背景
想要实现实时语音转文字,并需要通过web共享出去,WhisperStreamWeb项目非常合适
环境
- Debain12
- 3070
- CUDA:12.7
- cuDNN:9.6.0
步骤
1 |
|
报错
缺失ffmpeg
描述:FileNotFoundError: [Errno 2] No such file or directory: ‘ffmpeg’
原因:系统中缺少实际的 ffmpeg 可执行文件。ffmpeg-python 是 Python 的一个接口,用于与 ffmpeg 交互,但它需要依赖操作系统上安装的 ffmpeg 二进制程序。
解决:
1 | # 安装ffmpeg |
libcudnn_ops.so无法加载
描述:Unable to load any of {libcudnn_ops.so.9.1.0, libcudnn_ops.so.9.1, libcudnn_ops.so.9, libcudnn_ops.so}
Invalid handle. Cannot load symbol cudnnCreateTensorDescriptor
原因:找不到libcudnn_ops.so系列库。缺乏正确版本的 cuDNN,CUDA Toolkit和cuDNN不是一个东西,CUDA Toolkit默认不会包含cuDNN库
解决:安装cuDNN
电脑浏览器访问本地端口识别失败
原因:
- 本地ip是http,浏览器默认禁止了麦克风访问权限
- 如果不是本机启动,需要将ws地址改为目标ip地址
解决:
浏览器访问”edge://flags/“ 找到Insecure origins treated as secure特性,把地址加入白名单
把ws地址改为实际地址
手机浏览器识别失败
原因:
- 手机浏览器获取输入设备失败,可能是因为http的原因,尝试换成https
解决: 使用nginx开启https反代处理成功