搜索
查看: 73|回复: 6
收起左侧

[网络插件] 离线运行的本地音视频转字幕工具 一键音视频提取文字 STT

[复制链接]

签到天数: 5 天

[LV.2]偶尔看看I

发表于 2026-4-20 13:25:02 | 显示全部楼层 |阅读模式
421.jpg

软件特点
离线运行的本地音视频转字幕工具,纯本地运行
支持cpu运行和GPU加速
完全免费,无需部署,一键运行
字幕支持输出json、srt字幕、纯文字txt格式

使用教程
下载后解压到某处,比如 E:/stt
双击 start.exe ,等待自动打开浏览器窗口即可
点击页面中的上传区域,在弹窗中找到想识别的音频或视频文件,或直接拖拽音频视频文件到上传区域,然后选择发生语言、文本输出格式、所用模型,点击“立即开始识别”,稍等片刻,底部文本框中会以所选格式显示识别结果
如果机器拥有英伟达GPU,并正确配置了CUDA环境,将自动使用CUDA加速注意:默认使用 cpu 运算,如果确定使用英伟达显卡,并且配置好了cuda环境,请修改 set.ini 中 `devtype=cpu`为`devtype=cuda`,并重新启动,可使用cuda加速

注意事项
如果没有英伟达显卡或未配置好CUDA环境,不要使用 large/large-v3 模型,可能导致内存耗尽死机
中文在某些情况下会输出繁体字
有时会遇到“cublasxx.dll不存在”的错误,此时需要下载 cuBLAS,然后将dll文件复制到系统目录下,点击下载 cuBLAS,解压后将里面的dll文件复制到 C:/Windows/System32下
如果控制台出现”[W:onnxruntime:Default, onnxruntime_pybind_state.cc:1983 onnxruntime::python::CreateInferencePybindStateModule] Init provider bridge failed.”, 可忽略,不影响使用
默认使用 cpu 运算,如果确定使用英伟达显卡,并且配置好了cuda环境,请修改 set.ini 中 devtype=cpu为 devtype=cuda,并重新启动,可使用cuda加速
尚未执行完毕就闪退
如果启用了cuda并且电脑已安装好了cuda环境,但没有手动安装配置过cudnn,那么会出现该问题,去安装和cuda匹配的cudnn。比如你安装了cuda12.3,那么就需要下载cudnn for cuda12.x压缩包,然后解压后里面的3个文件夹复制到cuda安装目录下。具体教程参考 https://juejin.cn/post/7318704408727519270
如果cudnn按照教程安装好了仍闪退,那么极大概率是GPU显存不足,可以改为使用 medium模型,显存不足8G时,尽量避免使用largev-3模型,尤其是视频大于20M时,否则可能显存不足而崩溃

游客,如果您要查看本帖隐藏内容请回复






上一篇:开源支持批量图片转文字OCR工具 Umi-OCR v2.1.5
下一篇:视频图片去水印软件VSR 完全免费开源

签到天数: 563 天

[LV.9]以坛为家II

发表于 2026-4-20 14:45:56 | 显示全部楼层
正需要,支持楼主大人了!
回复 支持 反对

使用道具 举报

签到天数: 10 天

[LV.3]偶尔看看II

发表于 2026-4-20 16:23:25 | 显示全部楼层
啥也不说了,感谢楼主分享哇!
回复 支持 反对

使用道具 举报

签到天数: 175 天

[LV.7]常住居民III

发表于 2026-4-20 22:29:48 | 显示全部楼层
啥也不说了,感谢楼主分享哇!
从不白嫖
回复 支持 反对

使用道具 举报

该用户从未签到

发表于 2026-4-22 05:25:56 | 显示全部楼层
321111111111111151515
回复 支持 反对

使用道具 举报

签到天数: 8 天

[LV.3]偶尔看看II

发表于 2026-4-22 21:22:44 | 显示全部楼层
牛逼牛逼牛逼牛逼牛逼牛逼牛逼牛逼牛逼牛逼
回复 支持 反对

使用道具 举报

签到天数: 1 天

[LV.1]初来乍到

发表于 5 天前 来自手机 | 显示全部楼层
与官方的
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册用户

本版积分规则

快速回复 返回顶部 返回列表