Releases: jianchang512/stt
stt-v0.92
Change
- 在 set.ini 增加中文下的 initial_prompt 提示词设置,打开 set.ini 设置 initial_promt_zh 的值即可,默认“以下为普通话内容,请转录为简体中文。”
下载地址(内含base模型)/Download url:
百度网盘: https://pan.baidu.com/s/1ASYA_sQRlRKsXuyz6NBKNA?pwd=38eq
GitHub: https://github.com/jianchang512/stt/releases/download/v0.92/stt-v0.92.7z
解压到英文目录下,双击 start.exe, 在打开的页面中上传音频视频文件识别
extract to folder and doubleclick start.exe, wait unitl open webbrowser
模型下载地址/Download models https://github.com/jianchang512/stt/releases/tag/0.0
stt-v0.91
Change
add more param at the set.ini for whisper model
下载地址(内含base模型)/Download url:
百度网盘: https://pan.baidu.com/s/1oAeBvVcNv3HP2QWa3uiilg?pwd=efvc
GitHub: https://github.com/jianchang512/stt/releases/download/v0.91/sttv-0.91.7z
解压到英文目录下,双击 start.exe, 在打开的页面中上传音频视频文件识别
extract to folder and doubleclick start.exe, wait unitl open webbrowser
模型下载地址/Download models https://github.com/jianchang512/stt/releases/tag/0.0
stt-v0.0.6
Change
- fixed bug #7
- 默认使用 cpu 运算,如果确定使用英伟达显卡,并且配置好了cuda环境,请修改 set.ini 中
devtype=cpu
为devtype=cuda
,并重新启动,可使用cuda加速 - progressbar
下载地址(内含base模型)/Download url:
百度网盘: https://pan.baidu.com/s/1am6RNTwR9cfA3_EKwyTLxg?pwd=cvrd
GitHub: https://github.com/jianchang512/stt/releases/download/v0.0.6/sttv0.0.6.7z
解压到英文目录下,双击 start.exe, 在打开的页面中上传音频视频文件识别
extract to folder and doubleclick start.exe, wait unitl open webbrowser
模型下载地址/Download models https://github.com/jianchang512/stt/releases/tag/0.0
cuBLASxx.dll下载
cuBLASxx.dll下载
如果遇到 "cublasxxx.dll不存在",请下载该文件,然后将里面的dll文件复制到 C:/Windows/System32 目录下
download all models-下载所有语音识别模型
faster-whisper 模型下载,适用于 stt 项目 和 “pyvideotrans视频翻译配音”项目的faster模型模式使用,openai模型请往下拉
tiny 模型下载64MB
tiny.en 模型下载64MB
base 模型下载 124MB
base.en 模型下载 124MB
small 模型下载 415MB
small 模型百度网盘
small.en 模型下载 415MB
medium 模型下载 1.27G
medium 模型百度网盘
medium.en 模型下载 1.27G
large-v1 模型百度网盘
large-v1 模型下载-墙外
large-v2 模型下载-墙外
large-v2 模型百度网盘
large-v3 模型下载-墙外
large-v3 模型百度网盘
distil-whisper-small.en 模型下载 282MB
distil-whisper-medium.en 模型下载 671MB
distil-medium模型百度网盘
distil-whisper-large-v2 模型下载 1.27G
distil-large-v2模型百度网盘
distil-whisper-large-v3 模型下载 1.3G
distil-whisper-large-v3百度网盘
下载后解压,将压缩包内的"models--Systran--faster-xx"文件夹复制到models目录内,解压复制后 models 目录下文件夹列表如下
压缩包内容
正确放置后的 models 目录下的文件夹列表
openai-whisper模型下载,仅适用于“pyvideotrans视频翻译配音软件”的 openai模型 下载使用
cuBLASxx.dll下载
下载cuBLAS dll 文件
如果遇到 "cublasxxx.dll不存在",请下载该文件,然后将里面的dll文件复制到 C:/Windows/System32 目录下
uvr5模型下载
下载后解压,得到一个 uvr5_weights
文件夹,将该文件夹复制到视频翻译配音软件根目录下。