简体中文 | English | Deutsch | Español | français | 日本語 | 한국어 | Português | Русский
一个实时字幕工具,基于 sherpa-onnx 的 asr 模型完成实时字幕识别。
PixPin_2025-12-06_17-30-42.mp4
下载安装应用,为了减小体积,应用本身没有捆绑模型,在应用的安装目录下有一个空的models文件夹,你可以将下载的模型放入该文件夹中。
模型下载:
比如下载这个中文语言模型,将模型文件解压到应用的models目录下,然后点击应用托盘图标打开设置界面,配置models目录即可自动识别,类似下面的目录结构
├── models
│ ├── sherpa-onnx-streaming-zipformer-zh-int8-2025-06-30
│ │ ├── decoder.onnx
│ │ ├── encoder.int8.onnx
│ │ ├── joiner.int8.onnx
│ │ ├── README.md
│ │ ├── test_wavs
│ │ │ ├── 0.wav
│ │ │ ├── 1.wav
│ │ │ └── 8k.wav
│ │ └── tokens.txt
前置条件:
- rust环境
- nodejs环境
克隆项目之后在根目录执行,使用你喜欢的包管理器即可
pnpm i
pnpm start- sherpa-onnx 语音识别模型支持
- TMSpeech 参考实现
