Last translated: 09 Jun 2025

Translation Not Available Yet

This repository's README hasn't been translated yet. Once translated, it will be easier to read and understand in your native language (中文).

After translating, add the links to README so others can view it directly.

Vosk 语音识别工具包

Vosk 是一款离线开源语音识别工具包。它支持 20 多种语言和方言的语音识别,包括英语、印度英语、德语、法语、西班牙语、葡萄牙语、中文、俄语、土耳其语、越南语、意大利语、荷兰语、加泰罗尼亚语、阿拉伯语、希腊语、波斯语、菲律宾语、乌克兰语、哈萨克语、瑞典语、日语、世界语、印地语、捷克语、波兰语等,未来还将支持更多语言。

Vosk 模型体积小巧(仅 50 MB),但能实现:

  • 连续大词汇量转写
  • 流式 API 带来的零延迟响应
  • 可重新配置的词汇表
  • 说话人识别功能

该工具包为多种编程语言提供了语音识别接口实现,包括 Python、Java、Node.JS、C#、C++、Rust、Go 等。

Vosk 可应用于:

  • 聊天机器人语音识别
  • 智能家居设备控制
  • 虚拟助手开发
  • 电影字幕生成
  • 讲座/访谈内容转录

其应用场景覆盖从树莓派等小型设备到 Android 智能手机,乃至大型服务器集群。

文档资源

安装指南、示例代码及完整文档请访问 Vosk 官方网站