Vosk 是一款离线开源语音识别工具包。它支持 20 多种语言和方言的语音识别,包括英语、印度英语、德语、法语、西班牙语、葡萄牙语、中文、俄语、土耳其语、越南语、意大利语、荷兰语、加泰罗尼亚语、阿拉伯语、希腊语、波斯语、菲律宾语、乌克兰语、哈萨克语、瑞典语、日语、世界语、印地语、捷克语、波兰语等,未来还将支持更多语言。
Vosk 模型体积小巧(仅 50 MB),但能实现:
该工具包为多种编程语言提供了语音识别接口实现,包括 Python、Java、Node.JS、C#、C++、Rust、Go 等。
Vosk 可应用于:
其应用场景覆盖从树莓派等小型设备到 Android 智能手机,乃至大型服务器集群。
安装指南、示例代码及完整文档请访问 Vosk 官方网站。