Vosk — это оффлайн-инструментарий с открытым исходным кодом для распознавания речи. Он поддерживает распознавание более чем 20 языков и диалектов, включая английский, индийский английский, немецкий, французский, испанский, португальский, китайский, русский, турецкий, вьетнамский, итальянский, голландский, каталанский, арабский, греческий, фарси, филиппинский, украинский, казахский, шведский, японский, эсперанто, хинди, чешский и польский. Поддержка новых языков постоянно добавляется.
Модели Vosk компактны (50 Мб), но обеспечивают:
Доступны привязки для распознавания речи на различных языках программирования: Python, Java, Node.JS, C#, C++, Rust, Go и других.
Vosk применяется для:
Инструментарий масштабируется от маломощных устройств (Raspberry Pi, смартфоны на Android) до крупных кластеров.
Инструкции по установке, примеры использования и документация доступны на официальном сайте Vosk.