Vosk est une boîte à outils open source de reconnaissance vocale fonctionnant hors ligne. Elle prend en charge la reconnaissance vocale pour plus de 20 langues et dialectes - anglais, anglais indien, allemand, français, espagnol, portugais, chinois, russe, turc, vietnamien, italien, néerlandais, catalan, arabe, grec, farsi, filipino, ukrainien, kazakh, suédois, japonais, espéranto, hindi, tchèque, polonais. D'autres langues seront ajoutées.
Les modèles Vosk sont compacts (50 Mo) mais offrent une transcription continue avec un large vocabulaire, une réponse sans latence grâce à une API de streaming, un vocabulaire reconfigurable et une identification des locuteurs.
Des liaisons de reconnaissance vocale sont implémentées pour divers langages de programmation comme Python, Java, Node.JS, C#, C++, Rust, Go et d'autres.
Vosk fournit la reconnaissance vocale pour les chatbots, les appareils domotiques intelligents, les assistants virtuels. Il peut également créer des sous-titres pour des films, des transcriptions pour des conférences et interviews.
Vosk s'adapte des petits appareils comme le Raspberry Pi ou les smartphones Android jusqu'aux grands clusters.
Pour les instructions d'installation, exemples et documentation, visitez le Site Web de Vosk.