Vosk é um kit de reconhecimento de voz de código aberto que funciona offline. Ele oferece suporte ao reconhecimento de voz em mais de 20 idiomas e dialetos - incluindo Inglês, Inglês Indiano, Alemão, Francês, Espanhol, Português, Chinês, Russo, Turco, Vietnamita, Italiano, Holandês, Catalão, Árabe, Grego, Farsi, Filipino, Ucraniano, Cazaque, Sueco, Japonês, Esperanto, Hindi, Tcheco e Polonês. Mais idiomas serão adicionados.
Os modelos do Vosk são compactos (50 MB), mas fornecem transcrição contínua de vocabulário extenso, resposta sem latência com API de streaming, vocabulário reconfigurável e identificação de falantes.
Existem bibliotecas de reconhecimento de voz implementadas para várias linguagens de programação como Python, Java, Node.JS, C#, C++, Rust, Go e outras.
O Vosk é utilizado para:
O Vosk é escalável, funcionando desde dispositivos pequenos como Raspberry Pi ou smartphones Android até grandes clusters.
Para instruções de instalação, exemplos e documentação completa, visite o Site do Vosk.