Vosk는 오프라인 오픈 소스 음성 인식 툴킷입니다. 영어, 인도 영어, 독일어, 프랑스어, 스페인어, 포르투갈어, 중국어, 러시아어, 터키어, 베트남어, 이탈리아어, 네덜란드어, 카탈로니아어, 아랍어, 그리스어, 페르시아어, 필리핀어, 우크라이나어, 카자흐어, 스웨덴어, 일본어, 에스페란토, 힌디어, 체코어, 폴란드어 등 20개 이상의 언어와 방언을 지원합니다. 지속적으로 더 많은 언어가 추가될 예정입니다.
Vosk 모델은 크기가 작지만(50Mb) 대용량 어휘 연속 변환, 스트리밍 API를 통한 제로 레이턴시 응답, 재구성 가능한 어휘 및 화자 식별 기능을 제공합니다.
Python, Java, Node.JS, C#, C++, Rust, Go 등 다양한 프로그래밍 언어용 바인딩이 구현되어 있습니다.
Vosk는 챗봇, 스마트 홈 기기, 가상 비서를 위한 음성 인식을 제공합니다. 또한 영화 자막 생성, 강의 및 인터뷰 녹취록 작성에도 활용할 수 있습니다.
Vosk는 Raspberry Pi나 Android 스마트폰 같은 소형 기기에서부터 대규모 클러스터까지 확장 가능합니다.
설치 방법, 예제 및 문서는 Vosk 웹사이트를 참조하세요.