2019-11-27

Оффлайн распознование текста - Kaldi ASR

Попробовал недавно систему распознавания речи Kaldi и оказалось, что все не так уж плохо, а даже на удивление хорошо. Качество распознавания оказалась ненамного хуже чем это делают это Гугл и Яндекс в онлайн, при этом совершенно бесплатно, без регистрации и СМС.  На хабре есть хорошая статья для на эту тему.

При этом голосовой движок находятся на локальном компьютере и неплохо справляется с поставленной задачей. Немного смущает количество ресурсов которые требуются для того чтобы скомпилирвать софт. В моем случае я потратил вечер для того чтобы скомпилировать систему, но уже после все заработало как надо. Если компилировать самому не хочется, уже имеется скомпилированный Docker образ, но пока не понятно как к нему подключить языковую модель.

Имеется также и очень неплохая языковая русская модель. Если покапаться в сети можно найти модели и для других языков. Если покапаться в сети можно найти модели и для других языков.  

Этот текст был наговорен в процессе движения на работу а затем распознан этой штуковиной. Да, я очень ленив.

 

комментарии:

 

Для того чтобы каждый раз не представляться можно войти как зарегистрированный пользователь.

Имя*

разрешены только теги br, font, span, p, strong, u, p, blockquote, a, div, img - остальные будут безжалостно удаляться