Недавно Луис Росман продемонстрировал программу на своем канале, которую делает компания, в которую она работает после переезда из Нью-Йорка.
Программа называется "Footer Voice Input" и как можно догадаться из названия, это программа для голосового входа на Android.
Ну вот уже даже собственно имя сделал опечатку "Futo Voice Input".
Основные достоинства данной программы заключаются в том, что это тренированный искусственный интеллект, но никак уголы данные обрабатываются строго локально.
Не угол, а у ГУГЛО! Ладно, спешим это на то, что я пытался это делать в ванной комнате и включил громко душ, чтобы добавить шум и проверить, как железяка разбирает голос, если присутствует дополнительный шум.
Сама программа Open Source, причем полный все лежит на гитхабе, возможно кроме Кроме самих данных после обучения и небольшая проблемка в том, что русский обучали на гораздо меньших сэмплах, поэтому, возможно, он не совсем доразбирает правильно.
Еще большое отличие от того же вода default на вананда-андроиде заключается в том, что когда вы делаете паузу, то программа понимает, что здесь нужна запитая или что-то, и не надо собственно ручно добавлять все точки запитые.
О, запятые, не запятые, а запятые, это комон железяка...
Попробуйте сами, сделайте вывод. Также программа часто, может устойчивые, я не уверен, когда говорить у друг английское слово, он понимает, что это английский и будет его на английском.
Взять программу можно на voiceinput.futa.org и проверить. И там три ссылки собственно на репозиторию для Android на Play Store самого Google или можно напрямую скачать apk файл сайта.
Собственно, данный тут был надиктован при помощи Footvoice Input и исправлено буквально две очень грубых опечатки. Кстати, дан вторую половину текста я диктую у открытого окна, где очень сильный автомобильный трафик. Так что я удивлен, насколько при этом точно программа разбирает мой шепелявый язык.
@AncientGood ща попробую, пасиба
@sign потестируй польский, интересно тоже
немного смешно вышло, но я хотел показать точность опознания русского на небольшом дата-сете для тренинга, в общем есть забавные опечатки, но в целом можно вводить много текста и потом слегка поправить
Как и сказал, всё локально, и доступ к инету программе нужен только чтобы качнуть банки с семплами, там есть немецкий, польский, русский, китайский (который удивительно на большом сете тренирован)
https://voiceinput.futo.org/
мой английский программа разбирает полущ, хотя у меня акцент что люди не всегда понимаю если честно