Недавно Луис Росман продемонстрировал программу на своем канале, которую делает компания, в которую она работает после переезда из Нью-Йорка.

Программа называется "Footer Voice Input" и как можно догадаться из названия, это программа для голосового входа на Android.

Ну вот уже даже собственно имя сделал опечатку "Futo Voice Input".

Основные достоинства данной программы заключаются в том, что это тренированный искусственный интеллект, но никак уголы данные обрабатываются строго локально.

Не угол, а у ГУГЛО! Ладно, спешим это на то, что я пытался это делать в ванной комнате и включил громко душ, чтобы добавить шум и проверить, как железяка разбирает голос, если присутствует дополнительный шум.

Сама программа Open Source, причем полный все лежит на гитхабе, возможно кроме Кроме самих данных после обучения и небольшая проблемка в том, что русский обучали на гораздо меньших сэмплах, поэтому, возможно, он не совсем доразбирает правильно.

Еще большое отличие от того же вода default на вананда-андроиде заключается в том, что когда вы делаете паузу, то программа понимает, что здесь нужна запитая или что-то, и не надо собственно ручно добавлять все точки запитые.

О, запятые, не запятые, а запятые, это комон железяка...

Попробуйте сами, сделайте вывод. Также программа часто, может устойчивые, я не уверен, когда говорить у друг английское слово, он понимает, что это английский и будет его на английском.

Взять программу можно на voiceinput.futa.org и проверить. И там три ссылки собственно на репозиторию для Android на Play Store самого Google или можно напрямую скачать apk файл сайта.

Собственно, данный тут был надиктован при помощи Footvoice Input и исправлено буквально две очень грубых опечатки. Кстати, дан вторую половину текста я диктую у открытого окна, где очень сильный автомобильный трафик. Так что я удивлен, насколько при этом точно программа разбирает мой шепелявый язык.

немного смешно вышло, но я хотел показать точность опознания русского на небольшом дата-сете для тренинга, в общем есть забавные опечатки, но в целом можно вводить много текста и потом слегка поправить

Как и сказал, всё локально, и доступ к инету программе нужен только чтобы качнуть банки с семплами, там есть немецкий, польский, русский, китайский (который удивительно на большом сете тренирован)

voiceinput.futo.org/

мой английский программа разбирает полущ, хотя у меня акцент что люди не всегда понимаю если честно

@sign потестируй польский, интересно тоже

Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.