Новая технология смартфонов &8212; управление голосом

Наш мир сейчас становиться все более фантастичным, то, что показывали в фильмах несколько десятилетий назад, стало настоящим. Общение голосом благодаря современным технологиям становиться все ближе к нам. Теперь любой обладатель современного смартфона имеет возможность опробовать это чудо технологии.

Управление голосом

Учитывая размеры современных смартфонов, работа с клавиатурой доставляет некий дискомфорт. Возникает сложность в наборе достаточно объемного запроса в системе поиска. Новая технология - система голосового поиска Google - позволит сделать это голосом.
Впервые о запуске голосового поиска на мобильных устройствах (смартфонах на платформе Google Android) было объявлено в 2008 году компанией Google. Изначально это было воспринято с недоверием, но за годы система показала себя в наилучшем свете – она работает, и работает хорошо.

Это очень сложная работа, которая осуществляется в нескольких следующих этапах: этап первый заключается в оцифровке и упаковке речи на мобильном устройстве, далее данные отсылаются на сервис, где и происходит распознавание речи. Следующий, заключительный, этап – это пересылка готовых результатов поиска обратно.

Для более точной работы нужно время, накапливая различные голоса, система улучшает точность их распознавания. Делая акцент на то, что у каждого из нас разная скорость речи, различная манера говорить, тональность, манера говорить, громкость, наложение окружающего шума и так далее, речь является очень индивидуальным способом обмена информации, поэтому нужна ее формализация.

Работа этой системы заключается в распознавании речи по достаточно сложным компьютерным алгоритмам по трем основным моделям речи: акустическая модель, модель произношения и языковая модель. В распознавании речи эти три модели необходимо использовать одновременно. Акустическая модель разбирает на звуки входную речь, модель произношения составляет слова из этих звуков, а языковая модель анализирует и составляет фразу из предварительно накопленной в базах данных статистике.

Для более точного воспроизведения нужен объемный словарь и больше времени для процесса распознавания. В среднем оптимальный размер словаря – миллион слов: слова, имена собственные, названия компаний, слова в различных падежах, словоформы и т. д. В разных языках возникают разные проблемы распознавания речи.

В русском – это большая вариативность слов и склонение по падежам, в немецком – составные слова, китайский и японский языки - иероглифическое письмо и тональность. Для таких систем поиска необходимо использовать фонетический, а не орфографический словарь.
Следующий шаг - это перевод с одного языка на другой.

Ads: последнее время популярен заработок в сети, и это не удивительно, чтоб заработать деньги, нужно лишь иметь немного упорства и компьютер, у многих людей это есть, и многие люди давно уже забыли про работу в оффлайне, и правильно=)

Советуем к прочтению:

Официальный представитель продукции Hitachi DataSystems

Новый планшет Brevis 901WA от компании Treelogic

ViewSonic выбрала процессоры CULV для своего новейшего Nettop

Sandwich Phone