Исследователи компании Baidu создали алгоритм, который догнал людей в распознавании речи на английском и мандаринском
17 декабря 2015 года
Лаборатория искусственного интеллекта (SVAIL) исследовательского подразделения китайской компании Baidu улучшила алгоритм распознавания речи под названием Deep Speech, при этом в некоторых случаях вторая версия программы распознает речь даже быстрее людей, передает N+1.
Разработчикам удалось использовать один алгоритм глубокого обучения для распознавания устной речи на двух языках: английском и мандаринском (крупнейший из китайских языков). При этом авторы улучшили распознавание английского в шумных местах, а также продвинулись вперед в быстродействии - создали новую аппаратную платформу на видеокартах, в семь раз подняв производительность по сравнению с предыдущей версией сервера для Deep Speech.
Авторы также протестировали Deep Speech 2 на скорость распознавания коротких фраз, сравнив ее с человеческой. Оказалось, что в некоторых случаях (короткие фразы без контекста) алгоритм справляется с распознаванием даже быстрее людей. Тем не менее Deep Speech 2 все еще уступает людям в распознавании больших фрагментов текста, а также в распознавании речи с акцентом или при большом количестве посторонних шумов.
По словам авторов, система уже готова к применению в онлайн-сервисах и мобильных приложениях и превосходит аналогичные алгоритмы конкурентов. В ближайшем будущем специалисты SVAIL планируют работать в направлении распознавания фраз на английском с акцентом. В частности, исследователи начали обучение нейросети английскому с индийским акцентом.
Кроме Baidu, обучение нейросетей для улучшения своих продуктов используют и другие компании. Facebook, например, разработала алгоритм, способный узнать человека даже со спины, а Google использует обученную нейросеть для перевода надписей на 27 языков в приложении Google Translate.
Источники править
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.