Искусственный интеллект Google DeepMind научился читать по губам лучше человека

24 ноября 2016 года

Алгоритмы искусственного интеллекта, разработанные командой Google DeepMind в сотрудничестве с учёными Оксфордского университета, превзошли человека в умении понимать речь наблюдением артикуляции говорящего.

У созданной ими программы результаты оказались на 35 % лучше, чем у профессионального «считывателя» по губам.

ИИ-систему Google обучили на шести телешоу (таких как Newsnight, BBC Breakfast и Question Time), которые выходили в эфир с 2010 по 2015 года, «скормив» ей видео общей продолжительностью 5 тысяч часов (около 118 тысяч предложений). Эффективность алгоритмов проверялась на новых выпусках телепрограмм, транслировавшихся с марта по сентябрь 2016 года.

Из случайной выборки 200 видеофрагментов человек, профессиональный чтец по губам, безошибочно распознал только 12,4 % произнесённых слов, в то время как компьютерные алгоритмы — 46,8 %. При этом полученные результаты могли быть ещё лучше, однако в некоторых случаях аудио и видео отставали почти на секунду, что мешало ИИ правильно выстраивать ассоциативные связи.

Ранее система глубинного, или глубокого обучения (алгоритмы, которые учат нейросети «думать» и выстраивать логические цепочки), разработанная исследователями из Оксфорда, также превзошла человека на тесте GRID. Но если словарный запас GRID состоял из всего лишь 51 уникального слова, то в ТВ-шоу BBC таковых было произнесено 17 500, что представляло гораздо более трудную задачу для компьютерных алгоритмов.

ИИ-систему Google вряд ли можно будет задействовать для прослушки, т. к. микрофоны направленного действия справляются с этой задачей намного лучше. Более вероятный сценарий — применение алгоритмов в потребительских устройствах, чтобы помочь Android-смартфонам понять, что им пытается сказать пользователь в шумной обстановке.

Источники править

Creative Commons

Эта статья содержит материалы из статьи «Искусственный интеллект Google DeepMind научился читать по губам лучше человека», опубликованной PanARMENIAN.Net и распространяющейся на условиях лицензии Creative Commons Attribution 3.0 Unported (CC-BY 3.0 Unported).

Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.

Несколько советов по оформлению реплик:

Новые темы начинайте, пожалуйста, снизу.
Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.

Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.

Добавить комментарий

	Имеете своё мнение на этот счёт?
Оставьте свой комментарий

	Поделитесь новостью с друзьями
Телеграм Фейсбук Твиттер ВК ОК ЖЖ