Компьютерная программа впервые проявила «воображение»

30 мая 2015 года

Одной из сложностей на пути создания искусственного интеллекта – отсутствие воображения у компьютерной программы. Машина не способна, подобно человеку представить визуальное изображение на основе ее описания и менять его. Однако исследователи Токийского университета Хирохару Като и Тацуя Харада создали алгоритм, который умеет грубо воспроизводить картинку по ее описанию – некий далекий аналог воображения.

Для этого ученые собрали базу из 101 изображения размером 128 × 128. С помощью алгоритма они проанализировали их на выявление визуальных слов. Визуальные слова - это понятие в компьютерном зрении, которое дает программам представление о том, что изображено на картинке: например, так можно отличить небо от горизонта. Одно визуальное слово представляет короткую последовательность пикселей. В эксперименте Като и Харады она составляла 13 × 13 пикселей.

Исследователи взяли этот метод и использовали для него два способа. Во-первых, решили считывать визуальные слова вместе с теми, которые находятся рядом с ними. Например, несколько слов о линии горизонта дадут программе представление о непрерывной линии. Таким образом они выявили пары визуальных слов, которые находятся друг с другом в их базе изображений, приняв, что 3/4 всех слов «перекрывают» друг друга. Во-вторых, ученые учитывали положение визуального слова на картинке. Например, вероятность получить визуальное слово с небом в верху изображения больше, чем внизу.

С полученным алгоритмом они провели эксперименты. Сначала воссоздали изображения по тем визуальным словам, которые получили с них. Потом использовали программу для компьютерного зрения на 10 тысячах случайных картинках, чтобы извлечь из них визуальные слова и восстановить по ним изображения. Кроме того, они попробовали с нуля создать графические файлы по описанию на естественном языке. Для этого они перевели все слова из описания набор визуальных слов и отдали их в обработку. В этом случае алгоритм воспроизвел абстрактные изображения, которые имели мало общего с исходным запросом.

Источники

править
 
 
Creative Commons
Эта статья содержит материалы из статьи «Компьютерная программа впервые проявила «воображение»», опубликованной PanARMENIAN.Net и распространяющейся на условиях лицензии Creative Commons Attribution 3.0 Unported (CC-BY 3.0 Unported).
 
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.