Нейросеть определила язык загадочного манускрипта Войнича

29 января 2018 года

Исследователи из Альбертского университета (Канада) заявили, что при помощи нейросети смогли определить язык, на котором написан загадочный манускрипт Войнича, над расшифровкой которого специалисты со всего мира бьются уже несколько десятилетий. Статья канадских ученых была опубликована в журнале Transactions of the Association of Computational Linguistics.

Рукопись Войнича представляет собой иллюстрированный манускрипт, написанный в XV веке в Центральной Европе неизвестным автором. Свое название книга получила в честь коллекционера Уилфрида Войнича, который купил ее в 1912 году у иезуитов. Текст 240-страничной книги написан с помощью неизвестного алфавита и разбит на шесть разделов. Книга хранится в библиотеке Йельского университета.

По словам Гжегожа Кондрака, одного из соавторов исследования, созданный командой алгоритм для определения языка прошел тренировку на переведенной на 380 языков Всеобщей декларации прав человека, показав точность распознавания языка в 97%. После этого ученые применили алгоритм для анализа текста рукописи Войнича, и нейросеть сочла, что древняя книга была написана на иврите, однако автор не использовал гласные буквы и изменил порядок букв в каждом слове, сообщает CBCNews.

Исходя из этой гипотезы, исследователи попытались перевести первое предложение рукописи Войнича и получили следующий текст: "Она дала рекомендации священнику, хозяину дома, и мне, и людям". Кроме того, создатели нейросети утверждают, что среди первых 72 слов книги встречаются слова "крестьянин", "свет", "воздух" и "огонь". Это говорит в пользу гипотезы, что манускрипт Войнича мог служить фармакопеей, то есть сводом правил, которыми руководствуются при изготовлении, хранении и назначении лекарственных препаратов, пишет N+1.

Как отметил Кондрак, дальнейшая расшифровка текста книги потребует участия лингвистов - специалистов по ивриту, а если попытка увенчается успехом, то нейросеть можно будет использовать и для других подобных задач, например для расшифровки критских иероглифов.

Источники

править
 
 
Creative Commons
Эта статья содержит материалы из статьи «Нейросеть определила язык загадочного манускрипта Войнича», опубликованной NEWSru.com и распространяющейся на условиях лицензии Creative Commons Attribution 4.0 (CC BY 4.0) — при использовании необходимо указать автора, оригинальный источник со ссылкой и лицензию.
 
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.