Нейросеть определила язык загадочного манускрипта Войнича
29 января 2018 года
Исследователи из Альбертского университета (Канада) заявили, что при помощи нейросети смогли определить язык, на котором написан загадочный манускрипт Войнича, над расшифровкой которого специалисты со всего мира бьются уже несколько десятилетий. Статья канадских ученых была опубликована в журнале Transactions of the Association of Computational Linguistics.
Рукопись Войнича представляет собой иллюстрированный манускрипт, написанный в XV веке в Центральной Европе неизвестным автором. Свое название книга получила в честь коллекционера Уилфрида Войнича, который купил ее в 1912 году у иезуитов. Текст 240-страничной книги написан с помощью неизвестного алфавита и разбит на шесть разделов. Книга хранится в библиотеке Йельского университета.
По словам Гжегожа Кондрака, одного из соавторов исследования, созданный командой алгоритм для определения языка прошел тренировку на переведенной на 380 языков Всеобщей декларации прав человека, показав точность распознавания языка в 97%. После этого ученые применили алгоритм для анализа текста рукописи Войнича, и нейросеть сочла, что древняя книга была написана на иврите, однако автор не использовал гласные буквы и изменил порядок букв в каждом слове, сообщает CBCNews.
Исходя из этой гипотезы, исследователи попытались перевести первое предложение рукописи Войнича и получили следующий текст: "Она дала рекомендации священнику, хозяину дома, и мне, и людям". Кроме того, создатели нейросети утверждают, что среди первых 72 слов книги встречаются слова "крестьянин", "свет", "воздух" и "огонь". Это говорит в пользу гипотезы, что манускрипт Войнича мог служить фармакопеей, то есть сводом правил, которыми руководствуются при изготовлении, хранении и назначении лекарственных препаратов, пишет N+1.
Как отметил Кондрак, дальнейшая расшифровка текста книги потребует участия лингвистов - специалистов по ивриту, а если попытка увенчается успехом, то нейросеть можно будет использовать и для других подобных задач, например для расшифровки критских иероглифов.
Источники
правитьЛюбой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.