ИИ из Сибири отыщет в Сети завуалированную «запрещёнку»
24 декабря 2019 года
Ученые Института систем информатики (ИСИ) им. А. П. Ершова СО РАН научили (Архивная копия от 28 января 2020 на Wayback Machine) искусственный интеллект находить запрещенные сайты, даже если те хорошо завуалированы. Программа способна отфильтровать данные и сделать по интернет-ресурсам собственные выводы, рассказали в научном центре. Ученые объединили нейронные сети с методами экспертов-лингвистов и специалистов по машинному обучению. Программа, которую разработали в институте, интегрирует нейросети с моделями, основанными на знаниях экспертов по искусственному интеллекту. В итоге инструмент проверяет информацию, находя нелегальный контент. Также интеллект объясняет, почему считает его таковым.
Старший научный сотрудник лаборатории искусственного интеллекта ИСИ Елена Сидорова отмечает:
|
.
Сначала программа анализирует структуру, затем с помощью словаря проводится лингвистический анализ содержания, и делается вывод, связан ли текст с темой наркотиков.
«Одно сообщение на веб-странице может содержать ссылку на другое, и эти цепочки помогают постоянно проверять подозрительную лексику и пополнять базу. Для обновления словаря названий наркотических средств также привлекались эксперты-наркологи, которые знают этот сленг», — уточняет Сидорова.
Отмечается, что методы машинного обучения определяют нелегальное содержание с точностью около 70%, комбинированный способ позволяет добиться точности выявления в 86% случаев. При этом почти 90% нейтральных сайтов метод не относит к нежелательным....
Источники
правитьЭта статья содержит материалы из статьи «ИИ из Сибири отыщет в Сети завуалированную «запрещёнку»», опубликованной на сайте Роскомсвободы и распространяющейся на условиях лицензии Creative Commons Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0). |
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.