Yahoo опубликовал крупнейшую базу данных для систем машинного обучения

14 января 2016 года

Компания Yahoo разместила (Архивная копия от 1 апреля 2016 на Wayback Machine) в публичном доступе крупнейший набор данных для исследователей машинного обучения и искусственного интеллекта, включающий информацию о 110 миллиардах событий (размер БД 13.5 Тб). База содержит обезличенные данные, накопленные с февраля по май 2015 года и включающие сведения о поведении 20 млн пользователей при чтении новостей на сайтах Yahoo.

Информация о взаимодействии с сайтами Yahoo включает сведения о прочитанных статьях в привязке к обезличенным пользователям, для которых приводятся демографические данные (пол, возраст, местоположение), что позволяет сформировать портрет интересов каждого пользователя и выработать индивидуальные рекомендации. Исследователи могут использовать БД для проверки рекомендательных систем, при разработке методов совместной фильтрации, контексто-зависимых систем обучения, крупномасштабных алгоритмов машинного обучения, моделирования поведения пользователей, систем повышения качества контента и автономных методов обучения.

Источники править


 
 
Creative Commons
Эта статья содержит материалы из статьи «Yahoo опубликовал крупнейшую базу данных для систем машинного обучения», опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons Attribution (CC BY) — указание автора, источник и лицензию.
 
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.