DMTK в открытом доступе
19 ноября 2015 года
Исследователи из лаборатории Microsoft Asia Research Lab выложили в открытый доступ на GitHub программу для создания распределённых систем машинного обучения Microsoft Distributed Machine Learning Toolkit (DMTK), с помощью которой несколько компьютеров могут параллельно решать целый комплекс проблем, традиционно относимых к области искусственного интеллекта.
Текущая версия DMTK включает в себя фреймворк, который эффективно выполняет процесс машинного обучения на больших данных за счет гибридной структуры данных, для хранения больших моделей данных, и за счёт автоматической конвейеризации.
Гибридная структура данных — это модель хранения, которая использует разделение данных на высокочастотные и низкочастотные параметры (например частота обращения пользователя к данным или же обращение к самой системы, и тому подобных вариантов), для достижения баланса между объёмом памяти и скоростью доступа.
DMTK имеет две модели алгоритмов: LightLDA — система тематического моделирования и Word2vec — реализация распределенных алгоритмов векторного представления слов.
Инструментарий предлагает сопутствующий API для облегчения работы исследователям и разработчикам.
DMTK поможет в реализации таких задач, как распознавание естественного языка, классификация документов, компьютерное зрение, распознавание речи и определение смысла текстовой информации и т. д.
Ссылки
править- Официальный сайт: Distributed Machine Learning Toolkit (Архивная копия от 16 сентября 2020 на Wayback Machine).
- GitHub: DMTK.
Источники
править- «Microsoft open sources Distributed Machine Learning Toolkit for more efficient big data research». , 13 октября 2015 года. (архив)
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.