Нейросеть AlphaZero всего за четыре часа научилась безупречно играть в шахматы
8 декабря 2017 года
Спустя 20 лет после того, как компьютерная программа DeepBlue победила чемпиона мира Гарри Каспарова, в шахматах грянула новая революция.
Алгоритму AlphaZero, разработанному Google и DeepMind, хватило всего четырех часов игры с самим собой, чтобы самостоятельно синтезировать шахматные знания человечества за полтора тысячелетия и достичь уровня, который не только превосходит людей, но и позволяет громить чемпионов среди компьютерных алгоритмов.
Все блестящие хитрости и утонченности, которые программисты использовали для создания шахматных движков, были отправлены на свалку истории, отмечает портал Chess24.com.
Нейросеть победила сильнейшую шахматную компьютерную программу Stockfish 8 в ста партиях, не проиграв ни одной. Играя белыми, AlphaZero добилась 25 побед при 25 ничьих. Без преимущества первого хода ей удалось выиграть три партии при 47 ничьих. Итого в ста играх нейросеть одержала 28 побед, сведя остальные 72 вничью.
Как утверждают разработчики, AlphaZero достигла этого уровня всего через четыре часа после того, как в нее были загружены только базовые правила игры в шахматы, без дополнительных сведений о тактике, алгоритмах и дебютах.
В отличие от традиционных шахматных программ, AlphaZero выбирает ход не за счет перебора возможных вариантов, а применяя собственные алгоритмы, выработанные при самообучении. Для сравнения: AlphaZero рассматривала 80 тысяч позиций за секунду, тогда как Stockfish - до 70 миллионов.
Ранее детище DeepMind потратило два часа на постижение сеги (японские шахматы) и за восемь часов научилась безупречной игре в го.
По мнению компании-разработчика, в будущем подобные нейро-алгоритмы смогут решать важные исследовательские задачи, включая разработку новых лекарств и материалов.
Источники
правитьЛюбой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.