Корпорация AMD рассказала о работе с ускорителем Radeon MI60 на Национальном Суперкомпьютерном Форуме
24 декабря 2018 года
29 ноября 2018 года корпорация AMD подробно рассказала о работе акселератора Radeon Instinct MI60 (процессор «Vega 7nm»). Новый графический процессор, построенный по 7-нм техпроцессу и лежащий в основе ускорителя, был впервые анонсирован 6 ноября в США и 28 ноября в России. Представитель компании Тимур Палташев раскрыл подробности на семинаре во время Национального Суперкомпьютерного Форума в Переславле (НСКФ-2018).
С графическим процессором «Vega 7nm» компания AMD выходит на рынок суперкомпьютеров. Этот процессор даёт очень большую производительность — 7,4 терафлопс в режиме двойной точности (64 бита) и 14,7 терафлопс в одинарной точности (32 бита). В режиме 8-битной арифметики на нейронной сети для распознавании изображений процессор даёт 59 тераопс. На акселераторе стоят 32 гигабайта памяти HBM, она работает со скоростью 1 терабайт в секунду. Процессор и память связаны проводниками в единой подложке (semiconductor interposer), чем и обеспечена огромная скорость обмена.
Работу с таким графическим ускорителем обеспечивает программный стэк ROCm (Radeon Open Compute). Его релиз включён в дистрибутивы Ubuntu, RedHat и CentOS. Написаны фреймворки для Caffe 2, MXNet, PyTorch, TensorFlow, что позволяет строить нейронные сети.
Рынок high performance computing — это рынок научных и технических вычислений. К ним добавились потребности машинного интеллекта и глубокого обучения. Новые машины, которые мы сделали, должны работать в кластерах и поддерживать все типы вычислительных работ по максимуму.
Тимур Палташев, д. т. н., старший менеджер Radeon Technology Group |
Программный стэк выпущен в открытом коде на GitHub, и в этом принципиальное отличие от закрытых библиотек Nvidia. Весь функционал, который был сделан для CUDA, есть в библиотеках AMD. Для каждой функции, которую вызывает CUDA, написан свой аналог.
Раньше AMD уже предлагала программу HIP — свой конвертор, который превращал исходный текст для CUDA в HCC код и отправлял его в HCC компилятор (Heterogeneous Compute Compiler). Теперь дело иное, новая версия HIP стала Clang-языком и LLVM-компилятором. Всё, что написано на HIP, может компилироваться и исполняться одновременно на платформах AMD и Nvidia.
На ускорителе Instinct MI60 работают математические библиотеки для машинного обучения и высокопроизводительных вычислений — rocBLAS, rocSparse, rocFFT, rocSolver, rocRAND, rocALUTION, rocPrim. Они доступны в двух версиях, написанных для HIP и для OpenCL. По интерфейсам rocSparse и rocSolver точно совпадают с cuSparse и cuSolver, и если написаны вызовы для CUDA — они будут прозрачно обработаны. С точки зрения библиотек — это зеркало, прямой перевод из одной технологии в другую.
В пакете ROCm есть инструменты для переноса кода между платформами, для его анализа и отладки. На гитхабе доступен собственный профайлер, к середине 2019 года будет сделан модуль для GNU Debugger. Налажена работа с инструментами PAPI (Performance Application Programming Interface), TAU (Tuning and Analysis Utilities) и VampirTrace, ведь разработчики суперкомпьютеров привыкли работать со специальными отладчиками, которые полагаются на интерфейсы PAPI.
Если у нас существует аналогичная библиотека — компилятор HIP автоматически всё переписывает. У нас на 99,6 процентов автоматический перевод кода из CUDA. Caffe за день перевели, и всё заработало. Тимур Палташев |
Более того, AMD позволяет писать программы на GPU-ассемблере, чего не позволяет ни один производитель. Такой ассемблер позволяет, например, создавать библиотеки для 128-битных вычислений.
Поддержка языка Фортран остаётся в планах, AMD идёт к нему через стандарт OpenMP. Продукты на Фортране так индивидуальны, что к ним трудно приложить один общий подход.
Господин Палташев подтвердил, что сервера с ускорителями MI60, которые AMD предложила американским университетам, дают открытый доступ для академического сообщества. Прислав заявку, сотрудники российских вузов смогут работать на этих кластерах, изучая новые ускорители. Среди разработчиков AMD есть русские программисты, поэтому обсуждение и переписка могут быть на родном языке.
Мы продолжим освещать выступления отдельных участников НСКФ и достижения этой промышленности.
Предыдущая новость: Вручена премия Национального Суперкомпьютерного Форума (2018) |
Продолжение: Борис Шапиро: Мы движемся к суперчеловечеству, которое будет сплавом человека биологического и небиологического |
Ссылки
править- Национальный Суперкомпьютерный Форум.
- ROCm Platform (Архивная копия от 5 декабря 2018 на Wayback Machine).
- ROCm Core Technology.
- ROCm Developer Tools.
Комментарии
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, однако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.