AMD совместно с Samsung создали HPC-систему на основе памяти HBM-PIM и ускорителей Instinct
Здесь предложили новую модификацию суперкомпьютера, в котором совмещены ускорители AMD Instinct и чипы для «вычислений в памяти». От ответственных лиц концерна поступают сообщения, что это позволяет увеличить производительность, что важно при обучении сложных, многоуровневых систем искусственного интеллекта. И одновременно появляется возможность оптимизировать энергопотребление.
В предложенной системе предусмотрено 96 ускорителей AMD Instinct MI100 (12 узлов по 8 ускорителей). И приложением ко всем ускорителям является блок памяти HBM-PIM с возможностью проводить вычисления. Вычислительные узлы разделены на группы по 6. Для взаимодействия между ними предназначены 16 коммутаторов InfiniBand. Скорость передачи данных составляет 200 Гбит/с.
Разработку от Samsung нельзя назвать лучшей, но результаты работы впечатлили экспертов. Например, с помощью супер ПК проводили обучение системы ИИ Text-to-Test Transfer Transformer (T5), разработанной специалистами Google. И процесс обучения сократился в 2,5 раза, а электроэнергии в сравнении с аналогами было потрачено меньше в 2,7 раза.
Разработчики особенно настаивают на том, что за счет применения подобного кластера годовое потребление электроэнергии можно сократить на 2100 ГВт·час в год. На практике это означает, что в атмосферу поступит углекислого газа на 960 тыс. тонн меньше. Если использовать для переработки всего этого объема выбросов зеленые насаждения, то 16 млн. деревьев справятся с нагрузкой за 10 лет.
Руководство концерна из Южной Кореи уже предлагает разработчикам ПО использовать преимущества in-memory computing с использованием блоков памяти HBM-PIM. Параллельно ведется разработка концепции PNM или processing-near-memory. Ее планируется использовать совместно с блоками памяти CXL.
Важно отметить, что концепции processing-near-memory и in-memory computing анонсированы концерном Samsung уже достаточно давно. Еще в прошлом году прозвучало заявление, что ускорители будут встроены в память и HBM2/3, и DDR4/5. И уже год назад эксперты могли ознакомиться с тем, как работает HBM-PIM. В этом образце все чипы дополнили ускорителями FP16-производительностью 1,2 Тфлопс.
Специалисты говорят о работоспособности и праве на существование первой HPC-системы, в основу которой положены «вычисления в памяти». Предполагается, что супер ПК на базе PIM и PNM найдут своих потребителей в самых разных сферах деятельности.