Решать задачи ИИ и HPC теперь проще. Поможет в этом Arm-процессор Graviton3E от AWS
Для работы с Graviton3 можно задействовать команды Armv8.4. Допустимые расширения — Neon (4×128 бит) и SVE (2×256 бит). Нельзя забывать и о системах искусственного интеллекта и необходимости обучать машины. И в данном случае чаще всего используют данные с форматами INT8 и BF16. Если сравнивать процессоры Graviton3 и Graviton2, то будет заметна разница в быстродействии. Увеличение составляет минимум 25%, максимум — 60%. При этом выделение тепла остается на прежнем уровне. В соответствии с выбранным дизайном на каждый узел системы приходится сразу 3 процессора.
При производстве Graviton3E разработчики внесли дополнительные изменения. Процессор адресован именно компаниям, работающим в сфере искусственного интеллекта, машинного обучения. С его помощью можно проводить объемные вычисления. Наиболее полно преимущества процессора проявляются при проведении вычислений с плавающей запятой. Оценят возможности чипа и те, кто работает с векторными вычислениями.
Архитектура процессора пока остается тайной, и разработчик не спешит ее раскрывать. Но некоторые подробности есть. Если сопоставлять скорость выполнения векторных вычислений на Graviton3 и Graviton3E, во втором случае производительность будет выше на 35%. С использованием процессора проводились самые разные тесты в финансовой, медико-биологической сфере. Решали и классические тесты HPL. И везде зафиксированы отличные результаты.
HPC (высокопроизводительные вычисления) предполагают перемещение значительных массивов информации. И перед разработчиками всегда стояла задача оптимизации подобных процессов. Решает ее и AWS за счет применения сетей на основе Elastic Fabric. Предложены и адаптеры Elastic Network Adapter (ENA). И сеть работает не с TCP-пакетами, а с сетевыми протоколами Scalable Reliable Datagram (SRD). На повторную пересылку пакетов данных теперь требуются микросекунды. Например, стандартные реализации Ethernet на это расходуют значительно большие временные отрезки.
Основой же обновленного инстанса стали гипервизоры Nitro 5. Если сравнивать с Nitro 4, в данном случае можно выделить ряд преимуществ:
существенно выросла производительность;
пропускная способность модулей памяти увеличена на 50%;
латентность сократилась на 30% при том, что можно количество обрабатываемых пакетов увеличивается на 60%.
У инстансов Hpc7g с чипами Graviton3E есть и еще одна особенность. Речь идет о внутренней сети с возможностью пересылать до 200 Гбит информации в секунду. Их можно использовать практически в любых конфигурациях, в том числе 64 vCPU с модулем памяти объемом 128 ГиБ. У инстансов C7gn характеристики такие же. А их можно использовать при построении виртуальных маршрутизаторов, систем распределения нагрузок и т. д.
Внимания заслуживают и сообщения разработчика о создании инстансов R7iz. В данном случае базой станут процессоры Intel Xeon Scalable. Выбрано уже 4-е поколение (Sapphire Rapids). Все ядра работают на одинаковой частоте 3,9 ГГц. Конфигурация — 128 vCPU. Объем памяти — 1 ТиБ.