Япония разрабатывает собственный AI-чип Pezy-SC4, способный конкурировать с NVIDIA H200
Япония активно работает над созданием собственных AI-чипов, чтобы снизить зависимость от иностранных технологий, в частности от решений NVIDIA. Хотя страна планирует использовать GPU NVIDIA в своем следующем суперкомпьютере FugakuNEXT (ожидается к 2030 году), параллельно ведется разработка отечественных ускорителей.
Компания Pezy Computing KK, поддерживаемая японской организацией NEDO, анонсировала чип Pezy-SC4. Первое поколение Pezy было представлено еще в 2012 году, а новая модель была показана на конференции Hotchips 25. Серийный выпуск запланирован на следующий год.
Pezy-SC4 производится по 5-нм техпроцессу TSMC, имеет площадь 555,7 мм² и содержит 4,8 млрд транзисторов. Чип оснащен 2048 ядрами, работает на частоте 1,5 ГГц и обладает 64 МБ кэша L3. Он использует 96 ГБ памяти HBM3 и имеет теплопакет 600 Вт.
Пиковая производительность составляет 24,6 TFLOPS для FP64, 49,2 TFLOPS для FP32 и 98,4 TFLOPS для FP16.
Также анонсирован следующий чип — Pezy-SC5. Он будет выпущен по 3-нм нормам TSMC, его площадь увеличится до 785 мм², а количество транзисторов достигнет 10 млрд. Чип получит 4096 ядер и 192 ГБ памяти HBM3e при теплопакете 900 Вт. Производительность вырастет вдвое, добавится поддержка FP8 с пиковой производительностью 329,6 TFLOPS.
По энергоэффективности в вычислениях FP64 Pezy-SC4 демонстрирует показатель 41 GFLOPS/Вт. Для сравнения, у NVIDIA H200 этот параметр составляет 47,9 GFLOPS/Вт, у B200 — 33,3 GFLOPS/Вт, а у ориентированного на AI-вычисления B300 — всего 0,89 GFLOPS/Вт (из-за сильного урезания поддержки FP64).
Японские разработчики делают ставку на универсальность: их чипы поддерживают вычисления от FP64 до FP8, что может дать им преимущество в задачах, требующих высокой точности.
Интересный факт: Гонка за создание собственных AI-чипов набирает обороты по всему миру. Помимо Японии, собственные процессоры для искусственного интеллекта разрабатывают США, Китай и Европейский союз. Это связано не только со стремлением к технологическому суверенитету, но и с огромным спросом на вычислительные мощности для обучения больших языковых моделей, который существующие производители не всегда успевают удовлетворять.
0 комментариев