Alibaba представила собственный AI-процессор, который якобы не уступает чипам Nvidia для Китая
Полупроводниковое подразделение Alibaba, T-Head, разработало новый AI-процессор, который, по заявлениям компании, соответствует производительности GPU Nvidia H20 — графического процессора, созданного специально для китайского рынка и в настоящее время находящегося в условиях геополитических ограничений.
Демонстрация состоялась во вторник, 16 сентября, в эфире China Central Television (CCTV), во время репортажа о визите премьер-министра Ли Цяна в энерговычислительный центр Sanjiangyuan Energy Intelligent Computing Centre компании China Umicom в Цинхае. В сюжете новый ускоритель T-Head под названием «PPU» напрямую сравнивался с чипами Nvidia H20 и A800, а также с Huawei Ascend 910B. На графике была показана эквивалентная производительность решений Alibaba и Nvidia.
Согласно спецификациям, показанным в эфире и сообщенным South China Morning Post, этот чип, представляющий собой ASIC, разработанный для AI-нагрузок, оснащен 96 ГБ памяти HBM2e, межчиповым соединением со скоростью 700 ГБ/с, поддержкой PCIe и энергопотреблением платы 400 Вт. Хотя в трансляции не раскрывались детали методологии тестирования и не публиковались точные цифры, это первый публичный бенчмарк, который относит аппаратное обеспечение Alibaba к тому же классу, что и датацентровые GPU Nvidia.
По данным Reuters, China Unicom уже развернула 16 384 карт PPU от Alibaba в своей инфраструктуре, что составляет более половины из почти 23 000 отечественных ускорителей, установленных в настоящее время на объекте в Цинхае. Вместе эти карты обеспечивают 3 579 петафлопс вычислительной мощности, и ожидается, что после завершения всех этапов мощность объекта превысит 20 000 петафлопс.
За демонстрацией на CCTV стоит не только технический, но и геополитический контекст. Nvidia H20 был представлен для соблюдения экспортных ограничений США, ограничивающих продажу высокопроизводительных чипов в Китай. Созданный на архитектуре Hopper, но урезанный для соответствия ограничениям, H20 поставляется с 96 ГБ HBM3 и пропускной способностью памяти примерно 4,0 ТБ/с. Это позволяет провести некоторое сравнение с 96 ГБ HBM2e от Alibaba, хотя и не обязательно говорит о реальной производительности.
Главной неизвестной на данный момент остается программная часть. Хотя Alibaba, понятное дело, стремится показать, что может самостоятельно удовлетворять потребности в AI-оборудовании, компания не раскрыла детали о фреймворках, инструментах разработки или совместимости с существующими стеками моделей. До появления независимых тестов и поддержки со стороны разработчиков заявление о паритете PPU с аппаратным обеспечением Nvidia остается лишь утверждением, подкрепленным китайским государственным телевидением и поддержанным правительством Китая.
ИИ: Китай продолжает активно развивать собственные полупроводниковые технологии, стремясь снизить зависимость от западных поставщиков, особенно в свете текущих ограничений. Однако без открытых независимых тестов и подробностей о программной экосистеме заявления о производительности стоит воспринимать с осторожностью.
0 комментариев