Утечка DeepSeek R2 раскрывает 512 петафлопс для развития инфраструктуры ускорителей ИИ

26 апреля 2025, 20:54 / Технологии → Новости / Технологии

DeepSeek, компания, которая покорила мир ИИ

Thumbnail: Искусственный интеллект Иску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

своей моделью R1, готовит новую и, как сообщается, значительно улучшенную модель DeepSeek R2, согласно известному инсайдеру в области ИИ @iruletheworldmo на X. Работая на кластерах чипов Ascend 910B от Huawei

Thumbnail: Huawei Huawei Technologies Co. Ltd. (кит. трад. Википедия

, возможном Huawei Atlas 900 и внутренней распределенной обучающей платформе DeepSeek, R2 выводит эти ускорители на впечатляющие 82% использования, что соответствует 512 петафлопс производительности FP16 — половине эксафлопс вычислительной мощности. Согласно данным лаборатории Huawei, это примерно 91% от того, что обеспечивают старые кластеры NVIDIA A100, однако DeepSeek утверждает, что сокращает затраты на обучение на единицу на замечательные 97,3%. За DeepSeek R2 стоит тщательно выстроенная экосистема партнеров. Tuowei Information, ведущий OEM в семействе Ascend, управляет более чем половиной заказов на суперкомпьютерное оборудование DeepSeek, в то время как Sugon поставляет серверные стойки с жидкостным охлаждением, способные выдерживать до 40 кВт на единицу. Чтобы контролировать потребление энергии, кремниевые фотонные трансиверы Innolight экономят еще 35% по сравнению с традиционными решениями.

Географически операции распределены по основным центрам: Runjian Shares управляет суперкомпьютерным центром в Южном Китае по контрактам, превышающим 5 миллиардов иен в год, а Zhongbei Communications поддерживает резерв в 1500 петафлопс на Северо-Западе для пиковых нагрузок. Что касается программного обеспечения, DeepSeek R2 уже поддерживает частное развертывание и тонкую настройку, поддерживая инициативы умных городов в 15 провинциях через платформу Yun Sai Zhilian. Узел в Северном Китае, контролируемый Yingbo Digital из Hongbo Shares, добавляет еще 3000 петафлопс к общему миксу. Если вычислительной мощности не хватает, Huawei готова развернуть свою систему CloudMatrix 384, которая позиционируется как отечественная альтернатива GB200 NVL72 от NVIDIA. Он оснащен 384 ускорителями Ascend 910C для достижения 1,7x общего петафлопса и 3,6x общей емкости HBM кластера NVL72, но он значительно отстает по производительности на чип и потребляет почти в четыре раза больше энергии. Тем не менее, запуск модели R2, как ожидается, пройдет гладко, и мы ждем официального запуска и тестов, чтобы увидеть его производительность.

Утечка DeepSeek R2 раскрывает 512 петафлопс для развития инфраструктуры ускорителей ИИ

0 комментариев

Оставить комментарий

Все комментарии - Технологии