Утечка DeepSeek R2 раскрывает 512 петафлопс для развития инфраструктуры ускорителей ИИ

DeepSeek, компания, которая покорила мир ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:Microsoft запускает функцию отзыва и интегрирует ИИ в поиск, а также другие обновленияIntel обновляет стратегию ИИ в Jaguar ShoresSK hynix представила HBM4 на симпозиуме TSMC 2025Nvida выпустила G-Assist для интеграции ИИ с ПОПроект NVIDIA G-Assist Plug-In Builder: каждый может настроить ИИ на ПК GeForce RTX AI

своей моделью R1, готовит новую и, как сообщается, значительно улучшенную модель DeepSeek R2, согласно известному инсайдеру в области ИИ @iruletheworldmo на X. Работая на кластерах чипов Ascend 910B от Huawei , возможном Huawei Atlas 900 и внутренней распределенной обучающей платформе DeepSeek, R2 выводит эти ускорители на впечатляющие 82% использования, что соответствует 512 петафлопс производительности FP16 — половине эксафлопс вычислительной мощности. Согласно данным лаборатории Huawei, это примерно 91% от того, что обеспечивают старые кластеры NVIDIA A100, однако DeepSeek утверждает, что сокращает затраты на обучение на единицу на замечательные 97,3%. За DeepSeek R2 стоит тщательно выстроенная экосистема партнеров. Tuowei Information, ведущий OEM в семействе Ascend, управляет более чем половиной заказов на суперкомпьютерное оборудование DeepSeek, в то время как Sugon поставляет серверные стойки с жидкостным охлаждением, способные выдерживать до 40 кВт на единицу. Чтобы контролировать потребление энергии, кремниевые фотонные трансиверы Innolight экономят еще 35% по сравнению с традиционными решениями.

Географически операции распределены по основным центрам: Runjian Shares управляет суперкомпьютерным центром в Южном Китае по контрактам, превышающим 5 миллиардов иен в год, а Zhongbei Communications поддерживает резерв в 1500 петафлопс на Северо-Западе для пиковых нагрузок. Что касается программного обеспечения, DeepSeek R2 уже поддерживает частное развертывание и тонкую настройку, поддерживая инициативы умных городов в 15 провинциях через платформу Yun Sai Zhilian. Узел в Северном Китае, контролируемый Yingbo Digital из Hongbo Shares, добавляет еще 3000 петафлопс к общему миксу. Если вычислительной мощности не хватает, Huawei готова развернуть свою систему CloudMatrix 384, которая позиционируется как отечественная альтернатива GB200 NVL72 от NVIDIA. Он оснащен 384 ускорителями Ascend 910C для достижения 1,7x общего петафлопса и 3,6x общей емкости HBM кластера NVL72, но он значительно отстает по производительности на чип и потребляет почти в четыре раза больше энергии. Тем не менее, запуск модели R2, как ожидается, пройдет гладко, и мы ждем официального запуска и тестов, чтобы увидеть его производительность.

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий