DeepSeek в сфере ИИ обошёл стандарт CUDA

DeepSeek произвел настоящий фурор в индустрии ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:KIOXIA выпустила ПО AiSAQ для снижения потребности в DRAMSolidigm продлевает соглашение с Broadcom о выпуске SSD-контроллеров высокой емкости для ИИТретья китайская компания начинает производство памяти HBM для процессоров ИИ: отчетСША готовят «Звездные врата»: 500 миллиардов долларов на развитие инфраструктуры ИИИИ увеличит потребность в хранении данных

, обучив свою языковую модель Mixture-of-Experts (MoE) с 671 миллиардом параметров с использованием кластера с 2048 графическими процессорами Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:Nvidia подтверждает, что «Press Build» RTX 5090 не разогнанNvidia наконец признала надвигающуюся нехватку графических процессоров серии RTX 50NVIDIA GeForce RTX 5070 Ti выйдет 20 февраляПэт Гелсингер прогнозирует рост акций NvidiaПадение рыночной капитализации Nvidia из-за DeepSeek AI

H800 примерно за два месяца, показав в 10 раз более высокую эффективность, чем лидеры индустрии ИИ, такие как Meta. Прорыв был достигнут за счет внедрения множества мелкозернистых оптимизаций и использования программирования PTX (Parallel Thread Execution), похожего на ассемблирование, вместо CUDA от Nvidia, согласно анализу Mirae Asset Securities Korea, цитируемому @Jukanlosreve.

PTX (Parallel Thread Execution) от Nvidia — это промежуточная архитектура набора инструкций, разработанная Nvidia для своих графических процессоров. PTX находится между языками программирования графических процессоров более высокого уровня (например, CUDA C/C++ или другими языковыми интерфейсами) и низкоуровневым машинным кодом (потоковой сборкой или SASS). PTX — это ISA, близкая к металлу, которая представляет графический процессор как устройство параллельных вычислений и, следовательно, допускает мелкозернистые оптимизации, такие как распределение регистров и корректировки уровня потоков/варпов, что не могут обеспечить CUDA C/C++ и другие языки. После того, как PTX попадает в SASS, он оптимизируется для определенного поколения графических процессоров Nvidia.

Например, при обучении своей модели V3 DeepSeek перенастроил графические процессоры Nvidia H800: из 132 потоковых мультипроцессоров он выделил 20 для связи между серверами, возможно, для сжатия и распаковки данных, чтобы преодолеть ограничения процессора по подключению и ускорить транзакции. Для максимизации производительности DeepSeek также реализовал расширенные алгоритмы конвейера, возможно, путем внесения дополнительных тонких корректировок на уровне потоков/варпов.

Эти модификации выходят далеко за рамки стандартной разработки на уровне CUDA, но их, как известно, трудно поддерживать. Таким образом, этот уровень оптимизации отражает исключительное мастерство инженеров DeepSeek. Глобальный дефицит GPU, усиленный ограничениями США, вынудил такие компании, как DeepSeek, принять инновационные решения, и DeepSeek совершила прорыв. Однако неясно, сколько денег DeepSeek пришлось вложить в разработку, чтобы достичь своих результатов.

Прорыв нарушил рынок, поскольку некоторые инвесторы считали, что потребность в высокопроизводительном оборудовании для новых моделей ИИ снизится, что нанесет ущерб продажам таких компаний, как Nvidia. Ветераны отрасли, такие как Intel Пэт Гелсингер, бывший генеральный директор Intel, считают, что такие приложения, как ИИ, могут использовать всю вычислительную мощность, к которой они могут получить доступ. Что касается прорыва DeepSeek, Гелсингер рассматривает его как способ добавить ИИ к широкому набору недорогих устройств на массовом рынке.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон

Смотреть все