Huawei Ascend 910C, как утверждается, на 60% быстрее Nvidia H100

HiSilicon Ascend 910C от Huawei — это версия процессора Ascend 910 для обучения ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:AMD: скепсис инвесторов на фоне ИИИИ получает агентов: ChatGPT теперь имеет глубокие исследования с возможностями агентовIntel отказывается от Falcon Shores. Преемник — Jaguar ShoresМодель R1-Zero воспроизводит технологии DeepSeek за 30 долларовKIOXIA выпустила ПО AiSAQ для снижения потребности в DRAM

, представленного в 2019 году. К настоящему времени производительности Ascend 910 едва хватает для экономически эффективного обучения больших моделей ИИ. Тем не менее, когда дело доходит до вывода, он обеспечивает 60% производительности H100 от Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:ASUS AI POD готов к массовому производствуОтчеты о сбоях в работе NVIDIA GeForce RTX 5090 и RTX 5090D SurgeRTX 5090 требует PCI 3x8-Pin, а RTX 5080 в этой конфигурации не работаетГрафические процессоры NVIDIA GeForce RTX 5070 Ti и 5070 добавлены в список поддержки Vulkan 1.4ПК с ИИ на базе NVIDIA GeForce RTX 50 ускоряют DeepSeek

, по словам исследователей из DeepSeek. Хотя Ascend 910C не является чемпионом по производительности, он может успешно снизить зависимость Китая от графических процессоров Nvidia.

Тестирование DeepSeek показало, что процессор 910C превзошел ожидания по производительности вывода. Кроме того, с помощью ручной оптимизации ядер CUNN его эффективность может быть дополнительно улучшена. Собственная поддержка DeepSeek для процессоров Ascend и его репозитория PyTorch позволяет выполнять бесшовное преобразование CUDA в CUNN с минимальными усилиями, что упрощает интеграцию оборудования Huawei в рабочие процессы ИИ.

Это говорит о том, что возможности ИИ-процессоров Huawei стремительно развиваются, несмотря на санкции со стороны правительства США и отсутствие доступа к передовым технологическим процессам TSMC.

Хотя Huawei и SMIC

Thumbnail: SMICSemiconductor Manufacturing International Corporation (SMIC) — китайская компания, занимающаяся производством микроэлектроники, крупнейшая микроэлектронная компания континентального Китая. Компания зарегистрирована на Каймановых островах, штаб-квартира расположена в Шанхае (КНР). Основана в 2000 году. Компания в настоящее время имеет наиболее передовое и развитое производство чипов в Китае: она производит СБИС по техпроцессам от 7 нм и начала рисковое производство по 7-нм техпроцессу в конце 2020 года. Википедия

Читайте также:Конгрессмен США обвинил SMIC в производстве 7-нм чипов для Китая в нарушение санкцийSMIC сообщает результаты третьего квартала 2024 годаПроблемы с чипами ИИ у Huawei: отчетВозможный избыток мощностей в китайском секторе микросхемКонкуренция производителей чипов в Китае снижает цены

сумели догнать TSMC по возможностям в эпоху 2019–2020 годов и выпустить чип, который можно считать конкурентоспособным с процессорами Nvidia A100 и H100, Ascend 910C — не лучший вариант для обучения ИИ. Обучение ИИ остается областью, в которой Nvidia сохраняет свое неоспоримое лидерство.

Ючен Цзинь из DeepSeek сказал, что надежность долгосрочного обучения является критическим недостатком китайских процессоров. Эта проблема возникает из-за глубокой интеграции аппаратной и программной экосистемы Nvidia, которая разрабатывалась в течение двух десятилетий. Хотя производительность вывода может быть оптимизирована, постоянные рабочие нагрузки обучения требуют дальнейшего улучшения аппаратного и программного стека Huawei.

Как и оригинальный Ascend 910, новый чип Ascend 910C использует упаковку чиплетов, а его основная вычислительная система SoC имеет около 53 миллиардов транзисторов. В то время как оригинальный вычислительный чиплет Ascend 910 был изготовлен TSMC с использованием технологии изготовления N7+ (класс 7 нм с EUV), вычислительный чиплет Ascend 910C изготовлен SMIC по ее технологическому процессу 2-го поколения 7 нм, известному как N+2.

Заглядывая вперед, некоторые эксперты предсказывают, что по мере того, как модели ИИ будут приближаться к архитектурам Transformer, важность программной экосистемы Nvidia может снизиться. Опыт DeepSeek в оптимизации аппаратного и программного обеспечения также может значительно снизить зависимость от Nvidia, предлагая компаниям ИИ более экономически эффективную альтернативу, особенно для вывода. Однако, чтобы конкурировать в глобальном масштабе, Китаю необходимо преодолеть проблему стабильности обучения и дополнительно усовершенствовать свою вычислительную инфраструктуру ИИ.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Поддерживаю. А еще если брать в разрезе Илон Маск и безопасность данных, то вообще смешно. Особенно для жителей РФ)О конфиденциальности можно забыть
  • Анон
1c пох на ваши операции, количество ядер и прочее. Умудрились написать ядро четко привязанное к Мгц. Единственный в мире продукт для 1го ядра.
  • Анон
Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон

Смотреть все