Графические процессоры AMD Instinct обеспечивают работу DeepSeek-V3

/ ТехнологииНовости / Технологии
AMD

Advanced Micro Devices, Inc. (AMD, дословный перевод с англ. — «передовые микроустройства») — производитель интегральной микросхемной электроники. Второй по объему производства и продаж производитель процессоров архитектуры x86 c долей рынка 16,9 %▲(2014), а также один из крупнейших производителей графических процессоров (после приобретения ATI Technologies в 2006 году), чипсетов для материнских плат и флеш-памяти. Компания с 2009 года не имеет собственного производства и размещает заказы на мощностях других компаний. Википедия

Читайте также:AMD выпускает плагины Unreal Engine 5.5 для Anti-Lag 2 и FSR 3.1.3AMD: скепсис инвесторов на фоне ИИNvidia опровергла результаты тестов AMD DeepSeekAMD Instinct MI400 будет включать новый специализированный кристалл ввода-вывода для мультимедиаAMD в марте выпустит Ryzen 9 и GPU RDNA 4

рада объявить об интеграции новой модели DeepSeek-V3 от DeepSeek на графических процессорах AMD Instinct, оптимизированной для производительности на базе SGLang. Эта интеграция поможет ускорить разработку передовых приложений и опытов ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:AMD: скепсис инвесторов на фоне ИИИИ получает агентов: ChatGPT теперь имеет глубокие исследования с возможностями агентовIntel отказывается от Falcon Shores. Преемник — Jaguar ShoresМодель R1-Zero воспроизводит технологии DeepSeek за 30 долларовKIOXIA выпустила ПО AiSAQ для снижения потребности в DRAM

. DeepSeek-V3 — это мультимодальная модель ИИ с открытым исходным кодом, разработанная для предоставления разработчикам непревзойденной производительности и эффективности. Благодаря бесшовной интеграции расширенных возможностей для обработки как текстовых, так и визуальных данных DeepSeek-V3 устанавливает новый стандарт производительности, стимулируя инновации и позволяя разработчикам создавать передовые приложения ИИ.

Модель DeepSeek-V3 представляет собой сильную языковую модель Mixture-of-Experts (MoE) с общими параметрами 671B, из которых 37B активируются для каждого токена. Для достижения эффективного вывода и экономически эффективного обучения DeepSeek-V3 использует архитектуры Multi-head Latent Attention (MLA) и DeepSeekMoE, которые были частью его предшественника DeepSeek-V2. Кроме того, DeepSeek-V3 является пионером в области стратегии без дополнительных потерь для балансировки нагрузки и устанавливает цель обучения прогнозирования нескольких токенов для более высокой производительности. DeepSeek-V3 позволяет разработчикам работать с передовыми моделями, используя возможности памяти для одновременной обработки текстовых и визуальных данных, обеспечивая широкий доступ к последним достижениям и предоставляя разработчикам больше функций. DeepSeek-V3 достигает наилучшей производительности в большинстве тестов, особенно в математических и кодовых задачах.

Ускорители графических процессоров AMD Instinct и DeepSeek-V3
Ускорители AMD Instinct GPUs преобразуют ландшафт многомодальных моделей ИИ, таких как DeepSeek-V3, которые требуют огромных вычислительных ресурсов и пропускной способности памяти для обработки текстовых и визуальных данных. Ускорители AMD Instinct обеспечивают выдающуюся производительность в этих областях.

Использование программного обеспечения AMD ROCm и ускорителей AMD Instinct GPU на ключевых этапах разработки DeepSeek-V3 еще больше укрепляет давнее сотрудничество с AMD и приверженность открытому программному подходу для ИИ. Масштабируемая инфраструктура от AMD позволяет разработчикам создавать мощные приложения визуального рассуждения и понимания.

Расширенная поддержка FP8 в ROCm может значительно улучшить процесс запуска моделей ИИ, особенно на стороне вывода. Она помогает решать ключевые проблемы, такие как узкие места памяти и проблемы с высокой задержкой, связанные с большим количеством форматов чтения-записи, позволяя обрабатывать более крупные модели или пакеты в рамках тех же аппаратных ограничений, что приводит к более эффективному процессу обучения и вывода. Кроме того, вычисления с пониженной точностью FP8 могут сократить задержки при передаче данных и вычислениях. AMD ROCm расширяет поддержку FP8 в своей экосистеме, обеспечивая повышение производительности и эффективности во всем, от фреймворков до библиотек.

Сотрудничество AMD и DeepSeek: готовность к поддержке на 0-й день:
С выпуском DeepSeek-V3 AMD продолжает свою традицию содействия инновациям посредством тесного сотрудничества с командой DeepSeek. Это партнерство гарантирует, что разработчики полностью оснащены для использования модели DeepSeek-V3 на графических процессорах AMD Instinct с самого начала, предоставляя более широкий выбор аппаратного обеспечения графических процессоров и открытый программный стек ROCm для оптимизированной производительности и масштабируемости. AMD продолжит оптимизировать производительность DeepSeek-v3 с помощью ядер на основе CK-tile на графических процессорах AMD Instinct. AMD стремится сотрудничать с поставщиками моделей с открытым исходным кодом для ускорения инноваций в области ИИ и предоставления разработчикам возможности создавать следующее поколение возможностей ИИ.

Acknowledgement:
Мы искренне ценим исключительную поддержку и тесное сотрудничество с командами DeepSeek и SGLang. Особая благодарность членам команды AMD Пэн Сану, Брюсу Сюэ, Хай Сяо, Дэвиду Ли, Карлусу Хуану, Минтао Гу, Вамси Алле, Джейсону Ф., Винаяку Гоку, Вун-го Хуану, Кэролайн Кан, Гилберту Лею, Соге Линь, Цзиннин Тану, Фань Ву, Джорджу Вану, Аншулу Гупте, Шуцаю Сяо, Лисюню Чжану и всем остальным, кто внес свой вклад в это начинание.

Источник: Techpowerup.com

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Эта ошибка из Tomshardware перекочевала fixed
  • Sam
Разница в том, что апартеид был системой угнетения, лишавшей чернокожих базовых прав, а BEE — это меры по исправлению последствий этой системы. Да, формально белый предприниматель из другой страны...
  • Rutab
Я ИИ-помощник на сайте Rutab.net, который помогает пользователям разбираться в тематиках статей — технологиях, науке, играх, фильмах и многом другом 😊 Можешь спрашивать меня о чем угодно!
  • Rutab
В статье не указан точный размер модели Falcon-H1, но упоминается, что это «компактная модель», превосходящая аналоги от Meta и Alibaba. Вероятно, речь идет о параметрах в диапазоне 1-10 млрд (как...
  • Rutab
Вангую Huang Tracing будет еще лучше, чем Ray Tracing и Path Tracing
  • Анон
Робот «Фёдор» (FEDOR — Final Experimental Demonstration Object Research) — это российский антропоморфный робот, разработанный ФПИ и НПО «Андроидная техника». В 2019 году он даже летал на МКС, но...
  • Rutab
Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab
а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон

Смотреть все