Nvidia установила мировой рекорд с DGX B200 Blackwell: более 1000 TPS на пользователя

Nvidia побила мировой рекорд в области искусственного интеллекта, преодолев барьер в 1000 токенов в секунду (TPS) на одного пользователя. Достижение было зафиксировано при работе с языковой моделью Llama 4 Maverick от Meta* на новейшем узле DGX B200 Blackwell с восемью GPU Blackwell.

Nvidia превзошла предыдущего рекордсмена — компанию SambaNova — на 31%, достигнув 1038 TPS/пользователя против 792 TPS/пользователя у SambaNova. Согласно отчету Artificial Analysis, Nvidia и SambaNova значительно опережают других участников теста. Amazon и Groq показали результаты около 300 TPS/пользователя, в то время как остальные компании (Fireworks, Lambda Labs, Kluster.ai и другие) не смогли преодолеть отметку в 200 TPS/пользователя.

Рекордный результат стал возможен благодаря ряду оптимизаций, специально разработанных для архитектуры Llama 4 Maverick. Nvidia использовала TensorRT для программных улучшений и применила технику Eagle-3 для ускорения вывода в языковых моделях. Эти две оптимизации дали 4-кратный прирост производительности по сравнению с предыдущими результатами Blackwell.

Точность также была улучшена за счет использования FP8 вместо BF16, операций Attention и техники Mixture of Experts. Инженеры Nvidia дополнительно оптимизировали ядро CUDA, применив пространственное разделение и перестановку весов GEMM.

TPS/пользователь — это метрика производительности ИИ, которая показывает, сколько токенов система может обработать в секунду для одного пользователя. Токены — это основа работы таких сервисов, как Copilot и ChatGPT. Чем выше этот показатель, тем быстрее ИИ-чатбот реагирует на запросы.

*Деятельность Meta (владельца Facebook и Instagram) запрещена в России как экстремистская.


ИИ: Удивительно, как Nvidia продолжает задавать темп в гонке ИИ-производительности. Новый рекорд Blackwell демонстрирует не только аппаратные преимущества, но и важность программных оптимизаций — именно их сочетание дает такой впечатляющий результат. Интересно, как отреагируют конкуренты и какие новые методы ускорения ИИ появятся в ближайшем будущем.

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Эта ошибка из Tomshardware перекочевала fixed
  • Sam
Разница в том, что апартеид был системой угнетения, лишавшей чернокожих базовых прав, а BEE — это меры по исправлению последствий этой системы. Да, формально белый предприниматель из другой страны...
  • Rutab
Я ИИ-помощник на сайте Rutab.net, который помогает пользователям разбираться в тематиках статей — технологиях, науке, играх, фильмах и многом другом 😊 Можешь спрашивать меня о чем угодно!
  • Rutab
В статье не указан точный размер модели Falcon-H1, но упоминается, что это «компактная модель», превосходящая аналоги от Meta и Alibaba. Вероятно, речь идет о параметрах в диапазоне 1-10 млрд (как...
  • Rutab
Вангую Huang Tracing будет еще лучше, чем Ray Tracing и Path Tracing
  • Анон
Робот «Фёдор» (FEDOR — Final Experimental Demonstration Object Research) — это российский антропоморфный робот, разработанный ФПИ и НПО «Андроидная техника». В 2019 году он даже летал на МКС, но...
  • Rutab
Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab
а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон

Смотреть все