NVIDIA Blackwell Ultra определяет новую эру ИИ: впечатляющий скачок эффективности и в 50 раз больше токенов на ватт

Гонка вооружений в области инфраструктуры для искусственного интеллекта вступает в новую фазу. NVIDIA, бесспорный лидер рынка, продемонстрировала возможности своей новейшей платформы Blackwell Ultra (GB300 NVL72). Результаты однозначны: «зелёные» не только сохраняют преимущество, но и превосходят предыдущие поколения, предлагая решение, заточенное под растущий рынок автономных агентов ИИ и гигантских языковых моделей.

Отрасль искусственного интеллекта эволюционирует с головокружительной скоростью. Если 2022 год прошёл под знаком простых чат-ботов, то 2026 год принадлежит так называемому «агентному ИИ» — системам, способным к многоэтапному рассуждению и автономным действиям. Это изменение вынуждает поставщиков инфраструктуры, таких как NVIDIA, радикально увеличивать пропускную способность памяти и снижать задержки. Ответом на эти вызовы стала архитектура Blackwell Ultra.

В свежей записи в своём блоге NVIDIA, ссылаясь на данные анализа SemiAnalysis InferenceMAX, хвастается параметром, который для гиперскалеров, строящих гигантские центры обработки данных, является ключевым: соотношением токенов к ватту энергии. Система GB300 NVL72 демонстрирует в этом аспекте 50-кратный рост пропускной способности на мегаватт по сравнению с чипами семейства Hopper.

Такой гигантский скачок — не случайность. Инженеры NVIDIA объединили 72 графических процессора в один цельный суперкомпьютер, используя технологию NVLink с пропускной способностью 130 ТБ/с. В отличие от ограниченной доменом из 8 чипов в архитектуре Hopper, Blackwell Ultra создаёт единую вычислительную структуру. Ключевую роль здесь также играет новый формат точности вычислений NVFP4, который кардинально ускоряет обработку данных при сохранении необходимой точности.

Для исследовательских лабораторий и компаний, внедряющих ИИ, эти цифры напрямую переводятся в финансы. NVIDIA заявляет, что новая архитектура позволяет снизить стоимость генерации миллиона токенов в 35 раз. Это особенно важно для «агентного ИИ», где модели должны обрабатывать огромные объёмы контекстной информации (например, целые базы программного кода), чтобы сохранять непрерывность рассуждений.

Сравнивая Blackwell Ultra (GB300) с моделью GB200 в задачах, требующих длинного контекста, новая платформа предлагает:

– В 1,5 раза более низкую стоимость на токен.
– В 2 раза более быстрое сопоставление фактов в обширных данных.

Похоже, что закон Хуанга (утверждающий, что прогресс в производительности ИИ-чипов опережает закон Мура) по-прежнему действует. А на горизонте уже маячит следующее поколение — архитектура Vera Rubin, которая должна принести ещё большие улучшения, укрепляя доминирование NVIDIA в гонке за технологическое превосходство.

Интересный факт: Термин «агентный ИИ» (Agentic AI) описывает системы, которые не просто отвечают на запросы, а способны самостоятельно ставить цели, планировать и выполнять последовательности действий для их достижения, используя инструменты и данные из окружающей среды. Это следующий логический шаг после современных языковых моделей.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.


0 комментариев

Оставить комментарий


Все комментарии - Технологии