NVIDIA Blackwell Ultra определяет новую эру ИИ: впечатляющий скачок эффективности и в 50 раз больше токенов на ватт
Гонка вооружений в области инфраструктуры для искусственного интеллекта вступает в новую фазу. NVIDIA, бесспорный лидер рынка, продемонстрировала возможности своей новейшей платформы Blackwell Ultra (GB300 NVL72). Результаты однозначны: «зелёные» не только сохраняют преимущество, но и превосходят предыдущие поколения, предлагая решение, заточенное под растущий рынок автономных агентов ИИ и гигантских языковых моделей.
Отрасль искусственного интеллекта эволюционирует с головокружительной скоростью. Если 2022 год прошёл под знаком простых чат-ботов, то 2026 год принадлежит так называемому «агентному ИИ» — системам, способным к многоэтапному рассуждению и автономным действиям. Это изменение вынуждает поставщиков инфраструктуры, таких как NVIDIA, радикально увеличивать пропускную способность памяти и снижать задержки. Ответом на эти вызовы стала архитектура Blackwell Ultra.
В свежей записи в своём блоге NVIDIA, ссылаясь на данные анализа SemiAnalysis InferenceMAX, хвастается параметром, который для гиперскалеров, строящих гигантские центры обработки данных, является ключевым: соотношением токенов к ватту энергии. Система GB300 NVL72 демонстрирует в этом аспекте 50-кратный рост пропускной способности на мегаватт по сравнению с чипами семейства Hopper.
Такой гигантский скачок — не случайность. Инженеры NVIDIA объединили 72 графических процессора в один цельный суперкомпьютер, используя технологию NVLink с пропускной способностью 130 ТБ/с. В отличие от ограниченной доменом из 8 чипов в архитектуре Hopper, Blackwell Ultra создаёт единую вычислительную структуру. Ключевую роль здесь также играет новый формат точности вычислений NVFP4, который кардинально ускоряет обработку данных при сохранении необходимой точности.
Для исследовательских лабораторий и компаний, внедряющих ИИ, эти цифры напрямую переводятся в финансы. NVIDIA заявляет, что новая архитектура позволяет снизить стоимость генерации миллиона токенов в 35 раз. Это особенно важно для «агентного ИИ», где модели должны обрабатывать огромные объёмы контекстной информации (например, целые базы программного кода), чтобы сохранять непрерывность рассуждений.
Сравнивая Blackwell Ultra (GB300) с моделью GB200 в задачах, требующих длинного контекста, новая платформа предлагает:
– В 1,5 раза более низкую стоимость на токен.
– В 2 раза более быстрое сопоставление фактов в обширных данных.
Похоже, что закон Хуанга (утверждающий, что прогресс в производительности ИИ-чипов опережает закон Мура) по-прежнему действует. А на горизонте уже маячит следующее поколение — архитектура Vera Rubin, которая должна принести ещё большие улучшения, укрепляя доминирование NVIDIA в гонке за технологическое превосходство.
Интересный факт: Термин «агентный ИИ» (Agentic AI) описывает системы, которые не просто отвечают на запросы, а способны самостоятельно ставить цели, планировать и выполнять последовательности действий для их достижения, используя инструменты и данные из окружающей среды. Это следующий логический шаг после современных языковых моделей.








0 комментариев