NVIDIA раскрывает потенциал AI-фабрик для генерации дохода

16 мая 2025, 21:39 / Технологии → Новости / Технологии

NVIDIA обсудила, как AI-фабрики могут стать ключевым инструментом для генерации дохода, преобразуя данные в ценные результаты — токены, прогнозы, изображения и другие формы информации. Эти фабрики оптимизируют три аспекта работы с ИИ: обработку данных, обучение моделей и масштабный вывод (инференс).

Экономика инференса и создание ценности

AI-фабрики балансируют между скоростью генерации токенов, энергоэффективностью и качеством вывода. Ключевые метрики:

Throughput — количество токенов в секунду.
Latency — время до первого токена и скорость последующих.
Goodput — полезный вывод системы при заданных задержках.

Например, чат-бот, отвечающий за 0,5 секунды, ценнее аналогичного с задержкой в 5 секунд, даже если оба генерируют одинаковое число токенов.

Оптимизация через Pareto frontier

График Pareto frontier помогает найти баланс между пропускной способностью и пользовательским опытом. NVIDIA сравнила производительность GPU H100 (32 токена/сек) и B300 (344 токена/сек), показав, что Blackwell Ultra дает в 10 раз лучший опыт и в 5 раз выше throughput, увеличивая потенциальный доход в 50 раз.

Как работают AI-фабрики

Они объединяют ускоренные вычисления, сети, ПО и хранилища для преобразования данных в интеллект. Пример — Lockheed Martin, обрабатывающая 1 млрд токенов в неделю на NVIDIA DGX SuperPOD, избегая затрат на облачные сервисы.

Технологии NVIDIA для AI-фабрик

Компания предлагает полный стек решений, включая GPU Blackwell, платформу Dynamo для оптимизации инференса и InfiniBand-сети. Например, жидкостное охлаждение GB200 NVL72 повышает энергоэффективность.

ИИ: AI-фабрики — следующий шаг в промышленном масштабировании ИИ. Их эффективность уже доказана такими гигантами, как Lockheed Martin, а технологии NVIDIA позволяют развертывать их быстрее и с меньшими затратами. В ближайшие годы этот подход может стать стандартом для предприятий, работающих с большими данными.

Источник: NVIDIA Blog

NVIDIA раскрывает потенциал AI-фабрик для генерации дохода

Экономика инференса и создание ценности

Оптимизация через Pareto frontier

Как работают AI-фабрики

Технологии NVIDIA для AI-фабрик

0 комментариев

Оставить комментарий

Все комментарии - Технологии