NVIDIA Blackwell показала рекордную производительность в тестах MLPerf Training
NVIDIA продолжает сотрудничество с компаниями по всему миру для создания «AI-фабрик», ускоряющих обучение и развертывание приложений на основе искусственного интеллекта. Архитектура Blackwell разработана для удовлетворения растущих требований к производительности в этой сфере.
В последнем раунде тестов MLPerf Training (12-м с момента запуска бенчмарка в 2018 году) платформа NVIDIA продемонстрировала наивысшую производительность во всех тестах, включая самый сложный — обучение крупной языковой модели Llama 3.1 405B.
Платформа NVIDIA стала единственной, представившей результаты по всем тестам MLPerf Training v5.0, что подчеркивает ее исключительную производительность и универсальность для различных задач ИИ. Тестирование проводилось на двух суперкомпьютерах на базе Blackwell: Tyche (с использованием NVIDIA GB200 NVL72) и Nyx (на основе NVIDIA DGX B200). В сотрудничестве с CoreWeave и IBM были представлены результаты с использованием 2496 GPU Blackwell и 1248 CPU NVIDIA Grace.
В тесте Llama 3.1 405B Blackwell показала производительность в 2,2 раза выше по сравнению с предыдущим поколением архитектуры. В тесте Llama 2 70B LoRA система DGX B200 с восемью GPU Blackwell продемонстрировала рост производительности в 2,5 раза.
Эти достижения стали возможны благодаря инновациям Blackwell, включая жидкостное охлаждение, 13,4 ТБ памяти на стойку, технологии NVLink пятого поколения и сетевую инфраструктуру Quantum-2 InfiniBand. Также важную роль сыграли улучшения в программном стеке NVIDIA NeMo Framework.
Партнерская экосистема NVIDIA активно участвовала в этом раунде тестов. Помимо CoreWeave и IBM, результаты представили ASUS, Cisco, Dell Technologies, Google Cloud, HPE и другие компании.
Подробнее о тестах MLPerf можно узнать на официальном сайте NVIDIA.
0 комментариев