Сетевое оборудование NVIDIA ускоряет работу суперкомпьютера xAI

/ ТехнологииНовости / Технологии
Компания NVIDIA сегодня объявила, что суперкомпьютерный кластер xAI Colossus, состоящий из 100 000 графических процессоров NVIDIA Hopper в Мемфисе, штат Теннесси, достиг такого огромного масштаба благодаря использованию сетевой платформы NVIDIA Spectrum-X Ethernet

Thumbnail: EthernetEthernet (англ. Ethernet [ˈiːθəˌnɛt] от ether [ˈiːθə] «эфир» + network «сеть, цепь») — семейство технологий пакетной передачи данных между устройствами для компьютерных и промышленных сетей. Это самый распространенный протокол в мире, используемый для построения локальных сетей (LAN) и городских сетей (MAN). Протоколы Ethernet работают на физическом уровне модели OSI, предоставляя средства для передачи данных между устройствами. Википедия

Читайте также:AMD представляет сетевую карту для ИИ и высокопроизводительных вычисленийRealtek представляет новые решения на выставке Network X 2024Alibaba Cloud отказывается от межсоединения Nvidia в пользу EthernetПатентная заявка Xbox позволяет представить, как могла бы выглядеть стриминговая консоль KeystoneRealtek стремится сделать коммутаторы Ethernet 5 Гбит/с более доступными с помощью новой платформы

, которая разработана для обеспечения превосходной производительности для многопользовательских гипермасштабируемых фабрик искусственного интеллекта с использованием стандартизированного Ethernet для сети удаленного прямого доступа к памяти (RDMA).

Colossus, крупнейший в мире суперкомпьютер с искусственным интеллектом, используется для обучения семейства крупных языковых моделей Grok компании xAI, а чат-боты предлагаются в качестве функции для подписчиков X Premium. xAI находится в процессе удвоения размера Colossus до общего числа 200 000 графических процессоров NVIDIA Hopper.

xAI и NVIDIA построили вспомогательное оборудование и современный суперкомпьютер всего за 122 дня, вместо типичного срока для систем такого размера, который может занять от нескольких месяцев до нескольких лет. С момента, когда первая стойка была выкатлена на пол, до начала обучения прошло 19 дней.

При обучении чрезвычайно большой модели Grok Colossus достигает беспрецедентной производительности сети. На всех трех уровнях сетевой структуры система испытала нулевую задержку приложений или потерю пакетов из-за столкновений потоков. Она сохранила 95% пропускной способности данных, обеспечиваемой контролем перегрузки Spectrum-X.

Такого уровня производительности невозможно достичь при масштабировании с помощью стандартного Ethernet, который создает тысячи коллизий потоков, обеспечивая при этом лишь 60% пропускной способности данных.

«ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:Линус Торвальдс считает, что ИИ — это «90% маркетинга и 10% реальности»SK hynix: рекордный рост выручки на 94% в III квартале 2024 годаДженсен Хуанг признал ошибку Nvidia в чипах ИИSSSTC представляет Gen5 Enterprise SSDТайвань рассматривает новые планы в области ядерной энергетики в связи с требованиями бума ИИ

становится критически важным и требует повышенной производительности, безопасности, масштабируемости и экономической эффективности», — сказал Гилад Шайнер, старший вице-президент по сетевым технологиям в NVIDIA. «Сетевая платформа NVIDIA Spectrum-X Ethernet разработана для того, чтобы предоставить таким новаторам, как xAI, более быструю обработку, анализ и выполнение рабочих нагрузок ИИ, и, в свою очередь, ускоряет разработку, развертывание и время вывода на рынок решений ИИ».

«Colossus — самая мощная система обучения в мире», — сказал Илон Маск в интервью X. «Отличная работа команды xAI, NVIDIA и наших многочисленных партнеров/поставщиков».

«xAI построила самый большой и мощный суперкомпьютер в мире», — заявил представитель xAI. «Графические процессоры NVIDIA Hopper и Spectrum-X позволяют нам раздвинуть границы обучения моделей ИИ в огромных масштабах, создавая сверхбыструю и оптимизированную фабрику ИИ на основе стандарта Ethernet».

Сердцем платформы Spectrum-X является Ethernet-коммутатор Spectrum SN5600, который поддерживает скорость портов до 800 Гбит/с и работает на базе микросхемы коммутатора Spectrum-4 ASIC. Компания xAI решила объединить коммутатор Spectrum-X SN5600 с сетевыми картами NVIDIA BlueField-3 SuperNIC для достижения беспрецедентной производительности.

Сетевое решение Spectrum-X Ethernet для ИИ предлагает расширенные функции, которые обеспечивают высокоэффективную и масштабируемую полосу пропускания с низкой задержкой и короткой задержкой хвоста, ранее эксклюзивную для InfiniBand. Эти функции включают адаптивную маршрутизацию с технологией NVIDIA Direct Data Placement, контроль перегрузки, а также улучшенную видимость фабрики ИИ и изоляцию производительности — все ключевые требования для многопользовательских генеративных облаков ИИ и крупных корпоративных сред.

Источник: Techpowerup.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Указан неверный диаметр вентиляторов, не 80 мм, а 100 мм. И чип не 103, а 102.
  • Анон
С прошлым обновлением как раз и появилась эта ошибка. А новое как и написано не дают скачать.
  • Анон
При включении 3D Turbo Mode у вас максимум будет доступно 8 ядер и 8 потоков всего. т.е. если у вас 16 ядерный на 32 потока то будет всего 8 ядер и 8 потоков! Странная оптимизация!
  • Анон
После скачивания вышел синий экран СУПЕР!
  • Анон
требуется указать магазин и purchase date без этого не регистрирует
  • Анон
Россия на них клала❤❤❤❤, будет называться Ладушка 2.0 )))
  • Анон
ДА у меня тоже неработает уже все Вы не знаете каким способом вернуть все обратно СПАСИ
  • Анон
Хаетв Рустам Базарвич Хаетв
  • Анон
Очень довольна приложением. Пользуюсь сама и рекомендую другим.
16 способ - Ноутбук HP ProBook 4740s автоматически установлена камера HP HD Webcam [Fixed] при этом онлайн из браузера подключается камера к веб страницам, камера работает. С приложениями камера...
  • Анон

Смотреть все