Сетевое оборудование NVIDIA ускоряет работу суперкомпьютера xAI
Ethernet (англ. Ethernet [ˈiːθəˌnɛt] от ether [ˈiːθə] «эфир» + network «сеть, цепь») — семейство технологий пакетной передачи данных между устройствами для компьютерных и промышленных сетей. Это самый распространенный протокол в мире, используемый для построения локальных сетей (LAN) и городских сетей (MAN). Протоколы Ethernet работают на физическом уровне модели OSI, предоставляя средства для передачи данных между устройствами. Википедия
Читайте также:AMD представляет сетевую карту для ИИ и высокопроизводительных вычисленийRealtek представляет новые решения на выставке Network X 2024Alibaba Cloud отказывается от межсоединения Nvidia в пользу EthernetПатентная заявка Xbox позволяет представить, как могла бы выглядеть стриминговая консоль KeystoneRealtek стремится сделать коммутаторы Ethernet 5 Гбит/с более доступными с помощью новой платформы
Colossus, крупнейший в мире суперкомпьютер с искусственным интеллектом, используется для обучения семейства крупных языковых моделей Grok компании xAI, а чат-боты предлагаются в качестве функции для подписчиков X Premium. xAI находится в процессе удвоения размера Colossus до общего числа 200 000 графических процессоров NVIDIA Hopper.
xAI и NVIDIA построили вспомогательное оборудование и современный суперкомпьютер всего за 122 дня, вместо типичного срока для систем такого размера, который может занять от нескольких месяцев до нескольких лет. С момента, когда первая стойка была выкатлена на пол, до начала обучения прошло 19 дней.
При обучении чрезвычайно большой модели Grok Colossus достигает беспрецедентной производительности сети. На всех трех уровнях сетевой структуры система испытала нулевую задержку приложений или потерю пакетов из-за столкновений потоков. Она сохранила 95% пропускной способности данных, обеспечиваемой контролем перегрузки Spectrum-X.
Такого уровня производительности невозможно достичь при масштабировании с помощью стандартного Ethernet, который создает тысячи коллизий потоков, обеспечивая при этом лишь 60% пропускной способности данных.
Иску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия
Читайте также:Линус Торвальдс считает, что ИИ — это «90% маркетинга и 10% реальности»SK hynix: рекордный рост выручки на 94% в III квартале 2024 годаДженсен Хуанг признал ошибку Nvidia в чипах ИИSSSTC представляет Gen5 Enterprise SSDТайвань рассматривает новые планы в области ядерной энергетики в связи с требованиями бума ИИ
«Colossus — самая мощная система обучения в мире», — сказал Илон Маск в интервью X. «Отличная работа команды xAI, NVIDIA и наших многочисленных партнеров/поставщиков».
«xAI построила самый большой и мощный суперкомпьютер в мире», — заявил представитель xAI. «Графические процессоры NVIDIA Hopper и Spectrum-X позволяют нам раздвинуть границы обучения моделей ИИ в огромных масштабах, создавая сверхбыструю и оптимизированную фабрику ИИ на основе стандарта Ethernet».
Сердцем платформы Spectrum-X является Ethernet-коммутатор Spectrum SN5600, который поддерживает скорость портов до 800 Гбит/с и работает на базе микросхемы коммутатора Spectrum-4 ASIC. Компания xAI решила объединить коммутатор Spectrum-X SN5600 с сетевыми картами NVIDIA BlueField-3 SuperNIC для достижения беспрецедентной производительности.
Сетевое решение Spectrum-X Ethernet для ИИ предлагает расширенные функции, которые обеспечивают высокоэффективную и масштабируемую полосу пропускания с низкой задержкой и короткой задержкой хвоста, ранее эксклюзивную для InfiniBand. Эти функции включают адаптивную маршрутизацию с технологией NVIDIA Direct Data Placement, контроль перегрузки, а также улучшенную видимость фабрики ИИ и изоляцию производительности — все ключевые требования для многопользовательских генеративных облаков ИИ и крупных корпоративных сред.
Источник: Techpowerup.com
0 комментариев