Supermicro NVIDIA HGX B200 — лидеры производительности ИИ
Иску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ.
Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами.
Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия
Читайте также:Microsoft показала технодемку Quake 2 с ИИShuttle расширяет серию XPC Nano с ускорением ИИ моделью на базе IntelСервер ИИ за 30 тысяч долларов: 7 GPU RTX 5090Lightmatter создала суперчип с фотонным ИИ-соединениемAyar Labs представляет первый в мире оптический чипсет UCIe для масштабируемых архитектур ИИ
Систе́ма (др.-греч. σύστημα «целое, составленное из частей; соединение») — множество элементов, находящихся в отношениях и связях друг с другом, которое образует определённую целостность, единство. Потребность в использовании термина «система» возникает в тех случаях, когда нужно подчеркнуть, что что-то является большим, сложным, не полностью сразу понятным, при этом целым, единым. В отличие от понятий «множество», «совокупность» понятие системы подчёркивает упорядоченность, целостность, наличие закономерностей построения, функционирования и развития (см. Википедия
SYS-421GE-NBRT-LCC (8x NVIDIA B200-SXM-180 ГБ) и SYS-A21GE-NBRT (8x NVIDIA B200-SXM-180 ГБ) продемонстрировали лидерство в производительности при выполнении тестов Mixtral 8x7B Inference, Mixture of Experts со скоростью 129 000 токенов/сек. Система Supermicro с воздушным и жидкостным охлаждением на базе NVIDIA B200 показала более 1000 токенов/сек для большой модели Llama3.1-405b, тогда как предыдущие поколения систем на базе GPU показали гораздо меньшие результаты. Для небольших задач вывода с использованием теста LLAMA2-70b система Supermicro с установленной NVIDIA B200 SXM-180 ГБ показала наивысшую производительность среди поставщиков систем уровня 1.
Specifically:
- Стабильная диффузия XL (сервер)
SYS-A21GE-NBRT (8x B200-SXM-180 ГБ)
#1 queries/s, 28.92
- llama2-70b-interactive-99 (Сервер)
SYS-A21GE-NBRT (8x B200-SXM-180 ГБ)
#1 Tokens/s, 62,265.70
- Llama3.1-405b (офлайн)
SYS-421GE-NBRT-LCC (8xB200-SXM-180 ГБ)
#1 Tokens/s 1521.74
- Llama3.1-405b (Сервер)
SYS-A21GE-NBRT (8x B200-SXNM-180 ГБ)
#1 Токенов/с, 1080,31 (для узла с 8 GPU)
- mixtral-8x7b (Сервер)
SYS-421GE-NBRT-LCC (8x B200-SXM-180 ГБ)
#1 Tokens/s, 129,047.00
- mixtral-8x7b (Оффлайн)
SYS-421GE-NBRT-LCC (8x B200-SXM-180 ГБ)
#1 Tokens/s, 128,795.00
«MLCommons поздравляет Supermicro с подачей заявки на бенчмарк MLPerf Inference v5.0. Мы рады видеть, что их результаты демонстрируют значительный прирост производительности по сравнению с предыдущими поколениями систем», — сказал Дэвид Кантер, руководитель MLPerf в MLCommons. «Клиенты будут довольны достигнутым повышением производительности, которое подтверждено нейтральными, репрезентативными и воспроизводимыми результатами MLPerf». Supermicro предлагает комплексное портфолио ИИ с более чем 100 оптимизированными для GPU системами, как с воздушным, так и с жидкостным охлаждением, с выбором ЦП, начиная от оптимизированных для одного сокета систем до 8-процессорных многопроцессорных систем. Системы Supermicro для стоечного размещения включают вычислительные, сетевые компоненты и компоненты хранения, что сокращает время, необходимое для их установки после доставки на объект клиента.
Системы NVIDIA HGX B200 8-GPU от Supermicro используют технологию жидкостного и воздушного охлаждения следующего поколения. Недавно разработанные охлаждающие пластины и новый блок распределения охлаждающей жидкости (CDU) мощностью 250 кВт более чем вдвое увеличивают охлаждающую способность предыдущего поколения в том же форм-факторе 4U. Доступная в конфигурациях 42U, 48U или 52U, стоечная конструкция с новыми вертикальными распределительными коллекторами охлаждающей жидкости (CDM) больше не занимает ценные стойки. Это позволяет использовать восемь систем, включающих 64 графических процессора NVIDIA Blackwell в стойке 42U, и до 12 систем с 96 графическими процессорами NVIDIA Blackwell в стойке 52U.
Новая система NVIDIA HGX B200 с воздушным охлаждением 10U отличается переработанным шасси с расширенным тепловым запасом для размещения восьми графических процессоров Blackwell TDP 1000 Вт. До 4 новых систем с воздушным охлаждением 10U могут быть установлены и полностью интегрированы в стойку, с той же плотностью, что и у предыдущего поколения, при этом обеспечивая до 15-кратного увеличения производительности вывода и 3-кратного увеличения производительности обучения.
Источник: Supermicro News
0 комментариев