Nvidia улучшит систему охлаждения ИИ-чипов

Современные облачные центры обработки данных потребляют не только огромное количество электроэнергии для вычислений и охлаждения, но и значительное количество воды, поскольку большинство из них использует испарительное жидкостное охлаждение

Жидкостное охлаждение — система отвода излишнего тепла от рабочего тела посредством контакта с циркулирующей охлаждающей жидкостью. Главными преимуществами этой схемы по сравнению с воздушным охлаждением являются способность отводить большее количество тепла, меньший размер установки и более низкий уровень шума. Википедия

.
Напротив, машины Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:«Горячие точки» GPU NVIDIA GeForce RTX 50-й серииТехнология DLSS от Nvidia теперь используется более чем в 760 играх и приложенияхОбновлённая версия The Elder Scrolls 4: Oblivion вышла после анонса от BethesdaПроблемы с нехваткой видеопамяти у RTX 5060 Ti 8 ГБNVIDIA выпускает исправленный драйвер GeForce 576.15

GB200 NVL72 и GB300 NVL72 используют системы жидкостного охлаждения с прямым охлаждением чипа, которые, как утверждается, в 25 раз более энергоэффективны и в 300 раз более водоэффективны, чем современные кулеры. Однако есть одна загвоздка, поскольку стоечные системы NVL72 потребляют в семь раз больше энергии, чем обычные стойки.

Типичные серверные стойки центра обработки данных потребляют около 20 кВт мощности, тогда как стойки Nvidia на базе H100 потребляют более 40 кВт мощности. Однако стоечные системы Nvidia GB200 NVL72 и GB300 NVL72 потребляют 120 кВт – 140 кВт мощности, опережая подавляющее большинство уже установленных стоек.

В результате методы воздушного охлаждения больше недостаточны для управления тепловыми нагрузками, создаваемыми этими стойками высокой плотности. Поэтому Nvidia пришлось принять новое решение для охлаждения для своих машин Blackwell, что привело к разработке нового решения.

Системы Nvidia GB200 NVL72 и GB300 NVL72 используют жидкостное охлаждение с прямой подачей на чип. Этот подход подразумевает циркуляцию охлаждающей жидкости непосредственно через охлаждающие пластины, прикрепленные к графическим процессорам, центральным процессорам и другим тепловыделяющим компонентам, эффективно отводя тепло от этих устройств без использования воздуха в качестве посредника.

В отличие от испарительного или иммерсионного охлаждения, жидкостное охлаждение NVL72 представляет собой замкнутую систему, поэтому охлаждающая жидкость не испаряется и не требует замены из-за потерь от фазового перехода, что экономит воду.

В архитектуре NVL72 тепло, поглощаемое жидким хладагентом, затем передается в инфраструктуру охлаждения центра обработки данных через теплообменники жидкость-жидкость на уровне стойки. Эти блоки распределения хладагента (CDU), такие как CoolIT CHx2000, способны управлять мощностью охлаждения до 2 мВт, поддерживая высокоплотные развертывания с низким тепловым сопротивлением и надежным отводом тепла.

Кроме того, такая конфигурация позволяет системам работать с охлаждением теплой водой, тем самым сокращая или устраняя необходимость в механических охладителях, что повышает как энергоэффективность, так и экономию воды.

Следует отметить несколько моментов, касающихся решений Nvidia с замкнутым контуром жидкостного охлаждения с прямой подачей на чип. Хотя решения с замкнутым контуром жидкостного охлаждения широко используются энтузиастами ПК, существует несколько практических, инженерных и экономических причин, по которым эти системы в настоящее время не получили широкого распространения в масштабах.

Центры обработки данных требуют модульности и доступности для обслуживания, обновлений и замены компонентов, поэтому они используют компоненты с возможностью горячей замены. Однако герметичные системы затрудняют быструю замену вышедших из строя серверов или графических процессоров, поскольку нарушение герметичности поставит под угрозу весь кластер.

Кроме того, прокладка герметичных жидкостных контуров по стойкам и всему центру обработки данных вносит логистическую сложность в трубопроводы, резервирование насосов и изоляцию отказов. К счастью, современные решения для жидкостного охлаждения с прямым подключением к чипу используют быстроразъемные фитинги с герметичными уплотнениями, которые обеспечивают удобство обслуживания без полной герметичности (в конце концов, быстрое обнаружение и изоляция утечек дешевле, чем создание полностью герметичного решения в масштабе центра обработки данных). Однако использование жидкостного охлаждения в масштабе центра обработки данных по-прежнему требует перепроектирования всего центра обработки данных, что является дорогостоящим.

Тем не менее, поскольку процессоры Blackwell от Nvidia предлагают непревзойденную производительность, пользователи графических процессоров B200 готовы инвестировать в такие модернизации. Кроме того, стоит отметить, что Nvidia совместно с Schneider Electric разработала референсные проекты для кластеров 1152 GPU DGX SuperPOD GB200, используя жидкостные CDU Motivair и жидкостные охладители с адиабатической поддержкой. Это позволяет быстро развертывать такие системы с максимальной эффективностью.

Хотя Nvidia требует использования жидкостного охлаждения в своих графических процессорах и системах Blackwell B200, компания инвестировала в эталонные конструкции герметичных решений для жидкостного охлаждения, чтобы избежать использования испарительных решений для жидкостного охлаждения в целях экономии воды, что представляется разумным компромиссом.

Подпишитесь на Tom's Hardware в Google News , чтобы получать наши последние новости, аналитику и обзоры в своих лентах. Не забудьте нажать кнопку Follow.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

0 комментариев

Оставить комментарий


Новые комментарии

Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон
"Физика вышла из чата"??? Каким образом они добилис свечения точек, которые меньше четверти длины волны???
  • Анон
И теперь нельзя отключить авто обновление!!! Это жесть
  • Анон
Не знаю, я купил Cougar850 80Gold за 10К₽ и нормально
  • Анон
После всех роликов я одно понял у этой игры которую выпустят 20 мая у неё большое будущее
  • Анон
Когда они в продаже появятся? Уже как бы конец февраля, а нигде нет..
  • Анон

Смотреть все