Nvidia улучшит систему охлаждения ИИ-чипов

Современные облачные центры обработки данных потребляют не только огромное количество электроэнергии для вычислений и охлаждения, но и значительное количество воды, поскольку большинство из них использует испарительное жидкостное охлаждение

Жидкостное охлаждение — система отвода излишнего тепла от рабочего тела посредством контакта с циркулирующей охлаждающей жидкостью. Главными преимуществами этой схемы по сравнению с воздушным охлаждением являются способность отводить большее количество тепла, меньший размер установки и более низкий уровень шума. Википедия

.
Напротив, машины Nvidia

NVIDIA Corporation (NASDAQ: NVDA) — американская компания, один из крупнейших разработчиков графических ускорителей и процессоров, а также наборов системной логики. На рынке продукция компании известна под такими торговыми марками как GeForce, nForce, Quadro, Tesla, ION и Tegra. Компания была основана в 1993 году. По состоянию на август 2006 года в корпорации насчитывалось более 8 тысяч сотрудников, работающих в 40 офисах по всему миру. Википедия

Читайте также:«Горячие точки» GPU NVIDIA GeForce RTX 50-й серииТехнология DLSS от Nvidia теперь используется более чем в 760 играх и приложенияхОбновлённая версия The Elder Scrolls 4: Oblivion вышла после анонса от BethesdaПроблемы с нехваткой видеопамяти у RTX 5060 Ti 8 ГБNVIDIA выпускает исправленный драйвер GeForce 576.15

GB200 NVL72 и GB300 NVL72 используют системы жидкостного охлаждения с прямым охлаждением чипа, которые, как утверждается, в 25 раз более энергоэффективны и в 300 раз более водоэффективны, чем современные кулеры. Однако есть одна загвоздка, поскольку стоечные системы NVL72 потребляют в семь раз больше энергии, чем обычные стойки.

Типичные серверные стойки центра обработки данных потребляют около 20 кВт мощности, тогда как стойки Nvidia на базе H100 потребляют более 40 кВт мощности. Однако стоечные системы Nvidia GB200 NVL72 и GB300 NVL72 потребляют 120 кВт – 140 кВт мощности, опережая подавляющее большинство уже установленных стоек.

В результате методы воздушного охлаждения больше недостаточны для управления тепловыми нагрузками, создаваемыми этими стойками высокой плотности. Поэтому Nvidia пришлось принять новое решение для охлаждения для своих машин Blackwell, что привело к разработке нового решения.

Системы Nvidia GB200 NVL72 и GB300 NVL72 используют жидкостное охлаждение с прямой подачей на чип. Этот подход подразумевает циркуляцию охлаждающей жидкости непосредственно через охлаждающие пластины, прикрепленные к графическим процессорам, центральным процессорам и другим тепловыделяющим компонентам, эффективно отводя тепло от этих устройств без использования воздуха в качестве посредника.

В отличие от испарительного или иммерсионного охлаждения, жидкостное охлаждение NVL72 представляет собой замкнутую систему, поэтому охлаждающая жидкость не испаряется и не требует замены из-за потерь от фазового перехода, что экономит воду.

В архитектуре NVL72 тепло, поглощаемое жидким хладагентом, затем передается в инфраструктуру охлаждения центра обработки данных через теплообменники жидкость-жидкость на уровне стойки. Эти блоки распределения хладагента (CDU), такие как CoolIT CHx2000, способны управлять мощностью охлаждения до 2 мВт, поддерживая высокоплотные развертывания с низким тепловым сопротивлением и надежным отводом тепла.

Кроме того, такая конфигурация позволяет системам работать с охлаждением теплой водой, тем самым сокращая или устраняя необходимость в механических охладителях, что повышает как энергоэффективность, так и экономию воды.

Следует отметить несколько моментов, касающихся решений Nvidia с замкнутым контуром жидкостного охлаждения с прямой подачей на чип. Хотя решения с замкнутым контуром жидкостного охлаждения широко используются энтузиастами ПК, существует несколько практических, инженерных и экономических причин, по которым эти системы в настоящее время не получили широкого распространения в масштабах.

Центры обработки данных требуют модульности и доступности для обслуживания, обновлений и замены компонентов, поэтому они используют компоненты с возможностью горячей замены. Однако герметичные системы затрудняют быструю замену вышедших из строя серверов или графических процессоров, поскольку нарушение герметичности поставит под угрозу весь кластер.

Кроме того, прокладка герметичных жидкостных контуров по стойкам и всему центру обработки данных вносит логистическую сложность в трубопроводы, резервирование насосов и изоляцию отказов. К счастью, современные решения для жидкостного охлаждения с прямым подключением к чипу используют быстроразъемные фитинги с герметичными уплотнениями, которые обеспечивают удобство обслуживания без полной герметичности (в конце концов, быстрое обнаружение и изоляция утечек дешевле, чем создание полностью герметичного решения в масштабе центра обработки данных). Однако использование жидкостного охлаждения в масштабе центра обработки данных по-прежнему требует перепроектирования всего центра обработки данных, что является дорогостоящим.

Тем не менее, поскольку процессоры Blackwell от Nvidia предлагают непревзойденную производительность, пользователи графических процессоров B200 готовы инвестировать в такие модернизации. Кроме того, стоит отметить, что Nvidia совместно с Schneider Electric разработала референсные проекты для кластеров 1152 GPU DGX SuperPOD GB200, используя жидкостные CDU Motivair и жидкостные охладители с адиабатической поддержкой. Это позволяет быстро развертывать такие системы с максимальной эффективностью.

Хотя Nvidia требует использования жидкостного охлаждения в своих графических процессорах и системах Blackwell B200, компания инвестировала в эталонные конструкции герметичных решений для жидкостного охлаждения, чтобы избежать использования испарительных решений для жидкостного охлаждения в целях экономии воды, что представляется разумным компромиссом.

Подпишитесь на Tom's Hardware в Google News , чтобы получать наши последние новости, аналитику и обзоры в своих лентах. Не забудьте нажать кнопку Follow.

Источник: Tomshardware.com

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Робот «Фёдор» (FEDOR — Final Experimental Demonstration Object Research) — это российский антропоморфный робот, разработанный ФПИ и НПО «Андроидная техника». В 2019 году он даже летал на МКС, но...
  • Rutab
Ошибка 5188 в MemTest86+ указывает на проблему с оперативной памятью (DDR4). Попробуйте следующие шаги: 1. Проверьте каждую планку RAM по отдельности — возможно, одна из них неисправна. 2....
  • Rutab
а разве рыцари Круглого стола и викинги не были чернокожими???
  • Анон
игра с формированием ложного самомнения через подхалимаж. ---По образу и подобию .....
  • Анон
Если игра упирается в производительность видеокарты, то хоть заускоряй процессор, а FPS больше не будет. Я у себя на синтетических тестах получил лишь меньшую задержку памяти. В играх практически...
  • Анон
Всё в порядке с физикой: источник может быть меньше четверти длины волны. Даже одиночный ион в ионной ловушке может излучать видимый свет (а размер меньше 0.2нм).
  • Анон
Можно делать смартфоны и планшеты на этом процессоре и наконец то использовать полноценную windows. Это отличная замена процессорам arm
  • Анон
Странно почему не 50 долларов.
  • Анон
Понимаю мощь производительность и все дела, но как черт возьми тепло отделять от камня если его прям нагрузить
  • Анон
Не предвзятость это - "Интересно, что Arc B580 проигрывает RTX 4060 в OpenCL" - где разница на невероятных 3,5 %, "но реабилитируется с НЕЗНАЧИТЕЛЬНЫМ 6%-ным преимуществом в Vulkan.". Не...
  • Анон

Смотреть все