Система жидкостного охлаждения для серверной стойки NVIDIA GB300 NVL72 стоит почти 50000 долларов
Серверные стойки NVIDIA «Blackwell Ultra», без сомнения, обладают огромной производительностью, но требуют и значительных систем охлаждения. NVIDIA позиционирует конфигурацию GB300 NVL72 как топовую: эти стойки с жидкостным охлаждением, построенные на базе суперчипов Grace Blackwell Ultra, обеспечивают экзафлопсную производительность при работе с плотными вычислениями FP4 и предлагают существенное улучшение пропускной способности на мегаватт по сравнению с предыдущими платформами HGX. Однако такая экстремальная производительность требует массивных систем охлаждения, стоимость которых может достигать около 50000 долларов (~4 млн рублей). Согласно оценочной модели инвестиционного банка Morgan Stanley, NVIDIA тратит почти 50000 долларов на охлаждение для 72-чиповой конфигурации в своей стойке Oberon. При номинальной тепловой мощности каждого чипа в 1400 Вт традиционные решения на основе воздушного охлаждения нецелесообразны.
Учитывая, что в стойке 72 GPU с тепловыделением до 1400 Вт, только от графических процессоров выделяется более 100 кВт тепла. Если добавить к этому 32 процессора «Grace», питающих систему, то на пиковой нагрузке совокупное тепловыделение превышает 100 кВт. Модель Morgan Stanley описывает стойку как содержащую 18 вычислительных модулей (каждый потребляет примерно 6,6 кВт, но требует охлаждения для около 6,2 кВт) вместе с девятью коммутационными модулями. Банк оценивает компоненты охлаждения для одного вычислительного модуля примерно в 2260 долларов, что в масштабах всей стойки дает около 40680 долларов. Охлаждение коммутационных модулей добавляет около 1020 долларов за модуль, или 9180 долларов в общей сложности. Высокопроизводительные холодные пластины выделяются как самые дорогие компоненты в спецификации, с ценой за единицу в несколько сотен долларов.
Любопытно, что в отчете также прогнозируется, что предстоящая конфигурация «Vera Rubin» NVL144 потребует еще большего количества термооборудования, поскольку GPU и межсоединения будут потреблять больше энергии. Morgan Stanley оценивает, что стоимость охлаждения может вырасти примерно на 17% — до около 55710 долларов. Это отражает известную закономерность: с ростом плотности вычислений и тепловыделения растут и затраты, и инженерная сложность поддержания систем в рамках тепловых ограничений. Поскольку коммутаторы потребляют больше электроэнергии, ожидается, что затраты на охлаждение этой передовой системы будут увеличиваться, что добавляет сложностей в управлении теплоотводом во все более мощной ИИ-инфраструктуре.









0 комментариев