Массовые поставки серверов Nvidia GB300 начнутся в сентябре
Хотя Dell и некоторые другие партнёры Nvidia уже начали раннее производство серверов на базе GB300, массовые поставки таких систем ожидаются лишь в сентябре 2025 года, сообщает DigiTimes. Внедрение новой платформы пройдёт более гладко по сравнению с предыдущими поколениями благодаря стратегическому повторному использованию дизайна и улучшенной координации в цепочке поставок. Однако системы жидкостного охлаждения по-прежнему остаются проблемой для производителей.
Переход на Blackwell Ultra
Одним из ключевых факторов, ускоряющих переход, стало решение Nvidia сохранить дизайн материнской платы, используемый в текущей платформе GB200, пишет DigiTimes. Более того, компания предоставляет партнёрам больше свободы, чем раньше. Для GB300 Nvidia переходит к модульному подходу, согласно SemiAnalysis. Вместо полностью собранной материнской платы Nvidia поставляет GPU B300 в виде модуля SXM Puck, процессор Grace в отдельном корпусе BGA и аппаратный контроллер управления (HMC) от Axiado. Остальные компоненты клиенты закупают самостоятельно, а для памяти CPU используются стандартные модули SOCAMM, доступные у различных поставщиков. Nvidia продолжает поставлять коммутационные панели и медленные backplane-платы, как и раньше. Повторное использование дизайна устраняет необходимость полного перепроектирования, упрощая производство и снижая риски.
В случае с GB200 Nvidia поставляет готовую материнскую плату Bianca, которая включает GPU B200, процессор Grace, 512 ГБ памяти LPDDR5X и компоненты питания — всё на одной печатной плате. Компания также предоставляет коммутационные панели и backplane для этой системы.
По данным DigiTimes, на этапе валидации и раннего производства GB300 производители не столкнулись с серьёзными трудностями. Партнёры сообщают, что квалификация компонентов идёт по плану, а Nvidia постепенно наращивает выпуск в третьем квартале. К четвёртому кварталу 2025 года объёмы поставок должны значительно вырасти.
Wistron, ключевой поставщик вычислительных плат, отмечает, что выручка в этом квартале останется на прежнем уровне из-за перехода между поколениями GB200 и GB300. Однако переход проходит гораздо глаже, чем в случае с текущей платформой, которая столкнулась с задержками из-за проблем с чипами, плотной компоновкой серверов и требованиями к охлаждению. Производители серверов, похоже, научились справляться с этими вызовами.
Проблемы с охлаждением
Несмотря на массовые поставки GB200 в дата-центры, система жидкостного охлаждения продолжает доставлять проблемы, сообщает DigiTimes. Основные неисправности связаны с быстроразъёмными соединениями, которые иногда протекают, несмотря на заводские испытания. Операторы дата-центров вынуждены применять меры вроде локальных отключений и дополнительных тестов на герметичность, фактически жертвуя надёжностью ради скорости развёртывания и производительности.
После GB300
Помимо GB300, Nvidia готовит следующее поколение серверов для ИИ под кодовым названием Vera Rubin. Платформа выйдет в два этапа. Первый этап заменит процессоры Grace на Vera, а GPU Blackwell — на Rubin, сохранив текущую стойку Oberon под названием NVL144 (несмотря на использование 72 двойных GPU-чиплетов). Второй этап представит полностью новую стойку Kyber с процессорами Vera и GPU Rubin Ultra с четырьмя вычислительными чиплетами.
Поскольку Rubin ожидается более энергозатратным, чем Blackwell, новая платформа усилит зависимость от жидкостного охлаждения. Однако, как показывает отчёт DigiTimes, этот метод остаётся сложным в реализации. В системах GB200 различия в конфигурациях трубопроводов и давлении воды между разными дата-центрами затрудняют полное устранение протечек, что ведёт к высоким затратам на обслуживание после развёртывания.
Источник: Tomshardware.com
0 комментариев