Китайские разработчики ИИ изучают аренду GPU Nvidia Rubin в облаке
Разработчики аппаратного обеспечения для ИИ из Китая быстро прогрессируют в создании собственных ускорителей. Однако самые продвинутые китайские компании в сфере ИИ всё чаще признают, что местное оборудование вряд ли догонит американских лидеров в ближайшем будущем, что серьёзно ограничивает разработку конкурентоспособных моделей. Чтобы оставаться на уровне с американскими коллегами, китайские разработчики ИИ изучают способы аренды предстоящих GPU Rubin от Nvidia в облаке, сообщает The Wall Street Journal.
Когда Nvidia в январе представила свою платформу для центров обработки данных Rubin для ИИ, она публично назвала американских клиентов, опустив китайских. Компания придерживается этого подхода в последние кварталы, что отражает правила экспорта США, её обязательство соблюдать их и намерение не сигнализировать инвесторам об открытии китайского рынка. Китайские компании поняли этот сигнал и начали искать способы удалённого получения передовых процессоров от Nvidia, чтобы не отстать от американских конкурентов.
Как утверждается в отчёте, китайские ИИ-компании начали переговоры о доступе к системам NVL144 GR200 и другим системам на базе Rubin, размещённым в дата-центрах за пределами Китая, особенно в Юго-Восточной Азии и на Ближнем Востоке. До середины этой недели такие соглашения в целом считались законными. Однако у них есть изначальные ограничения: вычисления арендуются, а не принадлежат компании, мощности являются общими, а не выделенными, а сроки развёртывания зависят от сторонних операторов, а не от внутренних графиков в худших сценариях.
Неудивительно, что использование удалённого оборудования для обучения передовых ИИ-моделей сопряжено с трудностями, поскольку разница между арендой Rubin в удалённом облачном дата-центре и его локальным развёртыванием огромна. Американские гиперскалеры могут интегрировать ускорители Rubin в больших масштабах, тонко настраивать свои программные стеки под новое оборудование и резервировать огромные кластеры GPU для длительных тренировок. В то же время китайским разработчикам, планирующим арендовать мощности Rubin, придётся мириться с ограниченными квотами, задержками при передаче данных через границу, ограниченной свободой в настройке систем и, в некоторых случаях, очередями. Если они арендуют достаточно систем — а в США есть облачные дата-центры, в которых сейчас работают сотни тысяч GPU Blackwell — они вполне смогут обучать свои модели без особых проблем. Однако если они не смогут вовремя найти подходящие облака, у них будет меньше ИИ-ускорителей на проект, а в некоторых случаях они не смогут запускать крупные задачи обучения, что напрямую ограничит размер модели, темпы экспериментов и скорость итераций.
Между тем, сложности обучения и неэффективность хорошо известны китайским разработчикам, которые использовали парки различных GPU Nvidia, состоящие из A100, H100, H800 и H20, для обучения своих передовых моделей. Поскольку они не могут официально закупать Blackwell, они также арендовали их в облаке, и, по словам инсайдеров, этот опыт был дорогим и операционно неудобным. В результате они уже знают, как бороться с неэффективностью.
С моделями следующего поколения и GPU Rubin всё станет ещё сложнее. По мере роста масштабов моделей возрастает ценность бесперебойного доступа к большим однородным кластерам GPU, чего арендованные мощности редко обеспечивают. Даже если сделки будут заключены (что не гарантировано, учитывая новые ограничения на доступ к облаку), они, как правило, оставляют китайских разработчиков в структурно невыгодном положении по сравнению с хорошо финансируемыми американскими конкурентами, которые могут развернуть десятки тысяч ускорителей под одной крышей.
Есть ещё одно осложнение. По оценкам UBS, китайские гиперскалеры потратили около 57 миллиардов долларов (около 4,56 трлн рублей) на капитальные расходы в прошлом году, что примерно в 10 раз меньше, чем у американских коллег. Для контекста, это меньше, чем капитальные расходы Meta в прошлом году, превысившие 70 миллиардов долларов (около 5,6 трлн рублей). Учитывая финансовые ограничения, остаётся под вопросом, смогут ли китайские разработчики ИИ остаться более или менее конкурентоспособными по сравнению со своими американскими коллегами.
ИИ: Ситуация наглядно демонстрирует, как геополитические ограничения формируют технологический ландшафт. Китайские компании вынуждены искать обходные пути, которые, хотя и позволяют получить доступ к передовым технологиям, создают серьёзные операционные и финансовые издержки, замедляя инновации. В долгосрочной перспективе это может привести к дальнейшему отрыву американского ИИ-сектора, если Китаю не удастся совершить качественный скачок в разработке собственных чипов или не изменится регуляторная среда.
Источник: Tomshardware.com
* Meta, Facebook и Instagram запрещены в России.







0 комментариев