DeepSeek готовит модель V4 на чипах Huawei, что беспокоит Nvidia
Основатель компании DeepSeek Лян Вэньфэн готовится к первому раунду финансирования с момента основания. Ранее компания, занимающаяся разработкой крупных языковых моделей, настаивала на отсутствии внешних инвестиций, но теперь планирует привлечь не менее 300 миллионов долларов при оценке в 10 миллиардов долларов, чтобы накопить ресурсы для конкурентной борьбы в сфере ИИ.
Помимо привлечения инвестиций, DeepSeek также планирует выпустить долгожданную версию модели V4 в конце месяца. Хотя её выпуск неоднократно откладывался, архитектура MoE с триллионом параметров по-прежнему вызывает большой интерес в отрасли.
Версия V4 продолжает философию DeepSeek, ориентированную на эффективность. Хотя общее количество параметров достигает триллиона, каждый токен активирует лишь около 37 миллиардов параметров, что позволяет сохранить стоимость вывода на уровне предыдущей версии V3.
Основная причина задержки выпуска V4 заключается не в технических проблемах модели, а в сложной миграции базового оборудования. Ранее все модели DeepSeek обучались на чипах NVIDIA, но версия V4 выбрала другой путь — будет работать на новейшем чипе Huawei Ascend.
Для этого инженерам пришлось приложить значительные усилия, переписать основной код и завершить миграцию из экосистемы NVIDIA CUDA на архитектуру CANN от Huawei. Это решение рассматривается как важный стратегический шаг, так как компания предоставила ранний доступ для оптимизации именно отечественным производителям чипов.
Если V4 сможет достичь конкурентоспособных показателей на оборудовании Huawei, она может стать первой в мире передовой моделью ИИ, не зависящей от аппаратной экосистемы NVIDIA. Генеральный директор Nvidia Дженсен Хуанг в недавнем интервью выразил обеспокоенность, заявив, что новые модели, основанные на альтернативных аппаратных платформах, могут подорвать позиции созданной Nvidia за годы экосистемы.
Интересный факт: переход крупных ИИ-компаний с платформы NVIDIA на альтернативные решения, такие как Huawei Ascend или собственные чипы (как у Google или Amazon), становится заметным трендом, что может в долгосрочной перспективе изменить расстановку сил на рынке высокопроизводительных вычислений.







0 комментариев