DeepSeek-V4 официально анонсирована: работа на чипах Huawei и отказ от NVIDIA
24 апреля состоялся официальный анонс новой модели DeepSeek-V4. Согласно сообщению в официальном аккаунте DeepSeek в WeChat, модель может похвастаться возможностью обработки контекста длиной в миллион слов, демонстрируя лучшие результаты как среди отечественных, так и среди решений с открытым исходным кодом с точки зрения возможностей агента, знаний об окружающем мире и возможностей вывода.
Сервис API был обновлен, и доступ к нему можно получить, изменив model_name на deepseek-v4-pro или deepseek-v4-flash.
Версия V4 продолжает философию DeepSeek, ориентированную на эффективность. Хотя общее количество параметров достигает одного триллиона, каждый токен активирует лишь около 37 миллиардов параметров. Это означает, что стоимость вывода остается на уровне предыдущей версии, V3. Такая высокая экономическая эффективность всегда была ключевым конкурентным преимуществом DeepSeek.
По имеющейся информации, DeepSeek V4 будет работать на новейшем чипе Huawei Ascend. Для достижения этого прорыва инженеры приложили значительные усилия к решению проблем совместимости чипов. Они не только переписали основной код, но и завершили миграцию из экосистемы NVIDIA CUDA на архитектуру CANN от Huawei.
Это важное технологическое решение и, что еще важнее, значимый стратегический сигнал. DeepSeek не предоставила Nvidia или AMD возможности для ранней оптимизации и адаптации; вместо этого она эксклюзивно предоставила ранний доступ отечественным производителям чипов.








0 комментариев