DeepSeek запускает модель V4 с 1,6 триллиона параметров на чипах Huawei на фоне обострения обвинений США в краже ИИ
В пятницу компания DeepSeek выпустила предварительную версию своей большой языковой модели V4, самой мощной на сегодняшний день. Модель, разработанная стартапом из Ханчжоу, насчитывает 1,6 триллиона параметров и имеет контекстное окно в 1 миллион токенов. Это первый крупный «передовой» релиз, оптимизированный для работы на ИИ-процессорах Huawei Ascend, а не на оборудовании Nvidia. Релиз состоялся в тот же день, когда Reuters сообщило, что Госдепартамент США направил дипломатическую телеграмму посольствам по всему миру с предписанием предупреждать иностранные правительства о предполагаемых кражах интеллектуальной собственности со стороны DeepSeek и других китайских ИИ-компаний.
V4 представлена в двух вариантах: V4-Pro, флагманская версия, стоимостью $3,48 (около 278 рублей) за миллион выходных токенов, и V4-Flash, уменьшенная версия с 284 миллиардами параметров, стоимостью $0,28 (около 22 рублей). Для сравнения, OpenAI взимает $30 (около 2400 рублей) за миллион выходных токенов за GPT-5.4, а Anthropic — $25 (около 2000 рублей) за Claude Opus 4.6. DeepSeek, однако, признает, что V4 «незначительно уступает» этим закрытым моделям, отставая от них примерно на три-шесть месяцев разработки, но превосходит всех других открытых конкурентов в тестах на агентное программирование и рассуждение.
Ранее DeepSeek обучала свою модель V3 на 2048 графических процессорах Nvidia H800, и компания уже сталкивалась с многочисленными расследованиями по поводу того, не приобретала ли она ограниченное оборудование Nvidia через посредников в Сингапуре.
V4 полностью обходит эту цепочку поставок, обучаясь на отечественных чипах Ascend. Huawei подтвердила совместимость с первого дня во всей линейке продуктов Ascend SuperNode, включая новейшие процессоры серии 950. DeepSeek заявила, что стоимость V4-Pro может еще снизиться после того, как Huawei нарастит производство Ascend 950 во втором полугодии этого года.
Согласно Reuters, дипломатическая телеграмма предписывала сотрудникам посольств обсуждать с зарубежными коллегами «опасения по поводу извлечения и дистилляции» американских моделей, называя DeepSeek наряду с Moonshot AI и MiniMax. Двумя днями ранее Управление научно-технической политики Белого дома опубликовало меморандум, в котором обвинило китайские организации в проведении «целенаправленных, промышленного масштаба кампаний» по дистилляции передовых американских ИИ-систем.
Эти обвинения основаны на претензиях, которые Anthropic выдвинула в феврале, когда компания заявила, что DeepSeek, Moonshot и MiniMax использовали 24 000 мошеннических аккаунтов для совершения 16 миллионов обменов с ее моделью Claude. OpenAI также обвинила DeepSeek в дистилляции своих моделей.
МИД Китая назвал эти обвинения «необоснованными», сообщает Reuters. Ранее DeepSeek заявляла, что ее модель V3 полагалась на естественно возникающие данные, собранные путем сканирования веб-страниц, и не использовала намеренно синтетические данные, созданные OpenAI. И дипломатическая телеграмма, и запуск V4 произошли всего за несколько недель до запланированного визита президента Трампа к председателю КНР Си Цзиньпину в Пекине на саммит, который, как ожидается, будет посвящен вопросам экспортного контроля над полупроводниками и спорам об интеллектуальной собственности.
Источник: Tomshardware.com







0 комментариев