В пятницу компания DeepSeek выпустила предварительную версию своей большой языковой модели V4, самой мощной на сегодняшний день. Модель, разработанная стартапом из Ханчжоу, насчитывает 1,6 триллиона параметров и имеет контекстное окно в 1 миллион токенов. Это первый крупный «передовой» релиз,
Читать дальше →
Администрация президента Дональда Трампа, по данным Financial Times, подготовила меморандум, в котором утверждается, что иностранные субъекты, в первую очередь китайские, занимаются «преднамеренными кампаниями промышленного масштаба по дистилляции передовых американских AI-систем». Белый дом
Читать дальше →
24 апреля состоялся официальный анонс новой модели DeepSeek-V4. Согласно сообщению в официальном аккаунте DeepSeek в WeChat, модель может похвастаться возможностью обработки контекста длиной в миллион слов, демонстрируя лучшие результаты как среди отечественных, так и среди решений с открытым
Читать дальше →
Основатель компании DeepSeek Лян Вэньфэн готовится к первому раунду финансирования с момента основания. Ранее компания, занимающаяся разработкой крупных языковых моделей, настаивала на отсутствии внешних инвестиций, но теперь планирует привлечь не менее 300 миллионов долларов при оценке в 10
Читать дальше →
До конца апреля осталось всего несколько дней, и сообщество с нетерпением ждёт анонса новой языковой модели DeepSeek V4. Вчера исследователи компании неожиданно обновили библиотеку операторов DeepGEMM, что было воспринято как предвестник скорого релиза V4.Однако команда, по-видимому, предвидела
Читать дальше →
Дата выхода новой языковой модели DeepSeek V4 стала горячей темой, и весьма вероятным считается релиз в конце апреля. Пользователи сети обнаружили значительные изменения в репозитории DeepSeek на GitHub, выявившие интересные улучшения.Исследователи DeepSeek обновили 110 файлов в официальном
Читать дальше →
Вслед за открытой моделью GLM-5.1 компания Minimax (Xiyu Technology) выполнила своё обещание и открыла исходный код своей большой языковой модели Minimax 2.7. Модель, представленная ещё 18 марта, отличается значительно улучшенными способностями к программированию.Согласно данным разработчика,
Читать дальше →
Китайский гигант в области искусственного интеллекта DeepSeek готовится к крупному обновлению. По данным инсайдеров, основатель компании Лян Вэньфэн в ходе внутренних обсуждений обозначил график выпуска нового флагманского продукта. Модель DeepSeek V4 должна быть официально
Читать дальше →
Ожидаемая многими языковая модель DeepSeek V4, релиз которой ожидается в этом месяце, продолжает проходить этапы тестирования. Сегодня в сети появились скриншоты нового интерфейса, который пока доступен лишь ограниченному кругу пользователей.Как показал пользователь Weibo, новый интерфейс
Читать дальше →
Ожидаемая многими модель DeepSeek V4, по последним данным, выйдет в апреле. Пока команда дорабатывает продукт, на официальном сайте компании появились новые вакансии, которые раскрывают ключевые направления развития их больших языковых моделей.Сегодня на сайте DeepSeek были опубликованы несколько
Читать дальше →
В сети появилась информация о новой крупной языковой модели, что вызвало оживлённые обсуждения. Ранее ходили слухи о скором выходе самой ожидаемой на внутреннем рынке модели DeepSeek V4, но этого не произошло.Новая модель снова была замечена на платформе OpenRuter. Было представлено два алгоритма.
Читать дальше →
На прошлой неделе ходили слухи о выпуске крупной языковой модели DeepSeek V4, но этого не произошло. Вместо этого компания DeepSeek опубликовала на своём официальном сайте облегчённую версию, которую пользователи сети окрестили DeepSeek V4 Lite.Согласно данным, DeepSeek V4 Lite имеет 200 миллиардов
Читать дальше →
Хотя в период китайского Нового года полноценная модель DeepSeek V4 не была представлена, компания DeepSeek 11 февраля выпустила новую версию под названием DeepSeek V4 Lite. Её особенностью является относительно небольшой размер — всего 200 миллиардов параметров.Основной особенностью DeepSeek V4
Читать дальше →
В этом году в период китайского Нового года вышло несколько крупных отечественных AI-моделей, но DeepSeek V4 так и не появился, как ожидалось. Хорошая новость в том, что он, скорее всего, будет официально представлен уже на следующей неделе.Это сообщение изначально появилось в британской Financial
Читать дальше →
Китайская компания DeepSeek, чьи AI-модели в прошлом году произвели фурор, отказала американским гигантам Nvidia и AMD в раннем доступе к своему новому поколению модели V4. Об этом сообщает Reuters со ссылкой на свои источники.Вместо этого привилегированный доступ был предоставлен местным
Читать дальше →
Согласно последним сообщениям иностранных СМИ, компания DeepSeek предоставила свою новейшую большую языковую модель для приоритетного тестирования местным производителям (как программного, так и аппаратного обеспечения), включая Huawei.В отчёте говорится, что DeepSeek предоставила модель DeepSeek V4
Читать дальше →
Ожидалось, что в середине февраля 2026 года состоится релиз мощной модели искусственного интеллекта DeepSeek V4, ориентированной в первую очередь на программирование. Однако первоначальное окно для премьеры прошло, а разработчики хранят молчание, и технологический рынок продолжает ждать официального
Читать дальше →
В последние дни американские законодатели публично заявили, что модель искусственного интеллекта DeepSeek обучалась с использованием самых передовых AI-чипов Nvidia, что, по их мнению, нарушает экспортный контроль США.Это заявление быстро привлекло внимание. Официальный представитель Министерства
Читать дальше →
Компания Anthropic обвинила ведущих китайских разработчиков моделей искусственного интеллекта — DeepSeek, Moonshot и MiniMax — в использовании крупномасштабной дистилляции для улучшения их собственных моделей за счёт возможностей её ИИ Claude. По данным Anthropic, для этого было использовано 24 000
Читать дальше →
Китайская компания DeepSeek официально подтвердила тестирование новой архитектуры языковой модели с увеличенной длиной контекста. Как сообщается, веб-версия и мобильное приложение сервиса получили обновление, которое позволяет модели обрабатывать до 1 миллиона символов контекста.Это представляет
Читать дальше →