Американские ИИ-модели превзошли китайский DeepSeek в тестах NIST
Национальный институт стандартов и технологий США (NIST) провел комплексное тестирование американских и китайских моделей искусственного интеллекта. Результаты показали, что модели от OpenAI и Anthropic превзошли DeepSeek по всем 19 различным тестовым показателям.
Министр торговли США Говард Латник поделился результатами в социальной сети X, поблагодарив президента Дональда Трампа за План действий по ИИ, направленный на ускорение американских инноваций и развитие инфраструктуры искусственного интеллекта.
«Отчет ясно показывает: DeepSeek значительно отстает, особенно в области кибербезопасности и программной инженерии. Эти слабости не просто технические. Они демонстрируют, почему зависимость на иностранный ИИ опасен и близорук», — заявил министр Латник. «Разрешение нашим противникам контролировать ИИ создает серьезные риски для нашей безопасности. Устанавливая стандарты, стимулируя инновации и обеспечивая безопасность Америки, Министерство торговли помогает гарантировать продолжающееся лидерство США в области ИИ».
NIST — федеральное агентство при Министерстве торговли, которое разрабатывает стандарты и поддерживает промышленность для сохранения глобальной конкурентоспособности США. Исследование проводилось в рамках недавно созданного Центра стандартов и инноваций в области ИИ (CAISI).
Тестирование включало модели DeepSeek R1, R1-0528 и V3.1 (что важно — не новую версию V3.2, выпущенную на этой неделе) в сравнении с GPT-5, GPT-5-mini и GPT-oss от OpenAI, а также Opus 4 от Anthropic. Тесты охватывали 19 различных областей, включая программную инженерию, общие знания, математическое мышление и устойчивость к взломам.
Все результаты изложены в 69-страничном документе [PDF-документе], где CAISI утверждает, что OpenAI и Anthropic превосходят DeepSeek во всех тестах, особенно в задачах программной инженерии и кибербезопасности. Американские модели ИИ в среднем превосходят DeepSeek на 20-80% и требуют примерно на 35% меньше затрат на эксплуатацию. Китайские модели также легче взломать, что делает их более уязвимыми для непреднамеренных действий.
Несмотря на эти результаты, модель DeepSeek R1 продолжает находить применение, хотя CAISI предупреждает, что «использование этих моделей может представлять риск для разработчиков приложений, потребителей и национальной безопасности США». Китайская компания продолжает выпускать новые модели, включая DeepSeek-V3.2-Exp, выпущенную на этой неделе, что может сделать часть проведенных тестов неактуальными.
ИИ: Интересно наблюдать, как технологическая конкуренция между США и Китаем в области ИИ выходит на новый уровень. Хотя американские модели демонстрируют превосходство в текущих тестах, постоянное обновление китайских моделей и политический контекст этих сравнений заставляют задуматься о объективности таких исследований. В 2025 году гонка ИИ-технологий определенно становится одним из ключевых фронтов глобальной конкуренции.
0 комментариев