DeepSeek V4 вернула себе лидерство в Китае по результатам тестирования SuperCLUE
Команда SuperCLUE опубликовала результаты оценки китайской языковой модели DeepSeek V4. Согласно отчету, версия DeepSeek-V4-Pro заняла первое место в Китае по общей производительности, а версия Flash расположилась на второй строчке. Это очередной прорыв для отечественных моделей с открытым исходным кодом.
Оценка охватывала шесть аспектов: математическое мышление, научное мышление, генерацию кода, планирование задач агента, выполнение инструкций и управление иллюзиями. Версия Pro набрала 70,98 балла, а версия Flash — 68,82 балла, что значительно превзошло показатели других китайских моделей.
В серии DeepSeek V4 используется совершенно новый механизм внимания, поддерживаются контексты длиной в миллион токенов во всех версиях, а также снижается вычислительная мощность и потребление памяти. При использовании с чипами отечественного производства достигается более высокая общая эффективность.
По сравнению с предыдущим поколением V3.2, обе версии получили существенные улучшения. Возможности интеллектуального агента в версии Pro улучшены более чем на 20 пунктов, математическое мышление — почти на 10 пунктов, соответствие инструкциям — почти на 12 пунктов, а управление иллюзиями также значительно оптимизировано.
Сохраняя эффективность логических рассуждений, версия Flash также значительно улучшает возможности интеллектуального агента и математические рассуждения, предлагая выдающуюся экономическую эффективность.
Версия Pro (15 юаней/миллион токенов) ориентирована на высокую производительность и предлагает более стабильное управление иллюзиями, что делает её подходящей для сложных задач и профессиональных сценариев. Версия Flash быстрее и дешевле, с ценой API всего 1,25 юаня за миллион токенов, что делает её более экономически выгодной для повседневного использования.
В ходе оценки также было отмечено, что модель по-прежнему отстает от лучших зарубежных моделей в таких областях, как генерация кода и выполнение сложных инструкций. В целом, DeepSeek V4, благодаря сбалансированным возможностям и доступной цене, прочно зарекомендовала себя как ведущий бренд в Китае, став высококачественным выбором для повседневной офисной работы, разработки и создания контента, а также обработки длинных текстов.









0 комментариев