DeepSeek представила математическую модель с самопроверкой
Китайская компания DeepSeek выпустила DeepSeekMath-V2 — революционную математическую модель, устанавливающую новые стандарты производительности и расширяющую границы решений задач с помощью искусственного интеллекта.
Новая модель, ставшая открытой на платформах Hugging Face и GitHub, представляет инновационную систему самопроверки, предназначенную для обеспечения не только правильных ответов, но и логически обоснованных и проверяемых доказательств.
Модель продемонстрировала результаты, соответствующие уровню золотых медалей на Международной математической олимпиаде 2025 года и Китайской математической олимпиаде 2024 года.
Примечательно, что модель также набрала 118 из 120 баллов на чрезвычайно сложном экзамене Putnam 2024 года, легко превзойдя лучший человеческий результат в 90 баллов.
Возможности модели были дополнительно подтверждены с помощью IMO-ProofBench, где она превзошла такие модели, как DeepThink от DeepMind.
Эта система противопоставляет две большие языковые модели друг другу — одна выступает в роли «доказывателя» для генерации математических доказательств, а другая служит «рецензентом» для проверки рассуждений.
Такой механизм решает критическое ограничение современных достижений ИИ — правильный конечный ответ не гарантирует правильного процесса рассуждений
— пояснили в команде DeepSeek.
В компании заявили, что эти прорывы устанавливают самопроверяющее математическое мышление как жизнеспособный и перспективный путь к разработке более мощных и надежных математических систем ИИ.
Математическое моделирование является одной из самых сложных задач для искусственного интеллекта, поскольку требует не просто вычислений, но и глубокого логического мышления. Успехи DeepSeekMath-V2 демонстрируют, что подход с самопроверкой может значительно повысить надежность ИИ-систем в научных и инженерных приложениях.






0 комментариев