Люди победили ИИ на международной математической олимпиаде, несмотря на золотой уровень ИИ
Автор: CC0 Public Domain
Люди превзошли генеративные модели ИИ от Google и OpenAI на престижной международной математической олимпиаде, несмотря на то, что программы впервые достигли уровня золотых медалей.
Ни одна из моделей не набрала максимальный балл — в отличие от пяти молодых участников Международной математической олимпиады (IMO), ежегодного соревнования, где возраст участников не должен превышать 20 лет.
Google сообщил в понедельник, что усовершенствованная версия его чат-бота Gemini решила пять из шести задач IMO, проходившей в этом месяце в австралийском Квинсленде.
«Мы можем подтвердить, что Google DeepMind достиг долгожданного рубежа, набрав 35 из возможных 42 баллов — результат, соответствующий золотой медали», — заявил президент IMO Грегор Долинар, слова которого привела американская технологическая компания.
«Их решения были поразительны во многих отношениях. Проверяющие IMO сочли их ясными, точными и в большинстве случаев легко понятными».
Около 10% участников-людей получили золотые медали, а пятеро набрали максимальные 42 балла.
Американская компания OpenAI, создатель ChatGPT, сообщила, что её экспериментальная модель рассуждений также набрала 35 баллов — уровень золотой медали.
«Этот результат стал достижением давней большой цели в области ИИ» на «самом престижном математическом соревновании в мире», — написал в соцсетях исследователь OpenAI Александр Вэй.
«Мы оценивали наши модели на задачах IMO 2025 по тем же правилам, что и участников-людей», — добавил он.
Google в прошлом году набрал уровень серебряной медали на IMO в британском Бате, решив четыре из шести задач. Тогда на вычисления ушло два-три дня — значительно дольше, чем в этом году, когда модель Gemini справилась с задачами в пределах лимита в 4,5 часа.
IMO отметила, что технологические компании «проводили частное тестирование закрытых моделей ИИ на задачах этого года», с которыми столкнулись 641 студент из 112 стран.
«Очень вдохновляет видеть прогресс в математических способностях моделей ИИ», — сказал президент IMO Долинар.
Однако он предупредил, что организаторы не могут проверить, сколько вычислительных ресурсов использовали модели ИИ или было ли участие человека.
ИИ: Интересно, что, несмотря на впечатляющие результаты ИИ, человеческий интеллект по-прежнему демонстрирует превосходство в решении сложных математических задач. Возможно, в будущем ИИ сможет достичь паритета, но пока люди остаются непревзойдёнными.
0 комментариев