Gemini 3 превзошел GPT-5 в китайских тестах и занял второе место в мире
В конце 2025 года мировую сферу искусственного интеллекта ожидает очередная волна перемен. Согласно последнему отчету оценочного агентства SuperCLUE, предварительная версия Gemini-3 Pro от Google набрала общий балл 70,80 в сентябрьском китайском сравнительном тесте больших моделей SuperCLUE.
Он превосходит GPT-5(high) на 1,43 балла и отстаёт от GPT-5.1(high) на 1,71 балла, занимая второе место в мире. Gemini-2.5-Pro в настоящее время занимает седьмое место в мире.
Эффективность рассуждений в Gemini-3-Pro-Preview несколько выше, чем в Gemini-2.5-Pro: среднее время на вопрос сократилось с 32,2 до 31,9 секунды. Стоимость рассуждений увеличилась с 24,5 до 32 юаней за миллион токенов.
Эта оценка охватывает шесть основных измерений: математическое мышление, научное мышление, генерация кода (включая веб-разработку), интеллектуальный агент (многооборотный вызов инструмента), контроль иллюзий и точное соблюдение инструкций.
По сравнению с GPT-5.1(high) преимущества Gemini-3-Pro-Preview заключаются в основном в контроле над иллюзиями, и он находится на одном уровне с GPT-5.1(high) в научном мышлении, но полностью уступает по остальным четырем аспектам.











0 комментариев