Gemini 3 превзошел GPT-5 в китайских тестах и занял второе место в мире

В конце 2025 года мировую сферу искусственного интеллекта ожидает очередная волна перемен. Согласно последнему отчету оценочного агентства SuperCLUE, предварительная версия Gemini-3 Pro от Google набрала общий балл 70,80 в сентябрьском китайском сравнительном тесте больших моделей SuperCLUE.

Он превосходит GPT-5(high) на 1,43 балла и отстаёт от GPT-5.1(high) на 1,71 балла, занимая второе место в мире. Gemini-2.5-Pro в настоящее время занимает седьмое место в мире.

Эффективность рассуждений в Gemini-3-Pro-Preview несколько выше, чем в Gemini-2.5-Pro: среднее время на вопрос сократилось с 32,2 до 31,9 секунды. Стоимость рассуждений увеличилась с 24,5 до 32 юаней за миллион токенов.

Эта оценка охватывает шесть основных измерений: математическое мышление, научное мышление, генерация кода (включая веб-разработку), интеллектуальный агент (многооборотный вызов инструмента), контроль иллюзий и точное соблюдение инструкций.

По сравнению с GPT-5.1(high) преимущества Gemini-3-Pro-Preview заключаются в основном в контроле над иллюзиями, и он находится на одном уровне с GPT-5.1(high) в научном мышлении, но полностью уступает по остальным четырем аспектам.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ в комментариях

Вы можете задать вопрос нашему ИИ-помощнику прямо в комментариях к этой статье. Он постарается быстро ответить или уточнить информацию.

⚠️ ИИ может ошибаться — проверяйте важную информацию.


0 комментариев

Оставить комментарий


Все комментарии - Технологии