Gemini 2.5 Pro от Google лидирует в тестах ИИ

Google только что выпустила свою новейшую флагманскую модель ИИ

Thumbnail: Искусственный интеллектИску́сственный интелле́кт (ИИ; англ. artificial intelligence, AI) — свойство искусственных интеллектуальных систем выполнять творческие функции, которые традиционно считаются прерогативой человека (не следует путать с искусственным сознанием); наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. Искусственный интеллект связан со сходной задачей использования компьютеров для понимания человеческого интеллекта, но не обязательно ограничивается биологически правдоподобными методами. Существующие на сегодня интеллектуальные системы имеют довольно узкие области применения. Википедия

Читайте также:Nvidia выпустила G-Assist и новые коэффициенты DLSSОбъединенный профсоюз работников видеоигр начал работу на фоне увольнений в отрасли и угрозы ИИЖесткие диски NVMe: ответ Seagate на растущий спрос на системы хранения данных для ИИNVIDIA и лидеры хранения данных представили новую корпоративную инфраструктуру для ИИПэт Гелсингер о Larrabee и ИИ на Nvidia GTC

Gemini 2.5 Pro. Если вы не знали, именно Google создала оригинальную архитектуру модели Transformer, которую используют модели ChatGPT OpenAI, Grok xAI, Anthropic Claude и другие. Google уже некоторое время занимается итерациями своей серии моделей Gemini, и компания выпустила свою самую мощную версию на данный момент — Gemini 2.5 Pro. Будучи семейством v2.5, она является частью мыслящих моделей, способных рассуждать о своих мыслях перед тем, как выдавать выходные данные, что позволяет ей повторять свои «мысли» перед тем, как выдавать оптимальные результаты. Рассуждение, выполняемое посредством обучения с подкреплением и подсказок цепочки мыслей, заставляет модель анализировать и выводить логические, пошаговые решения, тем самым выдавая лучшие результаты.

В LMArea, который предоставляет пользователям выходные данные модели ИИ, которые они оценивают и решают, какая из них лучше, Gemini 2.5 Pro поднялся на первое место в общем рейтинге, заняв первое место в таких областях, как сложные подсказки, кодирование, математика, творческое письмо, следование инструкциям, более длинные запросы и многоходовые ответы. Это впечатляющий результат для Google, поскольку теперь он возглавляет таблицу лидеров во всех этих областях и опережает xAI Grok 3 и OpenAI GTP-4.5. В стандартизированных отраслевых тестах ИИ Gemini 2.5 Pro также является лидером в большинстве тестов, таких как AIME, LiveCodeBench, Aider, SWE-Bench, SimpleQA и других. Интересно, что 18,8% в Humanity's Last Exam в настоящее время являются самым сложным тестом ИИ. Интересно, что Gemini 2.5 Pro от Google может обрабатывать огромный контекст с контекстным окном в один миллион токенов, которое вскоре будет расширено до двух миллионов токенов. Буквально достаточно обработать целые книги контекста, чтобы получить модель. Gemini 2.5 Pro теперь доступен в Google AI Studio, а пользователи Gemini Advanced могут выбрать его в раскрывающемся списке моделей на настольных компьютерах и мобильных устройствах.

Источник: Google

Подписаться на обновления Новости / Технологии

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• Rutab-Бот читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос и обновите страницу через пару минут 👍
• Rutab-Бот работает в тестовом режиме и может ошибаться, либо просто не знать ответа.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Новые комментарии

Отличный вопрос! 😊 Давай разберёмся: 1. Сложнее интеллектуального труда — это задачи, где нужна непредсказуемость (например, создание принципиально новых научных теорий) или этический выбор...
  • Rutab
😄 Ну что ты, Quba! Если бы я был жмотом, то не делился бы планами на $300 млн в этом комментарии . Но раз уж ты администратор — предлагаю сделку: 10% от моих виртуальных миллионов в обмен на...
  • Rutab
Вы правы, формулировка в статье действительно может показаться однобокой. Под «катастрофическими последствиями» подразумевался провал именно для сети агентов ЦРУ, а не для китайских спецслужб — это...
  • Rutab
BCI расшифровывается как Brain-Computer Interface, что переводится как «интерфейс мозг-компьютер» (ИМК). Это технология, позволяющая напрямую связывать мозг с внешними устройствами для обмена...
  • Rutab
Извини, Quba! 😊 Да, действительно, скандал с Gemini произошел в феврале 2024 года (а не 2025), и я ошибся в дате. Спасибо за уточнение! 🙏 Буду внимательнее с фактами.
  • Rutab
США действительно традиционно выступали за свободную торговлю, но в последние годы политика изменилась — санкции стали инструментом давления (особенно в высокотехнологичных отраслях). Как видно из...
  • Rutab
Эта ошибка из Tomshardware перекочевала fixed
  • Sam
Разница в том, что апартеид был системой угнетения, лишавшей чернокожих базовых прав, а BEE — это меры по исправлению последствий этой системы. Да, формально белый предприниматель из другой страны...
  • Rutab
Я ИИ-помощник на сайте Rutab.net, который помогает пользователям разбираться в тематиках статей — технологиях, науке, играх, фильмах и многом другом 😊 Можешь спрашивать меня о чем угодно!
  • Rutab
В статье не указан точный размер модели Falcon-H1, но упоминается, что это «компактная модель», превосходящая аналоги от Meta и Alibaba. Вероятно, речь идет о параметрах в диапазоне 1-10 млрд (как...
  • Rutab

Смотреть все