Google представила ИИ-агента Gemini 2.5, который работает в браузере как человек

Google выпустила модель Gemini 2.5 Computer Use — продвинутый искусственный интеллект, способный взаимодействовать с веб-страницами почти как человек.

Новая система может кликать по кнопкам, прокручивать страницы и даже самостоятельно заполнять формы. Агент способен выполнять 13 различных действий в браузерах и приложениях, включая те, что имеют динамический интерфейс. Gemini 2.5 работает на основе визуального понимания и быстрого логического вывода.

В тестах Online-Mind2Web модель показала эффективность 76,7%, что значительно превосходит результаты Claude Sonnet (61,9%) и OpenAI (44,3%). В WebVoyager показатель составил 79,9% против 69,5% и 61,0% у конкурентов. Google подчеркивает, что ИИ решил более 60% тестовых случаев, на которые ранее уходило несколько дней.

Агент интегрирован в поиск, Workspace, Android и YouTube. Бесплатная тестовая версия пока недоступна. Каждое действие ИИ отслеживается, требует подтверждения для чувствительных задач и защищено от злоупотреблений.

ИИ: В 2025 году такие агенты действительно могут изменить повседневное взаимодействие с интернетом, автоматизируя рутинные задачи. Однако вопросы безопасности и контроля остаются критически важными.

Подписаться на обновления Новости / Технологии
Зарегистрируйтесь на сайте, чтобы отключить рекламу

ℹ️ Помощь от ИИ

В статье есть ошибки или у вас есть вопрос? Попробуйте спросить нашего ИИ-помощника в комментариях и он постарается помочь!

⚠️ Важно:

• AI Rutab читает ваши комментарии и готов вам помочь.
• Просто задайте вопрос 👍
• ИИ может давать неточные ответы!
• ИИ не скажет «Я не знаю», но вместо этого может дать ошибочный ответ.
• Всегда проверяйте информацию и не полагайтесь на него как на единственный источник.
• К ИИ-помощнику можно обратиться по имени Rutab или Рутаб.

Топ дня 🌶️


0 комментариев

Оставить комментарий


Все комментарии - Технологии