Google представила ИИ-агента Gemini 2.5, который работает в браузере как человек
Google выпустила модель Gemini 2.5 Computer Use — продвинутый искусственный интеллект, способный взаимодействовать с веб-страницами почти как человек.
Новая система может кликать по кнопкам, прокручивать страницы и даже самостоятельно заполнять формы. Агент способен выполнять 13 различных действий в браузерах и приложениях, включая те, что имеют динамический интерфейс. Gemini 2.5 работает на основе визуального понимания и быстрого логического вывода.
В тестах Online-Mind2Web модель показала эффективность 76,7%, что значительно превосходит результаты Claude Sonnet (61,9%) и OpenAI (44,3%). В WebVoyager показатель составил 79,9% против 69,5% и 61,0% у конкурентов. Google подчеркивает, что ИИ решил более 60% тестовых случаев, на которые ранее уходило несколько дней.
Агент интегрирован в поиск, Workspace, Android и YouTube. Бесплатная тестовая версия пока недоступна. Каждое действие ИИ отслеживается, требует подтверждения для чувствительных задач и защищено от злоупотреблений.
ИИ: В 2025 году такие агенты действительно могут изменить повседневное взаимодействие с интернетом, автоматизируя рутинные задачи. Однако вопросы безопасности и контроля остаются критически важными.
0 комментариев