Как развернуть AI-агента на смартфоне без прав root: пошаговое руководство
Современные ИИ-помощники на смартфонах эволюционировали до уровня, когда одной фразой можно автоматически заказать кофе, еду или совершить покупки, переключаясь между приложениями. Эти функции часто преподносятся как ключевые на презентациях, но на самом деле обычный пользователь тоже может создать такого AI-агента на своём телефоне. Процесс довольно прост и не требует прав root. Давайте разберёмся, как это сделать.
Что потребуется для начала?
Нужно не так много. Прежде всего — смартфон на Android версии 10 или новее, на более старых системах работа может быть нестабильной.
Из программного обеспечения понадобятся три ключевых компонента: приложение AutoGLM For Android (можно скачать с GitHub или с китайского магазина приложений Coolapk), утилита Shizuku (для предоставления прав приложениям) и аккаунт на платформе BigModel от компании Zhipu AI. В качестве модели используется специально обученный для операций на телефоне AutoGLM-Phone, который на данный момент доступен бесплатно в течение ограниченного времени.
Пошаговая инструкция:
1. Активация режима разработчика. Зайдите в «Настройки», найдите раздел «О телефоне» и семь раз подряд нажмите на пункт «Номер сборки». После этого вы получите уведомление, что стали разработчиком. Вернитесь в главное меню настроек, где появится новый пункт «Для разработчиков».
2. Установка и настройка Shizuku. Это приложение позволяет AutoGLM получать некоторые системные разрешения без необходимости рутирования телефона. После установки откройте Shizuku и выберите активацию через «Отладку по Wi-Fi».

Затем вернитесь в «Для разработчиков», найдите «Отладка по Wi-Fi», включите её и нажмите «Сопряжение с устройством с помощью кода». На экране появится IP-адрес и код. Введите этот код в Shizuku. После успешного сопряжения статус Shizuku изменится на «Работает».
3. Установка AutoGLM. Скачайте APK-файл приложения с Coolapk или GitHub, установите и откройте его. Приложение запросит ряд разрешений — все их необходимо предоставить. Особенно важны разрешения Shizuku, специальные возможности (Accessibility) и разрешение на отображение поверх других окон.
4. Получение API-ключа. Это ключевой шаг.
Зарегистрируйте аккаунт на платформе BigModel от Zhipu AI. После входа в систему используйте поиск по запросу «autoglm-phone», чтобы найти нужную модель. Активируйте её (сейчас это бесплатно). Затем перейдите на страницу «API Keys», создайте новый ключ и скопируйте его.
5. Настройка модели в приложении. В настройках AutoGLM найдите раздел конфигурации модели. Вставьте скопированный API-ключ. В поле Base URL введите:
https://open.bigmodel.cn/api/paas/v4. Важно не добавлять ничего лишнего в конец, например, /v1/chat/completions. В поле Model введите точное название модели: autoglm-phone.
6. Первый запуск. После настройки вернитесь на главный экран приложения. Попробуйте дать первую команду, например: «Откройте WeChat и отправьте сообщение «Привет, ИИ» в «Передачу файлов»». Нажмите «Старт».
На экране появится всплывающее окно, в котором будет отображаться процесс «мышления» ИИ — как он распознает элементы на экране и планирует следующие действия. Затем WeChat откроется автоматически, найдет нужный чат, введет текст и отправит сообщение. Весь процесс похож на удаленное управление вашим телефоном, и ощущение действительно удивительное.
Типичные ошибки и как их избежать:
• Неправильная модель. AutoGLM требует не обычную языковую модель для диалога, а специальную визуальную модель, обученную для управления телефоном, такую как autoglm-phone от Zhipu AI. Использование других моделей (например, Doubao-1.5-pro) не позволит добиться нужного результата.
• Неправильный Base URL. Приложение AutoGLM само добавляет необходимые пути к URL, поэтому нужно указывать только базовый адрес. Добавление лишних сегментов вызовет ошибку сервера.
• Проблемы с активацией Shizuku. Если сопряжение по Wi-Fi не удается, попробуйте активировать Shizuku через USB-подключение к компьютеру, выполнив команду из официальной документации утилиты.
• Слишком общие команды. Чем конкретнее инструкция, тем выше вероятность успеха. Вместо «Закажи мне жареную курицу» лучше сказать: «Откройте Meituan, найдите жареную курицу, выберите магазин с самым высоким рейтингом, закажите большую порцию и перейдите к оплате».
В чём смысл этого эксперимента?
Честно говоря, после всех манипуляций главное впечатление — конечный результат не так удобен, как ожидалось. Операции могут быть неидеальными, иногда происходят задержки. Так зачем же это нужно?
Во-первых, это принципиально новый способ взаимодействия, и сам факт такого качественного скачка стоит того, чтобы попробовать его лично.
Что более важно, на основе этого подхода можно создавать более интересные вещи. Поскольку AutoGLM в основе использует языковые модели (такие как GLM-4.5), он обладает способностью к естественному диалогу и может стать персональным помощником для общения. Более того, модель с открытым исходным кодом позволяет развернуть её на своём устройстве и создать ИИ, который действительно понимает вас и принадлежит только вам.
Таким образом, самое интересное здесь — не текущая практическая полезность, а сам процесс: когда вы своими руками заставляете ИИ выполнять команды, даже если это просто отправка сообщения в WeChat, это невероятно увлекательно.














0 комментариев