
简介介绍
AutoGLM 手机助手的现代化 Web 图形界面 – 让 AI 自动化操作 Android 设备变得简单
Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。系统通过 ADB(Android Debug Bridge)来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作流程。用户只需用自然语言描述需求,如“打开小红书搜索美食”,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。系统还内置敏感操作确认机制,并支持在登录或验证码场景下进行人工接管。同时,它提供远程 ADB 调试能力,可通过 WiFi 或网络连接设备,实现灵活的远程控制与开发。
主要特点
- 多设备并发控制 – 同时管理和控制多个 Android 设备,设备间状态完全隔离
- 对话式任务管理 – 通过聊天界面控制 Android 设备
- 实时屏幕预览 – 基于 scrcpy 的低延迟视频流,随时查看设备正在执行的操作
- 直接操控手机 – 在实时画面上直接点击、滑动操作,支持精准坐标转换和视觉反馈
- 零配置部署 – 支持任何 OpenAI 兼容的 LLM API
- ADB 深度集成 – 通过 Android Debug Bridge 直接控制设备
- 模块化界面 – 清晰的侧边栏 + 设备面板设计,功能分离明确
工具地址
GitHub图形界面版:https://github.com/suyiiyii/AutoGLM-GUI