AutoGLM-Phone 是一个基于视觉语言模型的 AI 手机智能助理框架。
它能以多模态方式理解屏幕内容,并通过 ADB 自动操控设备。
用户只需用 自然语言 下指令,如“打开小红书搜美食”,模型即可解析意图、理解界面并自动规划、执行操作流程,无需手动点击。
具体的搭建流程:
- 环境
- 安装 Python
- 安装并配置 ADB
- 配置Open-AutoGLM的git仓库
- 模型
- 注册智谱大模型开放平台
- 获取模型密钥
安装Python
- 下载Python安装包 点击下载Windows版本3.14.2
- 安装Python:双击安装包,按照提示进行安装,要勾选添加Python到环境变量
- 验证安装成功:在命令行输入python,如果显示Python版本信息,则安装成功
安装ABD
- 下载abd 进入网页选择适用于自己系统的abd版本
- 解压后将文件路径添加进系统Path变量中
配置ADB
adb devices
# 应显示:
# List of devices attached
# XXXXXX device
配置Open-AutoGLM
-
获取代码库
git clone https://github.com/zai-org/Open-AutoGLM.git cd Open-AutoGLM -
安装必要的组件
pip install -r requirements.txt pip install -e .
启动
python main.py --base-url https://open.bigmodel.cn/api/paas/v4 --model "autoglm-phone" --apikey "你的apikey" "打开美团搜索附近的火锅店"
出现这个字样就是成功。