实现安卓手机自动化 - AutoGLM-Phone

AutoGLM-Phone 是一个基于视觉语言模型的 AI 手机智能助理框架。

它能以多模态方式理解屏幕内容,并通过 ADB 自动操控设备。

用户只需用 自然语言 下指令,如“打开小红书搜美食”,模型即可解析意图、理解界面并自动规划、执行操作流程,无需手动点击。

具体的搭建流程:

  1. 环境
    • 安装 Python
    • 安装并配置 ADB
    • 配置Open-AutoGLM的git仓库
  2. 模型
    • 注册智谱大模型开放平台
    • 获取模型密钥

安装Python

  1. 下载Python安装包 点击下载Windows版本3.14.2
  2. 安装Python:双击安装包,按照提示进行安装,要勾选添加Python到环境变量
  3. 验证安装成功:在命令行输入python,如果显示Python版本信息,则安装成功

安装ABD

  1. 下载abd 进入网页选择适用于自己系统的abd版本
  2. 解压后将文件路径添加进系统Path变量中

配置ADB

adb devices
# 应显示:
# List of devices attached
# XXXXXX    device

配置Open-AutoGLM

  1. 获取代码库

    git clone https://github.com/zai-org/Open-AutoGLM.git
    cd Open-AutoGLM
    
  2. 安装必要的组件

    pip install -r requirements.txt
    pip install -e .
    

启动

python main.py --base-url https://open.bigmodel.cn/api/paas/v4 --model "autoglm-phone" --apikey "你的apikey" "打开美团搜索附近的火锅店"
image-20251215222347500

出现这个字样就是成功。