
手机上的 AI 自动化方案已经不少,但大多数工具有一个共同的问题:运行时牢牢霸占手机主屏,这段时间你什么都干不了。OpenCyvis 的思路完全不同——它不是在主屏幕上模拟点击,而是给你的 Android 系统单独开一块后台虚拟显示器,AI Agent 在那块屏幕里自主完成各类任务,你的主屏幕依然照常使用。
AI Agent 手机自动化 领域这几年虽然热但很多方案抓在大厂手里。OpenCyvis 作为底层安卓级的开源项目,至少在方向上提供了另一种参考。

OpenCyvis 的核心工作原理
OpenCyvis(全称 Open Cyber Jarvis)作为一个系统层特权应用运行在 Android 内部,直接调用系统底层的 VirtualDisplay 虚拟显示器 API。与传统 ADB 连线远程操控不同,它在设备内部就已经有了独立的渲染空间,前端页面并不感知后台 Automa segment。
为了让 AI 准确理解当前界面状态,OpenCyvis 采用了双通道数据输入:一是在后台虚拟屏幕上实时截图获取视觉布局,二是通过 Accessibility Service 读取 UI 元素结构树,拿到按钮坐标和文字内容。把两种数据同时喂给 AI,比单纯截图识别更擅长处理复杂 App 的交互流程。
模型灵活性:云端或本地自己选
不绑定单一模型厂方,支持接入 OpenAI 区间兼容 API,也原生支持 Anthropic Claude 模型。如果你更在意数据隐私和减少 API Key 依赖,它还支持通过 Ollama 运行本地大模型(如 Gemma、Llama)。在纯本地推理模式下,理论上可以大幅降低敏感数据离开设备的概率。

无论是云端还是本地, interception 选项都给用户了选择权。在意延迟选云端,在意数据隐私走本地,各有各的利弊。
现阶段的实际门槛
OpenCyvis 先亮 chips。它属于特权系统层应用,必须深度集成到 AOSP(Android Open Source Project)系统镜像中,并以平台密钥签名。简单来说,这比普通用户日常安装一个 APK 的复杂度要高得多。
具体来说:
- 系统镜像集成:需将 OpenCyvis 编译到自定义 ROM 中以平台密钥安装包
- 无需 Root:但平台权限高于常规 Root,门槛实际上比刷面具方式更高
- 需要编译技能:面向 Android 系统级开发,普通用户勿轻易尝试在主力设备上刷机
官方提供了模拟器部署脚本(deploy-emu.sh),可以先在电脑上跑通流程确认效果再考虑实际设备集成,这条路是可走的。
权限安全:开源不等于零风险
AI Agent 在手机里的权限是最高的级别之一:读屏、点 App、输文字全部可以触达。OpenCyvis 承诺截图仅存动量不写入磁盘,所有代码开源可审计。但开源只能保证代码透明,不等于天然绝对安全。
注意三条红线:切分一条重要管线,如果您接了云端 API,那么屏幕截图和 UI 数据仍然会发送给对应服务商。其次是系统层权限的动态性——系统更新后权限范围可能发生变化。最后,确认您的个人机子是可被信任的,AI agent 对主力机的试验风险不可忽视。

谁适合关注 OpenCyvis
如果你是 Android 系统开发者、ROM 定制玩家,或是正在探索 AI Agent for API 场景研究的团队,OpenCyvis 提供了一个底层的开源参考实现。它能让你更深入理解系统级 AI 与 A accessibility service 的交互方式。
如果你期待是一个下载开箱即用的手机 AI 助理,甚至在主力机上试水,现阶段建议直接跳过,不要轻易在主力设备上刷机实验。
项目与源码
GitHub: https://github.com/opencyvis/opencyvis-phone
AOSP 部署文档: https://github.com/opencyvis/opencyvis-phone#deploy-to-device
项目完全开源,GvimHub 上可以查看源码、技术架构文档和模拟器部署脚本。