OpenCyvis - 开源AI手机Agent

手机上的 AI 自动化方案已经不少,但大多数工具有一个共同的问题:运行时牢牢霸占手机主屏,这段时间你什么都干不了。OpenCyvis 的思路完全不同——它不是在主屏幕上模拟点击,而是给你的 Android 系统单独开一块后台虚拟显示器,AI Agent 在那块屏幕里自主完成各类任务,你的主屏幕依然照常使用。

AI Agent 手机自动化 领域这几年虽然热但很多方案抓在大厂手里。OpenCyvis 作为底层安卓级的开源项目,至少在方向上提供了另一种参考。

OpenCyvis 核心功能与技术亮点

OpenCyvis 的核心工作原理

OpenCyvis(全称 Open Cyber Jarvis)作为一个系统层特权应用运行在 Android 内部,直接调用系统底层的 VirtualDisplay 虚拟显示器 API。与传统 ADB 连线远程操控不同,它在设备内部就已经有了独立的渲染空间,前端页面并不感知后台 Automa segment。

为了让 AI 准确理解当前界面状态,OpenCyvis 采用了双通道数据输入:一是在后台虚拟屏幕上实时截图获取视觉布局,二是通过 Accessibility Service 读取 UI 元素结构树,拿到按钮坐标和文字内容。把两种数据同时喂给 AI,比单纯截图识别更擅长处理复杂 App 的交互流程。

模型灵活性:云端或本地自己选

不绑定单一模型厂方,支持接入 OpenAI 区间兼容 API,也原生支持 Anthropic Claude 模型。如果你更在意数据隐私和减少 API Key 依赖,它还支持通过 Ollama 运行本地大模型(如 Gemma、Llama)。在纯本地推理模式下,理论上可以大幅降低敏感数据离开设备的概率。

OpenCyvis 后台虚拟显示器原理

无论是云端还是本地, interception 选项都给用户了选择权。在意延迟选云端,在意数据隐私走本地,各有各的利弊。

现阶段的实际门槛

OpenCyvis 先亮 chips。它属于特权系统层应用,必须深度集成到 AOSP(Android Open Source Project)系统镜像中,并以平台密钥签名。简单来说,这比普通用户日常安装一个 APK 的复杂度要高得多。

具体来说:

  • 系统镜像集成:需将 OpenCyvis 编译到自定义 ROM 中以平台密钥安装包
  • 无需 Root:但平台权限高于常规 Root,门槛实际上比刷面具方式更高
  • 需要编译技能:面向 Android 系统级开发,普通用户勿轻易尝试在主力设备上刷机

官方提供了模拟器部署脚本(deploy-emu.sh),可以先在电脑上跑通流程确认效果再考虑实际设备集成,这条路是可走的。

权限安全:开源不等于零风险

AI Agent 在手机里的权限是最高的级别之一:读屏、点 App、输文字全部可以触达。OpenCyvis 承诺截图仅存动量不写入磁盘,所有代码开源可审计。但开源只能保证代码透明,不等于天然绝对安全。

注意三条红线:切分一条重要管线,如果您接了云端 API,那么屏幕截图和 UI 数据仍然会发送给对应服务商。其次是系统层权限的动态性——系统更新后权限范围可能发生变化。最后,确认您的个人机子是可被信任的,AI agent 对主力机的试验风险不可忽视。

OpenCyvis 部署门槛与适合人群

谁适合关注 OpenCyvis

如果你是 Android 系统开发者、ROM 定制玩家,或是正在探索 AI Agent for API 场景研究的团队,OpenCyvis 提供了一个底层的开源参考实现。它能让你更深入理解系统级 AI 与 A accessibility service 的交互方式。

如果你期待是一个下载开箱即用的手机 AI 助理,甚至在主力机上试水,现阶段建议直接跳过,不要轻易在主力设备上刷机实验。

项目与源码

GitHub: https://github.com/opencyvis/opencyvis-phone

AOSP 部署文档: https://github.com/opencyvis/opencyvis-phone#deploy-to-device

项目完全开源,GvimHub 上可以查看源码、技术架构文档和模拟器部署脚本。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。