“如臂使指”
暨 MolaGPT 开发日志 - 其(十四)
MolaGPT Mobile 现已开放下载,支持 Android。
我现在是各种 CLI Agent 的重度用户,Claude Code 和 Codex 在桌面上跑任务,一跑就是十几分钟,我很快发现了一个别扭的事实:Agent 明明是替我干活的,我却被它拴在了电脑前:它每次要改文件、跑脚本,都会停下来等我点一下允许,这当然是件好事,但你不可能无脑开者 Bypass Permission 模式,有时我出门吃了个饭,回来发现任务在第二分钟(我可能还没下楼)就停在一个权限确认上... Agent Loop 诞生后,大模型的工作从即问即答变成了长期任务,人的角色在这时候就变成了关键节点的确认者。
或者有时因为一些事情必须要离开电脑,但假如这正好是我的灵感如同泉涌时刻,所以不中断工作是很有必要的。
介绍 MolaGPT Mobile
今天,我在此发布 MolaGPT Mobile:远程控制运行在你电脑上的 Codex 和 Claude Code,以及和 MolaGPT 或你自定义的任何 LLM 聊天。

MolaGPT 是一个原生 Android 客户端,由 Kotlin 和 Jetpack Compose 开发,大小仅有不到 4 MB。其不仅仅作为 MolaGPT 的移动端聊天客户端使用,在用户的 PC 上安装了 MolaGPT Desktop 之后,还能通过 MolaGPT Agent Bridge 远程控制运行在用户 PC 上的 Codex 和 Claude Code.

MolaGPT App 和其他平台的客户端一样:支持几乎所有的 MolaGPT 功能,也支持 BYOK。您可以使用 MolaGPT,也可以配置自己的 OpenAI Compatible、Anthropic 或 Gemini 接口,既可以当作 MolaGPT 的手机客户端,也可以当作一个支持自定义模型的移动端 LLM Chat.

介绍 MolaGPT Agent Bridge
本次的重头戏是 MolaGPT Agent Bridge,在桌面端开启 Bridge 之后,本机的 Claude Code / Codex 会话会经云端同步到登录同一账号的手机上,并且可以在 MolaGPT App 上直接控制它们。

手机上能做的事,几乎就是你坐在电脑前能做的事:您可以在手机上查看会话列表,看到每个任务当前是空闲、运行中,还是正在等待确认。点进单个会话后,可以看到 Agent 的实时输出,包括它正在读什么文件、准备执行什么命令、工具调用返回了什么结果。
当 Agent 需要权限确认时,手机端会出现提醒。您可以批准本次操作、始终批准,也可以拒绝。除此之外,手机端还可以发送新指令、打断当前任务、切换模型、调整推理力度和权限模式。

用户也可以直接在手机上新建会话,指定工作目录,让远程的 PC 开始执行任务。比如电脑放在宿舍或家里,人已经在外面,但突然想到一个要改的功能,就可以直接在手机上把任务丢给桌面端。

Agent Bridge 的原理并不复杂,桌面端会把会话中发生的事情记录成一条条带编号的事件,加密交给 MolaGPT 的中转服务器暂存;手机端定期拉取新事件并显示出来。相反,手机端发出的消息、打断、批准、拒绝和配置切换,也会变成命令进入队列,由桌面端取走执行。

在其中,中转服务器只负责转发,不会执行任何任务。真正运行 Agent 的依然是您的 PC,真正做决定的依然是您自己。
隐私与数据安全
Bridge 里流动的内容可能包含文件路径、命令输出、项目代码,甚至某些临时调试信息,我现在将它开放给大家使用,但需要注意的是它依然是一个个人项目里的功能,如果你打算使用它,就需要先理解它的工作方式和数据安全事宜。
- 传输层面,手机、桌面端和中转服务器之间的通信都由 TLS 加密保护,且每个请求都会携带登录 MolaGPT 后签发的凭证,中转服务器会校验签名,并从凭证中确认账号身份。
- 存储层面,中转服务器按账号隔离数据,每个账号拥有独立的存储目录,中转服务器只按照原样保存事件流和命令队列需要的原始数据,用于手机端同步和断线续传。
综上,控制权始终留在用户手里,故在 MolaGPT Desktop 中,Bridge 为默认关闭状态,且开启时会先弹出隐私说明;关闭后,桌面端会立刻标记离线,并停止继续上报会话事件,随后删除中转服务器上的所有文件。

MolaGPT Mobile 现已开放下载,支持 Android。

发表回复