太香了!这个 GitHub 开源项目,让安卓模拟器直接跑在浏览器里,搞 AI 的必看 研究痛点搞过移动 GUI 智能体的人都知道真机测试是真的费钱。买一批手机、搭环境、跑任务出了 bug 还得手动复现一轮下来成本直接起飞。更要命的是你想大规模并行训练基本没戏——除非你有钱买几十台设备。mobilegym 这个开源项目就是冲着这个痛点来的。它在浏览器里跑安卓模拟器专门为移动 GUI 智能体研究设计。内置 28 个模拟应用、416 个任务模版拿到手就能开跑。状态透明传统模拟器最大的坑是什么评判。你让 AI 去操作一个 App完了怎么知道它做对了截图比对OCR都不靠谱。mobilegym 直接把整个环境状态转成结构化 JSON评判器读状态就行毫秒级出结果。这种确定性评判用过的人都懂有多爽。而且它支持重置、注入、快照、克隆状态。你可以把某一刻的完整环境存下来随时恢复。这对复现 bug、对比不同策略的效果来说简直不要太方便。并行能力并行能力是这玩意最让我惊艳的地方。单个实例大概 400MB 内存、50MB 磁盘256 个实例在一台服务器上跑CPU 占用不到 10%。算一下一台普通服务器就能同时跑 256 个训练任务这效率比真机方案高了不止一个量级。沙箱环境里 AI 可以”犯错”无数次反正随时重置。全环境状态比对也能做这在真机上想都别想。迁移效果很多人第一反应模拟器里训出来的模型到真机上能行吗数据说明问题——模拟训练后的模型在真实设备上成功率 72.9%保留率 95.1%。也就是说大部分能力是能迁移过去的不是那种”模拟猛如虎实战二百五”的情况。还有个细节我觉得设计得挺好AnswerSheet 协议。Agent 完成任务后必须填结构化表单说自己具体做了什么。这就堵住了模糊回答、瞎蒙的漏洞评判标淮明明白白。聊聊缺点28 个内置应用覆盖面毕境有限要是你的研究场景比较冷门得自己适配工作量不小。它用的声明式导航每个屏幕和跳转都用有限状态机描述——可控是可控但复杂应用写起规格文件来挺废时间的。另外这项目目前更偏向研究者普通开发者想拿来做自动化测试的话上手门槛不低文档对非研究人员不太友好。不过话说回来能在浏览器里跑安卓模拟器来做智能体研究这个方向确实解决了一个大问题。就算不跑大规模训练拿来当自动化测试环境也值得一试你说呢下载地址https://pan.quark.cn/s/823d93a8610