08月

22日

  • 阿里巴巴发布第三代 GUI 智能体框架 Mobile-Agent-v3 并开源多模态模型 GUI-Owl

    牛透社 8 月 22 日消息,阿里巴巴发布第三代 GUI 智能体框架 Mobile-Agent-v3,并同步开源多模态跨平台 GUI 虚拟层模型 GUI-Owl。该技术组合在 AndroidWorld 和 OSWorld 测试平台上分别以 73.3% 和 37.7% 的任务成功率刷新行业记录。

    Mobile-Agent-v3 可自主完成 97% 的常见 GUI 操作类型,复杂工作流连续执行能力较前代提升近 3 倍,其核心技术 GUI-Owl 的 GUI 元素解析准确率达 92.4%。开源版本包含 14 项核心专利,已有医疗自动化公司利用其实现 CT 影像报告系统零人工操作流程。Gartner 预测 2026 年企业级 GUI 自动化市场规模有望突破千亿美元。

意见反馈
返回顶部