11月

20日

  • 芝加哥大学与伯克利团队突破强化学习瓶颈 DreamGym 框架实现 30%-40% AI 训练效能跃升

    牛透社 11 月 20 日消息,芝加哥大学与加州大学伯克利分校研究团队发布革命性训练框架 DreamGym,成功攻克强化学习训练大型语言模型智能体的高成本、复杂架构及反馈不可靠三大难题。

    该框架通过推理经验模型、动态经验回放池及渐进式任务生成器实现闭环训练,在 WebArena 场景中纯模拟训练成功率较传统方法提升超 30%,模拟转现实策略仅用 10% 真实数据即实现 40%+ 性能跃升,并支持跨领域无缝迁移。企业用户可通过少量种子数据实现高效智能体训练。

意见反馈
返回顶部