09月

11日

  • 字节跳动 Seed 团队开源 AgentGym – RL 框架,五大场景 27 项任务表现超商用模型

    牛透社 9 月 11 日消息,字节跳动 Seed 研究团队发布 AgentGym – RL 强化学习框架及 ScalingInter – RL 训练方法,该框架采用模块化解耦架构,支持主流 RL 算法以实现代理决策能力的系统性提升,主要应用于网络导航、深度信息检索、数字游戏、体感任务及科学实验等多元场景。

    研究以 Qwen2.5 – 3B/Qwen2.5 – 7B 为基础模型,在五大场景的 27 项任务中综合表现超越多个商用模型。团队宣布将完整开源 AgentGym – RL 框架(含代码及数据集),以推动智能代理技术的产学研协同发展。

意见反馈
返回顶部