09月
08日
微软开源 rStar2 – Agent 框架,140 亿参数 AI 模型多领域性能突破行业标杆
牛透社北京时间 2025 年 9 月 8 日消息,微软发布开源 AI 智能体推理框架 rStar2 – Agent。该产品在参数规模仅为 DeepSeek – R1 0.2%(140 亿 vs 6710 亿)的情况下,以 80.6% 的数学推理准确率刷新纪录,并在 GPQA – Diamond 科学推理(60.9%)和 BFCL v3 工具调用(60.8%)测试中超越现有标杆。
技术突破包含三大革新:隔离式代码执行架构支持单步 4.5 万次工具调用,GRPO – RoC 算法提升推理效率,训练流程使计算资源利用率达传统方法的 3.2 倍。项目已在 GitHub 开源,加速智能体技术产业化落地。