多机构联合研发 GitTaskBench 发布推动代码智能体实战评估进入新阶段 - 牛透社

使用已有账号登录

09月

01日

多机构联合研发 GitTaskBench 发布推动代码智能体实战评估进入新阶段

牛透社 9 月 1 日消息，由中科院、北京大学及香港科技大学等多所顶尖学术机构联合研发的代码智能体评估工具 GitTaskBench 正式发布。

该工具构建端到端评测体系，其开源版本涵盖 7 大模态、7 个核心领域、24 个细分领域及 54 个基于实际 GitHub 仓库的真实任务，通过经济当量评估体系（任务完成度/市场价值/质量系数）量化代码智能体经济效益，为学术研究及商业应用提供新基准。

新闻排行

热门新闻

零一万物把 Agent 带进了鸡舍

零一万物把 Agent 带进了鸡舍

2026-06-03

网易智企押注可靠 AI 员工

网易智企押注可靠 AI 员工

2026-06-03

引爆行业！EIOSpace登场企业 AI 从此进入新纪元

引爆行业！EIOSpace登场企业 AI 从此进入新纪元

2026-06-01

导航

京ICP备17034123号-3Copyright © 崔牛会版权所有

合作伙伴

快速导航

京ICP备17034123号-3Copyright © 崔牛会版权所有

关于我们加入我们联系我们

iTrust