09月
01日
多机构联合研发 GitTaskBench 发布 推动代码智能体实战评估进入新阶段
牛透社 9 月 1 日消息,由中科院、北京大学及香港科技大学等多所顶尖学术机构联合研发的代码智能体评估工具 GitTaskBench 正式发布。
该工具构建端到端评测体系,其开源版本涵盖 7 大模态、7 个核心领域、24 个细分领域及 54 个基于实际 GitHub 仓库的真实任务,通过经济当量评估体系(任务完成度/市场价值/质量系数)量化代码智能体经济效益,为学术研究及商业应用提供新基准。
您投送的稿件违反了牛透社的投稿协议,现已关闭您的投稿功能,如有异议请发邮件至tougao@jinse.com进行申诉。