06月

20日

  • 昆仑万维发布并开源 Skywork-SWE-32B,引领开源软件工程智能体模型新风潮

    牛透社 6 月 20 日消息,昆仑万维发布代码智能体基座模型 Skywork – SWE – 32B,该模型参数规模达 320 亿,在 SWE – bench Verified 测试中以 47.0% 的 pass@1 准确率刷新 32B 参数规模开源模型纪录。

    昆仑万维团队针对当前市场上 SWE 任务的主流数据集存在的问题,建立了一套三阶段的自动化流程来收集和验证训练数据。在数据采集阶段,他们通过 GitHub API 抓取了超过 15 万个开源仓库的信息,并通过一系列严格的筛选步骤,最终保留了23389个任务样本。

    在验证阶段,团队使用统一命令生成和 Docker 环境构建技术,确保每个任务样本的有效性,最终生成了10169条高质量样本。

    在智能体轨迹生成阶段,团队使用开源的 OpenHands 框架,结合商用大模型作为基座,对每个任务执行了多轮交互,全面记录智能体的解决过程。最终,他们构建出8209条高质量的验证通过轨迹,为 Skywork-SWE-32B 的训练提供了坚实基础。

意见反馈
返回顶部