05月

26日

  • 红杉中国发布动态 AI 评估工具 xBench,覆盖 12 个行业 2500+场景

    牛透社 2025 年 5 月 26 日消息,红杉中国发布 AI 基准测试工具 xBench,该产品具备动态更新机制与双轨制评估体系,主要应用于大型模型能力评估与智能体实际应用场景。

    该工具通过 2500 + 个动态测试场景评估矩阵(每月更新 15% 内容)量化 AGI 关键能力,已与 12 个行业头部企业合作提供全生命周期认证服务。其研发基于红杉中国自 2022 年对 AGI 发展的持续观察,突破点包括垂直领域评估、多模态追踪及可信度验证三大技术模块。

意见反馈
返回顶部