07月

25日

  • 快手研究院开源 KAT-V1 大语言模型 动态思维机制实现 37% 效率跃升

    牛透社 2025 年 7 月 25 日消息,快手研究院发布开源混合认知大模型 KAT-V1,该模型通过动态思维模式切换机制可根据问题复杂度自主调整思考深度,40B 基础版在自动思考模式下表现接近 DeepSeek 6850 亿参数旗舰模型 R1-0528,200B 扩展版全面超越 Qwen、DeepSeek 及 Llama 系列顶级模型。

    技术报告显示,其通过”短时直觉推理”与”长程逻辑推演”混合训练范式及 Step-SRPO 强化学习算法显著提升推理密度。动态思维调控技术使人机协作效率提升 37%,平均响应速度缩短至原方案 1/4。核心创新包括基于 Qwen2.5-32B 的认知数据架构(千万级跨领域数据增强)、异构蒸馏框架(知识迁移效率提升 3.2 倍)和动态认知引擎(复杂问题解决效能达 DeepSeek R1-0528 的 95%)。

    KAT-V1-40B 基座模型已部署于 Hugging Face 平台,200B MoE 版本计划 2026 年第一季度完成训练。该模型现集成于快手 AI 研发助手 Kwaipilot,赋能开发者 AI 应用开发。

意见反馈
返回顶部