02月
27日
腾讯发布混元 Turbo S 模型,主打 “秒回” 体验
2月27日,腾讯正式发布新一代快思考模型混元Turbo S。该模型最大亮点是实现“秒回”,与DeepSeek R1、混元T1等慢思考模型不同,其吐字速度提升一倍,首字时延降低44%,大大提升交互流畅性。
混元Turbo S采用创新的Hybrid-Mamba-Transformer融合架构,结合Mamba高效处理长序列与Transformer捕捉复杂上下文的优势,降低传统Transformer计算复杂度及KV-Cache缓存占用,实现训练和推理成本下降,这也是工业界首次将Mamba架构无损应用于超大型MoE模型。
在性能表现上,混元Turbo S在知识问答、数学推理、代码生成等短思维链任务中表现出色,通过长短思维链融合,在保持文科类问题快速处理优势的同时,理科推理能力较前代提升27%,在业界通用的多个公开基准测试中,效果可对标DeepSeek V3、GPT 4o、Claude等顶尖模型。
成本方面,其部署成本大幅下降,API定价输入为0.8元/百万tokens,输出为2元/百万tokens,相比前代混元Turbo模型价格下降数倍。