06月

07日

  • 面壁智能发布终端侧大模型 MiniCPM 4.0,推理性能最高提升 220 倍

    牛透社 6 月 7 日消息,面壁智能发布终端侧大型语言模型 MiniCPM 4.0,该产品通过自主研发的 CPM.cu 推理框架,在极限场景下最高可实现 220 倍性能提升,常规场景下亦有 5 倍加速效果,并兼容 vLLM、SGLang 及 LlamaFactory 等主流部署框架。

    面壁智能专注于终端侧人工智能技术研发,其核心业务覆盖大型语言模型优化与推理框架开发。此次发布的 MiniCPM 4.0 主要应用于终端设备的高效自然语言处理场景。

意见反馈
返回顶部