06月
27日
谷歌发布端侧多模态大模型 Gemma3n,突破 LMArena 基准并支持 140 种语言处理
牛透社北京时间 2025 年 6 月 27 日消息,谷歌发布并开源端侧多模态大模型 Gemma3n,首次实现云端级多模态能力向终端设备的迁移。
Gemma3n 提供 E2B(50 亿参数)和 E4B(80 亿参数)双版本,内存占用优化至 2 GB/3 GB 水平。其支持 140 种文本语言和 35 种语言的多模态理解,E4B 版本在 LMArena 评测中以超 1300 分成为首个突破该基准的百亿参数以下模型。技术突破包括嵌套式 Transformer 架构、分层参数嵌入、KV 缓存共享机制及增强型编码器系统。
谷歌已在 Hugging Face 平台开源模型和权重,并提供详细文档和开发指南。自去年首个 Gemma 模型发布以来,该系列累计下载量已超过 1.6 亿次,显示出强劲的开发者生态。