05月

21日

  • 谷歌 I/O 发布轻量级多模态模型 Gemma3n 并扩展家族,医疗与手语翻译模型表现亮眼

    牛透社 5 月 21 日消息,谷歌于 2025 年谷歌 I/O 开发者大会发布轻量级多模态模型 Gemma3n,宣布扩展 Gemma 模型家族,新增 MedGemma 与 SignGemma。

    Gemma3n 专为低算力设备设计,可跨模态处理文本、音频、图像及视频,支持在运行内存低于 2 GB 的设备流畅运行,与 Gemini Nano 共享底层架构。MedGemma 在病理切片分类任务中准确率达 98.7%;SignGemma 实现美国手语到英语文本实时翻译,识别准确率较现有方案提升 37%。

    Gemma 系列累计下载量突破 4200 万次,医疗类模型占比达 34%。谷歌强调其轻量化、毫秒级响应与隐私保护特性,但非标准开源协议引发部分开发者对商业化应用的担忧。

意见反馈
返回顶部