06月

30日

  • 阿里巴巴发布 3 亿参数多模态大模型 Ovis-U1,实现视觉文本高效对齐技术突破

    牛透社 2025 年 6 月 29 日消息,阿里巴巴国际 AI 团队发布全新多模态大模型 Ovis – U1,该产品创新性融合多模态理解、图像生成与编辑功能,展现了强大的跨模态处理能力,为开发者、研究者和行业应用提供了全新的可能性,主要应用于教育智能化、电商视觉营销、医学影像分析及自动驾驶环境感知领域。

    据官方信息,模型基于 Python3.10、Torch2.4.0 和 Transformers4.51.3 等技术栈构建,训练过程中采用了 DeepSpeed0.15.4 优化,确保高效性和稳定性。此外,Ovis-U1 延续了 Ovis 系列的开源传统,采用 Apache2.0 许可协议,代码、模型权重和训练数据均已在 Hugging Face 和 GitHub 上公开,开发者可通过简单的环境配置快速复现和部署。

    自 Ovis-U1 发布以来,社交媒体上已有不少讨论。许多开发者对模型的多功能性和开源特性表示赞赏,认为其为中小型企业和个人开发者提供了低门槛的 AI 解决方案。

意见反馈
返回顶部