05月

31日

  • 通义实验室开源 VRAG-RL 多模态框架,视觉任务推理效率最高提升 57%

    牛透社 5 月 31 日消息,阿里巴巴旗下通义实验室自然语言智能团队发布并开源 VRAG-RL 框架,该框架是基于视觉感知驱动的多模态检索增强生成推理系统,通过强化学习驱动的智能体训练、视觉感知机制创新等突破,在医疗影像报告生成、金融图表分析等视觉密集型任务中实现检索速度提升 45%、准确率提升 28%、端到端处理效率提升 57%。

意见反馈
返回顶部