09月
29日
谷歌视觉 AI 模型 Veo3 实现 1.8 万项多模态任务突破,跨模态对标 GPT-3
牛透社 2025 年 9 月 29 日消息,谷歌研究部门发布视频生成模型 Veo3,该模型在视觉 AI 领域实现重大突破,被业界誉为该领域的“GPT – 3 时刻”。
Veo3 在无需额外训练前提下,可自主完成物体定位、图像修复、迷宫导航等 18,384 项复杂视觉任务,展现多模态能力。其技术覆盖图像理解、物理认知、智能编辑及逻辑推理四大维度,标志着视觉 AI 进入通用化发展阶段,与自然语言处理领域的 GPT – 3 形成跨模态里程碑呼应。