10月
10日
Gaga AI 发布全球首个影视级音画同步模型,或加速在广告营销、短视频、虚拟偶像领域应用
牛透社 10 月 10 日消息,Gaga AI 团队发布全球首个专注人物对话的影视级音画同步模型 Gaga AI,该模型突破传统图像动画与唇形同步技术,通过单张静态照片和文本提示可生成长达 60 秒的 1080P 电影级视频,支持情感演绎、双人交互及多语言输出。
Gaga AI 核心突破为「拟真演绎」能力,可智能解析场景、语气与情感生成微表情与肢体动作,在人物一致性与动态精度上超越 Sora、Gen-3 等开源模型。操作流程支持上传人像照片与文本指令自动生成视频,背景音乐与音效随情感节奏适配,大幅降低影视制作成本。团队计划推出 GAGA-1 升级版本强化角色一致性,或加速 AI 在广告营销、短视频生产及虚拟偶像领域的应用。