05月
24日
谷歌发布视频生成模型 Veo3,实现音画同步技术突破
牛透社 5 月 22 日消息,谷歌发布全新视频生成模型 Veo3,该产品具备音画同步生成功能,主要应用于影视级拟真视频创作。
Veo3 通过 V2A(视频转音频)算法架构实现视觉信息与音轨的语义关联,可依据文本提示生成精准唇形对白及物理声效。其技术突破包括:语音对位生成、复杂语义解析和环境音效模拟,订阅费用为 249.99 美元/月。谷歌依托 YouTube 平台数据资源完成模型训练,当前版本支持 8 秒视频生成。
您投送的稿件违反了牛透社的投稿协议,现已关闭您的投稿功能,如有异议请发邮件至tougao@jinse.com进行申诉。