05月
16日
腾讯混元发布毫秒级实时图像生成模型 Hunyuan Image 2.0
牛透社 2025 年 5 月 16 日消息,腾讯混元发布业界首个毫秒级实时图像生成大模型 Hunyuan Image 2.0,该模型参数规模较前代提升数十倍,支持文本、语音、草图多模态交互并同步生成写实质感图像。
Hunyuan Image 2.0 基于单双流 DiT 架构实现效率突破,首次引入多模态大语言模型(MLLM)作为文本编码器,结合结构化描述系统精准解析语义与视觉意图。腾讯混元为腾讯旗下聚焦生成式 AI 技术的研发团队,其图像生成技术持续领跑行业。