08月
26日
谷歌发布 Imagen 4 文本转图像模型,文本渲染性能提升 28% 并推出三版本差异化架构
牛透社 2025 年 8 月 26 日消息,谷歌公司发布全新文本转图像生成模型 Imagen 4,该产品通过升级注意力机制算法和多模态表征学习框架,实现文本渲染性能参数较前代提升 28%,包含标准版、商业加速版和专业版三大差异化版本。
标准版 Imagen 4 在 Text-to-Image Benchmarks 评测中文本字形渲染准确率达 98.3%;Imagen 4Fast 版本推理时间缩短至 0.8 秒/帧,单次生成成本控制在 0.02 美元;Imagen 4Ultra 版本在 512×512 分辨率条件下 FID 得分达 3.1,具备像素级重构能力。该模型可通过 Gemini API 和 Google AI Studio 平台访问,预计推动数字艺术创作(生成误差率 2.1%)和程序化广告设计(元素组合成功率 93%)领域技术变革。根据预测,2027 年全球文本转图像市场规模将达 147 亿美元。