谷歌发布 Imagen 4 文本转图像模型，文本渲染性能提升 28% 并推出三版本差异化架构

08月

26日

谷歌发布 Imagen 4 文本转图像模型，文本渲染性能提升 28% 并推出三版本差异化架构

牛透社 2025 年 8 月 26 日消息，谷歌公司发布全新文本转图像生成模型 Imagen 4，该产品通过升级注意力机制算法和多模态表征学习框架，实现文本渲染性能参数较前代提升 28%，包含标准版、商业加速版和专业版三大差异化版本。

标准版 Imagen 4 在 Text-to-Image Benchmarks 评测中文本字形渲染准确率达 98.3%；Imagen 4Fast 版本推理时间缩短至 0.8 秒/帧，单次生成成本控制在 0.02 美元；Imagen 4Ultra 版本在 512×512 分辨率条件下 FID 得分达 3.1，具备像素级重构能力。该模型可通过 Gemini API 和 Google AI Studio 平台访问，预计推动数字艺术创作（生成误差率 2.1%）和程序化广告设计（元素组合成功率 93%）领域技术变革。根据预测，2027 年全球文本转图像市场规模将达 147 亿美元。

新闻排行

热门新闻