TL;DR
- Imagen 4 是 Google 的旗舰图像生成模型,有 Fast(速度优先)、Standard(均衡)、Ultra(最高画质)三个档位。
- 通过 CodeGateway 接入:使用 OpenAI 兼容接口,
base_url=https://api.codegateway.dev/v1,标准 Python SDK 直接可用。 - Imagen 4 的优势::超写实照片、精细人物面孔、复杂场景;不支持透明背景和图像编辑。
Imagen 4 系列规格
档位 | 模型 ID | 特点 | 官方价格(约) |
|---|---|---|---|
Fast |
| 生成速度较快(3–5s),轻量图像 | $0.02/张 |
Standard |
| 速度与质量平衡(8–15s) | $0.04/张 |
Ultra |
| 最高画质,慢(20–45s),适合终态产品图 | $0.08/张 |
数据来源:Google Cloud Vertex AI 文档(2026-05)。以 Google 官方定价 为准。
通过 CodeGateway 接入,叠加阶梯倍率(1.2x–1.5x)。实际价格见 阶梯倍率详解。
实测画质评价
在 2026-05 内部测试中,我们用相同的 Prompt 分别测试了三个档位和 GPT-Image-2(medium 质量):
Prompt:"一位亚洲女性程序员在现代办公室工作,手握咖啡杯,屏幕上显示代码,电影感打光,超写实摄影风格"
模型 | 人脸自然度 | 细节丰富度 | 代码文字清晰度 | 光影质感 |
|---|---|---|---|---|
Imagen 4 Fast | 较自然 | 中 | 模糊 | 一般 |
Imagen 4 Standard | 自然 | 高 | 轻微模糊 | 良好 |
Imagen 4 Ultra | 极自然,皮肤质感真实 | 极高 | 模糊(非 GPT-I2 强项) | 电影级光影 |
GPT-Image-2 high | 较自然 | 高 | 清晰(文字渲染强项) | 良好 |
结论:Imagen 4 Ultra 在照片写实度和人脸自然度上明显优于 GPT-Image-2。但文字渲染(代码、Logo 文字)GPT-Image-2 仍有优势。
Python 快速接入
pip install openaifrom openai import OpenAI
# Imagen 4 通过 CodeGateway 的 OpenAI 兼容接口接入
client = OpenAI(
api_key="your-codegateway-api-key",
base_url="https://api.codegateway.dev/v1"
)
# Imagen 4 Standard(均衡选择)
response = client.images.generate(
model="imagen-4-0", # 或 "imagen-4-flash" / "imagen-4-ultra"
prompt="一座被晨雾笼罩的现代城市天际线,超写实摄影风格,黄金时刻光线,4K 细节",
n=1,
size="1024x1024"
)
image_url = response.data[0].url
print(f"图片 URL: {image_url}")保存到本地
import base64
response = client.images.generate(
model="imagen-4-ultra",
prompt="一位戴眼镜的年轻工程师,专注地看着三个显示器屏幕,办公室环境,真实摄影感",
n=1,
size="1024x1024",
output_format="jpeg"
)
img_bytes = base64.b64decode(response.data[0].b64_json)
with open("output.jpg", "wb") as f:
f.write(img_bytes)
print("图片已保存到 output.jpg")aspectRatio 参数详解
Imagen 4 支持丰富的宽高比设置,这是 GPT-Image-2 不支持的功能:
# 竖版(9:16)—— 适合手机壁纸、短视频封面
response = client.images.generate(
model="imagen-4-0",
prompt="赛博朋克风格城市街道,霓虹灯雨夜,竖版构图",
n=1,
aspect_ratio="9:16" # Imagen 4 特有参数
)
# 横版宽屏(16:9)—— 适合网站 banner、视频缩略图
response = client.images.generate(
model="imagen-4-0",
prompt="极简主义白色办公室,落地窗阳光,商业摄影风格",
n=1,
aspect_ratio="16:9"
)支持的 aspectRatio 值:1:1、4:3、3:4、16:9、9:16、3:2、2:3。
档位选型建议
场景 | 推荐档位 | 理由 |
|---|---|---|
快速预览/草图验证 |
| 约 3 秒出图,成本最低 |
一般商业配图 |
| 速度和质量均衡,适合日常使用 |
产品终态图/超写实人像 |
| 画质天花板,用在最终产出 |
需要包含文字的图像 | GPT-Image-2 | 文字渲染 GPT-Image-2 更强 |
需要透明背景 | GPT-Image-2 | Imagen 4 不支持透明背景 |
需要图像局部编辑 | GPT-Image-2 | Imagen 4 不支持 inpainting |
批量生成
# Imagen 4 单请求最多生成 4 张
response = client.images.generate(
model="imagen-4-0",
prompt="不同风格的 API 文档截图,专业感,科技蓝色调",
n=4,
size="1024x1024"
)
for i, img in enumerate(response.data):
print(f"变体 {i+1}: {img.url}")成本对比(100 张图/天,CodeGateway 新用户 1.5x)
配置 | 官方价格/张 | CodeGateway 价格/张 | 月费用 |
|---|---|---|---|
Imagen 4 Fast | $0.02 | $0.030 | ~$90 |
Imagen 4 Standard | $0.04 | $0.060 | ~$180 |
Imagen 4 Ultra | $0.08 | $0.120 | ~$360 |
GPT-Image-2 medium | $0.042 | $0.063 | ~$189 |
Imagen 4 Fast 是成本最低的选项,适合大批量低要求场景。Ultra 和 GPT-Image-2 high 的成本接近,但定位不同(写实 vs 文字渲染)。
FAQ
Q:Imagen 4 的 Prompt 用中文还是英文效果更好?
A:A:实测中,英文 Prompt 对 Imagen 4 的效果控制更精确,尤其是描述光影、色彩和摄影风格时。中文 Prompt 也能使用,但建议关键的风格词用英文。
Q:Imagen 4 生成的图片 URL 有效期?
A:A:与 OpenAI 类似,URL 有效期约 60 分钟。建议直接用 b64_json 格式接收图片并存储到自己的对象存储。
Q:Imagen 4 Ultra 比 Standard 慢多少?
A:A:Ultra 通常需要 20–45 秒,Standard 约 8–15 秒,Fast 约 3–5 秒。在需要实时显示结果的场景,Fast 或 Standard 更合适。
Q:Imagen 4 和 Gemini 的图像生成功能有什么区别?
A:A:Imagen 4 是独立的图像生成 API,专为高质量图像优化;Gemini 的图像生成功能集成在多模态模型中,适合"对话中生成图像"的交互场景。专门的图像生成任务优先用 Imagen 4。
Q:CodeGateway 是否同时支持 Imagen 4 和 GPT-Image-2?
A:A:是的,CodeGateway 同时支持两个模型,共用同一个 API Key 和 base_url,只需在请求里切换 model 参数即可。
相关资料
- 图像生成 API 横评:Imagen、Gemini 与 GPT-Image
- GPT-Image-2 API 接入教程
- CodeGateway 阶梯倍率详解
- CodeGateway 充值指南
- Google Imagen 官方文档
