← 返回博客
Image Generation APICodeGatewayImagen 4Google AI

Imagen 4 API 接入教程:Google 最新图像模型 Python 快速上手

2026年5月12日
Imagen 4 API 接入教程:Google 最新图像模型 Python 快速上手

TL;DR

  • Imagen 4 是 Google 的旗舰图像生成模型,有 Fast(速度优先)、Standard(均衡)、Ultra(最高画质)三个档位。
  • 通过 CodeGateway 接入:使用 OpenAI 兼容接口,base_url=https://api.codegateway.dev/v1,标准 Python SDK 直接可用。
  • Imagen 4 的优势::超写实照片、精细人物面孔、复杂场景;不支持透明背景和图像编辑。

Imagen 4 系列规格

档位

模型 ID

特点

官方价格(约)

Fast

imagen-4-flash

生成速度较快(3–5s),轻量图像

$0.02/张

Standard

imagen-4-0

速度与质量平衡(8–15s)

$0.04/张

Ultra

imagen-4-ultra

最高画质,慢(20–45s),适合终态产品图

$0.08/张

数据来源:Google Cloud Vertex AI 文档(2026-05)。以 Google 官方定价 为准。

通过 CodeGateway 接入,叠加阶梯倍率(1.2x–1.5x)。实际价格见 阶梯倍率详解

实测画质评价

在 2026-05 内部测试中,我们用相同的 Prompt 分别测试了三个档位和 GPT-Image-2(medium 质量):

Prompt:"一位亚洲女性程序员在现代办公室工作,手握咖啡杯,屏幕上显示代码,电影感打光,超写实摄影风格"

模型

人脸自然度

细节丰富度

代码文字清晰度

光影质感

Imagen 4 Fast

较自然

模糊

一般

Imagen 4 Standard

自然

轻微模糊

良好

Imagen 4 Ultra

极自然,皮肤质感真实

极高

模糊(非 GPT-I2 强项)

电影级光影

GPT-Image-2 high

较自然

清晰(文字渲染强项)

良好

结论:Imagen 4 Ultra 在照片写实度和人脸自然度上明显优于 GPT-Image-2。但文字渲染(代码、Logo 文字)GPT-Image-2 仍有优势。

Python 快速接入

bash
pip install openai
python
from openai import OpenAI

# Imagen 4 通过 CodeGateway 的 OpenAI 兼容接口接入
client = OpenAI(
api_key="your-codegateway-api-key",
base_url="https://api.codegateway.dev/v1"
)

# Imagen 4 Standard(均衡选择)
response = client.images.generate(
model="imagen-4-0", # 或 "imagen-4-flash" / "imagen-4-ultra"
prompt="一座被晨雾笼罩的现代城市天际线,超写实摄影风格,黄金时刻光线,4K 细节",
n=1,
size="1024x1024"
)

image_url = response.data[0].url
print(f"图片 URL: {image_url}")

保存到本地

python
import base64

response = client.images.generate(
model="imagen-4-ultra",
prompt="一位戴眼镜的年轻工程师,专注地看着三个显示器屏幕,办公室环境,真实摄影感",
n=1,
size="1024x1024",
output_format="jpeg"
)

img_bytes = base64.b64decode(response.data[0].b64_json)
with open("output.jpg", "wb") as f:
f.write(img_bytes)
print("图片已保存到 output.jpg")

aspectRatio 参数详解

Imagen 4 支持丰富的宽高比设置,这是 GPT-Image-2 不支持的功能:

python
# 竖版(9:16)—— 适合手机壁纸、短视频封面
response = client.images.generate(
model="imagen-4-0",
prompt="赛博朋克风格城市街道,霓虹灯雨夜,竖版构图",
n=1,
aspect_ratio="9:16" # Imagen 4 特有参数
)

# 横版宽屏(16:9)—— 适合网站 banner、视频缩略图
response = client.images.generate(
model="imagen-4-0",
prompt="极简主义白色办公室,落地窗阳光,商业摄影风格",
n=1,
aspect_ratio="16:9"
)

支持的 aspectRatio 值1:14:33:416:99:163:22:3

档位选型建议

场景

推荐档位

理由

快速预览/草图验证

imagen-4-flash

约 3 秒出图,成本最低

一般商业配图

imagen-4-0 (Standard)

速度和质量均衡,适合日常使用

产品终态图/超写实人像

imagen-4-ultra

画质天花板,用在最终产出

需要包含文字的图像

GPT-Image-2

文字渲染 GPT-Image-2 更强

需要透明背景

GPT-Image-2

Imagen 4 不支持透明背景

需要图像局部编辑

GPT-Image-2

Imagen 4 不支持 inpainting

批量生成

python
# Imagen 4 单请求最多生成 4 张
response = client.images.generate(
model="imagen-4-0",
prompt="不同风格的 API 文档截图,专业感,科技蓝色调",
n=4,
size="1024x1024"
)

for i, img in enumerate(response.data):
print(f"变体 {i+1}: {img.url}")

成本对比(100 张图/天,CodeGateway 新用户 1.5x)

配置

官方价格/张

CodeGateway 价格/张

月费用

Imagen 4 Fast

$0.02

$0.030

~$90

Imagen 4 Standard

$0.04

$0.060

~$180

Imagen 4 Ultra

$0.08

$0.120

~$360

GPT-Image-2 medium

$0.042

$0.063

~$189

Imagen 4 Fast 是成本最低的选项,适合大批量低要求场景。Ultra 和 GPT-Image-2 high 的成本接近,但定位不同(写实 vs 文字渲染)。

FAQ

Q:Imagen 4 的 Prompt 用中文还是英文效果更好?

A:A:实测中,英文 Prompt 对 Imagen 4 的效果控制更精确,尤其是描述光影、色彩和摄影风格时。中文 Prompt 也能使用,但建议关键的风格词用英文。

Q:Imagen 4 生成的图片 URL 有效期?

A:A:与 OpenAI 类似,URL 有效期约 60 分钟。建议直接用 b64_json 格式接收图片并存储到自己的对象存储。

Q:Imagen 4 Ultra 比 Standard 慢多少?

A:A:Ultra 通常需要 20–45 秒,Standard 约 8–15 秒,Fast 约 3–5 秒。在需要实时显示结果的场景,Fast 或 Standard 更合适。

Q:Imagen 4 和 Gemini 的图像生成功能有什么区别?

A:A:Imagen 4 是独立的图像生成 API,专为高质量图像优化;Gemini 的图像生成功能集成在多模态模型中,适合"对话中生成图像"的交互场景。专门的图像生成任务优先用 Imagen 4。

Q:CodeGateway 是否同时支持 Imagen 4 和 GPT-Image-2?

A:A:是的,CodeGateway 同时支持两个模型,共用同一个 API Key 和 base_url,只需在请求里切换 model 参数即可。

相关资料

参考资料

Anthropic 多模态文档 · OpenAI 图像生成参考

作者CodeGateway 团队最后审稿2026-05-16