TL;DR
- GPT-Image-2 是 OpenAI 在 2025 年发布的最新图像生成模型,支持 1K/2K/4K 分辨率、透明背景(PNG)和图像编辑。
- 通过 CodeGateway 接入:
base_url=https://api.codegateway.dev/v1,使用标准 OpenAI SDK,5 行代码跑通。 - 最适合场景:需要精确文字渲染、透明背景贴图、产品图像编辑的商业场景。
GPT-Image-2 规格
我们实测过这套配置。GPT-Image-2 是 OpenAI 的第二代图像生成模型,相比 DALL-E 3 有显著改进:
规格 | 值 |
|---|---|
支持分辨率 | 1024×1024、1536×1024、1024×1536(1K);2048×2048(2K);4096×4096(4K) |
支持格式 | JPEG、PNG、WebP |
透明背景 | 支持(PNG/WebP 输出时) |
图像编辑(inpainting) | 支持 |
批量生成 | 支持(单请求最多 10 张) |
官方价格 | 按质量档位:$0.011/张(低质量 1K)到 $0.167/张(高质量 4K) |
数据来源:OpenAI 官方 API 文档(2026-05)。以官方最新价格为准。
通过 CodeGateway 接入时,在官方价格基础上叠加阶梯倍率(1.2x–1.5x)。详见 阶梯倍率详解。
5 分钟快速接入(Python)
前置条件
pip install openai基础图像生成
from openai import OpenAI
client = OpenAI(
api_key="your-codegateway-api-key", # CodeGateway API Key
base_url="https://api.codegateway.dev/v1"
)
response = client.images.generate(
model="gpt-image-2",
prompt="一只坐在书堆上的橙色猫咪,在温暖的台灯光下阅读,水彩插画风格",
n=1,
size="1024x1024"
)
# 获取图片 URL(60 分钟有效)
image_url = response.data[0].url
print(f"图片 URL: {image_url}")生成并保存到本地
import base64
import os
response = client.images.generate(
model="gpt-image-2",
prompt="现代简约风格的 App 界面截图,蓝色主题,干净的白色背景",
n=1,
size="1024x1024",
quality="high", # "low" | "medium" | "high"
output_format="png" # "jpeg" | "png" | "webp"
)
# 保存 base64 编码的图片
img_data = base64.b64decode(response.data[0].b64_json)
with open("output.png", "wb") as f:
f.write(img_data)
print("图片已保存到 output.png")透明背景生成(适合贴图/UI 素材)
response = client.images.generate(
model="gpt-image-2",
prompt="一个简洁的应用程序图标,代表代码网关,深蓝色背景,去除背景",
n=1,
size="1024x1024",
quality="high",
output_format="png", # 透明背景必须用 PNG 或 WebP
background="transparent" # 开启透明背景
)参数详解
size(尺寸)
参数值 | 分辨率 | 适用场景 |
|---|---|---|
| 1K 正方形 | 社交媒体、头像、产品图 |
| 1K 横版 | 博客封面、网站 banner |
| 1K 竖版 | 手机壁纸、海报 |
| 2K 正方形 | 高清打印、详细插画 |
| 4K 正方形 | 超高清输出(成本高) |
quality(质量)
参数值 | 特点 | 适用场景 |
|---|---|---|
| 生成快,细节少 | 草图、快速预览 |
| 默认档位,平衡质量和成本 | 一般商业用途 |
| 最高细节,生成时间约 20–30s | 最终产品图、精细插画 |
实测成本(1024×1024,通过 CodeGateway)
quality 档位 | 官方价格/张 | CodeGateway 价格(新用户 1.5x) |
|---|---|---|
low | $0.011 | $0.017 |
medium | $0.042 | $0.063 |
high | $0.080 | $0.120 |
每天生成 100 张中等质量图片的月费用约为 $190(CodeGateway,新用户倍率)。消耗增加后倍率降低,实际月费用会进一步下降。
图像编辑(Inpainting)
GPT-Image-2 支持基于文本描述的图像局部编辑:
import base64
from pathlib import Path
# 读取原始图片和遮罩
with open("original.png", "rb") as f:
original_b64 = base64.b64encode(f.read()).decode()
with open("mask.png", "rb") as f:
mask_b64 = base64.b64encode(f.read()).decode()
response = client.images.edit(
model="gpt-image-2",
image=original_b64,
mask=mask_b64, # 白色区域 = 要修改的部分
prompt="把背景改成日落海边场景",
n=1,
size="1024x1024"
)遮罩规则:PNG 格式,与原图相同尺寸,白色区域表示要修改的部分,黑色区域保持不变。
批量生成(最多 10 张)
response = client.images.generate(
model="gpt-image-2",
prompt="科技感强的数据可视化图表,蓝色霓虹灯效果,深色背景",
n=4, # 同时生成 4 张变体
size="1024x1024",
quality="medium"
)
for i, image_data in enumerate(response.data):
url = image_data.url
print(f"变体 {i+1}: {url}")与 Imagen 4 的选型建议
GPT-Image-2 和 Imagen 4 都是 2025–2026 年的主流图像生成模型,各有侧重:
对比维度 | GPT-Image-2 | Imagen 4 |
|---|---|---|
文字渲染 | 明显更强(生成含文字的图像) | 一般 |
照片写实度 | 高 | 极高(Imagen 4 Ultra) |
艺术风格多样性 | 丰富 | 较丰富 |
透明背景 | 支持 | 不支持 |
图像编辑 | 支持(inpainting) | 不支持(Standard/Fast) |
低成本选项 | low 质量档 $0.011/张 | Fast 版约同级 |
选型建议:
- 需要在图像里渲染精确文字(Logo、海报文案)→ GPT-Image-2
- 需要超写实人物/场景照片 → Imagen 4 Ultra
- 需要修改现有图片局部 → GPT-Image-2(inpainting)
- 纯风格化插画 → 两者相差不大,按成本选
完整对比见 图像生成 API 横评:Imagen、Gemini 与 GPT-Image。
FAQ
Q:生成的图片 URL 有效期多久?
A:A:OpenAI 返回的图片 URL 有效期为 60 分钟。如需长期保存,使用 response_format="b64_json" 获取 base64 编码后自行存储。
Q:GPT-Image-2 支持哪些语言的 Prompt?
A:A:支持多语言 Prompt,包括中文。实测中文 Prompt 效果接近英文,但描述风格和细节时英文往往更精确。
Q:生成速度大概多快?
A:A:low 质量约 5–10 秒,medium 约 10–20 秒,high 约 20–40 秒。网络状况和服务器负载会影响实际时间。
Q:能生成人脸吗?
A:A:可以,但 OpenAI 对人脸生成有内容政策限制,涉及真实人物面孔的生成会被拒绝。
Q:CodeGateway 的 API Key 和 OpenAI 官方 Key 能通用吗?
A:A:不能,CodeGateway 的 API Key 只能配合 base_url="https://api.codegateway.dev/v1" 使用。
