← 返回博客
Image Generation APIAI CodingCodeGatewayGPT-Image-2

GPT-Image-2 API 接入教程:5 分钟跑通图像生成(Python 实战)

2026年5月12日
GPT-Image-2 API 接入教程:5 分钟跑通图像生成(Python 实战)

TL;DR

  • GPT-Image-2 是 OpenAI 在 2025 年发布的最新图像生成模型,支持 1K/2K/4K 分辨率、透明背景(PNG)和图像编辑。
  • 通过 CodeGateway 接入:base_url=https://api.codegateway.dev/v1,使用标准 OpenAI SDK,5 行代码跑通。
  • 最适合场景:需要精确文字渲染、透明背景贴图、产品图像编辑的商业场景。

GPT-Image-2 规格

我们实测过这套配置。GPT-Image-2 是 OpenAI 的第二代图像生成模型,相比 DALL-E 3 有显著改进:

规格

支持分辨率

1024×1024、1536×1024、1024×1536(1K);2048×2048(2K);4096×4096(4K)

支持格式

JPEG、PNG、WebP

透明背景

支持(PNG/WebP 输出时)

图像编辑(inpainting)

支持

批量生成

支持(单请求最多 10 张)

官方价格

按质量档位:$0.011/张(低质量 1K)到 $0.167/张(高质量 4K)

数据来源:OpenAI 官方 API 文档(2026-05)。以官方最新价格为准。

通过 CodeGateway 接入时,在官方价格基础上叠加阶梯倍率(1.2x–1.5x)。详见 阶梯倍率详解

5 分钟快速接入(Python)

前置条件

bash
pip install openai

基础图像生成

python
from openai import OpenAI

client = OpenAI(
api_key="your-codegateway-api-key", # CodeGateway API Key
base_url="https://api.codegateway.dev/v1"
)

response = client.images.generate(
model="gpt-image-2",
prompt="一只坐在书堆上的橙色猫咪,在温暖的台灯光下阅读,水彩插画风格",
n=1,
size="1024x1024"
)

# 获取图片 URL(60 分钟有效)
image_url = response.data[0].url
print(f"图片 URL: {image_url}")

生成并保存到本地

python
import base64
import os

response = client.images.generate(
model="gpt-image-2",
prompt="现代简约风格的 App 界面截图,蓝色主题,干净的白色背景",
n=1,
size="1024x1024",
quality="high", # "low" | "medium" | "high"
output_format="png" # "jpeg" | "png" | "webp"
)

# 保存 base64 编码的图片
img_data = base64.b64decode(response.data[0].b64_json)
with open("output.png", "wb") as f:
f.write(img_data)
print("图片已保存到 output.png")

透明背景生成(适合贴图/UI 素材)

python
response = client.images.generate(
model="gpt-image-2",
prompt="一个简洁的应用程序图标,代表代码网关,深蓝色背景,去除背景",
n=1,
size="1024x1024",
quality="high",
output_format="png", # 透明背景必须用 PNG 或 WebP
background="transparent" # 开启透明背景
)

参数详解

size(尺寸)

参数值

分辨率

适用场景

1024x1024

1K 正方形

社交媒体、头像、产品图

1536x1024

1K 横版

博客封面、网站 banner

1024x1536

1K 竖版

手机壁纸、海报

2048x2048

2K 正方形

高清打印、详细插画

4096x4096

4K 正方形

超高清输出(成本高)

quality(质量)

参数值

特点

适用场景

low

生成快,细节少

草图、快速预览

medium

默认档位,平衡质量和成本

一般商业用途

high

最高细节,生成时间约 20–30s

最终产品图、精细插画

实测成本(1024×1024,通过 CodeGateway)

quality 档位

官方价格/张

CodeGateway 价格(新用户 1.5x)

low

$0.011

$0.017

medium

$0.042

$0.063

high

$0.080

$0.120

每天生成 100 张中等质量图片的月费用约为 $190(CodeGateway,新用户倍率)。消耗增加后倍率降低,实际月费用会进一步下降。

图像编辑(Inpainting)

GPT-Image-2 支持基于文本描述的图像局部编辑:

python
import base64
from pathlib import Path

# 读取原始图片和遮罩
with open("original.png", "rb") as f:
original_b64 = base64.b64encode(f.read()).decode()

with open("mask.png", "rb") as f:
mask_b64 = base64.b64encode(f.read()).decode()

response = client.images.edit(
model="gpt-image-2",
image=original_b64,
mask=mask_b64, # 白色区域 = 要修改的部分
prompt="把背景改成日落海边场景",
n=1,
size="1024x1024"
)

遮罩规则:PNG 格式,与原图相同尺寸,白色区域表示要修改的部分,黑色区域保持不变。

批量生成(最多 10 张)

python
response = client.images.generate(
model="gpt-image-2",
prompt="科技感强的数据可视化图表,蓝色霓虹灯效果,深色背景",
n=4, # 同时生成 4 张变体
size="1024x1024",
quality="medium"
)

for i, image_data in enumerate(response.data):
url = image_data.url
print(f"变体 {i+1}: {url}")

与 Imagen 4 的选型建议

GPT-Image-2 和 Imagen 4 都是 2025–2026 年的主流图像生成模型,各有侧重:

对比维度

GPT-Image-2

Imagen 4

文字渲染

明显更强(生成含文字的图像)

一般

照片写实度

极高(Imagen 4 Ultra)

艺术风格多样性

丰富

较丰富

透明背景

支持

不支持

图像编辑

支持(inpainting)

不支持(Standard/Fast)

低成本选项

low 质量档 $0.011/张

Fast 版约同级

选型建议

  • 需要在图像里渲染精确文字(Logo、海报文案)→ GPT-Image-2
  • 需要超写实人物/场景照片 → Imagen 4 Ultra
  • 需要修改现有图片局部 → GPT-Image-2(inpainting)
  • 纯风格化插画 → 两者相差不大,按成本选

完整对比见 图像生成 API 横评:Imagen、Gemini 与 GPT-Image

FAQ

Q:生成的图片 URL 有效期多久?

A:A:OpenAI 返回的图片 URL 有效期为 60 分钟。如需长期保存,使用 response_format="b64_json" 获取 base64 编码后自行存储。

Q:GPT-Image-2 支持哪些语言的 Prompt?

A:A:支持多语言 Prompt,包括中文。实测中文 Prompt 效果接近英文,但描述风格和细节时英文往往更精确。

Q:生成速度大概多快?

A:A:low 质量约 5–10 秒,medium 约 10–20 秒,high 约 20–40 秒。网络状况和服务器负载会影响实际时间。

Q:能生成人脸吗?

A:A:可以,但 OpenAI 对人脸生成有内容政策限制,涉及真实人物面孔的生成会被拒绝。

Q:CodeGateway 的 API Key 和 OpenAI 官方 Key 能通用吗?

A:A:不能,CodeGateway 的 API Key 只能配合 base_url="https://api.codegateway.dev/v1" 使用。

相关资料

作者CodeGateway 团队最后审稿2026-05-16