doubao-seedream-5.0-lite 多图融合 API文档
将多张输入图片融合生成新图,适用于人物换装、场景合成、风格混合等场景。
doubao-seedream-5.0-lite 与其他版本的差异
- 联网搜索(
tools):仅 5.0-lite 支持,可根据提示词自主判断是否搜索互联网内容(如商品、天气等),提升图片时效性 - 输出格式(
output_format):仅 5.0-lite 支持指定输出为png或jpeg,4.5/4.0 固定输出 jpeg - 最高分辨率:5.0-lite 最高支持 3K(3072px),4.5/4.0 最高支持 4K;若需 4K 分辨率请选用 4.5/4.0 版本
- 参考图数量上限更多:5.0-lite 最多支持 14 张参考图,4.5 最多 10 张
- 参考图宽高比范围更宽:5.0-lite 支持 [1/16, 16],4.5 仅支持 [1/3, 3]
请求地址
https://www.dmxapi.cn/v1/responses模型名称
doubao-seedream-5.0-lite示例代码
python
import requests
import json
# ═══════════════════════════════════════════════════════════════
# 🔑 步骤1: 配置 API 连接信息
# ═══════════════════════════════════════════════════════════════
# 🌐 DMXAPI 服务端点地址
url = "https://www.dmxapi.cn/v1/responses"
# 🔐 DMXAPI 密钥 (请替换为您自己的密钥)
# 获取方式: 登录 DMXAPI 官网 -> 个人中心 -> API 密钥管理
api_key = "sk-*****************************************"
# ═══════════════════════════════════════════════════════════════
# 📋 步骤2: 配置请求头
# ═══════════════════════════════════════════════════════════════
headers = {
"Content-Type": "application/json", # 指定请求体为 JSON 格式
"Authorization": f"{api_key}", # token 认证方式
}
# ═══════════════════════════════════════════════════════════════
# 💬 步骤3: 配置请求参数
# ═══════════════════════════════════════════════════════════════
payload = {
"model": "doubao-seedream-5.0-lite",
# 【input】用于生成图像的提示词,支持中英文
# 建议不超过 300 汉字或 600 英文单词,字数过多信息容易分散,模型可能因此忽略细节
"input": "保持模特姿势和液态服装的流动形状不变。将服装材质从银色金属改为完全透明的清水(或玻璃),生成3张图片",
# 【size】指定生成图像的尺寸信息,支持以下两种方式,不可混用:
# 方式 1 | 指定分辨率关键词,在 prompt 中用自然语言描述宽高比/形状/用途,模型判断具体大小
# 可选值:`2K`、`3K`
# 方式 2 | 指定宽高像素值,默认 2048x2048,需同时满足:
# 总像素取值范围:[2560x1440=3686400, 3072x3072x1.1025=10404496]
# 宽高比取值范围:[1/16, 16]
# 说明:总像素是对单张图宽度和高度的像素乘积限制,而不是对宽度或高度的单独值进行限制
# 有效示例 `3750x1250`:总像素 3750x1250=4687500 符合 [3686400, 10404496],
# 宽高比 3750/1250=3 符合 [1/16, 16],故有效
# 无效示例 `1500x1500`:总像素 1500x1500=2250000 未达到 3686400 最低要求,
# 虽宽高比 1 符合范围,但未同时满足两项限制,故无效
# 推荐宽高像素值:
# 2K | 1:1=2048x2048 4:3=2304x1728 3:4=1728x2304 16:9=2848x1600
# | 9:16=1600x2848 3:2=2496x1664 2:3=1664x2496 21:9=3136x1344
# 3K | 1:1=3072x3072 4:3=3456x2592 3:4=2592x3456 16:9=4096x2304
# | 9:16=2304x4096 3:2=3744x2496 2:3=2496x3744 21:9=4704x2016
"size": "2K",
# 【image】输入的图片信息,支持 URL 或 Base64 编码
# doubao-seedream-5.0-lite/4.5/4.0 支持单图或多图输入,最多传入 14 张参考图
# 图片URL:请确保图片 URL 可被访问
# Base64编码:格式为 `data:image/<图片格式>;base64,<Base64编码>`
# 注意 <图片格式> 需小写,如 `data:image/png;base64,<base64_image>`
# 传入图片需满足以下条件:
# 图片格式:jpeg、png、webp、bmp、tiff、gif
# 宽高比(宽/高)范围:[1/16, 16]
# 宽高长度(px)> 14
# 大小:不超过 10MB
# 总像素:不超过 6000x6000=36000000 px
# (对单张图宽度和高度的像素乘积限制,而不是对宽度或高度的单独值进行限制)
"image": [
"https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_imagesToimage_1.png",
"https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_5_imagesToimage_2.png"
],
# 【sequential_image_generation】控制是否开启组图功能,默认 disabled,仅 doubao-seedream-5.0-lite/4.5/4.0 支持
# auto:自动判断模式,模型会根据用户提供的提示词自主判断是否返回组图以及组图包含的图片数量
# disabled:关闭组图功能,模型只会生成一张图
"sequential_image_generation": "auto",
"sequential_image_generation_options": {
# 【max_images】指定本次请求最多可生成的图片数量,取值范围 [1, 15],默认 15
# 实际可生成的图片数量,除受到 max_images 影响外,还受到输入的参考图数量影响
# 输入的参考图数量 + 最终生成的图片数量 ≤ 15 张
"max_images": 15
},
# 【tools】配置模型调用的工具,仅 doubao-seedream-5.0-lite 支持
"tools": [{
# 【type】指定使用的工具类型
# web_search:联网搜索功能,开启后模型会根据用户的提示词自主判断是否搜索互联网内容
# (如商品、天气等),提升生成图片的时效性,但也会增加一定的时延
# 实际搜索次数可通过字段 usage.tool_usage.web_search 查询,如果为 0 表示未搜索
"type": "web_search"
}],
# 【stream】控制是否开启流式输出模式,默认 false,仅 doubao-seedream-5.0-lite/4.5/4.0 支持
# false:非流式输出模式,等待所有图片全部生成结束后再一次性返回所有信息
# true:流式输出模式,即时返回每张图片输出的结果,在生成单图和组图的场景下均生效
"stream": False,
# 【output_format】指定生成图像的文件格式,默认 jpeg,仅 doubao-seedream-5.0-lite 支持自定义设置
# 可选值:png、jpeg
"output_format": "png",
# 【response_format】指定生成图像的返回格式,默认 url
# url:返回图片下载链接,链接在图片生成后 24 小时内有效,请及时下载图片
# b64_json:以 Base64 编码字符串的 JSON 格式返回图像数据
"response_format": "url",
# 【watermark】是否在生成图片中添加水印,默认 true
# false:不添加水印
# true:在图片右下角添加"AI生成"字样的水印标识
"watermark": False,
"optimize_prompt_options": {
# 【mode】设置提示词优化功能使用的模式,默认 standard
# standard:标准模式,生成内容的质量更高,耗时较长
# fast:快速模式,生成内容的耗时更短,质量一般;doubao-seedream-5.0-lite/4.5 当前不支持
"mode": "standard"
}
}
# ═══════════════════════════════════════════════════════════════
# 📤 步骤4: 发送请求并输出结果
# ═══════════════════════════════════════════════════════════════
# 发送 POST 请求到 API 服务器
response = requests.post(url, headers=headers, json=payload)
# 格式化输出 JSON 响应
# - indent=2: 缩进 2 空格,便于阅读
# - ensure_ascii=False: 正确显示中文字符
print(json.dumps(response.json(), indent=2, ensure_ascii=False))python
import requests
import json
# ═══════════════════════════════════════════════════════════════
# 🔑 步骤1: 配置 API 连接信息
# ═══════════════════════════════════════════════════════════════
# 🌐 DMXAPI 服务端点地址
url = "https://www.dmxapi.cn/v1/responses"
# 🔐 DMXAPI 密钥 (请替换为您自己的密钥)
# 获取方式: 登录 DMXAPI 官网 -> 个人中心 -> API 密钥管理
api_key = "sk-*****************************************"
# ═══════════════════════════════════════════════════════════════
# 📋 步骤2: 配置请求头
# ═══════════════════════════════════════════════════════════════
headers = {
"Content-Type": "application/json", # 指定请求体为 JSON 格式
"Authorization": f"{api_key}", # token 认证方式
}
# ═══════════════════════════════════════════════════════════════
# 💬 步骤3: 配置请求参数
# ═══════════════════════════════════════════════════════════════
payload = {
"model": "doubao-seedream-5.0-lite",
# 【input】用于生成图像的提示词,支持中英文
# 建议不超过 300 汉字或 600 英文单词,字数过多信息容易分散,模型可能因此忽略细节
"input": "保持模特姿势和液态服装的流动形状不变。将服装材质从银色金属改为完全透明的清水(或玻璃),生成3张图片",
# 【size】指定生成图像的尺寸信息,支持以下两种方式,不可混用:
# 方式 1 | 指定分辨率关键词,在 prompt 中用自然语言描述宽高比/形状/用途,模型判断具体大小
# 可选值:`2K`、`3K`
# 方式 2 | 指定宽高像素值,默认 2048x2048,需同时满足:
# 总像素取值范围:[2560x1440=3686400, 3072x3072x1.1025=10404496]
# 宽高比取值范围:[1/16, 16]
# 说明:总像素是对单张图宽度和高度的像素乘积限制,而不是对宽度或高度的单独值进行限制
# 有效示例 `3750x1250`:总像素 3750x1250=4687500 符合 [3686400, 10404496],
# 宽高比 3750/1250=3 符合 [1/16, 16],故有效
# 无效示例 `1500x1500`:总像素 1500x1500=2250000 未达到 3686400 最低要求,
# 虽宽高比 1 符合范围,但未同时满足两项限制,故无效
# 推荐宽高像素值:
# 2K | 1:1=2048x2048 4:3=2304x1728 3:4=1728x2304 16:9=2848x1600
# | 9:16=1600x2848 3:2=2496x1664 2:3=1664x2496 21:9=3136x1344
# 3K | 1:1=3072x3072 4:3=3456x2592 3:4=2592x3456 16:9=4096x2304
# | 9:16=2304x4096 3:2=3744x2496 2:3=2496x3744 21:9=4704x2016
"size": "2K",
# 【image】输入的图片信息,支持 URL 或 Base64 编码
# doubao-seedream-5.0-lite/4.5/4.0 支持单图或多图输入,最多传入 14 张参考图
# 图片URL:请确保图片 URL 可被访问
# Base64编码:格式为 `data:image/<图片格式>;base64,<Base64编码>`
# 注意 <图片格式> 需小写,如 `data:image/png;base64,<base64_image>`
# 传入图片需满足以下条件:
# 图片格式:jpeg、png、webp、bmp、tiff、gif
# 宽高比(宽/高)范围:[1/16, 16]
# 宽高长度(px)> 14
# 大小:不超过 10MB
# 总像素:不超过 6000x6000=36000000 px
# (对单张图宽度和高度的像素乘积限制,而不是对宽度或高度的单独值进行限制)
"image": [
"https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_imagesToimage_1.png",
"https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_5_imagesToimage_2.png"
],
# 【sequential_image_generation】控制是否开启组图功能,默认 disabled,仅 doubao-seedream-5.0-lite/4.5/4.0 支持
# auto:自动判断模式,模型会根据用户提供的提示词自主判断是否返回组图以及组图包含的图片数量
# disabled:关闭组图功能,模型只会生成一张图
"sequential_image_generation": "auto",
"sequential_image_generation_options": {
# 【max_images】指定本次请求最多可生成的图片数量,取值范围 [1, 15],默认 15
# 实际可生成的图片数量,除受到 max_images 影响外,还受到输入的参考图数量影响
# 输入的参考图数量 + 最终生成的图片数量 ≤ 15 张
"max_images": 15
},
# 【tools】配置模型调用的工具,仅 doubao-seedream-5.0-lite 支持
"tools": [{
# 【type】指定使用的工具类型
# web_search:联网搜索功能,开启后模型会根据用户的提示词自主判断是否搜索互联网内容
# (如商品、天气等),提升生成图片的时效性,但也会增加一定的时延
# 实际搜索次数可通过字段 usage.tool_usage.web_search 查询,如果为 0 表示未搜索
"type": "web_search"
}],
# 【stream】控制是否开启流式输出模式,默认 false,仅 doubao-seedream-5.0-lite/4.5/4.0 支持
# false:非流式输出模式,等待所有图片全部生成结束后再一次性返回所有信息
# true:流式输出模式,即时返回每张图片输出的结果,在生成单图和组图的场景下均生效
"stream": True,
# 【output_format】指定生成图像的文件格式,默认 jpeg,仅 doubao-seedream-5.0-lite 支持自定义设置
# 可选值:png、jpeg
"output_format": "png",
# 【response_format】指定生成图像的返回格式,默认 url
# url:返回图片下载链接,链接在图片生成后 24 小时内有效,请及时下载图片
# b64_json:以 Base64 编码字符串的 JSON 格式返回图像数据
"response_format": "url",
# 【watermark】是否在生成图片中添加水印,默认 true
# false:不添加水印
# true:在图片右下角添加"AI生成"字样的水印标识
"watermark": False,
"optimize_prompt_options": {
# 【mode】设置提示词优化功能使用的模式,默认 standard
# standard:标准模式,生成内容的质量更高,耗时较长
# fast:快速模式,生成内容的耗时更短,质量一般;doubao-seedream-5.0-lite/4.5 当前不支持
"mode": "standard"
}
}
# ═══════════════════════════════════════════════════════════════
# 📤 步骤4: 发送请求并输出结果
# ═══════════════════════════════════════════════════════════════
# 发送 POST 请求到 API 服务器(stream=True 开启流式传输)
response = requests.post(url, headers=headers, json=payload, stream=True)
print(response.status_code)
# 流式读取响应,只保留关键信息
current_event = None
for line in response.iter_lines():
if line:
line = line.decode('utf-8')
# 记录事件类型
if line.startswith('event: '):
current_event = line[7:]
continue
# 处理数据行
if line.startswith('data: '):
data_str = line[6:]
else:
data_str = line
# 只输出图片生成事件和完成事件
if current_event == 'response.output_text.delta':
print(f"event: {current_event}")
print(f"data: {data_str}")
elif current_event == 'response.completed':
try:
data = json.loads(data_str)
usage = data.get('response', {}).get('usage', {})
print(f"event: {current_event}")
print(f"data: {json.dumps({'status': 'completed', 'usage': usage}, ensure_ascii=False)}")
except:
print(data_str)
elif data_str == '[DONE]':
print('[DONE]')返回示例
json
{
"created_at": 1772439766,
"id": "resp_bd608d40-d985-4b81-90ae-",
"object": "response",
"output": [
{
"image_url": {
"url": "https://ark-acg-cn-beijing.tos-cn-beijing.volces.com/..."
},
"type": "image_url"
},
{
"image_url": {
"url": "https://ark-acg-cn-beijing.tos-cn-beijing.volces.com/..."
},
"type": "image_url"
},
{
"image_url": {
"url": "https://ark-acg-cn-beijing.tos-cn-beijing.volces.com/..."
},
"type": "image_url"
}
],
"status": "completed",
"usage": {
"input_tokens": 0,
"input_tokens_details": {
"cached_tokens": 0
},
"output_tokens": 6600,
"output_tokens_details": {
"reasoning_tokens": 0
},
"total_tokens": 6600
}
}text
200
event: response.output_text.delta
data: {"content_index":0,"delta":"","item_id":"msg_8a5206c5aeca4053ad173f952a3ea648","logprobs":[],"output_index":0,"sequence_number":4,"type":"response.output_text.delta"}
event: response.output_text.delta
data: {"content_index":0,"delta":"","item_id":"msg_8a5206c5aeca4053ad173f952a3ea648","logprobs":[],"output_index":0,"sequence_number":5,"type":"response.output_text.delta"}
event: response.output_text.delta
data: {"content_index":0,"delta":"","item_id":"msg_8a5206c5aeca4053ad173f952a3ea648","logprobs":[],"output_index":0,"sequence_number":6,"type":"response.output_text.delta"}
event: response.completed
data: {"status": "completed", "usage": {"total_tokens": 6600, "input_tokens": 0, "input_tokens_details": {"cached_tokens": 0}, "output_tokens": 6600, "output_tokens_details": {"reasoning_tokens": 0}}}