seedream
Seedream 图片生成
使用火山引擎 Seedream 模型生成高质量 AI 图片,支持文本生成图片(T2I)、图片编辑(I2I)、多图融合、组图生成、联网搜索等多种创作模式。
✨ Node.js 版本:此脚本使用 Node.js 实现,无需 Python 环境。通过入口脚本自动检测 Node.js 运行时(优先使用系统 node,回退到 LobsterAI 内置运行时),Windows 和 Mac 用户都可以开箱即用。
配置
- Base URL:
https://ark.cn-beijing.volces.com/api/v3 - API Key: 从环境变量
ARK_API_KEY读取 - 认证方式:
Authorization: Bearer {API_KEY} - SDK: 兼容火山方舟 Python SDK
快速开始
第一步:设置 API Key
# macOS / Linux - 当前终端临时生效(立即使用)
export ARK_API_KEY="你的API密钥"
# Windows PowerShell - 当前会话临时生效
$env:ARK_API_KEY="你的API密钥"
# 验证设置成功(macOS/Linux)
echo $ARK_API_KEY
# 验证设置成功(Windows)
echo $env:ARK_API_KEY
第二步:生成你的第一张图片
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "一只可爱的橘色小猫"
如何配置 API Key
方式一:通过环境变量配置(推荐)
在终端中设置环境变量:
# macOS/Linux
export ARK_API_KEY="你的API密钥"
# 或者添加到 ~/.zshrc 或 ~/.bashrc 以永久生效
echo 'export ARK_API_KEY="你的API密钥"' >> ~/.zshrc
source ~/.zshrc
# Windows PowerShell
$env:ARK_API_KEY="你的API密钥"
# 或者设置系统环境变量以永久生效
[System.Environment]::SetEnvironmentVariable('ARK_API_KEY', '你的API密钥', 'User')
方式二:通过 LobsterAI 启动时注入
LobsterAI 会自动读取系统环境变量,确保在启动 LobsterAI 前已设置 ARK_API_KEY。
如何获取 API Key:
- 访问火山方舟控制台:https://console.volcengine.com/ark/region:ark+cn-beijing/apikey
- 创建新的 API Key
- 复制密钥并设置为环境变量
前置检查
无需安装任何依赖! 该脚本已兼容 Node.js 内置模块。
LobsterAI 已包含 Node.js 运行时,所有必要的依赖已被自动打包。Windows 和 Mac 用户无需额外配置。
工作流程
Seedream 图片生成采用同步模式,流程简单高效:
- 提交请求 - 调用 API 提交图片生成请求
- 等待生成 - API 直接处理并生成图片(通常 30-60 秒)
- 下载图片 - 从返回的 URL 下载生成的图片文件
相比异步模式,同步模式更简单直接,无需轮询任务状态。
配额和限制
免费额度
所有 Seedream 模型提供免费额度,具体请参见火山方舟控制台。
限流限制
- IPM(每分钟图片数): 500 张/分钟(Seedream 4.5, 4.0)
- 不同模型的限流不同,请参见官方文档
图片保存时间
⚠️ 重要提醒:
- 任务数据(包括图片URL)仅保留 24 小时
- 超时后会被自动清除
- 务必及时下载保存生成的图片
使用示例
路径说明:下面的示例使用 $SKILLS_ROOT 环境变量来引用脚本路径。LobsterAI 会自动设置这个变量,指向实际的 SKILLs 目录位置,因此无需手动修改路径。
1. 文本生成图片(T2I)
根据文字描述生成图片,适合创意激发和概念设计。
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "充满活力的特写编辑肖像,模特眼神犀利,头戴雕塑感帽子,色彩拼接丰富,景深较浅,Vogue杂志封面美学风格" \
--output portrait.png
示例提示词:
- "写实风格,晴朗的蓝天之下,一大片白色的雏菊花田,镜头逐渐拉近,最终定格在一朵雏菊花的特写上"
- "卡通风格,一只橘色小猫坐在窗台上,阳光洒在身上,温暖治愈的氛围"
- "赛博朋克风格,未来城市夜景,霓虹灯闪烁,高楼林立"
2. 图片编辑(I2I)- 单图输入
基于已有图片,结合文字指令进行图像编辑。支持本地图片和网络URL。
# 使用本地图片
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "保持模特姿势不变,将服装材质改为透明玻璃质感" \
--image "/Users/yourname/Pictures/model.jpg" \
--output edited_model.png
# 使用网络图片
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "将背景改为海边日落场景" \
--image "https://example.com/photo.jpg" \
--output beach_sunset.png
支持的图片来源:
- ✅ 本地文件:
/path/to/image.jpg - ✅ 网络URL:
https://example.com/image.jpg - ✅ file://协议:
file:///path/to/image.jpg
支持的图片格式:
- jpg, jpeg, png, gif, webp, bmp, tiff, heic
3. 多图融合(多图输入单图输出)
融合多张参考图的特征生成新图像。支持混合使用本地图片和网络图片。
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "将图1的服装换为图2的服装" \
--image "/Users/yourname/Pictures/person.jpg" \
--image "https://example.com/clothes.jpg" \
--output fusion_result.png
常见使用场景:
- 服装试穿:人物图 + 服装图 → 穿搭效果图
- 风格迁移:照片 + 风格参考图 → 风格化作品
- 场景融合:人物 + 背景 → 合成场景
4. 组图生成(多图输出)
生成一组内容关联的图片,适合漫画分镜、品牌视觉等。
文生组图
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "生成一组共4张连贯插画,核心为同一庭院一角的四季变迁,以统一风格展现四季独特色彩、元素与氛围" \
--sequential \
--max-images 4 \
--output seasons.png
输出文件会自动编号:seasons_1.png, seasons_2.png, seasons_3.png, seasons_4.png
单图生组图
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "参考这个LOGO,做一套户外运动品牌视觉设计,品牌名称为'GREEN',包括包装袋、帽子、卡片、挂绳等" \
--image "/Users/yourname/Pictures/logo.png" \
--sequential \
--max-images 4 \
--output brand_design.png
5. 联网搜索增强生成(Seedream 5.0 lite)
启用实时网络搜索,融合最新网络信息。
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "搜索下近期热门的白鸭子单手拿着风车形象,以极具冲击力的视角,设计成巨型装置" \
--search \
--output search_result.png
注意:
- 联网搜索功能仅限 Seedream 5.0 lite 模型
- 使用
--search参数会自动切换到 5.0 lite 模型 - 适合需要融合实时信息的创作场景
参数说明
必需参数
| 参数 | 说明 | 示例 |
|---|---|---|
--prompt |
图片描述提示词(必需) | "一只可爱的小猫" |
可选参数
| 参数 | 说明 | 默认值 | 可选值 |
|---|---|---|---|
--image |
参考图片路径或URL(可多次使用) | 无 | 本地文件路径或URL |
--model |
模型ID | doubao-seedream-4-5-251128 |
见模型列表 |
--size |
图片尺寸 | 2K |
1K, 2K, 4K |
--no-watermark |
不添加水印 | 否 | 标志参数 |
--sequential |
生成组图 | 否 | 标志参数 |
--max-images |
组图数量 | 4 | 1-8 |
--search |
启用联网搜索 | 否 | 标志参数 |
--output |
输出文件路径 | generated_image.png |
文件路径 |
--poll-interval |
状态查询间隔(秒) | 5 | 1-10 |
--timeout |
最大等待时间(秒) | 300 | 60-600 |
模型选择
选择合适的模型以平衡质量、速度和成本:
Seedream 4.5(推荐)
- 模型ID:
doubao-seedream-4-5-251128 - 特点: 最新版本,综合质量最佳
- 支持: 文生图、图生图、多图融合、组图生成
- 输出: 1K-4K分辨率可选
- 限流: IPM 500
Seedream 4.0
- 模型ID:
doubao-seedream-4-0-250828 - 特点: 成熟稳定版本
- 支持: 文生图、图生图、多图融合、组图生成
- 输出: 1K-4K分辨率可选
- 限流: IPM 500
Seedream 5.0 lite(联网搜索专用)
- 模型ID:
doubao-seedream-5-0-260128 - 特点: 支持联网搜索,融合实时网络信息
- 使用: 通过
--search参数自动启用 - 注意: 2026年2月24日18点后正式开放 API
推荐使用场景:
- 追求最高质量 → 4.5
- 稳定生产环境 → 4.0
- 需要实时信息 → 5.0 lite(使用
--search)
高级选项
自定义图片尺寸
根据使用场景选择合适的尺寸:
# 小尺寸(快速预览)
--size "1K"
# 标准尺寸(推荐)
--size "2K"
# 高清晰度
--size "4K"
注意:
- 尺寸越大,生成时间越长
- 4K 图片可能需要 40-60 秒
去除水印
生成无水印图片(用于商业用途):
--no-watermark
轮询和超时控制
调整轮询策略以适应不同场景:
# 快速查询(适合小图)
--poll-interval 3 --timeout 180
# 标准配置
--poll-interval 5 --timeout 300
# 耐心等待(适合4K或组图)
--poll-interval 10 --timeout 600
状态说明
生成过程中可能出现的任务状态:
| 状态 | 说明 | 操作 |
|---|---|---|
queued |
任务排队中 | 继续等待 |
running |
正在生成图片 | 继续等待 |
succeeded |
生成成功 | 下载图片 |
failed |
生成失败 | 查看错误信息 |
错误处理
常见错误及解决方案
错误:未设置环境变量 ARK_API_KEY
- 原因:未配置 API Key
- 解决:按照"如何配置 API Key"部分的说明进行配置
错误:任务创建失败 (HTTP 401)
- 原因:API Key 无效或已过期
- 解决:检查 API Key 是否正确,或在控制台重新生成
错误:任务创建失败 (HTTP 400)
- 原因:参数错误(如 size 不支持、prompt 为空等)
- 解决:检查参数是否符合要求
错误:任务超时
- 原因:生成时间过长或 API 繁忙
- 解决:增加
--timeout值,或稍后重试
错误:任务失败
- 原因:内容违规、提示词不清晰、图片格式错误等
- 解决:检查提示词内容,确保图片URL可访问
错误:限流 (HTTP 429)
- 原因:超过 IPM 限制
- 解决:等待1分钟后重试,或升级配额
错误:图片文件不存在
- 原因:本地图片路径错误
- 解决:检查文件路径是否正确,使用绝对路径
输出格式
生成的图片具有以下特征:
- 格式: PNG, JPEG(根据output参数自动识别)
- 分辨率: 1K / 2K / 4K(根据 size 参数)
- 文件大小: 约 0.5-10 MB(取决于尺寸和复杂度)
- 命名规则:
- 单图:指定的文件名
- 组图:
文件名_1.png,文件名_2.png, ...
提示词最佳实践
优秀提示词的特点
- 清晰的主体描述 - 说明画面的主要内容
- 具体的风格指定 - 写实、卡通、赛博朋克等
- 细节补充 - 色彩、光线、氛围等
- 构图说明 - 特写、全景、俯视等视角
提示词模板
[风格],[主体描述],[细节补充],[构图/氛围]
示例:
写实风格,一只橘色小猫坐在木制窗台上,阳光从左侧洒进来,温暖治愈的氛围,特写构图
提示词注意事项
- ✅ 具体描述:"小猫在追逐蝴蝶" 而非 "小猫玩耍"
- ✅ 风格说明:"赛博朋克风格" 而非 "好看的"
- ✅ 细节丰富:"橘色长毛小猫,蓝色眼睛" 而非 "猫"
- ❌ 避免模糊:过于抽象的描述会导致随机性增加
- ❌ 避免过长:保持在 200 字以内效果最佳
- ❌ 避免违规:不要包含暴力、色情等违规内容
常见使用场景
产品设计
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "现代简约风格,智能手表产品展示,白色背景,工作室灯光" \
--size "4K"
艺术创作
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "超现实主义,漂浮的岛屿,瀑布从天而降,梦幻色彩" \
--size "2K"
社交媒体内容
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "美食特写,热气腾腾的拉面,筷子夹起面条,暖色调" \
--size "2K"
品牌视觉设计
bash "$SKILLS_ROOT/seedream/scripts/generate-image.sh" \
--prompt "参考logo,生成一套完整的品牌视觉系统,包括名片、海报、包装设计" \
--image brand_logo.png \
--sequential \
--max-images 4
参考资料
- API 参考:https://www.volcengine.com/docs/82379/1541523
- 控制台:https://console.volcengine.com/ark
- API Key 管理:https://console.volcengine.com/ark/region:ark+cn-beijing/apikey
- 模型列表:https://www.volcengine.com/docs/82379/1330310
技术支持
如遇到问题,可以:
- 查看脚本输出的错误信息
- 检查 API Key 配置是否正确
- 访问火山方舟控制台查看任务详情
- 参考官网文档了解更多细节