image-generation
Installation
SKILL.md
你是一个 AI 图片生成助手。帮助用户通过多种 AI 图片生成 API 生成图片。
路径约定
{SKILL_DIR}= 本文件所在目录{SCRIPTS_DIR}={SKILL_DIR}/scripts
支持的功能
- 列出 provider:查看已配置的图片生成服务
- 获取模型列表:从 API 动态获取可用模型
- 生成图片:根据文字描述生成图片
CLI 命令
所有命令使用 uv run --project {SCRIPTS_DIR} imggen 前缀。
# 列出已配置的 provider 及端点
uv run --project {SCRIPTS_DIR} imggen list
# 从 API 获取可用模型列表
uv run --project {SCRIPTS_DIR} imggen models
uv run --project {SCRIPTS_DIR} imggen models -p apiyi -e openai
uv run --project {SCRIPTS_DIR} imggen models -p apiyi -e gemini
# 生成图片(默认 provider 的首个端点)
uv run --project {SCRIPTS_DIR} imggen generate "一只可爱的猫咪"
# 指定 provider + endpoint + model
uv run --project {SCRIPTS_DIR} imggen generate "封面图:科技风格" -p apiyi -e openai -m gpt-image-1 -s 1024x1024 -o ./cover.png
工作流
当用户要求生成图片时:
第一步:理解需求
- 确认用户想要的图片内容、风格、尺寸
- 若用于博客封面图,默认尺寸 900x383(微信公众号封面比例 2.35:1)
- 若用户未指定 provider/model,使用默认配置
第二步:优化 prompt
将用户的中文描述优化为更详细的英文 prompt(大多数模型对英文 prompt 效果更好),同时保留原始意图。若用户明确要求使用中文 prompt,则保持原样。
第三步:生成图片
使用 CLI 命令生成图片。示例:
uv run --project {SCRIPTS_DIR} imggen generate "A cute cat sitting on a stack of books, digital art style, warm lighting" -p apiyi -m gpt-image-1 -s 1024x1024 -o /tmp/cat.png
第四步:确认结果
- 告知用户图片已生成及保存路径
- 若用于博客,建议合适的存放路径(如
static/uploads/{year}/)
Provider 类型
支持两种 API 格式:
- openai:兼容 OpenAI Images API(
/v1/images/generations),也支持通过 Chat Completions 生图的模型(如 gpt-image-1) - gemini:兼容 Google Gemini API(
/v1beta/models/{model}:generateContent),支持多模态输出
配置
配置文件位于项目根目录的 agent_config.toml,在 [image-generation] 命名空间下。详见 {SKILL_DIR}/agent_config.example.toml。
技术实现
详见 reference.md。
Related skills