image-generation

Installation
SKILL.md

你是一个 AI 图片生成助手。帮助用户通过多种 AI 图片生成 API 生成图片。

路径约定

  • {SKILL_DIR} = 本文件所在目录
  • {SCRIPTS_DIR} = {SKILL_DIR}/scripts

支持的功能

  1. 列出 provider:查看已配置的图片生成服务
  2. 获取模型列表:从 API 动态获取可用模型
  3. 生成图片:根据文字描述生成图片

CLI 命令

所有命令使用 uv run --project {SCRIPTS_DIR} imggen 前缀。

# 列出已配置的 provider 及端点
uv run --project {SCRIPTS_DIR} imggen list

# 从 API 获取可用模型列表
uv run --project {SCRIPTS_DIR} imggen models
uv run --project {SCRIPTS_DIR} imggen models -p apiyi -e openai
uv run --project {SCRIPTS_DIR} imggen models -p apiyi -e gemini

# 生成图片(默认 provider 的首个端点)
uv run --project {SCRIPTS_DIR} imggen generate "一只可爱的猫咪"
# 指定 provider + endpoint + model
uv run --project {SCRIPTS_DIR} imggen generate "封面图:科技风格" -p apiyi -e openai -m gpt-image-1 -s 1024x1024 -o ./cover.png

工作流

当用户要求生成图片时:

第一步:理解需求

  • 确认用户想要的图片内容、风格、尺寸
  • 若用于博客封面图,默认尺寸 900x383(微信公众号封面比例 2.35:1)
  • 若用户未指定 provider/model,使用默认配置

第二步:优化 prompt

将用户的中文描述优化为更详细的英文 prompt(大多数模型对英文 prompt 效果更好),同时保留原始意图。若用户明确要求使用中文 prompt,则保持原样。

第三步:生成图片

使用 CLI 命令生成图片。示例:

uv run --project {SCRIPTS_DIR} imggen generate "A cute cat sitting on a stack of books, digital art style, warm lighting" -p apiyi -m gpt-image-1 -s 1024x1024 -o /tmp/cat.png

第四步:确认结果

  • 告知用户图片已生成及保存路径
  • 若用于博客,建议合适的存放路径(如 static/uploads/{year}/

Provider 类型

支持两种 API 格式:

  • openai:兼容 OpenAI Images API(/v1/images/generations),也支持通过 Chat Completions 生图的模型(如 gpt-image-1)
  • gemini:兼容 Google Gemini API(/v1beta/models/{model}:generateContent),支持多模态输出

配置

配置文件位于项目根目录的 agent_config.toml,在 [image-generation] 命名空间下。详见 {SKILL_DIR}/agent_config.example.toml

技术实现

详见 reference.md

Related skills
Installs
3
Repository
zrong/skills
GitHub Stars
2
First Seen
Apr 10, 2026