Academic Figure Prompt
SKILL.md
Academic Figure Prompt — 学术论文配图提示词生成器
为学术论文生成极其详细的英文提示词,供 AI 图片生成工具(NanoBanana / Gemini / Midjourney / DALL-E)生成顶会级别的专业学术配图。
核心理念
生成的提示词必须做到三点:信息密度极高、视觉风格精确、内容完整无遗漏。
宁可提示词过长过详细,也绝不能简化省略。学术配图的价值在于精准传达复杂信息,而非美观简洁。
工作流程
Step 1: 理解论文内容
在生成提示词之前,必须先充分理解论文内容:
- 阅读用户提供的论文/章节源文件(LaTeX、Word、PDF 等)
- 提取每个章节的核心概念、方法、模型架构、数据流
- 识别所有需要配图的位置及其内容需求
- 理解论文中的数学符号、变量含义、维度信息
Step 2: 分析参考图(如有)
如果用户提供了参考图,必须详细分析:
| 分析维度 | 提取内容 |
|---|---|
| 配色方案 | 主色、辅色、强调色的精确色值(如 #3A8F85) |
| 布局结构 | 流向(左→右 / 上→下)、分区方式、层次关系 |
| 模块样式 | 框的形状、边框粗细、填充色、圆角大小 |
| 标注方式 | 标题栏样式、公式标注、维度标注、箭头类型 |
| 信息密度 | 每个模块内的子细节数量、嵌入缩略图的使用方式 |
| 特殊元素 | 反馈环路、虚线框、跳接箭头、图例位置 |
Step 2.5: 配色方案选择(必须在生成提示词前完成)
在生成任何提示词之前,必须先向用户展示配色选项并等待确认。
展示以下内容:
请选择配色方案(输入编号或自定义):
| # | 方案名 | 风格定位 | 主色 | 辅色 | 点缀色 |
|---|---|---|---|---|---|
| A | Okabe-Ito 学术标准 | Nature / Science / CVPR 推荐,色盲友好 | Steel Blue #0072B2 |
Warm Orange #E69F00 |
Bluish Green #009E73 |
| B | Blue 单色系 | 克制、模块详解图适用 | Navy #0072B2 |
Medium Blue #4A90D9 |
Light Blue #A0C4E8 |
| C | Teal + Amber | 现代感强,ICLR / NeurIPS 风 | Deep Teal #00897B |
Amber #FFB300 |
Soft Grey #ECEFF1 |
| D | Navy + Coral | 沉稳大气,IEEE 期刊风 | Deep Navy #1A3A5C |
Coral #E05A47 |
Warm Sand #F5ECD7 |
| E | Slate + Violet | 优雅冷调,医学 / 生物信息学风 | Slate Blue #3F51B5 |
Muted Violet #7E57C2 |
Pale Lavender #EDE7F6 |
| F | Forest + Gold | 厚重学术感,自然科学期刊风 | Forest Green #2E7D32 |
Gold #C49A00 |
Cream #F9F6EE |
| G | Minimal Grey | 极简灰度 + 单一强调色,arXiv 技术报告风 | Charcoal #263238 |
Steel #546E7A |
单一强调(用户指定) |
| H | 自定义 | 由用户提供色值或从下方工具选取 | — | — | — |
如需自定义配色,推荐以下工具:
- Coolors — 随机生成 + 锁定调整,导出色板:https://coolors.co
- ColorHunt — 精选高质量色板,支持标签筛选:https://colorhunt.co
- Adobe Color — 色轮 + 互补/类比/三分配色生成:https://color.adobe.com/create
- ColorBrewer — 专为学术数据可视化设计,支持色盲安全验证:https://colorbrewer2.org
- Viz Palette — 专为数据可视化配色,实时模拟色盲效果:https://projects.susielu.com/viz-palette
- Paletton — 色相环驱动配色方案设计器:https://paletton.com
提示:选好颜色后,直接把主色/辅色/点缀色的 hex 值告诉我即可(如
主色 #2E7D32,辅色 #C49A00)。
等待用户选择后,再进入 Step 3 生成提示词。
如果用户已在初始请求中明确指定了配色(如"用蓝绿配色"、"参考我的参考图"),则跳过此步骤直接进入 Step 3。
Step 3: 生成提示词
按照下方的「提示词结构模板」为每张图生成提示词。
提示词结构模板
每个提示词必须包含以下 四个层次,缺一不可:
层次 1: 全局描述(Global Description)
开头一段话,概括整张图的类型、主题和整体布局。
A highly detailed, information-dense academic paper [类型] diagram in the style of
top-tier [目标会议] publications. The diagram illustrates [主题概述], arranged as
[布局描述: e.g., "a rich multi-stage left-to-right pipeline with multiple parallel
pathways, embedded thumbnail visualizations, and dense annotations"].
类型词汇表:
- architecture / framework / pipeline / flowchart / comparison / ablation
- network architecture / module detail / data flow / system overview
层次 2: 分区详细描述(Section-by-Section Description)
用 === SECTION NAME === 格式分隔每个区域。每个区域内部必须包含:
| 元素 | 要求 | 示例 |
|---|---|---|
| 背景面板 | 极浅色填充 + 色值 | very faint grey #F7F7F7 background panel |
| 节标签 | small-caps 文字 + 细灰分割线 | small-caps Steel Blue label "ENCODER" |
| 模块框 | 白色填充 + 彩色/灰色边框 | white rounded-rectangle box with Steel Blue border |
| 子结构 | 每个模块内部的组件 | containing three parallel branches... |
| 嵌入缩略图 | 模块内的小型单色可视化 | a small monochrome FFT spectrum bar chart thumbnail |
| 公式标注 | LaTeX 风格公式 | with formula "HT = 1/(1 + d/d₀)" |
| 维度标注 | 张量/向量维度 | labeled "X ∈ R^(120×6)" |
| 连接箭头 | 箭头类型和标签 | thin arrow labeled "30-step predicted trajectory" |
关键原则:每个模块框内部都必须有子内容。不允许出现空白占位框。
层次 3: 全局标注(Global Annotations)
- 维度标注沿主要箭头:
"R^(120×6)", "R^(30×6)", "R^14", "R^5" - 反馈环路(如有):
dashed feedback arrow from output back to input - 图例(如有):
legend box in bottom-right corner - 跨区域连接:
skip connection dashed arrow from Stage 1 to Stage 3
层次 4: 风格规格(Style Specifications)
每个提示词末尾必须附加完整的风格描述,将选定方案的色值填入。
配色方案色值表
用户在 Step 2.5 中选定方案后,从下方取对应色值填入提示词末尾的 STYLE SPECIFICATIONS。
方案 A: Okabe-Ito 学术标准(默认)
| 元素 | 色值 | 用途 |
|---|---|---|
| 主色 | Steel Blue #0072B2 |
核心模块边框、节标签、主箭头 |
| 辅色 | Warm Orange #E69F00 |
次要模块边框、替代高亮 |
| 点缀色 | Bluish Green #009E73 |
输出/结果模块(极少量) |
| 警告色 | Vermillion #D55E00 |
关键高亮/警告(极少量) |
| 模块填充 | Pure White #FFFFFF |
所有内容框 |
| 区域背景 | Faint Grey #F7F7F7 |
大区域分组 |
| 标准边框 | Light Grey #CCCCCC |
普通框体(1px) |
| 正文字色 | Charcoal #333333 |
所有标签 |
| 箭头/线条 | Dark Grey #4D4D4D |
连接线 |
| 次要注释 | Medium Grey #666666 |
标注文字 |
方案 B: Blue 单色系
| 元素 | 色值 | 用途 |
|---|---|---|
| 强调/标签 | Navy #0072B2 |
关键模块边框、节标签 |
| 主要边框 | Medium Blue #4A90D9 |
主流程模块 |
| 次要边框 | Light Blue #A0C4E8 |
次要/辅助模块 |
| 区域背景 | Pale Blue #EBF3FA |
大区域分组 |
| 模块填充 | Pure White #FFFFFF |
所有内容框 |
| 中性/箭头 | Grey #999999 |
连接线、次要标注 |
| 正文字色 | Charcoal #333333 |
所有标签 |
方案 C: Teal + Amber
| 元素 | 色值 | 用途 |
|---|---|---|
| 主色 | Deep Teal #00897B |
核心模块边框、节标签 |
| 辅色 | Amber #FFB300 |
次要模块边框、强调 |
| 区域背景 | Soft Grey-Blue #ECEFF1 |
大区域分组 |
| 模块填充 | Pure White #FFFFFF |
所有内容框 |
| 标准边框 | Light Grey #CFD8DC |
普通框体 |
| 正文字色 | Dark Slate #263238 |
所有标签 |
| 箭头/线条 | Medium Grey #607D8B |
连接线 |
| 次要注释 | Grey #90A4AE |
标注文字 |
方案 D: Navy + Coral
| 元素 | 色值 | 用途 |
|---|---|---|
| 主色 | Deep Navy #1A3A5C |
核心模块边框、节标签 |
| 辅色 | Coral #E05A47 |
强调模块、关键路径 |
| 点缀色 | Warm Sand #D4A96A |
输出/结果模块(极少量) |
| 区域背景 | Ivory #F9F6EE |
大区域分组 |
| 模块填充 | Pure White #FFFFFF |
所有内容框 |
| 标准边框 | Light Warm Grey #D4C5B0 |
普通框体 |
| 正文字色 | Dark Slate #1A3A5C |
所有标签 |
| 箭头/线条 | Medium Grey #7A8A99 |
连接线 |
方案 E: Slate + Violet
| 元素 | 色值 | 用途 |
|---|---|---|
| 主色 | Indigo #3F51B5 |
核心模块边框、节标签 |
| 辅色 | Muted Violet #7E57C2 |
次要模块边框 |
| 点缀色 | Teal Accent #26A69A |
输出/结果模块(极少量) |
| 区域背景 | Pale Lavender #EDE7F6 |
大区域分组 |
| 模块填充 | Pure White #FFFFFF |
所有内容框 |
| 标准边框 | Light Purple Grey #C5CAE9 |
普通框体 |
| 正文字色 | Deep Indigo #1A237E |
所有标签 |
| 箭头/线条 | Medium Grey #7986CB |
连接线 |
方案 F: Forest + Gold
| 元素 | 色值 | 用途 |
|---|---|---|
| 主色 | Forest Green #2E7D32 |
核心模块边框、节标签 |
| 辅色 | Antique Gold #C49A00 |
次要模块边框、强调 |
| 区域背景 | Warm Cream #F9F6EE |
大区域分组 |
| 模块填充 | Pure White #FFFFFF |
所有内容框 |
| 标准边框 | Sage #A5D6A7 |
普通框体 |
| 正文字色 | Dark Forest #1B5E20 |
所有标签 |
| 箭头/线条 | Warm Grey #795548 |
连接线 |
方案 G: Minimal Grey + 单一强调色
| 元素 | 色值 | 用途 |
|---|---|---|
| 强调色(可替换) | Steel Blue #0072B2 |
仅用于最核心的 1-2 个模块边框 |
| 深灰 | Charcoal #263238 |
节标签、正文字色 |
| 中深灰 | Slate #546E7A |
主要边框、箭头 |
| 中灰 | Medium Grey #90A4AE |
次要边框 |
| 浅灰 | Light Grey #ECEFF1 |
区域背景 |
| 模块填充 | Pure White #FFFFFF |
所有内容框 |
| 标准边框 | Grey #B0BEC5 |
普通框体 |
方案 H: 用户自定义
从参考图中提取,或使用调色工具选定色值后,按如下格式告知:
主色:#XXXXXX(核心模块边框/节标签)
辅色:#XXXXXX(次要模块/强调)
点缀色:#XXXXXX(输出结果,可选)
背景:#XXXXXX(区域分组背景,建议极浅)
文字:#XXXXXX(建议深色)
配色禁忌(避免 AI 生图感)
| 禁止做法 | 替代做法 |
|---|---|
| 4-5 种彩色背景面板 | 白色为主 + 极浅灰分组 |
| 高饱和度 Header Banner Bar | 小号 small-caps 文字标签 + 灰色分割线 |
| 每个模块不同颜色填充 | 纯白填充 + 仅边框用色 |
| 彩色缩略图 | 单色灰度或仅用 2 色 |
| 5+ 种颜色同时出现 | 最多 3 种色彩 + 灰色系 |
| 彩虹/渐变效果 | 纯色、扁平、无渐变 |
图片类型专用模板
类型 1: 总体框架图(Overall Framework)
结构: [输入] → [阶段1] → [阶段2] → ... → [输出]
要求:
- 各阶段用 small-caps 文字标签 + 细灰色分割线(不用彩色背景面板)
- 核心模块用主色边框,次要模块用辅色边框,普通模块用 Grey 边框
- 所有模块白色填充,无彩色填充
- 阶段间箭头标注数据维度和含义
- 每个阶段内展示 2-4 个子模块,子模块内嵌入单色缩略图
- 底部或顶部添加反馈/跳接连接(灰色虚线)
类型 2: 网络架构图(Network Architecture)
结构: [输入层] → [编码器堆叠] → [核心模块(并行分支)] → [输出头]
要求:
- 并行分支用不同边框色区分,内部均为白色填充
- 每个分支内标注操作名称 + 单色缩略图
- 残差连接用灰色虚线弧形箭头
- 维度标注在每层转换处(灰色小字)
- 重复层用 "×N" 灰色虚线框标识
类型 3: 模块详解图(Module Detail)
结构: [输入] → [操作1] → [中间表示] → [操作2] → [输出]
要求:
- 每步操作用白色独立框,关键操作用主色边框,次要用 Grey 边框
- 中间表示用单色灰度缩略图可视化(频谱图、热力图等)
- 跳接/残差连接用灰色虚线
- 公式标注在对应操作框旁(灰色小字)
类型 4: 对比/消融图(Comparison / Ablation)
结构: N 列并排,每列一个变体
要求:
- 共享的基础结构用相同灰色边框
- 差异部分用主色或辅色边框高亮 + 灰色虚线框标出
- 每列顶部标注变体名称(small-caps)
- 底部可添加性能指标对比条(仅用主色 + 辅色 + Grey)
类型 5: 数据/行为模板图(Data / Behavior Patterns)
结构: 1×N 网格,每格一个类别
要求:
- 每格为白色框 + 细灰色边框,顶部标签用主色小字
- 格内嵌入该类别的单色/双色典型可视化(轨迹、波形等)
- 用主色 / 辅色区分正面/负面类别(如有对比语义)
- 关键特征用文字标签
- 底部共享坐标轴(如有)
缩略图词汇表(Thumbnail Vocabulary)
| 数据类型 | 缩略图描述 |
|---|---|
| 时间序列 | a small time-series waveform thumbnail |
| 频率谱 | a small frequency spectrum bar chart thumbnail |
| 注意力图 | a small monochrome attention heatmap grid thumbnail |
| 轨迹 | a small 3D orbital trajectory curve thumbnail |
| 概率分布 | a small probability distribution bar chart thumbnail |
| 决策树 | a small decision tree branching diagram thumbnail |
| 混淆矩阵 | a small confusion matrix heatmap thumbnail |
| 网络节点 | a small neural network layer diagram thumbnail |
| 特征向量 | a small horizontal feature vector bar visualization |
| 散点图 | a small scatter plot with cluster coloring thumbnail |
| 感受野 | a progressively larger receptive field grid icon |
| 卷积核 | a small convolution filter kernel grid thumbnail |
| 梯度流 | a small gradient flow direction arrow diagram |
| 损失曲线 | a small training loss convergence curve thumbnail |
| ROC 曲线 | a small ROC curve with AUC shading thumbnail |
| 图像样本 | a small example image/photo thumbnail |
| 点云 | a small 3D point cloud visualization thumbnail |
| 热力图 | a small spatial heatmap overlay thumbnail |
质量检查清单
生成每个提示词后,对照以下清单自检:
- 信息密度:每个模块框内都有子内容(子框、缩略图、公式),没有空白框
- 色彩克制:仅使用 2-3 种色彩,无多余颜色
- 白色主导:≥70% 面积为白色/近白色,无彩色背景面板
- 边框而非填充:模块用白色填充 + 彩色/灰色细边框,而非彩色填充
- 分区方式:用 small-caps 文字标签 + 灰色分割线,不用彩色 banner bar
- 维度标注:所有主要数据流箭头上都标注了维度(如 R^(N×D))
- 公式标注:关键操作旁有对应数学公式
- 缩略图嵌入:至少 50% 的模块内嵌入了单色/双色缩略可视化
- 完整性:论文中描述的所有组件都在图中体现,无遗漏
- 连接清晰:并行路径、残差连接、反馈环路都有明确描述
- 风格规格:末尾包含完整的 STYLE SPECIFICATIONS 段落(含色值约束和禁止项)
- 无简化:没有用 "..." 或 "etc." 省略任何内容
- 灰度测试:描述确保图片在黑白打印时仍可完整阅读
输出格式
每个提示词用 markdown 代码块包裹:
### 图 X.Y — [中文图名]
适用类型:[框架图/架构图/模块图/对比图/模板图]
配色方案:[已选方案名]
推荐分辨率:[建议的宽高比,如 16:9, 3:2]
```
[完整英文提示词]
```
注意事项
- 提示词语言:提示词本身必须为英文,说明文字用中文
- 长度不限:宁长勿短,信息密度是第一优先级
- 领域自适应:根据论文领域(CV、NLP、Robotics、医学等)调整缩略图和图标选择
- 参考图优先:如果用户提供了参考图,配色和布局以参考图为准,覆盖预设方案
- 批量生成:当用户要求为整篇论文生成配图时,按章节组织,并给出优先级建议