Academic Figure Prompt
Academic Figure Prompt — 学术论文配图提示词生成器
为学术论文生成极其详细的英文提示词,供 AI 图片生成工具(NanoBanana / Gemini / Midjourney / DALL-E)生成顶会级别的专业学术配图。
核心理念
生成的提示词必须做到三点:信息密度极高、视觉风格精确、内容完整无遗漏。
宁可提示词过长过详细,也绝不能简化省略。学术配图的价值在于精准传达复杂信息,而非美观简洁。
Input Contract
- 优先输入:图类型、论文/章节内容、方法或模块描述、必要标签、公式、维度、配色方案、参考图
- 最低可用输入:至少提供图类型 + 主题/方法概述;其余缺失时允许以占位约束继续
- 缺失处理:核心内容不足时生成骨架级 prompt,并明确哪些细节是占位项、哪些是推断
Output Contract
始终输出一个 Prompt Package,至少包含:
- 中文图名
- 适用图类型
- 最终英文 image prompt
- 使用的配色方案或默认决定
- 简短中文说明
- 明确列出的假设或待确认项
工作流程
Step 1: 理解论文内容
在生成提示词之前,必须先充分理解论文内容:
- 阅读用户提供的论文/章节源文件(LaTeX、Word、PDF 等)
- 提取每个章节的核心概念、方法、模型架构、数据流
- 识别所有需要配图的位置及其内容需求
- 理解论文中的数学符号、变量含义、维度信息
Step 2: 分析参考图(如有)
如果用户提供了参考图,必须详细分析:
| 分析维度 | 提取内容 |
|---|---|
| 配色方案 | 主色、辅色、强调色的精确色值(如 #3A8F85) |
| 布局结构 | 流向(左→右 / 上→下)、分区方式、层次关系 |
| 模块样式 | 框的形状、边框粗细、填充色、圆角大小 |
| 标注方式 | 标题栏样式、公式标注、维度标注、箭头类型 |
| 信息密度 | 每个模块内的子细节数量、嵌入缩略图的使用方式 |
| 特殊元素 | 反馈环路、虚线框、跳接箭头、图例位置 |
Step 2.5: 配色方案选择(快速默认模式可用)
如果用户没有明确指定配色,不要静默锁定为单一方案。先按以下顺序决策:
- 若能从用户上下文识别
venue/ 学科 / 图类型,优先给出“场景推荐方案 + 1 个备选方案” - 若上下文不足以判断,再明确告知“当前先使用默认 Okabe-Ito 继续生成”
- 始终说明:后续可随时切换到其他预设或自定义色值
快速继续(显式默认):
✅ 如果你暂时不想选配色,我会先用默认 Okabe-Ito 继续生成;如果你想要更现代 / 更柔和 / 更期刊风 / 更像 ML 顶会,也可以随时切换。
场景推荐示例:
NeurIPS / ICML / ICLR→ML TopConf Colorblind/ML TopConf Tab10Nature / Science / CVPR→Okabe-ItoHCI / CHI→Teal-Coral生物 / 医学→Warm Earth/Okabe-Ito
或者查看全部 9 套预设配色方案:
| # | 方案名 | 风格定位 | 主色 | 辅色 | 点缀色 |
|---|---|---|---|---|---|
| A | Okabe-Ito 学术标准⭐ | Nature / Science / CVPR 推荐,色盲友好 | Steel Blue #0072B2 |
Warm Orange #E69F00 |
Bluish Green #009E73 |
| B | Blue 单色系 | 克制、模块详解图适用 | Navy #1565C0 |
Medium Blue #42A5F5 |
Light Blue #90CAF9 |
| C | Warm Earth | 生物学、医学影像 | Brick Red #C0392B |
Burnt Orange #E67E22 |
Amber #F39C12 |
| D | Purple-Green | 数据可视化、IEEE 期刊 | Deep Purple #6A1B9A |
Forest Green #2E7D32 |
Medium Purple #AB47BC |
| E | Grayscale | 仅黑白打印 | Near-black #212121 |
Medium Gray #616161 |
Light Gray #9E9E9E |
| F | Teal-Coral | HCI / CHI 现代感 | Dark Teal #00695C |
Coral #E64A19 |
Medium Teal #26A69A |
| G | ML TopConf Tab10 | Matplotlib 默认,熟悉感强 | tab:blue #1F77B4 |
tab:orange #FF7F0E |
tab:green #2CA02C |
| H | ML TopConf Colorblind | Seaborn 色盲友好 | #0173B2 |
#DE8F05 |
#029E73 |
| I | ML TopConf Deep | Seaborn Deep,柔和稳定,适合多面板密集布局 | #4C72B0 |
#DD8452 |
#55A868 |
额外入口:自定义配色
如需自定义配色,可直接提供主色/辅色/点缀色 hex 值,或从下方工具选取。
如需自定义配色,推荐以下工具:
- Coolors — 随机生成 + 锁定调整,导出色板:https://coolors.co
- ColorHunt — 精选高质量色板,支持标签筛选:https://colorhunt.co
- Adobe Color — 色轮 + 互补/类比/三分配色生成:https://color.adobe.com/create
- ColorBrewer — 专为学术数据可视化设计,支持色盲安全验证:https://colorbrewer2.org
- Viz Palette — 专为数据可视化配色,实时模拟色盲效果:https://projects.susielu.com/viz-palette
- Paletton — 色相环驱动配色方案设计器:https://paletton.com
提示:选好颜色后,直接把主色/辅色/点缀色的 hex 值告诉我即可(如
主色 #2E7D32,辅色 #C49A00)。
若用户明确表示想先比较或确认配色,则展示方案并等待确认;否则不因配色缺失而中断,按“用户指定 → 场景推荐 → 默认安全方案”的顺序继续进入 Step 3。
如果用户已在初始请求中明确指定了配色(如"用蓝绿配色"、"参考我的参考图"),则直接进入 Step 3。
Step 2.75: 缺信息处理分支
总原则: 信息不足时,优先输出“保守但有用”的阶段性结果,而不是停止任务或假装已经掌握全部细节;任何超出已知证据的内容,都必须明确标注为“推断”或“待确认”,必要时改写为占位约束。
情况 1:只有图类型,没有论文内容
- 先生成通用骨架级提示词,覆盖布局、模块关系、标注方式、风格规格
- 将具体模块名、公式、维度、输入输出内容写为可替换占位项
- 明确标注:
当前提示词为通用结构草案,具体内容需结合论文细节补全
情况 2:只有标题、摘要或局部章节
- 仅基于已有材料提取高置信信息生成提示词
- 对模块细节、公式、维度、实验面板数量采用保守表述
- 不要臆造未出现的子模块、损失函数或实验结果
情况 3:用户没有指定配色
- 先尝试从
venue、学科、图类型、参考图中推断最合适的方案 - 若能判断场景,则给出
场景推荐方案 + 1 个备选方案 - 若仍无法判断,则明确标注:
当前先使用默认 Okabe-Ito,可后续切换为其他方案 - 不因缺少配色而停止生成
情况 4:用户没有给参考图,但要求“参考某风格”
- 可以依据用户提到的 venue / 风格关键词生成近似风格约束
- 如果缺少明确视觉参考,则以本 skill 的标准学术风格模板为主
- 不要虚构参考图中的具体元素
情况 5:用户需求很模糊
- 先收缩为最可能的图类型(如 Overall Framework / Module Detail)
- 输出内容应分为:已确认元素、待确认元素、建议补充信息
- 如果连图类型都无法判断,则先给 1 个最稳妥的框架图提示词草案,而不是展开多张假设性图片
Step 3: 生成提示词
按照下方的「提示词结构模板」为每张图生成提示词。
提示词结构模板
每个提示词必须包含以下 四个层次,缺一不可:
层次 1: 全局描述(Global Description)
开头一段话,概括整张图的类型、主题和整体布局。
A highly detailed, information-dense academic paper [类型] diagram in the style of
top-tier [目标会议] publications. The diagram illustrates [主题概述], arranged as
[布局描述: e.g., "a rich multi-stage left-to-right pipeline with multiple parallel
pathways, embedded thumbnail visualizations, and dense annotations"].
类型词汇表:
- architecture / framework / pipeline / flowchart / comparison / ablation
- network architecture / module detail / data flow / system overview
层次 2: 分区详细描述(Section-by-Section Description)
用 === SECTION NAME === 格式分隔每个区域。每个区域内部必须包含:
| 元素 | 要求 | 示例 |
|---|---|---|
| 背景面板 | 极浅色填充 + 色值 | very faint grey #F7F7F7 background panel |
| 节标签 | small-caps 文字 + 细灰分割线 | small-caps Steel Blue label "ENCODER" |
| 模块框 | 白色填充 + 彩色/灰色边框 | white rounded-rectangle box with Steel Blue border |
| 子结构 | 每个模块内部的组件 | containing three parallel branches... |
| 嵌入缩略图 | 模块内的小型单色可视化 | a small monochrome FFT spectrum bar chart thumbnail |
| 公式标注 | LaTeX 风格公式 | with formula "HT = 1/(1 + d/d₀)" |
| 维度标注 | 张量/向量维度 | labeled "X ∈ R^(120×6)" |
| 连接箭头 | 箭头类型和标签 | thin arrow labeled "30-step predicted trajectory" |
关键原则:每个模块框内部都必须有子内容。不允许出现空白占位框。
层次 3: 全局标注(Global Annotations)
- 维度标注沿主要箭头:
"R^(120×6)", "R^(30×6)", "R^14", "R^5" - 反馈环路(如有):
dashed feedback arrow from output back to input - 图例(如有):
legend box in bottom-right corner - 跨区域连接:
skip connection dashed arrow from Stage 1 to Stage 3
层次 4: 风格规格(Style Specifications)
每个提示词末尾必须附加完整的风格描述,将选定方案的色值填入。
配色方案色值表
用户在 Step 2.5 中选定方案后,从下方取对应色值填入提示词末尾的 STYLE SPECIFICATIONS。
方案 A: Okabe-Ito 学术标准(默认)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | Steel Blue #0072B2 |
核心模块边框、节标签、主箭头 |
| secondary | Warm Orange #E69F00 |
次要模块边框、替代高亮 |
| tertiary | Bluish Green #009E73 |
输出/结果模块(极少量) |
| text | Charcoal #333333 |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | Faint Grey #F7F7F7 |
大区域分组 |
| border | Light Grey #CCCCCC |
普通框体(1px) |
| arrow | Dark Grey #4D4D4D |
连接线 |
方案 B: Blue Monochrome(蓝色单色系)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | Deep Blue #1565C0 |
核心模块边框 |
| secondary | Light Blue #42A5F5 |
次要模块边框 |
| tertiary | Pale Blue #90CAF9 |
辅助元素 |
| text | Near-black #212121 |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | Very Pale Blue #F5F8FC |
大区域分组 |
| border | Blue-gray #B0BEC5 |
普通框体 |
| arrow | Dark Blue-gray #37474F |
连接线 |
方案 C: Warm Earth(暖土色系)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | Brick Red #C0392B |
核心模块边框 |
| secondary | Burnt Orange #E67E22 |
次要模块边框 |
| tertiary | Amber #F39C12 |
输出/结果 |
| text | Charcoal #2C2C2C |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | Warm Cream #FDF6EC |
大区域分组 |
| border | Sand #D5C5A1 |
普通框体 |
| arrow | Brown #5D4037 |
连接线 |
方案 D: Purple-Green(紫绿互补)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | Deep Purple #6A1B9A |
核心模块边框 |
| secondary | Forest Green #2E7D32 |
次要模块边框 |
| tertiary | Medium Purple #AB47BC |
第三类元素 |
| text | Near-black #1A1A1A |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | Lavender tint #F8F5FC |
大区域分组 |
| border | Light Purple #CE93D8 |
普通框体 |
| arrow | Dark Purple #4A148C |
连接线 |
方案 E: Grayscale(纯灰度)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | Near-black #212121 |
核心模块边框 |
| secondary | Medium Gray #616161 |
次要模块边框 |
| tertiary | Light Gray #9E9E9E |
辅助元素 |
| text | Black #111111 |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | Off-white #F5F5F5 |
大区域分组 |
| border | Silver #BDBDBD |
普通框体 |
| arrow | Dark Gray #424242 |
连接线 |
方案 F: Teal-Coral(青蓝珊瑚)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | Dark Teal #00695C |
核心模块边框 |
| secondary | Coral #E64A19 |
次要模块边框 |
| tertiary | Medium Teal #26A69A |
输出/结果 |
| text | Near-black #212121 |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | Pale Teal tint #F0F9F8 |
大区域分组 |
| border | Light Teal #80CBC4 |
普通框体 |
| arrow | Very Dark Teal #004D40 |
连接线 |
方案 G: ML TopConf Tab10(Matplotlib 默认)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | tab:blue #1F77B4 |
核心模块边框 |
| secondary | tab:orange #FF7F0E |
次要模块边框 |
| tertiary | tab:green #2CA02C |
输出/结果 |
| text | slate-800 #1F2937 |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | slate-50 #F8FAFC |
大区域分组 |
| border | slate-300 #CBD5E1 |
普通框体 |
| arrow | slate-700 #334155 |
连接线 |
方案 H: ML TopConf Colorblind(Seaborn 色盲友好)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | #0173B2 |
核心模块边框 |
| secondary | #DE8F05 |
次要模块边框 |
| tertiary | #029E73 |
输出/结果 |
| text | #1F2937 |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | #F8FAFC |
大区域分组 |
| border | #CBD5E1 |
普通框体 |
| arrow | #334155 |
连接线 |
方案 I: ML TopConf Deep(Seaborn Deep · 柔和)
| 元素 | 色值 | 用途 |
|---|---|---|
| primary | #4C72B0 |
核心模块边框 |
| secondary | #DD8452 |
次要模块边框 |
| tertiary | #55A868 |
输出/结果 |
| text | #1F2937 |
所有标签 |
| fill | Pure White #FFFFFF |
所有内容框 |
| section_bg | #F8FAFC |
大区域分组 |
| border | #CBD5E1 |
普通框体 |
| arrow | #334155 |
连接线 |
额外入口:用户自定义
从参考图中提取,或使用调色工具选定色值后,按如下格式告知:
主色:#XXXXXX(核心模块边框/节标签)
辅色:#XXXXXX(次要模块/强调)
点缀色:#XXXXXX(输出结果,可选)
背景:#XXXXXX(区域分组背景,建议极浅)
文字:#XXXXXX(建议深色)
配色禁忌(避免 AI 生图感)
| 禁止做法 | 替代做法 |
|---|---|
| 4-5 种彩色背景面板 | 白色为主 + 极浅灰分组 |
| 高饱和度 Header Banner Bar | 小号 small-caps 文字标签 + 灰色分割线 |
| 每个模块不同颜色填充 | 纯白填充 + 仅边框用色 |
| 彩色缩略图 | 单色灰度或仅用 2 色 |
| 5+ 种颜色同时出现 | 最多 3 种色彩 + 灰色系 |
| 彩虹/渐变效果 | 纯色、扁平、无渐变 |
图片类型专用模板
类型 1: 总体框架图(Overall Framework)
结构: [输入] → [阶段1] → [阶段2] → ... → [输出]
要求:
- 各阶段用 small-caps 文字标签 + 细灰色分割线(不用彩色背景面板)
- 核心模块用主色边框,次要模块用辅色边框,普通模块用 Grey 边框
- 所有模块白色填充,无彩色填充
- 阶段间箭头标注数据维度和含义
- 每个阶段内展示 2-4 个子模块,子模块内嵌入单色缩略图
- 底部或顶部添加反馈/跳接连接(灰色虚线)
类型 2: 网络架构图(Network Architecture)
结构: [输入层] → [编码器堆叠] → [核心模块(并行分支)] → [输出头]
要求:
- 并行分支用不同边框色区分,内部均为白色填充
- 每个分支内标注操作名称 + 单色缩略图
- 残差连接用灰色虚线弧形箭头
- 维度标注在每层转换处(灰色小字)
- 重复层用 "×N" 灰色虚线框标识
类型 3: 模块详解图(Module Detail)
结构: [输入] → [操作1] → [中间表示] → [操作2] → [输出]
要求:
- 每步操作用白色独立框,关键操作用主色边框,次要用 Grey 边框
- 中间表示用单色灰度缩略图可视化(频谱图、热力图等)
- 跳接/残差连接用灰色虚线
- 公式标注在对应操作框旁(灰色小字)
类型 4: 对比/消融图(Comparison / Ablation)
结构: N 列并排,每列一个变体
要求:
- 共享的基础结构用相同灰色边框
- 差异部分用主色或辅色边框高亮 + 灰色虚线框标出
- 每列顶部标注变体名称(small-caps)
- 底部可添加性能指标对比条(仅用主色 + 辅色 + Grey)
类型 5: 数据/行为模板图(Data / Behavior Patterns)
结构: 1×N 网格,每格一个类别
要求:
- 每格为白色框 + 细灰色边框,顶部标签用主色小字
- 格内嵌入该类别的单色/双色典型可视化(轨迹、波形等)
- 用主色 / 辅色区分正面/负面类别(如有对比语义)
- 关键特征用文字标签
- 底部共享坐标轴(如有)
缩略图词汇表(Thumbnail Vocabulary)
| 数据类型 | 缩略图描述 |
|---|---|
| 时间序列 | a small time-series waveform thumbnail |
| 频率谱 | a small frequency spectrum bar chart thumbnail |
| 注意力图 | a small monochrome attention heatmap grid thumbnail |
| 轨迹 | a small 3D orbital trajectory curve thumbnail |
| 概率分布 | a small probability distribution bar chart thumbnail |
| 决策树 | a small decision tree branching diagram thumbnail |
| 混淆矩阵 | a small confusion matrix heatmap thumbnail |
| 网络节点 | a small neural network layer diagram thumbnail |
| 特征向量 | a small horizontal feature vector bar visualization |
| 散点图 | a small scatter plot with cluster coloring thumbnail |
| 感受野 | a progressively larger receptive field grid icon |
| 卷积核 | a small convolution filter kernel grid thumbnail |
| 梯度流 | a small gradient flow direction arrow diagram |
| 损失曲线 | a small training loss convergence curve thumbnail |
| ROC 曲线 | a small ROC curve with AUC shading thumbnail |
| 图像样本 | a small example image/photo thumbnail |
| 点云 | a small 3D point cloud visualization thumbnail |
| 热力图 | a small spatial heatmap overlay thumbnail |
质量检查清单
生成每个提示词后,对照以下清单自检:
- 信息密度:每个模块框内都有子内容(子框、缩略图、公式),没有空白框
- 色彩克制:仅使用 2-3 种色彩,无多余颜色
- 白色主导:≥70% 面积为白色/近白色,无彩色背景面板
- 边框而非填充:模块用白色填充 + 彩色/灰色细边框,而非彩色填充
- 分区方式:用 small-caps 文字标签 + 灰色分割线,不用彩色 banner bar
- 维度标注:所有主要数据流箭头上都标注了维度(如 R^(N×D))
- 公式标注:关键操作旁有对应数学公式
- 缩略图嵌入:至少 50% 的模块内嵌入了单色/双色缩略可视化
- 完整性:论文中描述的所有组件都在图中体现,无遗漏
- 连接清晰:并行路径、残差连接、反馈环路都有明确描述
- 风格规格:末尾包含完整的 STYLE SPECIFICATIONS 段落(含色值约束和禁止项)
- 无简化:没有用 "..." 或 "etc." 省略任何内容
- 灰度测试:描述确保图片在黑白打印时仍可完整阅读
输出格式
每个提示词用 markdown 代码块包裹:
### 图 X.Y — [中文图名]
适用类型:[框架图/架构图/模块图/对比图/模板图]
配色方案:[已选方案名]
推荐分辨率:[建议的宽高比,如 16:9, 3:2]
#### 信息完整度说明
- **已分析材料**:[论文、摘要、章节、参考图、用户明确要求]
- **当前输出类型**:完整提示词 / 阶段性提示词 / 通用骨架提示词
- **配色来源**:用户指定 / 场景推荐 / 默认安全方案
- **高置信信息**:[已明确出现的模块、流程、术语、配色或风格要求]
- **待确认信息**:[公式、维度、具体模块命名、实验面板数量等]
- **建议补充材料**:[最值得补充的 1-3 项]
```
[完整英文提示词]
```
注意事项
- 提示词语言:提示词本身必须为英文,说明文字用中文
- 长度不限:宁长勿短,信息密度是第一优先级
- 领域自适应:根据论文领域(CV、NLP、Robotics、医学等)调整缩略图和图标选择
- 参考图优先:如果用户提供了参考图,配色和布局以参考图为准,覆盖预设方案
- 批量生成:当用户要求为整篇论文生成配图时,按章节组织,并给出优先级建议
More from azhi-ss/academic-figure-skills
academic paper analyzer & figure planner
Use this skill whenever the user wants to analyze an academic paper, identify figure-worthy content, plan which figures to generate, suggest figure types and count per section, or says "分析论文配图需求", "论文需要哪些图", "论文配图规划", "paper figure planning", "analyze paper for figures", or "which figures does my paper need".
12academic repo analyzer
Use this skill whenever the user wants to analyze a deep learning or machine learning code repository, understand what it does, identify its architecture and tech stack, generate a quick understanding document for downstream figure planning, or says "分析代码仓库", "仓库分析", "repo analyzer", "analyze this repo", "理解这个代码库", "what does this repo do", or "code repository analysis".
11academic figure color expert
Use this skill whenever the user wants help choosing an academic figure color palette, needs venue-specific or colorblind-safe design advice, wants a paper color scheme recommendation, wants to match a color scheme for extracted architecture diagrams, or says "学术配图配色", "论文配色方案", "色盲友好配色", "学术配色", "架构图配色", "academic color palette", "colorblind safe figure", "paper color scheme", "architecture diagram color matching".
11academic figure prompt — modern ml airy style
Use this skill whenever the user wants modern ML or RL paper-style figure prompts matching recent ICLR, NeurIPS, or ICML 2024-2025 aesthetics, needs a soft pastel academic diagram style, or says "pastel风格论文配图", "现代ML论文配图", "modern ML figure prompt", "pastel academic figure", "ICLR 2024 风格图", or "NeurIPS 2025 风格图".
11academic figure workflow orchestrator
Use this skill whenever the user wants an end-to-end academic figure workflow, wants to go from a repository or paper to a figure prompt, is unsure which academic-figure skill to start with, or says "帮我从仓库到配图走一遍", "完整论文配图工作流", "academic figure workflow", "end-to-end figure pipeline", "from paper to figure prompt", or "which skill should I use first".
11academic figure architecture extractor & analyzer
Use this skill whenever the user wants to extract architecture diagrams from academic papers, filter out invalid images, analyze the structure and components of diagrams, automatically match suitable color schemes, or says "提取论文架构图", "架构图分析", "从PDF中提取图表", "自动分析架构图", "architecture diagram extraction", "extract figures from pdf", "analyze architecture diagram".
10