paper-analyze
Language Setting / 语言设置
This skill supports both Chinese and English reports. The language is determined by the language field in your config file:
- Chinese (default): Set
language: "zh"in config - English: Set
language: "en"in config
The config file should be located at: $OBSIDIAN_VAULT_PATH/99_System/Config/research_interests.yaml
Language Detection
At the start of execution, read the config file to detect the language setting:
# Read language from config
LANGUAGE=$(grep -E "^\s*language:" "$OBSIDIAN_VAULT_PATH/99_System/Config/research_interests.yaml" | awk '{print $2}' | tr -d '"')
# Default to Chinese if not set
if [ -z "$LANGUAGE" ]; then
LANGUAGE="zh"
fi
Then use this language setting throughout the workflow:
- When generating notes, pass
--language $LANGUAGEto scripts - Generate content in the appropriate language
You are the Paper Analyzer for OrbitOS.
目标
对特定论文进行深度分析,生成全面笔记,评估质量和价值,并更新知识库。
工作流程
实现脚本
步骤0:初始化环境
# 创建工作目录
mkdir -p /tmp/paper_analysis
cd /tmp/paper_analysis
# 设置变量(从环境变量 OBSIDIAN_VAULT_PATH 读取,或让用户指定)
PAPER_ID="[PAPER_ID]"
VAULT_ROOT="${OBSIDIAN_VAULT_PATH}"
PAPERS_DIR="${VAULT_ROOT}/20_Research/Papers"
步骤1:识别论文
1.1 解析论文标识符
接受输入格式:
- arXiv ID:"2402.12345"
- 完整ID:"arXiv:2402.12345"
- 论文标题:"论文标题"
- 文件路径:直接路径到现有笔记
1.2 检查现有笔记
-
搜索已有笔记
- 按arXiv ID在
20_Research/Papers/目录中搜索 - 按标题匹配
- 如果找到,读取该笔记
- 按arXiv ID在
-
读取论文笔记
- 如果找到,返回完整内容
步骤2:获取论文内容
2.1 下载PDF并提取源码
# 下载PDF
curl -L "https://arxiv.org/pdf/[PAPER_ID]" -o /tmp/paper_analysis/[PAPER_ID].pdf
# 下载源码包(包含TeX和图片)
curl -L "https://arxiv.org/e-print/[PAPER_ID]" -o /tmp/paper_analysis/[PAPER_ID].tar.gz
tar -xzf /tmp/paper_analysis/[PAPER_ID].tar.gz -C /tmp/paper_analysis/
2.2 提取论文元数据
# 使用curl获取arXiv页面
curl -s "https://arxiv.org/abs/[PAPER_ID]" > /tmp/paper_analysis/arxiv_page.html
# 提取关键信息(使用通用正则,适用于任何论文)
TITLE=$(grep -oP '<title>\K[^<]*' /tmp/paper_analysis/arxiv_page.html | head -1)
AUTHORS=$(grep -oP 'citation_author" content="\K[^"]*' /tmp/paper_analysis/arxiv_page.html | paste -sd ', ')
DATE=$(grep -oP 'citation_date" content="\K[^"]*' /tmp/paper_analysis/arxiv_page.html | head -1)
2.3 读取TeX源码内容
# 读取各章节内容
cat /tmp/paper_analysis/1-introduction.tex > /tmp/paper_analysis/intro.txt
cat /tmp/paper_analysis/2-joint-optimization.tex > /tmp/paper_analysis/methods.txt
cat /tmp/paper_analysis/3-agent-swarm.tex > /tmp/paper_analysis/agent_swarm.txt
cat /tmp/paper_analysis/5-eval.tex > /tmp/paper_analysis/eval.txt
步骤2.1 从arXiv获取
-
获取论文元数据
- 使用WebFetch访问arXiv API
- 查询参数:
id_list=[arXiv ID] - 提取:标题、作者、摘要、发布日期、类别、链接、PDF链接
-
获取PDF内容和图片
- 使用WebFetch获取PDF
- 重要:提取论文中的所有图片
- 保存图片到
20_Research/Papers/[领域]/[论文标题]/images/ - 生成图片索引:
images/index.md
2.2 从Hugging Face获取(如果适用)
- 获取论文详情
- 使用WebFetch访问Hugging Face
- 提取:标题、作者、摘要、标签、点赞、下载
步骤3:执行深度分析
3.1 分析摘要
-
提取关键概念
- 识别主要研究问题
- 列出关键术语和概念
- 注明技术领域
-
总结研究目标
- 要解决的问题是什么?
- 提出的解决方案方法是什么?
- 主要贡献是什么?
-
生成中文翻译
- 将英文摘要翻译成流畅的中文
- 使用适当的技术术语
3.2 分析方法论
-
识别核心方法
- 主要算法或方法
- 技术创新点
- 与现有方法的区别
-
分析方法结构
- 方法组件及其关系
- 数据流或处理流水线
- 关键参数或配置
-
评估方法新颖性
- 这个方法有什么独特之处?
- 与现有方法相比如何?
- 有什么关键创新?
3.3 分析实验
-
提取实验设置
- 使用的数据集
- 对比基线方法
- 评估指标
- 实验环境
-
提取结果
- 关键性能数字
- 与基线的对比
- 消融研究(如果有)
-
评估实验严谨性
- 实验是否全面?
- 评估是否公平?
- 基线是否合适?
3.4 生成洞察
-
研究价值
- 理论贡献
- 实际应用
- 领域影响
-
局限性
- 论文中提到的局限性
- 潜在弱点
- 有什么假设可能不成立?
-
未来工作
- 作者建议的后续研究
- 有什么自然的扩展?
- 有什么改进空间?
-
与相关工作对比
- 搜索相关历史论文
- 与相似论文相比如何?
- 补充了什么空白?
- 属于哪个研究路线
步骤3:复制图片并生成索引
# 复制figures目录到目标位置
cp /tmp/paper_analysis/*.{pdf,png,jpg,jpeg} "PAPERS_DIR/[DOMAIN]/[PAPER_TITLE]/images/" 2>/dev/null
# 列出复制的内容
ls "PAPERS_DIR/[DOMAIN]/[PAPER_TITLE]/images/"
步骤4:生成综合论文笔记
4.1 确定笔记路径和领域
# 根据论文内容确定领域(智能体/大模型/多模态技术/强化学习_LLM_Agent等)
# 推断规则:
# - 如果提到"agent/swarm/multi-agent/orchestration" → 智能体
# - 如果提到"vision/visual/image/video" → 多模态技术
# - 如果提到"reinforcement learning/RL" → 强化学习_LLM_Agent
# - 如果提到"language model/LLM/MoE" → 大模型
# - 否则 → 其他
PAPERS_DIR="${VAULT_ROOT}/20_Research/Papers"
DOMAIN="[推断的领域]"
PAPER_TITLE="[论文标题,空格替换为下划线]"
NOTE_PATH="${PAPERS_DIR}/${DOMAIN}/${PAPER_TITLE}.md"
IMAGES_DIR="${PAPERS_DIR}/${DOMAIN}/${PAPER_TITLE}/images"
INDEX_PATH="${IMAGES_DIR}/index.md"
4.2 使用Python生成笔记(正确处理Obsidian格式)
# 调用外部脚本生成笔记
python "scripts/generate_note.py" --paper-id "[PAPER_ID]" --title "[论文标题]" --authors "[作者]" --domain "[领域]" --language "$LANGUAGE"
4.3 使用obsidian-markdown skill生成最终笔记
当分析完成后,调用obsidian-markdown skill来确保格式正确,然后手动补充详细内容。
步骤5:更新知识图谱
5.1 读取现有图谱
GRAPH_PATH="${PAPERS_DIR}/../PaperGraph/graph_data.json"
cat "$GRAPH_PATH" 2>/dev/null || echo "{}"
5.2 生成图谱节点和边
# 调用外部脚本更新知识图谱
python "scripts/update_graph.py" --paper-id "[PAPER_ID]" --title "[论文标题]" --domain "[领域]" --score [评分] --language "$LANGUAGE"
步骤4:生成综合论文笔记
4.1 笔记结构
---
date: "YYYY-MM-DD"
paper_id: "arXiv:XXXX.XXXXX"
title: "论文标题"
authors: "作者列表"
domain: "[领域名称]"
tags:
- 论文笔记
- [领域标签]
- [方法标签-无空格] # 标签名不能有空格,空格替换为-
# ⚠️ 标签名格式规则
# Obsidian的tag名称不能包含空格,如有空格需用短横线(-)连接
# 例如:
# "Agent Swarm" → "Agent-Swarm"
# "Visual Agentic" → "Visual-Agentic"
# "MoonViT-3D" → "MoonViT-Three-D"
#
# Python脚本(scripts/generate_note.py)会自动处理标签名中的空格
# 将所有tag.replace(' ', '-')移除空格
- [相关论文1] ← 在tags中添加相关论文
- [相关论文2] ← 在tags中添加相关论文
quality_score: "[X.X]/10"
created: "YYYY-MM-DD"
updated: "YYYY-MM-DD"
status: analyzed
---
# [论文标题]
## 核心信息
- **论文ID**:arXiv:XXXX.XXXXX
- **作者**:[作者1, 作者2, 作者3]
- **机构**:[从作者推断或查看论文]
- **发布时间**:YYYY-MM-DD
- **会议/期刊**:[从categories推断]
- **链接**:[arXiv](链接) | [PDF](链接)
- **引用**:[如果可获取]
## 摘要翻译
### 英文摘要
[论文的英文摘要原文]
### 中文翻译
[将英文摘要翻译成流畅的中文,保持学术术语的准确性]
### 核心要点提炼
- **研究背景**:[该研究领域的现状和存在的问题]
- **研究动机**:[为什么要做这项研究]
- **核心方法**:[一句话概括主要方法]
- **主要结果**:[最重要的实验结果]
- **研究意义**:[该研究对领域的贡献]
## 研究背景与动机
### 领域现状
[详细描述该研究领域当前的发展状况]
### 现有方法的局限性
[深入分析现有方法存在的问题:]
### 研究动机
[解释为什么需要这项研究:]
## 研究问题
### 核心研究问题
[清晰、准确地描述论文要解决的核心问题]
## 方法概述
### 核心思想
[用通俗易懂的语言解释方法的核心思想,让非专业人士也能理解]
### 方法框架
#### 整体架构
[描述方法的整体架构,包括主要组件和它们之间的关系]
**架构图选择原则**:
1. **优先使用论文中的现成图** - 如果论文PDF中有架构图/流程图/方法图,直接插入
2. **仅在无图时创建Canvas** - 当论文没有合适的架构图时,才用JSON Canvas自行绘制
**方式1:插入论文中的图(优先)**
图1:[架构描述,包括图中各个部分的含义和它们之间的关系]
**注意**:图片文件名必须与实际文件名匹配(从arXiv提取的图片通常是`.pdf`格式)
**方式2:创建Canvas架构图(论文无图时使用)**
调用 `json-canvas` skill 创建 `.canvas` 文件,然后嵌入:
![[论文标题_Architecture.canvas|1200|400]]
Canvas 创建步骤:
1. 调用 `json-canvas` skill
2. 使用 `--create --file "路径/架构图.canvas"` 参数
3. 创建节点和连接,使用不同颜色区分层级
4. 保存后在markdown中嵌入引用
**文本图表示例**(当无法插入图片或创建Canvas时的最后备选):
输入 → [模块1] → [模块2] → [模块3] → 输出 ↓ ↓ ↓ [子模块] [子模块] [子模块]
#### 各模块详细说明
**模块1:[模块名称]**
- **功能**:[该模块的主要功能]
- **输入**:[输入数据/信息]
- **输出**:[输出数据/信息]
- **处理流程**:
1. [步骤1详细描述]
2. [步骤2详细描述]
3. [步骤3详细描述]
- **关键技术**:[使用的关键技术或算法]
- **数学公式**:[如果有重要的数学公式]
[公式内容]
**模块2:[模块名称]**
- **功能**:[该模块的主要功能]
- **输入**:[输入数据/信息]
- **输出**:[输出数据/信息]
- **处理流程**:
1. [步骤1详细描述]
2. [步骤2详细描述]
3. [步骤3详细描述]
- **关键技术**:[使用的关键技术或算法]
**模块3:[模块名称]**
[类似格式]
### 方法架构图
[选择最适合的方式展示架构]
**选择原则**:
1. **优先使用论文中的架构图** - 如果论文中有合适的方法架构图、流程图或系统图,直接插入
2. **仅在无图时创建Canvas** - 当论文没有相关架构图时,才用JSON Canvas自行绘制
**方式1:插入论文中的图(优先)**
图1:[架构描述,包括图中各个部分的含义和它们之间的关系]
**注意**:图片文件名必须与实际文件名匹配(从arXiv提取的图片通常是`.pdf`格式)
**方式2:创建Canvas架构图(论文无图时使用)**
![[论文标题_Architecture.canvas|1200|400]]
调用`json-canvas` skill创建,支持:
- 彩色节点(颜色1-6或自定义hex)
- 带标签的箭头连接
- 节点分组和层级结构
- Markdown文本渲染
**注意**:Canvas只作为补充手段,不要替换论文中原有的架构图。论文中的图通常更准确、更权威。
## 实验结果
### 实验目标
[本实验要验证什么]
### 数据集
#### 数据集统计
| 数据集 | 样本数 | 特征维度 | 类别数 | 数据类型 |
|--------|--------|----------|--------|----------|
| 数据集1 | X万 | Y维 | Z类 | [类型] |
| 数据集2 | X万 | Y维 | Z类 | [类型] |
### 实验设置
#### 基线方法
[列出所有对比的基线方法,并简要说明]
#### 评估指标
[列出所有评估指标,并解释每个指标的含义]
#### 实验环境
#### 超参数设置
### 主要结果
#### 主实验结果
| 方法 | 数据集1-指标1 | 数据集1-指标2 | 数据集2-指标1 | 数据集2-指标2 | 平均排名 |
|------|---------------|---------------|---------------|---------------|----------|
| 基线1 | X.X±Y.Y | X.X±Y.Y | X.X±Y.Y | X.X±Y.Y | N |
| 基线2 | X.X±Y.Y | X.X±Y.Y | X.X±Y.Y | X.X±Y.Y | N |
| 基线3 | X.X±Y.Y | X.X±Y.Y | X.X±Y.Y | X.X±Y.Y | N |
| **本文方法** | **X.X±Y.Y** | **X.X±Y.Y** | **X.X±Y.Y** | **X.X±Y.Y** | **N** |
> 注:±后的数字表示标准差,**粗体**表示最优结果
#### 结果分析
[对主实验结果的详细分析]
### 消融实验
#### 实验设计
[消融实验的设计思路]
#### 消融结果和分析
### 实验结果图
[插入论文中的实验结果图]

> 图2:[图描述]
**注意**:图片文件名必须与实际文件名匹配(从arXiv提取的图片通常是`.pdf`格式)
## 深度分析
### 研究价值评估
#### 理论贡献
- **贡献1**:[详细描述理论贡献]
- 创新点:[手动分步执行(用于调试)
#### 步骤0:初始化环境
```bash
# 创建工作目录
mkdir -p /tmp/paper_analysis
cd /tmp/paper_analysis
步骤1:识别论文
# 搜索已有笔记
find "${VAULT_ROOT}/20_Research/Papers" -name "*${PAPER_ID}*" -type f
步骤2:获取论文内容
# 下载PDF和源码(见步骤2.1、2.2、2.3)
# 或者从已有数据读取
cat /tmp/paper_analysis/{1-introduction,2-joint-optimization,3-agent-swarm,5-eval}.tex
步骤3:复制图片
# 使用extract-paper-images skill
/extract-paper-images "$PAPER_ID" "$DOMAIN" "$TITLE"
步骤4:生成笔记
# 使用外部脚本生成笔记
python "scripts/generate_note.py" --paper-id "$PAPER_ID" --title "$TITLE" --authors "$AUTHORS" --domain "$DOMAIN" --language "$LANGUAGE"
步骤5:更新图谱
# 使用外部脚本更新知识图谱
python "scripts/update_graph.py" --paper-id "$PAPER_ID" --title "$TITLE" --domain "$DOMAIN" --score 8.8 --language "$LANGUAGE"
步骤6:使用obsidian-markdown skill修复格式
分析完成后,调用/obsidian-markdown来确保frontmatter格式正确,然后手动补充详细内容。
完整工作流程示例
场景1:分析arXiv论文(有网络访问)
# 一键执行
bash run_full_analysis.sh 2602.02276 "Kimi K2.5: Visual Agentic Intelligence" "Kimi Team" "智能体"
场景2:分析本地PDF(无网络访问)
# 手动上传PDF
cp /path/to/local.pdf /tmp/paper_analysis/[ID].pdf
# 执行分析(跳过步骤2的下载)
python3 run_paper_analysis.py [ID] [TITLE] [AUTHORS] [DOMAIN] --local-pdf /tmp/paper_analysis/[ID].pdf
新理论/新方法/新视角]
-
学术价值:[对学术界的价值]
-
影响范围:[影响的研究领域]
-
贡献2:[详细描述理论贡献] [类似格式]
实际应用价值
-
应用场景1:[应用场景描述]
- 适用性:[该方法在该场景的适用性]
- 优势:[相比现有方案的优势]
- 潜在影响:[可能带来的影响]
-
应用场景2:[应用场景描述] [类似格式]
领域影响
- 短期影响:[近期可能产生的影响]
- 中期影响:[中期可能产生的影响]
- 长期影响:[长期可能产生的影响]
- 潜在变革:[可能带来的范式变革]
方法优势详解
优势1:[优势名称]
- 描述:[详细描述该优势]
- 技术基础:[该优势的技术基础]
- 实验验证:[实验如何验证该优势]
- 对比分析:[与现有方法相比的优势程度]
优势2:[优势名称]
[类似格式]
优势3:[优势名
重要规则称]
[类似格式]
局限性分析
##所有 局都限用上限名称]
- 描述:[详细描述该局限性]
- 表现:[在实际中的表现]
- 原因:[产生该局限的根本原因]
- 影响:[对实际应用的影响]
- 可能的解决方案:[如何缓解或解决]
局限2:[局限名称]
[类似格式]
局限3全面分析名称]包含所有部分,图文并茂场景分析
适用场景
-
场景1:[场景描述]
- 适用原因:[为什么适用]
- 预期效果:[预期能达到的效果]
- 注意事项:[使用时需要注意什么]
-
场景2:[场景描述] [类似格式]
不适用场景
-
场景1:[场景描述]
- 不适用原因:[为什么不适用]
- 替代方案:[建议使用什么替代方案]
-
场景2:[场景描述] [类似格式]
与相关论文对比
对比论文选择依据
[为什么选择这些论文进行对比]
[[相关论文1]] - [论文标题]
基本信息
- 作者:[作者]
- 发表时间:[时间]
- 会议/期刊:[ venue]
- 核心方法:[一句话概括]
方法对比
| 对比维度 | 相关论文1 | 本文方法 |
|---|---|---|
| 核心思想 | [描述] | [描述] |
| 技术路线 | [描述] | [描述] |
| 关键组件 | [描述] | [描述] |
| 创新程度 | [描述] | [描述] |
性能对比
| 数据集 | 指标 | 相关论文1 | 本文方法 | 提升幅度 |
|---|---|---|---|---|
| 数据集1 | 指标1 | X.X | Y.Y | +Z.Z% |
| 数据集2 | 指标2 | X.X | Y.Y | +Z.Z% |
关系分析
- 关系类型:[改进/扩展/对比/跟随]
- 本文改进:[相比该论文的改进点]
- 优势:[本文方法的优势]
- 劣势:[本文方法的劣势]
- 互补性:[两种方法是否互补]
[[相关论文2]] - [论文标题]
[类似格式]
[[相关论文3]] - [论文标题]
[类似格式]
对比总结
[对所有对比论文的总结]
技术路线定位
所属技术路线
本文属于[技术路线名称],该技术路线的核心特点是:
- 特点1:[描述]
- 特点2:[描述]
- 特点3:[描述]
技术路线发展历程
[里程碑1] → [里程碑2] → [里程碑3] → [本文工作] → [未来方向]
↑ ↑ ↑ ↑
[论文A] [论文B] [论文C] [本文]
本文在技术路线中的位置
- 承上:[继承了哪些前期工作]
- 启下:[为后续工作提供了什么基础]
- 关键节点:[为什么是技术路线中的关键节点]
具体子方向
本文主要关注[具体子方向],该子方向的研究重点是:
- 重点1:[描述]
- 重点2:[描述]
相关工作图谱
[用文本或图形表示与相关工作的关系]
未来工作建议
作者建议的未来工作
-
建议1:[作者的建议]
- 可行性:[是否可行]
- 价值:[潜在价值]
- 难度:[实现难度]
-
建议2:[作者的建议] [类似格式]
基于分析的未来方向
-
方向1:[方向描述]
- 动机:[为什么这个方向值得研究]
- 可能的方法:[可能的研究方法]
- 预期成果:[可能取得的成果]
- 挑战:[面临的挑战]
-
方向2:[方向描述] [类似格式]
-
方向3:[方向描述] [类似格式]
改进建议
[对本文方法的具体改进建议]
-
改进1:[改进描述]
- 当前问题:[存在的问题]
- 改进方案:[如何改进]
- 预期效果:[预期能达到的效果]
-
改进2:[改进描述] [类似格式]
我的综合评价
价值评分
总体评分
[X.X]/10 - [评分理由简述]
分项评分
| 评分维度 | 分数 | 评分理由 |
|---|---|---|
| 创新性 | [X]/10 | [详细理由] |
| 技术质量 | [X]/10 | [详细理由] |
| 实验充分性 | [X]/10 | [详细理由] |
| 写作质量 | [X]/10 | [详细理由] |
| 实用性 | [X]/10 | [详细理由] |
重点关注
值得关注的技术点
需要深入理解的部分
我的笔记
%% 用户可以在这里添加个人阅读笔记 %%
相关论文
直接相关
- [[相关论文1]] - [关系描述:改进/扩展/对比等]
- [[相关论文2]] - [关系描述]
背景相关
- [[背景论文1]] - [关系描述]
- [[背景论文2]] - [关系描述]
后续工作
- [[后续论文1]] - [关系描述]
- [[后续论文2]] - [关系描述]
外部资源
[可列举一些相关的视频、博客、项目等的链接]
[!tip] 关键启示 [论文最重要的启示,用一句话总结核心思想]
[!warning] 注意事项
- [注意事项1]
- [注意事项2]
- [注意事项3]
[!success] 推荐指数 ⭐⭐⭐⭐⭐ [推荐指数和简要理由,如:强烈推荐阅读!这是XX领域的里程碑论文]
## 步骤5:更新知识图谱
### 5.1 添加或更新节点
1. **读取图谱数据**
- 文件路径:`$OBSIDIAN_VAULT_PATH/20_Research/PaperGraph/graph_data.json`
2. **添加或更新该论文的节点**
- 包含分析元数据:
- quality_score
- tags
- domain
- analyzed: true
3. **创建到相关论文的边**
- 对每篇相关论文,创建边
- 边类型:
- `improves`:改进关系
- `related`:一般关系
- 权重:基于相似度(0.3-0.8)
4. **更新时间戳**
- 设置`last_updated`为当前日期
5. **保存图谱**
- 写入更新的graph_data.json
## 步骤6:展示分析摘要
### 6.1 输出格式
```markdown
## 论文分析完成!
**论文**:[[论文标题]] (arXiv:XXXX.XXXXX)
**分析状态**:✅ 已生成详细笔记
**笔记位置**:[[20_Research/Papers/领域/YYYY-MM-DD-arXiv-ID.md]]
---
**综合评分**:[X.X/10]
**分项评分**:
- 创新性:[X/10]
- 技术质量:[X/10]
- 实验充分性:[X/10]
- 写作质量:[X/10]
- 实用性:[X/10]
**突出亮点**:
- [亮点1]
- [亮点2]
- [亮点3]
**主要优势**:
- [优势1]
- [优势2]
**主要局限**:
- [局限1]
- [局限2]
**相关论文**(N篇):
- [[相关论文1]] - [关系]
- [[相关论文2]] - [关系]
- [[相关论文3]] - [关系]
**技术路线**:
本文属于[技术路线],主要关注[子方向]。
---
**快速操作**:
- 点击笔记链接查看详细分析
- 使用`/paper-search`搜索更多相关论文
- 打开Graph View查看论文关系
- 根据分析决定深入研究或跳过
**建议**:
- [基于分析的具体建议1]
- [基于分析的具体建议2]
重要规则
- 保留用户现有笔记 - 不要覆盖手动笔记
- 使用全面分析 - 涵盖方法论、实验、价值评估
- 提供中文内容 - 翻译和解释用中文
- 引用相关工作 - 建立连接到现有知识库
- 客观评分 - 使用一致的评分标准
- 更新知识图谱 - 维护论文间关系
- 图文并茂 - 论文中的所有图都要用上(核心架构图、方法图、实验结果图等)
- 优雅处理错误 - 如果一个源失败则继续
- 管理token使用 - 全面但不超出token限制
分析标准
评分细则(0-10分制)
创新性:
- 9-10分:新颖突破、新范式
- 7-8分:显著改进或组合
- 5-6分:次要贡献、已知或已确立
- 3-4分:增量改进
- 1-2分:已知或已确立
技术质量:
- 9-10分:严谨的方法论、合理的方法
- 7-8分:良好的方法、次要问题
- 5-6分:可接受的方法、有问题的方法
- 3-4分:有问题的方法、差的方法
- 1-2分:差的方法
实验充分性:
- 9-10分:全面的实验、强基线
- 7-8分:良好的实验、充分的基线
- 5-6分:可接受的实验、部分基线
- 3-4分:有限的实验、差基线
- 1-2分:差的实验或没有基线
写作质量:
- 9-10分:清晰、组织良好
- 7-8分:总体清晰、次要问题
- 5-6分:可理解、部分不清晰
- 3-4分:难以理解、混乱
- 1-2分:差写作
实用性:
- 9-10分:高实用影响、可直接应用
- 7-8分:良好实用潜力
- 5-6分:中等实用价值
- 3-4分:有限实用性、理论性仅
- 1-2分:低实用性、理论性仅
关系类型定义
improves:对相关工作的明显改进extends:扩展或建立在相关工作之上compares:直接对比,可能更好/更差在什么方面follows:同一研究路线的后续工作cites:引用(如果有引用数据可用)related:一般概念关系
## 错误处理
- **论文未找到**:检查ID格式,建议搜索
- **arXiv掉线**:使用缓存或稍后重试,在输出中注明局限性
- **PDF解析失败**:回退到摘要,注明局限性
- **相关论文未找到**:说明缺乏上下文
- **图谱更新失败**:继续但不更新图谱
## 使用说明
当用户调用 `/paper-analyze [论文ID]` 时:
### 快速执行(推荐)
使用以下bash脚本一键执行完整流程:
```bash
#!/bin/bash
# 变量设置
PAPER_ID="$1"
TITLE="${2:-待定标题}"
AUTHORS="${3:-Kimi Team}"
DOMAIN="${4:-其他}"
# 执行完整流程
python "scripts/generate_note.py" --paper-id "$PAPER_ID" --title "$TITLE" --authors "$AUTHORS" --domain "$DOMAIN" --language "$LANGUAGE" --language "$LANGUAGE" || \
echo "笔记生成脚本执行失败"
# 提取图片
# 调用 extract-paper-images skill
# /extract-paper-images "$PAPER_ID" "$DOMAIN" "$TITLE" || \
# echo "图片提取失败"
手动分步执行(用于调试)
步骤0:初始化环境
# 创建工作目录
mkdir -p /tmp/paper_analysis
cd /tmp/paper_analysis
步骤1:识别论文
# 搜索已有笔记
find "${VAULT_ROOT}/20_Research/Papers" -name "*${PAPER_ID}*" -type f
步骤2:获取论文内容
# 下载PDF和源码(见步骤2.1、2.2、2.3)
# 或者从已有数据读取
cat /tmp/paper_analysis/{1-introduction,2-joint-optimization,3-agent-swarm,5-eval}.tex
步骤3:复制图片
# 使用extract-paper-images skill
/extract-paper-images "$PAPER_ID" "$DOMAIN" "$TITLE"
步骤4:生成笔记
# 使用外部脚本生成笔记
python "scripts/generate_note.py" --paper-id "$PAPER_ID" --title "$TITLE" --authors "$AUTHORS" --domain "$DOMAIN" --language "$LANGUAGE"
步骤5:更新图谱
# 使用外部脚本更新知识图谱
python "scripts/update_graph.py" --paper-id "$PAPER_ID" --title "$TITLE" --domain "$DOMAIN" --score 8.8 --language "$LANGUAGE"
步骤6:使用obsidian-markdown skill修复格式
分析完成后,调用/obsidian-markdown来确保frontmatter格式正确,然后手动补充详细内容。
完整工作流程示例
场景1:分析arXiv论文(有网络访问)
# 一键执行
bash run_full_analysis.sh 2602.02276 "Kimi K2.5: Visual Agentic Intelligence" "Kimi Team" "智能体"
场景2:分析本地PDF(无网络访问)
# 手动上传PDF
cp /path/to/local.pdf /tmp/paper_analysis/[ID].pdf
# 执行分析(跳过步骤2的下载)
python3 run_paper_analysis.py [ID] [TITLE] [AUTHORS] [DOMAIN] --local-pdf /tmp/paper_analysis/[ID].pdf
注意事项
-
frontmatter格式(重要):所有字符串值必须用双引号包围
--- date: "YYYY-MM-DD" paper_id: "arXiv:XXXX.XXXXX" title: "论文标题" authors: "作者列表" domain: "[领域名称]" quality_score: "[X.X]/10" created: "YYYY-MM-DD" updated: "YYYY-MM-DD" status: analyzed ---Obsidian对YAML格式要求严格,缺少引号会导致frontmatter无法正常显示!
-
图片路径:使用相对路径
images/xxx(不指定扩展名,Obsidian会自动识别)- 重要:从arXiv提取的图片通常是
.pdf格式,Obsidian可以直接显示PDF图片 - 图片路径应使用实际文件名,如
images/loss_curve.pdf或images/figure1.png
- 重要:从arXiv提取的图片通常是
-
wikilinks:使用
[[论文名]]格式 -
领域推断:根据论文内容自动推断
-
相关论文:在笔记中引用
[[相关论文]],图谱会自动创建边
重要规则
关键特性
图文并茂:论文中的所有图片都要用上
- 保存到正确位置:
20_Research/Papers/[领域]/[论文标题]/images/ - 图片索引:生成
images/index.md索引所有图片 - 与start-my-day区别:paper-analyze用于深度分析单篇论文
- 全面分析:包含所有部分,图文并茂