literature-reader
Literature Reader — 文献阅读与概要生成
指令
Step 1: 获取 PDF 内容
首选方式: 使用 Cursor 内置 Read 工具直接读取 PDF 文件。
Read tool → path: "/path/to/paper.pdf"
Read 工具会自动将 PDF 转换为文本。如果 PDF 过大被截断,分段读取:
Read tool → path: "/path/to/paper.pdf", offset: 1, limit: 200
Read tool → path: "/path/to/paper.pdf", offset: 201, limit: 200
备选方式: 若 Read 工具无法读取 PDF(返回空内容、乱码、严重截断),或遇到扫描件、复杂排版等情况,请查阅 PDF 文本提取指南 使用备选提取脚本。
快速使用:
pip3 install pdfplumber # 首次使用需安装
python3 ~/.cursor/skills/literature-reader/scripts/extract_pdf.py "/path/to/paper.pdf" --output /tmp/paper_text.txt
预期输出:终端显示 Extracted text saved to: /tmp/paper_text.txt,随后用 Read 工具读取该文件。完整参数说明、判断标准和故障排查见 references/pdf-extract.md。
Step 2: 内容分析
按以下维度逐一分析提取到的文本:
- 元信息提取 — 标题、作者、机构、发表年份、期刊/会议
- 研究问题识别 — 论文试图回答什么问题,解决什么痛点
- 方法论梳理 — 使用了什么研究方法、技术路线、实验设计
- 核心贡献归纳 — 论文的主要创新点和学术贡献(通常在 Introduction 末尾或 Abstract 中明确列出)
- 实验与结果 — 关键实验设置、数据集、指标、定量结果
- 局限性与未来方向 — 作者承认的不足、提出的后续工作
Step 3: 生成文献概要
使用模板生成结构化输出。模板见 summary-template.md。
输出格式为 Markdown 文件,文件名建议:[第一作者姓氏]_[年份]_[关键词缩写].md
Step 4: 质量检查
生成概要后进行自查:
- 元信息(标题、作者、年份)是否准确
- 研究问题是否清晰表述
- 方法描述是否抓住了核心技术路线而非细枝末节
- 核心贡献是否与论文 Abstract/Introduction 一致
- 关键数据和结论是否有具体数值支撑
- 个人评价是否客观且有理有据
特殊场景处理
批量文献阅读
当用户提供多篇论文时:
- 逐篇按上述流程处理
- 在最后额外输出一份 横向对比表,包含:标题、年份、方法、数据集、核心指标、主要贡献
- 简要说明各论文之间的关系(互补/竞争/递进)
横向对比表模板见 summary-template.md 底部。
特定章节深读
当用户只关心论文某一部分(如方法论、实验结果)时:
- 仅展开该部分的详细分析
- 其余部分保持一句话概述
- 对关键公式、算法伪代码进行解读
中文论文
中文论文使用中文输出概要。对中文论文中引用的英文术语,保留原文并在括号内标注,如:注意力机制(Attention Mechanism)。
输出规范
- 文献概要长度:1000–2000 字(视论文复杂度调整)
- 语言:与论文语言一致,或遵从用户指定语言
- 格式:Markdown,使用清晰的层级标题
- 关键术语首次出现时标注英文原文
- 数据和结论必须标注出处章节(如 "见 Table 3" "Section 4.2")
示例
示例 1:单篇论文精读
用户说:「帮我读一下这篇论文 /Users/me/papers/attention.pdf」 操作:
- 使用 Read 工具读取 PDF 内容
- 按 Step 2 维度逐一分析
- 按模板生成完整文献概要 结果:输出结构化的 Markdown 概要文件
示例 2:批量对比
用户说:「对比一下这三篇论文 /papers/a.pdf /papers/b.pdf /papers/c.pdf」 操作:
- 逐篇读取并生成概要
- 输出横向对比表
- 分析论文间的互补/递进/竞争关系 结果:三份独立概要 + 一份横向对比分析
示例 3:章节深读
用户说:「这篇论文的方法部分具体是怎么做的?」 操作:
- 读取 PDF 并定位方法论章节
- 详细解读技术路线、关键公式和算法
- 其余章节一句话概述 结果:聚焦方法论的深度分析
故障排查
Read 工具读取 PDF 为空或乱码
原因:PDF 为扫描件(图片格式)或使用了特殊编码 解决方案:改用备选提取脚本,详见 PDF 文本提取指南
PDF 内容被截断
原因:PDF 页数过多,单次读取超出限制 解决方案:
- 使用 Read 工具分段读取,每次 200 行,直到覆盖全部内容
- 或使用备选提取脚本的
--pages参数按范围提取,详见 references/pdf-extract.md
pdfplumber 安装失败或脚本报错
详见 PDF 文本提取指南 - 故障排查 中的完整排查步骤
More from wpsnote/wpsnote-skills
wps-note
通过 MCP 工具读取、编辑和管理 WPS 笔记,基于 block 文档模型,所有内容以
62novel-writer
AI 陪伴式长篇小说创作助手,结合 WPS 笔记实现有记忆、懂上下文、不穿帮的持续创作。触发词:帮我写小说、我想写一部小说、继续写小说、写下一章、我有个故事想法、帮我创作。核心能力:冷启动建档(世界观+人物设定+AI生图)、按章写作、每次自动回顾上文防穿帮、全程归档 WPS 笔记。不适用于:短文、散文、诗歌等非长篇小说创作。
27skill-creator
Create new skills, modify and improve existing skills, and measure skill performance. Use when users want to create a skill from scratch, edit, or optimize an existing skill, run evals to test a skill, benchmark skill performance with variance analysis, or optimize a skill's description for better triggering accuracy.
20novel-writer-cli
AI 陪伴式长篇小说创作助手(CLI 版)。通过系统命令行调用 wpsnote-cli 操作 WPS 笔记,实现有记忆、懂上下文、不穿帮的持续创作。触发词:帮我写小说、我想写一部小说、继续写小说、写下一章、我有个故事想法、帮我创作。核心能力:冷启动建档(世界观+人物设定+AI生图)、按章写作、每次自动回顾上文防穿帮、全程归档 WPS 笔记。不适用于:短文、散文、诗歌等非长篇小说创作。
16tag-organize
笔记标签整理的核心原则与完整工作流程。当用户提到"整理笔记标签"、"清理标签"、"标签太乱"、"标签太多"、"帮我打标签"、"重构标签"、"重新分类"、"笔记分类混乱"、"标签体系需要优化"等需求时使用。
13wpsnote-beautifier
智能美化 WPS 笔记文档,采用克制统一的配色风格(全文仅1种主色调,不混用多色系)。核心能力:优化标题层级结构、用高亮块强调核心结论与注意事项、用分栏展示对比或并列内容、应用统一配色方案并写入。仅当用户明确表达美化需求时才触发,例如:美化笔记、排版优化、文档美化、笔记排版、WPS笔记美化、智能排版、文档结构调整、加颜色、加高亮、加分栏、让笔记好看点、优化文档格式、笔记太丑了、调整排版、加点样式、给笔记润色、整理笔记格式、提升可读性。不要在用户仅要求写入内容、编辑文字、总结归纳等非美化场景下主动触发此skill。通过 user-wpsnote MCP 服务操作 WPS 笔记文档。
13