ljg-paper
ljg-paper: 读论文
读论文不是做学术,是猎取思想。把别人的发现拆解成自己能用的认知。
格式约束
Org-mode 语法
- 加粗用
*bold*(单星号),禁止**bold** - 标题层级从
*开始,不跳级
ASCII Art
所有图表用纯 ASCII 字符。允许:+ - | / \ > < v ^ * = ~ . : # [ ] ( ) _ , ; ! ' " 和空格。禁止 Unicode 绘图符号。
模板权威性
输出结构依据 references/template.org。禁止参考 ~/Documents/notes/ 中已有论文文件的章节结构——旧文件可能使用过期模板。
Denote 文件规范
- 时间戳:
date +%Y%m%dT%H%M%S - 可读时间:
date "+%Y-%m-%d %a %H:%M" - 文件名:
{时间戳}--paper-{简短标题}__paper.org - 输出目录:
~/Documents/notes/
Org 文件头
#+title: {一句精练语句提炼论文核心思想或发现}
#+subtitle: {论文原始标题,通常英文}
#+date: [{YYYY-MM-DD Day HH:MM}]
#+filetags: :paper:
#+identifier: {YYYYMMDDTHHMMSS}
#+source: {URL 或来源描述}
#+authors: {作者列表}
#+venue: {发表场所/年份}
title 这一句怎么写
title 是这篇笔记的灵魂句——读者扫一眼就知道这篇论文带走什么。它不是文件名,不是方法名,是核心思想或发现本身。
写作约束:
- 不复述题目 — 反例:「关于强化学习预训练空间转移的探索性研究」(学术腔)
- 不当方法名介绍 — 反例:「PreRL:把强化学习搬进预训练空间」(这是方法名+方法描述,不是思想)
- 点出那个发现或反直觉之处 — 正例:「奖励信号会把模型锁死在已会的轨迹里,擦掉题目就解锁了」
- 点出关键的反直觉动作 — 正例:「只用错样本做 RL,反思能力自己长出来」
- 长度:10-25 字。短到能记住,长到能承重
title 与「洞见」section 的关系:title 是洞见的灵魂句形式,洞见 section 是同一发现的展开论证。先写完「洞见」section,回头把那段话压成一句填进 title。
title 与文件名的关系:denote 文件名 paper-{简短标题} 的「简短标题」是方法名/核心概念名(如 prerl、dsrl),用于文件检索;title 是思想句,用于内容入口——两者是不同字段,互不替代。
文件写入后报告路径。
红线(每条必须过)
- 口语检验 — 你会这样跟朋友介绍一篇论文吗?不会→改。学术腔是默认敌人
- 零术语 — 先用大白话落地,再顺带提术语名。如果必须用原文术语才能解释,说明还没懂
- 短词优先 — 能用两个字说的不用四个字。「本文提出了一种新的框架」→「他们做了个东西」
- 一句一事 — 每句只推一步
- 具体 — 名词看得见,动词有力气。形容词能砍就砍
- 开头给理由 — 问题部分的第一句让人想知道答案
- 不填充 — 删学术套话(「近年来随着...的发展」「值得注意的是」)。每句干活
- 信任读者 — 说一遍够了。不重复结论
- 诚实 — 论文有硬伤就说有硬伤。看不懂的部分说看不懂
写作原则
四条核心原则,决定文章是"活人在说话"还是"机器在汇报":
- 一个锚点撑全文 — 「问题」里立的那个具象例子就是锚点。「翻译」「核心概念」都在这个锚点上展开,每段都回到它,让读者一直待在同一个问题域里。换锚点 = 换地图 = 读者前面建立的直觉全丢
- 推理外显 — 模拟"一个人想明白的过程",而非呈现"想明白之后的结果"。用"既然A是B,那能不能C也是D?"带读者一起推。让读者觉得结论差一步就是自己想到的
- 变形替代定义 — 解释两个概念的关系时,把A连续变形成B,不要说"A和B是XX关系"。「把LSTM变形→看起来像ResNet」比「LSTM和ResNet是对偶的」有力十倍
- 落点在能用 — 给出"这意味着你可以___",而非"这让我们重新思考___"。读者读完要带走一个能动手的东西,不是一个值得沉思的感慨
工具箱(选用)
讲解论文时可以拿的工具,没有哪个是必须的:
- 类比 — 承重的,方法的关键组件都能映射上。沿着类比走一遍方法
- ASCII 图 — 展示组件关系、数据流、结构对比。读者有概念脚手架后再画
- 餐巾纸速写 — 「以前这么想,现在应该这么想」的并排对比
- 好问题 — 把论文解决的困境变成一个让外行也好奇的问题
- 递进例子 — 从简单到复杂,一步步搭建理解
- 反问入链 — 遇到隐含假设,用问题打开
执行
1. 获取内容
- arxiv URL → WebFetch
- PDF → Read(注意 pages 参数限制)
- 本地文件 → Read
- 论文名称 → WebSearch
确保拿到:标题、作者、摘要、核心方法、结果。
如果论文有一张承载全文核心思路的总览图(overview / architecture diagram,通常是 Figure 1),提取并保存到 ~/Documents/notes/images/,文件名 {identifier}--paper-{简短标题}-overview.png。
判断标准:这张图让人一看就抓住论文在做什么。不是所有论文都有——没有就跳过,不要硬找。
提取方法:
- arxiv → 访问 HTML 版(
arxiv.org/html/...),找到图片 URL,WebFetch 下载 - PDF → 截取含图页面保存为图片
2. 问题:让读者遇到那个困境
不是描述问题,是让读者亲历那个问题。开场给一个具象示例——一个具体场景、一段输入输出、一张失败截图、一个用户故事——让读者在这个例子上看到困境。
不是「大模型在事实回答上存在幻觉问题」,是:「你问 GPT『2023 年图灵奖得主是谁?』它一本正经回答 Yann LeCun。再问一次,它说 Hinton。第三次又变了。」
三段叙事,用同一个例子贯穿:
- 亲历 — 把读者拉到困境现场。例子最好简单到一两句话能说完
- 旧路 — 之前的研究者在这个例子上是怎么做的?为什么走不通?把短板用同一个例子暴露出来,读者看见"哦,这条路确实卡住了"
- 新口 — 本论文作者在这个例子上看到了什么别人没看到的入口?引出他们的解法思路(只引出方向,不展开机制——那是「翻译」的事)
如果论文没有明确的前作(开创性问题、新领域),跳过第二段,直接「亲历→新口」。
反例:「本文提出了一种新的 XXX 框架」——这是学术摘要,不是问题。
3. 翻译:直指方法要义
「问题」已经把困境讲透了——这一节不要再重述问题。重心是"如何做到":论文的方法、机制、关键 insight。
沿用同一个例子:继续在「问题」里那个具象示例上讲。读者刚刚在那个例子上看到旧路走不通、新口在哪里——你现在带他在同一个例子上一步步打开论文的方法。换例子 = 切语境,读者前面建的直觉就丢了。
唯一豁免:如果同一例子无法支撑机制细节(比如算法过程需要展开数据流),引入"子例子"作为延伸——但子例子必须和父例子在同一问题域里,让读者感觉是"放大镜下看局部",而不是换地图。
开头立锚点:找到一个具象的中心隐喻或画面——锚点描述的是方法在那个例子上的样子。比如「在我们刚才那个图灵奖问题上,方法像一个分诊台:先把不确定的回答拦下来再说」。锚点和「问题」例子焊在一起。
一步步揭开,让读者解锁迷雾:每段往前推一步,每段都给读者一个新视角,"啊,原来如此"的小揭秘累积成对例子的深度理解。揭秘动词:"这时候你看……""于是发生了……""那这一步怎么办呢——他们想到……"。前一段说的事打开后一段的口子。
需要覆盖(都在那个例子上):
- 它怎么做的(核心机制/方法)
- 做出来效果如何(挑最说明问题的两三个结果)
- 理解全文需要的钥匙概念(如果有)
子标题按内容需要组织,不必固定。
4. 核心概念:在同一例子上解锁
挑出论文中最关键的 1 至 3 个概念(方法名、架构组件、数学对象、新定义……),逐个拆解。
每个概念都在「问题」那个例子上落地——不是孤立讲一个术语,是回到那个例子,让概念在那个语境里浮出水面。读者每解锁一个概念,对那个例子的理解就深一层,迷雾就散一片。
每个概念:
- 一句话:这东西是什么,干什么用的
- 回到例子:在那个例子上,这个概念长什么样?少了它在那个例子上会怎样?解释两个概念的关系时,优先用"把A变形成B"而非"A和B是XX关系"——变形比定义有力
- 为什么重要:少了它论文的逻辑链断在哪里
选概念的标准:读者如果不懂这个,后面的洞见和审稿就跟不上。已经在「翻译」里讲透的不重复选。
5. 洞见:思想结晶
整篇论文最值钱的往往就一个点——作者真正找到的那颗新结晶。
用一句话把它说出来。这句话应该让读者觉得「这个想法我可以带走」,而不是「哦,论文说了这么个事」。
检验标准:把这句话单独抽出来,脱离论文上下文,它还有没有力量?如果只是在复述论文结论,那不是洞见。洞见是你读完之后自己看到的那个东西——论文里未必直说,但逻辑指向它。
说不出来就重读第三步。如果论文确实没有思想火花,直说「这篇论文是工程改进,没有认知层面的新发现」。不要硬挤。
6. 博导审稿
换身份:这个方向上带了二十年研究生的博导。学生拿着论文来找你,你判断这东西值不值得认真对待。
用白话说,像在办公室跟学生聊:
- 选题眼光:问题值不值得做?真缺口还是人造缺口?
- 方法成熟度:巧劲还是蛮力?有没有更自然的做法被忽略?
- 实验诚意:baseline 公不公道?消融到位没?数字经不经得起追问?
- 写作功力:最该说清楚的地方有没有偷懒?
- 判决:strong accept / weak accept / borderline / weak reject / strong reject,一句话理由
好的说好,差的说差在哪儿。
7. 启发:对我的提醒
落点在"能用",不在"能想"。给出"这意味着你可以___",而非"这让我们重新思考___"。
用三个视角试探连接,命中展开,没命中跳过,全没命中说「没有」:
- 迁移:论文的某个机制/视角能移植升级我体系的某个零件吗?具体怎么接?
- 混搭:论文的某个组件和我已有的东西组合能产生新东西吗?产出什么?
- 反转:论文的做法和我的默认假设相反吗?该停下什么、开始什么?
8. 过红线
逐条扫红线。额外检查:
- 破公式——否定式排比全文不超过两处,三段式改两项或四项
- 变节奏——长短句交替
- 杀金句——听起来像可引用的,重写
- 查跳跃——逻辑每步可追
列修改清单确认后生成文件。
9. 生成 Org 文件
按 Denote 规范获取时间戳,读 references/template.org,写入 ~/Documents/notes/。
验收
- 问题让人亲历:开场有具象示例,读者在例子上遇到困境;旧解法的短板用同一例子暴露
- 翻译直指要义:不重述问题,重心是"如何做到"——方法、机制、关键 insight
- 同例贯穿:翻译和核心概念都在「问题」那个例子上展开,读者一直待在同一个问题域里
- 探索感:每段都给读者一个新视角,"啊原来如此"的小揭秘累积成对例子的深度理解
- 有锚点:翻译部分锚点描述的是"方法在那个例子上的样子",后续概念围绕它生长
- 带着推:读者能感受到"一步步想明白"的过程,而非接收打包好的结论
- 外行能跟:不懂这个领域的聪明人读完能复述核心思路
- 博导像博导:有判断力有分寸,最后一句判决
- 启发能动手:启发部分的落点是"你可以___",不是"值得思考___"
- 零割裂感:读完像一个人在跟你说「我读了篇论文,发现了个有意思的事」