counterfactual-reasoning

Installation
SKILL.md

反事实思维工具(Counterfactual Reasoning)

本 skill 基于 King、Keohane & Verba(1994)的因果推断逻辑、 Campbell & Stanley(1963)的威胁效度框架,以及社会学实证研究的评审标准, 对研究结论进行系统性压力测试,帮助研究者在提交前识别和处理论证弱点。

核心立场:一个经得住检验的结论,是被竭力反驳之后仍然成立的结论,而不是没有被反驳过的结论。 主动寻找竞争性解释并处理它们,比等待审稿人指出要有价值得多。


启动:获取必要信息

触发后,收集以下信息:

必填 1:核心结论或论点

用户希望进行压力测试的结论,尽量具体,例如:

"平台工人通过'时间自由叙事'内化了平台对劳动时间管理责任的转移, 这是一种主体性的屈从(subjectivation),而非单纯的意识形态灌输。"

必填 2:支撑结论的主要证据

简要说明结论建立在什么数据/材料基础上:

  • 定性研究:受访者人数、类型、核心资料来源
  • 定量研究:样本量、变量操作化、核心统计结果

选填 3:研究设计概述

  • 研究方法类型
  • 案例选择策略
  • 数据收集方式

选填 4:用户已意识到的弱点

研究者自己已经注意到的潜在问题(优先处理)。

选填 5:目标期刊

不同期刊的审稿文化不同,可以影响压力测试的侧重点。


执行流程

收到信息后,自动连续执行以下四个阶段,无需每步等待用户确认。


第一阶段:结论解剖

在压力测试之前,先精确解析结论的逻辑结构:

  1. 核心主张:结论声称 A 导致(或解释了)B,其中 A 和 B 分别是什么?
  2. 因果方向:是单向因果?双向?还是条件性关系?
  3. 适用范围:结论明示或暗示适用于哪类情境、人群、时间段?
  4. 机制描述:结论背后声称发生了什么机制?(不只是"A→B",而是"A 通过 X 过程导致 B")
  5. 证据-结论的跨度:现有证据直接支撑到哪里?从证据到结论做了多大的推论跳跃?

输出格式

【结论解剖】
核心主张:A = [  ],B = [  ]
因果/解释方向:
适用范围(显性):
适用范围(隐性预设):
声称的机制:
证据实际覆盖到:[具体到哪里]
推论跨度评估:小 / 中 / 大

第二阶段:竞争性解释枚举

系统枚举所有可能与当前结论竞争的替代解释。按以下五类来源逐一检索:

来源 1:混淆变量(Confounding Variables)

有没有第三个变量同时影响了原因变量和结果变量,使得观察到的关系是虚假的?

针对研究的具体情境,提出 2-4 个最可能的混淆变量候选,并说明:

  • 该变量如何同时影响两端?
  • 研究设计是否控制了这个变量?
  • 如果没有控制,结论的稳健性受到多大威胁?

来源 2:反向因果(Reverse Causation)

B 有没有可能是 A 的原因,而非结果? 或者两者互为因果?

说明反向因果的可能路径,并评估:

  • 时间顺序是否足够清晰?
  • 有没有工具变量或其他因果识别策略?

来源 3:选择性偏差(Selection Bias)

研究的样本/案例是否系统性地倾向某种特征,导致结论不具代表性?

检查:

  • 样本如何被选入研究?选入过程有没有内生性?
  • "沉默的多数"——那些没有进入样本的对象,会和样本有什么系统性差异?
  • 访谈研究中:接受访谈的人与拒绝访谈的人,有没有系统性差异?

来源 4:观察者效应(Observer Effects)

研究者的存在或研究过程本身,是否改变了被研究现象?

在定性研究中尤其重要:

  • 受访者是否在研究者面前呈现了与日常不同的行为或叙述?
  • 受访者是否猜测了研究者的期望并迎合它?
  • 反思性:研究者的身份、立场如何影响了数据收集和解读?

来源 5:替代机制(Alternative Mechanisms)

即使 A→B 的关系成立,有没有与当前解释不同的机制也能产生同样的结果?

这是最具挑战性的一类:机制的竞争。 列出 2-3 个替代机制,每个替代机制说明:

  • 这个替代机制的逻辑是什么?
  • 它会产生和当前结论相同的可观测模式吗?
  • 什么样的证据能够区分这两个机制?

输出格式(每类竞争性解释):

[竞争性解释类型:混淆变量/反向因果/选择偏差/观察者效应/替代机制]
具体威胁描述:
威胁的严重程度:高 / 中 / 低
当前研究的处理情况:已处理 / 部分处理 / 未处理
如果未处理,对结论可信度的影响:
可能的回应策略:

第三阶段:结论范围检验

压力测试结论的适用边界,防止过度概括:

检验 1:案例代表性

研究者选择的案例/样本能否支撑所声称的普遍性程度?

  • 如果结论声称"在X情境下普遍成立",当前证据覆盖了X的哪些子类型?
  • 有没有明显遗漏的子类型,而那些子类型可能产生不同结果?

检验 2:时间稳健性

结论是在特定历史时刻成立,还是具有一定的时间稳健性?

  • 数据收集的时间背景有什么特殊性?
  • 如果在其他时间点重复这项研究,结论可能如何变化?

检验 3:情境转移

结论能在多大程度上迁移到其他情境?

  • 哪些情境特征对结论至关重要(改变这些特征,结论就不成立)?
  • 哪些情境特征不影响结论(这些构成结论的稳健性证明)?

输出格式

【结论范围检验】
当前证据实际支撑的范围:[比结论声称的范围更窄?还是基本匹配?]
遗漏的重要子类型:
时间特殊性风险:
情境迁移的边界条件:
建议的结论措辞调整:[将当前过宽的结论收窄至证据能支撑的范围]

第四阶段:模拟审稿人质疑

模拟 2-3 种不同立场的审稿人,提出最可能的核心质疑,并给出应对建议:

审稿人 A:方法论严格派

关注:研究设计的效度、因果推断的严谨性、抽样的合理性

"[模拟质疑内容]"

建议回应策略:

审稿人 B:理论对话派

关注:与现有文献的对话是否准确、理论贡献的原创性、对替代理论的处理

"[模拟质疑内容]"

建议回应策略:

审稿人 C:经验领域专家

关注:对该研究情境的了解是否准确、数据解读是否符合领域常识

"[模拟质疑内容]"

建议回应策略:


第五阶段:综合建议

综合以上分析,给出:

  1. 最需要主动处理的 2-3 个弱点(按威胁程度排序)
  2. 可以通过文本修辞处理的问题(承认局限性、限定结论范围、说明研究设计选择的理由)
  3. 需要补充数据或分析才能真正解决的问题(如果有)
  4. 结论强度建议:当前结论是否过强?建议修改为什么强度?

在所有输出之后,输出以下固定文字:

压力测试的目的是强化结论,而非摧毁结论。 以下问题请研究者判断后告知:

  1. 你认为哪个竞争性解释威胁最大?你有没有尚未告知我的应对材料?
  2. 结论范围的调整建议,你是否认可?
  3. 有没有你刻意保持的结论强度,而不是疏忽?如果是,说明理由。

参考文献

  • King, G., Keohane, R. O., & Verba, S. (1994). Designing Social Inquiry: Scientific Inference in Qualitative Research. Princeton University Press.
  • Campbell, D. T., & Stanley, J. C. (1963). Experimental and Quasi-Experimental Designs for Research. Houghton Mifflin.
  • Mahoney, J. (2010). After KKV: The new methodology of qualitative research. World Politics, 62(1), 120–147.
  • Seawright, J. (2016). Multi-Method Social Science: Combining Qualitative and Quantitative Tools. Cambridge University Press.

语言

  • 默认中文
  • 若用户用英文输入,输出用英文,frontmatter 字段名保持英文
Related skills

More from yipng05-max/-skills

Installs
4
GitHub Stars
101
First Seen
Apr 9, 2026