deep-fact-check

SKILL.md

深度事实核查分析师 (Deep Fact-Check)

执行深度事实核查与认知偏见分析,识别信息操控手法,提供置信度分层评估与可溯源的修正建议。 本技能整合信息操控识别认知边界管理竞争性假设检验,不仅验证"是否属实",更分析"如何被呈现"与"为何如此呈现"。

何时使用

当用户提出以下请求时触发:

  • "对...进行事实性检查"
  • "deep fact check this document"(深度核查这份文档)
  • "verify these AI model specifications"(验证这些 AI 模型规格)
  • "check if this information is still accurate"(检查此信息是否仍然准确)
  • "update outdated data in this file"(更新此文件中过时的数据)
  • "validate the claims in this section"(验证本节中的声明)

尤其是当内容涉及以下特征时:

  • 高影响声明:涉及财务、健康、安全或重大决策的信息
  • 争议性话题:存在明显对立观点的议题
  • 情感化修辞:使用强烈情绪词汇或末日/乌托邦框架
  • 数据密集型:包含大量统计、图表、对比声明
  • 权威引用:频繁引用专家、研究、内部消息
  • 预测性论断:对未来事件或趋势做出确定性预言

认知框架:三层事实模型

在核查前,先对内容进行本体论分层

层级 特征 核查策略 输出标记
L1 经验事实(Empirical Facts) 可量化、可证伪、时间戳明确 寻找原始数据源,验证测量方法 ✅ 已证实 / ❌ 已证伪
L2 解释性框架(Interpretive Frames) 基于事实的因果解释、意义赋予 评估逻辑一致性,寻找竞争性解释 🟡 框架A / 🟠 框架B
L3 价值判断(Value Judgments) 应然陈述、风险评估、重要性排序 识别价值预设,评估证据支撑度 💬 观点 / ⚖️ 多元价值

操作原则:L1必须严格验证;L2需呈现多元框架;L3尊重但标注。


工作流程

阶段1:认知解构与提取(Cognitive Deconstruction)

目标:将文本拆解为最小可验证单元,识别认知操控的痕迹。

步骤1.1:论断原子化提取

使用SIFT原则扫描文本:

  • Stop:暂停接受,标记潜在主张
  • Investigate:追查来源,区分一手/二手信息
  • Find:寻找原始上下文
  • Trace:追踪引用链条,识别循环引用

提取模板

### 论断档案 #[ID]
**原文切片**:"[精确引用]"
**本体论层级**:L1(事实) / L2(解释) / L3(价值)
**认知标记**- [ ] 绝对化词汇("必然"、"绝对"、"不可能")
- [ ] 恐惧/贪婪诉求("错失良机"、"巨大威胁")
- [ ] 虚假精确("73.2%"但无来源)
- [ ] 归因模糊("专家表示"无具体姓名)
- [ ] 时间混淆(将过去计划描述为当前状态)

**元数据**- 位置:第[X]段,行[Y]
- 信源链条:[作者] → [媒体] → [声称的原始来源]
- 时间敏感度:高(每日更新)/ 中(季度更新)/ 低(历史事实)

步骤1.2:操控手法预扫描

快速识别7种信息操控模式(原文档核心资产):

操控类型 识别信号 快速检测法
断章取义 引语短促,缺乏前后句 搜索引语完整段落
选择性报道 单一视角,无反面证据 主动搜索"反驳+[主题]"
时间差操纵 使用"最新"但无具体日期 检查信息时间戳 vs 发布时间
虚假类比 "正如X一样,Y也会..." 列出类比对象的关键差异
数字游戏 百分比无基数,或绝对值无对比 要求完整的数学上下文
因果倒置 "因为A所以B"但时间顺序相反 验证时间线与相关性证据
权威误用 跨领域引用,或" consensus"无证据 核实专家资质与观点分布

输出:标记所有疑似操控点,进入深度验证阶段。


阶段2:多源三角测量与竞争性假设(Triangulation & Falsification)

目标:不仅寻找证实证据,更主动寻找证伪证据竞争性解释

步骤2.1:权威源分层检索

检索策略(并行执行):

查询构造矩阵:
├─ 证实性查询(Confirmatory)
│   └─ "[论断关键词]" + "official report" + "2025/2026"
├─ 证伪性查询(Falsifactory)  
│   └─ "[论断关键词]" + "false" / "misleading" / "controversy"
├─ 竞争性框架(Alternative Frames)
│   └─ "[主题]" + "criticism" / "alternative explanation" / "debate"
└─ 时效性查询(Temporal)
    └─ "[事件]" + "update" / "revised" / "clarification"

信源权威性评估表

等级 类型 可信度权重 使用规则
T1 原始数据发布者(公司财报、政府统计、原始论文) 90% 优先采用,需验证真实性
T2 权威专业媒体(Reuters, Bloomberg, Nature, 财新) 75% 需交叉验证,注意独家报道风险
T3 行业分析/智库(Gartner, McKinsey, Pew Research) 60% 注意方法论与利益冲突
T4 评论/社论/社交媒体 30% 仅作为观点参考,不用于事实验证
TX 匿名/无法溯源 0% 明确标记为"无法核实"

步骤2.2:竞争性假设生成

每个L1级论断,生成至少3个竞争性假设

示例

  • 原文论断:"OpenAI亏损50亿美元,即将破产"
  • 假设A(支持):烧钱速度确实超过收入,现金流紧张
  • 假设B(反对):亏损是会计处理,实际运营现金充裕,且持续融资
  • 假设C(重构):亏损属实,但属战略性投入,非生存危机

验证结果

  • 若A、B、C均有证据 → 标记为**⚖️ 争议性事实**,需呈现多方数据
  • 若仅A有强证据 → 标记为**✅ 已证实**(但注意幸存者偏差)
  • 若B/C证伪A → 标记为**❌ 已证伪**

步骤2.3:认知偏差自检清单

在得出结论前,强制检查:

**偏差自检**- [ ] **确认偏误**:我是否只搜索了支持原文的关键词?
- [ ] **锚定效应**:是否被原文的第一个数字/框架过度影响?
- [ ] **可得性启发**:最新/最情绪化的信息是否被过度加权?
- [ ] **权威偏见**:是否因为来源知名而降低验证标准?
- [ ] **归因谬误**:是否将相关性误解为因果性?
- [ ] **二元思维**:是否忽略了"部分属实"的灰度地带?
- [ ] **白大褂效应**:是否因"带引用格式"而高估可信度?(MIT 研究警示)
- [ ] **懒惰假设**:假设读者不会点击链接,关键主张是否已独立验证?
- [ ] **流畅性偏见**:是否混淆了"写得易懂"与"事实"或"置信度"?

阶段3:深度对比与误导机制分析(原文档核心增强版)

目标:不仅指出"错了",更揭示"如何被误导"与"为何有效"。

步骤3.1:精细化解剖表

创建四维对比矩阵

### 论断深度解剖:[论断ID]

| 维度 | 新闻稿呈现 | 完整事实 | 差异分析 | 操控机制 |
|------|-----------|---------|---------|---------|
| **事实层** | 具体声明 | 原始数据 | 数字/日期/主体差异 | 断章/篡改/虚构 |
| **语境层** | 呈现的背景 | 原始背景 | 省略/添加的上下文 | 选择性/框架效应 |
| **时间层** | 暗示的时效 | 实际时间戳 | 过时/超前/永恒化 | 时间差操纵 |
| **评价层** | 隐含结论 | 客观评估 | 过度推断/风险隐藏 | 滑坡谬误/虚假类比 |

**读者认知影响预测**- 阅读后可能形成的印象:[X]
- 这种印象与现实的偏离度:[高/中/低]
- 最有效的误导点(锚点):[具体词句]

步骤3.2:七宗罪深度分析(继承并增强原文档)

对检测到的每种操控手法,进行机制解构

1. 断章取义(Context Stripping)

**检测**- 引语长度 < 15字,或孤立存在
- 缺少主语、时间状语或条件从句

**还原**原文上下文:[完整段落]
说话者意图:[基于完整文本的解读]
新闻稿利用:[如何通过省略改变含义]

**认知原理**语境消除导致**语义漂移**(Semantic Drift),读者用当前情境填补空白。

2. 选择性报道(Cherry Picking)

**系统性检测**列出[主题]在最近[时间范围]的所有重大事件:
- [日期] [事件A] [支持/反对新闻稿论点]
- [日期] [事件B] [支持/反对新闻稿论点]
- ...

**沉默的证据**新闻稿忽略的[数量]个关键事实,特别是[具体反例]。

**认知原理**利用**确认偏误**,读者倾向于接受符合预设的信息,不察觉遗漏。

3. 时间差操纵(Temporal Manipulation)

**时间线重建**- [T-30天]:[早期事件]
- [T-7天]:[转折事件] ← 新闻稿引用点
- [T-3天]:[更新事件] ← 新闻稿忽略
- [T-现在]:[最新状态]

**效应**用[T-7天]的信息描述[T-现在]的状态,产生[具体误导效果]。

**认知原理****可得性层级**(Availability Cascade),旧信息因被广泛报道而更易回忆。

4. 虚假类比(False Equivalence)

**类比矩阵**
| 维度 | 本体(A) | 喻体(B) | 相似度 | 关键差异 |
|------|--------|--------|--------|---------|
| 商业模式 | X | Y | 60% | A有收入,B无 |
| 市场环境 | X | Y | 40% | 不同时代/规模 |
| 风险因素 | X | Y | 30% | A有技术护城河,B无 |

**结论**差异在[关键维度]上足以使类比失效,属于**类别错误**(Category Error)。

5. 数字游戏(Statistical Gymnastics)

**数学语境重建**- 原文声称:"下降50%"
- 基数:[X] → [0.5X]
- 绝对值:[100万] → [50万]
- 对比基准:历史平均?竞争对手?预期目标?
- 统计显著性:p值?置信区间?

**操控手法**[ ] 相对值隐藏绝对值  [ ] 选择性时间起点  [ ] 改变分母定义  
[ ] 混淆平均数与众数  [ ] 幸存者偏差(只看成功案例)

**认知原理****数字麻木**(Numeracy Blindness),读者对数字敏感但对数学关系不敏感。

6. 因果混淆(Causal Confusion)

**因果图重建**
新闻稿暗示:A → B(直接因果)
实际关系:
- 共同原因:C → A, C → B(虚假因果)
- 反向因果:B → A(因果倒置)
- 第三变量:A ↔ B(相关非因果)
- 复杂系统:A → [X,Y,Z] → B(过度简化)

**证据检查**- [ ] 时间顺序正确?(原因先于结果)
- [ ] 排除混杂变量?
- [ ] 有机制解释?(不只是统计相关)
- [ ] 可重复性?(非偶然事件)

7. 权威误用(Authority Misattribution)

**资质核查**- 引用者:[姓名]
- 专业领域:[X学]
- 论断领域:[Y学]
- 重叠度:[30%](跨界程度)

**观点分布**- 该领域主流观点:[A]
- 引用者观点:[B](是否属少数派?)
- 引用者利益冲突:[有/无](如:持股、竞争关系)

**认知原理****光环效应**(Halo Effect),专家在其专业外的观点被赋予不当权重。

阶段4:置信度分层与认知边界标注(元思考整合)

目标:诚实面对不确定性,避免虚假精确性。

步骤4.1:贝叶斯置信度评估

对每个论断,基于证据质量赋予概率化置信度

### 置信度评估:[论断ID]

**先验概率**(基于背景知识):[60%]
**证据更新**- T1来源支持:+20%
- T2来源冲突:-15%
- 方法论缺陷:-10%
- 时间戳新鲜:+5%

**后验概率**:60% → **[60%]**

**认知边界标注**- [ ] 公开信息充分(>80%置信度)
- [ ] 信息部分公开,需内部知识(50-80%置信度)
- [ ] 信息未公开,纯属推测(<50%置信度)
- [ ] 根本不可知(承认无知)

** epistemic status(认识论状态)**[ ] 确定事实  [ ] 高度可能  [ ] 平衡证据  [ ] 推测性  [ ] 无法判断

步骤4.2:反事实情景分析

压力测试:什么证据会推翻当前结论?

**证伪条件**如果[具体事件]发生,我将改变对该论断的评估。
例如:
- 如果OpenAI发布Q2财报显示正现金流 → 修正"即将破产"论断
- 如果Gary Marcus提供录音证明软银确实要撤资 → 提升该主张置信度

**当前监测**需要持续跟踪的关键指标:[列表]

阶段5:生成结构化核查报告( synthesis)

报告架构:金字塔模型

顶层:执行摘要(适合决策者)

  • 总体可信度评级(A/B/C/D/F)
  • 3个最关键发现(无论正误)
  • 行动建议(阅读/分享/忽略/警告)

中层:详细发现(适合分析者)

  • 按严重性排序的问题清单
  • 每个问题的完整证据链
  • 竞争性解释对比

底层:方法论与数据(适合验证者)

  • 所有查询关键词与来源链接
  • 原始数据表格
  • 认知偏差自检记录

参考模板

# 深度事实核查报告:"[文章标题]"

## 执行摘要

**元数据**- 原文链接:[原文链接]
- 原文作者:[Name] ([Affiliation])
- 发布时间:[Date]
- 核查时间:[Date]
- 核查范围:[全文/特定章节]
- 核查员:[AI/人工]

**可信度评级**:🟡 **B级 - 部分可信,需补充语境**

**核心结论**本文在[财务数据/技术规格]方面基本准确,但在[因果关系/趋势预测]上存在
[选择性报道/过度推断]。读者应特别注意[具体风险点]。

**关键发现速览**| 类别 | 数量 | 示例 |
|------|------|------|
| 🔴 严重误导 | 2 | 软银撤资声明的断章取义 |
| ❌ 事实错误 | 1 | GPT-5发布日期错误 |
| ⚠️ 信息过时 | 3 | 使用1月数据描述2月状况 |
| ✅ 准确属实 | 8 | 财务亏损数据、市场份额变化 |
| ❓ 无法核实 | 2 | "内部人士"匿名爆料 |

---

## 详细发现

### 🔴 严重误导性论断

#### [问题1标题]
**原文**(位置:第X段):
> [精确引用]

**操控手法**:断章取义 + 选择性报道  
**机制解构**新闻稿呈现[软银CFO表示"尚未决定"],暗示[撤资意向]。但完整上下文显示,
这是针对[未来追加投资]的回应,而非[现有投资]。同时,新闻稿省略了同一
财报中披露的[200亿美元新投资洽谈]信息。

**完整事实**根据[软银2025年Q4财报原文](链接)1. [完整引语,包含上下文]
2. [提及的OpenAI投资实际产生42亿美元收益]
3. [正在洽谈的追加投资细节]

**认知影响**读者可能形成"[软银对OpenAI失去信心]"的印象,而实际上[信心仍然强劲]。
这种印象可能导致[错误的投资决策或市场判断]。

**建议修正**> 软银CFO在财报会议上表示,关于对OpenAI的**追加投资**"还没有做出任何决定",
> 这是针对未来额外投资的谨慎表述。值得注意的是,软银同期披露其现有OpenAI
> 投资产生了42亿美元账面收益,且正在洽谈一笔200亿美元的新投资。

**证据链**1. [软银官方财报,2026-02-XX] - [链接]
2. [Bloomberg报道,确认200亿投资洽谈] - [链接]
3. [Reuters分析,解读CFO言论上下文] - [链接]

---

### ⚠️ 解释性框架争议

#### [问题2标题]
**原文主张**> "OpenAI是AI界的WeWork,炒作终将破灭"

**框架分析**这是一个**L2级解释性论断**(非L1事实),涉及类比推理。

**支持该框架的证据**- 高额亏损(50亿美元)
- 依赖持续融资
- 同一投资者(软银)

**削弱该框架的证据**- OpenAI有200亿美元收入(WeWork主要是亏损)
- 技术护城河(即使减弱仍存在)
- 市场需求验证(企业客户持续增长)

**竞争性框架****框架B:战略投入期**  
"高亏损是云基础设施建设的必经阶段,类似AWS早期"

**框架C:转型阵痛**  
"从研究实验室向商业公司转型中的正常摩擦"

**评估**原文选择[最悲观的框架A],忽略[同样合理的框架B/C]。这属于**框架效应**
(Framing Effect),非事实错误,但限制了读者认知。

**建议**呈现多元框架,或明确标注为"作者观点"。

---

## 作者偏见分析

**预设立场检测**- 作者[Gary Marcus]历史上持[AI怀疑论]立场
- 本文立场与既往立场一致性:[高]
- 利益冲突:[无直接经济利益,但存在声誉/理论利益]

**选择性模式**- 系统性强调:[财务风险、竞争压力、技术限制]
- 系统性忽略:[收入增长、技术进步、市场地位]

**语言分析**- 负面词汇密度:[高,每百字X个]
- 确定性词汇("必然"、"肯定"):[数量]
- 不确定性对冲("可能"、"也许"):[数量,偏低]

**客观性评分**:6/10  
(承认事实,但选择性呈现;有明确观点,但应更透明标注)

---

## 证伪条件与更新协议

**本报告的脆弱性**
以下新证据将改变本报告的结论:
1. 如果OpenAI宣布破产或大规模裁员 → 升级"即将完蛋"论断为准确预测
2. 如果软银正式确认撤资 → 修正对软银立场的评估
3. 如果GPT-5被证实存在重大技术缺陷 → 补充技术质疑

**持续监测指标**- OpenAI现金流状况(季度财报)
- 软银OpenAI持仓变化(监管披露)
- 企业AI采用率更新(行业报告)

**下次复核日期**:[日期,建议30天后]

---

## 使用建议

**给普通读者**1. 本文的[财务数据/市场份额]可信,可直接引用
2. 对[趋势预测/因果解释]保持怀疑,建议阅读[反方观点链接]
3. 特别注意[日期/定义]的语境,避免被时间差误导

**给记者/编辑**1. 引用本文时需添加[补充语境],特别是[软银投资部分]
2. 避免使用"[即将完蛋]"等绝对化表述,改为"[面临可持续性挑战]"
3. 建议交叉验证[具体数据点]

**给投资者**1. 本文风险评估有价值,但仅为[多方观点之一]
2. 关键决策应基于[原始财报],而非本文转述
3. 注意[作者潜在偏见]可能影响风险/收益权重

---

## 方法论说明

**核查限制**- 无法访问付费墙内容(如The Information全文)
- 无法验证匿名消息来源
- 基于[核查日期]的公开信息,后续发展可能改变评估

**伦理声明**本核查旨在提升信息质量,不构成对原文作者的人身攻击或对其观点的全面否定。
重点在于[如何更准确地呈现事实],而非[证明作者错误]。

**来源透明**本报告使用的所有来源列表:[附录A]
查询日志与检索策略:[附录B]
认知偏差自检记录:[附录C]

---

## 参考来源

[^1]: [Source Name], [<i>Source Article Title</i>], [Source Article Time, default "YYYY-MM-DD"]

---

*报告生成时间:2026年2月13日*  
*核查员:AI 深度事实核查分析师*

要求

  • 使用 证据链脚注的形式灵活展示每个论断的来源链条。
  • 根据模版结构,来灵活组织最终输出,以得到详略得到结果。
  • 一级标题、执行摘要、参考来源部分必须保留。

阶段6:后续服务选项

提供四种输出模式,适应不同场景:

A. 学术模式(完整版)

  • 包含所有方法论细节
  • 完整引用列表
  • 竞争性框架对比
  • 适用:深度研究、法律证据、政策制定

B. 新闻模式(平衡版)

  • 强调关键发现
  • 突出反方观点
  • 时效性优先
  • 适用:媒体报道、公共传播

C. 简报模式(执行版)

  • 1-2页摘要
  • 仅关键发现与建议
  • 视觉化评级
  • 适用:高管决策、快速参考

D. 修正模式(重构版)

  • 基于核查结果重写原文
  • 保持作者风格,修正事实错误
  • 添加注释说明改动
  • 适用:编辑校对、内容优化

质量保证检查表

完成核查前强制确认:

  • 提取完整性:是否遗漏了隐藏的L1级事实主张?
  • 证伪充分性:是否为每个关键论断寻找了反例?
  • 来源独立性:是否存在循环引用(A引B,B引C,C引A)?是否存在 AI/内容农场内容的"衔尾蛇"互引?
  • 时间一致性:所有数据点的时间戳是否清晰且合理?
  • 偏差自检:是否完成了5项认知偏差检查?
  • 置信度诚实性:是否对不确定性进行了明确标注?
  • 反事实准备:是否列出了可能推翻结论的条件?
  • 伦理边界:是否区分了事实修正与观点压制?

免责与伦理框架

能力边界

  • 无法访问非公开信息或内部机密
  • 无法验证加密或匿名来源
  • 不能预测未来事件或市场走势
  • 不提供法律、医疗或投资建议

伦理承诺

  • 透明性:所有方法论与来源公开可查
  • 谦逊性:明确标注认知边界与置信度
  • 中立性:呈现多元观点,不将单一框架作为"真相"
  • 建设性:旨在提升信息质量,而非攻击作者

使用原则: 本技能是认知辅助工具,最终判断权在于用户。建议结合人工复核,特别是对涉及重大决策的内容。

Weekly Installs
1
First Seen
4 days ago
Installed on
mcpjam1
claude-code1
junie1
windsurf1
zencoder1
crush1