wps-deep-search

Installation
SKILL.md

Contract(契约)

Input Contract

  • 类型: 自然语言查询或结构化搜索请求
  • 必填字段:
    • query: 用户问题或目标
  • 可选字段:
    • context: 对话上下文
    • filters: 时间范围、标签、项目范围、来源偏好等
    • max_results: 默认 10,范围 1-20
    • search_depth: quick | standard | deep(默认 standard
    • source_mode: notes_only | web_only | hybrid(默认 hybrid
  • 验证规则:
    • query 长度 >= 2
    • 问题包含“最新/今日/近期”等时,必须启用网络时效检查

Output Contract

  • 类型: 结构化检索结果 + 可读结论
  • 保证字段:
    • results: 结果列表(按综合相关性排序)
    • search_dimensions: 实际执行的检索维度
    • evidence: 证据清单(笔记证据 + 外部证据)
    • confidence: 每条关键结论的置信度(High/Medium/Low 或 0-100)
    • conflicts: 冲突信息或未决点
  • 约束:
    • 结论必须可追溯到证据来源
    • 区分“已证实”和“待验证”
    • 明确哪些结论来自笔记,哪些来自外部网络

Error Handling

  • 无效查询 → 返回优化建议,不直接失败
  • 无匹配结果 → 自动放宽一次约束重试,仍无结果则返回“证据不足”
  • 工具失败 → 返回可用部分结果 + 未完成项
  • 权威来源不足 → 降级输出,不给确定性结论

核心原则

  1. 深度搜索不是单轮关键词匹配,而是“启发式漏斗 + 证据收敛”。
  2. 除非用户明确要求“只查笔记”,默认使用 hybrid(笔记 + 网络权威源)。
  3. 外部来源必须可追溯,web_search 摘要只能作线索,web_fetch 正文才可作证据。
  4. 严禁编造来源、编造引用、把低权威单一来源当成定论。
  5. 本版本强制单代理串行执行,禁止调用 sub_agent
  6. 该 Skill 为只读检索流程,不调用笔记写入类工具。

与 wps-note 的关系

本 Skill 是 wps-note 的深度检索场景封装层:

  • 复用底层能力:搜索、定位、读取、标签聚合
  • 新增智能能力:启发式扩展、证据融合、置信度评估
  • 新增外部能力:网络权威信源检索与交叉验证

工具列表与调用方式

笔记侧工具(只读)

工具名 用途
search_notes 笔记级召回(标题/正文/标签维度)
search_note_content 单篇笔记内定位关键段落
get_note_info 获取元数据(标题、标签、更新时间)
find_tags 标签扩展与近义聚合
get_note_outline 获取结构并定位读取入口
read_section 章节级精读
read_blocks 精确回读证据块
read_note / read_note_content 全文读取(宿主工具名兼容)

网络侧工具(只读)

工具名 用途
web_search 单查询检索权威候选
batch_web_search 多查询并行召回(推荐)
web_fetch 抓取正文,形成可引用证据

禁用工具

  • sub_agent(本 Skill 禁止使用)

权威信源分级(必须执行)

级别 定义 结论作用
Tier 1(一级官方) 政府/监管/标准组织/公司官方披露/原始机构发布 结论主锚点
Tier 2(二级主流) 主流媒体、头部研究机构、可追溯作者和发布时间来源 交叉验证
Tier 3(三级补充) 社区、自媒体、二次转载、观点文 线索与背景,不单独定论

规则:

  • 关键结论优先 Tier 1;无 Tier 1 时至少要有 2 条独立 Tier 2。
  • 仅 Tier 3 时只能输出“探索性判断/证据不足”。

启发式检索漏斗(Heuristic Funnel)

第一层:意图澄清(Intent Clarification)

目标:把用户问题转成可检索任务。

  • 识别任务类型:事实核查/关联挖掘/趋势判断/决策建议
  • 提取结构化要素:实体时间窗约束输出目标
  • 设定 source_mode:notes_only | web_only | hybrid
  • 对明显歧义最多澄清一次;否则基于保守假设继续并声明假设

第二层:候选扩展(Candidate Expansion)

目标:先充分召回,再高质量收敛。

  • 同义词扩展:别称、缩写/全称、中英术语
  • 反向词扩展:正负信号并查,降低单边偏差
  • 时间锚点扩展:相对时间转绝对时间,并加对照窗口
  • 实体关系扩展:上下游、竞品、监管、合作方、负责人
  • 语境扩展:优先使用用户笔记里的项目名/内部术语

第三层:证据收敛(Evidence Convergence)

目标:让每条结论都可审计。

  • 抽取证据单元:主张、证据片段、来源、时间、适用范围
  • 独立交叉验证:关键主张需多源印证
  • 冲突保留:标注争议点,不强行合并
  • 输出置信度:高/中/低,并解释原因

Workflow(工作流程,串行)

步骤 0:模式选择

  • 用户明确“只看笔记” → notes_only
  • 用户强调“最新/外部动态/权威口径” → hybrid(或 web_only
  • 未明确时默认 hybrid

步骤 1:拆解问题为 claim

将问题拆成可验证断言(claim),每条 claim 至少包含:

  • subject
  • predicate
  • time_scope

步骤 2:规划检索与预算

  • 每条 claim 默认 2 轮网络检索
  • 每条 claim 默认最多抓取 6 个页面
  • 提前停止条件:
    • 已有 1 条 Tier 1 + 1 条独立 Tier 2
    • 或已有 2 条独立 Tier 2 且一致

步骤 3:笔记侧检索(串行)

  1. search_notes / find_tags 召回候选笔记
  2. search_note_content 定位关键段落
  3. read_section / read_blocks 抽取证据

步骤 4:网络侧检索(串行)

  1. batch_web_search 执行多 query 扩展召回
  2. web_fetch 抓取正文并过滤掉仅摘要结果
  3. 按 Tier 1 → Tier 2 → Tier 3 顺序保留候选

步骤 5:证据融合与评分

建议综合分(0-100):

  • 意图匹配度(30)
  • 证据强度(25)
  • 来源权威度(20)
  • 时效匹配度(15)
  • 跨源一致性(10)

置信度建议:

  • High:>= 80 且满足权威来源条件
  • Medium:60-79
  • Low:< 60 或存在重大冲突

步骤 6:结果呈现(来源透明)

必须包含:

  • 查询主题与检索时间
  • 结论摘要
  • claim 级判定(supported / partially_supported / conflicting / insufficient_evidence)
  • 笔记证据(note_id / 位置 / 摘要)
  • 外部证据(Tier、来源名、URL、发布时间、抓取时间、证据作用)
  • 冲突与未决问题

常用编排模式

模式 1:事实核查(默认混合)

适用于“这件事是真的吗/最新口径是什么”:

claim 拆解 → 笔记检索 → 网络检索 → 证据收敛 → 置信度输出

模式 2:跨笔记关联 + 外部验证

适用于“这个主题和我过去笔记有什么关联,外部又怎么说”:

笔记召回 → 主题扩展 → 网络权威检索 → 一致性分析

模式 3:趋势研判

适用于“最近走势/风险变化”:

时间锚点扩展 → 多时间窗检索 → 证据对比 → 趋势结论

示例

示例 1:事实核查

输入深度搜索:某 AI 公司最近是否发布了新的企业定价政策?

执行要点

  • claim 拆解:是否发布 / 发布时间 / 涉及范围
  • 串行执行官方信源 + 主流媒体检索
  • 回查用户笔记里的历史定价讨论
  • 输出 claim 级证据、置信度与冲突点

示例 2:关联挖掘

输入深度搜索:把“模型成本压降”相关的内部笔记和外部权威资料一起梳理

执行要点

  • 笔记侧召回项目复盘、预算、采购笔记
  • 外部侧检索监管/厂商官方文档与主流行业报告
  • 输出“内部观点 vs 外部证据”对齐与偏差

Troubleshooting

网络结果为空

  • 放宽术语精度或扩大时间窗重试一次
  • 若仍为空,明确返回“未检索到可核验证据”

结果太多

  • 收紧实体与时间锚点
  • 只保留高分候选并解释筛选依据

来源冲突

  • 保留双版本结论
  • 标记 conflicting,给出待确认点

无 Tier 1/Tier 2

  • 标记 insufficient_evidence
  • 不输出确定性判断,只给线索与下一步建议

页面不可抓取

  • web_search 结果仅作线索
  • 没有 web_fetch 正文时不可作为最终证据

时效风险

  • 用户问“最新”时必须展示发布时间与抓取时间
  • 超过时效窗口要显式提示“可能过时”

结果质量红线

  • 不能把“猜测”写成“事实”
  • 不能省略来源链接与时间信息
  • 不能忽略明显冲突证据
  • 不能把单一三级来源当最终依据
Related skills

More from wpsnote/wpsnote-skills

Installs
8
GitHub Stars
131
First Seen
Apr 7, 2026