zcbot/skills/brief/references/citation_verify.md

2.9 KiB
Raw Blame History

引文核验协议(简报版)

paper skill 的引文三角核验同一套思路,这里按简报场景收口。简报虽轻,但编造引文 / 引而不实同样致命——决策者会照着简报判断方向,假信息代价更高。

协议不是脚本——你(模型)拿 host-side tool 逐条执行。quality_check.py 只做机械的 orphan/uncited/编号核对,真伪与支撑度靠本协议。

何时跑

阶段四逐段起草后、阶段六渲染前,对所有 [CITE-xx] 占位逐条核验。用户自带的引文也要跑。

三层核验(逐条)

第 1 层 — 存在性

  1. documents 语义检索 / researchsearch() / get_paper(doi) 确认文献真实存在
  2. 命中 → 以库里返回字段为准记 DOI/作者/年/期刊,不沿用记忆
  3. 两库都查不到 → 标 [未核实],不得编造;告诉用户"这条找不到来源,请提供 DOI 或删去该论断"

第 2 层 — 三角印证

关键论断(趋势判断、定量结论、"标志性进展")至少 2 个独立源一致才稳:

  • documents 命中 + research/DOI 一致 → 通过
  • 仅单一来源 → 标"单源,谨慎",简报交付时点出"此点单源待复核"
  • 来源字段冲突 → 以可验证 DOI 元数据为准

第 3 层 — 支撑度

文献存在但不支撑你写的那句话是最容易翻车的:

  1. md_content(documents)/ fetch_xml/fetch_pdf(research)
  2. 定位 ≤25 词原文锚点 + 段落位置
  3. 三档:support 通过;partial/需限定 → 改写论断迁就证据;not-support/反向 → 删引用或换文献
  4. 抓不到全文 → abstract 弱核验,标"仅摘要核验"

web 来源的核验(简报特有)

web 资讯(政策/标准/产业)不进学术引文三角,但同样要可溯源:

  • 原始 URL + 访问日期 + 发布机构;优先官方源(政府/标委会/期刊/企业官网),而非二手转载
  • 政策 / 标准类:能找到文号 / 标准号就记(如"GB/T xxxxx""国办发2025x号")
  • web 信息标注"截至 <日期>",时效性内容明确边界——避免简报过期后误导

产出:核验台账 CITATIONS.md

# 引文核验台账
- [1] <author> <year>, <journal> | exists:✓(documents+DOI) | triangulate:✓ | claim:support "<≤25词锚点>"(§x) | status: verified
- [2] <author> <year> | exists:✓ | claim:partial → 已把"大幅提升"改为"28d 提高约 15%" | status: verified-revised
- [W1] <机构> <标题>, <URL>, 访问 <日期> | 类型:政策动向 | status: web-sourced
- [3] <author> <year> | exists:✗ 两库未命中 | status: 待用户提供

铁律(同 paper)

  • status 非 verified/verified-revised/用户确认的学术引文不得进最终稿
  • 不为凑数编造"看起来合理"的文献
  • web 资讯当学术结论引(单列动向段,标 URL+日期)
  • 支撑不足改论断迁就证据,不是改证据迁就论断
  • 两库/web 都查不到如实告诉用户,给"提供来源 / 删论断"两个选项