2.9 KiB
2.9 KiB
引文核验协议(简报版)
与 paper skill 的引文三角核验同一套思路,这里按简报场景收口。简报虽轻,但编造引文 / 引而不实同样致命——决策者会照着简报判断方向,假信息代价更高。
协议不是脚本——你(模型)拿 host-side tool 逐条执行。quality_check.py 只做机械的 orphan/uncited/编号核对,真伪与支撑度靠本协议。
何时跑
阶段四逐段起草后、阶段六渲染前,对所有 [CITE-xx] 占位逐条核验。用户自带的引文也要跑。
三层核验(逐条)
第 1 层 — 存在性
documents语义检索 /research的search()/get_paper(doi)确认文献真实存在- 命中 → 以库里返回字段为准记 DOI/作者/年/期刊,不沿用记忆
- 两库都查不到 → 标
[未核实],不得编造;告诉用户"这条找不到来源,请提供 DOI 或删去该论断"
第 2 层 — 三角印证
关键论断(趋势判断、定量结论、"标志性进展")至少 2 个独立源一致才稳:
- documents 命中 + research/DOI 一致 → 通过
- 仅单一来源 → 标"单源,谨慎",简报交付时点出"此点单源待复核"
- 来源字段冲突 → 以可验证 DOI 元数据为准
第 3 层 — 支撑度
文献存在但不支撑你写的那句话是最容易翻车的:
- 抓
md_content(documents)/fetch_xml/fetch_pdf(research) - 定位 ≤25 词原文锚点 + 段落位置
- 三档:support 通过;partial/需限定 → 改写论断迁就证据;not-support/反向 → 删引用或换文献
- 抓不到全文 → abstract 弱核验,标"仅摘要核验"
web 来源的核验(简报特有)
web 资讯(政策/标准/产业)不进学术引文三角,但同样要可溯源:
- 记原始 URL + 访问日期 + 发布机构;优先官方源(政府/标委会/期刊/企业官网),而非二手转载
- 政策 / 标准类:能找到文号 / 标准号就记(如"GB/T xxxxx""国办发〔2025〕x号")
- web 信息标注"截至 <日期>",时效性内容明确边界——避免简报过期后误导
产出:核验台账 CITATIONS.md
# 引文核验台账
- [1] <author> <year>, <journal> | exists:✓(documents+DOI) | triangulate:✓ | claim:support "<≤25词锚点>"(§x) | status: verified
- [2] <author> <year> | exists:✓ | claim:partial → 已把"大幅提升"改为"28d 提高约 15%" | status: verified-revised
- [W1] <机构> <标题>, <URL>, 访问 <日期> | 类型:政策动向 | status: web-sourced
- [3] <author> <year> | exists:✗ 两库未命中 | status: 待用户提供
铁律(同 paper)
- ❌ status 非 verified/verified-revised/用户确认的学术引文不得进最终稿
- ❌ 不为凑数编造"看起来合理"的文献
- ❌ web 资讯当学术结论引(单列动向段,标 URL+日期)
- ✅ 支撑不足改论断迁就证据,不是改证据迁就论断
- ✅ 两库/web 都查不到如实告诉用户,给"提供来源 / 删论断"两个选项