zcbot/skills/brief/references/citation_verify.md

61 lines
2.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 引文核验协议(简报版)
`paper` skill 的引文三角核验**同一套思路**,这里按简报场景收口。简报虽轻,但**编造引文 / 引而不实**同样致命——决策者会照着简报判断方向,假信息代价更高。
> 协议不是脚本——你(模型)拿 host-side tool 逐条执行。quality_check.py 只做机械的 orphan/uncited/编号核对,真伪与支撑度靠本协议。
## 何时跑
阶段四逐段起草后、阶段六渲染前,对所有 `[CITE-xx]` 占位逐条核验。用户自带的引文也要跑。
## 三层核验(逐条)
### 第 1 层 — 存在性
1. `documents` 语义检索 / `research``search()` / `get_paper(doi)` 确认文献真实存在
2. 命中 → 以**库里返回字段为准**记 DOI/作者/年/期刊,不沿用记忆
3. 两库都查不到 → 标 `[未核实]`,**不得编造**;告诉用户"这条找不到来源,请提供 DOI 或删去该论断"
### 第 2 层 — 三角印证
关键论断(趋势判断、定量结论、"标志性进展")至少 **2 个独立源**一致才稳:
- documents 命中 + research/DOI 一致 → 通过
- 仅单一来源 → 标"单源,谨慎",简报交付时点出"此点单源待复核"
- 来源字段冲突 → 以可验证 DOI 元数据为准
### 第 3 层 — 支撑度
文献存在但**不支撑你写的那句话**是最容易翻车的:
1.`md_content`(documents)/ `fetch_xml`/`fetch_pdf`(research)
2. 定位 ≤25 词原文锚点 + 段落位置
3. 三档:**support** 通过;**partial/需限定** → 改写论断迁就证据;**not-support/反向** → 删引用或换文献
4. 抓不到全文 → abstract 弱核验,标"仅摘要核验"
## web 来源的核验(简报特有)
web 资讯(政策/标准/产业)**不进学术引文三角**,但同样要可溯源:
- 记**原始 URL + 访问日期 + 发布机构**;优先官方源(政府/标委会/期刊/企业官网),而非二手转载
- 政策 / 标准类:能找到文号 / 标准号就记(如"GB/T xxxxx""国办发2025x号")
- web 信息标注"截至 <日期>",时效性内容明确边界——避免简报过期后误导
## 产出:核验台账 `CITATIONS.md`
```markdown
# 引文核验台账
- [1] <author> <year>, <journal> | exists:✓(documents+DOI) | triangulate:✓ | claim:support "<≤25词锚点>"(§x) | status: verified
- [2] <author> <year> | exists:✓ | claim:partial → 已把"大幅提升"改为"28d 提高约 15%" | status: verified-revised
- [W1] <机构> <标题>, <URL>, 访问 <日期> | 类型:政策动向 | status: web-sourced
- [3] <author> <year> | exists:✗ 两库未命中 | status: 待用户提供
```
## 铁律(同 paper)
- ❌ status 非 verified/verified-revised/用户确认的学术引文不得进最终稿
- ❌ 不为凑数编造"看起来合理"的文献
- ❌ web 资讯当学术结论引(单列动向段,标 URL+日期)
- ✅ 支撑不足**改论断迁就证据**,不是改证据迁就论断
- ✅ 两库/web 都查不到如实告诉用户,给"提供来源 / 删论断"两个选项