zcbot/skills/brief/references/citation_verify.md

# 引文核验协议(简报版)

与 `paper` skill 的引文三角核验**同一套思路**,这里按简报场景收口。简报虽轻,但**编造引文 / 引而不实**同样致命——决策者会照着简报判断方向,假信息代价更高。

> 协议不是脚本——你(模型)拿 host-side tool 逐条执行。quality_check.py 只做机械的 orphan/uncited/编号核对,真伪与支撑度靠本协议。

## 何时跑

阶段四逐段起草后、阶段六渲染前,对所有 `[CITE-xx]` 占位逐条核验。用户自带的引文也要跑。

## 三层核验(逐条)

### 第 1 层 — 存在性

1. `documents` 语义检索 / `research` 的 `search()` / `get_paper(doi)` 确认文献真实存在
2. 命中 → 以**库里返回字段为准**记 DOI/作者/年/期刊,不沿用记忆
3. 两库都查不到 → 标 `[未核实]`,**不得编造**;告诉用户"这条找不到来源,请提供 DOI 或删去该论断"

### 第 2 层 — 三角印证

关键论断(趋势判断、定量结论、"标志性进展")至少 **2 个独立源**一致才稳:

- documents 命中 + research/DOI 一致 → 通过
- 仅单一来源 → 标"单源,谨慎",简报交付时点出"此点单源待复核"
- 来源字段冲突 → 以可验证 DOI 元数据为准

### 第 3 层 — 支撑度

文献存在但**不支撑你写的那句话**是最容易翻车的:

1. 抓 `md_content`(documents)/ `fetch_xml`/`fetch_pdf`(research)
2. 定位 ≤25 词原文锚点 + 段落位置
3. 三档:**support** 通过;**partial/需限定** → 改写论断迁就证据;**not-support/反向** → 删引用或换文献
4. 抓不到全文 → abstract 弱核验,标"仅摘要核验"

## web 来源的核验(简报特有)

web 资讯(政策/标准/产业)**不进学术引文三角**,但同样要可溯源:

- 记**原始 URL + 访问日期 + 发布机构**;优先官方源(政府/标委会/期刊/企业官网),而非二手转载
- 政策 / 标准类:能找到文号 / 标准号就记(如"GB/T xxxxx""国办发〔2025〕x号")
- web 信息标注"截至 <日期>",时效性内容明确边界——避免简报过期后误导

## 产出:核验台账 `CITATIONS.md`

```markdown
# 引文核验台账
- [1] <author> <year>, <journal> | exists:✓(documents+DOI) | triangulate:✓ | claim:support "<≤25词锚点>"(§x) | status: verified
- [2] <author> <year> | exists:✓ | claim:partial → 已把"大幅提升"改为"28d 提高约 15%" | status: verified-revised
- [W1] <机构> <标题>, <URL>, 访问 <日期> | 类型:政策动向 | status: web-sourced
- [3] <author> <year> | exists:✗ 两库未命中 | status: 待用户提供
```

## 铁律(同 paper)

- ❌ status 非 verified/verified-revised/用户确认的学术引文不得进最终稿
- ❌ 不为凑数编造"看起来合理"的文献
- ❌ web 资讯当学术结论引(单列动向段,标 URL+日期)
- ✅ 支撑不足**改论断迁就证据**,不是改证据迁就论断
- ✅ 两库/web 都查不到如实告诉用户,给"提供来源 / 删论断"两个选项