zcbot/skills/brief/SKILL.md

8.9 KiB
Raw Blame History

name description
brief 生成科研方向简报(research direction briefing / 文献计量趋势型简报)。给定一个研究方向 + 时间窗,用三路真实数据(documents 内部库取全文 / research 取近期 DOI 元数据 / web 取政策·会议·标准动向),产出一份热点聚类 + 新兴方法 + 关键进展 + 研究空白 + 产业政策动向的可读简报,每条论断可溯源、不编造引文。当用户要"简报 / 方向简报 / 研究动态 / 趋势报告 / 调研快报 / 某方向近期进展 / 文献综述快讯 / 跟踪某领域最新研究"时使用。

科研方向简报

把"某研究方向最近发生了什么"变成一份可读、可溯源、有判断的简报。先定题对齐 → 三路检索取数 → 趋势分析 → 逐段起草 → 引文核验渲染 —— 不要一口气出全文,定题和分析阶段先和用户对齐方向与边界。

简报 ≠ 综述论文(paper review):综述要全面、深、给定论;简报要快、准、有取舍——"重要性优先于完整性",帮决策者 / 课题组 520 分钟掌握一个方向近期态势。

进度展示建议:用 task_progress 标记「定题对齐 / 三路检索 / 趋势分析 / 逐段起草 / 引文核验 / 渲染」关键阶段。

边界(先划清,免得和别的 skill 撞)

与谁区分 边界
vs research/documents 它们只取文献(候选清单 / 全文);brief 是消费方,把取回的文献组织成有判断的趋势简报,引文核验接到它们头上
vs paper(review 类型) paper-review 写可投稿的综述论文(IMRaD/主题式、几十页、定论);brief 出轻量趋势简报(几页、有取舍、面向决策),不投稿
vs analyze analyze 把模糊科学问题拆成子问题 + 路线图(不查文献);brief 围绕一个已定方向摸近期态势(重检索)。两者可互为上下游(先拆问题再摸态势,或先摸态势再拆)
vs proposal proposal 写本子(立项依据);brief 只摸方向近期态势,不写立项依据。要立项 → 把简报喂给 proposal

何时不用:只要文献清单 / DOI / PDF → research/documents;要写可投稿综述 → paper(review);要拆科学问题 → analyze;要写本子 → proposal。

资源

下面所有路径相对 <skill_dir> —— load_skill 返回头里的 [skill=brief, dir=<绝对路径>],用这个绝对路径拼脚本/资源,不要假设 cwd。

先读(always):

  • <skill_dir>/templates/brief_outline.md —— 简报骨架 + 按深度(快报/标准/深度)的字数预算与簇数/引文数
  • <skill_dir>/references/search_strategy.md —— 三路检索分工(documents/research/web)+ 跨源去重 + 中文方向→英文术语转译

阶段五必读:

  • <skill_dir>/references/citation_verify.md —— 引文核验协议(存在性 / 三角印证 / 支撑度,复用 paper 思路,接 documents/research/web)

模板:

  • templates/spec.md —— 七条定题对齐固定字段(复制到 task 级 spec 文件)

脚本(.venv/Scripts/python.exe <skill_dir>/scripts/...):

  • scripts/quality_check.py —— --depth {flash,standard,deep},结构完整性 / 占位符泄漏 / 过度宣称 / 无源句式 / 引文交叉核对(orphan/uncited/编号连续)
  • scripts/render_docx.py —— md→docx,简报专属版式:商务红主题(--no-color 关)+ 正文 [n]/[Wn] 引文上标并锚到文末 + DOI/URL 可点击超链接 + 化学式下标白名单(CO2/C3S/Na2O...,不误伤 LC3/C595/Ca2+)+ TL;DR / 判断 行做底纹 callout

产物与渲染:简报默认产物是 .md。要 docx → 本 skill 自带 render_docx.py(见上);要做成汇报 deck → 转 ppt skill。

阶段一:定题对齐(写 spec)BLOCKING

产物:task 级 spec 文件,简报的"宪法",后续每阶段前重读。命名按 system prompt 的《task 级「宪法」文件命名约定》:

<task_dir>/<today>-<task_short_id>-<task_name>.spec.md

复制 templates/spec.md 填七条,有歧义先反问,不要替用户拍板:

  1. 方向 + 边界:具体到子方向(不是"水泥"而是"低碳水泥 SCM");明确纳入/排除(如"只看辅助胶凝材料替代,不含碱激发")
  2. 时间窗:默认近 3 年;用户说"最新/近期"→ 近 1 年;"这两年"→ 近 2 年。换算成 year_gte(今年是 system prompt 给的当前年)
  3. 受众:院领导汇报 / 课题组内部 / 立项前调研 / 对外交流 —— 决定语气与详略
  4. 深度:flash 快报(12 页)/ standard 标准(46 页)/ deep 深度(8+ 页,含机构-地理计量)—— 见 brief_outline.md 预算
  5. 数据源开关:documents(内部库,材料类首选)/ research(补 DOI 与近期元数据)/ web(政策·会议·标准·产业动向)—— 默认三路并用,用户可关
  6. 语言:中文(默认)/ 英文
  7. 特殊关注点:用户特别想知道的(如"重点看 CCUS 与水泥结合""谁在做工业固废路线")—— 写进 spec,分析阶段重点回应

写完把 spec 七条复述给用户确认,认可后进阶段二。

阶段二:三路检索取数

先读 references/search_strategy.md(三路分工 + 中→英术语 + 去重)。流程:

  1. 中文方向 → 英文检索词组:库里主语料是英文,SCM 这类要展开(supplementary cementitious materials / fly ash / GGBFS / calcined clay / limestone calcined clay cement / LC3 ...)
  2. documents(材料类首选):语义检索,中英 query 都行;胶凝材料库(classification_id=1)。取 md_content 备引文核验
  3. research:search(keyword=英文, year_gte=<窗>, limit=...) 拉近期候选 + DOI;has_pdf/is_oa 按需 filter。看 list 自带 abstract 判切题
  4. web(可选):政策(双碳、水泥行业碳配额)、标准(新国标/团标)、行业会议、企业中试/产线 —— web 的东西单独标"产业/政策动向",不混进学术引文计数
  5. 汇成证据表 <task_dir>/evidence.md(仿 lit_matrix):一行一条 = 来源 | 标题 | 年 | 一句话 takeaway | 归属簇 | 引文可用性(documents全文/DOI/web)

收 2080 条(按深度),不求穷尽,够支撑各簇即可。命中 0 条先换同义词/放宽年份,3 次仍空如实告诉用户库未覆盖,不脑补文献

阶段三:趋势分析(和用户对齐结构)BLOCKING-lite

把证据表聚成 37 个热点簇(按深度),给用户看簇划分 + 每簇代表文献,认可后再起草。每簇判断:

  • 这个簇在做什么 / 解决什么问题(一句话主题句,不是关键词堆砌)
  • 代表性进展(24 篇,带真实引文)
  • 新兴方法 / 技术(出现的新表征、新建模、新工艺)
  • 争议 / 分歧 / 未解(哪里还没共识)

横向再扫:研究空白(大家都没做的)、机构-地理格局(deep 才做,元数据够时:谁在领跑、中国占比)、产业/政策动向(来自 web)。

取舍纪律:一个方向近期可能上百篇,简报只留改变判断的。重复验证性工作合并成一句"多篇验证了 X";边缘工作直接不收。宁缺毋滥。

阶段四:逐段起草

brief_outline.md 骨架写 <task_dir>/sections/*.md,每段一个论断 + 证据:

  • TL;DR 要点(5 行内,先给结论)→ 方向概览与边界 → 研究热点聚类(各簇)→ 新兴方法 → 近期标志性进展 → 研究空白与争议 → 产业/政策/标准动向(web,可选)→ 参考文献
  • 起草时引文用占位 [CITE-<keyword>],阶段五核验后映射真实条目并编号
  • 数字 / 定量结论必须挂引文;"据报道""有研究表明"这种无源句式禁止

阶段五:引文核验(渲染前必跑)

先读 references/citation_verify.md,对所有引文逐条核验:存在性(两库/web 命中)→ 三角印证(关键论断 ≥2 源)→ 支撑度(抓原文锚点,partial 就改论断迁就证据)。台账写 <task_dir>/CITATIONS.md

铁律(同 paper):status 非 verified 的引文不得进最终稿;不为凑数编造文献;支撑不足改论断不改证据;两库/web 都查不到如实告诉用户。

阶段六:渲染验收

  1. quality_check.py --depth <flash|standard|deep> 跑 sections:结构 / 簇数预算 / 占位符 / 过度宣称 / 无源句式 / 引文交叉核对
  2. 用户要 docx → .venv/Scripts/python.exe <skill_dir>/scripts/render_docx.py <sections_dir> -o <方向>-简报.docx(商务红 + 引文上标超链接 + 化学式下标;--no-color 出黑白);要 deck → 转 ppt skill
  3. 交付时一句话说清:覆盖了哪几路源、收了多少条证据、哪些被取舍、哪些点是单源待复核

反模式

  • 跳过定题直接检索 —— 方向边界没定,检索词发散,收一堆不相关
  • 把命中的文献全部堆进简报 —— 简报是取舍的艺术,不是清单转储
  • web 抓的资讯当学术结论引 —— web 动向单列,学术论断要文献支撑
  • 编造 DOI / "据报道"无源句 —— 走 citation_verify,查不到就如实说
  • 用中文 keyword 搜英文库 —— 先转专业英文术语(见 search_strategy.md)