zcbot/docs/科研AI双智能体-汇报PPT大纲.md

# 科研 AI 双智能体 · 汇报 PPT 大纲

> 单位:中国建筑材料科学研究总院 · 中存大数据
> 用途:生成汇报 PPT 的内容底稿。本文件只定**结构 + 每页要点 + 呈现形式**,不写大段叙述文字。
> 编写日期:2026-06-24

---

## 0. 总体设计说明(给设计 / 制作人员看)

**叙事主线 —— 通用 + 垂直,双轮驱动:**

| | 第一部分 | 第二部分 |
|---|---|---|
| 名称 | 通用科研辅助智能体 | 无机非金属材料自主研发智能体 |
| 定位 | **横向**:服务全院科研人员日常全流程 | **纵深**:材料配方自主研发的自动化 |
| 入口 | 自然语言,任意科研任务 | 材料研发需求 → 实验方案/配方 |
| 形态 | 17 项 skill 能力矩阵 + 可交付物 | 五大引擎 + 配方大模型(垂直微调) |
| 一句话 | 把"想法"变成可交付的科研产物 | 把"性能要求"变成可执行的实验配方 |

**呈现纪律(全程硬约束):**
- 每页**论断式标题**(写结论,不写"XX 介绍")。
- 正文只用:**短卡片(≤12 字)/ KPI 数字卡 / 流程图 / 时间轴 / 对比表 / 矩阵网格**。禁止整段话。
- 每页带一行【呈现形式】,指明该页用什么版式画。
- 颜色:商务红主题(主色 #C00000),关键数字 / 核心步骤高亮。
- 凡是带"流程"的页,一律画成**节点+箭头流程图**,不写成文字列表。

**全篇页序(约 26 页):** 封面 → 双智能体总览 → [PART1:1.0–1.10] → [PART2:2.0–2.10] → 总结 → 展望/交流。

---

## 封面

- 主标题:**科研 AI 双智能体**
- 副标题:通用科研辅助智能体 · 无机非金属材料自主研发智能体
- 落款:中国建筑材料科学研究总院 · 中存大数据 / 2026

【呈现形式】杂志级背景图 + 居中大标题;底部一行四个关键词:自然语言驱动 / 全流程可交付 / 垂直配方大模型 / 统一安全底座。

---

## 总览页 · 一张图看懂两个智能体

**论断:一个横向赋能全院,一个纵向攻坚配方 —— 通用 + 垂直,双轮驱动。**

左右两张大卡:
- 左卡「通用科研辅助智能体」:自然语言入口 · 17 skill · 内部 100 万+ 文献库 · 直出 Word/PPT/图表
- 右卡「材料自主研发智能体」:五大引擎 · 智能实验设计 · 配方大模型(LoRA 微调) · 预测→配方闭环
- 中间用箭头/底座连接:**共享统一底座**(多模型调度 · 向量知识库 · 安全沙盒 · 训练流水线)

【呈现形式】左右双卡 + 下方一条横贯"统一底座"长条。这页是全场的"地图",后面两部分都回指这张图。

---

# 第一部分 · 通用科研辅助智能体

## 1.0 章节分隔页

- PART 01
- **通用科研辅助智能体**
- 副题:以自然语言为入口,把科研任务串成可交付的工作流

【呈现形式】章节封面页,大序号 + 标题 + 一句定位。

---

## 1.1 它是什么 —— 现有功能总览

**论断:不止"问答",而是能自己动手、直接交付成果的科研智能体。**

四张能力卡 + 一行数字条:
- **自然语言驱动**:描述需求 → 自动识别意图、动态挂载专业能力
- **产出可交付物**:直接生成 Word / PPT / 图表 / 数据,贴合科研与申报格式
- **全流程覆盖**:调研 — 计算 — 写作 — 评审,一个智能体串起,无需多工具切换
- **统一底座**:多模型调度 · 安全沙盒 · 长期记忆 · 长任务断点恢复

数字条(KPI):**17** 项专业 skill · **6** 大能力类别 · 内部 **100 万+** 篇材料文献库 · **多渠道**接入(网页/微信/定时)

【呈现形式】2×2 能力卡网格 + 底部一条 KPI 数字条(4 个数字)。

---

## 1.2 它怎么工作 —— 五步工作流

**论断:意图识别 → 动态挂载能力 → 沙盒内执行 → 关键节点人工确认 → 规范化成果。**

横向五段流程:
1. **自然语言需求**(用户提出)
2. **意图识别**(自动挂载对应 Skill)
3. **工具调用循环**(安全沙盒内自主迭代:思考→调用工具→观察)
4. **人工确认**(关键决策由用户拍板,过程可追溯)
5. **规范化成果**(Word · PPT · 图表 · 数据)

底部一条"统一底座支撑":多模型调度 / 安全沙盒隔离 / 个人文件库 / 长期记忆·断点恢复

【呈现形式】横向 5 节点流程图(箭头串联)+ 底部一条底座长条,做成主图、放大。

---

## 1.3 能力矩阵 —— 科研全流程 Skill 体系

**论断:17 项专业能力,按科研全流程六大类组织,可持续扩展。**

六张分类卡(每卡:类名 + 含的 skill + 一句话):
- **科研写作**:proposal 申报书 / paper 论文 / standard 标准 / patent 专利 / review 审稿 —— 立项到评审全链路
- **文献检索**:documents 内部库 / research 全网 / brief 方向简报 —— 可溯源文献支撑
- **科研计算**:pymatgen 晶体计算 / stats_ml 配方建模 —— "配比→性能"预测寻优
- **演示出图**:ppt 商务级幻灯 / plot_pub 出版级学术图 —— 能看、能讲、能投稿
- **通用元能力**:analyze 问题拆解 / coding 代码实现
- **可定制**:skill-creator 用户私有 skill(从零写或 fork 内置再改)

【呈现形式】2×3 卡片网格,每卡一个图标。下面五页对其中"标志性"能力各展开一页。
> 说明:内容生成(文生图/文生视频)本次汇报不展开,不单列页。

---

## 1.4 标志性能力 ① 文献检索 —— 内部百万级材料文献库

**论断:中文提问,命中英文文献 —— 100 万+ 篇材料学科论文,可溯源。**

主体两块:
- **七大学科库**(卡片/六边形网格,各一行):胶凝材料 · 陶瓷基 · 玻璃基 · 晶体 · 复合 · 耐火 · 检验检测
- **三路检索分工**(小流程):
  - `documents` 内部库:100 万+ 英文论文,已 Markdown 化(LLM 直读),**跨语言语义检索**
  - `research` 全网:OpenAlex 元数据 + DOI + PDF 下载
  - `brief` 方向简报:重要论文列表 + 内容总结,5–20 分钟掌握一个方向

差异化标签(高亮):**跨语言检索** · **可溯源引用** · **立项依据有真实文献支撑**

【呈现形式】上方七学科库网格,下方三路检索分工小图;右侧竖排三个差异化标签 pill。

---

## 1.5 标志性能力 ② 项目申报 —— proposal

**论断:把课题信息变成可提交的申报书,评审雷区与文献真实性内置兜底。**

能力卡(短):
- **6 类基金骨架**:重点研发 / 重大专项 / 国自然面上·青年 / 联合基金 / 省地方 / 横向
- **评审雷区清单** + "不可考核词"过滤
- **文献真实性铁律**:不允许编造引文(GB/T 7714 顺序编码)
- **自动化产出**:间接费用台阶 + 经费表自动生成 · 技术路线图自动渲染插图
- **一段一卡**:关键章节逐段确认,不一口气出全文

产物:带目录 + 自动图题 + 图表编号的 `.docx`

【呈现形式】左侧"6 类基金"卡片网格,右侧"需求 → 一段一卡起草 → 渲染 docx"竖向流程;底部一条产物预览缩略。

---

## 1.6 标志性能力 ③ 科研写作全家桶 —— 论文 / 标准 / 专利 / 审稿

**论断:从论文到标准、专利、审稿 —— 写作全链路,反 AI 幻觉是底线。**

四象限卡(每卡:skill + 输入→产物):
- **paper 论文**:实验数据 → 中文核心 / 英文 SCI 投稿稿(IMRaD + 引文三角核验)
- **standard 标准**:材料/方法 → 国标 / 行标 / 团标 + 编制说明(GB/T 1.1—2020)
- **patent 专利**:项目素材 → 发明专利技术交底书(供代理师转写)
- **review 审稿**:已有稿 → 问题表 + 修改稿(长文分段深审)

横贯亮点条(高亮):**引文三角核验** —— 存在性 → 三角印证 → 支撑度,编造引文**零容忍**。

【呈现形式】2×2 象限卡 + 底部一条横贯"引文三角核验"亮点带。

---

## 1.7 标志性能力 ④ 材料计算 —— pymatgen + stats_ml

**论断:从晶体结构到配方建模 —— 服务"配比 → 性能"的预测与寻优。**

左右两栏:
- **pymatgen 无机材料计算**:晶体结构 I/O · XRD 模拟 · 相图 · 对称性 · Materials Project;**中文相名映射**(C₃S / 钙矾石 / 莫来石 / 方镁石 → 化学式)
- **stats_ml 配方-性能建模**:三库分工(sklearn 预测 / statsmodels 假设检验·p值 / PyMC 小样本贝叶斯);DoE 响应面 · 强度预测 · 异常配方聚类

典型场景标签:XRD 谱图模拟 · TG-DSC 双轴 · 强度预测 · 响应面寻优

【呈现形式】左右双栏卡,每栏配 2–3 个典型场景小图标;高亮"中文相名映射"和"三库分工"。

---

## 1.8 标志性能力 ⑤ 演示出图 —— ppt + plot_pub

**论断:成果"能看、能讲、能投稿" —— 商务级幻灯 + 出版级学术图。**

左右两块:
- **ppt 商务级演示**:卡片式视觉系统 · 论断式标题 · 信息设计纪律 · 一键整建 deck(原生可编辑)
- **plot_pub 出版级学术图**:中文 + viridis + 矢量(SVG/PDF)· 投稿级复合图设计纪律(XRD 叠图 / TG-DSC 双轴 / 多 panel)

价值标签:贴合期刊投稿(Cement and Concrete Research 等)· 降低整理排版成本

【呈现形式】左右两个产物缩略(一张 PPT 卡片样张 + 一张学术图样张)做观感对比。

---

## 1.9 平台技术架构(架构师视角)

**论断:Less Scaffolding, More Trust —— 把 LLM 当会持续变强的同事,给目标不给步骤。**

四象限架构卡:
- **① 智能体内核**:ReAct 工具调用循环(思考→调用→观察自主迭代)+ 进展守卫(重复调用/空转自动收敛)+ 阶段化编排嵌人工确认
- **② Skill 动态加载**:意图识别按需挂载,不相关能力不进上下文(渐进披露,省算力)+ 可扩展插件(流程+模板+脚本)
- **③ 安全沙盒**:每用户 Docker 容器隔离 · 资源限额 + 网络管控 + 最小权限 + 丰富工具集 / MCP
- **④ 模型·知识·记忆底座**:多模型自由调度(DeepSeek/Qwen + OpenAI 接口,涉密切内网)· RAG 抑制幻觉 · 双层长期记忆 + 长任务断点恢复

底部技术栈条:FastAPI(异步后端 + 原生 SSE)· LiteLLM(多模型统一接入,OpenAI 兼容)· 自研 ReAct 内核 · PostgreSQL(任务/消息 append-only)· Docker(每用户沙盒)· Skill 渐进披露体系

【呈现形式】2×2 架构象限卡 + 底部技术栈 pill 条,每条压成一句。

---

## 1.10 多渠道接入与产品化

**论断:不只是网页 —— 微信对话、定时任务,把智能体送到用户身边。**

三张卡:
- **网页工作台**:三栏 SPA(任务 / 对话 / 文件),消息目录导航、方案确认卡、文件预览
- **微信接入**:个人微信对话即可用,可主动推送简报/结果
- **定时任务**:"每天 X 点干 Y" —— 跑 skill 出简报 / 发邮件,自然语言建任务

【呈现形式】三卡横排,各配渠道图标。

---

# 第二部分 · 无机非金属材料自主研发智能体

## 2.0 章节分隔页

- PART 02
- **无机非金属材料自主研发智能体**
- 副题:水泥基配方大模型 —— 从"性能要求"到"实验配方"的自动化

【呈现形式】章节封面页。承上启下一句:从通用辅助,进入材料研发深水区。

---

## 2.1 五大引擎 —— 一图看全

**论断:五大引擎协同,构成材料研发的智能中枢。**

五个引擎卡(每卡:名称 + 一句≤10 字功能 + 图标):
1. **智能问答中枢**:统一入口,多轮+工具+文件问答
2. **知识库构建**:非结构化文档 → 可检索知识资产
3. **知识库问答**:RAG 结合企业知识,引用溯源
4. **AI 文档分类**:自动归档 + 触发向量重建
5. **智能实验设计**:需求 → 可执行配方(旗舰)

【呈现形式】五卡环形/总线布局,中心写"配方大模型";第 5 个引擎高亮(2.7 展开)。后面 2.3–2.7 逐个引擎各一页。

---

## 2.2 总体架构图(分层框图)

**论断:应用层 → 五大引擎 → 模型与向量层 → 训练模块,标准接口协同。**

四层框图:
- **User**:业务系统 / 请求
- **Backend 五大引擎**:Chat / KBBuild / KBQA / DocAI / Lab(**LangGraph 编排**复杂逻辑与实验设计流)
- **模型与数据层**:LLM(DeepSeek/Qwen) · Qwen2.5-VL 视觉 · BGE-M3 向量 · Milvus 向量库 · MinerU 解析
- **Train 训练模块**:LLaMA Factory → LoRA → 行业配方模型

【呈现形式】自上而下四层分层框图,层间箭头标接口(RAG / Embedding / LoRA)。只画框和箭头,不写段落。

---

## 2.3 引擎 ① 智能问答中枢

**论断:大模型统一入口 —— 从"回答问题"升级为"执行任务"。**

工作流程(流程图):
用户问题 → 会话与权限处理 → 任务识别 → **是否需要外部能力?**
- 否 → 普通问答 / 文件上下文 → LLM 生成
- 是 → 工具能力 → 读取文档 / MCP 工具调用
→ SSE 流式返回回答

技术卡(短):LangGraph 编排 · DeepSeek V3.1 / Qwen3-30B-A3B · 文件问答 + 多轮 + 思考模式 · MCP 接入外部系统 · SSE 流式输出

价值标签:统一标准化问答 · 高扩展集成业务工具 · 可升级为执行任务

【呈现形式】左侧带分支判定的流程图(菱形判定)+ 右侧技术卡 + 底部价值 pill。

---

## 2.4 引擎 ② 知识库构建

**论断:把分散的非结构化文档,沉淀为可检索、可引用、可追溯的企业知识资产。**

工作流程(流程图):
上传原始文档 → MinerU 解析 → **是否含图片/图表/扫描件?**
- 是 → Qwen2.5-VL 视觉解析 ↘
→ 文本结构化 & 生成 Markdown → 文本切分 → BGE-M3 向量化写入 Milvus → 保存文档元数据

支持内容卡(三类):
- **文档类**:PDF / Word / PPT / Excel
- **图像类**:图片 / 扫描件 / 图表
- **文本类**:Markdown / TXT / CSV / JSON

价值标签:分散资料 → 结构化知识库 · 为问答/实验/训练提供高质量数据基础

【呈现形式】上方带分支的处理流程图 + 下方三类支持内容卡。

---

## 2.5 引擎 ③ 知识库问答

**论断:基于 RAG 结合企业内部知识作答,引用可溯源,显著抑制幻觉。**

工作流程(流程图):
用户问题 → 问题理解 → 生成检索问题 → BGE-M3 向量化 → Milvus 检索 → 组装引用上下文 → 生成答案与溯源

技术卡(短):RAG 检索增强 · BGE-M3 向量化 + Milvus 检索 · DeepSeek/Qwen 结合上下文生成 · 引用来源溯源 · 多维度检索过滤

价值标签:提升专业性/准确性/可追溯 · 赋能私有文档深度问答 · 降低大模型幻觉风险

【呈现形式】横向 7 节点检索流程图(主色高亮"Milvus 检索"与"溯源")+ 右侧技术卡。

---

## 2.6 引擎 ④ AI 文档分类

**论断:自动识别领域与材料分类并归档,触发向量重建 —— 知识治理自动化。**

工作流程(流程图,含闭环):
待分类文档 → 读取解析内容 → 领域预判 → 构建分类体系 → 大模型分类 → 分类结果校验 → 保存 → **是否需调整归属?**
- 是 → 迁移文档并重建向量 → 完成归档

智能输出卡:摘要 · 领域 · 分类路径 · 判定依据 · 置信度

价值标签:降低人工整理归档成本 · 归入正确体系提升检索效率 · 为行业模型筛选标准化数据集

【呈现形式】带回环箭头的闭环流程图 + 一张"智能输出 5 字段"卡。

---

## 2.7 引擎 ⑤ 智能实验设计 —— 核心工作流(旗舰)

**论断:多阶段工作流,把研发需求转成可执行实验配方;核心一步是调用行业微调模型。**

横向时间轴,11 步压成 6 个阶段(核心步高亮):
1. **问题提炼**(科学问题 + 检索分类匹配 + 方向确认)
2. **文献检索分析**(向量库召回 + 逐篇提取实验参数)
3. **初步方案**(融合目标与文献,生成思路框架)
4. **学术评估优化**(多维量化评估,迭代优化路径)
5. ⭐ **配方生成**(调用 Qwen2.5-1.5B LoRA 行业模型 → 原料/配比/条件)
6. **校验 + 用户确认 + 实验工单**(人机协同闭环 → 对接实验室)

【呈现形式】横向 6 段时间轴/泳道,第 5 段(配方生成)用主色高亮放大;标注"人工确认节点"。

---

## 2.8 配方大模型训练 —— 配置与成效

**论断:LLaMA Factory + Qwen2.5-1.5B + LoRA,16 条实测数据完成首版训练。**

左:训练配置卡(短):
- 框架 / 基座:**LLaMA Factory + Qwen2.5-1.5B-Instruct**
- 微调:**PEFT + LoRA**(冻结主干,仅训低秩矩阵)
- 任务:**SFT** 建立"性能要求 → 配方组成"映射
- 数据:**16 组**实验室实测(输入 3d/7d 抗压抗折 → 输出 矿粉/电石渣/脱硫石膏/粉煤灰/水/减水剂 配比)

右:KPI 数字卡网格 + loss 曲线示意:
- 可训练参数占比 **4.57%**(7386 万 / 16.18 亿)
- Loss **0.6897 → 0.0073**(降 **98.9%**)
- 训练轮数 **50** Epochs
- 优化策略:禁用 KV Cache · 梯度检查点 · Torch SDPA 加速

成效三标签:收敛稳定 · 捕捉"低强度→低掺量"行业规律 · 标准化配方输出

【呈现形式】左配置卡 + 右 KPI 网格(4 个大数字)+ 一条 loss 下降曲线示意。

---

## 2.9 现状与下一步 —— 局限与优化路线

**论断:首版受 16 条数据所限偏"记忆";分三阶段补数据、简空间、建闭环。**

左右对比:
- **左 · 当前局限**:
  - 数据仅 16 条 → 模型偏"记忆样本",未真正"理解规律"
  - 泛化受限 → 未见性能区间配方精度有波动
- **右 · 优化路线**(P0/P1/P2 路线条):
  - **P0** 扩充数据集至 **200+**(从记忆升级为理解)
  - **P1** 简化配方空间(精简冗余材料,降学习维度)
  - **P2** 搭建"预测–实验–反馈"闭环,目标达标率 **≥85%**

【呈现形式】左侧两张"痛点"卡(冷色),右侧 P0→P1→P2 路线时间轴(暖色/主色)。

---

## 2.10 模型矩阵 —— 通用 + 垂直双轮

**论断:通用基座 + 视觉/向量 + 垂直 LoRA 配方模型,打通"解析→沉淀→决策"。**

六行场景表(场景 | 模型 | 用途):
| 场景 | 模型 | 用途 |
|---|---|---|
| 智能问答中枢 | DeepSeek V3.1 / Qwen3-30B-A3B | 通用问答、文件问答、工具调用 |
| 知识库构建 | Qwen2.5-VL + BGE-M3 + Milvus | 文档解析、图表提取、向量入库 |
| 知识库问答 | DeepSeek V3.1 + BGE-M3 + Milvus | RAG 精准问答 + 原文溯源 |
| AI 文档分类 | Qwen3-30B-A3B + BGE-M3 | 自动识别主题、分类归档 |
| 智能实验设计 | 通用大模型 + Qwen2.5-1.5B(LoRA) | 分析文献、生成配方方案 |
| 配方模型训练 | Qwen2.5-1.5B 基座 + BGE-M3 | 学习"性能-配方"映射 |

【呈现形式】六行卡片表(非密集文字表);右侧一句"通用 + 垂直双轮驱动"呼应总览页。

---

# 结尾

## 总结 —— 双智能体落地成效

**论断:一横一纵双智能体已落地,共享统一底座。**

四张成果卡:
- **通用智能体**:17 项 skill · 内部 100 万+ 文献库 · 全流程可交付(Word/PPT/图表)
- **垂直智能体**:五大引擎 · 智能实验设计 · 配方大模型首版(Loss 收敛 0.0073)
- **统一底座**:多模型调度 · 向量知识库 + RAG · 每用户安全沙盒 · 训练流水线 + LoRA 微调
- **业务价值**:打通"数据 → 知识 → 决策"闭环,知识沉淀为可复用资产,支撑研发提效

【呈现形式】2×2 成果卡,关键数字高亮。

---

## 展望 / 交流

- 下一阶段:配方数据集 16 → 200+ · 简化配方空间 · 建"预测–实验–反馈"闭环(达标率 ≥85%)· 持续扩展 skill 与渠道
- **感谢聆听 · 欢迎交流**

【呈现形式】左侧 3–4 条展望短句(带图标),右侧大字"感谢聆听 / 交流环节"。