zcbot/docs/科研AI双智能体-汇报PPT大纲.md

429 lines
19 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 科研 AI 双智能体 · 汇报 PPT 大纲
> 单位:中国建筑材料科学研究总院 · 中存大数据
> 用途:生成汇报 PPT 的内容底稿。本文件只定**结构 + 每页要点 + 呈现形式**,不写大段叙述文字。
> 编写日期:2026-06-24
---
## 0. 总体设计说明(给设计 / 制作人员看)
**叙事主线 —— 通用 + 垂直,双轮驱动:**
| | 第一部分 | 第二部分 |
|---|---|---|
| 名称 | 通用科研辅助智能体 | 无机非金属材料自主研发智能体 |
| 定位 | **横向**:服务全院科研人员日常全流程 | **纵深**:材料配方自主研发的自动化 |
| 入口 | 自然语言,任意科研任务 | 材料研发需求 → 实验方案/配方 |
| 形态 | 17 项 skill 能力矩阵 + 可交付物 | 五大引擎 + 配方大模型(垂直微调) |
| 一句话 | 把"想法"变成可交付的科研产物 | 把"性能要求"变成可执行的实验配方 |
**呈现纪律(全程硬约束):**
- 每页**论断式标题**(写结论,不写"XX 介绍")。
- 正文只用:**短卡片(≤12 字)/ KPI 数字卡 / 流程图 / 时间轴 / 对比表 / 矩阵网格**。禁止整段话。
- 每页带一行【呈现形式】,指明该页用什么版式画。
- 颜色:商务红主题(主色 #C00000),关键数字 / 核心步骤高亮。
- 凡是带"流程"的页,一律画成**节点+箭头流程图**,不写成文字列表。
**全篇页序(约 26 页):** 封面 → 双智能体总览 → [PART1:1.01.10] → [PART2:2.02.10] → 总结 → 展望/交流。
---
## 封面
- 主标题:**科研 AI 双智能体**
- 副标题:通用科研辅助智能体 · 无机非金属材料自主研发智能体
- 落款:中国建筑材料科学研究总院 · 中存大数据 / 2026
【呈现形式】杂志级背景图 + 居中大标题;底部一行四个关键词:自然语言驱动 / 全流程可交付 / 垂直配方大模型 / 统一安全底座。
---
## 总览页 · 一张图看懂两个智能体
**论断:一个横向赋能全院,一个纵向攻坚配方 —— 通用 + 垂直,双轮驱动。**
左右两张大卡:
- 左卡「通用科研辅助智能体」:自然语言入口 · 17 skill · 内部 100 万+ 文献库 · 直出 Word/PPT/图表
- 右卡「材料自主研发智能体」:五大引擎 · 智能实验设计 · 配方大模型(LoRA 微调) · 预测→配方闭环
- 中间用箭头/底座连接:**共享统一底座**(多模型调度 · 向量知识库 · 安全沙盒 · 训练流水线)
【呈现形式】左右双卡 + 下方一条横贯"统一底座"长条。这页是全场的"地图",后面两部分都回指这张图。
---
# 第一部分 · 通用科研辅助智能体
## 1.0 章节分隔页
- PART 01
- **通用科研辅助智能体**
- 副题:以自然语言为入口,把科研任务串成可交付的工作流
【呈现形式】章节封面页,大序号 + 标题 + 一句定位。
---
## 1.1 它是什么 —— 现有功能总览
**论断:不止"问答",而是能自己动手、直接交付成果的科研智能体。**
四张能力卡 + 一行数字条:
- **自然语言驱动**:描述需求 → 自动识别意图、动态挂载专业能力
- **产出可交付物**:直接生成 Word / PPT / 图表 / 数据,贴合科研与申报格式
- **全流程覆盖**:调研 — 计算 — 写作 — 评审,一个智能体串起,无需多工具切换
- **统一底座**:多模型调度 · 安全沙盒 · 长期记忆 · 长任务断点恢复
数字条(KPI):**17** 项专业 skill · **6** 大能力类别 · 内部 **100 万+** 篇材料文献库 · **多渠道**接入(网页/微信/定时)
【呈现形式】2×2 能力卡网格 + 底部一条 KPI 数字条(4 个数字)。
---
## 1.2 它怎么工作 —— 五步工作流
**论断:意图识别 → 动态挂载能力 → 沙盒内执行 → 关键节点人工确认 → 规范化成果。**
横向五段流程:
1. **自然语言需求**(用户提出)
2. **意图识别**(自动挂载对应 Skill)
3. **工具调用循环**(安全沙盒内自主迭代:思考→调用工具→观察)
4. **人工确认**(关键决策由用户拍板,过程可追溯)
5. **规范化成果**(Word · PPT · 图表 · 数据)
底部一条"统一底座支撑":多模型调度 / 安全沙盒隔离 / 个人文件库 / 长期记忆·断点恢复
【呈现形式】横向 5 节点流程图(箭头串联)+ 底部一条底座长条,做成主图、放大。
---
## 1.3 能力矩阵 —— 科研全流程 Skill 体系
**论断:17 项专业能力,按科研全流程六大类组织,可持续扩展。**
六张分类卡(每卡:类名 + 含的 skill + 一句话):
- **科研写作**:proposal 申报书 / paper 论文 / standard 标准 / patent 专利 / review 审稿 —— 立项到评审全链路
- **文献检索**:documents 内部库 / research 全网 / brief 方向简报 —— 可溯源文献支撑
- **科研计算**:pymatgen 晶体计算 / stats_ml 配方建模 —— "配比→性能"预测寻优
- **演示出图**:ppt 商务级幻灯 / plot_pub 出版级学术图 —— 能看、能讲、能投稿
- **通用元能力**:analyze 问题拆解 / coding 代码实现
- **可定制**:skill-creator 用户私有 skill(从零写或 fork 内置再改)
【呈现形式】2×3 卡片网格,每卡一个图标。下面五页对其中"标志性"能力各展开一页。
> 说明:内容生成(文生图/文生视频)本次汇报不展开,不单列页。
---
## 1.4 标志性能力 ① 文献检索 —— 内部百万级材料文献库
**论断:中文提问,命中英文文献 —— 100 万+ 篇材料学科论文,可溯源。**
主体两块:
- **七大学科库**(卡片/六边形网格,各一行):胶凝材料 · 陶瓷基 · 玻璃基 · 晶体 · 复合 · 耐火 · 检验检测
- **三路检索分工**(小流程):
- `documents` 内部库:100 万+ 英文论文,已 Markdown 化(LLM 直读),**跨语言语义检索**
- `research` 全网:OpenAlex 元数据 + DOI + PDF 下载
- `brief` 方向简报:重要论文列表 + 内容总结,520 分钟掌握一个方向
差异化标签(高亮):**跨语言检索** · **可溯源引用** · **立项依据有真实文献支撑**
【呈现形式】上方七学科库网格,下方三路检索分工小图;右侧竖排三个差异化标签 pill。
---
## 1.5 标志性能力 ② 项目申报 —— proposal
**论断:把课题信息变成可提交的申报书,评审雷区与文献真实性内置兜底。**
能力卡(短):
- **6 类基金骨架**:重点研发 / 重大专项 / 国自然面上·青年 / 联合基金 / 省地方 / 横向
- **评审雷区清单** + "不可考核词"过滤
- **文献真实性铁律**:不允许编造引文(GB/T 7714 顺序编码)
- **自动化产出**:间接费用台阶 + 经费表自动生成 · 技术路线图自动渲染插图
- **一段一卡**:关键章节逐段确认,不一口气出全文
产物:带目录 + 自动图题 + 图表编号的 `.docx`
【呈现形式】左侧"6 类基金"卡片网格,右侧"需求 → 一段一卡起草 → 渲染 docx"竖向流程;底部一条产物预览缩略。
---
## 1.6 标志性能力 ③ 科研写作全家桶 —— 论文 / 标准 / 专利 / 审稿
**论断:从论文到标准、专利、审稿 —— 写作全链路,反 AI 幻觉是底线。**
四象限卡(每卡:skill + 输入→产物):
- **paper 论文**:实验数据 → 中文核心 / 英文 SCI 投稿稿(IMRaD + 引文三角核验)
- **standard 标准**:材料/方法 → 国标 / 行标 / 团标 + 编制说明(GB/T 1.1—2020)
- **patent 专利**:项目素材 → 发明专利技术交底书(供代理师转写)
- **review 审稿**:已有稿 → 问题表 + 修改稿(长文分段深审)
横贯亮点条(高亮):**引文三角核验** —— 存在性 → 三角印证 → 支撑度,编造引文**零容忍**。
【呈现形式】2×2 象限卡 + 底部一条横贯"引文三角核验"亮点带。
---
## 1.7 标志性能力 ④ 材料计算 —— pymatgen + stats_ml
**论断:从晶体结构到配方建模 —— 服务"配比 → 性能"的预测与寻优。**
左右两栏:
- **pymatgen 无机材料计算**:晶体结构 I/O · XRD 模拟 · 相图 · 对称性 · Materials Project;**中文相名映射**(C₃S / 钙矾石 / 莫来石 / 方镁石 → 化学式)
- **stats_ml 配方-性能建模**:三库分工(sklearn 预测 / statsmodels 假设检验·p值 / PyMC 小样本贝叶斯);DoE 响应面 · 强度预测 · 异常配方聚类
典型场景标签:XRD 谱图模拟 · TG-DSC 双轴 · 强度预测 · 响应面寻优
【呈现形式】左右双栏卡,每栏配 23 个典型场景小图标;高亮"中文相名映射"和"三库分工"。
---
## 1.8 标志性能力 ⑤ 演示出图 —— ppt + plot_pub
**论断:成果"能看、能讲、能投稿" —— 商务级幻灯 + 出版级学术图。**
左右两块:
- **ppt 商务级演示**:卡片式视觉系统 · 论断式标题 · 信息设计纪律 · 一键整建 deck(原生可编辑)
- **plot_pub 出版级学术图**:中文 + viridis + 矢量(SVG/PDF)· 投稿级复合图设计纪律(XRD 叠图 / TG-DSC 双轴 / 多 panel)
价值标签:贴合期刊投稿(Cement and Concrete Research 等)· 降低整理排版成本
【呈现形式】左右两个产物缩略(一张 PPT 卡片样张 + 一张学术图样张)做观感对比。
---
## 1.9 平台技术架构(架构师视角)
**论断:Less Scaffolding, More Trust —— 把 LLM 当会持续变强的同事,给目标不给步骤。**
四象限架构卡:
- **① 智能体内核**:ReAct 工具调用循环(思考→调用→观察自主迭代)+ 进展守卫(重复调用/空转自动收敛)+ 阶段化编排嵌人工确认
- **② Skill 动态加载**:意图识别按需挂载,不相关能力不进上下文(渐进披露,省算力)+ 可扩展插件(流程+模板+脚本)
- **③ 安全沙盒**:每用户 Docker 容器隔离 · 资源限额 + 网络管控 + 最小权限 + 丰富工具集 / MCP
- **④ 模型·知识·记忆底座**:多模型自由调度(DeepSeek/Qwen + OpenAI 接口,涉密切内网)· RAG 抑制幻觉 · 双层长期记忆 + 长任务断点恢复
底部技术栈条:FastAPI(异步后端 + 原生 SSE)· LiteLLM(多模型统一接入,OpenAI 兼容)· 自研 ReAct 内核 · PostgreSQL(任务/消息 append-only)· Docker(每用户沙盒)· Skill 渐进披露体系
【呈现形式】2×2 架构象限卡 + 底部技术栈 pill 条,每条压成一句。
---
## 1.10 多渠道接入与产品化
**论断:不只是网页 —— 微信对话、定时任务,把智能体送到用户身边。**
三张卡:
- **网页工作台**:三栏 SPA(任务 / 对话 / 文件),消息目录导航、方案确认卡、文件预览
- **微信接入**:个人微信对话即可用,可主动推送简报/结果
- **定时任务**:"每天 X 点干 Y" —— 跑 skill 出简报 / 发邮件,自然语言建任务
【呈现形式】三卡横排,各配渠道图标。
---
# 第二部分 · 无机非金属材料自主研发智能体
## 2.0 章节分隔页
- PART 02
- **无机非金属材料自主研发智能体**
- 副题:水泥基配方大模型 —— 从"性能要求"到"实验配方"的自动化
【呈现形式】章节封面页。承上启下一句:从通用辅助,进入材料研发深水区。
---
## 2.1 五大引擎 —— 一图看全
**论断:五大引擎协同,构成材料研发的智能中枢。**
五个引擎卡(每卡:名称 + 一句≤10 字功能 + 图标):
1. **智能问答中枢**:统一入口,多轮+工具+文件问答
2. **知识库构建**:非结构化文档 → 可检索知识资产
3. **知识库问答**:RAG 结合企业知识,引用溯源
4. **AI 文档分类**:自动归档 + 触发向量重建
5. **智能实验设计**:需求 → 可执行配方(旗舰)
【呈现形式】五卡环形/总线布局,中心写"配方大模型";第 5 个引擎高亮(2.7 展开)。后面 2.32.7 逐个引擎各一页。
---
## 2.2 总体架构图(分层框图)
**论断:应用层 → 五大引擎 → 模型与向量层 → 训练模块,标准接口协同。**
四层框图:
- **User**:业务系统 / 请求
- **Backend 五大引擎**:Chat / KBBuild / KBQA / DocAI / Lab(**LangGraph 编排**复杂逻辑与实验设计流)
- **模型与数据层**:LLM(DeepSeek/Qwen) · Qwen2.5-VL 视觉 · BGE-M3 向量 · Milvus 向量库 · MinerU 解析
- **Train 训练模块**:LLaMA Factory → LoRA → 行业配方模型
【呈现形式】自上而下四层分层框图,层间箭头标接口(RAG / Embedding / LoRA)。只画框和箭头,不写段落。
---
## 2.3 引擎 ① 智能问答中枢
**论断:大模型统一入口 —— 从"回答问题"升级为"执行任务"。**
工作流程(流程图):
用户问题 → 会话与权限处理 → 任务识别 → **是否需要外部能力?**
- 否 → 普通问答 / 文件上下文 → LLM 生成
- 是 → 工具能力 → 读取文档 / MCP 工具调用
→ SSE 流式返回回答
技术卡(短):LangGraph 编排 · DeepSeek V3.1 / Qwen3-30B-A3B · 文件问答 + 多轮 + 思考模式 · MCP 接入外部系统 · SSE 流式输出
价值标签:统一标准化问答 · 高扩展集成业务工具 · 可升级为执行任务
【呈现形式】左侧带分支判定的流程图(菱形判定)+ 右侧技术卡 + 底部价值 pill。
---
## 2.4 引擎 ② 知识库构建
**论断:把分散的非结构化文档,沉淀为可检索、可引用、可追溯的企业知识资产。**
工作流程(流程图):
上传原始文档 → MinerU 解析 → **是否含图片/图表/扫描件?**
- 是 → Qwen2.5-VL 视觉解析 ↘
→ 文本结构化 & 生成 Markdown → 文本切分 → BGE-M3 向量化写入 Milvus → 保存文档元数据
支持内容卡(三类):
- **文档类**:PDF / Word / PPT / Excel
- **图像类**:图片 / 扫描件 / 图表
- **文本类**:Markdown / TXT / CSV / JSON
价值标签:分散资料 → 结构化知识库 · 为问答/实验/训练提供高质量数据基础
【呈现形式】上方带分支的处理流程图 + 下方三类支持内容卡。
---
## 2.5 引擎 ③ 知识库问答
**论断:基于 RAG 结合企业内部知识作答,引用可溯源,显著抑制幻觉。**
工作流程(流程图):
用户问题 → 问题理解 → 生成检索问题 → BGE-M3 向量化 → Milvus 检索 → 组装引用上下文 → 生成答案与溯源
技术卡(短):RAG 检索增强 · BGE-M3 向量化 + Milvus 检索 · DeepSeek/Qwen 结合上下文生成 · 引用来源溯源 · 多维度检索过滤
价值标签:提升专业性/准确性/可追溯 · 赋能私有文档深度问答 · 降低大模型幻觉风险
【呈现形式】横向 7 节点检索流程图(主色高亮"Milvus 检索"与"溯源")+ 右侧技术卡。
---
## 2.6 引擎 ④ AI 文档分类
**论断:自动识别领域与材料分类并归档,触发向量重建 —— 知识治理自动化。**
工作流程(流程图,含闭环):
待分类文档 → 读取解析内容 → 领域预判 → 构建分类体系 → 大模型分类 → 分类结果校验 → 保存 → **是否需调整归属?**
- 是 → 迁移文档并重建向量 → 完成归档
智能输出卡:摘要 · 领域 · 分类路径 · 判定依据 · 置信度
价值标签:降低人工整理归档成本 · 归入正确体系提升检索效率 · 为行业模型筛选标准化数据集
【呈现形式】带回环箭头的闭环流程图 + 一张"智能输出 5 字段"卡。
---
## 2.7 引擎 ⑤ 智能实验设计 —— 核心工作流(旗舰)
**论断:多阶段工作流,把研发需求转成可执行实验配方;核心一步是调用行业微调模型。**
横向时间轴,11 步压成 6 个阶段(核心步高亮):
1. **问题提炼**(科学问题 + 检索分类匹配 + 方向确认)
2. **文献检索分析**(向量库召回 + 逐篇提取实验参数)
3. **初步方案**(融合目标与文献,生成思路框架)
4. **学术评估优化**(多维量化评估,迭代优化路径)
5.**配方生成**(调用 Qwen2.5-1.5B LoRA 行业模型 → 原料/配比/条件)
6. **校验 + 用户确认 + 实验工单**(人机协同闭环 → 对接实验室)
【呈现形式】横向 6 段时间轴/泳道,第 5 段(配方生成)用主色高亮放大;标注"人工确认节点"。
---
## 2.8 配方大模型训练 —— 配置与成效
**论断:LLaMA Factory + Qwen2.5-1.5B + LoRA,16 条实测数据完成首版训练。**
左:训练配置卡(短):
- 框架 / 基座:**LLaMA Factory + Qwen2.5-1.5B-Instruct**
- 微调:**PEFT + LoRA**(冻结主干,仅训低秩矩阵)
- 任务:**SFT** 建立"性能要求 → 配方组成"映射
- 数据:**16 组**实验室实测(输入 3d/7d 抗压抗折 → 输出 矿粉/电石渣/脱硫石膏/粉煤灰/水/减水剂 配比)
右:KPI 数字卡网格 + loss 曲线示意:
- 可训练参数占比 **4.57%**(7386 万 / 16.18 亿)
- Loss **0.6897 → 0.0073**(降 **98.9%**)
- 训练轮数 **50** Epochs
- 优化策略:禁用 KV Cache · 梯度检查点 · Torch SDPA 加速
成效三标签:收敛稳定 · 捕捉"低强度→低掺量"行业规律 · 标准化配方输出
【呈现形式】左配置卡 + 右 KPI 网格(4 个大数字)+ 一条 loss 下降曲线示意。
---
## 2.9 现状与下一步 —— 局限与优化路线
**论断:首版受 16 条数据所限偏"记忆";分三阶段补数据、简空间、建闭环。**
左右对比:
- **左 · 当前局限**:
- 数据仅 16 条 → 模型偏"记忆样本",未真正"理解规律"
- 泛化受限 → 未见性能区间配方精度有波动
- **右 · 优化路线**(P0/P1/P2 路线条):
- **P0** 扩充数据集至 **200+**(从记忆升级为理解)
- **P1** 简化配方空间(精简冗余材料,降学习维度)
- **P2** 搭建"预测–实验–反馈"闭环,目标达标率 **≥85%**
【呈现形式】左侧两张"痛点"卡(冷色),右侧 P0→P1→P2 路线时间轴(暖色/主色)。
---
## 2.10 模型矩阵 —— 通用 + 垂直双轮
**论断:通用基座 + 视觉/向量 + 垂直 LoRA 配方模型,打通"解析→沉淀→决策"。**
六行场景表(场景 | 模型 | 用途):
| 场景 | 模型 | 用途 |
|---|---|---|
| 智能问答中枢 | DeepSeek V3.1 / Qwen3-30B-A3B | 通用问答、文件问答、工具调用 |
| 知识库构建 | Qwen2.5-VL + BGE-M3 + Milvus | 文档解析、图表提取、向量入库 |
| 知识库问答 | DeepSeek V3.1 + BGE-M3 + Milvus | RAG 精准问答 + 原文溯源 |
| AI 文档分类 | Qwen3-30B-A3B + BGE-M3 | 自动识别主题、分类归档 |
| 智能实验设计 | 通用大模型 + Qwen2.5-1.5B(LoRA) | 分析文献、生成配方方案 |
| 配方模型训练 | Qwen2.5-1.5B 基座 + BGE-M3 | 学习"性能-配方"映射 |
【呈现形式】六行卡片表(非密集文字表);右侧一句"通用 + 垂直双轮驱动"呼应总览页。
---
# 结尾
## 总结 —— 双智能体落地成效
**论断:一横一纵双智能体已落地,共享统一底座。**
四张成果卡:
- **通用智能体**:17 项 skill · 内部 100 万+ 文献库 · 全流程可交付(Word/PPT/图表)
- **垂直智能体**:五大引擎 · 智能实验设计 · 配方大模型首版(Loss 收敛 0.0073)
- **统一底座**:多模型调度 · 向量知识库 + RAG · 每用户安全沙盒 · 训练流水线 + LoRA 微调
- **业务价值**:打通"数据 → 知识 → 决策"闭环,知识沉淀为可复用资产,支撑研发提效
【呈现形式】2×2 成果卡,关键数字高亮。
---
## 展望 / 交流
- 下一阶段:配方数据集 16 → 200+ · 简化配方空间 · 建"预测–实验–反馈"闭环(达标率 ≥85%)· 持续扩展 skill 与渠道
- **感谢聆听 · 欢迎交流**
【呈现形式】左侧 34 条展望短句(带图标),右侧大字"感谢聆听 / 交流环节"。