# 科研 AI 双智能体 · 汇报 PPT 大纲 > 单位:中国建筑材料科学研究总院 · 中存大数据 > 用途:生成汇报 PPT 的内容底稿。本文件只定**结构 + 每页要点 + 呈现形式**,不写大段叙述文字。 > 编写日期:2026-06-24 --- ## 0. 总体设计说明(给设计 / 制作人员看) **叙事主线 —— 通用 + 垂直,双轮驱动:** | | 第一部分 | 第二部分 | |---|---|---| | 名称 | 通用科研辅助智能体 | 无机非金属材料自主研发智能体 | | 定位 | **横向**:服务全院科研人员日常全流程 | **纵深**:材料配方自主研发的自动化 | | 入口 | 自然语言,任意科研任务 | 材料研发需求 → 实验方案/配方 | | 形态 | 17 项 skill 能力矩阵 + 可交付物 | 五大引擎 + 配方大模型(垂直微调) | | 一句话 | 把"想法"变成可交付的科研产物 | 把"性能要求"变成可执行的实验配方 | **呈现纪律(全程硬约束):** - 每页**论断式标题**(写结论,不写"XX 介绍")。 - 正文只用:**短卡片(≤12 字)/ KPI 数字卡 / 流程图 / 时间轴 / 对比表 / 矩阵网格**。禁止整段话。 - 每页带一行【呈现形式】,指明该页用什么版式画。 - 颜色:商务红主题(主色 #C00000),关键数字 / 核心步骤高亮。 - 凡是带"流程"的页,一律画成**节点+箭头流程图**,不写成文字列表。 **全篇页序(约 26 页):** 封面 → 双智能体总览 → [PART1:1.0–1.10] → [PART2:2.0–2.10] → 总结 → 展望/交流。 --- ## 封面 - 主标题:**科研 AI 双智能体** - 副标题:通用科研辅助智能体 · 无机非金属材料自主研发智能体 - 落款:中国建筑材料科学研究总院 · 中存大数据 / 2026 【呈现形式】杂志级背景图 + 居中大标题;底部一行四个关键词:自然语言驱动 / 全流程可交付 / 垂直配方大模型 / 统一安全底座。 --- ## 总览页 · 一张图看懂两个智能体 **论断:一个横向赋能全院,一个纵向攻坚配方 —— 通用 + 垂直,双轮驱动。** 左右两张大卡: - 左卡「通用科研辅助智能体」:自然语言入口 · 17 skill · 内部 100 万+ 文献库 · 直出 Word/PPT/图表 - 右卡「材料自主研发智能体」:五大引擎 · 智能实验设计 · 配方大模型(LoRA 微调) · 预测→配方闭环 - 中间用箭头/底座连接:**共享统一底座**(多模型调度 · 向量知识库 · 安全沙盒 · 训练流水线) 【呈现形式】左右双卡 + 下方一条横贯"统一底座"长条。这页是全场的"地图",后面两部分都回指这张图。 --- # 第一部分 · 通用科研辅助智能体 ## 1.0 章节分隔页 - PART 01 - **通用科研辅助智能体** - 副题:以自然语言为入口,把科研任务串成可交付的工作流 【呈现形式】章节封面页,大序号 + 标题 + 一句定位。 --- ## 1.1 它是什么 —— 现有功能总览 **论断:不止"问答",而是能自己动手、直接交付成果的科研智能体。** 四张能力卡 + 一行数字条: - **自然语言驱动**:描述需求 → 自动识别意图、动态挂载专业能力 - **产出可交付物**:直接生成 Word / PPT / 图表 / 数据,贴合科研与申报格式 - **全流程覆盖**:调研 — 计算 — 写作 — 评审,一个智能体串起,无需多工具切换 - **统一底座**:多模型调度 · 安全沙盒 · 长期记忆 · 长任务断点恢复 数字条(KPI):**17** 项专业 skill · **6** 大能力类别 · 内部 **100 万+** 篇材料文献库 · **多渠道**接入(网页/微信/定时) 【呈现形式】2×2 能力卡网格 + 底部一条 KPI 数字条(4 个数字)。 --- ## 1.2 它怎么工作 —— 五步工作流 **论断:意图识别 → 动态挂载能力 → 沙盒内执行 → 关键节点人工确认 → 规范化成果。** 横向五段流程: 1. **自然语言需求**(用户提出) 2. **意图识别**(自动挂载对应 Skill) 3. **工具调用循环**(安全沙盒内自主迭代:思考→调用工具→观察) 4. **人工确认**(关键决策由用户拍板,过程可追溯) 5. **规范化成果**(Word · PPT · 图表 · 数据) 底部一条"统一底座支撑":多模型调度 / 安全沙盒隔离 / 个人文件库 / 长期记忆·断点恢复 【呈现形式】横向 5 节点流程图(箭头串联)+ 底部一条底座长条,做成主图、放大。 --- ## 1.3 能力矩阵 —— 科研全流程 Skill 体系 **论断:17 项专业能力,按科研全流程六大类组织,可持续扩展。** 六张分类卡(每卡:类名 + 含的 skill + 一句话): - **科研写作**:proposal 申报书 / paper 论文 / standard 标准 / patent 专利 / review 审稿 —— 立项到评审全链路 - **文献检索**:documents 内部库 / research 全网 / brief 方向简报 —— 可溯源文献支撑 - **科研计算**:pymatgen 晶体计算 / stats_ml 配方建模 —— "配比→性能"预测寻优 - **演示出图**:ppt 商务级幻灯 / plot_pub 出版级学术图 —— 能看、能讲、能投稿 - **通用元能力**:analyze 问题拆解 / coding 代码实现 - **可定制**:skill-creator 用户私有 skill(从零写或 fork 内置再改) 【呈现形式】2×3 卡片网格,每卡一个图标。下面五页对其中"标志性"能力各展开一页。 > 说明:内容生成(文生图/文生视频)本次汇报不展开,不单列页。 --- ## 1.4 标志性能力 ① 文献检索 —— 内部百万级材料文献库 **论断:中文提问,命中英文文献 —— 100 万+ 篇材料学科论文,可溯源。** 主体两块: - **七大学科库**(卡片/六边形网格,各一行):胶凝材料 · 陶瓷基 · 玻璃基 · 晶体 · 复合 · 耐火 · 检验检测 - **三路检索分工**(小流程): - `documents` 内部库:100 万+ 英文论文,已 Markdown 化(LLM 直读),**跨语言语义检索** - `research` 全网:OpenAlex 元数据 + DOI + PDF 下载 - `brief` 方向简报:重要论文列表 + 内容总结,5–20 分钟掌握一个方向 差异化标签(高亮):**跨语言检索** · **可溯源引用** · **立项依据有真实文献支撑** 【呈现形式】上方七学科库网格,下方三路检索分工小图;右侧竖排三个差异化标签 pill。 --- ## 1.5 标志性能力 ② 项目申报 —— proposal **论断:把课题信息变成可提交的申报书,评审雷区与文献真实性内置兜底。** 能力卡(短): - **6 类基金骨架**:重点研发 / 重大专项 / 国自然面上·青年 / 联合基金 / 省地方 / 横向 - **评审雷区清单** + "不可考核词"过滤 - **文献真实性铁律**:不允许编造引文(GB/T 7714 顺序编码) - **自动化产出**:间接费用台阶 + 经费表自动生成 · 技术路线图自动渲染插图 - **一段一卡**:关键章节逐段确认,不一口气出全文 产物:带目录 + 自动图题 + 图表编号的 `.docx` 【呈现形式】左侧"6 类基金"卡片网格,右侧"需求 → 一段一卡起草 → 渲染 docx"竖向流程;底部一条产物预览缩略。 --- ## 1.6 标志性能力 ③ 科研写作全家桶 —— 论文 / 标准 / 专利 / 审稿 **论断:从论文到标准、专利、审稿 —— 写作全链路,反 AI 幻觉是底线。** 四象限卡(每卡:skill + 输入→产物): - **paper 论文**:实验数据 → 中文核心 / 英文 SCI 投稿稿(IMRaD + 引文三角核验) - **standard 标准**:材料/方法 → 国标 / 行标 / 团标 + 编制说明(GB/T 1.1—2020) - **patent 专利**:项目素材 → 发明专利技术交底书(供代理师转写) - **review 审稿**:已有稿 → 问题表 + 修改稿(长文分段深审) 横贯亮点条(高亮):**引文三角核验** —— 存在性 → 三角印证 → 支撑度,编造引文**零容忍**。 【呈现形式】2×2 象限卡 + 底部一条横贯"引文三角核验"亮点带。 --- ## 1.7 标志性能力 ④ 材料计算 —— pymatgen + stats_ml **论断:从晶体结构到配方建模 —— 服务"配比 → 性能"的预测与寻优。** 左右两栏: - **pymatgen 无机材料计算**:晶体结构 I/O · XRD 模拟 · 相图 · 对称性 · Materials Project;**中文相名映射**(C₃S / 钙矾石 / 莫来石 / 方镁石 → 化学式) - **stats_ml 配方-性能建模**:三库分工(sklearn 预测 / statsmodels 假设检验·p值 / PyMC 小样本贝叶斯);DoE 响应面 · 强度预测 · 异常配方聚类 典型场景标签:XRD 谱图模拟 · TG-DSC 双轴 · 强度预测 · 响应面寻优 【呈现形式】左右双栏卡,每栏配 2–3 个典型场景小图标;高亮"中文相名映射"和"三库分工"。 --- ## 1.8 标志性能力 ⑤ 演示出图 —— ppt + plot_pub **论断:成果"能看、能讲、能投稿" —— 商务级幻灯 + 出版级学术图。** 左右两块: - **ppt 商务级演示**:卡片式视觉系统 · 论断式标题 · 信息设计纪律 · 一键整建 deck(原生可编辑) - **plot_pub 出版级学术图**:中文 + viridis + 矢量(SVG/PDF)· 投稿级复合图设计纪律(XRD 叠图 / TG-DSC 双轴 / 多 panel) 价值标签:贴合期刊投稿(Cement and Concrete Research 等)· 降低整理排版成本 【呈现形式】左右两个产物缩略(一张 PPT 卡片样张 + 一张学术图样张)做观感对比。 --- ## 1.9 平台技术架构(架构师视角) **论断:Less Scaffolding, More Trust —— 把 LLM 当会持续变强的同事,给目标不给步骤。** 四象限架构卡: - **① 智能体内核**:ReAct 工具调用循环(思考→调用→观察自主迭代)+ 进展守卫(重复调用/空转自动收敛)+ 阶段化编排嵌人工确认 - **② Skill 动态加载**:意图识别按需挂载,不相关能力不进上下文(渐进披露,省算力)+ 可扩展插件(流程+模板+脚本) - **③ 安全沙盒**:每用户 Docker 容器隔离 · 资源限额 + 网络管控 + 最小权限 + 丰富工具集 / MCP - **④ 模型·知识·记忆底座**:多模型自由调度(DeepSeek/Qwen + OpenAI 接口,涉密切内网)· RAG 抑制幻觉 · 双层长期记忆 + 长任务断点恢复 底部技术栈条:FastAPI(异步后端 + 原生 SSE)· LiteLLM(多模型统一接入,OpenAI 兼容)· 自研 ReAct 内核 · PostgreSQL(任务/消息 append-only)· Docker(每用户沙盒)· Skill 渐进披露体系 【呈现形式】2×2 架构象限卡 + 底部技术栈 pill 条,每条压成一句。 --- ## 1.10 多渠道接入与产品化 **论断:不只是网页 —— 微信对话、定时任务,把智能体送到用户身边。** 三张卡: - **网页工作台**:三栏 SPA(任务 / 对话 / 文件),消息目录导航、方案确认卡、文件预览 - **微信接入**:个人微信对话即可用,可主动推送简报/结果 - **定时任务**:"每天 X 点干 Y" —— 跑 skill 出简报 / 发邮件,自然语言建任务 【呈现形式】三卡横排,各配渠道图标。 --- # 第二部分 · 无机非金属材料自主研发智能体 ## 2.0 章节分隔页 - PART 02 - **无机非金属材料自主研发智能体** - 副题:水泥基配方大模型 —— 从"性能要求"到"实验配方"的自动化 【呈现形式】章节封面页。承上启下一句:从通用辅助,进入材料研发深水区。 --- ## 2.1 五大引擎 —— 一图看全 **论断:五大引擎协同,构成材料研发的智能中枢。** 五个引擎卡(每卡:名称 + 一句≤10 字功能 + 图标): 1. **智能问答中枢**:统一入口,多轮+工具+文件问答 2. **知识库构建**:非结构化文档 → 可检索知识资产 3. **知识库问答**:RAG 结合企业知识,引用溯源 4. **AI 文档分类**:自动归档 + 触发向量重建 5. **智能实验设计**:需求 → 可执行配方(旗舰) 【呈现形式】五卡环形/总线布局,中心写"配方大模型";第 5 个引擎高亮(2.7 展开)。后面 2.3–2.7 逐个引擎各一页。 --- ## 2.2 总体架构图(分层框图) **论断:应用层 → 五大引擎 → 模型与向量层 → 训练模块,标准接口协同。** 四层框图: - **User**:业务系统 / 请求 - **Backend 五大引擎**:Chat / KBBuild / KBQA / DocAI / Lab(**LangGraph 编排**复杂逻辑与实验设计流) - **模型与数据层**:LLM(DeepSeek/Qwen) · Qwen2.5-VL 视觉 · BGE-M3 向量 · Milvus 向量库 · MinerU 解析 - **Train 训练模块**:LLaMA Factory → LoRA → 行业配方模型 【呈现形式】自上而下四层分层框图,层间箭头标接口(RAG / Embedding / LoRA)。只画框和箭头,不写段落。 --- ## 2.3 引擎 ① 智能问答中枢 **论断:大模型统一入口 —— 从"回答问题"升级为"执行任务"。** 工作流程(流程图): 用户问题 → 会话与权限处理 → 任务识别 → **是否需要外部能力?** - 否 → 普通问答 / 文件上下文 → LLM 生成 - 是 → 工具能力 → 读取文档 / MCP 工具调用 → SSE 流式返回回答 技术卡(短):LangGraph 编排 · DeepSeek V3.1 / Qwen3-30B-A3B · 文件问答 + 多轮 + 思考模式 · MCP 接入外部系统 · SSE 流式输出 价值标签:统一标准化问答 · 高扩展集成业务工具 · 可升级为执行任务 【呈现形式】左侧带分支判定的流程图(菱形判定)+ 右侧技术卡 + 底部价值 pill。 --- ## 2.4 引擎 ② 知识库构建 **论断:把分散的非结构化文档,沉淀为可检索、可引用、可追溯的企业知识资产。** 工作流程(流程图): 上传原始文档 → MinerU 解析 → **是否含图片/图表/扫描件?** - 是 → Qwen2.5-VL 视觉解析 ↘ → 文本结构化 & 生成 Markdown → 文本切分 → BGE-M3 向量化写入 Milvus → 保存文档元数据 支持内容卡(三类): - **文档类**:PDF / Word / PPT / Excel - **图像类**:图片 / 扫描件 / 图表 - **文本类**:Markdown / TXT / CSV / JSON 价值标签:分散资料 → 结构化知识库 · 为问答/实验/训练提供高质量数据基础 【呈现形式】上方带分支的处理流程图 + 下方三类支持内容卡。 --- ## 2.5 引擎 ③ 知识库问答 **论断:基于 RAG 结合企业内部知识作答,引用可溯源,显著抑制幻觉。** 工作流程(流程图): 用户问题 → 问题理解 → 生成检索问题 → BGE-M3 向量化 → Milvus 检索 → 组装引用上下文 → 生成答案与溯源 技术卡(短):RAG 检索增强 · BGE-M3 向量化 + Milvus 检索 · DeepSeek/Qwen 结合上下文生成 · 引用来源溯源 · 多维度检索过滤 价值标签:提升专业性/准确性/可追溯 · 赋能私有文档深度问答 · 降低大模型幻觉风险 【呈现形式】横向 7 节点检索流程图(主色高亮"Milvus 检索"与"溯源")+ 右侧技术卡。 --- ## 2.6 引擎 ④ AI 文档分类 **论断:自动识别领域与材料分类并归档,触发向量重建 —— 知识治理自动化。** 工作流程(流程图,含闭环): 待分类文档 → 读取解析内容 → 领域预判 → 构建分类体系 → 大模型分类 → 分类结果校验 → 保存 → **是否需调整归属?** - 是 → 迁移文档并重建向量 → 完成归档 智能输出卡:摘要 · 领域 · 分类路径 · 判定依据 · 置信度 价值标签:降低人工整理归档成本 · 归入正确体系提升检索效率 · 为行业模型筛选标准化数据集 【呈现形式】带回环箭头的闭环流程图 + 一张"智能输出 5 字段"卡。 --- ## 2.7 引擎 ⑤ 智能实验设计 —— 核心工作流(旗舰) **论断:多阶段工作流,把研发需求转成可执行实验配方;核心一步是调用行业微调模型。** 横向时间轴,11 步压成 6 个阶段(核心步高亮): 1. **问题提炼**(科学问题 + 检索分类匹配 + 方向确认) 2. **文献检索分析**(向量库召回 + 逐篇提取实验参数) 3. **初步方案**(融合目标与文献,生成思路框架) 4. **学术评估优化**(多维量化评估,迭代优化路径) 5. ⭐ **配方生成**(调用 Qwen2.5-1.5B LoRA 行业模型 → 原料/配比/条件) 6. **校验 + 用户确认 + 实验工单**(人机协同闭环 → 对接实验室) 【呈现形式】横向 6 段时间轴/泳道,第 5 段(配方生成)用主色高亮放大;标注"人工确认节点"。 --- ## 2.8 配方大模型训练 —— 配置与成效 **论断:LLaMA Factory + Qwen2.5-1.5B + LoRA,16 条实测数据完成首版训练。** 左:训练配置卡(短): - 框架 / 基座:**LLaMA Factory + Qwen2.5-1.5B-Instruct** - 微调:**PEFT + LoRA**(冻结主干,仅训低秩矩阵) - 任务:**SFT** 建立"性能要求 → 配方组成"映射 - 数据:**16 组**实验室实测(输入 3d/7d 抗压抗折 → 输出 矿粉/电石渣/脱硫石膏/粉煤灰/水/减水剂 配比) 右:KPI 数字卡网格 + loss 曲线示意: - 可训练参数占比 **4.57%**(7386 万 / 16.18 亿) - Loss **0.6897 → 0.0073**(降 **98.9%**) - 训练轮数 **50** Epochs - 优化策略:禁用 KV Cache · 梯度检查点 · Torch SDPA 加速 成效三标签:收敛稳定 · 捕捉"低强度→低掺量"行业规律 · 标准化配方输出 【呈现形式】左配置卡 + 右 KPI 网格(4 个大数字)+ 一条 loss 下降曲线示意。 --- ## 2.9 现状与下一步 —— 局限与优化路线 **论断:首版受 16 条数据所限偏"记忆";分三阶段补数据、简空间、建闭环。** 左右对比: - **左 · 当前局限**: - 数据仅 16 条 → 模型偏"记忆样本",未真正"理解规律" - 泛化受限 → 未见性能区间配方精度有波动 - **右 · 优化路线**(P0/P1/P2 路线条): - **P0** 扩充数据集至 **200+**(从记忆升级为理解) - **P1** 简化配方空间(精简冗余材料,降学习维度) - **P2** 搭建"预测–实验–反馈"闭环,目标达标率 **≥85%** 【呈现形式】左侧两张"痛点"卡(冷色),右侧 P0→P1→P2 路线时间轴(暖色/主色)。 --- ## 2.10 模型矩阵 —— 通用 + 垂直双轮 **论断:通用基座 + 视觉/向量 + 垂直 LoRA 配方模型,打通"解析→沉淀→决策"。** 六行场景表(场景 | 模型 | 用途): | 场景 | 模型 | 用途 | |---|---|---| | 智能问答中枢 | DeepSeek V3.1 / Qwen3-30B-A3B | 通用问答、文件问答、工具调用 | | 知识库构建 | Qwen2.5-VL + BGE-M3 + Milvus | 文档解析、图表提取、向量入库 | | 知识库问答 | DeepSeek V3.1 + BGE-M3 + Milvus | RAG 精准问答 + 原文溯源 | | AI 文档分类 | Qwen3-30B-A3B + BGE-M3 | 自动识别主题、分类归档 | | 智能实验设计 | 通用大模型 + Qwen2.5-1.5B(LoRA) | 分析文献、生成配方方案 | | 配方模型训练 | Qwen2.5-1.5B 基座 + BGE-M3 | 学习"性能-配方"映射 | 【呈现形式】六行卡片表(非密集文字表);右侧一句"通用 + 垂直双轮驱动"呼应总览页。 --- # 结尾 ## 总结 —— 双智能体落地成效 **论断:一横一纵双智能体已落地,共享统一底座。** 四张成果卡: - **通用智能体**:17 项 skill · 内部 100 万+ 文献库 · 全流程可交付(Word/PPT/图表) - **垂直智能体**:五大引擎 · 智能实验设计 · 配方大模型首版(Loss 收敛 0.0073) - **统一底座**:多模型调度 · 向量知识库 + RAG · 每用户安全沙盒 · 训练流水线 + LoRA 微调 - **业务价值**:打通"数据 → 知识 → 决策"闭环,知识沉淀为可复用资产,支撑研发提效 【呈现形式】2×2 成果卡,关键数字高亮。 --- ## 展望 / 交流 - 下一阶段:配方数据集 16 → 200+ · 简化配方空间 · 建"预测–实验–反馈"闭环(达标率 ≥85%)· 持续扩展 skill 与渠道 - **感谢聆听 · 欢迎交流** 【呈现形式】左侧 3–4 条展望短句(带图标),右侧大字"感谢聆听 / 交流环节"。