19 KiB
科研 AI 双智能体 · 汇报 PPT 大纲
单位:中国建筑材料科学研究总院 · 中存大数据 用途:生成汇报 PPT 的内容底稿。本文件只定结构 + 每页要点 + 呈现形式,不写大段叙述文字。 编写日期:2026-06-24
0. 总体设计说明(给设计 / 制作人员看)
叙事主线 —— 通用 + 垂直,双轮驱动:
| 第一部分 | 第二部分 | |
|---|---|---|
| 名称 | 通用科研辅助智能体 | 无机非金属材料自主研发智能体 |
| 定位 | 横向:服务全院科研人员日常全流程 | 纵深:材料配方自主研发的自动化 |
| 入口 | 自然语言,任意科研任务 | 材料研发需求 → 实验方案/配方 |
| 形态 | 17 项 skill 能力矩阵 + 可交付物 | 五大引擎 + 配方大模型(垂直微调) |
| 一句话 | 把"想法"变成可交付的科研产物 | 把"性能要求"变成可执行的实验配方 |
呈现纪律(全程硬约束):
- 每页论断式标题(写结论,不写"XX 介绍")。
- 正文只用:短卡片(≤12 字)/ KPI 数字卡 / 流程图 / 时间轴 / 对比表 / 矩阵网格。禁止整段话。
- 每页带一行【呈现形式】,指明该页用什么版式画。
- 颜色:商务红主题(主色 #C00000),关键数字 / 核心步骤高亮。
- 凡是带"流程"的页,一律画成节点+箭头流程图,不写成文字列表。
全篇页序(约 26 页): 封面 → 双智能体总览 → [PART1:1.0–1.10] → [PART2:2.0–2.10] → 总结 → 展望/交流。
封面
- 主标题:科研 AI 双智能体
- 副标题:通用科研辅助智能体 · 无机非金属材料自主研发智能体
- 落款:中国建筑材料科学研究总院 · 中存大数据 / 2026
【呈现形式】杂志级背景图 + 居中大标题;底部一行四个关键词:自然语言驱动 / 全流程可交付 / 垂直配方大模型 / 统一安全底座。
总览页 · 一张图看懂两个智能体
论断:一个横向赋能全院,一个纵向攻坚配方 —— 通用 + 垂直,双轮驱动。
左右两张大卡:
- 左卡「通用科研辅助智能体」:自然语言入口 · 17 skill · 内部 100 万+ 文献库 · 直出 Word/PPT/图表
- 右卡「材料自主研发智能体」:五大引擎 · 智能实验设计 · 配方大模型(LoRA 微调) · 预测→配方闭环
- 中间用箭头/底座连接:共享统一底座(多模型调度 · 向量知识库 · 安全沙盒 · 训练流水线)
【呈现形式】左右双卡 + 下方一条横贯"统一底座"长条。这页是全场的"地图",后面两部分都回指这张图。
第一部分 · 通用科研辅助智能体
1.0 章节分隔页
- PART 01
- 通用科研辅助智能体
- 副题:以自然语言为入口,把科研任务串成可交付的工作流
【呈现形式】章节封面页,大序号 + 标题 + 一句定位。
1.1 它是什么 —— 现有功能总览
论断:不止"问答",而是能自己动手、直接交付成果的科研智能体。
四张能力卡 + 一行数字条:
- 自然语言驱动:描述需求 → 自动识别意图、动态挂载专业能力
- 产出可交付物:直接生成 Word / PPT / 图表 / 数据,贴合科研与申报格式
- 全流程覆盖:调研 — 计算 — 写作 — 评审,一个智能体串起,无需多工具切换
- 统一底座:多模型调度 · 安全沙盒 · 长期记忆 · 长任务断点恢复
数字条(KPI):17 项专业 skill · 6 大能力类别 · 内部 100 万+ 篇材料文献库 · 多渠道接入(网页/微信/定时)
【呈现形式】2×2 能力卡网格 + 底部一条 KPI 数字条(4 个数字)。
1.2 它怎么工作 —— 五步工作流
论断:意图识别 → 动态挂载能力 → 沙盒内执行 → 关键节点人工确认 → 规范化成果。
横向五段流程:
- 自然语言需求(用户提出)
- 意图识别(自动挂载对应 Skill)
- 工具调用循环(安全沙盒内自主迭代:思考→调用工具→观察)
- 人工确认(关键决策由用户拍板,过程可追溯)
- 规范化成果(Word · PPT · 图表 · 数据)
底部一条"统一底座支撑":多模型调度 / 安全沙盒隔离 / 个人文件库 / 长期记忆·断点恢复
【呈现形式】横向 5 节点流程图(箭头串联)+ 底部一条底座长条,做成主图、放大。
1.3 能力矩阵 —— 科研全流程 Skill 体系
论断:17 项专业能力,按科研全流程六大类组织,可持续扩展。
六张分类卡(每卡:类名 + 含的 skill + 一句话):
- 科研写作:proposal 申报书 / paper 论文 / standard 标准 / patent 专利 / review 审稿 —— 立项到评审全链路
- 文献检索:documents 内部库 / research 全网 / brief 方向简报 —— 可溯源文献支撑
- 科研计算:pymatgen 晶体计算 / stats_ml 配方建模 —— "配比→性能"预测寻优
- 演示出图:ppt 商务级幻灯 / plot_pub 出版级学术图 —— 能看、能讲、能投稿
- 通用元能力:analyze 问题拆解 / coding 代码实现
- 可定制:skill-creator 用户私有 skill(从零写或 fork 内置再改)
【呈现形式】2×3 卡片网格,每卡一个图标。下面五页对其中"标志性"能力各展开一页。
说明:内容生成(文生图/文生视频)本次汇报不展开,不单列页。
1.4 标志性能力 ① 文献检索 —— 内部百万级材料文献库
论断:中文提问,命中英文文献 —— 100 万+ 篇材料学科论文,可溯源。
主体两块:
- 七大学科库(卡片/六边形网格,各一行):胶凝材料 · 陶瓷基 · 玻璃基 · 晶体 · 复合 · 耐火 · 检验检测
- 三路检索分工(小流程):
documents内部库:100 万+ 英文论文,已 Markdown 化(LLM 直读),跨语言语义检索research全网:OpenAlex 元数据 + DOI + PDF 下载brief方向简报:重要论文列表 + 内容总结,5–20 分钟掌握一个方向
差异化标签(高亮):跨语言检索 · 可溯源引用 · 立项依据有真实文献支撑
【呈现形式】上方七学科库网格,下方三路检索分工小图;右侧竖排三个差异化标签 pill。
1.5 标志性能力 ② 项目申报 —— proposal
论断:把课题信息变成可提交的申报书,评审雷区与文献真实性内置兜底。
能力卡(短):
- 6 类基金骨架:重点研发 / 重大专项 / 国自然面上·青年 / 联合基金 / 省地方 / 横向
- 评审雷区清单 + "不可考核词"过滤
- 文献真实性铁律:不允许编造引文(GB/T 7714 顺序编码)
- 自动化产出:间接费用台阶 + 经费表自动生成 · 技术路线图自动渲染插图
- 一段一卡:关键章节逐段确认,不一口气出全文
产物:带目录 + 自动图题 + 图表编号的 .docx
【呈现形式】左侧"6 类基金"卡片网格,右侧"需求 → 一段一卡起草 → 渲染 docx"竖向流程;底部一条产物预览缩略。
1.6 标志性能力 ③ 科研写作全家桶 —— 论文 / 标准 / 专利 / 审稿
论断:从论文到标准、专利、审稿 —— 写作全链路,反 AI 幻觉是底线。
四象限卡(每卡:skill + 输入→产物):
- paper 论文:实验数据 → 中文核心 / 英文 SCI 投稿稿(IMRaD + 引文三角核验)
- standard 标准:材料/方法 → 国标 / 行标 / 团标 + 编制说明(GB/T 1.1—2020)
- patent 专利:项目素材 → 发明专利技术交底书(供代理师转写)
- review 审稿:已有稿 → 问题表 + 修改稿(长文分段深审)
横贯亮点条(高亮):引文三角核验 —— 存在性 → 三角印证 → 支撑度,编造引文零容忍。
【呈现形式】2×2 象限卡 + 底部一条横贯"引文三角核验"亮点带。
1.7 标志性能力 ④ 材料计算 —— pymatgen + stats_ml
论断:从晶体结构到配方建模 —— 服务"配比 → 性能"的预测与寻优。
左右两栏:
- pymatgen 无机材料计算:晶体结构 I/O · XRD 模拟 · 相图 · 对称性 · Materials Project;中文相名映射(C₃S / 钙矾石 / 莫来石 / 方镁石 → 化学式)
- stats_ml 配方-性能建模:三库分工(sklearn 预测 / statsmodels 假设检验·p值 / PyMC 小样本贝叶斯);DoE 响应面 · 强度预测 · 异常配方聚类
典型场景标签:XRD 谱图模拟 · TG-DSC 双轴 · 强度预测 · 响应面寻优
【呈现形式】左右双栏卡,每栏配 2–3 个典型场景小图标;高亮"中文相名映射"和"三库分工"。
1.8 标志性能力 ⑤ 演示出图 —— ppt + plot_pub
论断:成果"能看、能讲、能投稿" —— 商务级幻灯 + 出版级学术图。
左右两块:
- ppt 商务级演示:卡片式视觉系统 · 论断式标题 · 信息设计纪律 · 一键整建 deck(原生可编辑)
- plot_pub 出版级学术图:中文 + viridis + 矢量(SVG/PDF)· 投稿级复合图设计纪律(XRD 叠图 / TG-DSC 双轴 / 多 panel)
价值标签:贴合期刊投稿(Cement and Concrete Research 等)· 降低整理排版成本
【呈现形式】左右两个产物缩略(一张 PPT 卡片样张 + 一张学术图样张)做观感对比。
1.9 平台技术架构(架构师视角)
论断:Less Scaffolding, More Trust —— 把 LLM 当会持续变强的同事,给目标不给步骤。
四象限架构卡:
- ① 智能体内核:ReAct 工具调用循环(思考→调用→观察自主迭代)+ 进展守卫(重复调用/空转自动收敛)+ 阶段化编排嵌人工确认
- ② Skill 动态加载:意图识别按需挂载,不相关能力不进上下文(渐进披露,省算力)+ 可扩展插件(流程+模板+脚本)
- ③ 安全沙盒:每用户 Docker 容器隔离 · 资源限额 + 网络管控 + 最小权限 + 丰富工具集 / MCP
- ④ 模型·知识·记忆底座:多模型自由调度(DeepSeek/Qwen + OpenAI 接口,涉密切内网)· RAG 抑制幻觉 · 双层长期记忆 + 长任务断点恢复
底部技术栈条:FastAPI(异步后端 + 原生 SSE)· LiteLLM(多模型统一接入,OpenAI 兼容)· 自研 ReAct 内核 · PostgreSQL(任务/消息 append-only)· Docker(每用户沙盒)· Skill 渐进披露体系
【呈现形式】2×2 架构象限卡 + 底部技术栈 pill 条,每条压成一句。
1.10 多渠道接入与产品化
论断:不只是网页 —— 微信对话、定时任务,把智能体送到用户身边。
三张卡:
- 网页工作台:三栏 SPA(任务 / 对话 / 文件),消息目录导航、方案确认卡、文件预览
- 微信接入:个人微信对话即可用,可主动推送简报/结果
- 定时任务:"每天 X 点干 Y" —— 跑 skill 出简报 / 发邮件,自然语言建任务
【呈现形式】三卡横排,各配渠道图标。
第二部分 · 无机非金属材料自主研发智能体
2.0 章节分隔页
- PART 02
- 无机非金属材料自主研发智能体
- 副题:水泥基配方大模型 —— 从"性能要求"到"实验配方"的自动化
【呈现形式】章节封面页。承上启下一句:从通用辅助,进入材料研发深水区。
2.1 五大引擎 —— 一图看全
论断:五大引擎协同,构成材料研发的智能中枢。
五个引擎卡(每卡:名称 + 一句≤10 字功能 + 图标):
- 智能问答中枢:统一入口,多轮+工具+文件问答
- 知识库构建:非结构化文档 → 可检索知识资产
- 知识库问答:RAG 结合企业知识,引用溯源
- AI 文档分类:自动归档 + 触发向量重建
- 智能实验设计:需求 → 可执行配方(旗舰)
【呈现形式】五卡环形/总线布局,中心写"配方大模型";第 5 个引擎高亮(2.7 展开)。后面 2.3–2.7 逐个引擎各一页。
2.2 总体架构图(分层框图)
论断:应用层 → 五大引擎 → 模型与向量层 → 训练模块,标准接口协同。
四层框图:
- User:业务系统 / 请求
- Backend 五大引擎:Chat / KBBuild / KBQA / DocAI / Lab(LangGraph 编排复杂逻辑与实验设计流)
- 模型与数据层:LLM(DeepSeek/Qwen) · Qwen2.5-VL 视觉 · BGE-M3 向量 · Milvus 向量库 · MinerU 解析
- Train 训练模块:LLaMA Factory → LoRA → 行业配方模型
【呈现形式】自上而下四层分层框图,层间箭头标接口(RAG / Embedding / LoRA)。只画框和箭头,不写段落。
2.3 引擎 ① 智能问答中枢
论断:大模型统一入口 —— 从"回答问题"升级为"执行任务"。
工作流程(流程图): 用户问题 → 会话与权限处理 → 任务识别 → 是否需要外部能力?
- 否 → 普通问答 / 文件上下文 → LLM 生成
- 是 → 工具能力 → 读取文档 / MCP 工具调用 → SSE 流式返回回答
技术卡(短):LangGraph 编排 · DeepSeek V3.1 / Qwen3-30B-A3B · 文件问答 + 多轮 + 思考模式 · MCP 接入外部系统 · SSE 流式输出
价值标签:统一标准化问答 · 高扩展集成业务工具 · 可升级为执行任务
【呈现形式】左侧带分支判定的流程图(菱形判定)+ 右侧技术卡 + 底部价值 pill。
2.4 引擎 ② 知识库构建
论断:把分散的非结构化文档,沉淀为可检索、可引用、可追溯的企业知识资产。
工作流程(流程图): 上传原始文档 → MinerU 解析 → 是否含图片/图表/扫描件?
- 是 → Qwen2.5-VL 视觉解析 ↘ → 文本结构化 & 生成 Markdown → 文本切分 → BGE-M3 向量化写入 Milvus → 保存文档元数据
支持内容卡(三类):
- 文档类:PDF / Word / PPT / Excel
- 图像类:图片 / 扫描件 / 图表
- 文本类:Markdown / TXT / CSV / JSON
价值标签:分散资料 → 结构化知识库 · 为问答/实验/训练提供高质量数据基础
【呈现形式】上方带分支的处理流程图 + 下方三类支持内容卡。
2.5 引擎 ③ 知识库问答
论断:基于 RAG 结合企业内部知识作答,引用可溯源,显著抑制幻觉。
工作流程(流程图): 用户问题 → 问题理解 → 生成检索问题 → BGE-M3 向量化 → Milvus 检索 → 组装引用上下文 → 生成答案与溯源
技术卡(短):RAG 检索增强 · BGE-M3 向量化 + Milvus 检索 · DeepSeek/Qwen 结合上下文生成 · 引用来源溯源 · 多维度检索过滤
价值标签:提升专业性/准确性/可追溯 · 赋能私有文档深度问答 · 降低大模型幻觉风险
【呈现形式】横向 7 节点检索流程图(主色高亮"Milvus 检索"与"溯源")+ 右侧技术卡。
2.6 引擎 ④ AI 文档分类
论断:自动识别领域与材料分类并归档,触发向量重建 —— 知识治理自动化。
工作流程(流程图,含闭环): 待分类文档 → 读取解析内容 → 领域预判 → 构建分类体系 → 大模型分类 → 分类结果校验 → 保存 → 是否需调整归属?
- 是 → 迁移文档并重建向量 → 完成归档
智能输出卡:摘要 · 领域 · 分类路径 · 判定依据 · 置信度
价值标签:降低人工整理归档成本 · 归入正确体系提升检索效率 · 为行业模型筛选标准化数据集
【呈现形式】带回环箭头的闭环流程图 + 一张"智能输出 5 字段"卡。
2.7 引擎 ⑤ 智能实验设计 —— 核心工作流(旗舰)
论断:多阶段工作流,把研发需求转成可执行实验配方;核心一步是调用行业微调模型。
横向时间轴,11 步压成 6 个阶段(核心步高亮):
- 问题提炼(科学问题 + 检索分类匹配 + 方向确认)
- 文献检索分析(向量库召回 + 逐篇提取实验参数)
- 初步方案(融合目标与文献,生成思路框架)
- 学术评估优化(多维量化评估,迭代优化路径)
- ⭐ 配方生成(调用 Qwen2.5-1.5B LoRA 行业模型 → 原料/配比/条件)
- 校验 + 用户确认 + 实验工单(人机协同闭环 → 对接实验室)
【呈现形式】横向 6 段时间轴/泳道,第 5 段(配方生成)用主色高亮放大;标注"人工确认节点"。
2.8 配方大模型训练 —— 配置与成效
论断:LLaMA Factory + Qwen2.5-1.5B + LoRA,16 条实测数据完成首版训练。
左:训练配置卡(短):
- 框架 / 基座:LLaMA Factory + Qwen2.5-1.5B-Instruct
- 微调:PEFT + LoRA(冻结主干,仅训低秩矩阵)
- 任务:SFT 建立"性能要求 → 配方组成"映射
- 数据:16 组实验室实测(输入 3d/7d 抗压抗折 → 输出 矿粉/电石渣/脱硫石膏/粉煤灰/水/减水剂 配比)
右:KPI 数字卡网格 + loss 曲线示意:
- 可训练参数占比 4.57%(7386 万 / 16.18 亿)
- Loss 0.6897 → 0.0073(降 98.9%)
- 训练轮数 50 Epochs
- 优化策略:禁用 KV Cache · 梯度检查点 · Torch SDPA 加速
成效三标签:收敛稳定 · 捕捉"低强度→低掺量"行业规律 · 标准化配方输出
【呈现形式】左配置卡 + 右 KPI 网格(4 个大数字)+ 一条 loss 下降曲线示意。
2.9 现状与下一步 —— 局限与优化路线
论断:首版受 16 条数据所限偏"记忆";分三阶段补数据、简空间、建闭环。
左右对比:
- 左 · 当前局限:
- 数据仅 16 条 → 模型偏"记忆样本",未真正"理解规律"
- 泛化受限 → 未见性能区间配方精度有波动
- 右 · 优化路线(P0/P1/P2 路线条):
- P0 扩充数据集至 200+(从记忆升级为理解)
- P1 简化配方空间(精简冗余材料,降学习维度)
- P2 搭建"预测–实验–反馈"闭环,目标达标率 ≥85%
【呈现形式】左侧两张"痛点"卡(冷色),右侧 P0→P1→P2 路线时间轴(暖色/主色)。
2.10 模型矩阵 —— 通用 + 垂直双轮
论断:通用基座 + 视觉/向量 + 垂直 LoRA 配方模型,打通"解析→沉淀→决策"。
六行场景表(场景 | 模型 | 用途):
| 场景 | 模型 | 用途 |
|---|---|---|
| 智能问答中枢 | DeepSeek V3.1 / Qwen3-30B-A3B | 通用问答、文件问答、工具调用 |
| 知识库构建 | Qwen2.5-VL + BGE-M3 + Milvus | 文档解析、图表提取、向量入库 |
| 知识库问答 | DeepSeek V3.1 + BGE-M3 + Milvus | RAG 精准问答 + 原文溯源 |
| AI 文档分类 | Qwen3-30B-A3B + BGE-M3 | 自动识别主题、分类归档 |
| 智能实验设计 | 通用大模型 + Qwen2.5-1.5B(LoRA) | 分析文献、生成配方方案 |
| 配方模型训练 | Qwen2.5-1.5B 基座 + BGE-M3 | 学习"性能-配方"映射 |
【呈现形式】六行卡片表(非密集文字表);右侧一句"通用 + 垂直双轮驱动"呼应总览页。
结尾
总结 —— 双智能体落地成效
论断:一横一纵双智能体已落地,共享统一底座。
四张成果卡:
- 通用智能体:17 项 skill · 内部 100 万+ 文献库 · 全流程可交付(Word/PPT/图表)
- 垂直智能体:五大引擎 · 智能实验设计 · 配方大模型首版(Loss 收敛 0.0073)
- 统一底座:多模型调度 · 向量知识库 + RAG · 每用户安全沙盒 · 训练流水线 + LoRA 微调
- 业务价值:打通"数据 → 知识 → 决策"闭环,知识沉淀为可复用资产,支撑研发提效
【呈现形式】2×2 成果卡,关键数字高亮。
展望 / 交流
- 下一阶段:配方数据集 16 → 200+ · 简化配方空间 · 建"预测–实验–反馈"闭环(达标率 ≥85%)· 持续扩展 skill 与渠道
- 感谢聆听 · 欢迎交流
【呈现形式】左侧 3–4 条展望短句(带图标),右侧大字"感谢聆听 / 交流环节"。