19 KiB

Raw Blame History

科研 AI 双智能体 · 汇报 PPT 大纲

单位:中国建筑材料科学研究总院 · 中存大数据用途:生成汇报 PPT 的内容底稿。本文件只定结构 + 每页要点 + 呈现形式,不写大段叙述文字。编写日期:2026-06-24

0. 总体设计说明(给设计 / 制作人员看)

叙事主线 —— 通用 + 垂直,双轮驱动:

	第一部分	第二部分
名称	通用科研辅助智能体	无机非金属材料自主研发智能体
定位	横向:服务全院科研人员日常全流程	纵深:材料配方自主研发的自动化
入口	自然语言,任意科研任务	材料研发需求 → 实验方案/配方
形态	17 项 skill 能力矩阵 + 可交付物	五大引擎 + 配方大模型(垂直微调)
一句话	把"想法"变成可交付的科研产物	把"性能要求"变成可执行的实验配方

呈现纪律(全程硬约束):

每页论断式标题(写结论,不写"XX 介绍")。
正文只用:短卡片(≤12 字)/ KPI 数字卡 / 流程图 / 时间轴 / 对比表 / 矩阵网格。禁止整段话。
每页带一行【呈现形式】,指明该页用什么版式画。
颜色:商务红主题(主色 #C00000),关键数字 / 核心步骤高亮。
凡是带"流程"的页,一律画成节点+箭头流程图,不写成文字列表。

全篇页序(约 26 页): 封面 → 双智能体总览 → [PART1:1.0–1.10] → [PART2:2.0–2.10] → 总结 → 展望/交流。

封面

主标题:科研 AI 双智能体
副标题:通用科研辅助智能体 · 无机非金属材料自主研发智能体
落款:中国建筑材料科学研究总院 · 中存大数据 / 2026

【呈现形式】杂志级背景图 + 居中大标题;底部一行四个关键词:自然语言驱动 / 全流程可交付 / 垂直配方大模型 / 统一安全底座。

总览页 · 一张图看懂两个智能体

论断:一个横向赋能全院,一个纵向攻坚配方 —— 通用 + 垂直,双轮驱动。

左右两张大卡:

左卡「通用科研辅助智能体」:自然语言入口 · 17 skill · 内部 100 万+ 文献库 · 直出 Word/PPT/图表
右卡「材料自主研发智能体」:五大引擎 · 智能实验设计 · 配方大模型(LoRA 微调) · 预测→配方闭环
中间用箭头/底座连接:共享统一底座(多模型调度 · 向量知识库 · 安全沙盒 · 训练流水线)

【呈现形式】左右双卡 + 下方一条横贯"统一底座"长条。这页是全场的"地图",后面两部分都回指这张图。

第一部分 · 通用科研辅助智能体

1.0 章节分隔页

PART 01
通用科研辅助智能体
副题:以自然语言为入口,把科研任务串成可交付的工作流

【呈现形式】章节封面页,大序号 + 标题 + 一句定位。

1.1 它是什么 —— 现有功能总览

论断:不止"问答",而是能自己动手、直接交付成果的科研智能体。

四张能力卡 + 一行数字条:

自然语言驱动:描述需求 → 自动识别意图、动态挂载专业能力
产出可交付物:直接生成 Word / PPT / 图表 / 数据,贴合科研与申报格式
全流程覆盖:调研 — 计算 — 写作 — 评审,一个智能体串起,无需多工具切换
统一底座:多模型调度 · 安全沙盒 · 长期记忆 · 长任务断点恢复

数字条(KPI):17 项专业 skill · 6 大能力类别 · 内部 100 万+ 篇材料文献库 · 多渠道接入(网页/微信/定时)

【呈现形式】2×2 能力卡网格 + 底部一条 KPI 数字条(4 个数字)。

1.2 它怎么工作 —— 五步工作流

论断:意图识别 → 动态挂载能力 → 沙盒内执行 → 关键节点人工确认 → 规范化成果。

横向五段流程:

自然语言需求(用户提出)
意图识别(自动挂载对应 Skill)
工具调用循环(安全沙盒内自主迭代:思考→调用工具→观察)
人工确认(关键决策由用户拍板,过程可追溯)
规范化成果(Word · PPT · 图表 · 数据)

底部一条"统一底座支撑":多模型调度 / 安全沙盒隔离 / 个人文件库 / 长期记忆·断点恢复

【呈现形式】横向 5 节点流程图(箭头串联)+ 底部一条底座长条,做成主图、放大。

1.3 能力矩阵 —— 科研全流程 Skill 体系

论断:17 项专业能力,按科研全流程六大类组织,可持续扩展。

六张分类卡(每卡:类名 + 含的 skill + 一句话):

科研写作:proposal 申报书 / paper 论文 / standard 标准 / patent 专利 / review 审稿 —— 立项到评审全链路
文献检索:documents 内部库 / research 全网 / brief 方向简报 —— 可溯源文献支撑
科研计算:pymatgen 晶体计算 / stats_ml 配方建模 —— "配比→性能"预测寻优
演示出图:ppt 商务级幻灯 / plot_pub 出版级学术图 —— 能看、能讲、能投稿
通用元能力:analyze 问题拆解 / coding 代码实现
可定制:skill-creator 用户私有 skill(从零写或 fork 内置再改)

【呈现形式】2×3 卡片网格,每卡一个图标。下面五页对其中"标志性"能力各展开一页。

说明:内容生成(文生图/文生视频)本次汇报不展开,不单列页。

1.4 标志性能力 ① 文献检索 —— 内部百万级材料文献库

论断:中文提问,命中英文文献 —— 100 万+ 篇材料学科论文,可溯源。

主体两块:

七大学科库(卡片/六边形网格,各一行):胶凝材料 · 陶瓷基 · 玻璃基 · 晶体 · 复合 · 耐火 · 检验检测
三路检索分工(小流程):
- documents 内部库:100 万+ 英文论文,已 Markdown 化(LLM 直读),跨语言语义检索
- research 全网:OpenAlex 元数据 + DOI + PDF 下载
- brief 方向简报:重要论文列表 + 内容总结,5–20 分钟掌握一个方向

差异化标签(高亮):跨语言检索 · 可溯源引用 · 立项依据有真实文献支撑

【呈现形式】上方七学科库网格,下方三路检索分工小图;右侧竖排三个差异化标签 pill。

1.5 标志性能力 ② 项目申报 —— proposal

论断:把课题信息变成可提交的申报书,评审雷区与文献真实性内置兜底。

能力卡(短):

6 类基金骨架:重点研发 / 重大专项 / 国自然面上·青年 / 联合基金 / 省地方 / 横向
评审雷区清单 + "不可考核词"过滤
文献真实性铁律:不允许编造引文(GB/T 7714 顺序编码)
自动化产出:间接费用台阶 + 经费表自动生成 · 技术路线图自动渲染插图
一段一卡:关键章节逐段确认,不一口气出全文

产物:带目录 + 自动图题 + 图表编号的 .docx

【呈现形式】左侧"6 类基金"卡片网格,右侧"需求 → 一段一卡起草 → 渲染 docx"竖向流程;底部一条产物预览缩略。

1.6 标志性能力 ③ 科研写作全家桶 —— 论文 / 标准 / 专利 / 审稿

论断:从论文到标准、专利、审稿 —— 写作全链路,反 AI 幻觉是底线。

四象限卡(每卡:skill + 输入→产物):

paper 论文:实验数据 → 中文核心 / 英文 SCI 投稿稿(IMRaD + 引文三角核验)
standard 标准:材料/方法 → 国标 / 行标 / 团标 + 编制说明(GB/T 1.1—2020)
patent 专利:项目素材 → 发明专利技术交底书(供代理师转写)
review 审稿:已有稿 → 问题表 + 修改稿(长文分段深审)

横贯亮点条(高亮):引文三角核验 —— 存在性 → 三角印证 → 支撑度,编造引文零容忍。

【呈现形式】2×2 象限卡 + 底部一条横贯"引文三角核验"亮点带。

1.7 标志性能力 ④ 材料计算 —— pymatgen + stats_ml

论断:从晶体结构到配方建模 —— 服务"配比 → 性能"的预测与寻优。

左右两栏:

pymatgen 无机材料计算:晶体结构 I/O · XRD 模拟 · 相图 · 对称性 · Materials Project;中文相名映射(C₃S / 钙矾石 / 莫来石 / 方镁石 → 化学式)
stats_ml 配方-性能建模:三库分工(sklearn 预测 / statsmodels 假设检验·p值 / PyMC 小样本贝叶斯);DoE 响应面 · 强度预测 · 异常配方聚类

典型场景标签:XRD 谱图模拟 · TG-DSC 双轴 · 强度预测 · 响应面寻优

【呈现形式】左右双栏卡,每栏配 2–3 个典型场景小图标;高亮"中文相名映射"和"三库分工"。

1.8 标志性能力 ⑤ 演示出图 —— ppt + plot_pub

论断:成果"能看、能讲、能投稿" —— 商务级幻灯 + 出版级学术图。

左右两块:

ppt 商务级演示:卡片式视觉系统 · 论断式标题 · 信息设计纪律 · 一键整建 deck(原生可编辑)
plot_pub 出版级学术图:中文 + viridis + 矢量(SVG/PDF)· 投稿级复合图设计纪律(XRD 叠图 / TG-DSC 双轴 / 多 panel)

价值标签:贴合期刊投稿(Cement and Concrete Research 等)· 降低整理排版成本

【呈现形式】左右两个产物缩略(一张 PPT 卡片样张 + 一张学术图样张)做观感对比。

1.9 平台技术架构(架构师视角)

论断:Less Scaffolding, More Trust —— 把 LLM 当会持续变强的同事,给目标不给步骤。

四象限架构卡:

① 智能体内核:ReAct 工具调用循环(思考→调用→观察自主迭代)+ 进展守卫(重复调用/空转自动收敛)+ 阶段化编排嵌人工确认
② Skill 动态加载:意图识别按需挂载,不相关能力不进上下文(渐进披露,省算力)+ 可扩展插件(流程+模板+脚本)
③ 安全沙盒:每用户 Docker 容器隔离 · 资源限额 + 网络管控 + 最小权限 + 丰富工具集 / MCP
④ 模型·知识·记忆底座:多模型自由调度(DeepSeek/Qwen + OpenAI 接口,涉密切内网)· RAG 抑制幻觉 · 双层长期记忆 + 长任务断点恢复

底部技术栈条:FastAPI(异步后端 + 原生 SSE)· LiteLLM(多模型统一接入,OpenAI 兼容)· 自研 ReAct 内核 · PostgreSQL(任务/消息 append-only)· Docker(每用户沙盒)· Skill 渐进披露体系

【呈现形式】2×2 架构象限卡 + 底部技术栈 pill 条,每条压成一句。

1.10 多渠道接入与产品化

论断:不只是网页 —— 微信对话、定时任务,把智能体送到用户身边。

三张卡:

网页工作台:三栏 SPA(任务 / 对话 / 文件),消息目录导航、方案确认卡、文件预览
微信接入:个人微信对话即可用,可主动推送简报/结果
定时任务:"每天 X 点干 Y" —— 跑 skill 出简报 / 发邮件,自然语言建任务

【呈现形式】三卡横排,各配渠道图标。

第二部分 · 无机非金属材料自主研发智能体

2.0 章节分隔页

PART 02
无机非金属材料自主研发智能体
副题:水泥基配方大模型 —— 从"性能要求"到"实验配方"的自动化

【呈现形式】章节封面页。承上启下一句:从通用辅助,进入材料研发深水区。

2.1 五大引擎 —— 一图看全

论断:五大引擎协同,构成材料研发的智能中枢。

五个引擎卡(每卡:名称 + 一句≤10 字功能 + 图标):

智能问答中枢:统一入口,多轮+工具+文件问答
知识库构建:非结构化文档 → 可检索知识资产
知识库问答:RAG 结合企业知识,引用溯源
AI 文档分类:自动归档 + 触发向量重建
智能实验设计:需求 → 可执行配方(旗舰)

【呈现形式】五卡环形/总线布局,中心写"配方大模型";第 5 个引擎高亮(2.7 展开)。后面 2.3–2.7 逐个引擎各一页。

2.2 总体架构图(分层框图)

论断:应用层 → 五大引擎 → 模型与向量层 → 训练模块,标准接口协同。

四层框图:

User:业务系统 / 请求
Backend 五大引擎:Chat / KBBuild / KBQA / DocAI / Lab(LangGraph 编排复杂逻辑与实验设计流)
模型与数据层:LLM(DeepSeek/Qwen) · Qwen2.5-VL 视觉 · BGE-M3 向量 · Milvus 向量库 · MinerU 解析
Train 训练模块:LLaMA Factory → LoRA → 行业配方模型

【呈现形式】自上而下四层分层框图,层间箭头标接口(RAG / Embedding / LoRA)。只画框和箭头,不写段落。

2.3 引擎 ① 智能问答中枢

论断:大模型统一入口 —— 从"回答问题"升级为"执行任务"。

工作流程(流程图): 用户问题 → 会话与权限处理 → 任务识别 → 是否需要外部能力?

否 → 普通问答 / 文件上下文 → LLM 生成
是 → 工具能力 → 读取文档 / MCP 工具调用 → SSE 流式返回回答

技术卡(短):LangGraph 编排 · DeepSeek V3.1 / Qwen3-30B-A3B · 文件问答 + 多轮 + 思考模式 · MCP 接入外部系统 · SSE 流式输出

价值标签:统一标准化问答 · 高扩展集成业务工具 · 可升级为执行任务

【呈现形式】左侧带分支判定的流程图(菱形判定)+ 右侧技术卡 + 底部价值 pill。

2.4 引擎 ② 知识库构建

论断:把分散的非结构化文档,沉淀为可检索、可引用、可追溯的企业知识资产。

工作流程(流程图): 上传原始文档 → MinerU 解析 → 是否含图片/图表/扫描件?

是 → Qwen2.5-VL 视觉解析 ↘ → 文本结构化 & 生成 Markdown → 文本切分 → BGE-M3 向量化写入 Milvus → 保存文档元数据

支持内容卡(三类):

文档类:PDF / Word / PPT / Excel
图像类:图片 / 扫描件 / 图表
文本类:Markdown / TXT / CSV / JSON

价值标签:分散资料 → 结构化知识库 · 为问答/实验/训练提供高质量数据基础

【呈现形式】上方带分支的处理流程图 + 下方三类支持内容卡。

2.5 引擎 ③ 知识库问答

论断:基于 RAG 结合企业内部知识作答,引用可溯源,显著抑制幻觉。

工作流程(流程图): 用户问题 → 问题理解 → 生成检索问题 → BGE-M3 向量化 → Milvus 检索 → 组装引用上下文 → 生成答案与溯源

技术卡(短):RAG 检索增强 · BGE-M3 向量化 + Milvus 检索 · DeepSeek/Qwen 结合上下文生成 · 引用来源溯源 · 多维度检索过滤

价值标签:提升专业性/准确性/可追溯 · 赋能私有文档深度问答 · 降低大模型幻觉风险

【呈现形式】横向 7 节点检索流程图(主色高亮"Milvus 检索"与"溯源")+ 右侧技术卡。

2.6 引擎 ④ AI 文档分类

论断:自动识别领域与材料分类并归档,触发向量重建 —— 知识治理自动化。

工作流程(流程图,含闭环): 待分类文档 → 读取解析内容 → 领域预判 → 构建分类体系 → 大模型分类 → 分类结果校验 → 保存 → 是否需调整归属?

是 → 迁移文档并重建向量 → 完成归档

智能输出卡:摘要 · 领域 · 分类路径 · 判定依据 · 置信度

价值标签:降低人工整理归档成本 · 归入正确体系提升检索效率 · 为行业模型筛选标准化数据集

【呈现形式】带回环箭头的闭环流程图 + 一张"智能输出 5 字段"卡。

2.7 引擎 ⑤ 智能实验设计 —— 核心工作流(旗舰)

论断:多阶段工作流,把研发需求转成可执行实验配方;核心一步是调用行业微调模型。

横向时间轴,11 步压成 6 个阶段(核心步高亮):

问题提炼(科学问题 + 检索分类匹配 + 方向确认)
文献检索分析(向量库召回 + 逐篇提取实验参数)
初步方案(融合目标与文献,生成思路框架)
学术评估优化(多维量化评估,迭代优化路径)
⭐ 配方生成(调用 Qwen2.5-1.5B LoRA 行业模型 → 原料/配比/条件)
校验 + 用户确认 + 实验工单(人机协同闭环 → 对接实验室)

【呈现形式】横向 6 段时间轴/泳道,第 5 段(配方生成)用主色高亮放大;标注"人工确认节点"。

2.8 配方大模型训练 —— 配置与成效

论断:LLaMA Factory + Qwen2.5-1.5B + LoRA,16 条实测数据完成首版训练。

左:训练配置卡(短):

框架 / 基座:LLaMA Factory + Qwen2.5-1.5B-Instruct
微调:PEFT + LoRA(冻结主干,仅训低秩矩阵)
任务:SFT 建立"性能要求 → 配方组成"映射
数据:16 组实验室实测(输入 3d/7d 抗压抗折 → 输出矿粉/电石渣/脱硫石膏/粉煤灰/水/减水剂配比)

右:KPI 数字卡网格 + loss 曲线示意:

可训练参数占比 4.57%(7386 万 / 16.18 亿)
Loss 0.6897 → 0.0073(降 98.9%)
训练轮数 50 Epochs
优化策略:禁用 KV Cache · 梯度检查点 · Torch SDPA 加速

成效三标签:收敛稳定 · 捕捉"低强度→低掺量"行业规律 · 标准化配方输出

【呈现形式】左配置卡 + 右 KPI 网格(4 个大数字)+ 一条 loss 下降曲线示意。

2.9 现状与下一步 —— 局限与优化路线

论断:首版受 16 条数据所限偏"记忆";分三阶段补数据、简空间、建闭环。

左右对比:

左 · 当前局限:
- 数据仅 16 条 → 模型偏"记忆样本",未真正"理解规律"
- 泛化受限 → 未见性能区间配方精度有波动
右 · 优化路线(P0/P1/P2 路线条):
- P0 扩充数据集至 200+(从记忆升级为理解)
- P1 简化配方空间(精简冗余材料,降学习维度)
- P2 搭建"预测–实验–反馈"闭环,目标达标率 ≥85%

【呈现形式】左侧两张"痛点"卡(冷色),右侧 P0→P1→P2 路线时间轴(暖色/主色)。

2.10 模型矩阵 —— 通用 + 垂直双轮

论断:通用基座 + 视觉/向量 + 垂直 LoRA 配方模型,打通"解析→沉淀→决策"。

六行场景表(场景 | 模型 | 用途):

场景	模型	用途
智能问答中枢	DeepSeek V3.1 / Qwen3-30B-A3B	通用问答、文件问答、工具调用
知识库构建	Qwen2.5-VL + BGE-M3 + Milvus	文档解析、图表提取、向量入库
知识库问答	DeepSeek V3.1 + BGE-M3 + Milvus	RAG 精准问答 + 原文溯源
AI 文档分类	Qwen3-30B-A3B + BGE-M3	自动识别主题、分类归档
智能实验设计	通用大模型 + Qwen2.5-1.5B(LoRA)	分析文献、生成配方方案
配方模型训练	Qwen2.5-1.5B 基座 + BGE-M3	学习"性能-配方"映射

【呈现形式】六行卡片表(非密集文字表);右侧一句"通用 + 垂直双轮驱动"呼应总览页。

结尾

总结 —— 双智能体落地成效

论断:一横一纵双智能体已落地,共享统一底座。

四张成果卡:

通用智能体:17 项 skill · 内部 100 万+ 文献库 · 全流程可交付(Word/PPT/图表)
垂直智能体:五大引擎 · 智能实验设计 · 配方大模型首版(Loss 收敛 0.0073)
统一底座:多模型调度 · 向量知识库 + RAG · 每用户安全沙盒 · 训练流水线 + LoRA 微调
业务价值:打通"数据 → 知识 → 决策"闭环,知识沉淀为可复用资产,支撑研发提效

【呈现形式】2×2 成果卡,关键数字高亮。

展望 / 交流

下一阶段:配方数据集 16 → 200+ · 简化配方空间 · 建"预测–实验–反馈"闭环(达标率 ≥85%)· 持续扩展 skill 与渠道
感谢聆听 · 欢迎交流

【呈现形式】左侧 3–4 条展望短句(带图标),右侧大字"感谢聆听 / 交流环节"。

19 KiB Raw Blame History Unescape Escape