diff --git a/core/__init__.py b/core/__init__.py index 5575ef5..0e19b7e 100644 --- a/core/__init__.py +++ b/core/__init__.py @@ -1,3 +1,3 @@ # zcbot 版本号单一事实源:web/app.py 的 FastAPI version、/healthz 返回、前端展示都引这里。 # 改版本只动这一行。 -__version__ = "0.24.3" +__version__ = "0.24.4" diff --git a/docs/操作说明书-精简版.md b/docs/操作说明书-精简版.md index 967dc1b..4f8d1a9 100644 --- a/docs/操作说明书-精简版.md +++ b/docs/操作说明书-精简版.md @@ -1,6 +1,6 @@ # 科研智能助手 · 操作说明书(精简版) -> 适用:无机非金属材料(水泥 / 混凝土 / 玻璃 / 陶瓷 / 耐火 / 新型建材)科研人员。从**登录后**讲起。 +> 适用:无机非金属材料(水泥 / 混凝土 / 玻璃 / 陶瓷 / 耐火 / 新型建材)科研人员。 --- @@ -19,12 +19,11 @@ ## 2. 界面:三栏 -``` -左:任务列表 中:对话区 右:文件区 -+ 新建任务 与助手一问一答 当前工作目录的文件 -搜索 / 筛选 实时显示进度 上传 / 预览 / 下载 -技能 / 记忆 底部输入框 -``` +| 左:任务列表 | 中:对话区 | 右:文件区 | +|---|---|---| +| + 新建任务 | 与助手一问一答 | 当前工作目录的文件 | +| 搜索 / 筛选 | 实时显示进度 | 上传 / 预览 / 下载 | +| 技能 / 记忆 | 底部输入框 | | ![](assets/image-1781662287932-1.png) diff --git a/docs/科研AI双智能体-汇报PPT大纲.md b/docs/科研AI双智能体-汇报PPT大纲.md new file mode 100644 index 0000000..123fcd9 --- /dev/null +++ b/docs/科研AI双智能体-汇报PPT大纲.md @@ -0,0 +1,428 @@ +# 科研 AI 双智能体 · 汇报 PPT 大纲 + +> 单位:中国建筑材料科学研究总院 · 中存大数据 +> 用途:生成汇报 PPT 的内容底稿。本文件只定**结构 + 每页要点 + 呈现形式**,不写大段叙述文字。 +> 编写日期:2026-06-24 + +--- + +## 0. 总体设计说明(给设计 / 制作人员看) + +**叙事主线 —— 通用 + 垂直,双轮驱动:** + +| | 第一部分 | 第二部分 | +|---|---|---| +| 名称 | 通用科研辅助智能体 | 无机非金属材料自主研发智能体 | +| 定位 | **横向**:服务全院科研人员日常全流程 | **纵深**:材料配方自主研发的自动化 | +| 入口 | 自然语言,任意科研任务 | 材料研发需求 → 实验方案/配方 | +| 形态 | 17 项 skill 能力矩阵 + 可交付物 | 五大引擎 + 配方大模型(垂直微调) | +| 一句话 | 把"想法"变成可交付的科研产物 | 把"性能要求"变成可执行的实验配方 | + +**呈现纪律(全程硬约束):** +- 每页**论断式标题**(写结论,不写"XX 介绍")。 +- 正文只用:**短卡片(≤12 字)/ KPI 数字卡 / 流程图 / 时间轴 / 对比表 / 矩阵网格**。禁止整段话。 +- 每页带一行【呈现形式】,指明该页用什么版式画。 +- 颜色:商务红主题(主色 #C00000),关键数字 / 核心步骤高亮。 +- 凡是带"流程"的页,一律画成**节点+箭头流程图**,不写成文字列表。 + +**全篇页序(约 26 页):** 封面 → 双智能体总览 → [PART1:1.0–1.10] → [PART2:2.0–2.10] → 总结 → 展望/交流。 + +--- + +## 封面 + +- 主标题:**科研 AI 双智能体** +- 副标题:通用科研辅助智能体 · 无机非金属材料自主研发智能体 +- 落款:中国建筑材料科学研究总院 · 中存大数据 / 2026 + +【呈现形式】杂志级背景图 + 居中大标题;底部一行四个关键词:自然语言驱动 / 全流程可交付 / 垂直配方大模型 / 统一安全底座。 + +--- + +## 总览页 · 一张图看懂两个智能体 + +**论断:一个横向赋能全院,一个纵向攻坚配方 —— 通用 + 垂直,双轮驱动。** + +左右两张大卡: +- 左卡「通用科研辅助智能体」:自然语言入口 · 17 skill · 内部 100 万+ 文献库 · 直出 Word/PPT/图表 +- 右卡「材料自主研发智能体」:五大引擎 · 智能实验设计 · 配方大模型(LoRA 微调) · 预测→配方闭环 +- 中间用箭头/底座连接:**共享统一底座**(多模型调度 · 向量知识库 · 安全沙盒 · 训练流水线) + +【呈现形式】左右双卡 + 下方一条横贯"统一底座"长条。这页是全场的"地图",后面两部分都回指这张图。 + +--- + +# 第一部分 · 通用科研辅助智能体 + +## 1.0 章节分隔页 + +- PART 01 +- **通用科研辅助智能体** +- 副题:以自然语言为入口,把科研任务串成可交付的工作流 + +【呈现形式】章节封面页,大序号 + 标题 + 一句定位。 + +--- + +## 1.1 它是什么 —— 现有功能总览 + +**论断:不止"问答",而是能自己动手、直接交付成果的科研智能体。** + +四张能力卡 + 一行数字条: +- **自然语言驱动**:描述需求 → 自动识别意图、动态挂载专业能力 +- **产出可交付物**:直接生成 Word / PPT / 图表 / 数据,贴合科研与申报格式 +- **全流程覆盖**:调研 — 计算 — 写作 — 评审,一个智能体串起,无需多工具切换 +- **统一底座**:多模型调度 · 安全沙盒 · 长期记忆 · 长任务断点恢复 + +数字条(KPI):**17** 项专业 skill · **6** 大能力类别 · 内部 **100 万+** 篇材料文献库 · **多渠道**接入(网页/微信/定时) + +【呈现形式】2×2 能力卡网格 + 底部一条 KPI 数字条(4 个数字)。 + +--- + +## 1.2 它怎么工作 —— 五步工作流 + +**论断:意图识别 → 动态挂载能力 → 沙盒内执行 → 关键节点人工确认 → 规范化成果。** + +横向五段流程: +1. **自然语言需求**(用户提出) +2. **意图识别**(自动挂载对应 Skill) +3. **工具调用循环**(安全沙盒内自主迭代:思考→调用工具→观察) +4. **人工确认**(关键决策由用户拍板,过程可追溯) +5. **规范化成果**(Word · PPT · 图表 · 数据) + +底部一条"统一底座支撑":多模型调度 / 安全沙盒隔离 / 个人文件库 / 长期记忆·断点恢复 + +【呈现形式】横向 5 节点流程图(箭头串联)+ 底部一条底座长条,做成主图、放大。 + +--- + +## 1.3 能力矩阵 —— 科研全流程 Skill 体系 + +**论断:17 项专业能力,按科研全流程六大类组织,可持续扩展。** + +六张分类卡(每卡:类名 + 含的 skill + 一句话): +- **科研写作**:proposal 申报书 / paper 论文 / standard 标准 / patent 专利 / review 审稿 —— 立项到评审全链路 +- **文献检索**:documents 内部库 / research 全网 / brief 方向简报 —— 可溯源文献支撑 +- **科研计算**:pymatgen 晶体计算 / stats_ml 配方建模 —— "配比→性能"预测寻优 +- **演示出图**:ppt 商务级幻灯 / plot_pub 出版级学术图 —— 能看、能讲、能投稿 +- **通用元能力**:analyze 问题拆解 / coding 代码实现 +- **可定制**:skill-creator 用户私有 skill(从零写或 fork 内置再改) + +【呈现形式】2×3 卡片网格,每卡一个图标。下面五页对其中"标志性"能力各展开一页。 +> 说明:内容生成(文生图/文生视频)本次汇报不展开,不单列页。 + +--- + +## 1.4 标志性能力 ① 文献检索 —— 内部百万级材料文献库 + +**论断:中文提问,命中英文文献 —— 100 万+ 篇材料学科论文,可溯源。** + +主体两块: +- **七大学科库**(卡片/六边形网格,各一行):胶凝材料 · 陶瓷基 · 玻璃基 · 晶体 · 复合 · 耐火 · 检验检测 +- **三路检索分工**(小流程): + - `documents` 内部库:100 万+ 英文论文,已 Markdown 化(LLM 直读),**跨语言语义检索** + - `research` 全网:OpenAlex 元数据 + DOI + PDF 下载 + - `brief` 方向简报:重要论文列表 + 内容总结,5–20 分钟掌握一个方向 + +差异化标签(高亮):**跨语言检索** · **可溯源引用** · **立项依据有真实文献支撑** + +【呈现形式】上方七学科库网格,下方三路检索分工小图;右侧竖排三个差异化标签 pill。 + +--- + +## 1.5 标志性能力 ② 项目申报 —— proposal + +**论断:把课题信息变成可提交的申报书,评审雷区与文献真实性内置兜底。** + +能力卡(短): +- **6 类基金骨架**:重点研发 / 重大专项 / 国自然面上·青年 / 联合基金 / 省地方 / 横向 +- **评审雷区清单** + "不可考核词"过滤 +- **文献真实性铁律**:不允许编造引文(GB/T 7714 顺序编码) +- **自动化产出**:间接费用台阶 + 经费表自动生成 · 技术路线图自动渲染插图 +- **一段一卡**:关键章节逐段确认,不一口气出全文 + +产物:带目录 + 自动图题 + 图表编号的 `.docx` + +【呈现形式】左侧"6 类基金"卡片网格,右侧"需求 → 一段一卡起草 → 渲染 docx"竖向流程;底部一条产物预览缩略。 + +--- + +## 1.6 标志性能力 ③ 科研写作全家桶 —— 论文 / 标准 / 专利 / 审稿 + +**论断:从论文到标准、专利、审稿 —— 写作全链路,反 AI 幻觉是底线。** + +四象限卡(每卡:skill + 输入→产物): +- **paper 论文**:实验数据 → 中文核心 / 英文 SCI 投稿稿(IMRaD + 引文三角核验) +- **standard 标准**:材料/方法 → 国标 / 行标 / 团标 + 编制说明(GB/T 1.1—2020) +- **patent 专利**:项目素材 → 发明专利技术交底书(供代理师转写) +- **review 审稿**:已有稿 → 问题表 + 修改稿(长文分段深审) + +横贯亮点条(高亮):**引文三角核验** —— 存在性 → 三角印证 → 支撑度,编造引文**零容忍**。 + +【呈现形式】2×2 象限卡 + 底部一条横贯"引文三角核验"亮点带。 + +--- + +## 1.7 标志性能力 ④ 材料计算 —— pymatgen + stats_ml + +**论断:从晶体结构到配方建模 —— 服务"配比 → 性能"的预测与寻优。** + +左右两栏: +- **pymatgen 无机材料计算**:晶体结构 I/O · XRD 模拟 · 相图 · 对称性 · Materials Project;**中文相名映射**(C₃S / 钙矾石 / 莫来石 / 方镁石 → 化学式) +- **stats_ml 配方-性能建模**:三库分工(sklearn 预测 / statsmodels 假设检验·p值 / PyMC 小样本贝叶斯);DoE 响应面 · 强度预测 · 异常配方聚类 + +典型场景标签:XRD 谱图模拟 · TG-DSC 双轴 · 强度预测 · 响应面寻优 + +【呈现形式】左右双栏卡,每栏配 2–3 个典型场景小图标;高亮"中文相名映射"和"三库分工"。 + +--- + +## 1.8 标志性能力 ⑤ 演示出图 —— ppt + plot_pub + +**论断:成果"能看、能讲、能投稿" —— 商务级幻灯 + 出版级学术图。** + +左右两块: +- **ppt 商务级演示**:卡片式视觉系统 · 论断式标题 · 信息设计纪律 · 一键整建 deck(原生可编辑) +- **plot_pub 出版级学术图**:中文 + viridis + 矢量(SVG/PDF)· 投稿级复合图设计纪律(XRD 叠图 / TG-DSC 双轴 / 多 panel) + +价值标签:贴合期刊投稿(Cement and Concrete Research 等)· 降低整理排版成本 + +【呈现形式】左右两个产物缩略(一张 PPT 卡片样张 + 一张学术图样张)做观感对比。 + +--- + +## 1.9 平台技术架构(架构师视角) + +**论断:Less Scaffolding, More Trust —— 把 LLM 当会持续变强的同事,给目标不给步骤。** + +四象限架构卡: +- **① 智能体内核**:ReAct 工具调用循环(思考→调用→观察自主迭代)+ 进展守卫(重复调用/空转自动收敛)+ 阶段化编排嵌人工确认 +- **② Skill 动态加载**:意图识别按需挂载,不相关能力不进上下文(渐进披露,省算力)+ 可扩展插件(流程+模板+脚本) +- **③ 安全沙盒**:每用户 Docker 容器隔离 · 资源限额 + 网络管控 + 最小权限 + 丰富工具集 / MCP +- **④ 模型·知识·记忆底座**:多模型自由调度(DeepSeek/Qwen + OpenAI 接口,涉密切内网)· RAG 抑制幻觉 · 双层长期记忆 + 长任务断点恢复 + +底部技术栈条:FastAPI(异步后端 + 原生 SSE)· LiteLLM(多模型统一接入,OpenAI 兼容)· 自研 ReAct 内核 · PostgreSQL(任务/消息 append-only)· Docker(每用户沙盒)· Skill 渐进披露体系 + +【呈现形式】2×2 架构象限卡 + 底部技术栈 pill 条,每条压成一句。 + +--- + +## 1.10 多渠道接入与产品化 + +**论断:不只是网页 —— 微信对话、定时任务,把智能体送到用户身边。** + +三张卡: +- **网页工作台**:三栏 SPA(任务 / 对话 / 文件),消息目录导航、方案确认卡、文件预览 +- **微信接入**:个人微信对话即可用,可主动推送简报/结果 +- **定时任务**:"每天 X 点干 Y" —— 跑 skill 出简报 / 发邮件,自然语言建任务 + +【呈现形式】三卡横排,各配渠道图标。 + +--- + +# 第二部分 · 无机非金属材料自主研发智能体 + +## 2.0 章节分隔页 + +- PART 02 +- **无机非金属材料自主研发智能体** +- 副题:水泥基配方大模型 —— 从"性能要求"到"实验配方"的自动化 + +【呈现形式】章节封面页。承上启下一句:从通用辅助,进入材料研发深水区。 + +--- + +## 2.1 五大引擎 —— 一图看全 + +**论断:五大引擎协同,构成材料研发的智能中枢。** + +五个引擎卡(每卡:名称 + 一句≤10 字功能 + 图标): +1. **智能问答中枢**:统一入口,多轮+工具+文件问答 +2. **知识库构建**:非结构化文档 → 可检索知识资产 +3. **知识库问答**:RAG 结合企业知识,引用溯源 +4. **AI 文档分类**:自动归档 + 触发向量重建 +5. **智能实验设计**:需求 → 可执行配方(旗舰) + +【呈现形式】五卡环形/总线布局,中心写"配方大模型";第 5 个引擎高亮(2.7 展开)。后面 2.3–2.7 逐个引擎各一页。 + +--- + +## 2.2 总体架构图(分层框图) + +**论断:应用层 → 五大引擎 → 模型与向量层 → 训练模块,标准接口协同。** + +四层框图: +- **User**:业务系统 / 请求 +- **Backend 五大引擎**:Chat / KBBuild / KBQA / DocAI / Lab(**LangGraph 编排**复杂逻辑与实验设计流) +- **模型与数据层**:LLM(DeepSeek/Qwen) · Qwen2.5-VL 视觉 · BGE-M3 向量 · Milvus 向量库 · MinerU 解析 +- **Train 训练模块**:LLaMA Factory → LoRA → 行业配方模型 + +【呈现形式】自上而下四层分层框图,层间箭头标接口(RAG / Embedding / LoRA)。只画框和箭头,不写段落。 + +--- + +## 2.3 引擎 ① 智能问答中枢 + +**论断:大模型统一入口 —— 从"回答问题"升级为"执行任务"。** + +工作流程(流程图): +用户问题 → 会话与权限处理 → 任务识别 → **是否需要外部能力?** +- 否 → 普通问答 / 文件上下文 → LLM 生成 +- 是 → 工具能力 → 读取文档 / MCP 工具调用 +→ SSE 流式返回回答 + +技术卡(短):LangGraph 编排 · DeepSeek V3.1 / Qwen3-30B-A3B · 文件问答 + 多轮 + 思考模式 · MCP 接入外部系统 · SSE 流式输出 + +价值标签:统一标准化问答 · 高扩展集成业务工具 · 可升级为执行任务 + +【呈现形式】左侧带分支判定的流程图(菱形判定)+ 右侧技术卡 + 底部价值 pill。 + +--- + +## 2.4 引擎 ② 知识库构建 + +**论断:把分散的非结构化文档,沉淀为可检索、可引用、可追溯的企业知识资产。** + +工作流程(流程图): +上传原始文档 → MinerU 解析 → **是否含图片/图表/扫描件?** +- 是 → Qwen2.5-VL 视觉解析 ↘ +→ 文本结构化 & 生成 Markdown → 文本切分 → BGE-M3 向量化写入 Milvus → 保存文档元数据 + +支持内容卡(三类): +- **文档类**:PDF / Word / PPT / Excel +- **图像类**:图片 / 扫描件 / 图表 +- **文本类**:Markdown / TXT / CSV / JSON + +价值标签:分散资料 → 结构化知识库 · 为问答/实验/训练提供高质量数据基础 + +【呈现形式】上方带分支的处理流程图 + 下方三类支持内容卡。 + +--- + +## 2.5 引擎 ③ 知识库问答 + +**论断:基于 RAG 结合企业内部知识作答,引用可溯源,显著抑制幻觉。** + +工作流程(流程图): +用户问题 → 问题理解 → 生成检索问题 → BGE-M3 向量化 → Milvus 检索 → 组装引用上下文 → 生成答案与溯源 + +技术卡(短):RAG 检索增强 · BGE-M3 向量化 + Milvus 检索 · DeepSeek/Qwen 结合上下文生成 · 引用来源溯源 · 多维度检索过滤 + +价值标签:提升专业性/准确性/可追溯 · 赋能私有文档深度问答 · 降低大模型幻觉风险 + +【呈现形式】横向 7 节点检索流程图(主色高亮"Milvus 检索"与"溯源")+ 右侧技术卡。 + +--- + +## 2.6 引擎 ④ AI 文档分类 + +**论断:自动识别领域与材料分类并归档,触发向量重建 —— 知识治理自动化。** + +工作流程(流程图,含闭环): +待分类文档 → 读取解析内容 → 领域预判 → 构建分类体系 → 大模型分类 → 分类结果校验 → 保存 → **是否需调整归属?** +- 是 → 迁移文档并重建向量 → 完成归档 + +智能输出卡:摘要 · 领域 · 分类路径 · 判定依据 · 置信度 + +价值标签:降低人工整理归档成本 · 归入正确体系提升检索效率 · 为行业模型筛选标准化数据集 + +【呈现形式】带回环箭头的闭环流程图 + 一张"智能输出 5 字段"卡。 + +--- + +## 2.7 引擎 ⑤ 智能实验设计 —— 核心工作流(旗舰) + +**论断:多阶段工作流,把研发需求转成可执行实验配方;核心一步是调用行业微调模型。** + +横向时间轴,11 步压成 6 个阶段(核心步高亮): +1. **问题提炼**(科学问题 + 检索分类匹配 + 方向确认) +2. **文献检索分析**(向量库召回 + 逐篇提取实验参数) +3. **初步方案**(融合目标与文献,生成思路框架) +4. **学术评估优化**(多维量化评估,迭代优化路径) +5. ⭐ **配方生成**(调用 Qwen2.5-1.5B LoRA 行业模型 → 原料/配比/条件) +6. **校验 + 用户确认 + 实验工单**(人机协同闭环 → 对接实验室) + +【呈现形式】横向 6 段时间轴/泳道,第 5 段(配方生成)用主色高亮放大;标注"人工确认节点"。 + +--- + +## 2.8 配方大模型训练 —— 配置与成效 + +**论断:LLaMA Factory + Qwen2.5-1.5B + LoRA,16 条实测数据完成首版训练。** + +左:训练配置卡(短): +- 框架 / 基座:**LLaMA Factory + Qwen2.5-1.5B-Instruct** +- 微调:**PEFT + LoRA**(冻结主干,仅训低秩矩阵) +- 任务:**SFT** 建立"性能要求 → 配方组成"映射 +- 数据:**16 组**实验室实测(输入 3d/7d 抗压抗折 → 输出 矿粉/电石渣/脱硫石膏/粉煤灰/水/减水剂 配比) + +右:KPI 数字卡网格 + loss 曲线示意: +- 可训练参数占比 **4.57%**(7386 万 / 16.18 亿) +- Loss **0.6897 → 0.0073**(降 **98.9%**) +- 训练轮数 **50** Epochs +- 优化策略:禁用 KV Cache · 梯度检查点 · Torch SDPA 加速 + +成效三标签:收敛稳定 · 捕捉"低强度→低掺量"行业规律 · 标准化配方输出 + +【呈现形式】左配置卡 + 右 KPI 网格(4 个大数字)+ 一条 loss 下降曲线示意。 + +--- + +## 2.9 现状与下一步 —— 局限与优化路线 + +**论断:首版受 16 条数据所限偏"记忆";分三阶段补数据、简空间、建闭环。** + +左右对比: +- **左 · 当前局限**: + - 数据仅 16 条 → 模型偏"记忆样本",未真正"理解规律" + - 泛化受限 → 未见性能区间配方精度有波动 +- **右 · 优化路线**(P0/P1/P2 路线条): + - **P0** 扩充数据集至 **200+**(从记忆升级为理解) + - **P1** 简化配方空间(精简冗余材料,降学习维度) + - **P2** 搭建"预测–实验–反馈"闭环,目标达标率 **≥85%** + +【呈现形式】左侧两张"痛点"卡(冷色),右侧 P0→P1→P2 路线时间轴(暖色/主色)。 + +--- + +## 2.10 模型矩阵 —— 通用 + 垂直双轮 + +**论断:通用基座 + 视觉/向量 + 垂直 LoRA 配方模型,打通"解析→沉淀→决策"。** + +六行场景表(场景 | 模型 | 用途): +| 场景 | 模型 | 用途 | +|---|---|---| +| 智能问答中枢 | DeepSeek V3.1 / Qwen3-30B-A3B | 通用问答、文件问答、工具调用 | +| 知识库构建 | Qwen2.5-VL + BGE-M3 + Milvus | 文档解析、图表提取、向量入库 | +| 知识库问答 | DeepSeek V3.1 + BGE-M3 + Milvus | RAG 精准问答 + 原文溯源 | +| AI 文档分类 | Qwen3-30B-A3B + BGE-M3 | 自动识别主题、分类归档 | +| 智能实验设计 | 通用大模型 + Qwen2.5-1.5B(LoRA) | 分析文献、生成配方方案 | +| 配方模型训练 | Qwen2.5-1.5B 基座 + BGE-M3 | 学习"性能-配方"映射 | + +【呈现形式】六行卡片表(非密集文字表);右侧一句"通用 + 垂直双轮驱动"呼应总览页。 + +--- + +# 结尾 + +## 总结 —— 双智能体落地成效 + +**论断:一横一纵双智能体已落地,共享统一底座。** + +四张成果卡: +- **通用智能体**:17 项 skill · 内部 100 万+ 文献库 · 全流程可交付(Word/PPT/图表) +- **垂直智能体**:五大引擎 · 智能实验设计 · 配方大模型首版(Loss 收敛 0.0073) +- **统一底座**:多模型调度 · 向量知识库 + RAG · 每用户安全沙盒 · 训练流水线 + LoRA 微调 +- **业务价值**:打通"数据 → 知识 → 决策"闭环,知识沉淀为可复用资产,支撑研发提效 + +【呈现形式】2×2 成果卡,关键数字高亮。 + +--- + +## 展望 / 交流 + +- 下一阶段:配方数据集 16 → 200+ · 简化配方空间 · 建"预测–实验–反馈"闭环(达标率 ≥85%)· 持续扩展 skill 与渠道 +- **感谢聆听 · 欢迎交流** + +【呈现形式】左侧 3–4 条展望短句(带图标),右侧大字"感谢聆听 / 交流环节"。