docs: 用户操作说明书(详+精简)+ 文献库口径 21W→100W + bump 0.16.2

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
caoqianming 2026-06-17 10:34:08 +08:00
parent 660bec0f2f
commit 6d6e9f79b5
9 changed files with 896 additions and 7 deletions

View File

@ -21,6 +21,11 @@
## 已完成关键能力 ## 已完成关键能力
### 2026-06-17 / 用户操作说明书(详 + 精简两版)+ 文献库库容 21W→100W 全量更新
- 新增 `docs/操作说明书.md`(详版)+ `docs/操作说明书-精简版.md`:面向科研用户、不出现产品代号、从登录后正式操作讲起。覆盖三栏布局、**个人文件夹 → 工作目录 → 任务**三层概念(任务≠文件夹、多任务可共享一个工作目录)、新建任务、对话、技能矩阵(含 paper)、文件管理、进阶(方案确认卡/消息目录/记忆)、任务管理、图像视频、账户存储、FAQ;截图留占位标注。突出对外优势(内部文献库、科研计算、可直接产出文件)。
- 文献库库容口径 **21W+ → 100W+** 全量改一遍:`SKILL_LIST.md`、`skills/documents/SKILL.md`(含 description,模型运行时据此向用户描述库容)、`skills/patent/SKILL.md`、`PROGRESS.md`、`scripts/optimize_arch_ppt.py`、两份说明书,共 10 处。bump 0.16.1 → 0.16.2。
### 2026-06-17 / paper skill:学术期刊论文写作 ### 2026-06-17 / paper skill:学术期刊论文写作
- 需求:现有 skill(proposal 写本子 / review 改稿 / research 查文献 / plot_pub 出图)缺"从零起草期刊投稿稿"这一环。联网调研开源论文 skill(ARS 32.1k★ / paper-writer-skill / claude-scientific-writer 1.9k★)——结论:不直接装(ARS 是 CC-BY-NC 非商用、全偏英文/医学/CS、引文默认 APA、依赖外部 API),但流程值得移植。 - 需求:现有 skill(proposal 写本子 / review 改稿 / research 查文献 / plot_pub 出图)缺"从零起草期刊投稿稿"这一环。联网调研开源论文 skill(ARS 32.1k★ / paper-writer-skill / claude-scientific-writer 1.9k★)——结论:不直接装(ARS 是 CC-BY-NC 非商用、全偏英文/医学/CS、引文默认 APA、依赖外部 API),但流程值得移植。
@ -308,7 +313,7 @@
- **imagegen skill 加 ⛔ 调 tool 前必须贴 prompt + BLOCKING 等确认**:把模型脑内装配摊到对话层让用户最后过一眼防白烧 ¥0.22;诊断五维→六维加比例/尺寸。 - **imagegen skill 加 ⛔ 调 tool 前必须贴 prompt + BLOCKING 等确认**:把模型脑内装配摊到对话层让用户最后过一眼防白烧 ¥0.22;诊断五维→六维加比例/尺寸。
- **新增 imagegen skill**:单文件五步法(诊断模糊度→给推断+待确认→拍板→装配 prompt→调 seedream);mermaid vs seedream 选型三段式。 - **新增 imagegen skill**:单文件五步法(诊断模糊度→给推断+待确认→拍板→装配 prompt→调 seedream);mermaid vs seedream 选型三段式。
- **登录页加「管理员添加用户」入口 + 删 chat meta 条/tok 显示**:`create_user`(CLI/web 共用)+ `POST /v1/auth/admin/create_user` 校验 `ZCBOT_ADMIN_TOKEN`。否决 User 表加 is_admin 列。 - **登录页加「管理员添加用户」入口 + 删 chat meta 条/tok 显示**:`create_user`(CLI/web 共用)+ `POST /v1/auth/admin/create_user` 校验 `ZCBOT_ADMIN_TOKEN`。否决 User 表加 is_admin 列。
- **新增 documents skill(内部材料学科知识库 document_search API)**:四函数 Bearer 认证,search 返整篇 Markdown,反模式约束只 print 前 300 字防爆上下文;库=7 材料学科英文论文 21W+ 文件 + 跨语言语义检索;与 research(OpenAlex)互补。 - **新增 documents skill(内部材料学科知识库 document_search API)**:四函数 Bearer 认证,search 返整篇 Markdown,反模式约束只 print 前 300 字防爆上下文;库=7 材料学科英文论文 100W+ 文件 + 跨语言语义检索;与 research(OpenAlex)互补。
- **dev SPA SSE 客户端重连**:`fetchSse` 拆 consume + 重连壳(1/2/4s 退避 ×3);后端 `stream_events` 入口检 run_status 非 running 立即吐 done 关流。 - **dev SPA SSE 客户端重连**:`fetchSse` 拆 consume + 重连壳(1/2/4s 退避 ×3);后端 `stream_events` 入口检 run_status 非 running 立即吐 done 关流。
- **research skill fetch_pdf 改走静态直链 + list 端点加直链 + pg_trgm GIN 索引**:绕开 paper_pdf_view 路径 bug;`?search` 30s→几十 ms;SKILL 加「XML 优先 PDF」。 - **research skill fetch_pdf 改走静态直链 + list 端点加直链 + pg_trgm GIN 索引**:绕开 paper_pdf_view 路径 bug;`?search` 30s→几十 ms;SKILL 加「XML 优先 PDF」。
- **顶栏 token 累计修(`sync_task_tokens` 改走 messages SUM)**:切 streaming 后内存计数器永不更新,改现算 + backfill。 - **顶栏 token 累计修(`sync_task_tokens` 改走 messages SUM)**:切 streaming 后内存计数器永不更新,改现算 + backfill。

View File

@ -22,7 +22,7 @@ zcbot 的"skill"是一份可加载的工作流脚本(`skills/<name>/SKILL.md` +
| 演示出图 | [ppt](#ppt) | 生成 PowerPoint 演示稿(商务红主题,大纲对齐后一脚本整建) | | 演示出图 | [ppt](#ppt) | 生成 PowerPoint 演示稿(商务红主题,大纲对齐后一脚本整建) |
| 演示出图 | [plot_pub](#plot_pub) | 出版级 matplotlib 学术图(中文 + viridis + 矢量 + 投稿级复合图设计纪律) | | 演示出图 | [plot_pub](#plot_pub) | 出版级 matplotlib 学术图(中文 + viridis + 矢量 + 投稿级复合图设计纪律) |
| 文献检索 | [research](#research) | 查 paper_server(OpenAlex 元数据 + Sci-Hub 下载) | | 文献检索 | [research](#research) | 查 paper_server(OpenAlex 元数据 + Sci-Hub 下载) |
| 文献检索 | [documents](#documents) | 查内部 7 学科材料知识库(21W+ 论文,跨语言检索;host-side tool 持 key) | | 文献检索 | [documents](#documents) | 查内部 7 学科材料知识库(100W+ 论文,跨语言检索;host-side tool 持 key) |
| 科研计算 | [pymatgen](#pymatgen) | 晶体结构 / XRD 模拟 / 相图 / Materials Project(host-side tool 持 key) | | 科研计算 | [pymatgen](#pymatgen) | 晶体结构 / XRD 模拟 / 相图 / Materials Project(host-side tool 持 key) |
| 科研计算 | [stats_ml](#stats_ml) | 配方-性能建模与机器学习(三库分工) | | 科研计算 | [stats_ml](#stats_ml) | 配方-性能建模与机器学习(三库分工) |
| 内容生成 | [imagegen](#imagegen) | 豆包 Seedream 5.0 文生图 + 改图 i2i(¥0.22 / 张) | | 内容生成 | [imagegen](#imagegen) | 豆包 Seedream 5.0 文生图 + 改图 i2i(¥0.22 / 张) |
@ -262,7 +262,7 @@ paper_server 是内部 Django 文献库:元数据来自 OpenAlex,PDF / XML 由 S
### documents ### documents
**查内部材料学科知识库(document_search API)。** **查内部材料学科知识库(document_search API)。**
部署在 `https://ai.ctc-zc.com:8100/api`。后端按 `kb_name` 分库存 7 个材料学科,共 **21W+ 英文学术论文**(Elsevier 期刊为主,DOI 前缀文件名)。每个文档带 `md_content`(整篇 Markdown,LLM 友好)+ 可选原 PDF 下载。 部署在 `https://ai.ctc-zc.com:8100/api`。后端按 `kb_name` 分库存 7 个材料学科,共 **100W+ 英文学术论文**(Elsevier 期刊为主,DOI 前缀文件名)。每个文档带 `md_content`(整篇 Markdown,LLM 友好)+ 可选原 PDF 下载。
**7 大学科库**(`classification_id` 1-7): **7 大学科库**(`classification_id` 1-7):
| 学科 | 内容 | | 学科 | 内容 |

View File

@ -1,3 +1,3 @@
# zcbot 版本号单一事实源:web/app.py 的 FastAPI version、/healthz 返回、前端展示都引这里。 # zcbot 版本号单一事实源:web/app.py 的 FastAPI version、/healthz 返回、前端展示都引这里。
# 改版本只动这一行。 # 改版本只动这一行。
__version__ = "0.16.1" __version__ = "0.16.2"

Binary file not shown.

After

Width:  |  Height:  |  Size: 646 KiB

View File

@ -0,0 +1,107 @@
# 科研智能助手 · 操作说明书(精简版)
> 适用:无机非金属材料(水泥 / 混凝土 / 玻璃 / 陶瓷 / 耐火 / 新型建材)科研人员。从**登录后**讲起。
---
## 1. 它能帮你做什么
一句话:**把模糊的科研需求,变成可交付的成果文件。** 它不只是聊天,能查库、跑算、出图、写文档,并产出可下载的 `.docx` / `.pptx` / 图 / 数据。
相较通用聊天工具的**关键优势**
- **接入内部材料文献库**——100 万+ 篇材料论文7 大学科),**中文提问命中英文文献**,全文可读,免你 OCR 翻库;另接 OpenAlex 元数据库补 DOI / 拉 PDF。
- **科研写作全覆盖**——论文投稿稿、6 类基金申报书、国/行/团标、专利交底书、审稿润色,规范成稿、文献真实。
- **科研计算**——XRD 模拟 / 相图、配方-性能建模、出版级学术图(中文 + 矢量)。
- **真实执行**——在安全沙箱里实跑 Python、出图、转档结果是算出来的并有**跨任务长期记忆**。
---
## 2. 界面:三栏
```
左:任务列表 中:对话区 右:文件区
+ 新建任务 与助手一问一答 当前工作目录的文件
搜索 / 筛选 实时显示进度 上传 / 预览 / 下载
技能 / 记忆 底部输入框
```
![](assets/image-1781662287932-1.png)
> 手机端顶部有「任务 / 对话 / 文件」标签切换;分隔线可拖宽,`` `` 可折叠两侧栏。
**三个概念(务必理清):个人文件夹 → 工作目录 → 任务**
| 概念 | 是什么 |
|---|---|
| **个人文件夹(「我的」)** | 你的私有根空间,别人看不到;右栏文件区顶层即「我的」。 |
| **工作目录** | 一个项目 / 课题的文件夹,存该项目的素材与成果;右栏展示的就是它。**可被多个任务共享**。 |
| **任务** | 一次对话会话,新建时绑定到某个工作目录。 |
**任务 ≠ 文件夹**:默认一个任务跟随任务名建一个同名目录(一对一);也可让多个任务挂**同一个工作目录**共享文件(如写一份本子,「立项依据 / 技术路线 / 经费」几个任务共用「XX 基金」目录,文件互通、对话各自独立)。
> 类比:个人文件夹是家,工作目录是项目抽屉,任务是围绕抽屉的一次次对话。
---
## 3. 上手三步
1. **新建任务**:点左栏 `+ 新建任务` → 填任务名(其余默认即可)→ `创建`
- 可选「智能体类型」预设专长,不选则助手按你的话自动判断。
2. **说需求**:在中栏底部输入框打字,**Enter 发送 / Shift+Enter 换行**。需求越具体越好(说清对象、目标、要什么产物)。
- 例:「按国自然面上,写低碳水泥熟料的立项依据」「这组掺量-28天强度数据建回归模型并出图」。
3. **取文件**:助手产出的文件出现在右栏,点开预览,右上角 `下载`
> 助手会分步执行(查资料 → 起草 → 出图),中栏实时显示进度;若提示「回复『继续』可续跑」,回个「继续」即可。
---
## 4. 能力一览(技能)
新建任务时可指定「智能体类型」,或直接在对话里说需求由助手自动挂载。点左栏底部 **`技能`** 可看完整说明。
| 类别 | 能力 | 产物 |
|---|---|---|
| 科研写作 | 学术论文(中文核心/英文 SCI含**引文三角核验**、基金申报书6 类)、标准起草(国/行/团标 + 编制说明)、专利交底书、审稿润色 | `.docx` |
| 演示出图 | PPT 演示稿、出版级学术图XRD / TG-DSC / 应力应变,矢量) | `.pptx` / 高清图 |
| 文献检索 | 内部材料库(中文命中英文,**找材料文献优先**、OpenAlex 元数据库(要 DOI 走它) | 文献清单 / PDF |
| 科研计算 | 晶体·物相XRD/相图,含中英相名映射)、配方-性能建模与机器学习 | 数据 / 图 / 结论 |
| 内容生成 | 文生图 / 改图、文生视频 | 图 / 视频 |
| 通用 | 问题拆解(模糊命题 → 子问题 + 路线图)、代码调试 | — |
> **写论文 vs 写本子 vs 审稿**:把数据写成投稿稿用「学术论文」;写基金本子用「申报书」;只改已有稿用「审稿」。
>
> 任务常串多个技能(如**写论文全流程**:查文献 → 建模出数据 → 出图 → 起草 → 引文核验 → 终审),把目标说清即可,助手自动调度。每次都要重复交代的一套做法,可让助手**固化成你的私有技能**。
---
## 5. 文件操作
- **上传**:点右栏 `⬆`、或直接拖文件进右栏、或在输入框 **Ctrl+V 粘贴**图片(随消息发给助手)。
- **选入**:点 `⊕` 从其他目录勾选文件,复制 / 移动到当前目录复用。
- **预览**:点文件即在线看——图片可 Ctrl+滚轮缩放Word/PDF/PPT/文本/表格直接渲染,无需下载。
- **下载**:预览弹窗右上角 `下载`
---
## 6. 常用小功能
- **切模型**:中栏顶部下拉切对话模型;旁边 `⚙` 选生图 / 生视频模型。
- **润色**`✨ 润色` 把随手草稿改成更清晰的指令再发Ctrl+Z 可撤销)。
- **方案确认卡**:助手在分叉点会给可点选项,点一个继续、或直接打字讨论。
- **消息目录**:长对话右缘有圆点轨道,悬停看标题、点击定位到某轮提问。
- **记忆**:左栏底部 `记忆` 只读查看长期记忆;**想改直接在对话里说**「记住… / 改成… / 忘掉…」。
- **任务管理**:左栏 `筛选 ▾` 按名称 / 状态 / 目录筛选排序;中栏 `完成` 归档,`⋯` 里可导出 / 清空 / 废弃 / 删除(**删除不可逆,暂时不用建议「废弃」**)。
- **账户**:右上角 `改密码` / `退出登录`;右栏底部显示已用存储与版本号。
---
## 7. 用好它的几条建议
- **需求越具体越好**说清对象、目标、约束、想要的产物形式Word 还是 PPT要图还是数据。不会表达就先点 `✨ 润色`
- **一件事一个任务**:文件与对话都更清爽,便于归档筛选。
- **文献多为英文别担心**:用中文提问即可,助手自动转专业英文术语检索。
- **图 / 文件没被看到**:确认已出现在右栏;粘贴的图记得连同消息一起发送。
---
> 把它当成一位**懂材料、会查库、能动手出活**的科研助理:你说清要什么,它把活干出来、把文件交到你手上。

359
docs/操作说明书.md Normal file
View File

@ -0,0 +1,359 @@
# 科研智能助手 · 操作说明书
> 适用对象:无机非金属材料(水泥 / 混凝土 / 玻璃 / 陶瓷 / 耐火 / 新型建材)科研人员
> 本说明书从**登录后正式操作**讲起。
---
## 目录
1. [平台能做什么(核心优势)](#1-平台能做什么核心优势)
2. [界面总览:三栏布局](#2-界面总览三栏布局)
- [2.1 三个概念:个人文件夹 → 工作目录 → 任务](#21-三个概念个人文件夹--工作目录--任务)
3. [第一步:新建任务](#3-第一步新建任务)
4. [第二步:与助手对话](#4-第二步与助手对话)
5. [选对「智能体类型」(技能矩阵)](#5-选对智能体类型技能矩阵)
6. [文件管理:上传 / 选入 / 预览 / 下载](#6-文件管理上传--选入--预览--下载)
7. [进阶操作](#7-进阶操作)
8. [任务管理](#8-任务管理)
9. [图像与视频能力](#9-图像与视频能力)
10. [账户与存储](#10-账户与存储)
11. [常见问题与使用建议](#11-常见问题与使用建议)
---
## 1. 平台能做什么(核心优势)
本平台是一个**面向材料科研的 AI 智能助手**。它不只是聊天工具——它能真正打开你的资料、查内部文献、跑计算、出图、写文档并把成果以可直接交付的文件Word / PPT / 图片 / 数据)产出。
相较通用聊天工具,本平台对科研工作有几项**关键优势**
| 优势 | 说明 |
|---|---|
| **接入内部材料文献库** | 内置 **100 万+ 篇材料学科论文**(胶凝 / 陶瓷 / 玻璃 / 晶体 / 复合 / 耐火 / 检验检测 7 大学科库,以 Elsevier 期刊为主),支持**中文提问命中英文论文**的跨语言语义检索,并已整篇 Markdown 化,助手可直接通读全文,免去你自己 OCR / 翻库。 |
| **接入文献元数据库** | 另接一套基于 OpenAlex 元数据的文献库,可按关键词 / DOI / 作者查文献、取摘要、拉 PDF适合补 DOI、找全网文献。 |
| **科研写作全覆盖** | 申报书 / 任务书6 类基金)、国标·行标·团标(含编制说明)、发明专利技术交底书、审稿润色——均按规范章节骨架成稿,文献真实、指标可考核。 |
| **科研计算能力** | 晶体结构 / XRD 模拟 / 相图pymatgen内置水泥·陶瓷·耐火相名中英文映射、配方—性能建模与机器学习、出版级学术图中文字体 + 矢量 + 投稿级排版纪律)。 |
| **可直接产出文件** | 不是给你贴一段文字,而是生成 `.docx` / `.pptx` / 高清图 / 数据文件,下载即用。 |
| **跨任务长期记忆** | 你的领域、习惯、常用约定会被记住,下次不用重复交代。 |
| **真实执行环境** | 助手在隔离的安全沙箱里实际运行 Python、渲染图表、转换文档结果是真算出来的不是「编」的。 |
> 一句话:**把模糊的科研需求,变成可交付的成果文件。**
---
## 2. 界面总览:三栏布局
登录后进入主界面,整体分为**左 / 中 / 右三栏**
![](assets/image-1781662287932-1.png)
- **左栏 = 任务**:你的所有工作会话,每条叫一个「任务」。顶部有「+ 新建任务」和搜索 / 筛选;底部有「技能」「记忆」两个入口。
- **中栏 = 对话**:选中某个任务后,在这里与助手对话。中部会实时显示助手正在做什么(查文献、跑脚本、出图…),底部是消息输入框。
- **右栏 = 文件**:当前任务工作目录下的所有文件。助手生成的成果、你上传的素材都在这里,可预览、可下载。
> **手机端**:顶部会出现「任务 / 对话 / 文件」三个标签,点击切换三栏。
三栏宽度可拖拽中间的分隔线调整;点栏顶的 `` / `` 可折叠左 / 右栏,给对话区让出空间。
### 2.1 三个概念:个人文件夹 → 工作目录 → 任务
理解这三者的层级关系,是用好平台的关键:
```
我的(个人文件夹 · 你的私有空间,别人看不到)
├── 工作目录 A一个项目 / 一个课题的文件夹)
│ ├── 任务①(对话会话:写大纲) ┐
│ ├── 任务②(对话会话:起初稿) ├─ 共用 A 里的同一批文件
│ └── 文件:素材 / 草稿 / 成果 ┘
├── 工作目录 B另一个项目
│ └── 任务③
└── ……
```
| 概念 | 是什么 | 关系 |
|---|---|---|
| **个人文件夹(「我的」)** | 你的**私有根空间**,所有工作目录都在它下面。每个用户彼此隔离,看不到别人的内容。右栏文件区面包屑最顶层就标「我的」。 | 最外层容器 |
| **工作目录** | 一个项目 / 课题的文件夹,存放该项目的素材、草稿、成果。右栏「文件」区展示的,就是当前任务所属的工作目录。 | 属于个人文件夹;**可被多个任务共享** |
| **任务** | 一次**对话会话**(上下文 + 进度 + 消息记录)。新建任务时绑定到某个工作目录。 | 属于某个工作目录 |
**关键点:任务 ≠ 文件夹。**
- 新建任务默认「跟随任务名」**自动新建一个同名工作目录**——此时任务与目录一对一,最省心。
- 你也可以让**多个任务共用一个工作目录**:新建任务时把「工作目录」选成已有的那个,它们就**共享同一批文件**。
- 典型场景写一份本子建「立项依据」「技术路线」「经费测算」几个任务都挂在同一个「XX 基金」工作目录下——彼此能看到对方产生的文件,但**对话各自独立、互不干扰**。
- 在右栏文件区,面包屑点到顶层「我的」,可浏览你**所有**工作目录;用 `⊕ 选入`(见 [6.2](#62-选入从其他目录带文件进来))还能把别的目录里的文件复制 / 移动到当前目录复用。
> **一句话****个人文件夹是你的家,工作目录是一个个项目抽屉,任务是围绕某个抽屉展开的一次次对话。** 文件按抽屉(工作目录)存,对话按任务分。
---
## 3. 第一步:新建任务
所有工作都从「任务」开始。一个任务 = 一个独立的工作会话 + 一个独立的文件目录,互不干扰。建议**一件事一个任务**如「XX 基金申报书」「玻璃配方建模」各建一个),方便管理与归档。
**操作步骤:**
1. 点左栏顶部蓝色按钮 **`+ 新建任务`**。
2. 在弹窗中填写:
[截图:新建任务弹窗]
| 字段 | 是否必填 | 说明 |
|---|---|---|
| **任务名** | 必填 | 一眼能认出的名字,如「初稿大纲」「早强配方对比」。 |
| **工作目录** | 默认即可 | 任务产生的文件存放处。默认「跟随任务名」自动新建;也可**选已有目录,让多个任务共享同一批文件**(概念见 [2.1](#21-三个概念个人文件夹--工作目录--任务))。 |
| **描述** | 可选 | 对任务的补充说明。 |
| **智能体类型** | 可选 | 预先指定助手用哪种专长(写本子 / 出 PPT / 查文献…)。不选则由助手按你的话自动判断。详见 [第 5 节](#5-选对智能体类型技能矩阵)。 |
| **模型** | 默认即可 | 驱动助手的大模型,一般用默认。 |
3. 点 **`创建`**。任务出现在左栏列表顶部并自动选中,即可开始对话。
> **小贴士**:「智能体类型」不是必须先选——你完全可以建一个空白任务,直接用大白话说需求,助手会自己挂载合适的能力。
---
## 4. 第二步:与助手对话
选中任务后,中栏底部出现输入框。这是你与助手交互的主要方式。
[截图:对话区 + 底部输入框]
### 4.1 发送消息
- 在输入框打字,按 **Enter 发送****Shift + Enter 换行**。
- 发送后,助手开始工作。中栏会**实时显示它在做什么**——「正在检索文献」「正在运行脚本」「正在生成图表」等,过程透明可见。
- 助手可能一次完成,也可能分多步(查资料 → 起草 → 出图)。耐心等它跑完一轮即可。
**提问示例(越具体越好):**
> - 「帮我查一下碱激发胶凝材料早期强度发展的近五年文献,要英文期刊的。」
> - 「按国家自然科学基金面上项目,写一份关于低碳水泥熟料的申报书立项依据。」
> - 「这组掺量—28天强度数据帮我建个回归模型并出一张图。」
### 4.2 「✨ 润色」按钮
如果你的需求只打了草稿、表达比较随意,可先点输入框右侧的 **`✨ 润色`**。它会用模型把你的草稿改写成更清晰、更可执行的指令再发送(误改了可 Ctrl+Z 撤销)。适合不确定怎么把需求说清楚时。
### 4.3 切换模型
中栏顶部的对话信息行有一个**模型下拉框**(常驻),可随时切换当前任务使用的对话模型。旁边的 **`⚙`(媒体)** 齿轮里可单独选「生图模型」「生视频模型」,详见 [第 9 节](#9-图像与视频能力)。
### 4.4 中途暂停 / 继续
- 助手运行时,发送按钮会变为可**停止**当前运行。
- 若助手因步数上限等原因停下,通常会提示「回复『继续』可续跑」——直接回个「继续」即可。
---
## 5. 选对「智能体类型」(技能矩阵)
平台内置一套**专业技能**,覆盖材料科研的高频场景。你可以在新建任务时指定,也可以在对话里直接说需求由助手自动挂载。下面是能力清单与**何时用**
### 科研写作
| 技能 | 做什么 | 典型产物 |
|---|---|---|
| **学术论文写作** | 把实验数据 / 前期报告写成**可投稿的期刊论文**:中文核心 / 英文 SCI原创研究 / 综述 / 快报。按 IMRaD 骨架先建文献矩阵、先定图表、逐章「一段一卡」起草,并做**引文三角核验**(每条引文回库查真、定位原文锚点,杜绝编造与引而不实)。 | 投稿稿 `.docx`+ 可选 cover letter / Highlights / 声明等投稿件) |
| **申报书 / 任务书** | 写本子、立项依据、研究方案、技术路线。覆盖国家重点研发、重大专项、国自然面上 / 青年 / 联合基金、省地方、横向共 6 类基金;自动生成经费表、技术路线图,并**严守文献真实性**(不编引文)。 | 带目录与图表编号的 `.docx` |
| **标准起草** | 起草国标 / 行标 / 团标(重点对接 CSTM 团标)及**编制说明**,符合 GB/T 1.1—2020自动套用「应 / 宜 / 可」能愿动词、指标量化闭环。 | 标准正文 `.docx` + 编制说明 `.docx` |
| **专利交底书** | 把项目材料 / 论文 / 代码挖成发明专利点,做现有技术检索,按七章骨架成稿,供代理师转写。 | 技术交底书 `.docx` |
| **审稿 / 润色** | 审中英文论文 / 报告 / 申报书,先抓全局结构再改语言;长文档先出骨架扫描再分段深审。 | 问题清单 + 修改稿 |
> **写论文 vs 写本子 vs 审稿**:要把数据写成**期刊投稿稿**用「学术论文写作」;写**基金申报书 / 任务书**用「申报书」;只**改已有稿**用「审稿 / 润色」。
### 演示与出图
| 技能 | 做什么 | 典型产物 |
|---|---|---|
| **PPT 演示稿** | 把汇报材料做成商务风可演示的 `.pptx`卡片式版式、论断式标题、KPI 数据卡,原生可编辑。 | `.pptx` |
| **出版级学术图** | 出 SCI 投稿级 matplotlib 图XRD 多谱叠图、TG-DSC 双轴、应力—应变…),中文字体 + viridis 配色 + 矢量输出。 | 高 dpi PNG / SVG / PDF |
### 文献检索(**平台核心优势**
| 技能 | 做什么 | 关系 |
|---|---|---|
| **内部材料知识库** | 查 7 大学科 100 万+ 篇论文,**中文提问也能命中英文文献**,整篇 Markdown 直接可读。找材料类文献**优先用它**。 | 与下者互补 |
| **文献元数据库** | 基于 OpenAlex 查全网文献,要 DOI、要 PDF、要摘要走它。 | 找其他学科或要 DOI 走它 |
### 科研计算
| 技能 | 做什么 |
|---|---|
| **晶体 / 物相计算** | 晶体结构 I/O、XRD 正向模拟与比对、相图、空间群、对称性;内置水泥熟料 / 陶瓷 / 耐火 / 玻璃相名中英文映射C3S、钙矾石、莫来石…。 |
| **统计建模与机器学习** | 配方—性能(强度 / 流动度 / 凝结时间回归、DoE 响应面、假设检验与置信区间、小样本贝叶斯估计、聚类找异常配方。 |
### 内容生成与通用
| 技能 | 做什么 |
|---|---|
| **文生图 / 改图** | 按描述生成图片,或在已有图上做像素级修改(详见第 9 节)。 |
| **文生视频** | 按描述生成短视频片段(详见第 9 节)。 |
| **问题拆解** | 面对模糊的高层科研问题,帮你拆成可操作的子问题 + 实施路线图,再接力给上面的专业技能。 |
| **代码 / 调试** | 修代码、调试、实现脚本。 |
> **查看完整技能说明**:点左栏底部 **`技能`** 按钮,弹窗里分「平台技能 / 我的技能」两列,点任一项可展开完整说明文档。
>
> [截图:技能查看弹窗]
### 跨技能协作(典型组合)
实际任务常常串联多个技能,例如:
- **写论文全流程**:查文献建证据底座 → 配方建模 / 计算出数据 → 出版级出图 → 逐章起草 → 引文核验 → 审稿终审 →(可选)出投稿件。
- **写本子全流程**:问题拆解 → 查文献 → 配方建模出预实验数据 → 出图 → 写申报书 → 审稿。
- **PPT 汇报**:提炼论点 → 找数据与引文 → 出图 → 组装 PPT →(可选)做封面图。
你不需要手动串——把目标说清楚,助手会自动调度。
### 自定义你自己的技能
如果你每次都要重复交代同一套做法(术语表、模板、默认值),可以让助手把它**固化成你的私有技能**(只对你生效):在对话里说「我想要个自己的技能 / 把这套流程固定下来」,或「平台的 XX 技能挺好,但我想改成 YY」即可。
---
## 6. 文件管理:上传 / 选入 / 预览 / 下载
右栏「文件」区是当前任务的工作目录。助手生成的成果、你提供的素材都在这里。
[截图:右栏文件区 + 顶部三个按钮]
### 6.1 上传素材
把已有资料(汇报草稿、数据表、参考论文、图片)交给助手处理,有三种方式:
1. **点 `⬆` 按钮**,选文件上传到当前目录。
2. **直接把文件拖进右栏**(出现「松开以上传」提示时放手)。
3. **在对话输入框 Ctrl+V 粘贴**文件(如截图、图片),会生成一个可预览的小卡片,随消息一起发给助手。
### 6.2 选入(从其他目录带文件进来)
`⊕` 按钮可从你**其他任务 / 目录**里勾选文件或文件夹,**复制**或**移动**到当前任务目录。适合复用之前任务的素材。
[截图:选入文件弹窗]
### 6.3 预览
点文件列表里的任意文件即可在线预览,**无需下载**
- **图片**:支持 Ctrl + 滚轮缩放、放大后左键拖动平移、双击复位。
- **Word.docx/ PDF**:直接在线阅读。
- **PPT.pptx**:自动转换后在线预览版面。
- **文本 / Markdown / 表格**:直接渲染。
[截图:文件预览弹窗(以一张图或一份 docx 为例)]
### 6.4 下载
预览弹窗右上角有 **`下载`** 按钮,可保存原文件到本地。
---
## 7. 进阶操作
### 7.1 方案确认卡
当助手遇到需要你拍板的分叉点(如「用方案 A 还是方案 B」它会在回复里给出**可点击的选项卡**。你可以:
- **直接点某个选项**——相当于把该选项作为回复发出,助手继续;
- **或不点,直接用文字讨论**——把你的想法打出来也行。
历史里已选过的选项会标「✓ 已选」。
[截图:方案确认卡(带可点选项)]
### 7.2 消息目录导航(长对话快速定位)
长对话里,对话区**右缘会悬浮一列圆点**,每个点对应你的一轮提问。鼠标悬停出现该轮标题气泡,点击即可滚动定位到那一轮。方便在几十轮的长任务里快速回到某个问题。
### 7.3 跨任务长期记忆
点左栏底部 **`记忆`** 按钮,可**只读查看**助手记住的、跨任务共享的长期信息(你的领域、常用约定等)。
- **想改记忆?** 不在这里操作——**直接在对话里说**「记住……」「改成……」「忘掉……」,助手会帮你维护。
[截图:记忆查看弹窗]
---
## 8. 任务管理
### 8.1 查找与筛选
左栏顶部点 **`筛选 ▾`** 展开筛选区,可:
- **搜索**任务名 / 描述;
- 按**状态**(进行中 / 已完成 / 已废弃)筛选;
- 按**工作目录**筛选;
- 按创建时间 / 更新时间 / 名称 / 状态分组**排序**。
### 8.2 任务操作菜单
选中任务后,中栏顶部有:
- **`完成`**:把任务标记为已完成(归档,不删数据)。
- **`⋯`(更多)**:导出对话、清空对话、废弃、删除。
| 操作 | 含义 | 可逆性 |
|---|---|---|
| **导出对话** | 把整个对话记录导出留存。 | — |
| **清空对话** | 清掉对话消息(保留任务与文件)。 | 谨慎 |
| **废弃** | 标记为已废弃(仍可在筛选里找到)。 | 可恢复 |
| **删除** | 彻底删除任务。 | **不可逆** |
> **提示**:破坏性操作(废弃 / 删除)按颜色区分(橙 / 红),并有二次确认,避免误点。
---
## 9. 图像与视频能力
平台可按文字描述**生成图片**、在已有图上**改图**、**生成短视频**,也能**「看懂」一张图**OCR、读图表、描述内容
### 9.1 选择媒体模型
中栏对话信息行的 **`⚙`(媒体)** 齿轮里,可单独选「生图模型」「生视频模型」。选定后随你下一条消息生效。
### 9.2 生图与改图
- **生图**:直接说「画一张……」「来个封面」。助手会先把要画的内容、尺寸等**整理成最终描述明文展示给你确认**,你拍板后才真正出图。
- **改图**:对刚生成或你上传的图说「按这个改成 X」助手会在**那张图上修改**(保留原构图),而不是重画。
> **关于费用**:生图、生视频属于**计费能力**(按次 / 按时长),助手在调用前**一定会先把方案明文给你确认**,不会擅自消费。静态图够用时不建议上视频(视频单价显著更高)。
### 9.3 看图(图像理解)
助手在需要时会自动「借眼睛」读图——识别图中文字、读取图表数据、描述图片内容。你上传图后直接问「这张图里写了什么 / 这条曲线峰值多少」即可。
---
## 10. 存储
### 10.1 存储用量
右栏底部有一条**存储进度条**,显示你当前已用的存储空间。最左侧还显示当前平台版本号。
---
## 11. 常见问题与使用建议
**Q怎么让结果更好**
A需求越具体越好——说清**对象、目标、约束、想要的产物形式**(要 Word 还是 PPT要图还是数据。不确定怎么表达时先点 `✨ 润色`
**Q助手好像停住了 / 没出全?**
A若提示「回复『继续』可续跑」直接回「继续」。长任务分多步是正常的。
**Q文献查出来大多是英文**
A内部材料库主语料是英文期刊但**支持中文提问命中英文文献**。你用中文描述需求即可,助手会自动转专业英文术语检索。
**Q我上传的图 / 文件助手看不到?**
A确认文件已出现在右栏「文件」区对话里用 Ctrl+V 粘贴的图,记得**连同那条消息一起发送**。
**Q一个任务能干很多不相干的事吗**
A不建议。**一件事一个任务**,文件与对话都更清爽,也便于后续归档、筛选。
**Q误删了任务能找回吗**
A**删除不可逆**。只是暂时不用,建议用「废弃」而非「删除」——废弃后仍可在筛选里找回。
---
> **使用心法**:把它当成一位**懂材料、会查库、能动手出活**的科研助理。你负责说清要什么,它负责把活干出来、把文件交到你手上。

View File

@ -0,0 +1,418 @@
# -*- coding: utf-8 -*-
"""一次性脚本:重组并瘦身《后端AI技术架构脉络说明-2》。
- 双产品重组为 4 部分;删除占位/虚构内容并替换为真实信息;长段落瘦身
- 输出 -3,保留 -2 原件不动视觉模板不动,只改文字 + 增删/重排页
"""
import copy
from pptx import Presentation
from pptx.oxml.ns import qn
from pptx.util import Inches, Pt
from pptx.enum.text import PP_ALIGN
SRC = "后端AI技术架构脉络说明20260608-2.pptx"
DST = "后端AI技术架构脉络说明20260608-3.pptx"
A_P = qn('a:p'); A_R = qn('a:r'); A_T = qn('a:t')
def first_run_size(p):
for r in p.runs:
if r.font.size is not None:
return r.font.size.pt
return None
def size_templates(tf):
d = {}
for p in tf.paragraphs:
if not p.runs:
continue
sz = first_run_size(p)
key = sz if sz is not None else '_none'
if key not in d:
d[key] = copy.deepcopy(p._p)
return d
def clone_para_with_text(template_p, text):
new_p = copy.deepcopy(template_p)
rs = new_p.findall(A_R)
if not rs:
return new_p
first = rs[0]
t = first.find(A_T)
if t is None:
t = first.makeelement(A_T, {})
first.append(t)
t.text = text
for r in rs[1:]:
new_p.remove(r)
return new_p
def rebuild(tf, specs):
"""specs: [(text, size_pt)] size 用于挑选要克隆格式的模板段落。"""
templ = size_templates(tf)
if not templ:
return
body = tf._txBody
for p in body.findall(A_P):
body.remove(p)
for text, sz in specs:
t = templ.get(sz)
if t is None:
t = next(iter(templ.values()))
body.append(clone_para_with_text(t, text))
def shp(slide, name):
for s in slide.shapes:
if s.name == name:
return s
return None
def edit(slide, name, specs):
s = shp(slide, name)
if s is None or not s.has_text_frame:
print(f" !! 未找到形状 {name}")
return
rebuild(s.text_frame, specs)
def del_shape(slide, name):
s = shp(slide, name)
if s is not None:
s._element.getparent().remove(s._element)
def retext(shape, text, size_pt=None, align=None):
"""改单段文字 + 可选字号/对齐,保留原 run 的颜色/字体(克隆来的)。"""
tf = shape.text_frame
body = tf._txBody
for p in body.findall(A_P)[1:]:
body.remove(p)
p0 = tf.paragraphs[0]
rs = p0._p.findall(A_R)
if rs:
first = rs[0]
t = first.find(A_T)
if t is None:
t = first.makeelement(A_T, {})
first.append(t)
t.text = text
for r in rs[1:]:
p0._p.remove(r)
if size_pt is not None:
for r in p0.runs:
r.font.size = Pt(size_pt)
if align is not None:
p0.alignment = align
def clone_shape(slide, src_name, new_name):
"""深拷贝一个形状(连同主题色/字体),分配唯一 id + 新名,返回 Shape。"""
src = shp(slide, src_name)
spTree = src._element.getparent()
new_sp = copy.deepcopy(src._element)
spTree.append(new_sp)
ids = [int(e.get('id')) for e in spTree.iter(qn('p:cNvPr'))
if e.get('id') and e.get('id').isdigit()]
nid = (max(ids) + 1) if ids else 100
cNvPr = new_sp.find(qn('p:nvSpPr')).find(qn('p:cNvPr'))
cNvPr.set('id', str(nid))
cNvPr.set('name', new_name)
for s in slide.shapes:
if s._element is new_sp:
return s
return None
def place(shape, left, top, width, height):
shape.left = Inches(left)
shape.top = Inches(top)
shape.width = Inches(width)
shape.height = Inches(height)
prs = Presentation(SRC)
S = prs.slides # 原始 0-based 索引 = 幻灯片号 - 1
# ============ S1 (idx0) 封面:删除 4 段概述(标题+正文+连接线+卡片底框),只留标题/副标题 ============
# 每段含:卡片底框(9/13/17/21)、标题(10/14/18/22)、连接线(11/15/19/23)、正文(12/16/20/24)
for nm in ["AutoShape 6",
"AutoShape 9", "AutoShape 13", "AutoShape 17", "AutoShape 21", # 卡片底框
"AutoShape 10", "AutoShape 14", "AutoShape 18", "AutoShape 22", # 标题
"AutoShape 12", "AutoShape 16", "AutoShape 20", "AutoShape 24", # 正文
"Connector 11", "Connector 15", "Connector 19", "Connector 23"]:
del_shape(S[0], nm)
# 重新设计封面:左侧竖条/logo/顶部细线/页脚 保留作装饰边框;
# 主标题下移居中放大,补副标题(双产品)、议程标语(四部分)、落款单位。
cover = S[0]
# 主标题:24 -> 40,移到垂直居中偏上,左对齐与竖条呼应
retext(shp(cover, "AutoShape 7"), "后端 AI 技术架构脉络说明", size_pt=40, align=PP_ALIGN.LEFT)
place(shp(cover, "AutoShape 7"), 1.5, 2.55, 10.3, 1.0)
# 副标题:两大产品线
sub = clone_shape(cover, "AutoShape 7", "CoverSubtitle")
retext(sub, "水泥基配方大模型 · 科研智能体应用平台", size_pt=20, align=PP_ALIGN.LEFT)
place(sub, 1.55, 3.7, 10.0, 0.6)
# 议程标语:四部分一行
agenda = clone_shape(cover, "AutoShape 7", "CoverAgenda")
retext(agenda, "总体架构与核心定位 / 五大引擎与训练 / 智能体应用平台 / 总结与展望",
size_pt=14, align=PP_ALIGN.LEFT)
place(agenda, 1.57, 4.45, 10.5, 0.5)
# 落款单位:左下
unit = clone_shape(cover, "AutoShape 7", "CoverUnit")
retext(unit, "中国建筑材料科学研究总院 · AI 技术部", size_pt=13, align=PP_ALIGN.LEFT)
place(unit, 1.57, 6.1, 8.0, 0.4)
# ============ S2 (idx1) 目录:改为真实 4 部分 ============
edit(S[1], "AutoShape 7", [("后端 AI 技术架构 · 汇报目录", 24)])
edit(S[1], "AutoShape 12", [("总体架构与核心定位", 18)])
edit(S[1], "AutoShape 13", [("明确平台核心定位与建设目标,展示总体技术架构图与核心技术栈,奠定整体框架。", 14)])
edit(S[1], "AutoShape 17", [("配方大模型:五大引擎与训练", 18)])
edit(S[1], "AutoShape 18", [("智能问答、知识库构建、知识库问答、文档分类、实验设计五大引擎,及配方大模型训练体系与成效。", 14)])
edit(S[1], "AutoShape 22", [("科研智能体应用平台", 18)])
edit(S[1], "AutoShape 23", [("自然语言驱动的科研智能体:工作流、定位价值、14 项 Skill 能力矩阵与平台技术架构。", 14)])
edit(S[1], "AutoShape 27", [("总结与展望", 18)])
edit(S[1], "AutoShape 28", [("汇总核心成果与模型矩阵,总结建设价值,展望后续优化方向。", 14)])
# ============ S3 (idx2) PART 01:替换占位/假技术栈为真实内容 ============
edit(S[2], "AutoShape 7", [("PART 01 总体架构与核心定位", 24)])
edit(S[2], "AutoShape 10", [
("01 / 核心定位与目标", 18),
("面向行业场景构建一体化 AI 能力平台,聚焦水泥基材料,打通“通用能力接入 → 专属模型训练 → 智能推理 → 业务落地”全链路闭环。", 14)])
edit(S[2], "AutoShape 12", [
("02 / 总体架构分层", 18),
("分层解耦:应用层 → 后端服务层(五大引擎)→ 模型与数据层 → 行业模型训练模块,各层经标准接口协同,兼顾高可用与弹性扩展。", 14)])
edit(S[2], "AutoShape 14", [
("03 / 关键技术栈", 18),
("FastAPI 高并发异步后端;LangGraph + LangChain 编排;DeepSeek V3.1 / Qwen3 多模型并兼容 OpenAI 接口;Milvus 向量库;LLaMA Factory 训练。", 14)])
# ============ S6 (idx5) 核心技术栈:8 框瘦身 ============
edit(S[5], "AutoShape 12", [("高性能后端框架:FastAPI 高并发异步,保障接口高效、稳定、低延迟,支撑大规模请求与模型调用。", 14)])
edit(S[5], "AutoShape 14", [("智能体流程编排:LangGraph 可视化编排复杂逻辑,LangChain 构建调用链,兼容 OpenAI 接口,多模型高效协同。", 14)])
edit(S[5], "AutoShape 18", [("通用与微调基座:DeepSeek V3.1、Qwen3-30B-A3B 为通用基座,Qwen2.5-1.5B 行业微调,兼顾通用与适配。", 14)])
edit(S[5], "AutoShape 20", [("多模态与向量增强:Qwen2.5-VL 解析视觉内容,BGE-M3 向量化,构建全维度语义理解与知识表示。", 14)])
edit(S[5], "AutoShape 24", [("数据解析与存储:MinerU 解析 PDF/DOC 等非结构化文档,Milvus 向量库实现海量向量高维索引与快速检索。", 14)])
edit(S[5], "AutoShape 26", [("RAG 检索增强:外部知识库与大模型深度融合,有效抑制幻觉,提升回答准确性、专业性与一致性。", 14)])
edit(S[5], "AutoShape 30", [("一站式训练:LLaMA Factory 标准化训练流水线,统一接入多类开源大模型,降低开发与迭代门槛。", 14)])
edit(S[5], "AutoShape 32", [("低成本微调:PEFT + LoRA 仅训练少量关键参数即显著提效,大幅节省算力,加速行业模型落地。", 14)])
# ============ S7 (idx6) PART 02:通用假五引擎 → 真实五引擎总览 ============
edit(S[6], "AutoShape 7", [("PART 02 水泥基配方大模型:五大引擎", 24)])
edit(S[6], "AutoShape 10", [("01 智能问答中枢", 16)])
edit(S[6], "AutoShape 12", [("大模型统一入口,支持通用对话、文件问答、工具调用与多轮会话,可升级为执行任务。", 13)])
edit(S[6], "AutoShape 14", [("02 知识库构建引擎", 16)])
edit(S[6], "AutoShape 16", [("将非结构化文档解析、向量化为可检索、可追溯的企业知识资产,支撑上层应用。", 13)])
edit(S[6], "AutoShape 18", [("03 知识库问答引擎", 16)])
edit(S[6], "AutoShape 20", [("基于 RAG 结合企业知识作答,支持引用溯源,显著抑制大模型幻觉。", 13)])
edit(S[6], "AutoShape 22", [("04 AI 文档分类引擎", 16)])
edit(S[6], "AutoShape 24", [("自动识别文档领域与材料分类并归档,触发向量重建,实现知识治理自动化。", 13)])
edit(S[6], "AutoShape 26", [("05 智能实验设计引擎", 16)])
edit(S[6], "AutoShape 28", [("多阶段工作流将需求转为可执行实验方案,调用行业微调模型生成配方。", 13)])
# ============ S8 (idx7) 智能问答中枢:295 字一坨 → 瘦身 ============
edit(S[7], "AutoShape 2", [
("定位", 16),
("大模型统一入口,负责通用对话、文件问答、工具调用与多轮会话管理。", 13),
("核心技术", 16),
("• LangGraph 编排复杂对话流程", 13),
("• 核心模型 DeepSeek V3.1 / Qwen3-30B-A3B", 13),
("• 支持文件问答、多轮上下文与思考模式", 13),
("• MCP 工具接入外部业务系统与接口", 13),
("• SSE 流式输出,实时生成展示", 13),
("主要价值", 16),
("• 统一、标准化的大模型问答能力", 13),
("• 高扩展性,无缝集成更多业务工具", 13),
("• 从“回答问题”升级为“执行任务”", 13)])
# ============ S9 (idx8) 知识库构建 ============
edit(S[8], "AutoShape 2", [
("核心定位", 16),
("将非结构化文档转化为可检索、可引用、可追溯的企业知识资产,是上层应用的基础。", 13)])
edit(S[8], "AutoShape 3", [
("支持内容类型", 16),
("• 文档类:PDF / Word / PPT / Excel", 13),
("• 图像类:图片、扫描件、图表", 13),
("• 文本类:Markdown / TXT / CSV / JSON", 13)])
edit(S[8], "AutoShape 4", [
("主要价值", 16),
("• 分散资料沉淀为结构化企业知识库", 13),
("• 为问答、实验、训练提供高质量数据基础", 13)])
# ============ S10 (idx9) 知识库问答 ============
edit(S[9], "AutoShape 2", [
("定位", 16),
("基于 RAG 架构,让大模型结合企业内部知识作答,保证专业性与准确性。", 13)])
edit(S[9], "AutoShape 3", [
("核心技术", 16),
("• RAG 检索增强生成", 12),
("• BGE-M3 向量化 + Milvus 检索", 12),
("• DeepSeek/Qwen 结合上下文生成", 12),
("• 支持引用来源溯源", 12),
("• 多维度检索过滤", 12)])
edit(S[9], "AutoShape 4", [
("主要价值", 16),
("• 提升专业性、准确性与可追溯性", 13),
("• 赋能私有文档深度问答", 13),
("• 降低大模型幻觉风险", 13)])
# ============ S11 (idx10) 文档分类:169 字 → 瘦身 ============
edit(S[10], "AutoShape 2", [
("定位", 16),
("自动识别文档领域与材料分类并归档至对应知识库,实现知识管理自动化。", 13)])
edit(S[10], "AutoShape 3", [
("核心技术", 16),
("• 内容理解:基于 MinerU + Qwen2.5-VL 解析", 13),
("• 分类推理:DeepSeek V3.1 / Qwen3 判定", 13),
("• 智能输出:摘要、领域、分类路径、依据、置信度", 13),
("• 闭环管理:自动触发文档迁移与 Milvus 重建", 13)])
edit(S[10], "AutoShape 4", [
("主要价值", 16),
("• 大幅降低人工整理归档成本", 13),
("• 归入正确体系,提升检索效率", 13),
("• 为行业模型筛选标准化数据集", 13)])
# ============ S12 (idx11) 实验设计:238 字 → 瘦身 ============
edit(S[11], "AutoShape 2", [
("▍定位", 16),
("平台最核心的行业智能体能力,经多阶段工作流将需求转为可执行实验方案。", 13),
("▍核心技术", 16),
("• LangGraph 编排含人工确认的实验设计流", 13),
("• 混合调用:通用模型析文献,行业微调模型生成配方", 13),
("• 知识驱动:Milvus 检索文献作决策依据", 13),
("▍主要价值", 16),
("• 海量文献转为实验依据,降低人工成本", 13),
("• 方案生成全链路可追溯", 13),
("• 专项微调模型提升配方专业性与适配性", 13)])
# ============ S14 (idx13) 科研平台:作为 PART 03 开篇 ============
edit(S[13], "AutoShape 7", [("PART 03 科研智能体应用平台", 24)])
edit(S[13], "TextBox 9", [
("以自然语言为入口,平台自动识别意图、动态挂载专业能力,把科研任务串成可执行、可交付的工作流;", 13.5),
("关键节点由用户确认,全程运行在统一的模型、知识与安全底座之上。", 13.5)])
# ============ S15 (idx14) 定位与价值 ============
edit(S[14], "AutoShape 9", [
("面向科研全流程的智能体:以自然语言为入口,自动拆解任务、调度工具与专业能力,把“想法”直接转化为可交付科研产物,压缩从需求到成果的链路。", 16)])
edit(S[14], "AutoShape 14", [
("从问题拆解、文献检索、计算建模、出版级出图,到申报书/标准/专利起草与审稿,覆盖“调研—计算—写作—评审”全链条,无需多工具切换。", 14)])
edit(S[14], "AutoShape 18", [
("用自然语言描述需求,平台自动识别意图、挂载对应专业能力,按阶段化流程推进,关键节点与用户确认,过程可控可追溯。", 14)])
edit(S[14], "AutoShape 22", [
("不止对话回答,直接产出 Word / PPT / 图表 / 数据等规范化交付物,贴合科研与项目申报格式,降低整理排版成本。", 14)])
# ============ S16 (idx15) 能力矩阵 ============
edit(S[15], "AutoShape 12", [("申报书/任务书、国标·行标·团标、专利交底书、审稿润色,覆盖立项到评审的写作全链路。", 14)])
edit(S[15], "AutoShape 16", [("检索内部 100 万+ 篇材料学科论文库与全网文献,支持中文检索命中英文文献,提供可溯文献支撑。", 14)])
edit(S[15], "AutoShape 20", [("晶体结构 / XRD 模拟 / 相图计算,配方-性能统计建模与机器学习,服务“配比→性能”预测寻优。", 14)])
edit(S[15], "AutoShape 24", [("一键生成商务级 PPT,出版级 matplotlib 学术图(中文+矢量),让成果能看、能讲、能投稿。", 14)])
edit(S[15], "AutoShape 28", [("文生图、文生视频按需调用,为封面、概念示意与宣传材料快速产出配图与动效。", 14)])
edit(S[15], "AutoShape 32", [("科学问题拆解与路线图引导、代码实现与调试,把专业能力按任务智能编排串联。", 14)])
edit(S[15], "AutoShape 34", [("当前已沉淀 14 项专业能力(skill),按“科研写作·文献检索·科研计算·演示出图·内容生成·通用元能力”六类组织,并可持续扩展。", 13)])
# ============ S17 (idx16) 平台技术架构:8 框瘦身 ============
edit(S[16], "AutoShape 12", [("ReAct 智能体循环:“思考→调用工具→观察”自主迭代,内置重复调用守卫与异常自愈,自动收敛到可交付结果。", 14)])
edit(S[16], "AutoShape 14", [("阶段化编排:复杂任务以图式工作流编排,嵌入人工确认节点,关键决策由用户拍板,过程可追溯。", 14)])
edit(S[16], "AutoShape 18", [("意图识别 + 按需挂载:识别需求后动态加载对应 skill,不相关能力不进上下文,精准又省算力。", 14)])
edit(S[16], "AutoShape 20", [("可扩展插件:每个 skill 是独立可维护的工作流(流程+模板+脚本),新增能力即插即用。", 14)])
edit(S[16], "AutoShape 24", [("每用户 Docker 沙盒隔离:代码执行与文件读写独立容器运行,资源限额 + 网络管控 + 最小权限。", 14)])
edit(S[16], "AutoShape 26", [("丰富工具集 + MCP:内置文件、命令、Python、联网检索等工具,兼容 MCP 接入外部系统。", 14)])
edit(S[16], "AutoShape 30", [("多模型自由调度:兼容 DeepSeek、Qwen 等及 OpenAI 接口,涉密任务可切内网私有模型。", 14)])
edit(S[16], "AutoShape 32", [("RAG + 长期记忆:向量检索抑制幻觉,双层记忆与长任务断点恢复,跨会话沉淀偏好与上下文。", 14)])
# ============ S18 (idx17) 训练体系导语:215 字 → 瘦身 + 侧标改子节 ============
edit(S[17], "AutoShape 8", [("训练体系", 20)])
edit(S[17], "AutoShape 10", [
("聚焦水泥基材料智能配方大模型的核心训练体系——材料配方智能化设计的技术基石。", 16),
("阐述从数据采集、特征工程到算法选型、迭代优化的全流程逻辑,融合材料科学机理与深度学习,破解传统研发“试错成本高、周期长”的痛点。", 16),
("并展示模型在性能预测、多目标配方寻优等关键环节的技术突破。", 16)])
# ============ S19 (idx18) 训练基础信息 ============
edit(S[18], "AutoShape 12", [("采用 LLaMA Factory 训练框架,Qwen2.5-1.5B-Instruct 为基座,兼顾训练效率与推理性能。", 13)])
edit(S[18], "AutoShape 16", [("PEFT + LoRA:不更新主干参数,仅微调少量低秩矩阵,大幅降低显存与训练成本,精准学习配方知识。", 13)])
edit(S[18], "AutoShape 20", [("以 SFT 为核心,建立“材料性能要求 → 配方组成”的精准映射,实现需求到方案直接转化。", 13)])
edit(S[18], "AutoShape 24", [("基于 16 组实验室实测数据:输入 3 天/7 天抗压、抗折强度;输出矿粉、电石渣、脱硫石膏、粉煤灰、水、减水剂配比。", 13)])
# ============ S21 (idx20) 训练成效 ============
edit(S[20], "AutoShape 12", [
("损失值收敛表现", 14),
("初始 0.6897 → 第 50 轮 0.0073,降幅 98.9%,拟合充分且未过拟合。", 12)])
edit(S[20], "AutoShape 14", [
("学习率动态调整", 14),
("从 4.92e-04 衰减至 4.93e-07,配合损失动态适配,避免后期震荡。", 12)])
edit(S[20], "AutoShape 27", [("损失曲线全程无剧烈波动,稳定在极低水平,参数更新策略有效,鲁棒性佳。", 12)])
edit(S[20], "AutoShape 31", [("模型掌握“低强度→低掺量、高强度→高掺量”行业逻辑,配方贴合工程实际。", 12)])
edit(S[20], "AutoShape 35", [("稳定输出高精度预测值,并按工程格式生成完整配方,直接对接下游系统。", 12)])
# ============ S23 (idx22) 总结 PART 04:删除虚构指标,替换真实成果 ============
edit(S[22], "AutoShape 7", [("总结与展望", 24)])
# 标题与正文是分开的形状:标题改 AutoShape 11/16/21/26,正文改 13/18/23/28
edit(S[22], "AutoShape 11", [("01. 核心能力落地成效", 18)])
edit(S[22], "AutoShape 13", [
("已落地五大引擎(智能问答、知识库构建/问答、文档分类、实验设计)与科研智能体平台,沉淀 14 项专业 skill;水泥基配方大模型完成首版训练,损失收敛至 0.0073。", 14)])
edit(S[22], "AutoShape 16", [("02. 平台技术底座", 18)])
edit(S[22], "AutoShape 18", [
("FastAPI + LangGraph 智能体内核,DeepSeek/Qwen 多模型调度,Milvus + RAG 抑制幻觉,每用户 Docker 沙盒隔离,LLaMA Factory + LoRA 行业微调。", 14)])
edit(S[22], "AutoShape 21", [("03. 业务价值与知识资产", 18)])
edit(S[22], "AutoShape 23", [
("打通“数据→知识→决策”全链路闭环;内部 100 万+ 篇材料论文知识库与配方数据沉淀为可复用知识资产,支撑研发提效。", 14)])
edit(S[22], "AutoShape 26", [("04. 下一阶段规划", 18)])
edit(S[22], "AutoShape 28", [
("配方数据集由 16 条扩充至 200+,简化配方空间,搭建“预测—实验—反馈”闭环,目标配方达标率 ≥85%;持续扩展 skill 与场景。", 14)])
# ============ S24 (idx23) 模型矩阵汇总:6 框各 120+ 字 → 瘦身 ============
edit(S[23], "AutoShape 9", [
("模型矩阵架构", 18),
("基于 DeepSeek、Qwen 大模型底座,融合视觉模型与向量检索,构建“通用+垂直”双轮驱动体系。", 13),
("核心价值:打通“解析→沉淀→决策”全链路闭环,提升研发与应用效率。", 14)])
DIV = "——————————"
edit(S[23], "AutoShape 11", [
("01. 智能问答中枢:通用基座", 15), (DIV, 11),
("模型:DeepSeek V3.1 / Qwen3-30B-A3B", 12),
("场景:通用问答、文件问答与工具调用,平台统一入口。", 12)])
edit(S[23], "AutoShape 13", [
("02. 知识库构建:多模态沉淀", 15), (DIV, 11),
("模型:Qwen2.5-VL + BGE-M3 + Milvus", 12),
("场景:文档解析、图表提取,非结构化数据向量化入库。", 12)])
edit(S[23], "AutoShape 15", [
("03. 知识库问答:精准溯源", 15), (DIV, 11),
("模型:DeepSeek V3.1 + BGE-M3 + Milvus", 12),
("场景:RAG 精准问答,提供原文引用与溯源。", 12)])
edit(S[23], "AutoShape 17", [
("04. AI 文档分类:知识治理", 15), (DIV, 11),
("模型:Qwen3-30B-A3B + BGE-M3", 12),
("场景:自动识别主题、分类归档,解决海量文档管理难题。", 12)])
edit(S[23], "AutoShape 19", [
("05. 智能实验设计:研发提效", 15), (DIV, 11),
("模型:通用大模型 + Qwen2.5-1.5B(LoRA 配方模型)", 12),
("场景:分析文献与实验数据,生成配方初步方案。", 12)])
edit(S[23], "AutoShape 21", [
("06. 配方模型训练:垂直深耕", 15), (DIV, 11),
("模型:Qwen2.5-1.5B 基座 + BGE-M3 预处理", 12),
("场景:学习“性能-配方”映射,建立专属垂直模型。", 12)])
# ============ 结构:重排 + 删除(S4=idx3 与 S25=idx24 删除) ============
# 目标顺序(原始 0-based 索引):
# 开场: 0,1 | PART1: 2,4,5 | PART2: 6,7,8,9,10,11,12,17,18,19,20,21
# PART3: 13,14,15,16 | PART4: 22,23,25
order = [0, 1, 2, 4, 5,
6, 7, 8, 9, 10, 11, 12, 17, 18, 19, 20, 21,
13, 14, 15, 16,
22, 23, 25]
sldIdLst = prs.slides._sldIdLst
ids = list(sldIdLst)
dropped_rids = [ids[i].get(qn('r:id')) for i in range(len(ids)) if i not in order]
for e in ids:
sldIdLst.remove(e)
for i in order:
sldIdLst.append(ids[i])
# 彻底移除被删幻灯片的部件(否则孤立 part 残留,PowerPoint 可能弹"修复")
for rid in dropped_rids:
if rid in prs.part.rels:
prs.part.drop_rel(rid)
prs.save(DST)
print(f"OK -> {DST}{len(order)}")

View File

@ -1,11 +1,11 @@
--- ---
name: documents name: documents
description: 查内部材料学科知识库(document_search API,7 个学科:胶凝 / 陶瓷 / 玻璃 / 晶体 / 复合 / 耐火 / 检验检测,21W+ 英文学术论文 Markdown 化,跨语言语义检索)。用户找材料领域文献、特定学科论文、材料性能数据时使用;与 research(OpenAlex 外部库)互补,可并用 / 同时试。 description: 查内部材料学科知识库(document_search API,7 个学科:胶凝 / 陶瓷 / 玻璃 / 晶体 / 复合 / 耐火 / 检验检测,100W+ 英文学术论文 Markdown 化,跨语言语义检索)。用户找材料领域文献、特定学科论文、材料性能数据时使用;与 research(OpenAlex 外部库)互补,可并用 / 同时试。
--- ---
# Documents # Documents
部署在 `https://ai.ctc-zc.com:8100/api` 的文档检索 API。后端按 `kb_name` 分库存储 7 个材料学科库(中文命名:胶凝 / 陶瓷基 / 玻璃基 / 晶体材料 / 复合材料 / 耐火材料 / 检验检测,共 21W+ 文件),**文档主体是英文学术论文**(Elsevier 期刊为主,DOI 前缀文件名),每个文档带 `md_content`(整篇 Markdown,LLM 友好)+ 可选的原 PDF 下载。**API 后端有跨语言语义检索**,中英文 query 都能命中英文文档。本 skill 使用三个 host-side tool:`document_list_kb` / `document_search` / `document_download`,**不要**自己 `httpx` 裸调,也不要在 `run_python` 里读 `DOCUMENT_SEARCH_API_KEY` 部署在 `https://ai.ctc-zc.com:8100/api` 的文档检索 API。后端按 `kb_name` 分库存储 7 个材料学科库(中文命名:胶凝 / 陶瓷基 / 玻璃基 / 晶体材料 / 复合材料 / 耐火材料 / 检验检测,共 100W+ 文件),**文档主体是英文学术论文**(Elsevier 期刊为主,DOI 前缀文件名),每个文档带 `md_content`(整篇 Markdown,LLM 友好)+ 可选的原 PDF 下载。**API 后端有跨语言语义检索**,中英文 query 都能命中英文文档。本 skill 使用三个 host-side tool:`document_list_kb` / `document_search` / `document_download`,**不要**自己 `httpx` 裸调,也不要在 `run_python` 里读 `DOCUMENT_SEARCH_API_KEY`
> ⚠️ **配置条件**:只有宿主后端配置了 `DOCUMENT_SEARCH_API_KEY` 时,上述 tool 才会出现在可用工具列表里。若没有 `document_*` tool,降级走 `research` skill(OpenAlex + Sci-Hub,不受影响,中文 query 先转专业英文术语)/ 用户自己导出文档落 task 目录后用 `read` 工具读。**别让 LLM 误推**:research 跟本 skill 不同范式,research 不持 secret,任何模式都能用。 > ⚠️ **配置条件**:只有宿主后端配置了 `DOCUMENT_SEARCH_API_KEY` 时,上述 tool 才会出现在可用工具列表里。若没有 `document_*` tool,降级走 `research` skill(OpenAlex + Sci-Hub,不受影响,中文 query 先转专业英文术语)/ 用户自己导出文档落 task 目录后用 `read` 工具读。**别让 LLM 误推**:research 跟本 skill 不同范式,research 不持 secret,任何模式都能用。

View File

@ -57,7 +57,7 @@ markitdown https://example.com/ -o <task_dir>/source/外部.md
3. **执行检索**(优先级从高到低): 3. **执行检索**(优先级从高到低):
- **`web_search`** —— 优先搜中国专利文库 / Google Patents / 期刊综述。query 里带 `site:patents.google.com` / `专利` / `CN10` 等限定符可显著提升信号 - **`web_search`** —— 优先搜中国专利文库 / Google Patents / 期刊综述。query 里带 `site:patents.google.com` / `专利` / `CN10` 等限定符可显著提升信号
- **`web_fetch`** —— 命中的关键专利/论文页拉全文摘要 - **`web_fetch`** —— 命中的关键专利/论文页拉全文摘要
- **`documents` skill** —— 本地材料学科库(7 个学科共 21W+ 论文)如果命中 - **`documents` skill** —— 本地材料学科库(7 个学科共 100W+ 论文)如果命中
- **`research` skill** —— OpenAlex 学术文献库,找综述与对比方案 - **`research` skill** —— OpenAlex 学术文献库,找综述与对比方案
4. **每条命中归档** (写到 spec §4): 4. **每条命中归档** (写到 spec §4):
- 公开号 / 标题 / 申请人 / 公开日 (专利) 或 DOI / 作者 / 期刊 / 年 (论文) - 公开号 / 标题 / 申请人 / 公开日 (专利) 或 DOI / 作者 / 期刊 / 年 (论文)