zcbot

Commit Graph

Author	SHA1	Message	Date
caoqianming	108351864e	feat(scheduler): 定时任务 v1 — 对话建/管 + 守护循环执行 + 只读前端 (DESIGN §8.5) 到点把一句自然语言 prompt 喂进 agent 主管线,可跑 skill 出简报 / 发邮件 / 打招呼等。 job 本体 = cron+时区 + prompt + 会话模式;"发邮件"不是字段,是 agent 据 prompt 调 send_email 的动作 → 加任何能力不改 schema。后端: - scheduled_jobs 表 + migration 0011(独立加表,公测兼容) - core/scheduler.py:croniter 算 next_run(时区+vixie OR 语义)、claim+advance 防重复触发、失败阈值自停、notify 兜底投递、CRUD 服务层(工具与 REST 共用不漂移) - 守护循环 _scheduler_loop(lifespan,仿 _disk_scanner 的 plain-asyncio,不引 APScheduler/Celery; 复用 _run_agent_bg,抢 run 锁、超时协作 cancel、并发上限) - tools/send_email.py(host-side,SMTP_* 齐才挂) - /v1/schedules GET/PATCH/DELETE 三端点对话端 = 完整 CRUD:schedule_create/list/update/cancel 四工具(定时 run 内不挂防自我繁殖)。前端 = 只读 + 停用/删除:左栏 rail「定时」入口 + crons.js 只读 master-detail modal (复用 skills modal 范式);建/改故意只走对话,规避 cron 构建器 UX。会话模式:isolated(默认,每次新建临时 task 省 token)/ persistent(绑 bound_task_id 续上下文)。 env:SMTP_* / ZCBOT_DISABLE_SCHEDULER / ZCBOT_SCHEDULER_TICK_SECONDS / ZCBOT_SCHEDULER_CONCURRENCY。已验:migration 上库、CRUD 端到端、3 REST + 4 工具注册、crons.js 语法。待验:起 web 进程跑一轮真实触发 + 邮件 smoke。bump 0.18.0 → 0.19.0。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-18 13:42:31 +08:00
caoqianming	4f61b5fc56	feat(skill): brief 科研方向简报(三路检索 documents/research/web)+ 全局化学式下标修复 + bump 0.18.0 新增 brief skill:给定研究方向 + 时间窗,用三路真实数据(documents 内部库取全文 / research 取近期 DOI 元数据 / web 取政策·会议·标准动向)产出文献计量趋势型简报。六阶段:定题对齐 spec → 三路检索取数(中→英术语 + 跨源去重)→ 趋势分析(3-7 热点簇) → 逐段起草 → 引文核验(复用 paper 三层协议)→ 渲染验收。深度三档 flash/standard/deep。自带 render_docx.py(简报专属版式):商务红主题 + 正文 [n]/[Wn] 引文上标并锚到文末 + DOI/URL 可点击超链接 + TL;DR 卡片 + 标题信息带 + 页脚页码。顺带修 zcbot 全局「角标」问题:水泥化学式在 docx 里平排数字(CO2/C3S/SO3...)是 paper/proposal 渲染器的老毛病。抽一份化学式下标白名单(长在前 + \b 防误伤 LC3/C595/Ca2+/2026,实测命中精确零误伤)统一补进 paper、proposal、brief 三个 render_docx.py 的 add_inline plain 分支(按"自包含 skill 脚本不跨 skill 引"的既有约定各自复制同一份)。core/export_docx.py 是对话原文转录、非排版文档,不动。文件:skills/brief/{SKILL.md, templates/{spec,brief_outline}.md, references/{search_strategy,citation_verify}.md, scripts/{quality_check,render_docx}.py}; SKILL_LIST.md(16→17)+ PROGRESS.md 同步。bump 0.17.0 → 0.18.0。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-18 11:28:03 +08:00
caoqianming	e87daa7c89	feat(tasks): 任务软删除(留对话轨迹做语料 + 可恢复)+ bump 0.17.0 DELETE /v1/tasks/{id} 从硬删(DELETE + CASCADE + rmdir)改为软删(置 deleted_at), messages/usage_events 及工作目录文件全部保留,留作训练语料且可恢复;新增 POST /v1/tasks/{id}/restore;list_tasks/list_folders 计数过滤 deleted_at IS NULL; delete_file 顶层目录 409 引用检查排除软删 task(避免"任务删了文件夹却删不掉")。 0010 migration 加 tasks.deleted_at(additive 可空,存量行自动视为未删)。推翻 DESIGN 原 hard-cascade 决策;文件归档方案(restic 备份 + DB 事件日志)写入 DESIGN 待办。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-17 16:37:47 +08:00
caoqianming	6d6e9f79b5	docs: 用户操作说明书(详+精简)+ 文献库口径 21W→100W + bump 0.16.2 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-17 10:34:08 +08:00
caoqianming	660bec0f2f	feat(skill): paper 学术论文写作(中英×三类型 + 引文三角核验)+ bump 0.16.1 新增自包含 skills/paper/:把实验数据/前期报告整理成可投稿论文 .docx。流程骨架取 paper-writer-skill 的"先定图表"纪律 + ARS 的三角引文核验/反谄媚审稿, 底座全换成 zcbot 自有(documents/research 查文献与核验、plot_pub 出图、复用 proposal 渲染心智)。 - 中英双语 × 三类型(original/review/letter)子 md 分流,一篇只挂一套 cite_gbt7714/cite_elsevier + redlines_zh/redlines_en - 六阶段:摄取 → 八条对齐 spec → 文献矩阵 → 先定图表 → 逐章一段一卡(Methods→Results→Intro→Discussion→Abstract→Title) → 引文三角核验(存在性/三角/支撑度,台账 CITATIONS.md) → 验收渲染 + 投稿件 - 自带脚本:render_docx(--lang 图题切换 + --toc 默认关)/ quality_check (引文交叉核对 orphan/uncited/编号连续 + 结构/占位符/过度宣称)/ word_count / render_diagrams - smoke 验证:happy path 全 OK,orphan/uncited/缺号负例正确触发,render 出 docx - SKILL_LIST 15→16,PROGRESS 加一条 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-17 09:55:10 +08:00
caoqianming	0d69ae86e2	feat(media): look_at_image 图像理解(豆包 Seed 2.0 Lite vision)+ bump 0.16.0 DESIGN §8.1 C 路落地 —— 主模型 DeepSeek V4 纯文本无视觉,挂 look_at_image 工具按需读图(OCR / 描述 / 读图表),模型自决何时调。 - 选型:设计时的 Seed 1.6 vision 已过时,改用 Doubao Seed 2.0 Lite (doubao-seed-2-0-lite-260428,全模态 SOTA 细粒度感知)。token 计费输入 ¥0.6 / 输出 ¥3.6 /Mtok,一次读图 < ¥0.01 - 后端:tools/look_at_image.py(/chat/completions base64 单图+问题→文本解读); doubao.yaml 加 vision 段;usage.py 加 record_vision_usage(kind=vision, 按 token,无需 migration——kind 自由文本);agent_builder 注册 + media prompt 段 - 图片路径解析与 i2i 共用 tools/image_ref.py - 验证:scripts/smoke_look_at_image.py 真机 OCR 通过(实测 ¥0.0011) Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-16 16:20:05 +08:00
caoqianming	be813629b2	feat(media): seedream i2i 改图 + 前端 paste 路径注入 + bump 0.15.0 - seedream 加 reference_images(v1 单图):传已有图路径做像素级改图, 不传=文生图行为 100% 不变(向后兼容)。路径解析抽到 tools/image_ref.py (三形态路径 + 强制落 user_root 内防越界 + 扩展名/大小校验) - 前端 chat.js:sendMessage 把粘贴图路径作 [用户上传的参考图] 行注入正文, 修了粘贴图路径到不了模型的既有缺口("上传外部图→改图"才能定位文件) - 引导:imagegen SKILL 删旧"不接图像输入"+ 加改图(i2i)专段,纠正 "该 i2i 却重新文生图丢原构图";agent_builder 媒体 block + SKILL_LIST 同步 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-16 16:18:18 +08:00
caoqianming	1cfeb000a6	feat(web): ask_user 工具 — 回复里渲染可点击「方案确认」选项卡 + bump 0.14.0 agent 在真正的分叉点(2-4 个互斥方向且选择会实质改变后续动作)调用 ask_user, 前端渲染可点击选项卡:点一个即作为回复继续,或不点直接用文字讨论。收窄定位防 agent 变爱问(高轮数烧 token 已知痛点),系统提示严格约束使用条件。与轮次模型同构、无阻塞:ask_user 是虚拟工具(同 task_progress 范式),loop 检测到本步调用它就提前结束本轮、不回灌 LLM;点选项=发该选项 label 作新用户消息,零额外 LLM 往返。选项落在 tool_calls.arguments 里,刷新页面按钮还在;已答的卡自动置灰。 - tools/ask_user.py 新增 AskUserTool;core/agent_builder.py 注册 - core/loop.py 加 ask_user 提前终止分支 - prompts/system/general_v1.md 加「方案确认约定」段 - web/static/js/chat.js buildAskUserCard + SSE/历史重渲特判 + sendMessage(overrideText) + 点击委托 - web/static/dev.html 加 .ask-user/.ask-option 样式 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-16 11:23:59 +08:00
caoqianming	91e200ef4f	feat(web): 消息目录-右侧悬浮圆点轨道导航(ChatGPT 式)+ 双向分页 + bump 0.13.0 右缘悬浮圆点轨道:每点=一轮"我"的提问,hover 展开标题,点击滚动定位+高亮, 滚动自动高亮当前轮;覆盖全部轮次(非仅当前窗口)。后端:新增 GET /v1/tasks/{id}/outline(只取 role=user 的 idx+首行片段,不回传整 payload);list_messages 加 after_idx 参数 + has_more_after 响应,支持向下翻页 (从目录跳旧消息后补回下方未加载的新消息)。纯增量,旧前端不受影响。前端:消息卡补 data-idx 锚点;jumpToMessage 已加载则 scrollIntoView、未加载用 before_idx 拉居中窗口再定位;refreshOutline 并入 selectTask 并发拉 + run 收尾刷新; dev.html 加 #msg-outline-rail(容器 pointer-events:none 不挡滚动条、仅圆点可点), 手机端隐藏,embed 页 null-safe。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-16 08:52:39 +08:00
caoqianming	82feecef06	perf(web): 切 task 并发拉 meta+messages + 默认窗口 60→30 + bump 0.12.16 selectTask 里 meta 与 messages 原本串行 await,改 Promise.all 并发省一个 RTT; MSG_PAGE 60→30 降首屏传输与 markdown/highlight 同步渲染量。切 task 慢非索引问题 ((task_id, idx) 唯一索引已覆盖主查询),故只优化前端串行与窗口大小。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-16 08:21:26 +08:00
caoqianming	ec27fcae3e	feat(skill): plot_pub 吸收 nature-figure 投稿级复合图设计纪律 + bump 0.12.15 调研 nature-figure skill(MIT)后只迁移可复用设计 IP,不整包移植 (避免与 plot_pub 重叠、R/生物内容不适配、多文件结构破坏单 SKILL.md 约定)。 - style.py: 补 svg.fonttype='none'(原只设 PDF Type 42,漏了 SVG 可编辑) + SEMANTIC_COLORS 语义色表 + clean_spines() + ablation_alphas() - SKILL.md: 新增「投稿级多 panel 复合图」段(五点 figure contract / 语义配色 / 信息架构 + spine 纪律 / 导出纪律),示例改建材领域 - SKILL_LIST.md / PROGRESS.md 同步;纯 Python 零新依赖,保留中文字体 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 16:54:32 +08:00
caoqianming	5caa3db62e	perf(web): 消息尾部窗口分页 + 向上滚动加载更早 + 切 task loading 占位 + bump 0.12.14 切 task 卡顿:/v1/tasks/{id}/messages 无分页全量拉 + 前端全量渲 DOM,消息多时两段成本线性涨。 - 后端 list_messages 加可选 limit/before_idx:不传=旧行为(升序全量,仅多返 has_more,向后兼容);传 limit 取尾部最近 N 条,before_idx 取更早一批,响应恒含 has_more - 前端 selectTask 进来立即换「加载中…」占位(治感知);loadMessages 默认 limit=60 - 新增 loadEarlierMessages + _msgScrollObserver(复用 task list sentinel 范式):顶部 sentinel 进视口自动 prepend 更早一批后整窗重渲,锚回滚动位不跳视口 - state 加 loadedMessages/msgHasMore/msgLoadingEarlier;dev.html 加 .msg-top-sentinel 样式 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 11:30:42 +08:00
caoqianming	888824ba85	feat(web): 图片预览放大后左键拖动平移 + 光标语义改正 + bump 0.12.13 - 光标:100% 改普通箭头(原 zoom-in 放大镜误导,左键不缩放);放大后 grab、拖动中 grabbing。 - 左键拖动平移:放大态 mousedown 记起点+滚动位,mousemove 改 body scrollLeft/Top 平移;img.draggable=false 关原生拖拽。document move/up 监听存 z._onMove/_onUp,_clearZoom 时移除避免泄漏。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 10:00:15 +08:00
caoqianming	eb1027b040	fix(web): 图片缩放 load 即量基准尺寸 + 双击复位提示 + bump 0.12.12 - _captureBase:图片加载完即量贴合尺寸做基准,避免首次缩放时还没渲染量到 0px 把图片塌成 0;量不到则本次跳过不破坏。 - 双击复位徽标显式提示「已复位 · 100%」(停留 1.4s)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 09:53:00 +08:00
caoqianming	12171a4bdf	fix(web): 图片预览缩放改显式 px,修 CSS zoom 被 flex max 夹回放不大 + bump 0.12.11 CSS zoom 对带 max-width/height:100% 的 flex item 无效(放大后被百分比 max 重新约束回去,视觉不变)。改为:以 scale=1 的贴合显示尺寸为基准缓存,缩放时 max:none + 显式 width/height = base × scale 像素,真正撑大布局让 body 出滚动条;复位时清空还原自适应。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 09:42:37 +08:00
caoqianming	31f46baaf6	fix(web): 文件预览修滚动穿透 + 图片 Ctrl+滚轮缩放 + bump 0.12.10 - 滚动不穿透:主/小预览 .body 加 overscroll-behavior: contain,再挂一次性非 passive wheel 监听,容器不可滚或到边界时 preventDefault 断冒泡,背景对话列表不再被带滚。 - 图片缩放(仅图片):Ctrl+滚轮 ×1.1 步进(夹 0.1-8x),用 CSS zoom 而非 transform(zoom 改布局盒,放大后 body 才出滚动条能看溢出);右下角 xx% 比例徽标(挂 .card,滚动不跟走,1s 淡出);双击复位 100%;.body.center 改 safe center 防 flex 居中裁掉溢出顶/左。 - wheel 监听只 init 挂一次到复用 body,缩放目标走 _zoomState WeakMap,免每次预览重复 addEventListener 泄漏。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 09:31:12 +08:00
caoqianming	314a05e111	fix(sandbox): 容器装 fonts-noto-color-emoji 修 mermaid 图满图豆腐块 + bump 0.12.9 模型生成的 mermaid 节点标签常前缀 emoji 图标(🌐🔥🛡 等),容器只装了 CJK 字体缺 emoji 字体,chromium 渲染时每个 emoji 都成空心方框 □。加 fonts-noto-color-emoji(+~10MB)并 fc-cache 刷索引即可正常出图标。纯增量容器改动,需重建镜像 + 重启 per-user 容器生效。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 09:21:39 +08:00
caoqianming	977923b6cf	feat(web): 左栏任务筛选区默认折叠(偏好仍持久化)+ bump 0.12.8 进页面只见「筛选 ▸」一行,点开才展开;用户显式展开过(localStorage 存 "0")才默认展开,否则一律折叠。已选筛选条件折叠后仍生效。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 08:56:46 +08:00
caoqianming	211b008821	fix(sandbox): 容器渲 mermaid 开箱即用(mmdc wrapper) + system 按 backend 注入运行环境段 + bump 0.12.7 接 --shm-size(0.12.5)。修两层让容器渲 mermaid 不再反复栽: 执行层 ── mmdc wrapper: - Dockerfile 给 /usr/local/bin/mmdc 套 wrapper,没显式 -p 时自动注入 -p /sandbox/puppeteer-config.json(含 --no-sandbox/--disable-dev-shm-usage), 裸调 `mmdc -i x -o y` 一次成;render_diagrams.py 等走 which mmdc 的脚本透明受益。 - 删掉没人读的 MERMAID_PUPPETEER_CONFIG env(mmdc 只认 -p)。引导层 ── system prompt 按 backend 注入「运行环境」段: - general_v1.md 删写死的 "Windows+cmd" 平台段(线上是 docker=Ubuntu 容器+bash, 误报导致模型在 Linux 里打 cmd 构文)。 - agent_builder 注入 _CONTAINER_ENV_BLOCK(docker)/_HOST_ENV_BLOCK(host):写明 Linux/bash、渲图走本地 mmdc 别调境外在线服务(mermaid.ink 被墙,容器虽有外网但渲图不该依赖出站)、mmdc/chromium/中文字体已装。 - 撤回上一轮加到 imagegen 的渲图引导(环境事实收归 system)。顺带:RUN.md 修正把 sandbox 网络写成 --internal 无 outbound 的过时注释(实际 bridge+NAT 有外网,见 network.py)。部署:Dockerfile 改动需 rebuild 镜像;prompt 改动重启 web 生效。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 08:30:43 +08:00
caoqianming	32bf6ae917	fix(sandbox): docker run 加 --shm-size 修 mmdc 渲 mermaid 挂超时 + bump 0.12.5 容器 /dev/shm 默 docker 64MB,chromium(mmdc/puppeteer)起不来一直挂到 timeout。实测一个"生图测试"对话:模型裸调 mmdc,自造 puppeteer config 漏 --disable-dev-shm-usage, 连试 6 次全超时烧约 120k token。从根上给 docker run 加 --shm-size(默 512m, env ZCBOT_SANDBOX_SHM_SIZE / yaml sandbox.shm_size 可配),任何 chromium 路径都不再挂。 - core/sandbox/pool.py: --shm-size 旋钮(优先级同 memory/cpus) - config/agent.yaml / RUN.md: 新增 shm_size 配置 + env + 故障兜底一行 - deploy/sandbox/probe_mermaid.sh: 实测脚本(区分 chromium 缺包 vs 纯 shm 超时) - scripts/diag_dump_task.py: 按 email+任务名 dump 对话的诊断脚本 - 已 running 旧容器需重启 web + idle 回收后新起才生效;镜像无需 rebuild Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-14 10:40:45 +08:00
caoqianming	d30435198c	feat(web): 模型选择瘦身 — 对话模型常驻 + 生图/生视频收进 ⚙ 弹层 + bump 0.12.4 - meta 行原三个带标签下拉(模型/生图/生视频)占满整行 → 高频对话模型常驻可见可切, 低频生图/生视频收进一个「⚙ 媒体」fixed 弹层(点开才渲染 select) - 行为不变:媒体模型选中值仍只进 state.*,随下条消息 image_model/video_model 发; send 读 state 不读 DOM,迁移安全;两个 select 都没配时连 ⚙ 都不画 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 13:07:51 +08:00
caoqianming	18f702886f	feat(web): 左栏筛选区可折叠(默认展开,偏好持久化)+ bump 0.12.3 - 搜索/状态/目录/排序四控件归到两行 .task-filter-row,标题行加「筛选 ▾」toggle - 默认展开,折叠只藏 UI(已选条件仍生效),偏好存 localStorage(同 pane 折叠范式) - 折叠后左栏顶部 4 行→2 行,任务列表可视区更高 - 状态下拉并入筛选区(flex),搜索框 flex:2 更宽;目录/排序合一行用 title 提示 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 12:58:33 +08:00
caoqianming	ae9790601a	refactor(web): 中栏操作收进 ⋯ 菜单 + 消息阅读限宽 + 色彩收敛 + bump 0.12.2 - 中栏顶栏 5 个平铺按钮(导出/清空/完成/废弃/删除)→「完成」+「⋯」菜单, 菜单复用 taskMenuItems(过滤 complete),与任务行同一范式;破坏性操作不再平铺易误点。顺带让菜单「清空」按 run_status 也禁用(修运行中 409-after-confirm 小坑) - 消息限宽:.msg max-width 92% → min(92%,48rem),user 气泡 min(92%,36rem),宽屏可读性↑ - 色彩收敛:颜色=后果(完成/下载绿、废弃橙、删除红),导出/清空中性不着色;移除紫/蓝冗余 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 12:52:56 +08:00
caoqianming	1f57bbd201	fix(web): 导出按钮简写 + 任务菜单加清空 + 修移动端 task 滚动 + admin 自适应 + bump 0.12.1 - 顶栏「导出对话记录」→「导出对话」,与「清空对话」对齐(dev.html + chat.js 菜单 export 项) - 任务菜单(每行 ⋯)新增「清空对话」,复用 clearMessages;dropdown 加 .act-clear 紫色 - 修移动端 task 列表无法滚动:手机断点 #pane-left 误用 display:block 致 #task-scroll flex:1 失效被 overflow:hidden 截断;改 display:flex 恢复滚动 - admin 移动端自适应:header 紧凑化 + .card-head/.ctrl 允许换行,避免窄屏横向溢出 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 12:41:53 +08:00
caoqianming	c870b10368	feat(memory): 双层记忆升级为 agent 自管 + 前端只读记忆面板 + bump 0.12.0 写入路径从纯手工改为 agent 自管(prompt 契约,非后台蒸馏):memory_block 注入可写路径锚点 + 「记忆维护契约」,契约/锚点常驻(记忆为空也注,解新用户冷启动)。extended 索引从首行标题升为优先 frontmatter description(缺则退回首行,平滑兼容存量)。修旧 bug:extended 路径在 docker 下注的是宿主路径指不到, 改按 backend 给 host 绝对路径 / /workspace/.memory。前端记忆面板取舍 = GUI 当眼睛、模型当手:左栏「记忆」按钮开只读 modal 看全貌 (GET /v1/memory + GET /v1/memory/extended/{filename},零写/删 API,路径穿越校验收口在 core/memory.py)。"看全貌"是读不是 operation,走 LLM 又贵又只拿转述;"改"全走对话(agent 自管),单一写入口 + 自然语言 + 不会写坏 frontmatter。对照业界:Claude(同文件式)给全套 view+edit,ChatGPT/Gemini 黑箱只给看/删。单测覆盖:frontmatter 解析 / legacy 兜底 / 空记忆常驻契约 / host·docker 路径 / 只读视图 / 单篇读 / 文件名安全 / 越界拦截。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 12:20:08 +08:00
caoqianming	0259f0ce92	docs(compat): 进入公测期,开发心智翻新为保证对外兼容 + bump 0.11.1 - CLAUDE.md「开发阶段心智」从"开发期可随意 break、不写兼容层"改为: 对外契约(用户数据/DB schema/对外 API/CLI·env·文件布局)必须向后兼容, 仅纯内部实现仍以最优为准放手重构;拿不准 → 当对外契约处理 - 版本号段:公测保持 0.x,1.0 留给对外冻结行为 / 正式 GA - PROGRESS 加一条;bump 0.11.0 → 0.11.1 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-12 11:23:03 +08:00
caoqianming	f12df1bd82	feat(admin): 后台目录导航 + 按模型/各用户用量时间筛选排序 + 存储分页 + 导出 PDF + bump 0.11.0 - 左侧目录(sticky,点击平滑滚动 + scrollspy 高亮,窄屏转横向 chip);各区 scroll-margin-top 避开顶栏 - 按模型 / 各用户用量拆为独立端点,带 range(all/7d/30d)+ sort(cost/tokens); 各用户用量含零用量用户(时间条件放 JOIN ON,避免被 cutoff 挤掉) - 存储分页(/v1/admin/storage/users);各用户用量分页;overview 瘦身为固定指标(runtime/tasks/users/总用量+近7d),独立表自管 range/sort/page - 导出 PDF:客户端 window.print()(零依赖),填充隐藏报告 DOM + @media print 版式;列表取前 10 - 文档同步 DESIGN §7.3 / PROGRESS / RUN Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-12 10:44:47 +08:00
caoqianming	81da2f6f55	fix(context): 不压 assistant tool_call 参数,断 run_python 投毒空转旧 assistant tool_call.arguments(>800 字符)被压成 {"_compacted":...} marker 发给 LLM,模型在长 doc/ppt 任务里反复看到后仿写它当真实参数 → run_python 拿不到 code/script_path 报错空转(DB 实测最近 60 个 task 命中 83 次,其中 61 次是模型仿写 marker)。把原本只给 task_progress 的豁免升级成通用规则:删 _compact_assistant_tool_calls / _compact_tool_call_arguments,只压 tool 结果 + skill,assistant 参数一律原样保留。附诊断脚本 scripts/diag_run_python_empty.py / diag_run_python_trace.py;全量 120 tests OK。 bump 0.10.0 -> 0.10.1 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-12 10:41:54 +08:00
caoqianming	ef611b0666	feat(admin): 角色化管理后台 + 分页各用户用量 + bump 0.9.0 - users 加 role 列(user/admin,migration 0009);make_require_admin 按 DB role gate(不进 JWT,改完即时生效) - /v1/admin/overview 监控总览:runtime(并发/线程池/SSE/RSS)+ tasks + users + usage 总用量 + storage - /v1/admin/usage/users 分页各用户 token 用量(全表 LEFT JOIN 含零用量,cost desc,稳定排序) - /v1/me 返 role;登录/建用户响应带 role;main.py user role / user add --role;建用户弹框加角色下拉 - 独立页 web/static/admin.html + js/admin.js(阈值/热力色差、响应式、10s 轮询、独立翻页);dev SPA admin 才显"管理"入口 - 文档同步:DESIGN §7.3/§7.4、PROGRESS、RUN Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-12 10:02:20 +08:00
caoqianming	44be5753f7	fix(version): 版本号挪到右侧存储条最左,垂直居中 + bump 0.8.1 - dev.html: #app-version 从左栏 #rail-resources 移入 #storage-foot 最左, 带细分隔线,垂直居中(align-items:center);左栏底部腾给后续按钮 - core.__version__ 0.8.0 → 0.8.1(纯 UI 位置微调,patch) - PROGRESS 同步新位置描述 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 12:55:35 +08:00
caoqianming	dd797a91e2	feat(version): 版本号单一事实源(core.__version__)+ web 左栏底部展示 - core/__init__.py 新增 __version__ = "0.8.0",作唯一来源 - web/app.py: FastAPI version 与 /healthz 返回都引它(不再写死两份) - dev.html: 左栏「我的资源」技能按钮旁加 #app-version 小灰字(纯展示) - main.js: boot 时无条件 fetch /healthz 填版本号(auth 豁免,embed/未登录皆可) - 放左栏底部而非顶栏:embed 模式桌面端 header 被 CSS 隐藏,顶栏点不到 - CLAUDE.md「文档维护」加规矩:每次 commit/push bump __version__(patch/minor/major 分类) - RUN.md / PROGRESS.md 同步 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 12:00:30 +08:00
caoqianming	958678aa12	feat(skills): 用户私有 skill(.skills)+ 创作工具 + skill-creator + Web 查看页每用户可在私有 .skills/ 下造/改 skill,只对自己生效。 - SkillRegistry 改多来源(SkillSource 列表:内置 + 用户 .skills),后扫同名覆盖先扫 → user wins;user_overrides 记覆盖关系、discovery 显式标注; Skill 加 source;from_dir 区分"非 skill 目录(静默)"与"格式错(SkillLoadError)", 坏的用户 skill 收进 load_errors 注入 prompt,不崩整次扫描。容器路径改写下沉到 registry.container_dir(按 source 给 /sandbox/skills 或 /workspace/.skills), LoadSkillTool 去掉 container_skills_dir 参数。 - 新增 host-side 工具 save_skill / fork_skill(tools/skill_authoring.py): fs 的 base_dir 锚 cwd/容器 wd 够不到 user_root/.skills,故用 host-side typed tool(与 seedream/document_* 同范式)。save_skill 写时校验 frontmatter; fork_skill copytree 整目录(带脚本)+ 自动对齐 frontmatter name。 - 新增 skill-creator 引导 skill(重点教写好 description + fork 语义)。 - Web:左侧 rail 底部「技能」按钮 → modal 分平台/我的两组,点开看完整 SKILL.md,我的可删;后端加 GET /v1/skills/{name}(正文)+ DELETE /v1/skills/{name}(只删 user 源 + 防穿越);/v1/skills 带 source/overrides/ load_errors;新 web/static/js/skills.js。创建/改/fork 仍走对话。 - .skills 是 dotfile(文件面板隐藏,与 .memory 一致;validate_task_name 已禁 . 起头 working_dir,天然不撞)。 - 测试:test_user_skills.py(20 例)+ 改写 test_load_skill.py;全 121 过。 - 文档:DESIGN §3.5 / PROGRESS / RUN(布局+端点)/ SKILL_LIST 同步。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 09:46:39 +08:00
caoqianming	d9b48bdb96	refactor(prompt): 精简 system prompt,媒体段改按需注入,通用任务每轮瘦 ~40 行去 system prompt 冗余 + 让无关段不常驻: - 「宪法」文件命名约定 ~25→~6 行:只留格式定义+注入值+一行 current/重定调; 操作细节本就由 proposal/ppt skill 各自讲,两 skill 引用不动也不破 - run_python「先 write script 再 script_path」去重:模板+agent_builder 两处合一, scripts/ 子目录约定收进模板 - 媒体工具段(seedream/seedance 红线)抽成 _MEDIA_TOOLS_BLOCK,仅 ArkConfig.load() 非 None(有 ARK_API_KEY)时追加;ark_cfg 提前 load 一次复用给 tool 注册 - 路径 echo 全形式段 8→4 行实测 media_enabled ON/OFF 差 891 字节(=媒体段),命名约定段拼接正常; test_system_prompt_paths 仍过。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 08:10:27 +08:00
caoqianming	8b6e66b006	feat(context): 压缩加"上下文压力门槛",短任务不压缩以护缓存+保信息 prepare_messages_with_stats 加 compact_threshold_chars:总 chars 未超阈值则完全跳过压缩、原样发 —— 短任务 prompt 前缀逐轮字节一致、DeepSeek 前缀缓存全程命中,且不白丢旧 tool 细节(context 预算还很空时无谓压缩=纯损失)。超阈值才走原压缩逻辑。 - loop 按 caps.reliable_context × 0.5 × 2.5(char/token 粗折算)算阈值 (flash ≈ 33 万 chars),_COMPACT_CONTEXT_RATIO/_CHARS_PER_TOKEN 可调 - compaction_skipped 进 stats / llm_start 事件可观测 - 默认 compact_threshold_chars=0 = 永远压缩(向后兼容) 背景:实测 task b27466a0 DeepSeek 缓存命中已 92-94%、滑动边界损失有限 (压缩函数确定性、旧消息压缩态稳定),故只补门槛、暂不改边界为阶梯式。新增 2 测试(below/above 门槛),全量 105 过。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-10 13:42:18 +08:00
caoqianming	0df9e5fe3f	feat(loop): 停机判据从"步数"解耦为"是否在推进" max_iterations 降级为纯安全 backstop(flash 50→120 / pro 100→150), 不再当"轮预算"砍正经长任务;真正的空转防护改用进展信号: - _RepeatGuard.record 多返 productive(净产出=非[Error]且非一字不差重复) - _execute_tool_call 三个返回点都带 productive - run loop 全局 _stall:整步全无净产出+1、任一净产出清零, 连续 _STALL_LIMIT=8 步主动停([stopped: no progress]), 比撞 backstop 早得多掐死循环,配逐指纹 HARD=4 双保险 - 撞 backstop / 空转停都 emit"回复继续可续跑"提示,不再静默停诊断依据:task b27466a0"中途断了"实为撞 max_iterations=50 后干净停、用户离开 25min 回来打"继续"续完(非崩溃);"步骤太长"=DeepSeek API 延迟 126-185s 而非工具(全<13s)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-10 13:22:02 +08:00
caoqianming	8150bf0b83	feat(tools+loop): 批量抓取 + 重复调用守卫 —— 治高轮数烧 token DB 实测高轮数 task 的浪费来自三股根因(空 {} 风暴 / 报错重试 / 检索不收敛)叠加,且 loop 对重复调用零防护。本轮两味药: 药2 检索/抓取类 host 工具批量化(从工具形态减往返): - web_fetch: url -> urls(1-10 并发,总预算 16000 按条分摊,单条失败不连坐) - document_search: query -> queries(1-8 并发,批内去重,批量自动缩量防爆 context) - document_download: file_name+kb_name -> items(1-10 并发,单条失败标 [Error] 不毁整批) 按「开发期不写兼容层」直接换签名、不留单数别名;skills/documents/SKILL.md 同步。药1 loop 病理性重复守卫(core/loop.py::_RepeatGuard): - 按 (工具名, 精确参数) 指纹跟踪「无产出重复」 - 只惩罚无产出(结果为 [Error] 或与之前一字不差);结果每次不同=有产出、清零, 绝不误伤正常迭代(改脚本重跑 / 修 bug 重跑构建) - SOFT=2 注入软提示;HARD=4 拦截不执行,逼模型换路 - 顺带堵 _malformed_tool_calls 漏空 {} 的洞(空 {} 每次返同句缺参错 -> 走 dup 被拦) 测试:tests/test_loop_repeat_guard.py(7 例)+ test_secret_host_tools.py 改新形态并加批量/去重/失败隔离 3 例;相邻 24 测试全过。诊断脚本留 scripts/diag_*.py 供复跑。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-08 16:47:56 +08:00
caoqianming	824f746571	fix(progress): 停压 task_progress 参数修进度还原 + 进度区移到对话区顶部问题1(进度不对): 上下文压缩把旧 task_progress tool_call 参数换成 {"_compacted":true,"step_id":"sX"} 这种像合法调用的标记, 既毒化模型让它照抄出残废 update_step(丢 step.status)入库, 又让前端 applyProgressAction 读不到 args.step → 步骤永停 pending。修复: task_progress 参数一律不压缩。问题2(没像 codex 在顶部): 删掉每条消息卡内联进度块, 进度统一只在对话区顶部单一 dock 实时显示(钉顶不滚); 全部完成时折叠成一行摘要。prompt/tool 描述改为跑完标 completed 而非 clear, 留住全绿收尾。校验: unittest test_context_compaction/test_task_progress_tool 12 过; node --test frontend_task_progress 2 过。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-08 09:52:44 +08:00
caoqianming	8616ba2b56	Add task progress tool	2026-06-08 08:44:16 +08:00
caoqianming	8a7e0cd233	fix(loop): 工具调用 arguments 损坏时丢弃重试 + 非流式兜底,断投毒级联 deepseek-v4-flash 大参数工具调用(大 write/run_python,≈7K+ 字符)偶发把内容碎片错位粘进 arguments 开头致 JSON 解析失败,或退化成空 {} 缺参。隔离批量验证 (干净上下文)非流式 8/8、流式 8/8 全干净 → 上游间歇抖动,概率低;真正放大成灾的是 loop 把损坏的 assistant 消息入库 + 每轮重发,诱导模型继续学坏(投毒级联)。 - core/loop.py:_stream_llm 拉一轮后用 _malformed_tool_calls 校验 tool_call arguments 能否 json.loads,不能则丢弃整轮(不 append/不记账)重 roll(≤3 次), 最后一次降级 _nonstream_once(provider 服务端拼,绕开流式错位)。流式收集逻辑抽成 _collect_stream_once,正常路径不变。 - core/executor_host.py / core/sandbox/tool_runner.py:缺必填参数早返「缺少必填参数 [...];请带齐 [...] 重新调用」,替掉暴露内部签名的 TypeError missing N required positional arguments(host + docker 两路覆盖)。 - 文档:PROGRESS.md 加 2026-06-06 条;RUN.md 故障兜底加一行。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-06 20:51:45 +08:00
caoqianming	69fc2599e3	feat(run_python): 过程脚本约定落 task_dir/scripts/ 模型显式写文件再 script_path 跑的过程脚本统一进 <task_dir>/scripts/ (可见/持久/可重跑),交付产物仍落 task_dir 根。inline code 匿名片段维持临时用后即焚(host 系统 temp、docker .zcbot_tmp dotfile,均不动)。改 agent_builder 系统提示工作目录段 + run_python tool description/参数说明。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-05 15:52:05 +08:00
caoqianming	af2ad3cef1	feat(usage): 记账给前缀缓存命中折价 + 前端体现缓存命中/真实成本排查"rust→PPT"task(flash,34 轮)发现累计 tokens_in 69.9 万里 88.6% 是缓存命中,但 _fallback_chat_cost_cny 把命中段也按 input 全价算,记账虚高 2-3x。 - capabilities: 加 cache_hit_cny_per_mtoken(deepseek flash 0.1 / pro 0.2; 0=不区分按全价兜底,绝不少记) - usage: 成本公式拆三段「命中×缓存价 + (input−命中)×input价 + output×output价」; loop 把 cache_hit_tokens + 缓存单价透传进 record_chat_usage - web: 不加 DB 列。app.py 加 _usage_aggregates(单查询 GROUP BY usage_events, 复用列表 msg_counts 批量范式,无 N+1)on-the-fly 算每 task 真实成本 + 缓存命中, _task_dict 带出;dev.html 列表行显 ¥、顶栏 formatTaskUsage 显「tok·缓存命中%·¥」 - scripts: backfill_chat_cost_cache_discount.py 按 units 已存 token 重算历史 cost_cny(只改成本列,默认 dry-run,--apply 落库) 折价只对新 chat 事件即时生效;历史走 backfill 脚本(部署后跑)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-05 08:26:09 +08:00
caoqianming	5f8b157733	perf(context): 压缩旧 assistant tool_call arguments + keep_recent 20→12 旧 assistant `tool_calls[].function.arguments` 超 ~800 chars 时压成合法 JSON 标记(保留 path/script_path/name/original_chars),避免 `write(content=...)` 源码参数反复进 prompt;keep_recent 20→12 收窄原文窗口。role/tool_call_id/ name 等协议字段不变,tool_call 协议完整。stats 增 compacted_tool_call_arguments。 DESIGN §8.2 退出标准补一条:列表 N 条/N tok 是历史累计、不随发送前压缩下降。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-05 08:25:56 +08:00
caoqianming	1c30a9e54e	Reduce chat context token usage	2026-06-04 16:41:14 +08:00
caoqianming	af97dd7c62	feat(web): 文件面板底部展示用户已用存储 + 配额后端已有 user_disk_usage 表(后台 15min 扫描落库)但无对外查询口, 加 GET /v1/user/storage(require_user)返 {bytes_used, file_count, limit_bytes, scanned_at};limit_bytes 由 parse_bytes(quotas. disk_bytes_per_user) 得,≤0/None=不限。disk_quota.get_user_usage 扩为返 (bytes,count,scanned_at) 三元组(复用而非新开函数,顺手改唯一调用方 check_disk_quota 解包)。前端 dev.html 右侧文件面板底部钉一条进度条+文字:#pane-right 改 flex 列让 file-list 独占滚动、存储条钉底;loadStorage() 在 enterApp 拉一次; 不限额时只显已用、隐进度条;超额变红;hover 显文件数+统计时间。样式用 class 选择器压低特异性,让折叠/手机隐藏规则能盖住它。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-04 15:00:36 +08:00
caoqianming	42755e246e	fix(sandbox): shell 也注入 PYTHONPATH + HOME=/tmp(修只读 rootfs 两副作用) 容器 --read-only rootfs 下两个副作用: - PYTHONPATH 原先只 run_python 注入,shell `python -c "from skills..."` 撞 ModuleNotFoundError - /home/zcbot 不可写,matplotlib/fontconfig 往 ~/.config / ~/.cache 写缓存刷 "Read-only file system" / "No writable cache" 噪音抽 _CONTAINER_ENV = {PYTHONPATH, HOME=/tmp},shell/run_python/fs 三路共用 (-e 确定性覆盖)。HOME=/tmp 一刀让缓存落 tmpfs(matplotlib→/tmp/.config、 fontconfig→/tmp/.cache),免逐个 MPLCONFIGDIR/XDG_CACHE_HOME。纯代码改, 重启 web 生效,免重建镜像。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-04 14:12:53 +08:00
caoqianming	7b09c77f76	fix(sandbox): docker 下 system prompt / SKILL 文档统一用容器路径 docker backend 下 shell/run_python/fs 工具全在容器里跑(<workspace>/users/<uid> bind 到 /workspace),但喂给 LLM 的路径多处仍是宿主绝对路径(容器内不存在), agent 据此 find 全空、瞎转到 pwd 才发现真身在 /workspace/<wd>。 - core/agent_builder.py::_build_system_prompt:docker 下 task_dir + 「宪法」 glob 范例换成容器路径 /workspace/<wd>,去掉容器里无意义的 cwd 行(cwd 恒等 task_dir);host 不变。修法同 LoadSkillTool 的 container_skills_dir 改写。 - skills 文档同类宿主路径残留清扫:patent 跨 skill 调 proposal 脚本由 <repo_root>/...(硬编码 D:/projects/zcbot)改兄弟相对 <skill_dir>/../proposal/...; research fetch_pdf 范例硬编码 D:/... 改 <task_dir> 占位;patent/proposal/ppt 的 <task_dir> 举例的废弃旧布局 workspace/tasks/<task_id> 改 host/docker 双形态说明。 - ppt 图标缓存写进只读挂载修复(方案 A):种子图标库 <skill_dir>/assets/icons/ 降为只读(glob 读),fetch_icon.py 新拉图标一律 -o <task_dir>/assets/icons/, 读路径改种子库 + 本 task 两处都 glob。docker 下 skills 是 :ro bind,旧写法必败; host 下还顺带污染仓库工作树。脚本已 out.parent.mkdir,无需改。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 16:33:59 +08:00
caoqianming	9cd33cf4d6	revert(workspace): 撤 ZCBOT_WORKSPACE_DIR env 覆盖(架构 bug),数据盘改用 bind mount 2026-06-02 给 resolve_workspace 加的 env 覆盖与路径存储层冲突:core/paths.py 把 DB working_dir 锚定 ROOT(代码仓库目录)存相对串,to_db_path 对 ROOT 外路径直接 relative_to raise。env 一旦指向 ROOT 外的 /data/...,三家分叉: - 文件面板 /v1/files 走 resolve_workspace(吃到 env)看数据盘 - agent resume 走 from_db_path(锚 ROOT)看 ROOT/workspace - 新建 task to_db_path 直接 500 现场症状:文件面板"目录尚未创建",但 agent 文件其实写在老 ROOT/workspace。改法:resolve_workspace 回退成显式 arg > cfg workspace_dir > 默 workspace (均 ROOT/<值>)。import os 保留(别处仍用)。要把重写入区落独立数据盘改用 bind mount 把 /data/zcbot/workspace 接到 ROOT/workspace —— .resolve() 不展开 bind,内核路径保持 ROOT 内,relative_to(ROOT) 照常过,DB 不用改,dev 不受影响。 RUN.md:删 .env 的 ZCBOT_WORKSPACE_DIR 段;「workspace 落独立数据盘」段改 bind mount(+ RequiresMountsFor 开机顺序硬化);故障表替换旧 env 行 + 加 "目录尚未创建"诊断行。PROGRESS.md:2026-06-03 加回退记录。DESIGN 不动。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 10:24:14 +08:00
caoqianming	382a85e88e	feat(workspace): resolve_workspace 加 ZCBOT_WORKSPACE_DIR env 覆盖(per-host 落盘) prod 要把重写入的 workspace/users/ 落到独立数据盘(xfs prjquota),但 config/agent.yaml 的 workspace_dir 是 dev/prod 共用提交的,改绝对路径会带歪 dev。 resolve_workspace 优先级改为 env ZCBOT_WORKSPACE_DIR > yaml workspace_dir > 默 "workspace" (对齐 sandbox.* 的 yaml+env 模式);env/cfg 值都按 ROOT/<值> 解析,绝对路径直接生效。 dev 不设 env 维持 ROOT/workspace,prod systemd 设数据盘绝对路径,两边不抢同一份 yaml。 PG 暂不迁(元数据库小,留默认 /var/lib/postgresql 少坑)。 RUN.md:env 段加 ZCBOT_WORKSPACE_DIR + 新增「workspace 落独立数据盘」段 (mkfs.xfs + fstab prjquota + rsync 迁移 + systemd env)+ 故障表一行。 PROGRESS.md:2026-06-02 加一条。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-02 14:42:00 +08:00
caoqianming	68ce996ad2	feat(tools): documents/pymatgen secret-bearing 能力改 host-side tools，key 不进 sandbox 新增 tools/documents.py（document_list_kb/search/download）和 tools/materials_project.py （mp_search_summary/get_structure/get_entries），key 只在宿主读取，sandbox/run_python 拿不到。 agent_builder 仅在对应 env 存在时注册。删 skills/pymatgen/materials.py::mp_rester() 旧入口， smoke 改走 host tool。同步 DESIGN §6.7 secret-bearing 规则 + RUN/SKILL_LIST/两个 SKILL.md。实测：MP step D 真连 api.materialsproject.org 返 403（工具行为正确，干净透传 [Error]），疑似 .env 里 legacy key 在新版 mp-api 失效，待换 next-gen key 再验。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-01 09:35:10 +08:00
caoqianming	aab1da3296	fix(executor_docker): 删 setsid 修 docker exec 延迟 stdout 丢失实证:`docker exec ... setsid python -c "sleep(2); print"` 等满 2s 输出空, 同条件去 setsid 输出 hello。setsid 调 setsid() syscall 后 docker exec/runc 的 stdio attach 出问题,延迟输出被截。上一条 _run_subprocess 重写修了独立的 poll-loop bug 但不是用户当下症状元凶。setsid 历史是给 §7.5 Step 3b PGID kill 协议铺路,该协议未实现的当下是空头载荷 + 副作用。改 _exec_shell:141 / _exec_python:177 各删 1 个 "setsid"。回归测试加 test_run_subprocess_delayed_output_not_lost (真子进程 sleep+print)+ test_argv_does_not_contain_setsid(防回潮)。19/19 PASS。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 11:02:17 +08:00

1 2

98 Commits