zcbot

Commit Graph

Author	SHA1	Message	Date
caoqianming	eb1027b040	fix(web): 图片缩放 load 即量基准尺寸 + 双击复位提示 + bump 0.12.12 - _captureBase:图片加载完即量贴合尺寸做基准,避免首次缩放时还没渲染量到 0px 把图片塌成 0;量不到则本次跳过不破坏。 - 双击复位徽标显式提示「已复位 · 100%」(停留 1.4s)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 09:53:00 +08:00
caoqianming	12171a4bdf	fix(web): 图片预览缩放改显式 px,修 CSS zoom 被 flex max 夹回放不大 + bump 0.12.11 CSS zoom 对带 max-width/height:100% 的 flex item 无效(放大后被百分比 max 重新约束回去,视觉不变)。改为:以 scale=1 的贴合显示尺寸为基准缓存,缩放时 max:none + 显式 width/height = base × scale 像素,真正撑大布局让 body 出滚动条;复位时清空还原自适应。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 09:42:37 +08:00
caoqianming	31f46baaf6	fix(web): 文件预览修滚动穿透 + 图片 Ctrl+滚轮缩放 + bump 0.12.10 - 滚动不穿透:主/小预览 .body 加 overscroll-behavior: contain,再挂一次性非 passive wheel 监听,容器不可滚或到边界时 preventDefault 断冒泡,背景对话列表不再被带滚。 - 图片缩放(仅图片):Ctrl+滚轮 ×1.1 步进(夹 0.1-8x),用 CSS zoom 而非 transform(zoom 改布局盒,放大后 body 才出滚动条能看溢出);右下角 xx% 比例徽标(挂 .card,滚动不跟走,1s 淡出);双击复位 100%;.body.center 改 safe center 防 flex 居中裁掉溢出顶/左。 - wheel 监听只 init 挂一次到复用 body,缩放目标走 _zoomState WeakMap,免每次预览重复 addEventListener 泄漏。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 09:31:12 +08:00
caoqianming	314a05e111	fix(sandbox): 容器装 fonts-noto-color-emoji 修 mermaid 图满图豆腐块 + bump 0.12.9 模型生成的 mermaid 节点标签常前缀 emoji 图标(🌐🔥🛡 等),容器只装了 CJK 字体缺 emoji 字体,chromium 渲染时每个 emoji 都成空心方框 □。加 fonts-noto-color-emoji(+~10MB)并 fc-cache 刷索引即可正常出图标。纯增量容器改动,需重建镜像 + 重启 per-user 容器生效。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 09:21:39 +08:00
caoqianming	977923b6cf	feat(web): 左栏任务筛选区默认折叠(偏好仍持久化)+ bump 0.12.8 进页面只见「筛选 ▸」一行,点开才展开;用户显式展开过(localStorage 存 "0")才默认展开,否则一律折叠。已选筛选条件折叠后仍生效。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 08:56:46 +08:00
caoqianming	211b008821	fix(sandbox): 容器渲 mermaid 开箱即用(mmdc wrapper) + system 按 backend 注入运行环境段 + bump 0.12.7 接 --shm-size(0.12.5)。修两层让容器渲 mermaid 不再反复栽: 执行层 ── mmdc wrapper: - Dockerfile 给 /usr/local/bin/mmdc 套 wrapper,没显式 -p 时自动注入 -p /sandbox/puppeteer-config.json(含 --no-sandbox/--disable-dev-shm-usage), 裸调 `mmdc -i x -o y` 一次成;render_diagrams.py 等走 which mmdc 的脚本透明受益。 - 删掉没人读的 MERMAID_PUPPETEER_CONFIG env(mmdc 只认 -p)。引导层 ── system prompt 按 backend 注入「运行环境」段: - general_v1.md 删写死的 "Windows+cmd" 平台段(线上是 docker=Ubuntu 容器+bash, 误报导致模型在 Linux 里打 cmd 构文)。 - agent_builder 注入 _CONTAINER_ENV_BLOCK(docker)/_HOST_ENV_BLOCK(host):写明 Linux/bash、渲图走本地 mmdc 别调境外在线服务(mermaid.ink 被墙,容器虽有外网但渲图不该依赖出站)、mmdc/chromium/中文字体已装。 - 撤回上一轮加到 imagegen 的渲图引导(环境事实收归 system)。顺带:RUN.md 修正把 sandbox 网络写成 --internal 无 outbound 的过时注释(实际 bridge+NAT 有外网,见 network.py)。部署:Dockerfile 改动需 rebuild 镜像;prompt 改动重启 web 生效。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-15 08:30:43 +08:00
caoqianming	32bf6ae917	fix(sandbox): docker run 加 --shm-size 修 mmdc 渲 mermaid 挂超时 + bump 0.12.5 容器 /dev/shm 默 docker 64MB,chromium(mmdc/puppeteer)起不来一直挂到 timeout。实测一个"生图测试"对话:模型裸调 mmdc,自造 puppeteer config 漏 --disable-dev-shm-usage, 连试 6 次全超时烧约 120k token。从根上给 docker run 加 --shm-size(默 512m, env ZCBOT_SANDBOX_SHM_SIZE / yaml sandbox.shm_size 可配),任何 chromium 路径都不再挂。 - core/sandbox/pool.py: --shm-size 旋钮(优先级同 memory/cpus) - config/agent.yaml / RUN.md: 新增 shm_size 配置 + env + 故障兜底一行 - deploy/sandbox/probe_mermaid.sh: 实测脚本(区分 chromium 缺包 vs 纯 shm 超时) - scripts/diag_dump_task.py: 按 email+任务名 dump 对话的诊断脚本 - 已 running 旧容器需重启 web + idle 回收后新起才生效;镜像无需 rebuild Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-14 10:40:45 +08:00
caoqianming	d30435198c	feat(web): 模型选择瘦身 — 对话模型常驻 + 生图/生视频收进 ⚙ 弹层 + bump 0.12.4 - meta 行原三个带标签下拉(模型/生图/生视频)占满整行 → 高频对话模型常驻可见可切, 低频生图/生视频收进一个「⚙ 媒体」fixed 弹层(点开才渲染 select) - 行为不变:媒体模型选中值仍只进 state.*,随下条消息 image_model/video_model 发; send 读 state 不读 DOM,迁移安全;两个 select 都没配时连 ⚙ 都不画 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 13:07:51 +08:00
caoqianming	18f702886f	feat(web): 左栏筛选区可折叠(默认展开,偏好持久化)+ bump 0.12.3 - 搜索/状态/目录/排序四控件归到两行 .task-filter-row,标题行加「筛选 ▾」toggle - 默认展开,折叠只藏 UI(已选条件仍生效),偏好存 localStorage(同 pane 折叠范式) - 折叠后左栏顶部 4 行→2 行,任务列表可视区更高 - 状态下拉并入筛选区(flex),搜索框 flex:2 更宽;目录/排序合一行用 title 提示 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 12:58:33 +08:00
caoqianming	ae9790601a	refactor(web): 中栏操作收进 ⋯ 菜单 + 消息阅读限宽 + 色彩收敛 + bump 0.12.2 - 中栏顶栏 5 个平铺按钮(导出/清空/完成/废弃/删除)→「完成」+「⋯」菜单, 菜单复用 taskMenuItems(过滤 complete),与任务行同一范式;破坏性操作不再平铺易误点。顺带让菜单「清空」按 run_status 也禁用(修运行中 409-after-confirm 小坑) - 消息限宽:.msg max-width 92% → min(92%,48rem),user 气泡 min(92%,36rem),宽屏可读性↑ - 色彩收敛:颜色=后果(完成/下载绿、废弃橙、删除红),导出/清空中性不着色;移除紫/蓝冗余 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 12:52:56 +08:00
caoqianming	1f57bbd201	fix(web): 导出按钮简写 + 任务菜单加清空 + 修移动端 task 滚动 + admin 自适应 + bump 0.12.1 - 顶栏「导出对话记录」→「导出对话」,与「清空对话」对齐(dev.html + chat.js 菜单 export 项) - 任务菜单(每行 ⋯)新增「清空对话」,复用 clearMessages;dropdown 加 .act-clear 紫色 - 修移动端 task 列表无法滚动:手机断点 #pane-left 误用 display:block 致 #task-scroll flex:1 失效被 overflow:hidden 截断;改 display:flex 恢复滚动 - admin 移动端自适应:header 紧凑化 + .card-head/.ctrl 允许换行,避免窄屏横向溢出 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 12:41:53 +08:00
caoqianming	c870b10368	feat(memory): 双层记忆升级为 agent 自管 + 前端只读记忆面板 + bump 0.12.0 写入路径从纯手工改为 agent 自管(prompt 契约,非后台蒸馏):memory_block 注入可写路径锚点 + 「记忆维护契约」,契约/锚点常驻(记忆为空也注,解新用户冷启动)。extended 索引从首行标题升为优先 frontmatter description(缺则退回首行,平滑兼容存量)。修旧 bug:extended 路径在 docker 下注的是宿主路径指不到, 改按 backend 给 host 绝对路径 / /workspace/.memory。前端记忆面板取舍 = GUI 当眼睛、模型当手:左栏「记忆」按钮开只读 modal 看全貌 (GET /v1/memory + GET /v1/memory/extended/{filename},零写/删 API,路径穿越校验收口在 core/memory.py)。"看全貌"是读不是 operation,走 LLM 又贵又只拿转述;"改"全走对话(agent 自管),单一写入口 + 自然语言 + 不会写坏 frontmatter。对照业界:Claude(同文件式)给全套 view+edit,ChatGPT/Gemini 黑箱只给看/删。单测覆盖:frontmatter 解析 / legacy 兜底 / 空记忆常驻契约 / host·docker 路径 / 只读视图 / 单篇读 / 文件名安全 / 越界拦截。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 12:20:08 +08:00
caoqianming	0259f0ce92	docs(compat): 进入公测期,开发心智翻新为保证对外兼容 + bump 0.11.1 - CLAUDE.md「开发阶段心智」从"开发期可随意 break、不写兼容层"改为: 对外契约(用户数据/DB schema/对外 API/CLI·env·文件布局)必须向后兼容, 仅纯内部实现仍以最优为准放手重构;拿不准 → 当对外契约处理 - 版本号段:公测保持 0.x,1.0 留给对外冻结行为 / 正式 GA - PROGRESS 加一条;bump 0.11.0 → 0.11.1 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-12 11:23:03 +08:00
caoqianming	f12df1bd82	feat(admin): 后台目录导航 + 按模型/各用户用量时间筛选排序 + 存储分页 + 导出 PDF + bump 0.11.0 - 左侧目录(sticky,点击平滑滚动 + scrollspy 高亮,窄屏转横向 chip);各区 scroll-margin-top 避开顶栏 - 按模型 / 各用户用量拆为独立端点,带 range(all/7d/30d)+ sort(cost/tokens); 各用户用量含零用量用户(时间条件放 JOIN ON,避免被 cutoff 挤掉) - 存储分页(/v1/admin/storage/users);各用户用量分页;overview 瘦身为固定指标(runtime/tasks/users/总用量+近7d),独立表自管 range/sort/page - 导出 PDF:客户端 window.print()(零依赖),填充隐藏报告 DOM + @media print 版式;列表取前 10 - 文档同步 DESIGN §7.3 / PROGRESS / RUN Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-12 10:44:47 +08:00
caoqianming	81da2f6f55	fix(context): 不压 assistant tool_call 参数,断 run_python 投毒空转旧 assistant tool_call.arguments(>800 字符)被压成 {"_compacted":...} marker 发给 LLM,模型在长 doc/ppt 任务里反复看到后仿写它当真实参数 → run_python 拿不到 code/script_path 报错空转(DB 实测最近 60 个 task 命中 83 次,其中 61 次是模型仿写 marker)。把原本只给 task_progress 的豁免升级成通用规则:删 _compact_assistant_tool_calls / _compact_tool_call_arguments,只压 tool 结果 + skill,assistant 参数一律原样保留。附诊断脚本 scripts/diag_run_python_empty.py / diag_run_python_trace.py;全量 120 tests OK。 bump 0.10.0 -> 0.10.1 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-12 10:41:54 +08:00
caoqianming	ef611b0666	feat(admin): 角色化管理后台 + 分页各用户用量 + bump 0.9.0 - users 加 role 列(user/admin,migration 0009);make_require_admin 按 DB role gate(不进 JWT,改完即时生效) - /v1/admin/overview 监控总览:runtime(并发/线程池/SSE/RSS)+ tasks + users + usage 总用量 + storage - /v1/admin/usage/users 分页各用户 token 用量(全表 LEFT JOIN 含零用量,cost desc,稳定排序) - /v1/me 返 role;登录/建用户响应带 role;main.py user role / user add --role;建用户弹框加角色下拉 - 独立页 web/static/admin.html + js/admin.js(阈值/热力色差、响应式、10s 轮询、独立翻页);dev SPA admin 才显"管理"入口 - 文档同步:DESIGN §7.3/§7.4、PROGRESS、RUN Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-12 10:02:20 +08:00
caoqianming	44be5753f7	fix(version): 版本号挪到右侧存储条最左,垂直居中 + bump 0.8.1 - dev.html: #app-version 从左栏 #rail-resources 移入 #storage-foot 最左, 带细分隔线,垂直居中(align-items:center);左栏底部腾给后续按钮 - core.__version__ 0.8.0 → 0.8.1(纯 UI 位置微调,patch) - PROGRESS 同步新位置描述 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 12:55:35 +08:00
caoqianming	dd797a91e2	feat(version): 版本号单一事实源(core.__version__)+ web 左栏底部展示 - core/__init__.py 新增 __version__ = "0.8.0",作唯一来源 - web/app.py: FastAPI version 与 /healthz 返回都引它(不再写死两份) - dev.html: 左栏「我的资源」技能按钮旁加 #app-version 小灰字(纯展示) - main.js: boot 时无条件 fetch /healthz 填版本号(auth 豁免,embed/未登录皆可) - 放左栏底部而非顶栏:embed 模式桌面端 header 被 CSS 隐藏,顶栏点不到 - CLAUDE.md「文档维护」加规矩:每次 commit/push bump __version__(patch/minor/major 分类) - RUN.md / PROGRESS.md 同步 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 12:00:30 +08:00
caoqianming	958678aa12	feat(skills): 用户私有 skill(.skills)+ 创作工具 + skill-creator + Web 查看页每用户可在私有 .skills/ 下造/改 skill,只对自己生效。 - SkillRegistry 改多来源(SkillSource 列表:内置 + 用户 .skills),后扫同名覆盖先扫 → user wins;user_overrides 记覆盖关系、discovery 显式标注; Skill 加 source;from_dir 区分"非 skill 目录(静默)"与"格式错(SkillLoadError)", 坏的用户 skill 收进 load_errors 注入 prompt,不崩整次扫描。容器路径改写下沉到 registry.container_dir(按 source 给 /sandbox/skills 或 /workspace/.skills), LoadSkillTool 去掉 container_skills_dir 参数。 - 新增 host-side 工具 save_skill / fork_skill(tools/skill_authoring.py): fs 的 base_dir 锚 cwd/容器 wd 够不到 user_root/.skills,故用 host-side typed tool(与 seedream/document_* 同范式)。save_skill 写时校验 frontmatter; fork_skill copytree 整目录(带脚本)+ 自动对齐 frontmatter name。 - 新增 skill-creator 引导 skill(重点教写好 description + fork 语义)。 - Web:左侧 rail 底部「技能」按钮 → modal 分平台/我的两组,点开看完整 SKILL.md,我的可删;后端加 GET /v1/skills/{name}(正文)+ DELETE /v1/skills/{name}(只删 user 源 + 防穿越);/v1/skills 带 source/overrides/ load_errors;新 web/static/js/skills.js。创建/改/fork 仍走对话。 - .skills 是 dotfile(文件面板隐藏,与 .memory 一致;validate_task_name 已禁 . 起头 working_dir,天然不撞)。 - 测试:test_user_skills.py(20 例)+ 改写 test_load_skill.py;全 121 过。 - 文档:DESIGN §3.5 / PROGRESS / RUN(布局+端点)/ SKILL_LIST 同步。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 09:46:39 +08:00
caoqianming	d9b48bdb96	refactor(prompt): 精简 system prompt,媒体段改按需注入,通用任务每轮瘦 ~40 行去 system prompt 冗余 + 让无关段不常驻: - 「宪法」文件命名约定 ~25→~6 行:只留格式定义+注入值+一行 current/重定调; 操作细节本就由 proposal/ppt skill 各自讲,两 skill 引用不动也不破 - run_python「先 write script 再 script_path」去重:模板+agent_builder 两处合一, scripts/ 子目录约定收进模板 - 媒体工具段(seedream/seedance 红线)抽成 _MEDIA_TOOLS_BLOCK,仅 ArkConfig.load() 非 None(有 ARK_API_KEY)时追加;ark_cfg 提前 load 一次复用给 tool 注册 - 路径 echo 全形式段 8→4 行实测 media_enabled ON/OFF 差 891 字节(=媒体段),命名约定段拼接正常; test_system_prompt_paths 仍过。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-11 08:10:27 +08:00
caoqianming	8b6e66b006	feat(context): 压缩加"上下文压力门槛",短任务不压缩以护缓存+保信息 prepare_messages_with_stats 加 compact_threshold_chars:总 chars 未超阈值则完全跳过压缩、原样发 —— 短任务 prompt 前缀逐轮字节一致、DeepSeek 前缀缓存全程命中,且不白丢旧 tool 细节(context 预算还很空时无谓压缩=纯损失)。超阈值才走原压缩逻辑。 - loop 按 caps.reliable_context × 0.5 × 2.5(char/token 粗折算)算阈值 (flash ≈ 33 万 chars),_COMPACT_CONTEXT_RATIO/_CHARS_PER_TOKEN 可调 - compaction_skipped 进 stats / llm_start 事件可观测 - 默认 compact_threshold_chars=0 = 永远压缩(向后兼容) 背景:实测 task b27466a0 DeepSeek 缓存命中已 92-94%、滑动边界损失有限 (压缩函数确定性、旧消息压缩态稳定),故只补门槛、暂不改边界为阶梯式。新增 2 测试(below/above 门槛),全量 105 过。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-10 13:42:18 +08:00
caoqianming	0df9e5fe3f	feat(loop): 停机判据从"步数"解耦为"是否在推进" max_iterations 降级为纯安全 backstop(flash 50→120 / pro 100→150), 不再当"轮预算"砍正经长任务;真正的空转防护改用进展信号: - _RepeatGuard.record 多返 productive(净产出=非[Error]且非一字不差重复) - _execute_tool_call 三个返回点都带 productive - run loop 全局 _stall:整步全无净产出+1、任一净产出清零, 连续 _STALL_LIMIT=8 步主动停([stopped: no progress]), 比撞 backstop 早得多掐死循环,配逐指纹 HARD=4 双保险 - 撞 backstop / 空转停都 emit"回复继续可续跑"提示,不再静默停诊断依据:task b27466a0"中途断了"实为撞 max_iterations=50 后干净停、用户离开 25min 回来打"继续"续完(非崩溃);"步骤太长"=DeepSeek API 延迟 126-185s 而非工具(全<13s)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-10 13:22:02 +08:00
caoqianming	8150bf0b83	feat(tools+loop): 批量抓取 + 重复调用守卫 —— 治高轮数烧 token DB 实测高轮数 task 的浪费来自三股根因(空 {} 风暴 / 报错重试 / 检索不收敛)叠加,且 loop 对重复调用零防护。本轮两味药: 药2 检索/抓取类 host 工具批量化(从工具形态减往返): - web_fetch: url -> urls(1-10 并发,总预算 16000 按条分摊,单条失败不连坐) - document_search: query -> queries(1-8 并发,批内去重,批量自动缩量防爆 context) - document_download: file_name+kb_name -> items(1-10 并发,单条失败标 [Error] 不毁整批) 按「开发期不写兼容层」直接换签名、不留单数别名;skills/documents/SKILL.md 同步。药1 loop 病理性重复守卫(core/loop.py::_RepeatGuard): - 按 (工具名, 精确参数) 指纹跟踪「无产出重复」 - 只惩罚无产出(结果为 [Error] 或与之前一字不差);结果每次不同=有产出、清零, 绝不误伤正常迭代(改脚本重跑 / 修 bug 重跑构建) - SOFT=2 注入软提示;HARD=4 拦截不执行,逼模型换路 - 顺带堵 _malformed_tool_calls 漏空 {} 的洞(空 {} 每次返同句缺参错 -> 走 dup 被拦) 测试:tests/test_loop_repeat_guard.py(7 例)+ test_secret_host_tools.py 改新形态并加批量/去重/失败隔离 3 例;相邻 24 测试全过。诊断脚本留 scripts/diag_*.py 供复跑。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-08 16:47:56 +08:00
caoqianming	824f746571	fix(progress): 停压 task_progress 参数修进度还原 + 进度区移到对话区顶部问题1(进度不对): 上下文压缩把旧 task_progress tool_call 参数换成 {"_compacted":true,"step_id":"sX"} 这种像合法调用的标记, 既毒化模型让它照抄出残废 update_step(丢 step.status)入库, 又让前端 applyProgressAction 读不到 args.step → 步骤永停 pending。修复: task_progress 参数一律不压缩。问题2(没像 codex 在顶部): 删掉每条消息卡内联进度块, 进度统一只在对话区顶部单一 dock 实时显示(钉顶不滚); 全部完成时折叠成一行摘要。prompt/tool 描述改为跑完标 completed 而非 clear, 留住全绿收尾。校验: unittest test_context_compaction/test_task_progress_tool 12 过; node --test frontend_task_progress 2 过。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-08 09:52:44 +08:00
caoqianming	8616ba2b56	Add task progress tool	2026-06-08 08:44:16 +08:00
caoqianming	8a7e0cd233	fix(loop): 工具调用 arguments 损坏时丢弃重试 + 非流式兜底,断投毒级联 deepseek-v4-flash 大参数工具调用(大 write/run_python,≈7K+ 字符)偶发把内容碎片错位粘进 arguments 开头致 JSON 解析失败,或退化成空 {} 缺参。隔离批量验证 (干净上下文)非流式 8/8、流式 8/8 全干净 → 上游间歇抖动,概率低;真正放大成灾的是 loop 把损坏的 assistant 消息入库 + 每轮重发,诱导模型继续学坏(投毒级联)。 - core/loop.py:_stream_llm 拉一轮后用 _malformed_tool_calls 校验 tool_call arguments 能否 json.loads,不能则丢弃整轮(不 append/不记账)重 roll(≤3 次), 最后一次降级 _nonstream_once(provider 服务端拼,绕开流式错位)。流式收集逻辑抽成 _collect_stream_once,正常路径不变。 - core/executor_host.py / core/sandbox/tool_runner.py:缺必填参数早返「缺少必填参数 [...];请带齐 [...] 重新调用」,替掉暴露内部签名的 TypeError missing N required positional arguments(host + docker 两路覆盖)。 - 文档:PROGRESS.md 加 2026-06-06 条;RUN.md 故障兜底加一行。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-06 20:51:45 +08:00
caoqianming	69fc2599e3	feat(run_python): 过程脚本约定落 task_dir/scripts/ 模型显式写文件再 script_path 跑的过程脚本统一进 <task_dir>/scripts/ (可见/持久/可重跑),交付产物仍落 task_dir 根。inline code 匿名片段维持临时用后即焚(host 系统 temp、docker .zcbot_tmp dotfile,均不动)。改 agent_builder 系统提示工作目录段 + run_python tool description/参数说明。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-05 15:52:05 +08:00
caoqianming	af2ad3cef1	feat(usage): 记账给前缀缓存命中折价 + 前端体现缓存命中/真实成本排查"rust→PPT"task(flash,34 轮)发现累计 tokens_in 69.9 万里 88.6% 是缓存命中,但 _fallback_chat_cost_cny 把命中段也按 input 全价算,记账虚高 2-3x。 - capabilities: 加 cache_hit_cny_per_mtoken(deepseek flash 0.1 / pro 0.2; 0=不区分按全价兜底,绝不少记) - usage: 成本公式拆三段「命中×缓存价 + (input−命中)×input价 + output×output价」; loop 把 cache_hit_tokens + 缓存单价透传进 record_chat_usage - web: 不加 DB 列。app.py 加 _usage_aggregates(单查询 GROUP BY usage_events, 复用列表 msg_counts 批量范式,无 N+1)on-the-fly 算每 task 真实成本 + 缓存命中, _task_dict 带出;dev.html 列表行显 ¥、顶栏 formatTaskUsage 显「tok·缓存命中%·¥」 - scripts: backfill_chat_cost_cache_discount.py 按 units 已存 token 重算历史 cost_cny(只改成本列,默认 dry-run,--apply 落库) 折价只对新 chat 事件即时生效;历史走 backfill 脚本(部署后跑)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-05 08:26:09 +08:00
caoqianming	5f8b157733	perf(context): 压缩旧 assistant tool_call arguments + keep_recent 20→12 旧 assistant `tool_calls[].function.arguments` 超 ~800 chars 时压成合法 JSON 标记(保留 path/script_path/name/original_chars),避免 `write(content=...)` 源码参数反复进 prompt;keep_recent 20→12 收窄原文窗口。role/tool_call_id/ name 等协议字段不变,tool_call 协议完整。stats 增 compacted_tool_call_arguments。 DESIGN §8.2 退出标准补一条:列表 N 条/N tok 是历史累计、不随发送前压缩下降。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-05 08:25:56 +08:00
caoqianming	1c30a9e54e	Reduce chat context token usage	2026-06-04 16:41:14 +08:00
caoqianming	af97dd7c62	feat(web): 文件面板底部展示用户已用存储 + 配额后端已有 user_disk_usage 表(后台 15min 扫描落库)但无对外查询口, 加 GET /v1/user/storage(require_user)返 {bytes_used, file_count, limit_bytes, scanned_at};limit_bytes 由 parse_bytes(quotas. disk_bytes_per_user) 得,≤0/None=不限。disk_quota.get_user_usage 扩为返 (bytes,count,scanned_at) 三元组(复用而非新开函数,顺手改唯一调用方 check_disk_quota 解包)。前端 dev.html 右侧文件面板底部钉一条进度条+文字:#pane-right 改 flex 列让 file-list 独占滚动、存储条钉底;loadStorage() 在 enterApp 拉一次; 不限额时只显已用、隐进度条;超额变红;hover 显文件数+统计时间。样式用 class 选择器压低特异性,让折叠/手机隐藏规则能盖住它。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-04 15:00:36 +08:00
caoqianming	42755e246e	fix(sandbox): shell 也注入 PYTHONPATH + HOME=/tmp(修只读 rootfs 两副作用) 容器 --read-only rootfs 下两个副作用: - PYTHONPATH 原先只 run_python 注入,shell `python -c "from skills..."` 撞 ModuleNotFoundError - /home/zcbot 不可写,matplotlib/fontconfig 往 ~/.config / ~/.cache 写缓存刷 "Read-only file system" / "No writable cache" 噪音抽 _CONTAINER_ENV = {PYTHONPATH, HOME=/tmp},shell/run_python/fs 三路共用 (-e 确定性覆盖)。HOME=/tmp 一刀让缓存落 tmpfs(matplotlib→/tmp/.config、 fontconfig→/tmp/.cache),免逐个 MPLCONFIGDIR/XDG_CACHE_HOME。纯代码改, 重启 web 生效,免重建镜像。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-04 14:12:53 +08:00
caoqianming	7b09c77f76	fix(sandbox): docker 下 system prompt / SKILL 文档统一用容器路径 docker backend 下 shell/run_python/fs 工具全在容器里跑(<workspace>/users/<uid> bind 到 /workspace),但喂给 LLM 的路径多处仍是宿主绝对路径(容器内不存在), agent 据此 find 全空、瞎转到 pwd 才发现真身在 /workspace/<wd>。 - core/agent_builder.py::_build_system_prompt:docker 下 task_dir + 「宪法」 glob 范例换成容器路径 /workspace/<wd>,去掉容器里无意义的 cwd 行(cwd 恒等 task_dir);host 不变。修法同 LoadSkillTool 的 container_skills_dir 改写。 - skills 文档同类宿主路径残留清扫:patent 跨 skill 调 proposal 脚本由 <repo_root>/...(硬编码 D:/projects/zcbot)改兄弟相对 <skill_dir>/../proposal/...; research fetch_pdf 范例硬编码 D:/... 改 <task_dir> 占位;patent/proposal/ppt 的 <task_dir> 举例的废弃旧布局 workspace/tasks/<task_id> 改 host/docker 双形态说明。 - ppt 图标缓存写进只读挂载修复(方案 A):种子图标库 <skill_dir>/assets/icons/ 降为只读(glob 读),fetch_icon.py 新拉图标一律 -o <task_dir>/assets/icons/, 读路径改种子库 + 本 task 两处都 glob。docker 下 skills 是 :ro bind,旧写法必败; host 下还顺带污染仓库工作树。脚本已 out.parent.mkdir,无需改。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 16:33:59 +08:00
caoqianming	9cd33cf4d6	revert(workspace): 撤 ZCBOT_WORKSPACE_DIR env 覆盖(架构 bug),数据盘改用 bind mount 2026-06-02 给 resolve_workspace 加的 env 覆盖与路径存储层冲突:core/paths.py 把 DB working_dir 锚定 ROOT(代码仓库目录)存相对串,to_db_path 对 ROOT 外路径直接 relative_to raise。env 一旦指向 ROOT 外的 /data/...,三家分叉: - 文件面板 /v1/files 走 resolve_workspace(吃到 env)看数据盘 - agent resume 走 from_db_path(锚 ROOT)看 ROOT/workspace - 新建 task to_db_path 直接 500 现场症状:文件面板"目录尚未创建",但 agent 文件其实写在老 ROOT/workspace。改法:resolve_workspace 回退成显式 arg > cfg workspace_dir > 默 workspace (均 ROOT/<值>)。import os 保留(别处仍用)。要把重写入区落独立数据盘改用 bind mount 把 /data/zcbot/workspace 接到 ROOT/workspace —— .resolve() 不展开 bind,内核路径保持 ROOT 内,relative_to(ROOT) 照常过,DB 不用改,dev 不受影响。 RUN.md:删 .env 的 ZCBOT_WORKSPACE_DIR 段;「workspace 落独立数据盘」段改 bind mount(+ RequiresMountsFor 开机顺序硬化);故障表替换旧 env 行 + 加 "目录尚未创建"诊断行。PROGRESS.md:2026-06-03 加回退记录。DESIGN 不动。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 10:24:14 +08:00
caoqianming	382a85e88e	feat(workspace): resolve_workspace 加 ZCBOT_WORKSPACE_DIR env 覆盖(per-host 落盘) prod 要把重写入的 workspace/users/ 落到独立数据盘(xfs prjquota),但 config/agent.yaml 的 workspace_dir 是 dev/prod 共用提交的,改绝对路径会带歪 dev。 resolve_workspace 优先级改为 env ZCBOT_WORKSPACE_DIR > yaml workspace_dir > 默 "workspace" (对齐 sandbox.* 的 yaml+env 模式);env/cfg 值都按 ROOT/<值> 解析,绝对路径直接生效。 dev 不设 env 维持 ROOT/workspace,prod systemd 设数据盘绝对路径,两边不抢同一份 yaml。 PG 暂不迁(元数据库小,留默认 /var/lib/postgresql 少坑)。 RUN.md:env 段加 ZCBOT_WORKSPACE_DIR + 新增「workspace 落独立数据盘」段 (mkfs.xfs + fstab prjquota + rsync 迁移 + systemd env)+ 故障表一行。 PROGRESS.md:2026-06-02 加一条。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-02 14:42:00 +08:00
caoqianming	68ce996ad2	feat(tools): documents/pymatgen secret-bearing 能力改 host-side tools，key 不进 sandbox 新增 tools/documents.py（document_list_kb/search/download）和 tools/materials_project.py （mp_search_summary/get_structure/get_entries），key 只在宿主读取，sandbox/run_python 拿不到。 agent_builder 仅在对应 env 存在时注册。删 skills/pymatgen/materials.py::mp_rester() 旧入口， smoke 改走 host tool。同步 DESIGN §6.7 secret-bearing 规则 + RUN/SKILL_LIST/两个 SKILL.md。实测：MP step D 真连 api.materialsproject.org 返 403（工具行为正确，干净透传 [Error]），疑似 .env 里 legacy key 在新版 mp-api 失效，待换 next-gen key 再验。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-01 09:35:10 +08:00
caoqianming	aab1da3296	fix(executor_docker): 删 setsid 修 docker exec 延迟 stdout 丢失实证:`docker exec ... setsid python -c "sleep(2); print"` 等满 2s 输出空, 同条件去 setsid 输出 hello。setsid 调 setsid() syscall 后 docker exec/runc 的 stdio attach 出问题,延迟输出被截。上一条 _run_subprocess 重写修了独立的 poll-loop bug 但不是用户当下症状元凶。setsid 历史是给 §7.5 Step 3b PGID kill 协议铺路,该协议未实现的当下是空头载荷 + 副作用。改 _exec_shell:141 / _exec_python:177 各删 1 个 "setsid"。回归测试加 test_run_subprocess_delayed_output_not_lost (真子进程 sleep+print)+ test_argv_does_not_contain_setsid(防回潮)。19/19 PASS。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 11:02:17 +08:00
caoqianming	91cc14278c	fix(executor_docker): 重写 _run_subprocess 修 docker exec stdout 多 chunk 静默丢失旧实现在 poll loop 里反复 communicate(timeout=0.5) 违反 subprocess API 假设, 配合 setsid bash -c block-buffered stdout 在多 chunk 输出时 chunk 静默丢失, LLM 调 run_python / shell 拿到空 [exit 0] 8 字符,误判 paper_server 不可用。改单次 communicate(timeout=full) + 侧线程 daemon poll cancel + 入口 inline 快路径。回归测试用真子进程 bash sleep 多次 echo 锁死,17/17 PASS。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:26:59 +08:00
caoqianming	4b7d7e6f77	fix(skill_tool): docker backend 下返回容器路径而非 host 绝对路径实测部署 dogfood analyze skill 时,LLM load_skill 拿到 host 绝对路径 `/home/lighthouse/zcbot/skills/analyze`,照 SKILL.md 拼 references 路径调 read → 容器内 namespace 没这条路径(容器只有 /sandbox/skills:ro 这 mount),抓瞎。修法:LoadSkillTool 加 container_skills_dir 构造参数;agent_builder 在装它时判 ZCBOT_SANDBOX_BACKEND==docker → 传 "/sandbox/skills",其它 → 保持原 host 绝对路径(开发期 host backend 不破)。结构性收益:proposal/ppt/research/coding/pymatgen/stats_ml/plot_pub 全部 skill references 在 docker backend 下自动 work,不用一个个改 SKILL.md 教用容器路径。 tests/test_load_skill.py 4 case 锁:host 走 host 路径 / docker 走 /sandbox / 末尾斜杠拼接不双斜杠 / 未知 skill 走原路径。docker executor 15/15 回归 PASS。部署后:git pull + 重启 agent 进程让新代码生效(SkillRegistry 每请求重建但 LoadSkillTool 实例化在 build_agent 里,需要新进程)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 13:37:19 +08:00
caoqianming	85415470d2	sandbox+infra: Python 3.10→3.12(host+Dockerfile)+ docker PYTHONPATH 加 /sandbox 为通过 3 个科学 skill 的 smoke 解决两件基础设施问题。 1. emmet-core 0.86.0rc1 用了 typing.NotRequired(3.11+),host .venv 是 3.10 → mp_rester ImportError。选 3.12(当下 ML 生态默认稳定版,比 3.11 多一年优化,比 3.13 wheel 覆盖更全 Windows 不踩坑)。Dockerfile python:3.11 → 3.12 同步升,部署机 rebuild image 时生效。 2. executor_docker.py:172 PYTHONPATH 由 /workspace 改 /sandbox:/workspace, 修历史 bug —— skills/ bind mount 到容器 /sandbox/skills:ro,SKILL.md 教 LLM `from skills.xxx import yyy`,docker backend 之前根本 import 不到 (research/paper 同款受影响,只是 dogfood 一直跑 host backend 没暴露)。 test_executor_docker.py:243 regression 测试改为 assertIn 含 /sandbox, 15/15 PASS。 smoke 验证:pymatgen XRD / sklearn / statsmodels / plot_pub 全通, mp_rester 联网遇 MP 服务侧 IP/ASN 403(LBNL 对国内 IP 临时封,非代码问题)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 11:35:02 +08:00
caoqianming	4ff5b0c171	sandbox: host 侧 resolv.conf bind mount 覆盖容器 ro docker 默 /etc/resolv.conf 是 ro mount(尤其 --read-only rootfs 下), init.sh `cat > /etc/resolv.conf` 写不进。改主路径: - SandboxPool._ensure_resolv_conf_file:host 侧 <workspace>/.sandbox/resolv.conf 写公网 DNS(nameserver 8.8.8.8 / 114.114.114.114) - _docker_run 加 -v <host>:/etc/resolv.conf:ro,user 指定 mount 优先级 > daemon 默注入,直接覆盖 embedded DNS 127.0.0.11 - ZCBOT_DNS env 仍传给 init.sh 作 fallback(init.sh 已 robust 失败不退) RUN.md 故障兜底两行(Read-only 报错根因 + 解法)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-27 12:21:05 +08:00
caoqianming	ae15a36e58	init.sh: 覆写 /etc/resolv.conf 绕过 docker embedded DNS 发现 user-defined bridge network 上 docker run --dns 是改 daemon 给 embedded DNS(127.0.0.11)的上游 forward 目标,容器 /etc/resolv.conf 不变(仍是 nameserver 127.0.0.11)。腾讯云轻量等场景 daemon 探测 systemd-resolved 上游失败 → embedded DNS 自身 forward 也跪 → --dns 8.8.8.8 救不了。正确解:init.sh 启动时直接覆写 /etc/resolv.conf,完全绕过 embedded DNS。 - pool.py 把 --dns flag 换成 -e ZCBOT_DNS=8.8.8.8,114.114.114.114 - init.sh apply_resolv_conf 函数循环 echo "nameserver $ip" > /etc/resolv.conf - /etc/resolv.conf 是 docker bind mount file(非 rootfs),--read-only 不挡, root 跑 init.sh 可写;--restart=no 容器生命周期内不被 docker 覆盖 iptables 127.0.0.11 ACCEPT 例外保留不动(无副作用,以备未来需要 service discovery 等场景)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-27 12:03:24 +08:00
caoqianming	3a3f8d86cc	sandbox: yaml sandbox.dns 显式 --dns 注入(绕开 daemon 上游探测) 腾讯云轻量等场景 docker daemon 探测 host systemd-resolved 上游 DNS 不稳, 即使 init.sh ACCEPT 127.0.0.11:53 例外,embedded DNS 自己 forward 不出去仍跪。显式 docker run --dns 8.8.8.8 --dns 114.114.114.114 直接写容器 /etc/resolv.conf 绕开上游探测。 - agent.yaml 加 sandbox.dns 列表,默 [8.8.8.8, 114.114.114.114] - SandboxPool 加 dns 字段(env: ZCBOT_SANDBOX_DNS 逗号分隔 override), _docker_run 每个 ip 加 --dns flag - RUN.md 故障兜底 DNS 失败那行补充第二层根因 + 解法 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-27 11:28:53 +08:00
caoqianming	eaf7f3ea1e	Stage C 收尾包:资源 yaml + 磁盘配额 + 网络放开 + 容器内源持久化 dogfood + 信任同事白名单阶段 Step 4 完整 egress proxy 暂不做(沉淀为升级触发信号:任一陌生用户注册 / 模型异常 outbound / 信任白名单出现非密切相识者 → 必上)。本批 3 件: (A) 容器资源 yaml 化(可调不重 build): - agent.yaml 加 sandbox 段(memory/cpus/pids_limit) - SandboxPool ctor 加三字段,优先级 env > yaml > 默(2g/1.0/256) - setup_pool/init_pool 透传 sandbox_cfg - sandbox check 输出加 [info] 4 行给运维一眼对账 (B) 应用层磁盘配额(§7.5 #4 软配额): - migration 0008 user_disk_usage 单行 per user - core/storage/disk_quota.py:parse_bytes("5gb"/int)+ scan_user_dir (os.scandir 跳顶层 .zcbot_tmp / .memory)+ upsert ON CONFLICT + check_disk_quota + scan_all_users 串行 - lifespan _disk_scanner 后台 task(启动跑一次 + 默 15min 周期) - DockerExecutor write/edit 起手 gate 超额 [Error] 不调容器 - /v1/files/upload 同款 gate 超额 HTTP 413 - yaml `quotas.disk_bytes_per_user: 5gb` + `disk_scan_interval_seconds: 900` - race 接受:扫描间隙写入轻微突破(image/video 配额同款 race-tolerant); 外部用户开放前 OS 层 xfs prjquota 兜底 - 11 测试 covered parse_bytes / scan / 跳 dotfile (C) 网络放开 + 容器内源持久化: - network.py 去 --internal flag,容器走 docker bridge default 有 NAT outbound - 已存在 internal network 不自动 rm 仅 warn,RUN.md 给迁移命令(避免破现有容器) - iptables 红线段不动(169.254/127/10/172.16/192.168/100.64/PG_IP DROP), 挡 cloud metadata + 内网扫描 + loopback,基线不依赖 proxy - Dockerfile 加 /etc/pip.conf(global index-url + timeout 60) + /etc/npmrc (global registry),让运行时模型 `pip install foo` / `npm install bar` 也走 mirror(此前 --build-arg 只 build 时生效) unittest discover 46/46 PASS(原 35 + 新 11)。 DESIGN 不动(延后决策仍在 §7.7 Stage C 阶段语义内,触发信号沉淀进 PROGRESS / RUN);RUN.md 加 env 列表 + 网络迁移 + 配额 + 故障兜底 3 行。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-27 08:35:53 +08:00
caoqianming	23ff996d38	Stage C Step 3d: fs 工具进容器 + DESIGN §7.5 #6 重写(物理边界替代代码护栏) Ubuntu dogfood 暴露 host 工具漏底:base_dir=Path.cwd() 无 user_root 校验, 模型 glob "*" 列出 host /home/lighthouse/zcbot/.git/.venv/... zcbot 源码自身。 DESIGN §7.5 #6 原写"host 工具走 paths.py::resolve_user_path 校验"是假命题 (代码里没那函数),绝对路径完全不挡。修法:fs 工具(read/write/edit/glob/grep)也走 docker exec,物理边界替代代码护栏(Phase B path validator 那条不做 ── 脆弱)。 - core/sandbox/tool_runner.py 新增:容器内 helper,stdin 接 JSON args, 调 tools/fs.py 的 Tool 子类;base_dir=cwd,user_root=/workspace - DockerExecutor 加 FS_TOOLS 信任域 + _exec_fs_tool:docker exec -i ... python /sandbox/tool_runner.py <name>,stdin 喂 JSON args(CJK / 引号透明传不被 shell metachar 切) - _run_subprocess 加 stdin 参数 + is_fs_tool 分支返 stdout 直透(原 Tool 返回串语义保持),exit≠0 stderr 当 ToolResult content - SandboxPool 加 repo_root 字段 + <repo>/skills:/sandbox/skills:ro mount 让容器内 read SKILL references 能解析 - Dockerfile COPY tools/ /sandbox/tools/ + tool_runner.py(build-time COPY 而非 mount ── 容器内代码不应跟随 host repo 改动) - web/app.py 透传 ROOT 给 init_pool - 留 host 的工具:load_skill(SkillRegistry 内存查找)/ web_search / web_fetch / seedream / seedance(持 Bocha/ARK key 不入容器) - DESIGN §7.5 #6 重写:"几乎所有工具进容器,host 只留持 key + 跨 user 的", 原假命题溯源标注 2026-05-26 修正代价:每 fs tool call +~200ms docker exec overhead,对话级 N≤15 总 1-3s, LLM 推理 5-30s 下噪声。升级触发(§7.9 升级表)docker exec → unix socket RPC 仍按原信号(overhead/total > 30% 持续 / 长驻服务工作流)。测试:test_executor_docker 加 4 fs 路径测试(argv 形态 / CJK stdin JSON / exit≠0 stderr 透传 / timeout);改原 read 直通测试 → load_skill 直通 (read 现在进容器)。unittest discover 35/35 PASS。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-26 21:56:41 +08:00
caoqianming	d93cc1a949	Stage C Step 3 hotfix: exec_user 跟随 build_arg + 镜像装 mermaid-cli Ubuntu dogfood 暴露两个真问题: (1) uid 错配:DockerExecutor 写死 --user 1000:1000,但镜像 build 时 --build-arg HOST_UID=$(id -u) 跟随 host 实际 uid(腾讯云轻量 lighthouse uid=1001),docker exec 进容器 uid=1000 → bind mount owner 1001 错配 → 写 /workspace/<wd>/ 全 EACCES,文件落 /tmp。改 DEFAULT_EXEC_USER = "zcbot"(username,docker 自动查容器 /etc/passwd 拿 uid),无论 HOST_UID build 成 1000/1001/其他都跟 bind mount owner 对齐。 (2) proposal/patent skill 渲 mermaid 缺 Node:render_diagrams.py 调 shutil.which("mmdc") 容器没装 → 退 mermaid.ink → sandbox --internal 默 deny outbound API 也不通 → ASCII fallback 出 docx 没图。 Dockerfile 加 chromium + nodejs + npm + @mermaid-js/mermaid-cli, +~400MB 接受成本(ASCII 不能用)。容器 chromium 缺 setuid sandbox + /dev/shm 不够大会跪,镜像落 /sandbox/puppeteer-config.json (--no-sandbox --disable-setuid-sandbox --disable-dev-shm-usage) + ENV MERMAID_PUPPETEER_CONFIG;render_via_mmdc 改读 env 拼 -p 注入, host 上跑 env 没设行为零变化。 PUPPETEER_SKIP_DOWNLOAD + PUPPETEER_EXECUTABLE_PATH 让 puppeteer 用容器内 chromium 不下载自带 Chrome(省 ~300MB)。 NPM_REGISTRY build-arg 同 pip 同款(腾讯云内网 / 阿里 npmmirror)。 RUN.md 加 NPM_REGISTRY 段 + 故障兜底 3 行(EACCES uid 错配 / mmdc 报 launch chromium / npm 慢)。DESIGN 不动(纯 bug fix + skill 依赖)。 unittest discover 31/31 PASS。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-26 21:47:33 +08:00
caoqianming	1a950dedb5	Stage C Step 5: main.py sandbox check + lifespan fs quota WARN - main.py sandbox check 子命令:5 项独立探测 + 汇总 exit code ① docker daemon 可达 ② zcbot-sandbox:latest 镜像存在 ③ zcbot-sandbox-net network 存在(warn 不 err) ④ 镜像 zcbot uid 与 host uid 对齐 ⑤ workspace/users 所在 fs 类型可 quota - core/sandbox/check.py:detect_fs_quota(path) -> (level, msg) 抽出来给 lifespan 与 CLI 共用;识别 xfs+prjquota/ext4+project/zfs/btrfs/tmpfs/其他 - web/app.py lifespan docker backend 启用时调 detect_fs_quota 打 WARN 到 stdout(不阻塞启动,应用层周期扫描仍生效) - err vs warn 分界:err = docker backend fail-fast 根因(daemon/镜像/uid), warn = 不阻塞启动但外部开放前要清(network 缺/fs 不可 quota) - run_sandbox_check 用 module-level getattr 而非固化 CHECKS 元组,让 unittest patch core.sandbox.check.check_xxx 生效 - tests/test_sandbox_check.py 19 测试覆盖各分支 + exit code 汇总; unittest discover 31/31 PASS - RUN.md 加"部署前置对账"小节 + "配额硬化"重写(fs 状态→处理映射表 + xfs 升级 4 步) + 故障兜底 3 行;DESIGN 不动 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-26 16:41:16 +08:00
caoqianming	dfac0acfa6	Stage C Step 3: DockerExecutor 集成 AgentLoop + web lifespan reaper - core/executor_docker.py 新增 DockerExecutor:组合 HostExecutor+SandboxPool, shell/run_python 走 docker exec(setsid + --user 1000:1000 + --workdir), 其他工具直通 host(§7.5 #6 信任域二分) - run_python tmp .py 落 <user_root>/.zcbot_tmp/<task_id>/(dotfile,/v1/files 天然过滤),容器内对应 /workspace/.zcbot_tmp/...,跑完 unlink - ZCBOT_SANDBOX_BACKEND=host\|docker env 切 backend,默 host(Windows dogfood 零变化);docker 路径 pool 未 init → fail-fast 不静默退化 - web/app.py lifespan:docker backend 启动时 init_pool + shutdown_all 清孤儿 + 60s 后台 reaper(run_in_executor 调 sync reap_idle);关闭时 cancel + 兜底清 - pool.py 顺手清 Step 2 债:asyncio.Lock → threading.Lock,ensure 改同步 (主使用方是 BG 线程 tool call,ephemeral loop 会让 asyncio.Lock 跨锁失效) - Cancel limitation 接受:Popen.kill() 仅杀 docker CLI 客户端,容器内进程靠 idle 5min reaper 兜底;升级到 PGID 协议(§7.5 #3)等用户反馈触发 - tests/test_executor_docker.py 11 测试覆盖关键路径(host 直通/argv 形态/ tmp 清理/timeout/cancel/未知工具/enable_run_python=False) - DESIGN.md 不动(纯按 §7.5 #5 #6 既有协议实施) - RUN.md 加 ZCBOT_SANDBOX_BACKEND env 段 + 切 docker 的前置条件 + 集成验证路径 - unittest discover 12/12 PASS Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-26 16:13:16 +08:00
caoqianming	160e801ab0	Stage C Step 2: Docker per-user 容器池 + iptables blocklist 基底 - deploy/sandbox/Dockerfile: python:3.11-slim + tini + iptables + non-root uid via HOST_UID build-arg + 全套 requirements - deploy/sandbox/init.sh: 6 段红线 IPv4 + ::1 + ZCBOT_PG_IPS 环境注入,任一规则失败 fail-fast - core/sandbox/network.py: ensure_network() 创 --internal zcbot-sandbox-net - core/sandbox/pool.py: SandboxPool 容器命名 zcbot-sandbox-<user_id>,per-user asyncio.Lock, in-memory _last_active dict(Docker 23+ 移除 docker update --label-add),hardening flags 全套(read-only / tmpfs / cap-drop ALL + NET_ADMIN / no-new-privileges / pids/mem/cpu limit / bind mount user_root → /workspace) - core/sandbox/__init__.py: 公开 SandboxPool / container_name / setup_pool / NETWORK_NAME Step 2 范围明确不含 AgentLoop 集成 / shell-run_python 切容器 / egress proxy / reaper task —— pool 孤立 commit,Step 3 接入。本地 Windows 无 docker 走不动,Ubuntu 上 5 条 smoke 命令 (build / iptables 段 / non-root uid / read-only / 销毁)写进 RUN.md "Sandbox(Stage C,Ubuntu)" 段。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-26 10:44:34 +08:00
caoqianming	48f99cf66d	Stage C Step 1: Executor 接口骨架 + HostExecutor in-process backend - core/executor.py: Executor ABC + ExecCtx(user_id/task_id/working_dir/cancel_check) + ToolResult - core/executor_host.py: HostExecutor 包原 tools dict,统一三种错误为 ToolResult - core/loop.py: AgentLoop 接 executor 而非 tools,_execute_tool_call 收成单条 call_tool 调用 - core/agent_builder.py: tools 装完后 HostExecutor(tools) 包一层,working_dir 透传 AgentLoop 接口形状与 DESIGN §7.5 #5 sketch (`call_tool(name, args, ctx)`) 完全一致, backend 无关 —— Step 3 docker backend 接入时 AgentLoop 零改动,只换装配层。行为零变化:smoke 4 分支(unknown/bad args/happy/schemas)全过,unittest 1/1 PASS。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-26 10:07:55 +08:00
caoqianming	fe95df0b9d	Add web_search and web_fetch tools via Bocha AI search API Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>	2026-05-25 11:37:33 +08:00
caoqianming	758486e2cd	feat(quotas): 媒体生成每账号每日上限 (默 20 图 / 5 视频, yaml 可配) config/agent.yaml 加 quotas 段;core/storage/usage.py 加 check_daily_quota (COUNT usage_events WHERE user_id+kind+created_at>=本地今日 00:00); SeedreamTool / SeedanceTool ctor 收 daily_limit, execute() 起手 if 超额返 [Error] 不调远端不烧钱。错误串只暴露已用/上限 + 重置时间,不写 yaml 路径 (避免 LLM 转述泄漏内部 schema 给外部用户)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-22 15:21:39 +08:00
caoqianming	7ff58c488e	feat: 接入豆包 Seedance 2.0 Fast 视频生成 (文生视频) + videogen skill - tools/seedance.py: 异步 submit /contents/generations/tasks → 5s 轮询 → succeeded 后 download mp4 + meta.json 落 <wd>/videos/;失败/cancel 不计费;cancel_check 在轮询间检查,响应用户停止按钮 - config/media/doubao.yaml: 展开 video.seedance_2_fast (¥37/Mtok 文生 / ¥22/Mtok 图生,token 公式校验 720p 5s = ¥4.00 完全对上源数据) - core/storage/usage.py: record_video_usage,kind=video,units jsonb snapshot resolution/duration/ratio/fps/tokens/单价 - core/agent_builder.py: build_agent 加 video_variant + cancel_check 形参, cancel_check 必须 build 阶段传 (SeedanceTool ctor 持有用于轮询) - web/app.py: GET /v1/video_models + MessageRequest.video_model + 透传 - web/static/dev.html: 顶栏第三下拉 (image 旁边) + state.videoModels/videoModel - skills/videogen/SKILL.md: 六维诊断 (运动+镜头替代 imagegen 的光线);BLOCKING 门槛比 imagegen 更严 (¥4 vs ¥0.22) + 等 30-90s 出片 - prompts/system/general_v1.md: 加 seedance 触发指引 (平行 seedream) phase 1 仅 t2v 文生视频,fast 上限 720p。API 端到端 smoke 跑过:路径/auth/错误解析全通,body schema 待用户在火山方舟控制台开通模型后真出片才能验。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-22 09:30:54 +08:00
caoqianming	468cef5fcc	feat: system prompt 注入 task 预选 skill 提示 + imagegen 加 BLOCKING 等 prompt 确认硬约束 1) core/agent_builder.py::_build_system_prompt 加 task_skill 参数,非空时在「工作目录与 task 上下文」段加一行 "- task 预选 skill: `<name>`",空字符串走老路径 prompt 字节级一致。LLM 拿到事实 + general_v1.md 已有 "对应 skill 领域先 load_skill" 规则自然组合 → 主动 load。否决"完整 SKILL.md 预注入 prompt"方案(会把 tasks.skill 升格成 binding,投入产出比不划算)。 2) imagegen SKILL.md 加 ⛔ 调 seedream tool 前必须把最终 prompt 贴给用户看 + BLOCKING 等明确确认硬约束:① 顶部流程加确认步骤;② 新增「调 tool 前的强制门(铁律)」段定义回复分类(可以/OK/画吧/嗯算确认;改 X → 重贴重等;沉默 → 继续等;模棱两可 → 追问到明确);③ 新增「调 tool 前再过一道」段给具体贴 prompt 的对话格式;④ 调用范式段加"前置条件已确认才调"; ⑤ 反模式加两条(没贴就调 / 模棱两可当确认)。本质是把模型脑内装配摊到对话层,装配 ≠ 授权调用。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-21 19:59:06 +08:00
caoqianming	b480147fb2	fix(usage): 顶栏 token 累计修 — sync_task_tokens 改走 messages SUM,删 LLM.TokenCounter 5/20 切流式后 LLM.token_counter.add() 只在同步 chat() 里调,流式 chat_stream() 路径从不更新它, sync_task_tokens 从内存计数器读累计 → tasks.tokens_prompt/completion 一直 0 → 顶栏 0 tok。 DB 验证:5/20 之前 task 数据正常(4568/934),之后 0/0;但 messages.tokens_in/out 一直对 (record_chat_usage 写),source-of-truth 完好,只是冗余汇总列没同步。改 sync_task_tokens(task_state) 走 SELECT SUM(tokens_in/out) FROM messages WHERE task_id=?, 删 TokenCounter 类 + ConsoleEventSink 的 token_counter 回调 + spinner ctx 尾巴。一次性 backfill 4 个被影响 task 的累计列。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-21 13:39:57 +08:00
caoqianming	972f36db20	fix(loop): tool message append 补 name 字段 + backfill 历史 — 修历史 task 重开后 seedream banner/chip 不展示 session.append 的 tool 消息只存 role/tool_call_id/content,没 name;前端历史渲染依赖 payload.name 判断产物工具白名单 + 抽 elapsed banner,刷新后两者全黑(流式正常因为 SSE event 单独带 name)。scripts/backfill_tool_message_name.py 按 task 走 assistant.tool_calls 建 tool_call_id→name map 回填,dry-run 默认,--apply 真写,幂等。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-21 08:14:23 +08:00
caoqianming	57ac7214e5	refactor(paths): 砍 ROOT 外路径分支 — 写入入口只接 simple name join workspace to_db_path 越界 raise(原 str(pp) 静默存绝对),from_db_path 删 is_absolute 分支只 ROOT/s。ROOT 外分支是防御性死代码:写入入口(POST /v1/tasks → working_dir_from_name)只接 simple name,0002 migration 已清理历史绝对串。DESIGN §7.4 注释同步。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-20 22:05:32 +08:00
caoqianming	8c9e0d0d3a	api+ui(media): 顶栏生图模型下拉(消息级,不入 DB) + 中间产物图片/视频内联展示 - 新加 GET /v1/image_models(扫 config/media/doubao.yaml image 段) - POST /v1/tasks/{id}/messages body 加可选 image_model 字段,_run_agent_bg 透传到 build_agent(image_variant=...);agent_builder 据此装配 SeedreamTool variant,不命中 yaml 静默回 fallback,空 → 沿用第一个 - dev SPA:顶栏「模型」旁加「生图」下拉(默认锁第一个 variant,per-session state 不持久),sendMessage 携 image_model 一起发 - 中间产物 chip 按文件类型分支:图片/视频走 .art-media 异步 fetch blob → 填 <img>/<video controls>(Bearer header 不允许 <img src=> 直 URL); 图片点击仍弹模态放大,视频用浏览器原生 controls;openFilePreview 加 _showVideo + .mp4/.webm/.mov/.mkv/.m4v 进 _EXT_GROUPS;_mediaArtifactCache 按 rel 复用,切 task 时 revoke - DESIGN 不动(无架构 / schema 变化);PROGRESS / RUN 同步 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-20 16:18:36 +08:00
caoqianming	a3acb97079	feat(loop+ui): LLM 调用切 streaming — cancel 秒退 + 前端打字机 + 发送/停止合并单按钮 - core/llm.py: 加 chat_stream() generator(stream=True + include_usage), generator finally 关底层 httpx 连接;_build_kwargs 抽出来 chat/chat_stream 共用 - core/loop.py: 主循环 _stream_llm() 流式迭代,chunk 间 poll cancel 命中 break, litellm.stream_chunk_builder 拼回 response 给 tool_calls 解析 + usage 记账; content delta 即时 emit text 事件激活前端打字机渲染 - web/static/dev.html: chat-send + chat-cancel 合并 chat-action 单按钮, setActionMode(idle/streaming/cancelling) 切态;streaming 期间 Enter 不触发停止 - cancel 延迟从「整轮 generation 时长」(几十秒)降到「单 chunk 间隔」(100ms 级) - 文档:DESIGN §3.1 + API 表 + risks 表翻转 tradeoff;RUN 接口 + 故障兜底同步; web/app.py docstring 对齐;PROGRESS 加条目 + 文件清单行数 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-20 15:46:54 +08:00
caoqianming	c04b8ba05e	feat(media): 接入豆包 Seedream 5.0 图像生成 tool + 0007 cost_usd→cost_cny 全表统一币种 - 新 tools/seedream.py:调 ark /images/generations 同步生成,产物落 figures/<ts>-<rand>.png + 同名 .meta.json - 新 core/ark_client.py:火山方舟 HTTP 封装(base URL + bearer auth + 异常翻译 + download),共享给后续 seedance - 新 config/media/doubao.yaml:独立命名空间;价格表注释 last_updated + 调价路径说明 - core/storage/usage.py 加 record_image_usage:单价 snapshot 进 units jsonb,防调价污染历史 - agent_builder.py 注册 SeedreamTool:仅当 ARK_API_KEY 设了才挂(无 key 用户无感) - 0007 migration:tasks/usage_events 双 rename cost_usd → cost_cny,×7.2 一次性折算; record_chat_usage 内部把 litellm USD 同样 ×7.2 落 CNY,免分类汇总 - prompts/system/general_v1.md 加「媒体生成工具」段,提示按需调用、不主动装饰 - dev SPA tool_result 折叠态显示 banner(model/size/cost/elapsed 徽章),不展开就透明 - scripts/smoke_seedream.py:端到端走通(待 ARK_API_KEY 配齐真跑会产生 ~¥0.22) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-20 15:20:34 +08:00
caoqianming	5ff09b9aca	fs tools 输出 user_root-relative 路径 + dev SPA chip 锚点修正 + assistant 正文也挂 chip - tools/base.Tool: 加 user_root kwarg + _display(p) helper(p 在 user_root 内 → POSIX 相对,外 → 原绝对) - tools/fs.py: Read/Write/Edit/Glob/Grep 所有结果串里路径都过 _display,不再泄 user_id / 部署根 - core/agent_builder: build_agent 把 user_root 透传给所有 tool(含 ShellTool / RunPythonTool / LoadSkillTool — base 默认 None 不影响) - tools/skill_tool: __init__ 加 user_root 转传 super - web/static/dev.html: 新加 _workingDirName helper(从 db 形 working_dir 取末段 + 跳过外部绝对路径);5 个 chip 抽取点统一用它代替原 working_dir 直取 → 根治 chip 点击 404;assistant 正文也接 chip 抽取 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-20 14:22:20 +08:00
caoqianming	c4fac2428b	skills+core(命名约定): task 级宪法文件 <date>-<short_id>-<name>.spec.md + spec_lock → spec 简化同 working_dir 多 task 共享中间产物是设计意图(素材跨本子复用), 但 spec 这种 task 1:1 宪法文件必须隔离 — 否则两本子 spec 直接撞。文件名三段式: - task_short_id (task_id.hex[:8],永不变) 主锚 → glob -<short_id>-.spec.md 字典序最大 = current - date 让"重定调"写新文件而非 edit 覆盖,旧版自然成历史快照 - task_name 作建时元数据,改 task.name 不 cascade(由 short_id 兜底定位) 约定由 core/agent_builder.py::_build_system_prompt 单点注入 (task_id / today 实际值嵌入,所有 skill SKILL.md 引用同一份)。 proposal / ppt SKILL.md 阶段一加"glob 检测已有 spec → 询问沿用/重定调"分支。模板 templates/spec_lock.md → spec.md (git mv 保历史),_lock 后缀无信息量去掉。未动:DB schema / PATCH /v1/tasks/{id} 改 name 入口 / 其他中间产物扁平共享 / quality_check.py (--spec 接路径)。反方案(cascade rename / spec 入 PG / 物理 task 子目录)及"何时升级到 DB 化"信号见 DESIGN §7.9。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-20 14:03:21 +08:00
caoqianming	7925dcef54	files: working_dir 视为可重生 FS 视图(DELETE task 顺手清空孤儿 + delete_file 去 task-ref 闸) DB 是 source of truth,FS working_dir 可独立删 / 用户手删 / 跨机器迁移丢失, 下次 build_agent 自动 mkdir 重建。三处改: - core/agent_builder.py: working_dir.mkdir(exist_ok=True) 从 if not resume: 里挪出,resume 也兜底建目录 - web/app.py DELETE /v1/tasks/{id}: 删完后若同 user 无其他 task 引用 + FS 空 + ROOT 内相对路径 → best-effort rmdir 清孤儿;外部 --working-dir (DB 绝对串)静默跳过 - web/app.py POST /v1/files/delete: 顶层目录去掉"有 task 引用 → 409"闸, 允许独立删空目录,task.working_dir 字段不动 smoke case 4 改 200 + working_dir 不变;新增 case 8(空目录自动清)/ case 9(非空保留),全 9 pass。PROGRESS / RUN 跟着更。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-20 08:10:36 +08:00
caoqianming	781a216ca6	model: 同 task 内切模型(c 模式 task 级 / A 粒度)+ usage_events v2 表(0006); GET /v1/models; 前端顶栏下拉 + 历史 model 切换点小标 - DB(0006): messages 加 model_profile 列(assistant 行有值); 重建 usage_events 表 v2 形态(event_id/user_id/task_id/message_id/kind/model_profile/units jsonb/cost_usd + 三索引), 0004 删的旧 schema 字段不够多态; tasks.tokens_prompt/completion/cost_usd 保留作粗概览 - ModelCapabilities 加 display_name; deepseek_v4.yaml flash/pro 各填名 - GET /v1/models: 扫 config/models/*.yaml 列可选项(profile/display_name/family/thinking_mode/is_default); POST /v1/tasks + PATCH 接受 model_profile(不传 → cfg["default_model"]; 校验走 ModelCapabilities.load 失败 400) - build_agent: resume 时优先 task.model_profile 而非 cfg default; AgentLoop 加 user_id 透传, 每轮 assistant 入库后调 record_chat_usage(litellm cost map 算钱, 失败吞掉 emit warn 不阻 loop) - core/storage/usage.py 新文件: record_chat_usage(双写 messages.tokens_in/out + model_profile + insert usage_events 一行) - session.append() 返回 message_id(供 usage 关联) - 前端 dev.html: chat-meta 加模型下拉(切了 PATCH + running 中提示"跑完后生效"); 新建对话框 modal 加 nt-model select; renderMessages 按 model_profile 切换点画小标 "── DeepSeek V4 Pro ──" - CLAUDE.md: 加"开发测试期 / 不删现有数据 / DROP COLUMN 两种情况"规则 - DESIGN §7.4 schema 加 messages.model_profile + usage_events v2 段; PROGRESS 加 0006 条目 + 文件清单 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-19 21:43:13 +08:00
caoqianming	2baed6894b	auth(dev SPA): 邀请码撤回邮箱+密码 (users.email/password_hash bcrypt; 0005 加 UNIQUE; user add CLI; 登录两 tab) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-19 13:58:48 +08:00
caoqianming	53f59eb78a	auth(dev SPA): 邀请码登录(invites 表 0005) + SENTINEL user 彻底撤 - 新增 POST /v1/auth/login_invite {token}: dev SPA 给同事试用,token → name → uuid5(NS, name) 推导 user_id;原 /v1/auth/login 保留为 platform 机器对机器入口 - 0005 migration 新表 invites(token PK / name UNIQUE / created_at);先用 ZCBOT_INVITES env 试了一版,讨论后升级到 DB 表 — schema 极薄,不入 user_id (uuid5 推导),不入 revoked_at (DELETE 即撤销);管理直接 SQL,后期可加 main.py invite CLI - web/auth.py: 删 _parse_invites / AuthConfig.invites / env 读取;新模块函数 resolve_invite(token) 每次 SELECT,无缓存避免 DELETE 后还能登 - SENTINEL_USER_ID 常量 + ensure_local_sentinel 函数 + agent_builder fallback 全删 (CLI 撤后无 caller);storage/utils.py 三函数 user_id 改必填;TaskState 加 user_id 字段;build_agent user_id 改 KEYWORD_ONLY 必填;session.py 删多余 ensure_local_task_row (task 行 web 入口已 INSERT) - DB 清: SENTINEL 行 + 5 个 dev task + 307 messages + workspace/users/00000000.../ 全删 - dev.html: 登录页 2 格 (uuid+key) → 1 格邀请码,header 显示 name·uuid 前 8 位 - 文档全套同步: RUN/DESIGN/PROGRESS Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-19 13:14:31 +08:00
caoqianming	9aa2efc335	core(/v1/files): 加 rename + delete 顶层加 task 引用闸 - POST /v1/files/rename:任意深度;path 是顶层目录则 DB-aware (FOR UPDATE 锁 task / 活跃 run 互锁 / check_no_subtask exclude / UPDATE working_dir 先于 FS rename,FS 失败回滚) - POST /v1/files/delete:顶层目录 + 有 task 引用 → 409,杜绝悬空 - check_no_subtask 加 exclude_task_ids,rename 平移自己不误判嵌套 - dev SPA:file row 加改名按钮,顶层改名后刷任务列表 + 当前 task header - smoke 7 case 全绿(scripts/smoke_files_rename.py) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-18 21:06:21 +08:00
caoqianming	0d127a7261	core(入口归位): cli.py→main.py, 原 main.py→core/agent_builder.py, 删 REPL 按 §5 Less Scaffolding + SoC 把混三角色的 main.py 拆开:入口归位到 main.py, 装配 lib 归位到 core/agent_builder.py。dev SPA 落地后 CLI REPL(chat/tasks/ export)与 web /v1 等价,维护双套 task 切换语义只是"对称美",一并撤(§7 E CLI 双模式路线同样撤)。 - cli.py → main.py(入口,只剩 web/db/probe 三 click 命令组) - 原 main.py → core/agent_builder.py(build_agent / system prompt / validate_task_name 装配 lib;顺手删死代码 _resolve_uuid_or_prefix + resume "last" 分支) - 删 chat/tasks/export 三 REPL 命令 + _cleanup_if_empty / _list_task_rows 等 CLI-only helpers ~400 行 - web/app.py 5 处 from main import → from core.agent_builder import - DESIGN §1/§2/§3.3/§3.6/§7.0/§7.6/§7.7/§7.8/§7.9 + RUN + PROGRESS 全套同步 - Smoke 6 case 全绿(in-process TestClient + 子进程 python main.py db current) - 净减 486 行 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-18 14:10:59 +08:00
caoqianming	2e519ab8a6	core(0004): 删 runs / usage_events 表 + cancel/SSE 改 task-level usage_events 全代码库零引用,纯死代码;runs 表实质就是"task 当前 in-flight 状态" 影子表,tokens_p/c 写但从未被读,run_id 唯二实用是 broker 频道键 + cancel 参数 — 单活 run 形态下完全冗余,客户端只需 task_id。按"开发期不写兼容层"心智一把切干净。 - alembic 0004:DROP runs / usage_events,tasks 加 run_status (idle/running/cancelling/error) + run_error 两列;ok/cancelled 终态都回 idle 不留持久标记,只有 error 持久 - ORM 删 Run / UsageEvent class - Broker 全 task_id 索引,加 start(tid) 在新 run 前清 _done - /v1/tasks/{tid}/runs/{rid}/{events,cancel} → /v1/tasks/{tid}/{events,cancel} - POST /messages 返 {events_url} 去掉 run_id - dev SPA: state.currentRunId → state.streaming(bool),路径去掉 /runs/{rid}/ - Smoke 18 case 全绿 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-18 11:05:35 +08:00
caoqianming	bf41631437	core(run cancel): POST /runs/{rid}/cancel + AgentLoop 协作式 cancel + dev SPA stop 按钮落地 DESIGN §7.2 原标"待"的 cancel 路由 — 等待回复 / LLM 操作时也能中断。 - broker 加 request_cancel / is_cancelled / clear_cancel(per-run threading.Event) - AgentLoop 加 cancel_check 回调,每轮 LLM 前 + tool_calls 之间 poll;命中给未执行 tool_call 补 [cancelled by user] tool result 保 LiteLLM 协议,emit cancelled event - 单活 gate + 启动 reaper 扩到 running \| cancelling - BG 装 cancel_check + 终态判 cancelled/ok + finally clear flag - dev SPA stop 按钮 + cancelled badge + fetchSse try/finally 失败路径复原 UI LLM 同步 call 本身不可中断,最坏等当前一轮跑完(通常几十秒)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-18 08:42:45 +08:00
caoqianming	4a6aaaf34d	core(0003): name + working_dir + skill schema 重构 + per-user .memory - alembic 0003: TRUNCATE tasks CASCADE + task_dir→working_dir + mode→skill + 加 name TEXT NOT NULL - name(必填,任务显示名,UI / docx 用)与 working_dir(可选,留空 fallback 用 name 作目录)解耦; 同 working_dir 多 task 共享物理目录(§7.1) - skill 字段对齐 skills/ 注册表语义,后续可下拉强校验 - POST /v1/tasks {name(req), working_dir?, description?, skill?}; PATCH 支持改 name/skill;新增 GET /v1/folders(FS 列表 + n_tasks + last_used) - DELETE /v1/tasks/{id} 硬删 DB(messages CASCADE)+ FS working_dir 保留; dev SPA 加 task delete 按钮 + file per-row 删按钮 - 工作目录改 eager mkdir(取代懒创建):用户给 name 即声明项目,目录立刻存在 - dev SPA modal 拆"任务名" + "工作目录"(<datalist> autocomplete 走 /v1/folders + 输入实时提示"复用 / 新建 / fallback");renderTaskList 主行 = t.name,副行 = 📁 + skill + desc - files 面板 UX:pane-head 显示项目名 + crumbs root 用项目名 + 修 root 处多渲 "." crumb 的 bug - 顺手:memory 搬 workspace/users/<uid>/.memory/(per-user dotfile 隔离); CLI --mode → --skill,--name + --working-dir 分开 - DESIGN §3.1 / §3.6 / §7.2 / §7.4 + PROGRESS + RUN 全量同步 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-17 19:15:37 +08:00
caoqianming	02a69058df	core(§7 D + D'): /v1 JSON API + PLATFORM_KEY→JWT auth + dev SPA 整合今日累积的 §7 D 阶段主体工作: - §7 D /v1 JSON API:删 web/templates/* + web/static/style.css, web/app.py 重写为纯 /v1 JSON 路由(tasks CRUD + messages + SSE 事件 JSON 化 + files 4 路由 + export),CORS allow_origins 起步 ,GET / 改 302 → dev SPA(详 DESIGN §7.9)。 - §7 D' 过渡 auth:web/auth.py 新增 — PLATFORM_KEY env(共享密钥) + JWT_SECRET env(HS256 签),POST /v1/auth/login 校验 key → 签 JWT(默 7d TTL),所有 /v1/tasks 走 Depends(require_user) 验签并按 user_id 隔离数据;豁免 /healthz、/docs、/openapi.json、 /static/*、/v1/auth/login。env 双必填,缺则 fail-fast。 - dev SPA:web/static/dev.html ~600 行 vanilla JS 单文件,login overlay(user_id 默 sentinel + platform_key)+ 3 栏布局(task list + chat 流 + files 浏览)+ new-task modal + done/abandon/ export。SSE 走 fetch+ReadableStream(EventSource 不支持 Bearer)。 - task_dir 改相对存储:新增 core/paths.py(to_db_path/from_db_path) + alembic 0002 migration 把 ROOT-内绝对路径转 posix 相对,跨 OS 和混合分隔符历史数据天然兼容。check_no_subtask 改 Python 端归一比对,逻辑更清晰。 - litellm 启动 cost map 网络警告兜底:core/llm.py 在 import 前 setdefault LITELLM_LOCAL_MODEL_COST_MAP=True,墙内冷启动 ~5s → <1s。 - docs:DESIGN §7.3 改写(过渡 auth + 真 OIDC 路线)+ §7.7 状态表 + §7.9 dev SPA 取舍;PROGRESS 加多条今日条目 + 文件清单 + 下一步;RUN env 双 auth env + curl 示例 + 路由表 Auth 列 + 5 条故障兜底新条目。CLAUDE.md 加"开发期不写兼容层"心智。 Smoke 全绿:env fail-fast / 8 路径无 token 全 401 / login 3 分支 / 带 token CRUD / 跨 user 4 case 隔离 / token 异常 4 case / 真实 HTTP uvicorn 端到端 login + bearer call + dev.html 服务。 requirements: 加 pyjwt>=2.8.0;删 jinja2 / markdown-it-py / mdit-py-plugins / pygments(模板路线撤一并清);保留 python- multipart(files upload 还用)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-15 16:14:25 +08:00
caoqianming	e8dbfa57a5	core(§7 B Step 6): no-subtask 前缀嵌套校验 - core/storage/utils.py 加 check_no_subtask + NoSubtaskError;PG LIKE 双向(new LIKE existing/% OR existing LIKE new/%),同 task_dir 允许(同项目多对话),空 / whitespace 跳过。 - 分隔符容差:SQL replace(task_dir, '\', '/') 把存的 Windows 反斜杠与新值统一到 '/' 再比;backslash 通过 bind 参数传,绕开 SQL 转义。 - main.py::build_agent 在 resolve_task_id 后、TaskState 构造前调, if not resume 单层闸 —— resume 跳过(改名走未来 Folder API cascade). - cli.py 三处 build_agent 调用现有 try/except 直接接住 NoSubtaskError. - PROGRESS / RUN 同步:Step 6 完工,故障兜底加一条 NoSubtaskError 处理. Smoke(9 路径 + e2e 3 分支)全绿。§7 B 完工(Step 5 取消)。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 11:59:37 +08:00
caoqianming	2b3692c8bf	core(§7 B Step 4): --task-dir 双形态 + RUN.md 运行手册 - CLI `chat --task-dir <path>` 让用户显式指定项目目录(§7.1 task-primary + dir 副视图心智模型落地);留空走默认派生 workspace/tasks/<uuid>/。 - main.py::resolve_task_id 加 task_dir_arg;resume 时从 PG tasks.task_dir 读,空则降级默认派生。新增 is_managed_task_dir(td, ws) 判断 task_dir 是否在默认模板下。 - cli.py::_cleanup_if_empty 拿 workspace_dir 作保护开关 —— 用户自指定的 task_dir 绝不 rmtree(可能含用户已有素材);DB 行该删还是删。 - core/export_docx.py::export_chat_to_docx 重构:task_id 升一等参数(从 task_dir.name 提取改入参传入),task_dir 留空时自动从 PG 读;cli /export 与 cli.py export 子命令均改走 _resolve_uuid_or_prefix + task_id 直传。 - 新建 RUN.md(运行手册):env / 初始化 / 日常命令 / 故障兜底 / 关键路径。 - CLAUDE.md 加 RUN.md 维护规则(三文档边界:DESIGN=为什么 / PROGRESS=做到哪 / RUN=怎么跑),对外行为改动同步更 RUN。 Smoke 4 路径:default-derived(managed=True, cleanup rmtree)/ --task-dir (managed=False, FS preserved)/ resume reads DB task_dir / export 自动 PG 查路径,全绿。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 11:38:05 +08:00
caoqianming	aeecc7f0f3	core(§7 B Step 3): TaskState ORM + Web UI 设计 (Phase G) - TaskState dataclass 改 PG-backed:save() → upsert_task (INSERT ON CONFLICT DO UPDATE,显式刷 updated_at);load(task_id) → SELECT。state.json 全面废除,task_dir 只承担 skill 产物。 - TaskState 字段去 cwd / 加 task_dir(对齐 §7 SaaS task_dir-as-identity); cwd 只在 session.meta 内存视图保留(展示用)。 - core/storage/utils.py 新增 upsert_task / update_task;ORM-level UPDATE 自带 onupdate=func.now(),DO UPDATE 需显式 set。 - session.py Session.append 的 ensure 调用补传 mode/description/ reasoning_effort,避免首次 INSERT 后 _list_task_rows 看到空 meta。 - sync_task_tokens 改成 update_task 单字段 UPDATE,避免无谓全字段 UPSERT。 - cli.py _list_task_rows 全字段从 PG 读,status 过滤走 SQL WHERE; _cleanup_if_empty 去 state.json 特例(任何 FS 文件/子目录都算实质痕迹)。 - core/export_docx.py meta 走 TaskState.load(tid),CWD 字段从 meta 表移除。 - DESIGN.md 追加 Phase G(Web UI 简洁版,FastAPI + Jinja2 + HTMX + SSE), 排在 §7.7 D 后;§7.9 补 server-render 不上 SPA 的取舍 4 条。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 11:25:53 +08:00
caoqianming	4f87bf14ee	core(§7 B Step 2): Session ORM — messages 走 PG, task_id 切 UUID Session 重写 - messages 落 PG `messages` 表(append-only, idx 严格递增, jsonb payload) - system prompt 不入库(每次 build_agent 重建到 messages[0],memory 演化即时生效) - Session.load(task_id, system_prompt=...) 从 DB 读历史 - Session.task_exists / n_user_msgs 工具 Storage utils - ensure_local_task_row: 首条消息前 INSERT ... ON CONFLICT DO NOTHING 打底 tasks 行(Step 3 后由 TaskState.save 接管字段更新) task_id 切 UUID - resolve_task_id(workspace, arg, resume): UUID + 前缀匹配,'last' 从 PG 按 updated_at 取最近 - 显示一律截前 8 位;完整 UUID 在 /id /status 保留 - 旧 workspace 老 task(时间戳格式)不做兼容 CLI 适配 - _cleanup_if_empty 双检查:DB messages count + FS 产物 - _list_task_rows: PG tasks ORDER BY updated_at + state.json 兜底字段 - _task_has_messages: /export 检查改 DB - core/export_docx.py: messages 从 PG 读,state.json 留作 meta Step 5 (migrate-from-fs) 取消。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 10:55:50 +08:00
caoqianming	425ea59937	core(§7 B Step 1): Storage 基建 — SQLAlchemy ORM + alembic + db CLI - core/storage/{engine,models}.py: 5 表 ORM(users/tasks/messages/runs/ usage_events)+ session_scope 上下文 + 本地 sentinel user 初始化 - alembic 初版 migration 0001_initial_schema: messages.payload GIN 索引 + tasks (user_id, task_dir) 复合索引 + pgcrypto 扩展兜底 - cli.py: db upgrade/downgrade/current 子命令组;ZCBOT_DB_URL 未设给 ASCII 报错 + exit 2(避开 Windows GBK 控制台编码问题) - requirements: +sqlalchemy>=2.0 +psycopg[binary]>=3.1 +alembic>=1.13 - DB URL 来自环境变量 ZCBOT_DB_URL,不引导 docker(用户给测试库地址) 已在远端测试 PG 跑通 db upgrade head + db current。Session/TaskState ORM 接入留 Step 2-3。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-14 10:41:44 +08:00
caoqianming	e4a48fbb53	core: Session/TaskState 原子写 + Phase 6 双层记忆 - core.session.atomic_write_text (tmp + fsync + os.replace) 接管 Session/ TaskState 落盘, 中途异常不留 0 字节; _cleanup_if_empty 放过 .tmp 孤儿 - core/memory.py: workspace/memory/{core.md, extended/} 双层记忆. core.md 注 system prompt, extended/.md 索引(标题+绝对路径)注 prompt, 内容靠 read 工具按需拉 - _build_system_prompt 从 build_agent 里提出来, new 和 resume 都走同一段, resume 时覆盖 messages[0] -> memory 演化即时生效 - PROGRESS/DESIGN 同步: §7 platform track 行 + A 阶段完成 + 双层记忆/原子写 + 文件清单到 2429 行 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 15:13:56 +08:00
caoqianming	375bb2999c	core: loop 事件流化 (sink 接口, §7 A 阶段) loop 不直接 console.print —— 改成 sink.emit({type, ...}),sink 决定怎么呈现。新增 ConsoleEventSink 接管 spinner / [in N out N] / assistant 文本 / tool>(args) / 结果预览, CLI 行为零回归。后续接 SSE 时只换 sink 实现,loop 不动。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-11 14:59:32 +08:00
caoqianming	b86c051290	cli+core: 加 task 对话导出为 .docx - core/export_docx.py: 渲染 messages.json 为对话稿,左排小字 + 角色配色 (user/assistant/tool/tool_call/reasoning),meta 信息表置文档开头,tool 结果默认前 1000 + 中间省略 + 后 500 - cli.py: 加 `export <task_id>` 子命令(支持 last / -o / --include-system / --no-reasoning / --tool-head / --tool-tail)与 REPL `/export [<id>]` - 默认跳过 system prompt(信息密度低),默认带 reasoning_content(观察价值高) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-08 14:42:45 +08:00
caoqianming	72d2b64c40	core/ui: 抽出语义化 console 主题, 调用方去硬编码颜色新增 core/ui.py 集中定义 Rich Theme: - 语义样式名: user / assistant / tool / ok / warn / err / info / muted / accent - 在黑底终端上 readable, 弱化用 grey 而非 dim, 强调走 bright_* - make_console() 统一应用主题, 以后改主题只动这一处 cli.py / main.py / core/loop.py 把内联的 [red] [green] [blue] [yellow] [cyan] [dim] 等替换为语义样式; 调用 make_console() 取代 Console()。	2026-05-07 16:10:11 +08:00
caoqianming	61ff98bb79	loop: thinking spinner 显示耗时 + 累计 token,每轮回打成本一行 spinner 文本由后台 daemon 线程每 100ms 用 status.update() 刷新,显示 'thinking... 1.3s ctx 12,345 tok'。每轮 LLM 返回后追加一行 dim '[in N out N t Xs]',留痕便于回看本轮成本。全 ASCII。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 14:05:44 +08:00
caoqianming	80f9934f8f	loop: 用 rich.Markdown 渲染 assistant 输出之前 console.print(f"...{content}") 只解析 [tag] 标签,不识别 bold、表格、列表等 markdown 语法,LLM 回复会以原文显示。改成单独打印前缀后再 console.print(Markdown(content))。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 11:19:46 +08:00
caoqianming	dbb778fe10	Phase 4 + 6: capability probe + task 概念 / state.json - core/probe.py + cli.py probe: basic_chat / parallel_tools / thinking_mode / long_context 四项实测对账 yaml;不进启动路径 - core/task.py + main.py: workspace/tasks/<id>/{state.json, messages.json}, TaskState 跟 mode/desc/status/tokens/timestamps;build_agent 返 5 元组 - cli.py tasks 子命令 + REPL /status /done /abandon /desc;chat 加 --mode/--desc 选项;移除 legacy workspace/sessions/ 兼容 Phase 5 evals 评估后决定不做:个人工具用 dogfooding 判断模型升级, probe 已覆盖健康检查;造作 case 没区分度,维护成本不划算。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 16:21:17 +08:00
caoqianming	3a66849953	Initial import: zcbot personal task agent DESIGN.md / PROGRESS.md 落地 Phase 1-3: - core/: LiteLLM 封装 + ReAct loop + 会话持久化 + Anthropic skill registry - tools/: read/write/edit/glob/grep/shell/run_python/load_skill (Hybrid 范式) - skills/coding \| proposal: WHY+WHAT 风格 SKILL.md - skills/ppt: 完整渐进披露 (SKILL + 4 references + 3 scripts) · 借鉴 hugohe3/ppt-master 的两阶段 + spec lock 思路 · MSO_SHAPE 图标体系 + 安全区 + 越界检测 · 默认商务红主题 (#C00000 / #E15554 / #FFC107) - config/models/: DeepSeek V4 flash/pro 档案 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 11:02:59 +08:00

1 2 3

135 Commits