design: 更新设计
This commit is contained in:
parent
4560a95fac
commit
b4df60062e
359
DESIGN.md
359
DESIGN.md
|
|
@ -13,13 +13,14 @@
|
|||
- **编码**:文件编辑、shell 执行、迭代验证
|
||||
|
||||
### 不做什么
|
||||
- 子 agent / IM 渠道 / 多用户 / Web UI(初期 CLI 即可)/ 自定义 RAG / 锁定 Anthropic
|
||||
- 子 agent / IM 渠道 / 自定义 RAG / 锁定 Anthropic(注:多用户 / Web UI 是 §7 SaaS 化路线,personal-tool 阶段不做)
|
||||
- **Eval Suite**:个人工具用 dogfooding 判断模型升级,造作 case 没区分度
|
||||
|
||||
### 关键约束
|
||||
- 模型自由:LiteLLM 接 OpenAI-compatible 任意 provider(默认 DeepSeek V4)
|
||||
- 任务持久化:任意时刻关机,下次能恢复
|
||||
- 演化性:模型升级时 agent 跟着升级,不需要大改架构
|
||||
- **形态兼容**:本地 CLI 与 SaaS 共享同一份 core 和同一种 storage(PG,无 SQLite / JSON 分支);CLI 长期保留(本地直跑 + `--remote` API client 双模式),不会被 HTTP API 取代(详 §7.0)
|
||||
|
||||
---
|
||||
|
||||
|
|
@ -58,9 +59,7 @@ zcbot/
|
|||
│ │ ├── core.md # 注 system prompt,常驻
|
||||
│ │ └── extended/ # 索引(标题+绝对路径)注 prompt,内容靠 read 工具按需拉
|
||||
│ │ └── *.md
|
||||
│ └── tasks/<task_id>/
|
||||
│ ├── state.json # TaskState
|
||||
│ ├── messages.json # Session
|
||||
│ └── tasks/<task_id>/ # task_dir:仅 skill 产物,state/messages 在 PG
|
||||
│ ├── spec_lock.md # skill 阶段一产物 (proposal/ppt)
|
||||
│ ├── source/ # proposal 用户素材 (PDF / 团队介绍)
|
||||
│ ├── source.md # ppt 转过的素材
|
||||
|
|
@ -74,7 +73,7 @@ zcbot/
|
|||
**task_dir = `workspace/tasks/<task_id>/`,所有 skill 产物都写到这里**。task_dir 绝对路径在 system prompt 里显式给 agent,SKILL.md 的 `<task_dir>` 占位符指向它。如果 agent 写错位置(写到 cwd / `skills/` / repo 根),git status 会立刻报红 —— `.gitignore` 不再用无锚通配规则盖住污染。
|
||||
|
||||
### 启动时拼装顺序
|
||||
1. 读 `config/agent.yaml` 拿 default_model
|
||||
1. 读 `config/agent.yaml` 拿 default_model;`ZCBOT_DB_URL` 环境变量指向 PG(本地 dev 连远端测试 PG 或 docker compose 起的本地 PG;两形态同一种 schema)
|
||||
2. `ModelCapabilities.load("deepseek_v4.flash", config/models/)` 拿能力档案
|
||||
3. `LLM(caps)` 构造,从 env 读 API key
|
||||
4. 解析 task_dir(新建 or resume)
|
||||
|
|
@ -134,19 +133,19 @@ yaml 是手填的,可能错。`probe` 用真实 LLM 调用对账:
|
|||
|
||||
### 3.6 Session 与 Task
|
||||
|
||||
**Session**(`core/session.py`)= 消息列表 + meta + 落 `messages.json`。
|
||||
**Session**(`core/session.py`)= 消息列表 + meta,**直接 ORM 写 PG `messages` 表**(append-only,`jsonb` 存 LiteLLM 原样 payload)。
|
||||
|
||||
**Task**(`core/task.py`)= Session 的上层概念,含 mode / description / status (active/completed/abandoned) / model / reasoning_effort / cwd / created_at / updated_at / tokens_prompt / tokens_completion。落 `state.json`。
|
||||
**Task**(`core/task.py`)= Session 的上层概念,含 mode / description / status (active/completed/abandoned) / model / reasoning_effort / task_dir / created_at / updated_at / tokens_prompt / tokens_completion。**直接 ORM 写 PG `tasks` 表**。
|
||||
|
||||
存储:`workspace/tasks/<task_id>/{state.json, messages.json}`。每轮 `agent.run` 后调 `sync_task_tokens` 把 LLM 累计 tokens 写回。
|
||||
存储:Session / Task → PG;task_dir FS 目录只存 skill 产物(spec_lock / sections / *.docx / *.pptx 等),不再有 `state.json` / `messages.json`。每轮 `agent.run` 后 `sync_task_tokens` UPDATE 累计 tokens。**本地 + SaaS 同一份 schema 和 ORM 实现,无 adapter 抽象层**,差别只在 `ZCBOT_DB_URL`(本地连 docker compose 起的 PG / 远端 dev PG,SaaS 连生产 PG)。
|
||||
|
||||
**懒创建** —— `build_agent` 新建分支不立刻 save,task_dir 在第一条 user 消息触发 `Session.append → save()` 时才物化(`Session.save` / `TaskState.save` 都 `mkdir(parents=True)`)。启动 REPL 后立刻 `/exit` 磁盘无痕,跨进程也安全(没有"另一个 REPL 刚 build_agent 还没说话就被这个进程当空 task 删掉"的窗口)。
|
||||
**懒创建** —— `build_agent` 新建分支不立刻 INSERT,Task / Session 在第一条 user 消息触发 `Session.append` 时才 INSERT;task_dir FS 目录在 skill 第一次落产物时 `mkdir(parents=True)`。启动 REPL 后立刻 `/exit` 不留 DB 行 + 不留 FS 目录,跨进程安全。
|
||||
|
||||
**REPL 内 task 切换** —— `/new` 开新 task,`/resume [last|<id>]` 切到已有 task(无参数列最近 10 个表格让用户选),`/done /abandon` 改状态,`/desc` 改描述。切走前 `_cleanup_if_empty` 守门:三条都满足才删 task_dir —— ① session 没 user 消息 ② 目录在磁盘上 ③ 目录里只剩 `messages.json`(state.json 存在 = `/done /abandon /desc` 留下的显式痕迹,要保;原子写的 `*.tmp` 孤儿不算)。
|
||||
**REPL 内 task 切换** —— `/new` 开新 task,`/resume [last|<id>]` 切到已有 task(无参数列最近 10 个表格让用户选),`/done /abandon` 改状态,`/desc` 改描述。切走前 `_cleanup_if_empty` 守门:DB 里该 task 没 messages 行 **且** FS task_dir 没产物 → DELETE tasks 行 + rmdir task_dir;任一痕迹存在则保留。
|
||||
|
||||
**原子落盘** —— `Session.save` 和 `TaskState.save` 都走 `core.session.atomic_write_text`:先写 `path.tmp` + `fsync`,再 `os.replace` 到目标。中途异常(磁盘满 / surrogate 编码错 / 进程被杀)不留 0 字节或半文件,老内容保留。
|
||||
**原子性** —— PG INSERT 天然原子,messages / tasks 写入无 0 字节风险。skill 产物(spec_lock.md / sections/*.md 等)仍走 `core.session.atomic_write_text`(tmp + fsync + replace),避免大文件写一半留半文件。
|
||||
|
||||
CLI:`chat --mode coding --desc "..." [--resume last|<id>]`;`tasks [--status active|completed|abandoned]` 列任务。
|
||||
CLI:`chat --mode coding --desc "..." [--resume last|<id>] [--remote <url>]`;`tasks [--status active|completed|abandoned]` 列任务。
|
||||
|
||||
### 3.7 双层记忆(`core/memory.py`)
|
||||
|
||||
|
|
@ -161,6 +160,12 @@ CLI:`chat --mode coding --desc "..." [--resume last|<id>]`;`tasks [--status acti
|
|||
|
||||
memory 文件由人填(也允许 agent 用 `write` 写)。系统不自动维护 —— 这是和"auto memory"框架的关键差异:**事实由用户判断,不由 LLM 自动总结**(后者噪音和误判风险高)。
|
||||
|
||||
**形态兼容** —— memory **永远在 FS,不入 DB**:
|
||||
- 本地形态:`workspace/memory/{core.md, extended/}`
|
||||
- SaaS 形态:`<storage_root>/users/<user_id>/memory/{core.md, extended/}`(bind mount 进容器)
|
||||
|
||||
理由:① memory 本质是"用户笔记",FS 读写 + 编辑器手编是产品语义的一部分,DB 化反而要造一层 UI 让用户改 md;② 跨 task 共享靠"同一 user 看同一份目录"语义自动达成,不需要 schema 设计;③ 不参与 §7.4 表结构,task 删/folder 删都不连带 memory。memory 不分 folder,是 per-user 单一命名空间。
|
||||
|
||||
---
|
||||
|
||||
## 4. 模型路由
|
||||
|
|
@ -219,11 +224,11 @@ default_model: deepseek_v4.flash
|
|||
### 已知风险
|
||||
| 风险 | 缓解 |
|
||||
|-----|------|
|
||||
| run_python subprocess 沙盒不够强 | 限制工作目录 + 敏感 env 过滤;后续可升级 Docker |
|
||||
| run_python subprocess 沙盒不够强(本地形态非真隔离) | 限制工作目录 + 敏感 env 过滤;SaaS 形态走 docker exec(§7.6 #6),本地依赖用户对模型生成代码的最终审阅 |
|
||||
| V4 在某些复杂任务不如 Claude | dogfooding 判断,fallback 手动切 |
|
||||
| Skill description 不够好 → 触发不准 | 用 Pro 优化 description,实战观察 |
|
||||
| Long context 退化 | `probe --long-context` 探测可靠 ceiling,不依赖宣称值 |
|
||||
| `Session.save()` 不原子,异常会留 0 字节文件 | 后续改 tmp + rename(已记 PROGRESS) |
|
||||
| 本地 PG 连接不稳定 / 离线 dogfood | `docker compose up -d` 一行起本地 PG 兜底;也可连远端 dev / staging PG;CI 用 ephemeral PG container |
|
||||
|
||||
### 取舍说明
|
||||
**为什么用 Hybrid 范式而不是纯 CodeAgent**:V4 JSON tool call 已稳定;沙盒成本只在需要时付;兼容 thinking 模式。
|
||||
|
|
@ -236,181 +241,273 @@ default_model: deepseek_v4.flash
|
|||
|
||||
---
|
||||
|
||||
## 7. Core / Platform 切分(草案,status=design,2026-05-09)
|
||||
## 7. SaaS 化(草案,status=design,2026-05-12)
|
||||
|
||||
> §1-§6 是 **personal-tool track**;本节是 **platform track**,目标把 core 包成多租户 SaaS。两者共享同一 core 代码,部署形态不同。本节落地前 §1-§6 路线照走,不阻塞 dogfood。
|
||||
> §1-§6 是 **本地 dogfood 形态**;本节是 **SaaS 形态**,把 core 包成多用户在线服务。
|
||||
> 不引入 platform/core 切分 —— core 就是后端,直接对用户做 auth(原"平台签 JWT、core 验签"多租户方案废弃)。两条形态共享同一份 core,差别只在 CLI 入口 vs HTTP 入口。本节落地前 §1-§6 路线照走,不阻塞 dogfood。
|
||||
|
||||
### 7.1 总原则
|
||||
### 7.0 与本地形态的兼容性
|
||||
|
||||
| | 形态 | 数据归属 | 接口 |
|
||||
|---|---|---|---|
|
||||
| Core(自己做) | 独立 **HTTP/SSE service** + sandbox 进程组 | 对话 / 文件 / 产物 / tokens / 用量 | `/v1/*` REST + SSE |
|
||||
| Platform(团队做) | BFF + Web/Mobile UI + Auth + Billing | 终端用户 / 订阅 / 发票 | 调用 core `/v1/*` |
|
||||
SaaS 化不是"重写"也不是"取代 CLI",而是**给同一份 core 加一个 HTTP 入口**。落地过程中本地 CLI 必须始终可用。
|
||||
|
||||
CLI 也是 core 的一个客户端 —— 走同一 `/v1`,本地起 core 跑 localhost。dogfood 和平台走同一份代码路径,bug 先在自己身上发现。
|
||||
**两条形态共享**:
|
||||
- 同一份 `core/`(loop / capabilities / skills / memory / storage 接口)
|
||||
- 同一份 `tools/`(底层 executor 从 subprocess 换 docker exec,接口不变)
|
||||
- 同一份 SKILL.md 和 prompts
|
||||
|
||||
参考蓝本:**OpenAI Assistants API** 形态(stateful agent service:`/threads /messages /files /runs`)。
|
||||
**两条形态差别**:
|
||||
|
||||
| 维度 | 本地形态 | SaaS 形态 |
|
||||
|---|---|---|
|
||||
| 入口 | `cli.py chat ...` 直调 core | HTTP `/v1/...` + SSE |
|
||||
| Storage | **PG**(`ZCBOT_DB_URL` 指 docker compose / 远端 dev PG) | **PG**(`ZCBOT_DB_URL` 指生产 PG) |
|
||||
| task_dir 根 | `workspace/tasks/<task_id>/`(派生,task 私有) | `<storage_root>/users/<user_id>/<task_dir>/`(用户给,可共享) |
|
||||
| Memory | `workspace/memory/`(FS) | `<storage_root>/users/<user_id>/memory/`(仍是 FS) |
|
||||
| Sandbox | subprocess + env 过滤(非真隔离) | per-task docker exec |
|
||||
| Auth | 无(单用户 `user_id='local'`) | OIDC + JWT(user_id) |
|
||||
|
||||
**CLI 长期双模式**:
|
||||
- **本地直跑**:`cli.py chat`(默认),直接调 core in-process,直连 PG。适合 dogfood / 调 core 内部状态
|
||||
- **API client**:`cli.py chat --remote https://...`,走 HTTP /v1,跟前端用户路径一致
|
||||
|
||||
两模式共用 `cli.py` 入口,差别只在 transport 层(in-process call vs HTTP)。dogfood ≡ 真实用户路径只在 `--remote` 模式下成立;**本地直跑模式永久保留**(调试 core 内部状态比 HTTP roundtrip 顺手)。
|
||||
|
||||
**本地 PG 连接** —— `ZCBOT_DB_URL` 指向 docker compose 起的本地 PG(`docker compose up -d` 一行起,repo 自带 `docker-compose.yml`)或远端 dev / staging PG。**离线场景靠本地 docker compose 兜底**,不靠"零依赖"幻觉。
|
||||
|
||||
`workspace/` 目录:仅存 skill 产物(spec_lock / sections / *.docx / *.pptx),state / messages 全在 PG。本地 vs SaaS 差别只在 task_dir 根路径,不在 storage 形态。
|
||||
|
||||
### 7.1 心智模型:Folder-centric,task-as-DB-record
|
||||
|
||||
参考 Claude Code(cwd 是 anchor,状态存别处)+ OpenAI Assistants(stateful agent service)。
|
||||
|
||||
- **Folder** = 用户的"硬盘",路径 `users/<user_id>/<user-defined>/...`。能浏览、新建、改名、上传、下载,**和本地文件管理器体感一致**。folder 没 ID,**path 就是标识**;改名走 prefix cascade。
|
||||
- **Task** = DB 一行,带 `task_dir` 指向 folder(相对 user root)。同 folder 允许多 task,但 task 之间**不允许嵌套**(no-subtask)。
|
||||
- **Messages** = DB 表,append-only,`jsonb` 存 LiteLLM 原样 payload。
|
||||
- **Skill 运行产物** 全落 cwd,不引入 artifacts 表;终稿后 SKILL.md 指示 agent 清中间件。
|
||||
- **Skill 定义** 是项目代码,跟部署走,所有用户共享,不入用户 folder。
|
||||
|
||||
**task_dir 在两形态的对应**(§7.0 总览的展开):
|
||||
- 本地形态:`task_dir = workspace/tasks/<task_id>/`(派生,task 私有,无并发写冲突)
|
||||
- SaaS 形态:`task_dir = <storage_root>/users/<user_id>/<user-given-path>/`(用户给,可被同 user 多 task 共享)
|
||||
|
||||
state / messages **两形态都在 PG**,FS 只承担 skill 产物(sections / *.docx / 中间件)。多 task 共享同 folder 时由 §7.8 文件级悲观锁兜底(并发写同名文件冲突早失败,推到模型自纠)。
|
||||
|
||||
### 7.2 资源模型与接口(/v1)
|
||||
|
||||
```
|
||||
POST /v1/tasks 创建 task(mode/desc/model)
|
||||
GET /v1/tasks 列表
|
||||
GET /v1/tasks/{id} 详情
|
||||
PATCH /v1/tasks/{id} 改 mode/desc/status
|
||||
DELETE /v1/tasks/{id} 删 task(连带 messages/files/产物)
|
||||
POST /v1/folders 创建
|
||||
GET /v1/folders 列树
|
||||
GET /v1/folders/{path} 详情(task 列表 + 文件列表)
|
||||
PATCH /v1/folders/{path} 改名/移动(prefix cascade)
|
||||
DELETE /v1/folders/{path} hard cascade(连带 task+messages,前端二确认)
|
||||
|
||||
POST /v1/tasks/{id}/files 上传(multipart,入 task_dir/source/)
|
||||
GET /v1/tasks/{id}/files 列表
|
||||
GET /v1/tasks/{id}/files/{name} 下载(产物也走这里)
|
||||
DELETE /v1/tasks/{id}/files/{name}
|
||||
POST /v1/folders/{path}/files 上传(multipart)
|
||||
GET /v1/folders/{path}/files[/{name}] 列 / 下载
|
||||
DELETE /v1/folders/{path}/files/{name}
|
||||
|
||||
POST /v1/tasks/{id}/messages 发消息,返回 {run_id}
|
||||
GET /v1/tasks/{id}/messages 历史
|
||||
GET /v1/tasks/{id}/runs/{run_id}/events SSE 事件流
|
||||
POST /v1/tasks 创建({task_dir, mode, desc, model})
|
||||
GET /v1/tasks 列(?task_dir= ?status= 过滤)
|
||||
GET /v1/tasks/{id} 详情
|
||||
PATCH /v1/tasks/{id} 改 mode/desc/status
|
||||
DELETE /v1/tasks/{id} 删 task(messages 一起删,不动 cwd 文件)
|
||||
|
||||
POST /v1/tasks/{id}/messages 发消息,返回 {run_id}
|
||||
GET /v1/tasks/{id}/messages 历史(?search= 走 jsonb GIN / tsvector)
|
||||
GET /v1/tasks/{id}/runs/{run_id}/events SSE 事件流
|
||||
POST /v1/tasks/{id}/runs/{run_id}/cancel
|
||||
|
||||
GET /v1/skills 可用 skill 列表
|
||||
GET /v1/models 可用 model profile
|
||||
POST /v1/probe (admin) 跑 capability probe
|
||||
|
||||
GET /v1/usage tokens/cost/quota 状态(by tenant)
|
||||
GET /v1/skills | /v1/models | /v1/usage
|
||||
POST /v1/probe (admin) 跑 capability probe
|
||||
```
|
||||
|
||||
**SSE 事件格式**:
|
||||
```json
|
||||
{"type":"tool_call","run_id":"...","name":"read","args":{...},"ts":"..."}
|
||||
{"type":"tool_result","run_id":"...","name":"read","preview":"...","truncated":false}
|
||||
{"type":"text","run_id":"...","delta":"..."} ← LLM 流式 token
|
||||
{"type":"usage","run_id":"...","prompt":1234,"completion":567,"cost_usd":0.012}
|
||||
{"type":"done","run_id":"..."}
|
||||
```
|
||||
**SSE 事件**:`tool_call` / `tool_result` / `text` (delta) / `usage` / `done`,带 `run_id`。
|
||||
|
||||
**版本化**:`/v1` 半年内 minor 向后兼容,major 6 个月 deprecation 窗口。
|
||||
**版本化**:`/v1` minor 半年内向后兼容,major 6 个月 deprecation。
|
||||
|
||||
### 7.3 认证模型
|
||||
|
||||
Core 只信平台,**不直接对终端用户**。
|
||||
OIDC / Clerk / 自建邮箱登录,JWT 只带 `user_id` claim:
|
||||
|
||||
```
|
||||
Authorization: Bearer <platform_api_key> ← 绑死平台租户
|
||||
X-Tenant-Id: <tenant_uuid> ← 平台 sign 的 JWT claim
|
||||
X-User-Id: <user_uuid> ← 同上
|
||||
X-Request-Id: <uuid> ← 跨服务 trace
|
||||
Authorization: Bearer <user_jwt>
|
||||
X-Request-Id: <uuid>
|
||||
```
|
||||
|
||||
平台对终端用户做 OIDC/Clerk auth,把租户/用户 ID 签进 JWT 给 core 验签 —— 平台**无法伪造租户 ID**。多租户隔离在 core 这一层强制,平台 bug 不会泄露跨租户数据。
|
||||
所有 storage/executor 调用 scoped by `user_id`。**无 tenant 层** —— 个人 SaaS 用不上,日后做企业版加 `org_id` claim 等价隔离。
|
||||
|
||||
### 7.4 存储:Postgres + 本地文件系统
|
||||
|
||||
**结构化数据走 Postgres**(service 形态多 worker 必须):
|
||||
```sql
|
||||
users(user_id uuid pk, email null, password_hash | oidc_subject null, plan null, created_at)
|
||||
-- 本地形态固定 INSERT 一行 sentinel: user_id = '00000000-0000-0000-0000-000000000000',
|
||||
-- email / auth / plan 全 NULL;CLI 启动时若不存在则建,tasks 全部 FK 到它
|
||||
|
||||
```
|
||||
tenants(id, name, api_key_hash, plan, created_at, status)
|
||||
tasks(id, tenant_id, user_id, mode, description, status, model_profile,
|
||||
tokens_prompt, tokens_completion, cost_usd, created_at, updated_at)
|
||||
messages(id, task_id, role, content, tool_calls, tool_call_id,
|
||||
reasoning_content, created_at)
|
||||
runs(id, task_id, status, started_at, finished_at, error, tokens_p, tokens_c, cost_usd)
|
||||
files(id, task_id, name, path, size, content_type, uploaded_at, kind)
|
||||
← kind: source / intermediate / artifact
|
||||
usage_events(id, tenant_id, task_id, run_id, kind, value, ts)
|
||||
← 计费/审计明细,append-only
|
||||
quotas(tenant_id, max_concurrent_runs, max_tokens_month, max_storage_bytes, ...)
|
||||
tasks(
|
||||
task_id uuid pk,
|
||||
user_id uuid fk,
|
||||
task_dir text not null, -- 相对 user root,如 "project_a/sub"
|
||||
mode text, -- coding / proposal / ppt / chat
|
||||
description text,
|
||||
status text, -- pending / running / paused / done
|
||||
model_profile text,
|
||||
tokens_prompt int default 0,
|
||||
tokens_completion int default 0,
|
||||
cost_usd numeric default 0,
|
||||
created_at timestamptz,
|
||||
updated_at timestamptz
|
||||
);
|
||||
create index on tasks (user_id, task_dir);
|
||||
|
||||
messages(
|
||||
message_id uuid pk,
|
||||
task_id uuid fk,
|
||||
idx int not null,
|
||||
payload jsonb not null, -- LiteLLM dict 原样
|
||||
tokens_in int, tokens_out int,
|
||||
created_at timestamptz,
|
||||
unique (task_id, idx)
|
||||
);
|
||||
create index on messages using gin (payload jsonb_path_ops);
|
||||
-- 对话全文搜按需加 tsvector + GIN(中文起步 simple + pg_trgm)
|
||||
|
||||
runs(run_id uuid pk, task_id fk, status, started_at, finished_at, error, tokens_p, tokens_c)
|
||||
usage_events(id, user_id, task_id uuid, run_id uuid, kind, value, ts)
|
||||
-- append-only。task_id/run_id 不 FK,task 硬删后审计记录仍存活
|
||||
```
|
||||
|
||||
**文件走本地磁盘**:
|
||||
**No-subtask 校验**(`create_task` 入口):
|
||||
|
||||
```
|
||||
<storage_root>/
|
||||
tenants/{tenant_id}/
|
||||
tasks/{task_id}/
|
||||
source/ ← 用户上传(PDF / 团队介绍等)
|
||||
intermediate/← 中间产物(spec_lock.md / sections / slides)
|
||||
artifact/ ← 最终产物(.docx / .pptx)
|
||||
```sql
|
||||
SELECT 1 FROM tasks
|
||||
WHERE user_id = ?
|
||||
AND ( ? LIKE task_dir || '/%' -- new 在已有之下 → 拒
|
||||
OR task_dir LIKE ? || '/%' ); -- 已有在 new 之下 → 拒
|
||||
-- 同 task_dir 允许(同 folder 多 task)
|
||||
```
|
||||
|
||||
`files.path` 存相对 `<storage_root>` 的路径。`<storage_root>` 由部署配置决定(单机 = 一个目录,多 worker = 共享挂载点)。
|
||||
**Folder rename**(改名 `old → new`,FS rename 成功后跑):
|
||||
|
||||
为什么本地而不 S3:简化首版部署,运维门槛低;访问延迟低;tasks 文件总量 100GB 级别本地盘够用。规模真起来后,**files 表 + storage 抽象层只需换 backend,接口不动**。
|
||||
```sql
|
||||
UPDATE tasks
|
||||
SET task_dir = ? || substring(task_dir from char_length(?) + 1) -- new, old
|
||||
WHERE user_id = ? AND (task_dir = ? OR task_dir LIKE ? || '/%'); -- old, old
|
||||
```
|
||||
|
||||
LIKE 用 `old/%` 而非 `old%`,避免 `project_a` 误中 `project_a_other`。**running task 引用该 folder 时禁 rename / delete**(后端校验 + UI 禁按钮)。
|
||||
|
||||
**Folder delete**:hard cascade,前端 modal 列影响面("将删 N 个对话、M 条消息、K 个文件")+ 输入 folder 名二确认。
|
||||
|
||||
```sql
|
||||
-- 先 DB 后 FS;DB 失败 FS 不动一致;DB 成功 FS 失败由后台 GC 兜底清孤儿目录
|
||||
DELETE FROM messages
|
||||
WHERE task_id IN (SELECT task_id FROM tasks
|
||||
WHERE user_id=? AND (task_dir=? OR task_dir LIKE ?||'/%'));
|
||||
DELETE FROM tasks
|
||||
WHERE user_id=? AND (task_dir=? OR task_dir LIKE ?||'/%');
|
||||
-- 然后 FS 递归删 folder
|
||||
```
|
||||
|
||||
`usage_events` 不参与 cascade(审计 append-only)。
|
||||
|
||||
**文件系统**:
|
||||
|
||||
```
|
||||
<storage_root>/users/<user_id>/
|
||||
memory/{core.md, extended/} # 跨 task 的 per-user 记忆,不入 DB
|
||||
project_a/source/ sections/ proposal.docx
|
||||
project_b/...
|
||||
```
|
||||
|
||||
本地优先 S3(简化部署 / 低延迟),storage 抽象层留好后续可换 backend。
|
||||
|
||||
**Storage 实现:单一 PG ORM**(本地 + SaaS 共用):
|
||||
- 一份 schema、一份 ORM(SQLAlchemy)、一份查询代码,无 adapter 抽象层,无 SQL 方言适配,无契约测试
|
||||
- 本地 dev 连接:`ZCBOT_DB_URL=postgresql://...` 环境变量;repo 自带 `docker-compose.yml` 起本地 PG(零配置)或连远端 dev / staging PG
|
||||
- Schema 演化:alembic 管理 migration,`db/migrations/*.py` 与代码一同版本化;CLI 启动校验当前 schema 版本,落后报错让用户跑 `cli db upgrade`(本地)或部署管线自动 `alembic upgrade head`(SaaS)
|
||||
- 旧 workspace JSON 一次性迁移:`cli migrate-from-fs --workspace ./workspace` 把 `state.json` / `messages.json` 导入 PG,完成后 workspace 进只读 archive 模式
|
||||
- 本地单用户 sentinel:DB init 时若 users 表无 sentinel 行则 INSERT;本地 CLI 所有 tasks 全 FK 到这一行,无 auth 流程,但 schema 与 SaaS 完全一致
|
||||
- memory 不参与:per-user FS,两形态都不入 DB
|
||||
|
||||
### 7.5 沙盒:Per-task 容器 + Per-run exec
|
||||
|
||||
| 选择 | 理由 |
|
||||
|---|---|
|
||||
| 每 task 一个长驻容器 | 起容器 ~300ms 太慢;一个 task 多轮 tool call 共享容器才划算 |
|
||||
| 每 run 一次 `docker exec` | 进容器跑 run_python/shell;exec 级 timeout/资源限制 |
|
||||
| 容器空闲 N 分钟回收 | 不浪费;下次 resume 重新拉起 |
|
||||
| `task_dir` 直接 bind mount 进容器 | 宿主 `<storage_root>/.../tasks/{id}/` 挂到容器 `/workspace`,无同步开销 |
|
||||
| 每 task 长驻容器 | 起容器 ~300ms 太慢;多轮 tool call 共享划算 |
|
||||
| 每 run 一次 `docker exec` | exec 级 timeout/资源限制 |
|
||||
| 空闲 N 分钟回收 | 不浪费,resume 时拉起 |
|
||||
| **bind mount = user root** | `<storage_root>/users/<user_id>/` → 容器 `/workspace`;同用户多 task 不互隔(协作方便),跨用户由独立容器实例隔离 |
|
||||
|
||||
**资源限制**:cgroup CPU/mem 上限、磁盘配额、网络 egress allowlist(只能出 LLM API 和 PyPI 镜像)、root 文件系统 read-only、no-new-privileges、drop ALL caps。
|
||||
**资源限制**:cgroup CPU/mem、磁盘配额、egress allowlist(只放 LLM + PyPI 镜像)、root fs read-only、no-new-privileges、drop ALL caps。
|
||||
|
||||
**选型**:Phase 起步用 **Docker**(运维门槛低);流量起来后视情况换 gVisor / Firecracker / e2b。Executor Protocol 抽象后切换成本低。
|
||||
**选型**:起步 Docker(运维门槛低);流量起来后视情况换 gVisor / Firecracker / e2b。Executor Protocol 抽象后切换成本低。
|
||||
|
||||
### 7.6 Core 代码改造(按依赖顺序)
|
||||
|
||||
| # | 改造 | 影响文件 | 估时 |
|
||||
| # | 项 | 影响文件 | 估时 |
|
||||
|---|---|---|---|
|
||||
| 1 | **事件流化 `loop.py`** —— `console.print` 改成 `yield Event`;CLI 接 console sink,API 接 SSE sink | `core/loop.py` `cli.py` | 半天 |
|
||||
| 2 | **Storage 层** —— `Session/TaskState` 落 Postgres;`files` 走 `<storage_root>` | `core/session.py` `core/task.py` `main.py` 新增 `core/storage/` | 2 天 |
|
||||
| 3 | **Executor 抽象** —— `run_python`/`shell` 走 `Executor.run(code, timeout, env)`;实现 = `docker exec` 到 per-task 容器 | `tools/run_python.py` `tools/shell.py` 新增 `core/executor/` | 2 天 |
|
||||
| 4 | **Config + 多租户上下文** —— 每次请求带 `(tenant_id, user_id)`,所有 storage/executor 调用都 scoped | `main.py` `cli.py` 全链路 | 1 天 |
|
||||
| 5 | **`api_key_env` 退役** —— 改 `KeyProvider`,运行时从 vault 取(平台 BYO 模式则逐请求注入) | `core/capabilities.py` `core/llm.py` | 半天 |
|
||||
| 6 | **HTTP 外壳** —— FastAPI app,把上面五层包成 `/v1/*` + SSE | 新增 `core/api/` | 3-4 天 |
|
||||
| 1 | ~~事件流化 `loop.py`~~ | 已完成(commit `375bb29`) | — |
|
||||
| 2 | **Storage 落 PG**:`Session` / `TaskState` 改 SQLAlchemy ORM 写 PG `messages` / `tasks` 表(单一实现,无 adapter 抽象);alembic 管 schema migration;`cli migrate-from-fs` 一次性把现有 workspace JSON 导入;repo 加 `docker-compose.yml` 起本地 PG 用于 dev | `core/session.py` `core/task.py` 新增 `core/storage/` `db/migrations/` `cli.py::migrate_from_fs` `cli.py::db_upgrade` `docker-compose.yml` `requirements.txt` | 3 天 |
|
||||
| 3 | **task_dir 双形态共存**:`TaskState.task_dir` 可显式指定(本地默认 `workspace/tasks/<task_id>/`,SaaS = 用户给路径);`tools/fs.py::_resolve` 接受 task_dir 注入;system prompt 注入逻辑两形态共用 | `core/task.py` `tools/fs.py` `main.py` `prompts/system/general_v1.md` | 1 天 |
|
||||
| 4 | **Folder API**:list / create / rename(cascade + 锁 running task) / delete(hard cascade,前端二确认强校验) / upload / download | 新增 `core/folders/` | 2 天 |
|
||||
| 5 | **No-subtask 校验**:`create_task` 入口跑 §7.4 的 SQL | `core/task.py` | 0.5 天 |
|
||||
| 6 | **Executor + 沙箱**:`run_python`/`shell` → `Executor.run(...)`,`docker exec` 到 per-user/per-task 容器;`api_key_env` → `KeyProvider`(运行时注入);**本地形态保留 subprocess executor**,SaaS 形态走 docker executor | `tools/run_python.py` `tools/shell.py` `core/capabilities.py` `core/llm.py` 新增 `core/executor/` | 2-3 天 |
|
||||
| 7 | **HTTP /v1**:FastAPI + SSE + OIDC | 新增 `core/api/` `core/auth/` | 4 天 |
|
||||
| 8 | **CLI 双模式**:加 transport 层抽象 —— 无 `--remote` 时走 in-process 直调 core(本地形态);`--remote <url>` 走 HTTP API client(dogfood ≡ 真实用户路径);**不删除本地直跑** | `cli.py` 加 `core/transport/` | 1.5 天 |
|
||||
|
||||
代码量增量预估:**+800~1200 行**(API 层 + storage 层 + executor 层 + 配套测试)。
|
||||
代码量增量:**+1000~1500 行**(单一 PG 实现比双 adapter 方案省 500-800 行;无契约测试集 / 无方言适配层)。
|
||||
|
||||
### 7.7 职责矩阵
|
||||
### 7.7 分阶段落地
|
||||
|
||||
| 事项 | Core | Platform | 备注 |
|
||||
| 阶段 | 范围 | 工作量 | 验收 |
|
||||
|---|---|---|---|
|
||||
| 终端用户 auth | – | ✅ | OIDC/Clerk |
|
||||
| 平台↔core 鉴权 | ✅ 验签 | ✅ 签发 | Bearer + JWT |
|
||||
| 多租户数据隔离 | ✅ enforce | – | platform bug 不能跨租户 |
|
||||
| Prompt injection 防护 | ✅ | – | 只有 core 看得见 LLM I/O |
|
||||
| 敏感数据出站审计 | ✅ 产事件 | ✅ 消费转 SIEM | 双层 |
|
||||
| 配额超限拒绝 | ✅ 计数 + 拒绝 | ✅ 展示给用户 | core 不能信平台传值 |
|
||||
| 文件病毒扫描 | ✅ 入库再扫一次 | ✅ pre-upload 扫 | 双层 |
|
||||
| GDPR 删除 | ✅ 提供 `DELETE` | ✅ 触发 | 数据在 core 这边 |
|
||||
| LLM API key(BYO) | 运行时注入,**不持久化明文** | ✅ 加密存,逐请求传 | 降攻击面 |
|
||||
| 计费 | ✅ 产 usage 事件 | ✅ 汇总 + Stripe | core 不碰钱 |
|
||||
| 监控 / SLO | ✅ 自己负责 | – | 独立服务 |
|
||||
| A | §7.6 #1 | done | ✅ |
|
||||
| B | §7.6 #2 #3 #4 #5(Storage 落 PG + task_dir 双形态 + Folder API + no-subtask) | ~1 周 | 本地 CLI 走 PG,messages 进 DB 可全文搜;多 task + folder rename 单测过;`migrate-from-fs` 跑通 |
|
||||
| C | §7.6 #6(Executor + sandbox) | 3 天 | 两本地账号互不可见对方 folder,本地 subprocess executor 仍可用 |
|
||||
| D | §7.6 #7(HTTP /v1 + auth) | 4 天 | curl/Postman 跑通主流程 |
|
||||
| E | §7.6 #8(CLI transport 双模式) | 1.5 天 | CLI 默认本地直跑保留,`--remote` 走 HTTP 也跑通 |
|
||||
| F | 上线打磨(限流 / 监控 / 告警 / HA) | 持续 | SLO 99.5% |
|
||||
|
||||
### 7.8 分阶段落地
|
||||
**B 阶段一次性切换** —— 切到 PG 后本地与 SaaS 走相同代码路径,无回退、无双轨。**dogfood 即生效**(messages 进 DB → 全文搜、jsonb 查询立刻可用)。前置:repo 提供 `docker-compose.yml`,作者本机 `docker compose up -d postgres` 一行准备好 dev DB。
|
||||
|
||||
| 阶段 | 目标 | 工作量 | 验收 |
|
||||
|---|---|---|---|
|
||||
| **A** 改造 §7.6 #1(事件流化) | CLI 不变,但 loop yield event;为后续铺路 | 半天 | CLI 走 event sink 跑通 dogfood |
|
||||
| **B** 改造 #2-#5(storage / executor / DI / key)| 单进程仍可跑;接口齐备 | 1 周 | CLI 接 Postgres 跑通本地多 task |
|
||||
| **C** 改造 #6(HTTP 外壳)| `/v1/*` 跑通,docker compose 起完整栈(core api + sandbox + PG) | 4 天 | curl / Postman 跑通主流程 |
|
||||
| **D** 多租户 + Auth + Quota + Audit | 平台接得上 | 1 周 | 平台 demo 跑通 |
|
||||
| **E** 上线打磨(限流/监控/告警/HA) | 可承接平台真实流量 | 持续 | SLO 99.5% |
|
||||
|
||||
**A** 立刻可做,独立有价值。**B-D** 等平台团队 kickoff 时间锁定后开。**E** 上线后持续投入。
|
||||
|
||||
### 7.9 已知风险
|
||||
### 7.8 已知风险
|
||||
|
||||
| 风险 | 缓解 |
|
||||
|---|---|
|
||||
| 过早抽象违背 §5 哲学 | A 阶段单独有价值(支持 Web UI);B-E 等平台到位再做 |
|
||||
| `/v1` 冻死后核心演化变慢 | minor 向后兼容窗口,major 6 个月 deprecation;内部加 `/v1internal` 用于实验 |
|
||||
| Sandbox 网络出站限制不当 | Egress allowlist 起步只放 LLM endpoint + PyPI 镜像;skill 需要新出站靠申请 |
|
||||
| Per-task 容器 ID 泄漏到对话 | tool 结果 sanitize,容器内 hostname/IP 不暴露 |
|
||||
| 平台 bug 把 core 冲垮 | 平台维度限流(rate limit by Bearer key)+ 租户维度并发上限 |
|
||||
| 文件计费/存储滥用 | 上传大小上限、月度配额、保留期(过期自动清) |
|
||||
| LLM 成本失控 | BYO key 默认;平台代付要 per-tenant 月预算硬上限 |
|
||||
| 本地盘容量瓶颈 | files 表 + storage 抽象层,换 backend 接口不动;LRU 清理冷 task |
|
||||
| 多 worker 共享本地盘 | 起步单机部署即可;需要扩 worker 时上 NFS 或换对象存储 |
|
||||
| 过早抽象违背 §5 哲学 | B 阶段单一 PG 实现无 adapter 抽象层;C-E 各阶段独立 dogfood 价值,"先有场景再加" |
|
||||
| 本地 PG 连接 / 离线 dogfood | `docker compose up -d` 本地起 PG 兜底;也支持连远端 dev / staging PG;CI 用 ephemeral PG container |
|
||||
| CLI 双模式分叉、本地直跑被忽略 | transport 层抽象统一接口;CI 跑 in-process 和 HTTP 两路径同一组用例 |
|
||||
| `/v1` 冻死后演化慢 | minor 半年兼容,major 6 个月 deprecation;`/v1internal` 实验 |
|
||||
| Rename 误命中前缀 / 漏改子 task | cascade SQL + 单测覆盖 `project_a` 不中 `project_a_other` |
|
||||
| 运行中 task 被 rename / delete | 后端校验 + UI 禁按钮 |
|
||||
| 误删 folder 丢对话 | 前端二确认 + 输入 folder 名;真要再加 trash bin(延迟 cascade) |
|
||||
| DB-then-FS 中断留孤儿目录 | 后台 GC 周期扫 "FS 有但 DB 无引用" 的目录 |
|
||||
| 同 folder 多 task 并发写同名文件 | 文件级悲观锁,冲突早失败 |
|
||||
| Sandbox 出站越权 | egress allowlist 起步只放 LLM + PyPI 镜像 |
|
||||
| 资源滥用(LLM / 存储) | BYO key 默认;月度 token & 存储配额;cold task LRU 清 |
|
||||
|
||||
### 7.10 取舍说明
|
||||
### 7.9 取舍说明
|
||||
|
||||
**为什么 Docker 起步而不直接上 Firecracker/gVisor**:Docker 运维门槛最低,Executor Protocol 抽象后可平滑切换。提前上 microVM 是过度工程。
|
||||
**path-as-identity 而非 folder_id**:folder 真实存在于 FS,folder_id 等于造两份 source of truth(易不一致)。rename 是 UI 主动动作,cascade 单事务搞定。
|
||||
|
||||
**为什么不复用 K8s Job per run**:Job 启停成本高(秒级),agent loop 一轮 tool call 才几百毫秒。Per-task 长驻容器 + per-run exec 是性能/隔离的最佳折中。
|
||||
**user auth 而非 tenant 层**:个人 SaaS 用不上。日后做企业版加 `org_id` claim,数据隔离规则等价。提前抽象 MVP 多 NULL 一层。
|
||||
|
||||
**为什么本地文件而不 S3**:首版部署/运维门槛低,访问延迟低,100GB 级别单机够用。storage 抽象层留好,真要切对象存储改 backend 不改接口。
|
||||
**skill 中间件全落 cwd 不引入 artifacts 表**:中间件是用户花 token 生成的资产,可下载可替换;artifacts 表 + 分类是为不确定的 UX 收益预付架构成本。真嫌乱 UI 加折叠视图。
|
||||
|
||||
**为什么 Postgres 而不 SQLite**:service 形态下 API + sandbox + 后续 worker 都要读写状态,SQLite 单写锁会成为瓶颈。Postgres 起步成本可接受。
|
||||
**hard cascade 而非 soft orphan**:`orphaned` 让 list/resume/UI 都多一种特殊 case,代码长尾;"删 folder = 删项目" 比 "留对话残骸" 自然。`usage_events` append-only 不 FK,task 硬删后月账仍存活。
|
||||
|
||||
**Docker + Postgres 起步**:运维门槛最低,Executor 抽象层留好,切 microVM / S3 都是 backend 替换不动接口。
|
||||
|
||||
**本地也用 PG,不用 SQLite / JSON**:
|
||||
1. **dogfood ≡ 真实用户路径** —— 本地与 SaaS 走相同 SQL 方言、相同事务语义、相同 ORM,bug 在 dogfood 阶段就能复现,不会等到生产
|
||||
2. **Docker 已经是必然依赖** —— §7.6 #6 沙盒走 docker exec;装 Docker 是前提,顺手 `docker compose up postgres` 是零增量门槛
|
||||
3. **双 adapter 维护税远高于 PG 一次性配置成本** —— 一份 schema、一份 ORM、一份查询;SaaS 起步即终态,切换成本归零
|
||||
4. **本地 dev 也能连测试服** —— 不强迫本机起 PG,作者可直接连远端 dev / staging PG 跑 dogfood,体感跟连 SaaS 几乎一致
|
||||
|
||||
**CLI 不被 API 取代,而是双模式共存**:本地直跑模式调 core 内部状态比 HTTP roundtrip 顺手;前端用户路径靠 `--remote` 模式打通。transport 层抽象代价小、长期价值高 —— 删本地直跑省不下多少代码,反而失去最便利的调试入口。**离线**靠本地 docker compose PG 兜底,不靠"全栈零依赖"幻觉。
|
||||
|
||||
**Memory 不入 DB**:跨 task 共享靠"同一 user 看同一份 FS 目录"的语义自动达成,不需要 schema。md 文件用户直接编辑器改,DB 化反而要造 UI、违反 §3.7 "事实由用户判断" 原则。两形态 memory 行为一致(只是根目录不同),迁移零成本。
|
||||
|
||||
**为什么 Tasks/Messages 在 PG 但 skill 产物在 FS**:tasks / messages 是元数据 + 对话流,需要查询、过滤、全文搜、跨 task 统计 —— 都是 DB 强项,jsonb GIN / pg_trgm 让查询代码不爆炸。skill 产物(`*.pptx` / `*.docx` / `sections/*.md`)是终用户拿走的文件,期望直接在文件管理器看到、用 Office 打开、邮件附件发出去 —— 进 DB 就要做"导出"这一步多余操作,且二进制 BLOB 在 PG 里没 GIN 索引价值。**FS 是产物的天然存储,DB 是元数据 / 状态 / 查询索引的天然存储,各司其职**。同理 §7.5 沙盒 bind mount = user root,容器里看到的就是用户在 Web UI 里看到的目录,无中间层翻译。
|
||||
|
||||
---
|
||||
|
||||
|
|
|
|||
96
PROGRESS.md
96
PROGRESS.md
|
|
@ -2,7 +2,7 @@
|
|||
|
||||
> 配合 `DESIGN.md` 阅读。本文件只记录 phase 状态、决策偏差、文件量、下一步。
|
||||
|
||||
最后更新:2026-05-11(原子写 + Phase 6 双层记忆)
|
||||
最后更新:2026-05-12(§7 改写为 user-direct SaaS 草案)
|
||||
|
||||
---
|
||||
|
||||
|
|
@ -10,68 +10,42 @@
|
|||
|
||||
| Phase | 标题 | 状态 | 备注 |
|
||||
|------|-----|-----|------|
|
||||
| 1 | 最小可用骨架 | ✅ | 全部验收点过 |
|
||||
| 2 | Skill 系统 + 三个 skill | ✅ | Anthropic 格式;coding/ppt/proposal |
|
||||
| 3 | Hybrid 范式 (run_python) | ✅ | subprocess + 敏感 env 过滤 |
|
||||
| 4 | 演化性能力 | 🟡 | Model Profile + Capability Probing ✅;版本化 prompts 未做 |
|
||||
| 5 | Eval Suite | ⏸ 不做 | 个人工具用 dogfooding 替代,probe 覆盖健康检查 |
|
||||
| 6 | 长任务工程化 | 🟡 | task + state.json + 中断恢复 ✅;双层记忆 ✅;context 压缩未做 |
|
||||
| 7 | 打磨 | ❌ | Docker 沙盒 / 更多 skill / Web UI |
|
||||
| §7 platform track | Core/Platform 切分(SaaS 化) | 🟡 | A 阶段 loop 事件流化 ✅;B-E 待平台 kickoff 后开 |
|
||||
| 1-3 | 骨架 + Skill + run_python | ✅ | 三个 skill;CoreCoder 唯一匹配 edit;敏感 env 过滤 |
|
||||
| 4 | 演化性能力 | 🟡 | Model Profile + Probing ✅;版本化 prompt 未做 |
|
||||
| 5 | Eval Suite | ⏸ 不做 | dogfooding 替代,probe 覆盖健康检查 |
|
||||
| 6 | 长任务工程化 | 🟡 | task + state.json + 恢复 ✅;双层记忆 ✅;context 压缩未做 |
|
||||
| 7 | 打磨 | ❌ | Docker 沙盒 / 更多 skill |
|
||||
| §7 SaaS 化 | DESIGN §7 路线 | 🟡 | A 事件流化 ✅;B (Storage 落 PG + task_dir 双形态 + Folder API + no-subtask) 可立刻开,本地与 SaaS 共用同一种 storage |
|
||||
|
||||
---
|
||||
|
||||
## 已完成关键能力
|
||||
|
||||
**Phase 1-3**(2026 早期):骨架 + skill 系统 + run_python。所有工具基目录是用户当前 cwd(不是 zcbot 仓库本身),agent 操作的是用户项目。`tools/fs.py` 的 `edit` 用 CoreCoder 风格唯一匹配。`tools/run_python.py` 过滤 `*API_KEY *TOKEN *SECRET *PASSWORD *PRIVATE_KEY` 环境变量。三个 skill 中 `ppt/` 最完整(v3:商务红硬约束 + apply_brand 品牌条 + Iconify 图标库 + scripts:fetch_icon / quality_check / render_icon;素材摄取改用 markitdown CLI)。
|
||||
**2026-Q1 ~ 05-06:Phase 1-4** —— 骨架 / 三个 skill(coding/ppt/proposal)/ run_python 范式 / Model Profile + Capability Probing。`ppt` v3:商务红约束 + apply_brand + Iconify + render_icon/quality_check;素材摄取改 markitdown CLI。
|
||||
|
||||
**Phase 4**(2026-05-06):
|
||||
- `core/probe.py` + `cli.py probe` —— basic_chat / parallel_tools / thinking_mode / long_context 四项探测
|
||||
- 真实 probe 跑通,**flash mismatch 发现**:yaml `parallel_tools: false` 但实测能并发(暂不自动改 yaml,需更多场景观察)
|
||||
- pro 全 ok
|
||||
**2026-05-06:Phase 6 部分** —— task + state.json + tokens 累计;CLI `tasks` + REPL `/status /done /abandon /desc`;移除 legacy `workspace/sessions/`。
|
||||
|
||||
**Phase 6 部分**(2026-05-06):
|
||||
- `core/task.py` + `workspace/tasks/<id>/{state.json, messages.json}` —— TaskState 跟 mode/desc/status/tokens/timestamps;`build_agent` 返 5 元组;`sync_task_tokens` 每轮后写回
|
||||
- CLI 新增 `tasks` 子命令 + REPL `/status /done /abandon /desc`;`chat` 加 `--mode --desc` 选项
|
||||
- 移除 legacy `workspace/sessions/` 兼容(单一布局)
|
||||
**2026-05-07:TUI 打磨 + task_dir 落地** —— rich Markdown 渲染;thinking spinner 显实时耗时+累计 token;system prompt 注入 task_dir 绝对路径,skill 产物全收敛 `workspace/tasks/<id>/`;`.gitignore` 删 bandaid 行。
|
||||
|
||||
**TUI 打磨 + task_dir 落地**(2026-05-07):
|
||||
- assistant 文字走 `rich.markdown.Markdown`,粗体/列表/表格/代码块正常渲染(非流式)
|
||||
- thinking spinner 由 daemon 线程每 100ms 刷文案,显示实时耗时 + 累计 token;每轮 LLM 返回追加 dim 一行 `[in N out N t Xs]` 留痕
|
||||
- system prompt 显式注入 `task_dir` 绝对路径,SKILL.md 里 `<task_dir>` 占位符**真正落地**;`spec_lock.md` / `sections/` / `slides/` / 最终 docx/pptx 全收敛到 `workspace/tasks/<id>/`
|
||||
- `.gitignore` 删 `sections/` `slides/` `spec_lock.md` 三条无锚 bandaid —— 现在写错位置 git status 立刻报红,不再靠 ignore 兜底
|
||||
**2026-05-08:REPL task 切换 + 懒创建** —— `/resume [last|<id>]`;`build_agent` 不预占文件,首条 user 消息触发 save;`_cleanup_if_empty` 三条件守门防误删。
|
||||
|
||||
**REPL 内 task 切换 + 懒创建**(2026-05-08):
|
||||
- `/resume [last|<id>]` REPL 命令,无参数列最近 10 个 task 表格让用户挑序号或 task_id;和 `/new` 对称,都在 REPL 内重建 (agent, session, sid, task_state, task_dir) 五元组。`tasks` 命令和 `/resume` 共用 `_list_task_rows` helper
|
||||
- **懒创建 task_dir**:`build_agent` 新建分支不再 `session.save()` / `task_state.save()` 占位,推迟到首条 user 消息触发的 `Session.append → save()`。启动 REPL 立刻 `/exit` 磁盘无痕,跨进程安全(没有"另一个 REPL 刚 build_agent 没说话就被本进程当空 task 删"的窗口)
|
||||
- `_cleanup_if_empty` 在切走前(`/exit /quit /new /resume` + Ctrl-C/EOF)守门。三条都满足才删 task_dir:① 无 user 消息 ② 目录在磁盘上 ③ 文件集 ⊆ `{messages.json}`(state.json 存在 = 用户跑过 `/done /abandon /desc` 留下显式痕迹,要保)
|
||||
**2026-05-09 → 05-10:§7 草案 + 对话导出** —— DESIGN §7 初版 SaaS 草案(后于 05-12 重写);`cli.py export <task_id>` + `core/export_docx.py` 导对话成 docx。
|
||||
|
||||
**§7 草案 + 对话导出**(2026-05-09 → 05-10):
|
||||
- DESIGN §7 加 Core/Platform 切分草案(SaaS 化方向):资源模型 `/v1/*` + SSE 事件流、Postgres + 本地盘存储、Per-task Docker 容器 + per-run exec、多租户鉴权与隔离、A-E 五段落地。**§1-§6 personal-tool 路线照走,不阻塞 dogfood**
|
||||
- `cli.py export <task_id> [--out path]` + `core/export_docx.py` —— 把 task 对话(user/assistant/tool)倒成 `.docx`,assistant 走 markdown→docx 转换;方便归档/外发
|
||||
**2026-05-11:原子写 + 双层记忆 + §7 A** —— `atomic_write_text` 接管 save;`core/memory.py` 双层记忆(core.md 入 prompt,extended/* 走索引);loop 事件流化(`sink.emit`)铺 SSE 路。
|
||||
|
||||
**§7 A 阶段:loop 事件流化**(2026-05-11):
|
||||
- `core/loop.py` 去掉所有 `console.print`,改 `sink.emit({type, ...})`。事件:`llm_start / llm_end / text / tool_call / tool_result / done`
|
||||
- 新增 `core/sinks.py` + `ConsoleEventSink` 接管渲染:spinner / `[in N out N t Xs]` / assistant Markdown / `tool>(args)` / 结果预览。CLI 行为**零回归**
|
||||
- 给后续 SSE 铺路:接 HTTP 时换 sink 实现(把 emit 转 yield)即可,loop 一行不用动
|
||||
|
||||
**原子写 + 双层记忆**(2026-05-11):
|
||||
- `core.session.atomic_write_text`(tmp + fsync + `os.replace`)接管 `Session.save` / `TaskState.save`,中途异常不留 0 字节;`_cleanup_if_empty` 放过 `*.tmp` 孤儿
|
||||
- 新增 `core/memory.py`:`workspace/memory/core.md` 注 system prompt,`extended/*.md` 索引(标题+绝对路径)注 prompt,内容靠 `read` 工具按需拉
|
||||
- `_build_system_prompt` 提出来,**new 和 resume 都走同一段**,memory 演化即时生效(resume 时覆盖 `messages[0]`,代价是上一轮的 system 段不再同形,memory 时效性更重要)
|
||||
- DESIGN §3.7 记法,目录树补 `workspace/memory/`
|
||||
**2026-05-12:§7 改写** —— 原 platform/core 多租户方案废弃,改 user-direct(folder-centric,task/messages 入 PG,no-subtask 约束,hard cascade delete)。
|
||||
|
||||
---
|
||||
|
||||
## 关键决策与偏差
|
||||
|
||||
| 项 | 决策 | 与设计差异 |
|
||||
|---|------|-----------|
|
||||
| 工具基目录 | 用户当前 cwd(读)+ task_dir(写) | system prompt 同时给 cwd 与 task_dir 绝对路径,SKILL.md `<task_dir>` 占位符指向 task_dir |
|
||||
| Workspace 用途 | `tasks/<id>/{state.json, messages.json}` + `memory/{core.md, extended/}` | memory 跨 task 共享 |
|
||||
| Eval Suite | 不做 | 设计为团队场景;个人工具 dogfooding 替代 |
|
||||
| 版本化 prompt | 直接 `general_v1.md`,无 active.md 软链接 | Windows 软链接麻烦,真要切版本时再做 |
|
||||
| run_python 沙盒 | subprocess + env 过滤 | 阶段 1 设计如此;Docker 待 Phase 7 |
|
||||
| 项 | 决策 | 备注 |
|
||||
|---|------|------|
|
||||
| 工具基目录 | cwd(读)+ task_dir(写) | system prompt 同时注入两者绝对路径 |
|
||||
| Workspace 布局 | `tasks/<id>/` + `memory/{core.md, extended/}` | memory 跨 task 共享 |
|
||||
| Eval Suite | 不做 | 个人工具用 dogfooding |
|
||||
| 版本化 prompt | 直接 `general_v1.md` | Windows 软链接麻烦,真要切再做 |
|
||||
| run_python 沙盒 | subprocess + env 过滤 | Docker 在 §7 C 阶段 |
|
||||
|
||||
---
|
||||
|
||||
|
|
@ -80,33 +54,35 @@
|
|||
```
|
||||
core/capabilities.py 71
|
||||
core/llm.py 89
|
||||
core/loop.py 152 ← §7 A: 去 console.print,改 sink.emit
|
||||
core/sinks.py 101 ← §7 A 新增: ConsoleEventSink
|
||||
core/ui.py 38 ← 语义化 console 主题
|
||||
core/probe.py 243 ← Phase 4
|
||||
core/loop.py 152 ← §7 A: sink.emit
|
||||
core/sinks.py 101 ← §7 A
|
||||
core/ui.py 38
|
||||
core/probe.py 243
|
||||
core/session.py 93 ← +atomic_write_text
|
||||
core/skills.py 81
|
||||
core/task.py 64 ← Phase 6
|
||||
core/memory.py 76 ← Phase 6 双层记忆
|
||||
core/export_docx.py 372 ← task 对话导出 .docx
|
||||
core/task.py 64
|
||||
core/memory.py 76
|
||||
core/export_docx.py 372
|
||||
tools/base.py 34
|
||||
tools/fs.py 182
|
||||
tools/shell.py 94
|
||||
tools/run_python.py 84
|
||||
tools/skill_tool.py 45
|
||||
main.py 210 ← +memory 注入 (_build_system_prompt)
|
||||
cli.py 439 ← +export 命令 / cleanup 放过 .tmp
|
||||
main.py 210
|
||||
cli.py 439
|
||||
─────────────────────────────────
|
||||
Python 合计 ~2429 行
|
||||
```
|
||||
|
||||
加上 skills/ppt 下的脚本(~600 行)、SKILL.md / references / config / prompts,总仓库约 3000 行可读源码。
|
||||
加 skills/ppt 脚本 ~600 行 + SKILL.md / references / config / prompts,总仓库约 3000 行。
|
||||
|
||||
---
|
||||
|
||||
## 下一步候选(性价比排序)
|
||||
|
||||
1. **§7 B 阶段:Storage / Executor / DI / KeyProvider**(~1 周)—— Session/TaskState 落 Postgres、Executor 抽象走 docker exec、(tenant_id, user_id) 上下文透传、API key 改 KeyProvider。**等平台 kickoff 时间锁定后开**
|
||||
2. **Phase 6 context 三层压缩**(~1 天)—— 兜底用,V4 长上下文一般用不到
|
||||
1. **§7 B 阶段**(~1 周)—— Storage 落 PG(单一实现,无 adapter 抽象)+ task_dir 双形态 + Folder API + No-subtask。**dogfood 即生效**(messages 进 DB → 全文搜立刻可用)。
|
||||
- 前置:repo 加 `docker-compose.yml`(`docker compose up -d postgres` 起本地 dev PG)或 `ZCBOT_DB_URL` 指向远端测试 PG
|
||||
- 里程碑:① schema + alembic 初版迁移 ② SQLAlchemy ORM 接入 `Session` / `TaskState` ③ CLI 适配(去 `.json` 读写,加 `_cleanup_if_empty` 新逻辑)④ `cli migrate-from-fs` 工具(把现有 `workspace/tasks/*/` 导入 PG)⑤ Folder API + no-subtask SQL 校验 ⑥ 本地单用户 sentinel(`user_id='00000000-...'`)init 流程
|
||||
2. **Phase 6 context 三层压缩**(~1 天)—— 兜底,V4 长上下文一般用不到
|
||||
3. **Phase 7 更多 skill / 模型档案**(持续)
|
||||
4. **Proposal mermaid 流程图预渲染**(~半天,看到第二张图再做)—— 现状是 ASCII 框图走 fenced code 透传 (新宋体 + Consolas + xml:space=preserve),中文与 box drawing 字符宽度对不齐时还是有错位。增强方案: ` ```mermaid ` 块在 `render_docx.py` 里调 `mmdc` (mermaid-cli) → PNG → `add_picture` 嵌入。依赖 Node.js + `npm i -g @mermaid-js/mermaid-cli`,首次配置略麻烦,所以等 ASCII 透传明显不够用再做
|
||||
4. **Proposal mermaid 流程图预渲染**(~半天)—— ASCII 透传不够用时再上 `mmdc`(Node.js 依赖)
|
||||
|
|
|
|||
Loading…
Reference in New Issue