zcbot

Commit Graph

Author	SHA1	Message	Date
caoqianming	8263382fd1	feat: 新增豆包 Seed 2.1(turbo/pro/evolving)+ GLM 5.2 文本模型档案(bump 0.30.0) - config/models/doubao.yaml(新建):Seed 2.1 turbo/pro + 自进化 evolving, 走 Ark OpenAI 兼容端点(openai/ 前缀 + ARK_API_KEY,同 local.yaml 范式) - config/models/glm.yaml:加 pro52(GLM 5.2,zai/glm-5.2,1M 上下文),与 glm.pro(5.1)并存 - thinking_mode 均 false(深度思考走 body 协议,非 reasoning_effort 等级,留 TODO) - 单价按火山/智谱 2026-06 发布价;evolving 单价未公布暂按 pro 估值兜底 - RUN.md 更新 ARK_API_KEY 说明(文本+图像+视频三处共用) Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-26 13:05:07 +08:00
caoqianming	0df9e5fe3f	feat(loop): 停机判据从"步数"解耦为"是否在推进" max_iterations 降级为纯安全 backstop(flash 50→120 / pro 100→150), 不再当"轮预算"砍正经长任务;真正的空转防护改用进展信号: - _RepeatGuard.record 多返 productive(净产出=非[Error]且非一字不差重复) - _execute_tool_call 三个返回点都带 productive - run loop 全局 _stall:整步全无净产出+1、任一净产出清零, 连续 _STALL_LIMIT=8 步主动停([stopped: no progress]), 比撞 backstop 早得多掐死循环,配逐指纹 HARD=4 双保险 - 撞 backstop / 空转停都 emit"回复继续可续跑"提示,不再静默停诊断依据:task b27466a0"中途断了"实为撞 max_iterations=50 后干净停、用户离开 25min 回来打"继续"续完(非崩溃);"步骤太长"=DeepSeek API 延迟 126-185s 而非工具(全<13s)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-10 13:22:02 +08:00
caoqianming	af2ad3cef1	feat(usage): 记账给前缀缓存命中折价 + 前端体现缓存命中/真实成本排查"rust→PPT"task(flash,34 轮)发现累计 tokens_in 69.9 万里 88.6% 是缓存命中,但 _fallback_chat_cost_cny 把命中段也按 input 全价算,记账虚高 2-3x。 - capabilities: 加 cache_hit_cny_per_mtoken(deepseek flash 0.1 / pro 0.2; 0=不区分按全价兜底,绝不少记) - usage: 成本公式拆三段「命中×缓存价 + (input−命中)×input价 + output×output价」; loop 把 cache_hit_tokens + 缓存单价透传进 record_chat_usage - web: 不加 DB 列。app.py 加 _usage_aggregates(单查询 GROUP BY usage_events, 复用列表 msg_counts 批量范式,无 N+1)on-the-fly 算每 task 真实成本 + 缓存命中, _task_dict 带出;dev.html 列表行显 ¥、顶栏 formatTaskUsage 显「tok·缓存命中%·¥」 - scripts: backfill_chat_cost_cache_discount.py 按 units 已存 token 重算历史 cost_cny(只改成本列,默认 dry-run,--apply 落库) 折价只对新 chat 事件即时生效;历史走 backfill 脚本(部署后跑)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-05 08:26:09 +08:00
caoqianming	1c30a9e54e	Reduce chat context token usage	2026-06-04 16:41:14 +08:00
caoqianming	cf23c9d178	models: 加 local.{r1,qwen3} 内网模型档案,涉密任务用 DeepSeek-R1 (满血) + Qwen3-30B-A3B(服务端 alias 名是 Qwen/QwQ-32B,实际后端 Qwen3) 部署在 http://182.54.21.126:9000/v1,OpenAI 兼容,共享 LOCAL_LLM_API_KEY env。thinking_mode=false(R1/Qwen3 默认就思考,不通过 reasoning_effort 控制)。 local.qwen3 已通连通性,local.r1 服务器侧调试中。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 15:55:37 +08:00
caoqianming	7fc9570ffe	model: 加 GLM 5.1 档案 (zai provider + 国内站 bigmodel.cn) - config/models/glm.yaml: family=glm, variant=pro, model_id=zai/glm-5.1, api_base 覆盖到 https://open.bigmodel.cn/api/paas/v4,env ZHIPUAI_API_KEY - thinking_mode 暂不开:GLM 协议是 body {"type":"enabled"} 而非 reasoning_effort 等级,需 core/llm.py 加 family 分支才能透传,留 TODO - requirements.txt: litellm 下限 1.50→1.83(zai provider PR #17307 merge 后才内置,旧版不识别 zai/ 前缀会炸) - RUN.md: .env 例子加 ZHIPUAI_API_KEY,probe 命令加 glm.pro Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-20 10:32:15 +08:00
caoqianming	781a216ca6	model: 同 task 内切模型(c 模式 task 级 / A 粒度)+ usage_events v2 表(0006); GET /v1/models; 前端顶栏下拉 + 历史 model 切换点小标 - DB(0006): messages 加 model_profile 列(assistant 行有值); 重建 usage_events 表 v2 形态(event_id/user_id/task_id/message_id/kind/model_profile/units jsonb/cost_usd + 三索引), 0004 删的旧 schema 字段不够多态; tasks.tokens_prompt/completion/cost_usd 保留作粗概览 - ModelCapabilities 加 display_name; deepseek_v4.yaml flash/pro 各填名 - GET /v1/models: 扫 config/models/*.yaml 列可选项(profile/display_name/family/thinking_mode/is_default); POST /v1/tasks + PATCH 接受 model_profile(不传 → cfg["default_model"]; 校验走 ModelCapabilities.load 失败 400) - build_agent: resume 时优先 task.model_profile 而非 cfg default; AgentLoop 加 user_id 透传, 每轮 assistant 入库后调 record_chat_usage(litellm cost map 算钱, 失败吞掉 emit warn 不阻 loop) - core/storage/usage.py 新文件: record_chat_usage(双写 messages.tokens_in/out + model_profile + insert usage_events 一行) - session.append() 返回 message_id(供 usage 关联) - 前端 dev.html: chat-meta 加模型下拉(切了 PATCH + running 中提示"跑完后生效"); 新建对话框 modal 加 nt-model select; renderMessages 按 model_profile 切换点画小标 "── DeepSeek V4 Pro ──" - CLAUDE.md: 加"开发测试期 / 不删现有数据 / DROP COLUMN 两种情况"规则 - DESIGN §7.4 schema 加 messages.model_profile + usage_events v2 段; PROGRESS 加 0006 条目 + 文件清单 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-19 21:43:13 +08:00
caoqianming	3a66849953	Initial import: zcbot personal task agent DESIGN.md / PROGRESS.md 落地 Phase 1-3: - core/: LiteLLM 封装 + ReAct loop + 会话持久化 + Anthropic skill registry - tools/: read/write/edit/glob/grep/shell/run_python/load_skill (Hybrid 范式) - skills/coding \| proposal: WHY+WHAT 风格 SKILL.md - skills/ppt: 完整渐进披露 (SKILL + 4 references + 3 scripts) · 借鉴 hugohe3/ppt-master 的两阶段 + spec lock 思路 · MSO_SHAPE 图标体系 + 安全区 + 越界检测 · 默认商务红主题 (#C00000 / #E15554 / #FFC107) - config/models/: DeepSeek V4 flash/pro 档案 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-06 11:02:59 +08:00

8 Commits