core: loop 事件流化 (sink 接口, §7 A 阶段)

loop 不直接 console.print —— 改成 sink.emit({type, ...}),sink 决定怎么呈现。新增 ConsoleEventSink 接管 spinner / [in N out N] / assistant 文本 / tool>(args) / 结果预览, CLI 行为零回归。后续接 SSE 时只换 sink 实现,loop 不动。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-11 14:59:32 +08:00 · 2026-05-11 14:59:32 +08:00 · 375bb2999c
parent f6c3492514
commit 375bb2999c
3 changed files with 161 additions and 64 deletions
--- a/core/loop.py
+++ b/core/loop.py
@ -1,19 +1,17 @@
-"""主 agent loop: ReAct 风格,LLM ↔ Tool 反复直到无 tool_call。"""
+"""主 agent loop: ReAct 风格,LLM ↔ Tool 反复直到无 tool_call。
 loop 不直接 print —— 进度通过 sink.emit(event) 上抛。Sink 决定怎么呈现
 (本地 console / SSE / 日志)。事件类型见 core/sinks.py 头部说明。
 """
 from __future__ import annotations
 import json
 import threading
 import time
 from contextlib import contextmanager
 from typing import Any, Dict, Optional, Tuple
 from rich.console import Console
 from rich.markdown import Markdown
 from .capabilities import ModelCapabilities
 from .llm import LLM
 from .session import Session
 from .ui import make_console
 def _extract_usage(usage: Any) -> Tuple[int, int]:
@ -36,7 +34,7 @@ class AgentLoop:
        tools: Dict[str, Any],
        session: Session,
        capabilities: ModelCapabilities,
-        console: Optional[Console] = None,
+        sink: Optional[Any] = None,
        max_iterations: Optional[int] = None,
    ) -> None:
        self.llm = llm
@ -44,68 +42,42 @@ class AgentLoop:
        self.session = session
        self.caps = capabilities
        self.max_iterations = max_iterations or capabilities.max_iterations
-        self.console = console or make_console()
+        self.sink = sink
-    @contextmanager
+    def _emit(self, event: dict) -> None:
-    def _thinking(self):
+        if self.sink is not None:
-        """spinner 实时刷耗时 + 上下文 token 数。yield 出的 ctx 退出后填 elapsed。"""
+            self.sink.emit(event)
        start = time.monotonic()
        stop = threading.Event()
        def fmt() -> str:
            elapsed = time.monotonic() - start
            total = self.llm.token_counter.total
            tail = f"  ctx {total:,} tok" if total else ""
            return f"[muted]thinking... {elapsed:.1f}s{tail}[/muted]"
        class Ctx:
            elapsed: float = 0.0
        ctx = Ctx()
        status = self.console.status(fmt(), spinner="dots")
        def tick() -> None:
            while not stop.wait(0.1):
                try:
                    status.update(fmt())
                except Exception:
                    return
        with status:
            th = threading.Thread(target=tick, daemon=True)
            th.start()
            try:
                yield ctx
            finally:
                stop.set()
                th.join(timeout=0.5)
                ctx.elapsed = time.monotonic() - start
    def run(self, user_message: str) -> str:
        self.session.append({"role": "user", "content": user_message})
        for _ in range(self.max_iterations):
-            with self._thinking() as t:
+            self._emit({"type": "llm_start"})
-                response = self.llm.chat(
+            start = time.monotonic()
-                    messages=self.session.messages,
+            response = self.llm.chat(
-                    tools=[t.schema for t in self.tools.values()],
+                messages=self.session.messages,
-                    reasoning_effort=self.caps.default_reasoning_effort or None,
+                tools=[t.schema for t in self.tools.values()],
-                )
+                reasoning_effort=self.caps.default_reasoning_effort or None,
            )
            elapsed = time.monotonic() - start
            msg = response.choices[0].message
            self.session.append(msg)
            pt, ct = _extract_usage(getattr(response, "usage", None))
-            self.console.print(
+            self._emit({
-                f"[info][in {pt:,}  out {ct:,}  t {t.elapsed:.1f}s][/info]"
+                "type": "llm_end",
-            )
+                "prompt_tokens": pt,
                "completion_tokens": ct,
                "elapsed": elapsed,
            })
            tool_calls = getattr(msg, "tool_calls", None) or []
            content = getattr(msg, "content", None)
            if content:
-                self.console.print("[assistant]assistant>[/assistant]")
+                self._emit({"type": "text", "content": content})
                self.console.print(Markdown(content))
            if not tool_calls:
                self._emit({"type": "done"})
                return content or ""
            for tc in tool_calls:
@ -118,6 +90,7 @@ class AgentLoop:
                    }
                )
        self._emit({"type": "done"})
        return "[reached max iterations]"
    def _execute_tool_call(self, tc: Any) -> str:
@ -128,31 +101,52 @@ class AgentLoop:
        except json.JSONDecodeError as e:
            return f"[Error] invalid JSON arguments for {name}: {e}"
-        preview = json.dumps(args, ensure_ascii=False)
+        args_preview = json.dumps(args, ensure_ascii=False)
-        if len(preview) > 200:
+        if len(args_preview) > 200:
-            preview = preview[:200] + "..."
+            args_preview = args_preview[:200] + "..."
-        self.console.print(f"[tool]tool>[/tool] {name}({preview})")
+        self._emit({
            "type": "tool_call",
            "name": name,
            "args": args,
            "args_preview": args_preview,
        })
        tool = self.tools.get(name)
        if tool is None:
-            return f"[Error] unknown tool: {name}"
+            err = f"[Error] unknown tool: {name}"
            self._emit({"type": "tool_result", "name": name, "result": err,
                        "preview": err, "truncated": False})
            return err
        try:
            result = tool.execute(**args)
        except TypeError as e:
-            return f"[Error] bad arguments to {name}: {e}"
+            err = f"[Error] bad arguments to {name}: {e}"
            self._emit({"type": "tool_result", "name": name, "result": err,
                        "preview": err, "truncated": False})
            return err
        except Exception as e:
-            return f"[Error executing {name}] {type(e).__name__}: {e}"
+            err = f"[Error executing {name}] {type(e).__name__}: {e}"
            self._emit({"type": "tool_result", "name": name, "result": err,
                        "preview": err, "truncated": False})
            return err
        if not isinstance(result, str):
            result = str(result)
        # 控制返回给模型的 tool 结果体量,避免炸 context
        MAX_LEN = 16_000
        truncated = False
        if len(result) > MAX_LEN:
            result = result[:MAX_LEN] + f"\n[... truncated, {len(result) - MAX_LEN} chars ...]"
            truncated = True
        # 给用户预览(截短)
        preview = result if len(result) < 400 else result[:400] + "..."
-        self.console.print(f"[muted]{preview}[/muted]")
+        self._emit({
            "type": "tool_result",
            "name": name,
            "result": result,
            "preview": preview,
            "truncated": truncated,
        })
        return result
--- a/core/sinks.py
+++ b/core/sinks.py
@ -0,0 +1,101 @@
 """EventSink: 把 loop 产生的事件画到目标(本地 console / SSE / 日志)。
 Loop 不直接 print,改 emit({type, ...})。Sink 决定怎么呈现。
 事件类型(loop 当前会发的):
  llm_start    {type}                          —— 一轮 LLM 调用开始
  llm_end      {type, prompt_tokens, completion_tokens, elapsed}
  text         {type, content}                 —— assistant 文字段(整段,非流式)
  tool_call    {type, name, args, args_preview}
  tool_result  {type, name, result, preview, truncated}
  done         {type}                          —— 一次 run 全部结束
 后续接 SSE 时,sink 实现里把 emit 转 yield 即可,loop 一行不用改。
 """
 from __future__ import annotations
 import threading
 import time
 from typing import Callable, Optional
 from rich.console import Console
 from rich.markdown import Markdown
 class ConsoleEventSink:
    """把事件画到 rich console。spinner 在 llm_start..llm_end 之间显示,
    后台 daemon 线程每 100ms 刷耗时 + 累计 token。"""
    def __init__(
        self,
        console: Console,
        token_counter: Optional[Callable[[], int]] = None,
    ) -> None:
        self.console = console
        # 把 LLM 累计 token 数取出来(spinner 文案要用),可选;无则不显示 ctx
        self._tokens = token_counter or (lambda: 0)
        self._status = None
        self._stop: Optional[threading.Event] = None
        self._thread: Optional[threading.Thread] = None
        self._start = 0.0
    def emit(self, event: dict) -> None:
        t = event.get("type")
        if t == "llm_start":
            self._spinner_start()
        elif t == "llm_end":
            self._spinner_stop()
            pt = event.get("prompt_tokens", 0)
            ct = event.get("completion_tokens", 0)
            el = event.get("elapsed", 0.0)
            self.console.print(f"[info][in {pt:,}  out {ct:,}  t {el:.1f}s][/info]")
        elif t == "text":
            content = event.get("content") or ""
            if content:
                self.console.print("[assistant]assistant>[/assistant]")
                self.console.print(Markdown(content))
        elif t == "tool_call":
            name = event.get("name", "")
            preview = event.get("args_preview", "")
            self.console.print(f"[tool]tool>[/tool] {name}({preview})")
        elif t == "tool_result":
            preview = event.get("preview", "")
            self.console.print(f"[muted]{preview}[/muted]")
        # done: 无需输出
    def _spinner_start(self) -> None:
        self._start = time.monotonic()
        self._stop = threading.Event()
        def fmt() -> str:
            elapsed = time.monotonic() - self._start
            total = self._tokens()
            tail = f"  ctx {total:,} tok" if total else ""
            return f"[muted]thinking... {elapsed:.1f}s{tail}[/muted]"
        self._status = self.console.status(fmt(), spinner="dots")
        self._status.__enter__()
        def tick() -> None:
            while not self._stop.wait(0.1):
                try:
                    self._status.update(fmt())
                except Exception:
                    return
        self._thread = threading.Thread(target=tick, daemon=True)
        self._thread.start()
    def _spinner_stop(self) -> None:
        if self._stop is not None:
            self._stop.set()
        if self._thread is not None:
            self._thread.join(timeout=0.5)
        if self._status is not None:
            try:
                self._status.__exit__(None, None, None)
            except Exception:
                pass
        self._status = None
        self._stop = None
        self._thread = None
--- a/main.py
+++ b/main.py
@ -17,6 +17,7 @@ from core.capabilities import ModelCapabilities
 from core.llm import LLM
 from core.loop import AgentLoop
 from core.session import Session
 from core.sinks import ConsoleEventSink
 from core.skills import SkillRegistry
 from core.task import TaskState
 from tools.fs import EditTool, GlobTool, GrepTool, ReadTool, WriteTool
@ -173,7 +174,8 @@ def build_agent(
        rp = RunPythonTool(base_dir=tool_base)
        tools[rp.name] = rp
-    agent = AgentLoop(llm, tools, session, caps, console=console)
+    sink = ConsoleEventSink(console, token_counter=lambda: llm.token_counter.total) if console else None
    agent = AgentLoop(llm, tools, session, caps, sink=sink)
    return agent, session, sid, task_state, task_dir