zcbot/config/models/doubao.yaml

# 豆包 Seed 2.1 文本/Agent 模型档案(火山方舟 Ark)
# 走 Ark 的 OpenAI 兼容 /chat/completions:litellm 用 `openai/` 前缀 + api_base 覆盖,
# 与 config/models/local.yaml 同范式(避免 litellm volcengine provider 的版本/字段差异)。
# api_key 复用媒体侧的 ARK_API_KEY(同一火山账号),env 见 RUN.md。
#
# thinking_mode 暂设 false:Seed 2.1 是深度思考模型,但开关走 Ark body `thinking:{type:enabled}`,
# 与 OpenAI/DeepSeek 的 `reasoning_effort` 等级协议不同 —— 同 glm.yaml 的处理,要 core/llm.py
# 加 family 分支才能透传等级,留 TODO。设 false 只是不发 reasoning_effort 字段;模型默认仍会
# 深度思考并返回 reasoning_content,不影响调用。
# 单价见各 variant(元/百万 tokens,来源:火山方舟 2026-06 发布价)。
family: doubao

variants:
  turbo:
    display_name: 豆包 Seed 2.1 Turbo
    model_id: openai/doubao-seed-2-1-turbo-260628
    api_base: https://ark.cn-beijing.volces.com/api/v3
    api_key_env: ARK_API_KEY
    max_context: 262144          # 256K
    reliable_context: 131072
    max_output: 16384            # 模型上限 128K(含思考),这里保守取值,需要长输出可调高
    parallel_tools: true         # Ark 兼容 parallel_tool_calls,默认 true
    tool_calling_quality: good
    thinking_mode: false
    reasoning_effort_levels: []
    default_reasoning_effort: ""
    code_quality: good
    enable_run_python: true
    max_iterations: 120   # backstop 兜底,非"轮"预算;真正的空转防护是 loop 的无进展熔断 + _RepeatGuard
    optimal_temperature: 0.3
    prompt_caching: false
    extended_thinking: false
    input_cny_per_mtoken: 3.0
    output_cny_per_mtoken: 15.0
    cache_hit_cny_per_mtoken: 0.6

  pro:
    display_name: 豆包 Seed 2.1 Pro
    model_id: openai/doubao-seed-2-1-pro-260628
    api_base: https://ark.cn-beijing.volces.com/api/v3
    api_key_env: ARK_API_KEY
    max_context: 262144          # 256K
    reliable_context: 131072
    max_output: 16384            # 模型上限 128K(含思考),这里保守取值,需要长输出可调高
    parallel_tools: true
    tool_calling_quality: excellent
    thinking_mode: false
    reasoning_effort_levels: []
    default_reasoning_effort: ""
    code_quality: excellent
    enable_run_python: true
    max_iterations: 150   # backstop 兜底,非"轮"预算;真正的空转防护是 loop 的无进展熔断 + _RepeatGuard
    optimal_temperature: 0.3
    prompt_caching: false
    extended_thinking: false
    input_cny_per_mtoken: 6.0
    output_cny_per_mtoken: 30.0
    cache_hit_cny_per_mtoken: 1.2

  evolving:
    # 自进化版:统一 model_id `doubao-seed-evolving`,每周至少迭代一次,始终指向最新版。
    # 面向 Coding/Agent 持续优化,覆盖全场景(与 pro 旗舰、turbo 低成本并列)。
    display_name: 豆包 Seed Evolving(自进化)
    model_id: openai/doubao-seed-evolving
    api_base: https://ark.cn-beijing.volces.com/api/v3
    api_key_env: ARK_API_KEY
    max_context: 262144          # 256K(随版本可能变,按 Seed 2.1 家族取值)
    reliable_context: 131072
    max_output: 16384
    parallel_tools: true
    tool_calling_quality: excellent
    thinking_mode: false
    reasoning_effort_levels: []
    default_reasoning_effort: ""
    code_quality: excellent
    enable_run_python: true
    max_iterations: 150   # backstop 兜底,非"轮"预算;真正的空转防护是 loop 的无进展熔断 + _RepeatGuard
    optimal_temperature: 0.3
    prompt_caching: false
    extended_thinking: false
    # evolving 官方未单独公布单价,暂按 pro 估值兜底(宁高勿低,不少记成本);公布后校正。
    input_cny_per_mtoken: 6.0
    output_cny_per_mtoken: 30.0
    cache_hit_cny_per_mtoken: 1.2