# 智谱 GLM 模型档案
# 走 litellm 原生 zai provider(1.83+ 内置)。litellm 默认 api_base 是国际站 api.z.ai;
# 国内站 bigmodel.cn 通过 yaml 的 api_base 字段覆盖。两站 API key 不通用,env 也分开命名。
# thinking 暂不接:GLM 的 thinking 协议是 body `{"type":"enabled"}`,与 OpenAI/DeepSeek
# 的 `reasoning_effort` 等级不同,要 core/llm.py 加 family 分支才能透传 — 留 TODO。
family: glm

variants:
  pro:
    display_name: GLM 5.1
    model_id: zai/glm-5.1
    api_base: https://open.bigmodel.cn/api/paas/v4
    api_key_env: ZHIPUAI_API_KEY
    max_context: 200000
    reliable_context: 100000
    max_output: 8192
    parallel_tools: false
    tool_calling_quality: good
    thinking_mode: false
    reasoning_effort_levels: []
    default_reasoning_effort: ""
    code_quality: good
    enable_run_python: true
    max_iterations: 50
    optimal_temperature: 0.3
    prompt_caching: false
    extended_thinking: false

  # GLM 5.2:与 5.1 并存(新增 variant,不动 glm.pro,线上 task 仍引 5.1 不受影响)。
  # 旗舰基座,真正可用的 1M 上下文,适合大仓库/长链路工程任务。thinking 同 pro 留 false(协议同 5.1)。
  pro52:
    display_name: GLM 5.2
    model_id: zai/glm-5.2
    api_base: https://open.bigmodel.cn/api/paas/v4
    api_key_env: ZHIPUAI_API_KEY
    max_context: 1000000          # 真 1M
    reliable_context: 262144
    max_output: 8192
    parallel_tools: false
    tool_calling_quality: good
    thinking_mode: false
    reasoning_effort_levels: []
    default_reasoning_effort: ""
    code_quality: excellent
    enable_run_python: true
    max_iterations: 50
    optimal_temperature: 0.3
    prompt_caching: false
    extended_thinking: false
    input_cny_per_mtoken: 8.0
    output_cny_per_mtoken: 28.0
    cache_hit_cny_per_mtoken: 2.0