# 智谱 GLM 模型档案 # 走 litellm 原生 zai provider(1.83+ 内置)。litellm 默认 api_base 是国际站 api.z.ai; # 国内站 bigmodel.cn 通过 yaml 的 api_base 字段覆盖。两站 API key 不通用,env 也分开命名。 # thinking 暂不接:GLM 的 thinking 协议是 body `{"type":"enabled"}`,与 OpenAI/DeepSeek # 的 `reasoning_effort` 等级不同,要 core/llm.py 加 family 分支才能透传 — 留 TODO。 family: glm variants: pro: display_name: GLM 5.1 model_id: zai/glm-5.1 api_base: https://open.bigmodel.cn/api/paas/v4 api_key_env: ZHIPUAI_API_KEY max_context: 200000 reliable_context: 100000 max_output: 8192 parallel_tools: false tool_calling_quality: good thinking_mode: false reasoning_effort_levels: [] default_reasoning_effort: "" code_quality: good enable_run_python: true max_iterations: 50 optimal_temperature: 0.3 prompt_caching: false extended_thinking: false # GLM 5.2:与 5.1 并存(新增 variant,不动 glm.pro,线上 task 仍引 5.1 不受影响)。 # 旗舰基座,真正可用的 1M 上下文,适合大仓库/长链路工程任务。thinking 同 pro 留 false(协议同 5.1)。 pro52: display_name: GLM 5.2 model_id: zai/glm-5.2 api_base: https://open.bigmodel.cn/api/paas/v4 api_key_env: ZHIPUAI_API_KEY max_context: 1000000 # 真 1M reliable_context: 262144 max_output: 8192 parallel_tools: false tool_calling_quality: good thinking_mode: false reasoning_effort_levels: [] default_reasoning_effort: "" code_quality: excellent enable_run_python: true max_iterations: 50 optimal_temperature: 0.3 prompt_caching: false extended_thinking: false input_cny_per_mtoken: 8.0 output_cny_per_mtoken: 28.0 cache_hit_cny_per_mtoken: 2.0