zcbot/config/media/doubao.yaml

64 lines
3.3 KiB
YAML
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 豆包(火山方舟 Ark)媒体生成模型档案。
#
# 价格表 last_updated: 2026-05-22
# 源: https://www.volcengine.com/docs/82379/1544106
# https://github.com/ArcReel/ArcReel(费用参考表)
# 豆包调价时手动更新本文件 + 重启 web。历史 usage_events 自带 snapshot 不受影响
# (record_image_usage / record_video_usage 把单价 snapshot 写进 units jsonb 列)。
#
# 接入方式:走 ark 原生 HTTP(litellm 不覆盖图像/视频),core/ark_client.py 封装统一调用。
# image (seedream) 同步返 URL;video (seedance) 异步 task + polling,产物落
# <wd>/videos/<ts>-<rand>.mp4。
ark_api_key_env: ARK_API_KEY
ark_base_url: https://ark.cn-beijing.volces.com/api/v3
image:
seedream_5:
model_id: doubao-seedream-5-0-260128
display_name: 豆包 Seedream 5.0
# 同步生成,3-5 秒出图。OpenAI Images API 兼容路径 /images/generations。
endpoint: /images/generations
price_cny_per_image: 0.22 # 计费单位:成功输出张数;调价改这里 + 重启
default_size: 2048x2048 # 原生最高 3072x3072;2K 兼顾质量/体积
default_watermark: false # 默认无水印(申报/PPT 场景反需求)
default_search: false # web search 额外加价 ~¥0.05/张;默认关
request_timeout_s: 60 # 出图慢于此判超时
video:
seedance_2_fast:
model_id: doubao-seedance-2-0-fast-260128
display_name: 豆包 Seedance 2.0 Fast
# 异步任务:POST /contents/generations/tasks 拿 cgt-xxx → 轮询 GET
# /contents/generations/tasks/<id> 直到 status=succeeded → 取 content.video_url
# (24h 内有效,本 tool 立刻 download 到本地)。
endpoint_submit: /contents/generations/tasks
endpoint_poll: /contents/generations/tasks # 实际路径 = base + "/{cgt_id}"
# 计费(per-token,token = (in_dur+out_dur) × W × H × fps / 1024):
# 文生视频(无视频输入,本期主力路径): ¥37 / 百万 tokens
# 图生视频(有视频输入,phase 2): ¥22 / 百万 tokens
# 实测档位(fast, 5s, 文生视频, 24fps,源: ArcReel 费用参考表):
# 480p 16:9 → ¥1.86
# 720p 16:9 → ¥4.00
# tool 内部按 W×H×duration×fps/1024 估算 tokens × 单价 → cost_cny。响应里若带 usage
# 字段则覆盖估算(待豆包接口实际返回字段校准)。
price_cny_per_mtoken_text2video: 37.0
price_cny_per_mtoken_video2video: 22.0
fps: 24 # token 估算用;豆包当前 24fps 固定
# 支持参数(POST body 字段)
default_resolution: 720p # fast 上限,可选 480p / 720p
default_ratio: "16:9" # 16:9 / 9:16 / 1:1 / 4:3 / 3:4 / 21:9 / adaptive
default_duration: 5 # 4-15s
default_watermark: false
# generate_audio: Seedance 2.0 旗舰特性 —— 原生 AI 生成背景音效 / 角色对白(无需后期配音)。
# 开启会增加 token 消耗(模型还要算音轨),cost 比纯视频高;默认关闭让 cost 可预测,
# 用户要带音的视频(广告 / 角色对白)时显式传 true。
default_generate_audio: false
# 轮询参数
request_timeout_s: 60 # submit POST 超时(异步,只是提交)
poll_interval_s: 5 # 单次 GET 间隔(秒);典型 30-90s 出片
poll_timeout_s: 600 # 总等待上限(10min)→ 超时返 [Error]