Spend Control

把 AI 成本控制做成客户愿意付钱的产品

客户不只需要更多模型,更需要知道每个 API key、客户、功能和模型花了多少钱,并能提前限制风险。

Workspace

月预算

API key

预算 / 日限

请求

最大成本

归因

customer_id / feature

从 API key 预算升级到 workspace 预算

现有 API key 月预算继续保留,Spend Control 增加 workspace 层预算、单次请求最大成本和模型 allow/block。

  • 预算命中时返回客户安全的 402/429,并附带剩余额度 header。
  • 模型 allowlist/blocklist 按 workspace 继承到请求执行。
  • 日限和单次请求成本上限防止异常流量扩大损失。

成本归因默认进入账本

客户可以通过 header 或 payload metadata 传入 customer_id 和 feature,用于 usage、billing 和 anomaly review。

  • 支持 X-BatchIn-Customer-Id 与 X-BatchIn-Feature。
  • 归因字段进入 UsageLog 和 billing metadata。
  • 异常提醒基于预算、增长率和模型切换信号。