推理 API

兼容 OpenAI 的推理平台,同时具备路由、审计和真实可控的运维能力。

用一个平台覆盖文本、图像、音频和向量任务,再按业务增长叠加 VaaS、模型路由和多支付方式。

模型数

38

常驻模型

36

审计

每次调用可接入 VaaS

路由

统一端点

为迁移而设计

继续使用现有 OpenAI SDK,只需替换 base URL 并签发 BatchIn Key,即可保持原有请求和返回结构。

  • 兼容 chat、embeddings、images 和 batch 等 OpenAI 风格接口。
  • 同一个控制台同时支持实时流式和队列型任务。
  • 当你需要可验证性时,可接入 VaaS 审计记录。

不额外套一层黑盒

平台重点提供路由、审计、计费和限流,而不是把模型行为再包进一个不可见的策略层。

  • 支持按 Key 速率限制,以及适用于平台流量的内部 Key 类型。
  • 同一控制台支持 USDC、Stripe 和区域化支付流程。
  • 持续提供延迟、用量和成本可视化,方便长期优化。