定价

价格计算器

按模型与调用参数估算每月成本,并对比经过核实的平台级竞品。

API 入口

https://api.luminapath.tech/v1

资金通路

支付宝 / USDC / 企业账单,按产品与账户状态决定

容量路径

共享核心 / 预留推理 / 8 卡以上专属交付

运行姿态

稳定生产级文本与多模态流量

全球网络接入,统一控制平面

统一的高性能智能 API 网关,为全球不同市场提供一致的稳定推理交付。

BatchIn 协同智能调度、安全控制与算力资源,为海内外客户提供本地化支付接入与高可靠的工业级推理算力底座。

查看当前公开合约

全球入口

BatchIn 通过英文站和全球 API 面向海外开发者、AI 团队与企业客户。

这个入口承接美元定价、公开 MCP 发现、OpenAI 兼容调用,以及面向海外客户的销售与交付。

https://batchin.tech · https://api.batchin.tech/v1

中国入口

LuminaPath 通过中文站和国内 API 合约面向中国开发者、企业客户与本地合作伙伴。

这个入口承接人民币导向的开通、国内支持方式和本地化交付,并保持统一的 BatchIn 使用体验。

https://luminapath.tech · https://api.luminapath.tech/v1

运行姿态

面向稳定生产级流量。

流量类型

覆盖文本、视觉、音频、图像和视频混合流量。

流式主路径

区域入口、稳定流式输出与请求连续性。

控制护栏

范围化限流、请求隔离与背压控制。

公开合约与就绪度

OpenAI 兼容端点统一覆盖 chat、responses、embeddings、images、audio 和 video。
公开 MCP transport 与工具发现都走 BatchIn 合约,不暴露执行细节。
流量策略面向稳定生产级文本与多模态负载,而不是只服务演示级流量。
能力可用状态以 usage、cost、billing、trace 和验证记录的一致状态为准。

共享核心

自助开发者与普通企业流量先进入共享 BatchIn 控制核心。

这里统一承接公开 Model API、Batch、Usage、Billing 和公开 MCP 合约。

独立 lane

预留推理、专属端点和更大规模企业流量会进入更强隔离的容量 lane。

客户界面保持一个产品真相,交付、配额和隔离方式按合同切换。

算力真相

8 卡以上专属交付与更小规模小时租都基于同一套算力和容量真相。

公开页面只展示来自已验证算力注册表的库存与可用性。

边缘接入

全球流量先进入区域边缘入口,以保证接入稳定和会话连续性。

延迟优化从客户侧入口开始,再进入主执行链路。

流式交付

BatchIn 在跨区域和多模态负载下保持稳定的流式返回表现。

连接复用与消费隔离用于降低抖动和长尾失败。

流量策略

流量策略通过范围化保护、重试纪律和优雅过载处理保持明确。

客户看到简洁 API 与清晰限制,BatchIn 在幕后处理流量保护。

支付与协议

人类支付、Agent 证明与结算协议分开表达

中文站只展示支付宝自助充值和真实账本口径。

支付与协议状态暂不可用。公开页不会在缺少真实协议目录时宣称充值或结算可用。

并发与能力边界

文本与多模态共用同一商业账号模型

面向稳定生产级文本、视觉、音频、图像和视频混合流量。
全球入口优先处理边缘接入、连接复用、流式交付和区域级限流;中文入口保持本地化开通与商业路径。
普通企业流量进入共享核心;预留推理、专属端点和 8 卡以上整租进入独立 lane / 独立配额 / 更强交付隔离。

模型价格

静态模型价格回退

38 个模型

模型状态公开价格可用性
deepseek-v4-flash
DeepSeek V4 Flash
live联系获取报价可用
deepseek-v4-pro
DeepSeek V4 Pro
exclusive联系获取报价不可用
deepseek-v3-2
DeepSeek V3.2
live联系获取报价可用
qwen3-coder-480b-a35b
Qwen3-Coder-480B-A35B
live联系获取报价可用
qwen3-coder-30b-a3b
Qwen3-Coder-30B-A3B
live联系获取报价可用
qwen3-next-80b-a3b
Qwen3-Next-80B-A3B
live联系获取报价可用
qwen-3-6-plus
Qwen 3.6 Plus
exclusive联系获取报价不可用
qwen3-5-397b
Qwen3.5-397B
live联系获取报价可用
glm-5-1
GLM-5.1
live联系获取报价可用
glm-5
GLM-5
live联系获取报价可用
kimi-k2-6
Kimi K2.6
exclusive联系获取报价不可用
kimi-k2-5
Kimi K2.5
live联系获取报价可用
kimi-k2-instruct-0905
Kimi K2 Instruct 0905
live联系获取报价可用
minimax-m2-7
MiniMax M2.7
exclusive联系获取报价不可用
minimax-m2-5
MiniMax M2.5
exclusive联系获取报价不可用
mimo-v2-pro
MiMo-V2-Pro
live联系获取报价可用
mimo-v2-omni
MiMo-V2-Omni
live联系获取报价可用
mimo-v2-flash
MiMo-V2-Flash
live联系获取报价可用
gpt-oss-120b
GPT-OSS-120B
live联系获取报价可用
gpt-oss-20b
GPT-OSS-20B
live联系获取报价可用
ernie-4-5-300b
ERNIE-4.5-300B
live联系获取报价可用
kat-coder-pro-v2
KAT-Coder-Pro V2
live联系获取报价可用
seed-1-6-flash
Seed 1.6 Flash
live联系获取报价可用
grok-4-1-fast
Grok 4.1 Fast
exclusive联系获取报价不可用
gemini-3-1-pro-preview
Gemini 3.1 Pro Preview
exclusive联系获取报价不可用
gemini-3-flash-preview
Gemini 3 Flash Preview
exclusive联系获取报价不可用
gpt-5-5
GPT-5.5
exclusive联系获取报价不可用
gpt-5-4-mini
GPT-5.4 Mini
exclusive联系获取报价不可用
llama-4-scout
Llama 4 Scout
live联系获取报价可用
llama-3-3-70b
Llama 3.3 70B
live联系获取报价可用
thudm-glm-4-9b
GLM-4-9B
live联系获取报价可用
step-3-5-flash
Step 3.5 Flash
live联系获取报价可用
gemini-2-5-flash
Gemini 2.5 Flash
live联系获取报价可用
qwen3-embedding-8b
Qwen3 Embedding 8B
live联系获取报价可用
qwen3-235b-a22b-07-25
Qwen3 235B A22B Instruct 2507
live联系获取报价可用
gemma-4-26b-a4b-it
Gemma 4 26B A4B
live联系获取报价可用
glm-4-5-air
GLM 4.5 Air
live联系获取报价可用
gemma-4-31b-it
Gemma 4 31B
live联系获取报价可用

Model API

状态待确认

按量调用

适合测试、原型和不稳定用量。

  • 自助生成 API 密钥
  • 真实调用、实时计费与账单
  • 统一模型目录与价格页

Media API

公开自助

自助结算

开发者 API,负责图像、视频和音频生成任务、状态、fallback、成本预估和回执。

  • 生成任务和任务状态
  • 失败原因和 fallback
  • 用量回执和成本预估

Spend Control

See pricing

进入套餐控制台查看

工作区预算、API key 限额、模型 allow/block 控制,以及 customer 或 feature 归因。

  • 工作区月预算
  • API key 上限和单次请求成本限制
  • 模型 allowlist 与 blocklist

VaaS Ledger

Public receipt path

On-demand checkout

可验证用量回执,用于计费请求、下游结算与对账。

  • 请求级回执与追踪链接
  • 计费、审计与争议证据
  • 按客户和功能归因成本

专属容量

商务交付

联系团队

适合需要更大规模长期容量、专属资源安排或基础设施级交付的客户。专属 GPU 容量提供全程交付支持。

  • 专属端点在可用时保持自助
  • 按卡时 GPU 继续保持自助
  • 8 卡以上整节点或整集群由客户成功团队对接