H200
$1.80/小时
如果无服务器模式不是合适抽象,BatchIn 提供更适合基础设施团队的 GPU 租赁路径,让容量采购和实际部署保持在同一条工作流里。
H200
$1.80/小时
A800
$1.00/小时
访问方式
SSH Root
部署
你的运行栈
按模型规模、延迟目标和交付节奏选择适合的加速器档位。
GPU 租赁适用于 serverless 不够合适的场景。BatchIn 提供容量,你的团队掌控运行方式。
当前租赁菜单的参考价格与适用场景。
| GPU | $/GPU-小时 | 显存 | 架构 | 适合场景 | 可用性 |
|---|---|---|---|---|---|
| B200 | 待定 | 192GB HBM3e | Blackwell | 下一代旗舰推理与 FP4 原生负载 | M2+ |
| H200 | $1.80 | 141GB HBM3e | Hopper | 大 MoE 与旗舰推理 | Day-1 |
| H100 | $1.50 | 80GB HBM3 | Hopper | 行业标准生产推理 | M1 |
| H20 | $1.20 | 96GB HBM3 | Hopper(中国) | 长上下文推理与中国区优化部署 | M1 |
| A800 | $1.00 | 80GB HBM2e | Ampere(中国) | 中型模型与成本优化推理 | Day-1 |
| 910C | $0.80 | 64GB HBM2e | Ascend(华为) | 国产项目与最低成本部署路径 | Day-1 |
| L40S | $0.60 | 48GB GDDR6X | Ada Lovelace | 图像、视频和 embedding 推理 | M1 |