GPU 租赁

租用专属 GPU 容量,获得 SSH 访问和完整运行时控制权。

如果无服务器模式不是合适抽象,BatchIn 提供更适合基础设施团队的 GPU 租赁路径,让容量采购和实际部署保持在同一条工作流里。

H200

$1.80/小时

A800

$1.00/小时

访问方式

SSH Root

部署

你的运行栈

匹配真实工作负载的硬件选择

按模型规模、延迟目标和交付节奏选择适合的加速器档位。

  • H200 适合追求显存余量和旗舰模型吞吐的部署。
  • A800 适合注重成本/性能平衡的生产推理。
  • 910C 适合围绕国产硬件供给规划的团队。

运行时归你控制

GPU 租赁适用于 serverless 不够合适的场景。BatchIn 提供容量,你的团队掌控运行方式。

  • 提供 SSH root 访问,方便自定义运行时、调度器和观测组件。
  • 可自带模型栈、权重、量化方案和部署流程。
  • 只有在你需要时,才把租赁基础设施与 BatchIn 的计费和审计产品组合起来。

当前 GPU 档位

当前租赁菜单的参考价格与适用场景。

GPU$/GPU-小时显存架构适合场景可用性
B200待定192GB HBM3eBlackwell下一代旗舰推理与 FP4 原生负载M2+
H200$1.80141GB HBM3eHopper大 MoE 与旗舰推理Day-1
H100$1.5080GB HBM3Hopper行业标准生产推理M1
H20$1.2096GB HBM3Hopper(中国)长上下文推理与中国区优化部署M1
A800$1.0080GB HBM2eAmpere(中国)中型模型与成本优化推理Day-1
910C$0.8064GB HBM2eAscend(华为)国产项目与最低成本部署路径Day-1
L40S$0.6048GB GDDR6XAda Lovelace图像、视频和 embedding 推理M1