Z.ai

智谱 AI

glm-5.1

GLM-5.1

GLM-5.1 已纳入当前百因智算 Model API 目录。

模型详情可用MoE Transformer

参数规模

754B MoE

上下文

198K

最大输出

128K

许可证

MIT

接口

/v1/chat/completions

接入状态

可用

为什么选它

  • 可用性以实时服务目录为准。
  • 价格仅在实时服务目录验证后展示。

价格与对比

层级公开价缓存说明
在线调用¥1.11 / ¥3.88¥0.388当前公开价格
批处理¥1.11 / ¥3.88¥0.388批处理价格开放后会同步显示
价格已从实时 BatchIn 目录同步。

快速开始

兼容常见接入方式,切换基础地址后即可开始测试。

Python
from openai import OpenAI

client = OpenAI(
    base_url="https://api.batchin.tech/v1",
    api_key="BATCHIN_API_KEY"
)

resp = client.chat.completions.create(
    model="glm-5.1",
    messages=[{"role": "user", "content": "Summarize why this model is a fit for my workload"}]
)

print(resp.choices[0].message.content)
JavaScript
import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.batchin.tech/v1",
  apiKey: process.env.BATCHIN_API_KEY,
});

const resp = await client.chat.completions.create({
  model: "glm-5.1",
  messages: [{ role: "user", content: "Summarize why this model is a fit for my workload" }],
});

console.log(resp.choices[0]?.message?.content);
cURL
curl https://api.batchin.tech/v1/chat/completions \
  -H "Authorization: Bearer ***" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.1",
    "messages": [{"role":"user","content":"Summarize why this model is a fit for my workload"}]
  }'

规格与行为

架构

MoE Transformer

厂商

智谱 AI

上下文

198K

最大输出

128K

适用场景

featured
glm
coding

相关模型

返回模型中心
Z.ai

z.ai

glm-5

GLM-5

GLM-5 可通过审核开通或引导交付接入。

查看详情
Qwen

Qwen / Alibaba

qwen3-coder-480b-a35b

Qwen3-Coder-480B-A35B

Qwen3-Coder-480B-A35B 可通过审核开通或引导交付接入。

查看详情
DeepSeek

DeepSeek

deepseek-v4-flash

DeepSeek V4 Flash

DeepSeek V4 Flash 可通过审核开通或引导交付接入。

查看详情
DeepSeek

DeepSeek

deepseek-v4-pro

DeepSeek V4 Pro

DeepSeek V4 Pro 可通过审核开通或引导交付接入。

查看详情
GLM-5.1 | 百因智算