Z.ai

智谱 AI

glm-5

GLM-5

GLM-5 可通过审核开通或引导交付接入。

模型详情审核开通MoE Transformer

参数规模

744B / 40B active

上下文

198K

最大输出

64K

许可证

GLM

接口

/v1/chat/completions

接入状态

审核开通

为什么选它

仅在工作区审核通过或引导交付后开通。
价格仅在实时服务目录验证后展示。

价格与对比

层级公开价缓存说明

在线调用¥2.02 / ¥8.11¥0.706当前公开价格

批处理¥2.02 / ¥8.11¥0.706批处理价格开放后会同步显示

价格已从实时 BatchIn 目录同步。

快速开始

该模型暂未开放在线试用，可联系团队确认合适的接入方式。

联系团队查看价格页

Python

from openai import OpenAI

client = OpenAI(
    base_url="https://api.batchin.tech/v1",
    api_key="BATCHIN_API_KEY"
)

resp = client.chat.completions.create(
    model="glm-5",
    messages=[{"role": "user", "content": "Summarize why this model is a fit for my workload"}]
)

print(resp.choices[0].message.content)

JavaScript

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.batchin.tech/v1",
  apiKey: process.env.BATCHIN_API_KEY,
});

const resp = await client.chat.completions.create({
  model: "glm-5",
  messages: [{ role: "user", content: "Summarize why this model is a fit for my workload" }],
});

console.log(resp.choices[0]?.message?.content);

cURL

curl https://api.batchin.tech/v1/chat/completions \
  -H "Authorization: Bearer ***" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5",
    "messages": [{"role":"user","content":"Summarize why this model is a fit for my workload"}]
  }'

规格与行为

架构

MoE Transformer

厂商

智谱 AI

上下文

198K

最大输出

64K

适用场景

glm

相关模型

返回模型中心

Z.ai

z.ai

glm-5-1

GLM-5.1

适合编码、推理与长周期智能体执行的开源旗舰路线

Qwen

Qwen

qwen3-5-397b

Qwen3.5-397B

适合高阶通用推理并带公开批处理折扣的大规模 Qwen 路线

DeepSeek

DeepSeek

deepseek-v4-flash

DeepSeek V4 Flash

DeepSeek V4 Flash 可通过审核开通或引导交付接入。

DeepSeek

DeepSeek

deepseek-v4-pro

DeepSeek V4 Pro

DeepSeek V4 Pro 可通过审核开通或引导交付接入。

GLM-5 | 百因智算