QYUAN AI API 接入文档

快速开始

如果你已经在用 OpenAI SDK，优先从这一节开始，最省迁移成本。

你可以把 QYUAN AI 看成一个统一的 API 网关。当前推荐的接入方式有两种：

OpenAI 兼容方式：适合大多数 SDK 与应用，使用 /v1/chat/completions 或 /v1/responses。
Claude Messages 方式：如果你现有代码已经是 Anthropic 风格，可以直接对接 /v1/messages。

OpenAI Base URL https://token.qyuanai.com/v1

Claude 请求地址 https://token.qyuanai.com/v1/messages

鉴权方式 OpenAI 兼容接口使用 Authorization: Bearer YOUR_API_KEY；Claude 接口使用 x-api-key: YOUR_API_KEY。

先登录控制台创建 API Key，再开始调用。模型名不要手填猜测，建议先调一次 GET /v1/models 获取当前可用模型列表。

接口与参数总览

现在站内模型已经不止一种调用形态。最容易踩坑的地方是： 文本模型大多可以统一走 OpenAI 兼容接口，但图片生成和 Claude 原生接口的入参格式不同。

模型类型	推荐接口	核心参数格式
GPT / Codex / Claude / Gemini 文本模型	`POST /v1/chat/completions`	`model + messages + max_tokens`
Gemini 模型（通过本网关）	`POST /v1/chat/completions`	仍然使用 OpenAI 风格 `messages`，不要改成 Google 原生 `contents`
纯图片生成	`POST /v1/images/generations`	`model + prompt + size + n`
OpenAI Responses 风格应用	`POST /v1/responses`	`model + input + max_output_tokens`
`POST /v1/messages`	Anthropic 原生格式	`model + max_tokens + messages`，并使用 `x-api-key`
`GET /v1/models`	查询当前可用模型	任何接入前都建议先调一次

当前模型分类

截至 2026-05-11，接口实际返回模型建议按下面理解：

类别	当前模型	推荐接入方式
OpenAI / Codex 文本模型	`gpt-5.2`、`gpt-5.3-codex`、`gpt-5.3-codex-spark`、`gpt-5.4`、`gpt-5.4-mini`、`gpt-5.5`、`gpt-oss-120b-medium`	`/v1/chat/completions` 或 `/v1/responses`
Claude 模型	`claude-sonnet-4-5`、`claude-sonnet-4-6`、`claude-opus-4-6`、`claude-opus-4-6-thinking`、`claude-opus-4-7`	`/v1/chat/completions` 或 `/v1/messages`
Gemini 文本 / 推理模型	`gemini-2.5-flash`、`gemini-2.5-flash-lite`、`gemini-2.5-pro`、`gemini-3-flash`、`gemini-3-flash-preview`、`gemini-3-pro-low`、`gemini-3-pro-high`、`gemini-3-pro-preview`、`gemini-3.1-flash-lite`、`gemini-3.1-flash-lite-preview`、`gemini-3.1-pro-low`、`gemini-3.1-pro-high`、`gemini-3.1-pro-preview`	`/v1/chat/completions`
图片模型	`gpt-image-2`	`/v1/images/generations`
Gemini 图像能力模型	`gemini-3.1-flash-image`	当前建议仍先按 `/v1/chat/completions` 接入与联调

最稳妥的做法始终是先请求一次 GET /v1/models，再从返回结果里读取模型名。

curl https://token.qyuanai.com/v1/models \
  -H "Authorization: Bearer YOUR_API_KEY"

OpenAI Chat Completions

这是当前最通用的接入方式。GPT、Claude、Gemini 在这个网关里都可以先用这一套格式联调。

默认参数格式： model + messages + 可选 max_tokens / stream。

curl 示例

curl https://token.qyuanai.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4-mini",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "请用一句话介绍 QYUAN AI"}
    ],
    "max_tokens": 512
  }'

Python 示例

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://token.qyuanai.com/v1"
)

resp = client.chat.completions.create(
    model="gpt-5.4-mini",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "请用一句话介绍 QYUAN AI"}
    ],
    max_tokens=512,
)

print(resp.choices[0].message.content)

JavaScript 示例

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QYUAN_API_KEY,
  baseURL: "https://token.qyuanai.com/v1",
});

const resp = await client.chat.completions.create({
  model: "gpt-5.4-mini",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "请用一句话介绍 QYUAN AI" }
  ],
  max_tokens: 512
});

console.log(resp.choices[0].message.content);

Gemini 模型接入说明

这一组模型在站内已经统一封装成 OpenAI 兼容格式，所以 不要直接照搬 Google 原生 API 的 contents、parts、generateContent 写法。 最简单的方法就是继续使用 /v1/chat/completions。

推荐接口 POST https://token.qyuanai.com/v1/chat/completions

适用模型 gemini-2.5-*、gemini-3-*、gemini-3.1-*

最小参数 model、messages，需要时再加 max_tokens、stream

Gemini 文本模型 curl 示例

curl https://token.qyuanai.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-2.5-flash",
    "messages": [
      {"role": "user", "content": "请只回复 ok"}
    ],
    "max_tokens": 64
  }'

Gemini 图像能力模型联调示例

gemini-3.1-flash-image 当前在本平台建议先按同样的 chat/completions 格式做联调与能力验证。

curl https://token.qyuanai.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-flash-image",
    "messages": [
      {"role": "user", "content": "请只回复 ok"}
    ],
    "max_tokens": 64
  }'

图片生成

如果你要的是直接生成图片，不要走 /v1/chat/completions，而是使用单独的 /v1/images/generations。

默认参数格式： model + prompt + size + n。当前文档推荐的纯图片生成模型是 gpt-image-2。

curl 示例

curl https://token.qyuanai.com/v1/images/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "一张极简风格的蓝色立方体产品海报，白色背景，工作室打光",
    "n": 1,
    "size": "1024x1024"
  }'

Python 示例

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://token.qyuanai.com/v1"
)

result = client.images.generate(
    model="gpt-image-2",
    prompt="一张极简风格的蓝色立方体产品海报，白色背景，工作室打光",
    size="1024x1024",
    n=1,
)

print(result.data[0].b64_json[:80])

流式输出

文本模型当前支持 SSE 流式返回。命令行测试时请加上 -N。

curl -N https://token.qyuanai.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4-mini",
    "stream": true,
    "messages": [
      {"role": "user", "content": "请分三行输出：第一行 hello，第二行 qyuan，第三行 ai"}
    ]
  }'

返回内容是标准的 data: {...} 事件流，结束时会收到 [DONE]。

Responses API

如果你的 SDK 或应用已经迁移到 OpenAI 新版统一接口，可以直接使用 /v1/responses。

默认参数格式： model + input + 可选 max_output_tokens。

curl https://token.qyuanai.com/v1/responses \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4-mini",
    "input": "请只回复 ok",
    "max_output_tokens": 32
  }'

如果你的项目已经大量使用 chat.completions，没有必要为了“新”而强制迁移到 responses。两者当前都可用，按你的现有代码结构选择即可。

Claude Messages 接口

对 Claude 模型，如果你手头的调用代码已经是 Anthropic 风格，可以继续沿用。

默认参数格式： model + max_tokens + messages，鉴权头使用 x-api-key，不要写成 Bearer。

curl https://token.qyuanai.com/v1/messages \
  -H "x-api-key: YOUR_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }'

建议 Claude 模型优先使用 claude-sonnet-4-5 或 claude-sonnet-4-6。如果你希望统一一套代码，也可以直接通过 OpenAI 兼容的 /v1/chat/completions 来调用 Claude 模型。

邀请奖励说明

为了避免歧义，当前邀请奖励规则明确如下：

企微客服提现说明

邀请奖励会在控制台中累计展示，站内使用和提现规则统一按下面口径执行。

邀请人可获得被邀请用户充值金额的 5%。

奖励可在控制台中查看，并支持划转到站内余额使用。

累计邀请收益满 100 美元（约 700 人民币）后，可添加企微客服申请提现。

扫码添加企微客服 Hanson，达到提现门槛后可联系客服处理提现事宜。

暂不建议接入的能力

为了保证文档和实际能力一致，以下能力本页暂不提供接入示例：

/v1/embeddings：当前没有可用的 embedding 渠道。
音频、文件、Assistants、Fine-tuning 等其它接口：当前不作为对外主能力说明。

常见问题

1. Base URL 应该填什么？

OpenAI 兼容 SDK 填 https://token.qyuanai.com/v1。

2. 为什么我调用失败提示模型不存在？

模型名请以 GET /v1/models 返回结果为准，不要沿用别的平台模型名。

3. Claude 一定要走 `/v1/messages` 吗？

不是。你也可以统一走 /v1/chat/completions，只要模型名填 Claude 模型即可。

4. Gemini 为什么不能直接照抄 Google 原生示例？

因为在本平台里 Gemini 已经被统一映射成 OpenAI 兼容接口，推荐直接使用 /v1/chat/completions + messages。

5. 图片生成应该走哪个接口？

纯图片生成请使用 /v1/images/generations，当前推荐模型是 gpt-image-2。

6. 如何验证我的 API Key 是否正常？

最简单的方法是先调用一次 GET /v1/models。能返回模型列表，说明鉴权已生效。

面向生产环境的统一 LLM API 接入说明

快速开始

接口与参数总览

当前模型分类

OpenAI Chat Completions

curl 示例

Python 示例

JavaScript 示例

Gemini 模型接入说明

Gemini 文本模型 curl 示例

Gemini 图像能力模型联调示例

图片生成

curl 示例

Python 示例

流式输出

Responses API

Claude Messages 接口

邀请奖励说明

暂不建议接入的能力

常见问题

1. Base URL 应该填什么？

2. 为什么我调用失败提示模型不存在？

3. Claude 一定要走 /v1/messages 吗？

4. Gemini 为什么不能直接照抄 Google 原生示例？

5. 图片生成应该走哪个接口？

6. 如何验证我的 API Key 是否正常？

3. Claude 一定要走 `/v1/messages` 吗？