QY QYUAN AI 面向生产环境的统一 API 接入说明

面向生产环境的统一 LLM API 接入说明

本页只保留 QYUAN AI 当前实际支持并已验证可用的接口。所有示例中的 Base URL 都已经替换为你自己的独立站域名 https://token.qyuanai.com

OpenAI 兼容 Claude Messages 兼容 支持流式输出 文档校验日期:2026-05-01

快速开始

如果你已经在用 OpenAI SDK,优先从这一节开始,最省迁移成本。

你可以把 QYUAN AI 看成一个统一的 API 网关。当前推荐的接入方式有两种:

  • OpenAI 兼容方式:适合大多数 SDK 与应用,使用 /v1/chat/completions/v1/responses
  • Claude Messages 方式:如果你现有代码已经是 Anthropic 风格,可以直接对接 /v1/messages
OpenAI Base URL https://token.qyuanai.com/v1
Claude 请求地址 https://token.qyuanai.com/v1/messages
鉴权方式 OpenAI 兼容接口使用 Authorization: Bearer YOUR_API_KEY;Claude 接口使用 x-api-key: YOUR_API_KEY
先登录控制台创建 API Key,再开始调用。模型名不要手填猜测,建议先调一次 GET /v1/models 获取当前可用模型列表。

接口与参数总览

现在站内模型已经不止一种调用形态。最容易踩坑的地方是: 文本模型大多可以统一走 OpenAI 兼容接口,但图片生成和 Claude 原生接口的入参格式不同。

模型类型 推荐接口 核心参数格式
GPT / Codex / Claude / Gemini 文本模型 POST /v1/chat/completions model + messages + max_tokens
Gemini 模型(通过本网关) POST /v1/chat/completions 仍然使用 OpenAI 风格 messages,不要改成 Google 原生 contents
纯图片生成 POST /v1/images/generations model + prompt + size + n
OpenAI Responses 风格应用 POST /v1/responses model + input + max_output_tokens
POST /v1/messages Anthropic 原生格式 model + max_tokens + messages,并使用 x-api-key
GET /v1/models 查询当前可用模型 任何接入前都建议先调一次

当前模型分类

截至 2026-05-11,接口实际返回模型建议按下面理解:

类别 当前模型 推荐接入方式
OpenAI / Codex 文本模型 gpt-5.2gpt-5.3-codexgpt-5.3-codex-sparkgpt-5.4gpt-5.4-minigpt-5.5gpt-oss-120b-medium /v1/chat/completions/v1/responses
Claude 模型 claude-sonnet-4-5claude-sonnet-4-6claude-opus-4-6claude-opus-4-6-thinkingclaude-opus-4-7 /v1/chat/completions/v1/messages
Gemini 文本 / 推理模型 gemini-2.5-flashgemini-2.5-flash-litegemini-2.5-progemini-3-flashgemini-3-flash-previewgemini-3-pro-lowgemini-3-pro-highgemini-3-pro-previewgemini-3.1-flash-litegemini-3.1-flash-lite-previewgemini-3.1-pro-lowgemini-3.1-pro-highgemini-3.1-pro-preview /v1/chat/completions
图片模型 gpt-image-2 /v1/images/generations
Gemini 图像能力模型 gemini-3.1-flash-image 当前建议仍先按 /v1/chat/completions 接入与联调

最稳妥的做法始终是先请求一次 GET /v1/models,再从返回结果里读取模型名。

curl https://token.qyuanai.com/v1/models \
  -H "Authorization: Bearer YOUR_API_KEY"

OpenAI Chat Completions

这是当前最通用的接入方式。GPT、Claude、Gemini 在这个网关里都可以先用这一套格式联调。

默认参数格式: model + messages + 可选 max_tokens / stream

curl 示例

curl https://token.qyuanai.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4-mini",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "请用一句话介绍 QYUAN AI"}
    ],
    "max_tokens": 512
  }'

Python 示例

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://token.qyuanai.com/v1"
)

resp = client.chat.completions.create(
    model="gpt-5.4-mini",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "请用一句话介绍 QYUAN AI"}
    ],
    max_tokens=512,
)

print(resp.choices[0].message.content)

JavaScript 示例

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.QYUAN_API_KEY,
  baseURL: "https://token.qyuanai.com/v1",
});

const resp = await client.chat.completions.create({
  model: "gpt-5.4-mini",
  messages: [
    { role: "system", content: "You are a helpful assistant." },
    { role: "user", content: "请用一句话介绍 QYUAN AI" }
  ],
  max_tokens: 512
});

console.log(resp.choices[0].message.content);

Gemini 模型接入说明

这一组模型在站内已经统一封装成 OpenAI 兼容格式,所以 不要直接照搬 Google 原生 API 的 contentspartsgenerateContent 写法。 最简单的方法就是继续使用 /v1/chat/completions

推荐接口 POST https://token.qyuanai.com/v1/chat/completions
适用模型 gemini-2.5-*gemini-3-*gemini-3.1-*
最小参数 modelmessages,需要时再加 max_tokensstream

Gemini 文本模型 curl 示例

curl https://token.qyuanai.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-2.5-flash",
    "messages": [
      {"role": "user", "content": "请只回复 ok"}
    ],
    "max_tokens": 64
  }'

Gemini 图像能力模型联调示例

gemini-3.1-flash-image 当前在本平台建议先按同样的 chat/completions 格式做联调与能力验证。

curl https://token.qyuanai.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-flash-image",
    "messages": [
      {"role": "user", "content": "请只回复 ok"}
    ],
    "max_tokens": 64
  }'

图片生成

如果你要的是直接生成图片,不要走 /v1/chat/completions,而是使用单独的 /v1/images/generations

默认参数格式: model + prompt + size + n。 当前文档推荐的纯图片生成模型是 gpt-image-2

curl 示例

curl https://token.qyuanai.com/v1/images/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "一张极简风格的蓝色立方体产品海报,白色背景,工作室打光",
    "n": 1,
    "size": "1024x1024"
  }'

Python 示例

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://token.qyuanai.com/v1"
)

result = client.images.generate(
    model="gpt-image-2",
    prompt="一张极简风格的蓝色立方体产品海报,白色背景,工作室打光",
    size="1024x1024",
    n=1,
)

print(result.data[0].b64_json[:80])

流式输出

文本模型当前支持 SSE 流式返回。命令行测试时请加上 -N

curl -N https://token.qyuanai.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4-mini",
    "stream": true,
    "messages": [
      {"role": "user", "content": "请分三行输出:第一行 hello,第二行 qyuan,第三行 ai"}
    ]
  }'

返回内容是标准的 data: {...} 事件流,结束时会收到 [DONE]

Responses API

如果你的 SDK 或应用已经迁移到 OpenAI 新版统一接口,可以直接使用 /v1/responses

默认参数格式: model + input + 可选 max_output_tokens
curl https://token.qyuanai.com/v1/responses \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4-mini",
    "input": "请只回复 ok",
    "max_output_tokens": 32
  }'
如果你的项目已经大量使用 chat.completions,没有必要为了“新”而强制迁移到 responses。两者当前都可用,按你的现有代码结构选择即可。

Claude Messages 接口

对 Claude 模型,如果你手头的调用代码已经是 Anthropic 风格,可以继续沿用。

默认参数格式: model + max_tokens + messages, 鉴权头使用 x-api-key,不要写成 Bearer。
curl https://token.qyuanai.com/v1/messages \
  -H "x-api-key: YOUR_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Hello!"}
    ]
  }'

建议 Claude 模型优先使用 claude-sonnet-4-5claude-sonnet-4-6。 如果你希望统一一套代码,也可以直接通过 OpenAI 兼容的 /v1/chat/completions 来调用 Claude 模型。

邀请奖励说明

为了避免歧义,当前邀请奖励规则明确如下:

企微客服提现说明

邀请奖励会在控制台中累计展示,站内使用和提现规则统一按下面口径执行。

邀请人可获得被邀请用户充值金额的 5%。
奖励可在控制台中查看,并支持划转到站内余额使用。
累计邀请收益满 100 美元(约 700 人民币)后,可添加企微客服申请提现。
企微客服 Hanson 名片二维码 扫码添加企微客服 Hanson,达到提现门槛后可联系客服处理提现事宜。

暂不建议接入的能力

为了保证文档和实际能力一致,以下能力本页暂不提供接入示例:

  • /v1/embeddings:当前没有可用的 embedding 渠道。
  • 音频、文件、Assistants、Fine-tuning 等其它接口:当前不作为对外主能力说明。

常见问题

1. Base URL 应该填什么?

OpenAI 兼容 SDK 填 https://token.qyuanai.com/v1

2. 为什么我调用失败提示模型不存在?

模型名请以 GET /v1/models 返回结果为准,不要沿用别的平台模型名。

3. Claude 一定要走 /v1/messages 吗?

不是。你也可以统一走 /v1/chat/completions,只要模型名填 Claude 模型即可。

4. Gemini 为什么不能直接照抄 Google 原生示例?

因为在本平台里 Gemini 已经被统一映射成 OpenAI 兼容接口,推荐直接使用 /v1/chat/completions + messages

5. 图片生成应该走哪个接口?

纯图片生成请使用 /v1/images/generations,当前推荐模型是 gpt-image-2

6. 如何验证我的 API Key 是否正常?

最简单的方法是先调用一次 GET /v1/models。能返回模型列表,说明鉴权已生效。