快速开始
如果你已经在用 OpenAI SDK,优先从这一节开始,最省迁移成本。
你可以把 QYUAN AI 看成一个统一的 API 网关。当前推荐的接入方式有两种:
- OpenAI 兼容方式:适合大多数 SDK 与应用,使用
/v1/chat/completions或/v1/responses。 - Claude Messages 方式:如果你现有代码已经是 Anthropic 风格,可以直接对接
/v1/messages。
https://token.qyuanai.com/v1
https://token.qyuanai.com/v1/messages
Authorization: Bearer YOUR_API_KEY;Claude 接口使用 x-api-key: YOUR_API_KEY。
GET /v1/models 获取当前可用模型列表。
接口与参数总览
现在站内模型已经不止一种调用形态。最容易踩坑的地方是: 文本模型大多可以统一走 OpenAI 兼容接口,但图片生成和 Claude 原生接口的入参格式不同。
| 模型类型 | 推荐接口 | 核心参数格式 |
|---|---|---|
| GPT / Codex / Claude / Gemini 文本模型 | POST /v1/chat/completions |
model + messages + max_tokens |
| Gemini 模型(通过本网关) | POST /v1/chat/completions |
仍然使用 OpenAI 风格 messages,不要改成 Google 原生 contents |
| 纯图片生成 | POST /v1/images/generations |
model + prompt + size + n |
| OpenAI Responses 风格应用 | POST /v1/responses |
model + input + max_output_tokens |
POST /v1/messages |
Anthropic 原生格式 | model + max_tokens + messages,并使用 x-api-key |
GET /v1/models |
查询当前可用模型 | 任何接入前都建议先调一次 |
当前模型分类
截至 2026-05-11,接口实际返回模型建议按下面理解:
| 类别 | 当前模型 | 推荐接入方式 |
|---|---|---|
| OpenAI / Codex 文本模型 | gpt-5.2、gpt-5.3-codex、gpt-5.3-codex-spark、gpt-5.4、gpt-5.4-mini、gpt-5.5、gpt-oss-120b-medium |
/v1/chat/completions 或 /v1/responses |
| Claude 模型 | claude-sonnet-4-5、claude-sonnet-4-6、claude-opus-4-6、claude-opus-4-6-thinking、claude-opus-4-7 |
/v1/chat/completions 或 /v1/messages |
| Gemini 文本 / 推理模型 | gemini-2.5-flash、gemini-2.5-flash-lite、gemini-2.5-pro、gemini-3-flash、gemini-3-flash-preview、gemini-3-pro-low、gemini-3-pro-high、gemini-3-pro-preview、gemini-3.1-flash-lite、gemini-3.1-flash-lite-preview、gemini-3.1-pro-low、gemini-3.1-pro-high、gemini-3.1-pro-preview |
/v1/chat/completions |
| 图片模型 | gpt-image-2 |
/v1/images/generations |
| Gemini 图像能力模型 | gemini-3.1-flash-image |
当前建议仍先按 /v1/chat/completions 接入与联调 |
最稳妥的做法始终是先请求一次 GET /v1/models,再从返回结果里读取模型名。
curl https://token.qyuanai.com/v1/models \
-H "Authorization: Bearer YOUR_API_KEY"
OpenAI Chat Completions
这是当前最通用的接入方式。GPT、Claude、Gemini 在这个网关里都可以先用这一套格式联调。
model + messages + 可选 max_tokens /
stream。
curl 示例
curl https://token.qyuanai.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.4-mini",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "请用一句话介绍 QYUAN AI"}
],
"max_tokens": 512
}'
Python 示例
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://token.qyuanai.com/v1"
)
resp = client.chat.completions.create(
model="gpt-5.4-mini",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "请用一句话介绍 QYUAN AI"}
],
max_tokens=512,
)
print(resp.choices[0].message.content)
JavaScript 示例
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.QYUAN_API_KEY,
baseURL: "https://token.qyuanai.com/v1",
});
const resp = await client.chat.completions.create({
model: "gpt-5.4-mini",
messages: [
{ role: "system", content: "You are a helpful assistant." },
{ role: "user", content: "请用一句话介绍 QYUAN AI" }
],
max_tokens: 512
});
console.log(resp.choices[0].message.content);
Gemini 模型接入说明
这一组模型在站内已经统一封装成 OpenAI 兼容格式,所以
不要直接照搬 Google 原生 API 的 contents、parts、generateContent 写法。
最简单的方法就是继续使用 /v1/chat/completions。
POST https://token.qyuanai.com/v1/chat/completions
gemini-2.5-*、gemini-3-*、gemini-3.1-*
model、messages,需要时再加 max_tokens、stream
Gemini 文本模型 curl 示例
curl https://token.qyuanai.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-2.5-flash",
"messages": [
{"role": "user", "content": "请只回复 ok"}
],
"max_tokens": 64
}'
Gemini 图像能力模型联调示例
gemini-3.1-flash-image 当前在本平台建议先按同样的
chat/completions 格式做联调与能力验证。
curl https://token.qyuanai.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.1-flash-image",
"messages": [
{"role": "user", "content": "请只回复 ok"}
],
"max_tokens": 64
}'
图片生成
如果你要的是直接生成图片,不要走 /v1/chat/completions,而是使用单独的
/v1/images/generations。
model + prompt + size + n。
当前文档推荐的纯图片生成模型是 gpt-image-2。
curl 示例
curl https://token.qyuanai.com/v1/images/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "一张极简风格的蓝色立方体产品海报,白色背景,工作室打光",
"n": 1,
"size": "1024x1024"
}'
Python 示例
from openai import OpenAI
client = OpenAI(
api_key="YOUR_API_KEY",
base_url="https://token.qyuanai.com/v1"
)
result = client.images.generate(
model="gpt-image-2",
prompt="一张极简风格的蓝色立方体产品海报,白色背景,工作室打光",
size="1024x1024",
n=1,
)
print(result.data[0].b64_json[:80])
流式输出
文本模型当前支持 SSE 流式返回。命令行测试时请加上 -N。
curl -N https://token.qyuanai.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.4-mini",
"stream": true,
"messages": [
{"role": "user", "content": "请分三行输出:第一行 hello,第二行 qyuan,第三行 ai"}
]
}'
返回内容是标准的 data: {...} 事件流,结束时会收到 [DONE]。
Responses API
如果你的 SDK 或应用已经迁移到 OpenAI 新版统一接口,可以直接使用 /v1/responses。
model + input + 可选 max_output_tokens。
curl https://token.qyuanai.com/v1/responses \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.4-mini",
"input": "请只回复 ok",
"max_output_tokens": 32
}'
chat.completions,没有必要为了“新”而强制迁移到
responses。两者当前都可用,按你的现有代码结构选择即可。
Claude Messages 接口
对 Claude 模型,如果你手头的调用代码已经是 Anthropic 风格,可以继续沿用。
model + max_tokens + messages,
鉴权头使用 x-api-key,不要写成 Bearer。
curl https://token.qyuanai.com/v1/messages \
-H "x-api-key: YOUR_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Hello!"}
]
}'
建议 Claude 模型优先使用 claude-sonnet-4-5 或 claude-sonnet-4-6。
如果你希望统一一套代码,也可以直接通过 OpenAI 兼容的 /v1/chat/completions 来调用 Claude 模型。
邀请奖励说明
为了避免歧义,当前邀请奖励规则明确如下:
邀请奖励会在控制台中累计展示,站内使用和提现规则统一按下面口径执行。
扫码添加企微客服 Hanson,达到提现门槛后可联系客服处理提现事宜。
暂不建议接入的能力
为了保证文档和实际能力一致,以下能力本页暂不提供接入示例:
/v1/embeddings:当前没有可用的 embedding 渠道。- 音频、文件、Assistants、Fine-tuning 等其它接口:当前不作为对外主能力说明。
常见问题
1. Base URL 应该填什么?
OpenAI 兼容 SDK 填 https://token.qyuanai.com/v1。
2. 为什么我调用失败提示模型不存在?
模型名请以 GET /v1/models 返回结果为准,不要沿用别的平台模型名。
3. Claude 一定要走 /v1/messages 吗?
不是。你也可以统一走 /v1/chat/completions,只要模型名填 Claude 模型即可。
4. Gemini 为什么不能直接照抄 Google 原生示例?
因为在本平台里 Gemini 已经被统一映射成 OpenAI 兼容接口,推荐直接使用 /v1/chat/completions + messages。
5. 图片生成应该走哪个接口?
纯图片生成请使用 /v1/images/generations,当前推荐模型是 gpt-image-2。
6. 如何验证我的 API Key 是否正常?
最简单的方法是先调用一次 GET /v1/models。能返回模型列表,说明鉴权已生效。