📚 API Gateway 使用文档
欢迎使用 API Gateway!本文档将帮助您快速上手并充分利用我们的服务。
🚀 快速开始
获取 API Key
注册账户
访问 用户中心,使用邮箱或 OAuth 快速注册。
获取 API Key
登录后,在「API 密钥」页面创建新的 API Key。新用户赠送 3.0 体验额度。
开始调用
将 API Key 用于您的请求中,即可开始调用各种 AI 模型。
首次注册即赠送 3.0 额度,可体验多种 AI 模型,无需绑定信用卡。
第一个请求
使用以下代码发送您的第一个请求:
curl https://api.7zi.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer YOUR_API_KEY" \
-d '{
"model": "auto",
"messages": [{"role": "user", "content": "你好,请介绍一下自己"}]
}'
将 YOUR_API_KEY 替换为您在用户中心创建的实际 API Key。
响应示例
{
"id": "chatcmpl-xxx",
"object": "chat.completion",
"model": "deepseek-v3.2", // 实际使用的模型
"choices": [{
"index": 0,
"message": {
"role": "assistant",
"content": "你好!我是一个 AI 助手..."
}
}],
"usage": {
"prompt_tokens": 15,
"completion_tokens": 100,
"total_tokens": 115
}
}
🎯 Auto 模型详解
将 model 参数设为 "auto",系统将自动选择最优模型。
Auto 的工作原理
- 实时监测:系统持续监控各渠道的延迟、成功率、成本
- 智能评分:根据多维度指标为每个模型打分
- 最优选择:选择综合得分最高的模型处理请求
- 故障切换:如选中模型异常,毫秒级切换备用模型
Auto 的优势
| 特性 | 说明 |
|---|---|
| 🎯 智能路由 | 自动选择当前表现最佳的模型 |
| 💰 成本优化 | 在满足需求前提下选择性价比最高的模型 |
| 🛡️ 高可用 | 故障自动切换,业务无感知 |
| 🔄 自动升级 | 新模型自动纳入选择池,无需修改代码 |
| 📊 透明可控 | 响应中返回实际使用的模型名称 |
Auto 模式适合:
- 通用对话、问答场景
- 对模型无严格要求的场景
- 追求性价比的场景
如需严格一致的输出风格或特定模型能力,建议直接指定模型。
📡 API 参考
对话补全 POST
POST /v1/chat/completions
请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model |
string | 是 | 模型 ID,如 auto、gpt-4、deepseek-v3.2 等 |
messages |
array | 是 | 对话消息数组 |
temperature |
number | 否 | 温度参数,0-2,默认 1 |
max_tokens |
integer | 否 | 最大生成 token 数 |
stream |
boolean | 否 | 是否流式返回,默认 false |
Messages 格式
"messages": [
{"role": "system", "content": "你是一个有帮助的助手"},
{"role": "user", "content": "你好"},
{"role": "assistant", "content": "你好!有什么可以帮到你的?"},
{"role": "user", "content": "介绍一下 Python"}
]
模型列表 GET
GET /v1/models
curl https://api.7zi.com/v1/models \
-H "Authorization: Bearer YOUR_API_KEY"
可用模型(部分)
| 模型 ID | 说明 |
|---|---|
auto |
智能选择最优模型 |
gpt-4 |
OpenAI GPT-4 |
gpt-4-turbo |
OpenAI GPT-4 Turbo |
claude-3-opus |
Anthropic Claude 3 Opus |
gemini-2.5-pro |
Google Gemini 2.5 Pro |
deepseek-v3.2 |
DeepSeek V3.2 |
glm-4 |
智谱 GLM-4 |
余额查询 GET
GET /v1/balance
curl https://api.7zi.com/v1/balance \
-H "Authorization: Bearer YOUR_API_KEY"
{
"balance": 2.85,
"currency": "USD"
}
📖 使用指南
指定具体模型
除了使用 auto,您也可以直接指定具体模型:
from openai import OpenAI
client = OpenAI(
api_key="your-api-key",
base_url="https://api.7zi.com/v1"
)
# 指定具体模型
response = client.chat.completions.create(
model="deepseek-v3.2", # 或 gpt-4, claude-3-opus 等
messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)
流式响应
设置 stream=True 实现流式输出:
response = client.chat.completions.create(
model="auto",
messages=[{"role": "user", "content": "写一首诗"}],
stream=True # 启用流式
)
for chunk in response:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")
SDK 使用
Python
pip install openai
Node.js
npm install openai
import OpenAI from 'openai';
const client = new OpenAI({
apiKey: 'your-api-key',
baseURL: 'https://api.7zi.com/v1'
});
const response = await client.chat.completions.create({
model: 'auto',
messages: [{ role: 'user', content: '你好' }]
});
💰 计费说明
计费方式
- 按 Token 数量 计费(输入 + 输出)
- 不同模型价格不同,auto 会自动选择性价比最优的模型
- 实时扣费,余额不足时请求会失败
价格参考
| 模型 | 输入 (每 1K tokens) | 输出 (每 1K tokens) |
|---|---|---|
| deepseek-v3.2 | ~$0.0005 | ~$0.001 |
| gpt-4-turbo | ~$0.01 | ~$0.03 |
| claude-3-opus | ~$0.015 | ~$0.075 |
以上为参考价格,实际价格以系统为准。使用 auto 模式可有效降低成本。
配额管理
- 在 用户中心 查看余额和使用明细
- 支持充值,支持支付宝、微信支付
- 可设置用量告警阈值
❓ 常见问题
API Key 在哪里获取?
登录 用户中心,在「API 密钥」页面创建和管理您的 API Key。
Auto 模式会选择什么模型?
系统根据实时监测数据自动选择当前综合表现最佳的模型,包括延迟、成功率、成本等因素。您可以在响应中看到实际使用的模型名称。
如何知道实际使用的模型?
每次响应的 model 字段会显示实际使用的模型,例如 deepseek-v3.2。
余额不足会怎样?
请求会返回 402 Payment Required 错误,提示余额不足。请及时充值。
支持哪些模型?
支持 OpenAI GPT 系列、Anthropic Claude 系列、Google Gemini 系列、DeepSeek、智谱 GLM 等主流模型。完整列表请调用 GET /v1/models 查看。
响应速度慢怎么办?
建议使用 auto 模式,系统会自动选择当前延迟最低的模型。也可以尝试指定延迟较低的模型如 deepseek-v3.2。
✨ 最佳实践
1. 使用 Auto 模式
对于大多数场景,推荐使用 auto 模式,让系统自动选择最优模型。
2. 合理设置 Temperature
- 代码生成:temperature = 0.2
- 对话问答:temperature = 0.7
- 创意写作:temperature = 1.0+
3. 使用流式响应
对于长文本生成,使用流式响应可以提升用户体验,减少等待感知。
4. 错误处理
始终实现重试逻辑和错误处理,特别是网络超时和余额不足的情况。
5. 缓存策略
对于重复的请求,考虑实现缓存以节省成本。
🚨 错误处理
常见错误码
| 错误码 | 说明 | 解决方案 |
|---|---|---|
| 401 | 认证失败 | 检查 API Key 是否正确 |
| 402 | 余额不足 | 充值或等待额度刷新 |
| 429 | 请求过于频繁 | 降低请求频率或等待 |
| 500 | 服务器错误 | 重试或联系支持 |
错误响应格式
{
"error": {
"message": "Insufficient balance",
"type": "insufficient_balance",
"code": "insufficient_balance"
}
}
现在您已经了解了 API Gateway 的基本使用方法,立即 获取 API Key 开始您的 AI 之旅!