Skip to content

令牌、分组与计费

先区分两个 Token

本文说的「令牌」是 API Key,是一把调用钥匙;你在模型计费里看到的 token 是大模型处理文本的最小单位。两者不是同一个概念。

API 令牌是什么

API 令牌用于鉴权。客户端或代码调用 蛋蛋 时,需要把令牌放在请求头:

http
Authorization: Bearer sk-your-api-key

Gemini 原生接口也可以使用:

http
x-goog-api-key: sk-your-api-key

令牌必须原样复制。不要添加任何协议后缀;后缀不会切换分组,只会导致鉴权失败。

建议按用途拆分令牌:

用途令牌名称示例
个人聊天客户端chatbox-home
IDE 插件cursor-work
Claude Codeclaude-code-main
Gemini CLIgemini-cli-main
服务端生产环境server-prod
临时测试test-2026-06

分组是什么

分组决定令牌可用的模型、平台、价格、限速和策略。一个账号可以有多个分组,例如 OpenAI 分组、Claude 分组、Gemini 分组、Antigravity 分组、默认分组、企业分组。

调用失败时重点检查:

  • 当前令牌属于哪个分组。
  • 该分组是否开放目标模型。
  • 该分组是否支持目标接口,例如向量、图片、Messages、Gemini v1beta。
  • 该分组是否设置了限速或限额。
  • 该分组是否还有余额或套餐额度。

token 计费是什么

大模型把文本拆成 token 处理。一般会区分:

类型含义
prompt tokens输入内容消耗,包括系统提示、历史消息、用户输入、工具定义
completion tokens模型生成内容消耗
total tokens输入和输出合计

不同模型价格不同,最终费用以控制台计费记录为准。

控制成本建议

  1. 不把完整聊天历史无限拼接。
  2. 对长文件先摘要或检索,再发送相关片段。
  3. 开发测试时用低成本模型。
  4. 为自动化任务设置令牌额度上限。
  5. 对失败重试设置最大次数。
  6. 为不同客户端拆分 Key,便于定位异常消耗。

为什么余额足够仍然报错

可能原因:

  • 令牌本身设置了限额。
  • 令牌分组没有该模型权限。
  • 令牌分组平台和请求协议不匹配。
  • 模型临时不可用。
  • 并发过高触发速率限制。
  • 客户端使用的是旧 API Key。
  • API Key 被手动加了后缀,导致后端无法匹配。

蛋蛋文档中心用于说明购买、接入、API 调用和故障排查流程。