主题
计费说明
本站采用 USD 作为计费单位。模型广场显示的价格即为最终计费价格,无需额外计算。
计费维度
每一次调用产生两类消耗:
| 维度 | 含义 |
|---|---|
| Prompt tokens | 你发送给模型的内容(包含 system prompt、历史对话、当前问题、上下文等) |
| Completion tokens | 模型返回的内容(非流式时一次返回总数,流式时累加每个 chunk) |
总费用 = prompt_tokens × prompt_price + completion_tokens × completion_price,以选定模型对应的单价计算。
计费方式
本站支持两种购买方式:
- 订阅购买:通常更便宜,有效期为 7/30 天。
- 按量购买:按实际使用量计费,无时间限制。
前往 充值/订阅页面 即可选择适合的购买方式。
计费规则细节
失败请求
- 上游成功返回响应(2xx)→ 按实际产生的 token 计费
- 上游返回错误(4xx/5xx)→ 不计费
- 客户端取消、连接中断 → 流式情况下,已成功推送给客户端的部分计费;非流式不计
流式输出
流式响应每个 chunk 都会被记录,最终按累计 token 一次性扣费。即使客户端中途断开,服务端依然会按已发送的 chunk 总量计算。
上下文累积
很多 Chat 客户端会把历史对话全部塞进 messages 数组,每次发请求时整个上下文都算输入 token。对话越长,单次请求的 prompt token 越多。如果对成本敏感,客户端配置里建议限制历史轮数或开启自动摘要。
价格如何计算
模型的计费包括三部分:输入、输出和缓存。每个部分都有对应的单价。
分组倍率
不同的 API Key 分组可能有不同的倍率。分组倍率是基于模型原价计算的,但模型广场显示的价格已经包含了倍率调整——那就是实际支付的价格。
示例
假设某模型的原价为:
- 输入:
2.5 - 输出:
15 - 缓存:
0.25
当分组倍率为 1.3 时,最终计费价格为:
- 输入:
3.25(2.5 × 1.3) - 输出:
19.5(15 × 1.3) - 缓存:
0.325(0.25 × 1.3)
这些调整后的价格就是模型广场显示的价格,也是最终支付的价格。具体的模型价格和分组倍率,请在 模型广场 查看。
在哪里看消耗
「使用记录」页提供三种视图:
- 明细:每次调用的时间、模型、Key、输入/输出 token、本次费用
- 聚合:按日/月/Key/模型分组的累计统计
- 导出:支持 CSV 便于对账
购买方式
订阅购买
订阅购买通常更便宜,但有效期为 7/30 天。
重复购买同一个订阅时:
- 不会并行新增一份同样的订阅
- 本质上是延长时间
- 后一次购买会在上一个订阅失效后生效
按量购买
按量购买无时间限制,按实际使用量计费。
前往 充值/订阅页面 完成购买(加微信联系)。
相关入口
注意
价格随上游调整可能变化。以「价格」页实时显示为准,本文档数字只做说明。