Skip to content

计费说明

本站采用 USD 作为计费单位。模型广场显示的价格即为最终计费价格,无需额外计算。

计费维度

每一次调用产生两类消耗:

维度含义
Prompt tokens你发送给模型的内容(包含 system prompt、历史对话、当前问题、上下文等)
Completion tokens模型返回的内容(非流式时一次返回总数,流式时累加每个 chunk)

总费用 = prompt_tokens × prompt_price + completion_tokens × completion_price,以选定模型对应的单价计算。

计费方式

本站支持两种购买方式:

  • 订阅购买:通常更便宜,有效期为 7/30 天。
  • 按量购买:按实际使用量计费,无时间限制。

前往 充值/订阅页面 即可选择适合的购买方式。

计费规则细节

失败请求

  • 上游成功返回响应(2xx)→ 按实际产生的 token 计费
  • 上游返回错误(4xx/5xx)→ 不计费
  • 客户端取消、连接中断 → 流式情况下,已成功推送给客户端的部分计费;非流式不计

流式输出

流式响应每个 chunk 都会被记录,最终按累计 token 一次性扣费。即使客户端中途断开,服务端依然会按已发送的 chunk 总量计算。

上下文累积

很多 Chat 客户端会把历史对话全部塞进 messages 数组,每次发请求时整个上下文都算输入 token。对话越长,单次请求的 prompt token 越多。如果对成本敏感,客户端配置里建议限制历史轮数或开启自动摘要。

价格如何计算

模型的计费包括三部分:输入、输出和缓存。每个部分都有对应的单价。

分组倍率

不同的 API Key 分组可能有不同的倍率。分组倍率是基于模型原价计算的,但模型广场显示的价格已经包含了倍率调整——那就是实际支付的价格。

示例

假设某模型的原价为:

  • 输入:2.5
  • 输出:15
  • 缓存:0.25

当分组倍率为 1.3 时,最终计费价格为:

  • 输入:3.25(2.5 × 1.3)
  • 输出:19.5(15 × 1.3)
  • 缓存:0.325(0.25 × 1.3)

这些调整后的价格就是模型广场显示的价格,也是最终支付的价格。具体的模型价格和分组倍率,请在 模型广场 查看。

在哪里看消耗

使用记录」页提供三种视图:

  • 明细:每次调用的时间、模型、Key、输入/输出 token、本次费用
  • 聚合:按日/月/Key/模型分组的累计统计
  • 导出:支持 CSV 便于对账

购买方式

订阅购买

订阅购买通常更便宜,但有效期为 7/30 天。

重复购买同一个订阅时:

  • 不会并行新增一份同样的订阅
  • 本质上是延长时间
  • 后一次购买会在上一个订阅失效后生效

按量购买

按量购买无时间限制,按实际使用量计费。

前往 充值/订阅页面 完成购买(加微信联系)。

相关入口

注意

价格随上游调整可能变化。以「价格」页实时显示为准,本文档数字只做说明。

基于 MIT 协议发布