计费说明

本站采用 USD 作为计费单位。模型广场显示的价格即为最终计费价格，无需额外计算。

计费维度

每一次调用产生两类消耗:

维度	含义
Prompt tokens	你发送给模型的内容(包含 system prompt、历史对话、当前问题、上下文等)
Completion tokens	模型返回的内容(非流式时一次返回总数,流式时累加每个 chunk)

总费用 = prompt_tokens × prompt_price + completion_tokens × completion_price,以选定模型对应的单价计算。

计费方式

本站支持两种购买方式：

订阅购买：通常更便宜，有效期为 7/30 天。
按量购买：按实际使用量计费，无时间限制。

前往充值/订阅页面即可选择适合的购买方式。

计费规则细节

失败请求

上游成功返回响应(2xx)→ 按实际产生的 token 计费
上游返回错误(4xx/5xx)→ 不计费
客户端取消、连接中断 → 流式情况下,已成功推送给客户端的部分计费;非流式不计

流式输出

流式响应每个 chunk 都会被记录,最终按累计 token 一次性扣费。即使客户端中途断开,服务端依然会按已发送的 chunk 总量计算。

上下文累积

很多 Chat 客户端会把历史对话全部塞进 messages 数组,每次发请求时整个上下文都算输入 token。对话越长,单次请求的 prompt token 越多。如果对成本敏感,客户端配置里建议限制历史轮数或开启自动摘要。

价格如何计算

模型的计费包括三部分：输入、输出和缓存。每个部分都有对应的单价。

分组倍率

不同的 API Key 分组可能有不同的倍率。分组倍率是基于模型原价计算的，但模型广场显示的价格已经包含了倍率调整——那就是实际支付的价格。

示例

假设某模型的原价为：

输入：2.5
输出：15
缓存：0.25

当分组倍率为 1.3 时，最终计费价格为：

输入：3.25（2.5 × 1.3）
输出：19.5（15 × 1.3）
缓存：0.325（0.25 × 1.3）

这些调整后的价格就是模型广场显示的价格，也是最终支付的价格。具体的模型价格和分组倍率，请在模型广场查看。

在哪里看消耗

「使用记录」页提供三种视图:

明细:每次调用的时间、模型、Key、输入/输出 token、本次费用
聚合:按日/月/Key/模型分组的累计统计
导出:支持 CSV 便于对账

购买方式

订阅购买

订阅购买通常更便宜，但有效期为 7/30 天。

重复购买同一个订阅时：

不会并行新增一份同样的订阅
本质上是延长时间
后一次购买会在上一个订阅失效后生效

按量购买

按量购买无时间限制，按实际使用量计费。

前往充值/订阅页面完成购买（加微信联系）。

注意

价格随上游调整可能变化。以「价格」页实时显示为准,本文档数字只做说明。

计费说明 ​

计费维度 ​

计费方式 ​

计费规则细节 ​

失败请求 ​

流式输出 ​

上下文累积 ​

价格如何计算 ​

分组倍率 ​

在哪里看消耗 ​

购买方式 ​

订阅购买 ​

按量购买 ​

相关入口 ​

注意 ​