返回
企业应用

为什么按 Token 计费

按 Token 计费反映了处理文本输入和生成输出时实际消耗的计算资源。这种计费方式直接将成本与以基本文本单元衡量的使用量相挂钩。

大语言模型以 Token 序列的形式处理文本,每个 Token 代表一个有意义的文本片段(如词的一部分)。处理 Token 需要消耗大量的计算能力和内存。按 Token 计费确保了账单与模型的工作负载和处理复杂度直接挂钩。这种方式普遍适用于生成、分析等各类输入和输出任务,本质上鼓励高效的输入设计,同时避免了按请求计费中常见的任意限制。

这种方式提供了透明、精准的成本计量。用户只需为其特定请求实际消耗的计算资源付费,无论输入的复杂程度或长度如何。它使服务提供商能够可持续地扩展运营,同时让用户能够根据其独特的工作负载强度获得可预测的成本。

FAQ

相关问题