成本变量

不同模型可能按输入 token、输出 token、媒体单位、批处理或缓存折扣计费。星模XModel 在模型页和价格页展示当前已发布的计费口径。Chat 流量先按输入 token、输出 token 和请求量估算,再用账户账单事件做真实核对。

输入成本输入 token × 输入单价 / 1,000,000
输出成本输出 token × 输出单价 / 1,000,000
月估算单次预估 × 月请求

生产流量用账号控制

网关会检查账户余额、支付限制、Key 策略和限流规则。不同提供方的模型都落在同一套账户和账单控制里。

余额在产生提供方成本前拦截不可用请求
限流用策略保护账号不被突发流量打穿
流水核对成功调用、拒绝调用和充值记录
价格页上线前比较模型成本和默认选择