成本变量
不同模型可能按输入 token、输出 token、媒体单位、批处理或缓存折扣计费。星模XModel 在模型页和价格页展示当前已发布的计费口径。Chat 流量先按输入 token、输出 token 和请求量估算,再用账户账单事件做真实核对。
| 输入成本 | 输入 token × 输入单价 / 1,000,000 |
| 输出成本 | 输出 token × 输出单价 / 1,000,000 |
| 月估算 | 单次预估 × 月请求 |
生产流量用账号控制
网关会检查账户余额、支付限制、Key 策略和限流规则。不同提供方的模型都落在同一套账户和账单控制里。
| 余额 | 在产生提供方成本前拦截不可用请求 |
| 限流 | 用策略保护账号不被突发流量打穿 |
| 流水 | 核对成功调用、拒绝调用和充值记录 |
| 价格页 | 上线前比较模型成本和默认选择 |