价格

按实际使用付费。

按量付费

模型费率
  • PoC 和单项目
  • 上线前估算
  • OpenAI 请求格式
开始构建

额度

预付余额
  • 项目级预算
  • 财务预核和对账
  • 试点和 QA
开始构建

团队

团队用量
  • 项目、环境、团队
  • 预算控制
  • 团队报表
开始构建

BYOK

BYOK
  • 提供方密钥自控
  • 同一套模型目录
  • 已有国内/海外合同
查看认证文档

计算器

模型、token、请求次数、月估算。

估算公式

成本 = 请求次数 × token × 单价 / 1,000,000。

Qwen3 Max:¥2.20

价格计算器

根据模型价格、token 数量和请求量估算月度支出。

月度估算¥1.80Qwen3 Max · 输入 0.2/1M · 输出 2/1M

低成本参考

低成本模型

8 / 8 个模型
模型提供方输入输出上下文能力适用场景延迟状态来源
Qwen3 Maxqwen/qwen3-maxAlibaba Cloud / Qwen¥0.2 / 1M tokens¥2 / 1M tokens128k
工具调用JSON 模式长上下文
中文问答, general chat1000-3200ms生产可用提供方公开定价
DeepSeek V4 Flashdeepseek/deepseek-v4-flashDeepSeek$0.112 / 1M tokens$0.224 / 1M tokens1M
工具调用JSON 模式长上下文
低成本中文任务, 长上下文摘要800-2600ms目录OpenRouter(可用时)
Mistral Small 3.2 24B Instructmistralai/mistral-small-3.2-24b-instructMistral AI$0.1 / 1M tokens$0.3 / 1M tokens128k
工具调用JSON 模式流式输出
翻译, 分类700-2300ms目录OpenRouter(可用时)
GPT-4o miniopenai/gpt-4o-miniOpenRouter$0.15 / 1M tokens$0.6 / 1M tokens128k
工具调用视觉JSON 模式
低成本聊天, 图像理解800-2400ms目录OpenRouter(可用时)
Llama 4 Maverickmeta-llama/llama-4-maverickMeta$0.15 / 1M tokens$0.6 / 1M tokens1M
JSON 模式长上下文流式输出
开源模型工作流, 成本敏感型长上下文950-2800ms目录OpenRouter(可用时)
Gemini 2.5 Flashgoogle/gemini-2.5-flashGoogle$0.3 / 1M tokens$2.50 / 1M tokens1M
工具调用视觉JSON 模式
长文档摘要, 图像问答900-2800ms目录OpenRouter(可用时)
DeepSeek R1deepseek/deepseek-r1DeepSeek$0.7 / 1M tokens$2.50 / 1M tokens163.8k
JSON 模式长上下文推理
中文推理, 数学1800-6000ms目录OpenRouter(可用时)
Qwen3 Coder Plusqwen/qwen3-coder-plusAlibaba Cloud / Qwen$0.65 / 1M tokens$3.25 / 1M tokens1M
工具调用JSON 模式长上下文
中文工程工作流, 代码生成1200-3900ms目录OpenRouter(可用时)