Alibaba Cloud / Qwen 模型

Qwen3 Max

Alibaba Cloud / Qwen提供方公开定价生产可用
工具调用JSON 模式长上下文推理流式输出低成本
输入价格
¥0.2 / 1M tokens
输出价格
¥2 / 1M tokens
上下文长度
128k 令牌
可用性
生产可用

模型Code

星模XModel 与百炼模型保持同一模型能力与计费维度,对外使用统一 OpenAI 兼容地址和模型 Code。

模型Code
qwen/qwen3-max
网关地址
https://api.pilotseaview.com/v1
接口兼容
OpenAI Chat Completions

模型介绍

  • CNY token price
  • Strong Chinese-language default
  • Production route verified by gateway smoke tests
  • Useful for general assistant workloads
  • 注意:Review live Alibaba billing facts before publishing margin-sensitive enterprise prices.

模型能力

中文问答 / general chat / 结构化输出 / agent workflows

输入模态
文本
输出模态
文本
支持参数
流式输出、工具调用、JSON、思考/推理
工具调用JSON 模式长上下文推理流式输出低成本

模型价格

计费单位: 每百万 tokens

输入
¥0.2 / 1M tokens
每百万输入 tokens
输出
¥2 / 1M tokens
每百万输出 tokens

免费额度

当前页面不承诺额外免费额度;实际赠送、活动和用量抵扣以控制台账户状态和正式账单为准。

免费额度
暂无免费额度信息

模型限流与上下文

默认按账户、模型和上游可用性动态调度。生产接入前建议先用小流量压测确认并发、延迟和错误率。

上下文长度
128k 令牌
限流说明
已配置
延迟估算
1000-3200ms

API代码示例

OpenAI 兼容接入

Python
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.pilotseaview.com/v1"
)

resp = client.chat.completions.create(
    model="qwen/qwen3-max",
    messages=[{"role": "user", "content": "你好,来自星模XModel"}]
)

print(resp.choices[0].message.content)

可替代模型

Alibaba Cloud / Qwen目录
$0.78 / 1M tokens输入$3.90 / 1M tokens输出262.1k上下文
适用场景中文 Agent 工作流, 商业分析, 结构化输出
路由已配置
工具调用JSON 模式长上下文推理
查看详情
Alibaba Cloud / Qwen目录
$0.65 / 1M tokens输入$3.25 / 1M tokens输出1M上下文
适用场景中文工程工作流, 代码生成, 代码库问答
路由已配置
工具调用JSON 模式长上下文流式输出
查看详情
Google目录
$1.25 / 1M tokens输入$10 / 1M tokens输出1M上下文
适用场景长上下文分析, 视觉工作流, 科学推理
路由已配置
工具调用视觉JSON 模式长上下文
查看详情