Alibaba Cloud / Qwen 模型

Qwen3 Max

阅读快速开始成本估算

Alibaba Cloud / Qwen提供方公开定价生产可用

工具调用JSON 模式长上下文推理流式输出低成本

输入价格

¥0.2 / 1M tokens

输出价格

¥2 / 1M tokens

上下文长度

128k 令牌

可用性

生产可用

模型Code

星模XModel 与百炼模型保持同一模型能力与计费维度，对外使用统一 OpenAI 兼容地址和模型 Code。

模型Code: qwen/qwen3-max
网关地址: https://api.pilotseaview.com/v1
接口兼容: OpenAI Chat Completions

阅读快速开始

模型介绍

CNY token price
Strong Chinese-language default
Production route verified by gateway smoke tests
Useful for general assistant workloads
注意：Review live Alibaba billing facts before publishing margin-sensitive enterprise prices.

模型能力

中文问答 / general chat / 结构化输出 / agent workflows

输入模态: 文本
输出模态: 文本
支持参数: 流式输出、工具调用、JSON、思考/推理

工具调用JSON 模式长上下文推理流式输出低成本

模型价格

计费单位: 每百万 tokens

输入: ¥0.2 / 1M tokens
输出: ¥2 / 1M tokens

免费额度

当前页面不承诺额外免费额度；实际赠送、活动和用量抵扣以控制台账户状态和正式账单为准。

免费额度: 暂无免费额度信息

模型限流与上下文

默认按账户、模型和上游可用性动态调度。生产接入前建议先用小流量压测确认并发、延迟和错误率。

上下文长度: 128k 令牌
限流说明: 已配置
延迟估算: 1000-3200ms

API代码示例

OpenAI 兼容接入

Python

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.pilotseaview.com/v1"
)

resp = client.chat.completions.create(
    model="qwen/qwen3-max",
    messages=[{"role": "user", "content": "你好，来自星模XModel"}]
)

print(resp.choices[0].message.content)

可替代模型

Alibaba Cloud / Qwen目录

DeepSeek V4 Pro

$0.78 / 1M tokens输入$3.90 / 1M tokens输出262.1k上下文

适用场景中文 Agent 工作流, 商业分析, 结构化输出

路由已配置

工具调用JSON 模式长上下文推理

查看详情

Alibaba Cloud / Qwen目录

Qwen3 Coder Plus

$0.65 / 1M tokens输入$3.25 / 1M tokens输出1M上下文

适用场景中文工程工作流, 代码生成, 代码库问答

路由已配置

工具调用JSON 模式长上下文流式输出

查看详情

Google目录

Gemini 2.5 Pro

$1.25 / 1M tokens输入$10 / 1M tokens输出1M上下文

适用场景长上下文分析, 视觉工作流, 科学推理

路由已配置

工具调用视觉JSON 模式长上下文

查看详情