Pilot 派诺信息星模XModel
首页模型榜单价格工具大赛文档博客
登录 / 注册
模型

模型加载中

正在打开模型详情...

Pilot 派诺信息星模XModel

模型选择、预算、BYOK、用量报表。

产品

模型市场榜单价格

工具

成本计算器迁移检测价格对比账单分析凭证验证

接入文档

快速开始OpenAI 迁移计费

法务

隐私政策服务条款退款政策

参考资源

低价 LLM APIOpenRouter 替代方案
© 2026 星模XModel主办单位:贵州派诺数海观澜数字产业发展有限公司黔ICP备2026008986号-1
Xiaomi Mimo V2.5 Pro API 价格、能力、上下文与 OpenAI 兼容代码 · 星模XModel
Alibaba Cloud / Qwen 模型

Xiaomi Mimo V2.5 Pro

阅读快速开始→成本估算
Alibaba Cloud / Qwen提供方公开定价生产可用
工具调用JSON 模式流式输出长上下文
输入价格
¥4 / 百万令牌
输出价格
¥16 / 百万令牌
上下文长度
1M 令牌
可用性
生产可用
模型代码模型介绍模型能力模型价格免费额度模型限流与上下文API 代码示例请求参数

模型代码

星模XModel 与百炼模型保持同一模型能力与计费维度,对外使用统一 OpenAI 兼容地址和模型代码。

模型代码
xiaomi/mimo-v2.5-pro
网关地址
https://api.pilotseaview.com/v1
接口兼容
OpenAI 兼容对话接口
阅读快速开始

模型介绍

MiMo-V2.5-Pro 是小米发布的最新旗舰模型。与前代模型相比,它在通用智能体能力、复杂软件工程以及长程任务等方面都有显著提升,在 ClawEval、GDPVal 和 SWE-bench Pro 等基准测试中均位列前茅。它能够独立且完全自主地完成需要人类专家耗时数天甚至数周的专业任务,涉及上千次工具调用。其高达 100 万 token 的上下文长度,非常适合集成到各种智能体框架中使用。

  • 已提供人民币计价的公开按令牌价格。
  • 已进入公开模型目录,可用于横向对比。
  • 可通过 `/v1/chat/completions` 调用。
  • 目录元数据已展示长上下文能力。

模型能力

中文问答 / 结构化输出 / 智能体工作流

输入模态
文本
输出模态
文本
支持参数
流式输出、工具调用、JSON
工具调用JSON 模式流式输出长上下文

模型价格

计费单位: 每百万令牌

输入
¥4 / 百万令牌
每百万输入令牌
输出
¥16 / 百万令牌
每百万输出令牌

免费额度

当前页面不承诺额外免费额度;实际赠送、活动和用量抵扣以控制台账户状态和正式账单为准。

免费额度
暂无免费额度信息

模型限流与上下文

默认按账户、模型和上游可用性动态调度。生产接入前建议先用小流量压测确认并发、延迟和错误率。

上下文长度
1M 令牌
最大输出长度
128k tokens
RPM 限流
100 次/分钟
TPM 限流
10,000,000 tokens/分钟
延迟估算
800-3200ms

API 代码示例

OpenAI 兼容接入

Python
from openai import OpenAI

client = OpenAI(api_key="YOUR_API_KEY", base_url="https://api.pilotseaview.com/v1")

resp = client.chat.completions.create(
    model="xiaomi/mimo-v2.5-pro",
    messages=[{"role": "user", "content": "Hello from XModel"}],
)

print(resp.choices[0].message.content)

请求参数

该模型所属接口类型支持的请求参数参考。具体可用取值以上游模型能力为准。

参数类型必填默认可选值说明
modelstring是——要调用的模型 id。
messagesarray是——OpenAI 对话格式的消息列表。
temperaturenumber否1—采样温度,0–2,越低越确定。
max_tokensinteger否——生成的最大 token 数。
top_pnumber否1—核采样概率质量,0–1。
streamboolean否false—以 SSE 流式返回。
stopstring | string[]否——最多 4 个停止序列。
toolsarray否——模型可调用的工具/函数定义。
tool_choicestring | object否auto—控制是否/调用哪个工具。
response_formatobject否—text | json_object强制纯文本或 JSON 对象输出。
frequency_penaltynumber否0—重复 token 惩罚,-2 到 2。
presence_penaltynumber否0—已出现 token 惩罚,-2 到 2。

可替代模型

Alibaba Cloud / Qwen生产可用

Glm 5.2

92
¥8 / 百万令牌输入¥28 / 百万令牌输出1M上下文
适用场景中文问答, 结构化输出, 智能体工作流
路由已配置
工具调用JSON 模式流式输出长上下文
查看详情
Alibaba Cloud / Qwen生产可用

Qwen3 Max (2026-01-23)

92
¥2.50 / 百万令牌 起输入¥10 / 百万令牌 起输出256k上下文
适用场景中文问答, 结构化输出, 智能体工作流
路由已配置
工具调用JSON 模式流式输出长上下文
查看详情
Alibaba Cloud / Qwen生产可用

Qwen3.7 Max

92
¥6 / 百万令牌输入¥18 / 百万令牌输出1M上下文
适用场景中文问答, 结构化输出, 智能体工作流
路由已配置
工具调用JSON 模式流式输出长上下文
查看详情

模型指标

可用性
生产可用
路由状态
已配置
延迟估算
800-3200ms
热度 / 活跃度
平台数据暂不可用