DeepSeek 模型

DeepSeek V4 Flash

DeepSeekOpenRouter(可用时)目录
工具调用JSON 模式长上下文推理低成本
输入价格
$0.112 / 1M tokens
输出价格
$0.224 / 1M tokens
上下文长度
1M 令牌
可用性
目录

模型Code

星模XModel 与百炼模型保持同一模型能力与计费维度,对外使用统一 OpenAI 兼容地址和模型 Code。

模型Code
deepseek/deepseek-v4-flash
网关地址
https://api.pilotseaview.com/v1
接口兼容
OpenAI Chat Completions

模型介绍

  • Low estimated token price
  • Long context
  • Chinese workload fit
  • 注意:Validate output quality for customer-facing final responses.

模型能力

低成本中文任务 / 长上下文摘要 / 批量代码辅助

输入模态
文本
输出模态
文本
支持参数
流式输出、工具调用、JSON、思考/推理
工具调用JSON 模式长上下文推理低成本

模型价格

计费单位: 每百万 tokens

输入
$0.112 / 1M tokens
每百万输入 tokens
输出
$0.224 / 1M tokens
每百万输出 tokens

免费额度

当前页面不承诺额外免费额度;实际赠送、活动和用量抵扣以控制台账户状态和正式账单为准。

免费额度
暂无免费额度信息

模型限流与上下文

默认按账户、模型和上游可用性动态调度。生产接入前建议先用小流量压测确认并发、延迟和错误率。

上下文长度
1M 令牌
限流说明
已配置
延迟估算
800-2600ms

API代码示例

OpenAI 兼容接入

Python
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.pilotseaview.com/v1"
)

resp = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash",
    messages=[{"role": "user", "content": "你好,来自星模XModel"}]
)

print(resp.choices[0].message.content)

可替代模型

DeepSeek目录
$0.7 / 1M tokens输入$2.50 / 1M tokens输出163.8k上下文
适用场景中文推理, 数学, 分析
路由已配置
JSON 模式长上下文推理流式输出
查看详情
Alibaba Cloud / Qwen目录
$0.65 / 1M tokens输入$3.25 / 1M tokens输出1M上下文
适用场景中文工程工作流, 代码生成, 代码库问答
路由已配置
工具调用JSON 模式长上下文流式输出
查看详情
Alibaba Cloud / Qwen生产可用
¥0.2 / 1M tokens输入¥2 / 1M tokens输出128k上下文
适用场景中文问答, general chat, 结构化输出
路由已配置
工具调用JSON 模式长上下文推理
查看详情