DeepSeek 模型

DeepSeek V4 Flash

阅读快速开始成本估算

DeepSeekOpenRouter（可用时）目录

工具调用JSON 模式长上下文推理低成本

输入价格

$0.112 / 1M tokens

输出价格

$0.224 / 1M tokens

上下文长度

1M 令牌

可用性

模型Code

星模XModel 与百炼模型保持同一模型能力与计费维度，对外使用统一 OpenAI 兼容地址和模型 Code。

模型Code: deepseek/deepseek-v4-flash
网关地址: https://api.pilotseaview.com/v1
接口兼容: OpenAI Chat Completions

阅读快速开始

模型介绍

Low estimated token price
Long context
Chinese workload fit
注意：Validate output quality for customer-facing final responses.

模型能力

低成本中文任务 / 长上下文摘要 / 批量代码辅助

输入模态: 文本
输出模态: 文本
支持参数: 流式输出、工具调用、JSON、思考/推理

工具调用JSON 模式长上下文推理低成本

模型价格

计费单位: 每百万 tokens

输入: $0.112 / 1M tokens
输出: $0.224 / 1M tokens

免费额度

当前页面不承诺额外免费额度；实际赠送、活动和用量抵扣以控制台账户状态和正式账单为准。

免费额度: 暂无免费额度信息

模型限流与上下文

默认按账户、模型和上游可用性动态调度。生产接入前建议先用小流量压测确认并发、延迟和错误率。

上下文长度: 1M 令牌
限流说明: 已配置
延迟估算: 800-2600ms

API代码示例

OpenAI 兼容接入

Python

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.pilotseaview.com/v1"
)

resp = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash",
    messages=[{"role": "user", "content": "你好，来自星模XModel"}]
)

print(resp.choices[0].message.content)

可替代模型

DeepSeek目录

DeepSeek R1

$0.7 / 1M tokens输入$2.50 / 1M tokens输出163.8k上下文

适用场景中文推理, 数学, 分析

路由已配置

JSON 模式长上下文推理流式输出

查看详情

Alibaba Cloud / Qwen目录

Qwen3 Coder Plus

$0.65 / 1M tokens输入$3.25 / 1M tokens输出1M上下文

适用场景中文工程工作流, 代码生成, 代码库问答

路由已配置

工具调用JSON 模式长上下文流式输出

查看详情

Alibaba Cloud / Qwen生产可用

Qwen3 Max

¥0.2 / 1M tokens输入¥2 / 1M tokens输出128k上下文

适用场景中文问答, general chat, 结构化输出

路由已配置

工具调用JSON 模式长上下文推理

查看详情