模型列表

DeepSeek 提供多种强大的 AI 模型，适用于不同的应用场景。本文档详细介绍了所有可用模型的特性、能力和使用建议。

可用模型概览

模型名称	类型	上下文长度	适用场景	状态
`deepseek-chat`	对话模型	32K tokens	通用对话、问答、创作	✅ 可用
`deepseek-reasoner`	推理模型	64K tokens	复杂推理、数学、逻辑	✅ 可用
`deepseek-coder`	代码模型	16K tokens	代码生成、调试、解释	✅ 可用

详细模型介绍

DeepSeek-Chat

模型标识: deepseek-chat

DeepSeek-Chat 是一个通用的对话模型，具备强大的自然语言理解和生成能力。

核心特性

多轮对话: 支持长期对话记忆和上下文理解
多语言支持: 支持中文、英文等多种语言
创意写作: 擅长文章创作、故事编写、诗歌创作
知识问答: 涵盖广泛的知识领域
文本处理: 支持摘要、翻译、改写等任务

技术规格

上下文长度: 32,768 tokens
输出长度: 最大 4,096 tokens
支持功能: 流式输出、函数调用、JSON 模式
训练数据截止: 2024年4月

适用场景

python

# 智能客服
response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "system", "content": "你是一个专业的客服助手"},
        {"role": "user", "content": "我想了解产品的退换货政策"}
    ]
)

# 内容创作
response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "user", "content": "写一篇关于人工智能发展的文章"}
    ]
)

# 语言翻译
response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "user", "content": "请将以下英文翻译成中文：Hello, how are you?"}
    ]
)

性能基准

测试项目	得分	说明
MMLU	87.1%	大规模多任务语言理解
BBH	87.5%	大语言模型困难任务
GSM8K	92.3%	小学数学问题
HumanEval	85.7%	代码生成能力

DeepSeek-Reasoner

模型标识: deepseek-reasoner

DeepSeek-Reasoner 是专门针对复杂推理任务优化的模型，在数学、逻辑推理和科学计算方面表现卓越。

核心特性

深度推理: 支持多步骤逻辑推理
数学计算: 从基础算术到高等数学
科学分析: 物理、化学、工程问题求解
逻辑证明: 演绎推理、归纳推理
问题分解: 将复杂问题分解为子问题

技术规格

上下文长度: 65,536 tokens
输出长度: 最大 8,192 tokens
推理深度: 支持多层次推理链
计算精度: 高精度数值计算

适用场景

python

# 数学问题求解
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[
        {"role": "user", "content": "求解方程组：x + y = 5, 2x - y = 1"}
    ]
)

# 逻辑推理
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[
        {"role": "user", "content": "如果所有的鸟都会飞，企鹅是鸟，那么企鹅会飞吗？请分析这个逻辑问题。"}
    ]
)

# 科学计算
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=[
        {"role": "user", "content": "计算一个质量为2kg的物体从10米高度自由落体的动能"}
    ]
)

性能基准

测试项目	得分	说明
MATH	94.2%	高中数学竞赛题
GSM8K	96.8%	小学数学应用题
TheoremQA	89.7%	科学定理问答
LogiQA	91.3%	逻辑推理测试

DeepSeek-Coder

模型标识: deepseek-coder

DeepSeek-Coder 是专门为编程任务设计的模型，在代码生成、调试和解释方面具有出色的表现。

核心特性

多语言编程: 支持 Python、JavaScript、Java、C++、Go 等
代码生成: 根据需求生成高质量代码
代码解释: 分析代码逻辑和功能
调试辅助: 帮助发现和修复代码问题
代码优化: 提供性能优化建议

技术规格

上下文长度: 16,384 tokens
支持语言: 100+ 编程语言
代码风格: 遵循最佳实践和规范
文档生成: 自动生成代码注释和文档

适用场景

python

# 代码生成
response = client.chat.completions.create(
    model="deepseek-coder",
    messages=[
        {"role": "user", "content": "写一个Python函数，实现快速排序算法"}
    ]
)

# 代码解释
response = client.chat.completions.create(
    model="deepseek-coder",
    messages=[
        {"role": "user", "content": "解释这段代码的功能：\ndef fibonacci(n):\n    if n <= 1:\n        return n\n    return fibonacci(n-1) + fibonacci(n-2)"}
    ]
)

# 代码调试
response = client.chat.completions.create(
    model="deepseek-coder",
    messages=[
        {"role": "user", "content": "这段代码有什么问题？\nfor i in range(10):\n    print(i)\n    i += 1"}
    ]
)

性能基准

测试项目	得分	说明
HumanEval	89.4%	Python 代码生成
MBPP	87.2%	基础编程问题
CodeContests	78.5%	编程竞赛题目
DS-1000	85.9%	数据科学代码

模型选择指南

根据任务类型选择

任务类型	推荐模型	理由
日常对话	`deepseek-chat`	自然流畅的对话体验
内容创作	`deepseek-chat`	强大的创意写作能力
数学计算	`deepseek-reasoner`	专业的数学推理能力
逻辑推理	`deepseek-reasoner`	深度逻辑分析能力
代码编写	`deepseek-coder`	专业的编程能力
代码审查	`deepseek-coder`	代码质量分析
技术文档	`deepseek-chat`	清晰的技术表达
科学计算	`deepseek-reasoner`	精确的科学计算

根据上下文长度选择

上下文需求	推荐模型	上下文长度
短对话	`deepseek-coder`	16K tokens
中等对话	`deepseek-chat`	32K tokens
长文档处理	`deepseek-reasoner`	64K tokens

性能与成本平衡

优先级	推荐模型	特点
成本优先	`deepseek-coder`	较低的 token 消耗
平衡选择	`deepseek-chat`	性能与成本平衡
性能优先	`deepseek-reasoner`	最强的推理能力

API 使用示例

获取模型列表

python

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://api.deepseek.com"
)

# 获取所有可用模型
models = client.models.list()

for model in models.data:
    print(f"模型ID: {model.id}")
    print(f"创建时间: {model.created}")
    print(f"所有者: {model.owned_by}")
    print("---")

获取特定模型信息

python

# 获取特定模型的详细信息
model_info = client.models.retrieve("deepseek-chat")

print(f"模型ID: {model_info.id}")
print(f"对象类型: {model_info.object}")
print(f"创建时间: {model_info.created}")
print(f"所有者: {model_info.owned_by}")

模型切换示例

python

def chat_with_model(model_name, messages):
    """使用指定模型进行对话"""
    response = client.chat.completions.create(
        model=model_name,
        messages=messages
    )
    return response.choices[0].message.content

# 使用不同模型处理相同问题
question = "解释什么是机器学习"

# 通用对话模型
chat_response = chat_with_model("deepseek-chat", [
    {"role": "user", "content": question}
])

# 推理模型
reasoner_response = chat_with_model("deepseek-reasoner", [
    {"role": "user", "content": question}
])

print("Chat模型回答:", chat_response)
print("Reasoner模型回答:", reasoner_response)

模型更新和版本

版本管理

DeepSeek 模型采用持续更新的方式，确保模型性能不断提升：

自动更新: 模型会定期更新以提升性能
向后兼容: 保持 API 接口的向后兼容性
版本通知: 重大更新会提前通知用户

模型状态监控

python

def check_model_status():
    """检查模型可用性"""
    models = ["deepseek-chat", "deepseek-reasoner", "deepseek-coder"]
    
    for model in models:
        try:
            response = client.chat.completions.create(
                model=model,
                messages=[{"role": "user", "content": "test"}],
                max_tokens=1
            )
            print(f"✅ {model}: 可用")
        except Exception as e:
            print(f"❌ {model}: 不可用 - {e}")

check_model_status()

最佳实践

1. 模型选择策略

python

def select_optimal_model(task_type, context_length, priority="balanced"):
    """根据任务特点选择最优模型"""
    
    if task_type in ["coding", "debug", "code_review"]:
        return "deepseek-coder"
    elif task_type in ["math", "logic", "reasoning", "science"]:
        return "deepseek-reasoner"
    elif context_length > 32000:
        return "deepseek-reasoner"  # 最大上下文长度
    else:
        return "deepseek-chat"  # 默认选择

# 使用示例
model = select_optimal_model("math", 1000)
print(f"推荐模型: {model}")

2. 性能优化

python

def optimize_model_usage(content, task_type):
    """优化模型使用"""
    
    # 根据内容长度选择模型
    content_length = len(content.split())
    
    if content_length > 8000:
        model = "deepseek-reasoner"  # 长文档处理
    elif task_type == "coding":
        model = "deepseek-coder"
    else:
        model = "deepseek-chat"
    
    return model

3. 错误处理

python

def robust_model_call(model, messages, fallback_model="deepseek-chat"):
    """带降级的模型调用"""
    try:
        response = client.chat.completions.create(
            model=model,
            messages=messages
        )
        return response
    except Exception as e:
        print(f"模型 {model} 调用失败，切换到 {fallback_model}")
        return client.chat.completions.create(
            model=fallback_model,
            messages=messages
        )

常见问题

Q: 如何选择合适的模型？

A: 根据具体任务选择：

日常对话和内容创作：deepseek-chat
数学和逻辑推理：deepseek-reasoner
编程相关任务：deepseek-coder

Q: 模型之间可以切换吗？

A: 可以，只需要在请求中更改 model 参数即可。

Q: 模型的上下文长度限制是什么？

deepseek-coder: 16K tokens
deepseek-chat: 32K tokens
deepseek-reasoner: 64K tokens

Q: 模型会定期更新吗？

A: 是的，模型会定期更新以提升性能，但保持 API 兼容性。

模型列表 ​

可用模型概览 ​

详细模型介绍 ​

DeepSeek-Chat ​

核心特性 ​

技术规格 ​

适用场景 ​

性能基准 ​

DeepSeek-Reasoner ​

核心特性 ​

技术规格 ​

适用场景 ​

性能基准 ​

DeepSeek-Coder ​

核心特性 ​

技术规格 ​

适用场景 ​

性能基准 ​

模型选择指南 ​

根据任务类型选择 ​

根据上下文长度选择 ​

性能与成本平衡 ​

API 使用示例 ​

获取模型列表 ​

获取特定模型信息 ​

模型切换示例 ​

模型更新和版本 ​

版本管理 ​

模型状态监控 ​

最佳实践 ​

1. 模型选择策略 ​

2. 性能优化 ​

3. 错误处理 ​

常见问题 ​

Q: 如何选择合适的模型？ ​

Q: 模型之间可以切换吗？ ​

Q: 模型的上下文长度限制是什么？ ​

Q: 模型会定期更新吗？ ​

相关资源 ​

模型列表

可用模型概览

详细模型介绍

DeepSeek-Chat

核心特性

技术规格

适用场景

性能基准

DeepSeek-Reasoner

核心特性

技术规格

适用场景

性能基准

DeepSeek-Coder

核心特性

技术规格

适用场景

性能基准

模型选择指南

根据任务类型选择

根据上下文长度选择

性能与成本平衡

API 使用示例

获取模型列表

获取特定模型信息

模型切换示例

模型更新和版本

版本管理

模型状态监控

最佳实践

1. 模型选择策略

2. 性能优化

3. 错误处理

常见问题

Q: 如何选择合适的模型？

Q: 模型之间可以切换吗？

Q: 模型的上下文长度限制是什么？

Q: 模型会定期更新吗？

相关资源