【LLM】如何使用DeepSeek推理模型（deepseek-reasoner）-Euler的博客

一、模型简介

DeepSeek推理模型（deepseek-reasoner）是DeepSeek推出的一款具备深度推理能力的AI模型。其核心优势在于通过**Chain of Thought（CoT，思维链）**机制，在生成最终答案前先进行逻辑推理过程的详细推导，从而显著提升回答的准确性和可解释性。该模型通过API提供以下核心能力：

返回**推理过程（reasoning_content）和最终答案（content）**两个独立输出
支持多轮对话场景下的上下文管理
最大支持64K上下文长度

二、API关键参数详解

1. 输入参数

参数名称	说明
`max_tokens`	控制最终答案的最大长度（默认4096，最大支持8192）
`reasoning_effort`	控制CoT推理过程的详细程度（即将支持，参数值范围待文档更新）

2. 输出参数

字段名称	说明
`content`	最终答案文本
`reasoning_content`	生成答案的完整推理过程（如数学推导、逻辑分析等）

3. 上下文限制

最大上下文长度：64K tokens
推理过程存储：reasoning_content不占用上下文长度配额

4. 兼容性说明

支持功能：Chat Completion、Prefix Completion（Beta）
不支持功能：Function Calling、JSON输出格式、FIM（Beta）
禁用参数：temperature、top_p等采样参数无效但不会报错

三、多轮对话处理规范

1. 核心原则

排除推理过程字段：在构建多轮对话历史时，仅传递前序轮次的 content字段，需主动过滤掉 reasoning_content
上下文管理示意图：

graph TD A[用户提问] --> B[模型生成CoT+答案] B --> C[过滤保留content] C --> D[构建新轮次上下文] D --> E[继续对话]

2. 错误示例

# ❌ 错误写法（包含推理过程）
messages = [
    {"role": "assistant", "content": prev_answer["content"], 
     "reasoning_content": prev_answer["reasoning_content"]},  # 违规字段
    {"role": "user", "content": "新问题"}
]

四、Python API使用示例

1. 非流式调用

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.deepseek.com"
)

# 第一轮对话
messages = [{"role": "user", "content": "比较9.11和9.8的大小"}]
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=messages
)

print("推理过程：")
print(response.choices[0].message.reasoning_content)
# 输出示例：
# "首先将两个数转换为小数形式：9.11 = 9.11，9.8 = 9.8。比较小数点后第一位，1 < 8，因此9.11 < 9.8"

print("最终答案：", response.choices[0].message.content)
# 输出："9.11比9.8小"

2. 流式调用（Streaming）

# 第二轮对话（流式处理）
messages.append({
    "role": "assistant",
    "content": response.choices[0].message.content
})
messages.append({
    "role": "user",
    "content": "草莓（strawberry）这个词中有几个R？"
})

response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=messages,
    stream=True
)

reasoning = ""
content = ""
for chunk in response:
    if chunk.choices[0].delta.reasoning_content:
        reasoning += chunk.choices[0].delta.reasoning_content
    else:
        content += chunk.choices[0].delta.content

print("推理过程：", reasoning)
# 输出："逐个字母分析：s-t-r-a-w-b-e-r-r-y。发现第3位和第8、9位存在R字符，共3个R"
print("最终答案：", content)
# 输出："草莓这个词中有3个R"

五、重要注意事项

SDK版本要求需升级OpenAI Python SDK至最新版：
```
pip install -U openai
```
参数限制
- 设置 temperature等参数不会影响结果
- 使用 logprobs参数会触发 400错误
性能优化建议
- 对于长推理过程，建议通过 max_tokens控制最终答案长度
- 多轮对话时定期清理历史记录以避免上下文过长

六、应用场景示例

教育领域展示数学题的详细解题步骤：

messages = [{"role": "user", "content": "解方程：2x + 5 = 15"}]
# 输出推理过程将包含移项、计算等详细步骤

客服系统
记录复杂问题的推理路径：

messages = [{"role": "user", "content": "为什么我的订单状态显示异常？"}]
# 推理过程可记录系统排查的多个可能性

七、总结

DeepSeek推理模型通过独特的CoT机制，为开发者提供了可解释性强、逻辑清晰的AI解决方案。通过合理使用 reasoning_content字段，开发者可以构建具备透明性的人机交互系统。建议在实际项目中结合流式处理和多轮对话管理，充分发挥该模型的潜力。

目录CONTENT

【LLM】如何使用DeepSeek推理模型（deepseek-reasoner）