本地部署 DeepSeek-R1 模型指南：Ollama 实战教程

前言

DeepSeek-R1 是国产开源大模型，推理能力接近OpenAI o1，但完全开源可本地部署。通过Ollama工具，我们可以轻松在本地运行这个强大的AI模型。

环境准备

硬件要求

模型规格	显存要求	推荐配置
1.5B	2GB	任意迷你主机/NUC
7B	8GB	带核显迷你主机
14B	16GB	游戏本/台式机
32B	32GB	高端台式机/服务器
70B	80GB+	多卡服务器

软件环境

操作系统：Windows 10/11、Linux、macOS
Ollama 最新版
Docker（可选，用于OpenWebUI）

安装 Ollama

Windows

访问 Ollama官网，下载安装包后一键安装。

# 验证安装
ollama --version

Linux/macOS

curl -fsSL https://ollama.com/install.sh | sh

下载 DeepSeek-R1 模型

查看可用模型

ollama list

选择合适版本

根据你的硬件配置选择：

# 推荐配置：Intel N150/N100 或 AMD 8845HS
ollama pull deepseek-r1:1.5b

# 内存8GB以上
ollama pull deepseek-r1:7b

# 内存16GB以上
ollama pull deepseek-r1:14b

# 内存32GB以上
ollama pull deepseek-r1:32b

查看已下载模型

ollama list

运行模型

基础对话

ollama run deepseek-r1:1.5b

配置API服务

默认情况下，Ollama在11434端口提供API服务：

# 设置环境变量
export OLLAMA_HOST=0.0.0.0:11434

# 启动服务
ollama serve

API调用示例

import requests

url = "http://localhost:11434/api/generate"
payload = {
    "model": "deepseek-r1:1.5b",
    "prompt": "用Python写一个快速排序算法",
    "stream": False
}

response = requests.post(url, json=payload)
print(response.json()["response"])

接入 OpenWebUI（可视化界面）

Docker 部署

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name openwebui \
  ghcr.io/open-webui/open-webui:main

使用

访问 http://localhost:3000
注册账号并登录
选择 DeepSeek-R1 模型
开始对话

性能优化

GPU加速（Windows）

确保安装了最新的显卡驱动，Ollama会自动调用GPU进行推理。

内存优化

对于内存较小的设备，可以使用4bit量化版本：

ollama pull deepseek-r1:7b-q4_K_M

多模型管理

# 查看所有模型
ollama list

# 删除不需要的模型
ollama rm deepseek-r1:14b

# 复制模型
ollama cp deepseek-r1:1.5b deepseek-r1:1.5b-custom

常见问题

模型下载速度慢

可以使用国内镜像源：

OLLAMA_MODELS=/path/to/models ollama pull deepseek-r1:7b

显存不足

选择更小的模型规格
使用量化版本（Q4_K_M）
关闭其他占用显存的程序

响应速度慢

检查是否启用GPU加速
考虑升级到更强显卡
选择更小的模型

应用场景

个人AI助手

通过API接入到各种应用，实现：

代码助手
文档撰写
知识问答

企业私有部署

内部知识库问答
客服自动化
数据安全敏感场景

总结

通过Ollama部署DeepSeek-R1非常简单，即使是硬件配置较低的迷你主机也能运行。1.5B版本在Intel N150上可以流畅对话，7B版本在16GB内存环境下也能获得不错的体验。

本地部署AI模型的优势：

✅ 数据隐私安全
✅ 无需联网使用
✅ 可自定义微调
✅ 长期使用成本低

感兴趣的读者可以先从1.5B或7B版本开始体验。