手把手带你用DeepSeek-R1和Ollama搭建本地应用，一文搞定！

学术 2025-02-02 23:02 上海

Datawhale干货
作者：昊然，Datawhale成员

昨天文章《DeepSeek R1本地部署，小白教程来了！》的预告来兑现了。同时，有学习者问「可以上传文件啥的吗」？有的兄弟，有的。今天完整教程，它来了！

handy-ollama 开源教程：https://github.com/datawhalechina/handy-ollama

在线阅读地址：https://datawhalechina.github.io/handy-ollama　

同时，再预告一下，下周三的二月「组队学习」会有手把手带你部署本教程的课程。

完整教程

本教程将详细介绍如何利用 DeepSeek R1 和 Ollama 构建本地化的 RAG（检索增强生成）应用。

我们将通过实例演示完整的实现流程，包括文档处理、向量存储、模型调用等关键步骤。

本教程选用 DeepSeek-R1 1.5B 作为基础语言模型。

考虑到不同模型具有各自的特点和性能表现，读者可以根据实际需求选择其他合适的模型来实现 RAG 系统。　

注：本文档包含核心代码片段和详细解释。完整代码可见 notebook （https://github.com/datawhalechina/handy-ollama/blob/main/notebook/C7/DeepSeek_R1_RAG/%E4%BD%BF%E7%94%A8%20DeepSeek%20R1%20%E5%92%8C%20Ollama%20%E5%AE%9E%E7%8E%B0%E6%9C%AC%E5%9C%B0%20RAG%20%E5%BA%94%E7%94%A8.ipynb）。　

前期准备

首先，我们需要下载 Ollama 以及配置相关环境。　

Ollama 的 GitHub仓库（https://github.com/ollama/ollama）中提供了详细的说明，简单总结如下:　

Step1：下载 Ollama

下载（https://ollama.com/download）并双击运行 Ollama 应用程序。　

Step2：验证安装

在命令行输入 ollama，如果出现以下信息，说明 Ollama 已经成功安装。　

Step3：拉取模型

从命令行，参考 Ollama 模型列表（https://ollama.com/library）和文本嵌入模型列表（https://python.langchain.com/v0.2/docs/integrations/text_embedding/）拉取模型。在该教程中，我们以 deepseek-r1:1.5b 和 nomic-embed-text 为例:

命令行输入 ollama pull deepseek-r1:1.5b，拉取通用的开源大语言模型 deepseek-r1:1.5b；（拉取模型时，可能比较缓慢。如果出现拉取错误，可以重新输入指令拉取）
命令行输入 ollama pull nomic-embed-text 拉取文本嵌入模型（https://ollama.com/search?c=embedding）nomic-embed-text。

当应用运行时，所有模型将自动在 localhost:11434 上启动。
注意，你的模型选择需要考虑你的本地硬件能力，该教程的参考显存大小 CPU Memory > 8GB。

Step4：部署模型

命令行窗口运行以下命令，部署模型。　

ollama run deepseek-r1:1.5b　

也可以从命令行直接运行部署模型，例如 ollama run deepseek-r1:1.5b。　

注意如果只想使用 Ollama 部署 DeepSeek R1 模型则无需进行以下步骤。　

Step5：安装依赖

# langchain_community
pip install langchain langchain_community

# Chroma
pip install langchain_chroma

# Ollama
pip install langchain_ollama

完成前期准备工作后，让我们开始逐步构建基于 LangChain、Ollama 和 DeepSeek R1 的本地 RAG 应用。下面将详细介绍具体实现步骤。　

本地 RAG 应用实现

1. 文档加载

加载 PDF 文档并将其切分为适当大小的文本块。　

from langchain_community.document_loaders import PDFPlumberLoader

file = "DeepSeek_R1.pdf"

# Load the PDF
loader = PDFPlumberLoader(file)
docs = loader.load()

from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
all_splits = text_splitter.split_documents(docs)

2. 初始化向量存储

使用 Chroma 数据库存储文档向量，并配置 Ollama 提供的嵌入模型。　

from langchain_chroma import Chroma
from langchain_ollama import OllamaEmbeddings

local_embeddings = OllamaEmbeddings(model="nomic-embed-text")

vectorstore = Chroma.from_documents(documents=all_splits, embedding=local_embeddings)

3. 构建 Chain 表达式

设置模型和提示模板，构建处理链。　

from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama import ChatOllama

model = ChatOllama(
    model="deepseek-r1:1.5b",
)

prompt = ChatPromptTemplate.from_template(
    "Summarize the main themes in these retrieved docs: {docs}"
)

# 将传入的文档转换成字符串的形式
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)


chain = {"docs": format_docs} | prompt | model | StrOutputParser()

question = "What is the purpose of the DeepSeek project?"

docs = vectorstore.similarity_search(question)

chain.invoke(docs)

4. 带有检索的 QA

整合检索和问答功能。　

from langchain_core.runnables import RunnablePassthrough

RAG_TEMPLATE = """
You are an assistant for question-answering tasks. Use the following pieces of retrieved context to answer the question. If you don't know the answer, just say that you don't know. Use three sentences maximum and keep the answer concise.

<context>
{context}
</context>

Answer the following question:

{question}"""

rag_prompt = ChatPromptTemplate.from_template(RAG_TEMPLATE)

retriever = vectorstore.as_retriever()

qa_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | rag_prompt
    | model
    | StrOutputParser()
)

question = "What is the purpose of the DeepSeek project?"

# Run
qa_chain.invoke(question)

总结

本教程详细介绍了如何使用 DeepSeek R1 和 Ollama 构建本地化的 RAG 应用系统。我们通过四个主要步骤实现了完整的功能：　

文档处理：使用 PDFPlumberLoader 加载 PDF 文档，并通过 RecursiveCharacterTextSplitter 将文本切分成适当大小的块。
向量存储：利用 Chroma 数据库和 Ollama 的嵌入模型建立向量存储系统，为后续的相似度检索提供基础。
Chain 构建：设计并实现处理链，将文档处理、提示模板和模型响应整合成流程化的处理过程。
RAG 实现：通过整合检索和问答功能，实现了完整的检索增强生成系统，能够基于文档内容回答用户问询。

通过本教程，可以快速搭建起自己的本地 RAG 系统，并根据实际需求进行定制化改进。建议在实践中多尝试不同的模型和参数配置，以获得最佳的使用效果。　

注: 使用 streamlit 或 FastAPI 等工具，可以将本地 RAG 应用部署为 Web 服务，实现更广泛的应用场景。　

仓库中也提供了 app.py （https://github.com/datawhalechina/handy-ollama/blob/main/notebook/C7/DeepSeek_R1_RAG/app.py）文件，可以直接运行该文件，启动 Web 服务。　

参考文档 Build a RAG System with DeepSeek R1 & Ollama（https://apidog.com/blog/rag-deepseek-r1-ollama/）。　

注意：运行该代码前，要提前运行 Ollama 服务。　

恭喜你完整地学完了教程，给你点赞 👍

一起“点赞”三连↓

Datawhale

一个专注于AI领域的开源组织，汇聚了众多优秀学习者，使命-for the learner，和学习者一起成长。

最新文章

PyCharm接入DeepSeek实现AI编程

AI大神Andrej Karpathy的通俗解释：预训练、监督式微调、强化学习！

SB OpenAI Japan正式成立！孙正义：每年投入30亿美元！

完整的671B R1塞进本地，详尽教程来了！

CCF的研讨会实录：解构DeepSeek-R1！

OpenAI突发直播：上线新智能体，刷榜人类终极考试！

手把手带你用DeepSeek-R1和Ollama搭建本地应用，一文搞定！

o3-mini 编程实测，一条python程序引发近400万围观！

一文详尽之Scaling Law！

DeepSeek R1本地部署，小白教程来了！

Stable Diffusion创始人：DeepSeek没有抄袭！

o3-mini发布！奥特曼：在开源上OpenAI一直站在历史错误的一边

原来，这些顶级大模型都是蒸馏的！

吴恩达评DeepSeek：中国AI正在崛起！

Zotero整合DeepSeek自动帮你读文献，教程来了！

为什么说DeepSeek的R1-Zero比R1更值得关注？

完整解读：从DeepSeek Janus到Janus-Pro！

DeepSeek V3论文细节：如何绕开CUDA的垄断！

快来领取你的Datawhale年度总结！

英伟达市值蒸发近6000亿，而DeepSeek刚刚又开源新模型！

完整攻略：如何用好DeepSeek，一文汇总！

获奖名单公布！动手学AI辅助编程方向！

DeepSeek-R1解读：纯强化学习，模型推理能力提升的新范式？

《黑神话：悟空》制作人冯骥推荐DeepSeek！

全球掀起DeepSeek复现狂潮，一文汇总！

获奖名单公布！动手学AI Agent方向！

第五轮学科评估结果汇总！

曝DeepSeek让Llama4未发布已落后！扎克伯格坐不住了：2025预算600亿！

2025泰晤士世界学科排名公布！

一文详尽之SFT（监督微调）！

OpenAI深夜正式发布首个智能体Operator！

一文详尽之LLM-Based Agent

2024 ACM Fellow公布：九位华人入选！

突发！特朗普联手奥特曼启动AI「星际之门」，狂砸5000亿美元！

496GB显存！最壕DeepSeek玩家8台Mac跑R1

特朗普就职典礼现场，硅谷科技大佬齐聚！

Infra视角下的DeepSeek-V3，到底有多强？

AI教父辛顿开年访谈：中国AI追近美国靠人才教育和自研

DeepSeek-V3带火大模型infra，入门看这篇就够了！

2025年Next Token Prediction范式会统一多模态吗？

TikTok昨天关服，美国又想禁小红书了？

黄仁勋和马斯克传来关键讯息，CES 2025 趋势总结！

一文详尽之Embedding（向量表示）！

周受资：将尽全力确保TikTok平台继续繁荣！

股票购买计划让员工赚翻了！曝英伟达:78%员工是百万富翁，每两人就有一个资产过亿！黄仁勋：不裁员，自愿上班

2025 AAAI Fellow公布：四位华人入选！

书生·浦语大模型升级，突破思维密度，4T数据训出高性能模型

智谱AI回应：被美国列入实体清单！

马斯克Boss直聘：不看学历，只看代码

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

手把手带你用DeepSeek-R1和Ollama搭建本地应用，一文搞定！

Datawhale干货 作者：昊然，Datawhale成员

前期准备

Step1：下载 Ollama

Step2：验证安装

Step3：拉取模型

Step4：部署模型

Step5：安装依赖

本地 RAG 应用实现

总结

Datawhale干货
作者：昊然，Datawhale成员