Cherry Studio搭建本地知识库,结合DeepSeek实现RAG
CherryStudio
CherryStudio 简介
CherryStudio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台。 CherryStudio 的高度自定义的设计、强大的扩展能力和友好的用户体验,使其成为专业用户和 AI 爱好者的理想选择。无论是零基础用户还是开发者,都能在 CherryStudio 中找到适合自己的AI功能,提升工作效率和创造力。
今天就体验一下 CherryStudio 搭建本地知识库,并使用 DeepSeek 实现 RAG 功能。
环境准备
在搭建本地知识库前,需要确保以下环境准备到位:
- 操作系统要求:支持 Windows、macOS、Linux 平台。
- 安装 Cherry Studio:
- 前往 Cherry Studio 官方网站 下载最新版本客户端。
- 按照安装向导完成部署。
模型配置
知识库需要配置嵌入模型,而实现 RAG 需要使用到大模型如 DeepSeek-R1,为了方便,我们可以直接使用硅基流动提供的 API 能力,毕竟点击新注册的账号有免费的 2000W Tokens 还没用完。
注册之后可以复制出来API Key,粘贴到Cherry Studio中去。
在 Cherry Studio 设置->模型服务->硅基流动,按如下顺序进行配置:
- 正确配置硅基流动的配置: API 地址【https://api.siliconflow.cn】和 API Key【sk-a·············bcqb】,如果有其他模型的 API Key 也可以直接选择其他模型。
- 选择嵌入模型:用于向量化知识,并存入向量数据库,免费的嵌入模型可以用
BAAI/bge-m3
,为了效果更好可以选择付费的Pro/BAAI/bge-m3
。 - 选择对话模型:用于 RAG 功能实现对话,我们选择当前 DeepSeek-R1 或 DeepSeek-V3。
本地知识创建
1、新建知识库
点击 Cherry Studio 左侧知识库按钮,进入知识库管理页面,点击添加按钮新建知识库。
2、添加文件
支持拖拽添加本地文件,也可以添加本地文件目录、网址、网站或者文本。
3、添加网址或者网站
可以将网络上的内容添加到知识库中,如某一篇博客内容,也可以将一个网站进行添加,如将本人博客网站添加到知识库,需要注意的是正确填写网站的站点地图。
4、搜索知识库
可以在本地知识库中进行内容搜索,能够检索到相关内容片段,这些内容片段后面通过 RAG 技术,将作为提问的上下文传给 LLM。
结合DeepSeek实现RAG
RAG (Retrieval-Augmented Generation) 是一种将信息检索和生成结合起来的技术架构。在自然语言处理领域,RAG 通过检索相关的外部知识库内容,结合生成式模型生成最终的答案,能够极大地提升模型的回答准确性和丰富性。
本地知识库的搭建则是 RAG 技术的重要部分,利用 Cherry Studio 等平台,可以便捷地实现这一过程。
1、选择知识库
进行提问之前可以选择要检索的知识库。
2、进行提问
可以看到大模型回答内容时参考了知识库中本人网站的内容:
常见问题与解决方案
Q: Cherry Studio 能否支持动态更新数据?
A: 支持。可以增量更新文档,系统会自动重建索引。
Q: 是不是需要联网才能使用?
A: 搭建本地知识库支持完全离线运行,对话模型需要联网。
Q: Cherry Studio 的检索速度如何?
自动重建索引。
Q: 是不是需要联网才能使用?
A: 搭建本地知识库支持完全离线运行,对话模型需要联网。
Q: Cherry Studio 的检索速度如何?
A: 对于中小规模知识库,其内置检索引擎性能较优。此外,结合向量化检索技术可以进一步提升速度。