RAG 实战｜用 StarRocks + DeepSeek 构建智能问答与企业知识库

编程

更新时间：2025-05-190

admin管理员组
文章数量:1439025

RAG 实战｜用 StarRocks + DeepSeek 构建智能问答与企业知识库

文章作者：

石强，镜舟科技解决方案架构师

赵恒，StarRocks TSC Member

RAG 和向量索引简介

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合外部知识检索与 AI 生成的技术，弥补了传统大模型知识静态、易编造信息的缺陷，使回答更加准确且基于实时信息。

RAG 的核心流程

检索（Retrieval）

用户输入问题后，RAG 从外部数据库（如维基百科、企业文档、科研论文等）检索相关内容。
检索工具可以是向量数据库、搜索引擎或传统数据库。

生成（Generation）

将检索到的相关信息与用户输入一起输入生成模型（如 GPT、LLaMA 等），生成更准确的回答。
模型基于检索内容“增强”输出，而非仅依赖内部参数化知识。

上图展示了 RAG 的标准流程。首先，图片、文档、视频和音频等数据经过预处理，转换为 Embedding 并存入向量数据库。Embedding 通常是高维 float 数组，借助向量索引（如 HNSW、IVF）进行相似性搜索，加速高效检索。

向量索引通过近似最近邻（ANN）算法优化查询效率，减少高维计算负担。语义搜索匹配用户问题与知识库中的相关内容，使回答基于真实信息，从而降低大模型的“幻觉”风险，提升回答的自然性和可靠性。

关于向量检索的更多介绍，可以参考腾讯大数据基于 StarRocks 的向量检索探索这篇文章。这里不再展开说明。

StarRocks + DeepSeek 的典型 RAG 应用场景

DeepSeek 负责生成高质量 Embedding 和回答，StarRocks 提供实时高效的向量检索，二者结合可构建更智能、更精准的 AI 解决方案。

企业级知识库

适用场景：

企业内部知识库（文档搜索、FAQ）
法律、金融、医药等专业领域问答
代码搜索、软件开发文档查询

方案：

文档嵌入（DeepSeek 负责）：将企业知识库、FAQ、技术文档等数据转换为向量。
存储+索引（StarRocks 负责）：使用 HNSW 或 IVFPQ 存储向量存储在 StarRocks 中，支持高效检索。
检索增强生成（RAG 负责）：用户输入问题 → DeepSeek 生成查询向量 → StarRocks 进行向量匹配 → 返回相关文档 → DeepSeek 结合文档生成最终回答。

AI 客服与智能问答

适用场景：

智能客服（银行、证券、电商）
法律、医疗等专业咨询
技术支持自动问答

方案：

客户对话日志嵌入（DeepSeek 负责）：训练 LLM 处理用户意图，转换历史聊天记录为向量。
存储+索引（StarRocks 负责）：采用向量索引让客服系统能够高效查找相似案例。
检索增强（RAG 负责）：结合历史客服对话 + 知识库 + DeepSeek LLM 生成答案。

示例流程：

用户问：“我如何更改银行卡预留手机号？”
StarRocks 检索到 3 个最相似的客户服务记录
DeepSeek 结合这 3 条历史记录 + 预设 FAQ，生成精准回答

操作演示

系统组成

DeepSeek：提供文本向量化(embedding)和答案生成能力
StarRocks：高效存储和检索向量数据（3.4+版本支持向量索引）

实现流程：

步骤	负责组件	具体实现
环境准备	Ollama StarRocks	用 Ollama 在本地机器上便捷地部署和运行大型语言模型
数据向量化	DeepSeek-Embedding	文本 → 3584 维向量
存储向量	StarRocks	创建表，存入向量
近似最近邻搜索	StarRocks 向量索引	IVFPQ / HNSW 检索
检索增强	模拟 RAG 逻辑	结合检索数据
生成答案	DeepSeek LLM	生成基于真实数据的回答

1.环境准备

1.1 DeepSeek 本地部署

Tips：以下内容使用的是 macbook 进行 demo 演示

1.1.1 使用 ollama 安装本地模型

在本地部署 DeepSeek 时，Ollama 主要起到模型管理和提供推理接口的作用，支持运行多个不同的 LLM，并允许用户在本地切换和管理不同的模型。

下载 ollama：/
安装 deepseek-r1:7b

代码语言：javascript代码运行次数：0运行复制

# 该命令会自动下载并加载模型ollama run deepseek-r1:7b

Tips: 如果想使用云端 LLM（如 DeepSeek 的官方 API），需要获取并填写 API Key 访问 DeepSeek 官网（）后注册账号并登录；在仪表盘中创建 API Key（通常在 “API Keys” 或 “Developer” 部分），复制生成的密钥（如 sk-xxxxxxxxxxxxxxxx）。
本文标签： RAG 实战｜用 StarRocksDeepSeek 构建智能问答与企业知识库
版权声明：本文标题：RAG 实战｜用 StarRocks + DeepSeek 构建智能问答与企业知识库内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.betaflare.com/biancheng/1747620539a2730904.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

编程频道|软件玩家 - 软件改变生活！

RAG 实战｜用 StarRocks + DeepSeek 构建智能问答与企业知识库

RAG 实战｜用 StarRocks + DeepSeek 构建智能问答与企业知识库

RAG 和向量索引简介

RAG 的核心流程

检索（Retrieval）

生成（Generation）

StarRocks + DeepSeek 的典型 RAG 应用场景

企业级知识库

适用场景：

方案：

AI 客服与智能问答

适用场景：

方案：

示例流程：

操作演示

系统组成

实现流程：

1.环境准备

1.1 DeepSeek 本地部署

1.1.1 使用 ollama 安装本地模型

更多相关文章

RAG 实战｜用 StarRocks + DeepSeek 构建智能问答与企业知识库

发表评论

推荐文章

javascript - How to create a slash command with spacing in the name? - Stack Overflow

华为HUAWEI MateBook B3-430 i5 1240P16GB2TB参数报价

技械骑士HZ60 酷睿i516GB1024GB4G独显参数报价

Android平台RTSP

windows下使用vscode+cline插件体验MCP，体验使用AI控制浏览器，踩坑记录（至少让你节省3个小时弯路版）（喂饭级别）

热门文章

javascript - Compensate for utcOffset in Moment.js - Stack Overflow

javascript - How to get the position(in coordinates) of any image element(resizabledraggable) drawn upon html5 canvas? - Stack O

javascript - Angular: serializeunserialize in JSON HttpRequest and HttpResponse object - Stack Overflow

html - Safari handles fit-content dialogs wrapping height: 100% as having no height - Stack Overflow

云原生训练模型+Craft生成代码，太cool啦！

WIFI越近信号越强？CST电磁仿真看看

UnoCSS即时按需引用的原子css引擎

如何从官网下载谷歌浏览器最新版本

桌面进入黑屏时的解决办法

为什么测试智能化推荐从&amp;quot;用例续写&amp;quot;开始

最新文章

2025 上海慕尼黑电子展

Cosmos

视频推理R1时刻，7B模型反超GPT

Claude终于能Research了！打通谷歌全家桶，工作效率10倍提升

MIT惊人神作：AI独立提出哈密顿物理！0先验知识，一天破译人类百年理论

javascript - Type &#39;undefined&#39; is not assignable to type &#39;menuItemProps[]&#39; - Stack Overflow

javascript - VS 2015 Angular 2 import modules cannot be resolved - Stack Overflow

javascript - Get the JSON objects that are not present in another array - Stack Overflow

javascript - How to dismiss a phonegap notification programmatically - Stack Overflow

c - Solaris 10 make Error code 1 Fatal Error when trying to build python 2.7.16 - Stack Overflow

微软Surface Pro 9 5G 商用版 SQ38GB256GB参数报价

微软Surface Pro 9 5G 商用版 SQ38GB128GB参数报价

微软Surface Pro 9 5G 商用版 SQ316GB256GB参数报价

微软Surface Pro 9 5G 商用版 SQ316GB512GB参数报价

联想昭阳X5-14 IRP i5 1335U24GB512GB参数报价

为什么测试智能化推荐从"用例续写"开始

javascript - Type 'undefined' is not assignable to type 'menuItemProps[]' - Stack Overflow