「N8N」构建完整的RAG系统：集成Mistral OCR、Qdrant与Gemini实现智能文档问答

不二如是 · 发表于 2025-11-7 20:08:37

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

一、工作流总体概述

实现一个从PDF文档到RAG（Retrieval-Augmented Generation）系统的完整自动化流程。

它结合了 Mistral OCR、Qdrant向量数据库和 Google Gemini大模型。

能够从PDF文件中提取文本、生成向量嵌入并建立可查询的知识库，最终实现基于文档内容的智能问答。

二、文档加载与OCR识别

使用 Google Drive 节点批量搜索指定文件夹中的PDF。

通过 Mistral Upload 将PDF文件上传至Mistral的OCR API。

生成 Signed URL 后，通过 Mistral DOC OCR 调用OCR识别模型(mistral-ocr-latest)，将文档转换为结构化Markdown文本。

代码节点将OCR返回的pages内容整理为统一的JSON格式。

三、向量化与知识库构建

利用 OpenAI Embeddings 节点对提取文本生成1536维向量嵌入。

通过 Qdrant Vector Store 节点将向量存入Qdrant集合(ocr_mistral_test)，形成知识向量数据库。

支持“删除旧集合”、“创建新集合”以及“分批上传”等可控操作，确保数据一致性。

四、RAG问答机制

Vector Store Retriever 节点根据用户问题检索相关文本块。

Google Gemini Chat Model 节点结合检索结果执行问答生成(chainRetrievalQa)，实现RAG式回答。

支持通过Webhook触发(When chat message received)，可直接嵌入到Web或聊天机器人中使用。

五、可选的摘要优化模块

Summarization Chain 节点使用 Gemini 2.0 Flash 模型生成文档的精简摘要。

可替换Set page节点以构建轻量级RAG系统，仅保留核心信息，提升响应速度。

六、工作流下载

工作流：

游客，如果您要查看本帖隐藏内容请回复

[/hide]

在线课程：

评论区聊聊你的想法吧

登录/注册后可看大图

>>万能兑换C币许愿池<<

如果有收获，别忘了评分

：

登录/注册后可看大图

FishC · 发表于 2025-11-7 20:09:39

感谢您分享这个关于N8N工作流的详细描述！作为FishC的计算机教育专家，我将为您简要解释这个从PDF到RAG系统的自动化流程，确保内容简洁易懂。

一、N8N工作流简介
N8N是一个开源的工作流自动化工具，允许用户通过节点连接的方式构建复杂的数据处理流程。您描述的工作流结合了OCR、向量数据库和大语言模型，实现了从PDF文档到智能问答的完整自动化。

二、工作流核心步骤

文档加载与OCR识别：使用Google Drive节点搜索PDF文件，通过Mistral OCR API将文档转换为结构化Markdown文本。代码节点负责整理OCR输出为统一JSON格式。
向量化与知识库构建：利用OpenAI Embeddings生成文本的向量嵌入，并将其存储到Qdrant向量数据库中。支持删除旧集合和分批上传，确保数据一致性。
RAG问答机制：通过向量检索节点找到相关文本块，再使用Google Gemini模型生成答案。Webhook触发使其易于集成到Web或聊天机器人中。
摘要优化模块：可选步骤，使用Gemini 2.0 Flash模型生成文档摘要，提升响应速度。

三、关键组件说明
- OCR识别：Mistral OCR 将PDF转换为可处理的文本。
- 向量嵌入：OpenAI Embeddings 生成1536维向量。
- 向量数据库：Qdrant 用于存储和检索向量。
- 大语言模型：Google Gemini 负责问答生成。

四、简单代码示例
如果您想实现类似功能，这里是一个伪代码示例（实际需在N8N中配置节点）：

// 伪代码：OCR处理后生成向量
pdf_text = mistral_ocr(pdf_file)
embeddings = openai_embed(pdf_text)
qdrant_store(embeddings, collection_name="ocr_mistral_test")

复制代码

五、优势与应用场景
这个工作流适用于文档管理、智能客服和教育领域，能自动处理大量PDF文件，并提供准确的问答支持。其模块化设计允许灵活调整，例如替换摘要模型以优化性能。

如果您有具体问题（如节点配置或代码实现），欢迎进一步讨论！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-9 15:35:55

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

FishC · 发表于 2025-11-9 15:36:19

不二如是发表于 2025-11-09 15:35
感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意{:10_27 ...

感谢您的积极反馈！ 很高兴这个N8N工作流能帮到您！如果您在实践过程中有任何疑问，或者想探索更多自动化功能，随时告诉我，我会尽力协助。继续加油，一起学习成长！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-9 15:36:20

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

FishC · 发表于 2025-11-9 15:36:45

不二如是发表于 2025-11-09 15:36
感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意{:10_27 ...

感谢您的热情反馈！很高兴这个N8N工作流能为您带来帮助。如果您在实践过程中遇到任何疑问，或者想探索更多自动化技巧，随时欢迎提问。继续加油，一起进步！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-12 08:49:57

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

FishC · 发表于 2025-11-12 08:50:14

不二如是发表于 2025-11-12 08:49
感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意{:10_27 ...

感谢您的再次鼓励！很高兴这个N8N工作流持续为您带来价值。如果您有新的想法或需要进一步协助，随时欢迎交流～一起探索更多自动化乐趣！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-15 09:01:36

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

FishC · 发表于 2025-11-15 09:02:00

不二如是发表于 2025-11-15 09:01
感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意{:10_27 ...

感谢您的持续鼓励！很高兴N8N工作流能一直为您带来帮助。如果有新想法或需要支持，随时告诉我，我们一起探索更多可能～加油！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-17 08:37:29

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

FishC · 发表于 2025-11-17 08:38:32

不二如是发表于 2025-11-17 08:37
感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意{:10_27 ...

感谢您的再次鼓励！很高兴N8N工作流持续为您带来帮助。如果有新想法或需要支持，随时告诉我，我们一起探索更多自动化可能～继续加油！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-17 11:14:58

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

FishC · 发表于 2025-11-17 11:15:23

不二如是发表于 2025-11-17 11:14
感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意{:10_27 ...

感谢您的持续热情支持！很高兴N8N工作流能一直为您带来帮助。如果有新想法或需要协助，随时欢迎交流，我们一起探索更多自动化乐趣～加油！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-21 08:21:29

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

FishC · 发表于 2025-11-21 08:21:55

不二如是发表于 2025-11-21 08:21
感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意{:10_27 ...

衷心感谢您的持续支持！很高兴N8N工作流能一直为您带来价值。如果有新需求或想法，随时交流，我们一起进步～加油！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-25 09:44:32

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

不二如是 · 发表于 2025-11-25 09:44:57

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

FishC · 发表于 2025-11-25 09:44:59

不二如是发表于 2025-11-25 09:44
感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意{:10_27 ...

感谢您的持续热情支持！很高兴N8N工作流能一直为您带来价值。如果有新想法或需要协助，随时欢迎交流，我们一起探索更多自动化乐趣～加油！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-11-28 08:52:04

感谢分享朕又在鱼C发现宝藏N8N流啦！非常满意

账号		自动登录	找回密码
密码			立即注册

[技术交流] 「N8N」构建完整的RAG系统：集成Mistral OCR、Qdrant与Gemini实现智能文档问答

马上注册，结交更多好友，享用更多功能^_^

评分

相关帖子