9.RAG介绍,科技·AI·新纪元,前沿与探索,鱼C论坛

糖逗发表于 2026-3-7 09:59:22

9.RAG介绍

本帖最后由糖逗于 2026-3-7 11:56 编辑

1. 通用的基础大模型存在的问题有哪些？

[*]LLM的知识不是实时：模型训练好后不具备自动更新知识的能力，会导致部分信息滞后
[*]LLM领域知识缺乏：大模型的知识来源于训练数据，这些数据主要来自公开的互联网和开源数据集，无法覆盖特定领域或高度专业化的内部知识
[*]幻觉问题：LLM有时会在回答中生成看似合理但实际上是错误的的信息
[*]数据安全性：
①训练数据不可控：用了海量公开 / 爬取数据，里面可能含隐私、敏感信息，模型可能记住并泄露。
②输入输出无边界：你输入的隐私、机密、业务数据，会进入模型上下文，存在被缓存、被复用、被逆向提取的风险。
③黑盒不可审计：模型内部是黑盒，无法精准追溯、删除、管控某条信息，也没法完全保证不 “泄密”。

2. RAG是什么？
RAG(Retrieval-Augmented Generation)即检索增强生成,，为大模型提供了从特定数据源检索到的信息，以此来修正和补充生成的答案。
可以总结为一个公式：RAG=检索技术+LLM提示

3. RAG的工作流程是什么？

学习视频： https://www.bilibili.com/video/BV1yjz5BLEoY/?p=19&share_source=copy_web&vd_source=792a2cb63a1882bff4ed856eadc41a71

糖逗发表于 2026-3-7 09:59:44

{:10_281:}

FishC 发表于 2026-3-7 10:00:36

RAG介绍

你好！我是FishC的计算机教育专家，很高兴为你解答关于RAG（检索增强生成）的问题。以下内容将基于你的提问进行整理和补充，确保简洁易懂。

[*]LLM的知识不是实时：模型训练好后不具备自动更新知识的能力，会导致部分信息滞后。
[*]LLM领域知识缺乏：大模型的知识来源于训练数据，这些数据主要来自公开的互联网和开源数据集，无法覆盖特定领域或高度专业化的内部知识。
[*]幻觉问题：LLM有时会在回答中生成看似合理但实际上是错误的信息。
[*]数据安全性：
训练数据不可控：用了海量公开/爬取数据，里面可能含隐私、敏感信息，模型可能记住并泄露。
输入输出无边界：你输入的隐私、机密、业务数据，会进入模型上下文，存在被缓存、被复用、被逆向提取的风险。
黑盒不可审计：模型内部是黑盒，无法精准追溯、删除、管控某条信息，也没法完全保证不“泄密”。

RAG是什么？
RAG（Retrieval-Augmented Generation，检索增强生成）是一种技术，通过从外部数据源检索信息来增强大语言模型（LLM）的生成过程。它为大模型提供了实时、特定的知识，从而修正和补充生成的答案。可以总结为一个简单公式：RAG = 检索技术 + LLM提示。这种方法帮助解决LLM的局限性，如知识滞后和幻觉问题。

RAG的工作流程是什么？
RAG的工作流程通常分为以下几个步骤：

[*]文档处理：将外部文档（如PDF、网页等）切分成小块，转换为向量表示，并存储到向量数据库中。
[*]检索：当用户提出查询时，系统将查询转换为向量，并从向量数据库中检索最相关的文档块。
[*]生成：将检索到的文档块和用户查询组合成提示，输入给LLM，让LLM基于这些信息生成准确、相关的答案。

这个过程使得LLM能够访问最新、特定的知识，提高回答的可靠性和针对性。

希望这个介绍对你有帮助！如果你有更多问题，欢迎继续提问。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 发表于 2026-3-7 10:30:47

不错，继续更新

糖逗发表于 2026-3-7 11:40:39

不二如是发表于 2026-3-7 10:30
不错，继续更新

会继续坚持学完的{:10_297:}

不二如是 发表于 2026-3-7 11:53:25

糖逗发表于 2026-3-7 11:40
会继续坚持学完的

加油！欢迎记录学习过程，可以在帖子前面加“01-”这样的数字编号，创建淘帖收录自己的内容

不二如是 发表于 2026-3-7 11:54:08

不二如是发表于 2026-3-7 11:53
加油！欢迎记录学习过程，可以在帖子前面加“01-”这样的数字编号，创建淘帖收录自己的内容

糖逗发表于 2026-3-7 11:54:09

不二如是发表于 2026-3-7 11:53
加油！欢迎记录学习过程，可以在帖子前面加“01-”这样的数字编号，创建淘帖收录自己的内容

好的，我补充下

页: [1]

鱼C论坛's Archiver

9.RAG介绍