9.RAG介绍
本帖最后由 糖逗 于 2026-3-7 11:56 编辑1. 通用的基础大模型存在的问题有哪些?
[*]LLM的知识不是实时:模型训练好后不具备自动更新知识的能力,会导致部分信息滞后
[*]LLM领域知识缺乏:大模型的知识来源于训练数据,这些数据主要来自公开的互联网和开源数据集,无法覆盖特定领域或高度专业化的内部知识
[*]幻觉问题:LLM有时会在回答中生成看似合理但实际上是错误的的信息
[*]数据安全性:
①训练数据不可控:用了海量公开 / 爬取数据,里面可能含隐私、敏感信息,模型可能记住并泄露。
②输入输出无边界:你输入的隐私、机密、业务数据,会进入模型上下文,存在被缓存、被复用、被逆向提取的风险。
③黑盒不可审计:模型内部是黑盒,无法精准追溯、删除、管控某条信息,也没法完全保证不 “泄密”。
2. RAG是什么?
RAG(Retrieval-Augmented Generation)即检索增强生成,,为大模型提供了从特定数据源检索到的信息,以此来修正和补充生成的答案。
可以总结为一个公式:RAG=检索技术+LLM提示
3. RAG的工作流程是什么?
学习视频: https://www.bilibili.com/video/BV1yjz5BLEoY/?p=19&share_source=copy_web&vd_source=792a2cb63a1882bff4ed856eadc41a71
{:10_281:} RAG介绍
你好!我是FishC的计算机教育专家,很高兴为你解答关于RAG(检索增强生成)的问题。以下内容将基于你的提问进行整理和补充,确保简洁易懂。
[*]LLM的知识不是实时:模型训练好后不具备自动更新知识的能力,会导致部分信息滞后。
[*]LLM领域知识缺乏:大模型的知识来源于训练数据,这些数据主要来自公开的互联网和开源数据集,无法覆盖特定领域或高度专业化的内部知识。
[*]幻觉问题:LLM有时会在回答中生成看似合理但实际上是错误的信息。
[*]数据安全性:
训练数据不可控:用了海量公开/爬取数据,里面可能含隐私、敏感信息,模型可能记住并泄露。
输入输出无边界:你输入的隐私、机密、业务数据,会进入模型上下文,存在被缓存、被复用、被逆向提取的风险。
黑盒不可审计:模型内部是黑盒,无法精准追溯、删除、管控某条信息,也没法完全保证不“泄密”。
RAG是什么?
RAG(Retrieval-Augmented Generation,检索增强生成)是一种技术,通过从外部数据源检索信息来增强大语言模型(LLM)的生成过程。它为大模型提供了实时、特定的知识,从而修正和补充生成的答案。可以总结为一个简单公式:RAG = 检索技术 + LLM提示。这种方法帮助解决LLM的局限性,如知识滞后和幻觉问题。
RAG的工作流程是什么?
RAG的工作流程通常分为以下几个步骤:
[*]文档处理:将外部文档(如PDF、网页等)切分成小块,转换为向量表示,并存储到向量数据库中。
[*]检索:当用户提出查询时,系统将查询转换为向量,并从向量数据库中检索最相关的文档块。
[*]生成:将检索到的文档块和用户查询组合成提示,输入给LLM,让LLM基于这些信息生成准确、相关的答案。
这个过程使得LLM能够访问最新、特定的知识,提高回答的可靠性和针对性。
希望这个介绍对你有帮助!如果你有更多问题,欢迎继续提问。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 不错,继续更新 不二如是 发表于 2026-3-7 10:30
不错,继续更新
会继续坚持学完的{:10_297:} 糖逗 发表于 2026-3-7 11:40
会继续坚持学完的
加油!欢迎记录学习过程,可以在帖子前面加“01-”这样的数字编号,创建淘帖收录自己的内容 不二如是 发表于 2026-3-7 11:53
加油!欢迎记录学习过程,可以在帖子前面加“01-”这样的数字编号,创建淘帖收录自己的内容
不二如是 发表于 2026-3-7 11:53
加油!欢迎记录学习过程,可以在帖子前面加“01-”这样的数字编号,创建淘帖收录自己的内容
好的,我补充下
页:
[1]