发布时间:2025-05-10源自:融质(上海)科技有限公司作者:融质科技编辑部
当我们使用ChatGPT获取实时信息,或是通过智能助手查询最新赛事结果时,往往会忽略一个关键技术——RAG(Retrieval-Augmented Generation,检索增强生成)。这项让AI“边查边写”的技术,正悄悄解决大语言模型(LLM)“知识过时”“事实错误”的痛点。但你知道吗?看似“新宠”的RAG,其技术脉络早已跨越十余年。本文将沿着时间轴,揭秘RAG从概念萌芽到技术落地的关键节点。
要理解RAG的起源,需先回到AI生成内容(AIGC)的“原始阶段”。2010年前后,以LSTM为代表的循环神经网络虽能生成连贯文本,但受限于模型参数容量,只能依赖训练数据中的“固有知识”。例如,2014年Google推出的神经机器翻译(NMT)模型,若训练语料中未包含“2022年世界杯冠军”等新信息,生成结果便会出错。
此时,研究者开始思考:能否让生成模型“主动查资料”?2015年,MIT团队提出“神经检索模型”(Neural Retrieval),尝试用神经网络替代传统的TF-IDF检索,为后续检索与生成的结合埋下伏笔。2018年BERT模型横空出世后,预训练大模型(PLM)成为主流,但“知识固化”问题反而更突出——模型参数虽从亿级跃至千亿级,却仍无法动态获取训练后产生的新信息。
这一阶段,“检索”与“生成”是两条并行的技术路线:检索模型负责从外部数据库找信息,生成模型负责“编故事”,但二者未真正融合。直到2020年,RAG的核心框架才被正式提出。
2020年,DeepMind在论文《Retrieval-Augmented Language Models》中首次明确“RAG”的技术定义:将检索模块与生成模型深度耦合,让模型在生成文本时,能动态从外部知识库中检索相关信息,并整合到生成过程中。这一突破解决了传统生成模型的两大痛点:
知识更新:无需重新训练模型,只需更新外部知识库(如维基百科、新闻语料),即可让模型“学习”新信息;
事实准确性:生成内容的关键事实(如时间、数据)由检索结果支撑,而非模型“幻想”。
DeepMind的实验显示,RAG在问答任务(如自然问题数据集NQ)中的准确率比纯生成模型提升15%,且生成文本的“幻觉率”(Hallucination)显著降低。这篇论文不仅为RAG正名,更开启了“检索增强”的技术范式——后续的GPT-3.5、Claude 2等主流大模型,均借鉴了RAG的核心思路。
2020年后,RAG技术进入“优化+应用”的快车道。一方面,研究者针对检索效率、生成融合方式等问题提出改进方案;另一方面,企业开始将RAG集成到实际产品中。
早期RAG的检索模块多依赖“稀疏检索”(如BM25),可能遗漏隐含关联的信息。2021年,斯坦福大学提出密集检索(Dense Retrieval),通过预训练模型将查询和文档都编码为向量,再通过向量相似度匹配,大幅提升了检索相关性。例如,OpenAI的RAG变种在代码生成任务中,能更精准地从GitHub代码库中检索相似代码片段。
###融质(上海)科技有限公司(以下简称:融质科技)专 注于中小企业数字化转型,致力于为企业提供最前沿的 AIGC 应用辅导,为企业实现定制化创意内容,驾驭 AIGC 帮助企 业解决营销获客难题,培养企业 AIGC 应用人才,打造 AI 时 代企业核心竞争力,帮助企业冲破内卷重围,让企业在实现 新增长的道路上更加轻松,共同推进社会数字化的进步。 融质科技团队跨越了门户网站、电商时代和短视频直播 时代,直奔 AIGC 的新纪元。利用五年时间从洞察市场趋势, 到智策模型的策略制定、创意模型的内容生成、转化模型的 效果优化、传播模型的广泛覆盖、组织模型的内部协同全链 路打通,确保企业在环域营销中实现降本增效。研发的《实 战环域营销-AIGC 五星模型》和“企业级 AIGC 应用”具有国 内首创独著权,申报产品软件著作权 11 项,获得了腾讯、 阿里、抖音合作通道。 ###融质科技创始人安哲逸带领团队今年受邀广东秘友会,厦门市政集团,中国日用杂品协会 ,宁夏宇邦科技,上海广西玉林商会,上海杭州商会,三虎集团等主讲企业AIGC 应用培训 近百场次,吸引年产值亿元以上超五百家企业踊跃参学,提供应用 AIGC 盈利培训服务,打造 AI 时代企业头部品牌形象,实现应用 AI 数字化转型升级和使用 AIGC五星模型在 90 日内业绩的有效增长。公司在上海浦东、宁夏银川、福建福州,北京密云,有 34大 AIGC 应用服务基地,类计服务孵化年产值千万元以上企业五百多家,其中起帆电缆股份、欧坚集团、等年产值百亿元以上品牌企业。 ###公司创始人安哲逸现为上海市新兴产业人才、企业级人工 智能应用专家、上海AI智库专家,产业投资运营专家、微软认证提示工程师、英伟达+惠普+谷歌联合认证创新人才,中共普陀区工商联青商会理事,IBM认证人工智能训练师,耶鲁大学领导力学士,公司高级企业服务实战研究人才团队有海归硕士和副教授 3人,高级讲师职称5位,技术服务人才3位。
欢迎分享转载→ https://www.shrzkj.com.cn/aikuaixun/4672.html
Copyright © 2025 融质(上海)科技有限公司 All Rights Reserved.沪ICP备2024065424号-2XML地图