分享好友 最新动态首页 最新动态分类 切换频道
人工智能的未来?RAG 结合了语言和搜索
2024-12-26 15:00

随着专家们暗示大型语言模型(LLM)的技术极限即将到来,人们的焦点转向了检索增强生成(RAG)——这是一项很有前途的进步,可以通过将信息检索与自然语言生成相结合来重新定义人工智能(AI)。

LLM引领了人工智能技术,并改进了各种应用。然而,他们产生虚假信息的倾向限制了他们的潜力。RAG 允许 AI 访问特定的外部数据并将其纳入其响应中,使其更加有效和准确。

“RAG相对于LLM的主要优势在于,前者完全基于所述RAG的所有者可以控制的专有数据集,从而允许更有针对性的应用程序,”人工智能公司Wonderslide的首席执行官Renat Abyasov告诉PYMNTS。“假设医生想为他们的病人部署一个聊天机器人;使用 RAG 将使他们能够确保所述聊天机器人提供的建议是可靠和一致的。LLM很难实现这种可靠性,LLM是用大量公开可用且有时相当可疑的数据进行训练的系统。

RAGs致富
RAG 模型是将语言理解与实时信息检索相结合的尖端 AI。这使他们能够通过访问来自外部来源的最新相关数据来提供更准确和最新的答案。RAG 模型在新闻、研究和客户支持等动态领域表现出色,它们整合新鲜信息的能力使其在需要保持最新状态的情况下具有高度的适应性和价值。

在某些情况下,RAG 可能会击败 LLM。 Tonic.ai 是一家以其专有基准测试平台 Tonic Validate 而闻名的公司,最近对 RAG 系统进行了一系列评估。在其中一项测试中,焦点集中在 CustomGPT.ai 上,这是一种无代码工具,使企业能够将 ChatGPT 风格的解决方案与 RAG 数据库一起部署。

为了评估 CustomGPT.ai 的性能,Tonic.ai 将其与 OpenAI 的内置 RAG 功能进行了比较。评估数据集包括保罗·格雷厄姆(Paul Graham)撰写的数百篇文章和一组55个基准问题,这些问题的答案来自文本。主要目标是评估平台生成准确且与上下文相关的响应的能力。

测试结果显示,CustomGPT.ai 和 OpenAI 的工具都可以产生高质量的答案。然而,CustomGPT.ai 始终如一地为复杂查询提供更精确的响应,从而优于竞争对手。这一结果凸显了 CustomGPT.ai 部署生成式 AI 聊天机器人的简化方法的有效性,使其成为寻求在没有广泛编程知识的情况下实施此类解决方案的企业的一个有吸引力的选择。

使用 RAG 可以带来现实世界的好处。斯坦福大学研究人员和合作者最近发表在NEJM AI杂志上的一份报告表明,RAG可以显着提高LLM在回答医学问题方面的表现。

研究发现,在回答董事会认证医生编写的问题时,GPT-4 的 RAG 增强版本和其他程序的表现优于标准 LLM。作者认为,RAG对于在临床环境中安全使用生成式AI至关重要。

即使是医学特定的LLM,如Google DeepMind的MedPaLM,仍然在与幻觉作斗争,可能无法准确处理临床相关任务。

在相关新闻中,MedPerf 是一项新举措,旨在加快医疗 AI 的发展,同时保护数据隐私。这凸显了对安全可靠的数据集成方法(如 RAG)的需求日益增长,以确保医疗保健中人工智能生成的响应的准确性和相关性。

RAG的优势
Trustible的首席技术官Andrew Gamino-Cheong告诉PYMNTS,许多LLM都接受过相当通用的信息培训,这些信息可以很容易地从互联网上收集。他强调,RAG是增强LLM的一种强大且具有成本效益的方法。通过整合机密或最新信息,RAG 使 LLM 能够提供更准确和相关的响应。这种方法使企业能够充分利用 LLM 的潜力,同时保持其专有数据的安全性和特异性。

他补充说:“LLM的许多用例都受到可能较旧的数据的限制,而RAG模式是使它们保持最新状态的最有效方法,而无需花费数百万美元对其进行全面再训练。“一个秘密是,许多 LLM 提供商希望用户添加 RAG 管道或直接微调他们的基础模型,因为这从根本上转移了很多产品责任。”

Abyasov 解释说,RAG 模型最常用于创建自操作的技术援助程序和对话式 AI 界面。

“在LLM出现在公众的雷达上之前,RAG已经用于这个应用程序多年了,”他补充道。“总的来说,几乎任何需要你拥有严格控制的数据集的应用程序都会倾向于使用RAG,因为它们可以减少意外,并全面获得更一致的结果。”

如何学习大模型 AI

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天:初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么
  • 大模型是怎样获得「智能」的
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天:高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天:模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天:商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

最新文章
营销网站优化怎么做的
优化营销网站的过程涉及多方面的策略,以提高网站在搜索引擎中的排名、提升用户体验,并增加转化率。以下是一些关键步骤和策略:1. 关键词研究: - 使用工具(如Google Keyword Planner,SEMrush,Ahrefs)识别相关的、高搜索量的关键词。
让中国卖家赚更多的钱亚马逊的这场全球峰会为什么开在南京
这对一直称雄国际的亚马逊构成了不小的挑战。面对两大竞争对手,亚马逊被迫更新了对卖家的收费标准,对价格低于15美元的服装,收取佣金从17%削减至5%;价格在15美元至20美元之间的服装,佣金降至10%。会上,亚马逊发布了明年中国业务的战略
小红书推行“号店一体”,社区和商业化的博弈仍在持续
小红书正在进一步完善交易闭环。近日,小红书宣布,从8月2日起正式推行“号店一体”机制,建立新的账号体系和一系列政策。具体而言,“号店一体”调整生效后,将为小红书社区商业生态带来三个核心变化,包括账号体系、开店政策和账号与店铺
海外facebook帐号批发网,facebook 账号 购买
在当今数字化时代,社交媒体平台如Facebook已成为人们沟通和交流的重要工具。随着市场需求的增加,海外Facebook帐号批发网应运而生,成为许多企业和个人获取Facebook账号的便捷渠道。通过这些平台,用户可以快速购买到大量的Facebook账号,
阜新微信小程序自定义顶部导航栏颜色和透明头部
如果您在寻找阜新微信商城小程序、阜新商城小程序、阜新微信小程序的专家,您来对地方了!我们拥有20年的行业经验,能够为您的提供极佳的APP、阜新微信小程序、阜新商城小程序方案。今天应客户要求需要将阜新微信商城小程序导航栏的颜色成
西安微信小程序注册事项
说到微信小程序,可以说是这几年挺流行的。特别是因为小程序不需要下载任何软件,可以随身使用,非常方便。所以一旦上市,就受到很多朋友的喜欢。不过可能有朋友认为只有技术人员才能注册微信小程序。其实这个想法并不是特别正确,只要掌握
汽修工具品牌排行榜前十名每年变化大吗
汽修工具品牌排行榜前十名每年变化大吗?变化不算特别大。目前常见的前十名品牌有世达/SATA、博世/BOSCH、绿林/greener、史丹利/STANLEY、德力西/DELIXI、长城精工、捷科/JETech、宝工/Pro’sKit、得力工具、钢盾/SHEFFIELD 。像世达,它是
使用 Python 爬虫抓取汽车品牌市场数据:销量、广告与消费者反馈
在现代商业环境中,数据已经成为最重要的资产之一,尤其在汽车行业。汽车制造商、经销商以及广告商都依赖于市场数据来优化他们的营销策略、产品开发和品牌定位。对于研究汽车行业的市场趋势和消费者反馈,抓取不同汽车品牌的市场销量、广告
这一抹红色,是从未忘却的纪念
它是飘落在地球上的一根红飘带是贵州旅游打卡的新地标它是什么?全国首个以长征为主题的全域行浸式数字科技体验馆“红飘带”项目9259如果奇迹有颜色那一定是中国红那,这样的红色你见过吗?它取自赤水河边的泥岩之色象征长征的艰辛历程和革
百度推广和安全联盟认证已被取消,现为百度信誉V认证
目前,在百度搜索框中输入某些关键词并搜索到一些自然网站排名时,把鼠标移动到百度推广蓝色V认证上面,发现没有显示百度推广身份认证和安全联盟认证字样,而是显示V已经通过百度信誉认证。由此看来,百度已经将百度推广认证和安全联盟认证
相关文章
推荐文章
发表评论
0评