智东西(公众号:zhidxcom)
作者 | 香草
编辑 | 漠影
从拼技术走向拼应用,大模型落地的第一站到底是什么?
要回答这个问题,还要从互联网时代的应用场景入手。“搜索”作为我们与信息之间最为频繁的接触场景,成为最广泛、最高频的重构需求之一。
在国外,OpenAI最近刚发布了AI搜索引擎SearchGPT,向谷歌、必应等传统搜索发起挑战;而国内,已经有百度搜索、阿里夸克、360 AI搜索、秘塔AI搜索、天工AI等十几款AI搜索引擎出现,让广大用户们挑花了眼。
到底哪个好用?用户使用量或许是一个比较有说服力的指标。智东西8月8日报道,近日,国内认可度最高的AI应用榜单之一「AI产品榜」(aicpb.com)发布7月榜单,百度搜索的Ai智能回答功能登顶国内AI产品总榜。
▲AI产品榜7月国内AI产品总榜
本次AI产品榜国内总榜,前三名中百度占2席。其中,排名第一的是百度搜索Ai智能回答,百度文库和文心一言分列第3和第5。此外,百度文库推出的新产品「橙篇」也登陆「全球新品增速榜」,成为国内增速最快的AI产品。
百度以搜索引擎起家,在AI时代又以文心大模型抢占先机。在文心大模型的加持下,百度搜索现在不仅具备Ai智能回答的功能,还能化身医疗专家解读检查报告、化身PS修图抠图。基于文心智能体平台,百度搜索接入了文心智能体平台的智能体,可以解答更加垂类、专业的问题。
大模型加身的百度搜索到底有多好用?和市面上其他AI搜索产品相比有什么区别?智东西上手体验了一番。
互联网时代,搜索引擎已经成为我们生活、工作中获取信息的重要工具。
然而,传统搜索引擎在很多方面仍存在痛点,例如对复杂的语义关系和上下文理解能力有限,无法准确理解用户的需求,难以处理图片、音频等非文本形式的信息等,这限制了我们获取信息的效率和质量。
AI时代,大模型加持下的搜索引擎是如何解决这些困境的呢?
首先,相比一个全新的AI搜索应用,在现有的搜索引擎上添加AI能力更符合用户的使用习惯。以百度搜索为例,打开百度App可以看到搜索框的入口和以往并没有什么变化。
▲百度搜索框入口
1、Ai智能回答:动态入口,自动调度智能体
和平时一样,我只需在搜索框输入自己的问题,比如“历届奥运会乒乓球男单冠军”。
在传统搜索中,我们可能会得到很多含有相关内容的匹配结果,需要再自行汇总所需答案。而现在百度搜索会自动调用Ai智能回答能力,直接把知识“嚼碎”了喂给我,迅速列出完整的列表。
▲Ai智能回答
当然,并不是所有的问题都需要调用大模型来解答,因此AI回答的入口被设置成动态的。
例如当我搜索“9.11和9.8谁大”,百度搜索会先呈现出传统的搜索结果,并提供一个按钮供我选择。
按下“回答”后,百度会调用Ai智能回答能力用大模型来解答。看来这道大模型们集体翻车的问题没能难倒文心大模型。
▲Ai智能回答动态入口
除了通用模型外,Ai智能回答也可以根据意图识别调用对应的智能体。例如当我搜索“什么时候去新加坡人最少”,它自动调用了权威的新加坡旅游局官方智能体,还绘制了图表可视化地表现数据。
如果想进一步追问,我也可以点击底部的“聊一聊”按钮进入智能体对话。
▲Ai智能回答智能体调度
智能体调度的好处,是可以获取更垂类、更有效的信息。
作为对比,当我用几款同类AI搜索工具搜索这个问题时,得到的答案要么没有聚焦在“人最少”这个问题上,要么给出的依据不足以支撑答案。相较之下,基于智能体得到的搜索结果更具专业度。
▲同类AI搜索产品对比
2、多模态搜索:一秒识图追问,AI解读医学报告
对多模态输入的搜索是传统搜索引擎的一大局限性。在AI加持下,百度多模态搜索AI功能也基于传统优势实现升级,不仅可以识图,还可以解读医疗报告、进行图片创作等。
例如当我在日常生活中看到感兴趣,但不知道具体是什么的东西,只要随手一拍,百度搜索的识万物功能就可以为我解答。此外,结合大模型能力,我可以继续追问“怎么学”,就得到了详细的学习步骤和技巧。
▲识万物
有时我们拿到检查、体检报告结果时,自己看不懂,要找医生帮忙看还需要重新挂号。这种时候就可以先用百度搜索了解一下大致的情况。
例如我上传一张血清免疫检验报告单,基于文心大模型学习了大量医疗知识的识万物功能,可以快速为我解读其中有哪些异常,并提供健康和就诊建议。
▲AI医疗报告解读
除了识别以外,百度搜索还整合了生成类的AI图像能力,推出了“Ai图片助手”功能,包括修图、抠图、重绘、扩图等。
之前火爆全网的粘土风格转换,现在在一个搜索引擎里就能实现了。
▲风格转换功能
一番试用下来,我的感受是与传统搜索引擎相比,文心大模型重构后的百度搜索大幅减少了信息过滤、汇总等繁琐过程,弥补了多模态搜索的欠缺,提供更加丰富和全面的信息获取方式。
与市面上同类的AI搜索产品相比,无需额外下载App、智能体调度能力等为百度搜索带来了差异性。基于智能体得到的搜索结果更专业,能满足更垂直细分的搜索需求。
信息的高效检索只是一方面,另一方面,AI时代下的搜索框已经突破了传统的束缚,不再仅仅局限于简单的文字或图像搜索。
例如,当我搜索“去水印”、“北京办护照”、“奥运祝福”等关键词,百度会自动识别意图,并呈现出对应内外部功能的入口,不需要再切换App就能实现想要的功能。
▲搜索可得到不同功能入口
这就像一个能通往任何地方的窗口,凭借语义理解和意图识别技术,百度搜索框仿佛成为了一个能够从通向万物的通道。
而在同类AI搜索应用中搜索“去水印”时,虽然可以得到详细的工具、做法,但我仍需要下载或切换到别的应用,再去找到对应的功能,颇有些“纸上谈兵”的意味了。
▲同类AI搜索产品对比
在搜索中自动调度大模型,更多的是一种被动使用AI能力的过程。而在工作、生活中,我们有时会遇到难度更高的问题,需要多轮交互才能解决。
其中,业内普遍认为智能体是这一问题的解决方案之一。在7月举办的2024年世界人工智能大会上,百度创始人、董事长兼首席执行官李彦宏谈道,智能体是其最看好的AI应用方向,而搜索是智能体分发的最大入口。
为了应对这些深度需求,百度搜索内置了AI助手和智能体,用户可以通过简便的入口主动使用。
例如,当我想对搜索的结果进一步追问时,可以点击上方的AI助手栏进行切换,搜索界面就变成了类ChatGPT的聊天窗口。除了可以继续提问外,百度还在顶部提供了相关的智能体推荐。
另一个入口在App底端,点击消息栏即可直接进入AI助手界面。
▲AI助手入口
AI助手同样具备智能体调度的能力。例如当我询问“怎么高情商拒绝别人借钱”,AI助手在给出回答后,在底部给出进一步追问的方向建议以及适用的智能体。点击这个智能体就可以在聊天框中召唤拒绝助手,获得更有针对性的建议。
▲智能体分发、多轮交互
在AI助手界面,点击右上角的小方块可以进入智能体广场,使用覆盖工作、学习、生活中的各种细分需求的智能体工具。
▲智能体入口
一些智能体会在对话中提供GUI(图形用户界面),让用户可以更简单地输入自己的需求,而无需学习复杂的提示词。
▲GUI引导
AI助手和百度搜索结果里的智能体,都来自百度文心智能体平台。截至今年7月,已经有20万开发者、6.3万企业加入百度文心智能体平台。该平台为开发者提供百度生态+域外分发路径和多元的商业机会,助力开发者完成商业闭环,帮助开发者「开发+分发+运营+变现」。
总的来看,百度搜索虽然集成了不少AI能力,但由于入口仍是原来的那个输入框,所以并不显得“厚重”。
搜索框直通各类功能的入口,让百度搜索相比传统搜索引擎、同类AI搜索应用大幅提升了交互体验,为用户节省了不少时间和精力,内置的AI助手和智能体也让其功能更加全面。
在AI搜索这个充满机遇与挑战的新战场上,我们看到了技术的革新为搜索体验带来的巨大变革。
然而,对于AI创企而言,这一赛道带来了索引库成本高昂、用户留存困难等诸多困境,要在这场竞争中脱颖而出并非易事。相比之下,传统搜索引擎开发商凭借其多年积累的技术、数据和用户基础,仍占据着一定的优势。