分享好友 最新动态首页 最新动态分类 切换频道
【原】用ChatGPT让Siri和小爱同学不再智障?我看行
2024-12-26 10:58

来 源:雷科技互联网组

编 辑:冬日果酱

排 版:LIN

AI 语音助手的「蠢」,好像全世界都知道。
不管是 Siri 还是小爱同学,大部分使用过所谓「AI 语音助手」的用户大概都同意,它们肯定不算聪明。尤其是在 ChatGPT 出来之后,这种对比尤为明显,甚至包括微软的最高话事人也在批评自家的语音助手。
微软 CEO 萨蒂亚·纳德拉最近在接受英国《金融时报》采访时表示,苹果的 Siri、亚马逊的 Alexa,微软自家的 Cortana(中文名:小娜)以及公认拔尖的 Google Assistant,这些语音助手有一个算一个:
都笨得跟石头一样。
xiaogpt,图/GitHub
在全球最大的代码托管平台 Github 上,就有开发者尝试将 ChatGPT 接入小爱同学,Star 数已经达到了 1.3k。据项目介绍,只要有 ChatGPT 的账号、小爱音箱、正常连接 ChatGPT 的网络以及 python 3.8+,人人都可以在小爱音箱上使用「ChatGPT 版小爱同学」。
原理上很简单,唤起小爱同学后,以「帮我」开头询问的问题会自动以文本形式发送一份给 ChatGPT,同时会屏蔽小爱同学原本的回答,替换成「正在问 GPT,请耐心等待」,而 ChatGPT 生成的文本则会被小爱同学通过 TTS(语音合成技术)进行语音回答。
从开发者的演示显示,整个过程足够流畅,实际回答也远超小爱同学原本的「智力」。(具备条件可搜索 GitHub 项目「xiaogpt」)
演示,图/YouTube
不仅是小爱同学,另一位更为大众调侃的「智障」语音助手——Siri,实际上更早就被开发者尝试接入 ChatGPT。
围绕 Siri 其实有不少尝试,其中国内开发者@Yue-Yang 最近就以「快捷指令」形式连接了 Siri 和 ChatGPT,让 Siri 变成真正的 AI 聊天机器人。在 GitHub 或者「小众软件」上你都能找到对应的快捷指令——智能聊天,不过使用条件是需要申请 OpenAI 的付费 API。
「ChatGPT Siri」在原理上与「xiaogpt」类似,利用 OpenAI 的 API(应用程序接口)和 iOS 的特性,先将语音指令转换为文本再传递给 ChatGPT,收到回答后再让 Siri「读」出来。在 B 站上,通过搜索「ChatGPT Siri」可以查看对应的演示
小爱同学 5.0 发布现场,图/小米
过去我们总抱怨 AI 太笨,要么答非所问,要么干脆就是「我没有明白」,基本几轮对话就会感到心累,转向对功能性的需求,比如天气、问题查询、智能家居操作等。相反,ChatGPT 的对话能力则基本不用担心,尽管可能会有错误信息,但至少不会像 Siri 和小爱同学那样沟通成本太高。这也是多年的发展停滞之后,语音助手的关键机会所在。
2 月底,微软在推出支持 AI 对话的新必应之后,又支持了 Android 和 iOS 版本,并且在 AI 对话中第一次增加了语音对话功能,用户如果使用语音开启对话,新必应也会使用语音回应。不过就现在而言,新必应的语音对话功能还仅限于对话,并不能用来进行一系列操作,比如在手机上唤起某个系统或应用的功能,也不支持设置为默认的语音助手。
语音功能加入,图/微软
此外,微软自家的 Windows 平台也还未支持,目前为止尚未流出 Cortana 或其他新语音助手加入类 ChatGPT 能力的消息。
而更早些时候,小度官方在 2 月初宣布,AI 语音助手小度将在未来融合百度文心一言的全面能力,同时在此基础上还将打造针对智能设备场景的人工智能模型「小度灵机」并应用到小度全系产品。而据小度官方数据,搭载小度的智能设备已经进入了 4000 万户家庭。
当然,按照百度此前的规划,文心一言要在本月才上线测试,距离小度全面接入文心一言的显然还需要一段时间。
另一方面,谷歌也早早看到了这一点。2021 年的 I/O 大会上,谷歌就首次宣布将 LaMDA 大语言模型的对话能力整合入 Goolgle Assistant、搜索和 Workspace。今年 2 月,谷歌推出了类 ChatGPT 的聊天机器人 Bard 之后,接入 Google Assistant 似乎也是题中应有之义,包括 9TO5Google、《连线》杂志也认为谷歌应该这么做。
就像人人都知道语音助手的「蠢」,所有人也看到了 ChatGPT 让语音助手们至少在理解人类语言和对话上「变聪明」的很大可能。
「贾维斯,有时在你学会走之前得先跑起来」,图/《钢铁侠》
过去我们都畅想过,有一个数字语音助手可以在日常生活中帮我们解决各种需求,就像《钢铁侠》里的贾维斯,现实是 Siri 和小爱同学们距离听懂人类的话还差很远,充斥着各种「不明白」「听不懂」。
的确,现实世界的技术还赶不上科幻世界的想象很正常,但 ChatGPT 背后强大的对话语言能力,无疑可以让语音助手们能够更流畅地与我们对话,让我们更感觉在对话的是一个「智商在线」的 AI 助手,而非对牛弹琴。而对于智能音箱和智能家居厂商,这也意味着更高的用户粘性和使用率。
更或许,当 AI 越来越聪明并理解人类,智能家居乃至物联网的未来也会随之发生巨变。
题图来自 Unsplash
最新文章
谷歌深夜发布Gemini 2.0,人工智能(159819)、软件30ETF(562930)备受关注
  消息面上,12月11日晚,刚刚发布量子芯片的谷歌,又投下一枚重磅炸弹,正式发布其最新版大模型Gemini 2.0系列,谷歌表示这是他们迄今为止最强大的人工智能模型,“专为智能体时代设计”,并同时介绍了多个智能体应用(AI Agent)。  
航海王鱼人岛篇特别编辑版
影片名称:航海王鱼人岛篇特别编辑版影片别名:影片类型:动漫影片导演:尾田荣一郎影片演员:田中真弓 , 冈村明美 , 中井和哉 , 山口胜平 , 平田广明 , 大谷育江 , 山口由里子 , 矢尾一树 , 长岛雄一 , 宝龟克寿年份地区:2024/日本更新时
规则引擎 drools_Java常用的规则引擎,让你变动的代码更加容易维护
在本文中,我们将介绍Java中一些最受欢迎的规则引擎。规则引擎由推理引擎发展而来,是一种嵌入在应用程序中的组件,实现了将业务决策从应用程序代码中分离出来,并使用预定义的语义模块编写业务决策。接受数据输入
草根站长的源动力-国内站长网站缩影
随着互联网的发展,国内个人网站也迅速雨后春笋般迅速发展。犹如80年代的私营企业发展个人网站的故事也频繁登上各媒体的版面 非官方的统计:目前国内已经有草根站长300万个。已经开始盈利的个人网站 近5万个个人网站的总收入已经超过3亿 这
背包有个十字架的牌子 十大奢侈品包包排名及图标志
背包有个十字架的牌子,是一个备受关注的奢侈品包包品牌。随着时尚产业的发展和消费观念的改变,越来越多的消费者对于高品质、独特设计的包包有着强烈的需求。在这样的市场环境下,背包有个十字架的牌子以其独特的设计和卓越的品质迅速崛起
港股开盘:恒生指数开盘跌0.59%,恒生科指跌0.61%,美团跌近2%
金融界12月17日消息 港股恒生指数开盘跌0.59%,报19678.03点,恒生科技指数跌0.61%,报4387.62点,国企指数跌0.53%,报7095.14点,红筹指数跌0.1%,报3691.93点。大型科技股中,阿里巴巴-W跌0.53%,腾讯控股跌0.89%,京东集团-SW跌1.39%,
玩转serv00虚拟主机(一):零成本搭建wordpress个人博客&入门
不少童鞋在搭建博客、alist、图床等各类web服务的时候苦于云的成本望而却步,但其实搭建web服务也可以用虚拟主机,不少厂商都有免费的虚拟主机,但对于很多童鞋可能是第一次听说虚拟主机,这里就开一个新的系列,玩转serv00家的免费虚拟主
考研民商法学专业容易上岸的大学怎么选择
在准备考研的过程中,选择合适的学校是至关重要的一步。尤其是对于民商法学专业的考生来说,如何找到一所适合自己的学校更是需要认真考虑的事情。本文将为大家提供一份考研选择民商法学学校指南,帮助你在众多院校中做出明智的决定。首先,
老照片如何修复成高清?四个老照片修复教程全揭晓
让老照片焕发新生:给你分享老照片修复的精彩工具 提到老照片,很多人心中总是涌动着温暖的回忆。家人们,是否曾经翻阅过那些泛黄的照片,感受到那份岁月的沉淀?但时间的流逝总会导致照片的劣化,很多细节模糊甚至消失。那么,我们该如何
四川甜城旅游景点大全:热门景点排名及详细介绍
四川甜城即四川省内江市以其独有的地理位置和丰富的历史文化遗产而闻名遐迩。内江不仅是的“糖都”也是甜城文化的发源地。这里既有壮丽的自然景观又有深厚的历史文化底蕴是一个不可多得的旅游胜地。从古朴典雅的隆昌石牌坊到秀美宁静的甜城
相关文章
推荐文章
发表评论
0评