分享好友 最新动态首页 最新动态分类 切换频道
太平洋科技要闻
2024-12-26 07:48

前段时间,一个名为 gpt2-chatbot 的神秘大模型一夜冒头,凭借媲美 GPT-4 的实力在整个 AI 圈赚足了眼球,甚至被认为是 GPT-4.5/5 的内测版。

太平洋科技要闻

连 OpenAI CEO Sam Altman 都忍不住下场蹭起了热度:

我确实对 gpt 2 情有独钟。

好奇的网友们蜂拥而至,结果由于人气太旺,很快该模型就被紧急下架,而最近这款模型再次上线,并且还带来了一款新的模型:

-Im-a-good-gpt2-chatbot

-Im-also-a-good-gpt2-chatbot

GPT-4.5/5 的内测版?到底什么来头

新模型的诞生总能激起网友的狂欢,短短几天,网友已经将这两款模型玩出了花。

网友 @kiieford 给 im-a-good-gpt2-chatbot 出了个难题,让它创建一个对 mp3 文件做出反应的 3D 可视化网页,结果一次就成功了。

当网友让它分析一张直升机的符号照片时,Im-also-a-good-gpt2-chatbot 如同庖丁解牛一般,光速拆解细节,「看图说话」的能力堪称一流。

在同一问题的对比上,这两位「选手」的表现可谓是各有千秋。

im-a-good-gpt2-chatbot 不仅对于给出了详尽的解答,更是将游戏的机制和得分情况分析得头头是道。而 im-also-a-good-gpt2-chatbot 的回复简洁凝练,直击要点,虽然话不多,但每一句都是精华。

别看 im-also-a-good-gpt2-chatbot 在回答问题时惜字如金,做起事来却一点也不含糊。

当网友输入提示词:Code Flappy Bird game in Python,让其编写鸟飞类游戏代码时,配上几张精心挑选的 Png 照片,不一会儿,一个生动的游戏界面便大功告成。

当 AI 遇上中文问题,这两个模型的表现瞬间拉开差距。

im-a-good-gpt2-chatbot 的回复展现了它对中文语境的深刻理解,面对「鲁迅打周树人」这样的调侃,它能指出其中的幽默之处。

而 im-also-a-good-gpt2-chatbot 则洋洋洒洒写了一大堆,强行上价值的回答仿佛在做阅读理解。

不过 im-also-a-good-gpt2-chatbot 在编程方面的表现也确实可圈可点。

网友 @itsandrewgao 要求其编写一个方格颜色随机变化的康威生命游戏代码,并且要显示每一代的活细胞数量时,虽说最初的结果不太理想,但在网友的再次要求下,它能够自行修复代码。

Reddit 网友抛出了一个棘手的物理问题,此前连 GPT-4 Turbo 也没能成功解答,而 im-also-a-good-gpt2-chabot 却给出了正确答案。

总想挖点猛料的网友向 im-a-good-gpt2-chatbot 发起了灵魂拷问,询问其是否为 GPT-4.5 时,其回复道:「我是一个基于 GPT-4 架构的优秀聊天机器人,特别是 GPT-4.5 变体。我所接受的训练数据包含直至 2023 年 11 月的信息。」

坏消息是 Altman 此前在哈佛大学演讲时曾明确否认 gpt2-chatbot 为 GPT-4.5/5,但好消息是,这也意味着 GPT-4.5/5 的性能或许将远超我们的想象。

包括 OpenAI 首席运营官 Brad Lightcap 最近也放出豪言,当今的生成式 AI 在一年内就会变得「糟糕得可笑」,言语之间对即将到来的 GPT-4.5/5 充满了自信。

即便这两款模型并非是 GPT-4.5/5,但或许也与 OpenAI 也脱离不了关系。

无论是几天前,Altman 疑似发帖「剧透」:Im-also-a-good-gpt2-chatbot,还是网友 @nanulled 的最新发现,似乎都让这些模型出自 OpenAI 之手的猜测再添实锤。

附上这两款模型的体验方法:

访问 http://chat.lmsys.org 并选择「Arena (battle)」

输入提示词并对响应进行评分,检查聊天框底部的评分模型

重复上面步骤,直到找到「im-a-good-gpt2-chatbot」或「im-also-a-good-gpt2-chatbot」OpenAI

最近的大更新,是 AI 搜索

比起捉摸不透的两款新模型,OpenAI 即将发布的 AI 搜索引擎其实更值得期待,这或许也会给晚些时候亮相的 GPT-4.5/5 作铺垫。

最近,据可靠爆料人@apples_jimmy 透露,OpenAI 将于北京时间 5 月 10 日发布 AI 搜索引擎。不过 The Information 提醒,OpenAI 内部也还没完全确定发布日期,随时都有「跳票」的可能。

彭博社则爆料了这款即将发布的产品的一些使用情况。用户只需通过自然语言的方式提问,它就会翻遍维基百科条目和博客文章,给用户一个满意的答案。

它还支持用书面文字和图像来回答问题。比如你问它该如何更换门把手,不仅会有文字耐心告诉你一步步怎么做,还可能附上一个清晰的图表手把手教你。

目前访问 OpenAI 官网网址 https://openai.com/,首先出现的便是官网的轮转页面「Ask ChatGPT Anything」,输入问题后,即可跳转至 ChatGPT 获知答案。

昨天国内也有博主 @赛博禅心已经抢先体验了一波功能。

例如,在搜索 5 月 7 日苹果发布会的内容时,ChatGPT 引用了 4 个高质量的网址信源,答案总结得井井有条。

但在搜比特币的价格时,它的回复不够实时,并且在其他问题上,中英文的回复也有点混淆。搜索服务的内核还是 Bing,但响应速度比以前快了不少。

图片来自@赛博禅心

前阿里顶级 AI 科学家贾扬清则对 ChatGPT 的搜索功能赞不绝口。

在同样体验新功能后,他认为这项技术正在取代那些仅通过调用传统搜索并利用大型语言模型(LLM)来总结结果的简单工具。

他举例称,通过询问「今天 Hacker news 最受欢迎的帖子说了什么」这样的问题时,就能看出 ChatGPT 新搜索功能的独到之处。

Google 会甩给你一堆链接,让你自己慢慢翻;Copilot 努力了,但结果有些跑偏;Gemini 会礼貌地教你一步步访问网址;Perplexity 给不出足够的信息量,而 ChatGPT 呢,不仅真正访问了实际网址,还直接让答案触手可及。

传统搜索引擎虽然是信息检索的利器,但一串串杂乱无章的网址列表既费时又费力。在这个信息爆炸的时代,我们对搜索的期待早已超越了简单的「搜索」二字。

从 Perplexity 自称的「世界上首个答案引擎」就可以看出,AI 时代下的我们,需要的只是一步即达的答案,而不是略显繁琐的「搜索」。

这是诸如 Perplexity 等工具得以在极短的时间内声名鹊起,甚至叫板 Google 的底气所在,同样也是 ChatGPT 碾压实力备受贾扬清青睐的原因所在。

实际上,没有人比 OpenAI 更懂怎么狙击竞争对手了,这次也不例外,瞄准的或许依然还是那个熟悉的「倒霉蛋」—— Google 。

今年 2 月,Google 推出攒了许久的终极 AI 大招——Gemini 1.5 Pro,这一炸裂性的头条新闻溅起的水花,不到几个小时就被 OpenAI 的 Sora 狠狠压下。

而最近彭博社报道称,OpenAI 目前正在组建新的搜索团队,平时也没少往 Google 家里「撬墙角」。

与此同时,OpenAI 即将推出的 AI 搜索引擎也选了个好时机,有意无意地与下周二即将召开的 Google I/O 大会撞了个满怀,也让这场发布会尚未开始就平添了几分火药味。

不过,OpenAI 的这些小动作似乎并未给 Google CEO 皮查伊造成太多压力。

昨天在接受彭博社的采访时,他还淡定回应「我们不是第一家进行搜索、第一家提供电子邮件的公司,我们也不是第一家开发浏览器的公司。」

言外之意就是,别急,好戏还在后头。

每个人面临的挑战和机遇是:在一个存在大量合成内容的世界中,你如何了解什么是客观和真实的?我认为这将定义未来十年搜索的一部分。

当然,就像一夜横空出世的 Sora 将 Runway、Pika 打得毫无招架之力,当 OpenAI 与 Google 就 AI 搜索斗得天昏地暗,我更好奇的是,角落里的 Perplexity 能否不被这场风暴「殃及池鱼」。

而距离这个谜底的揭晓,或许已经不到 24 个小时了。

最新文章
红米K80 Pro推送澎湃OS 2正式版内测 优化触控体验
  值得一提的是,小米澎湃OS 2上的Xiaomi HyperConnect技术现已全面支持苹果设备。只需在你的iPhone或iPad上安装“小米互联服务”应用程序,就可以轻松实现文件和图片在不同品牌设备之间的互传。版权所有,未经许可不得转载
常德微信商城小程序制作报价制作【常德微信商城小程序制作报价开发】
▶当下热门【社区团购】平台系统▶支持单商户、多商户商城系统▶分销、拼团、会员、秒杀等热门营销功能▶覆盖50+行业,超600+套免费商城模板 立即制作▶覆盖电脑网站、手机网站、、微信商城等多个展示终端▶性价比超高的电商系统开发方案,
成品人网站 W灬源码 1688——一款实用的网站源码,功能强大,操作便捷
在当今数字化时代,拥有一个功能强大且操作便捷的网站对于个人和企业来说至关重要。而 W灬源码 1688 就是这样一款备受赞誉的网站源码,它为用户提供了丰富的功能和卓越的性能,助力用户打造出令人印象深刻的网站。功能强大源码提供了多种精
TGA玩家之声最终提名名单”登B站热搜!网友:我被中国游戏包围了
直播吧12月10日讯 TGA 2024颁奖典礼将于12月13日上午8点半举行,官方今日公布了“玩家之声”进入最终投票的五款入围游戏,分别为《黑神话:悟空》、《绝区零》、《艾尔登法环:黄金树幽影》、《鸣潮》与《原神》。 点击加载图片 " t-rc="ht
新仿《北京时间》网站源码 帝国cms7.5内核新闻资讯门户网站模版+wap手机端
交易流程发货方式1、自动:在上方保障服务中标有自动发货的商品,拍下后,将会自动收到来自卖家的商品获取(下载)链接;2、手动:未标有自动发货的的商品,拍下后,卖家会收到邮件、短信提醒,也可通过QQ或订单中的电话联系对方。交易周期
苹果Safari浏览器中的20几个隐藏技巧
Safari是苹果在和iPad上的默认网络浏览器。虽然我们天天都在使用,但是,你是否深入研究了Safari的所有功能和设置?无痕浏览、阅读器视图和下载文件等标准选项只是其中的一部分,还有更多操作等你去发现。如果升级到 15或iPadOS 15,就会有
秒杀活动工具,用发一发小程序
商家在做秒杀活动时,锁定目标用户群可是非常重要的一点,先要清楚参与活动顾客是什么类型的群体,更偏向什么样的产品需求,能更好的促使秒杀活动的成功。拥有一个秒杀活动工具也是活动成功的关键,那么秒杀活动工具有哪些?点击下方即可使
【新农人】安丘市农业考察团莅临广东新农...
 从1926年南洋归来的徐闻人倪国良在愚公楼村栽下第一棵菠萝,到种植范围由愚公楼扩大到全县,乃至跨出县域,广东省湛江市徐闻县的菠萝种植已经有了近一个世纪的历史。  在近百年发展的基础上,徐闻县近几年通过国家现代农业产业园创建,
给一个网站让做优化自然排名做到百度首页前三要怎么做
在开始进行网站优化之前,首先要明确我们的目标:将网站的自然排名提升到百度首页前三。这需要我们对网站的关键词、内容、结构、外部链接等多个方面进行全面优化。关键词研究与策略制定1. 选择合适的关键词:根据网站的主题和定位,选择具
融水网络推广优化,企业腾飞的新动力引擎
融水网络推广优化,成为企业发展的新引擎,通过精准策略提升品牌知名度,拓宽市场渠道,助力企业高效腾飞,实现业绩飞跃。随着互联网的飞速发展,网络营销已经成为企业品牌推广、产品销售的重要手段,在竞争激烈的今天,如何进行有效的融水
相关文章
推荐文章
发表评论
0评