分享好友 最新动态首页 最新动态分类 切换频道
谷歌“狙击”OpenAI,发布新一代大模型!主打Agent+多模态
2024-12-27 23:07

继量子芯片之后,谷歌又来抢“OpenAI双12直播”的流量了!

谷歌“狙击”OpenAI,发布新一代大模型!主打Agent+多模态

就在刚刚,谷歌新一代大模型Gemini 2.0突然登场,再次由谷歌CEO皮猜亲自官宣。

新一代模型专为AI Agent而打造,谷歌表示目前已经将2.0版本提供给了一些开发者内测,正在迅速将其集成在Gemini和搜索等产品线中。

好消息是,Gemini 2.0 Flash实验版模型今天就在网页端开放,大家都能玩,移动端即将推出。

除此之外,谷歌还推出了一项名为深度研究(Deep Research)的新功能,基于高级推理和长上下文能力,它能直接帮你干研究助理的活儿——给个主题,自己出报告的那种。

目前这个新功能在Gemini Advanced版本中可用。

谷歌这一波出手,再结合Sora的不尽如人意,新一天的直播还没开始,已经有人开始唱衰OpenAI了:

OpenAI的护城河是什么?

“面向智能体时代的新AI模型”

在谷歌CEO皮猜、Google DeepMind CEO哈萨比斯,以及Google DeepMind CTO科雷(Koray Kavukcuoglu)三人共同撰写的博客文章中,官方给Gemini 2.0的定位是:

面向智能体时代的AI模型。

在多模态方面的新进展,以及原生工具的使用,使我们能够构建新的AI智能体,以更接近实现通用助手的愿景。

具体如何体现?在Gemini 2.0 Flash实验版第一时间上线的同时,谷歌还在Gemini Advanced中推出了一项名为深度研究(Deep Research)的智能体新功能。

你可以把它当成以研究助理,围绕一个复杂主题生成研究报告。有点像是个科研版AI搜索

另外一个Gemini 2.0的重点关键词是:多模态

2.0 Flash实验版除了支持图像、视频、音频多模态输入,还支持多模态输出。

不单单是简单的图文混排,可控的多语种文本到语音(TTS)输出也行,还能直接本地调用工具,比如谷歌搜索、代码工具、第三方用户定义的功能。

有ChatGPT插件那味儿了。

不过,作为实验模型,其文本到语音和原生图像生成功能目前仅提供给早期访问合作伙伴。谷歌透露2.0 Flash将在1月份正式推出,会提供更多不同大小的模型。

而根据谷歌发布的基准测试结果,不论是在多模态的图片、视频能力上,还是编码、数学等能力上,仅是Flash实验版的Gemini 2.0表现就已几乎全面超越Gemini 1.5 Pro 002。

而且它的速度是1.5 Pro的两倍。

谷歌表示,明年年初,会将Gemini 2.0扩展到更多旗下产品中,比如Project Astra。

就是I/O大会上谷歌推出来跟GPT-4o的语音功能打擂台的那个。

此次,基于Gemini 2.0,Project Astra更新了以下功能:

更好的对话:现在能够以多种语言和混合语言进行对话,更好地理解口音和不常见的单词。

使用新工具:Project Astra会用谷歌搜索、Lens和地图了。

更强的记忆力:Project Astra现在拥有10分钟的会话记忆,并且可以记住更多历史对话,也就说,凭借这些“记忆”,它能更懂你了。

改进延迟:Project Astra可以按正常人类对话的节奏来理解对话。

谷歌还提到,正在将Project Astra移植到眼镜等更多移动终端中。

另外,谷歌透露,他们正在和Supercell等游戏开发商合作,测试基于Gemini 2.0打造的游戏智能体们的实力。

这些智能体可以根据屏幕上的动作对游戏进行推理,并与玩家实时对话提供行动建议。

除了网页端可用,Gemini 2.0 Flash实验模型还通过Google AI Studio和Vertex AI的Gemini API向开发者提供。

从OpenAI跳槽到谷歌的Logan Kilpatrick表示,他们在Google AI Studio中创建了一个全新体验,展示了Gemini 2.0视频理解、原生工具使用、空间理解的入门应用。

那么,你觉得这够Agent吗?

参考链接:
[1]https://x.com/GoogleDeepMind/status/1866869343570608557
[2]https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents

最新文章
第599讲:想要淘宝直播流量,你的活动要这样策划
最近,我们代运营业务的一个客户,经过长时间的供应链准备和优化,终于要准备上直播了。优化后的供应链,几乎可以做到在牛仔品类里无限款式零库存,很符合淘宝直播的需求,当然,我们也花了很大的功夫,做了整体的直播策划,今天就拿其中的
SEO小白速成指南,轻松学会搜索引擎优化
本教程为您详细讲解SEO基础知识,从搜索引擎原理到优化技巧,助您轻松入门,快速提升网站排名。涵盖关键词研究、网站结构优化、内容创作等关键环节,助您打造搜索引擎友好型网站。随着互联网的普及,越来越多的企业和个人开始重视网站优化
救命钱被卷走,一群白血病人的寒冬
作者 | 南风窗记者 朱秋雨实习生 焦梦洋编辑 | 向由湖南45岁的单身母亲王静,生活刚刚好起来——儿子的白血病有所好转,抑郁症也不再频繁影响她了——然而世事难料,这一年来,助她改善处境的一个“配捐”项目,在11月爆雷了。“配捐”是一
[学习资料]2020年学生会个人年度计划书模板范文[推广有奖]
学生会个人年度计划书模板范文篇一:一个学期又在一个忙碌而不经意间悄然而过,一个新的学期又来到我们身旁,作为学校学生会里的一名成员,我有责任把学校赋予的每一项工作做好。根据大学生艺术团本学期工作要点,结合院学生会工作实际,特
高清美女写真生成器 | 用AI科技画出你的完美偶像!
限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在这个科技飞速发展的时代,越来越多的人开始追求个性化和艺术化的生活。尤其是在摄影以及艺
淘宝权重意味着什么意思(解读什么是淘宝权重)
做电商的都知道,降权这个词都已经风靡电商界了,那么降权是什么意思呢?淘宝权重又是什么意思呢? 其实说实在点儿,权重越高流量越高,访客也就越高。降权也就是流量下滑了,访客也下滑。淘宝权重分为两种,第一种是店铺权重;第二种是商
红河元阳县水下施工公司-怎么算价格「方法/技术」2024排名一览
红河元阳县水下施工公司-怎么算价格「方法/技术」2024排名一览红河元阳县,位于我国云南省东南部,风光秀丽,自然资源丰富。近年来,基础设施建设的大力推进,水下施工行业在元阳县得到了迅速发展。本文将为您介绍红河元阳县水下施工公司的
图片SEO优化攻略,揭秘提升图片搜索排名的秘诀
图片SEO优化,提升搜索排名的秘籍包括:优化图片文件名和描述,使用关键词;压缩图片大小,提高加载速度;合理设置图片alt标签,描述图片内容;使用高质量图片,提升用户体验;优化图片布局,使图片更吸引人。通过这些方法,可以有效提高图
未来5年,最赚钱的5大外贸风口行业
做外贸一定要提前知道的信息差最近外贸行业的大新闻,川普上台对中关税政策,以及最近刚出台的各行业出口退税下调,那些卷价格的工厂肯定要涨价了,一下子 外贸环境又在悄悄变天了那么作为外贸业务的我们,可以如何把握趋势,关注接下来哪
语音转文字软件哪个好用?良心推荐12款好用语音转文字工具!
语音转文字软件哪个免费又好用?这相信对于平时有会议和课程语音转换需求的朋友,都是不小的难题,毕竟如果你不用自己记笔记,可以大幅提升效率呀,接下来就给各位同学分享主流的工具!下载地址:https://reccloud.cn
相关文章
推荐文章
发表评论
0评