新智元报道
编辑:编辑部 HYZ
【新智元导读】重磅!12月5日起,OpenAI将开始连续12天的圣诞马拉松。根据外媒The Verge的内部消息,满血版o1和Sora会正式发布。消息一出,网友们沸腾了。奥特曼也提前预热,称AGI将在2025年实现!
就在刚刚,奥特曼宣布——
从12月5日开始,OpenAI的圣诞季特别活动即将拉开帷幕,连续轰炸12天!
每个工作日,OpenAI都会有一场直播,展示新的产品或演示。
12天,12场直播,一堆大大小小的新东西。
奥特曼的这个圣诞礼物太大了,可以算是给科技爱好者们准备的史无前例的科技盛宴。
网友已经po出奥特曼的圣诞老人照
对此,网友戏称:谷歌又被「截胡」了……
马斯克现身评论,表示非常酷。
随后,Hassabis现身评论区,邀请马斯克和谷歌DeepMind一起做AI游戏,马斯克高兴应约。
满血版o1和Sora,就在眼前了?
评论区呼声最高的,当然就是满血版o1和Sora了,搞快点搞快点!
有人敲锣提醒:Sora已经发布294天了,高级语音模式已经发布205天了,我们什么时候能用到啊?
有人直接伸手:饿饿,饭饭。
已经有网友替OpenAI安排上了——
第1天,当然就是Sora 第2天,给ChatGPT加上一个圣诞老人风格的语音,节日气氛拉满 第3天,增强ChatGPT的高级语音模型,顺便再上个视觉功能 第4天,让免费用户也能用上o1-preview,高级推理模型人人可用 第5天,提前展示将于明年1月上线的AI Agent 第6天,发布GPT-4o图像功能 第7天,发布新的开发者工具 第8天,展示全新升级的DALL-E图像生成模型 第9天,发布上下文窗口更长的下一代GPT模型(GPT-NEXT) 第10天,发布辩论游戏,训练机器对问题进行辩论 第11天,发布神经网络模型可视化集合Microscope 第12天,将高级语音模式使用时间延长至每天20小时
不知还有没有人记得,之前的说法是,OpenAI的下一代旗舰模型Orion,预计会在ChatGPT两周年纪念日时推出,但显然落空了。
除此之外,更重要的问题是:GPT-5何时来?AGI实现了吗?
奥特曼:AGI将在2025年初现
在12天连炸之前,奥特曼在最新采访中做了一个预热。
当地时间周三,在纽约时报DealBook峰会上,他在与Andrew Ross Sorkin的访谈中更加肯定道,超级智能将在几千天之内到来。
奥特曼预计,在2025年,OpenAI的AI系统将吸引更多人的关注。即便是那些对当前AI进展持怀疑态度的人,他都会说,「wow,我没有想到会这样」。
「智能体」无处不在,成为每个人口中避不开的怀疑。
因为,任何人可以给AI分配一个相当复杂的任务,就像把任务交给聪明的人去做一样,它需要一段时间利用工具,并创造出有价值的东西。
奥特曼称,这也是我明年期待的事情。
他继续表示,AGI到来的时间会比世界上大多人想象的要早,不过其影响要小得多。
事实上,一些研究员此前表达的许多安全担忧,并不会在AGI出现的那一刻立即成为现实。
AGI是可以被构建出来的,但世界仍将按原有方式运转,只是会发展更快。
不过,从我们所说的AGI到超级智能之间,还有很长的路要走。
采访中,奥特曼预测,经济方面的变革可能要比人们想象的慢一些。在最初的几年里,可能不会有太大的变化, 但之后可能会发生翻天覆地的变化。
大约两年前,OpenAI曾放出豪言,AGI可以「造福人类」,并将为每个人带来令人难以置信的新能力。
显然,奥特曼正在试图降低预期。
他表示,这期间存在很大的不确定性,而且对于超级智能也有不同的定义。
「两年前,我认为我们正处于一个非常陡峭的发展曲线上,也就是说,OpenAI的创立认为这是可能的,或许没有那么遥远。
到目前为止,我们依旧相信OpenAI可以做到,只不过,目前还有很多的研究和工程需要完成」。
这也并非是奥特曼,第一次淡化看似即将到来的AGI。
据The Verge透露,OpenAI计划将大模型整合在一起,并将其定义为通用人工智能。可以说,OpenAI对AGI的定义正在发生微妙的变化。
OpenAI领导层曾经激进的AGI蓝图,现已被谨慎地重新定义为「超级智能」。
过去,OpenAI曾提到能够自动化绝大多数智力劳动,但奥特曼最新暗示,这一点可能最早在2025年就能实现,而且在现有硬件上即可完成。
对「超级英雄」马斯克感到失望
谈及和马斯克的关系时,奥特曼坦诚地说,我对我们之间关系不和感到非常难过。
「我们一起长大,我将他视为心中的「超级英雄」。我认为马斯克所做的事情,对世界来说是不可思议的。
虽然我对他的看法现在已经改变,但我依然为他的存在感到庆幸。
这种庆幸不仅来自他一手创建的商业帝国,更源于他在缺乏远见的时代,勇敢地推动人们去思考得更宏大,包括我自己。
「我们一起创办了OpenAI,然而,他后来对其失去了信心,决定分道扬镳」。
因为奥特曼知道,这段分手并非出于敌意,而是源于对未来的不同想象。
「不过,那也没关系,我认为马斯克是一个建设者。」
「然而,令人遗憾的是,马斯克越来越多地依赖法律战,而非市场竞争发起攻击」。
不过,随着马斯克最近在政坛上的影响力愈加显著,奥特曼是否对此会有所担心呢?
他表示,自己并不担心,甚至对此坚信不疑,原因在于——
我相信马斯克会做正确的事,美国人利用政治权力伤害竞争对手、为自己谋利的做法是非常违背美国精神的,马斯克不会做这样的事。 尽管他确实有很多让人不喜欢的地方,但他不会选择这么做,因为我深信这与他所坚持的价值观相悖。
主持人又问道,你是如何看待xAI作为一个竞争对手的?包括我们经常会讨论的谷歌、Anthropic、亚马逊,某种程度上包括微软,他们是OpenAI最大的竞争对手之一吗?
奥特曼表示,是的,我认为他们将是一个非常重要的竞争对手。
「那么,他们是如何快速扩张,与你们所取得的非常接近,这意味着什么」?
奥特曼称,其实许多前沿模型性能非常接近。但xAI以超乎寻常的速度建起超算,展现出令人惊叹的执行力。
在最新爆料中,马斯克还要计划将Colossus超算扩展到100倍。
要知道,现在已建成的10万块H100超算,以及世界最大超算。届时,100万块GPU互联,必定是一个巨大的野兽。
ChatGPT爆火实属偶然,OpenAI笃定会有那么一个时刻
Andrew Ross Sorkin问,「让我们回到两年ChatGPT诞生那天,当你按下按钮时,你认为会发生什么」?
奥特曼称,从抽象角度来看,我们一直认为总会有那么一个时刻,无论是处于某种原因,世界会从不理解这项技术,恍然间清楚地意识到它确实有效。
在OpenAI内部,在某个时间节点上,对我们来说很明显的是,语言模型将继续scaling。
为什么会在ChatGPT发布这一刻,才给世界带来了变化?
为什么恰好不是在2020年GPT-3和API推出之际发生?
为什么不是在GPT-4发布之后?
为什么2022年12月那个节点才是确切的时刻?
奥特曼称,这其中必然存在偶然性因素,才导致ChatGPT火的一塌糊涂。
不过,他们通过API和GPT-3观察到的是,GPT-3整体能力还言之过早,并不能在很多领域中发挥作用。
但是从另一个角度来看,它是一个杀手级的应用场景,开发者能直接在开发环境中使用,并通过API快速测试之前的想法。
开发者们会坐下来与GPT-3交谈,谈论任何话题,这也就是人们使用其主要目的。
OpenAI研究人员突然发现,这如果是人们想要的,我们还可以让其使用起来更加简单。
也就是说,任何人无需注册开发者账户,也可以微调让其擅长对话。
因此,OpenAI才决定将其作为一个产品推出。
原本,他们一波人计划与GPT-4一起发布ChatGPT。OpenAI早在2022年8月左右完成了GPT-4的研发,但最终决定暂时还是不发布新模型。
简言之,奥特曼和OpenAI整个团队只是坚定地认为,AI技术变革前夜一定会出现一个重要的时刻。
而在ChatGPT身上恰好应验,这件事是没有人能预料到的。
大模型没撞墙,12天每日一更
接下来,主持人又将话题带回到过去几周,各大媒体头条纷纷曝出大模型Scaling Law正在放缓,或在鼓吹撞墙论。
当时,奥特曼只是发了一句话回应,「根本就没有墙」。
采访现场,他再次表示,我不认还能有比这句话更直白的回应了。
他当时发帖子的初衷是,至少能让全网的这种猜测暂时平息下来。
让他费解的是,许多人总是喜欢猜测「是否有一堵墙?是否scaling还会持续?」,而不是仅仅看到了进步的曲线。
奥特曼回应道,「无论如何,我们都会有很多新的、很棒的东西」。
「从明天开始,我们将进行为期12天的OpenAI活动。接下来的12个工作日,每天发布一个新东西,要么做一个演示」。
「关于明天要发的,我会不说太多。这已经证明了我们在持续进步」。
这也算是,OpenAI对sacling law撞墙论最好的回应。
主持人接着问道,需要多少数据,以及如何才能实现这种scaling?这当中,有多少是单纯依赖于计算能力以及相应的资本的投入?
奥特曼表示,算力、数据、算法是三个关键要素。当然还有其他方面,但这三方面是最主要的,并且有时可以在这三者之间进行权衡。
比如,如果你有更好的数据,就可以减少计算量。或者你有更多计算资源,可以利用其生成合成数据,从而获取更多的数据。
但是当你希望在这三个要素上同时推进时,在不同时期,可能会有一个或另一个方向的回报差异。
总之,奥特曼认为Scaling Law实现还得需要依赖这三点的推进。其中,算法进步是最重要的,Transformer就是一个典型的例子。
此外,算力军备竞赛也是不能忽视的一个重要方面。
而且,从长远来看,除了和微软的合作,OpenAI也需要确保拥有足够的算力资源,这一方法便是通过建立自己的硬件来实现。
AGI降临那天,立即解绑微软
主持人提到,微软将OpenAI模型植入Copilot,苹果AI也在使用ChatGPT,而OpenAI也有一款原生的商业产品。
他问道,到了某个节点,这些利益还会保持一致?
奥特曼表示,在不同时间段肯定会存在这个问题。
两年前,我们几乎没有任何业务。现在OpenAI的每周活跃用户超过3亿,用户每天向ChatGPT发送10亿条消息。
而且,OpenAI还有一个非常庞大的开发人员的业务,仅美国就有1300万开发者,更不用提在全球范围内的人数了。
因此,OpenAI还需要比预期更多的算力。这种情况,在商业史上,也是非常少见的快速增长。
奥特曼表示,不过到目前为止,还没有听说有人对微软服务感到不满。虽然不是完全没有紧张的状况,但总体来说,我认为我们的激励措施相当一致。
在追求技术的背后,是OpenAI精心设计的商业策略。他们与微软签署的独家商业协议中,显然包括了一个关键的退出机制——这将在AGI宣布实现时立刻生效。
对于OpenAI而言,这意味着能够摆脱微软的利润分成安排,为成为下一个巨头铺平道路。
回应员工离职潮
主持人也提到,过去这一两年,OpenAI的变动很大。
很多人离开了OpenAI,也有人公开发言,强调OpenAI对安全的重视程度不够。
究竟有什么事是应该发生而没有发生的呢?
奥特曼回答说,由于技术极新且发展迅猛,初期确实在对齐方面面临挑战。
不过,现在可以有把握地说,这项技术已经达到了足够的安全性和稳定性,能够被社会广泛接受和使用。
虽然有观点认为,AI技术的开放加剧了全球竞争,压缩了各方对安全问题的思考和应对时间。
但在奥特曼看来,这些系统推就应该趁着风险还比较低的时候被推向全世界,从而让社会和技术能够共同进化。
奥特曼:我愿把OpenAI比作「晶体管」
面对xAI、谷歌、Anthropic、亚马逊乃至微软等竞争对手,OpenAI具备哪些独特的优势和劣势?
对此,奥特曼回应道,如果将深度学习比作一条物理定理,那么可以说,我们发现了一门崭新且重要的科学。
而这门科学的发展,终将由众多参与者共同推动完成。至于AI的本质为何,每个人都可能有其独特的理解和诠释。
有人将OpenAI的成就比作是工业革命,也有人认为是文艺复兴,但奥特曼更喜欢用「晶体管」作为比喻。
这项最初由少数几家公司发现的技术,不仅彻底改变了人类社会,更以难以想象的规模不断扩展其影响力。
环顾四周,尽管我们不会将那些内含晶体管的设备称为「晶体管设备」,也不会将谷歌视为「晶体管公司」,但不可否认的是,若没有晶体管的发明,这些公司也就不会存在了。
同理,我们在未来所使用的设备、产品和服务,也不会都标榜自己与AI相关。
从某种意义上说,AI作为一种推理引擎,终将走向商品化。这是一个积极的发展方向,正如科学知识应当惠及全社会一样。
这也正是OpenAI致力于开发ChatGPT等产品的根本原因。
OpenAI必须成为营利性组织吗?
OpenAI最初是以非营利组织的形式创立的研究机构,但如今却有观点认为,它必须转型为某种以盈利导向的公司。
主持人问向奥特曼:这是必须的吗?
对此,奥特曼表示,OpenAI最初选择非营利形式的原因,某种程度上已经回答了这个问题。
创立之初,我们既未预见到自己会发展成为一家「产品公司」,也没料到所需资金规模会如此巨大。
如果事先知道这些,我们很可能会选择一种完全不同的组织架构。
要知道,这一切发生得并不久远。就在几年前,我们甚至还没有开展过引领性的语言模型研究。
从2016年算起,距离我们推出第一个产品还有四年半时间,距离ChatGPT的问世更是有六年半之久。
当时,我们只是想做一些AI研究,因为我们坚信,AGI和超级智能终将会对世界产生重大的影响。
我们那会儿正忙着写新的强化学习算法论文,研究机器人手部的操控,以及电子游戏领域的新理论。完全没想过未来会开发出一款产品,更不用提产生收入了。
但在后来,我们才意识到:我们需要更多的钱。
当马斯克停止资助后,我们必须寻找一种能够实现利润封顶的运营方式。最终,我们找到了一个能够将非营利组织所能控制的机构推到理论极限的方案。
不过奥特曼强调,无论如何,非营利组织的部分都将继续存在。
最后,非常亮的一趴来了。
主持人问,你没有任何OpenAI的股份,你想要吗?
他回答,我不想要。不过如果有机会回到过去,我会拿一点点,只是为了永远不必回答这个问题。
原因在于,他认为自己已经拥有了世界上最有趣、最酷的工作,就像自己的退休梦想成真了一样。
人们可以从事艺术项目,而不必为此得到报酬。
但现在有点晚了,很多投资人没有投钱,就是因为奥特曼没有OpenAI的股票。
但能够从事AGI的研究,每天坐在世界上最聪明的研究人员中间,进行这一疯狂冒险,仿佛儿时的梦想已经成真了,人生无憾。
参考资料:
https://www.theverge.com/2024/12/4/24313130/sam-altman-openai-agi-lower-the-bar