“如果让GPT-4去下围棋,目前肯定下不过人类选手。还有像AlphaFold,它只会解析蛋白质结构。但是这样一些专用模型,在对应的领域里面能够发挥很大的作用。”
12月13-14举行的2024浦江AI学术年会期间,上海人工智能实验室青年科学家陈恺谈到通用大模型和专用模型的差异时对第一财经表示,AlphaGo虽然只会下围棋模型,但是它能在下围棋任务里达到人类的顶尖水平,或者超越人类的水平,这对于通用模型来说却是非常困难的。
就在上个月,上海人工智能实验室按照通专融合AGI路径,在第一阶段构建并发布了强推理模型书生InternThinker,自主构造大规模高智力密度数据生成,具备代码、数学等多场景泛化能力。最近发布的书生万象2.5在多模态cot上取得突破,成为首个MMMU突破70%的开源多模态大模型。
上海人工智能实验室领军科学家欧阳万里教授介绍,“通专融合”是实验室正在做的,两种大模型是融合的,就像大学的知识慢慢会融通到高中教学中去。
而上海人工智能实验室也正和产业界合作,开发了全球首个翼型AI生成式系统“书生·翼飞”。“我们和商飞C919团队合作进行飞机设计,设计出来一个翼型是不难的,但是要让这个翼型达到工业需求并且比工业需求高,让升力提高,减小阻力,就要用到很多空气动力学知识。原来一个设计师设计一个翼型时间是以周来计,但是当AI学习了专家数据库,一分钟就能生成好几十个翼型供专家选择。”欧阳万里说。
除了航空航天,他还透露正在化学领域和科学家合作。“读谱是帮助化学家了解到底发生了什么化学反应的重要手段,我们最近和这些专家合作,开发了第一个能读谱的模型,现在已经达到专家水平,数秒钟可以得到专业结果。”
在欧阳万里看来,“通专融合”是建立在过去一段时间大模型研发基础上的思考和总结,是更适合未来大模型的发展路径。
陈恺也称,通用模型是希望一个模型能够完成所有的任务,与之相对的是一些专用模型,比如说像过去也非常火的AlphaGo。目前他们实验室采用的路线是通专融合,希望在保持一定的泛化能力的情况下,能够去提升模型的一个专业领域的水平,比如说达到人的专家水平,这样能够达到一个通专融合的引爆点,或者说它的一个能力点,其实就能够去为很多的一些实际的场景来服务。