百度大脑再次重磅升级!2019年7月3日,在“Baidu Create 2019”百度AI开发者大会主论坛上,百度CTO王海峰发布百度大脑5.0,在算法突破和计算架构升级的基础上,实现AI算法、计算架构与应用场景的融合创新,百度大脑成为“软硬一体的AI大生产平台”,加速产业智能化。
同时,百度与华为宣布,百度飞桨(PaddlePaddle)深度学习平台与华为麒麟芯片开展深度合作,优势互补,联合技术攻关与创新,为端侧AI提供最强劲算力,促进更多AI应用落地,共同为加速产业智能化贡献力量。
核心技术持续创新 保持世界领先水平
百度大脑是百度AI多年技术积累和业务实践的集大成,一直在持续发展和完善。百度大脑的核心架构,包括基础层、感知层、认知层和平台层等。在原有架构的基础上,认知层统一为语言与知识技术,同时增加AI安全。
在算法突破方面,语音识别的流式多级截断注意力模型(SMLTA)使识别准确率和响应速度都有大幅提升,为用户带来更好的体验;风格迁移的语音合成技术,仅需20句话就可以制作一个人的专属声音。
综合应用语音和视觉技术,机器可以自动合成虚拟形象。百度大脑的实时合成虚拟形象技术,首先对语音信号和视频信号进行实时的识别与理解,再通过唇动生成,以及语音、面部和肢体的合成,实时合成一个虚拟形象。
除了感知技术的创新,认知层的语言与知识技术也有显著的进步和突破。现场,王海峰展示了基于知识图谱理解音乐纪录片《大河唱》的内容,影片中的角色、人物关系、音乐种类、取景地、影片主题等信息,都被精准解析。百度大脑结合视觉、语音和自然语言处理技术解析多模态信息,并与知识图谱的相关实体建立关联,通过计算和推理,得到电影内容的结构化语义表示,从而理解电影中出现的角色、音乐和民间艺术等。
在语言和知识技术方面,百度大脑还公布了机器同传的突破和创新,在翻译过程中对语音识别结果进行纠错的联合词向量编码技术,可解决多轮翻译一致性和连贯性问题的语篇翻译模型等,结合先进的语音技术,百度大脑实现了高准确、低时延的机器同传技术。
语言与知识技术中,语义理解是重要的基础之一。百度大脑发布了知识增强的语义理解框架——ERNIE,能够持续学习知识,提升效果,快速应用。ERNIE结合先验知识和海量数据,构建预训练任务,深入学习其中蕴含的语言、实体、关系、知识等信息,模型能力持续增强,在自然语言处理任务上取得领先的效果。
这些领先的AI技术能力,已经广泛应用。现场,百度语音技术部高级总监高亮演示了搭载SMLTA技术的百度输入法精准识别中英文混合输入;大会现场采用的同传服务,也是基于百度大脑的机器同传技术。
全新AI计算架构亮相 百度、华为联手拓展AI未来
人工智能的发展,离不开算力的支撑。算法持续突破,算力缺口巨大,王海峰认为,这需要算法、计算架构等多方面努力来解决。AI计算架构主要面临着算力、效率和多元化场景的挑战。
百度大脑的AI计算架构,通过芯片、连接、系统和调度的协同设计和技术创新,提供百万TOPS的算力,并紧密结合百度飞桨(PaddlePaddle)训练与推理框架,提供面向算法优化的极致效率,并做到异构、无感的使用。
讲到算力,芯片自然是关注的焦点。继去年开发者大会上发布的百度自研云端通用AI芯片“昆仑”流片后,百度发布了一款新的芯片——专为远场语音交互打造的芯片“鸿鹄”。 百度“鸿鹄”芯片按照车规级打造,采用HiFi4自定义指令集,双核DSP核心,平均功耗仅100mW,可实现远场阵列信号的实时处理和高精度低误报语音唤醒,并集成离线语音识别功能,适配车载语音交互、智能家居等各种场景。
底层的芯片和上层的应用之间,还需要操作系统承接。王海峰认为,深度学习框架就是智能时代的操作系统。百度自研的国内唯一功能完备的深度学习平台“飞桨”就是中国自己的“AI操作系统”。
当天,王海峰与华为消费者BG软件总裁王成录博士联合宣布,百度飞桨与华为麒麟芯片深度对接,全球领先的端侧AI芯片和深度学习平台,将联合为端侧AI提供最强劲算力、打造最好的深度学习运行效率。
王成录认为,这将充分发挥软硬结合的优势,惠及更多用户,切实推动中国的产业智能化。王海峰也表示:“我们有坚定的信心,飞桨和麒麟一起,促进更多AI应用落地,加速中国的产业智能化进程。”
随着AI技术的产业化应用不断深入,AI安全也受到越来越多的重视。百度大脑打造了完整的AI安全防护体系,涵盖网络和系统安全、数据安全与隐私、业务和应用安全,以及安全生态建设等,为百度大脑的技术、平台和应用全方位保驾护航。
AI大生产平台赋能开发者 加速产业智能化
“百度大脑5.0全面升级成为软硬件一体的AI大生产平台,希望能够深度赋能产业开发者,加速产业智能化进程。”王海峰表示。
百度大脑在数据和算力的基础上,打通了人工智能产业化应用落地相关的全部流程,包括基础的深度学习平台,到通用AI能力、定制化训练平台、部署与集成,以及应用的技术解决方案,同时有完整的AI安全体系保障,实现了AI技术的标准化、自动化、模块化,助力开发者快速实现应用,带来价值。
目前百度大脑已经开放了210项领先的AI技术能力,开发者数量达到了130万,平台上开发者的日均调用次数同比增长108%,定制化平台模型的数量也在飞速增长。来自不同行业,拥有不同背景的开发者们,都在借助百度大脑快速地获得AI能力。