最强版「百度大脑」来了,躯干和四肢在哪里?

摘要

集百度AI之大成的百度大脑,不甘心只是一个技术平台

在 2019 百度 AI 开发者大会首日,新任 CTO 王海峰的演讲不到半小时,复杂的技术图谱和专业化术语,配合他缺乏起伏的语调,显得有些激情不足。但这种平淡中蕴含着的,却是如今百度最具创新和希望的力量。不久前,百度进行内部调整,搜索元老向海龙离职,AI 平台负责人王海峰就任空缺十年的百度 CTO,一上一下,百度对于 AI 的追求并不曾消退。

2019 年 Q1 年报发布,一直被认为「躺着赚钱」的百度 14 年来首次出现了亏损,其来自搜索的收入依旧占据了七成以上,但收入增长已经大幅放缓。百度未来增长乃至保持盈利的希望,从理念到实际,都更多地寄托到 AI 能力上。好消息是,无论是从专利数量还是技术水平来看,百度都是国内 AI 公司执牛耳者,问题只剩下一个:百度真的做好了 AI 大规模商业化的准备吗?

百度大脑,作为百度 AI 能力的真正集大成者,由王海峰宣布,从去年开发者大会时宣布的 3.0,直接跃进到了 5.0 阶段。新的百度大脑,装进了哪些新的东西?还是单纯鼓舞人心的数字游戏?


算法与算力才是重点

AI 的三大要素,算法、算力和数据,百度大脑 5.0 在前两个领域都进行了升级。

算法突破方面,首先是语音识别的流式多级截断注意力模型(SMLTA),使识别准确率和响应速度都有大幅提升,为用户带来更好的体验;风格迁移的语音合成技术,能够将音色、风格和情感等多要素解耦分析,20 句话就可以制作一个人的专属声音。

语音识别技术的进步,无疑将增加百度在智能音箱等领域的优势。在上午,百度发布了大金刚等三款智能音箱产品,李彦宏和小度智能音箱的交流,更是放在了大会之初作为热场,「全双工免唤醒」的功能,让音箱可以自动分辨哪些话是对自己说的,哪些不需应答,语音助手变得更智能。而 AI 语音合成技术,结合视觉技术,自动生成的虚拟形象,应用于浦发银行的「金融数字人」,不仅听得懂,还能对答如流。

搭载小度助手的智能设备激活数量 | 百度

认知层的语言与知识技术方面,王海峰现场展示了基于知识图谱理解音乐纪录片《大河唱》的内容,影片中的角色、人物关系、音乐种类、取景地、影片主题等信息,都被精准解析。百度大脑结合视觉、语音和自然语言处理技术解析多模态信息,并与知识图谱的相关实体建立关联,通过计算和推理,得到电影内容的结构化语义表示,从而理解电影中出现的角色、音乐和民间艺术等。而新发布的知识增强的语义理解框架——ERNIE,ERNIE 结合先验知识和海量数据,构建预训练任务,深入学习其中蕴含的语言、实体、关系、知识等信息,模型能力持续增强,在自然语言处理任务上取得领先的效果。

相比算法的快速发展,AI 算力的缺口正越来越大,王海峰认为,这需要算法、计算架构等多方面努力来解决。AI 计算架构主要面临着算力、效率和多元化场景的挑战。

发布会上,王海峰展示了百度大脑 AI 计算架构,继去年发布百度自研云端通用 AI 芯片「昆仑」后,又发布了远场语音交互芯片「鸿鹄」,并且宣布深度学习平台飞桨将与华为麒麟芯片深度对接,将联合为端侧 AI 提供最强劲算力、打造最好的深度学习运行效率。虽然没有明确宣布合作内容,但国产深度学习框架和国产芯片的首次「官宣」,将给整个中国 AI 产业在未来一段时间带来丰富的想象空间。

不过,这些技术上的进步,并不足以全面概括这次升级。


AI 大生产时代到来?

百度在 AI 技术上的演进从未停止,最早在 2010 年,百度就开始了 AI 的布局;2012 年,百度开始自研深度学习框架 PaddlePaddle(现在的飞桨);2016 年,百度大脑完成了基础能力的积累和 AI 能力的初步开放,达到 1.0 阶段;2017 年,百度大脑构建了完整的技术体系,包括基础层、感知层、认知层和平台层,并全面开放 AI 能力,升级到 2.0。2018 年,百度大脑升级 3.0,提出了「多模态深度语义理解」的概念,以及多维度多层次开放 AI 能力。

相比技术上实实在在的进步,百度大脑更让人存疑的,是其商业化和落地的能力。在 2017 年的百度 AI 开发者大会上,百度曾提出 AI 的发展方向是平台化和生态化,商业模式是「数据+算法+软件+硬件」,现在看来,百度大脑的技术体系和商业模式,都从那时起大致确定。

在本次大会上,王海峰对技术体系只是稍作更改,将认知层统一为语言与知识技术,同时增加 AI 安全。但对百度大脑 5.0,他给出了新的定义——软硬一体化的 AI 大生产平台。如何让百度大脑的 AI 能力真正落地产业发挥价值,显然是百度更关心的问题。   

百度大脑5.0的技术体系 | 百度

什么是大生产?在去年的开发者大会上,王海峰曾给出过答案,并在本届大会上再次强调——每一项科技,要真正改变人类,就要有标准化、模块化和自动化的特性。找到百度大脑和不同行业头部合作的项目并不难,但这样定制化的项目,显然与其 AI 平台的定位,与大规模商业化的希望不符。

百度大脑对平台化和生态化的期望,是打通人工智能产业化应用落地全流程。百度大脑上已有 130 万开发者,开放了 210 项 AI 技术能力,技术储备并不少,缺少的是将其更高效率应用的途径。1 个多月前,百度大脑发布 AI 市场,目前平台上有超过 400 家服务商,和 500 余可供交易的 AI 上下游软硬件产品,对建立一个完整、繁荣的 AI 生态来说,这显然只是一个起点。

百度AI开发者大会上AI市场展位 | 极客公园

那百度大脑最缺少的是什么?在五月末深圳举办的百度大脑生态合作计划及 AI 市场发布会上,百度宣布百度大脑生态合作伙伴体系全新升级,尤其提到希望吸引到行业解决方案合作伙伴和教育培训合作伙伴(AI 培训),前者能够帮助 AI 落地到产业,后者能够帮助产业的从业者利用 AI 技术。

在上午李彦宏的演讲中,也曾谈到,市场上缺乏既懂产业,又懂 AI 的开发者。既懂产业又懂 AI 的中间环节,是百度大脑推动产业智能化最需要的部分,也是百度建设 AI 生态,一定要补全的部分。


责任编辑 卧虫

头图来源 百度

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。