百度技术开放日深度分享:百度大脑背后的技术积累及发展方向

前不久百度 CEO 李彦宏在中国 IT 领袖峰会上时曾表示,人工智能是一个非常大的产业,会持续很长时间,在未来的 20 年至 50 年都会快速地发展。

在人工智能行业上,国际上投入最多的当属美国、英国和中国。就百度而言,近两年科研和总营收的比值均为 15% 上下,去年更是投入高达 102 亿。目前在中国谈到人工智能,都会被默认为是百度的人工智能,尤其在现在这一阶段以大数据为主的,具有深度学习算法的人工智能。由于 AI 的介入,医疗、交通、物流等各行业效率得到显著提升,进而提升了社会的总体效率。

百度技术委员会理事长陈尚义在 4 月 11 日的第五届百度技术开放日上表示,技术对百度而言乃是立命之本,尤其是在现在的人工智能领域。现在互联网只是开胃菜,人工智能才是主菜。在人工智能这道主菜上场之前,百度希望通过技术加速中国乃至世界的改变。

最强大脑背后的技术基础

百度研究院院长、深度学习技术及应用国家工程实验室主任林元庆主要介绍了百度在《最强大脑》使用到的技术,其中最为核心包括图像检索、声纹识别、人脸识别。

5103044419215043335.jpg

  1. 在搜索业务上,以图搜图是比较容易做的。图像质量良好,包含多个信息点作为线索。但《最强大脑》的规则难度加大了许多:在几十张图像里面(图片做了模糊处理),扣出极小的像素进行识别和匹配。百度采用深度学习算法,算出 128 位特征,对模糊、噪声、角度变化等因素有更好的校正。他透露,近期百度在引擎服务上会有非常大的升级。
  2. 声纹识别技术的应用。它和语音识别的区别在于,语音识别只需要识别声音内容,而声纹识别需要识别声音特征,判断说话对象。因为不同的说话内容包含的噪声背景不同,所以具备难度。百度大脑在现场判断中也有一次识别错误。林元庆强调,这一块将是百度重点提升的方向。声纹识别可作为身份验证的辅助手段,具备一定应用场景。
  3. 在跨年龄、跨代的人脸识别测试中,百度大脑不但展现了极强的辨别能力,还在社会公益项目中发挥作用,其中跨年龄人脸识别已经应用到帮助寻找走失儿童项目中。百度与「宝贝回家」寻亲平台合作,已经有超过 6 万条寻亲图片数据接入百度跨年龄人脸识别系统对比评测,初步筛选出 30 例疑似对象。目前已经成功确认一例子,父母与孩子 DNA 匹配成功。据林元庆透露,实际上匹配成功的还包括一对家庭。此外,跨代的人脸识别还能通过父母的照片,找到小孩线索。该平台此前也与其他人脸识别平台合作,但并未成功。「百度在跨年龄、跨代的人脸识别领域已经是世界第一」,其内部数据测试集包含有 11 万类图片,而著名的图像测试平台 ImageNet 是 1000 类。
  4. 此外,百度的人工智能业务还在不断扩充中,林元庆透露,AI 视频分析、AI 医疗图像分析是百度正在搭建和扩充的两大团队。其中 AI 视频分析包括两个方面:一个是视频的语义理解,短视频是非常火的应用领域,即发现视频里面是谁,他在干什么,可为视频打上标签和帮助剪辑。百度正在搭建一个强大的团队,Stereo Visual Odomety 研究方向聚焦在检测、分割和 3D 重建的统一框架。可应用于自动驾驶、AR 等场景,例如,利用汽车上的摄像头拍到影像,分析估计出摄像头的精确位置,即三维重建,对周围环境有更深的理解。百度希望能达到 99% 的精度。

此外,AI 医疗图像分析也是百度当下重点发力的方向。

百度 AI 全新的产业高地

人工智能对于百度来说,核心就是百度大脑。百度大脑有类似人类大脑的语音能力,听力,看的能力即图像识别,自然语言处理能力即拥有人类的理解能力。

此前,全国政协委员、百度 CEO 李彦宏在两会上提案「利用人工智能技术来解决儿童走失的问题。」在最强大脑的脑王争霸赛中,也有跨代人脸识别技术的实际应用体验。该技术是在跨年龄人脸识别技术上的一次升级,林元庆在百度技术开放日透露,这项技术现在已经可以稳定运行并服务社会。今年 3 月份,百度已经和全国最大的寻亲平台「宝贝回家」开展合作,超过 6 万条寻亲图片数据接入百度跨年龄人脸识别系统对比评测。

不仅如此,百度的人脸识别技术已经应用到金融行业里面了,例如泰康保险的远程开户,甚至在政府方面都有深层次的合作。

现在百度的员工进入百度大厦,进出不需要刷卡、指纹,只要直接往里面走就可以。这里应用到的是 EBN 人脸识别,能够瞬间识别在库的百度人员,并且在一万多人里面查找到正确的人员选项,不受外观差异的影响。经长时间的实践证明,安全性精度非常高。

1Y1A1054_meitu_1.jpg

同时,在技术开放日活动上,百度基础技术负责人百度云联席总经理刘炀,百度基础技术团队成员郭月月、张发恩、吕毅、崔永新、王栋分别以开放百度技术、百度大脑应用场景、百度云深度学习平台、百度大脑上的基础架构技术、百度基础机构助力 AI、AI 化运维为主题发表演讲。介绍了百度大脑背后有强大的硬件和软件支撑。数十万台服务器构成了百度大脑的实体,几年前百度便开始自建中国最大的 GPU 集群,保证了百度大脑超强的计算能力。而在软件方面,搜索起家的百度具备了得天独厚的优势:全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据成为了百度大脑不断学习、快速成长的养料。

百度将着力打造开放型平台

人工智能不是互联网的一部分,是堪比工业革命的一个新的技术革命。百度是一家坚持以技术为信仰,不曾停止过深耕人工智能技术的公司,可想而知,在这样一场技术革命中,投入数百亿研究资金的百度必然会成为人工智能革命的先驱者。

事实上,从 2013 年开始,百度就开始在算法上进行推进,大规模投入,吸引人才,开始对于人工智能的倾注。时至今日,百度领航 AI 行业发展,并将人工智能树立为公司战略。但即便如此,靠强大的技术以一己之力构建人工智能的生态并不是百度所追求的,这也是第五届百度技术开放日举办的意义——以开放和共享的精神,与大家一起共同繁荣技术创新的生态。

人工智能的大幕已经开启,人工智能的未来愿景也已经勾画出来。目前与业界领先厂商的合作,只是百度迈出的一小步,构建人工智能的生态,还需要各行各业的共同努力,尤其是在金融、医疗、交通、物流等传统行业中,人工智能技术的引进,将会创造出更大的商业价值。

百度人工智能.png

共建人工智能生态

百度大脑的技术进展,展现出人工智能的无限可能。对于商业用户来说,人工智能能够收集更加自然的来自用户的大数据,从而生产出更为贴合用户需求的产品,创造更高的商业价值。

此次百度技术开放日目的正是为了让大家通过了解百度,了解互联网的技术,通过百度开放的方式,将技术开放给用户,让所有人共享技术成果,与对人工智能技术比较感兴趣的人群一起站在百度的肩膀上,共同成长。技术开放,这是百度对于国家的一份社会责任,更是百度技术开放日开放的理念。

关注极客公园公众号
反馈