华为端出「河图」打造新时代 Oracle 生态

摘要

修路,要靠大家一起来

山西长治的矿工兄弟可能不知道,自己弯腰探测矿井水源的身影被实时传到了远在深圳的一块大屏幕上。他手旁的液压挖掘器向前推进了多少次,打入了多少次管子,都被矿坑上方的摄像头实时记录并上传到附近的边缘处理器中。像这样的矿坑安全边缘处理节点,华为在煤矿大省山西设立了数个。

大屏幕正对着的洲际酒店「马德里」会议厅内,华为 Cloud & AI 产品与服务总裁侯金龙宣布启动数据基础设施战略,并开源数据虚拟化引擎 HetuEngine(河图引擎),希望让伙伴像使用「数据库」一样使用「大数据」。

两个月前,华为在上海公布了「鲲鹏+昇腾」组合的云计算战略。两个月后,华为用一场发布会,在细节方面阐释了公司打造的「数据基础设施」将如何为合作伙伴提供数据的全周期处理及应用。

「实现数据生命周期的每比特价值最大。」侯金龙在大会上宣布到。大厅墙壁上的绅士骑马油画与「河图」这个极具中国特色的名字相映成趣。


新数据基础设施

虽然会议场地没有 9 月时候那么大,但是侯金龙却显得比两个月前稍微紧张一些,可能面对客户而不是媒体和大众,这位华为云+AI 负责人会更游刃有余。

「数据增长是无限的,而数据资源是有限的。」侯以短视频应用快手能为用户提供 1.2 亿个内容标签为例,证明数据灵活应用的威力。如果说消费即应用每天能够产生 TB 级的数据,那么 To B 行业,小到城市监控摄像头,大到自动驾驶汽车,每天产生的数据量则达到 PB 级别,与消费应用有着数量级的差距。而对于企业来说,要像快手一样灵活的使用和分析数据,显然需要一个更好的工具,或者平台。华为显然是个很好的选择。

自己的狗粮自己吃,华为的「鲲鹏+昇腾」组建的数据基础设施首先就应用在了自己身上。对于一个拥有 20 万员工的集团来说,仅仅安排每年 300 万次的出差,对人力资源管理就是一个巨大挑战。而在使用了数据驱动企业流程简化后,之前「出差涉及考勤、机票、酒店,包括报销等十几个申请流程,现在只需要一个流程就可以真正实现」。侯说到。

新时代的数据基础设施,在华为认为,就是一个集合了采集、存储、计算、管理和应用一体的超级数据平台。在此之前,数据的采集、存储和计算,大都由不同的公司和解决方案承包,之前的数据很难互联互通。而华为不仅有自研的存储系统,现在还有具有 AI 能力的处理器组合,配合华为的云计算平台,能够实现数据高效共享和分析,降本增效。

两个月前的大会,华为强调「暴力计算美学」;两个月后的这场大会,华为则表现了公司如何将「算力」融入到整个数据基础设施的方案之中。



新时代的 Oracle

「我的 Gauss 数据库目标很清晰,就是希望做到跟 Oracle 一样。」

华为 IT 产品线副总裁、智能数据与存储领域总裁周跃峰在会后的采访中说到。数据的采集和存储可以加大硬件量来解决,真正的问题是存储后的数据如何搜索和应用。

随着业务类型日益增多,大量业务需要跨平台、跨数据源协同分析,侯金龙认为在这样的场景下,团队有「找数据、取数据和用数据」三大难。为了屏蔽数据类型差异、地域差异、语法差异,让数据治理简单,使用简单,华为推出了「河图引擎」。

河图取自中国神话故事,据说上古皇帝大禹就因为得到「河图」,掌握了中国的河流山川脉路,最终治水成功。取名河图,华为希望能让合作伙伴屏蔽数据基础设施的复杂度,让开发者像使用数据库一样使用大数据,提高效率。

9 月的大会上,华为就将开源列为了公司的目标之一,此次发布的河图引擎,走的同样是开源路线。侯介绍,开源版本的河图引擎叫 openHetu,将于 2020 年 6 月上线,届时华为将开源内核,开发者可以基于开源代码进行定制,包括数据源扩展、SQL 执行策略等,让合作伙伴开发更简单,用起来也更放心。

「今天我们有 CPU,我们搭建了服务器,但实际上这些服务器生态还有待构建,windows 跑不到我这个上面来。今天我们有很多游戏,你能跑在鲲鹏服务器上玩吗?玩不了。」

虽然已经有了基础设施的软硬件,但是周跃峰坦诚,要想建成一个完整的生态,华为需要和更多的合作伙伴一起努力。同时,华为推出了 Gauss DB 数据库在「国内是领先的」,但周也承认还有很多升级的空间。

「这也是为什么我们要悬红,邀请全球的人才来解决基础设施层面的难题。」周在大会宣布了「奥林帕斯」奖,要用奖金来吸引人才解决数据库难题。

「不一定要一两年就有答案,只要有进展,我们就奖励。」周跃峰说到。

责任编辑:卧虫

图片来源:华为

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。