【极客公园夏令营】AVOS Cloud 江宏:新数据的异变和整合

【极客公园夏令营】AVOS Cloud 江宏:新数据的异变和整合

编者注释: AVOS Cloud 是加速移动开发的一站式解决方案,专注于为应用开发者提供一流的工具、平台和服务。提供包括数据存储到社交分享、消息推送、以及应用数据统计分析。本文基于其 CEO 江宏在极客公园夏利营上演讲整理。


新数据的爆发 

现在几乎可以存储采集下来的所有数据,并且也可以对完整的数据集进行处理。互联网上数据的增长图中我们可以看到,2013 年,产生 4ZB,据 IDC 预测,三年之后会增加 3 倍多,到 13ZB,在所有数据里只有 0.3% 是得到分析和再利用的。云端数据确实是有价值,但是很大一部分价值还没有被真正发掘出来,我们浪费了很多存储资源和带宽。

之前没有办法采集到的数据现在可以很容易的采集到的,用 iPhone 为例,1 代时手机上有 3 个传感器,5s 已经有 5 个传感器了,三星更加激进一些,Gaxaly S 也是 3 个传感器,到 S5 已经有 10 个传感器。Web2.0 时代很多互联网用户开始参与创造内容,并产生数据,创造内容其实是主动行为,到 Twitter、新浪上发状态更新你写博客,包括点赞等等,其实这些都是主动行为。随着可穿戴设备的普及,更多新数据将不知不觉地上传到采集商的服务器中,如果 App 跟保险公司合作,当你生活在厦门,每天都跑步 5 公里,保险公司根据数据可以作出个性化定价,明年健康方面的保险费可能低很多,如果每天在北京跑 5 公里,明年保险公司不一定愿意卖保险给你,个性化的定价策略肯定会给保险公司带来很强的竞争力。

IDC 对过去几年智能设备出货量统计和对未来出货量的预测,在未来可见几年,还会处于高速增长的趋势,到 2020 年之后才会逐渐放缓,可穿戴设备才刚刚开始步入高速增长期,根据互联网分析师玛丽·米克尔 (Mary Meeker)《互联网趋势报告》,新科技产品的出货量和用户数往往是上一代主流科技产品的 10 倍,笔记本的数量会达到 PC 的 10 倍,手机数量会达到笔记本的 10 倍,可穿戴设备数量很可能达到智能手机的 10 倍,作为一个人来说可能同时只会用一台手机,但是全身有很多可穿戴设备。

数据异构

所有产品售出之后都会产生大量数据,以 Jawbone 和 Fitbit 的血压数据为例,Jawbone 多了心律数据,数据结构有比较大的差别,比如 Jawbone 可能是不同时间点测到的值,Fitbit 先有一定时间内的平均值,然后有一个序列测量值,另外,对于同样数据,名称不一样。如果要做一个产品,需要使用他们的数据,你就要阅读他们的文档,然后分别跟他们的云端接口做集成,如果做成不管用户使用什么智能设备都能用的产品,难度就非常大。

 

在美国医院当中,其实也存在很多数据标准,比如病人需要转院,从医院 A 转到医院 B,健康数据需要同时转过去,所以有很多数据传输的标准,HL7 是其中应用的比较广的一个,还存在很多标准。

不同平台的整合方式

舆论上有不少人说这是苹果历史上最重要的 WWDC 之一,WWDC 可能最重要的东西还是在云端,苹果新的云端 API,提供了一个新的服务,用来给应用做通用的数据存储,并且推出了两个垂直领域的云端 API,推出两个 Cloudkit 和 Homekit,分别是针对健康领域和家居领域,这两个新的服务最重要的作用是统一数据,如果你是 iOS 生态圈硬件开发者,你如果是跟 Cloudkit 和 Homekit 集成,可以得到更多苹果官方功能上的支持,同时,把你采集到所有数据以苹果规定的统一标准拱手给了苹果,从消费者角度来说,作为一个苹果的用户,肯定会遵从苹果标准,能够跟苹果产品无缝集成的产品,这些硬件产品为了获得最终消费者,还是会屈服于苹果的压力,最终应该还是会采用苹果定义的标准。

在今年 Google I/O 很多新的服务都跟苹果非常相似,Google Fit 可以收集不同来源的数据,帮助用户追踪数据,同时帮助 Google 追踪不同用户的数据。

AVOS Cloud 在这方面可以做什么呢?苹果和谷歌的用户是互联网的最终用户,我们作为开发者服务,用户是开发者,对谷歌和苹果来说,开发者更多的是为他们的生态圈做贡献,把他们的生态圈扩大,从而捕捉更多的最终用户,我们的直接用户就是开发者,所以我们一直相信我们的整个商业模式必须跟开发者共赢。

我们首先会选择一些能给开发者带来直接价值的垂直领域帮助开发者进行数据的整合、数据的统一,现在很多移动应用都有社交元素,比如用户之间可以互相关注,每个用户可能有一个时间线,时间线里的数据来自于他关注的其他的用户,这个逻辑其实都是大同小异的,比如之前的人人、微博、朋友圈,我们把社交做成一个服务,提供给开发者,解决开发者技术难题的同时,也保证社交类的数据可以以相对一致的方式存储和传输。另外一个例子,聊天,如果你自己做一个聊天服务是非常困难的,我们解决这个技术的难题的同时,也保证不同应用之间聊天消息是通过统一的协议传输的,为将来用户间的数据互通提供了可能性。

让云端数据真正发挥价值的 3 个关键点

要让云端数据真正发挥价值,只有技术还不够,我自己能想到的非技术的方面有下面三点:

多方利益的一致或平衡:在商场上,绝大部分公司都是比较自私的,希望从别人那里得到数据,不希望把自己的东西给别人。参考互联网去中心化结构,不被一个国家政府控制,当在你互联网上把一个消息从 A 点传到 B 点时,就有可能跨过多个网络,当一条消息到一个网络边界时,交换机就要作出一个选择,下一步怎么走,他就要询问别的网络你能不能帮我送这条消息,如果每个网络都是自私的,他肯定希望别人承载自己的流量,而自己不愿意给别人承载能量,一般来说,网络之间遵循 BGP 路由协议,保证公平性,如果一个网络不传输其它网络给它的流量,其它网络不会给他传输流量,达到利益的平衡。大家都非常熟悉流量交换网络,不同应用之间,按照一定比例交换用户的流量,作为数据方面的资源,是不是也可以有一种类似的方式解决呢?这里面有很多挑战,因为数据的价值是不一样的,我有数据,你有数据,可能我们对各自的数据的价值的定位和认可度是不一样的,那么怎么样形成市场机制,让大家公平的做交换,这是非常有意思的问题。

开放的商业实践:在一个市场里,如果每一个玩家都是封闭的心态,我的数据和应用不给任何人,整个系统就没办法很好的运转起来,数据都是在信息孤岛里,没办法流通,我发现很多公司都有一个以上的开发平台,特别像腾讯和阿里这样有很多产品的公司,这些平台都叫开放平台,但并不开放,腾讯开放平台官方网站列的一些常见的应用不能接入的情况,一共有 15 条,其中一条是应用中不能含有腾讯主要竞争对手的分享及宣传内容,开放平台对竞争非常排斥,英语里有一个词叫 Competition 和 Cooperation,就是竞争与合作,很多人还没有意识到这点,另外一点,微博开放平台,每个用户接入时必须说我同意微博开放平台开发者协议,里面对广告有非常严格的限制,对向第三方披露自己的运营数据有非常严格的限制。

对谷歌来说,开放性真的是自内向外的信仰,如果公司高层在某个时候做了一个不是那么开放的商业决策,会有很多内部的声音出来反对,谷歌在过去几年在确保自己产品开放性上花费了非常多的资源,到谷歌 Takeout 这个页面,可以把自己所有数据拿走,如果我是谷歌的竞争者,比如我们做了一个跟 Gmail 同样产品,用户很容易把他的数据从 Gmail 迁移到我这里,过那么多年这些产品仍然是各自领域里最好的产品,开放性对于一家好的公司来说是竞争力,而不是负担。

注重用户隐私的保护 :用户隐私保护在美国、欧洲都比较受重视,在中国很多用户和公司还不太重视,法律对大家隐私的保护也不够,针对于今天的主题,怎么样实现数据的价值?同时,又能达到隐私保护的目的,能想到的有两个方式:

  1. 由平台控制数据,对外提供功能性服务,也就是苹果和谷歌采用的方式,比如所有带传感器的硬件和应用都以他们规定的统一的 API 的形式把数据保存到他们的平台,他们可以在征得用户允许情况下把用户数据开放给一些其它的应用,也许一个医疗方面的应用他可以使用 Fitbit 手环采集的数据。
  2. 学术界在过去十多年有一个叫 Privacy-preserving data 可以保护隐私的数据挖掘,简单地说,学术界有些研究成果可以做到在一个大的数据集上进行数据挖掘,但又可以保证单个用户的隐私不会受到侵犯,如果这些学术研究能得以实现将能解决很多问题。
数据挖掘可穿戴设备
下载极客公园客户端
iOS下载
反馈