对话 CTO〡听 GrowingIO CTO 叶玎玎讲无埋点数据分析的业务理想

摘要

「对话 CTO」是极客公园的一档最新专栏,以技术人的视角聊聊研发管理者的发展和成长。

我们特别邀请到了 ONES 的创始人&CEO 王颖奇作为特邀访谈者。王颖奇曾参与金山软件 WPS、金山毒霸等大型软件的核心开发工作;2011 年创立了正点科技,旗下产品正点闹钟、正点日历在全球用户过亿;2014 年,王颖奇在知名美元基金晨兴资本任 EIR,并以个人身份参与十余家公司的管理咨询工作;2015 年,王颖奇创立 ONES,致力于提供企业级研发管理解决方案。


创立之初,GrowingIO 以无埋点技术切入市场。为了让数据平台可以帮助客户做深度的用户转化、留存分析,GrowingIO 花了三年多时间去打磨产品。

正如 GrowingIO 联合创始人&CTO 叶玎玎所说,真正去做一个 SDK 来采数据其实很容易,但是要做 SaaS 服务,要针对不同用户的不同写法去做通用型的开发,还要考虑应用开发本身的一些易变化特性等等,这些都需要很强的技术支持。

叶玎玎曾在网易杭州研究院从事工程数据库相关工作,2009 年接触 SaaS,2015 年到 GrowingIO 负责核心产品研发。

本期对话 CTO,我们请到了 GrowingIO 联合创始人&CTO 叶玎玎。关于 GrowingIO 产品如何支持业务发展,以及数据分析产品的历史演进,叶玎玎谈了谈自己的看法。


产品做给业务端

颖奇:很高兴 GrowingIO 的 CTO 叶玎玎同学能接受我们的访谈,我觉得可以先大概讲一下 GrowingIO 在技术方面的一些特长。

叶玎玎:OK,如果要研究 GrowingIO 的技术,一定要先了解它的形态。GrowingIO 是一家云的公司,做 SaaS 的公司,所以我们所有的客户数据的采集都会在云上。

目前我们第一个技术特点就是外界所熟知的无埋点,自动去采集用户从打开应用或者打开网站到离开的所有行为数据,这个行为数据通过可视化的定义方式去展现。其实这会涉及到你如何去理解客户端的实现,无论是对浏览器本身的实现,还是对于 iOS 或者安卓操作系统的实现,这里都需要很多黑科技的东西。去了解它的实现后才能更好地在上层去研究怎么做无埋点的逻辑。所以这个是我们在过去三年花了很多时间去研究的东西。

真正去做一个 SDK 来采这些数据其实很容易,但是要做 SaaS 服务,如何针对不同用户的不同写法去做这个通用型的开发,并且是插件,包括这里面还要考虑如何去应对应用开发本身的一些易变化特性等等,这里需要做很多东西。

所以我们在这个过程中自己也用了很多方法,通过算法、模型、机器学习等方式,考虑怎么去让前端采集到的数据跟后端用户的数据逻辑之间更好的匹配,所以这个就是外界所熟知的 GrowingIO 的无埋点。但本质上另外一个挑战在于,当有这么大数据量进来的时候,我怎么去处理数据?我相信 GrowingIO 数据量在国内应该算蛮大的。

颖奇:因为无埋点本身是没有筛选的来进行数据采集,所以肯定会有很大的数据量。

叶玎玎:一方面是这个,另外一方面也在我们数据系统本身。举个例子,我们每天可能有个两三千亿条的消息,我相信大部分公司都达不到这个量,这是第一点。第二点是,GrowingIO 有一些几个亿 DAU 的客户,单体客户几个亿,再加上云端有这么多其他的客户,怎么更好地处理、存储、查询,都是一个很大的挑战。

颖奇:那对比市场其他竞品,在数据量这方面,GrowingIO 有没有一些技术上的先进性?

叶玎玎:是有的。 GrowingIO 目前有一个很多客户认为很方便的功能——指标维度的多维交叉,实现任意去拖拽指标维度,瞬间出图。举个例子,你要进行基于人的指标维度任意交叉的时候,GrowingIO 是可以快速出结果的。具备这些属性的用户,然后做过哪些事情的用户,在历史上的任何一个时间点,能立刻知道这群人,立刻计算出来他们有谁。这个东西在之前的数据系统里面相对来说是比较少的。大部分数据系统,无论是 T+1 还是实时,还是一个小时这种,它都是基于事件的处理。

颖奇:这就是说分析过程上你们应该是做了更多事情的。

叶玎玎:我觉得是在用户画像本身,就是我们如何去更好的找到一批用户。然后这个过程包括,如果你找一个其他的用户分析系统,你想要看留存,或者说要去做转化路径,要找到哪些优化点,那核心其实就在于对于用户之间群体的对比。

对单一人群去做分析其实很容易,但是一旦要将用户之间对比各种东西,然后又要达到非常快的响应效果,这个其实是其他竞品很难做到的。这里最核心的差别是说,因为我们一直是做给业务端的,就是产品运营等等,所以我们的要求就是他们能非常简单的从我们的分析工具里面去得到结果。

颖奇:所以 GrowingIO 在无埋点等技术上有哪些关键特点呢?

叶玎玎:无埋点肯定是我们一个关键特点,因为使用其他产品的话,你可能需要自己去梳理所有东西,我们是让那个业务直接可以自己去做。然后第二点是基于这个能力上来说,本身我们会演变出来新的一层能力,我们能快速做实验。比如我现在想要一个东西,这个时候我不是找研发去帮我做打点,而是直接可以看到结果。我当时自己为什么觉得 GrowingIO 很值得做,就是因为我之前用其他数据分析工具时,陷入到数据采集-使用、采集-使用的整个不停的轮回之中,这个过程中,大量时间其实被浪费在前端的采集和处理这一块,真正进入到核心的产品逻辑的迭代和产品的改进的时间是比较少的,而 GrowingIO 就不会有这样的问题。


高效能远程工作

颖奇:我了解到您之前是有做过远程团队的工作,您觉得远程工作这样的方法在中国现在是不是真正能够去很好的来实行?

叶玎玎:我个人判断相对是比较难的,它必须变成两种模式。远程工作要么就是全员远程,这个事情反而是可以做的。因为全员远程意味着大家每个人都接受了,我必须要为了我们的效率提高付出额外的努力,然后为了降低我的沟通成本,我要做哪些事情。我觉得这个是非常关键的。但这里面如果存在大部分人不远程,某一两个人、两三个人远程的情况的话,这个就会变得非常尴尬。因为很多时候最高效的沟通肯定是面对面沟通,然后在面对面沟通过程中,有一个人如果在远程的话,那很多时候他其实不知道其他人在聊什么,因为除了语音、视频以外,还有一些肢体语言等等,然后聊着聊着很容易的一点就是大家把远程的人忽略掉了。

所以我个人的建议是如果全员远程,这个是 OK 的。但是这种模式是否能演变出来非常快地去响应变化,这是有一些潜在风险的。所以这个意味着整个团队的认知需要达到一定的高度,然后整个团队为了达到更高的效率,更好的沟通,愿意付出什么。如果你去评估这两点之后,觉得这是自己可承受的风险,那可以选择。如果对一个创业公司的话,我觉得这个可能是比较难的。但是如果对于一些看着需求做事的公司来讲可能是没有任何问题的,因为这个过程中无非是我怎么把项目管理做的更好。或者还有很多公司选择了另外一种模式,其实不算远程,就是一个多地的办公室。

颖奇:前一两年的时候,因为一些效率工具的出现,大家都说可能未来是远程工作的时代,人会越来越依赖工具。但是现在我们越来越觉得,真正工具刚需的来源不是因为远程工作,面对面的时候我们也是需要工具的。

叶玎玎:我觉得工具的核心不是为了解决远程的问题,而是人是在流动的,是不一定都在一起的。比如风车到最后服务的团队可能是在一个 office,但是因为大家都出去了,所以在这个过程中怎么去分配工作,怎么去沟通等等,(工具本身)还是解决类似这类问题。


围绕用户做分析

颖奇:您怎么看待中国数据分析行业的过去、现在、未来?包括过去一代二代的数据分析产品,现在的数据产品,可以来分享一下您的看法。

叶玎玎:我觉得最早的应该不叫分析工具,叫统计工具。像 CNZZ 也好,像百度统计也好,做流量的一些统计,核心是在流量层面。

然后再往下,大家会说光是统计还不行,要进入分析,要了解一下我的用户整个情况是怎样的,那这个时候会演变出来第二代的数据分析产品,就是基于事件的。因为每个事件都会对应到人,既有事件的模型又有用户的模型,这个用户到底做了哪些事情,然后去筛选用户,这个是第二个阶段。

目前大部分的工具应该也在这一层,包括在 2010 年左右出来的友盟、Talking Data 为代表的一系列工具,当时它们承载的很多可能就是流量统计的功能,但是它们也有事件模型。然后再到下一代,从事件本身到开始运营用户的生命周期了,就是到用户这一层。

颖奇:到用户这一层了,就是会把它组合起来看。

叶玎玎:是的,我通过事件去更具体的去看一个用户,核心围绕着用户来做分析,不是核心围绕着事件来分析。所以我们所有的人的模型在整个数据分析里面就会成为第一个关注点,这个是很重要的。然后再往下的东西也跟这个时代相关,因为现在有很多机器学习,你要去做个性化,这个过程中,你怎么去更好的基于机器学习来做东西,无论是从各种推荐引擎,或者说各种的计算模型,这样演变出来比如做 alert(提醒)、anomaly detection(异常检测),那这些又会进入到下一个阶段。但是这里的所有都是基于你的数据层是干净的。数据这一层要有一个好的基础,不然想着跳到下面步骤的话是很难的。

颖奇:在您刚才讲的用户精准个性化的一些业务上,我们现在看到的这些数据平台更多是帮忙分析,你们会有一天能够真正走到业务中去吗?比如说可能会提供一些数据的接口,或者提供一些非常精准的画像,每一个客户最终都会跟真正业务端的服务对应起来。

叶玎玎:其实我们现在就在做了,我刚才提到,理论上我们的客户主要打的还是业务端,比如产品、运营,他们用我们系统就在做这件事情,真正走到业务里面去,他们在我们系统上去定义各种东西。举个例子,我们可以让系统找出来,比如昨天注册了,看了 Demo,但是没有继续去做创建项目的人。这群用户筛出来以后,针对这些用户可以去做触达。然后比如在做哪些事情的过程中,你到底要给他一个什么样的动作,这些东西是我们在帮我们客户做的,所以它其实是非常业务化的。

颖奇:能否给大家介绍下您的个人职业经历?

叶玎玎:我之前在网易杭州研究院工程数据库相关的组里面工作了一年半,2015 年之后在做 GrowingIO。中间有几个节点,第一个是我最早远程是 Freelancer,那时候更多是帮美国的一些创业者去做 0 到 1。然后 09 年到 12 年,我从自己研发的这个点更加往外扩出去,负责产品研发,做企业社交这一块。但是我是从 09 年开始真正去接触 SaaS 这个行业,然后接触 to B 这个方向。

09 年的时候,我们非常看重怎么去做实时 Web,因为它在 09 年的时候其实没有太好的解决方案,但那个时候我们为了自己做的东西,就做了很多技术上的突破。然后到做协作工具也是,就是怎么把用户体验和当时实施的技术更好的打包成一个方案表给到用户。然后到 14 年底开始做无埋点,也是在当时非常新的一个东西。

12 年底到 13 年又做了另外一个蛮好玩的事情,就是 Teahour,一个技术播客。我觉得当时 Teahour 对很多刚工作一两年的或者在刚毕业要找工作的那群人给了很多方向性的指导。

颖奇:您之前一直在做程序员,也一直在做自己的项目,那最终变成一个这么大公司的 CTO,中间有什么特别重要的一些转变,或者您觉得比较关键的时间点或者里程碑,经历了之后就变成一个 CTO 

叶玎玎:因为我从 06 年毕业的时候就开始创业,无非是一开始创业相对来说团队的人数可能比较少,然后会经历一个团队从小变大的过程。我会非常关心用户到底是怎么想的,对我来说,为什么我对数据分析很感兴趣的一点,在于我会尝试通过这个去理解到底用户在用我的产品的时候他心里的想法。所以我觉得很核心一点是,我自己是在思考到底这个业务和产品应该怎么来做的,所以我觉得我跟大部分的技术不太一样,我会很容易在用这样的视角去思考。

颖奇:非常棒。最后可不可以推荐一些您最近看的认为比较好的书给大家。

叶玎玎:我看的书会比较更加偏意识形态一点,更加偏管理一点。我最近一直在看《赋能》,《赋能》这本书核心讲在现在这个时代,你到底应该有什么心态,应该怎么去更好的发展等等。

颖奇:好的,今天有很多收获,非常感谢。


本文作者:王颖奇

联系方式:wangyingqi@gmail.com



最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。