碳云智能黎浩:把管理健康的权利还给每一个人

含着金钥匙出生的碳云智能,从一创立起,就备受关注。

2016 年 4 月,碳云智能已获腾讯领投的 10 亿人民币 A 轮融资,被誉为生命科学领域的「独角兽」。

2017 年 4 月 21 日,碳云智能联合创始人兼首席信息官黎浩出席了亿欧举办的「新科技·划时代——让 AI 落地产业才能产生价值」峰会。这次峰会旨在邀请学界、产业界、资本界共聚一堂,探讨如何捕捉人工智能风口,帮助 AI 从技术向产业落地,创造更大价值。

黎浩会上发表了题为「AI 与数字生命」的演讲。

黎浩在会后接受了记者采访。在谈到碳云的初衷时,黎浩表示:「以前主要做科研项目数据管理,只能得到一个数据切面;而现在我们做面向消费端的数据,需要不断跟踪数据的走向,和用户交互,得到更完整的分析路径。我觉得这是做消费端数据分析的意义所在。」

健康数据管理在黎浩看来,不仅仅是为了治疗疾病,而是为了在平日里,根据自己身体数据,让身体不断感知、反馈,自我学习,达到健康管理、预防疾病的目的,保持健康,活到 120-150 岁。

这不是一个遥远的梦想。目前基因检测技术已经较为成熟,但是从基因到健康评价、疾病诊断,基因的转录、表达、代谢等等中间环节还很多,还有很多表型的数据要收集、整理和分析。「这也正是碳云智能的努力方向。」


vbox4081_922A9547_140803_small.JPG


以下为演讲内容整理:

碳云智能,是一个新的公司,2015 年 10 月 27 日创立。存在的基础是什么?碳、云、智能三个单词解释了公司存在的背景和基本假设。

碳,Carbon,曾经有人问我们是不是做石墨烯的。其实,地球上所有的生命都是以碳为基础的。这个世界上所有的生命是不是可以被数字化?这个已经具备条件了,生物技术采集可以在这个时间点,是可以被数字化的,主要是有赖于测序仪的发展,可以检测 DNA,或者是代谢产物。

这也是非常大的数据量,如何来解读,和今天的主题相关,也就是智能。碳基化的数字化的生命可以被人工智能化,因为这个数据量,未来如何看待这些数字,必须用人工智能来解读。

云,一个人的数据其实价值是不大的,只有把所有人的数据或者是更多人的数据联结在一起,网络化才有价值。今天传递的知识可能更多通过网络传播,因为这是一个知识要被重写,信息要被重构的时代。我们想做的事情是做一个数字生命的运营商,我们未来希望能够用人工智能的方法,去解读数字化的碳基生命,最终可以运营和管理这些数据。

碳基生命数字化,简单分成两大类:

第一类是现在医院的检测数据,都归为表型数据。有影像学的数据,生理生化数据,还有可能是情感偏好数据,有问卷,也有心理健康数据,我们都称之为表型数据。

第二类是组学数据,基因组,蛋白质组,微生物组,表观遗传组,在座的各位谁有这方面的数据?

这些数据怎么来?比如说基因组,今天能够把生命和大数据结合起来,和人工智能结合起来,主要是测序仪的作用,它把 DNA 里的秘密揭开,解析一些数据,到底怎么样排列组合,形成一个能够表达你生命本源的、有基础逻辑运算的程序。这是上个世纪的三大工程——原子弹、登月计划、人类基因组计划——里面最后一个完成的,6 个国家花了 13 年用了 30 亿美金测了一个人,后来测序的价格开始下降,一直到 2012 年时候的 1 千美金,现在应该可以做到 600 美金,但这只是测一个人,而且只做了基因组。这个数据量到底有多大?从这张图我们可以看到,一个人的全量数据量大约是 4-10T.

未来如果是测序免费,在座的各位以基因组为代表的组学数据都有了,那时数据的价值才会更大。


vbox4092_6S9A9439_140938_small.JPG


数字生命的智能化


上午很多专家都讲了人工智能的演进路径,97 年的深蓝,2012 年的沃森,到现在的 AlphaGo 打败李世石。

AlphaGo 仿照人类下了 3000 万盘棋,现在的 Master 说我根本就不考虑人类是怎么下的,也许以前下棋的思路是错的。如果说对围棋的终极理解为 100 分的话,也许人类探索了 3000 年只在 10 分的领域里打转,9 段的棋手也就是达到了 9 分左右,那么 AlphaGo 可能达到了 60 分,Master 可能是 70 分。人和机器在这个方面的战争(结局)是怎么样?机器已经是不可能战胜的。

现在还有人在做德扑人机对战的游戏,让人工智能和德扑的高手比赛。(过去)在(和 AI)下棋的阶段还只是规定范围内,规定规则下,大家的信息对称情况下的博弈。德扑的更有意思,是信息不对称的博弈,双方都会使诈。目前也已经打败了人类。人工智能可能会走得越来越快,越来越远,从 AlphaGo 到 Master 的进化只用了几个月的时间,几个月走完了深蓝到 AlphaGo 十几年的时间。

生物学上我们要做的是什么?

未来做医疗的、健康的,所有的生物学(的知识)都可能会被冠以计算生物学的概念,我现在要讲的是 BT 和 IT 融合的概念,从 DNA,RNA,基因转录,蛋白代谢,肠道微生物等等全量组学数据的记录才能准确的描述一个人的健康状况。但是这些描述不是对一个切片的描述,也许未来的场景不是一个诊断的场景,是一个监测的场景。在座的各位可能对于管理你的生命健康(这件事)需要更多的监测性的指标,而不是一个时点的诊断指标。

你的 DNA 转为 RNA,蛋白质、代谢上是怎么表达的,和环境是怎么互相作用的……未来,我们把这些所有的数据记录下来,进行分析。每个人未来都有自己的阿凡达,你说我明天要跑 42 公里,你可以先让它运算一下。我们知道马拉松赛道上经常有猝死的人,你有没有猝死的基因,要不要测一下?比如说我明天要去爬 8848(珠穆朗玛峰),那你如何适应?也许我可以给你一套健康锻炼的计划,去适应。

所以未来只有 BT 和 IT 的结合,从生物的底层数据开始,才有可能解读和改变现有的健康管理和医疗管理。

我们希望从自我学习开始,每个人都可能是一个更为敏感的 Sensor,每天在和自己饮食运动结合的过程中,不断的调试自己。有些人很注意,知道保养:我要吃这个,要吃那个,我不能吃这个,不能吃那个,今天要跑多少公里,明天要做健身增肌……这个过程,就是你的自我学习的过程。但是你想不想在这个过程中有个数字化的东西,帮你记录,帮你反馈,给你建议?

未来如果你自己的学习系统(进化的)更好了,是否愿意推荐给你的朋友做对照、建议,又是另外一个课题,人多了以后进入了机器学习和大数据的学习(阶段),就可能帮你解决更多的共性和个性的问题。

从人工智能和健康管理的学习系统来看,我们从一开始用计算机来代替 1+1 的运算,后来我们给计算机喂更多的数据来训练和学习,到后来推理和预测。而这些基本的假设可能要来自学生物信息学的人,最后还有可能根据分析的结果给予个性化的管理和干预的手段。

那么进化模型就可能是从数据到信息,到知识,到最后大家形成健康管理的共识,可能这一切就颠覆了你现在知道的「我们有病要看医生」的过程。在数据的基础上告诉你应该怎么管理健康,最后给你更多的干预和解决方案,让大家未来在新的认知上达成新的平衡,你的身体健康也可能达成一个新的平衡。


vbox4092_6S9A9450_141254_small.JPG


数字生命的网络化


一个人的数字是没有用的,我是乳糖不耐受,原来不喝咖啡,后来检测完了之后发现,我不是不能喝咖啡,原来是对咖啡里面的乳糖不耐受,那就不要加牛奶和糖了,所以现在只喝美式的。

很多人说我对酒精的耐受程度到底怎么样,其实就是两个酶决定的,只要检测一下就知道了。以前我们可能听说过这样的事,说有的人家里的孩子一打针就耳聋,结果很长时间都在想这个问题,这个医生多坏!给他吃药就没事儿了,给我打针我就聋了。

所以现在的新生儿家长都知道,要进行耳聋基因的筛查,是因为有些孩子的基因对这种药物是不耐受的,这个以前没有检测是不知道的,但是这样的人多吗?都是哪些人?都需要网络化来做。更多人的数据连接起来,才有可能知道这个事情。

每个人的 DNA 都是预设的一套程序,那么这套程序大概是什么样的运转逻辑?我们知道哺乳动物的理论寿命,应该是生长周期的 7 到 8 倍,所以人的理论寿命应该是 120 岁到 150 岁,但是为什么大多数人活不到?第一,有些人有生命程序的缺陷,有单一遗传性疾病,有很多孩子就活不到几岁,甚至活不到 20 岁。

第二个可能是生命程序的变异,这个程序有这样的风险。比如说乳腺癌,就跟肿瘤变异的可能性关系很大,安吉利娜朱丽就切除了她的乳腺。

还有一种可能,是你的生命程序处于非最佳状态,就是慢病。现在在座的各位都是成年人,中国糖尿病的发病率在 30 年前是 1%,现在是 11.6%,而且还有 14% 甚至是更多的人属于前糖状态,这 30 年发生了什么?我们吃饱了,这个病就来了。

世界卫生组织说,一个人的健康有 15% 的是遗传因素,10% 是社会因素,8% 医疗条件,7% 是气侯条件,60% 是自我管理,自我行为的对照。除了前面的 15%,85% 都是可以被控制的。

例如气侯条件我们是可以选择迁移。还有我们的饮食、运动、情绪分别影响了我们的摄入、消耗、干预。我们选择用什么办法来调节这个过程,决定了我们是否能够活得更长。

vbox4081_922A9564_141309_small.JPG

碳云智能,希望在生命的数字化技术里能够帮到你,如何知道你的命运。我们希望用数字化的技术来解读这些问题。我们在国外收购了几家公司,做蛋白组检测的,做代谢组检测的,这几家公司是在各自层面最好的公司。

我们做了数字生命的管理平台,叫觅我,可以做精准的美容,健康,营养,运动等解决方案,帮助你更好的管理自己。

我们还搭建了相关的平台架构,从数据获取,到数据存储、产出、交互各个层面上做了一系列的布局。从个性化的数据到集合数据的传输,清洗,加载,还有整个个性化数据的标准化和质量管控,以及在数据化运作过程中的数据结构,逻辑算法,信息安全,智能查询。这些东西我们最后都会以 2C 的形式呈现给各位用户,让大家感知到我在管理自己的生命,管理自己的健康,而且是以数字化的模式在管理。

我们去年做了一个七天的断食研究,记录了自己所有的相关数据变化,发现了很多有意思的东西。

在做这次测试的时候,正好赶上去年诺贝尔医学奖公布,最后这个奖颁给了日本人大隅良典,他的主要理论基础就是细胞自噬理论,而其中一个重要的逻辑,就是人在饥饿状态下,那些坏的细胞会被先消耗掉。糖尿病的发病率也验证了结果,吃,还是不吃,这是一个选择。

你的肠道微生物在定期的状态下被清空一次,那你的身体是否应该象计算机一样,需不需要来一次重启?

我们做了精准的辟谷项目,用 81 天的时间开启你的数字化生命之旅,中间有 7 天是完全断食状态。但是在之前我会先帮助你做一次检测,告诉你到底适不适合去辟谷。因为不是所有人都适合七天不吃饭的,或者至少不是每个人都是七天。

所以未来在检测之后会告诉你,你应该如何进入到断食这个项目中,在断食的过程中要有怎么样的干预和监控手段,全程的监控你的安全。我们有血糖仪,有心率贴,智能手环,全天的尿糖、微量元素的监测。最重要的是七天以后怎么办?你的肠道微生物被重建了,你希望是一个什么样的状态?我们会给你一些干预(建议),告诉你怎么样才能更好的吃,不吃是为了更好的吃,希望大家最后能够在这个过程中更加了解自己,管理自己的认知,管理自己的健康。

如果你的认知达到了新的水平,主要是科技进步的结果,接受了新的科技就可能达到这个水平,但是这个过程需要大家的传播和认知,最后才有可能真正的寻找到碳基生命的硅基未来。

谢谢大家。

关注极客公园公众号
反馈