拨开区块链的云雾,攻破三元悖论的不可能

摘要

区块链网络模型如何兼顾性能、安全、去中心化三要素,区块链扩容方案 Monoxide 给出了最优解。

长久以来,数据安全是人工智能行业内的热门话题和痛点之一,区块链技术凭借自身去中心化、匿名化等特点,不仅确保领域内数据共享的安全性及私密性,还在一定程度上避免了数据孤岛的情况发生。它与人工智能技术的有机结合,正在为智慧城市、医疗卫生、食品安全等领域注入更多的可能性。

尽管区块链技术在诸多场景中逐步应用但这项技术长期面临「不可能三角」(也称三元悖论)的技术瓶颈。无论采取哪种共识机制来决定新区块的生成方式,区块链网络模型都无法同时兼顾性能、安全、去中心化这三项要求,最多只能满足其中两项而牺牲另外一项。

由创新工场人工智能工程院副院长兼执行董事王嘉平参与撰写的,基于异步共识组 Monoxide 区块链扩容方案的研究论文,在去年 12 月被计算机网络学术会议 NSDI 录用。这篇论文详细阐释了 Monoxide 的优势和特性,有望打破「不可能三角」这一长期阻碍区块链性能的瓶颈。

         (创新工场人工智能工程院副院长兼执行董事王嘉平与 NSDI 会议主席 Jay Lorch | 创新工场)


数据暗箱

进入云服务时代后,面对全球的海量信息,我们更依赖于搜索引擎和推荐系统提供的网页和信息流推送内容。这些系统和产品左右着用户的「所见」,甚至通过人工智能技术的加持,主打「千人千面」的内容呈现方式。虽然这些服务系统的背后恪守着诸多规则,但它毕竟由人为建立,依附于机器去严格执行。

现有的服务系统基于计算所构建的规则愈发强大。不过,最初的计算却很简单。计算的目的是为了完成任务,计算过程全部掌握在使用者手中。王嘉平表示,从 Web 时代开始,移动互联网让这件事变得不一样。尤其是在云服务体系当中,规则被认为是计算的核心。我们日常使用的很多服务,背后都是受这些规则所驱动:「比如网页推荐和信息流,或主打撮合型服务的网约车程序,用户很少去思考系统规则的背后究竟是为用户服务,还是服务提供商谋取利润的工具。」

事实上,二者皆存在。

大型在线服务商的背后是成千上万服务器 24 小时运转,它服务每个人,又去了解每个人的喜好,并针对性地优化服务质量和业务流水。

Google 作为全球最大的搜索引擎公司,曾提出「不作恶」的口号,是因为技术本身存在作恶的嫌疑,所以 Google 才会用这句 slogan 为自己树立行业标杆。也正因这种计算范式,导致了它有一个冠冕堂皇的理由:收集用户的公开数据和隐私数据变为一种理所应当,成为用户隐私问题的罪恶之源。

行业从业者清楚,这些规则对用户而言并不透明,并可以在暗处操纵。尤其是在线服务的规模近乎影响到所有人时,这件事情更需要关注和警惕。

在线服务系统最初源自于基于服务器的计算范式。服务器的逻辑认为,所有的计算都在数据中心发生,它隐含了两件事情:一是计算过程完全由自己控制和制定,并且可以随时改变其中的规则;二是用户没有办法获悉整个计算过程。

(王嘉平现任创新工场执行董事,投资方向为区块链和人工智能,曾主导了对比特大陆的首轮机构投资,成为其首轮三大主要投资方之一 | 创新工场)


打破信息不对称

提到区块链,公众脱口而出的词汇更多是数字货币,但区块链的本质并不能和数字货币划上等号,「大家看到的比特币只是区块链技术支撑的应用之一」,王嘉平强调。

很明显,当下区块链行业信息不对称的现象严重。「那些人鼓吹区块链是万能的人,从一开始就让大家就对区块链产生误解,觉得区块链是一个不可篡改的数据库,这种理解明显歪曲了事物原貌。

区块链的本质是让计算规则不被改变。它作为一种全新的计算范式,让系统内的规则在全网公开透明,且规则一经部署无法私自改变。而系统内涉及的数据,建立的状态,可以是任何类型的数据结构。

不同于服务器的计算逻辑,区块链新的计算方式要求以用户为结点,计算过程是一次又一次地被全球不同的计算机接力完成,而不是停留在一台特定的计算机里面执行。

它改变了原来的计算方式,摆脱了由硬盘存储、CPU 代码等软硬件对计算结果的绝对控制。它拥有一份完整的规则,譬如应该如何完成计算,怎样利用数据做输出和输入。当这套规则运行在网络内时,它允许所有人参与进来,但任何人都没有办法在计算的过程中篡改规则,否则计算结果不会被承认。这使得区块链的计算范式具有一种「独特的能力」。

王嘉平认为,判断一项新兴技术的价值和潜力,归根到底是看其是否具备一些新的能力和实实在在的技术突破。区块链以数字化和形式化的业务场景为前提,构建了一个不受人为因素控制的、牢不可破的规则。正因为这种技术的独特性,才赋予了区块链支撑未来新业务和新应用的市场机遇。

(在接力计算的过程中,无法预测下一次计算会在哪个结点完成,但区块链会基于 P2P 网络协议把数据或计算结果同步到网络上 | 创新工场)


分而治之

眼下,区块链技术存在的明显缺陷是性能问题。要知道,区块链系统要求每一台计算机同步整个网络里面的信息和状态,这导致了全网性能实际上只有一台计算机的储存、通讯和计算能力,这正是比特币进展迟缓的主要原因。

当然,它的解决方案显而易见,因为工作量巨大,不必让所有的计算机重复所有的工作,可以对计算机分组并参与分片的工作,这种「分而治之」的思路,在互联网的发展历程当中,被大量的使用,也为为互联网系统性能的提升做出了卓越的贡献。

王嘉平介绍,分布式计算系统数据量之大,以至于当今世界上任何机器都无法独立胜任这份工作。而分布式计算的「伸缩性」可以很好地把储存数据和其相应的计算切分成若干块,利用普通的标准化 SKU,让多台计算机共同参与计算,不再需要打造超大型计算机。

去年 12 月,计算机网络顶级学术会议 NSDI 宣布录用由王嘉平参与撰写的区块链研究论文,该论文提出名为异步共识组 Monoxide 的区块链扩容方案,并可以在由 4.8 万个全球节点组成的测试环境中,实现比比特币网络高出 1000 倍的每秒事务处理量,以及 2000 倍的状态内存容量。

(理论上,Monoxide 模型可以将一个单链共识算法的横向扩展倍数提升到 10 万量级 | 创新工场)

论文中的异步共识组——Monoxide 模型,是一个并发的多链系统,每一个链称为「共识组」,即把整个网络的共识和计算分成若干组,它们互相独立,并行工作,分摊网络里的部分工作量。这种思路听起来直白简练,但事实上,要在区块链系统完成这样一项设计,并且保证安全和公平开放的特性,是非常有挑战的。

(Monoxide 模型打破了「不可能三角」的制约,在满足安全、高性能和去中心化的三角特性前提下,尽量不引入额外的实体,不引入额外的机制 | 创新工场)

「互联网技术讲究容错性,它在内部部署不需要考虑恶意结点的存在,允许机器的失效和突然宕机,但是在区块链系统当中,任何人都可以参与进来,这意味着它不仅仅需要容错,还要保证安全,这就要求它必须具备通过协议、密码学、共识技术等,去抵挡网络当中某些恶意结点的出现」,这是区块链系统实现「分而治之」的设计思路最有挑战的地方,王嘉平认为。

异步共识组本质上是为了改善区块链性能,它有两个非常重要的指标:一是吞吐量(TPS),二是状态容量。

吞吐量在业务层面意味着流量,意味着用户的活跃度。在 Monoxide 系统内,吞吐量不是一个定值,而是具备可伸缩的特性。只要给定足够多的计算资源,那么整个网络的吞吐量就可以实现线性提升。在试验阶段,Monoxide 成功在一千多台计算机上部署四万多个结点。

而状态容量则是系统承载用户量的天花板,它的空间量决定了区块链系统记录用户状态(又称账簿)的多与少。因为区块链存储用户数据需要放在内存里面,确保其验证交易能够随时访问。

状态容量以前始终是一个单机容量,几乎没有得到过提升。但实际上,状态容量可以随着更多的计算机参与而得到线性提升。「比如 Monoxide 现在用 2048 个分片,再全网达到一万多的 TPS,状态容量的大小是几个 T。当我们把分片分到几十万的量级,足以满足支付宝整个业务量。」王嘉平透露,Monoxide 将在今年 8 月上线测试网络,供开发者做技术评估。


应用畅想与自证清白

区块链构建的规则,要被完全数字化和形式化,确保所有的东西都能被计算。譬如现阶段用区块链技术去衡量道德,所有的计算机都无能为力。因此,区块链所涉及到的信息,需要被影射后才能成为链上的数据,触达一些新的业务。

王嘉平表示,用计算构建信任的区块链技术,可以在供应链、金融、食品安全、医疗卫生、防伪溯源等业务场景大有可为,它传递了信任关系,让不同产业间的上下游企业更好地相互协作。

比如一家溯源公司不可避免地要跟很多企业打交道,却始终绕不开「凭什么把数据给你」的问题。「给了你数据以后,万一你利用这些数据做其他的事情,我怎么控制,把你养大了,未来给我搞事情怎么办」,王嘉平强调,区块链最大的意义不是围绕业务展开,而是给业务增加一个很好的湿润剂。

大家做的都是跟溯源相关的计算,不能任意部署其他计算,也不能任意把数据拿作他用,这是区块链的技术保障。「倒不是说区块链本身在承载什么样的计算,而是说它给了大家一个可以去相信的支点,这个信任保证不是任何人的背书,而是来自于密码学和共识技术」,王嘉平说道。

再比如金融支付领域过去受到货币兑换、手续办理等因素的制约,跨国支付往往需要花费较高的时间成本,难以高效完成。而在具有公开、不可篡改属性的区块链技术的帮助下,交易双方的信用机制将得到保障,并且大幅提升系统的运转效率,降低业务成本,能够有效推动跨境支付在商业领域中的发展。

除此之外,保证计算被执行这件事情会有很大的价值,譬如就征信、税务和专利保护问题,这些事情在区块链里未来一定会发生,并深入到社会的每个角落。

对于业务本身来讲,自证清白是规避风险,明晰责任。比如医疗卫生、智慧城市,都需要做一些与公有数据和私有数据相关的计算和服务。对于那些想浑水摸鱼的企业来说,唯有用「良币驱逐劣币」的正向循环手段对付他们。

每逢基础设施的更替,都会导致企业盈利模式的变化。王嘉平推测,从互联网技术到区块链技术的更替同样会经历类似的阵痛期。商业公司需要在「提高用户服务质量」和「盈利赚钱」中权衡,这个平衡点目前区块链尚不能支撑,如果让计算机自证清白,这项新技术,或许不是区块链,也不是当年苹果提出的「端到端加密」的概念,还有赖于未来其他技术的发展。

图片来源:创新工场

责任编辑:周小丹

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。