解密基于区块链的分布式存储

2019-12-20 09:47董天一
软件和集成电路 2019年11期
关键词:存储系统代币矿工

董天一

世界正在被数据化,自从人类文明诞生以来,人类便发明了各种数据存储和传输的科技,人类文明以数据的方式得以传承和保存。从最早的甲骨文到现代文明的计算机,知识的分享速度和密度随着人类技术手段的进步一直在稳步增长。

数据正在快速地被生产、传输、使用以及存储。特别是随着近些年物联网的逐步成熟和应用的落地,数据的产生和传输将达到空前的规模和速度。数据分析公司Statista对互联网数据存储供需和数据流量进行了统计和预测(如图1和图2所示)。从全球角度来看,存储的供给并没有满足数据存储的需求。另外,第五代通信技术(5G)即将商用,会极大促进物联网的布局。数据的存储和传输成本必然会成为制约技术发展的一个瓶颈,如何以更低的成本进行数据存储和传输成为亟待解决的问题。

基于区块链的分布式存储为我们提供了一个新的技术解决方案,能够大幅降低数据存储和传输的成本,同时提升数据存储的安全性。

基于区块链的分布式存储是什么?

分布式数据存储系統是一种计算机网络,其中信息通常以复制的方式存储在多个节点上。通常专门用于指代用户在多个节点上存储信息的分布式数据库,或用户在多个对等网络节点上存储信息的计算机网络。分布式存储是相对于中心化存储而言的。简而言之,就是把数据存储在多个节点上。

将区块链和分布式存储结合在一起,就是“基于区块链的分布式存储”系统。该系统可以看做是共享经济的范畴。存储和流量的提供方和需求方通过区块链对数据和流量进行交易。网络在区块链的平衡下逐渐达到供需平衡。

系统的参与方包括:存储和流量的提供者(将自己的存储设备通过网络接入系统,提供数据存储和流量服务)与存储和流量的需求方(通过接入系统的方式付费获取存储空间和流量的使用)。

对互联网数据存储和传输的强大优化作用

基于区块链的分布式存储有着天然的诸多优势。自从2009年区块链结束诞生以来,经过近十年的发展,仍然没有形成与实体经济紧密结合的可落地区块链标杆性项目,因而,基于区块链的分布式存储项目是一个新的尝试。基于区块链的分布式存储系统对于互联网数据的存储和传输有着强大的优化作用。其主要表现在以下几个方面。

网络:BT传输的技术的使用,可以比现有中心化存储节省高达60%的带宽。会优化现有互联网的使用,提升带宽的利用率。

数据存储:基于区块链的分布式存储在使用过程中会逐步平衡优化数据存储,将数据“放到”更加靠近数据频繁使用的区域。这种自平衡功能,对互联网的优化提供了强大的技术基础支持。

分布式互联网发展方向:互联网经过了几十年的发展和进化,随着网络规模的逐渐增大,应用的规模一直在突破人们的认知上限。例如:天猫“双11”购物节、春晚抢红包服务带来的恐怖流量等。互联网技术从中心化、集中式的服务逐步演变为分布式结构。基于区块链的分布式存储系统更加适应未来网络技术的发展方向,属于分布式时代的“原住民”。

基于区块链存储的优势有以下几个方面:

1.存储共享:在这个世界上存在着大量的没有有效利用的存储设备,如果能将这些设备都有效利用起来,会大大降低数据存储的成本。

2.带宽共享:与存储设备一样,在目前的互联网框架下,大量的带宽同样也没有得到有效的利用或者价值没有得到公平的分配。基于区块链存储系统可以将这部分价值有效利用起来,重新平衡网络的利用,有效降低用户的网络使用成本。

3.对区块链技术本身的完善:我们知道“算力”是区块链技术中计算矿工贡献的主要手段。而传统的区块链算力与矿机的计算速度严格成正相关。计算速度越快,算力就越大,矿工收益就越高。这带来两个问题:计算资源的浪费和能源的大量消耗。矿工在该种激励方式下势必会投入更多的算力来获取更多的收益。技术的进步从来不会停止,基于区块链的分布式存储可以从根本上解决以往区块链的弊端。取而代之的是,矿工会投入更多的存储设备和网络带宽,恰好这二者可以为网络提供更多的存储设备和带宽来满足世界对存储和带宽的需求。这也为提升系统价值奠定了基础。

4.下载速度快,性能高:BT技术的使用可以使得该系统有更好的数据传输体验。

5.更加安全:基于区块链的分布式数据存储系统,由于数据存储的分布式特点,决定了数据自带冗余备份能力。在数据存储安全上有着天然的优势。

基于区块链的分布式存储的技术挑战

基于区块链的分布式存储引进了一些新的技术解决方案,也带来了很多新的技术挑战。其中有一些决定了整个系统价值的长期可持续性。

算力如何确定?矿工的贡献如何度量。区块链技术一个重要的方向就是如何对矿工共享进行度量,激励更多的矿工参与区块链的建设与维护。我们知道,在比特币系统中,以矿工计算哈希值的能力,作为算力的度量。对于分布式存储系统,将采用计算矿工贡献存储和带宽的能力来作为矿工贡献的度量。这种新型的“算力”计算方式带来一系列的技术挑战,也是基于区块链的分布式存储的难点中的难点。截止到目前,世界上一部分数学家还在进行新的算法研究工作,以期优化算法,提升系统的可用性。

数据寻址:传统的互联网数据寻址采用的是DNS方式进行数据寻址。即查询数据存在于什么地方。DNS寻址是一套遍布世界的、成本极高的、设备维护的、基于区块链的分布式存储系统,一改传统方式,采用了分布式哈希表(DHT)的方式进行数据寻址。

数据的安全性:无论在任何情况下,只存储一份备份,对于数据存储的安全是远远不够的,一旦这一份备份出现故障,必然造成数据的丢失。数据存储安全性是不容忽视的问题。基于区块链的分布式存储也必须解决该问题。非常巧合的是,分布式存储天然适合做数据的冗余备份,在数据存储安全性上有着传统的系统无法比拟的优势。

数据一致性:多副本的冗余需要保证多副本的一致性。

系统性能:应对大规模的数据存储和读取需求。分布式系统采用去中心化的方式,分散了系统压力,性能上可以保证互联网应用的需求。举个例子:我们平常使用BT软件进行下载的时候,几乎可以将自己的网络带宽完全利用。基于区块链的分布式存储系统利用BT的特性,数据传输体验与此类似。

案例解析:IPFS+Filecoin 项目

我们通过一个案例来简要介绍一下基于区块链的分布式存储系统。基于区块链的分布式存储项目的研发工作大约起源于2014年至2015年。截止到今天,大约经历了5年左右的时间。其中最有代表性的,当属目前正在开发中的IPFS+Filecoin项目。该系统有两个协议组成:IPFS协议和Filecoin协议。IPFS协议:全称是星际文件系统(InterPlanetary File System),其定义为:一种点对点的超媒体传输协议,类似HTTP协议。Filecoin协议:基于区块链的分布式存储项目。

首先,我们来看这两个协议分别解决的问题和功能定位。IPFS:数据的分发和定位(数据传输协议,类似HTTP协议)。传输:数据在节点之间进行传输。定位:数据寻址,发现数据的存储位置。Filecoin:数据存储(类似一个云存储)。存储空间交易:用户和矿工之间进行存储空间的交易,矿工将自己的存储空间“挂”到  系统上进行出售,用户选购存储空间来存储自己的数据。带宽交易:用户和矿工之间进行数据流量的交易,矿工看见自己存储的数据出售,用户付费下载。区块链网络的维护:矿工通过贡献来维护网络,获取额外的收益。

存储空间交易和带宽交易,统称为价值交换市场。Filecoin通过区块链解决了数据的存储和数据下载的价值交换。

Filecon 系统的工作原理

我们来简单解释一下Filecon系统的工作原理(如图3所示):

1.FileCoin区块链(中间部分):区块链记录了全网络的数据存储位置,同时,记录了一个矿工贡献的存储空间和全网的交易记录。区块链根据矿工的贡献,来为矿工发放相应的报酬。

2.存储市场(上面部分):用户提交自己的数据,矿工接受用户的数据,并且将用户数据存储到自己的存储空間里,同时收到用户所付的费用。

3.检索市场(下面部分):用户提交自己的数据下载需求,矿工接单后发送数据给用户,并且获取用户支付的费用。

放在一起来看,Filecoin区块链作为交易的中介,来完成用户和矿工之间的价值交易。用户获取数据存储和流量服务。矿工获取用户支付的存储和流量费用。同时,矿工贡献了资源维护网络的正常运转,区块链根据矿工的贡献,通过数字货币的形式对矿工进行奖励,这就是 ipfs+Filecoin解决的问题。

我们再来看一下Filecoin经济体系设计和价值交换与流转:经济体系设计是区块链项目里面重要的一环。经济体系设计的健壮性,直接决定了项目是否能长期运行。

Filecoin的经济体系设计为通缩模型,跟比特币类似:具有一定的储存价值。Filecoin 的存储市场和极检索市场近似一个充分竞争的市场经济体系。Filecoin自带有价值市场,代币又具有很强的流通价值。如图4所示,Filecoin 经济体系里面代币的产生和流通模型,与比特币相比较,Filecoin明显在代币的流通上更为复杂。通过检索市场和存储市场流通的代币,也是Filecoin价值市场的直观表现形式。

1.初始代币的分发:Filecoin代币的总量为20亿枚。与比特币系统相同,初始代币的分发通过矿工“挖矿”进行。Filecoin的代币发放为线性发放。

2.用户消费:用户首先从矿工处购买代币,用于支付使用Filecoin系统的存储和流量费用。代币第一次发生流通,从矿工流入到用户,体现Filecoin的代币的流通价值。矿工通过代币的中介作用获取到最终收益。

基于区块链的分布式存储系统,是近些年区块链的技术创新点。目前,国内也涌现出一批类似项目,在探索新的技术解决方案,相信不久后,会有更加优秀的项目诞生。技术最终是用于服务人类的,技术的进步不会停止。

猜你喜欢
存储系统代币矿工
逆流而上的矿工兄弟
The New 49ers
天河超算存储系统在美创佳绩
面向4K/8K的到来 存储该怎么办?
央行等七部门叫停各类代币发行融资
央行等七部门叫停各类代币发行融资
央行等七部门叫停各类代币发行融资
代币“清零”