基于区块链的电力营销数据存储机制

2021-09-06 11:23王凌宇
重庆大学学报 2021年8期
关键词:哈希加密分布式

王凌宇,傅 宏,杨 云,刘 俊

(1. 国网重庆市电力公司客户服务中心,重庆 400000;2. 国网重庆市电力公司,重庆 400014;3. 重庆邮电大学 软件工程学院,重庆 400065)

由于电力系统其本身结构复杂、设备众多,且随着中国工业用电与居民用电需求越来越高从而产生海量的电力数据[1],如何高效且安全地对TB(trillionbyte)甚至PB(petabyte)级别的电力交互数据进行存储成为当前电力企业发展的一个重要问题。

目前电力公司数据管理平台多采用关系型数据库(如Oracle、MySQL等),针对关系型数据库对海量数据的读写性能比较差[2-3],宋亚奇等[4]提出了基于Hadoop和HBase的电力设备采样数据的云存储方案,实现了海量数据存储和快速查询。但是在云存储环境中,当非法用户取得对电子记录的控制权时,云存储的数据容易复制和篡改。同时云存储服务器可能会故意删除电子记录以节省成本,从而对电子记录的所有者造成不可挽回的损害。

针对云存储存在数据丢失、信息安全受限等问题,颜拥等[5]提出将区块链应用到电力行业场景之中,以区块链技术作为电力电子合同安全存储的底层支撑,实现电力行业网中电子合同数据的完整性保存。

普通用户在日常用电的过程中会产生用电数据信息,主要包括用户名称、用户地址、电价电费、用户电量、用户联系信息及受电装置等。这些信息涉及用户的个人隐私,在向企业提供营销数据信息的同时需要对其安全性进行分析。笔者以区块链技术为核心,提出一种基于区块链技术的多级加密电力数据存储机制,相比于传统的电力数据存储方案,该存储机制利用区块链技术解决电力的存储安全问题,同时结合分布式存储技术,解决数据不断增长集中式存储硬件设备容量有限的问题,该存储机制满足分布式数据库的高并发性、高可用性,经过实验证明该存储方案能够满足电力营销数据的安全存储性能的要求和服务可靠性的要求。

1 相关背景知识

区块链是一种分布式数据结构,可以在网络成员之间进行复制和共享。它被引入比特币[6]来解决双重花费问题[7]。区块链是一种基于分布式计算和数据存储的新兴技术,受密码学数字签名和分布式共享机制的组合保护。即使存在网络攻击和通信中断的情况下,区块链系统中的各个节点依旧可以达成区块链网络状态的一致性协议。在区块链系统中有公有链、联盟链和私有链3种类型[8],对比关系如表1所示。

表1 各区块链系统类型对比

区块链技术的核心优势在于其去中心化中达成信息的共识。通常可以将区块链看作一个日志,它的记录被处理成时间戳保存为区块,每个块由其密码散列标识。其中每个块都引用它之前的块的哈希值。这将在块之间建立一个链接,从而创建一个块链或区块链,如图1所示。

图1 区块的链式结构Fig. 1 Blockchain structure

在区块链网络中的任何一个节点都可以访问这条链连接的区块列表存储的数据[9]。这些节点形成一个对等网络(peer to peer, P2P),区块链的交互流程如下:

1)节点之间交互。节点通过私钥/公钥与区块链进行交互[10]。其中私钥来进行自己的交易,并且可以通过公钥在网络上寻址。区块链中使用非对称加密技术将信息认证,数据完整性和不可否认性带入到区块链网络。

2)交易验证。区块链网络中的对等节点对交易进行验证,确保这个进入区块链中的交易有效,然后再进一步转发,进行全网的同步,无效的交易会被丢弃。

3)挖矿。挖矿是指在约定的时间间隔内,由网络使用上述流程收集和验证的事务,且将各事务进行排序并打包成一个时间戳成为候选块的过程。

4)事务验证。当节点验证的交易包含事务的有效性,即当前的散列引用其链上的前一个区块的散列值时,他们会将区块添加到其链中,否则丢弃该候选的区块。

区块链应用程序为各种场景提供了应用程序接口(API)。用户通过这些API与他们直接交互,而不必担心底层的技术细节。通常在区块链应用中把它作为一个附加的数据库,由对等网络节点维护[11]。在区块链系统中,任何节点都可以签署和发布事务,如果它们被验证通过则加入到新的区块中。区块链系统中的节点将随时检查其分散网络中的其他节点,每个节点都可以加入协商过程,将新的区块扩展到区块链中。区块链中数据具有防篡改特性,在新区块生成过程中需要其他节点的验证,因此在全局账本中记录的所有有效的区块和交易实际上都是不可变的。此外,整个全局账本在区块链节点之间按照协商一致的机制进行同步[12],使区块链上存储的数据真实性和准确性有了更大的保障。

2 区块链系统的数据存储技术

区块链中的每个区块包含区块头和区块体两个部分[13]。区块头主要用于构成区块的链式结构,主要有前一个区块哈希值(prev hash)、时间戳(timestamp)、随机数(nonce)和交易的根哈希(root hash)组成,其中目标区块的哈希值由前一个区块的哈希值和随机数生成,根哈希用于验证交易的真实性使得交易不可伪造[13]。区块中的区块体部分主要存储交易数据,交易数据的结构由区块链系统支持的功能所决定。

2.1 区块链的主要数据结构

区块链是基于交易的系统[8],在区块链系统中存在大量的交易数据,这些交易数据存储结构为Merkle树。Merkle树的数据结构可以是二叉树也可以是n叉树,在比特币中使用的是二叉树结构[14],如图2所示。Merkle树需要大量数据,将其压缩为一个简单的字符串,可以证明Merkle 树所保存数据的真实性,而无须透露原始数据[15]。Merkle树采用自底向上方式构建,在区块链中叶节点为基础交易数据,每个中间节点是它的子节点的哈希,根节点是根哈希。在Merkle树结构中如果根据某种标准正确命名,则用户可以识别内容,而无须解压缩并打开包含的文件。不同的区块链系统在数据存储结构上有所不同,主要在根哈希结构、根哈希数量和存储编码等方面,典型的区块链存储结构对比如表2所示。

图2 Merkle树Fig. 2 Merkle tree

表2 典型区块链存储结构对比

2.2 区块链的数据存储方式

当前主流的区块链系统对区块头采用数据文件方式进行存储,对区块体及元数据主要使用Key-Value的形式进行数据存储。区块链系统的数据库主要基于Key-Value的LevelDB 数据库,以此为代表的主要为以太坊和比特币,而超级账本Fabric的数据可以在转换成Json格式后选择存储在LevelDB或CouchDB之中。其他基于区块链的存储系统,如Storj、Filecoin、BigchainDB 等系统也均采用了LevelDB或MongoDB等基于键值模型的数据库系统存储元数据信息[16]。

区块链系统中,不仅要存储区块头和区块体的数据,还需要根据功能设计管理状态数据、索引数据和元信息等数据,因此在数据组织方式上也具有较大的差异,主要的区块链系统存储组织对比如表3所示。

表3 典型区块链系统存储对比

3 基于区块链的多级加密电力数据存储机制

3.1 基于区块链的电力营销数据存储架构

将区块链应用到电力行业电力营销数据存储的场景之中,提出基于区块链技术的电力营销数据存储模型,该模型具有2个数据库,其中1个为分布式存储数据库和联盟区块链,分布式存储数据库为区块链提供存储服务,区块链为分布式存储数据库提供系统安全支撑,存储架构如图3所示。

图3 基于区块链的电力营销数据的分布式存储架构Fig. 3 Distributed storage architecture of power marketing data based on blockchain

基于区块链的多级加密电力数据存储主要包括电力营销数据的分布式存储服务和电力营销数据的多级加密服务两部分。其中基于区块链的电力数据分布式存储主要包括以下流程,首先智能电网设备或用户向本存储系统发出存储资源节点的请求,然后由本系统中的分布式存储节点提供存储服务,在存储服务完成后需要在区块链上登记存储记录,最后由智能电网设备或用户评价存储服务。

第1步,智能电网设备或用户向基于区块链的多级加密电力数据存储系统发送存储请求,需要在分布式存储节点中选择某个在线的存储节点作为存储服务的对象。在基于区块链的电力营销数据存储系统中设定一旦终端发送请求,在60 s内不能再选择其他存储节点发送存储请求,且收到存储节点的确认后,直接传送存储数据。

第2步,当在线存储节点收到存储请求时需要为请求节点提供存储服务,且按请求节点请求时间的先后顺序回复节点。当智能电网设备或者用户收到存储节点的确认消息后,即向存储节点传输电力数据。

第3步,存储记录信息上链,在存储节点完成响应请求的存储服务之后,存储节点将存储记录信息传输到区块链上。最后由智能电网设备或用户评价此次存储服务,评价信息作为存储节点的信用分,可根据该信用分评判该存储节点的存储性能。

3.2 电力营销数据的保密机制

在基于区块链的电力营销数据存储机制中提出一种基于数据分割的多级加密机制以保护电力营销数据的安全性和隐私性。使用多级加密机制与分布式存储相结合可以很好地解决数据分割的使用场景,可有效提高系统效率,该多级加密机制支持电力数据上链、电力数据传输、智能合约调用等流程的逐级加密及验证,多级加密机制流程如图4所示。

图4 多级加密机制Fig. 4 Multi-level encryption mechanism

在本文中所提出的多级加密机制主要由以下组成:身份认证模块、数据加密上链模块、上链数据哈希提取模块、加密通信模块。在身份认证模块中使用RSA算法生成公私钥,公钥可对用户电力营销数据加密,用作数据隐私保护,私钥用作智能电网设备或用户签名。为了提高系统效率同时减少密钥管理难度采用密钥长度为128 bit RSA加密算法,具体算法流程如图5所示。

RSA加密算法密钥生成:选择两个质数p和q计算p和q的乘积n=p×q计算n的欧拉函数φ(n)=(p-1)(q-1)随机选择一个整数e,满足1< e < φ(n),且e与φ(n)互为质数计算e对于φ(n)的模反元素d将n和e封装成公钥,n和d封装成私钥加密利用公钥(n,e)对明文M进行加密:c=Memod n解密利用私钥(n,d)对密文进行解密:M=Cdmod n

数据加密模块采用密钥长度为192 bit的非对称加密算法AES完成数据加密,从而实现电力营销数据的安全存储机制。AES加密密钥由智能电力设备或用户口令通过Hash方式生成。在数据解密时,必须获取密文对应的密钥来对密文进行解密。上链数据哈希提取模块主要采用当前主流的Hash函数SHA-2/SHA-3,哈希算法将任意长度的二进制值映射为固定长度的二进制值,Hash函数已经广泛应用对当前生活的各个领域。在通信过程中使用TLS协议栈防止恶意用户非法截取通信数据。

3.3 实验仿真

使用传统集中式存储机制与提出的基于区块链的多级加密分布式存储机制延迟情况对比如图6所示,图6(a)为延迟与接入设备数量之间的关系,图6(b)为延迟与存储服务数量之间的关系。由图可知,当随着连接的设备数量与存储服务数量增加时,存储的延迟会增加,但是所提出的基于区块链的多级加密分布式存储机制延迟情况均要优于传统的集中式存储。

图6 两种存储机制的延迟对比Fig. 6 Delay comparison of two storage mechanisms

存储系统的吞吐量为单位时间内存储信息的量,是衡量存储系统的性能标准之一,将传统的集中式存储机制与基于区块链的存储机制进行对比,使用电力营销数据作为存储服务,结果如图7所示。与传统的存储机制相比,所提出的存储方案具有较高的吞吐量,实现了存储效率的改进。图8为文件大小与系统响应时间的对比,结果表明,在小文件存储过程中响应速率相差不大,但是在大文件存储时所提出的存储方案具有更快的响应速度,满足电力大数据的存储效率需求。

图7 系统吞吐量变化对比Fig. 7 Comparison of system throughput changes

图8 响应时间与文件大小关系对比Fig. 8 Comparison of response time and file size

4 数据安全性分析

目前针对数据的安全防护技术有加密和脱敏2种方法,数据加密是通过使用加密算法对原始数据进行加密,以密文的形式进行数据存储,适用于数据安全存储,而数据脱敏是通过使用脱敏算法对原始数据信息进行变形,适用于数据安全保护。通过使用AES与RSA加密算法对原始的电力营销数据进行加密,使数据以密文的形式进行传输与存储,更有效地对电力营销数据进行保护。

实验表明所提出的基于区块链的多级加密电力营销数据存储机制能够提供存储稳定性高、更安全、可靠的存储性能,但是在该系统中由于采用分布式数据库存储电力营销数据,需要考虑数据完整性。数据完整性是指存储提供方严格按照用户的要求存储数据,存储的文件不能丢失,使用时用户的文件没有被伪造或篡改的情况发生[17]。这里通过采用抽样的策略对存储在分布式数据库中的数据文件进行完整性分析。通常数据完整性证明有Setup和Challenge两个阶段,具体流程如下。

Setup阶段:

1)随机选取一个范德蒙矩阵A作为散布矩阵,经过一系列初等变化后,A=[I/P],生成挑战密钥kchal和置换密钥KPRP。

2)生成编码文件

G=F·A={G1,…,Gm,Gm+1,…,Gn},

(1)

制动屏在机车正常操作时,实时显示了均衡风缸、制动管、总风缸和制动缸的压力值,也实时显示制动管充风流量和空气制动模式的当前状况。如图2所示。

3)生成验证元数据:为每个服务器j∈[1,2,…,n],预选生成t个验证元数据,每个标签i由式(2)计算得来:

(2)

Challenge阶段:

3)接收到响应集合后,去除冗余信息的屏蔽值

(3)

根据本地存储的和P,判断式(4)是否成立:

(4)

如果等式成立则文件是完整未损坏的。

4)不成立,继续比较

如果仍不相等表明服务器j上的文件已损坏。

5 结 语

针对传统的集中式数据存储模式无法满足电力业务数据存储所要求的安全性、低延迟和扩展性问题,提出了一种基于区块链的多级加密电力数据存储架构。该存储机制具有存储稳定性高、安全可靠、数据可追溯、可审计及可扩展等诸多优势,同时提出的多级加密机制支持电力数据上链、电力数据传输等流程的逐级加密及验证,使得电力数据存储与数据访问的安全性得到进一步的保证。通过实验证明,相比于传统的集中式电力数据存储机制,所提出的电力数据存储机制延迟更低,吞吐量更高和响应时间更低能够满足电力营销数据存储的稳定性和安全性要求。

猜你喜欢
哈希加密分布式
文件哈希值处理一条龙
一种基于熵的混沌加密小波变换水印算法
分布式光伏热钱汹涌
分布式光伏:爆发还是徘徊
基于OpenCV与均值哈希算法的人脸相似识别系统
认证加密的研究进展
基于DDS的分布式三维协同仿真研究
基于ECC加密的电子商务系统
基于格的公钥加密与证书基加密
西门子 分布式I/O Simatic ET 200AL