基于区块链的数据交换激励机制研究

2024-03-14 08:37孙雨虹张玉健
网络安全与数据管理 2024年2期
关键词:提供数据请求者贡献度

孙雨虹,张玉健,赵 越,丁 鲲

(1. 东南大学 网络空间安全学院,江苏 南京 211189;2. 国防科技大学 第六十三研究所,江苏 南京 211189;3. 国防科技大学 大数据与决策实验室,湖南 长沙 410073)

0 引言

随着信息技术的飞速发展,数字化转型已经成为各类企业、组织、机构等的关注焦点。数据的收集与分析,有助于有关部门更好地实现数据驱动的决策和业务模式创新。同时,数字化转型也在不断融合各种新兴技术,如区块链、人工智能、虚拟现实等。根据数据要素的特殊属性,要求加强数据资源的开放共享,数据越多价值越大,越分享价值越大,越跨行业、跨区域价值越大[1]。不同部门之间通过信息的交换与合作,能够更顺利实现资源的优化配置和效率提升。然而数字化转型为社会和经济带来的广泛影响,也包括新的数据安全挑战,有关部门将面临各种风险与责任,因此,有必要建立健全完整的数据交换体系,促进数据的流通,推动数字化转型的健康发展,实现经济社会的可持续发展。

本文简要介绍了数据交换相关背景知识以及研究意义,阐述了现有激励机制的研究现状及存在问题;提出并搭建了数据交换激励机制框架,并详细说明了该激励机制的计算方法,这是一种综合历史贡献与当前贡献两个维度计算制定激励的计算方法;最后分析了本方案对比其他方案的优势,并通过实验证明本方案的优越性。

1 数据交换

1.1 数据交换平台

数据交换平台是实现信息资源共享的基础性平台。数据交换平台的建立,有助于打破信息孤岛,甚至可以实现交换双方间跨局域网、跨系统、跨数据库、跨平台的数据共享,实现信息资源的合理使用,整合、优化各业务部门的服务[2]。

传统的数据交换方式分为集中式和点对点式。前者主要依靠高级别管理机构对数据进行统一收集、存储、处理和发放,该方式虽能够构建起数据全局视角,但集中的交换决策存在管理机构效能瓶颈的问题,且有单点故障的风险,不利于数据快速流通和个性化应用[3];后者不以统一的可信机构为桥梁,由数据提供者和数据使用者之间进行直接交互,但通常需要经由上级部门之间协商以明确数据使用的权责关系,故而审批流程复杂,不利于常态化、规模化的数据交换[4]。

区块链因其具有去中心化、匿名性、不可篡改性等特点,使它成为了一种具有革命性的分布式账本技术,并在金融、物流、医疗、政府等领域得到了广泛的应用。用区块链建立数据交互平台,由区块链充当账本记录每一次的交易行为,所有用户都可以共同维护,使交换过程更加透明,有效避免了中心化机构的潜在风险。而进一步将区块链技术与密码学技术相结合,则可以同时保证账本数据的可靠性和不可篡改性,以达到系统内用户可以安全共享数据而不必担心数据被篡改或泄露的目的。此外,区块链可以用于建立可编程的智能合约,让数据交互的条件和规则可以被预先设定和执行,从而实现自动化的数据交互,大大保证了交互的正确性和高效性[5]。

1.2 激励机制

人们天生具有保护自我利益的本能,在竞争激烈的社会环境中,分享自己拥有的资源时,人们会出于对自身利益的顾虑而有所迟疑。在数据拥有者提供数据时,他们首先会考虑交换行为的安全性,这是大多现有工作的着力点;而在解决了安全问题之后,由于人们普遍本能地认为共享会削弱他们之间的竞争力,因而更愿意保持自己的优势从而拒绝交换,只有当进行这一行为带给他们的利益大于风险,或不进行这项行为带给他们的风险大于利益时,用户才愿意进行这项行为。

传统激励机制通常依赖可信第三方机构作为中介,然而在实际应用场景中,使用第三方作为数据交换的信任组织增加了数据不透明、不公开和易遭受攻击的可能性。

区块链为激励机制在不依赖第三方机构的情况下实现对任务方的激励提供了有效的解决方案。在区块链体系结构中设计一定的发行机制与分配机制,以鼓励节点参与区块链验证与共识,这些机制构成了区块链基础架构中的激励层,近几年基于区块链的激励机制在物联网领域得到了广泛应用[6]。然而在数据交换过程中,缺少与大量用户交换数据的动态激励机制[7]。为了使数据交换体系平稳运行以提高效率、促进决策和执行,须让系统中的所有用户在合法合规的情况下自愿提供数据,为此必须设立相应的激励手段刺激用户作出正向行为。

2 研究现状

近年来,基于区块链的数据交换系统大多致力于实现数据请求者访问的可靠性、确保数据的完整性等,也有使数据提供者可以从中获得诸如声誉值、比特币一类的回报的激励机制。

Shrestha等人[8]提出了一个基于区块链的数据收集模型,数据所有者不仅将享有更高的透明度和更强的数据安全性,而且还将通过数字代币激励他们与感兴趣的数据请求者共享数据。该工作的使用激励方式较为笼统,没有针对具体的共享资产提出更有吸引力的激励措施。Zou等人[9]提出了一个基于区块链的医疗数据共享和隐私保护电子健康系统SPChain,其中构建了声誉体系以激励医疗机构参与SPChain。医疗机构通过积累声誉分数以请求患者的电子病历,该激励机制站在数据请求者的角度规范其行为,且为一种考虑历史表现的激励机制。针对提高数据提供者参与度的问题,Xuan等人[10]对大数据时代的数据交换进行了进化博弈均衡分析,设计了一种自适应智能合约的进化博弈理论的数据交换激励模型,可以动态控制激励参数,不断鼓励用户参与数据交换。文章考虑了动态因素以调整激励参数和参与成本来保持用户的参与水平,但是缺乏对用户交换的数据大小和数据质量带来的影响的考虑。物联网场景下,Si等人[11]提出了基于区块链技术的轻量级物联网信息交换安全框架,该框架在保证数据安全和用户隐私的同时,提出了一种节点协作的动态博弈方法,通过报告节点的声誉值来估计未知节点的状态,高信任参考报告用于校正恶意节点在整体报告和节点合并中的权重,最终达到贝叶斯均衡。该方法从第三者视角构建声誉体系,可以在一定程度上发现恶意节点,但是参考系较为片面。车联网场景下,Cui等人[12]设计了一种基于信任分数模型的增强的委托权益证明共识算法,确保了数据交换过程的安全性和隐私性,同时激励数据提供者可以将数据索引上传到区块链以赚取加密货币(车辆币)。文章通过保证数据隐私安全和设定激励机制鼓励车辆提供数据,但激励机制只从正向奖励的角度去设计,并没有考虑惩罚措施。智能电网场景下,Reijsbergen等人[13]提出一种激励机制来奖励上传数据的运营商,但规定如果数据丢失或异常则会对他们进行惩罚。文章提出的解决方案在单个操作员由于缺乏冗余而无法检测到攻击的情况下提供安全性,然而效率方面存在优化空间。针对多云中数据共享的真实性需求,Shen等人[14]设计了一种基于区块链的利用Shapley值的方案。Shapley值是合作博弈论中用于衡量合作博弈中各个参与者对合作所创造的价值的贡献程度的一个概念,使用该方法进行激励只考虑了个体当前维度的贡献情况。

综上所述,有必要设计一种鼓励数据用户进行数据交换行为、有效提高用户交换意愿的用户激励机制,通过分析系统内用户的行为动机,针对用户的共享行为给予奖励,反之对长期不提供数据的用户给予相应惩罚,奖惩并施以维护共享系统的良性运行。

3 数据交换激励机制设计

3.1 体系架构

激励机制是保证数据共享平台可持续发展的重要保障。基于历史贡献的激励机制通过考量个体在过往历史中所作出的行为来评估其现阶段所能获得的报酬,这种激励机制促使个体长期重视自己的行为;基于当前贡献的激励机制则注重某次行为中个体所作出的贡献,其对本次行为的影响决定自身能获得的报酬,是一种公平划分报酬的有效方法。在针对贡献值设立相关共享规则的基础上,通过将历史贡献因素与当前贡献因素相结合进行综合考量以分配贡献值,既可以维护系统的公平性,又可以起到长期激励用户的作用。本方案构建的数据激励系统如图1所示。

图1 系统架构

系统中设立的角色包括:

(1)用户。所有通过认证加入到系统中的用户既可以是数据拥有者也可以是数据请求者。当一个用户发起数据交换请求时,视为数据请求者;当一个用户为数据请求者提供数据时,视为数据提供者。

(2)区块链。区块链充当公共账本,嵌入其中的智能合约帮助用户间进行自主化的数据交换活动。

用户通过区块链发布数据交换请求,符合条件的用户将对请求作出响应,达成一致意见的双方间进行数据交换,交易伴随着贡献值的转移,智能合约将定期查询用户的贡献值,依照奖惩机制对用户的行为进行反馈。

3.2 初始化

每位用户维护一个反映自身贡献度的指标——贡献值,以及一个反映自身诚实度的指标——作恶次数[15],初始化时系统为每位用户分配相同的贡献值,作恶次数归零。此外,初始化时将为系统设定阈值[16]、优秀值、贡献度影响比值、单位数据价值(详见第4.1节)四个公共参数。当用户的贡献值小于系统设定的阈值时,该用户将被加入低贡献度名单,名单内的用户在下次核查贡献值大于等于阈值前将不能发起数据请求,即只可以通过提供数据获得贡献值;当贡献值大于优秀值时,该用户将被加入高贡献度名单,每当用户被加入该名单时,将触发智能合约为其分发一定的贡献值作为奖励。贡献度影响比值则代表在每次数据交换中数据提供者能得到贡献值受自身贡献值的影响大小。另外,在区块链账本上维护一个低贡献度名单和高贡献度名单,智能合约将被设置为定期调用检查系统内所有用户的贡献值,每次检查后生成新的高、低贡献度名单并更新记录上链。

3.3 数据交换流程

(1)数据请求者发出数据请求。数据请求者将自己需要的数据发布上链,广播给系统内所有用户。

(2)数据提供者作出响应。有意向进行数据交换的用户,给出拥有该数据的相关证明,对请求作出响应。

(3)计算贡献值。从历史贡献维度和当前贡献维度分别计算,最终由历史贡献值和当前贡献值得到最终贡献值。数据请求者根据收到的有效响应数公布实际提供该数据的用户数量,数据提供者据此调用区块链上的智能合约计算贡献值,其算法如算法1所示。用户输入所请求的数据列表,智能合约根据记录在公共账本上的数据拥有情况计算出数据的价值,再根据用户当前的贡献值计算出历史贡献值,根据实际提供数据的用户数计算出当前贡献值,最后将两者结合得到最终贡献值(计算公式详见第4节)。

(4)双方进行交易。数据请求者将贡献值上传至区块链,规定只有达到指定条件才可取走;数据提供者将数据上传至区块链,获得取走贡献值的要素。

4 数据交换激励机制计算

贡献值的转移发生在一次数据交换中,个体请求成功得到数据将消耗自己的贡献值,相反成功提供数据将得到相应的贡献值。

4.1 数据价值

数据的价值依照数据的稀有度而定[17]。例如,若当前系统内共有n名用户,其中拥有数据A的用户有a名,则数据A的价值为vn/a;拥有数据B的用户有b名,则数据B的价值为vn/b。一个用户i提供的数据m总价值为:

(1)

4.2 历史贡献值

历史贡献情况是影响数据提供者得到贡献值的因素之一。历史贡献值反映的是用户的过往表现情况,它类似于一些基于区块链的激励机制中考虑到的声誉值[18]因素。本方案设定,若一个用户提供的数据价值远大于请求的数据价值,则该用户的贡献值将高于大部分很少提供数据的用户,那么该用户在之后的提供数据活动中也将有更大的优势获得更多的贡献值;反之,若一个用户长时间不提供有价值的数据,甚至频繁请求数据,那么该用户在之后的活动中若想要提供数据获得大量贡献值将变得困难。具体来说,本方案考虑历史贡献值的计算公式为:

(2)

如果用户被指认出存在不诚实行为,则作恶次数为mn+1(不诚实行为包括提供虚假数据等,具体判定不在本文讨论范围内)。

4.3 当前贡献值

影响数据提供者得到贡献值的另一个因素是实际贡献情况。数据提供者i若确定提供数据,其就本次共享作出的贡献而言,可获得的贡献值可表示为:

(3)

其中,p是实际提供数据的用户人数,k是拥有该数据的用户人数;t为截止时间,tc为数据拥有者提供数据的当前时间(tc≥t),即越早提供数据获得的贡献值越多。对上式求导,可知结果始终≥0,因此无论其他用户是否选择提供数据,自身提供的数据越多,所获得的贡献值越多。

4.4 最终贡献值

综上所述,当数据提供者提供某类数据时,一方面根据提供者的历史行为,另一方面根据其提供的数据相应的价值,其最终可获得的贡献值为:

fvi=[hvi×s+cvi×(1-s)]1/(mn+1)

(4)

其中s为贡献度影响比值,可以根据实际需要进行调整。

5 评估分析

5.1 安全性分析

5.1.1 不诚实的数据提供者

在计算贡献值时,除了按一定的比率综合考虑历史贡献情况和当前贡献情况外,还将考虑作恶次数。从式(4)中可知,用户一旦被记录有作恶次数,其贡献值的计算将大幅减少,且该影响是永久性的。

5.1.2 恶意用户合谋

在计算贡献值时,所有用户的当前贡献值与所拥有的数据情况都是记录在区块链上的,每位用户可获得的贡献值单独公开调用智能合约计算得到。激励机制的公平性由公共账本区块链保证,恶意用户不能通过合作谋取更大利益。

5.2 影响因素评估

本方案提出的数据交换激励机制能够在不借助可信第三方的前提下,自主完成对积极提供数据的用户的奖赏以及对消极用户的惩罚。本方案与其他方案所提出的激励机制的考虑维度比较如表1所示。

表1 激励机制比较

文献[10]中提出的激励机制考虑了动态激励用户,依据用户的过往行为给予奖励,但是没有涉及实时贡献,也没有设立惩罚机制;文献[11]中提出的激励机制只考虑了当前贡献因素,激励效果欠佳;文献[12]设立了惩罚机制,但是也只从当前贡献的维度进行奖励;而本方案提出的激励机制,既从历史贡献维度出发,又考虑了当前用户作出的贡献,将二者动态结合,奖惩并施,起到全方面激励用户积极提供数据的作用。

5.3 实验评估

5.3.1 实验环境

本文使用Python3.8.5进行仿真实验。设定系统内用户人数为10人,初始贡献值为100,数据单位价值为2。

5.3.2 历史贡献度对贡献值的影响

设定用户的作恶次数为0,截止时间为1 000 s,提交时间为500 s,完成10次相同的任务,对比只考虑当前贡献与考虑历史贡献分别占比30%、50%、70%情况下用户获得的贡献值奖励的差异。实验结果如图2所示。

图2 历史贡献度对贡献值的影响

从实验结果可知,若只考虑当前贡献,对于同样的任务,诚实的数据提供者可以获得的贡献值保持不变;而若考虑过往表现情况,对于同样的任务保持积极行为的数据提供者能够获得的贡献值逐步增多,其中历史贡献度占比越高用户的积极行为越具有优势。该实验结果表明,长久保持积极行为对用户自身利益有利,因而可以起到长期激励用户的作用。

5.3.3 提交时间对贡献值的影响

设定用户的作恶次数为0,截止时间为1 000 s,贡献度影响比值为50%,对比提交时间对用户获得的贡献值奖励的差异。实验结果如图3所示。

图3 提交时间对贡献值的影响

从实验结果可知,对任务作出响应的时间越长,获得的贡献值越少,总体呈抛物线性减少。该实验结果表明,积极的提交行为能为用户带来更多利益,从而促进交易的快速完成,不仅对数据提供者有利,也对数据请求者有利,能够使数据交换系统整体良性运作。

5.3.4 作恶次数对贡献值的影响

设定截止时间为1 000 s,提交时间为500 s,完成10次相同的任务,贡献度影响比值为50%,对比作恶次数分别为0(诚实用户)、1、2情况下用户获得的贡献值奖励的差异。实验结果如图4所示。

图4 作恶次数对贡献值的影响

从实验结果可知,一旦有过一次恶意行为,用户所能获得的贡献值将大幅降低,即使在后续的交易中持续保持正向行为,也无法再恢复到诚实用户所能获得的贡献值水平。该实验结果表明,恶意行为将为用户带来不可挽回的利益损失,且该负面影响是永久的,可以有效约束用户的行为。

6 结论

本文针对数据交换中的用户积极性问题,搭建了基于区块链的数据交换激励框架,从过往表现和当下表现两个维度制定激励机制。本方案所考虑的激励机制不仅包括基于历史贡献与当前贡献的激励措施,也包括对不积极行为的惩罚措施,对比其他方案考虑的因素更加全面。实验结果表明,该方案可以有效约束用户的行为,达到长期激励用户作出正向行为的激励效果。

此外,本方案所设定的低贡献度名单和高贡献度名单,计划在后续的完善工作中,设立针对如记录上名单次数等因素的奖惩措施,以区别于每次任务实时检查贡献值是否满足要求的方法,强调过往行为的影响。

猜你喜欢
提供数据请求者贡献度
基于D2D 多播通信的合作内容下载机制
群智感知中基于云辅助的隐私信息保护机制
充分把握教育对经济社会发展的贡献度
基于贡献度排序的肾透明细胞癌串扰通路分析
药品领域专利如何提供数据的探讨
汉语自然会话中请求行为的序列结构
中国“天链”组网全球
基于差值诱导的Web服务评价可信度的评估
需求侧资源促进可再生能源消纳贡献度综合评价体系
中国对外贸易对经济增长贡献度探索——基于VAR模型的分析