基于区块链的数字教育资源安全共享研究

2022-08-12 08:53黄章菡
贺州学院学报 2022年2期
关键词:账本指纹合约

黄章菡,刘 鹏

(1.桂林航天工业学院 传媒与艺术设计学院,广西 桂林 541004;2.广西师范大学 计算机科学与工程学院,广西 桂林 541006)

互联网技术推动了在线教育的发展。2018 年教育部制定了《教育信息化2.0 行动计划》,2019 年中共中央国务院印发了《中国教育现代化2035》,2020 年教育部公布了《高等学校区块链技术创新行动计划》。上述文件的出台表明,国家鼓励并提倡区块链与教育融合发展,教育与信息技术的有机融合已经成为国家发展战略。近年来,在这一国家战略和社会需求的推动下,信息技术在教育领域广泛应用,产生了海量的教育大数据资源,包括在教育活动过程中产生的以及根据应用需要采集的数据,也包括具有教育价值的其他数据集。教育大数据与教育主流业务的深度融合,将持续推动教育系统的智能化变革,驱动教育管理科学化、教学模式改革、个性化学习、教育评价体系重构和教育服务个性化。2020 年在线教育得到迅猛发展,开发了大量在线教育平台,智慧教育由此得到前所未有的关注和扩展。目前的国内主要在线教育平台有“中国大学MOOC”“网易云课堂”和“腾讯课堂”等,国外的主要平台有“Coursera”“edX”和“Udacity”等。线上教育已经成为获取知识的重要途径,越来越多的学生通过互联网学习知识。教案、讲义、教学视频等数字化教育资源是在线教育的关键数据,也是高校和教育机构的重要资产。对于这些数字教育资源的共享,各方都持有谨慎的态度,因此需要可信的数据资源共享和确权技术解决共享过程中的再次分发等问题,以打消所有者的顾虑,实现上述重要数据的共享。这将促进数字教育资源的有效利用,保护学校教育机构的权益,提高创新积极性,促进教育信息化的发展,实现多方共赢。

一、基于区块链的数字教育资源安全共享研究现状

在互联网发展的过程中,数据安全共享是信息时代的重要研究课题。在基于区块链的数字教育资源共享研究上,目前的工作主要围绕访问控制及安全存储两个方面进行,例如熊碧林等人提出了针对数字教育资源的细粒度访问控制方案,将模型分为交互层、服务层与数据层,在多场景下利用智能合约实现了共享信息的可信存证[1]2-3。但是对于数字教育资源来说,更重要的是共享过程中确认资源的拥有权问题。全立新等人利用双链架构研究了数字教育资源结合区块链进行安全流通问题,并利用主链和侧链协同实现了数据的共享与查询,利用智能合约和账本技术对共享信息进行可信存证,使用对称加密技术保证了账本信息的安全[2]4。李新等人利用分布式共享技术构建了一种能够实现公开和自我管理和增长的数字教育资源流通方案,利用智能合约实现了智能化的管理模型,最大限度地实现了区块链上共享模型的效用性[3]5。靳瑞霞等人对区块链技术以及如何将数字教育资源共享工作应用做了详细的描述,对模型的构建以及应用给出了分析[4]1-2。胡晨阳等人[5]2以及熊碧林等人[1]1分别就数字教育资源结合区块链技术在访问控制领域进行了研究,使用属性加密或是智能合约实现了安全的访问控制模型,并针对数字教育资源的特点设计了相应的系统。丁宝根等人就当前数字教育资源发展过程中遇到的问题进行了分析,并得出区块链对促进教育资源共享以提升教育信息化水平有积极影响的结论,进一步说明了结合区块链进行教育资源共享工作的意义和可行性[6]6。Guo 等人针对教育场景提出了在线教育结合区块链技术的框架,不仅将多媒体资源共享考虑其中,也考虑了信用学分的机制,使用区块链的PoW(Proof of Work,工作量证明)共识保证了共享信息的可追溯性,也利用这一机制实现了版权保护目的[7]6。Li 等人针对数字教育资源结合区块链技术设计了交易框架,使用基于Tardos 抗合谋攻击码实现了确权模型,在交易过程中将数据分块并使用秘密共享以及零知识证明技术实现了安全和公平的交易机制[8]1-6。

综上所述,目前研究者已经注意到区块链技术在数字教育资源共享和隐私保护中的潜在价值,并开展了使用区块链技术解决数据共享中的隐私和安全问题等方面的研究,但目前针对数字教育资源共享过程中的确权问题研究较少,已有工作是利用区块链进行版权信息的可信存证,但对于确权问题来说重要的是能够确定权益的归属,仅仅使用区块链技术进行存证依然存在抵赖或陷害风险,基于区块链的数字教育资源安全共享模型的构建,能够使共享过程中的确权工作更为透明,并提供不可篡改的安全保障。

二、基于区块链的数字教育资源安全共享模型分析

基于区块链的数字教育资源安全共享模型主要从可行性、具体实现以及安全性保障三个方面进行分析。

(一)基于区块链技术的数字教育资源安全共享模型的可行性

基于区块链技术构建的数字教育资源安全共享模型能够有效促进资源共享,教育机构或是教师,通过高效安全的资源共享模型获得一定的收益并且能够更放心地将自己的资源进行共享,有助于打破数字教育资源孤岛现象。对于学习请求者来说,无论是有偿还是免费的资源共享形式,都能够提升请求者的学习积极性,从而最大化地发挥数字教育资源的效用。

区块链技术已相对成熟,能够结合人们较为熟悉的互联网交互方式与用户进行交互,例如通过网站或App 的形式,通过SDK+API(软件开发工具包+应用程序编程接口)形式对账本数据进行读取,需要设计读取的访问控制权限管理,防止非法用户读取账本内容导致信息泄露。结合互联网常用方式的交互,能够让参与者以最快速度了解模型的使用,吸引更多的参与者加入平台的使用,有效地促进教育信息化的发展。

(二)基于区块链技术的数字教育资源安全共享模型的实现

在理论上,无论是区块链、数字指纹、数字水印还是密码学技术,都已经经历了数十年的发展并不断改进提高,理论上具有可行性,模型的实现基于这些成熟的理论并将其转化为计算机可编程语言进行交互,能够在模型架构确立之后进行快速搭建。

在技术上,目前智能合约已支持较多图灵完备的编程语言,可以在不同语言之间相互调用进行交互;目前的智能合约框架也较为成熟,开发者只需要了解基本的网络架构知识以及编程语言基础即可对区块链智能合约进行编程,对于基于区块链技术的数字教育资源安全共享模型的实现,最关键的是智能合约的实现和调用,无论是在公有链或是联盟链架构,开发者只需要了解不同的架构模式之间的差别(如提交交易打包的区别),即可实现整个安全共享模型。开发者在实现模型的过程中,能够通过异步调用的方式对智能合约进行调用,通过SDK+API 的形式对账本数据进行读取,总的来说,目前区块链的各类架构都能够快速调用和开发,安全共享模型的实现过程并不存在较多的难点,数字指纹和数字水印技术也有较多的成熟框架进行嵌入和提取的操作。

(三)基于区块链技术的数字教育资源安全共享模型的安全性保障

无论是区块链技术还是密码学技术,都能够对安全共享模型进行安全性保障,在基于区块链技术的数字教育资源安全共享模型中,将确权问题纳入安全性考虑中,RSA 技术在数据传输和数字签名的使用中都能够保障资源共享过程中的安全性。除此之外,由于区块链架构的特殊性,区块链网络底层技术中已含有多种密码学技术进行安全性保障,但随之而来的问题是国外密码学技术的安全性问题,针对国内环境研究的数字教育资源安全共享不可避免地涉及一些敏感的教育资源,针对国家密码技术改造的区块链底层架构迫在眉睫,针对联盟链的国密改造技术已较为成熟,能够通过直接修改证书认证中心以及节点的关键代码进行替换,在替换之后重新部署网络并通过自适应日志对改造情况进行展示。

总的来说,基于区块链技术的数字教育资源安全共享模型无论从可行性、实现难度还是安全性上都具有较强的基础,目前所拥有的理论以及技术基础已经成熟,通过国密改造的区块链网络能够有效适应国内对于教育资源共享的安全要求。

三、基于区块链的数字教育资源安全共享模型构建

(一)区块链技术概念

区块链技术自2008 年诞生以来,已经历了14年的发展,现今区块链技术的应用已不局限于记账,其去中心化、可溯源、防篡改的技术特点能为数据共享提供安全和隐私保护。区块链本质上是可信账本,由不同区块(Block)形成链式(Chain)结构,其中区块内部结构以默克尔树为主要数据结构,如图1 所示,默克尔树由不同哈希向上生成默克尔树根(Merkle Tree Root)结构。在区块链技术中,区块的生成是其中关键技术之一,区块与区块之间通过哈希指针相互连接和绑定,并且在每一个区块内存储交易信息,这些交易信息相互关联,联系紧密。

图1 默克尔树结构

1.分布式账本

分布式账本技术是区块链技术的核心,对于数字教育资源安全共享工作而言,利用账本技术能够对数字教育资源确权信息进行可信存证,从而提供可信拥有证明。共享信息一旦记录到区块链中的分布式账本,将永久保存并不会被篡改,所有交易信息可溯源并且对所有参与者公开账本信息,保障了数据和信息的安全性。

2.共识机制

共识机制是区块链可信的基础,目前较为常用的共识机制主要有三类,分别是工作量证明PoW 共识、权益证明PoS(Proof of Stake)共识和股份授权证明DPoS(Delegate Proof of Work);针对联盟链的共识机制有Raft 和Kafka,但联盟链中的共识机制都是基于常用三类共识机制的改进或是针对联盟链特性进行的适配算法,与公有链不同的是,联盟链还提供Solo 共识算法,能够为单机部署提供更快捷的共识方式。共识机制算法保证了区块链账本的安全性,以PoW 为例,若使用拜占庭算法进行共识,只有拥有51%算力的节点才能改变账本数据,对于区块链网络来说,这是不现实且实现成本过高的操作,共识算法的不断改进,也让区块链技术的安全性不断提高。

3.智能合约

不同的区块链网络,例如公有链、联盟链和私有链的智能合约稍有不同,如公有链中使用的是以太坊智能合约,联盟链中使用的是链码Chaincode,但不同区块链网络的目的是相同的,即希望通过预先设置的规则自动执行某些在区块链网络上的脚本。目前以太坊的智能合约使用Solidity 语言编写,采用Truffle+Ganeche 架构进行网络的搭建,而在联盟链中使用的是Golang 语言结合JavaScript 进行合约的调用,但无论实现的具体方式如何,智能合约的目的都是为了完成区块链上交易的自动执行。

4.非对称加密

目前使用最广泛的非对称加密技术是RSA 加密,将公钥通过智能合约进行公开,将数据使用对应参与者公钥加密之后,共享给参与者,参与者使用自己的私钥进行解密并获得数据资源,此过程保证了共享双发的信息安全,并且对于涉及敏感数据的信息,可以使用RSA 加密之后再通过智能合约存入账本中,保障敏感信息不被公开。例如,某些教育机构不想公开自己的相关信息,则可以对这些不想公开的信息进行加密之后存入账本中。

5.以太坊架构

以太坊最初作为货币平台,以进行交易为目的,经过长时间的发展,目前以太坊已成为区块链应用搭建的主要平台,越来越多的应用在以太坊中进行搭建,因为其公开透明度高、应用搭建便利快捷等特点,成为各类应用搭建的主要平台。以太坊完全符合基于区块链的数字教育资源共享平台的搭建要求,使用Ganache+Truffle 能够对共享过程中的功能进行快速搭建,智能合约使用Solidity 语言进行编写,重要的是,以太坊提供了私链测试模式,在共享平台投入应用之前,可以在私链环境中进行迭代测试满足系统运行的要求。

(二)数字指纹和水印技术

区块链技术能够对共享信息进行存证保证共享的安全性,对于数字教育资源更为关键的是提供所有权证明,即机构或学校拥有该数字教育资源的证明,这项功能单纯通过区块链技术难以实现。数字指纹作为数据版权保护的重要技术,已经历经数十年的发展,数字指纹是一段随机或具有一定特性的01 编码,例如最传统的对称指纹技术,由数据拥有者嵌入指纹信息,在发现盗版行为时,数据拥有者对指纹信息进行提取之后,将提取到的信息提交至可信第三方进行比对确权。但第三方平台存在和盗版者共谋的情况,越是有价值的数字教育资源越是容易发生非法行为,这个问题如果不能解决,将会侵害共享机构或学校的利益,进而降低其参与数据共享的积极性。区块链技术为数字指纹的确权过程提供了全新的切入点,能够让确权过程可信并且可追溯,使用区块链技术结合数字指纹实现可信存证,能够在去第三方的情况下提供可信的确权,从技术上为共享双方提供安全保障。与数字指纹不同,信息安全领域的数字水印技术属于信息隐藏范畴,数字水印的嵌入,能够有效地确定版权的归属,但是在数字教育资源发生盗版行为时,不能提供确权的证明,数字水印技术能够将数字指纹技术以隐藏的方式进行嵌入,数字指纹形式可以根据不同的场景和要求设计不同的生成方式。结合区块链和数字指纹技术能够打造可信的确权和权益保护机制,并在发生盗版行为时,通过比对盗版数据中提取到的数字指纹和账本上的指纹集合精准追责,保护参与者的权益,促进更多优秀的数字教育资源在网络中共享。

(三)基于区块链的数字教育资源安全共享模型

针对数字教育资源目前面临的问题以及当前研究的现状,设计基于区块链的数字教育资源安全共享模型能够有效解决数字教育资源信息孤岛现象。针对共享中的安全问题,利用区块链技术结合数字指纹技术提供安全性保障,数字指纹为版权归属权提供证明,结合区块链技术进行存证,进一步保障了数字指纹信息的可信度。

基于以上原因,在联盟链环境中实现数字教育资源的共享模型,如图2 所示,模型主要分为应用层、合约层、底层架构以及业务数据库四个方面。其中应用层是共享模型的实现形式,主要实现了包括共享平台、存证平台以及权益保护平台三个主要应用;合约层提供溯源、存证、追责以及查询验证等共享过程的关键智能合约;在底层架构上,使用RSA、数字指纹、以太坊以及Fabric 技术实现了共享平台的底层架构搭建。在区块链数据库的选择上,以太坊使用的是Oracle 数据库,联盟链上使用的CouchDB 数据库,区块链账本本质上和中心化的数据库无差异,区块链的安全性通过Raft 共识机制提供保障。

图2 基于区块链的数字教育资源安全共享模型框架图

对于区块链网络本身来说,模型的构建并不依赖于某一个特定的架构,甚至不依赖场景进行搭建,可针对不同的共享要求,如一对多和多对多的共享模式供参与者选择。为解决模型异构问题,参与者特别是高校机构需要统一接入平台进行数据的互通,设计访问控制机制保障隐私敏感数据的安全性。

基于区块链的数字教育资源安全共享模型主要在应用层体现其价值,合约层为应用层提供区块链网络的交互,在应用层中,以共享和存证作为基础内容,权益保护作为关键内容,区块链共识算法为整个应用层提供安全可靠性保障。在智能合约的设计中,应充分考虑教育领域资源的特性,如参与者的特性与其他共享平台存在主体不同的区别,教育领域资源共享的主要参与者为高校、教育机构以及教师,针对特定的主体,智能合约要设置访问控制结构,防止非法用户进入平台进行非法操作。在基于区块链的数字教育资源安全共享研究中,合约层不仅需要完成查询和验证操作,更重要的是利用触发机制实现溯源和追责,存证上链作为其基础,配合分布式账本技术完成整个共享过程。

基于区块链的数字教育资源安全共享模型底层架构由数据层和区块链基础技术组成,其中数据层使用公有链和联盟链的账本数据库Oracle 和CouchDB,在业务数据库之上,使用RSA 非对称加密技术结合数字指纹技术实现数字教育资源的确权过程,使用基于RSA 加密的数字签名技术完成资源共享过程的验证和收发过程,区块链基础网络使用以太坊和Fabric 架构进行搭建。在联盟链搭建中,可以以省份或是城市作为组织,不同的学校作为节点进行教育资源的共享,管理员节点设置为教育管理部门如教育局,管理学校或是机构进行组织的加入。在资源共享的过程中,最重要的是在不可信的通道中进行资源的传输,利用RSA 结合智能合约技术能够在保障安全的同时对共享信息进行溯源,便于所有者维权。

使用区块链和密码学技术能够保障数字教育资源共享的安全性,但对于数字教育资源来说,安全性更重要的是资源拥有者能够拥有对自身资源的控制权,即能够在版权确权的过程中掌握主动,这也是使用区块链技术进行可信存证的原因。使用数字指纹结合智能合约技术,首先是能对相对应的资源进行存证,在盗版行为发生时,资源拥有者想维权智能合约提供相应证据,需要注意的是,传统的对称指纹即使使用区块链技术依然无法避免陷害问题的产生,传统的对称指纹嵌入过程完全由资源拥有者完成,即使是高校和教育机构这类公信力很强的主体,依然存在安全隐私问题。针对此问题,基于区块链的数字教育资源安全共享模型可以使用非对称指纹技术方式防止陷害问题的发生,进一步的保障交易双方的安全性和公平性。具体来说,数字指纹由共享双方共同提供,资源拥有者不仅需要嵌入自己的指纹,还需要嵌入共享请求者的加密指纹之后,通过密码学技术例如同态加密技术保障安全和公平。

目前已有的基于区块链技术的数字教育资源安全共享模型都是在数字权限管理DRM(Digital Right Management)技术上进行访问控制的管理以保证资源的安全性并实现有效的版权保护功能,结合数字指纹、多种密码学技术的安全共享模型架构需要将区块链网络本身的特效纳入考虑当中,例如需要考虑区块链架构的适配性和不同区块链网络之间的交互。另外,智能合约的隐私保护性也需要进行考虑,因为智能合约的执行过程对整个区块链网络公开,需要对隐私信息进行加密,基于区块链技术的数字教育资源安全共享模型需要使用RSA 或堆成加密技术对智能合约上的敏感信息进行处理,以保障共享双方特别是资源提供者的权益。

基于区块链的数字教育资源共享模型的设计和实现只是针对数字教育资源生成之后的版权保护,未能结合数字教育资源整个生命周期进行可信存证,特别是资源在创作过程中的关键步骤存证。此外,数字指纹具有一定的追责局限性,即使使用抗合谋攻击指纹对资源进行追责,依然存在无法追踪到所有盗版者的局限性。

四、总结和展望

基于区块链的数字教育资源安全共享作为当前教育数字化的重要内容,结合新兴互联网技术区块链能够保障共享过程的安全性和可靠性。在安全性保障的过程中,确权问题也不容忽视,利用数字指纹技术和智能合约与分布式账本能够对确权信息进行可信和安全存证,在敏感隐私数据的基础上,使用RSA 非对称加密技术对关键信息进行加密之后上传至区块链强化了共享全过程的安全和隐私保护。

在未来的研究中,可以继续针对数字指纹进行改进,例如研究抗合谋攻击数字指纹码与区块链的结合形式,能够抵抗数字指纹的合谋共计,进一步保障数字教育资源的共享安全。另外,针对教育领域的特定主体,设计基于智能合约技术的针对教育机构的多方位多主体访问控制结构,也能够最大化地保障共享过程的安全性。

猜你喜欢
账本指纹合约
像侦探一样提取指纹
为什么每个人的指纹都不一样
数说:重庆70年“账本”展示
丢失的红色账本
大树爷爷的账本
唯一的指纹
可疑的指纹
小账本折射出大爱心