湖北省健康医疗大数据中心数据开放共享管理研究

2022-08-25 07:28徐进汪火明孙润康任宇飞
科学与信息化 2022年16期
关键词:脱敏提供者使用者

徐进 汪火明 孙润康 任宇飞

华中科技大学同济医学院附属同济医院 湖北 武汉 430030

引言

随着2015年8月19日国务院发布了《关于促进大数据发展的行动纲要》[1],宣布国家要实施国家大数据战略,在纲要中十数次提到“大数据”,大数据作为国家战略性生产资料,需要使用平台化工具进行收集、整理、组织和数据利用。医疗卫生属于该行动纲要的重点领域,建设医疗大数据平台是国家需求。湖北省委省政府《关于推进疾病预防控制体系改革和公共卫生体系建设的意见》、湖北省政府《湖北省疫后重振补短板强功能“十大工程”三年行动方案(2020-2022年)》中均明确提出要提高信息化服务能力,建设中部地区健康医疗大数据中心,加强重大疫情信息平台建设。

“十三五”期间,湖北省卫生健康委在遵循国家标准规范的基础上,结合本省实际进行拓展落地应用,制定实施了《湖北省全民健康信息标准与规范》(鄂卫生计生通〔2017〕39号),为系统融合、数据共享、业务协同等信息化建设和应用提供了统一规范的标准依据。但该套标准目前仍存在标准应用协同不够,机构、部门之间信息交换不畅通等问题,还缺乏统一权威的数据开放共享管理机制,来保障的数据在开放共享过程中的规范合理[2-3]。

1 开放共享管理框架

数据开放共享涉及数据提供者、数据管理者和数据使用者。首先管理者对用于交换共享的信息资源进行组织、分类。然后提供者按照规划,将基础数据和业务数据注册到数据开放共享平台中。管理者对于注册的数据进行整理形成主题数据,对于主题数据通过管理形成交换数据,将交换数据根据开放共享策略开放给使用者。使用者根据管理者要求,对数据进行各场景的使用。最后对于完成开放共享后的数据及时销毁。框架如图1。

图1 数据开放共享规范框架图

2 角色分类

参与大数据开放共享的角色共分为3类,提供者、管理者和使用者,这3类在数据开放共享过程中分别有不同的责任和义务[4]。

2.1 提供者

主要负责信息资源开放共享内容与系统的数据注册等。应当按照“一数一源、最少够用”的原则提供相关信息,所提供的信息应当符合业务应用和管理要求,保证数据中标识的唯一性、一致性,所提供的信息应当严格实行信息复核程序,防止重复注册、多头注册;应当严格执行相关标准,做到标准统一、术语规范、内容准确;在数据发生变更时,应当将所管理的信息完整、安全地移交给主管部门管理。

2.2 管理者

主要负责对用于开放共享的信息资源进行组织与分类,并负责内容更新,对已注册的数据进行整理清洗,通过数据开放共享平台对数据执行脱敏操作,对信息资源共享使用设置级别和授权,对数据使用者的数据申请进行审批,审批通过后提供申请相应的数据等。

2.3 使用者

主要负责大数据中心的数据使用等,应依法依规使用开放共享的数据资源。数据使用者对从数据开放共享平台获取的信息,只可按照明确的目的和用途使用,并按照设置的数据使用权限,申请获取相应的数据,并在授权范围内按照规定进行使用,并保管好相关数据内容,对开放共享的数据有疑义或者发现错误时,应当及时反馈给管理者和提供者。

3 活动分类

参与大数据开放共享的管理活动主要分为数据规划、数据注册、数据整理、数据管理、数据开放共享和数据销毁6个环节,各环节的任务不同[5]。

3.1 数据规划

主要指在业务流程梳理基础上规划用于开放共享的信息资源,对信息资源进行组织、分类,确定数据开放共享的范围、模式和实施步骤等。

3.1.1 数据归集。管理者在归集数据过程中应采用身份鉴别、数据源认证等安全机制保障开放共享数据来源的真实性。

3.1.2 数据分级。管理者依据科学性、稳定性、实用性、扩展性等原则,根据数据的敏感程度、重要程度以及被泄漏或被非法处理后对国家安全、公共秩序、公共利益、党政机关及事业单位、法人或其他非政府组织及个人的合法权益的危害程度等的不同,将数据划分为四个等级,不同级别的保密性要求不同[6]。

3.1.3 数据分类。管理者根据业务领域对数据进行分类,数据按照业务领域分类包括健康类、环境类、资源类、交换类和影像类[7],如图2。

图2 数据分类模型

3.1.4 资源目录管理。数据管理者构建资源目录发布和审核的机制,并对外提供资源目录管理服务,供数据提供者调用,并对提供者进行的相关操作进行审核;数据提供者调用资源目录管理服务,对资源目录进行管理,并根据数据分类分级规则,定义资源目录对应的内容和安全等级等。

3.2 数据注册

主要指管理者对可供注册的数据类型、数据格式等进行维护,并对提供者进行用户和授权管理。提供者按照类型和格式要求等进行数据注册。

3.2.1 用户管理。管理者建立完整的用户管理机制,支持根据用户类别对用户进行管理,并支持用户全生命周期的管理、监督和分析等。

3.2.2 授权管理。管理者可针对用户的应用权限、数据权限、管理权限、机构权限等权限类型进行授权管理,支持分级授权,并对于权限的操作进行日志记录并监管,不允许对权限范围外的应用或数据进行操作和访问。

3.2.3 数据导入导出。管理者在数据导入导出过程中应对每次数据导入导出的事务进行唯一标定,在数据导入导出过程中对用户身份进行鉴别,对导入导出操作有抗抵赖验证,保证数据在注册过程中的传输安全,并在整个导入导出过程中进行跟踪和记录,保证重要数据的可追溯。

3.2.4 数据维护。管理者应建立数据质量控制机制,对数据进行定期维护保证所得到的数据完整准确、及时有效,对敏感数据和重要数据进行加密存储保护,根据数据安全等级的不同,对数据进行分域分级存储,并具备数据更新和失效数据重获取机制,以及故障恢复后数据自动加载能力。

3.3 数据整理

主要指管理者对已注册的基础数据和业务数据进行清洗,对敏感数据进行脱敏、匿名化等处理,生成主题数据[8]。

3.3.1 数据脱敏。管理者在数据整理过程中应能够识别出敏感数据,对敏感数据建立数据脱敏管理策略并进行脱敏,并且在脱敏后,能根据需要保留数据相关信息以进行追溯,同时,所有的数据脱敏操作应有相关日志进行记录。

3.3.2 数据加密。管理者在数据整理过程对重要数据和敏感数据可采用国密等相关密码技术,对数据进行加密处理。

3.4 数据管理

主要指管理者对已注册的基础数据、业务数据和整理出的主题数据进行分类分级及权限设置等处理,形成交换数据。

3.4.1 权限标记。管理者在数据管理过程中应根据数据的不同密级,标记交换数据的不同使用权限。

3.4.2 安全策略检查。管理者在数据管理过程中应建立检查机制,保证开放共享数据安全策略正确配置与实施。

3.5 数据开放共享

主要指使用者按照管理者设置的数据使用权限,获取相应数据,并按照规定进行使用[9]。

3.5.1 用户管理。参考3.2.1。

3.5.2 授权管理。参考3.2.2。

3.5.3 访问控制。管理者应遵照授权策略对使用者进行访问控制,并实时检查使用者的访问权限和访问操作,对于不符合授权的访问尝试,应提醒并进行相应的记录。

3.5.4 数据导出使用。参考3.2.3。

3.5.5 数据使用反馈及处理。数据提供者在数据使用过程中对开放共享的数据有疑义或者发现错误时,应当及时反馈给管理者,管理者应及时协调提供者,共同校核并予以反馈。

3.5.6 使用监管。管理者应基于国家相关法律法规及标准规范,制定数据使用机制,促使使用者对数据的使用正当合理,同时对数据使用进行监管记录并分析,对使用者的异常使用进行提醒。

3.6 数据销毁

主要指对在数据开放共享平台中按照数据开放共享规则完成开放共享后的数据,管理者和使用者应及时销毁数据,且同时应长期保留数据开放共享日志记录,以备数据溯源。

4 结束语

数据开放共享规范明确了各相关方的职责分工、权利义务和应用规范等内容,确保各个角色在各个活动中对不同数据拥有不同的权限和责任,保障数据使用的规范合理。对于具体的数据开放共享策略未进行制定,未给出对于不同用户在各个使用场景中对不同数据拥有权限制定详细的策略方案,需要在具体建设过程中制定具体的数据开放共享方案。并且对于数据分级没有给出具体的数据分级目录,需要在数据整理和数据管理过程中,对具体的数据集进行分级,形成数据资源分级目录。

猜你喜欢
脱敏提供者使用者
设计让您在喜爱的虚拟世界中自由奔跑
激光联合脱敏剂治疗牙本质过敏症
快速脱敏治疗的临床应用
网络交易平台提供者的法律地位与民事责任分析
新型拼插休闲椅,让人与人的距离更近
论网络侵权的归责原则
网络言论自由的行政法规制研究
网络服务提供者的著作权间接侵权责任研究
抓拍神器
梦乡床