乳腺超声影像筛选与标定系统的设计与实现

2023-08-01 07:25申辉繁黄源
现代信息科技 2023年11期
关键词:人工智能

申辉繁 黄源

摘  要:基于乳腺超声影像数据和病理报告数据,采用隐私保护技术保障数据的安全性,通过ETL技术和互联网技术,开发乳腺超声影像筛选与标定系统。系统实现了多模态的数据导入及预处理、乳腺超声影像数据筛选及标定、专家审核等功能,为人工智能在乳腺超声影像智能诊断与分析领域的应用提供高质量的数据支撑,同时提升了标定医生的工作效率。

关键词:人工智能;ETL;超声影像;智能诊断

中图分类号:TP391.9    文献标识码:A    文章编号:2096-4706(2023)11-0026-05

Design and Implementation of Breast Ultrasound Image Screening and Labeling System

SHEN Huifan, HUANG Yuan

(Sichuan Institute of Computer Sciences, Chengdu  610041, China)

Abstract: Based on breast ultrasound image data and pathological report data, this paper uses privacy protection technology to ensure the data security, and develops the breast ultrasound image screening and labeling system through ETL and internet technology. The system realizes the functions of multimodal data importing and pretreatment, data screening and labeling of breast ultrasound image data, and expert review. It provides high-quality data support for the application of Artificial Intelligence in the field of intelligent diagnosis and analysis of breast ultrasound images, and improves the work efficiency of labeling doctors.

Keywords: Artificial Intelligence; ETL; ultrasound image; intelligent diagnosis

0  引  言

近年來,医学影像与人工智能(AI)的结合成为行业发展的热点,尤其是在AI与放射影像的结合领域取得了大量成果[1]。然而,超声影像的信噪比低、病变类型分布不均、数据标注的成本高等特点增大了超声影像AI训练的难度,对AI与超声影像结合领域的应用产生较大的影响[2]。本系统基于乳腺超声影像数据和病理报告数据,采用ETL技术对影像数据和病理数据进行抽取、集成、融合,利用互联网和信息安全等技术开发筛选与标定系统,实现数据清洗、多模态数据导入、数据筛选与标定、专家审核等工作流程,同时保障了数据的安全性。由于乳腺超声影像数据的标注具有很强的专业性,需要有经验的医生对数据进行标注,因此高性能、高标准的数据标定系统显得尤为重要,本系统的实现提升了标注医生的工作效率,为乳腺超声影像在AI领域的应用提供了高质量的数据支撑。

1  系统设计

1.1  系统总体架构设计

为保证系统的灵活性,让系统能随着用户工作流程、工作需求等的变化而方便地升级,做到随需应变,延长系统使用周期,该系统采用了以SOA(Service-Oriented Architecture)

架构思想为指导,以服务为核心[3,4],采用基于面向服务的思想进行业务建模和构架业务流程,有利于保证每个业务环节均通过服务进行实现,支持组织内部业务快速协同,有利于快速适应组织机构与业务流程的变化,系统的总体架构如图1所示。系统的整体框架分为五层,包括数据中心、支撑平台、应用层、网络层、用户层[5,6]。系统采用高拓展性、高可靠性和低成本的分布式存储与计算框架,通过对结构化数据和非结构化数据进行标准化、结构化、归一化后采用分布式存储方式对数据进行安全存储,充分运用事务处理等成熟技术,在统一应用支撑平台上部署系统,并可根据负载变化进行集中式或集群部署。系统建立超声影像安全管理体系,保障数据存储、网络设备、基础设施等安全工作,并提供数据安全保障相应措施,做到数据流转全程留痕、数据安全监测和预警、数据泄露事故可查询可追溯等数据安全保障工作。

不同角色的用户通过浏览器发出HTTP请求,由网络层的Nginx服务器代理至Tomcat容器进行处理,后端采用RMI远程调用的方式实现通信。

应用层采用Duboo+Zookeeper高可用分布式架构,基于微服务架构,使得每个服务能够独立运行而又互不影响,根据用户不同的请求向业务中台调用各类服务,如数据查看、统计分析、数据导出等。

支撑平台为应用层提供业务支撑,主要包括表单组件、集成平台、数据展示、用户系统、权限系统、ETL工具等,支撑平台是连接数据中心和应用层的桥梁。

数据中心是对系统数据进行存储,体现为MySQL数据库、Redis缓存数据库、Mycat数据库中间件等。数据中心主要包括乳腺超声影像库、乳腺超声病理库、病人基本信息库、系统用户信息库等。

1.2  系统设计原则

该系统的建设是一个系统性的工程,在功能上体现综合性,结构上凸显层次性,在设计过程中严格遵守了多种原则:

1)安全性:系统充分考虑系统运行的安全策略和机制,实现备份和方便快捷的恢复功能,能够抵御高强度的网络攻击和渗透,在系统遭到攻击或崩溃时能快速恢复,确保重要数据的机密性和完整性;数据处理过程要保证数据安全性,做到数据保密性、数据完整性、数据可利用等。

2)可扩展性:系统采用面向对象和模块化的设计理念,各类接口服务满足可扩展的原则,便于更新、扩充、升级。系统的功能满足当前业务处理的需求,并充分考虑未来业务种类不断增长和用户不断增长的需求。

3)高性能和稳定性:系统应保证各种网上应用服务的稳定高效运行,能够在高访问负载情况下,向各类服务对象提供可靠的服务。在考虑经济性和实用性的前提下,选择高性能的基础架构设施。并规范地进行系统建设、开发和软硬件配置,提供合理有效的应急方案,确保系统的高稳定。

1.3  系统功能设计

如图2所示,本系统功能主要分为数据录入、数据清洗、数据管理、系统管理4个功能模块:

1)数据录入模块:包括乳腺超声影像数据导入和乳腺病理数据导入。乳腺超声影像数据导入功能可以将病人历年的乳腺超声检查数据导入该系统,乳腺病理数据导入功能可以将Excel文件数据或HTML文件数据等多模态数据导入该系统,并根据病人检查号自动绑定乳腺超声数据和乳腺病理数据。

2)数据清洗模块:对乳腺超声数据和乳腺病理数据进行数据抽取、数据转换、数据融合,对敏感信息进行脱敏处理,最终得到系统可使用的数据。

3)数据管理模块:对导入的乳腺超声数据和乳腺病理数据进行管理。数据标注医生可以通过数据筛选、数据标定功能对数据进行筛选、标定,专家医生可以通过数据审核对标注医生标注的数据进行审核和数据导出。

4)系统管理模块:主要提供用户权限控制以及系统监控等功能。系统采用基于角色的访问控制的权限管理模式,通过为用户分配角色,为角色设置权限来控制用户的权限,系统监控包括日志管理、定时任务管理、性能监控等功能。

2  关键技术

2.1  多模态数据融合技术

系统采用多源异构数据融合技术,基于知识融合本身的特点,借鉴已有的数据融合算法,将其合理地移植到知识融合中,在传统ETL能力基础之上补充了半结构化、非结构化数据采集的能力,解决了针对文本、图片等数据的采集、转换、融合和存储问题。将融合后的数据导入至MySQL、MongoDB或Neo4j等不同类型的数据库,通过MySQL数据库能够实现对数据的便捷管理;MongoDB数据库能够便于处理键值的快速查询;而Neo4j图数据库能够便于发现数据关联关系。建立统一数据接口,灵活接入和同步包括Socket、Webservice、Dll、Corba等多种数据源,在不同的应用场景快速完成多源异构数据整合,提供深度对接各个系统的能力。

2.2  基于访问控制的数据隐私保护技术

医疗数据通常包含大量用户的隐私信息,因此对用户隐私数据的保护显得尤为重要。对数据隐私泄露的风险进行量化是一个非常复杂的过程,因为用户各阶段的访问行为及信任度之间是相互独立又相互联系的关系[7],不同指标对最终风险的影响也是不同的。本系统在基于神经网络和模糊理论的风险量化方法中,借助模糊推理系统对知识进行提取,将模糊推理系统和神经网络相结合不仅可以提高模型的性能还可以使得数据的处理过程以人们易于接受的方式表达出来。此外,当用户访问行为发生微妙变化时,模型的输出结果也会自动的发生变化,实现动态、自动化的处理方式。

2.3  基于Duboo+Zookeeper的高可用分布式架构

系统采用Duboo+Zookeeper高可用分布式架构,基于Dubbo分布式服务框架,提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案,使用ZooKeeper封装好复杂易出错的关键服务,将高效、稳定、易用的服务提供给用户使用。以微服务架构为基础,和传统的单体架构相比,微服务架构使得整个系统的分工更加明确,将服务按照业务功能分为多个部分,使得开发人员可以独立地开发、测试、部署和更新,对架构侵蚀具有更好的弹性。每个服务独立运行,服务的单点故障不会扩展到整个系统,新服务的开发不会影响现有服务,通过REST接口快速整合各类服务,并提供统一、开放的接口服務,实现新业务快速开发和部署。

3  系统实现

3.1  数据录入与检索

主要实现乳腺超声影像数据导入和乳腺病理数据导入以及对数据的检索功能。乳腺超声数据导入后经过数据预处理得到最终的乳腺超声影像数据;乳腺病理数据可以导入excel文件数据或HTML文件数据,数据导入后经过数据脱敏、数据清洗后得到存入数据库,如图3所示。

3.2  数据筛选功能

用户登录系统后可以根据乳腺病理报告对乳腺超声影像数据进行筛选,同时可以查看病人详细的超声检查报告详情,帮助用户快速筛选出高质量的数据,如果遇到难以筛选的数据,用户可以跳过筛选并将其标记为“难筛选”,该部分数据将分发至专家医生进行处理和操作,如图4所示。

3.3  数据标注功能

先由系统自动对筛选的数据进行标注,然后数据标注医生在已标注的基础上进行调整,提高了标注医生的工作效率。系统可以通过打点、画框、画线、描边等方式对乳腺超声数据进行标注,对标注的图像提供放大、缩小、回退、清空、删除、编辑等操作,同时系统还提供快捷键的功能方便标注医生进行操作,如图5所示。

3.4  数据审核功能

专家医生登录系统后可以对已标注的乳腺超声影像进行审核,审核通过的数据可以保存并导出结果数据,审核不通过的数据可由专家医生重新标注后得到最终的标定后的数据,通过该功能可以控制数据标定的质量,最终得到能为乳腺超声影像智能诊断与分析算法模型进行训练的高质量数据集,如图6所示。

4  结  论

近年来,医学影像是人工智能最有研究和应用前景的领域,但高质量数据获取难度大、数据标注成本高等因素严重制约了“人工智能+医学影像”的发展。本文通过多模态数据融合、基于访问控制的数据隐私保护技术和互联网等技术,基于乳腺超声影像数据和病理报告数据,设计并实现了乳腺超声影像筛选与标定系统,本系统的实现提升了标注医生的工作效率,为乳腺超声影像在AI领域的应用提供了高质量的数据支撑。

参考文献:

[1] 施俊,汪琳琳,王珊珊,等.深度学习在医学影像中的应用综述 [J].中国图象图形学报,2020,25(10):1953-1981.

[2] 吕明慧,周帅,朱强.基于深度学习乳腺超声计算机辅助诊断系统研究进展 [J].中国医学影像技术,2020,36(11):1722-1725.

[3] 肖祥林,周春容.基于云+SOA架构的异构智慧校园平台设计与实现 [J].电子设计工程,2018,26(4):85-89.

[4] 周洪成,谭宇.基于SOA架构的智慧旅游综合管理服务平台设计研究 [J].通信与信息技术,2021(2):87-89+79.

[5] 冯维娜.浅谈分层技术在计算机软件开发中的应用 [J].开封大学学报,2019,33(4):81-83.

[6] 杨芙清.软件工程技术发展思索 [J].软件学报,2005(1):1-7.

[7] 王祥,李紅娟,丁红发.基于风险访问控制的大数据安全与隐私保护 [J].电子技术与软件工程,2021(13):236-238.

作者简介:申辉繁(1987—),男,汉族,湖南邵阳人,工程师,硕士,研究方向:数据挖掘、软件工程;通讯作者:黄源(1989—),男,汉族,四川德阳人,工程师,硕士,研究方向:数据挖掘、软件工程。

收稿日期:2023-01-12

猜你喜欢
人工智能
我校新增“人工智能”本科专业
用“小AI”解决人工智能的“大”烦恼
当人工智能遇见再制造
2019:人工智能
AI人工智能解疑答问
人工智能与就业
基于人工智能的电力系统自动化控制
人工智能,来了
数读人工智能
人工智能来了