基于OCR技术的医疗档案管理系统研究与构建

2015-01-26 22:45向明华向国华
中国医疗设备 2015年10期
关键词:字符识别泰兴病历

向明华,向国华

1.泰兴市人民医院,江苏 泰兴 225400;2.中国电信股份有限公司泰兴分公司,江苏 泰兴 225400

基于OCR技术的医疗档案管理系统研究与构建

向明华1,向国华2

1.泰兴市人民医院,江苏 泰兴 225400;2.中国电信股份有限公司泰兴分公司,江苏 泰兴 225400

基于医院信息系统,利用OCR技术开发了医疗档案管理系统。系统主要由管理模块、OCR处理模块、档案管理模块、邮件管理模块组成。本文详细介绍了系统的开发过程和使用情况。

医院信息系统;医疗档案管理系统;光学字符识别;便携式文档格式

随着计算机技术和网络技术的快速发展,使得医疗档案管理数字化、信息化已成必然趋势[1-2]。病历资料是在诊疗过程中形成的客观病历材料和主观病历材料,对将来医疗机构举证也起到举足轻重的作用。电子医疗档案是由病历资料转化而来,电子医疗档案采用的便携式文档格式(PDF)不但能够真实、准确和客观地反映原始病历材料,而且PDF医疗档案只可查阅,不可涂改,保证了病历资料的客观性和科学性[3-4]。笔者利用医院现有的医院信息系统(HIS)、影像归档和通信系统(PACS),构建了基于光学字符识别(OCR)技术的PDF医疗档案管理系统,实现了信息共享和全文检索,提高了医疗档案文件管理的效率。

1 系统结构及功能设计

1.1 结构设计

医疗档案管理系统结构设计主要包括系统管理模块、OCR处理模块、档案管理模块、邮件管理模块等,见图1。

1.2 功能设计

(1)系统管理模块。该模块负责系统的部门信息维护、人员信息维护、角色维护和模块维护,工作流程,见图2。

(2)OCR处理模块。经OCR处理的PDF医疗文件不依靠第三方数据库技术,直接进行内容抽取和索引,对被索引的文件内容可以进行高效全文检索。该模块具有图像输入、预处理(包括二值化、图像去噪、倾斜矫正)、版面分析、字符切割、字符识别和版面恢复等功能,用于对扫描仪或相关软件生成的PDF医疗档案文件进行处理,以便在Web系统中检索[5-7]。字符识别的关键是OCR分辨率的设置,一般来说,文稿字体大,则OCR分辨率设置小些,如2、3号字的文章段,推荐使用200 dpi;反之则大些,如7、8号字的文章段,推荐使用600 dpi。扫描时适当地调整好亮度和对比度值,使扫描文件黑白分明;在医疗档案管理系统中不得存储可编辑数据,如txt、doc及xls等格式文件。

(3)使用权限设置。为保证系统安全,本系统共分两种用户:一种为系统管理员,主要负责人员信息维护、角色维护、模块管理;另一种为部门人员(部门人员分多种用户),部门人员登录系统后,可以修改登录密码、查询其他人员的基础信息,收发邮件等。系统可以根据不同权限的用户显示不同的功能模块,系统管理员才具有创建医疗档案、借阅医疗档案等管理权利[8]。

2 系统的实现

2.1 数据库的创建

系统使用SQL Server2000数据库管理系统,数据表在创建完成之后生成SQL脚本文件,在查询分析器中直接运行来创建表结构、数据表的SQL脚本语句[9]。

2.1.1 目录结构

此系统实现的目录结构比较清晰,src目录下存放项目中所用到的java源文件,test目录下存放java测试类源文件,即本系统所采用的Junit测试文件,doc目录下存放项目开发所用到的说明文档[10-11]。

2.1.2 数据表的创建

(1)用户信息表SM_USER。此表包括了所有登录系统用户的信息。

(2)模块信息表SM_MODEL。此表中记录了系统模块信息,可以根据用户的权限动态显示相应的模块,本表采用表字段自关联实现菜单的显示功能,即子菜单通过父ID查找实现菜单的关联功能。

(3)部门信息表SM_DEPARTMENT。部门信息表用以记录部门信息相关的内容,从而实现对部门的检索及分类,通过部门名称就可以对部门相关信息进行查询。

2.2 界面设计及实现代码

2.2.1 界面设计

在本地浏览器中输入http://r-co,即可进入PDF医疗档案信息管理的登录界面。在此界面单击导航栏中的“系统模块管理”链接,打开模块管理查询界面,就可以实现修改、添加等维护系统操作[12-13]。

2.2.2 代码实现

由于每个模块的代码具有相似性,且代码量较大,这里简要介绍人员维护页面流程。

(1)Spring配置文件。action-servlet.xm l主要用来通过Spring配置Jsp页面与action的映射信息。

(2)控制层action。该层为Java源代码,主要负责收集从JSP传来的数据并调用Spring业务代码,本例中负责控制层的java源代码为SmUserController.java。

(3)业务层service。Service层主要负责业务的处理并调用Dao层的数据,并将从Dao层获取的数据回传给action层,service层分为service层接口的定义和接口的实现类。

(4)Dao层。Dao层主要用来与底层的数据库交互,Dao层分为Dao层接口的定义和接口的实现。

(5)JSP显示层smUsersFrame.jsp。smUserFrame.jsp页面采用框架结构设计。

3 结语

基于OCR技术的PDF医疗档案管理系统的研究和构建,使得档案管理系统可对全文进行检索,大大提高了医疗档案管理效率和检索率。另外,该系统可预留与办公自动化系统交换数据的接口,以实现与办公自动化系统的无缝连接。

[1]戴晟晖,常春英.Dreamweaver8实例与操作[M].北京:航空工业出版社,2010.

[2]李兴华.JavaW eb开发实战经典基础篇[M].北京:清华大学出版社,2010.

[3](美)Brian P.Hogan.HTM L5和CSS3实例教程[M].北京:人民邮电出版社,2012.

[4](美)N icholas C.Zakas.JavaScript高级程序设计[M].3版.北京:人民邮电出版社,2012.

[5]岳峰,李鹏,张玉祥.跟ORACLE工程师学JAVA软件项目开发[M].北京:科学出版社,2010.

[6]Christian Bauer,Gavin King.Java Persistence w ith H ibernate[M].USA:Manning Publications Co.,2009.

[7](美)斯格科.Jakarta Struts Cookbook[M].北京:清华大学出版社,2007.

[8]李兴华,王月清.Java W eb开发实战经典[M].北京:清华大学出版社,2010.

[9]陈亚辉,缪勇.Struts2+Spring+Hibernate框架技术与项目实战[M].北京:清华大学出版社,2012.

[10]孙晓非,冯冠,张银鹤,等.XM L基础教程与实验指导[M].北京:清华电脑学堂,2008.

[11](美)Adobe公司.Adobe Acrobat X中文版经典教程[M].北京:人民邮电出版社,2012.

[12]陈金雄,刘宝妹,钟俊华.基于云计算的军人电子健康档案平台架构的设计与实现[J].中国医疗设备,2014,29(2):53-55.

[13]黄吴健,帅仁俊.电子健康档案的加密研究[J].计算机工程与设计,12(10):3833-3837.

Study and Construction of an OCR-Based M edical Record Adm inistration System

XIANG Ming-hua1, XIANG Guo-hua2
1.The People’s Hospital of Taixing, Taixing Jiangsu 225400, China;2. China Telecom Beijing Branch, Taixing Jiangsu 225400, China

Based on the hospital information system, the medical record administration system was developed by using OCR technology. The system mainly consisted of the management module, OCR processing module, fi le management module and e-mail management module. This paper introduced the development process and the use of the system in detail.

hospital information system;medical record adm inistration system;optical character recognition;portable document format

TP311.52

A

10.3969/j.issn.1674-1633.2015.10.031

1674-1633(2015)10-0106-02

2015-04-01

2015-08-10

本文作者:向明华,高级工程师。

作者邮箱:225400@126.com

猜你喜欢
字符识别泰兴病历
强迫症病历簿
泰兴砖雕:方寸之间见大美
非遗中的“泰兴印忆”
“大数的认识”的诊断病历
开泰图兴——泰兴经济开发区的绿色崛起之道
何烨副会长出席泰兴日化产业园开园仪式
融合字符及字符排列特征的铭牌识别方法
一种基于OpenCV的车牌识别方法
为何要公开全部病历?
基于MATLAB的图片中字符的分割与识别