医学院校大学生数据挖掘IT技能培养的研究与实践

2015-01-31 08:37刘尚辉曹阳霍妍马瑾娄岩
中国高等医学教育 2015年3期
关键词:医学院校数据挖掘医学

刘尚辉,曹阳,霍妍,马瑾,娄岩

(中国医科大学公共基础学院,辽宁沈阳110001)

●课程建设

医学院校大学生数据挖掘IT技能培养的研究与实践

刘尚辉,曹阳,霍妍,马瑾,娄岩*

(中国医科大学公共基础学院,辽宁沈阳110001)

在网络、数字化信息迅速发展的今天,各行各业积累的数据越来越多,尤其在医院的工作流程中积累了大量的医学数据。毋庸置疑,我们已经处在一个真正的大数据时代,如何跟上时代发展,培养出适应时代需求的医学人才,是医学教育工作者面临的问题。数据挖掘(Data Mining)就是从大量的实际数据中提取隐含信息和知识的新型学科,在医学院校计算机课程中开设针对医学数据的数据挖掘课程,能够开发学生在大数据时代学习和工作中的潜能,培养高素质的医学人才。

医学数据挖掘;计算机教育;教学研究

一、引言

数据挖掘(Data Mining),也可被称作是基于数据库的知识,是指从存放在数据仓库或其他信息库中的、大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程[1]。数据挖掘技术是近年来一个十分活跃的研究领域,他是在数据库、人工智能、统计分析和模式识别等基础上发展起来的一门独立学科,主要技术有关联规则、序列模式、分类/回归分析、决策树、聚类、神经网络、Web挖掘等等[2]。目前在制造、金融、医疗、市场等多个领域广泛应用。

国内对数据挖掘的研究起步较晚,特别是在医学领域开展的研究成果更少,目前面临的问题是“数据海量,信息缺乏”。调查显示,目前我国大部分医院的管理信息系统中,80%以上只是简单的数据查询与基本计算功能,隐藏在这些数据中的潜在关联与知识没有被发现与利用,大量的医学数据资料被浪费。

二、问题的提出

当医学数据的积累量足够大的时候到来时,数据的迅速增加与数据分析方法的选择和使用之间的矛盾就变得越来越突出,在已经到来的大数据时代,我们能做些什么?如何在医学教育领域有所作为是每个教育工作者要回答的问题。

国外数据挖掘技术的研究成果已经广泛应用于各个领域,国内许多的科研部门和高校先后开展了知识发现的基础理论及其应用研究,国内综合性大学基本都开展了数据挖掘的课程,但医药院校开展得比较少,计算机课程在医学数据处理上很难满足实际医学问题的需求,我们的课程应该教会学生管理信息,分析信息,挖掘信息潜在价值的IT技术本领。在医学院校计算机课程中增加数据挖掘方面的内容,不仅是学生实际工作的需求,更应该是医学院校增加关注与扶持的计算机课程教学内容。

三、数据挖掘技术在医学领域的应用

通过在医学院校开设数据挖掘课程,学生在学习及工作过程中,可以将该技术应用到医学的许多领域。

1.基础医学领域的DNA序列分类、基因组测序数据分析等方面,基因微阵列的数据挖掘是基因数据分析的新方向,基因微阵列数据挖掘方法常用聚类分析方法[3],Olivier Tassy提出了一个数据挖掘预测系统Manteia,用于分析脊椎动物的基因与遗传病的关系,这个数据挖掘系统是个综合性的数据库,同时为基因数据分析提供挖掘工具[4]。

2.疾病诊治和预测,通过对与患者有关的大量医学数据进行挖掘处理,发现有意义的信息支持临床决策。如病因分析中一项研究代谢病与生活方式的关系,通过DCIP算法挖掘出了生活方式中15个与代谢疾病相关的属性,例如性别、饮酒、工作类型、睡眠等,而且其中80%的属性被专家文献证实[5]。

3.流行病学和医学统计领域,如将决策树、回归和神经网络方法结合起来分析疾病死亡率的影响因素,从而弥补了神经网络方法输出的结果难以理解的不足。

4.药物分析、毒理学研究,数据挖掘广泛应用于药物不良反应监测、药物间作用等方面,主要技术有非比例分析、统计回归、非监督机器学习[6]。

5.影像分析,如通过收集大量患者的暴露剂量,对不同曝光剂量进行“分类”挖掘,实现暴露剂量指标的标准化。

6.医院和卫生事业管理领域,医院信息系统提供了大量的信息资源,数据挖掘可以从中提取有价值的决策支持信息,为医疗保健政策的制定、卫生资源的合理配置提供了参考。

四、医学院校计算机数据挖掘课程的特点

理工类学生有一定的IT技术基础,课程内容更偏重于理论知识和解决问题的算法研究;而医学院校学生IT技术基础薄弱,因此在教学上要偏重于医学应用的层面,在医学应用上来引导学生的学习与实践。

1.医学数据挖掘课程是对学生从事医学研究有明确应用意义的课程。这门新兴的课程在教学内容上要突出基本知识、挖掘方法的选择、挖掘工具的使用及结果的分析评价等方面的讲授。教会学生自我探索医学信息中潜在的知识与规律、循证决策技能、科学推断预测疾病发展趋势等手段。

2.将数据挖掘技术与医学具体问题相结合,首先总结出不同的医学问题,教会学生对不同问题用不同的挖掘方法解决。如将决策树、关联分析等算法应用于具体的医学数据中,挖掘数据之间潜在的相互关系,相互依赖与规则。

3.本课程与其他医学计算机课程不同,可以更直接、更深入的与医学应用结合,是医学科研工作者应该具备的数据建模,各种因素间潜在关系的深层次分析的手段与工具。

4.目前在实现医院的科学化、信息化、数字化的管理形势下,本课程可以借助医院信息管理平台,不断提高学生对医疗管理信息的分析和预测的能力,为医院的科学决策提供更多信息化的技术支持。

五、医学数据挖掘课程的一些实施方法

数据不能自动变成知识,数据中暗含的知识只有人设法发现,让学生找到大量的数据与找到有用的知识完全是两回事。中国医科大学已经为本科生开设了4年的医学数据挖掘课程,这里介绍一些教与学的做法。

1.课上典型案例展示与课下实训相结合的教学模式,既兼顾对数据挖掘的基本知识、基本方法和应用软件操作的多重训练,又突出实际医学挖掘的应用案例,强化教学中的实训演练。

2.实验教学建设上,突出具有医学知识背景的综合性实验内容,培养学生的实践能力与创新精神。例如:数据挖掘在疾病辅助诊断中的应用等。

3.重视课程资源建设,不断补充、更新和优化教学资源。如各种基础医学、临床医学、生物医学等的数据资源收集,医学案例资源是此课程成败的关键。

4.项目驱动团队协作。学生按组上网检索国内外医学数据库、医院课间实习收集病例、与医院相关部门合作等方式获取医学实际数据,制定项目计划表,严格按照项目进度完成实训内容,最后师生一起验收成果。

5.在教与学的过程中师生共同成长,培养青年教师主讲医学数据挖掘课程及从事该课程的相关研究,如青年教师与学生共同查阅文献写综述论文,通过各种渠道一起收集教学数据资源,共同撰写发表研究论文等等。

六、结语

通过为医学生开设数据挖掘课程,将计算机技术与医学实际需要深入结合,收获了将医学数据转化成知识的教学成果。学生掌握了发现数据中存在的知识,并预测未来发展趋势的技术本领。教学中也遇到了一些问题,如在医学数据采集、更新及清洗方面,由于工作量大存在一些困难,还有挖掘出的结果需要医学验证等问题。这些问题已经作为我们今后的工作方向,由于医学本身的特殊性,在该领域进行探索研究必将取得可惜的收获。

[1]李雄飞,董元方,李军,等.数据挖掘与知识发现.第2版[M].北京:高等教育出版社,2010:2-5.

[2]SOMANKP,等著.范明,牛常勇,译.北数据挖掘基础教程[M].北京:机械工业出版社,2009:1-25.

[3]Mercado C P,Byrum S,Beggs M L,et al.Impact of elevated plasma serotonin on global gene expression of murine megakaryocytes[J].PloS one,2013,8(8):e72580.

[4]Tassy O,PourquiéO.Manteia,a predictive data Mining system for vertebrate genes and its applications to human genetic diseases[J].Nucleic acids research,2013:gkt807.

[5]Huang Y C.The application ofdataMining to explore association rules between metabolic syndrome and lifestyles[J].The HIM journal,2013,4(6):44-49.

[6]Harpaz R,DuMouchelW,Shah N H,etal.Novel data-Miningmethodologies for adverse drug event discovery and analysis[J].Clinical Pharmacology&Therapeutics,2012,91(6):1010-1021.

Data m ining:Training IT skills for medical college students

Liu Shanghui,Cao Yang,Huo Yan,et al
(China Medical University public foundation college,Shenyang 110001,Liaoning,China)

data has been increasingly accumulated in today’s information society.In this big data era,the training ofmedical staff needs to keep up with the times.A new subject,datamining extract the hidden information from the huge quantity of data.Offering datamining class to students can bring them better job potentials.

Medical datamining;computer education;teaching and research

G642.3

A

1002-1701(2015)03-0042-02

2014-01

刘尚辉,女,硕士,副教授,研究方向:医学高校计算机教育。

*通讯作者

10.3969/j.issn.1002-1701.2015.03.023

猜你喜欢
医学院校数据挖掘医学
微课教学模式在医学院校健美操课程中的实践研究
本刊可直接使用的医学缩略语(二)
地方高等医学院校发展的逻辑起点——读《地方高等医学院校发展战略研究》有感
探讨人工智能与数据挖掘发展趋势
医学的进步
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
预防新型冠状病毒, 你必须知道的事
关于医学院校医用英语教学的几点思考
医学院校内药用植物园规划与建设初探
医学、生命科学类