下积分在医学中的应用

2012-10-11 03:03李雪非冯慧敏
海南开放大学学报 2012年4期
关键词:样例测度帕金森病

沈 君,李雪非,冯慧敏

(1.海南师范大学数学与统计学院,海南 海口,571158;2.河北农业大学理学院,河北保定,071000;3.河北大学数学与计算机学院,河北保定,071000)

引 言

近年来,模糊数学在医学领域中的应用越来越广泛,很多医学工作者借助模糊综合评价方法对医疗质量进行评价[1][2][3]。用模糊决策模型诊断疾病具有直观、简便优点,但它的假设前提是疾病各症状相互独立,这显然是不合理的,因为治疗中患者发病原因、症状及体征等许多因素具有不确定性。如帕金森病(又称震颤麻痹)是中老年人中枢神经系统某些神经元细胞出现退性或变性引发的一种疾病,主要表现为肢体震颤、运动迟缓、僵直,有的病人还会出现呆痴,流口水,吞咽困难,肢体疼痛等。帕金森病症的一些外部表现特征,比如肢体震颤、运动迟缓、僵直等,与病毒性脑炎,老年性震颤,以及小脑病变引起震颤等疾病很相似,难以区分。帕金森病在早期和晚期通过脑CT和核共振检查并没有特征性变化,到目前为止还没有特别的仪器和化验方法能确诊这种疾病,只能通过医生检查粗略判断。

看这条模糊推理规则:“如果病人有症状A,B,C和D,那么就断定得了帕金森病”。通过医学知识还知道,在确定是否得帕金森病时,症状C,D比A,B更重要,也就是说病人出现症状C或D比出现症状A或B得帕金森病的可能性更大。但病人同时出现症状C和D比同时出现病症A和B得帕金森病的可能性又要小。

根据上述信息得到下式:

max{Lw(A),Lw(B)} < min{Lw(C),Lw(D)}

如果不考虑症状之间交互性,按照简单加权方法,又有下面式子:

Lw(A,B)=Lw(A)+Lw(B),Lw(C,D)=Lw(C)+Lw(D)

这样就不能把“同时出现症状C和D比同时出现症状A和B得帕金森病的可能性小”这个信息表示出来,导致判断时候出现失误。

由于疾病症状之间交互性,导致模糊产生式规则之间也是有交互影响的。比如说,

规则1.IF(属性 A=尿多)and(属性 B=血糖升高)THEN可能得糖尿病

规则2.IF(属性C=体重减轻)and(属性D=心动过速)THEN可能得糖尿病

规则3.IF(属性 A=尿多)and(属性 E=食欲亢进)THEN可能得糖尿病

规则1和规则2相互作用,增强了感染糖尿病的可能性,而规则2和规则3相互作用则削弱了感染糖尿病的可能性,因为规则2和规则3也更像是感染了甲亢。

在医学中,针对某种疾病,根据它的发病原因、相关症状及其体征,可以抽取出模糊产生式规则,这些规则不仅有不同的重要性,而且还可能会存在交互影响。当模糊规则之间的交互作用不能忽略的时候,用模糊积分作为融合算子是一个很好的选择。近年来,许多研究者用模糊积分处理疾病间的这种交互作用[4][5],收到了较好效果。用模糊积分处理交互作用的关键问题是模糊测度的确定,模糊测度不仅可以表示每条规则的重要度,还可以表示出规则之间的交互作用。已有不少学者在模糊测度确定方面进行了深入有效探讨,提出了一些确定模糊测度的方法[6][7][8],但是如何才能确定合适的模糊测度仍然是一件很麻烦的工作。文章讨论下积分在医学中的应用,侧重于解决医学上疾病的分类问题。在这里每一条规则可以看成是一个分类器。

文章从如何有效提高模糊规则融合效果底限的角度出发,提出一种基于下积分的融合方法。该方法将各个模糊规则组合的分类正确率作为效率测度,避免了确定模糊测度这一复杂问题。下积分不再只是普通模糊积分中融合算子的作用,借助下积分将待识别样例在各个规则及其组合之间合理分配,达到利用有限资源提高融合效率底限作用,通过求解关于下积分优化问题,得到样例在各规则及其组合之间优化分配方案(即各规则组合应对多大比例的样例进行分类)。当有一批新的样例需要分类时,不再需要所有规则都参与进来进行分类,而是用得到的优化分配方案,用对应规则组合对其进行分类。规则之间交互作用最大程度提高了融合系统中分类效率底限。

一 模糊测度和模糊积分

定义1[9]:设X是任意一个集合,Ω是X上的σ-代数,定义在Ω上的集函数μ:Ω→[0,1]称为模糊测度,必须满足以下条件:

(1)μ(Ø)=0,μ(X)=1(正则性)

(2)μ(A)≥0,∀A∈Ω,(非负性)

(3)μ(A)≤μ(B),∀A,B⊂Ω,A⊂B.(单调性)

当μ满足1和2时,称其为效率测度。模糊测度和效率测度都是非负集函数。

基于模糊测度的最常用积分有Choquet积分和Sugeno积分,Choquet积分是一种线性积分,是由勒贝格积分发展来的,如果交互作用不存在,Choquet积分就蜕变为勒贝格积分。

定义2[9]:设 f:X→[0,+ ∞],μ 是定义在 X上的模糊测度,f关于μ的Choquet模糊积分定义为:

其中Fα={x|f(x)≥α,x∈X}.

设有定义在集合 X上的函数 f:X→[0,+∞],则函数f关于模糊测度μ的下积分定义[10]如下:

其中aj≥0,Aj= ∪i:ji=1{xi},j的二进制串表达式记为 jnjn-1…j1,j=1,2,…2n- 1.

下积分的值可以通过求解以 a1,a2,…,a2n-1为变量的线性优化问题得到。aj≥0,j=1,2,…2n- 1

其中,μj= μ(Aj),j=1,2,…2n- 1.

下积分和其他模糊积分一样不满足线性性质,所以用它作为融合算子能体现出模糊规则之间交互作用。

二 下积分在医学上的分类研究

(一)基于下积分的融合方法

下积分定义里蕴含着一种优化机制。在模糊规则融合过程中,下积分代表把一批测试样例在各个模糊规则组合间进行分配时,融合系统融合效率的底限,体现了最保守的融合效率。对于此,提出基于下积分的模糊规则融合分类方法。

幂集P(X)中每一个元素表示一个模糊规则组合,每条规则代表一个分类器,若有n条规则,则共有2n-1种组合方式,即有2n-1个分类器。例如{x1}表示单个规则,{x1,x2}表示两条规则一起工作,其中每个规则都有分类精度,借助融合算子对它们的分类结果进行整合,融合算子可以是平均、加权平均,也可以是取大取小等。如果组合中只有一条模糊规则,则直接计算正确率;如果组合中包含多条规则,要先用融合算子对多条规则分类结果进行融合,再计算由它们组合得到的分类精度,各规则及其组合的分类精度可以看成是(X,P(X))上的效率测度μ,直观体现出各规则重要度和它们之间交互作用。

建立分类效率底限模型:

其中bi是j的二进制表达式bnbn-1…b1中的第i位,j=1,2,…2n-1,aj所对应的规则组合为{xk|bk=1,bnbn-1…b1是j的二进制表式,k=1,2,…,n}。这里的两个约束条件分别表示各规则只能够对正确分类的样例分类,一个样例只能被一个规则组合分类。

通过求解,此优化模型可以得到使待识别样例得到较高分类精度的分配方案。进行分类时,按照所求最优解把样例分成几个不相交子集,每一个样例子集由一个模糊规则组合进行分类,不用所有模糊规则都参与进来,这是和普通积分不一样的地方。哪些样例在同一子集呢?应该是能够被同一规则组合正确分类的样例。但是对于未知样例,这一点很难做到。为解决这个问题,要预测模糊规则,看预测的模糊规则组合可对哪些样例进行正确分类,就把这些样例分给这个组合去分类。同一个分类器组合可把样例分成两类,即正确分类样例和错误分类样例。利用这两类样例预测分类器,确定哪些样例适合在同一个分类器组合中分类。

(二)医学数据的试验结果

我们选用医学中常用的Pima India diabetes data(妊娠期糖尿病) 和 Breast Cancer[12](乳腺癌)来检验下积分的分类融合效果。Pima India diabetes data是一个诊断是否患糖尿病的两类问题的数据库,里面有768个事例,其中268个正例,500个负例,有8个数值型的属性值。Breast Cancer是一个是否得乳腺癌的两类问题的数据库,里面有499个事例,其中258个正例,241个负例,有10个数值型的属性值。

每个数据集被随机分成两部分,70%作为训练样例,30%作为测试样例。在这里用模糊ID3抽取模糊产生式规则。通过求解可以得到使融合系统分类效率达到最大的样例分配比例,对分配比例不为零的模糊规则进行组合,形成预测规则组合。50次试验测试集上的平均分类正确率如下表:

Table1.The result of experiment表1 实验结果

由表1可以看出,基于上面两个数据库,下积分融合的正确率高于普通积分,试验验证了基于下积分的融合方法的可行性和有效性,同时说明了疾病症状之间交互作用的存在性,考虑这种交互性可以提高诊断准确度。

[1]刘涛,付君,邓平基.基于熵权模糊积分的医疗质量综合评价[J].中国卫生统计,2010(5).

[2]高丽娟.To PSIS法对医院医疗质量管理的综合评价[J].中国卫生统计,2007(3).

[3]甘琴霞.模糊数学在中医学领域的应用进展[J].江苏中医药,2007(1).

[4]张彩坡.模糊积分及多分类器融合在医疗诊断中的应用[D].天津:天津理工大学,2010.

[5]吴志龙.改进的模糊遗传算法在医学中的应用和研究[D].天津:天津理工大学,2010.

[6]Michel Grabisch,Jean - Marie Nicolas.Classification by Fuzzy Integral:Performance and Tests[J].Fuzzy Sets and Systems,1994(65).

[7]Zhenyuan Wang,Kwong-sak Leung,Jia Wang.A Genetic Algorithm for Determining Non Additive Set Function in Information Fusion[J].Fuzzy Sets and Systems,1999(102).

[8]Zhenyuan Wang,Wenye Li,Kwong - sak Leung.Integration on Finite Sets[J].International Journal of Intelligent Systems,2006(21).

[9]王熙照等.模糊测度和模糊积分及在分类技术中的应用[M].北京:科学出版社,2008.

[10]Zhenyuan Wang.Kwong - Sak Leung.Jia Wang.Low Integrals and Upper Integrals with Respect to Non Additive Set Functions[J].Fuzzy Sets and Systems,2008(159).

[11]沈君.用特殊结构的模糊测度表示规则间的交互作用[D].石家庄:河北大学,2006.

[12]Theories.ftp://ftp.ics.uci.edu/pub/machine - learning data base,2005.

猜你喜欢
样例测度帕金森病
手抖一定是帕金森病吗
样例呈现方式对概念训练类别表征的影响
三个数字集生成的自相似测度的乘积谱
R1上莫朗测度关于几何平均误差的最优Vornoi分划
非等熵Chaplygin气体测度值解存在性
Cookie-Cutter集上的Gibbs测度
“样例教学”在小学高年级数学中的应用
帕金森病科普十问
帕金森病的治疗
基于样例学习研究的几点展望