基于变精度粗糙集理论在肿瘤诊断的研究

2019-04-20 02:23邢瑞芳刘巍樊亚云
科技视界 2019年3期
关键词:约简粗糙集等价

邢瑞芳 刘巍 樊亚云

【摘 要】对肿瘤病例使用变精度粗糙集与贝叶斯方法到处的诊断规则准确性高于粗糙集理论的诊断准确性。基于变精度粗糙集与贝叶斯网络的肿瘤诊断模型对提高肿瘤诊断水平具有良好的临床使用价值,为肿瘤的诊断与分类提供了一种新思路。

【关键词】粗糙集;肿瘤诊断

中图分类号: R651.15 文献标识码: B            文章编号: 2095-2457(2019)03-0043-001

DOI:10.19694/j.cnki.issn2095-2457.2019.03.015

Research on diagnosis of tumor based on variable precision rough set theory

XING Rui-fang LIU Wei FAN Ya-yun

(Xian Peihua University,Xian Aerospace General Hospital, Xian Shaanxi 710125, China)

【Abstract】The diagnostic accuracy of variable-precision rough set and Bayesian method for tumor cases is higher than that of rough set theory. The tumor diagnosis model based on variable precision rough set and Bayesian network has good clinical value in improving the level of tumor diagnosis and provides a new idea for the diagnosis and classification of tumors.

【Key words】Rough Set Theory; Tumor diagnosis

粗糙集理论是一种处理不精确、不确定与不完全数据的新的数学方法,主要应用在机器学习、数据挖掘、决策、归纳推理等方面[1-2]。

定义1(等价类)[3]设R是K上的一个等价关系,与K中的一个元素k等价所有元素组成的集合叫做k的一个等价类,记作[k].

定义 2(不可区分关系)[4]如果P?哿R,同时P≠φ,那么∩P也同样是一个等价关系,属于P上的不可区分关系,可将其记作ind(P).

定义3(上近似,下近似)[5]K=(U,R),X?哿U,R是U上的等价关系,X的下近似小于等于β的分类误差被包含在X里的R等价类的并,X的上近似为小于等于β的分类誤差与X的交集不为空的等价类的并。

定义4(多数包含关系)[5]若任何一个e∈Y则称X包含于Y,记作Y?勐X,令:

其中|X|是集合X的基数,集合X关于集合Y的相对错误分类率称为c(X,Y).

令(0≤β≤0.5),多数包含关系定义为

定义5(β约简)[5]条件属性集P关于决策属性集Q的β约简或急死约简P是的一个子集red(P,Q,β),并且满足以下两个条件:

(1)r(P,Q,β)=r(red(P,Q,β),Q,β)。

(2)从red(P,Q,β)中无论去掉哪一个属性,条件(1)都不成立。

贝叶斯网络是有向无环图中得知一组随机变数及其n组条件概率分配的性质。在已知某种症状下,贝叶斯网络就可用来计算各种可能罹患疾病之发生的概率。

在肿瘤诊断方法研究中,应用贝叶斯网络技术,对症状与症状起因间的相关关系、症状起因形成证明的规律进行探讨,样本量为850例,通过粗糙集理论将条件属性的重要度排行,得到调整后超声诊断症状和病理类型建立关系集合列出最小属性集,再利用贝叶斯网络推理出肿瘤病理类型的概率。

假设:U={1,2,…,850},C={b,c,d,e,f,g}为条件属性,D={a}为决策属性。良性肿瘤a=1,恶性肿瘤肿瘤a=2;b=回声(取值1-9分别表示低回声,实性,囊性,混合,等回声,中等,中低性,实质不均质,无回声);c=边界(取值1,2,3表示清楚,毛糙,成角);d=形态(1,2,3分别表示规整,不规整,凸向包膜外);e=CDFI(1,2,3,4,5分别表示短线状血流,肿块内及周边见血流信号,肿块内及周边血流丰富,肿块内及周边未见血流信号,环状血流);f=肿块内斑点状强回声(1,2分别表示有,无);g=淋巴结肿大(1,2分别表示有,无)。

通过计算,可以得到条件属性b,c,d,e,f,g的重要性分别为:

所以条件属性C的决策属性D约简为C-{c}={b,d,e,f,g}为c,g,f,d,b,e,由粗糙集重要度得到相对重要度。判断肿瘤的恶性到良性的顺序是淋巴结肿大、肿块内斑点状强回声、形态、回声、CDFI,征兆编号m1-6:征兆类型为稍高回声、低回声、混合回声、包膜欠完整、无砂粒样钙化、内部回声均匀。

病理类型结节性甲状腺肿、甲状腺腺瘤、乳头状癌、滤泡癌、髓样癌、未分化癌,症状编号分别为a1-6。

【参考文献】

[1]周正国.基于变精度粗糙集的约简算法在网络教育资源检索中的应用[J].信息技术与信息化,2018(12):84-85.

[2]冯志强,焦自权,陈善本,柳存根,刘鹏,余建星,黄伟铭.基于粗糙集知识约简的焊接动态过程建模[J].数学的实践与认识,2018,48(24):203-211.

[3]夏秀云,田浩,田时宇.基于测度的广义覆盖粗糙集模型[J].计算机与数字工程,2018,46(12):2413-2418+2424.

[4]胡名彩,郭伏,叶国全.基于改进变精度贝叶斯粗糙集的感性知识获取[J].东北大学学报(自然科学版),2018,39(12):1794-1799.

[5]刘丽华,周涛,周乾智.基于VPRS粗糙熵的图像分割[J].计算机工程与应用,2018,54(20):178-183.

猜你喜欢
约简粗糙集等价
等价转化
基于二进制链表的粗糙集属性约简
实值多变量维数约简:综述
基于模糊贴近度的属性约简
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
收敛的非线性迭代数列xn+1=g(xn)的等价数列
两个域上的覆盖变精度粗糙集模型
环Fpm+uFpm+…+uk-1Fpm上常循环码的等价性
一种改进的分布约简与最大分布约简求法