基于邻域粗糙集的特征基因提取分析

2017-06-06 11:41刘翠翠
电脑知识与技术 2017年9期
关键词:粗糙集

刘翠翠

摘要:在我国当前,由于传统的基因提取计算方法会导致在选择过程中提取出大量的剩余基因,从而导致提取樣本的测试数据准确率不高。因此研发了一种基于邻域粗糙集的特征基因提取方案。此方案的研发是为了避免基因提取过程中数据偏离理性化所导致的经济损失,通过此种基因提取方案来有效提高提取基因时的理性准确率。该文首先简要阐述了基于邻域粗糙集的基本理论概念,以及基于邻域粗糙集的特征基因提取分析的方法,对实验结果进行分析探讨。

关键词:基于邻域;粗糙集;特征基因提取

随着大批量的基因表达谱技术的发展,基因提取基于当前发病原因以及临床病情进行诊读的有效手段。基因提取是从表达的谱数据之中选择基因的子集属性,并且所获得基因能够具有强大的疾病发现且识别的能力。通过把基因按照排序的方法对基因进行划分,在划分过程中按照计分准则。进而划分的基因分值结果较大的情况下就将其作为预选基因,因为基因的分值大,它所代表的能力就强。目前经常被使用的基因提取方案要则就是信噪比指标,FISHER判别以及误分类阙值等,在其中信噪比指标应用较为广泛。而基因排序的方法不依赖于任何算法,并且能够有效避免出现“过拟合”的分子现象,因此通常选用此种方法用于基因提取数据。如果想要完成基因提取数据,那么就要对基因的选择采取适当的方法,通常我们所采取的基因选择方法就是过滤以及缠绕法。由于采用过滤的基因选择方法是由于其具有便捷的特点,比如信噪比、信息增益等方法,但是此种方法可能会在选择过程中出现关联性较高的特征基因。如果出现这种情况,那么就会降低其分辨基因类别的能力,而且也会增加计算负担,降低工作效率;而缠绕选择基因方法是在选择过程中通过将基因分类器产生准确的分类评价基因子集,用时较长,分类过程中的复杂性也很高,并且特征类的基因子集在缠绕法的基因分类器中得到泛化的能力减弱。因此鉴于基因表达数据的自身特点,为了保证尽可能地采用少量的基因信息来获取高样本的基因分类,降低计算负担,我们将主要对基于信噪比与邻域粗糙集的特征基因提取办法进行探讨。

猜你喜欢
粗糙集
粗糙集与包络分析下舰船运行数据聚类算法
局部多粒度覆盖粗糙集
基于二进制链表的粗糙集属性约简
基于粗糙集的不完备信息系统增量式属性约简
优势直觉模糊粗糙集决策方法及其应用
基于键树的粗糙集属性约简算法
悲观的多覆盖模糊粗糙集
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
两个域上的覆盖变精度粗糙集模型