一种双层基因调控网络的构建方法

2019-05-14 08:25张莉彬宋凯利
数字技术与应用 2019年2期
关键词:癌症基因

张莉彬 宋凯利

摘要:基因网络是一种复杂的生物网络,描述了基因与其他作用因子之间的调控关系。相同的基因可以和不同的调控因子通过相关作用关系构成基因调控网络,而miRNA是近年来研究发现的一种新型基因调控元件,现已成为基因调控网络的重要组成部分。鉴定与多种癌症相关的miRNA及其靶基因,有助于了解基因与癌症等复杂疾病的关系,并为针对泛癌症的生物药物研制及靶向治療提供参考。

关键词:基因;miRNA;癌症

中图分类号:TP301.6 文献标识码:A 文章编号:1007-9416(2019)02-0057-02

0 引言

MicroRNA简称miRNA,是一类内源性非编码的小RNA分子,它们通过与靶基因相互作用来调控复杂疾病的生物过程,尤其在许多癌症进程中起到了关键作用。针对单一基因或miRNA的研究对深入了解癌症的病发过程具有一定的局限性,本文则通过研究与泛癌症相关的基因和miRNA数据,对miRNA之间和基因之间做关联分析,提出了一种miRNA-基因双层调控网络的构建方法,解释了参与调控多种癌症过程的重要作用因子之间的合作机制,为癌症的风险预测以及生物靶向药物的研制提供帮助。

1 双层基因调控网络的构建方法流程

1.1 构建方法流程图

构建双层基因调控网络的方法包括:分析网络中重要调控因子miRNA的表达数据;利用统计检验方法选出与多种癌症相关的miRNA;度量miRNA之间的皮尔森相关性;根据可调控癌症的数量和相关性对miRNA进行排序,筛选出强相关的miRNA,获取其靶基因以及它们之间的相互作用关系[1]。

1.2 方法构建步骤

第一步,预处理miRNA数据集:

(1)去掉原始样本中有缺失值的数据,剔除平均表达值小于10的miRNA以降噪;(2)对每行数据进行t检验够过滤掉P-value大于 0.5的miRNA;(3)分别计算各组miRNA数据集中患病样本表达值与正常样本表达值之间的Fold Change(FC)值,设定阈值为2,即FC绝对值大于2时预示对应的miRNA在癌症中表达显著异常;

筛选出的miRNA是影响多种癌症的生物过程的miRNA。

第二步,根据T值和C值对miRNA进行排序,Ti表示miRNA i在多种癌症中表达异常的次数,Ci按照如下公式计算:

;

其中,N为至少在五种癌症中表达异常的miRNA组成的集合,n为集合N的元素个数,PCC(i,j)为miRNA i与miRNA j的皮尔森相关系数值。选出排序最高的若干miRNA记为重要miRNA。

第三步,使用miRanda、miRDB、RNA22、TargetScan和CancerMiner这五种方法预测重要miRNA的靶基因,根据False Discovery Rate(FDR)小于某设定阈值的条件分别取五种预测结果的交集,作为靶基因预测结果。FDR设定阈值为0.01,即选取FDR小于0.01的基因作为相应miRNA的候选靶基因,以此降低数据内部噪声和提高靶基因鉴定准确率。

第四步,将各miRNA的五种靶基因结果做交集之后,利用STRING数据库,通过基因编码的蛋白质评估得到的交集中基因之间的作用关系。

第五步,综合重要miRNA之间的联系、靶基因之间的联系以及miRNA-基因之间的联系,构建双层基因调控网络。

2 双层基因调控网络的构建方法实现流程

2.1 构建方法实现流程

下面结合实验对本文提出的网络构建方法作详细的描述。

利用PanCancer项目中相关数据集构建双层基因调控网络:

PanCancer项目中,七组数据集有正常样本作为对照,即七种癌症的miRNA数据集可以使用。这七种癌症分别是膀胱尿路上皮癌(BLCA)、乳腺浸润癌(BRCA)、头颈部鳞状细胞癌(HNSC)、肾透明细胞癌(KIRC)、肺腺癌(LUAD)、肺鳞状细胞癌(LUSC)、子宫内膜样腺癌(UCEC)。每组数据集中都有1045个miRNA,样本数量信息如表1所示。

在上述数据集上的具体实施步骤如下:

(1)对7组miRNA原始数据集进行预处理:1)去掉原始样本中有缺失值的数据,剔除平均表达值小于10的miRNA以降噪;2) 对每行数据进行t检验够过滤掉P-value大于0.5的miRNA;3)分别计算各组miRNA数据集中患病样本表达值与正常样本表达值之间的FC值,设定阈值为2;

通过以上方法从1045个miRNA中筛选出235个miRNA,可认为这些miRNA影响多种癌症的生物过程。

(2)在选出的miRNA基础上再筛选出至少在五种癌症中表达异常的miRNA,度量这48个miRNA之间的皮尔森相关性,根据T值和C值对miRNA进行排序,选出排序最高的八个miRNA,分别为miR-590,miR-141,miR-19a,miR-93,miR-96,miR-130b,miR-345,miR-18a。

(3)使用上述五种方法预测重要miRNA的靶基因,根据FDR小于0.01的条件分别取五种预测结果的交集。再将各miRNA的靶基因结果做交集,最终得到60个基因,利用STRING数据库通过基因编码的蛋白质评估最终得到的交集中基因之间的作用关系。

(4)综合八个miRNA之间的联系、48个基因之间的联系和miRNA及其靶标之间的联系,构建双层基因调控网络,如图1所示。

2.2 网络分析

该网络综合了多方面信息,有利于全面了解影响泛癌的重要作用因子以及作用因子合作调控癌症过程的机制。以下是对所构建网络的可靠性分析:

首先,miRNA之间具有强相关性,其中,mir-130b,mir-19a和mir-93是与泛癌相关的miRNA家族成员,它们彼此合作共同调节相同的癌症。同时,mir-93和mir-19a被推断有助于乳腺肿瘤、胃肿瘤、前列腺肿瘤和卵巢肿瘤这些癌症的发展。而在过去研究中总被忽略的miR-590,与其他七个miRNA的皮尔森相关系數值都超过了阈值,实际上它会通过与其他几种常见的致癌miRNA合作来促进癌症的发展[2]。mir-590可以调节其靶肿瘤抑制基因PDCD4和PTEN的表达,其中参与细胞周期调节磷酸酶蛋白质产物的表达而成为肿瘤抑制基因的PTEN,是共调控模块中所有miRNA的常见靶标,可被视为癌症共有的治疗靶标。

其次,众多癌症过程中都发生了基因间的相互作用,如MMP2和TIMP3的表达之间有着强相关性,MMP2是涉及许多癌症的蛋白水解酶,TIMP3的特异性组织抑制剂可调节细胞活性,它们的不平衡表达是肺癌、乳腺癌、结肠癌等多种癌症发展过程中的重要危险因素。E2F1充当调节RRM2表达水平的转录因子,而RRM2的高表达促使直肠癌肿瘤的生长和侵袭。与正常组织相比,大多数癌症组织中两者的蛋白质水平均升高且相互平行[3]。FOXO1可抑制胰腺β细胞中的TXNIP转录,在细胞肿瘤的形成过程中起着关键作用。此外FOXO1还可上调TXNIP在神经元和内皮细胞中的表达,并下调TXNIP在肝脏中的表达。

3 结语

本文基于miRNA与基因之间的调控关系以及两者与癌症之间的重要联系,通过构建miRNA-基因调控网络来帮助分析复杂疾病的机理。基于当前海量的相关数据,挖掘多种癌症中miRNA与miRNA、miRNA与靶基因基、基因与基因间多方位信息,综合于一体,以双层网络的形式呈现出来,可更直观地体现出miRNA通过协作靶向基因调控泛癌症的过程。此项研究会为疾病的研究提供更加全面丰富的信息,有助于从系统层面了解疾病的发病机制和过程,为诊断和治疗疾病提供理论借鉴,将会在未来的生命科学研究中发挥关键作用。

参考文献

[1] 张莉彬.利用miRNA表达谱构建miRNA-基因调控网络[D].西安电子科技大学,2017.

[2] Hongfei Y , Wenhong Z , Wentao Z , et al.Roles of miR-590-5p and miR-590-3p in the development of hepatocellular carcinoma[J]. Journal of Southern Medical University,2013,33(06):804-811.

[3] Zejun F , Chaoju G , Hong L , Xiaomin Z , Lingming M , Mintao S , Lanlan Q , Shuchai L , Zhihua Z , Ronghui Z , Hongqian Gu , Xiang C . E2F1 promote the aggressiveness of human colorectal cancer by activating the ribonucleotide reductase small subunit M2[J]. Biochemical & Biophysical Research Communications, 2015, 464(2):407-415.

Method for Constructing Double-layer Gene Regulation Network

ZHANG Li-bin,SONG Kai-li

(Xi'an Aviation Vocational and Technical College, Xi'an  Shaanxi  710023)

Abstract:A genetic network is a complex biological network that describes the regulatory relationship between genes and other contributing factors. The same gene can form a gene regulatory network through a related relationship with different regulatory factors. miRNA is a novel gene regulatory element discovered in recent years and has become an important part of the gene regulatory network. Identification of miRNAs and their target genes associated with various cancers can help to understand the relationship between genes and complex diseases such as cancer, and provide reference for biopharmaceutical development and targeted therapy for pan-cancerous diseases.

Key words:gene; miRNA; cancer

猜你喜欢
癌症基因
BCAA代谢异常与癌症的相关性研究进展
Frog whisperer
留意10种癌症的蛛丝马迹
癌症“偏爱”那些人?
对癌症要恩威并施
不如拥抱癌症
邓大君:矢志不渝 为癌症破晓