基于GCBI平台骨关节炎芯片数据的生物信息学分析

2017-12-28 01:31卢云梁江邰湾周静黄维琛徐宇
中医眼耳鼻喉杂志 2017年4期
关键词:差异基因滑膜骨关节炎

卢云 梁江 邰湾 周静 黄维琛 徐宇

基于GCBI平台骨关节炎芯片数据的生物信息学分析

卢云 梁江 邰湾 周静 黄维琛 徐宇

目的从已知的GCBI公共基因芯片分析平台着手初步探索骨关节炎的机制,寻找该病的关键性靶点基因,为今后的研究和治疗指明方向。方法从公共基因芯片数据库GEO(Gene Expression Omnibus)选取GCBI平台支持后期处理分析的人类骨关节炎组织全基因组RNA芯片(样本为OA患者和正常人的滑膜及软骨组织),下载芯片数据,利用 GCBI 在线实验室筛选出骨关节炎差异基因,分别对差异基因进行 GO 富集分析、KEGG通路分析以及参与生物功能的蛋白相互作用网络分析。结果从符合研究纳入条件的5 个基因表达芯片数据集最终得到648个差异性基因,查到PRKCA、ITGB3、PLCB1、ADCY4、PIK3R3、 NRAS 、ITPR1等7个功能性蛋白在OA疾病发展进程中意义重大,PI3K-AKT、MAPK 信号通路、细胞凋亡、粘附相关通路、Wnt通路、P53通路,VEGF通路共9条通路与骨关节炎的发病密切相关。结论利用生物信息学有助于分析骨关节炎基因芯片数据,探索参与OA进程的核心蛋白和信号转导通路,为探索治疗靶点和发病机制提供理论依据。

骨关节炎; 基因芯片; 生物信息分析; 滑膜; 软骨

骨关节炎(osteoarthritis,OA)是以一种常见慢性退行性疾病,可引起受累关节疼痛、活动受限并最终导致关节功能障碍,据我国流行病学研究报道,中国人大于 40 岁的人群中,OA整体患病率约 46.3%[1],国外研究显示,OA 患者的全球伤残调整生命年在非传染疾病中位居前十[2],既往观点认为该病病理特征以关节软骨进行性退变为主(包含软骨细胞凋亡、软骨下骨重建、骨赘形成),但近年来发现低水平的炎症参与了OA的进程(滑膜水肿增生、炎症因子释放)[3],因此此前有许多关于OA的研究聚焦于滑膜或软骨标本差异性基因研究上,这类基因芯片研究数据相当一部分汇集于公共数据库GEO(Gene Expression Omnibus)上,而国内GCBI生物信息分析平台汇集了GEO在内的多个数据库及分析技术模块,这为我们提供了综合该病现有生物信息数据、进行病灶与正常组织差异性基因发掘的有利条件,使探索该病致病基因、信号通路甚至治疗靶点的手段更为丰富。本研究利用公共基因芯片数据库(GEO)中的骨关节炎RNA基因芯片数据,对该病的相关基因进行挖掘,并进行生物信息学分析,现报道如下:

1 资料与方法

1.1 资料来源

在GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)下载OA芯片数据。每个数据集均需符合以下条件:(1)数据集来自全基因组 RNA 表达芯片;(2)因OA病理核心表现与软骨退变和滑膜炎症相关,因此选取差异性基因样本研究来源于滑膜和软骨,实验使用人类骨关节炎滑膜或软骨组织与正常滑膜或软骨组织对照,每组样本至少不小于3个。(3)GCBI平台支持已获取的芯片数据进行后期运算分析。

1.2 方法

在GEO下载的原始芯片数据,导入GCBI(http://www.gcb.com.cn)在线平台。在该平台实验室内,创建一个分析基因芯片差异基因的实验方案,平台自动按设计的方案为导入的芯片数据分组如下,按照GCBI生物信息分析模块构建如图分析路线图(图1),获得多个研究中正常组织和患者组织的差异基因并取得交集差异基因(若差异基因少于10,则取并集),依次针对差异基因的功能和生物过程进行 Gene Ontology 功能富集分析(GO 分析),信号通路富集分析(KEGG分析)、趋势分析,String网站(https://string-db.org)上进行差异基因蛋白的相互作用网络分析(PPI并绘制网络关系图,)以上分析取前20项最显著的条目,不足20条者罗列全部条目。

2 结果

2.1 纳入芯片汇总资料(共5块芯片)

图1 基于GCBI平台构建的模块分析路线图

表1

2.2 差异基因

GCBI平台对上传的原始芯片数据,首先进行芯片信号值的预处理与预过滤,然后使用差异分析方法 SAM法,依次对所纳入的 5套芯片数据进行差异基因的筛选。滑膜标本组:差异基因的筛选条件为:Q 值 < 0.05,差异倍数≥1.5倍,其中从GSE55235中获得差异性基因1804个,表达上调的基因有884个,下调的基因920个;从GSE82107中获得差异性基因1342个,表达上调的基因有693个,下调基因649个;从GSE12021中获得差异性基因1150个,表达上调的基因有10个,下调基因1140个;3个差异性基因数据集取交集得53个差异基因。软骨标本组,2块芯片:差异基因的筛选条件为:Q 值 <0.05,差异倍数≥1.2倍,因样本量少,取交集得差异基因较少,仅11个,考虑OA同时有滑膜增生和软骨退变,为避免遗漏差异性基因,我们将滑膜来源的差异性基因交集(53个)与软骨来源的差异基因并集(606个)合并,得648个差异基因,进行进一步的生物信息学分析。

2.3 GO富集分析

取并集后的 648个差异基因,用 GCBI平台自带的GO分析模块分别作生物学进程和分子功能 GO 富集分析(FDR<0.01),结果显示这些基因富集在胶原蛋白生成代谢、血管新生等生物学进程和细胞外基质构成、相关受体结合、金属离子、部分细胞因子(生长因子为主)结合或活化等分子功能上。见表 2。

表2 GO 富集分析生物过程的结果

表3 GO富集分析分子功能的结果

续表3

GO编号注释基因数FDR值GO:0048407血小板源生长因子结合65.46E⁃07GO:0005102受体的结合196.03E⁃06GO:0005178整合素的结合116.15E⁃06GO:0004867西林类肽链内切酶抑制剂的活性111.55E⁃05GO:0002020蛋白酶绑定91.55E⁃05GO:0008083生长因子活性141.55E⁃05GO:0043184血管内皮生长因子受体2结合41.82E⁃05GO:0042802同源蛋白结合204.48E⁃05GO:0005096鸟苷三磷酸酶的激活124.61E⁃05GO:0070492低聚糖的结合30.000211125GO:0004222金属内肽酶的活化100.000232253

2.4 通路分析

取并集后的 648 个差异基因,用 GCBI平台自带的Pathway分析模块作通路分析,共获得富集通路107条,最显著的20条通路结果显示,这些基因显著富集于细胞外基质构建、补体系统与凝血、黏着斑以及免疫炎症相关的PI3K-Akt 信号通路、MAPK信号通路,与某些特殊感染、癌症相关疾病通路也有密切联系。(P值<0.05)。在此基础上对这107条通路做信号通路间功能方面互相作用网络分析,得到46条显著互相作用的信号通路,其中交互作用最显著9条的核心通路为MAPK 信号通路、细胞凋亡、粘附以及钙离子相关通路、Wnt通路、P53通路,VEGF通路,与骨关节炎的发病密切相关,见表 3。

表4

续表4

编号注释基因数P值5146阿米巴病141.74106E⁃094270血管平滑肌收缩146.26743E⁃095200癌症相关通路214.83776E⁃084066HIF⁃1信号通路111.01875E⁃064540缝隙连接101.60154E⁃064726含血清素的神经突触通路112.12086E⁃064912促性腺激素信号通路102.18308E⁃064010MAPK信号通路163.86923E⁃064730抑郁症相关85.52384E⁃065166人类T淋巴细胞细胞性病毒感染165.72222E⁃065210结肠直肠癌相关87.11345E⁃064380破骨细胞分化111.11713E⁃055144疟疾71.46051E⁃054970唾液分泌91.507E⁃05

图2 差异蛋白相互作用网络图注:图中每个圆圈代表一个蛋白,连线代表两个蛋白直接有相互作用关系。一个蛋白与多个蛋白之间有线相连,代表与多个蛋白有相关作用关系,连线代表该蛋白在网络中的地位越重要

2.5 差异蛋白相互作用网络分析

取并集后的 648个差异基因,用 GCBI平台自带的蛋白相互作用网络分析模块分析其单一基因之间的相互作用网络,最终得到88个作用显著的蛋白,将这些蛋白带入蛋白分析数据平台STRING(https://string-db.org/)进行蛋白互相作用分析,作图结果如图2可见:其中最核心的蛋白包括PRKCA 、ITGB3 、PLCB1 、ADCY4、PIK3R3、 NRAS 、 ITPR1,这些蛋白与周围蛋白的关系数目均大于10(称之为度,即圆圈所示某一蛋白的外周连线数目超过10,表示该蛋白直接联系的上下游基因数目总和)。

3 讨论

基于公共基因芯片数据库的挖掘性生物信息分析是目前关注度较热的一种预测性研究方法[4],这种方法可以协助研究者从自己关注的领域和角度出发,在前人基因芯片研究数据的基础上探索病理组织与正常组织差异性基因,找到潜在的罪犯基因或信号通路,为接下来的研究方向提供指导依据,但国内骨关节炎方面的此类研究尚较少报道。

骨关节炎的进程中存在滑膜增生水肿以及软骨退行性变,本研究从GEO数据库下载5套骨关节炎RNA基因芯片数据(3块芯片滑膜组织来源研究、2块芯片来自软骨标本),利用GCBI生物信息分析平台进行数据挖掘与分析,因滑膜来源芯片数据多,而软骨组织来源芯片数据少,为减少遗漏,我们选择取滑膜来源数据芯片交集,软骨组织来源芯片数据取并集,以上二者再取并集得到差异性基因648个,在此基础上进行差异性基因功能归类注释(GO分析)、信号通路富集分析(Pathway分析)以及蛋白之间、信号通路之间的交互作用网络分析以求探索导致骨关节炎发生的核心功能基因和信号通路,研究结果显示:相对于正常组织,OA组差异性基因主要表现在胶原蛋白生成代谢、血管新生等生物学进程和细胞外基质构成方面,这与骨关节炎软骨退变、含水率下降,滑膜一定程度上水肿增生的病理表现相符。我们发掘出差异显著的基因RGS2、IER3、RAM1、AP-1在后续的研究文献溯源查阅中得到了一定的证实,如:RGS2(G蛋白信号调节因子2)是一个蛋白编码基因,既往发现RGS2与高血压、焦虑症及肥胖相关[5],但近期的研究证实:RGS2可以协同RGS5,RGS7 RGS10促进软骨细胞发育分化,而RGS4可抑制软骨细胞分化,与NOTCH炎症通路导致的软骨退变也有关联[6],而目前这方面的研究报道尚少。而AP-1是明确参与了骨关节炎发病的明星分子,且有报道[7]发现黄芩素这一中药单体成分通过在转录水平上抑制κc-fos和AP-1的活性从而阻断了滑膜的慢性炎症,保护了软骨的降解,其相关途径包括MAPK、RET信号等通路。而经过pathway分析,这些差异基因显著富集的MAPK 信号通Wnt通路、VEGF通路、P53通路都是近10年来与骨关节炎炎症发生、滑膜水肿增生密切相关的通路,而细胞凋亡、粘附以及钙离子相关通路也与软骨变性、破坏相关。蛋白交互作用作网络分析中我们发现了88个作用显著的蛋白,其中(PRKCA、ITGB3、PLCB1、ADCY4、PIK3R3)是最显著的5个核心蛋白,文献溯源[8]提示:PRKCA(Protein kinase C alfa,蛋白激酶C-a)参与了细胞粘附、细胞转化、细胞周期和细胞体积变化等多种生物过程,是激活MAPK炎症信号通路的重要激酶,对OA的炎症发生有重要意义。而ITGB3(integrin,beta 3,整合素beta-3)是细胞黏附分子家族的重要成员之一[9],主要介导细胞与细胞、细胞与细胞外基质(ECM)之间的相互黏附,并介导细胞与 ECM 之间的双向信号传导,参与了血管生成,侵袭转移、炎症、伤口愈合和凝血等生理和病理过程,在PI3K炎症相关通路中扮演重要角色,参与了OA滑膜炎症的的发生,目前以整合素为治疗靶点的含精-甘-天冬序列的多肽,(Arg-Gly-Asp,RGD)[10]能抑制破骨细胞之间、破骨细胞与基质之间的黏附,阻止破骨细胞的增殖、迁移、分化,从而促进骨组织的再生。ADCY4(adenylate cyclase 4,腺苷酸环化酶4)[11]广泛分布于哺乳动物的细胞膜中,催化ATP生成cAMP并释放焦磷酸,对软骨细胞的能量代谢、老化凋亡有重要意义,这些蛋白在软骨组织滑膜组织中含量较多,提示了潜在的致病机理和成为治疗靶点的可行性,部分研究已经进展至相应的靶向药物,为未来临床治疗用药指出了方向。

本研究尚存在一些缺陷和问题:①GCBI生物信息分析平台虽然整合了GEO数据库,KEGG数据库,STRINBG数据库及分析平台的部分资源和功能,较大程度实现了数据共享、一次进行多种方法和角度分析,迅速显示结果的需求,但并不能完全涵盖所有数据,即使是GEO数据库内的RNA芯片数据也不能全部支持匹配分析,因此纳入数据有一定局限性。②同一差异性基因存在多个别名,各大网站数据库难以涵盖所有别名,为研究带来困难,③目前国内大量的生物信息研究通常是在GEO数据库平台找到目的芯片数据进行找到差异性基因,分别带入DAVID网站进行GO分析、KEGG网站进行pathway 分析,STRING网站进行蛋白互作网络化分析,较少有直接利用国内GCBI一站式完成所有数据获取和分析的研究,且更缺乏同一对象同时利用上述多网站平台分析和GCBI一站式分析的对比分析,以评价哪种研究遗漏数据较多、偏倚性如何,这是今后必须关注的方向。④不同研究的芯片数据或因为样本本身存在个体化差异,或因为芯片设计(如探针敏感性特异性有差异)导致同一基因在A研究中疾病组表现为表达上调,而在B研究中表现为下调或差异不明显,多个研究数据差异基因的交集难以确认表达量情况,导致后期筛选出来的差异基因必须进行浩繁的文献回溯验证才能使结论更加严谨。⑤生物信息分析毕竟只是对既往研究数据的归纳整理,与真实世界的基因表达尚存在距离,尤其现有文献无报道的情况下,找到的显著差异性基因可能与发病本身无关,因此有必要进行进一步的实验验证,如再获取标本进行免疫组化分析或细胞层面上的基因表达量研究。虽然有问题和缺陷,GCBI整合国际上多个权威基因数据库和分析平台,构建一站式获取、分析的国内生物信息分析平台的思路是值得肯定的,该平台的营运技术人员也扩大支持分析的芯片类型和数据资源,积极完善分析计算模块的功能,提高其分析精度,数据资源的局限性、不同类型或格式芯片数据的归一化、多平台分析的兼容性这些问题是有望得到解决的。而本研究选出的潜在致病信号通路和关键基因经现阶段文献查阅验证大多存在合理性,我们将在接下来的实际标本免疫组化及细胞实验中进一步验证这些潜在靶点。

[1] 薛庆云,王坤正,裴福兴,等.中国40岁以上人群原发性骨关节炎患病状况调查[J].中华骨科杂志,2015,35(12):1206-1212.

[2] Dalys G,Collaborators H.Global a systematic analysis for the Global Burden of Disease Study[J].Lancet,2016,388(10053): 1603-1658.

[3] 郑毅,温晓宏.关于骨关节炎概念及治疗指南的更新[J].中华风湿病学杂志,2017,21(1):1-3.

[4] Steinberg J,Ritchie G R S,Roumeliotis T I,etal.Integrative epigenomics,transcriptomics and proteomics of patient chondrocytes reveal genes and pathways involved in osteoarthritis[J].Scientific Reports,2017,7(1):8935.

[5] RGS Appleton C T,James C G,Beier F.Regulator of G-protein signaling(RGS)proteins differentially control chondrocyte differentiation[J].Journal of Cellular Physiology,2006,207(3):735-745.

[6] Liu Z,Chen J,Mirando A,etal.A Dual Role for NOTCH Signaling in Joint Cartilage Maintenance and Osteoarthritis[J].Science Signaling,2015,8(386):ra71.

[7] Khan N M,Haseeb A,Ansari M Y,etal.A wogonin-rich-fraction of Scutellaria baicalensis root extract exerts chondroprotective effects by suppressing IL-1β-induced activation of AP-1 in human OA chondrocytes[J].Scientific Reports,2017,7:43789.

[8] Martineau X,Abed é,Martel-Pelletier J,etal.Alteration of Wnt5a expression and of the non-canonical Wnt/PCP and Wnt/PKC-Ca2+ pathways in human osteoarthritis osteoblasts[J].Plos One,2017,12(8):e0180711.

[9] Zupan J,Komadina R,Marc J.The relationship between osteoclastogenic and anti-osteoclastogenic pro-inflammatory cytokines differs in human osteoporotic and osteoarthritic bone tissues[J].Journal of biomedical science,2012,19(1):28.

[10] Santangelo K S,Baker S A,Nuovo G,etal.Detectable reporter gene expression following transduction of adenovirus and adeno-associated virus serotype 2 vectors within full-thickness osteoarthritic and unaffected canine cartilage in vitro and unaffected guinea pig cartilage in vivo[J].Journal of Orthopaedic Research Official Publication of the Orthopaedic Research Society,2010,28(2):149.

[11] Liu J,Hao Y,Wang Y,etal.Candidate methylated genes in osteoarthritis explored by bioinformatics analysis[J].Knee,2016,23(6):1035-1043.

BioinformaticsanalysisofosteoarthritisgenemicroarraybasedonGCBIdatabase

LUYun,LIANGJiang,TAIWan,ZHOUJing,HUANGWei-chen,XUYu

(GuiyangCollegeofTraditionalChineseMedicine,MiaoMedicineCollaborativeInnovationCenter,Guiyang,Guizhou,550000)

ObjectiveTo explore the mechanism of osteoarthritis(OA)and search the key genes as new treating target for future research.MethodsGene microarray profiles on osteoarthritis(samples of synovial membranes or cartilage tissues came from osteoarthritis patients and healthy donors)were download from GEO(Database of Gene Expression Omnibus),then different expressed genes were identified through lab data analytics platform named GCBI,then key functions,pathways and Internal relations between these genes were explored through three methods include gene oncology(GO),KEGG pathway and protein-protein interaction analysis(PPI).Results648 different expressed genes were got from 5 gene expression data sets met the inclusion criteria,7 genes(PRKCA、ITGB3、PLCB1、ADCY4、PIK3R3、 NRAS 、ITPR1)may play important roles in OA,9 bio-pathways appeared to be important in OA,including PI3K-AKT signaling pathway、MAPK signaling pathway、cell apoptosis and adhesion pathway,P53 signaling pathway,VEGF pathway.ConclusionBioinformatics analysis may be helpful to research OA gene microarray data and study key proteins and signaling pathways for treating targets or pathogenesis.

Osteoarthritis; Gene microarray; Bioinformatics analysis; Synovial membrane; Cartilage

基金编号:1)贵州省重大基础研究专项资助项目;项目编号:黔科合J重大字[2015]2002;2)贵州省自然科学技术基金资助项目:黔科合J字[2013]2074号,3)国家自然基金(地区基金):项目批准号 81560817

550000,贵州贵阳,贵阳中医学院 苗族医学协同创新中心

梁江,E-mail:165372999@qq.com

10.3969/j.issn.1674-9006.2017.04.008

R68

猜你喜欢
差异基因滑膜骨关节炎
基于滑膜控制的船舶永磁同步推进电机直接转矩控制研究
抗抑郁药帕罗西汀或可用于治疗骨关节炎
高层建筑施工中的滑膜施工技术要点探讨
三伏贴贴敷治疗寒湿痹阻型膝骨关节炎的临床观察
骨关节炎患者应保持适量运动
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
血糖血脂对骨关节炎的影响
紫檀芪处理对酿酒酵母基因组表达变化的影响
关节镜在膝关节滑膜软骨瘤病诊治中的应用
SSH技术在丝状真菌功能基因筛选中的应用