黑安格斯牛CEBPA基因的克隆及生物信息学分析

2021-08-26 07:04周子航蒋秋斐马正旭黄增文冯小芳禹保军王卫振顾亚玲
关键词:安格斯结构域氨基酸

周子航,封 元,王 瑜,蒋秋斐,张 娟,马正旭,黄增文,冯小芳,郭 菊,王 影,禹保军,王卫振,顾亚玲

(1 宁夏大学 农学院,宁夏 银川 750021;2 宁夏畜牧工作站,宁夏 银川 750001)

黑安格斯肉牛品种优良,原产地为英国,由于其适应能力较强、出肉率高、繁殖性能强、生长速度快、饲料利用率高、肉品质好等特点被引入我国[1],属于专门化的肉牛品种[2]。研究表明,同月龄黑安格斯牛的体质量和各项肉质指标均高于秦川牛[3],利用黑安格斯牛与早胜牛杂交,其后代在早期强度育肥条件下肉用性能更强[4]。

CEBPA基因是C/EBPs家族的一员,可与脂肪细胞特定区域进行特异性结合,从而对葡萄糖摄取进行调节,这极大影响着脂肪细胞的分化完成,并起到促进作用[5],该家族中所有基因具有相似的结构特征,均含有一段保守的碱性亮氨酸拉链结构。C/EBPs家族基因包含多种亚型及异构体,可对特定基因结构进行激活,对脂肪细胞的分化起着关键作用,能在调控过程中使家族内影响脂肪分化的基因于不同时期进行表达[6],并在机体免疫反应和损伤应答过程中发挥关键作用[7]。相关研究表明,牛的CEBPA基因定位在18号染色体上,仅有一个外显子,无内含子,主要分布在脂肪和胆固醇代谢相对较旺盛的组织,如脂肪、肝脏、肺、肾上腺等[8]。该基因参与着多个与脂肪相关基因的转录表达[9],并受到多个基因的调节,影响该基因在脂肪细胞分化中的表达,其中与CEBPA基因同属C/EBPs家族的C/EBP-δ和C/EBP-β基因对其起着调节作用[10],PPAR-γ基因对CEBPA基因以正反馈作用影响着脂肪的生成[11-12]。CEBPA基因还与自身存在着作用机制,可以结合调控区位点,从而产生更多的CEBPA基因,若基因调控区CCAAT重复序列发生突变,那么基因的表达也随之受阻[13]。目前国内外关于CEBPA基因的研究多集中在人的急性髓系白血病(AML)中,有关CEBPA基因在黑安格斯牛上的基因编码区序列结构及功能预测的研究尚鲜有报道。

本研究以宁夏地区24月龄健康黑安格斯牛背最长肌组织为材料,使用GenBank中公布的牛CEBPA基因序列,对其CDS区设计特异性引物,进行编码区的扩增、基因克隆、测序,并对编码区进行功能生物信息学分析,以期为后续深入研究CEBPA基因转录水平、蛋白质水平、代谢水平细胞功能等的调控和表达机制,以及我国肉牛的分子育种研究提供理论依据。

1 材料与方法

1.1 材 料

1.1.1 试验材料 在宁夏示范牛场固原富民农业科技发展有限公司,选取3头24月龄健康的黑安格斯牛,屠宰采集背最长肌组织各100 g,剪碎后即刻装入冻存管,标记后置于液氮中,带回实验室于-80 ℃冰箱冻存备用。

1.1.2 试验试剂 RNA提取试剂盒、柱式DNA胶回收试剂盒、RNase-free water,均购于生工生物工程(上海)股份有限公司;氯仿、异丙醇,均购于徐州天鸿化工有限公司;固相RAase清除剂,购于北京天恩泽公司;RevertAid Premium Reverse Transcriptase,购自Thermo Fisher公司;LATaqDNA聚合酶,购自TaKaRa公司。

1.2 黑安格斯牛总RNA的提取及cDNA的合成

使用RNA提取试剂盒提取黑安格斯牛背最长肌组织样总RNA,使用NANODROP核酸浓度检测仪检测总RNA的浓度和纯度,并用1%琼脂糖凝胶电泳检测样本总RNA的完整性及是否有污染。挑取完整度好的RNA用RevertAid Premium Reverse Transcriptase反转录为cDNA,于-20 ℃保存备用。

1.3 CEBPA基因的引物设计及合成

根据NCBI所提供的牛CEBPA基因(登录号:BC149006.1)的mRNA序列,使用Primer Premier 5.0软件设计引物,上下游引物序列(5′-3′)分别为F:TCGCCATGCCGGGAGGACTTTA;R:GGTCCCAGCCGGCGACCA;产物长度为685 bp,并将引物序列送交生工生物工程(上海)股份有限公司合成。

1.4 CEBPA基因CDS区的扩增、克隆和测序

以上述反转录的cDNA进行CDS区扩增,PCR扩增总体系为25 μL:cDNA模板1 μL,上游引物(10 μmol/L)0.5 μL,下游引物(10 μmol/L)0.5 μL,Taq酶(5 U/μL)0.2 μL,2×GC Buffer Ⅰ 12.5 μL,dNTP(10 mmol/L)0.2 μL,灭菌超纯水10.1 μL。PCR扩增程序为:95 ℃预变性3 min;94 ℃变性30 s,58 ℃退火30 s,72 ℃延伸90 s,共33个循环;72 ℃修复延伸7 min,4 ℃保存。PCR扩增产物用1%琼脂糖凝胶进行电泳检测,使用凝胶纯化试剂盒纯化回收目的片段。

将目的片段与pMD18-T载体在4 ℃连接过夜后转化至感受态细胞(SK2301),转化步骤为:冰浴30 min,42 ℃水浴热激60 s,冰上12 min,加入LB培养基混匀后放入摇床,于37 ℃、220 r/min 振荡培养1 h,将细菌涂布于含有氨苄青霉素的平板上,倒置37 ℃培养过夜,挑取菌落进行培养,并进行菌液PCR扩增,然后送生工生物工程(上海)股份有限公司测序。

1.5 CEBPA基因的生物信息学分析

利用Seqman软件完成黑安格斯牛CEBPA基因序列的校对、拼接;利用BioEdit[14]软件完成核苷酸基本组成信息的分析及基因序列的比对。利用MEGA5[15]软件进行核苷酸序列的多重比对,以邻接法构建不同物种的进化树并进行遗传距离分析;使用ProtParam软件进行分子量、等电点等理化性质分析(http://web.expasy.org/protparam/);使用ExPASy软件分析基因编码蛋白质的亲水性(https://web.expasy.org/protscale/);采用TMHMM Server 2.0 软件分析基因编码蛋白质跨膜结构域(http://www.cbs.dtu.dk/services/TMHMM-2.0/);采用InterPro蛋白质数据库预测蛋白质保守结构域(http://www.ebi.ac.uk/interpro/);利用SignalP-5.0软件预测基因编码蛋白的信号肽(http://www.cbs.dtu.dk/services/SignalP/):使用NetPhos 3.1软件分析蛋白质的磷酸化位点(http://www.cbs.dtu.dk/services/NetPhos/)[16];采用 Immune Epitope Database (IEDB)数据库预测B细胞抗原表位(http://tools.iedb.org/bcell/);使用PSORT Ⅱ Prediction软件预测亚细胞定位(https://psort.hgc.jp/form2.html);利用MethPrimer 2.0软件预测CpG岛(http://www.urogene.org/methprimer/);使用PSIPRED软件分析预测基因编码蛋白质的二级结构(http://bioinf.cs.ucl.ac.uk/psipred/);通过SWISS-MODEL软件对基因编码蛋白质的三级结构进行分析(http://swissmodel.expasy.org/);通过String数据库进行基因共表达分析;采用轮廓隐马尔可夫模型(profile hidden Markov models, profile HMMs)软件对蛋白数据库进行生物序列分析与检索(https://www.ebi.ac.uk/Tools/hmmer/)。

2 结果与分析

2.1 黑安格斯牛肌肉组织总RNA的检测及CEBPA基因CDS区扩增

黑安格斯牛背最长肌组织总RNA琼脂糖凝胶电泳检测结果(图1)表明,提取的牛总RNA具有较好的完整性,无明显的降解,OD260/OD280值为1.7~2.0,说明RNA纯度较高,可满足后续试验的要求。将黑安格斯牛CEBPA基因序列的CDS区进行PCR扩增后,扩增产物用1%琼脂糖凝胶进行电泳检测,结果表明扩增片段条带较整齐,条带明亮无引物二聚体等杂带,说明引物特异性较好。该基因序列CDS区的扩增产物长度为685 bp,与预测目的条带大小相符(图2),测序峰图结果正常,说明可用于后续生物信息学分析。

1~3.3头黑安格斯牛背最长肌总RNA1-3.Total RNA of longissimus dorsi muscle in 3 black Angus cattle

2.2 黑安格斯牛CEBPA基因CDS区生物信息学分析

2.2.1 CDS区碱基成分 对测序后的黑安格斯牛CEBPA基因序列进行校正、拼接,结果表明,CEBPA基因CDS区全长570 bp,编码189个氨基酸(图3),与普通牛(登录号:BC149006.1)的基因编码区相比,克隆得到的基因序列缺失39 bp;核苷酸组成及序列结构分析发现,该基因CDS区胞嘧啶核苷酸数量比重最大(35.96%),胸腺嘧啶核苷酸比重最小(10.53%),G+C含量(68.60%)明显高于A+T含量(31.40%);编码区DNA单链和双链分子质量分别为175.3和348.3 ku。

图3 黑安格斯牛CEBPA基因编码区全长序列与对应的氨基酸序列Fig.3 Full length coding sequence and amino acids sequence of CEBPA gene of black Angus cattle

2.2.2CEBPA基因编码氨基酸序列及蛋白的理化性质 由表1可见,在黑安格斯牛CEBPA基因编码蛋白质的多种氨基酸中,以丙氨酸占比最大(12.63%),其后依次为脯氨酸(8.95%)、丝氨酸(8.95%)、精氨酸(8.42%)和谷氨酸(7.89%),半胱氨酸占比最小(1.05%),无色氨酸的密码子。氨基酸残基中,正电荷残基(Arg+Lys)总数为28个,较负电荷残基总数(Asp+Glu)多3个。理化性质分析结果显示,黑安格斯牛CEBPA蛋白的总原子数为2 878,原子组成为C891H1 425N275O282S5,分子质量为20.662 ku,理论等电点为8.90,估计半衰期为30 h,不稳定指数为61.45,脂肪指数为60.58。

表1 黑安格斯牛CEBPA基因编码蛋白质的氨基酸组成Table 1 Amino acids composition of proteins encoded in CEBPA gene of black Angus cattle

2.2.3CEBPA基因编码蛋白的亲水性 使用ExPASy软件,选择Hphob./Kyte&Doolittle算法预测蛋白质亲水性,结果见图4。由图4可以看出,黑安格斯牛CEBPA基因编码蛋白第64位异亮氨酸(Ile)和第185位蛋氨酸(Met)具最强的疏水性(分值均为0.911),第132位天冬氨酸(Asp)具最强的亲水性(分值为-2.967),亲水性总均值小于0(-0.841),说明该蛋白具有较强的亲水区域。

正值表示疏水性,负值表示亲水性 Positive value means hydrophobic and negative value means hydrophilic

2.2.4CEBPA基因编码蛋白跨膜结构域、保守结构域及GO注释 采用在线软件TMHMM Server v. 2.0预测表明,黑安格斯牛CEBPA基因的编码蛋白无跨膜结构域,不属于跨膜蛋白。利用InterPro蛋白质数据库预测黑安格斯牛CEBPA基因编码蛋白质序列的保守结构域,结果(图5)表明,黑安格斯牛CEBPA蛋白存在4个保守结构域,分别是第1~56位、第86~139位、第108~139位氨基酸残基的无序区域(即表征内在无序/非结构化蛋白质)和第131~172位的氨基酸残基盘绕线圈区域。黑安格斯牛CEBPA蛋白归属于脊索动物CCAAT/增强子结合蛋白,与数据库中编号为IPR004827的碱性亮氨酸拉链结构域Basic-leucine zipper domain(bZIP)、PF07716碱性区域亮氨酸拉链结构域Basic region leucine zipperPfam entry(bZIP_2)、PS50217基本-亮氨酸拉链结构域Basic-leucine zipper domain profile (bZIP)、SM00338基本区域亮氨酸拉链结构域basic region leucin zipper(BRLZNEU)重叠,分别位于第111~176、113~165、113~176和111~175位氨基酸残基。

对结构域进行的GO注释表明,黑安格斯牛CEBPA基因所编码的蛋白质在生物过程中参与转录调节和DNA模板化,在分子功能中与脱氧核糖核酸结合转录因子的活性相关。

mobidb-lite.氨基酸残基无序区域;Coil.氨基酸残基盘绕线圈区域mobidb-lite. Amino acid residue disorder region;Coil. Amino acid residue coiling region

2.2.5CEBPA基因编码蛋白的信号肽预测 信号肽预测结果表明,黑安格斯牛CEBPA基因编码蛋白检测出SP(Sec/SPⅠ)型信号肽识别位点,可能性为0.000 9;未检测出含有LIPO(Sec/SPⅡ)和TAT(Tat/SPⅠ)型的信号肽识别位点,表明CEBPA蛋白可能不存在信号肽剪切位点,为非分泌型蛋白。

2.2.6CEBPA基因编码蛋白的磷酸化位点 图6显示,黑安格斯牛CEBPA蛋白存在12个丝氨酸(Ser)磷酸化位点,分别位于氨基酸序列第3,17,21,27,40,61,65,108,113,130,163和180位;3个苏氨酸(Thr)磷酸化位点,分别位于第141,149和168位;2个酪氨酸(Tyr)磷酸化位点,分别位于第7,67位。

图6 黑安格斯牛CEBPA蛋白的磷酸化位点Fig.6 Phosphorylation sites of CEBPA protein in black Angus cattle

2.2.7CEBPA基因编码蛋白的B细胞抗原表位预测 采用Immune epitope 在线软件预测黑安格斯牛CEBPA基因编码蛋白的抗原表位,结果(图7)发现,黑安格斯牛CEBPA蛋白存在7个B细胞抗原表位(图中分数大于0.5部分),分别位于氨基酸序列第5~125,132,135~147,150,153~154,157和174~185位氨基酸残基。

2.2.8CEBPA基因编码蛋白的亚细胞定位 采用在线工具PSORTⅡ Prediction对CEBPA基因编码产物进行亚细胞定位,结果表明其分布在细胞核的可能性为56.5%,分布在线粒体的可能性为17.4%,分布在细胞质的可能性为17.4%,分布在内质网的可能性为4.3%,分布在分泌系统小泡的可能性为4.3%。因此,CEBPA基因编码产物可能主要在细胞核中发挥生物学作用。

2.2.9CEBPA基因CpG岛的在线预测 通过MethPrimer 2.0在线软件预测CpG岛,结果(图8)显示,黑安格斯牛CEBPA基因编码蛋白存在1个CpG岛,大小为468 bp,位于该基因核苷酸序列的第47~514位,并含有5对亚硫酸氢盐PCR引物。

图8 黑安格斯牛CEBPA基因CpG岛预测Fig.8 Prediction of CpG island of CEBPA gene in black Angus cattle

2.2.10CEBPA基因编码蛋白的二级和三级结构预测 通过PSIPRED在线软件对CEBPA基因编码蛋白的二级结构进行预测,结果(图9)表明,黑安格斯牛CEBPA 蛋白含有46%的α-螺旋(含87个氨基酸)和54%的无规则卷曲(含102个氨基酸)。通过SWISS-MODEL软件对CEBPA基因编码蛋白质的三级结构进行分析,使用同源建模法建立三级结构模型。结果(图10)显示,所建立三级结构模型的目标序列与模板序列一致度为100%,说明该三级结构模型可用于蛋白质结构的预测。三级结构模型预测与二级结构预测结果有部分差异,但仍可以确定其含有大量α-螺旋结构。

图9 黑安格斯牛CEBPA基因编码蛋白质的二级结构预测Fig.9 Prediction of secondary structure of protein encoded by CEBPA gene in black Angus cattle

图10 黑安格斯牛CEBPA基因编码蛋白质的三级结构预测Fig.10 Prediction of tertiary structure of protein encoded by CEBPA gene in black Angus cattle

2.2.11 黑安格斯牛CEBPA基因共表达分析 利用String数据库对CEBPA基因进行共表达分析,结果(图11)发现,在黑安格斯牛中未发现与CEBPA共表达的基因存在,在其他生物有机体中,CEBPA与RUNX1、FLT3、TRIB1、RUNX1T1、RUNX2、TRIB2、MYB、PER2、MYBL2和MYBL1均存在共表达。

A.在黑安格斯牛中的共表达;B.在其他生物中的共表达A.Coexpression in black Angus cattle;B.Coexpression in other organisms

2.2.12CEBPA基因编码蛋白的生物序列 使用轮廓隐马尔可夫模型在线工具,在蛋白质数据库中对CEBPA基因编码氨基酸序列进行生物序列交互式搜索分析,结果表明,黑安格斯牛CEBPA基因编码氨基酸序列与InterPro蛋白质数据库的同源序列共有1 025条,主要分布在真核生物中,涉及到不同种的牛、马、骆驼、绵羊、野猪、大猩猩、熊、驴、大鼠等,与bZIP_2蛋白家族序列和物种的比对相符。

2.2.13CEBPA基因的系统进化树 将黑安格斯牛CEBPA基因的核苷酸序列分别与GenBank中牦牛(XM_005893918.2)、野牛(XM_010849281.1)、白犀牛(XM_004439780.2)、马(XM_023649498.1)、双峰驼(XM_010950046.1)、绵羊(NM_001308574.1)、野猪(XM_003127015.4)、大猩猩(XM_031004588.1)、灰熊(XM_026484294.1)、驴(XM_014835803.1)、大鼠(X12752.1)共11个物种的核苷酸序列进行比对,构建系统发育进化树并分析不同亚种及物种间的遗传距离。结果(图12)表明,黑安格斯牛与牦牛的遗传距离为0.004,亲缘关系最近;其次与黑安格斯牛亲缘关系较近的是绵羊,遗传距离是0.009;野牛与黑安格斯牛之间的遗传距离较远,遗传距离为0.404。

图12 黑安格斯牛与不同物种CEBPA基因编码序列的系统进化树分析Fig.12 Phylogenetic tree analysis of CEBPA gene coding sequences of black Angus cattle and different species

3 讨 论

随着科研水平的飞速发展,生物信息学方法和手段在动物遗传育种领域发挥着关键作用[17-19]。CEBPA基因主要参与脂肪的生成以及机体的免疫应答,相关报道在人的急性髓系白血病(AML)研究中较为常见。近年来,在秦川牛、猪、羊、小鼠、鸭、鸡等研究中发现,该基因与脂肪分化相关,对改善肉品质具有关键作用[20-22]。牛的CEBPA基因可激活脂肪细胞分化相关基因的转录表达,促进脂肪的形成,主要分布在脂肪和胆固醇代谢相对较旺盛的组织中[7-8]。本研究结果表明,黑安格斯牛CEBPA基因的CDS区全长为570 bp,与NCBI上公布的普通牛(登录号:BC149006.1)基因编码区相比缺失39 bp,这可能是由于基因发生了可变剪接现象,对基因的表达及生物遗传的多态性会产生一定影响。周扬[23]的研究证实,CEBPA基因存在可变剪接现象。本研究中,黑安格斯牛CEBPA基因CDS区G+C含量达68.60%,共编码189个氨基酸,其中以丙氨酸占比最大(12.63%),该氨基酸可以缓和血糖和调节能量,对脂肪的生成有一定促进作用。CEBPA蛋白理论等电点为8.90(>7),估计半衰期为30 h,不稳定指数为61.45(>40),推断该蛋白为碱性不稳定蛋白[24],可能会影响黑安格斯牛背最长肌细胞的周期及生命活动。CEBPA蛋白亲水性的总平均值小于0(-0.841),表明该蛋白是可溶性蛋白[25],且预测发现该蛋白不存在信号肽,跨膜结构域为非分泌型蛋白,这与相关研究结果“跨膜结构域的疏水区和信号肽的疏水区高度相似”[26]一致。预测发现,该编码蛋白存在4个保守结构域,含有无序区域(即表征内在非结构/无序蛋白质)和盘绕线圈区域,在生物发育过程中,参与转录调节和DNA模板化,在分子功能中与脱氧核糖核酸结合转录因子活性相关。相关研究表明,这些固有的非结构/无序蛋白(IUPS/IDPs)在生理条件下以快速相互转换的构象集合形式存在,在蛋白质组中的预期高频率也突显了其重要性,估计30%~50%的真核蛋白至少含有一个长的无序片段,这些蛋白质参与了重要的调节功能[27]。盘绕线圈区域的相关研究表明,盘绕线圈片段位于发挥重要功能的区域,并介导了许多不同类型的生物过程[28]。

蛋白质磷酸化是一种较为重要的调节方式,参与多种生物学过程,磷酸化位点对推动蛋白质的翻译及细胞增殖等过程有一定作用[29]。本研究结果表明,黑安格斯牛CEBPA蛋白存在17个磷酸化位点,这些位点可能影响着安格斯牛背最长肌细胞的分化和生长,通过蛋白翻译后的磷酸化和去磷酸化影响转录因子的调控[30]。本研究发现,黑安格斯牛CEBPA蛋白存在7个B细胞抗原表位。赵骁等[31]的研究表明,蛋白质以β-转角及无规则卷曲居多,则可能易与抗体结合成为表位。亚细胞定位表明,CEBPA基因编码蛋白分布在细胞核的可能性为56.5%,说明CEBPA基因编码产物可能主要在细胞核中发挥生物学作用,与GO注释中脱氧核糖核酸结合转录因子活性的分析结果一致。MethPrimer 2.0在线软件预测表明,CEBPA基因编码蛋白存在1个CpG岛。CpG岛多位于基因转录调控区附近,与GO注释结果(即参与转录调节)一致,但预测中并未发现CEBPA基因存在甲基化特异性,为后续CEBPA基因CpG岛甲基化状态的研究起到一定启示作用。在CEBPA基因编码蛋白的二级和三级结构预测中发现,该蛋白以α-螺旋和无规则卷曲为主,从而印证了B抗原表位的预测结果,无规则卷曲结构与蛋白质特异功能有关[32],通过蛋白质肽链中配体和受体结合的活性影响着蛋白质的功能[33-34]。利用String数据库对CEBPA基因的共表达分析表明,其中并未发现与黑安格斯牛CEBPA共表达的基因,表明该数据库不同品种牛中不含该基因的共表达信息,但在其他有机生物体中发现10个共表达基因,其RUNX1基因在人上被证实存在共表达的关系[35]。系统进化发育树分析结果表明,黑安格斯牛和牦牛的亲缘关系最近,与野牛的遗传距离较远。

本研究通过克隆发现,CEBPA基因存在可变剪接现象,进一步预测分析了黑安格斯牛CEBPA基因编码蛋白质的理化性质、空间结构和功能,为后续深入研究CEBPA基因的可变剪接、转录水平、蛋白水平等机理提供了科学依据,并为黑安格斯肉牛的分子育种奠定了理论基础。

猜你喜欢
安格斯结构域氨基酸
细菌四类胞外感觉结构域的概述
酋长的答谢礼
革兰氏阳性菌蛋白结构域特征分析
月桂酰丙氨基酸钠的抑菌性能研究
UFLC-QTRAP-MS/MS法同时测定绞股蓝中11种氨基酸
安格斯和鸭子
HPLC法同时测定阿胶强骨口服液中4种氨基酸
重组绿豆BBI(6-33)结构域的抗肿瘤作用分析
回眸
24美元的“冷漠”罚单