卢芷梅,关 睿,苏立蓉,姚 薇,张李兵,陈珍珍,徐 舜,段礼新,季爱加
(广州中医药大学中药学院国际中医药转化医学研究所 广州 510006)
大宗药材丹参为唇形科植物丹参Salvia miltiorrhizaBge.的干燥根和根茎[1]。历代本草对丹参的论述始载于《神农本草经》,虽有参名,但其补血之力不足,而活血之力有余,具调经活血、止痛祛瘀、凉血除烦安神之功。丹参具有保护心脏,改善心脏供血、扩张心脏的冠状动脉、活血化瘀预防血栓等作用,成为心血管疾病的首选中药[2-4]。丹参的有效活性成分主要分为2 类:水溶性的酚酸类成分和脂溶性的丹参酮类成分,其中丹参酮类是心脑血管疾病治疗的活性成分,主要分布于丹参根及根茎周皮木栓层[5-8]。丹参的生态适应性强,产地分布广。由于野生资源减少,目前丹参主要以田间栽培为主,但近年来栽培丹参质量严重下降,含量较低,大大限制了市场需求[9-10]。加强对丹参次生代谢调控机制的研究,有利于提高丹参的产量和品质。目前关于丹参调控机制研究主要集中于转录因子(Transcription factor),转录因子在丹参的次生代谢生物合成过程中起着重要作用[11-12]。
转录因子通常能够调控多个生物合成途径基因,是影响药用植物次生代谢物质合成和积累的重要调控因子[13-15]。其中AP2/ERF 转录因子家族是一类大的植物特异的转录因子家族,该基因家族已在丹参中鉴定,包含171 个成员。AP2/ERF 家族分为5 个相对保守的亚家族,包括AP2(25 个基因)、DREB(61 个基因)、ERF(79 个基因)、RAV(4 个基因)和Soloist(1 个基因)[16-17]。AP2/ERF家族的相对保守的5个亚家族均含有AP2/ERF 结构域且作为最主要的特征,AP2/ERF 结构域是由60-70 个氨基酸序列构成的DNA 结合结构域[18-19]。其中ERF 类转录因子亚家族属于AP2/ERF 超家族中最大的一个亚家族,它又可以分为B1-6等6个亚组。丹参作为中国的传统大宗药材,国外关于丹参的相关研究较少。目前,ERF 亚家族成员被报道参与激素信号和次生代谢调控,ERF 家族能够特异性结合GCC-box,在调控花发育、茎尖伸长、次生代谢、生物和非生物胁迫应答中具有重要作用[20-23],如青蒿(Artemisia annua)中AaERF1和AaERF2两个转录因子可以调控青蒿素的合成;CrERF5 转录因子参与调控长春花中长春花碱生物合成[24-25]。
本研究根据前期转录组数据筛选到一个新的可能与次生代谢相关的ERF 基因SmERF108[17],对SmERF108 进行生物信息学和亚细胞定位分析,转录激活实验探究其转录激活活性,对途径酶基因启动子分析发现SmCPS1启动子区含有GCC box 位点,预测SmERF108可能结合该位点调控SmCPS1的表达,SmCPS1是丹参酮生物合成途径上二萜骨架形成的环化酶,并通过酵母单杂交实验验证可能调控SmCPS1。初步明确SmERF108基因在丹参中的调控模式,为深入研究丹参SmERF108基因功能奠定基础,进而深入探讨ERF 转录因子在丹参次生代谢途径中的调控作用。
本研究所用植物材料丹参(S. miltiorrhizaBge)取自中国医学科学院药用植物研究所,经广州中医药大学中药学院季爱加副研究员鉴定确认。选取生长健壮,处于盛花期的丹参,包于锡箔纸内,立即置于液氮速冻,置于-80℃冰箱备用。拟南芥(Arabidopsis thaliana)种子来源实验室保存。
采用液氮研磨,参照快速通用植物RNA 提取试剂盒(华越洋生物科技有限公司,0416-50gk)说明书提取丹参各组织的总RNA,琼脂糖凝胶电泳检测RNA的完整性,并用核酸定量仪测定其浓度。参照反转录试剂盒(湖南艾科瑞生物工程,AG11615)说明书将RNA反转录为cDNA。
根据基因组数据库中SmERF108基因序列设计特异性引物并进行 PCR 扩增,SmERF108-F:ATGACAACCTCAGACGCATC;SmERF108-R:TTAGCAGTGCATCTCACACAA;随后对产物进行切胶回收,将回收后的产物连接至PLB 载体,转化至DH5α感受态细胞,涂布于含氨苄青霉素抗性的LB 固体平板上,37℃恒温培养箱中,暗培养12-15 h。挑取单一菌落于含氨苄青霉素抗生素的培养液中37℃恒温摇菌,进行菌液PCR 阳性鉴定,将阳性菌液送生工生物工程上海股份有限公司测序。
使用NCBI 中的CD-Search 和PFAM 蛋白家族数据库确认SmERF108 转录因子保守结构域,同时利用MEME在线分析网站预测保守基序;用ComputePI/MW对蛋白质的等电点、分子式等进行计算;通过ExPASy网站中的ProtParam 与ProtScale 分别对蛋白特性与亲疏水性进行预测分析;用在线分析网站TMHMMServer,v.2.0 与SignalP-5.0 分别对跨膜域和信号肽进行预测分析;在线分析网站Disulfind 与NetPhos3.1Server 分别对二硫键与磷酸化位点进行预测;此外,用SOPMA 网站进行SmERF108 二级结构预测分析,最后利用Swiss-Model 与Phyre2 构建蛋白的三级结构模型。
将测序验证的SmERF108序列通过softberry 网站中的HMM-based gene structure prediction 模块对目的基因的基因结构进行预测,并得到相应的氨基酸序列;使用软件TBtools 在丹参基因组进行对比,索取并获得SmERF108上游2000 bp 基因序列,用PlantCARE对上游顺式元件进行预测。
数据库搜索并提取ERF 亚家族中与次生代谢相关的转录因子序列和DREB亚家族中部分功能蛋白序列,包括:来源于青蒿(A. annua)的AaERF1(JN162091.1)、AaERF2(JN162092.1);来源于长春花(Catharanthus roseus)的CrERF5(MK862158.1);来源于烟草(Nicotiana tabacum)的 NtERF32(NM_001325036.1);来源于丹参(S. miltiorrhiza)的SmERF1L1(MH006594.1)、SmERF128(MG897156.1);来源于菊花(Chrysanthemum morifolium)的CmDREB6(MG199593.1);来源于水稻(Oryza sativa)的OsDREB2A(Q0JQF7);来源于拟南芥(A. thaliana)的AtDREB1A(AB007787)、AtDREB2A(AB007790);来源于马铃薯(Solanum tuberosum) 的 StDREB2(JN125858)。利用以上功能蛋白序列与SmERF108构建系统进化树,采用MEGA-X 软件,bootstrap 次数1000 次,建树方法为LG with Freqs.(+F)model,数据方法为Maximum likelihood。
为了分析SmERF108 的亚细胞定位,设计同源臂引物克隆目的基因 ,SmERF108-xbal:gagaacacgggggactctagaATGACAACCTCAGACGCATCG;SmERF108-smal:gcccttgctcaccatcccgggGCAGTGCATC TCACACAATCGG;然 后 将PBI221-GFP 用Xba Ⅰ和SmaⅠ限制性内切酶进行双酶切,将酶切完全失活的质粒再与带有同源臂的目的基因进行同源反应。取同源产物转化至DH5α 大肠杆菌感受态细胞中,涂布于含抗性固体平板上,在37 ℃恒温培养箱中培养过夜,PCR 鉴定后提取重组PBI221-GFP-SmERF108质粒。同时利用培养4周没有抽苔的拟南芥叶片制备原生质体。把重组载体导入拟南芥原生质体适宜条件下孵育一段时间,在共聚焦显微镜下观察GFP荧光。
取丹参植株三株,提取不同部位(根、茎、叶、花、周皮、木质部和韧皮部)的RNA,然后反转录为cDNA。用于实时荧光定量PCR 的引物为SmERF108-F:TTATGGAGATGAGCTGAACGC;SmERF108-R:AGTGTTCGGGTTCGGGTT;实验使用QuantStudio5 实时荧光定量PCR 仪,使用TaKaRa 公司的TB Green Premix Ex Taq II,反应体系(10 μL)为:cDNA 模板1 μL,10 μmol·L-1上下游引物各0.4 μL,TB Green Premix Ex Taq II 5 μL,ROX Reference Dye II 0.2 μL,RNase-freeddH2O 3 μL;反应程序为:95℃预变性30 s;95℃变性5 s,60℃退火34 s,40 个循环,然后收集荧光信号。每个反应进行三个生物学重复,数据根据2-△△Ct法进行分析,用SPSS软件进行统计分析。
通过将pGBKT7 用EcoRI 和SalI 限制性内切酶进行双酶切,采用同源重组方法,设计带有同源臂引物,将目的基因克隆到表达载体pGBKT7 上。引物如下,SmERF108EcoRI-F:tatggccatggaggccgaattcATGACAAC CTCAGACGCATCG;SmERF108Sal I-R:atgcggccgctgcaggtcgacTTAGCAGTGCATCTCACACAAT CG。步骤同1.3,将重组载体pGBKT7-SmERF108通过酵母转化法转化进酿酒酵母AH109 中,同时转化空载体pGBKT7 作为阴性对照,转化pGBKT7-ANAC096作为阳性对照。后续观察显色情况判断有无自激活作用[26]。
采用同源重组方法,设计带有同源臂引物SmERF108-F:GGGGACAAGTTTGTACAAAAAAGCAG GCTNNATGACAACCTCAGACGCATC;SmERF108-R:GGGGACCACTTTGTACAAGAAAGCTGGGTNTTAGCA GTGCATCTCACACA。基因克隆到表达载体pB42AD上,采用T4 连接方法将ProCPS1克隆到pLacZ-2u 表达载体。将pB42AD用EcoRI、XhoI限制性内切酶进行双酶切,构建重组载体pB42AD-SmERF108和pLacZ-2u-ProCPS1,然后共转化酿酒酵母EGY480.4。同时pB42AD 和pLacZ-2u 共转化酿酒酵母EGY480.4 感受态细胞作为阴性对照,pB42AD-JG 和pLacZ-2u-PZ 共转化作为阳性对照。通过β-半乳糖苷酶活性测定判断转录因子SmERF108 和关键酶基因SmCPS1有无结合作用,是否为其靶基因[27]。
提取新鲜的丹参叶片RNA 并反转录成cDNA,以此为PCR 扩增模板用引物SmERF108-F/R进行扩增,将扩增产物进行1%琼脂糖凝胶电泳检测,获得大小约为500 bp 的特异条带(图1),将该电泳条带进行切胶回收后测序。测序结果为546 bp 的片段,编码181个氨基酸。
图1 PCR产物凝胶电泳图
2.2.1SmERF108编码的蛋白性质分析
通过NCBI 中的CD-search 及PFAM 分析发现SmERF108具有AP2保守结构域,属于AP2/ERF2家族转录因子(图2a);生物信息学在线分析发现:SmERF108 编码蛋白由181 个氨基酸残基组成,蛋白质分子式预测为C876H1368O274S8,相对分子量为2788,等电点为6.31。其中带负电荷(Asp+Glu)、正电荷(Arg+Lys)的残基总数分别为28、27。关于编码的蛋白的亲水性与疏水性,推测SmERF108 蛋白为稳定的亲水蛋白(图2b)。通过TMHMM Server, v. 2.0 和SignalP-5.0分析显示膜内、膜外及跨膜没有信号变化,推测为非跨膜蛋白(图2c)。SmERF108含有信号肽的可能性为0.0015,为其他的可能性为0.9985,故SmERF108 推测不含有信号肽,具有转录因子的特点。使用NetPhos 3.1 Server 分析磷酸化位点,发现主要为丝氨酸位点共15 个,由此推测SmERF108 蛋白是以丝氨酸为主,苏氨酸为辅的磷酸化修饰方式发挥调控功能(图2d)。
图2 SmERF108 编码的蛋白性质分析
2.2.2 蛋白质二级、三级结构预测
用SOPMA 对SmERF108编码的蛋白的氨基酸序列进行二级结构预测,SmERF108 蛋白中含有28.73%α 螺旋、3.31%β 折叠和61.88%无规则弯曲(图3a)。用Phyre2 与SWISS-MODEL,分别搜索并构建模板,Phyre2 与SWISSMODEL 预测结果显示均与二级结构预测结果一致(图3b)。
图3 SmERF108蛋白质二级结构(a)和三级结构(b)分析
用PlantCARE 对SmERF108起始密码子上游2000 bp 启动子进行调控元件预测(图4),结果显示在1000-1400位存在2个defense and stress responsiveness(防御和应激反应元件),0-1800 位有10 个light responsive(光反应元件),在0-1200 位存在2 个lowtemperature responsiveness(低温反应反应元件),在0-1600 位有2 个auxin responsiveness(生长素响应元件),此外,在0-800 位存在2 个anaerobic induction(厌氧感应元件)。以上结果显示,SmERF108可能会受到以上环境因子或信号分子诱导,进而促进或抑制SmERF108基因的表达。
图4 SmERF108启动子区顺式作用元件预测
用 MEGA X 采 用 Maximum likelihood 对SmERF108和其他功能蛋白进行进化关系分析(图5),从进化树结果中可以看出整个系统进化树聚类为两大支:ERF 亚家族转录因子聚一支,DREB 亚家族成员聚为一支。其中,SmERF108位于第一支,属于ERF亚家族B3 组成员。进一步对所有蛋白进行保守基序分析发现,所有蛋白序列都包含Motif 1 和Motif 2,属于保守的AP2/ERF 结构域序列。此外,其他保守基序的分布呈现亚家族特异性,其中ERF 亚家族特异性包含Motif 3、Motif 4、Motif 5、Motif 7 和Motif 9,而Motif 6、Motif 8 和Motif 10 仅存在于DREB 亚家族中。SmERF108 的保守基序分布与丹参的SmERF128 和青蒿的AaERF2 非常接近,推测其与SmERF128 和AaERF2具有相似功能。
图5 SmERF108蛋白与其他功能蛋白的进化关系及保守基序分析
如图6,空载体PBI221 的绿色荧光信号充满整个细胞,而SmERF108 转录因子的绿色荧光信号出现在细胞核。说明SmERF108 定位在细胞核,是一个核蛋白,具有转录因子基本特征。
图6 SmERF108转录因子亚细胞定位
通过RT-qPCR 检测SmERF108基因在丹参根、茎、叶片、花、周皮、韧皮部、木质部的差异表达情况(图7),SmERF108在根皮中表达最高,在叶中也有高表达。丹参酮主要积累于根部,分布规律为周皮(R1)>韧皮部(R2)>木质部(R3)[28],由图中我们可以看出SmERF108的表达趋势符合此规律,预测可能与丹参酮的生物合成相关。
图7 SmERF108组织差异表达分析
为了验证SmERF108 转录因子的自激活活性,通过酵母异源表达方法把带有正确目的序列重组载体pGBKT7-SmERF108转化进酿酒酵母细胞,表达载体上带有LacZ 报告基因,通过β-半乳糖苷酶活性测定,结果如图8,空载体pGBKT7 在显色板上不显蓝色,阳性对照pGBKT7-ANAC096显蓝色,同时转录因子SmERF108 在显色板上显蓝。说明SmERF108 具有转录激活活性。
图8 SmERF108转录因子转录激活活性检测
为了验证SmERF108 转录因子结合的靶基因,设置阴性对照pLacZ-2u 和pB42AD 转化酿酒酵母细胞EGY48,阳性对照pB42AD-JG 和pLacZ-2u-PZ 共转酿酒酵母细胞EGY48(表1)。把构建好的重组载体pB42AD-SmERF108,与构建好的靶基因启动子重组载体pLacZ-2u-ProCPS1,通过酵母异源表达方法诱导进酿酒酵母细胞EGY48 中,表达载体上带有LacZ 报告基因,通过β-半乳糖苷酶活性测定。结果如图9,阴性对照在显色板上不显色,实验组1-2均不显色,实验组3,即pB42AD-SmERF108与pLacZ-2u-ProCPS1的共转显蓝色,并且阳性对照也显蓝色。说明SmERF108与SmCPS1启 动 子 结 合,SmCPS1作 为SmERF108的靶基因。SmCPS1是丹参酮生物合成途径上二萜骨架形成的环化酶基因,因此SmERF108 转录因子可能通过调控SmCPS1影响丹参酮的合成。
图9 SmERF108转录因子酵母单杂显色结果
表1 转化酵母组别
进入21 世纪以来,心血管疾病发病率急剧升高,丹参具有保护心脏,改善心脏供血、扩张心脏的冠状动脉、活血化瘀预防血栓等作用[29-30],成为心血管疾病的首选中药。目前,药材丹参的临床需求量巨大,但栽培丹参质量下降,含量较低,严重影响临床用药的安全性和有效性。丹参药材品质的物质基础是药效成分,药效成分大都属于植物次生代谢产物,次生代谢生物合成受到环境因子和遗传因素的影响[31-33]。而转录因子不但可以直接或间接调控遗传基因的表达,还可以通过环境因子介导植物次生代谢合成调控,研究转录因子对药效成分的调控有助于揭示丹参药材质量形成的分子机制[34]。
AP2/ERF 转录因子家族是植物最大转录因子家族之一,该家族转录因子广泛参与植物生长发育、胁迫响应和次生代谢等多种生理过程。其中,AP2/ERF转录因子被证明能够调控多个药物明星分子的生物合成。例如,Yu等发现两个受到茉莉酸诱导的转录因子基因AaERF1和AaERF2,过表达二者后,抗疟药物青蒿素生物合成途径关键酶基因ADS和CYP71AV1表达量显著升高,青蒿酸和青蒿素含量均有所增加[35]。后续研究发现一个腺毛特异性表达AP2/ERF 转录因子AaORA 能够通过正向调控ADS、CYP71AV1、DBR2、AaERF1的表达提高了青蒿素和青蒿酸的产量[36]。其次,在长春花中也发现了包括ORCA3 和CrERF5 在内的多个AP2/ERF 转录因子能够正向调控抗肿瘤药物长春碱和长春新碱的生物合成[37]。本研究获得的转录因子基因SmERF108在根皮中表达最高,与丹参酮化学成分积累模式一致。此外,根据SmERF108 蛋白与其他功能蛋白的系统发育进化树结果显示,SmERF108与青蒿、长春花、烟草和丹参中的ERF亚家族成员聚为一支。其中,SmERF108 转录因子与丹参中SmERF128 和青蒿中AaERF2 亲缘关系较近且保守基序模式最相似,SmERF128 调控丹参中二萜丹参酮的生物合成[16],AaERF2调控倍半萜青蒿素的生物合成[35],据此推测SmERF108 很可能具有调控丹参酮合成的功能。
丹参酮的生源合成来源于二萜骨架途径,包括甲羟戊酸MVA 途径及质体磷酸赤藓糖醇MEP 途径,其中SmCPS1是丹参酮生物合成途径上二萜骨架形成的环化酶,与SmKSL1催化前体物质GGPP合成丹参酮前体物质次丹参酮二烯[38]。本研究通过启动子序列分析发现SmCPS1启动子区含有GCC box 位点,酵母单杂技术验证SmERF108能够结合SmCPS1启动子区,确定其靶基因可能为SmCPS1,SmERF108转录因子可能通过调控SmCPS1影响丹参酮的合成。虽然本研究通过分子互作实验初步证实SmERF108的功能,但该转录因子在丹参体内的功能未知,后续研究需通过转基因毛状根或植株体系验证SmERF108体内的调控功能。此外,可以通过转基因实验结果进一步推测SmERF108转录因子与丹参酮合成途径上的其他酶基因是否存在直接或间接的启动或抑制关系,进一步利用分子互作等技术揭示调控机制,以期全面地阐释SmERF108转录因子的功能。