泛素连接酶-底物选择关系的研究进展

2015-04-10 16:15李杨李栋

生物技术通报 2015年1期

关键词：信息学复合体泛素

李杨李栋

（军事医学科学院放射与辐射医学研究所北京蛋白质组研究中心蛋白质组学国家重点实验室，北京 102206）

泛素连接酶-底物选择关系的研究进展

李杨李栋

（军事医学科学院放射与辐射医学研究所北京蛋白质组研究中心蛋白质组学国家重点实验室，北京 102206）

泛素是一种包含76个氨基酸的小分子蛋白。泛素共价结合到底物的过程称为泛素化修饰。泛素化修饰过程是一个由级联的泛素激活酶、泛素结合酶和泛素连接酶所介导的复杂过程，泛素化修饰具有高效、ATP依赖、高度特异的特点。泛素化修饰与细胞周期调控、细胞凋亡、转录调控、DNA损伤修复等一系列生物学过程密切相关。在泛素化修饰过程中，泛素连接酶对底物的识别，是决定泛素化修饰特异性的关键环节。泛素连接酶底物识别的相关机制研究不断被报道，鉴定泛素连接酶底物的高通量方法也在不断的改进和发展。随着实验研究的不断深入，实验数据的不断产出，利用生物信息学进行泛素连接酶底物的研究也开始受到关注。对泛素连接酶识别底物的相关机制、高通量泛素连接酶底物的鉴定方法、泛素连接酶底物的生物信息学研究和生物信息学在泛素连接酶底物研究中的发展方向进行讨论。

泛素化修饰；泛素连接酶；底物；生物信息学

DIO： 10.13560/j.cnki.biotech.bull.1985.2015.01.002

泛素（Ubiquitin）是真核生物中一种由76个氨基酸组成，仅8.5 kD的小分子调节蛋白，于1975年被发现［1］。泛素化是一种蛋白质的翻译后修饰，是泛素共价结合到蛋白质赖氨酸残基上或者N末端的过程。泛素化修饰是一个多酶级联的、消耗ATP的反应。参与泛素化过程的酶包括泛素激活酶（E1，ubiquitin activating enzymes），泛素结合酶（E2，Ubiquitin conjugating enzymes），泛素连接酶（E3，ubiquitin ligases）［2］和去泛素化酶（Deubiquitinating enzyme，DUB）。泛素化修饰最为人们所熟知的功能是利用多聚泛素链标记靶蛋白，介导被标记蛋白的蛋白酶体降解［3］。泛素化修饰既能将单个的泛素修饰到底物，发生单泛素化（Monoubiquitination），也可以将利用泛素本身所包含的7个赖氨酸形成的多聚泛素链修饰到底物发生多聚泛素化（Polyuniquitination）。除了利用自身所具有的赖氨酸形成多聚泛素链，泛素还可以通过肽键形成线性的泛素链［4］。这些复杂的修饰形式决定了泛素化修饰在多种生物学过程中扮演重要角色。单泛素修饰影响细胞的膜运输、内吞和病毒出芽等过程［5，6］；由48位赖氨酸（K48）形成的泛素链发生的修饰，主要介导蛋白质的蛋白酶体降解；由63位赖氨酸（K63）形成的泛素链发生的修饰，与内吞作用、炎症响应、蛋白质翻译和DNA修复相关。而其他形式的泛素链与细胞周期、溶酶体降解、激酶识别等一系列过程相关。

在泛素化修饰过程中，泛素连接酶对底物的选择过程是泛素化调控特异性的关键。泛素连接酶负责将泛素或多聚泛素链从E2转移到底物赖氨酸残基或者蛋白质N端残基［7］，决定底物蛋白的命运。泛素连接酶依据结构的不同主要分为3类：RING类、HECT类、U-box类。目前已知的E3数目至少超过600种［8，9］，多于激酶的数量（518种）。泛素连接酶与众多的生物学过程密切相关，如Pellino家族E3之前被认为通过促进IRAK1的泛素化调节天然免疫信号通路，最近研究表明，Pellino家族E3通过泛素化参与更多的先天和适应性免疫调节，参与TLR信号通路的调控［10］；PRP19［11］、RNF4［12］、RNF8［13］等泛素连接酶参与DNA损伤应答；SCF（FBW7）通过靶向MCL1发生泛素化降解调节细胞凋亡［14］；FBXO31介导Cyclin D1的降解，与细胞DNA损伤的G1期阻滞密切相关［15］。泛素化修饰几乎调控真核细胞功能的所有方面。因此，泛素化修饰与许多疾病有密切关系：泛素连接酶Cbl-b和TAM受体能利用自然杀伤细胞调节癌细胞的转移［16］；FBXO11的失活会导致BCL6的过表达，从而引发弥散性巨型B细胞淋巴癌［17］；c-Cbl和Cbl-b对人的骨细胞形成和破坏起重要作用［18］。由于E3对底物识别具有特异性，是非常有潜力的药靶。E3与多种肿瘤的发生发展密切相关，通过干预E3的功能，可以对多种癌症起到治疗作用。目前，有多个团队正在研发针对泛素连接酶HDM2，或者干扰HDM2-p53相互作用的抑制剂以稳定p53的表达，进而用于肿瘤治疗［19，20］。

E3与底物特异性的选择机制和调控作用的发现，对揭示泛素化修饰所参与的细胞调控过程，理解泛素化修饰相关疾病的发病机理，研发高特异性、低副作用的药物具有重要意义。现在对泛素连接酶底物的研究，主要采用分子生物学方法，通过体内或体外的实验，寻找特定泛素连接酶底物。目前也建立了一些高通量的泛素连接酶底物鉴定方法，同时生物信息学研究也在泛素连接酶底物的发现中进行了一些尝试。这些研究为理解泛素连接酶与底物选择关系，提供了多方面的帮助。本文将从泛素连接酶底物识别机制、鉴定泛素连接酶底物的高通量方法和泛素连接酶底物选择关系的生物信息学研究3个方面对泛素连接酶和底物选择关系的研究进展进行综述。

1 泛素连接酶底物识别机制

由于泛素连接酶数目众多，并且存在大量复合体泛素连接酶。在泛素连接酶识别底物的过程中，有很多适配体参与其中。并且，泛素化修饰与多种其它翻译后修饰存在着交互应答，特别是与磷酸化修饰存在多种多样的相互调控作用。这些原因都导致泛素连接酶对底物的识别机制变得异常复杂。

1.1 通过特定的序列特征识别底物

泛素连接酶对底物的识别，可能是由特定的序列所介导的。这里的序列主要指结构域和motif。结构域（Domain）是指蛋白中具有特定结构的一段序列，结构域通常为60-300个氨基酸长度。Motif（有翻译为模体）是一些比较短的（通常小于10个氨基酸）、包含一些特定氨基酸的序列段［21］。目前有许多关于E3利用特定的domain或motif识别底物的特定motif或domain的研究报道。

APC/C复合体是一个由多个亚基组成的RING类复合体泛素连接酶，APC/C复合体利用Cdc20和Cdh1亚基作为底物识别亚基，Cdc20和Cdh1利用WD40 domain识别一些特定的motif识别底物。APC/C复合体识别底物的motif包括D-box motif和KEN-box motif。D-box motif又称为RxxL motif，是指包含RxxL氨基酸的一段序列，其中x表示任意氨基酸。RxxL motif在所有哺乳动物的PLK1同源蛋白中都出现，具有很高的保守性［22］。利用这个motif，APC/C复合体识别PLK1、ID2［23］等蛋白。KEN-box motif可识别多种底物，包括Cdc20，Cdc20上的KEN motif能被由Cdh1形成的APC/C复合体泛素连接酶所识别并泛素化［24］。通过KEN motif被识别的底物，包括与有丝分裂相关的中心体复制因子STIL［25］、与转录相关的蛋白TRRAP［26］等。

HECT类泛素连接酶中也存在类似的底物识别机制，最典型的是NEDD4家族，人类的NEDD4家族包括9个成员：NEDD4、NEDD4-2/NED4L、ITCH、SMURF1、SMURF2、WWP1、WWP2、NEDL1及NEDL2［27］。该家族的E3结构上类似，N端包含一个C2 domain，C端为HECT domain，中间段包含2-4个重复的WW domain。该家族能够通过WW domain识别底物的PY motif［28］（包含PPxY序列的氨基酸段，x代表任意氨基酸），实现底物识别，如NEDD4-2能通过WW domain识别上皮细胞钠离子通道的β和γ亚基的PY motif［29］。

但是蛋白上具有这些motif，并不是该蛋白被E3识别的必要条件。如Axin由SMURF1介导发生K29多聚泛素化，Axin上具有PY motif，但是通过研究发现，SMURF1上的WW结构域对于Axin泛素化不是必须的，Axin并不被SMURF1上的WW domain所识别［30］。进一步研究发现，SMURF1上的C2 domain是泛素化Axin的关键结构域。另外，Zhi等［31］在对WWP1进行综述时也介绍了WWP1既能识别包含PY motif的底物，也能识别不包含PY motif的底物。并且给出了19个包含PY motif的底物和8个非PY motif的底物。在这些例子中，E3可能依赖一些人们所未知的motif对底物进行识别，但是这些现象也说明了泛素连接酶与底物选择关系的复杂性。

1.2 利用适配体识别底物

所谓适配体（Adaptor）是一些与E3和底物发生相互作用的蛋白，研究发现，E3在调节底物泛素化的过程中，除了直接与底物结合，有时候还有一些适配体参与调节。这些适配体发挥多种多样的功能。如TGFβ受体是一个复合体，能将信号跨膜传递给Smad信号通路。TGFβ能够被Nedd4家族泛素连接酶SMURF1识别并降解。SMURF1并不是直接连接到TGFβ受体的亚基上，而是利用适配体Smad7结合TGFβ，并介导TGFβ的泛素化降解［32］。

RING类泛素连接酶中也存在类似的适配体，特别是复合体泛素连接酶，其多利用Cullin蛋白作为支架，连接用于识别E2的包含RING结构域的蛋白（如ROC1）和用于底物识别的亚基（70多种F-box蛋白）。这些用于底物识别的亚基，某种意义上也可算作是识别底物的适配体。非复合体的RING类泛素连接酶TRAF6，也能够利用p62蛋白，结合NGF受体TrkA，并介导TrkA的K63泛素化［33］。

除了作为E3和底物连接的支架，适配体还具有其他的作用，如激活或者抑制E3的活性，调节E3的细胞定位等。适配体所具有的这些丰富的功能，除了决定E3底物识别的特异性，一定程度上还决定了E3调控底物的时空特异性。

1.3 泛素化修饰与其他翻译后修饰的cross-talk

泛素化修饰与其他翻译后修饰存在广泛的crosstalk。目前，研究最多的是泛素化与磷酸化间的crosstalk。磷酸化既可激活泛素化修饰，也可抑制泛素化修饰。如β-catenin和IκB都可被由Cul1、skp1和f-box蛋白β-TRCP组成的复合体E3所识别。但它们在通常状态下并不被该复合体E3所识别，当IκB的第32位和第36位丝氨酸被磷酸化或当β-catenin的第33位和第37位丝氨酸被磷酸化时，才能被由β-TRCP形成的复合体泛素连接酶所识别［34］。

在ITCH泛素连接酶的活性调控过程中，磷酸化发生了更广泛的作用。ITCH并非组成型活化的泛素连接酶，前面所述ITCH泛素连接酶属于NEDD4家族，ITCH会发生内部折叠和自身相互作用，HECT domain会与WW domain发生连接，从而抑制ITCH的泛素连接酶活性。而激酶JNK1可以磷酸化ITCH的199位丝氨酸、222位苏氨酸和232位丝氨酸，释放与WW domain结合的HECT domain，激活ITCH的泛素连接酶活性。激活后的ITCH可以促进JunB的泛素化。当该过程需要被减弱或终止时，络氨酸激酶Fyn能够磷酸化ITCH的371位络氨酸，这个位点位于WW domain，磷酸化修饰后ITCH将无法利用WW domain与底物的PY motif结合［35］，从而抑制ITCH的活性。

sumo化修饰是一种类泛素化修饰，同样修饰底物上的赖氨酸位点。在DNA修复过程中，存在着两种潜在的泛素化与sumo化修饰的cross-talk，第一种是PIAS可能sumo化RNF168和HERC2，HERC2的sumo化造成其内部发生相互作用，使HERC2和RNF8组装成复合体，这个复合体能够配合RNF168在DNA损伤的位置附近的蛋白上形成泛素链。另一种潜在机制是PIAS介导MDC1的sumo化和DNA损伤位置附近蛋白的sumo化，sumo化的MDC1能够募集RNF4，连同RNF8形成泛素链，并结合在之前修饰在DNA损伤位点附近蛋白上的sumo蛋白，形成sumo-泛素混合链［36］。除了与泛素化修饰协同，sumo化修饰还和泛素化修饰存在许多竞争关系。泛素化修饰能够促进IKBα的蛋白酶体降解，而sumo化修饰能够与IKBα的泛素化修饰发生竞争，从而维持IKBα的稳定［37］。

作为另外一种重要的类泛素化翻译后修饰，NEDD8修饰与泛素化修饰之间也存在重要的crosstalk。NEDD8修饰重要的功能之一，就是促进SCF复合体泛素连接酶的活性。但是NEDD8并不影响SCF复合体泛素连接酶的组装，而是能够帮助募集E2，从而达到促进泛素化修饰的作用［38］。

甲基化修饰是组蛋白翻译后修饰中研究最多的一类。某些组蛋白残基可以通过甲基化抑制或激活基因表达，从而成为表观遗传。甲基化修饰的位点通常为精氨酸和赖氨酸。组蛋白同样可以发生泛素化修饰，组蛋白的甲基化修饰和泛素化修饰之间，也存在着相互影响。如组蛋白H2B的123位赖氨酸能够发生泛素化修饰，该修饰帮助起始组蛋白H3的79位甲基化修饰。组蛋白H3的79位甲基化修饰需要酶Dot1的辅助，而Dot1促进组蛋白H3的79位甲基化，同时能够抑制组蛋白H2B的123位泛素化修饰，从而形成反馈调节回路，控制组蛋白H3的甲基化修饰水平［39，40］。

磷酸化、甲基化等和多种类泛素化修饰与泛素化修饰之间的cross-talk，对泛素化修饰产生了帮助E3识别底物、激活或抑制E3活性、促进泛素链形成、调控组蛋白甲基化修饰等一系列的调控作用，这些调控存在非常精细的机制，使得泛素化修饰和其他翻译后修饰的发生不仅具有底物选择的特异性，更具有了时空的特异性。这些翻译后修饰借助它们之间的协同或抑制关系，通过功能的组合，发挥更多样的调控作用。

2 鉴定泛素连接酶底物的高通量方法

泛素的得名是因其在生物体内广泛的存在。而数目众多的E3也决定了泛素化修饰在体内是大量发生的。传统的泛素连接酶底物鉴定试验方法，多集中于对单个E3和少数底物的选择关系的实验研究和验证，这样的研究方法虽能比较精确的得到E3和底物的选择关系，但实验通量低，难以达到全面研究泛素连接酶和底物选择关系的目的。近些年来，一些高通量实验方法可以进行较大规模的泛素连接酶的底物发现。这些方法包括基于蛋白全局稳定性分析（Global protein stability profiling，GPS）、基于蛋白质微阵列和基于质谱技术等的一系列方法。

2.1 基于全局蛋白质稳定性分析方法

蛋白质全局稳定性分析方法，巧妙地将编码红色荧光蛋白和绿色荧光蛋白的核酸序列构建在同一个腺病毒载体上，并且在两个荧光蛋白之间加入核糖体入口，将编码绿色荧光蛋白的核酸和编码目标蛋白的核酸构建在一起，利用该腺病毒侵染宿主细胞，就能够在宿主细胞中等比例的表达红色荧光蛋白和带绿色荧光蛋白的靶蛋白，如果靶蛋白被降解，则红色荧光蛋白和绿色荧光蛋白的比例会发生变化，利用流式细胞技术，可以进行蛋白质稳定性分析［41］。

Hsueh-Chi等［42］利用显性失活突变技术，替代RNA干扰技术，构建显性失活的Cul1，Cul1是构成SCF复合体泛素连接酶的支架蛋白，如果Cul1失活，即便底物识别亚基能够识别并结合底物，也无法将泛素修饰到底物。通过多轮的流式细胞筛选，最后鉴定出因为Cul1失活，而导致蛋白质丰度发生显著变化的蛋白，作为潜在的底物。利用该方法鉴定到了大于350个潜在的底物，并且鉴定到了大部分已知的底物。利用GSP方法鉴定泛素连接酶底物能够鉴定稳定性发生变化的底物蛋白。但是造成泛素连接酶底物降解的泛素化修饰主要是K48泛素链修饰，K63泛素链主要和信号转导相关。所以针对K63位泛素链或者其他非降解的泛素化修饰形式，难以有效使用该方法。

2.2 基于蛋白质微阵列的泛素连接酶底物鉴定

基于蛋白质微阵列的泛素连接酶底物鉴定技术，主要是通过构建体外的泛素化体系，对构建在微阵列上的蛋白质进行泛素化实验，之后利用多种方法进行检测和分析。如Andrews等［43］利用蛋白质微阵列鉴定了SMURF1的底物。通过给泛素连接上生物素标签，泛素分子可以利用streptavidin-Alexa Flour进行荧光检测，通过荧光判断是否发生了泛素化。利用该方法，共有89个潜在的SMURF1底物被鉴定。Loch等［44］利用两块微阵列板，使用两种泛素抗体与泛素发生抗原抗体反应。一种既能结合单泛素，又能结合多聚泛素链；一种只能结合多聚泛素链。通过进一步的GO分析，选取了部分结果作为进行后续实验的备选底物。

基于蛋白质微阵列方法鉴定泛素连接酶底物，相比GPS方法简单且高效，并且通过采用合适的泛素鉴定方法，可以不受所修饰泛素链形式的影响。但是利用蛋白质微阵列进行泛素连接酶底物鉴定，需要构建体外的泛素化体系，筛选合适的E2，然而根据前面所述，泛素化修饰可能受到其他翻译后修饰的调控，泛素化的发生也具有一定的时空特异性，这些在体外泛素化修饰实验中难以模拟。另一方面，利用蛋白质微阵列进行底物鉴定，所能覆盖的底物规模，受到微阵列本身的限制。所以基于蛋白微阵列进行泛素连接酶底物的鉴定，主要用于为后续更深入的研究进行初步的底物筛选。

2.3 基于噬菌体展示技术的泛素连接酶底物鉴定

噬菌体展示（Phage display）技术是一种高通量的研究蛋白质-蛋白质、蛋白质-肽段、蛋白质-DNA相互作用的方法。噬菌体展示技术的原理是将需要研究的蛋白或多肽的基因与噬菌体表面蛋白的编码基因融合，经过表达并装配成噬菌体后，待研究蛋白或多肽会以融合蛋白的形式呈现在噬菌体表面。而导入了多种蛋白的一群噬菌体，就构成了一个噬菌体展示文库。利用噬菌体展示技术对泛素连接酶底物进行筛查，首先需要进行阴性选择。将人脑cDNA展示文库与仅包含E1、E2和His标签泛素，而不包含E3的体外泛素化系统以及Ni-beads共同孵育。收集没有与Ni-beads结合的噬菌体，并用它们感染BLT5403大肠杆菌进行扩增，扩增后的文库用于阳性筛选。在阳性筛选过程中，将之前扩增的文库与包含E3的体外泛素化系统及Ni-beads共同孵育，Ni-beads会结合His标签，所以发生泛素化修饰的噬菌体会被Ni-beads所捕获。将这些噬菌体从Ni-beads上洗脱后，用这些噬菌体感染BLT5403大肠杆菌扩增，再重复进行阴性、阳性筛选，经过多轮筛选后，单克隆的噬菌体利用PCR进行测序，从而得到E3的底物序列［45］。

该技术的原理决定它可以对非降解的泛素连接酶底物进行考察，并且只要能够构建E3对应的体外泛素化修饰系统，理论上就可以对底物进行筛查。但该技术与利用蛋白质微阵列鉴定泛素连接酶底物的原理类似，所以也存在和利用蛋白微阵列进行泛素连接酶底物鉴定存在类似的限制。

2.4 基于质谱技术的泛素连接酶底物鉴定

基于质谱技术的泛素连接酶底物鉴定包括多种方法，这些方法之间存在较大差异，其共同点是最后都是通过质谱技术进行蛋白质鉴定。Yumimoto等［46］发展了一种利用差异蛋白质组鉴定F-box构成的复合体泛素连接酶底物的方法DiPIUS。这两种方法首先都需要构建野生型和突变的F-box蛋白，并且给它们带上FLAG标签。突变的F-box蛋白不能与skp1结合，也就不能构成完整的SCF泛素连接酶复合体，无法介导底物发生泛素化。第一种方法是将F-box在分别用12C和13C标记的细胞中表达，利用MG132抑制蛋白酶体。然后通过免疫共沉淀技术同时对野生型和突变型F-box蛋白进行沉淀，经过酶切后进行质谱鉴定，进行差异蛋白质组分析。另一种方法，将两种F-box蛋白分别在不标记的细胞中表达，然后分别用免疫共沉淀技术对F-box蛋白进行沉淀。利用SDS-PAGE蛋白电泳分离蛋白，酶切后分别进行质谱鉴定，进行差异蛋白质组分析。利用该方法，作者对Fbxw7α、Skp2和Fbx15的底物进行了鉴定，得到一些先前已知的底物，如Fbxw7α的底物c-Myc、Skp2底物p27、Fbx15底物IPR1和IPR2，证明了方法的有效性。

另一种利用质谱鉴定底物的方法，是利用串联的UBA富集泛素的方法进行底物鉴定。UBA结构域是泛素结合结构域，能够结合泛素。Shi等［47］曾利用4个串联的UBA拷贝富集泛素化蛋白，并通过质谱技术鉴定泛素化修饰位点。Rubel等［48］进一步利用4个串联的UBA domain进行泛素化蛋白的富集，首先分离新生大鼠心肌细胞，作为用于后续泛素化试验的细胞系。将大鼠的MuRF1泛素连接酶包装成带Myc标签的腺病毒，然后侵染之前分离的细胞系，分别向对照组和试验组加入串联了4个UBA拷贝的琼脂糖珠（TUBE组）和不带UBA结构域的琼脂糖珠（Control组）。孵育一段时间后进行分离，从琼脂糖珠上分离蛋白（eluate），并保留上清液（Supernatant），分别做3组2维凝胶电泳：Control TUBE eluate VS Experiment TUBE eluate；Experiment TUBE supernatant VS Experiment agrose control supernatant；Control TUBE supernatant VS Control agarose control supernatant。如果鉴定E3的底物，第1组选取Ctrleluate＜Expeluate，第2组选取Expctrl＞ExpTUBE，第3组选取Ctrlctrl＞CtrlTUBE的蛋白进行质谱鉴定。鉴定后前两组得到的是发生泛素化的蛋白，第3组得到的是组成型泛素化的底物。通过去冗余分析，可以得到待研究泛素连接酶的底物。如果利用该方法进行DUB底物鉴定，只需要在对凝胶电泳后的结果进行蛋白选取时遵循相反的原则即可。

质谱方法进行泛素连接酶底物的鉴定，分离和获得潜在底物蛋白的方法多种多样，最后都需要通过质谱技术对底物蛋白进行鉴定。所以利用质谱技术鉴定底物蛋白，鉴定的覆盖率和准确性受到质谱技术本身的影响和制约。

2.5 基于NEDD8修饰鉴定泛素连接酶底物

在之前讨论泛素化修饰与其他翻译后修饰的交互中，介绍过NEDD8修饰是一种类泛素化修饰，可将类泛素分子NEDD8修饰到底物的赖氨酸残基上。利用这一性质，Zhuang等［49］开发了一种鉴定泛素连接酶底物的方法。直接鉴定泛素连接酶的底物有一些困难，如泛素化底物通常较多，所以如果要直接鉴定某一种泛素连接酶的底物，可能受到其他泛素化修饰的干扰。而NEDD8修饰相比泛素化修饰，是一种细胞内比较稀少的修饰，为了鉴定IAP泛素连接酶的底物，Zhuang等巧妙的将NEDD8的结合酶Ubc12与IAP泛素连接酶进行了融合。融合后的蛋白可以将NEDD8修饰到原本应该修饰泛素的底物赖氨酸。通过鉴定被NEDD8修饰的蛋白，就可以鉴定到泛素连接酶的底物。利用该方法，有50多个IAP泛素连接酶的底物被鉴定。

该方法设计非常巧妙，并且利用NEDD8修饰代替泛素化修饰，避免了泛素化修饰底物鉴定中的一些困难。但是泛素蛋白和NEDD8蛋白的空间结构存在着一些差异，可能导致该方法存在一定的假阳性和假阴性问题。

3 泛素连接酶底物选择关系的生物信息学研究

随着泛素连接酶与底物选择关系研究的不断深入，以及高通量鉴定泛素连接酶底物方法的不断产生和发展，大量的泛素连接酶和底物选择关系的研究数据不断产出。随之也产生了几个对泛素连接酶和底物关系进行收录的数据库。另一方面，随着数据的不断积累，利用生物信息学方法进行泛素连接酶底物的研究和预测变得可能。

3.1 收录泛素连接酶和底物选择关系的数据库

E3net（http：//pnet.kaist.ac.kr/e3net/）是一个以E3为中心，收录泛素连接酶及其底物的数据库［50］，E3net收录了来自人、小鼠、酵母等多个物种的2 201个E3和4 896个底物数据。以人为例，收录了415个E3和1 590个底物数据，其中190个E3包含有对应的底物信息。E3net的数据由对PubMed数据库的文献摘要的文本挖掘、对UniProt数据库注释信息的文本挖掘、对公共泛素化数据库的整合和少量对高通量实验数据的整合构成。E3net通过以E3或底物为中心浏览数据条目，提供了E3或底物的UniProt访问号、描述该蛋白为E3或底物的文献语句或UniProt注释、通路信息、参与的生物学过程、功能、家族、定位、相关疾病等信息。如果该蛋白有对应的底物或E3信息，则会提供描述它们之间特异性选择关系的文献和数据库信息。为了更全面的了解E3对底物的调控信息，E3net还利用数据库中的数据构建了一个E3和底物的调控网络。用户可以可视化的对该网络进行浏览。

E3net数据库是目前收录E3和底物选择关系最全面的数据库，其数据具有多个来源，数据质量较高。E3net中收录了许多复合体的E3，数据库对这些复合体的亚基进行了系统收录并且特别标示了复合体中负责底物识别的亚基。利用其构建的网络可以方便的对E3和底物的相互选择关系进行浏览，帮助进行E3底物调控网络的研究。但是数据库的数据自2012年之后没有更新，也没有提供数据提交功能，不利于用户帮助补充数据，并且不提供数据的下载。

hUbiquitome（http：//202.38.126.151/hmdd/hubi）数据库是一个旨在收录高可信实验验证的人类泛素化酶和底物数据的数据库［51］。数据库由于对数据的要求标准比较严格，所有数据经过人工校验，所以数据量相对较小。包含1个E1、12个E2、138个E3、279个底物和17个DUB数据。hUbiquitome所有数据基于PubMed数据库中的文献获得。hUbiquitome支持通过blast方式，利用序列信息搜索相关的泛素化酶与底物数据。hUbiquitome提供了全部数据的下载，这相比前面介绍的E3net数据库，极大地方便了研究者利用hUbiquitome数据库数据进行更深入的泛素化机制讨论。hUbiquitome数据库提供了用户提交数据的功能。让用户可以参与进行数据库的完善和补充。但是用户无法在线提交数据，需要通过填写表格后邮件发送给作者的方式提交数据，这在一定程度上会影响用户提交数据的积极性。hUbiquitome数据库数据自2011年10月后无更新。

SCUD（http：//scud.kaist.ac.kr/）数据库是一个收录酵母的泛素化相关酶与底物的数据库［52］。数据库包含42个不同的E3和940个底物，并对E3进行了分类，但是该数据库物种比较局限。除了上面介绍的这些数据库外，泛素化相关的数据库还有收录实验产出的底物和位点信息的Ubiprot数据库［53］、收录植物泛素化酶系统的plantsUPS［54］、收录植物泛素化相关通路的数据库plantsUBQ等。

3.2 利用生物信息学方法进行泛素连接酶底物的研究和预测

TRAF6是一个RING类E3，p62可以作为泛素连接酶TRAF6的适配体蛋白，帮助识别并结合底物。Jadhav等［55］通过对TRAF6/p62已知的两个底物NRIF和TrKA进行分析，总结出了一个包含10个氨基酸的motif：［-hydrophobic-k-hydrophobic-x-xhydrophobic-polar1-hydrophobic-polar2-hydrophobic-］进行底物的预测。该研究收集了155个p62的相互作用蛋白和54个不发生相互作用的蛋白，利用bruteforce比对算法，对这些蛋白上K附近的氨基酸进行motif匹配。根据匹配结果，发现了一些可能以p62作为桥接蛋白的TRAF6底物。Jadhav等［55］的研究是较早利用生物信息学进行E3底物研究的工作，具有一定的开创性。

Liu等［56］建立了一种利用KEN-box和D-box motif预测APC/C复合体E3底物的方法。通过考察文献，共有68个APC/C底物中的74个D-box motif数据和42个APC/C底物中的44个KEN-box motif数据被收集作为金标准数据集。作者定义满足这两个motif的序列，以及上下游的m，n个氨基酸组成一个ARM（m，n），采用了之前发展的GPS方法［57，58］，通过训练窗口大小（即选取合适的m值和n值）、位点权重和对打分矩阵进行点突变，建立预测模型。利用这个模型，可考察包含KEN-box和D-box的蛋白是否是APC/C复合物的底物，以及匹配这两个motif的区域是否是APC/C的识别区域。

但是利用这两种生物信息学方法进行泛素连接酶底物的预测都是借助E3识别底物的motif进行的，然而目前对泛素连接酶识别底物的motif研究还比较少，所以前面介绍的两项工作都只针对单个泛素连接酶的底物进行讨论。

4 泛素连接酶底物选择关系研究展望

泛素化修饰作为一种重要的翻译后修饰，参与了大部分生物学过程。泛素化修饰具有多样的修饰形式，可以发挥多种多样的功能。随着泛素化相关研究的不断发展，泛素连接酶底物高通量鉴定技术的不断推进，对泛素连接酶底物的研究将更加的深入，实验方法将更加的高效和可靠，随之，将会有大量的泛素连接酶与底物选择关系数据持续产出。随着这些数据的积累，生物信息学方法有望在泛素连接酶底物选择关系包括泛素连接酶底物生物信息学预测、泛素连接酶底物数据库构建和大规模发现泛素连接酶底物方面发挥重要作用。

4.1 泛素连接酶底物的生物信息学预测

生物信息学在蛋白质相互作用预测领域取得了很好的效果，并且随着时间的推进不断的有高水平文献产出［59-62］。随着蛋白质相互作用研究的不断深入，蛋白质相互作用预测不断加入新的特征，效果不断提高。而泛素连接酶与底物的选择关系本质上是一种特殊的蛋白质相互作用。所以通过借鉴蛋白质相互作用预测的方法，结合泛素化修饰具有的性质和生物学特征，对泛素连接酶底物进行生物信息学预测，是很有潜力的研究方向。生物信息学预测泛素连接酶底物，相比实验方法，花费少，效率高。甚至可以利用生物信息学对全基因组进行扫描，构建基于生物信息学预测的泛素连接酶底物选择网络，这将对深入认识泛素连接酶底物选择机制和辅助实验人员筛选泛素连接酶底物研究对象提供很大的帮助。

4.2 泛素连接酶底物选择关系数据库的构建

虽然目前已建立了E3net、hUbiquitome等收录泛素连接酶底物选择关系的数据库，但收录的数据或来自对文献进行的文本挖掘，或来自人工对文献的阅读和整理，这些数据库往往存在数据量较小、数据库维护较差、数据更新不及时的问题。而泛素连接酶底物数据不断产出，大量数据未被很好地收录。所以构建一个数据规模较大，更新及时的泛素连接酶底物数据库非常必要。并且可以借鉴相互作用数据库，为实验人员提供数据提交平台，让实验人员在使用数据库数据的同时参与到数据库的数据补充中来。另外可以借鉴STRING数据库的构建方式［63］，将预测得到的数据加入数据库，以帮助实验人员进行实验设计，并且可以通过实验人员验证预测数据。

4.3 大规模发现泛素连接酶底物

大规模泛素连接酶底物的发现需要进行大量的实验工作。可以利用生物信息学辅助实验验证，降低实验规模。随着生物信息学预测泛素连接酶底物技术的不断发展，如果能够取得接近高通量实验的准确性和覆盖度，那么利用生物信息学预测，进行底物的初步筛选，可以减少实验研究的工作量，降低实验成本。或者可以利用生物信息学方法，采取一定的策略，进行合理的实验设计，如借鉴酵母双杂交实验中用到的smart pooling［64］方法，借助生物信息学设计合理的实验分组方案，在降低实验次数的同时，保证一定的实验重复，提高实验的准确性。

［1］ Goldstein G， Scheid M， Hammerling U， et al. Isolation of a polypeptide that has lymphocyte-differentiating properties and is probably represented universally in living cells［J］. Proceedings of the National Academy of Sciences， 1975， 72（1）：11-15.

［2］ Pickart CM， Eddins MJ. Ubiquitin：structures， functions， mechanisms［J］. Biochimica et Biophysica Acta（BBA）-Molecular Cell Research， 2004， 1695（1-3）：55-72.

［3］ Komander D， Rape M. The ubiquitin code［J］. Annual Review of Biochemistry， 2012， 81：203-229.

［4］ Komander D. The emerging complexity of protein ubiquitination［J］. Biochemical Society Transactions， 2009， 37（Pt 5）：937-953.

［5］ Miranda M， Sorkin A. Regulation of receptors and transporters by ubiquitination：new insights into surprisingly similar mechanisms［J］. Molecular Interventions， 2007， 7（3）：157-167.

［6］ Ikeda F， Dikic I. Atypical ubiquitin chains：new molecular signals［J］. EMBO Reports， 2008， 9（6）：536-542.

［7］ Ciechanover A， Ben-Saadon R. N-terminal ubiquitination：more protein substrates join in［J］. Trends in Cell Biol， 2004， 14：103-106.

［8］ Deshaies RJ， Joazeiro CAP. RING domain E3 ubiquitin ligases［J］. Annual Review of Biochemistry， 2009， 78：399-434.

［9］ Michelle C， Vourc’h P， Mignon L， et al. What was the set of ubiquitin and ubiquitin-like conjugating enzymes in the eukaryote common ancestor？［J］. J Mol Evol， 2009， 68（6）：616-628.

［10］ Moynagh PN. The roles of Pellino E3 ubiquitin ligases in immunity［J］. Nature Reviews Immunology， 2014， 14（2）：122-131.

［11］ Wrighton KH. DNA damage response：a ligase makes sense of DNA damage［J］. Nature Reviews Molecular Cell Biology， 2014，15（2）：76-77.

［12］ Guo X， Baillo A， Dutta SM， et al. HTLV-1 Tax binds to and stabilizes the SUMO-targeted ubiquitin ligase RNF4 during DNA damage response［J］. Retrovirology， 2014， 11（Suppl 1）：98.

［13］ Zhang S， Zhou Y， Sarkeshik A， et al. Identification of RNF8 as a ubiquitin ligase involved in targeting the p12 subunit of DNA polymerase δ for degradation in response to DNA damage［J］. Journal of Biological Chemistry， 2014， 288（5）：2941-2950.

［14］ Inuzuka H， Shaik S， Onoyama I， et al. SCFFBW7 regulates cellular apoptosis by targeting MCL1 for ubiquitylation and destruction［J］. Nature， 2011， 471（7336）：104-109.

［15］ Santra MK， Wajapeyee N， Green MR. F-box protein FBXO31 mediates cyclin D1 degradation to induce G1 arrest after DNA damage［J］. Nature， 2009， 459（7247）：722-725.

［16］ Paolino M， Choidas A， Wallner S， et al. The E3 ligase Cbl-b and TAM receptors regulate cancer metastasis via natural killer cells［J］. Nature， 2014， 507（7493）：508-512.

［17］ Duan S， Cermak L， Pagan JK， et al. FBXO11 targets BCL6 for degradation and is inactivated in diffuse large B-cell lymphomas［J］. Nature， 2012， 481（7379）：90-93.

［18］ Severe N， Dieudonné FX， Marie PJ. E3 ubiquitin ligase-mediated regulation of bone formation and tumorigenesis［J］. Cell Death & Disease， 2013， 4（1）：e463.

［19］ Berkers CR， Ovaa H. Drug discovery and assay development in the ubiquitinproteasome system［J］. Biochemical Society Transactions， 2010， 38（1）：14.

［20］ Yang Y， Ludwig RL， Jensen JP， et al. Small molecule inhibitors of HDM2 ubiquitin ligase activity stabilize and activate p53in cells［J］. Cancer Cell， 2005， 7（6）：547-559.

［21］ Obenauer JC， Cantley LC， Yaffe MB. Scansite 2.0：proteomewide prediction of cell signaling interactions using short sequence motifs［J］. Nucleic Acids Res， 2003， 31（13）：3635-3641.

［22］ Lindon C， Pines J. Ordered proteolysis in anaphase inactivates Plk1 to contribute to proper mitotic exit in human cells［J］. The Journal of Cell Biology， 2004， 164（2）：233-241.

［23］ Lasorella A， Stegmüller J， Guardavaccaro D， et al. Degradation of Id2 by the anaphase-promoting complex couples cell cycle exit and axonal growth［J］. Nature， 2006， 442（7101）：471-474.

［24］ Pfleger CM， Kirschner MW. The KEN box：an APC recognition signal distinct from the D box targeted by Cdh1［J］. Genes & Development， 2000， 14（6）：655-665.

［25］ Arquint C， Nigg EA. STIL Microcephaly mutations interfere with APC/C-mediated degradation and cause centriole amplification［J］. Current Biology， 2014， 24（4）：351-360.

［26］ Ichim G， Mola M， Finkbeiner MG， et al. The histone acetyltransferase component TRRAP is targeted for destruction during the cell cycle［J］. Oncogene， 2014， 33（2）：181-192.

［27］ Ingham RJ， Gish G， Pawson T. The Nedd4 family of E3 ubiquitin ligases：functional diversity within a common modular architecture［J］. Oncogene， 2004， 23（11）：1972-1984.

［28］ Rotin D， Kumar S. Physiological functions of the HECT family of ubiquitin ligases［J］. Nature Reviews Molecular Cell Biology，2009， 10（6）：398-409.

［29］ Graham L， Padmanabhan S. NEDD4L in essential hypertension［J］. Journal of Hypertension， 2014， 32（2）：230-232.

［30］ Fei C， He X， Xie S， et al. Smurf1-mediated axin ubiquitination requires Smurf1 C2 domain and is cell-cycle dependent［J］. Journal of Biological Chemistry， 2014， 289（20）：14170-14177.

［31］ Zhi X， Chen C. WWP1：a versatile ubiquitin E3 ligase in signaling and diseases［J］. Cell Mol Life Sci， 2012， 69（9）：1425-1434.

［32］ Kavsak P， Rasmussen RK， Causing CG， et al. Smad7 binds to Smurf2 to form an E3 ubiquitin ligase that targets the TGFβ receptor for degradation［J］. Molecular Cell， 2000， 6（6）：1365-1375.

［33］ Geetha T， Jiang J， Wooten MW. Lysine 63 polyubiquitination of the nerve growth factor receptor TrkA directs internalization and signaling［J］. Molecular Cell， 2005， 20（2）：301-312.

［34］ Laney JD， Hochstrasser M. Substrate targeting in the ubiquitin system［J］. Cell， 1999， 97（4）：427-430.

［35］ An H， Krist DT， Statsyuk AV. Crosstalk between kinases and Nedd4 family ubiquitin ligases［J］. Molecular Biosystems， 2014，10（7）：1643-1657.

［36］ Zhao Y， Brickner JR， Majid MC， et al. Crosstalk between ubiquitin and other post-translational modifications on chromatin during double-strand break repair［J］. Trends in Cell Biology， 2014， 24（7）：426-434.

［37］ Gill G. SUMO and ubiquitin in the nucleus：different functions，similar mechanisms？［J］. Genes & Development， 2004， 18（17）：2046-2059.

［38］ Kawakami T， Chiba T， Suzuki T， et al. NEDD8 recruits E2-ubiquitin to SCF E3 ligase［J］. The EMBO Journal， 2001， 20（15）：4003-4012.

［39］ Darwanto A， Curtis MP， Schrag M， et al. A modified “cross-talk”between histone H2B Lys-120 ubiquitination and H3 Lys-79 methylation［J］. J Biol Chem， 2010， 285（28）：21868-21876.

［40］ Lee JS， Shukla A， Schneider J， et al. Histone crosstalk between H2B monoubiquitination and H3 methylation mediated by COMPASS［J］. Cell， 2007， 131（6）：1084-1096.

［41］ Yen HCS， Xu Q， Chou DM， et al. Global protein stability profiling in mammalian cells［J］. Science， 2008， 322（5903）：918-923.

［42］ Yen HCS， Elledge SJ. Identification of SCF ubiquitin ligase substrates by global protein stability profiling［J］. Science， 2008，322（5903）：923-929.

［43］ Andrews PS， Schneider S， Yang E， et al. Identification of substrates of SMURF1 ubiquitin ligase activity utilizing protein microarrays［J］. Assay and Drug Development Technologies，2010， 8（4）：471-487.

［44］ Loch CM， Eddins MJ， Strickler JE. Protein microarrays for the identification of praja1 e3 ubiquitin ligase substrates［J］. Cell Biochemistry and Biophysics， 2011， 60（1-2）：127-135.

［45］ Guo Z， Wang X， Li H， et al. Screening E3 substrates using a live phage display library［J］. PloS One， 2013， 8（10）：e76622.

［46］ Yumimoto K， Matsumoto M， Oyamada K， et al. Comprehensive identification of substrates for F-box proteins by differential proteomics analysis［J］. Journal of Proteome Research， 2012， 11（6）：3175-3185.

［47］ Shi Y， Chan DW， Jung SY， et al. A data set of human endogenous protein ubiquitination sites［J］. Molecular & Cellular Proteomics，2011， 10（5）：M110. 002089.

［48］ Rubel CE， Schisler JC， Hamlett ED， et al. Diggin' on U（biquitin）：a novel method for the identification of physiological E3 ubiquitin ligase sustrates［J］. Cell Biochemistry and Biophysics， 2013， 67（1）：127-138.

［49］ Zhuang M， Guan S， Wang H， et al. Substrates of IAP ubiquitin ligases identified with a designed orthogonal E3 ligase， the NEDDylator［J］. Molecular Cell， 2013， 49（2）：273-282.

［50］ Han Y， Lee H， Park JC， et al. E3Net：a system for exploring E3-mediated regulatory networks of cellular functions［J］. Molecular & Cellular Proteomics， 2012， 11（4）：0111.

［51］ Du Y， Xu N， Lu M， et al. hUbiquitome：a database of experimentally verified ubiquitination cascades in humans［J］. Database， 2011， 2011：bar055.

［52］ Lee WC， Lee M， Jung JW， et al. SCUD：Saccharomyces cerevisiae ubiquitination database［J］. BMC Genomics， 2008， 9（1）：440.

［53］ Chernorudskiy AL， Garcia A， Eremin EV， et al. UbiProt：a database of ubiquitylated proteins［J］. BMC Bioinformatics，2007， 8（1）：126.

［54］ Du Z， Zhou X， Li L， et al. PlantsUPS：a database of plants’Ubiquitin Proteasome System［J］. BMC Genomics， 2009， 10（1）：227.

［55］ Jadhav TS， Wooten MW， Wooten MC. Mining the TRAF6/p62 interactome for a selective ubiquitination motif［J］. BMC Proc，2011， 5（suppl 2）：S4.

［56］ Liu ZX， Yuan F， Ren J， et al. GPS-ARM：computational analysis of the APC/C recognition motif by predicting D-boxes and KEN-boxes［J］. PloS One， 2012， 7（3）：e34370.

［57］ Xue Y， Zhou F， Zhu M， et al. GPS：a comprehensive www server for phosphorylation sites prediction［J］. Nucleic Acids Research，2005， 33（suppl 2）：W184-W187.

［58］ Xue Y， Ren J， Gao X， et al. GPS 2.0， a tool to predict kinasespecific phosphorylation sites in hierarchy［J］. Molecular & Cellular Proteomics， 2008， 7（9）：1598-1608.

［59］ Jansen R， Yu H， Greenbaum D， et al. A Bayesian networks approach for predicting protein-protein interactions from genomic data［J］. Science， 2003， 302（5644）：449-453.

［60］ Rhodes DR， Tomlins SA， Varambally S， et al. Probabilistic model of the human protein-protein interaction network［J］. Nature Biotechnology， 2005， 23（8）：951-959.

［61］ Li D， Liu W， Liu Z， et al. PRINCESS， a protein interaction confidence evaluation system with multiple data sources［J］. Molecular & Cellular Proteomics， 2008， 7（6）：1043-1052.

［62］ Zhang Q C， Petrey D， Deng L， et al. Structure-based prediction of protein-protein interactions on a genome-wide scale［J］. Nature，2012， 490（7421）：556-560.

［63］ Snel B， Lehmann G， Bork P， et al. STRING：a web-server to retrieve and display the repeatedly occurring neighbourhood of a gene［J］. Nucleic Acids Research， 2000， 28（18）：3442-3444.

［64］ Thierry-Mieg N. A new pooling strategy for high-throughput screening：the Shifted Transversal Design［J］. BMC Bioinformatics， 2006， 7（1）：28.

（责任编辑狄艳红）

Research Advances in the Selective Relationship Between Ubiquitin Ligases and Substrates

Li Yang Li Dong
（State Key Laboratory of Proteomics，Beijing Proteome Research Center，Beijing Institute of Radiation Medicine，Beijing 102206）

Ubiquitin is a small-molecule protein composed of 76 amino acids. The covalent-bonding process between ubiquitin and substrates is defined as Ubiquitination. Ubiquitination modification， an efficient， ATP-dependent， and highly specific process， is mediated by a cascade regulation of ubiquitin activating enzymes， ubiquitin conjugating enzymes， ubiquitin ligase and deubiquitinating enzymes. Ubiquitination is highly relevant with biological processes like cell cycle regulation， cell apoptosis， transcription regulation， DNA damage response and so on. In the process of ubiquitination， the recognition between ubiquitin ligases and substrates is critical for the specificity. The mechanisms of such recognition are being reported moreover the high throughput methods identifying E3’s substrate are being improved and developed. With the accumulation of ubiquitination data from the deep-going research， the bioinformatics approach studying the selective relationship between E3s and substrates is becoming a hot spot. This article will discuss the recognition mechanism between E3s and substrates， the high throughput methods used for the identification of E3’s substrates， review the bioinformatics study about E3s’ substrates and highlight the future research direction.

ubiquitination；ubiquitin-ligase；substrate；bioinformatics

2014-06-09

国家重大科学研究计划项目（2012CB910300， 2011CB910202），国家高技术研究发展计划项目（“863”计划）（2012AA020201），国家自然科学基金项目（31271407），国际科技合作与交流专项（2014DFB30020）

李杨，硕士研究生，研究方向：泛素连接酶底物的生物信息学；E-mail：liyang_bprc@163.com

李栋，博士，副研究员，研究方向：蛋白质组学和生物信息学；E-mail：lidong.bprc@foxmail.com