二、组蛋白修饰

(一)组蛋白修饰的作用

组蛋白修饰(histone modification)包括赖氨酸残基的乙酰化、赖氨酸残基和精氨酸残基的甲基化、丝氨酸残基和苏氨酸残基的磷酸化、赖氨酸残基的泛素化与类泛素化、谷氨酸残基的ADP-核糖基化等。赖氨酸残基的氨基可形成一甲基化、二甲基化或三甲基化物,精氨酸残基可形成一甲基化或二甲基化物。组蛋白修饰主要有两种作用方式:可通过影响组蛋白与DNA双链的亲和性,从而改变染色质的疏松或凝结状态;或通过影响其他转录因子与结构基因启动子的亲和性来发挥基因调控作用。组蛋白修饰对基因表达的调控有类似DNA遗传密码的调控作用,这些修饰成为组蛋白印记(histone imprints),现在也称为“组蛋白密码”(histone code)。组蛋白密码可被一系列特定的蛋白质所识别,并将其翻译成一种特定的染色质状态,以实现对特定基因表达的调节,扩大了遗传密码的信息储存量。DNA的转录有赖于两大对立力量的较量,一种为激活因子,通过乙酰化修饰组蛋白,它们可以松散DNA的螺旋结构,有利于RNA 聚合酶的结合;另一种是抑制因子,它们可以修饰组蛋白,主要是组蛋白的甲基化修饰,从而招募去乙酰化酶,去掉激活类修饰,进而增加染色质的屏障作用。这种平衡一旦被打破就会导致多种疾病。
最近有学者在酵母细胞中研究基因功能时发现,组蛋白的修饰可以控制一个基因是否被允许发挥功能,这对于维持基因的表达潜力非常重要,以便确定未来细胞的行为。基因表达是生物活性细胞最重要的一个基础环节,即便是拥有同样DNA的细胞,基因表达的不同程序都会表现出不同的细胞行为和功能。比如人类肌肉细胞和神经细胞拥有同样的DNA,但是其行为和功能并不一样。基因表达的错误调节会影响细胞的适合度,并且引发疾病。在细胞间基因表达不同,错误调节是在一小类细胞中发生的,而且这些细胞随后也会发病,因此在单一细胞水平上研究基因调节至关重要。研究者使用细胞分裂的荧光录影技术,就可以观察到一种名为 HO的基因在单一酵母细胞中如何进行表达。正常情况下, HO的表达会使得芽殖酵母变性,即从雄性变成雌性;而更有意思的是这种性转变仅仅是在母体细胞中发生的。研究者发现, HO基因在98%的母体细胞中表达,同时也在3%的子代细胞中表达。研究者发现的问题是,为何在2%的母体细胞及3%的子代细胞中, HO基因的表达调节是失败的,而最终研究者发现问题出在组蛋白上。组蛋白是一种携带有DNA的蛋白复合体,组蛋白结构的改变可以影响部分细胞的功能,进而使得 HO基因出现错误表达。如果 HO基因在单一细胞中开启,其很有可能在该细胞的后代细胞中也被开启表达,而 HO基因表达的这种短期记忆可以通过组蛋白修饰来完成。

(二)组蛋白修饰的命名

组蛋白修饰在命名时首先以组蛋白名称开始,如H3;然后加上单一字母的氨基酸简称(如K代表赖氨酸)及在蛋白质的位置;最后是修饰的种类,如Me即甲基化、P即磷酸化、Ac即乙酰化、Ub即泛素化。举例来说,H3K4Me就代表组织蛋白H3从N端开始起计第4个赖氨酸的甲基化。

(三)组蛋白修饰的主要类型 1.组蛋白乙酰化

组蛋白乙酰化修饰是表观遗传学调解中研究最早的翻译后修饰,与基因活化关系密切,主要受组蛋白乙酰基转移酶(histone acetyltransferases,HATs)和组蛋白去乙酰化酶(histone deacetylases,HDACs)的共同调控。前者将乙酰辅酶A的乙酰基转移至核心组蛋白氨基末端中特定的赖氨酸残基上,中和其电荷,使核小体DNA易于接近转录因子,乙酰基转移酶则充当了转录的辅激活因子。它还可以通过与各种反式激酶的蛋白质相互作用,被募集到染色质的特定位点上以便其发挥调节基因转录的作用。后者通过组蛋白N端的去乙酰化,使组蛋白带正电荷,从而与带负电荷的DNA紧密结合,染色质呈致密卷曲的阻抑结构,抑制转录。已知HAT和HDAC对乙酰化位点有严密的特异性,他们不仅参与整个基因组的乙酰化和去乙酰化,还参与修饰其他因子。乙酰化转移酶主要是在组蛋白H3、H4的N端尾上的赖氨酸加上乙酰基,去乙酰化酶则相反,不同位置的修饰均需要特定的酶来完成。组蛋白乙酰化和去乙酰化之间的调节主要是通过对乙酰转移酶和去乙酰化酶的调节来实现。
体外研究表明,在组蛋白H3主要的乙酰化位点中,K14最容易发生乙酰化,这也许与K14以外的氨基酸序列有关。Hanse等认为,核小体中的组蛋白不必完全乙酰化,仅40%乙酰化就足以防止染色质折叠,促进RNA聚合酶催化转录。同时,组蛋白乙酰化高度保守,具有调节染色质的功能。Turner等发现,H4尾部K5和K12去乙酰化可促进染色质组装,并为转录因子和染色质修饰酶的结合和发挥作用提供条件。乙酰化酶家族可作为辅激活因子调控转录,调节细胞周期,参与DNA损伤修复,还可作为DNA结合蛋白。去乙酰化酶家族则和染色体易位、转录调控、基因沉默、细胞周期、细胞分化和增殖以及细胞凋亡相关。组蛋白乙酰化/去乙酰化的平衡失调与多种疾病的发生有关。

(1)组蛋白乙酰基转移酶:

乙酰基转移酶分为3个家族,即Gcn5相关的N-乙酰转移酶(Gcn5 N-acetyl transferase,GNAT)家族、MYST(MOZ/Ybf2/Sas2/Sas3/Tip60)家族和环磷酸腺苷反应元件结合蛋白(CREB-binding protein,CBP)/p300家族。CBP和p300是两种不同的蛋白质,但是两者在氨基酸序列和功能上非常相似,除了参与组蛋白乙酰化外,还可以通过与环磷酸腺苷反应元件结合蛋白、Fos等相互作用募集到特定的基因上,调控基因的表达。同时,乙酰基转移酶也可以乙酰化非组蛋白,表明乙酰基转移酶在复杂的细胞信号转导通路上发挥了重要的作用。

(2)组蛋白去乙酰化酶:

该家族根据氨基酸序列可分为4类:①Ⅰ类包括HDAC1~3和8,广泛存在于人体的各种器官,与酵母酶Rpd3有关。②Ⅱ类包括HDAC4~7、9和10,具有组织特异性,多在心脏、肺、骨骼肌表达,与酵母蛋白HDA1有关。根据结构相似性可进一步将此类分为两个亚类,即Ⅱa(HDAC4、5、7和9)和Ⅱb(HDAC6和10)。③Ⅲ类包括酵母中沉默信息调节因子2及其相关蛋白,具有烟酰胺腺嘌呤二核苷酸依赖性,与酵母HDAC Sir2具有同源性,在人类中有7种Sir2同源物,分别为沉默信息调节因子1~7。④Ⅳ类HDAC11是该家族中最后发现的,其序列与其他三类相似性很低。这4类中除了第Ⅲ类,都是锌依赖的酶(表3-1)。
表3-1 组蛋白去乙酰化酶家族
多数学者认为Ⅰ类去乙酰化酶对基因的调节起重要作用,如HDAC1和HDAC2能够调节细胞增殖和肿瘤的发展过程。将鼠胚胎成纤维细胞中的HDAC1敲除后能够诱导G1期部分停滞,这种作用在HDAC2敲除后能够得到增强。在T淋巴细胞中,HDAC1能够限制细胞因子的表达和增殖。将癌细胞基因中的HDAC2敲除后能够产生更多的分化表型,并通过上调p21的表达促进凋亡。将乳腺癌细胞中的HDAC2敲除后能够增强p53的结合活性,从而抑制细胞增殖和促进细胞衰老。然而将心肌细胞、胶质细胞、神经元和B型细胞中的HDAC1或HDAC2敲除并不能引起这些细胞系的明显损伤。而将这些细胞中的这两种酶联合敲除后能够使细胞在增殖、分化以及存活方面产生明显的变化,表明这两种酶存在互补作用。如将成纤维细胞中的这两种酶同时敲除,能够引起细胞周期停滞在G1期,并伴随着细胞周期蛋白依赖性激酶抑制剂p21和p57表达的增加。也有研究表明HDAC1/HDAC2缺失的成纤维细胞所呈现的老化和G1期细胞周期停滞,并不是通过p53/p21途径完成的。

(3)组蛋白去乙酰化酶抑制剂:

组蛋白去乙酰化酶抑制剂靶向作用于HDAC,主要通过抑制HDAC的活性使组蛋白乙酰化程度升高,引起染色质重组,DNA转录活化或抑制。组蛋白去乙酰化酶抑制剂通常由三部分构成:链接器区域(linker region)、成盖组件(capping group)和一个金属基团(metal moiety)。MS275是一种合成的苯甲酰胺衍生物,在HDAC1、2、3和9同时存在的情况下能够优先抑制HDAC1,不能或很少能够抑制HDAC4、6、7和8的活性。MS275经口服后能够很容易地透过血-脑屏障,不会产生严重的不良反应;Apicidin是一种四环肽,在较低浓度时能够抑制HDAC2和HDAC3的活性,在较高浓度时能够抑制HDAC8的活性,但并不影响HDAC1或Ⅱ类HDAC的活性;FK-228也是一种四环肽,具有较强的抑制HDAC1和HDAC2活性的能力。
利用小分子量的组蛋白去乙酰化酶抑制剂来抑制HDAC的活性已经引起了更多的关注。人们最初的研究主要集中在去乙酰化酶抑制剂作为一种抗癌药物方面,曲古抑菌素作为一种去乙酰化酶抑制剂,可致多种肿瘤细胞生长停滞在G1或G2/M期,研究发现曲古抑菌素对骨肉瘤细胞有很强的周期阻滞和诱导凋亡作用,经过曲古抑菌素作用后,p21 mRNA表达显著增强。研究表明,p21 mRNA基因转录活性增加与其相关组蛋白乙酰化有关。 p21基因为野生型 p53基因的下游靶基因的转录产物,是细胞周期蛋白与细胞周期蛋白依赖性激酶的广泛抑制剂,可与多种细胞周期蛋白依赖性激酶复合物结合抑制底物磷酸化,导致细胞生长阻滞于G2/M期,抑制细胞无限增殖。 p21基因对于细胞具有重要的调节作用,在各种组织中限制干细胞的自我增殖, p21- /-鼠与野生型鼠相比拥有更多的干细胞,并且处于静止期的干细胞减少。 p53基因是肿瘤抑制基因,能够调节干细胞的细胞周期进程,抑制去分化并且能够诱导神经前体细胞和有丝分裂后的神经元凋亡。 p53基因缺失能够促进神经球的形成并诱导干细胞向神经元分化,表明 p53基因调控干细胞自我复制、分裂、生存和分化。HDAC能够下调p53,即p53与HDAC的相互作用能够引起p53脱乙酰化,从而降低其转录活性。p53与HDAC结合能够抑制 p21基因的转录,SP1是HDAC1的一个结合域,在DNA损伤时p53能够和SP1结合形成p53-SP1复合物并且同时使HDAC1从SP1游离,使p21启动子组蛋白核心超乙酰化,抑制 p21基因转录,调节p21中HDAC1,可能是p53的拮抗剂(表3-2)。

(4)内源性乙酰化酶抑制剂:

靶向抑制去乙酰化酶已经成为治疗肿瘤等疾病的研究方向,多种乙酰化酶抑制剂化合物被证实有效,但是部分化合物的毒性和副作用限制了其进入临床应用的前景。近期,内源性乙酰化酶抑制剂的研究为这一问题的解决提出了新的方向。肿瘤抑制分子HIC1(hypermethylated in cancer)和DBC1(deleted in breast cancer 1)能够直接抑制Sirt1的功能,Chfr和REN则能够通过去泛素化而下调HDAC1。 丝氨酸蛋白酶抑制剂家族中的maspin被证实能够抑制HDAC1,对肺癌的进展和预后产生影响。脂质鞘氨醇-1-磷酸(lipid sphingosine-1-phosphate,S1P)能够抑制HDAC1和HDAC2的活性。这些内源性乙酰化酶抑制剂在肿瘤发病时表达常常缺失,恢复这些“抗肿瘤分子”的正常功能是肿瘤防治的有效方法之一,也为研发特异性更强的小分子化合物乙酰化酶抑制剂奠定基础。
表3-2 组蛋白去乙酰化酶抑制剂

(5)组蛋白乙酰化/去乙酰化调控基因表达:

目前认为组蛋白乙酰化/去乙酰化影响基因的表达主要是通过以下几种方式实现的:①改变核小体周围环境,加强或削弱基因表达相关蛋白质与DNA的相互作用;②参与染色质构型改变,进而影响蛋白质与蛋白质,蛋白质与DNA 的相互作用;③组蛋白乙酰化/去乙酰化作为特殊信号,被其他蛋白质因子识别并影响它们的活动。
染色质和染色体是细胞核中同一物质的两种不同形态,是以核小体为基本组成单位,经螺旋、盘绕、压缩而成。每个核小体包括两部分,其核心是由核心组蛋白八聚体及缠绕其上的DNA;另一部分是连接两个核小体核心的DNA链,其上结合有一个H1,在N末端发生多种共价修饰,其中最易发生的是赖氨酸ε-氨基的乙酰化。核小体组蛋白的乙酰化中和了其周围的正电荷,增加了组蛋白的亲水性,削弱了组蛋白与DNA的相互作用,而使染色质处于相对松弛的状态,利于转录因子与DNA的结合;相反,组蛋白的去乙酰化则使核小体周围带正电荷增加,与DNA的磷酸基所带负电荷的相互作用加强,染色质结构变得紧密而不利于转录。这可能是组蛋白乙酰化/去乙酰化参与基因表达调控的机制之一,也能较好的解释和支持组蛋白乙酰化促进基因活化,而去乙酰化参与基因沉默的观点。
要实现基因的表达,处于高度螺旋状态的染色质必须发生构型改变,使其处于相对松弛的状态,以便于转录因子与DNA的结合及其他蛋白质因子的相互作用,此过程即为染色质构型重建。至少有两类物质参与了染色质构型重建:一类称为ATP依赖的染色质构型重建复合体(或酶),有三个家族,即SWI2/SNF2家族、ISWI家族(人类包括RSF、hACF/WCRF、hCHRAC等)和Mi-2/NuRD家族,它们能利用水解ATP产生的能量使染色质构型改变或核小体滑动。另一类就是参与“组蛋白尾巴”修饰的酶类,主要是使组蛋白乙酰化和去乙酰化的酶,共同改变染色质的结构。如在INF-β基因转录起始复合物形成过程中,首先是相关转录因子(如NF-κB、IRFs、ATF-2等)结合到核心核小体外的增强子上,形成增强子复合体,由这个复合体招GCN5,使核小体组蛋白H3的第9位和H4第8位赖氨酸乙酰化,SWI/SNF识别并结合到CBP(CREB binding protein)和乙酰化了的核小体上,通过一种尚未明确的机制改变染色质构型,使TFⅡD连接到TATA盒上形成转录起始复合物。许多实验证明,在哺乳动物细胞中HATs可促进SWI/SNF连接到染色体上并维持其稳定,核小体组蛋白乙酰化后才能被SWI/SNF的溴域识别,并结合到乙酰化了的组蛋白上发挥其作用;然而,在对酵母的研究中却发现SWI/SNF依赖的染色质构型改变发生于组蛋白乙酰化之前。此外,有些ATP依赖的染色质构型重建复合体本身就具有HDAC活性,如HDAC1和HDAC2共同构成Sin3、Mi-2/NuRD和CoREST的催化核心,HDAC3则是N-CoR和SMRT的催化亚基。因而,Mi-2/NuRD在染色质构型重建中作用的发挥离不开组蛋白去乙酰化酶,同样hSWI/SNF需与Sin3及CoREST结合发挥作用,转录抑制因子通过依次招募CoREST、Sin3和hSWI/SNF形成封闭的染色质结构而抑制转录。另外,HDAC1还与DNA拓扑异构酶Ⅱ相互作用,使染色形成紧密的结构导致基因沉默。
组蛋白尾巴的N端尾巴上不同位点的不同修饰可形成大量特殊信号,类似各种不同的密码,供其他蛋白质因子识别,并影响一系列相关蛋白质的活动。这就是已被多数学者所认可的“组蛋白密码”学说。在“组蛋白尾巴”上,不同的氨基酸位点可发生不同的修饰,同一氨基酸位点也可发生不同的修饰,这些修饰可相互作用,也可被其他蛋白质的活动所影响,亦可影响其他蛋白质的活动,形成一种复杂的网络,对基因的表达调控产生影响和作用。组蛋白的乙酰化是其中一种较为重要的修饰方式,也是这个复杂网络中的一个重要环节。组蛋白乙酰化/去乙酰化并不能直接引起染色质结构的改变,也不能使核小体滑动,而是通过招募染色质构型重建复合体并与其协同作用引起染色质构型改变的。组蛋白乙酰化甚至是其他转录因子活动的前提,如H4第8位赖氨酸的乙酰化是招募SWI/SNF所必需的,而H3的第9和14位赖氨酸的乙酰化则是招募TFⅡD 的关键。HDACs可与多种转录因子或辅因子相互作用,如几乎所有第Ⅱ类HDACs都能与DNA 结合的转录因子或转录辅抑制因子相互作用而参与转录的激活或抑制。HDACs也可以和DNA甲基化酶或组蛋白甲基化酶等结合,共同受转录抑制因子招募,参与基因转录抑制。乙酰化的组蛋白可与称为溴域的结构作用,则可能是组蛋白影响其他因子活动的主要方式,因许多染色质构型重建复合体和转录因子或辅因子都具有这一结构,故组蛋白乙酰化修饰可与许多转录因子发生作用,参与到复杂的基因表达调控网络中。组蛋白乙酰化/去乙酰化也受其他蛋白质活动的影响,转录激活因子(或抑制因子)可招募HATs(或HDACs)复合物到基因启动子区使特定组蛋白乙酰化或去乙酰化。有研究发现,基因启动子附近组蛋白高甲基化可招募HATs增强基因表达,而低甲基化可招募HDACs抑制基因表达。也有研究表明,H3的第9位赖氨酸既可甲基化也可乙酰化,甲基化和乙酰化是相互排斥的,H3第10位丝氨酸的磷酸化能增强Gcn5催化H3的第14位赖氨酸乙酰化的能力。组蛋白乙酰化酶和去乙酰化酶也受胞内或外源性物质的调节。还有研究发现人细胞内有一种能抑制P300/CBP和P/CAF的复合物,即乙酰转移酶抑制剂(inhibitor of acetyltransferases,INHAT),并认为INHAT对HAT的抑制在染色质构型改变和基因转录调控中起重要作用。某些转录因子也具有调节HAT 活性的功能,病毒癌蛋白SV40的T抗原可以增强HAT的活性。HATs和HDACs本身也可被修饰,如酪蛋白激酶2可使HDAC1和HDAC2特殊位点磷酸化而调节其活性,具有HATs活性的ATCR可被P300/CBP乙酰化,而且P/CAF的乙酰化可增强其自身的活性。此外,已发现多种外源性物质(如丁酸盐、TSA、FK228等)可抑制HDACs的活性,影响多种基因的表达,而具有抗肿瘤作用。

2.组蛋白甲基化

组蛋白甲基化是继DNA甲基化之后提出的概念。组蛋白甲基化主要发生在组蛋白H3和H4的赖氨酸和精氨酸残基上,另外组蛋白的球状结构域有时也会被甲基化,由组蛋白甲基转移酶(histone methyltransferase,HMT)和组蛋白去甲基化(histone demethylation,HDM)调控。研究发现,HMT和HDM可与同一个蛋白复合体结合,组蛋白是否被甲基化很大程度上直接取决于这个蛋白复合即时结合的对象。因此,HMT和HDM的表达、活性和招募都会改变组蛋白的状态,从而改变转录平衡。

(1)组蛋白甲基转移酶:

组蛋白甲基化反应由数种HMT催化。赖氨酸残基存在单、双或三甲基化三种不同方式。精氨酸残基有单和双甲基化两种方式,甲基转移酶主要有3个蛋白家族,即蛋白质精氨酸甲基转移酶家族、含有保守的SET(suppressor of variegation,enhancer of zeste and trithorax)催化结构域的蛋白家族和不含SET催化结构域的家族。HMT独特的结构决定了其对底物的识别既具有特异性又具有多样性,如ESET、G9a 和SUV39H1是组蛋白H3K9甲基化的重要酶类,MLL催化H3K4甲基化,EZH2催化H3K27甲基化。
SET结构域高度保守,约含110个氨基酸,是植物核酮糖二磷酸羧化酶-加氧酶中大亚基转移酶(large subunitmethyltransferase,LSMTs)的一部分。同其他甲基转移酶相比较,含有保守的SET结构域的HMT具有一个独特的折叠结构,一系列连续的β折叠插入3个非连续的片层中,环绕围成一个类似于绳结的三级结构(knot like structure)。如此与众不同的类绳结结构是SET结构域C末端片段穿插入蛋白末端序列向前延伸围成的环状结构形成的。与SET结构域相关的蛋白质可以分为四个家族:SET1、SET2、SUV39、RIZ。任何酶都具有特异的修饰底物,特定的HMT也有其特异的甲基化位点。关于这种特异性的机制,一种观点认为SET起到了类似抗原决定簇的作用,使不同的甲基转移酶识别不同的底物;另一种观点则认为同一个HMT识别不同底物的同一基序。HMT的活性部位大多是由一些疏水氨基酸所构成,这些关键氨基酸的突变可能造成酶活性的改变或丧失。
DOT1L是目前唯一不含SET结构域的HKMTs,能特异性催化H3K79甲基化,且只能催化位于核小体中的蛋白H3的甲基化,而不能催化从核小体分离出来的组蛋白H3的甲基化。DOT1L是一个在进化上保守的蛋白,其二级结构中具有组蛋白精氨酸甲基转移酶的标志性结构域。DOT1L的这个特性使之可以把DNA复制之后新形成的核小体和原有的核小体区分开来,因为新合成的染色质还不存在H3K79甲基化,这可以为其他的组蛋白修饰(如乙酰化)提供信息,使新合成的染色质能继承模板染色质的表观信息和结构。

(2)组蛋白去甲基转移酶:

去甲基化酶负责清除组蛋白的甲基化标记。人蛋白精氨酸脱亚氨酶4(protein-arginine deiminase type-4,PADI4)可以将甲基化的精氨酸转换为瓜氨酸,但由于并非移除甲基,故PADI4并不是严格意义上的去甲基化酶。PADI4可特异性地针对单甲基化的底物,使精氨酸脱亚氨基可以在H3R2、H3R8、H3R17、H3R26以及H4R3上发生。研究报道,对于激素诱导的基因招募组蛋白甲基转移酶PRMT1和CARM1至这些基因的启动子上,将导致这个区域组蛋白精氨酸甲基化快速增加并引起转录激活,之后PADI4被招募到上述启动子区域使甲基化精氨酸残基转化为瓜氨酸并导致RNA聚合酶Ⅱ脱离目的基因。此外,继精氨酸脱亚氨基之后再次发生的精氨酸残基甲基化,可能对激素诱导的基因表达开启与关闭有调控作用。除精氨酸脱亚氨基这种作用之外,真正意义上的精氨酸甲基转移酶亦被发现,JMJD6(Jumonji domain-containing protein 6-A)为包含JmjC(Jumonji-C)结构域的铁及2-酮戊二酸依赖的加双氧酶,可对H3R2、H4R3进行去甲基化。
赖氨酸特异性组氨酸去甲基酶-1(lysine-specific histonedemethylase1,LSD1)是以FAD为辅助因子,以甲醛及非甲基化的赖氨酸残基为产物的组蛋白去甲基化酶,可以和Co-REST、BHC80、HDAC1/2等蛋白形成复合物共同发挥生物学作用。LSD1可识别H3K4me1和H3K4me2并使其去甲基化,Co-REST自身为染色质相关的转录抑制子,与LSD1 形成复合物时可以改变LSD1的底物。Co-REST复合物首先被认为可以抑制非神经元细胞中神经元基因的转录,LSD1在Co-REST的靶基因上引起H3K4去甲基化并导致转录抑制。此外,LSD1和雄激素受体联合作用可以使LSD1成为H3K9去甲基化酶,并成为转录激活子,引起激素依赖的转录激活。同时,LSD1在雌激素依赖的转录调控中也有类似作用。
含有JmjC结构域的蛋白家族是另一类以Fe(Ⅱ)和α-酮戊二酸为辅因子的去甲基化酶,其家族成员可对H3K4、H3K9和H3K36等多个位点进行去甲基化,具有广泛的作用。JHDM1A(JmjC domain-containinghistone demethylation protein 1A)是特异性的H3K36me2及H3K36me1去甲基化酶。JHDM2(主要为JHDM2A 和JHDM2B)是H3K9特异的去甲基化酶,可识别H3K9me2及H3K9me1。JHDM3A/JMJD2A可以催化H3K9me3/2及H3K36me3/2的去甲基化,从而导致H3K9me1及H3K36me1累积;JMJD2B与异染色质的形成有关,JMJD2C/GASC1 在多种食管鳞状上皮癌相关细胞系中高表达,抑制JMJD2C可减弱细胞增殖,这一过程可能和JMJD2C去甲基化减弱了H3K9的甲基化程度及其与HP1的作用相关。此外,JMJD2C通过和LSD1的相互作用,共同发挥使H3K9me1/2/3去甲基化的作用,可刺激雄激素依赖的基因转录。JARID1A/RBP2则可以催化H3K4me3及H3K4me2的去甲基化,同时亦具有改变H3K4甲基化状态从而引起转录调控的功能。

(3)组蛋白赖氨酸甲基化:

组蛋白赖氨酸甲基化修饰有广泛的生物学功能,如干细胞的维持和分化、X 染色体失活、转录调节和DNA损伤反应等。与组蛋白赖氨酸乙酰化促进基因表达不同,组蛋白赖氨酸甲基化对基因表达的影响比较复杂,它们中有的可以促进基因表达,有的可以抑制基因表达,取决于它所位于的残基情况。每个赖氨酸残基最多可以出现3个甲基,重要的是,在位于常染色质基因中的沉默区发现单和双甲基化的H3K9,而三甲基化的H3K9则集中于中心体周围的异染色质中,提示不同的甲基化状态可以作为明显不同的异染色质区的标志。虽然组蛋白赖氨酸甲基化有促进基因表达功能,但总的来说与DNA甲基化类似,组蛋白赖氨酸甲基化主要与染色质浓缩,抑制基因表达有关。
组蛋白赖氨酸甲基化主要发生在H3和H4上,分别被单甲基化(me1)、双甲基化(me2)和三甲基化(me3),是基因表达调控较为稳定的修饰,作用也较复杂。不同位点的甲基化修饰对基因表达的影响不同,其中H3K4、H3K36和H3K79位点的甲基化与转录激活有关,而H3K9、H3K20及H3K27位点的甲基化则抑制基因表达。赖氨酸甲基化中H3K3处发生的双甲基化是处于有活性的染色质区域。H3K4甲基化则与活性基因的表达有关,该位点的竞争性修饰或许就是常、异染色质改型的分子开关,调控相关酶及其活性,从而达到精密调控复杂的生物学过程。H3K4me3修饰在确定可变启动子,从而在产生不同的转录本方面发挥重要作用。研究发现,富含CG的启动子含有大量H3K4me3和H3K27me3,并且这种偏性影响转录本的表达。染色质免疫沉淀分析也证明,H3K9的甲基化与失活基因的启动子有关,而K4的甲基化则与X染色体的活性基因有关。这表明H3氨基末端不同位点的甲基化分别与基因的失活与激活相关。这也可能是确立和维持特异性染色质的/组蛋白密码的部分分子机制。

(4)组蛋白精氨酸甲基化:

由精氨酸介导的组蛋白甲基转移酶能选择性地甲基化H2和H3的精氨酸位点,并协同诱导转录活性。精氨酸残基能够被单、双甲基化。组蛋白精氨酸甲基化是一种相对动态的标记,精氨酸甲基化与基因激活有关,而H3和H4靶精氨酸的甲基化丢失与基因沉默有关。蛋白精氨酸甲基化主要由蛋白精氨酸甲基转移酶PRMT(protein arginine methyhransferase)家族的部分成员催化完成。PRMT家族包括PRMT1、PRMT3、RMT1/HMT1、PRMT4/CAMR1、PRMT5,其中只有PRMT5属于第二类精氨酸甲基转移酶,其余都属于第一类精氨酸甲基转移酶。蛋白精氨酸甲基转移酶能够将S-腺苷甲硫氨酸(AdoMet)上的甲基转移到靶蛋白精氨酸残基末端的胍基上,反应最初产生单甲基化精氨酸,也可连续两次催化得到对称双甲基化精氨酸(symmetric double methylation of arginine,SDMA)(称为Ⅰ型),或非对称的双甲基化精氨酸(asymmetric double methylation of arginine,ADMA)(称为Ⅱ型)。
第一类精氨酸甲基转移酶PRMT4/CAMR1(cofactor associated arginine methyltransferase)以及PRMT1可催化产生单甲基化和非对称的二甲基化,与基因的激活相关;第二类精氨酸甲基转移酶PRMT5可催化产生单甲基化以及对称的二甲基化,与基因的抑制有关。PRMT4/CAMR1 主要引起组蛋白H3N端的2、17、26 位(H3R2、H3R17、H3R26)和C端的128、129、131、134 位(H3R128、H3R129、H3R131、H3R134)精氨酸以及H2A的甲基化。PRMT1主要引起组蛋白H4的第3位精氨酸残基(H4R3)的甲基化,而PRMT5可引起组蛋白H3第8位及H4第3位精氨酸(H3R8、H4R3)的甲基化。组蛋白精氨酸位点的甲基化在基因转录调控中发挥着重要作用,并能影响细胞的多种生理过程,包括DNA修复、信号转导、细胞发育及癌症发生。

3.组蛋白磷酸化

组蛋白N 端氨基酸残基可被磷酸化修饰。磷酸化能破坏组蛋白与DNA间的相互作用,而使染色质结构不稳定。这样一种不稳定性对有丝分裂时染色质凝集成为同源染色体过程中的结构重组是必要的。总的来说,组蛋白磷酸化修饰和其他表观遗传修饰一样也可能是通过两种机制影响染色体的结构和功能:①磷酸基团携带的负电荷中和了组蛋白上的正电荷,造成组蛋白与DNA之间亲和力的下降;②修饰能够产生与蛋白质识别模块(protein recognition modules)结合的表面,与特异的蛋白质复合物相互作用。组蛋白的磷酸化主要影响信号转导通路相关激酶的活性,从而直接影响细胞的有丝分裂、死亡和DNA 复制、损伤修复。核心组蛋白和连接组蛋白的磷酸化的作用不尽相同。

(1)组蛋白H2A/H2B磷酸化:

H2的磷酸化也和减数分裂时染色质的凝聚相关。该过程中丝氨酸发挥了重要功能,H2B磷酸化是DNA双螺旋崩解、凋亡、有丝分裂和转录激活的关键步骤,但具体机制还未被阐明。组蛋白H2 部位的磷酸化也和DNA的损伤修复机制有关。H2A的变体H2AX Ser139上的磷酸化与DNA损伤,尤其是涉及DNA双链结构断裂的损伤有关。

(2)组蛋白H3的磷酸化:

组蛋白H3的磷酸化主要在其第10、28 位丝氨酸(Ser10/Ser28)和第3、11 位苏氨酸(Thr3/Thr11)上。首先,H3的磷酸化与细胞分裂有关。组蛋白H3的Ser10在G2期初始阶段会发生磷酸化,从而进一步影响基因转录的起始和有丝分裂期染色体浓缩时形态结构的改变。H3 Ser10的磷酸化开始于细胞分裂前期,在分裂中期达到高峰,在分裂末期随着整体磷酸化水平的下降而下降。其次,H3磷酸化和转录活性存在关联。外来刺激下产生的H3 磷酸化是快速而短暂的,能影响一类不同于在正常分裂细胞中能检测到的磷酸化的H3。同时,这种H3的磷酸化水平与乙酰化水平呈正相关,说明在通过MAPK途径的转录激活中,这两种组蛋白修饰可能是成对出现的。

(3)组蛋白H4的磷酸化:

研究主要集中在Ser1上。H4 Ser1磷酸化与H3 Ser10磷酸化不同的是,后者在孢子(spore)形成(sporulation)的早期出现高峰,随后即下降;而前者则出现在减数分裂Ⅰ、Ⅱ期的终末,且此后一直维持高水平,只在孢子发芽后才出现下降。由此可知,H3 Ser10的磷酸化出现于孢子形成早期,而H4 Ser1的磷酸化则激活于孢子发芽后,与孢子形成无关。H4 Ser1磷酸化还有赖于色氨酸/苏氨酸蛋白激酶SMK1/SPS1。磷酸化的H4 Ser1在孢子形成(sporulation)过程中是一个稳定的分子标志。

(4)组蛋白H1磷酸化:

H1的磷酸化与细胞周期进程相关,在G1期时水平很低,随着有丝分裂的进行逐渐增高至最高峰,但是癌基因转化的细胞或者Rb缺失的细胞会出现G1期H1磷酸化水平的升高。H1磷酸化的作用是中和正电荷,削减其与DNA的结合力,使染色质结构不稳定。连接组蛋白的亲和力及染色质的凝集可能受多种水平的调控,包括连接组蛋白亚型的构成及其磷酸化的水平、其他的核因子等。但是,在体外以H1磷酸化为唯一变量的情况下,磷酸化会降低其在染色质中的亲和力。在体内研究中发现,H1磷酸化水平的增高会增加H1的动态活动性。

4.组蛋白泛素化

泛素是一种有76个氨基酸残基的多肽,相对分子质量约为8.5kD,高度保守,存在于所有真核细胞内,因其存在丰富而广泛得名。它的主要作用是以多聚泛酸链的形式与需降解的底物蛋白结合,从而标记底物蛋白,以便通过泛酸-蛋白酶体途径对蛋白质进行降解。这种降解有着重要的生理功能,如在细胞周期的调控、抗原呈递、转录调控和细胞周期凋亡等方面发挥重要作用。研究发现,泛酸-蛋白酶体途径是至今为止人们所知的最精细的蛋白降解途径。
组蛋白泛素化是将激活的含76个氨基酸的泛素蛋白的羧基末端与组蛋白亚基多肽链N端处的赖氨酸残基相互结合的过程。这个过程需要三种酶序贯作用,泛素C端甘氨酸的激活需要ATP-依赖性激活酶E1的作用:E1的C端与泛素通过硫酯键结合,继而发生水解作用,释放出磷酸而形成泛素腺苷酸。激活的泛素被转移至泛素结合酶E2的半胱氨酸残基上。在泛素连接酶E3的作用下,泛素C端的甘氨酸与底物赖氨酸残基的ε-氨基团通过异构肽键相连接,从而使底物被泛素化。泛素化过程通常仅有一种E1、多种E2和许多种特异性的E3,其中每种E3都能特异性地催化泛素蛋白连接。组蛋白既可以被单泛素化修饰,也可以被多泛素化修饰。单泛素化修饰即组蛋白的一个或几个赖氨酸残基仅结合一个泛素分子,而多泛素化修饰是指组蛋白的一个赖氨酸残基同时结合多个泛素分子。
组蛋白泛素化修饰以H2A、H2B 较多见,H1、H3和H4也可发生泛素化修饰,但极为少见。H2A是首先被发现可被泛素化的蛋白,泛素化的H2A约占总H2A的10%,其泛素化位点在高度保守的119位赖氨酸残基上。立体结构分析显示,该残基存在于组蛋白八聚体的表面,易于与泛素结合,这可以推测H2A K119单泛素化会影响核小体的整体结构,但是这种推测在泛素化的H2A体外核小体结构测定中未发现。新近的研究发现,在基因激活及抑制中均存在H2A泛素化。H2B被广泛的多泛素化,且H2B多泛素化广泛出现在染色质中。细胞中大部分蛋白单泛素化和多泛素化对细胞的调控是截然不同的,单泛素化的蛋白较稳定,多泛素化则多为2S蛋白酶体降解的标志。尽管组蛋白的泛素化修饰是可逆的共价修饰,但H2B的单泛素化也具有稳定核小体结构的作用。
组蛋白泛素化可通过干扰组蛋白乙酰化和甲基化来较为长久地影响基因表达。组蛋白H2BK120的泛素化促进H3K4和H3K79的甲基化,从而标记了转录活跃的染色质区,组蛋白H2AK119的泛素化则促进H3K9甲基化,使得基因表达失活。

5.组蛋白生物素酰化

组蛋白生物素酰化是一种新的组蛋白修饰现象。与组蛋白甲基化、乙酰化、磷酸化等修饰不同的是,组蛋白生物素酰化修饰还没有被广泛接受。生物素这样的大分子如何修饰组蛋白的氨基残端还有很多问题亟须回答。
生物素由微生物、酵母和植物合成,是人类和动物维持健康不可缺少的一种水溶性维生素(维生素H)。组蛋白的生物素酰化是由生物素酰胺酶(biotinidase,BTD)催化的,离体实验中发现BTD能催化组蛋白,细胞核中是否存在BTD尚有争议,而且也没发现BTD有入核信号。组蛋白的生物素酰化主要是通过羧化全酶合成酶(holocarboxylasesynthetase,HCS)与组蛋白H3和H4相互作用的结果。组蛋白不同赖氨酸位点的生物素酰化应该有不同的生物学功能,目前鉴定出的组蛋白H4的K8和K12以及组蛋白H3的K9和K18的生物素酰化修饰,都可促使基因沉默。
研究表明,组蛋白生物素酰化在细胞增殖、DNA损伤修复、维持基因组稳定等方面发挥作用。在人淋巴细胞周期中,发现从细胞周期的早期(G1期)开始到细胞周期后期阶段(S、G2和M期),组蛋白生物素酰化水平增加。已有许多证据表明组蛋白生物素酰化与维持基因组稳定有关,在鸡红细胞中发现染色质转录沉默区域富含生物素酰化的组蛋白。近年来发现,在染色体着丝粒周围以及基因组富含转座子区域富含K8和K12生物素酰化修饰的组蛋白H4、K9和K18生物素酰化修饰的组蛋白H3,这些组蛋白生物酰化能够抑制基因的转录。生物素缺乏导致转座子区域的组蛋白生物素酰化水平降低,会增加转座子的活性从而导致基因组的不稳定。

(四)组蛋白修饰组合

不同的组蛋白修饰在基因的表达中起着不同的作用,包括组蛋白密码、信号网络和电荷中和模型等不同的模型被提出来说明组蛋白修饰的功能。有学者认为,单一组蛋白的修饰往往不能独立地发挥作用,一个或多个组蛋白尾部的不同共价修饰依次发挥作用或组合在一起,形成一个修饰的级联,它们通过协同或拮抗来共同发挥作用,影响基因的表达。不同组蛋白修饰活动相互作用,形成多亚基复合物,可能与核小体重修饰复合物(NuRcs,如Swi/Snf、RSC、NURF)相互作用,重修饰染色质。有证据表明,这些重修饰复合物通过组蛋白尾部,由这些复合物所调节的启动子处不同乙酰化方式的因子募集和识别而联合起作用。由于组蛋白修饰这一“标志”的变化,必然带来其下游的改变,包括效应分子的特异性识别以及组合,这其中也可能存在动态的触发与转变,最终体现在参与了某一特定的效应过程。

(五)组蛋白修饰的相互作用

位于相同或不同残基上的各种组蛋白修饰包括甲基化、乙酰化、磷酸化、泛素化等可以相互影响,同一残基上的不同修饰(cross talk in situ)多为相斥作用,不同位点上的修饰则可能相斥或协同。目前报道的多为甲基化、乙酰化、磷酸化几种不同修饰之间的相互作用。
不同位点及状态组蛋白甲基化与乙酰化间有一定关系。组蛋白H3-K4的双甲基化和三甲基化及H3的第36、79位赖氨酸的双甲基化与高乙酰化和基因的激活相关,而组蛋白H3-K9双甲基化及三甲基化与组蛋白的低乙酰化相关。组蛋白H4-R3的甲基化促进P300催化H4-K8和H4-K12发生乙酰化,导致相应基因转录激活,但H4上的4个赖氨酸中的任何一个发生乙酰化都会抑制H4-R3甲基化的发生。不同位点的甲基化与泛素化之间形成了不同的组合关系。Set1催化的H3K4甲基化依赖于H2B的123位赖氨酸泛素化,但是该泛素化对Set2催化的H3K36甲基化则没有影响。H2BK123泛素化后可以募集H3K4甲基转移酶Set1而延长复合体PAF能够与Set1结合。此外,H2B的123位赖氨酸的泛素化还能影响H3K79的甲基化。组蛋白磷酸化与甲基化、乙酰化、泛素化之间存在关联,这些修饰能够通过协同和拮抗机制影响基因的表达。组蛋白H3S10的磷酸化促进H3K9及H3K14的乙酰化,但是抑制H3K9的甲基化。H3S28磷酸化能够诱导邻近的K27产生甲基化-乙酰化开关机制。在转录延长的过程中,组蛋白H3S57和K56能够相互影响,继而发挥一定的生物学功能。当K56发生乙酰化后,S57磷酸化能够促进核小体转移。H3T6磷酸化能够影响H3K4二甲基化。

(侯旭 王雨生)