第三章 表观遗传学调节的分子学机制
第一节 DNA甲基化
(一)概念
DNA甲基化是指在DNA甲基转移酶的催化下,以S-腺苷甲硫氨酸(SAM)为甲基供体,将甲基转移到特定的碱基上的过程。DNA甲基化可以发生在腺嘌呤的N-6位、胞嘧啶的N-4位、鸟嘌呤的N-7位或胞嘧啶的C-5位等。在哺乳动物中,DNA甲基化主要发生在5′-CpG-3′的C上,生成5-甲基胞嘧啶(5 mC)。
人类的CpG以两种形式存在,一种是分散于DNA 中,另一种是CpG结构高度聚集的CpG岛。在位于转录调控区附近基化区,常成簇存在富含CpG 的DNA 片段,约每10bp就出现一个CpG位点,通常长度为1~2kb,称为CpG 岛。CpG岛的概念最早由Adrian Bird提出,他称之为未甲基化的HapⅡ小片段(HpaⅡ tiny fragment,HTF),更正式的定义是“区域”,该区域的序列长度至少200个碱基对,GC含量超过50%,CpG比值(观测值/期望值)超过0.6。最近,为了排除那些Alu重复序列,提出了更严格的标准:长度至少500碱基对,GC含量超过55%,CpG比值大于0.65。CpG 岛一般位于基因的启动子区,有时还包括基因5′端的外显子和内含子,与基因5′端密切相关。健康人基因组中CpG 岛中的CpG 位点通常处于非甲基化状态,而在CpG 岛外的CpG 位点则通常是甲基化的。
近年采用高精度质谱分析发现了在高等动物有5-羟甲基胞嘧啶(5- hmC)的存在,称之为基因组第六碱基。随后又发现了5-甲酰基胞嘧啶和5-羧基胞嘧啶,称之为基因的第七、八碱基。GpG岛外甲基化CpG岛海滩(CpG island shores)现象也被证实。
(二)DNA甲基化的形成
DNA 的甲基化主要是受到DNA 甲基转移酶(DNA methyltransferase,DNMT)家族的调控。一般认为,维持甲基化主要参与的分子是DNMT1,而从头甲基化则依赖于DNMT3a和DNMT3b的活性。
哺乳动物DNMT的催化区域中存在保守序列含大约500 个氨基酸残基,是催化CpG 岛甲基化的活性部位,催化的具体机制为:首先识别并将待甲基化的CpG移至甲基化酶的所谓催化袋(pocket)中,此后酶催化域中的半胱氨酸和待甲基化的胞嘧啶6位在酶的催化作用下形成共价键,与此同时,S-腺苷甲硫氨酸(s-adenosylmethionine,SAM)在甲基化酶的催化下将甲基转移到被激活的胞嘧啶5 位上;最后,胞嘧啶6 位的共价键断裂,5 位的质子释放,而SAM 变成S 腺苷高半胱氨酸。
从头甲基化酶Dnmt3a 和Dnmt3b是使原来没有甲基化的DNA 双链上进行甲基化。维持甲基化酶Dnmt1主要是催化复制后的半甲基化,也就是在Dnmt1 的作用下根据亲链上的甲基化位点进行相应的甲基化修饰的过程,使DNA 分子未甲基化的那一条子链甲基化,从而保持子链与亲链有完全相同的甲基化形式,重新甲基化完成后由维持甲基化来维持其稳定的甲基化状态。
最近研究表明,DNMT3a和DNMT3b也参与了维持甲基化的过程,可以增强DNMT1所介导的甲基复制的保真度。而DNMT1在体外也可以参与从头甲基化,只是活性较低,但在体内研究中还没有明确的结论。
(三)DNA甲基化的维持
如上所述,DNMT1的活性在DNA甲基化的维持中起重要作用。除此之外,非编码RNA、组蛋白甲基化以及核小体的分布等因素对甲基化的维持也有影响。
非编码RNA作为表观遗传的重要方面参与对DNA甲基化的调控。长链非编码RNA(lncRNA)不仅可通过竞争性结合miRNA 或PcG 蛋白等途径来发挥正向调节基因表达的作用,而且还可通过与DNMT1结合来阻断其甲基化活性,维持目的基因DNA 的去甲基化状态。此外,miR-143将DNMT3a作为直接作用靶点,抑制DNMT3a的表达。还有研究表明,miRNA可以通过其他靶点而间接作用于DNMT,从而调节DNA的甲基化。miRNA还可作用于组蛋白修饰过程中的甲基化转移酶而调节组蛋白氨基酸基团的甲基化,影响基因的表达。
组蛋白的甲基化对指导DNA的甲基化有一定意义。甲基化的CpG结合蛋白MeCP2不仅能促进组蛋白去乙酰化,同时它还是DNA甲基化和组蛋白甲基化的桥梁,如甲基化的DNA可通过甲基结合蛋白MeCP2招募组蛋白甲基转移酶SET,引起H3K9甲基化,抑制基因转录。
H3K4me3 是基因存在转录活性的标志,H3K4me1 则是H3K4me3 形成的基础。未甲基化的H3K4 是DNMT3L 的结合区,能够促进DNMT3L-DNMT3a 复合物的从头甲基化作用。未甲基化的H3K4 还能够诱导DNMT3a 蛋白的构象变化,提高其甲基化酶活性;DNMT3a 的甲基化活性与H3K4me1 的含量存在负相关关系。近年来,多种高分辨率的转录因子结合组和DNA 甲基化组研究揭示,活性基因转录起始点附近序列是转录复合物的稳定结合区,在这些区域的染色质中普遍存在甲基化的H3K4,DNA则呈低甲基化状态。
基因组中DNA 的甲基化与核小体的分布亦存在高度的相关性。在人胃癌的发生过程中, p16 基因CpG 岛甲基化具有以核小体为基本单元脉冲式扩展的特征,在降低组蛋白甲基化酶G9A 和SUV39H1 蛋白水平和基因启动子区H3K9me2/3 水平后,启动子区结合的HP1和DNMT1 减少。全基因组进行hMeDIP-测序分析发现 hmC 大部分分布于小鼠胚胎干细胞常染色质区。种种迹象表明,在DNMT1 充分表达的条件下,DNA 中大部分CpG 位点的默认状态是甲基化的,在基因常转录的区域存在活跃的DNA 去甲基化现象。上述现象说明,基因的转录产物及其相关的组蛋白修饰在维持DNA 去甲基化状态方面发挥着关键作用,一旦基因处于非转录状态,则将失去这些去甲基化机制的保护,发生甲基化。
(四)DNA甲基化的遗传
在细胞增殖分化的过程中,基因的甲基态将遗传给后代。但哺乳动物生殖细胞在形成受精卵后的最初几次卵裂中,发生DNA 的去甲基化,即在去甲基化酶的作用下,去除DNA分子上几乎所有从亲代遗传来的甲基化标记,这是一种受到RNA 分子调节的核酸替代的过程。此过程包括非特异性去甲基化和特异性去甲基化。胚胎早期的植入期前,整个基因组发生了普遍的非特异性去甲基化,非甲基化状态保持到细胞的桑葚期前。此后的胚胎植入期间,组织特异性基因经历选择性的特异性甲基化。当细胞内新的甲基化模式形成后,即可通过甲基化酶以“甲基化维持”的形式将新的DNA甲基化传递给所有子细胞。值得注意的是,甲基化的遗传机制和受精卵中的表观遗传差异有关,而不完全由基因的序列决定。
X 染色体失活是表观遗传学研究的很好范例,女性有两条X 染色体,而男性只有一条X染色体,为了保持平衡,女性的一条X 染色体被永久失活,这便是“剂量补偿” 效应。X 染色体的失活状态需要表观遗传修饰如DNA 甲基化来维持。这种失活可以通过有丝或减数分裂遗传给后代。
肿瘤DNA甲基化也可以遗传。直肠癌是一种遗传背景比较突出的恶性肿瘤,其中以遗传性非息肉病性直肠癌(hereditary nonpolyposis colorectal cancer,HNPCC)最为常见,约占全部直肠癌的5%。HNPCC 是由于DNA 错配修复系统中的某些基因突变导致的常染色体显性遗传性疾病,其中 hMLH1 及 hMSH2 这两个DNA 错配修复系统中的重要基因占所有检测到的基因的90%以上; hMLH1及 hMSH2 基因启动子的甲基化可以抑制基因的表达,进而影响DNA 错配修复系统的功能,最终导致肿瘤发生,并且有研究表明,这种启动子区域异常的甲基化状态会遗传给下一代。
(五)哺乳动物DNA甲基化的特点
哺乳动物DNA甲基化主要有4个特点:①基因组内甲基化多数在与鸟嘌呤相连的胞嘧啶上形成 mCpG。基因组中有3%的胞嘧啶是甲基化的,而CpG中70%的胞嘧啶是甲基化的。②G+C丰富区域的CpG(即CpG岛)是非甲基化的;看家基因的启动子都含CpG岛,且保持非甲基化状态,而组织特异基因则缺乏这样的岛。③哺乳动物有2种启动子,即CpG丰富且保持非甲基化状态的启动子和CpG较少且在大多数组织中甲基化的启动子,后一种总是出现在组织特异性表达的基因内。启动子区的CpG被甲基化时转录受到抑制,基因下游即非岛区的CpG甲基化不抑制基因的转录。④启动子区CpG甲基化的密度与转录的抑制程度有关,弱的启动子能被密度较低的甲基化完全抑制,当启动子被增强子增强时,恢复转录功能;如果甲基化的密度进一步增加,转录也进一步被完全抑制。
(六)DNA甲基化对基因表达的调控
DNA 甲基化虽然未改变核苷酸顺序及其组成,但可在转录水平调控基因的表达,尤其是转录起始阶段,DNA 甲基化也正通过这种方式发挥生物学作用。由于CpG 岛多位于启动子附近区域,是转录的启动区,众多转录因子与DNA 结合于DNA 的大沟内,而甲基化的5-甲基胞嘧啶的甲基也位于此沟内,从而阻碍了蛋白质因子与DNA 间的结合,降低基因转录。此外,甲基化DNA 位点还可以结合转录抑制子,如甲基化结合蛋白2(methyl-CpG binding proteins,MeCP2)引起基因沉默。转录抑制子对脊椎动物细胞转录起始阶段有抑制作用,对于某些真菌,转录抑制子还能阻断其基因转录的延伸阶段。近年还发现,DNA 甲基化可改变染色质结构,也可间接介导转录抑制。另外,DNA 甲基化还可能通过降低RNA 聚合酶活性而抑制基因的表达。
基因转录受到甲基化的抑制仅发生在启动子区,而非CpG岛区的DNA甲基化则不抑制基因的转录。对于启动子区,CpG 甲基化的密度与基因转录的抑制程度呈正相关。甲基化密度较低时只能完全抑制弱的启动子,而在增强子作用下时,启动子便可恢复基因转录功能;但如果进一步增加甲基化的密度,也可能完全抑制了被增强子增强的启动子的转录。总之,除有些始终非甲基化的组织特异性基因及对甲基化不敏感的基因外,甲基化程度的高低往往影响着基因表达的程度,通常呈负相关关系,即甲基化水平较低时,基因表达水平较强;反之,甲基化水平较高时,基因表达水平较低。
基因启动子及其附近区域内CpG 甲基化是众多基因实现去表达(沉默)和基因印迹的重要途径,通过测定启动子CpG 岛甲基化状态了解基因是否去表达,为在DNA 水平研究基因表达提供重要途径(图3-1)。
图3-1 DNA甲基化及其对基因表达的调控示意图
本图简单显示了DNA甲基化如何影响基因转录。CpG岛低甲基化时(圆圈)转录因子可与基因启动子区结合,转录并表达相应基因。CpG岛高甲基化时(黑点),甲基化的DNA、甲基化结合蛋白2(MeCP2)等因素共同作用,抑制转录因子与相应区域的结合,基因无法转录
(七)DNA甲基化的生物信息学研究
近年来,随着高通量的DNA甲基化检测技术的出现,DNA甲基化的生物信息学研究得到了很大的发展。一系列具有较好精度的DNA甲基化预测工具不仅成为实验检测技术的补充,也反映了DNA甲基化本身是有规律可循的,这启发了研究者们对于DNA甲基化内在机制的探索。
1.DNA甲基化的相关数据库
数据库的构建是生物信息学研究的重要内容。目前发表的较大规模的DNA甲基化相关数据库有:MethDB、MethyCancer、PubMeth和MethCancerDB,数据情况见表3-1,其中,MethDB是最早整合文献中DNA甲基化数据的数据库,也是涵盖物种和组织最多的数据库,其余3个数据库都采用了文献挖掘的方法,收集了文献中已报道的与特定癌症相关的一些DNA甲基化模式。MethDB和MethyCancer还提供了DNA甲基化的可视化工具。通过对现有的分散的DNA甲基化数据的整理分析,这些数据库提供了内容独立、记录相对完整、格式比较统一的数据资源,为后期的深入挖掘提供了极大便利。随着大规模深度测序技术在DNA甲基化检测中的应用,建立相应数据库用以存储和分析相关数据,开发更加友好的可视化分析工具将具有重要价值。
2.DNA甲基化的预测研究
实验手段检测DNA甲基化状态的方法虽然比较可靠,但是其对于人力财力的需求以及检测技术方面的缺陷,使得目前大规模的DNA甲基化的实验数据还比较有限。研究计算预测DNA序列甲基化状态的方法显得极为重要。另一方面,作为实验检测技术的补充,预测算法能够挖掘出数据中隐藏的重要特征,为人们进一步认识DNA甲基化机制提供重要依据和研究思路。目前发表的对DNA甲基化模式进行预测的方法中,按照预测目标的类型可以分为:对单个CpG双核苷酸的甲基化状态预测、对CpG岛片段以及CpG岛的甲基化状态预测。
Methylator(http://bio.dfci.harvard.edu/Methylator/index.html)是预测单个CpG双核苷酸甲基化状态的工具。该工具基于MethDB数据库中人的2839个DNA甲基化模式数据,以CpG位点周围39bp的序列模式为特征,采用支持向量机的方法得到了87%的正确率。该研究还表明,基因的非翻译区的甲基化程度要高于外显子和内含子。由于单个CpG双核苷酸的甲基化状态在细胞生长过程中是动态变化的,因此Methylator的应用相对有限。
HDMFinder和MethCGI是预测CpG岛片段甲基化状态的工具。HDMFinder(http://rulai.cshl.edu/HDMFinder/methylation.htm)利用包括Alu在内的17个序列特征,能够对长度为800bp的CpG岛片段以及800bp的普通DNA序列的甲基化状况进行准确预测,并且还对22个常染色体中的甲基化模式进行了预测。清华大学开发的MethCGI则专门针对CpG岛片段(包括200bp、300bp以及400bp)进行了预测,正确率可达84%。另外,MethCGI对MethDB数据库中包含的来自多个组织的甲基化数据也得到了较好的预测精度,表明CpG岛片段的甲基化模式并没有很强的组织特异性。
Epigraph是一种预测CpG岛甲基化状态的工具(http://epigraph.mpi-inf.mpg.de/Web GRAPH/)。CpG岛的甲基化状态同基因表达的模式密切相关,因此对于CpG岛甲基化状态的预测一直是人们关注的重点。Feltus等通过在细胞系中加入过量DNA甲基化转移酶1(DNMTl),发现大部分的CpG岛仍然保持非甲基化状态,同时有部分CpG岛呈现超甲基化,采用序列特征对两类的分类正确率可以达到82%。在特征选择的过程中,他们发现两类CpG岛在长度、GC含量、CpG比例以及和启动子的关系上没有显著性差异,但是其后对来自体内的DNA甲基化数据的研究表明,甲基化和非甲基化的CpG岛在长度、GC含量以及CpG比例上存在显著差异。
总之,随着各种高通量检测技术的发展和应用,各种正常组织以及癌症组织的DNA甲基化数据将不断涌现,这就给生物信息研究提供了大量研究数据,分析这些海量数据无疑需要开发更多更有效的计算方法和工具。利用来自不同样本不同组织的DNA甲基化数据,可以深层次探讨DNA甲基化在人群中的差异性以及组织特异的DNA甲基化模式。
(八)CpG岛不易被甲基化的机制探索
虽然人类基因组中有一部分CpG岛处于甲基化状态,但是大部分CpG岛是不易被甲基化的,这同基因组上约80%的CpG双核苷酸处于甲基化状态的现象形成鲜明对比。该现象促使人们思考为什么CpG岛不易被甲基化。早在1994年Brandeis等就发现,Spl的结合位点在人胚胎干细胞的APRT基因中能够保护CpG岛在重新甲基化的过程中不被甲基化,后来对人乳腺组织中BRCA1基因的研究结果同样表明,启动子区Spl和CTCF结合位点突变与否将决定该区域CpG岛的甲基化状态。Turker等以Spl在小鼠 Aprt基因中的功能对小鼠体细胞中DNA甲基化模式的形成提出了一个动态平衡假说,认为在DNA的重新甲基化过程中,首先是B1之类的重复序列被甲基化,这些序列被称为甲基化中心,然后甲基化会从中心往外延伸,Spl结合位点通过与Spl的结合能够阻碍甲基化向CpG岛区的蔓延,从而保护CpG岛不被甲基化。后来的研究又发现,在Spl缺失的情况下 Aprt基因仍然有表达,即CpG岛并没有因Spl的缺失而超甲基化,另一方面,Spl(以及CTCF)的结合位点并非存在于所有不易甲基化的CpG岛附近,这也意味着还应该有其他因子参与保护机制的形成。
进一步研究发现,人脑组织基因组尺度的CpG岛甲基化数据显示了不易甲基化的CpG岛内部以及岛边界序列的序列特征,一些具有锌指结构的转录因子(包括Spl和CTCF)可能的结合位点在CpG岛的400bp边界序列中显著富集,而且其中80%的结合位点在人、大鼠和小鼠中是显著保守的。从小鼠Aprt基因得到的关于CpG岛不易被甲基化的保护机制同样存在于人的基因组中。Alu序列是重新甲基化过程中的甲基化中心,在甲基化转移酶的作用下,DNA甲基化从Alu序列出发往外延伸,当CpG岛周围富集的转录因子结合位点同具有锌指结构的转录因子结合以后则可以阻止甲基化向CpG岛的蔓延,因此在这种阻止与蔓延的作用达到动态平衡以后,就形成了比较稳定的甲基化模式。当细胞所在的环境发生变化时,这种平衡可能会被打破,阻止功能的增强或者侵入能力的提高则可能使DNA甲基化往CpG岛外或者往内移动,从而建立新的平衡。比如,如果某些顺式元件发生突变,则本可以结合并阻碍DNA甲基化蔓延的特定转录因子可能因为结合能力的减弱使其阻碍功能变弱甚至消失,这种情况下,其附近的CpG岛可能会被甲基化,因此,发生癌变的组织中抑癌基因的异常甲基化以及与老化过程相关的甲基化可能是由于这种保护机制的减弱造成的。
虽然保护机制的假说能够一定程度上解释CpG岛不易被甲基化的机制,但是该假说是否全面揭示了其真实机制,是否还有其他更多甚至更重要的因素参与其中,这些问题都有待进一步研究。
(九)DNA甲基化与全身疾病
近来研究发现,CpG岛异常DNA甲基化与肿瘤发生、糖尿病等全身疾病以及干细胞分化有一定关联。
1.DNA甲基化参与肿瘤发生的机制
DNA甲基化模式改变时会出现基因突变、染色体变得不稳定、癌基因启动子区的低甲基化、抑癌基因启动子区的高甲基化以及microRNA表达的失调。这几个方面通常联合作用,导致癌症的发生。
甲基化的CpG二核苷酸具有较高的基因突变率。甲基化的胞嘧啶能自发地发生脱氨基作用而转为胸腺嘧啶,产生T∶G的错配,经过DNA复制,最终从C∶G转换为T∶A,导致遗传信息的改变。DNA错配修复系统(mismatch repair system,MMR)的作用是监视和改正在微卫星DNA序列中发生的碱基错配,对维持基因组的稳定发挥着重要作用。
肿瘤细胞中常见整体基因组的低甲基化,影响染色体的稳定。低甲基化可以导致基因的突变率增加和杂合性缺失。低甲基化的染色体其凝聚程度降低,原有的构象发生改变让DNA变得容易受外界因素的影响,并使DNA修复蛋白不易识别染色体。低甲基化易发生于间隔区和内含子区的DNA,特别是重复序列和转座子,这两者被认为与导致染色体不稳定和增加基因突变概率有关。
癌基因启动子区低甲基化是肿瘤癌变过程中早期的分子变化之一,是发现肿瘤的潜在生物学指标。肿瘤相关基因启动子区的低甲基化,与基因的激活和转录密切关联。例如,早期直肠癌中,长散步核元件-1(long interspersed nuclear element-1, LINE- 1)基因启动子区的甲基化水平显著降低,并且被确认为是癌症病死率增加的独立危险因素。在乳腺癌中,白介素-10(interleukin-10, IL- 10)基因启动子区的甲基化水平明显低于正常组织和良性乳腺瘤。
抑癌基因启动子区呈高甲基化状态可抑制基因的表达,导致抑癌基因功能丧失。例如,在少突胶质细胞瘤中,过氧化物酶-1(peroxiredoxin-1, PRDX1)基因启动子区表现出高甲基化,其蛋白表达受到明显抑制,并与胶质瘤的发生密切相关。
2.DNA甲基化与肺癌
肺癌是世界范围内最常见的恶性肿瘤之一,也是发病率及癌症相关致死率最高的恶性肿瘤。最近研究发现DNA 甲基化与肺癌的发生、发展密切相关。 p16 基因是一个常见的抑癌基因,发生在CpG 岛的甲基化使 p16 基因沉默,使其编码蛋白表达水平下降或消失,从而导致肿瘤的发生。手术切除非小细胞肺癌组织中 p16 基因表达损失在非小细胞肺癌(64%)中是常见的现象,而启动子异常甲基化是表达缺失的常见原因。 p16基因发生在鳞癌的甲基化率高于腺癌。而更多的相关研究表明吸烟程度,肿瘤分期等与 p16 基因的甲基化程度呈正相关。 CDH 1 是一肿瘤浸润抑制基因,其编码E-钙黏蛋白(E-cadherin)表达与肿瘤的浸润、转移呈负相关。对于非小细胞肺癌的发生,研究表明 CDH 1基因启动子的异常甲基化是一个原因,肺癌组织的 CDH1 基因启动子甲基化频率要高于癌旁与正常组织。 CDH13与 CDH 1同源,是黏钙素超家族又一成员,其基因启动子甲基化在肺癌组织中发生率为54.5%,其中,腺癌和鳞癌组织甲基化率分别为66.7%和28.6%,肺腺癌组异常甲基化率高于鳞癌组。对于肺癌相关抑癌基因甲基化的研究,为肺癌患者的早期诊断提供思路,并为治疗开辟了新的方向。
3.DNA甲基化与胃癌
抑癌基因高甲基化导致表达失活是胃癌发生过程中一个频发的早期事件。目前已在胃癌中检测出数十个抑癌基因的CpG 岛异常甲基化,这些基因参与调节细胞周期、DNA 修复、信号转导等多个细胞生理过程。例如,胃癌RUNX3CpG岛甲基化率(64%)显著高于慢性胃炎(8.1%)、肠化生(28.1%)和胃腺瘤(27.3%),并随着疾病发展过程逐渐升高。RUNX 蛋白可与转化生长因子(TGF)-β 超家族成员共同介导某些重要的生物学效应,其功能改变可影响TGF-β信号的活性,进而在胃癌发生过程中起重要作用。此外,胃癌发生 RASSF1A 基因甲基化,而胃腺瘤、肠化生和慢性胃炎中该基因甲基化率极低,提示 RASSF1A 甲基化可能是癌特异性的,并与RB基因相关。胃贲门腺癌 RASSF1A 基因的甲基化率为明显高于癌旁正常组织,随着临床分期的进展, RASSF1A 基因的甲基化率升高。再如, p16 基因(又称多肿瘤抑制基因,multiple tumor suppressor, MTS)启动子区高甲基化在胃癌发生中起重要作用,并且与胃癌恶性程度相关,血清中DNA 甲基化水平的检测可能是胃癌早期检查的一个有用标志物。
4.结直肠癌中的DNA 甲基化改变
结直肠癌中,基因不稳定性主要包括微卫星不稳定、CpG 岛甲基化表型和癌基因突变。结直肠癌中的5-甲基胞嘧啶较正常组织水平低,而对于 p16(即MTS,multiple tumor suppressor 1)、错配修复基因1(human mutL homolog 1,hMLH1)和MINT(Msx2 interacting nuclear target protein)位点甲基化水平的检测发现,其广泛低甲基化主要发生于结直肠癌早期。广泛低甲基化可以增加某些基因的表达水平,如癌基因 c- myc、 K- ras 以及结直肠癌中S100 钙调蛋白 A4 基因等。此外,在结直肠癌中 TWIST1(twist homolog 1)基因超甲基化是较为常见的,而且它的高表达会进一步造成结直肠癌的恶化。
CpG 岛超甲基化可能会是一个很有前景的早期诊断肿瘤的指标。平坦型结直肠癌患者80%左右可以检测到RAS 相关区域家族1A 基因(ras association domain family 1A gene, RASSF1A)的启动子超甲基化,结果显示 RASSF1A 的启动子超甲基化是一个在平坦型结直肠癌发病早期的频发分子事件,并且随后一系列RAS 基因转导路径的异常与平坦型结直肠癌的形态和侵袭性有关。鼻咽癌细胞相关基因6(nasopharyngeal carcinoma associated gene 6, NGX6)介导的启动子甲基化是一个潜在的结直肠癌分子标志。 TMEFF2 基因(transmembrane proteinwith EGF-like and two follistatin domain gene)、表皮生长因子受体基因和 ZDHHC22 基因(zinc finger,DHHC domain containing 22)等标志物具有高度特异性,并且可用于检测血液或粪便样本,可作为结直肠癌的非侵入性诊断方法。随着深入研究,DNA 甲基化将会在结直肠癌早期诊断中发挥重要作用。
5.肝癌DNA 甲基化特征
肝癌的发生同其他人类肿瘤一样,都是由表观遗传学异常和基因改变共同引起的,DNA 甲基化是表观遗传学上研究最为深入的一种机制。在肝癌的发生发展过程中,抑癌基因等肿瘤相关基因的高甲基化和整个基因组水平的低甲基化起着重要作用。钙黏附蛋白(cadherin,CDH)是钙介导膜糖蛋白的成员,该分子在所有正常上皮细胞表面表达,其表达缺失主要是启动子区CpG 岛甲基化所致。在慢性病毒性肝炎和肝硬化组织中, CDH1 甲基化率分别为8%和46%。人组织因子途径抑制物2 是一种Kunitz 类型丝氨酸蛋白酶抑制剂,能抑制多种肿瘤入侵,在肝癌中,人组织因子途径抑制物2 的mRNA表达减少或缺失与甲基化同时发生的几率为90%,47% 发生启动子区异常甲基化,而正常肝脏组织启动子区无异常甲基化。细胞因子信号抑制因子(suppressors of cytokine signaling, SOCS)- 1和 SOCS- 3 是JAK-STAT 信号通路的负性调控因子。在肝癌中,SOCS-1 和SOCS-3启动子甲基化发生频率分别为60%和33%。 SOCS- 1 基因甲基化在HCV 诱导的慢性肝炎和肝硬化中达45%,且甲基化频率随肝纤维化程度加重而增加。
对肝癌的研究发现,伴随着特异基因的启动子区出现的高甲基化,整个基因组中普遍存在低甲基化,主要发生在DNA 重复序列中,如微卫星DNA、长散布元件(LINES)、Alu 顺序等,这种广泛的低甲基化会造成基因组不稳定,与肿瘤的发生有关。DNA 低甲基化激活了惰性基因的表达尤其是原癌基因 ras、 myc 以及其他的肿瘤促进基因等的表达诱发肿瘤的发生。对36 例肝细胞癌的1 号染色体的微卫星序列Sat2 进行研究,发现69% 肝细胞癌的Sat2 DNA发生低甲基化,且Sat2 DNA 的低甲基化与染色体1q12 断裂、不正常的1q 形成显著相关。
6.DNA甲基化与白血病
白血病是造血干细胞的恶性克隆性疾病,由于克隆中的白血病细胞增殖失控,分化障碍,凋亡受阻,停止在细胞发育的不同阶段,因而使成熟的正常白细胞比例下降。在骨髓和其他造血组织中白血病细胞大量累积,并浸润到其他组织或器官,大量未发育成熟的白血病细胞使正常造血受抑制,人体正常的造血功能受累。
基因启动子区域CpG 岛的高度甲基化也是白血病等血液系统恶性肿瘤的一种发病机制,大概有90% 的血液系统肿瘤都会至少有一个基因高度甲基化。如慢性骨髓性白血病的发展伴随 BCR- ABL融合基因 ABL1 启动子的高度甲基化,因此DNA高度甲基化成为血液系统恶性肿瘤的重要诊疗靶标。65% 的骨髓增生异常综合征中都存在降钙素基因的高度甲基化,而如果该基因的高度甲基化出现在急性淋巴性白血病中,95%的病例预后不良。
成人的急性骨髓性白血病中存在雌激素受体甲基化。在一项研究中,通过对20 例急性骨髓性白血病患者骨髓标本的降血钙素、雌激素受体、E-钙粘素、 p15、 p16、 Rb、 GST- Pi 及 HIC1 基因CpG 岛甲基化程度的研究发现,在9 例对照骨髓标本中上述八种癌症相关基因均无甲基化现象,相比而言,95% 的患者标本都存在至少一种以上的癌症相关基因的异常甲基化,75% 的患者标本有两个或是更多的以上基因的异常甲基化。同样,已有文献报道证明在40%~60% 的急性骨髓性白血病及急性淋巴性白血病中,PASG(DDM1亚家族的一个成员)的变异可以促进DNA甲基化。又如 P15INK4b基因启动子的高度甲基化与急性骨髓性白血病发病风险密切相关。
在急性骨髓性白血病中,DNA 甲基化需要依赖某些例如DNMT1、DNMT3A 和DNMT 3B之类的DNA甲基化转移酶的作用,通过比较病理和正常的骨髓,可发现DNMT1、DNMT3A和DNMT 3B 在病理骨髓组织中有明显升高。尽管慢性骨髓性白血病细胞在慢性疾病过程中这些DNA 甲基化转移酶的水平并没有明显变化,但在疾病急性转变的过程中却有上述DNA 甲基化转移酶的升高。利用专门的研究甲基化的PCR,在急性骨髓性白血病中可以发现72%的 P15INK4b 基因有甲基化,并且还伴随着DNMT1 和DNMT 3B 的升高。由此看来,白血病细胞中DNMTs 的过表达,无论是对于白血病病理机制还是对于异常的局部高水平甲基化的研究都有举足轻重的作用。
慢性淋巴性白血病已被确认的基因变异包括13q14、11q22-q23、6q21、17p13 和3 染色体12 缺失。当染色体解凝状态下变脆弱时,可观察到的细胞内着丝粒高度甲基化和微卫星标记的高度甲基化的现象。急性早幼粒性白血病中促白血病PML-RARA 融合蛋白导致了基因的高度甲基化,并通过召集DNMT1 和DNMT3A 到目的基因 RAR- 2 的启动子区域而使基因沉默。骨髓增生异常综合征包括一组异常的克隆骨髓干细胞异质群体,以外周血细胞减少和骨髓祖细胞发育不良为特点。50%~60% 的患者有细胞发育异常的遗传缺陷,10%~60% 的病例中有克隆进化,并且与进展性的骨髓功能衰竭和进一步演变为急性骨髓性白血病密切相关,当骨髓增生异常综合征的亚型及细胞类型确定时, p15 基因的甲基化水平也可以影响到骨髓细胞的进化程度。
总之,临床白血病研究中,多种基因特别是抑癌基因和细胞信号通路中的关键基因启动子区域的高度甲基化,提示DNA甲基化在白血病致病机制中扮演重要角色。DNA甲基化从属于表观遗传学范畴,过程是可逆的,所以DNA 甲基化转移酶是DNA 甲基化关键的一环,DNA 甲基化转移酶抑制剂得到开发并应用到临床治疗中取得了良好疗效。
7.DNA甲基化与糖尿病
2型糖尿病(type 2 diabetes mellitus,T2DM)又名非胰岛素依赖性糖尿病,约占所有糖尿病患者的90%。2型糖尿病的发生和发展是环境及遗传因素共同作用的结果。环境因素可以通过改变DNA甲基化修饰和组蛋白修饰,进而影响2型糖尿病的发生、发展。
对同卵双胞胎的研究发现,基因组DNA甲基化修饰具有较高的遗传度,以及DNA甲基化修饰改变与胰岛素抵抗显著相关。其他研究也表明了DNA甲基化与2型糖尿病的患病风险有显著的相关性。在T2DM患者的胰岛组织中,发现有276个CpG岛甲基化修饰出现显著变化。此外,瘦素基因(leptin, LEP)DNA甲基化可以预测对低热量饮食的反应、妊娠期间糖耐量异常以及成年期T2DM的发病风险。胰岛素编码基因(insulin, INS)、脂肪量和肥胖相关基因(fat mass and obesity associated, FTO)、胰腺十二指肠同源盒基因(pancreatic and duodenal homeobox 1, PDX1)、编码钾离子通道亚单位的基因(potassium voltage-gated channel,KQT-like subfamily,member 1, KCNQ1)等的DNA甲基化修饰也与2型糖尿病密切相关。
8.DNA 甲基化与心血管疾病
近年研究发现,异常的DNA 甲基化与许多心血管疾病如动脉粥样硬化、高血压、心力衰竭等均有关系。与动脉粥样硬化相关的DNA 甲基化基因主要包括雌激素受体(estrogen receptor,ER)基因、 p53 基因和细胞外超氧化物歧化酶基因等。近年许多研究发现,组织因子途径抑制物2(tissue factor pathway inhibitor-2,TFPI-2)和低密度脂蛋白受体(low-density lipoprotein receptor,LDLR)基因甲基化也与动脉粥样硬化有关。雌激素受体(estrogen receptor,ER)属于核受体家族,分为ER-α 和ER-β 两个亚型。严重动脉粥样硬化症患者的动脉中 ER-α基因发生超甲基化,基因的表达下调,ER介导的血管保护作用受到抑制,进而引起血管平滑肌细胞增殖。有报道发现,动脉粥样硬化时斑块部位 ER-β 基因启动子区甲基化的水平较斑块周围正常组织明显升高,且该基因的表达也显著上调,上述研究均提示, ER基因甲基化修饰参与了动脉粥样硬化的发生和发展。TFPI-2为Kunitz 型丝氨酸蛋白酶抑制剂,具有抑制凝血、纤维溶解、降解细胞外基质及调控平滑肌细胞和单核/巨噬细胞增殖等作用。动脉粥样硬化患者 TFPI- 2 基因甲基化的水平显著增高, TFPI- 2基因的表达减少。动脉粥样硬化患者血浆中LDLR 基因甲基化率明显升高,基因表达受到抑制,认为这一调控机制与动脉粥样硬化患者体内高胆固醇水平等血脂代谢障碍有关。上述研究提示,动脉粥样硬化的发生及发展与多个基因的甲基化状态及其调控有关,并由多个基因表达改变联合作用所致。
DNA 甲基化修饰参与高血压的病理生理过程,并且涉及交感神经系统活性增强、肾脏水钠潴留及肾素-血管紧张素-醛固酮系统激活等多个环节。原发性高血压患者全基因组DNA 中5-甲基胞嘧啶的水平显著降低,且与高血压的级别呈负相关。血管紧张素Ⅱ受体(angiotensin Ⅱ reeeptor,ATR)可通过多种机制发挥升高血压的作用。有研究发现,ATR 的1b型( AT1b)受体基因启动子区低度甲基化修饰可以促进AT1b 受体基因表达,从而导致高血压的发生。11β-羟基类固醇脱氢酶-2(11β-hydroxysteroid dehydrogenase-2,11β-HSD-2)是一类能够保护盐皮质激素受体的专一氧化酶,该酶活性降低时,皮质醇则与失去保护的盐皮质激素受体结合,引起水钠潴留、血容量增加,最终导致高血压。研究发现, 11β- HSD- 2 基因启动子区甲基化水平增高引起的 11β- HSD- 2 基因表达下调参与了泼尼松治疗引起的继发性高血压的发生。
心力衰竭是心肌梗死、高血压、心律失常等大多数心血管疾病发展的共同终末阶段。肌浆网Ca 2+-ATP酶2a(sarcoplasmic reticulum Ca 2+-ATPase2a,SERCA2a)在心脏功能和钙稳态的维持中发挥重要作用。研究发现,肿瘤坏死因子-α(TNF-α)可促进DNMT 表达,使SERCA2a 启动子区的甲基化增强,导致SERCA2a mRNA 及其蛋白表达减少,破坏细胞内Ca 2+浓度的稳定性,参与心力衰竭的发生和发展。
9.基因组印记与遗传病
基因组印记是指来自父方和母方的等位基因在通过精子和卵子传递给子代时发生了修饰,使带有亲代印记的等位基因具有不同的表达特性,一般来说,DNA 甲基化修饰是造成基因印记的主要原因。该修饰作用发生于胚胎发育早期,当DNA 甲基化紊乱时,造成印记丢失。印记基因的异常表达引发伴有复杂突变和表型缺陷的多种人类疾病。研究发现许多印记基因对胚胎和胎儿出生后的生长发育有重要的调节作用,对行为和大脑的功能也有很大的影响;印记基因的异常同样可诱发癌症。例如,脐疝-巨舌-巨人综合征(Beckwith-Wiedemann syndrome,BWS)是一种先天性疾病,该病主要是由11号染色体上的 IGF2和 p57两个印记基因的错误表达引发。Prader-Willi/Angelman syndrome(PWS/AS)是两种先天性神经异常发育综合征。目前已知的致病机制主要有三种情况:70%的是由于父本来源的染色体15q11~13 缺失;25%是因为母源性的单亲二倍体;5%是由于印记中心缺陷。Silver-Russell syndrome(SRS)是一种先天性印迹疾病,研究发现人类7 号染色体上的印迹基因生长因子受体结合蛋白10( Grb10)是该病的候选致病基因。
10.DNA甲基化与干细胞分化
干细胞在相对静息的状态下也受到环境因素的影响,环境的改变往往会引起表观遗传的变化,细胞的状态也会随之改变。在干细胞中,DNMT3a和DNMT3b密切地相互作用,在分化中的胚胎癌性细胞或ES细胞中,这两种酶协同作用使 Oct4和 Nanog基因的启动子区甲基化,如果去除DNMT3a和DNMT3b会引起甲基化不足, Oct4和 Nanog的表达会失调。 DNMT1-/-、 DNMT3a- /-和 DNMT3b- /-双突变的小鼠胚胎干细胞(ESC)能够增殖分裂且保持未分化状态,表明基因组低甲基化与维持ESC的自我更新能力有关。基因组水平的DNA甲基化图谱分析显示DNA CpG岛的甲基化是一种动态的表观遗传学标记,这种标记在未分化的干细胞和分化的细胞中其CpG岛的甲基化区域是不同的。DNA甲基化和大约87%的ES细胞抑制性基因有关。DNA甲基化对于这类在ES细胞中处于沉默状态的基因是一种潜在的抑制性机制。当ES细胞向分化方向发展时,DNA甲基化也可以使关键性的多潜能性转录因子基因沉默。最近的研究也指出,在非多能性的细胞中, Oct4、 Sox2和 Nanog基因的启动子是甲基化的。
总之,DNA 甲基化与人类疾病和发生发展密切相关,但是究竟前者是后者的原因、中间过程抑或后果尚不清楚。DNA 甲基化的改变是可逆的,甲基化抑制剂可改变某些基因的甲基化状态和表达水平,发挥相应的生物学效应。在表观遗传药理学的药物效应方面,DNA甲基化的影响也已经在探索中,这些都为我们从新视角去认识和治疗疾病提供了可能。目前对于上述问题的研究尚处于起步阶段,有待于进行更深层次的探索。
(周鹏)