第一节 蛋白质合成异常

蛋白质合成,又称为基因表达(gene expression),是生物将储存在脱氧核糖核酸(DNA)序列中的遗传信息经过转录和翻译,合成具有生物活性的蛋白质分子的过程。蛋白质合成过程受到严密精准的时空特异性调控,以实现有序、不可逆的分化和发育过程。一旦调控失常,蛋白质合成在时空上出现紊乱,就会导致疾病。

一、蛋白质转录调控

转录(transcription)是指以 DNA为模板,由DNA依赖的RNA聚合酶催化四种三磷酸核苷酸(NTP)聚合生成RNA的过程。转录调控包括转录前调控、转录水平调控和转录后调控。
1.转录前调控
转录前调控主要指DNA被转录成mRNA之前,对基因组上的遗传信息进行调控的过程,主要包括基因突变(gene mutation)、染色体变异(chromosome aberration)和表观遗传修饰(epigenetic modification)等通过改变DNA序列和染色质结构及数量从而影响基因表达的过程。基因突变从分子结构的角度可分为点突变(point mutation)、动态突变(dynamic mutation)和移动基因(movable gene)及外源DNA序列插入引起的突变。点突变指单个碱基被另一个碱基替换,或原序列中插入或丢失了一个脱氧核糖核酸分子。动态突变指基因组中存在的一些短串联重复序列,尤其是三核苷酸重复,在世代传递过程中重复次数逐渐增加。移动基因又叫转位因子(transposable element),是一类能够在内切酶作用下出现在其他基因座上的DNA序列,转位因子引起的插入突变可使插入部位出现新基因,染色体变异等。染色体变异包括染色体结构或数目的变异。染色体结构变异由染色体或染色单体断裂引起,其类型包括缺失、重复、倒位和易位。染色体数目变异可分为整倍体变异和非整倍体变异。表观遗传是指DNA序列不发生变化的前提下,基因表达发生了可遗传的改变。表观遗传修饰目前所知的主要有 DNA甲基化、RNA修饰、RNA编辑、染色质重塑和组蛋白修饰等。组蛋白特定位点的修饰(如乙酰化、磷酸化、甲基化、泛素化等)与染色质的活化密切相关,如组蛋白高乙酰化能增强基因表达(相关内容详见第一章)。
2.转录水平调控
转录水平调控是基因表达调控全过程中最关键和最核心的环节。理论上,涉及转录每一个环节的调节都可导致基因表达产物量或质的变化,但转录起始是真核基因表达调控的最重要环节。RNA聚合酶Ⅱ启动基因转录需要一整套转录因子在转录开始前先在启动子部位按顺序组装,再与RNA聚合酶Ⅱ形成复合物。组装的每一步骤都受到内、外环境信号的调节,使不同基因转录的启动快慢有别。
真核基因的转录调控区含有特异的DNA序列——顺式作用元件(cis-acting element),按功能分类包括启动子(promoter)、增强子(enhancer)和沉默子(silencer)等。其中启动子是 RNA聚合酶结合并启动基因转录的特异DNA序列,增强子决定基因的时空特异性表达,能增强基因转录活性;沉默子则抑制或阻遏基因转录。反式作用因子(transacting factor)又叫转录因子(transcription factor),是真核生物细胞核内的一类蛋白质,能识别顺式作用元件中的特异靶序列,介导邻近基因的开放或关闭。任何原因导致的顺式作用元件的突变或甲基化修饰、转录因子的结构和功能改变,都会引起两者不能正确结合和相互作用,从而导致基因转录水平的异常(图2-1)。
图2-1 真核基因转录调控区模式图
顺式作用元件与反式作用因子的正确结合可分别启动或阻遏特定基因的转录过程
3.转录后调控
转录后水平调控包括 5′-端加m7GpppN 帽、3′-端加 polyA 尾、6-甲基腺嘌呤、选择性剪接等对mRNA前体加工成熟过程的调控。其中,选择性剪接(alternative splicing)是在剪接体(spliceosome)的作用下,识别不成熟的mRNA上剪切效率各异的剪切点,去除内含子,产生多种不同的成熟mRNA,进而翻译合成多种不同功能的蛋白质。这一过程取决于选择性剪接加工因子——RNA结合蛋白的特异性。mRNA前体的选择性剪接影响哺乳动物近95%的基因和多个调节过程,是转录与翻译之间的一种非常重要的调控交叉点,极大地增加了蛋白质的多样性和基因表达复杂程度,对细胞分化、发育和病理状态都有重要意义。
mRNA在细胞中的浓度取决于该mRNA的半衰期,mRNA降解调控通过改变mRNA的稳定性来调控基因表达。除了3′端polyA这一增加mRNA稳定性的重要因素外,在高等生物基因表达调控中,普遍存在一类特殊的小RNA分子介导的基因转录后沉默机制——RNA 干扰(RNA interference,RNAi),与多细胞生物个体发育和肿瘤等密切相关。小RNA又称微 RNA(micro RNA,miRNA),为 20~25bp双链结构,是由约70个碱基对组成的、具有内部互补序列形成发卡样结构的RNA前体(precursor miRNA,premiRNA)经特异核酸内切酶Dicer裂解而成。miRNA在RNA诱导沉默复合体(RNA-induced silencing complex,RISC)的作用下,将双链 miRNA加工成单链,并附着在RISC上,通过与靶mRNA互补结合,诱导靶mRNA的降解或抑制蛋白翻译,从而对靶基因表达进行反向调控。此外,调控性非编码RNA还包括长链非编码 RNA(long noncoding RNA,lncRNA)和环状RNA(circular RNA)等,可以在转录及转录后多个层次调控基因表达,详见第一章。

二、蛋白质翻译调控

翻译(translation)是指以氨基酸为原料,以mRNA为模板,在tRNA、rRNA和多种蛋白质及辅助因子的调控下,将DNA携带的遗传信息传递给蛋白质/多肽链的过程,可人为划分为起始、延长和终止三个阶段。翻译起始时,首先是由40S小亚基与起始甲硫氨酰tRNA(Met-tRNAi)及一系列真核翻译起始因子(eukaryotic initiation factors,eIFs)组成 43S 核糖体前起始复合物;随后在帽结合起始复合物和eIF4F的介导下,与mRNA的 5′端m 7GpppN帽结构结合;最后与60S大亚基结合形成80S核糖体。肽链延长是在延长因子(elongation factor,EF)的参与下,通过核糖体循环(ribosomal cycle)从 N端向 C端添加氨基酸。翻译终止于释放因子(release factor,RF)识别mRNA上终止密码,mRNA、核糖体分离,肽链释放,并被定向转运至靶位置进一步折叠及修饰。翻译水平调控决定哪些mRNA翻译成蛋白质及什么时候翻译,其调控过程通常涉及mRNA稳定性及其分子结构对其功能的控制,以及与多种蛋白质因子之间的相互作用。mRNA的5′和3′端的非翻译区(untranslated region,UTR)是影响翻译过程的主要调节位点。

三、蛋白质合成异常与相关疾病

蛋白质合成各个环节的异常都有可能造成蛋白质结构和数量上的异常,从而导致疾病的发生。
1.基因突变
基因突变所致的蛋白质结构和功能异常,是遗传病发生的最主要原因。例如,血红蛋白病中的镰状细胞贫血(sickle cell anemia)是一种常染色体隐性遗传病,是由于点突变造成β链第6位谷氨酸(Glu)被缬氨酸(Val)取代,产生异常结构的血红蛋白HbS所致。纯合子患者血红蛋白溶解度下降,红细胞镰状改变,可产生血管阻塞危象,如腹痛、脑血栓、严重溶血性贫血及脾大等(图2-2)。
图2-2 镰状细胞贫血机制
镰状细胞贫血患者血红蛋白β链第6位谷氨酸(Glu)被缬氨酸(Val)取代,产生异常结构的血红蛋白HbS。患者红细胞镰状改变,引起血管阻塞相关症状
基因突变还可通过编码特定氨基酸的基因异常扩增,导致病理性蛋白质异常聚集而引起疾病,如1型强直型肌营养不良(myotonic dystrophy,DM1),是染色体 19q13.2-19q13.3基因三核苷酸(CTG)重复序列扩增而引起;亨廷顿舞蹈病(PD),是由于扩增的CAG重复片段被翻译成多聚谷氨酰胺(PolyQ),导致含超长PolyQ的蛋白质在细胞核或突触中聚集所致;异常扩增还可阻断转录因子,导致相应蛋白质水平下降,如脆性X综合征。
1969年提出的癌基因假说(oncogene hypothesis)认为肿瘤的发生与原癌基因的激活密切相关。原癌基因是一组与细胞生长调控有关的基因,包括生长因子、生长因子受体、信号转导因子等。原癌基因可因基因突变、基因扩增或染色体重排而被激活。一方面,原癌基因的突变导致蛋白结构的改变,从而出现蛋白质(酶)活性提高和调节功能异常;另一方面,原癌基因突变导致蛋白丰度提高,主要由于蛋白表达提高和稳定性提高,导致细胞中蛋白量的提高。此外,染色体易位可导致在错误的时间或者错误的细胞中基因出现高表达,并产生有活性的融合蛋白,从而引起相关疾病。此外,外源DNA序列如人乳头瘤病毒(HPV)DNA可整合入宿主细胞基因组引起基因组不稳定和结构异常,引起基因表达水平和蛋白质结构的改变,进而导致疾病的发生。
2.染色体变异
基因位于染色体上,染色体的改变所致基因拷贝数变化,会引起基因表达水平改变,甚至引起新的异常蛋白的产生。例如,慢性粒细胞白血病的染色体 t(9;22)易位形成 BCR-ABL融合基因,导致所编码的蛋白质具有强酪氨酸激酶活性,与胞内多种蛋白质酪氨酸磷酸化水平升高,正常信号转导通路紊乱以及细胞凋亡抑制有关。
3.表观遗传异常
基因组序列中富含胞嘧啶-磷酸-鸟氨酸(CpG)位点的区域称为CpG岛。发生在启动子序列的CpG岛的高甲基化(methylation)抑制转录因子与启动子的识别结合,从而抑制基因的表达。在肿瘤的发生发展过程中,DNA甲基化总体水平降低;然而,一些局部序列(如细胞周期和DNA损伤修复相关基因群启动子区域的CpG岛)在癌变早期即出现高甲基化。
脆性 X综合征(fragile X syndrome)是一种以智力低下为主要表现的遗传性智力障碍综合征,是一种因基因突变导致表观遗传修饰异常所致的疾病表型。其致病基因为位于Xq27.3的脆性X智障基因 1(fragile X mental retardation-1,FMR1),该基因最常见的突变是5′端非翻译区中CCG三核苷酸重复序列的扩增,可引起其上游CpG岛异常甲基化,使FMR1基因沉默和表达产物FMRP的缺失,从而引起智能低下。此外,系统性红斑狼疮女性患者X染色体上调控序列的去甲基化失活有关。
4.转录调控异常
许多疾病或综合征都与转录因子、转录辅因子和转录调控区等突变相关。这些突变会引起诸如癌症、自身免疫病、神经系统疾病、生长发育综合征和冠心病等。大多数肿瘤细胞的生长和增殖都依赖转录因子c-myc,c-myc升高细胞内已有的基因表达水平,从而促进肿瘤细胞生长和增殖。其编码基因 MYC是最常被扩增的原癌基因,其表达水平升高与肿瘤恶化及临床预后不佳相关。同样,免疫应答转录因子NF-κB参与炎症相关基因转录延长过程,其调控异常与炎症和自身免疫病相关。转录辅因子MED23的突变会引起其与增强子相关转录因子之间相互作用异常,导致有丝分裂原反应性即刻早期基因的转录抑制,从而影响脑发育和可塑性,引起智力障碍。
单核苷酸多态性(single nucleotide polymorphism,SNP)是基因组DNA序列中由于单个核苷酸的突变而引起的多态性,是人类可遗传变异中最常出现的一种。许多疾病相关的SNP都富集于转录调控区,例如9p21基因区(gene desert)增强子上的两个冠心病致病性SNP破坏了信号转导及转录激活因子 1(signal transducer and activator of transcription 1,STAT1)的结合位点,引起一种反义非编码RNA,CDKN2BAS表达的增强。CDKN2BAS与表达抑制性蛋白相互作用,使相关基因转录沉默,最终导致冠心病的发生发展。
5.转录后调控异常
基因突变导致选择性剪接异常可引起多种疾病。例如。额颞叶变性(frontotemporal lobar degeneration,FTLD)是一组由大脑额颞叶逐渐变性引起的复杂疾病,是仅次于阿尔茨海默病的最常见的早老性痴呆症。在FTLD中已发现44种 MAPT基因突变,其中一种突变干扰了 MAPT外显子10的选择性剪接,导致4R型tau蛋白水平升高,3R/4R亚型比值的降低,促进tau蛋白的聚集,进而引起疾病的发生。强直型肌营养不良1型(DM1)是由 DM蛋白激酶基因的 3′非翻译区中的CTG三核苷酸扩增引起,这类患者存在由骨骼肌缺陷引起的胰岛素抵抗,可见骨骼肌中胰岛素受体(IR)pre-mRNA的异常选择性剪接,导致低胰岛素代谢反应性非肌肉异构体(IR-A)的表达升高。剪接调节子CUG-BP在DM1骨骼肌中水平增高,可通过位于选择性剪接外显子11上游的内含子元件介导IR的选择性剪接异常。
约50%的已知miRNA在人类肿瘤发生过程中起重要作用。例如,miR-34家族包含 miR-34a、miR-34b和miR-34c,是最早发现与人类肿瘤相关的miRNA。miR-34作用于一系列与细胞周期调控、增殖和凋亡相关的原癌基因,如 CDK4、MYC、Bcl-2、SIRT1等,从而抑制细胞生长。在肝癌和肺癌患者的癌细胞中均发现miR-34表达下降。miRNA let-7的靶基因为原癌基因RAS,其水平在肺癌细胞中也下降,且肺癌患者的生存期缩短与let-7表达量下降密切相关。而 miRNA miR-21在许多种肿瘤细胞中都存在过度表达,过度表达的miR-21会导致一些重要的抑癌基因的抑制,如PTEN、TPM1等。
6.翻译调控异常
蛋白质的翻译起始是蛋白质合成的限速环节,因此,翻译起始的调控常常是蛋白质翻译的关键。起始阶段eIF2参与43S核糖体启动翻译过程,而 eIF2的磷酸化起着负性调节作用,会阻断蛋白质合成过程。有大量证据显示在许多肿瘤发展过程中出现了eIF2磷酸化水平的下调,与肿瘤细胞蛋白合成和增殖增加相关。而肿瘤早期存在eIF2磷酸化水平上调,可能与蛋白合成减少以适应肿瘤发生早期的缺氧环境相关。
与此不同,另一种真核翻译起始因子在肿瘤发生发展中的作用更加明确,如eIF4F帽结合起始复合物参与mRNA 5′端加 m 7GpppN帽过程,已发现复合物中的组分eIF4E在多个器官的肿瘤中过表达,如乳腺、头颈、肺肿瘤及淋巴瘤。eIF4E的过表达能选择性增加细胞周期蛋白、细胞生长和存活相关蛋白,如MIF及促癌基因表达的增加;eIF4E突变导致的过磷酸化也会促进肿瘤发生。
哺乳动物雷帕霉素靶蛋白(mammalian target of rapamycin,mTOR)是一种丝-苏氨酸蛋白激酶,是两种蛋白复合物,mTOR复合物 1(mTOR complex 1,mTORC1)和mTORC2的核心组分。mTORC1作用广泛,参与蛋白质翻译调控、自噬、脂质合成等重要生命活动。mTORC1能通过磷酸化,激活转录核糖体S6激酶(ribosomal S6 kinase,S6K)和抑制 eIF4E结合蛋白 1(eIF4E-binding protein 1,4E-BP),从而促进蛋白质翻译过程。而生理性应激如缺氧、营养剥夺以及药物雷帕霉素能抑制mTOR活性,导致S6K活性降低,从而引起其下游延长因子 2(elongation factor 2,eEF2)的活性降低,肽链延长速率降低。而mTOR活性降低引起的4E-BP的活性增加,与eIF4G竞争性结合 eIF4E,影响依赖帽结构的转录过程,同样会抑制蛋白质合成。给予雷帕霉素抑制mTORC1能改善肿瘤、阿尔茨海默病、2型糖尿病及自身免疫病的症状。雷帕霉素已被美国食品药品管理局(Food and Drug Administration,FDA)批准用于治疗淋巴瘤、胰腺癌等肿瘤性疾病,其用于治疗衰老相关疾病的临床研究也在进行中。