第一节 遗传病诊断

个体生殖源性遗传物质的异常具有全身性与终生性的特点,因此遗传病诊断的对象不仅仅是遗传病患者,还包括家系中与患者亲缘关系较近的高风险个体、胎儿、胚胎甚至受精卵。根据遗传病的特点与不同的临床目的,遗传病诊断通常可以分为三种方式,包括症状诊断(symptomatic diagnosis)、症状前诊断(presymptomatic diagnosis)与产前诊断(prenatal diagnosis),分述如下。

一、症状诊断

在遗传病家系中,对包括先证者在内的所有已出现症状患者的临床诊断均称为症状诊断。遗传病的症状诊断不仅遵循一般疾病的诊断原则,而且还以遗传学检查的结果作为确诊的重要依据。

(一)病史、症状与体征

1.病史

遗传病具有先天性的特点,根据遗传物质异常严重程度的不同,病史也各有其显著的特点。一些严重的染色体病与基因组病在新生儿期就表现出明显的症状体征,如21-三体综合征及猫叫综合征等。而更多的单基因病患者就诊时,通常其疾病表现已有一段时期,这主要是源于三个原因:①一些单基因病的症状体征随着生长发育而逐渐显现,如脊肌萎缩症(spinalmuscular atrophy,SMA)等。在病史询问中患者或家系成员往往将发病归咎于某一偶发事件。②还有一些单基因病起病比较隐匿,其症状体征经由一些特定的环境因素或生理过程诱发或加重,如葡萄糖-6-磷酸脱氢酶缺乏症(glucose-6-phosphate dehydrogenase deficiency)患者进食蚕豆引发急性溶血,地中海贫血携带者女性孕期出现加重且难以纠正的贫血等。③另有一些单基因病在青年期,甚至成年后才会起病,至较明显影响生活工作时就诊。如神经系统遗传病,通过病史询问可比较清楚地了解到其病情逐渐加重的过程。

2.症状与体征

遗传病既有与其他疾病相交叉的症状与体征,又有其特殊的临床表现。如染色体病与基因组病由于涉及较多基因的缺失或重复,临床上往往表现为同时累及多个组织器官的症候群,出生后即可能观察到“特殊面容”、异常皮纹、组织器官的先天畸形、生长发育迟滞、神经精神发育异常等表现。而多数单基因病的临床表现比较单一,如地中海贫血(thalassemia)以溶血性贫血为主要表现,进行性肌营养不良症(progressivemuscular dystrophy)以进行性肌无力肌萎缩为主要表现,血友病(hemophilia)以出血倾向为主要表现等。由于基因的多效性与疾病的遗传异质性,单基因病也可能出现临床症候群,如溶酶体贮积病(lysosomal storage diseases),不仅可导致智力低下,还可能会引起生长发育迟缓等。

(二)家族史

调查家族史是遗传病诊断的重要环节。由于遗传异常的垂直传递遵循孟德尔遗传规律,因此家系中可能出现两个或两个以上的患者,这在单基因病家系中尤其常见,阳性家族史是该类疾病诊断的重要辅助证据。其他遗传病如染色体病与基因组病,则由于患者多为新发遗传物质异常而致病,故而多数缺乏阳性家族史。

在单基因病家族史的调查中,一个最重要的内容是利用标准的系谱符号绘制系谱图(图3-1~图3-4)。以系谱图为基础进行系谱分析,其主要作用是判断疾病的遗传方式,以区分表型相似的遗传病。系谱分析时应注意:①尽可能保证系谱信息的完整性与可靠性;②以被标注的先证者为基点,以先证者及其直系亲属组成的家系为核心分析系谱特点;③近亲婚配并不罕见,该类家系常染色体隐性遗传病的发生风险远高于随机婚配家系,因此当怀疑常染色体隐性遗传病时,应着重询问并标注双亲有无近亲婚配现象。另外,还有一些经常面临的情况:①在一些常染色体显性遗传病家系中,可能存在外显不全与延迟显性的家系成员,二者均携带显性致病基因,其中前者可能终生不发病,后者或许在家系患者就诊时还未发病,因此在系谱上可能出现隔代遗传的不规则显性现象;②目前家庭子女普遍较少,小家系较多,当见到仅有一个患者的家系时,可优先考虑常染色体隐性或X连锁隐性遗传,但不能排除新发突变导致显性遗传病的可能。

图3-1 常见的系谱符号

图3-2 常见的系谱线条

图3-3 常见的辅助生育技术的系谱符号

图3-4 常见的遗传评估/检查信息的系谱符号

(三)一般检查

遗传病诊断中的一般检查包括了除遗传学检查外的所有临床检查手段,如血清学检查、生化检查、影像学检查、电生理检查及病理检查等。

在单基因病中,因致病基因往往编码一些重要的结构蛋白或生物酶,因此通过对这些蛋白质或其复合体的数量或活性进行实验室检测,可以为这些遗传病的拟诊提供重要的依据。如地中海贫血患者的血红蛋白电泳可以发现血红蛋白比例的显著变化或异常血红蛋白条带。再如甲型血友病(hemophilia A),最具有诊断价值的实验室指标之一就是FⅧ因子活性显著降低。

临床生化检查在遗传病诊断中起着非常重要的作用,尤其在目前已发现的200余种遗传代谢性疾病(metabolic diseases)中,多数是由于单基因突变导致生物酶的数量或功能缺陷,通过生化检查了解相关酶或中间代谢产物的变化,可以为这类遗传病的靶向基因检查提供关键性指引。

在临床中,皮肤系统与神经系统遗传病较为常见,二者具有一些共同的特点,包括遗传异质性强、症状体征交叉程度高、鉴别诊断困难等。因此皮肤系统的遗传病诊断中,强调组织病理检查的重要性;在神经系统遗传病诊断中经常会进行影像学检查、电生理及病理检查以区分不同疾病。如常染色体显性小脑脊髓性共济失调(spinocerebellar ataxia,SCA)在CT检查中多可发现小脑萎缩;进行性肌营养不良症患者肌电图检查可提示肌源性损伤;脊肌萎缩症患者肌电图检查则提示神经源性损伤等特征性改变。

(四)遗传学检查

1.染色体病

通过染色体检查证实染色体数目异常与结构畸变是染色体病最重要的确诊依据。染色体检查的指征主要包括:①智力低下、生长发育迟缓或其他先天畸形者;②原发性闭经和女性不育症患者;③严重生精障碍和男性不育患者;④两性畸形患者;⑤多发性流产、死胎的妇女及其丈夫;⑥家族中已有染色体异常或先天畸形个体;⑦疑为Down综合征的患儿及其父母;⑧35岁以上的高龄孕妇。染色体病遗传学检查的标本来源多样,包括外周血、皮肤组织标本、胎儿绒毛、羊水脱落细胞及脐血等。

需要特别注意的是,将染色体检查中发现的染色体可疑异常核型与临床表现联系起来是染色体病诊断的核心。一般而言,染色体数目异常导致的染色体病,通过染色体检查最容易获得病因诊断,如21-三体综合征(Down syndrome)、18-三体综合征、Turner综合征及 Klinefelter综合征等;其次是染色体部分单体,当缺失发生在基因比较密集的区域时,这类缺失与临床表现的关系比较容易确定;然而,染色体部分重复或片段增加的表型效应有时难以确定,一个可行的办法是了解患者的一级亲属中之健康者是否存在该核型,以及调研该变异核型是否在其他类似表型的患者中也有发现。如在患者中重复出现,可以认为是核型与表型相互关联的重要证据。反之,则应尽量排除染色体多态性的可能。以较常见的9号染色体臂间倒位为例,虽然核型为inv(9)(p12q13)的倒位已被认为是一种染色体多态性,但不排除其他9号染色体臂间倒位的致病性,这取决于染色体断裂点的位置与遗传物质剂量是否发生增减。因此,对这类携带倒位染色体的个体,可采用aCGH或SNP array等方法对染色体组进行更详细的分析。

2.单基因病

单基因病的遗传学检查主要指基因检查。由于通过确定基因致病性突变可以从病因水平为这类疾病提供确诊依据,因此通常将基因检查称为基因诊断。但从严格意义上说,基因诊断应包括实验室基因检查与基因型/表型关系分析两个步骤。由于单基因病致病基因数量大、基因突变类型多、突变范围广泛及遗传异质性等因素,基因诊断从诞生之日起就体现出家族化与个体化的特点,这也正是基因诊断的复杂之处。

从20世纪70年代基因诊断诞生至今,基因检查无论从技术还是病种上看都有长足的发展,尤其在近10年里,能进行基因检查的单基因病已近3000种,涵盖了绝大多数临床常见的致死、致残、致愚性疾病。基因检查的发展在很大程度上归功于致病基因的定位克隆与突变谱的建立,其中遗传异质性与单基因突变谱的特点决定了基因检查的策略。分子遗传学技术的进步同样十分重要,如近年来出现的用于基因微小突变检测的二代测序(next-generation sequencing,NGS)、变性高效液相色谱(denaturing high performance liquid chromatography,DHPLC)、高分辨率熔解曲线分析(high-resolution melting analysis,HRM)及基质辅助激光解析/电离飞行时间质谱(matrix-assisted laser desorption/ionization time of flightmass spectrometry,MALDI-TOF-MS),以及用于基因缺失/重复检测的多重连接依赖式探针扩增(multiplex ligation-dependent probe amp lification,MLPA)等技术,均显著提高了基因突变的检出率。

二、症状前诊断

症状前诊断是遗传病诊断的一种特有形式,是对遗传病家系中的患病高风险个体在症状出现前进行的一种临床诊断。症状前诊断主要针对单基因病,其最重要的前提条件是家系患者有明确的临床诊断,并且已证实家系的致病性突变。

症状前诊断在延迟显性的严重遗传病中既是必要的,也是可行的。但需要强调的是,症状前诊断存在一定程度的伦理学冲突,尤其对未成年人的诊断值得商榷。根据有益无害的原则,未成年人如无明确社会或医学原因,不宜进行症状前诊断,以免影响未成年人的成长。

临床上症状前诊断的目的主要包括:①职业选择。如神经系统的遗传病多为延迟显性,一旦发病,进行性发展会严重影响患者的工作能力,因此早期发现有利于提前做好职业规划。②早预防早治疗。有少数延迟显性遗传病可以对症治疗,如家族性多发性结肠息肉病(familial adenomatous polyposis,FAP),未经治疗结肠息肉转变为结肠癌的平均年龄是39岁,因此症状前诊断可以帮助受检者了解是否携带致病突变,并及早选择医疗对策,避免恶性肿瘤的发生。③避免患者出生。这是症状前诊断最重要的医学目的之一。尤其是神经系统延迟显性遗传病,虽然发病较晚,但逐渐加重以致生活难以自理,亦属于严重致残致死性遗传病之列。对家系高风险个体进行症状前诊断,有利于提前做好心理准备与生育的医学安排,从而避免影响子代。

三、产前诊断

产前诊断是避免遗传病患者出生的有效手段之一,是遗传病预防的重要环节。通过对受精卵、孕妇外周血、绒毛组织、羊水细胞及脐血中胎儿细胞的染色体或基因进行检查,以判断胎儿是否会发生严重染色体病或单基因病。

染色体病产前诊断的指征主要包括:①夫妻之一有染色体畸变或染色体平衡易位;②夫妻核型正常,但曾生育染色体病患儿;③夫妻核型正常,但原因不明反复流产死胎;④35岁以上高龄孕妇;⑤产前筛查或产前影像学检查提示出生缺陷高风险的孕妇。

单基因病产前诊断的基本条件包括:①严重致死、致残、致愚的单基因病;②家系中先证者临床诊断明确,致病基因已知,且胎儿有较高发病风险。

产前诊断是一个涉及申请者家系成员、医学遗传学咨询专家、临床专科医生、实验室检查人员的复杂过程,以单基因病的产前诊断为例,整个产前诊断流程可分为以下阶段:①临床诊断与病因诊断阶段。该阶段主要通过患者临床表现,结合各种一般性实验室检查,完成家系中患者的临床诊断;根据临床诊断进行致病基因检查,明确患者基因突变位点与性质。②遗传咨询阶段。该阶段主要判断产前诊断的医学必要性以及当事人的意愿,提示产前诊断风险后,由当事人自主选择是否进行产前诊断。原则上较严重的遗传病才有必要进行产前干预,而是否适合于产前诊断并非完全取决于病种,还涉及两个基本因素,其一,基因本身的重要性;其二,基因突变对基因功能的影响程度。如进行性肌营养不良症中,杜氏与贝氏肌营养不良症有共同的致病基因,但前者临床表现非常严重,需要产前诊断,而贝氏肌营养不良症则比较轻微。再如甲型血友病,重型患者致残致死率较高,需终身替代治疗,而轻型患者基本不影响生活工作。③产前诊断的实验室检查阶段。往往需要对先证者与家系其他核心成员进行共同分析,以了解突变基因或风险染色体的传递情况。当双亲之一为常染色体显性遗传病患者,可直接进行胎儿的基因检查;如为常染色体隐性遗传病,确定夫妻双方为致病基因携带者后,可进行胎儿基因检查;如为X连锁隐性遗传病,确定母亲为致病基因携带者后,可进行胎儿基因检查。在隐性遗传病中,当不能排除夫妇为生殖系统突变嵌合体时,遗传诊断明确后亦可进行产前诊断。④再咨询阶段。该阶段主要是对申请者解释产前诊断结果及面临的风险,由申请者自行决定是否终止妊娠。

产前诊断可以最大限度地避免严重遗传病患儿出生,但应认识到这是一个高风险的医疗行为,尤其是单基因病的产前诊断,都是通过检测家系中已知基因突变的传递判断胎儿状况,而非对胎儿基因全序列进行分析,因此无法发现新产生的生殖源性突变(de novo),理论上无法完全避免遗传病患儿的出生。虽然遗传病的产前诊断已有一套严格的程序,但也无法完全消除诊断技术的局限与从业人员人为差错所带来的风险。遗传病的产前诊断从来就与遗传咨询密不可分,必须对产前诊断申请者进行详细的遗传咨询,充分提示诊断的风险,并为其决定提供正确的遗传学依据。

四、染色体病与基因组病遗传学检查的策略与适用技术

从非显带染色体到显带染色体的制备,染色体检查技术的进步已使不同的染色体能够得到准确地区分,大大提高了对染色体数目异常与结构畸变(染色体病)的识别率。同时,染色体分子杂交技术的出现使发现与诊断染色体微小结构突变及其导致的遗传病(基因组病)成为可能。

(一)染色体与基因组检查策略

就临床表现而言,染色体病与基因组病均可能以临床症候群为特点,包括生长发育迟缓、神经精神发育异常及先天畸形等,因此临床上有时难以区分。就遗传病因而言,二者均与多基因改变有关,但不同的是前者的基因组改变更为显著。随着基因组检查技术的发展,对这两类疾病的诊断与鉴别越来越依赖于遗传学检查,但应注意检查的策略。

1.染色体与基因组检查的顺序

常规染色体检查是染色体病诊断的“金标准”,对于怀疑染色体病的患者首先应完成常规染色体检查,以发现显著的染色体数目异常与结构畸变;当常规染色体检查无阳性发现时,可考虑选择分辨率更高的基因组检查,目前该类检查以比较基因组杂交芯片为代表,以期发现基因组功能性的微小结构突变,包括微缺失及微重复等。

2.非靶向与靶向基因组检查

采用比较基因组杂交等高分辨技术进行非靶向基因组检查,适用于患者的临床表现缺乏特异性,难以根据症状体征及一般实验室检查获得病因诊断的情况。非靶向基因组检查的结果可进一步采用靶向检查予以验证。以荧光原位杂交技术为代表的靶向基因组检查适用于一些常见染色体病的快速筛查及非靶向基因组检查结果的验证。

(二)染色体与基因组检查的适用技术

常规染色体显带技术适用于染色体病的检测,以期发现较明显的染色体数目异常与结构畸变;高分辨染色体显带技术可以进一步提高染色体结构畸变的检出率,可用于常规染色体显带技术发现可疑染色体结构畸变的精确核型确定。

荧光原位杂交(fluorescence in situ hybridization,FISH)适用于染色体病与基因组病的靶向检测。在临床工作中,通常首先进行常规染色体检查,以获得染色体组全貌;在发现特定染色体异常,尤其是结构改变时,可利用FISH核型进一步判断与表型的关系。在特殊的情况下,如产前诊断中靶向检查21、18、13、X及Y等染色体时,或羊水细胞培养失败时,可直接采用FISH检查的方法。

定量PCR技术(quantitative polymerase chain reaction,qPCR)主要针对常见的染色体病与基因组病的靶向检测。定量PCR技术的缺点是难以对染色体易位与嵌合体作出有效判断。基于短串联重复序列(short tandem repeat,STR)的定量PCR技术理论上适用于大部分常见的染色体非整倍体的检查。多重连接依赖式探针扩增(MLPA)是另一个临床常用的染色体病与基因组病的靶向检测技术。该技术适用于检测已知的染色体微缺失/微重复综合征(microdeletion/dup lication syndromes)及染色体亚端粒缺失综合征等,是目前针对已知的染色体微缺失/微重复最可靠的遗传检查方法之一。

微阵列比较基因组杂交(array comparative genomic hybridization,a CGH)与单核苷酸微阵列(single nucleotide polymorphism array,SNP array)技术均为高通量、高分辨率的基因组结构检测技术,适用于基因组未知微缺失/微重复的非靶向检测。该技术最突出的不足是难以检出染色体平衡易位与嵌合体,这一问题的解决还有待于该技术的进一步改进与发展。

五、单基因病遗传学检查的策略与适用技术

基因诊断是通过寻找致病基因的功能性突变,对单基因遗传病进行病因诊断的过程。无论是单基因病的临症诊断(symptomatic diagnosis)、症状前诊断还是产前诊断,其核心都是基因诊断。基因诊断可分为实验室基因检查与基因突变性质判断两个内容。根据致病基因的结构特点与突变谱,基因检查的重点集中在确定诊断策略与选择适用分子生物学检测技术两个方面。而对基因突变性质的分析则需要集中实验室与生物信息学两个方面的证据。

(一)基因检查策略

随着人类疾病基因组学研究的深入,越来越多的致病基因被发现,也积累了大量的基因型与疾病表型相关性的证据。迄今为止,在实验室中已能对近3000种单基因病进行基因突变分析。然而,单基因病致病基因突变大都有其自身的特点。如常染色体显性成人型多囊肾病,其致病基因突变主要以单碱基置换为主,且缺乏突变热点;而β地中海贫血虽然也以点突变为主,但通过对少数突变热点的分析,却可以发现90%以上患者的突变点;再如遗传性脊肌萎缩症以SMN1基因7、8号外显子拷贝变化为主,95%以上患者可以发现致病基因的纯合缺失;而假肥大性肌营养不良症则有近2/3患者可以见到DMD基因内大片段缺失或重复。显然,这些致病基因的突变谱特点存在较大差异,因此在实验室基因检查中首先需要解决的问题是选择合适的检查策略。

1.直接与间接基因诊断

(1)直接基因诊断:

指利用适用的技术与方法对遗传病患者的致病基因进行直接分析,确定致病基因突变位点以达到基因诊断的目的。直接基因诊断的指征包括:致病基因明确的单基因病;患者群体致病基因突变谱已建立,有突变热点;或者基因较小,检测耗时与成本符合临床需要。

(2)间接基因诊断:

指通过检测基因内或基因两侧的一些遗传多态性位点的基因型,利用基因连锁分析建立家系中野生型基因与突变型基因多态性位点单倍型的信息,进而了解待检者是否获得突变基因的一种诊断方法。间接基因诊断的指征是:致病基因明确的单基因病;未能检出致病基因功能区致病突变,或缺乏明显的突变热点或基因较大的单基因病,采取直接诊断耗时长且成本高昂,不符合临床的实际需求,且家系中有健在的临床通过“金标准”诊断明确的患者。

遗传多态性位点的选择是间接基因诊断的关键,一般有两类多态可以选用。①单核苷酸多态性(single nucleotide polymorphism,SNP),该类位点数量大,并且较多可以利用限制性片段长度多态性(restriction fragment length polymorphism,RFLP)分析方便地确定基因型,而缺点是这些位点多见二态变化,明显地限制了其多态信息量,因此往往需要结合较多的SNP位点检测才能区分家系中的野生型与突变型基因。②短串联重复序列(STR),这类位点虽然数量远少于SNP位点,但由于每个位点往往存在有较多的等位片段,因此多态信息量远大于SNP位点,区分家系野生与突变基因所需的STR位点数也大大少于SNP位点,基于这些特点,目前间接基因诊断多选择STR位点。在这类位点中,二核苷酸重复位点数量大于三核苷酸重复或四核苷酸重复,因此前者更常见于间接基因诊断中。

(3)两种基因诊断方法的比较与联合应用:

间接基因诊断与直接基因诊断有着截然不同的特点:①直接诊断的对象主要是单基因病的患者,目的是获知致病基因的功能性突变,明确患者的病因诊断。而间接诊断的对象主要是家系中的患病高风险个体,家系中的患者则必须有确定的临床诊断,以定义致病基因的单倍型,因此间接基因诊断多用于单基因病的产前诊断或症状前诊断。②直接诊断有机会获知具体的致病性突变,无论在临症诊断、症状前诊断还是产前诊断中都可以得到比较明确的结果,因此在基因诊断中应尽量选择直接诊断。而间接诊断成本较低,耗时较少,在大基因或遗传异质性疾病的诊断中有难以替代的优势。

与此同时,两种诊断方法各有不足。当面对一些新发现的错义突变时,直接诊断难以在短时间内确定基因型与表型的关系,给病因诊断带来一些不确定因素。而间接诊断面临的最大问题是生殖细胞减数分裂时发生致病基因内交换重组,使STR单倍型与未知突变的连锁传递关系遭到破坏,如不能及时被发现,则可能直接导致错误的诊断结果。间接诊断通常应用于大基因的分析,而后者发生基因重组的机会也更多,因此为及时发现基因重组,在间接诊断中应尽量选用基因内分布比较均匀的STR位点。从基因诊断的发展历程看,基因诊断的主要方法一直在间接与直接诊断之间变换,在对疾病致病基因了解非常有限的时期,多采用间接诊断方法,而随着越来越多的致病基因被定位,更多地开始采用直接诊断的方法;随后较大的致病基因与遗传异质性的发现,间接诊断又被作为一种重要的诊断手段。近十年来,随着高通量突变检测技术的突飞猛进,为直接诊断奠定了坚实的技术基础。从总的趋势看,直接诊断始终是单基因病基因诊断追求的目标。

尽管两种诊断方法存在较大差异,但在实际工作中仍有联合应用的例子。如在常染色体显性多囊肾病(autosomal dominant polycystic kidney disease,ADPKD)的诊断中,已明确有两个基因PKD1PKD2的突变均可单独致病,其中PKD1的突变见于85%的患者,PKD2的突变见于15%的患者。作为常染色体显性遗传病,这类家系往往可以见到两个或两个以上的患者,因此在基因诊断中,可以先采用间接诊断的方法,通过连锁分析初步确定家系的致病基因,然后对该基因进行直接诊断。联合应用直接与间接基因诊断的另一种情况是:当致病基因较大,而且检出的突变点较多,一时难以明确致病性突变点时,可以辅以间接诊断的方法,以快速区分家系风险染色体区域,为其他高风险家系成员的诊断或产前诊断提供依据。

2.已知与未知突变诊断

(1)已知突变诊断:

这是一种靶向的基因诊断方法。在进行直接基因诊断时,通过对致病基因的一个或少数几个频繁出现于患者群体的功能性突变进行检测,以尽可能小的成本在短时间内完成基因诊断。常见突变诊断的诊断率取决于被检测突变在患者群体中出现的频率。该诊断方法适用于致病基因有突变热点的单基因病。

(2)未知突变诊断:

当致病基因缺乏明显的突变热点,或者患者被证实未发生常见突变时,在直接基因诊断中可以采取未知突变诊断策略。这类诊断主要在基因功能区的数量有限,预计能够在临床允许的时间与成本范围内完成诊断时采用。目前,随着高通量测序技术的发展与临床应用,已经能一次性地对大基因及遗传异质性单基因病进行罕见突变检测,大大地缩短了直接基因诊断的时间。

在直接基因诊断中,已知与未知突变检测往往是相伴而行的。如β地中海贫血的诊断中,一般先对10余个已知的热点突变进行检测,如患者的突变被证实则达到诊断目的。但约有5%~10%的患者存在其他少见突变,这时就需要继续采用未知突变诊断策略,在整个基因范围内寻找致病突变点。已知突变诊断与未知突变诊断最大的差异在于,前者采用了成本较低且耗时较少的技术手段进行突变检测。相较于后者对基因所有功能区进行突变检测,前者在诊断成本与耗时等方面更符合临床的需要。近年来,随着高通量突变检测技术的发展与检测成本的下降,越来越多的遗传病诊断不再区分已知与未知突变检测。

(二)致病突变分析

在实验室中检出基因突变只是基因诊断的第一步,更重要的是在其中区别出致病的功能性突变,这就是突变性质分析过程。实质是通过分析突变基因型与疾病表型的关系,最终确定致病突变。这一步骤充分体现了基因检测在病因诊断中的价值。突变性质的分析是一个循证的过程,同时涉及生物信息学与实验室两个方面。

1.生物信息学循证

(1)突变数据库核实基因型与表型信息:

对基因检测中发现的突变点,首先需要查询各种突变数据库以获得判断其性质的信息,主要的数据库包括:①人类基因突变数据库(The Human Gene Mutation Database,HGMD)。该数据库于1978年由英国卡迪夫大学医学遗传研究所创建(http://www.hgmd.cf.ac.uk/ac/index.php),1996年发展为一个公共数据库。该数据库集中了公开报道的可引起人类单基因疾病表型的核基因组突变,突变类型包括了单碱基置换、缺失、插入及复杂的基因重排。目前数据库已收集近5000个基因,合计超过12万个基因功能突变的信息。数据库还提供了相关基因的cDNA序列,可以便利地进行基因突变点的定位及判断蛋白质一级结构的改变。在基因诊断中,这是一个重要的突变循证数据库,使用者可利用基因名称、疾病名称或其他数据库的编号进行特定基因突变谱的查询,判断检测中发现的突变是否已被报道,进而通过阅读数据库所列文献,了解既往研究中所发现的突变与表型的关系。②位点特异性突变数据库(Locus-Specific Mutation Databases)。包括各种特定遗传病致病基因突变数据库。这类数据库与HGMD最大的不同在于,其专门针对某一种特定的遗传病,往往是由国外特定遗传病研究领域较领先的研究机构建立,更新速度更快,还包含了许多未经公开报道的突变与遗传多态。其中比较有名的数据库,如荷兰莱顿大学医学中心构建的进行性肌营养不良症突变数据库(http://www.dmd.nl/),加拿大多伦多儿童医院构建的囊性纤维化病突变数据库(http://www.genet.sickkids.on.ca/cftr/app),美国梅奥医学中心构建的成人型多囊肾病突变数据库(http://pkdb.mayo.edu/)等。另外,特定遗传病也可能存在不同机构构建的多个突变数据库。③遗传变异数据库。在基因突变检测中,经常可以发现一些未经报道的基因功能区或剪切位点突变,其中错义突变尤其常见,一个很重要的步骤是排除其为单核苷酸多态性的可能性,因此需要查询遗传变异数据库。1998年创建的美国国立卫生研究院SNP数据库[Database of Single Nuleotide Polymorphisms(dbSNP)]与欧盟全基因组关联研究数据库(GWASCentral)是最重要的两个多态数据库。 其中,dbSNP(http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp)数据库已收集了包括人类在内的超过50个物种近7千万个基因组变异,是基因突变循证中最常被使用的多态数据库。GWASCentral(https://www.gwascentral.org/)数据库偏重于表型研究结果,因此,基因诊断中如需进一步确定基因功能区SNP的效应,可查询该数据库。另外,Hapmap数据库(http://hapmap.ncbi.nlm.nih.gov/cgi-perl/gbrowse/hapmap24_B36/)与千人计划数据库(http://www.1000genomes.org/home)也是判断基因突变性质时重要的信息来源。

(2)跨物种蛋白同源序列的保守性分析:

当所发现的突变经查询各种数据库后确定为新突变,尤其是错义突变时,可进行多物种氨基酸序列的比对,以判断其保守性。该分析的基本思路是:功能上越重要的蛋白,或越重要的蛋白结构域,在进化中越保守,因此在不同物种比较时,可以发现蛋白质一级结构变化越小。通过比对不同物种特定基因突变氨基酸及两侧的序列(http://genome.ucsc.edu,http://blast.ncbi.nlm.nih.gov/Blast.cgi,http://www.megasoftware.net/),可以为突变性质的判断提供重要线索。

(3)蛋白质高级结构比对:

有些基因突变可以通过改变蛋白质的空间结构来影响蛋白功能,通过一些公共软件可以进行初步的推测。如分析突变前后是否有α螺旋、β折叠、β转角、扩展链或无规卷曲结构的改变等,都有利于突变性质的判断。

(4)软件或服务器预测:

包括PolyPhen2(http://genetics.bwh.harvard.edu/pph2/)、SIFT(http://sift.jcvi.org/)、MutPred(http://mutpred.mutdb.org/)、nsSNPAnalyzer(http://snpanalyzer.uthsc.edu/)、Panther(http://www.pantherdb.org/)、PhD-SNP(http://snps.biofold.org/phdsnp/phd-snp.html)及 SNPs&GO(http://snps-and-go.biocomp.unibo.it/snps-and-go/)等,可以对错义突变性质进行一定程度的预测。

2.实验室循证

(1)家系中突变与疾病表型的共分离:

在家系成员中靶向检测新突变。如完全显性的常染色体遗传病家系,分析成员是否符合有突变即为患者、无该突变则无病的特点;如X连锁隐性遗传病家系,男性成员是否符合上述特点;如常染色体隐性遗传病家系,是否家系中突变纯合子都患病等。在该分析中应注意区别不完全显性、外显不全及延迟显性等情况。

(2)突变在群体中的分布:

在群体中,SNP等位基因频率通常超过1%,因此可对非病群体中超过200个等位基因进行分析,以了解其群体频率。如未发现或低于1%,则有可能是功能突变。

(3)突变基因mRNA与蛋白质水平鉴定:

基因突变的致病性既可以表现为mRNA质量的变化,也可以主要表现为蛋白质功能的变化。前者源于一些剪切位点突变、隐匿剪切位点激活突变或基因表达调控位点突变。这些突变有一个共同的特点,就是突变基因mRNA序列或数量发生了较大的改变,可以通过逆转录实验在mRNA水平上获得突变性质的证据。而有一些错义突变,其致病性可能通过改变蛋白空间结构,使其与上下游蛋白结合异常等途径得以显现。因此需要进行蛋白功能实验,以确定突变的致病性。由于后者往往难以满足临床对检测时间与成本的要求,因此在现阶段还不是一个主要的循证手段。

(三)基因检测的适用技术

选择适用的基因检测技术是快速准确地完成基因诊断的前提,其在较大程度上取决于采取何种基因诊断策略。下面简要介绍几种实验室的常用技术及其适用范围。

聚合酶链反应-限制性片段长度多态性检测技术(PCR-RFLP)适用于直接基因诊断中常见点突变的检测,可以迅速地区分野生型与突变型等位基因,从而达到基因诊断的目的。该技术的检测结果需要DNA测序验证。

等位基因特异性寡核苷酸(allele-specific oligonucleotide,ASO)技术适用于直接基因诊断中常见点突变的检测。ASO的点突变检出率依赖于理想的反应条件和引物-模板错配时尽可能少的错配延伸,因此比较容易出现假阳/阴性结果,在临床上的使用受到一定限制。该技术的检测结果也需要DNA测序验证。

聚合酶链反应-单链构象多态性(PCR-single strand conformation polymorphism,PCR-SSCP)检测适用于直接基因诊断中未知罕见突变的筛查。该技术只能提示突变存在的可能性,不能证实突变的位置与性质,必须与其他检测手段如DNA测序并用。近年来,随着具有更高电泳分辨率的毛细管技术的普及,PCR-SSCP对突变的检出率有明显提高。

变性高效液相色谱(denaturing high performance liquid chromatography,DHPLC)适用于直接基因诊断中未知罕见突变的筛查。由于DHPLC技术的突变检出率与PCR片段中突变碱基的位置,以及异源杂合双链从色谱柱上被洗脱的时间及温度等因素有关,其通用性受到一定程度的影响。该技术的检测结果也需要DNA测序验证。

高分辨率熔解曲线分析(high-resolution melting analysis,HRM)适用于直接基因诊断中未知罕见突变的筛查。该技术可以提示突变的存在。HRM技术在突变筛查中其便捷性、灵敏度与特异性均优于DHPLC,并且检测成本较低,耗时较少,在临床中已得到较多的使用。该技术的检测结果也需要DNA测序验证。

Sanger测序(Sanger sequencing)是目前基因突变检测的“金标准”。近年来,随着DNA测序技术的快速发展,常规测序的成本不断降低,为直接基因诊断提供了强有力的技术支持。目前几乎所有突变筛查及高通量突变检测结果均需通过Sanger DNA测序验证。

二代测序(next-generation sequencing,NGS)技术主要包括全基因组测序(whole genome sequencing,WGS)技术与全外显子组测序(whole exome sequencing,WES)技术。 NGS技术主要用于高通量检测基因的单碱基置换、小的缺失或(与)插入等累及较少碱基的变异。遗传病诊断中NGS技术的应用指征包括检测与寻找高度遗传异质性单基因病的致病基因;检测与寻找表型重叠遗传病的致病基因;检测与寻找大基因的致病突变。NGS数据中致病突变的主要特点包括:遗传变异的群体频率<1%~5%;变异类型包括无义突变、终止密码突变、缺失与(或)插入突变、剪切位点突变及错义突变等;变异基因与疾病表型存在明确的相关性。需要注意的是,致病突变需要采用如Sanger测序等方法进一步验证。NGS的优势体现在通过对全基因组,或全外显子组,或预设的特定疾病相关基因群的高通量检测,可以同时获得大量的基因变异信息,为后续致病突变的判断奠定了基础,使病因诊断率显著提高。NGS的局限性包括检测时间较长,费用较高,对突变性质辨析的要求高。

多重连接依赖式探针扩增技术(MLPA)适用于未知基因缺失与重复的高通量检测。除对基因缺失的定性检测外,该技术还具有检测靶点拷贝数的相对定量能力,因此能对基因片段的杂合缺失(缺失携带者)及重复进行判断。

其他基因检测技术还包括适用于已知或突变范围比较确定的基因组缺失与重复检测的DNA印迹(Southern blotting)以及长片段PCR技术(long PCR)等。后者在如α-地中海贫血等病的基因缺失诊断中有成熟的应用。