第二节 单倍型图绘制

本节介绍使用标签研究单倍型图的整体框架。简言之,它包括从研究人群中确定候选基因单倍型结构,标签的选择和临床资料的基因分型标签。Weale等人运用这种方法研究神经元钠通道基因SCN1A,发现仅仅五个标签就足以代表常见的基因变异。
一、确定单倍型结构和选择标签SNPs
首先,第一步在关联研究中通过对研究人群进行基因测序,运用标签确定对照组候选基因的基本单倍型结构。虽然Weale等人在两个研究人群中发现五个相同的标签足以说明两人群存在常见的基因变异,但是如果群体间的主要单倍型不同,那么对应的标签也不同。使用singleton material或trios(后者具有检查错误的优势)进行基因测序时,除了考虑编码区,还需考虑内含子和扩展的调控区域。
一旦单倍型结构确定了,必须选择对应的标签SNP。标签的选择在单倍型研究中起重要作用。在某些情况下(如非常小的基因),可能可以通过肉眼识别标签。但对于大多数基因,特别是大量的基因和或者需考虑调控区域时,就必须使用正式的统计标准。最近我们引进了TagIT程序(见http://popgen.biol.ucl.ac.uk/),该程序运行在MATLAB编程环境下,可计算出大量的统计学标准,用于从trios获得的基因型数据及已知的单倍型频率的基础上选择和评估标签。另一种程序(见David Clayton’s website http://www-genc.cimr.cam.ac.uk/clayton/software/)通过对标签的统计评估以确保覆盖未分型的基因数据。此外,重要的是在重复试验时,选择足够多的标签以评价这些标签是否能够较好地代表未选定的SNPs。最后,标签在临床资料中分型。为获得小效应的基因变异,必须进行大型人群研究。
二、检查人群分层
理论上为了避免可能的分层效应,应该检查所有的关联对结果的影响。虽然分层的一般重要性仍然未知,但分层可导致错误的关联,并造成在病例对照组中一些矛盾和不可重复的结果。如在分层研究中出现新的重要关联位点与影响结果的位点无关,要考虑在分组间存在频率差别的现象。Genome Control是一种控制分层的方法,该方法是基于假设分层存在的基础上,除了分析候选基因标签的关联性外,也增加其他无联系的标签的关联性。运用Genome Control检测分层时,包括在病例组和对照组中对无关联的标记进行基因分型。关联程度的量化完全取决于人群的分层和对分层的校正。只有一些标签需要使用这种方法,这使大多数研究易于进行。这将有助于在检测分层中开发标签的标准品。另一种名为结构性关联的方法主要用于对分组的统计鉴定和对支持鉴定分组关联性证据的有效评价。
三、评估人群结构
一个基因结构人群是由两个或多个具有分布差异的基因突变的亚群构成。许多的遗传变异包括在种群间药物代谢酶的基因多态和药物靶点的基因多态(表2-1)的频率差异。这可能影响在不同人群中药物的平均疗效、毒性和最适剂量。例如,在两个大规模随机试验中,ACEI依那普利被证明与非洲裔人群比较,在高加索患者中疗效较低。基于这些研究结果,评价药物时,描述人群结构显得至关重要。目前有两种主要策略:种族标签和明确的遗传推理。
标记民族或种族时,使用种族标签来描述人类遗传变异的结构。Risch等人基于欧洲大陆世系提出五种主要种族人群。虽然这种方法易于实现,但它是在假定人类基因历史相对简单的基础上。明确的遗传推理忽略地域、种族或民族的标签,而是利用基因组数据评估人群。例如,Wilson等人使用明确的遗传推理通过对39个无关联的微卫星位点的分析从全球八个种群354人中分出四个不同的基因群。目前还不清楚是否Risch等人提出的方案足以代表人类临床试验中的遗传结构。
四、候选基因和途径
使用标签绘制大量基因的单倍型图时需充分考虑经济的因素。过去传统的候选基因研究的出发点是研究药物的直接靶蛋白或与药物直接相关的其他因素(如药物代谢酶)。现在的研究扩展到编码一条特定通路上的所有组件的基因。此外,单倍型框架可以测定不同基因组合成的不同单倍型的相互作用。
肾素血管紧张系统(RASS)是一种多基因通路,它是心血管药物如ACEI、AT1受体拮抗剂和一些β受体拮抗剂的作用靶点。据统计需20~30个蛋白参与ACEI的反应并最终产生生理学效应,而大多数RASS遗传药理学研究集中于单个基因的SNPs或单个SNP。所以不同研究得出的不同的结果就不足为奇了。
一项ACE、AT1受体和血管紧张素原基因组合的45个基因多态与ACEI反应的关联研究中,支持了RASS是个多基因途径的观点。研究发现十个SNPs的组合比单个SNP能更好预测药物的反应。通过增加该途径上的基因数量和使用标签可提高模型的预测能力。
五、候选基因法vs全基因扫描法
采用单倍型标签SNPs的候选基因研究提供了一个更为经济的方法来获得影响药物反应的常见变异,特别是在研究中,考虑只需要确定研究人群的单倍型结构的研究方法会节省大量的研究成本。一旦合适的候选基因确定,很多心血管药物的生物学行为就容易理解。遗憾的是在大多数甚或所有情况下,候选基因的名单是不完整的,需在全基因组范围内确定。
全基因组关联分析(genome-wide association study)指在全基因组范围筛选出与疾病相关的序列变异。GWAS将在患者全基因组范围内检测出的SNP位点与对照组进行比较,从而避免了像候选基因策略一样需要预先假设致病基因。GWAS研究让我们找到了许多从前未曾发现的基因以及染色体区域,为复杂疾病的发病机制提供了更多的线索。
为了彻底筛选全基因组,就必须充分描述含连锁不平衡的全基因组模式。国际人类基因组单体型图计划(International HapMapProject)是个国际性的项目,它致力于构建全基因组的单倍型图。HapMap Project提出确定一个全基因组标签集的建议,但该标签集是建立在尚未定义的标准的基础上。Gabriel等人估计一项关于非洲人群的全基因组关联研究需100万个SNPs,而非非洲人群则需30万个SNPs。当然实际的数字取决于使用的标准。应当指出,即使标签能为全基因组所用,全基因组扫描的成本仍然非常昂贵,除非基因分型的成本大幅度降低。在筛选全基因组的过程中进行多重比较的调整将大幅减低研究的效果。基于这些原因,在许多情况下,研究者仍将重点放在具有活跃生物学行为的候选基因。候选基因法还有一个好处,就是不需要进行多重比较的关联研究和全基因分析。因此,当已知合适的候选基因时,应首先进行候选基因分析。
六、健康受试者研究的框架
遗传药理学的关联研究通常关注的是患者。在大多数情况下,健康受试者的药物反应的关联研究给临床研究提供了重要的补充。例如,考虑到候选基因的数量多和基因之间可能的相互作用,需扩大样本量以包括每个具有代表性的多位点基因型,但往往是不可能收集足够多患者的临床表型数据。
健康人作为受试者的主要好处是可以获得大量的研究人群,可以筛选大量的受试者和单倍型组合的探针。这也有利于具有功能意义的变异位点的精确定位。精确定位的方法需大量研究人群和少见的重组单倍型,探讨重组单倍型和具有功能意义的变异的关联性。与复杂的病例研究相比,健康人作为受试者可以最大程度减少环境因素的影响,如药物相互作用,器官功能受损,并发症等,还可以将其他环境因素与受试者进行匹配,如年龄或生活方式。
在药物代谢途径的研究中,健康人作为受试者也具有明显的优势。已知约50%处方药经细胞色素P450酶CYP3A4代谢,包括治疗心血管疾病的药物,如某些钙通道阻滞剂、抗心律失常药和调血脂药。在代谢率上,很多药物代谢酶出现相当大的个体间差异。选择合适的探药,在健康受试者中进行药物代谢表型与单倍型的关联研究将成为可能。显然,并不是所有药物的靶点研究都适合选用健康受试者,但给予健康受试者单剂量β受体拮抗剂(心血管药物)是相对安全的。