方法介绍
定位克隆首先是获取基因在染色体上的位置的信息,然后采用各种实验方法克隆基因和进行定位。基因的定位克隆策略大体上可以分成四个步骤。
①通过家系连锁分析资料或染色体微小缺失(杂合性丢失,LOH)等数据,确定基因在染色体上的位置;
②通过染色体步移(chromosomewalking)、染色体区带显微切割等技术,获得基因所在区段的DNA片段叠连群(contig),绘制出更精细的染色体图谱;
③确定含有候选基因的染色体片段;
④从这些片段中进一步筛选目的基因,并作突变检测验证和功能分析。
重要地位
当前,人类基因组研究的重心正在由“结构”向“功能”转移,一个以基因组功能研究为主要内容的所谓“后基因组时代”(post-genomics),也即功能基因组(functionalgenomics)时代,即将到来。如何获取基因的功能信息,即与人类重大疾病和重要生理功能相关的基因信息,就摆在了我们面前。定位候选克隆策略(positionalcandidatecloning)是传统定位克隆(positionalcloning)的改进和发展,并以其在克隆疾病相关基因中的有效性而日益受到重视。
人类基因组计划已确定了一系列分布于全基因组24条染色体上的分子标记。根据这些分子标记的序列和定位信息,结合杂交或PCR的方法可以快速检测染色体上与肿瘤或遗传性疾病相关的热点位置,进而从中克隆疾病相关基因。定位候选克隆克服了经典的定位克隆纯粹依靠连锁分析进行染色体定位的繁冗而缓慢的弊端,大大加快了克隆工作的进程,而且它也不仅仅局限于遗传病,现在已更多地运用于肿瘤易感基因的克隆工作。
1994年国际上开始构建并于1996年首次公布的基因图谱是一个以cDNA为基础的STS(sequence-taggedsite)标记的物理图和多态性微卫星标记的遗传图相结合的图谱,它一方面使染色体定位更加准确、可靠、精密,同时为从候选区域内获得疾病相关的候选基因提供了极大的便利,使得目的基因的克隆更加简便而快捷,为这种方法的发展和应用注入了更大的活力,表现为此后相继克隆出16条新的疾病相关基因,如从胰腺癌中分离得到的抑癌基因DPC4等。1998年10月GeneBank公布了最新的“基因图谱98”,它的信息量更大,且准确度和精确度都有大幅度的提高,包含有41464个STS标记,代表了30181条基因的定位信息,也即完成了人的全部基因组约6万~7万条基因中的一半左右的定位工作。总之,随着人类基因组计划的推进,定位候选克隆已成为一种有效的克隆疾病相关基因的方法。
基本步骤
综述
定位候选克隆包括三个基本步骤:基因组定位、候选cDNA的获得、全长及功能分析。本文即对此策略的发展和应用作一概要介绍。
基因组定位
新发展起来的,尤其在分离肿瘤易感基因中常用的方法是用PCR方法检测多样本的杂合性丢失(LOH)或纯合性丢失的高发频率区,从而获得疾病候选基因定位。体细胞抑癌基因的失活是导致癌变的一个主要因素,最常见的表现即杂合性缺失。通常在染色体上杂合性缺失的高发频率区含有一个或多个抑癌基因。利用散布于各条染色体上的分子标记(包括STS、微卫星标记等),用PCR检测多个肿瘤样本的染色体各区带的缺失情况,可确定LOH的高发频率区,也即确定了相关肿瘤生长负调控因子的染色体定位,并可精确到基因组分子标记指示的区域,进一步可作基因的克隆工作。利用这一方法已成功地克隆了几个抑癌基因,如乳腺癌中的BRCA1、BRCA2及胰腺癌中的DPC4基因等。同时,FISH技术的不断发展及推广应用,染色体显微切割技术的成熟,可在显微镜下切割特定的染色体区带,制备染色体区带特异探针,对正常和病变组织作FISH分析,比较确定疾病相关基因的染色体区带定位。近些年来,RH谱(radiationhybridmap)的建立,使染色体精细定位成为可能。这些方法比原先连锁分析的检测速度更快、精确度更高。例如L-CTsui用连锁分析花费了大约10年的时间才把囊性纤维变性基因定位在7号染色体,而现在可能只要一年或更短的时间就可完成这项工作。
候选cDNA的获得
基因组定位提供的信息包含一定的分子标记,可用PCR或杂交的方法直接从YAC(yeastartificialchromosome)库,或从BAC(bacterialartificialchromosome)库、PAC(P1artificialchromosome)库中筛选相对应的克隆。YAC库的嵌合性严重且操作难度较大,已逐步为PAC库和BAC库取代。PAC系统是以噬菌体P1为基础的克隆系统,它可容纳70~100kb的插入片段,并可选择性地区分重组子和非重组子,且同时有两套复制机制。单拷贝复制子可用于稳定克隆增殖,而多拷贝复制子则可在Lac操纵子的控制下用于DNA的制备。BAC系统是基于大肠杆菌中可大容量容纳基因且稳定性良好的F因子衍生而来的载体系统,可容纳超过100kb的插入片段,BAC克隆的插入片段的平均长度为120kb,最大可达到240kb左右。良好的稳定性和操作的简便性是BAC系统的主要优点。由这些克隆入手,采用依赖于适当cDNA文库的方法、依赖于特征序列的方法或依赖于表达性质等方法获得候选cDNA。
全长及功能分析
获得了众多的候选cDNA后,通过筛选cDNA文库或RACE等方法克隆全长基因。为确定其中的致病基因,需要逐个检测它们在患病家系中的变化情况,并分析其功能。功能分析往往是定位克隆中的一个难点,因为不同的疾病有不同的特征,也就需要用不同的功能检测系统进行分析。常用的如细胞水平的正义或反义基因的表达后细胞形态和功能变化的研究,在肿瘤研究中检测细胞形态和接触抑制的变化,软琼脂生长能力的变化及裸鼠致瘤性分析等。更进一步的功能分析则包括个体水平的基因敲除实验等。
现在还发展出了一些与其它方法相结合的新思路,如与差减杂交相结合,筛选位于候选区域的差异表达基因,大大提高了获得有价值基因的可能性。同时人类基因组计划中转录图谱〔15〕工作的开展,有很多EST已被精确定位于染色体的不同区带上,可以直接进行功能研究。随着研究的深入,越来越多的EST定位工作的完成,基因转录图谱的不断完善,我们完全可以直接跳过定位克隆的第二个步骤而直接进入功能鉴定和基因全长的克隆工作,这可能将是定位克隆中最快的方法。在分析分离手段不断提高,人类基因组计划紧锣密鼓地实施的今天,各种新思路新方法层出不穷,定位克隆方法的周期也将不断缩小,为人类最终克隆各种疾病基因提供了可能性。
筛选方法
直接筛选法依赖适当cDNA文库的方法有直接筛选法和cDNA选择法(cDNAselection)。直接筛选法即用基因组DNA直接从cDNA文库中筛选位于该基因组片段内的cDNA,如从覆盖有候选区域的YAC、PAC、BAC克隆中分离外源片段作为探针从文库中筛选候选基因;而cDNA选择法恰恰与直接筛选法相反,它把基因组DNA固定在膜上,用总cDNA与之杂交,通过PCR从中回收可与基因组片段结合的cDNA片段。直接筛选法的优点在于避免了对候选区域大片段地亚克隆操作,且在单一的筛选中可以获得多个转录子的信息。但缺点是大片段地纯化,标记较困难,而PAC、BAC克隆片段纯化相对方便的优点就成为这种方法发展的趋势;同时由于探针的复杂性,使杂交背景加深,假阳性增多,而且容易忽略短的外显子或低丰度cDNA。cDNA选择法的最大优越性在于PCR反应的介入,大大提高了选择的灵敏度,可以检测到一些稀有转录子。
表达依赖法也即Northern杂交分析法。用候选区域基因组DNA作为探针与总RNA杂交,切下阳性条带,反转录为cDNA并克隆,即可获得位于此基因组片段中的转录子。
上述方法都各有其优缺点,必须根据原材料及要达到的目的,选择适当的一种或多种方法组合来达到研究目的。此外,其它方法还很多,如微切割和微克隆法、减法cDNA杂交法、重组筛选法等。
依赖特征序列依赖特征序列的方法是依据转录子内部及其两侧的序列特征直接从基因组DNA中分离cDNA片段,主要有CpG岛搜寻法、外显子捕获法(exontrapping)、交叉物种序列同源性比较法(cross-speciessequencehomology)、AluPCR法与直接序列分析法等。CpG岛也称为HTF岛,是一些富含GC的小区域。大部分转录子的附近(通常是在5′上游区域)都含有非甲基化的CpG岛。利用一些识别CpG岛的稀有酶,如SacⅡ、BssHⅡ、EagⅠ等,切割基因组DNA,获得位于CpG岛附近的序列作为探针从总RNA或cDNA文库中得到转录子。外显子捕获法是基于对外显子两侧的功能性5′和3′剪接位点的识别,从基因组DNA中分离外显子片段。交叉物种序列同源性比较的依据是编码区序列在不同物种间的保守性要远高于非编码区,把候选区域的DNA分为多个亚克隆,分别与不同的物种总DNA杂交,与不同物种DNA都有阳性信号的DNA克隆可能就是编码区基因。这种方法依赖的是物种间DNA水平上的序列同源性。Alu序列是散布于人基因组中的短的重复序列,通过设计人特异的Alu序列作为引物,可直接快速用PCR方法从YAC、BAC、PAC克隆或人鼠杂合细胞中得到人源的特异序列。直接序列分析法则在基因组序列信息中用GRAIL和GeneScan等软件分析推测编码基因的方法。