生命科学工业的形成
由于基因组研究与制药、生物技术、农业、食品、化学、化妆品、环境、能源和计算机等工业部门密切相关,更重要的是基因组的研究可以转化为巨大的生产力,国际上一批大型制药公司和化学工业公司大规模纷纷投巨资进军基因组研究领域,形成了一个新的产业部门,即生命科学工业。
世界上一些大的制药集团纷纷投资建立基因组研究所。Ciba-Geigy和Ssandoz合资组建了Novartis公司,并斥资2.5亿美元建立研究所,开展基因组研究工作。SmithKline公司花1.25亿美元加快测序的进度,将药物开发项目的25%建立在基因组学之上。Glaxo-Wellcome在基因组研究领域投入4,700万美元,将研究人员增加了一倍。 大型化学工业公司向生命科学工业转轨。孟山都公司早在1985年就开始转向生命科学工业。至1997年,该公司向生物技术和基因组研究的投入已高达66亿美元。1998年4月,杜邦公司宣布改组成三个实业单位,由生命科学领头。1998年5月,该公司又宣布放弃能源公司Conaco,将其改造成一家生命科学公司。Dow化学公司用9亿美元购入EliLilly公司40%的股票,从事谷物和食品研究,后又成立了生命科学公司。Hoechst公司则出售了它的基本化学品部门,转项投资生物技术和制药。 传统的农业和食品部门也出现了向生物技术和制药合并的趋势。GenzymeTransgenics公司培养出的基因工程羊能以较高的产量生产抗凝血酶III,一群羊的酶产量相当于投资1.15亿美元工厂的产量。据估计,转基因动物生产的药物成本是大规模细胞培养法的十分之一。一些公司还在研究生产能抗骨质疏松的谷物,以及大规模生产和加工基因工程食品。 能源、采矿和环境工业也已在分子水平上向基因组研究汇合。例如,用产甲烷菌Methanobacterium作为一种新能源。用抗辐射的细菌Deinococcusradiodurans清除放射性物质的污染,并在转入tod基因后,在高辐射环境下清除多种有害化学物质的污染。 功能基因组学
人类基因组计划当前的整体发展趋势是什么?一方面,在顺利实现遗传图和物理图的制作后,结构基因组学正在向完成染色体的完整核酸序列图的目标奋进。另一方面,功能基因组学已提上议事日程。人类基因组计划已开始进入由结构基因组学向功能基因组学过渡、转化的过程。在功能基因组学研究中,可能的核心问题有:基因组的表达及其调控、基因组的多样性、模式生物体基因组研究等。 基因组的表达及其调控
一个细胞的基因转录表达水平能够精确而特异地反映其类型、发育阶段以及反应状态,是功能基因组学的主要内容之一。为了能够全面地评价全部基因的表达,需要建立全新的工具系统,其定量敏感性水平应达到小于1个拷贝/细胞,定性敏感性应能够区分剪接方式,还须达到检测单细胞的能力。近年来发展的DNA微阵列技术,如DNA芯片,已有可能达到这一目标。 研究基因转录表达不仅是为了获得全基因组表达的数据,以作为数学聚类分析。关键问题是要解析控制整个发育过程或反应通路的基因表达网络的机制。网络概念对于生理和病理条件下的基因表达调控都是十分重要的。一方面,大多数细胞中基因的产物都是与其它基因的产物互相作用的;另一方面,在发育过程中大多数的基因产物都是在多个时间和空间表达并发挥其功能,形成基因表达的多效性。在一个意义上,每个基因的表达模式只有放到它所在的调控网络的大背景下,才会有真正的意义。进行这方面的研究,有必要建立高通量的小鼠胚胎原位杂交技术。 2)蛋白质组学研究
蛋白质组学研究是要从整体水平上研究蛋白质的水平和修饰状态。目前正在发展标准化和自动化的二维蛋白质凝胶电泳的工作体系。首先用一个自动系统来提取人类细胞的蛋白质,继而用色谱仪进行部分分离,将每区段中的蛋白质裂解,再用质谱仪分析,并在蛋白质数据库中通过特征分析来认识产生的多肽。 蛋白质组研究的另一个重要内容是建立蛋白质相互关系的目录。生物大分子之间的相互作用构成了生命活动的基础。组装基因组各成分间的详尽作图已在T7噬菌体(55个基因)获得成功。如何在模式生物(如酵母)和人类基因组的研究中建立自动方法,认识不同的生化通路,是值得探讨的问题。 3)生物信息学的应用
目前,生物信息学已大量应用于基因的发现和预测。然而,利用生物信息学去发现基因的蛋白质产物的功能更为重要。模式生物体中越来越多的蛋白质构建编码单位被识别,无疑为基因和蛋白质同源关系的搜寻和家族的分类提供了极其宝贵的信息。同时,生物信息学的算法、程序也在不断改善,使得不仅能够从一级结构,也能从估计结构上发现同源关系。但是,利用计算机模拟所获得的理论数据,还需要经过实验经过的验证和修正。 基因组多样性的研究
人类是一个具有多态性的群体。不同群体和个体在生物学性状以及在对疾病的易感性与抗性上的差别,反映了进化过程中基因组与内、外部环境相互作用的结果。开展人类基因组多样性的系统研究,无论对于了解人类的起源和进化,还是对于生物医学均会产生重大的影响。
1)对人类DNA的再测序
可以预测,在完成第一个人类基因组测序后,必然会出现对各人种、群体进行再测序和精细基因分型的热潮。这些资料与人类学、语言学的资料项结合,将有可能建立一个全人类的数据库资源,从而更好地了解人类的历史和自身特征。另外,基因组多样性的研究将成为疾病基因组学的主要内容之一,而群体遗传学将日益成为生物医药研究中的主流工具。需要对各种常见多因素疾病(如高血压、糖尿病和精神分裂症等)的相关基因及癌肿相关基因在基因组水平进行大规模的再测序,以识别其变异序列。 2)对其它生物的测序
对进化过程各个阶段的生物进行系统的比较DNA测序,将揭开生命35亿年的进化史。这样的研究不仅能勾画出一张详尽的系统进化树,而且将显示进化过程中最主要的变化所发生的时间及特点,比如新基因的出现和全基因组的复制。 认识不同生物中基因序列的保守性,将能够使我们有效地认识约束基因及其产物的功能性的因素。对序列差异性的研究则有助于认识产生大自然多样性的基础。在不同生物体之间建立序列变异与基因表达的时空差异之间的相关性,将有助于揭示基因的网络结构。
开展对模式生物体的研究
1)比较基因组研究
在人类基因组的研究中,模式生物体的研究占有极其重要的地位。尽管模式生物体的基因组的结构相对简单,但是它们的核心细胞过程和生化通路在很大程度上是保守的。这项研究的意义是:1〕有助于发展和检验新的相关技术,如大规模测序、大规模表达谱检验、大规模功能筛选等;2〕通过比较和鉴定,能够了解基因组的进化,从而加速对人类基因组结构和功能的了解;3〕模式生物体间的比较研究,为阐明基因表达机制提供了重要的线索。
目前对于基因组总体结构组成方面的知识,主要来源于模式生物体的基因组序列分析。通过对不同物种间基因调控序列的计算机分析,已发现了一定比例的保守性核心调控序列。根据这些序列建立的表达模式数据库对破译基因调控网络提供了必要的条件。
2)功能缺失突变的研究
识别基因功能最有效的方法,可能是观察基因表达被阻断后在细胞和整体所产生的表型变化。在这方面,基因剔除方法(knock-out)是一项特别有用的工具。目前。国际上已开展了对酵母、线虫和果蝇的大规模功能基因组学研究,其中进展最快的是酵母。欧共体为此专门建立了一个称为EUROFAN(EuropeanFunctionalAnalysisNetwork)的研究网络。美国、加拿大和日本也启动了类似的计划。 随着线虫和果蝇基因组测序的完成,将来也可能开展对这两种生物的类似性研究。一些突变株系和技术体系建立后,不仅能够成为研究单基因功能的有效手段,而且为研究基因冗余性和基因间的相互作用等深层次问题奠定了基础。小鼠作为哺乳动物中的代表性模式生物,在功能基因组学的研究中展有特殊的地位。同源重组技术可以破坏小鼠的任何一个基因,这种方法的缺点是费用高。利用点突变、缺失突变和插入突变造成的随机突变是另一中可能的途径。对于人体细胞而言,建立反义寡核苷酸和核酶瞬间阻断基因表达的体系可能更加合适。蛋白质水平的剔除术也许是说明基因功能最有力的手段。利用组合化学方法有望生产出化学剔除试剂,用于激活或失活各种蛋白质。 总之,模式生物体的基因组计划为人类基因组的研究提供了大量的信息。今后,模式生物体的研究方向是将人类基因组8~10万个编码基因的大部分转化为已知生化功能的多成分核心机制。而要获得酶一种人类进化保守性核心机制的精细途径,以及它们的紊乱导致疾病的各种途径的知识,将只能来自对人类自身的研究。 通过功能基因组学的研究,人类最终将将能够了解哪些进化机制已经确实发生,并考虑进化过程还能够有哪些新的潜能。一种新的解答发育问题的方法可能是,将蛋白质功能域和调控顺序进行重新的组合,建立新的基因网络和形态发生通路。也就是说,未来的生物科学不仅能够认识生物体是如何构成和进化的,而且更为诱人的是产生构建新的生物体的可能潜力。
人类基因组计划大事记
1990年10月,国际人类基因组计划启动。
1999年9月,中国获准加入人类基因组计划。
1999年12月1日,人类首次成功地完成人体染色体基因完整序列的测定。 2000年4月底,中国科学家完成1%人类基因组的工作框架图。
2000年5月8日,由德国和日本等国科学家组成的国际科研小组宣布,他们已基本完成了人体第21对染色体的测序工作。
2000年6月26日,六国科学家公布人类基因组工作框架图。
2001年8月26日,中国提前两年完成1%人类基因组测序任务。
2003年4月15日,六个国家共同宣布人类基因组序列图完成。