多序列比对

双序列比对是序列分析的基础。然而,对于构成基因家族的成组的序列来说,我们要建立多个序列之间的关系,这样才能揭示整个基因家族的特征.

多序列比对

在阐明一组相关序列的重要生物学模式方面起着相当重要的作用.

多序列比对

有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个简明扼要的了解。与双序列比对一样,

多序列比对

的方法建立在某个数学或生物学模型之上.

因此,正如我们不能对双序列比对的结果得出"正确或错误"的简单结论一样,

多序列比对

的结果也没有绝对正确和绝对错误之分,而只能认为所使用的模型在多大程度上反映了序列之间的相似性关系以及它们的生物学特征.

分类

目前,构建

多序列比对

模型的方法大体可以分为两大类.

第一类

基于氨基酸残基的相似性,如物化性质,残基之间的可突变性等.

第二类

主要利用蛋白质分子的二级结构和三级结构信息,也就是说根据序列的高级结构特征确定比对结果.

差别

两种方法所得结果可能有很大差别。一般说来,很难断定哪种方法所得结果一定正确,应该说,它们从不同角度反映蛋白质序列中所包含的生物学信息.

基于序列信息和基于结构信息的比对都是非常重要的比对模型,但它们都有不可避免的局限性,因为这两种方法都不能完全反映蛋白质分子所携带的全部信息.

蛋白质序列是经过DNA序列转录翻译得到的。从信息论的角度看,它应该与DNA分子所携带的信息更为"接近".而蛋白质结构除了序列本身带来的信息外,还包括经过翻译后加工修饰所增加的结构信息,包括残基的修饰,分子间的相互作用等,最终形成稳定的天然蛋白质结构。因此,这也是对完全基于序列数据比对方法批评的主要原因.

多序列比对的步骤

多序列比对一般通过3个步骤完成:

(1)两两进行双重比对。

(2)生成一系统树图(dendrogram),将序列按相似性大致地分组。

(3)使用系统树图作为引导,产生出最终的多序列比对结果。