多序列比對

雙序列比對是序列分析的基礎。然而,對于構成基因家族的成組的序列來說,我們要建立多個序列之間的關系,這樣才能揭示整個基因家族的特征.

多序列比對

在闡明一組相關序列的重要生物學模式方面起著相當重要的作用.

多序列比對

有時用來區(qū)分一組序列之間的差異,但其主要用于描述一組序列之間的相似性關系,以便對一個基因家族的特征有一個簡明扼要的了解。與雙序列比對一樣,

多序列比對

的方法建立在某個數(shù)學或生物學模型之上.

因此,正如我們不能對雙序列比對的結果得出"正確或錯誤"的簡單結論一樣,

多序列比對

的結果也沒有絕對正確和絕對錯誤之分,而只能認為所使用的模型在多大程度上反映了序列之間的相似性關系以及它們的生物學特征.

分類

目前,構建

多序列比對

模型的方法大體可以分為兩大類.

第一類

基于氨基酸殘基的相似性,如物化性質,殘基之間的可突變性等.

第二類

主要利用蛋白質分子的二級結構和三級結構信息,也就是說根據(jù)序列的高級結構特征確定比對結果.

差別

兩種方法所得結果可能有很大差別。一般說來,很難斷定哪種方法所得結果一定正確,應該說,它們從不同角度反映蛋白質序列中所包含的生物學信息.

基于序列信息和基于結構信息的比對都是非常重要的比對模型,但它們都有不可避免的局限性,因為這兩種方法都不能完全反映蛋白質分子所攜帶的全部信息.

蛋白質序列是經(jīng)過DNA序列轉錄翻譯得到的。從信息論的角度看,它應該與DNA分子所攜帶的信息更為"接近".而蛋白質結構除了序列本身帶來的信息外,還包括經(jīng)過翻譯后加工修飾所增加的結構信息,包括殘基的修飾,分子間的相互作用等,最終形成穩(wěn)定的天然蛋白質結構。因此,這也是對完全基于序列數(shù)據(jù)比對方法批評的主要原因.

多序列比對的步驟

多序列比對一般通過3個步驟完成:

(1)兩兩進行雙重比對。

(2)生成一系統(tǒng)樹圖(dendrogram),將序列按相似性大致地分組。

(3)使用系統(tǒng)樹圖作為引導,產(chǎn)生出最終的多序列比對結果。