Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~footkicker/t2_files/align.html
Дата изменения: Fri Nov 25 16:40:11 2005
Дата индексирования: Tue Oct 2 12:38:15 2012
Кодировка: Windows-1251
Глобальное и локальное выравнивание аминокислотных последовательностей На главную страницу второго семестра

Матрицы переходов

Глобальное выравнивание

  • Матрица переходов строилась для двух последовательностей. Одна последовательность (SKIV) состоит из первых четырех аминокислотных остатков белка ENO_ECOLI. Вторая последовательность (SKAIC) получена из первой с помощью замены двух остатков и последующей вставки одного произвольного остатка.
  • Параметры построения матрицы переходов:
    вес совпадения = 2
    вес замены = -1
    штраф за делецию = -2
  • Выравнивание, соответствующее оптимальному пути:
    Seq1  SK-IV
          || |
    Seq2  SKAIC    
    
    На картинке оно выделено красным цветом.
  • Вес оптимального пути равен 3. Это говорит о том, что данные последовательности очень близки по аминокислотному составу. Впрочем, достаточно взглянуть на картинку, чтобы это понять, так как оптимальный путь проходит почти по главной диагонали.

Локальное выравнивание

  • Матрица переходов строилась для следующих последовательностей:
    1)Первые 9 остатков (SKIVKIIGR) белка ENO_ECOLI.
    2)Вторая, третья, седьмая, восьмая и девятая (KIIGR) аминокислоты белка ENO_ECOLI.
  • Параметры построения матрицы переходов:
    вес совпадения = 2
    вес замены = -1
    штраф за делецию = -2
  • Выравнивания, соответствующие:
    1) Оптимальному пути
    Seq1  5 KIIGR 9
            |||||
    Seq2  1 KIIGR 5
    
    Показано красным цветом.
    2) Субоптимальному пути
    Seq1  2 KI 3
            || 
    Seq2  1 KI 2
    
    Показано зеленым цветом.
  • Вес оптимального пути равен 10, а субоптимального — 4. Интересно заметить, что достигается максимально возможное значение (10) веса выравнивания для оптимального пути при данных параметрах(значения весов и количество аминокислот в последовательностях). Это объясняется очень просто: вторая аминокислота совпадает с пятой, а третья — с шестой. :)))

Влияние параметров на глобальное выравнивание

С помощью программы Needle из пакета EMBOSS были построены 3 глобальных выравнивания с разными параметрами: со штрафом 10, 5 и 1 соответственно за открытие делеции и со штрафом 1 за продолжение делеции.
Объекты выравнивания:
Первые два выравнивания в точности совпадают, а третье отличается.
Ниже приведены первое и третье выравнивания.
ENO_ECOLI          1 SKIVKIIGREIIDSRGNPTVEAEVHLEGGFVGMAAAPSGASTGSREALEL     50
                                                                       
posledovat         1                                                         0

ENO_ECOLI         51 RDGDKSRFLGKGVTKAVAAVNGPIAQALIGKDAKDQAGIDKIMIDLDGTE    100
                                                                       
posledovat         1                                                         0

ENO_ECOLI        101 NKSKFGANAILAVSLANAKAAAAAKGMPLYEHIAELNGTPGKYSMPVPMM    150
                                                                       
posledovat         1                                                         0

ENO_ECOLI        151 NIINGGEHADNNVDIQEFMIQPVGAKTVKEAIRMGSEVFHHLAKVLKAKG    200
                                                                       
posledovat         1                                                         0

ENO_ECOLI        201 MNTAVGDEGGYAPNLGSNAEALAVIAEAVKAAGYELGKDITLAMDCAAS-    249
                                                               .:|...: 
posledovat         1                                           IIDSRGNP      8

ENO_ECOLI        250 --EFYKDGKYVLAGEGNKAFTSEEFTHFLEELTKQYPIVSIEDGLDESDW    297
                       |||||||||||||                                   
posledovat         9 TVEFYKDGKYVLAGE                                        23

ENO_ECOLI        298 DGFAYQTKVLGDKIQLVGDDLFVTNTKILKEGIEKGIANSILIKFNQIGS    347
                                                                       
posledovat        24                                                        23

ENO_ECOLI        348 LTETLAAIKMAKDAGYTAVISHRSGETEDATIADLAVGTAAGQIKTGSMS    397
                                                                       
posledovat        24                                                        23

ENO_ECOLI        398 RSDRVAKYNQLIRIEEALGEKAPYNGRKEIKGQA    431
                                                       
posledovat        24                                        23

Параметры выравнивания:
  • Матрица весов аминокислотных замен — BLOSUM62.
  • Штраф за открытие делеции — 10.0.
  • Штраф за продолжение делеции — 1.0.
ENO_ECOLI          1 SKIVKIIGREIIDSRGNPTVEAEVHLEGGFVGMAAAPSGASTGSREALEL     50
                                                                       
posledovat         1                                                         0

ENO_ECOLI         51 RDGDKSRFLGKGVTKAVAAVNGPIAQALIGKDAKDQAGIDKIMIDLDGTE    100
                                                                       
posledovat         1                                                         0

ENO_ECOLI        101 NKSKFGANAILAVSLANAKAAAAAKGMPLYEHIAELNGTPGKYSMPVPMM    150
                                                                       
posledovat         1                                                         0

ENO_ECOLI        151 NIINGGEHADNNVDIQEFMIQPVGAKTVKEAIRMGSEVFHHLAKVLKAKG    200
                                                                       
posledovat         1                                                         0

ENO_ECOLI        201 MNTAVGDEGGYAPNLGSNAEALAVIAEAVKAAGYELGKDITLAMDCAASE    250
                                            :| :: :      |.. |  :     |
posledovat         1                        II-DS-R------GNP-T--V-----E     11

ENO_ECOLI        251 FYKDGKYVLAGEGNKAFTSEEFTHFLEELTKQYPIVSIEDGLDESDWDGF    300
                     ||||||||||||                                      
posledovat        12 FYKDGKYVLAGE                                           23

ENO_ECOLI        301 AYQTKVLGDKIQLVGDDLFVTNTKILKEGIEKGIANSILIKFNQIGSLTE    350
                                                                       
posledovat        24                                                        23

ENO_ECOLI        351 TLAAIKMAKDAGYTAVISHRSGETEDATIADLAVGTAAGQIKTGSMSRSD    400
                                                                       
posledovat        24                                                        23

ENO_ECOLI        401 RVAKYNQLIRIEEALGEKAPYNGRKEIKGQA    431
                                                    
posledovat        24                                     23

Параметры выравнивания:
  • Матрица весов аминокислотных замен — BLOSUM62.
  • Штраф за открытие делеции — 1.0.
  • Штраф за продолжение делеции — 1.0.
Два данных выравнивания довольно сильно отличаются. При штрафе за открытие делеции, равном 10, вторая последовательность не разделена гэпами. К тому же выравнивание происходит по участку большей длины (то есть второму), а первый участок находится рядом со вторым. При штрафе, равном 1, вторая последовательность оказывается разделенной несколькими гэпами, и если аминокислоты стоят друг под другом, то они в большинстве своем совпадают.
Различия в выравнивании объясняются легко. При большом штрафе за открытие делеции (10) этих самых делеций очень мало, потому что если бы их было много, то вес выравнивания очень сильно бы уменьшился. Ну а когда штрафы за открытие и продолжение делеции равны, то количество делеций мало влияет на вес выравнивания. Поэтому их гораздо больше, чем в первом случае.
Но! Ни одно из выравниваний не дает правильного результата (и даже близкого к правильному). Почему? Дело, конечно, не в несовершенстве программы Needle, а в том, что вторая последовательность выбрана случайно. Если бы мы брали последовательности из белков-гомологов, то тогда результат был бы правильным (или хотя бы хорошим).


© Кривошей Александр, 2005