Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Try2Fly/t2_files/align.html
Дата изменения: Mon Dec 19 10:45:10 2005
Дата индексирования: Tue Oct 2 10:45:24 2012
Кодировка: Windows-1251
Глобальное и локальное выравнивание аминокислотных последовательностей

Глобальное и локальное выравнивание аминокислотных последовательностей.

Матрицы переходов:
  • Глобальное выравнивание:
   Здесь представлено глобальное выравнивание двух аминокислотных последовательностей. Первая, M-F-R-K, представляет собой 4 начальных аминокислотных остатка белка AQPZ_ECOLI. Вторая, Q-F-A-R-L, была получена из первой путем введения двух произвольных замен (M->Q; K->L) и одной вставки ( FR->FAR).
   Выравнивание было построено с помощью матрицы переходов, параметры матрицы: вес совпадения = 2, вес замены = -1, штраф за делецию = -2.

Матрица переходов данного выравнивания
(темно-серым выделен оптимальный путь):

   В итоге было получено следующее глобальное выравнивание, с весом, равным 0:
M F - R K
. |   | .
Q F A R L
  • Локальное выравнивание:
   Здесь находится локальное выравнивание двух аминокислотных последовательностей. Первая, M-F-R-K-L-A-A-E-C-, представляет собой 9 первых аминокислотных остатков белка AQPZ_ECOLI. Вторая, F-R-A-E-C, составлена из остатков под номерами 2, 3, 7, 8, 9 того же белка.
   Выравнивание было построено с помощью матрицы переходов, параметры матрицы: вес совпадения = 2, вес замены = -1, штраф за делецию = -2.

Матрица переходов данного выравнивания
(синим выделен оптимальный путь, темно-серым - субоптимальный):

   На основе этой матрицы было получено два локальных выравнивания - оптимальное, с весом, равным 6:
A E C
| | |
A E C
и субоптимальное с весом 4:
F R 
| | 
F R 
Влияние параметров на глобальное выравнивание:

   Ниже представлены два глобальных выравнивания построенных программой needle для белка AQPZ_ECOLI и последовательности thirdprot, искусственно "склеенной" из двух небольших фрагментов этого белка.
   В первом случае были установлены следующие параметры: Gap opening penalty (штраф за открытие делеции) = 1; Gap extention penalty (штраф за продолжение делеции) = 1. В результате было получено выравнивание:

AQPZ_ECOLI         1 MFRKLAAECFGTFWLVFGGCGSAVLAAGFPELGIGFAGVALAFGLTVLTM     50

thirdprot          1                                                         0

AQPZ_ECOLI        51 AFAVGHISGGHFNPAVTIGLWAGGRFPAKEVVGYVIAQVVGGIVAAALLY    100
                                   ||||||||||||      | :||   |||     ||
thirdprot          1               AVTIGLWAGGRF------G-LIA---GGI-----LY     21

AQPZ_ECOLI       101 LIASGKTGFDAAASGFASNGYGEHSPGGYSMLSALVVELVLSAGFLLVIH    150
                     :||
thirdprot         22 VIA                                                    24

AQPZ_ECOLI       151 GATDKFAPAGFAPIAIGLALTLIHLISIPVTNTSVNPARSTAVAIFQGGW    200

thirdprot         25                                                        24

AQPZ_ECOLI       201 ALEQLWFFWVVPIVGGIIGGLIYRTLLEKRD    231

thirdprot         25                                     24 

с параметрами:
  • Length (длина выравнивания): 231 аминокисл. остаток
  • Identity (процент идентичности): 9.5%
  • Similarity (процент сходства): 10.4%
  • Gaps (число гэпов): 207 (Needle при подсчете учитывает концевые гэпы, поэтому реальное число гэпов - 15)
  • Score (вес выравнивания): 101.0
   Во втором случае параметры были изменены на: Gap opening penalty = 10; Gap extention penalty = 1:

AQPZ_ECOLI         1 MFRKLAAECFGTFWLVFGGCGSAVLAAGFPELGIGFAGVALAFGLTVLTM     50
                                                                       
thirdprot          1                                                         0

AQPZ_ECOLI        51 AFAVGHISGGHFNPAVTIGLWAGGRFPAKEVVGYVIAQVVGGIVAAALLY    100
                                   ||||||||||||               |::|..:||
thirdprot          1               AVTIGLWAGGRF---------------GLIAGGILY     21

AQPZ_ECOLI       101 LIASGKTGFDAAASGFASNGYGEHSPGGYSMLSALVVELVLSAGFLLVIH    150
                     :||                                               
thirdprot         22 VIA                                                    24

AQPZ_ECOLI       151 GATDKFAPAGFAPIAIGLALTLIHLISIPVTNTSVNPARSTAVAIFQGGW    200
                                                                       
thirdprot         25                                                        24

AQPZ_ECOLI       201 ALEQLWFFWVVPIVGGIIGGLIYRTLLEKRD    231
                                                    
thirdprot         25                                     24

  • Length (длина выравнивания): 231 аминокисл. остаток
  • Identity (процент идентичности): 7.8%
  • Similarity (процент сходства): 9.5%
  • Gaps (число гэпов): 207 ( 15)
  • Score (вес выравнивания): 78