Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~maravilla/term2/mnogoaligned.html
Дата изменения: Mon May 18 18:06:23 2009
Дата индексирования: Tue Oct 2 14:24:58 2012
Кодировка: Windows-1251
Множественные выравнивания
Множественные выравнивания

Задание 1 (Ознакомление с программой Muscle)

Для начала нашей задачей является получить невыровненные последовательности дельта-антигенов в формате fasta, что мы и сделаем с помощью UniProt. Для этого воспользуемся системой поиска SRS, где в соответствующих полях (Taxonomy и Description) запишем данные дельта-антигенов. Затем сохраним полученные последовательности в fasta-формате. Просмотрим имеющиеся последовательности с помощью программы GeneDoc:



Файл можно загрузить, если нажать здесь
Глядя на эти последовательности, можно сделать несколько предположений. Во-первых, бросается в глаза часть последовательности с 49 позиции (пролин) по 54 включительно (валин). Такой фрагмент есть во всех последовательностях, поэтому было бы вполне осмысленно как с математической точки зрения, так и с биологической, их выровнять, поставив где-нибудь гэпы в первой, второй и третьей последовательностях, а также с шестой и далее.
Во-вторых, нетрудно обнаружить еще один такой же большой кусочек - в первой последовательности с 100 позиции (D) по 114 - лизин (L).
Есть еще один такой же кусочек довольно большой длины - в первой последовательности с 159 позиции аргинин (R) по 168 пролин (P).
Затем произведем выравнивание данных последовательностей с помощью программы muscle:



Файл с выравниванием лежит тут
Если посмотреть на это выравнивание, то можно обнаружить, что наши предположения оправдались. Кроме того, нашлись еще довольно значимые участки соответствия (с 50 по 55 позиции, с 70 по 74, с 126 по 131 и со 174 по 180 позиции включительно).
В целом, данное выравнивание позволяет заключить, что эти белки являются гипотетическими гомологами.


Задание 2 (Выравнивание набора гомологов своего белка)

Для того, чтобы найти гомологи для белка FDNH_ECOLI, воспользуемся программой BLASTP. Ограничим поиск следующими параметрами: ищем гомологи только среди бактерий (Bacteria); E-value<0.001. Кроме того, процент свходства должен быть не больше 90%.
При таких парметрах поиска получили 34 белка, из них были выбраны 6, не считая самого FDNH_ECOLI. При этом худший среди всех процентов сходства был не меньше 32%, а лучший - 77%. К сожалению, чего-то среднего между этими двумя числами не нашлось. А E-value худшей из находок был равен 3e-09.
Полученный последовательности выравниваем с помощью программы muscle, из полученного файла делаем картинку:



Исходный файл лежит тут
Из произведенного выравнивания видно, что есть несколько участков консервативных позиций, например, 181 по 209.


Задание 3 (Другие программы множественного выравнивания)

Теперь попробуем произвести выравнивания тех же последовательностей с помощью программы mafft.
Для последовательностей вирусных белков "дельта-антигенов" получаем:



Исходный файл - delta_aligned2.fasta
Как мне кажется, эти выравнивания одинаковы. Поэтому логично предположить, что такое выравнивание является оптимальным.
Для последовательностей гомологов белка FDNH_ECOLI получаем:



Этот файл лежит здесь
Нетрудно заметить,что выравнивание гомологов белка FDNH_ECOLI, выполненное с помощью программы muscle немного отличается от выравнивания, выполненного программой mafft. Так, mafft решли выровнять первые метионины, которы muscle не трогал, но биологического смысла этот участок все равно не приобрел.
В целом в обоих случаях сохранились те же выровненные фрагменты,например,позициям со 185 по 212 во втором выравнивании соответствует позиции 181-208 в первом. Но вот участку со 134 по 136 позиции повезло меньше: mafft нашел еще один столбец соответствия а.о. (130-140 позиция). Кроме того, mafft нашел на 94 позиции столбец соответствия, которого не нашел muscle. Впрочем, биологического смысла этот столбец не несет. остальные же фрагменты в обоих случаях остались без изменений.
Вообще оба выравнивания довольно схожи, так так большинство позиций соотнесенных аминоксилотных остатков в первом выранивании сохраняется во втором, хотя и не обязательно на тех же позициях выравнивания. К примеру, позициям 155-157 в первом соответствуют те же а.о. на позициях 159-161 во втором.