Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~maravilla/term2/mnogoaligned.html
Дата изменения: Mon May 18 18:06:23 2009 Дата индексирования: Tue Oct 2 14:24:58 2012 Кодировка: Windows-1251 |
Множественные выравнивания
Задание 1 (Ознакомление с программой Muscle) |
Для начала нашей задачей является получить невыровненные последовательности
дельта-антигенов в формате fasta, что мы и сделаем с помощью UniProt. Для этого воспользуемся системой поиска SRS, где в соответствующих полях (Taxonomy и Description) запишем данные
дельта-антигенов. Затем сохраним полученные последовательности в fasta-формате.
Просмотрим имеющиеся последовательности с помощью программы GeneDoc:
Файл можно загрузить, если нажать здесь Глядя на эти последовательности, можно сделать несколько предположений. Во-первых, бросается в глаза часть последовательности с 49 позиции (пролин) по 54 включительно (валин). Такой фрагмент есть во всех последовательностях, поэтому было бы вполне осмысленно как с математической точки зрения, так и с биологической, их выровнять, поставив где-нибудь гэпы в первой, второй и третьей последовательностях, а также с шестой и далее. Во-вторых, нетрудно обнаружить еще один такой же большой кусочек - в первой последовательности с 100 позиции (D) по 114 - лизин (L). Есть еще один такой же кусочек довольно большой длины - в первой последовательности с 159 позиции аргинин (R) по 168 пролин (P). Затем произведем выравнивание данных последовательностей с помощью программы muscle: Файл с выравниванием лежит тут Если посмотреть на это выравнивание, то можно обнаружить, что наши предположения оправдались. Кроме того, нашлись еще довольно значимые участки соответствия (с 50 по 55 позиции, с 70 по 74, с 126 по 131 и со 174 по 180 позиции включительно). В целом, данное выравнивание позволяет заключить, что эти белки являются гипотетическими гомологами. |
Задание 2 (Выравнивание набора гомологов своего белка) |
Для того, чтобы найти гомологи для белка FDNH_ECOLI, воспользуемся программой BLASTP.
Ограничим поиск следующими параметрами: ищем гомологи только среди бактерий (Bacteria); E-value<0.001.
Кроме того, процент свходства должен быть не больше 90%.
При таких парметрах поиска получили 34 белка, из них были выбраны 6, не считая самого FDNH_ECOLI. При этом худший среди всех процентов сходства был не меньше 32%, а лучший - 77%. К сожалению, чего-то среднего между этими двумя числами не нашлось. А E-value худшей из находок был равен 3e-09. Полученный последовательности выравниваем с помощью программы muscle, из полученного файла делаем картинку: Исходный файл лежит тут Из произведенного выравнивания видно, что есть несколько участков консервативных позиций, например, 181 по 209. |
Задание 3 (Другие программы множественного выравнивания) |
Теперь попробуем произвести выравнивания тех же последовательностей с помощью программы mafft.
Для последовательностей вирусных белков "дельта-антигенов" получаем: Исходный файл - delta_aligned2.fasta Как мне кажется, эти выравнивания одинаковы. Поэтому логично предположить, что такое выравнивание является оптимальным. Для последовательностей гомологов белка FDNH_ECOLI получаем: Этот файл лежит здесь Нетрудно заметить,что выравнивание гомологов белка FDNH_ECOLI, выполненное с помощью программы muscle немного отличается от выравнивания, выполненного программой mafft. Так, mafft решли выровнять первые метионины, которы muscle не трогал, но биологического смысла этот участок все равно не приобрел. В целом в обоих случаях сохранились те же выровненные фрагменты,например,позициям со 185 по 212 во втором выравнивании соответствует позиции 181-208 в первом. Но вот участку со 134 по 136 позиции повезло меньше: mafft нашел еще один столбец соответствия а.о. (130-140 позиция). Кроме того, mafft нашел на 94 позиции столбец соответствия, которого не нашел muscle. Впрочем, биологического смысла этот столбец не несет. остальные же фрагменты в обоих случаях остались без изменений. Вообще оба выравнивания довольно схожи, так так большинство позиций соотнесенных аминоксилотных остатков в первом выранивании сохраняется во втором, хотя и не обязательно на тех же позициях выравнивания. К примеру, позициям 155-157 в первом соответствуют те же а.о. на позициях 159-161 во втором. |