Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~vermilion_991/multiple.html
Дата изменения: Wed May 27 16:08:19 2009
Дата индексирования: Tue Oct 2 04:31:28 2012
Кодировка: Windows-1251
multiple.html

WELCOME MY FRIEND!


Множественное выравнивание последовательностей.

  1. Ознакомление с программой Muscle
  2. Задача – получить выравнивание вирусных белков, называемых "дельта-антигенами", посредством программы muscle [массл] и посмотреть на него в GeneDoc.
    1. Получила файл с последовательностями дельта-антигенов в формате fasta. Для этого воспользовалась SRS. Ввела в поле "Taxonomy" название рода "Deltavirus", в поле "Description" слово "delta". Для сохранения в формате fasta нажала кнопку "Save": delta.fasta.
    2. Импортировала файл в GeneDoc: delta.msf. Это невыровненные последовательности.
    3. Построила выравнивание с помощью программы muscle. Можно посмотреть на содержимое полученного файла (например, <F3> в Far manager), чтобы представлять, как выглядит выравнивание в fasta-формате: delta_aligned.fasta.
    4. В GeneDoc завела новый проект и импортировала выравнивание: delta_aligned.msf.

      Сравним две картинки с выравиванием - полученную в GeneDoc и открываемую в редакторе Far Manager. Как можно догадаться, с помощью GeneDoc мы можем с намного большей вероятностью судить о том, что выравнивание имеет биологический смысл. Действительно, если в Far'е открыть и посмотреть выравнивание этих последовательностей, одинаковые буквы остатков аминокислот, располагающиеся друг под другом, совершенно не обязательно будут представлять из себя консервативные участки. Это можно заключить из достаточной случайности расположения таких "выравниваний". Однако, как правило, консервативные участки представляют собой участки в несколько аминокислот, расположенных относительно близко друг к другу, а по последовательности - участами идентичности для всех выравниваемых последовательностей, составляющими некий каркас, общий для всех, дающий нам возможность делать какие-то выводы об их гомологичности. GeneDoc улавливает эти участки и, в зависимости от заданных параметров, как-либо выделяет их. В других редакторах, не специализирующихся на подобной работе, такие участки, естественно, никак не выделены, к тому же, как уже говорилось, могут вообще ничего общего с консервативными позициями не иметь, а представлять случайные совпадения чаще всего одиночных аминокислотных остатков.
      Теперь посмотрим на те же последовательности в GeneDoc только без выравнивания:

      Как видим, найдено намного меньше "консервативных участков". Выравнивание получилось формальным. Дело в том, что в этом случае выровнялись случайные совпадения, без учета возможных вставок и делеций, происходивших в процессе эволюции. По такому выравниванию нельзя судить о гомологичности тех или иных участков, к тому же, упущено подавляющее большинство таковых, которые мы видим в настоящем выравнивании.

  3. Выравнивание набора гомологов моего белка
  4. Получила 8 гомологов моего белка посредством BLAST на NCBI. Выборку делаем такой, чтобы она не состояла только из очень похожих последовательностей.

    Построила множественное выравнивание моего белка и всех найденных гомологов. Импортировала выравнивание в GeneDoc.

    В структуре выравнивания мы видим достаточно много участков с повышенной долей консервативных позиций. На картинке они отмечены черным и представляют собой столбики стоящих друг под другом одинаковых а.о. Это участки, общие для всех последовательностей. По их наличию можно судить о наличии или вероятности гомологичности наших белов. На мой взгляд, наиболее яркий участок, где выравнивание, скорее всего, не имеет биологического смысла - участок, начинающийся с 73 а.о. каждой последовательности и заканчивающийся выровненным общим для всх участком PSVAFG (на картинке - начало второй строки). Заметна некоторая хаотичность в расставлениии гэпов и выравнивании остатков. Скорее всего, здесь нет места гомологичности и на этом участке каждая последорвательность шла собственным эволюционным путем.
    Один из наиболее ярких консервативных участков (позиции в аминокислотных последовательностях; 1й столбик - с учетом схожести остатков S-T, 2й- абсолютное совпадение)::

    sw:menc_vibfm  262-270  262-268
    sw:menc_pholl  261-269  261-267
    sw:menc_erwct  261-269  261-267
    sw:menc_klep7  261-269  261-267
    sw:menc_ecoli  260-268  260-266
    sw:menc_citk8  260-268  260-266
    sw:menc_salar  260-268  260-266
    sw:menc_salns  260-268  260-266
    sw:menc_salsv  260-268  260-266
    

    На картинке показан первый вариант раскраски - с учетом сходства а.о.
     



К блоку
Ко 2му семестру
На главную



© Шишкова Настя, 2008