Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~ramil.mintaev/projects/plural_alignment/plural_alignment.php
Дата изменения: Unknown
Дата индексирования: Fri Feb 28 16:51:51 2014
Кодировка: Windows-1251
Минтаев Рамиль | Множественное выравнивание последовательностей


Множественное выравнивание последовательностей

  • Ознакомление с программой Muscle

    Для выравнивания получил последовательности вирусных белков, называемых "дельта-антигенами", при помощи SRS, запросом:
    ([swissprot-Taxonomy:Deltavirus*] & [swissprot-Description:delta*]).

    Нашлось 34 последовательности, которые сохранил в fasta формате (delta.fasta). Получил выравнивание посредством программы muscle (delta_aligned.fasta). Далее, я импортировал в GeneDoc последовательности до и после выравнивания и сравнил две картинки.
    допосле

    После выравнивания можно увидеть на картинке много наглядных консервативных участков.

  • Выравнивание набора гомологов белка CLPB_ECOLI

    Получил 7 гомологов(myprotein.list) при помощи BLASTP на сервере NCBI и их последовательности в fasta формате(myprotein.fasta) при помощи программы seqret на сервере kodomo-count.

    В данном множественном выравнивании(картинка) можно выделить участки с повышенной долей консервативных позиций:
    координаты
    по столбцам выравнивания:
    alignment1 189-409;
    alignment2 567-757;
    alignment3 795-807;
    alignment4 851-866.
    по остаткам белка СLPB_ECOLI:
    alignment1 175-397;
    alignment2 531-721;
    alignment3 751-763;
    alignment4 807-822.


    Также можно выделить участки, где выравнивание недостоверно, т.е. скорее всего не имеет биологического смысла.
    координаты
    по столбцам выравнивания:
    761-850
    495-520
    879-937
    120-166
    50-75
    по остаткам белка СLPB_ECOLI:
    725-807
    467-530
    835-857
    115-143
    45-74

    На этих участках нет совпадений на каком-нибудь бы уровне(не всех строчках, а бывает только на некоторых).

  • Другие программы множественного выравнивания

    При помощи программы mafft и edialign получил два множественных выравнивания(картинка_mafft,_edialign; fasta: aligned_mafft,_edialigh). Ничего осбенного я не нашел в этих программах - они также примерно указали на те фрагменты, которые я написал во 2 задании. Есть мелкие различия, которые как раз-таки, наверно, и показывают точечные различия, не имеющие биологического смыла. Также, заметил, что edialign очень любит ставить длинные гэпы.

  • Программы обработки множественных выравниваний

    • Consambig - создает последовательность в fasta формате из фрагментов совпавших во множественном выравнивании.(файл)
    • Distmat - создает матрицу дистанции из множественного выравнивания.(файл distmat) Эта программа высчитывает эволюционные дистанции, т.е. степень родства, между парами выравниваний из множественного.
    • Plotcon - наносит на карту консервативные участки из выравненных последовательностей.(файл ps) После конвертации из ps в pdf и затем в gif. Выяснилось, что Plotcon построил зависмость длины последовательности от схожести во множественном выравнивании.