Построение множественного выравнивания
-
С помощью программы blastP на сервере NCBI
нашла в SwissProt восемь разных гомологов своего белка.
Поиск проводила только в таксоне Bacteria.
Получила выборку последовательностей
со следующими свойствами:
- 3 последовательности на 60-70% совпадающих с достаточно протяженным фрагментом заданной последовательности;
- 4 последовательности на 50-60% совпадающих с достаточно протяженным фрагментом заданной последовательности;
- 1 последовательность, совпадающая с заданной примерно на 35-45%
Сохранила в одном файле (all.fasta) все выбранные последовательности вместе с последовательностью своего белка.
Формат последовательностей FASTA.
-
Установила соединение с сервером kodomo-count с помощью putty.
Запустила программу emma. Задала на вход файл "all.fasta". Получено выравнивание в формате fasta.
-
Установила соединение с сервером kodomo-count с помощью putty.
Запуститла программу muscle без каких-либо параметров. Задала следющую команду: muscle -in all.fasta -out 2.fasta. В данном условии "all.fasta" - файл с последовательностью на вход. Выравнивание в формате fasta.
-
Импортировала выравнивание, полученное с помощью emma, в Genedoc.
Изменила конфигурацию проекта так, чтобы цветом были выделены только самые консервативные колонки выравнивания:
консервативные на 100% красным, а на 70% темно-голубым:
1)В меню Project кнопка "Configure".
2)В открывшемся меню подменю Shade.
3)Убираем галочку около кнопки "Similarity Groups Enabled".
4)Выбераем раскраску 3-его уровня.
5)В подподменю Conserved percent указываем нужные значения идентичности, а в меню ниже выбираем требуемые цвета.
6)"OK".
7)Сохранила полученное выравнивание в файле "viravnivanie1.htm".
Выводы:
Количество колонок консервативных на 100%= 52
Количество колонок консервативных на 70%= 64
Есть несколько консервативных фрагментов, близко раположенных, длиной по 3 аминокислоты. Но, мне кажется, что 3 аминокислоты не достаточно для утверждения того, что данный фрагмент действительно консервативен. Есть консервативный фрагмент из 4 аминокислот.
В положении гэпов нет явных недоразумений.
-
С помощью меню "Reports" получила матрицу попарной идентичности последовательностей:
1)В меню Reports выбираем кнопку "Configure reports".
2)На левой панели открывшегося меню оставляем галочки только возле пунктов Exact Matches, Percent Values, Output as Matrix, Labels Top and Left sides, Labels in single line.
3)Возвращаемся в меню Reports, выбираем кнопку "Statistics report", откроется матрица попарных совпадений. В том же меню выбираем кнопку "Save Report File". .
4)Сохранила ее в файле"matrica.txt".
Сравнение двух полученных выравниваний с помощью программы Genedoc
Импортировала выравнивание, полученное с помощью muscle, на ту же страницу Genedoc, где уже расположено раскрашенное выравнивание emma .
Программа не допускает повторения имен последовательностей, поэтому в выходном файле muscle добавила букву 'm' к имени последовательности.
Объявила каждое выравнивание группой:
1)В меню Groups выбираем кнопку "Edit Sequence Group". Откроется следующее меню.
2)Нажимаем кнопку "New Group", задаем имя и цвет группы: выбираем, например, розовый и зеленый.
3)Затем в окошке с названиями последовательностей выбираем последовательности одного из выравниваний и щелкаем по кнопке "Add".
4)Повторяем то же для второго выравнивания.
5)Нажмите кнопку "OK".
Получила независимую раскраску консервативных столбцов в каждом выравнивании:
1)в меню Groups выбераем кнопку "Shade Group Configuration".
Сохранила раскрашенное объединение выравниваний в отдельном HTML-файле "zadanie4.htm":
1)Нажимаем и, щелкнув мышкой, выделяем нужные блоки выравнивания.
2)Затем в меню Edit выбераем кнопку "Copy Selected Blocks to"=>HTML file. .
Наблюдения:
До 63 позиции выравнивания абсолютно совпадают. На 64-65 позициях muscle ставит гэпы, которые отсутствуют в выравнивании, сделанном программой emma. За счет этого в выравнивании muscle появляется консервативная на 100% колонка глицина, в то время как в выравнивании emma соответствующие остатки глицина консервативны только на 70%. Далее emma ставит гэпы, отсутствующие в выравнивании muscle, за счет этого получается, что мы наблюдаем участки консервативности одинаковые и по составу аминокислотных остатков, и по процентам консервативности. Однако, если сравнивать положения позиций двух выравниваний, то выравнивание, сделанное программой muscle, сдвинуто на 1 позицию вперед. Это смещение сохраняется до конца выравниваний.
Сравнение попарного выравнивания, порожденного множественным, с оптимальным попарным выравниванием
Рассмотрела матрицу попарной идентичности, выбрала две наиболее непохожие последовательности:MUTH_SHEON и MUTH_BUCBP.
Cкопировала их из исходного файла all.fasta в отдельные файлы, к началу имени последовательности добавила 'o'.
Получила оптимальное попарное выравнивание выбранных последовательностей с помощью программы needle на сервере kodomo-count
Для того, чтобы получить выравнивание в формате FASTA запустила программу с параметром -aformat fasta.
Вернулась к выравниванию в Genedoc и удалила все лишние последовательности (меню Sequence Dialog) , оставив из
каждого выравнивания только пару выбранных последовательностей.
Импортировала оптимальное выравнивание на эту же страницу и объявила его новой группой. Получила независимую раскраску консервативных позиций
в 3-х группах.
А раскрашенное объединение 3-х выравниваний экспортировала в HTML-файл "zadanie5.htm".
Выводы:
До 63 позиции выравнивания, порожденные множественными, абсолютно совпадают. Дальше за счет гэпов, расставленных программой muscle, происходит сдвиг выравнивания, осуществленного этой программой, на 1 позицию вперед относительно выравнивания, порожденного выравниванием emma, однако состав консервативных участков полностью совпадает. Что касается выравнивания needle, то оно отличается от двух предыдущих самым первым консервативным соответствием. Если программы множественно выравнивания ставят в соответствие метионин и изолейцин, то needle сопоставляет метионин с лейцином. Далее за счет расстановки гэпов программой needle консервативные участки всех трех попарных выравниваний совпадают по соответствию аминокислотных остатков, однако оптимальное попарное выравнивание сдвинуто на 1 позицию вперед относительно выравнивания muscle и на 2 относительно выравнивания emma.
|