Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.su/FBB/year_04/doc/term2/task_9.doc
Дата изменения: Fri Apr 15 13:21:26 2005
Дата индексирования: Tue Oct 2 00:10:06 2012
Кодировка: koi8-r

Занятие ? 9 второго семестра: два упражнения

Упражнение 1.
Сравнить множественное выравнивание, построенное программой ClustalW,
с «правильным» выравниванием из BaliBase

Найдите Ваше задание в файле P:|\
y04\Term2\Practice9\Task\my_login.doc. В этом файле указано имя документа
BaliBase и фрагмент выравнивания для сравнения, т.е.номера позиций
выравнивания из BaliBase. Сами документы находятся в этой же директории.

Откройте документ. Вверху указаны идентификаторы выровненных
последовательностей. С помощью поисковой системы SRS получите один файл со
всеми последовательностями в формате FASTA. Сохраните его в рабочей
директории.

Постройте множественное выравнивание с помощью программы emma
пакета EMBOSS на сервере kodomo-count.cmm.msu.ru (эта программа - одна из
реализаций ClustalW). Сохраните результирующее выравнивание в файле
clustalw.aln. Импортируйте выравнивание в Genedoc и сохраните в виде файла
clustalw.msf.

Сравните заданный Вам фрагмент выравнивания BaliBase с полученным
выравниванием.
Мерой сходства будем считать число совпадающих «правильных» колонок,
деленное на общее количество «правильных» колонок в заданном фрагменте.

Подсказки
1. В файле из BaliBase все участки «биологически обоснованного
выравнивания» изображены
заглавными буквами. Сравнение выравниваний вне этих участков
бессмысленно.
2. Программа emma может переставить последовательности местами.

Отчетом является протокол (Protocol.doc) + отредактированный файл
clustalw.msf.

Формат протокола
Заголовок протокола ( «Сравнение множественного выравнивания, полученного
с помощью программы Clustalw, с «биологически правильным» выравниванием
из BaliBase».
Далее опишите задание:
идентификатор выравнивания из BaliBase,
идентификаторы последовательностей,
максимальный и минимальный процент совпадения
последовательностей,
заданный Вам фрагмент.
Приведите блок выравнивания из BaliBase, содержащий Ваш фрагмент.
Выделите цветом «правильные» колонки.
Приведите соответствующие блок (блоки) выравнивания из файла
clustalw.msf. Выделите цветом сравниваемые колонки.
Опишите результаты:
длина заданного фрагмента,
доля «правильных» колонок в этом фрагменте,
число «правильных» колонок, совпавших с колонками в файле
clustalw.msf,
*другие Ваши наблюдения.




Упражнение 2.
Оценить консервативность аминокислотных остатков в зоне контакта с
функциональным лигандом.

Создайте выборку из 10 последовательностей ортологов Вашего белка.
Для этого используйте программу blastp. Поиск ведите по банку SWISS-
Prot.
В первом приближении будем считать ортологами белки с одинаковыми
названиями.
Выбирайте ортологи в диапазоне 50%(identity(75% .
Подсказка:
на страничке выдачи программы blastp есть кнопка, позволяющая сразу
получить все выбранные последовательности в формате FASTA.

Создайте множественное выравнивание полученных последовательностей с
помощью программы emma пакета EMBOSS. Импортируйте выравнивание в Genedoc и
сохраните в виде файла ortho.msf. Раскрасьте разным цветом позиции, в
которых аминокислотные остатки абсолютно консервативны, и позиции, в
которых они консервативны не менее, чем на 80%.
Проверьте, не попали ли в Вашу выборку одинаковые
последовательности. Для этого
получите матрицу попарного совпадения последовательностей. Если Вы увидите
2 последовательности, совпадающие на 90% и более, имеет смысл одну из них
заменить.
Матрицу сохраните в текстовом файле.

Подсказка
Сначала добейтесь нужной конфигурации выдачи. В меню конфигурации (кнопки
"Reports" =>"Configure reports") оставьте галочки против пунктов «Show
calculations for Exact matches»
и «Show results as percent values».
Затем получите матрицу (кнопки "Reports" =>"Statistics reports").

Определите, какие аминокислотные остатки в Вашем белке, находятся на
расстоянии не более, чем 5 ангстрем от функционального лиганда. Используйте
команду select within программы RasMol. Получите остовное изображение 3D-
структуры Вашего белка, а лиганда - в шариковой модели. Остатки в зоне
контакта представьте в виде шарнирных моделей. Консервативные выделите
цветом. Оцените, сколько из контактирующих остатков являются
консервативными.

Формат отчета к упражнению 2 - HTML-страничка.
Заголовок «Консервативные аминокислотные остатки в выборке 10
потенциальных ортологов ..(название белка)..»
На страничке нужно представить
а) матрицу попарного сходства (% совпадения) последовательностей Вашей
выборки;
б) множественное выравнивание, на котором цветом выделены консервативные
позиции;
в) изображение 3D-структуры Вашего белка с отмеченными консервативными
остатками;
г) Ваши рассуждения о том, насколько консервативна область контакта с
лигандом, в каких местах структуры расположены консервативные остатки,
другие интересные наблюдения.


Для любопытных:

BAliBASE (version 2.0): A benchmark alignment database, including
enhancements for repeats, transmembrane sequences and circular permutations
http://www-igbmc.u-strasbg.fr/BioInfo/BAliBASE2/index.html