Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.fbb.msu.ru/FBB/year_09/term2/help5.doc
Дата изменения: Sat Mar 20 15:21:34 2010
Дата индексирования: Tue Oct 2 04:14:24 2012
Кодировка: koi8-r

Методические указания

Часть действий исполняется на kodomo-count в операционной системе Linux.
С помощью putty зайдите на kodomo-count и перейдите в свою директорию
Practice5. На kodomo-count установлен универсальный пакет программ для
биоинформатики EMBOSS (http://emboss.sourceforge.net/) . Он может быть
установлен и под Windows на домашнем компьютере

(ftp://emboss.open-bio.org/pub/EMBOSS/windows/) . Ниже команды из этого
пакета отмечены.

Для сохранения PDB-файлов создайте поддиректорию pdb (маленькие буквы) в
директории Practice5. PDB-файлы, и только их, сохраняйте в этой
поддиректории. Так удобно!

Задание 1.
Как быстро получить PDB-файл, зная PDB-код?
(i) (kodomo-count ): get_pdb
Например get_pdb 1xyz (1xyz - PDB код)
Подсказка get_pdb -h
(ii) (Интернет, хлопотнее) http://www.rcsb.org/pdb


Как получить последовательность из PDB-файла?
(i) (kodomo-count ): pdb_to_fasta -f [ ї Борис Нагаев ]
Например pdb_to_fasta 1xyz.ent (1xyz.ent - имя файла)
Подсказка pdb_to_fasta -h
Программа выдает последовательности всех белков и нуклеиновых кислот,
имеющихся в файле. Нужную следует выбрать и добавить в файл
XXXXXX_prot.fasta с двумя последовательностями из пактикума 4.

Внимание! Аминокислотные остатки белка, отсутствующие в структуре,
заменены буквами "X".

(ii) (Интернет, хлопотнее) http://www.rcsb.org/pdb


Как построить выравнивание нескольких последовательностей?

(kodomo-count ) muscle -in <файл с последовательностями в fasta-формате>
-out XXXXXXX_3.msf
Например muscle -in Ivanov_prot.fasta -out Ivanov_3.fasta
Подсказка muscle -h
Внимание! Результат - выравнивание в fasta формате! [i]


Далее импортировать файл Ivanov_3.fast в Genedoc и сохранить в формате msf.

Вариант: перевести файл Ivanov_3.fasta с выравниванием в msf формат:
(kodomo-count, EMBOSS) seqret <имя файла> <имя выходного файла с
указанием формата>
Например seqret Ivanov_3.fasta msf::Ivanov_3.msf
Подсказка seqret -h
Внимание! Формат задается "msf::", а вовсе не расширением в имени
файла.

Как посмотреть структуру, найти в ней остаток, сделать рисунок?
Rasmol, См. семестр 1.

Как решить, что мутация вредна для белка и, следовательно, организма?
См. конспект лекции, записанный вами, а также презентацию.


Задание 2.

Повторите необходимые команды для второго PDB-файла. Сохраните в одном
файле XXXXXXX_2.fasta последовательности двух указанных белков из PDB
файлов .

Внимание! Не все найденные нами пары (ваш белок, его родственник),
указанные в списке, равноценны по сложности, и не все проверены нами до
конца. Поэтому если вас не все устраивает в данном вам примере, например,
все слишком просто, то, по договоренности с преподавателем можете выбрать
другую пару из списка.

Как проверить выравнивание по структурным данным?
(kodomo-count) geometrical-core -i <выравнивание в формате fasta> -g
<результат в формате msf> -p <результат в формате PDB> [ ї Борис
Нагаев ]
Например geometrical-core -i Ivanov_2.fasta -g
Ivanov_YYYY_ZZZZ.msf -p Ivanov_YYYY_ZZZZ.ent
Подсказка geometrical-core -h
Требование к входному файлу: имена последовательностей должны совпадать с
PDB-кодами, например,
>1zuw_A (chain A from PDB-file 1zuw)
Дополнительные возможности этой программы см. в подсказке.

Программа делает вот что. Она находит один или несколько участков
выравнивания двух (или нескольких) последовательностей таких, что все
вместе эти участки в одной структуре расположены так же, как в другой
структуре. Результат называется основным геометрическим ядром. Этим дело
не ограничивается: программа повторяет ту же процедуру, стартуя с тех
участков выравнивания, которые не вошли в основное геометрическое ядро.
Найденное второе геометрическое ядро называется альтернативным. Может
найтись и третье альтернативное ядро. Если вам удалось понять, зачем
нужно искать альтернативные геометрические ядра, то это круто!
Прокомментируйте в протоколе.

Результат программы - в нескольких файлах. Во-первых, в выравнивание
добавляются строчки, по одной на каждое геометрическое ядро. Буквами "N"
отмечены остатки, которые вошли в данное геометрическое ядро. Следует
считать , что выравнивание этих остатков подтверждено структурными данными.
Более того, если выравнивание в позиции i подтверждено структурными
данными, выравнивание в позиции i+2 тоже подтверждено структурными данными
и в позиции i+1 символов гэпа, то можно считать, что и в позиции i+1
выравнивание также подтверждено структурными данными ("заливка маленьких
дыр").

-----------------------
[i] muscle умеет выдавать результат и в msf формате (см. подсказку). К
сожалению, muscle не до конца изучил msf формат (. Поэтому иногда
построенный им файл в формате msf не открывается другими программами.