Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Kamina/Term3/task4.doc
Дата изменения: Wed Nov 9 14:45:22 2005
Дата индексирования: Tue Oct 2 07:01:45 2012
Кодировка: koi8-r

Предсказание генов во фрагменте генома бактерии Yersinia bercovieri

Целью нижеследующей работы является аннотация участка генома Yersinia
bercovieri, то есть нахождение в этом участке генов.

1) Был создан файл (называется он aalc01000107.fasta) содержащий фрагмент
AALC01000107, взятый из файла с неаннотированными фрагментами генома
бактерии Yersinia bercovieri.
Для этого использовались следующие команды:

seqret /home/export/samba/public/tmp/yb.fasta:AALC01000107 -sask
aalc01000107.fasta
2) Далее из этого фрагмента генома Y. bercovieri были извлечены трансляции
всех открытых рамок считывания длиной не менее 240 нуклеотидов. При этом
использовался стандартный для бактерий (bacterial) генетический код,а
открытой рамкой считайте последовательность, начинающуюся со старт-кодона
и заканчивающуюся стоп-кодоном. Также, был создан файл, включающий все
указанные трансляции в fasta-формате (файл ramki_aalc01000107.fasta).
Извлечены трансляции всех открытых рамок считывания проводилось
программой getorf . Соответствующие команды: getorf -minsize 240
-table 11 -find 1 далее по умолчанию.

3) Были созданы индексные файлы BLAST для всех последовательностей из
SwissProt из бактерий таксона Enterobacteriales (к которому относится и
Y. bercovieri)
Команды:
1) создан файл с нужными аминокислотными последовательностями из банка
SwissProt
secret sw-org:Enterobacteriales

2)созданы индексные файлы BLAST
formatdb -i Enterobacteriales.fasta - p Т -n Enterobacteriales
4) Далее приведена таблица, включающая информацию обо всех открытых
рамках считывания во фрагменте AALC01000107 генома.

|? открытых рамкок|начало во |конец во |направление |Число сходных |
|считывания |фрагменте |фрагменте | |последовательностей, |
| | | | |найденных программой |
| | | | |BLASTP среди |
| | | | |последовательностей |
| | | | |Enterobacteriales |
|>AALC01000107_1 |142 |426 |прямое |0 |
|>AALC01000107_2 |114 |590 |прямое |0 |
|>AALC01000107_3 |766 |1011 |прямое |0 |
|>AALC01000107_4 |1775 |2638 |прямое |38 |
|>AALC01000107_5 |2759 |3796 |прямое |18 |
|>AALC01000107_6 |3789 |3508 | обратное |0 |
|>AALC01000107_7 |2186 |1878 | обратное |0 |
|>AALC01000107_8 |1673 |1194 | обратное |0 |
|>AALC01000107_9 |1396 |1151 | обратное |0 |
|>AALC01000107_10 |1046 |54 | обратное |4 |

Команды: grep AALC01000107 ramki_aalc01000107.fasta > text.txt
Далее приведено изображение, на котором схематически показано положение
предполагаемых генов (открытых рамок, имеющих гомологов) на фрагменте.

54<--------1046 1775------------->2638 2759------------>3796



Ниже(на следующей странице) приведен скрипт, с помощью которого были
получили данные о числе сходных последовательностей.
Скрипт.

seqret ramki_aalc01000107.fasta:AALC01000107_1 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" > all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_2 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_3 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_4 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_5 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_6 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_7 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_8 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_9 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt
seqret ramki_aalc01000107.fasta:AALC01000107_10 stdout | blastall -p blastp
-d Enterobacteriales -e 0.01 | grep "Number of sequences better than 1.0e-
02:" >> all.txt