|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~anahita/Task%204%20(tRNA).html
Дата изменения: Thu Dec 27 10:03:53 2007 Дата индексирования: Tue Oct 2 05:06:17 2012 Кодировка: Windows-1251 |
:
| Аминокислотный остаток в 4-ой позиции белк YAHK_ECOLI | K | |
| Соответствующий кодон в гене yahK | 5'-AAA-3' | |
| Идеальный антикодон | 5'-UUU-3' | |
| Сколько можно было бы ожидать разных тРНК для остатка K (если опираться на генетический код)? |
2 | |
| Сколько тРНК для остатка K аннотировано в геноме кишечной палочки? | 6 | |
| Характеристика выбранной для дальнейшего изучения тРНК: | ||
| название гена | lysV | |
| координаты гена в записи EMBL | 2519275..2519350 |
|
| антикодон | 5'-UUU-3' | |
Команда, использованная для поиска всех лизиновых тРНК в геноме.
grep "anticodon.*Lys" ecoli.embl > antilys
результаты поиска в виде преформатированного текста.
FT /anticodon=(pos:779810..779812,aa:Lys) FT /anticodon=(pos:780099..780101,aa:Lys) FT /anticodon=(pos:780403..780405,aa:Lys) FT /anticodon=(pos:780625..780627,aa:Lys) FT /anticodon=(pos:780833..780835,aa:Lys) FT /anticodon=(pos:2519308..2519310,aa:Lys)
Выбрали антикодон
/anticodon=(pos:2519308..2519310,aa:Lys)
Вырезание t-RNK:
seqret -sask ecoli.embl
Выходной файл : u00096.fasta
| Программа | FastA | BLASTN | MegaBLAST | Discontigous MegaBLAST |
|
| Число находок с Е-value < 0,001 | 3 | 0 | 0 | - | |
| Характеристика лучшей находки: | |||||
| E-value находки | 6.5e-08 |
0.38 |
0.38 |
- | |
| Номер сектора генома | 47 | 157 | 157 | - | |
| AC соответствующей записи EMBL | AE010172 | AE010282 | AE010282 | - | |
| координаты выравнивания(-ий) в записи EMBL | 475..552 | 1781 ... 1768 |
1781 ... 1768 | - | |
| Аннотация лучшей находки по EMBL (не аннотирована, аннотирована как тоже <аланиновая> тРНК, как другая тРНК etc.) |
tRNA-Lys | hypothetical protein | hypothetical protein | - | |
.
Используемые команды:
BLASTN:
blastall -p blastn -d pf -i trnkseqret -o blastn
MegaBLAST:
megablast -d pf -i trnkseqret -o megablast14 -W 14
В параметре -W было выбрано значение 14, так как при больших значениях данного параметра находок нет
FAST(A):
fasta35 trnkseqret pf_genome.fasta 6
discontiguous MegaBLAST не нашел ни одной последовательности ни при какой возможной комбинации параметров.
Один из вариантов запроса в discontiguous MegaBLAST:
megablast -d pf -i trnkseqret -o dmegablast12_16_2 -W 12 -t16 -N 2
Выводы:
программы BLASTN, MegaBLAST и discontiguous MegaBLAST не подошли для поиска гомологов, так в первых двух случаях не было находок с Е-value < 0,001, в третьем же случае ни при каких параметрах находок не было. Скорее всего, данные программы не совсем предназначены для поиска гомологичных последовательностей. Программы FAST(A), наоборот, справилась с задачей. Скорее всего это связано с алгоритмом Смита- Ватермана, который подразумевает наличие матрицы замен (даже для 4 нуклеотидных оснований можно составить матрицу весов замен, по которой и будет считаться Score) и который содержиться только в программе FAST(A). Также на результат сказалась и длина слова: чем меньше слово, тем больше находок с Е-value < 0,001 - BLASTN :11, MegaBLAST:14, FAST(A):6