Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~vanilin/tRNA.html
Дата изменения: Sun Nov 11 21:52:01 2007
Дата индексирования: Mon Oct 1 23:01:36 2012
Кодировка: Windows-1251
tRNA
На главную страницу сайта
На главную страницу третьего семестра
 

Поиск гомологов некодирующей нуклеотидной последовательности

Определение тРНК, использованной для присоединения 4-го аминокислотного остатка к BTUB_ECOLI

Четвертым аминокислотным остатком белка BTUB_ECOLI является лизин (K, Lys). Чтобы найти соответствующую ему тРНК в геноме E.coli K-12, была использована программа grep:

grep 'anticodon.*Lys' ecoli.embl > tRNA_list.txt

В результате было получено 6 различных лизиновых тРНК (результат), и все они удовлетворяли нашим запросам, поэтому для дальнейшей работы была выбрана первая из них без каких-либо предпочтений.

 Аминокислотный остаток в 4-ой позиции белка BTUB_ECOLI Lysine
 Соответствующий кодон в гене btuB 5'-AAA-3'
 Идеальный антикодон 5'-UUU-3'
 Сколько можно было бы ожидать разных тРНК для лизина 2
 Количество лизиновых тРНК, аннотированых в геноме кишечной палочки 6
 Характеристика выбранной для дальнейшего изучения тРНК:
 название гена lysT
координаты гена в записи EMBL 779777..779852
антикодон UUU

Мы видим, что количество тРНК в три раза превышает количество, которого было бы вполне достаточно. Возможно это некий элемент защиты от мутаций в геноме: если ген одной тРНК будет испорчен, и она не сможет корректно выполнять свою функцию — всегда будет несколько запасных копий.

Поиск гомологичных тРНК в геноме Sulfolobus solfataricus

Последовательность лизиновой тРНК была получена программой seqret с параметром -sask.
Предлагается 4 способа поиска родственных последовательностей. Программа BLASTN запускается аналогично предыдущему занятию. Результат можно посмотреть здесь.

Megablast обладает схожим с blastall синтаксисом, параметр -W (длина слова), равный по умолчанию 28, было рекомендовано не менять. discontiguous MegaBLAST запускается при указании параметров -t, -W и -N. Параметр -t (длина слов для сравнения) принимает значения 16, 18, 21; -W (количество совпавших букв в слове, взятом для сравнения) — 11, 12; -N указывает — кодирующая последовательность или нет, и в нашем случае не меняется и равен 1. Помимо этих трех параметров discontiguous MegaBLAST имеет также полезный параметр -D, который управляет выдаваемой информацией. По умолчанию его значение - 2, оно соответствует наиболее полной информации.
Перепробовав все сочетания значений параметров -t и -W, не было найдено никаких совпадений, в том числе и без этих параметров (то есть при поиске Megablastом). Только когда длина слова была установлена размером 12 (вместо 28), были найдены близкие последовательности:

megablast -d ss -i tRNA-Lys.fasta -o tRNA_Mb.out -W 12

Такой результат можно было предсказать, поскольку Sulfolobus solfataricus достаточно далекий родственник Escherichia coli, а Megablast служит для поиска близких гомологов.

fasta35 — использует совершенно другой алгоритм поиска гомологов, поэтому результаты ее работы особенно интересны. Время выполнения действительно немного дольше, но в итоге была выдана неплохая выборка гомологичных последовательностей.

Программа FastA BLASTN MegaBLAST
Число находок с Е-value < 0,001 0 0 0
Характеристика лучшей находки:
  E-value находки 0,24 0,15 0,59
  Номер сектора генома 164 27 75
  AC соответствующей записи EMBL AE006805 AE006668 AE006716
  Координаты выравнивания в записи EMBL 7153 - 7204 5248 - 5230 8402 - 8415
Аннотация лучшей находки по EMBL Неаннотированная
рамка считывания
6520..8442
Аргининовая тРНК
5219..5306
Неаннотированная
рамка считывания
8051..9499

Таким образом, лучше всех, как ни странно, справилась с задачей программа BLASTN, поскольку она нашла действительно тРНК, пусть и не лизиновую. Значит для поиска некодирующих нуклеотидных последовательностей BLASTN все таки пригодна. Но не стоит забывать, что ее результаты должны быть проверены. На опыте поиска кодирующих последовательностей мы знаем, что на правильность найденных BLASTN результатов можно пологаться лишь изучив эти находки. Хотя в данном случае вероятность того, что BLASTN случайно нашла именно тРНК из всего генома, очень незначительна, в общем случае она не всегда так точна.

 

 

 

 


© Донченко Иван, 2007