Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~golergka/term3/practice3/
Дата изменения: Sat Nov 18 18:44:15 2006
Дата индексирования: Tue Oct 2 15:35:08 2012
Кодировка: Windows-1251
Программы пакета BLAST для работы с нуклеотидными последовательностями Третий семестр

Программы пакета BLAST для работы с нуклеотидными последовательностями

Создание индексов

Для поиска по геномам холерного эмбриона, синегнойной палочки и бактерии Pasteurella multocida были созданы соответствующие индексные файлы с помощью следующих команд:

Скопировать текст в буфер обмена

Поиск в неаннотированном геноме

Следующей моей задачей являлось провести поиск в геномах этих организмов генов, похожих на кодирующиую последовательность моего белка. Т.к. последовательность моего белка имеет белковый формат (честно говоря, это можно было бы сказать и получше, но у меня не получилось), а поиск необходимо было провести в геноме, описанном в нуклеотидном формате (и то, и то, впрочем, вполне логично - ясное дело, что из генома транскрипция может идти в 6 рамках, но перевернутый задом наперед белок никому не нужен), то я использовал программу tblastn, как и все мои разумные однокурсники.
Хотя, надо отметить, что один момент для меня остался невыясненным. Как эта программа может учитывать иногда происходящий при трансляции сдвиг рамки считывания? Насколько я понимаю, это явление не слишком частое, но имеющее место - однако ген, предусматривающий такой сдвиг, такой программой найти будет невозможно, даже если сходство с искомым белком будет очень большое и хорошее. Вот выполненные мной команды:

Скопировать текст в буфер обмена vc.search pa.search pm.search
Поиск гомологов btuf_Ecoli Геном
Vibrio Chloreae
Геном
Pseudomonas Aeruginosa
Геном
Pasteurella Multocida
Характеристика лучшей находки:
E-value находки 4*10-43
координаты выравнивания(-ий)в записи генома 8560..9297 5711..4956 13569..13294
AC соответствующей записи EMBL AE004308 AE004821
теперь AE004091
AE006047
Координаты CDS в записи EMBL (если они есть)
AC UniProt в записи EMBL (если есть) Q9KPJ1 Q9CPD1
Число находок с Е-value<0,01 2 4 2
Лучшие находки при поиске по трем геномам:
E-value: 10-42 6*10-24 4*10-4
Общее число находок с E-value большим 0,01 - 6.

Поиск гомологов с помощью blastn