Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~golergka/term2/practices/practice8/
Дата изменения: Fri Jun 2 12:19:18 2006
Дата индексирования: Sat Dec 22 07:14:18 2007
Кодировка: Windows-1251
Работа с программой BLAST

Программа BLASTP

Целью занятия было научиться работать с веб-интерфейсом программы Blastp и научиться искать различные белки по их последовательностям.

Поиск белка по его последовательности

Я провел на сервере NCBI (http://www.ncbi.nlm.nih.gov/BLAST/) поиск своего белка по последовательности, попросту взяв ее из уже готового fasta-файла и удалив описание белка с настройками по умолчанию. Мой белок при поиске по базе данных swissprot (P37028B) был выдан первым, со score 530, E-value - 2e-150. Когда я повторил поиск по БД pdb, первым вышел он же, точнее, двухангстремная модель его B-цепи. Код модели - 1N2Z, score - 490 бита, E-value - 1e-139, начало выравнивания по исходной последовательности - 22, по данной модели - 1, конец - 266 и 245 соответственно. Процент совпадений - 100%. Разница в E-Value естественно, определяется различием состава этих баз данных. Очевидно, что мой белок присутствует в этих базах данных и они годны хотя бы на то, что бы найти его по в точности совпадающей последовательности.

Поиск белка по его гомологу

Поиск в swissprot по последовательности белка BTUF_PHOLL, гомолога моего BTUF тут же обнаружил консервативный домен BTUF (что вполне естественно). BTUF_ECOLI вышел в результирующей подборке пятым, score - 281, E-value - 2e-75, процент совпадений - 51%, у исходной последовательности и моего белка начало выравнивания - 27 и 22, конец - 271 и 263 соответственно.
Первым по порядку был именно тот белок, чью последовательность я задал. Все результыты очевидны и вполне ожидаемы, ничего интересного:

Поиск белка фрагментам его последовательности

Аналогичный поиск был произведен по thirdprot.fasta: В этот раз результаты были интереснее - например, почему-то наложились два домена btuf, вполне ожидаемо выровненные к фрагментам моего белка, из которых была собрана эта последовательность (Рис 1.).
В результате мой белок был вторым, score - 80,1, E value - 1e-15, не скажу, что могу особенно осмысленно проанализировать эти результаты:
А странное выравнивание с доменом, оказывается, чисто случайно - вообще процент совпадения очень низкий (17,6%, 14,3%), так что никакого интереса эти выравнивания не представляют.
Рисунок 1. Поиск в Blastp.

Разные пользовательские интерфейсы BLAST

Интерфейс EBI функционально аналогичен предыдущему, но я предпочел бы именно его - все как-то внятнее и удобнее. Результаты поиска другие; вряд ли имеет смысл их здесь приводить.

Является ли BLAST инструментом для поиска ортологов?

Я произвел поиск по базе данных Swiss-Prot с помощью BLASTP репрессора рибозного оперона RbsR из Bacillus subtilis. Результат поиска в виде имен найденных последовательностей хранится в файле ortolog.txt, и он наглядно показывает, что BLASTP является достаточно хорошим инструментом для поиска ортологов - 2 первых найденных последовательности после собственно RBSR_BACSU начинаются со слова RBSR.