Программа BLASTP
Целью занятия было научиться работать с веб-интерфейсом программы Blastp и научиться искать различные белки по их последовательностям.
Поиск белка по его последовательности
Я провел на сервере NCBI (
http://www.ncbi.nlm.nih.gov/BLAST/) поиск своего белка по последовательности, попросту взяв ее из уже готового
fasta-файла и удалив описание белка с настройками по умолчанию. Мой белок при поиске по базе данных
swissprot (
P37028B) был выдан первым, со
score 530,
E-value - 2e-150. Когда я повторил поиск по БД pdb, первым вышел он же, точнее, двухангстремная модель его B-цепи. Код модели -
1N2Z,
score - 490 бита,
E-value - 1e-139, начало выравнивания по исходной последовательности - 22, по данной модели - 1, конец - 266 и 245 соответственно. Процент совпадений - 100%. Разница в E-Value естественно, определяется различием состава этих баз данных. Очевидно, что мой белок присутствует в этих базах данных и они годны хотя бы на то, что бы найти его по в точности совпадающей последовательности.
Поиск белка по его гомологу
Поиск в swissprot по последовательности белка BTUF_PHOLL, гомолога моего BTUF тут же обнаружил консервативный домен BTUF (что вполне естественно). BTUF_ECOLI вышел в результирующей подборке пятым, score - 281, E-value - 2e-75, процент совпадений - 51%, у исходной последовательности и моего белка начало выравнивания - 27 и 22, конец - 271 и 263 соответственно.
Первым по порядку был именно тот белок, чью последовательность я задал. Все результыты очевидны и вполне ожидаемы, ничего интересного:
Поиск белка фрагментам его последовательности
Аналогичный поиск был произведен по
thirdprot.fasta: В этот раз результаты были интереснее - например, почему-то наложились два домена btuf, вполне ожидаемо выровненные к фрагментам моего белка, из которых была собрана эта последовательность (Рис 1.).
В результате мой белок был вторым, score - 80,1, E value - 1e-15, не скажу, что могу особенно осмысленно проанализировать эти результаты:
А странное выравнивание с доменом, оказывается, чисто случайно - вообще процент совпадения очень низкий (17,6%, 14,3%), так что никакого интереса эти выравнивания не представляют.
Рисунок 1. Поиск в Blastp.
Разные пользовательские интерфейсы BLAST
Интерфейс EBI функционально аналогичен предыдущему, но я предпочел бы именно его - все как-то внятнее и удобнее. Результаты поиска другие; вряд ли имеет смысл их здесь приводить.
Является ли BLAST инструментом для поиска ортологов?
Я произвел поиск по базе данных
Swiss-Prot с помощью
BLASTP репрессора рибозного оперона
RbsR из
Bacillus subtilis. Результат поиска в виде имен найденных последовательностей хранится в файле
ortolog.txt, и он наглядно показывает, что
BLASTP является достаточно хорошим инструментом для поиска ортологов - 2 первых найденных последовательности после собственно
RBSR_BACSU начинаются со слова
RBSR.