Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~student08fbb/psiblast.html
Дата изменения: Fri May 22 17:19:41 2009
Дата индексирования: Tue Oct 2 04:19:54 2012
Кодировка: Windows-1251
PSI-BLAST

Учебный сайт Шиндяпиной А.В.

Работа с PSI-BLAST (Position-Specific Iterated BLAST).


Работа с четырьмя аминокислотными последовательностями.

Для выполнения работы в PSI-BLAST были даны три последовательности с AC P18196, P0A832, P0A780 и послед-ть анализируемого мною белка P0AA04.
Сначала провела итеративный поиск по банку Swiss-Prot программой PSI-BLAST. ( http://blast.ncbi.nlm.nih.gov/ => "protein blast") По умолчанию задан порог на E-value 0,005. Поиск провела по всем четырем последовательностям, записав результаты в Таблице ?1.
Таблица ?1
ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
PTHP_ECOLI P0AA04 3 53 0,003 0,015 59 2*10-13 0,67
MINC_ECOLI P18196 5 125 0,004 0,005 240 0,003 0,007
SSRP_ECOLI P0A832 2 449 3*10-10 5,0 449 8*10-31 0,62
NUSB_ECOLI P0A780 4 327 0,003 0,008 388 2*10-12 0,031

Из полученных результатов можно сделать несколько выводов:
во-первых с каждой последуюющей итерацией уменьшается e-value для худшей находки до порога и учеличивается для лучшей находки ниже порога, что скорее всего связано с ростом вероятности, что мы "выделили" целое семейство после каждой новой итерации, т.е. растет разрыв между ними;
во-вторых не для каждого семейства белков количество итераций одинаково, что скорее всего зависит от специфичности выполняемой ими функции (вследствие чего наличие индивидуальных структур, возможно более длинных и специфичных гомологичных участков и др.), так же возможно зависит и от того, насколько это большое семейство белков;
в-третьих можно заметить, что с каждой последующей итерацией уменьшается e-value лучшей находки до порога
Проследив изменение e-value какой-нибудь средней находки, можно сделать вывод, что ее e-value будет изменяться в зависимости от того, насколько она удовлетворяет профилю.

Работа с белком MINC_ECOLI

Для дальнейшего изучения возможностей программы PSI-BLAST взяла белок, для которого даже после 5 итераций находилось много новых гомологичных последовательностей с е-value больше 0,005. Понизив порог до 0,001, провела 4 итерации, после которых навонец-то вырисовалось семейство. Для того, чтобы итерации сошлись сразу нужно задать порок где-то 9*10-9-10-10 (соответствует худшей находке выше порока 0,001 с 1 по 3 итерации).