Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~sonaida/term4/text/PFTOOLS.html
Дата изменения: Tue May 17 16:22:46 2011
Дата индексирования: Tue Oct 2 18:01:46 2012
Кодировка: Windows-1251
Рассчитать вес строк выравнивания
В исходном файле каждая последовательность имела вес = 1. В обработанном файле, последовательности имеют разный вес,
в зависимости от их "степени отличия" (чем сильнее последовательность отличается от остальных, тем больше ее вес). Если сложить вес
всех последовательностей - получится примерно единица.
Создание профиля и поиск по профилю
pfsearch -C2.0 -f my.prf bacteria.fasta > my.pfsearch
Профиль - my.prf
Находок было слишком много поэтому я поставила порог 2.0
Анализ результатов
Нашлось 9778 последовательностей с весом больше 2
С весом более 3 - 727 находки
более 4 - 195
более 5 - 59
Максимальный вес - 5.53
Составила сводную таблицу - количество строк уменьшилось. Примерно в 260 белках было найдено по два участка. Файл Excel со сводной таблицей
У созданнного на позапрошлом занятии паттерна селективность и чувствительность равнялись 1. Чтобы добиться такого же значения селективности у профиля
, необходимо поставить порог 5,04. При таком пороге значение чувствительности у профиля (как и для всех белков, так и для S11)- 0,94.
ROC-кривая:
Я усовершенствовала профиль : увеличила вес Glu в шестой
позиции (найденная консервативная позиция см. первое занятие этого блока), и
уменьшила вес Gln в 12-ой позиции (Gln в 12 позиции у некоторых белков, не принадлежащих к подсеместву
Bacillales, но имеющих большой суммарный вес). В результате, при пороге 5,1 профиль имеет
чувствительность и селективность 1.