Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~zhuravlka/term4/b3z1.html
Дата изменения: Sat May 14 17:29:24 2011 Дата индексирования: Tue Oct 2 09:17:36 2012 Кодировка: Windows-1251 |
На главную страницу На страницу четвертого семестра |
Создание паттерна по выравниванию семейства белков. |
1)Поиск в банке Prosite паттерна рибосомального белка RL5_BACSU бактерий.Паттерн:[LIVM]-x(2)-[LIVM]-[STAVC]-[GE]-[QV]-x(2)-[LIVMA]-x-[STC]-x-[STAG]-[KRH]-x-[STA]Описание семейства:Рибосомальный белок L5- один из белков большой субъединицы рибосомы. Известно, что у Escherichia coli L5 включен в процесс связывания 5S РНК с большой субъединицей. Принадлежит к семейству рибосомальных белков, к которому на основе сходства последовательностей относятся:* L5 эубактерий. * L5 хлоропластов водорослей. * L5 Цианеллы. * Архебактериальный L5. * L11 млекопитающих. * Tetrahymena thermophila L21. * (Slime mold) L5 слизневой плесени (V18). * L16 дрожжей (39A). * митохондриальный L5 растений.В качестве паттерна, являющегося признаком для данного семейства, был выбран консервативный участок, расположенный в первой трети последовательности этих белков. Характеристики паттерна:# номер версии UniProtKB/Swiss-Prot : 04, общее число записей последовательностей: 526969. # Общее число находок в UniProtKB/Swiss-Prot: 708 находок в 708 различных последовательностях # Число находок в белках, которые известно принадлежат к числу рассматриваемых: 703 находок в 703 различных последовательностях # Число находок в белках, которые могут потенциально принадлежать к числу рассматриваемых: 0 в 0 различных последовательностях # Число ложных находок (их неродственных белков): 5 находок в 5 различных последовательностях # Число известных пропущенных последовательностей: 160 # Число частичных последовательностей, которые принадлежат к рассматриваемым, но которые не находятся паттерном из-за их фрагментарности: 4 # Точность (правдивые находки / (правдивые находки + ложные положительные)): 99.29 % # Чувствительность ( правдивые находки / (правдивые находки + ложные отрицательные)): 81.46 % 2) Создание паттерна для поиска белков подсемейства.Подсемейством я выбрала отдел Firmicutes. Выборка из подсемейства: RL5_BACSU RL5_LISMO RL5_LACAC RL5_LACDA RL5_PEDPA RL5_STAES RL5_THETN Выборка из других бактерий: RL5_ACHLI RL5_BORA1 RL5_NEIG1 RL5_OCEIH RL5_RHOSK RL5_SACD2 RL5_XANORПосле нескольких попыток работы с различными участками выравнивания для составления паттерна за основу принят исходный для всей группы- [LIVM]-x(2)-[LIVM]-[STAVC]-[GE]-[QV]-x(2)-[LIVMA]-x-[STC]-x-[STAG]-[KRH]-x-[STA] делаем его строже и протяженней в длину, в итоге приходим к следующему: [LIM]-x(2)-[IVL]-[TSA]-G-Q-[KRQH]-[AP]-[VLIM]-[TIVL]-T-[KRT]-A -[KR]-[KNR]-[SA]-[IV]-[AS]-[NGTAS]-F-[KR]-[ILV]-R-x-[GDN]-[MVTA] -x-[ILV]-G-[CAVSTL]- K-[VT]-[TD]-L-R-[GKR]-x(2)-M-[YFW]-[EDH]-F-X-[DEQYS] По этому паттерну ProSite находит 167 последовательностей, среди них есть 12 лишних и все 155 нужных. Так как отклонение меньше 10%, а попытки улучшить паттерн оказались не очень-то успешными, было принято решение остановиться на данном результате.Рамочкой выделена область паттерна. Ссылка на исходное выравнивание двух выборок z2.msf Ссылка на проверку в Excel правильности находок z1e1.xlsx |
|
© Zhuravleva Katya, 2009 |