Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~v.romashchenko/Term_3/practice12.html
Дата изменения: Wed Dec 9 03:26:54 2009
Дата индексирования: Tue Oct 2 15:03:29 2012
Кодировка: Windows-1251
Romashchenko Valeriya

Учебный сайт
Ромащенко Валерии

Работа с сервером MEME.

Для нахождения общего мотива с помощью программы MEME были взята следующие параметры: распределение количества встреч каждого мотива - "Zero or one per sequence"; максимальная и минимальная длина мотива по 16 (ищем мотивы строго заданной длины); число различных мотивов - 1. В результате была получена информация о найденных мотивах, в частности, - LOGO, матрица PSSM и таблица найденных мотивов.

LOGO

Матрица PSSM.

Номер строки A C G T
1 119 -1010 72 -1010
2 184 -1010 -1010 -1010
3 -3 -128 72 -3
4 -1010 -1010 218 -1010
5 70 130 -1010 -1010
6 170 -128 -1010 -1010
7 170 -1010 -128 -1010
8 119 -28 -1010 -62
9 -1010 218 -1010 -1010
10 -1010 -1010 218 -1010
11 -62 -1010 -28 119
12 -1010 -1010 -1010 184
13 -1010 -1010 -1010 184
14 -62 -128 130 -62
15 -1010 204 -128 -1010
16 -161 30 152 -1010

Таблица найденных мотивов.

NAME STRAND START P-VALUE SITES
purM - 121 1.17e-09 TCTAACAGGG AAAGCAAACGTTTGCG AGACTGCTTT
cvpA - 129 2.67e-09 TCTAACAGAA AAAGAAAACGTTTGCG TAGGGATTTC
purE - 114 6.32e-09 GAAAGAGAGC AAGGAAAACGGTTGCG TGGCTGTGAA
purR + 138 2.33e-08 AAGGTGTGTA AAGGCAAACGTTTACC TTGCGATTTT
pyrC + 132 2.33e-08 TTTTCGTGCA AAGGAAAACGTTTCCG CTTATCCTTT
purL - 109 7.86e-08 CTGATGCGCT GACGAAACCGTTTGCG TGGAAATAAA
codB - 118 7.86e-08 CTGAAGATAA AAAGCAATCGTTTTCG TGGGGAAATA
guaB + 130 2.73e-07 AAAAGGGGTA GATGCAATCGGTTACG CTCTGTATAA
purA + 77 4.40e-07 ACTACATGTT GAGGAAAACGATTGGC TGAACAAAAA
glnB + 116 6.02e-07 ACACGAGCTG GATGCAAACGATTTCA AGGAATGAAT
carA + 90 8.96e-07 ATATCTCCAG AATGCCGCCGTTTGCC AGAAATTCGT

Исходные последовательности (найденные мотивы подчеркнуты)

   
                 >codB                                                                                                             
                 catgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatat               
                 aaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg            
                                                                                                                                        
                 >purE                                                                                                              
                 tggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctg             
                 atttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc           
                                                                                                                                        
                 >pyrC                                                                                                              
                 gcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgaggg          
                 cgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta                
                                                                                                                                        
                 >purR                                                                                                              
                 ttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccg             
                 gcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa             
                                                                                                                                        
                 >cvpA                                                                                                             
                 cgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttt             
                 tattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat             
                                                                                                                                        
                 >purM                                                                                                              
                 atattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaag           
                 gttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag                
                                                                                                                                        
                 >guaB                                                                                                              
                 actaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggata           
                 gcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgccc                
                                                                                                                                        
                 >glnB                                                                                                             
                 aactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttc            
                 ccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc              
                                                                                                                                        
                 >purL                                                                                                             
                 aggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttat           
                 ttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt                
                                                                                                                                        
                 >purA                                                                                                              
                 accaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaac          
                 aaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaa                 
                                                                                                                                        
                 >carA                                                                                                              
                 tgtcgcttaatgcctgtaaaacatgcatgagccacaaaataatataaaaaatcccgccattaagttgacttttagcgcccatatctccagaatgccgccgtttgccag
                 aaattcgtcggtaagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtgaatattctctggagggtgttt                           
          

Сравнение результатов с реальными сайтами узнавания Pur.

Только в 11 из изначально выданных 17 последовательностей были найдены мотивы, что на одну последовательность больше, чем их есть в реальных сайтах узнавания PurP (которых 10). Из них неверно был указан сайт для purA, а лишней оказалась находка в carA. Последовательности, в которых вообще не было найденно мотивов: folD, rpiA, fixA, rbsD, araD. Найденно 11, реальных 10, правильных 9.
Чувствительность: 9/10=0.9
Специфичность: 9/11=0.81


© Ромащенко 2008