|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~v.romashchenko/Term_3/practice12.html
Дата изменения: Wed Dec 9 03:26:54 2009 Дата индексирования: Tue Oct 2 15:03:29 2012 Кодировка: Windows-1251 |
Для нахождения общего мотива с помощью программы MEME были взята следующие параметры: распределение количества встреч каждого мотива - "Zero or one per sequence"; максимальная и минимальная длина мотива по 16 (ищем мотивы строго заданной длины); число различных мотивов - 1. В результате была получена информация о найденных мотивах, в частности, - LOGO, матрица PSSM и таблица найденных мотивов.
LOGO
![]()
Матрица PSSM.
Номер строки A C G T 1 119 -1010 72 -1010 2 184 -1010 -1010 -1010 3 -3 -128 72 -3 4 -1010 -1010 218 -1010 5 70 130 -1010 -1010 6 170 -128 -1010 -1010 7 170 -1010 -128 -1010 8 119 -28 -1010 -62 9 -1010 218 -1010 -1010 10 -1010 -1010 218 -1010 11 -62 -1010 -28 119 12 -1010 -1010 -1010 184 13 -1010 -1010 -1010 184 14 -62 -128 130 -62 15 -1010 204 -128 -1010 16 -161 30 152 -1010 Таблица найденных мотивов.
NAME STRAND START P-VALUE SITES purM - 121 1.17e-09 TCTAACAGGG AAAGCAAACGTTTGCG AGACTGCTTT cvpA - 129 2.67e-09 TCTAACAGAA AAAGAAAACGTTTGCG TAGGGATTTC purE - 114 6.32e-09 GAAAGAGAGC AAGGAAAACGGTTGCG TGGCTGTGAA purR + 138 2.33e-08 AAGGTGTGTA AAGGCAAACGTTTACC TTGCGATTTT pyrC + 132 2.33e-08 TTTTCGTGCA AAGGAAAACGTTTCCG CTTATCCTTT purL - 109 7.86e-08 CTGATGCGCT GACGAAACCGTTTGCG TGGAAATAAA codB - 118 7.86e-08 CTGAAGATAA AAAGCAATCGTTTTCG TGGGGAAATA guaB + 130 2.73e-07 AAAAGGGGTA GATGCAATCGGTTACG CTCTGTATAA purA + 77 4.40e-07 ACTACATGTT GAGGAAAACGATTGGC TGAACAAAAA glnB + 116 6.02e-07 ACACGAGCTG GATGCAAACGATTTCA AGGAATGAAT carA + 90 8.96e-07 ATATCTCCAG AATGCCGCCGTTTGCC AGAAATTCGT Исходные последовательности (найденные мотивы подчеркнуты)
>codB catgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatat aaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagggggaatttcg >purE tggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctg atttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagttttaagacgc >pyrC gcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgaggg cgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagcatagagatta >purR ttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccg gcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggagtgaaatggaa >cvpA cgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttt tattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcgtgggacacat >purM atattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaag gttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtggggacccaagcag >guaB actaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggata gcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcgagatattgccc >glnB aactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttc ccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttcaaggaatagc >purL aggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttat ttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaagacgagagactt >purA accaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaac aaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtgattttgaaaaa >carA tgtcgcttaatgcctgtaaaacatgcatgagccacaaaataatataaaaaatcccgccattaagttgacttttagcgcccatatctccagaatgccgccgtttgccag aaattcgtcggtaagcagatttgcattgatttacgtcatcattgtgaattaatatgcaaataaagtgagtgaatattctctggagggtgtttСравнение результатов с реальными сайтами узнавания Pur.
Только в 11 из изначально выданных 17 последовательностей были найдены мотивы, что на одну последовательность больше, чем их есть в реальных сайтах узнавания PurP (которых 10). Из них неверно был указан сайт для purA, а лишней оказалась находка в carA. Последовательности, в которых вообще не было найденно мотивов: folD, rpiA, fixA, rbsD, araD. Найденно 11, реальных 10, правильных 9.
Чувствительность: 9/10=0.9
Специфичность: 9/11=0.81