|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~anuta_al/Practice_8.html
Дата изменения: Sat Dec 19 18:30:19 2009 Дата индексирования: Tue Oct 2 03:31:52 2012 Кодировка: Windows-1251 |
| Число находок с Е-value<0,001 | 1 | |
| Характеристика лучшей находки: | ||
| E-value находки | 9e-63 | |
| Название геномной последовательности | AE006179 | |
| Координаты выравнивания(-ий) в найденной последовательности | 2577-3191 | |
>AE006179 Pasteurella multocida subsp. multocida str. Pm70
Query: 1 CDICLDPPKQYDGSTDAQIALSTIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYG 60
CDICLDPPKQYDG DAQ +STI R+ QRFG+ YV+ V+RG +NQ+I+D H++L VYG
Sbjct: 2577 CDICLDPPKQYDGLIDAQKVMSTIYRIGQRFGVHYVIAVLRGLSNQKIKDNQHEQLSVYG 2756
Query: 61 MGRDKSHEHWVSVIRQLIHLGLVTQNIAQHSA-LQLTEAARPVLRGESSLQLAVPRIVAL 119
+G+DKS EHW SVIRQLIHLG + Q +A LQLTE A+P+LRGE L LA+PRI +L
Sbjct: 2757 IGKDKSKEHWQSVIRQLIHLGFIKQVFDHFNATLQLTENAKPILRGEQPLSLAMPRISSL 2936
Query: 120 KP-KAMQKSFGGNYDXXXXXXXXXXXXSIADESNVPPYVVFNDATLIEMAEQMPITASEM 178
A Q+ YD IAD+ N+P Y+VFNDATL EMA+ P T +EM
Sbjct: 2937 TSVVAPQRYAIAQYDKDLFARLRFLRKQIADKENIPAYIVFNDATLQEMAQYQPTTKAEM 3116
Query: 179 LSVNGVGMRKLERFGKPFMALIRAH 203
L++NGVG K ERF +PFM +I+ H
Sbjct: 3117 LAINGVGATKFERFAQPFMQIIQQH 3191
Для этого создадим в своей директории файл с последовательностью того
участка генома, который был найден в предыдущем упражнении как лучший: (файл)
Затем вырежем найденную в предыдущем задании последовательность в файл:
seqret -sask
Reads and writes (returns) sequences
Input (gapped) sequence(s): ae004439.entret
Begin at position [start]: 2577
End at position [end]: 3191
Reverse strand [N]: Y
output sequence(s) [ae004439.fasta]:ae004439.fasta
Полученный на выходе файл:
(ae004439.fasta)
На сайте EBI (http://www.ebi.ac.uk/Tools/)
запустим поиск этой последовательности в банке "EMBL standard prokaryote".
У первой находки (AE004439) был выбран режим "Show aligments".
В результате была выдана следующая информация:
>EM_PRO:AE004439; AE004439 Pasteurella multocida subsp. multocida str. Pm70, complete
genome.
Length = 2257487
Score = 1110 bits (1230), Expect = 0.0
Identities = 615/615 (100%)
Strand = Plus / Minus
Query: 1 gaccccgaccaaatcgctggcaacacagcgtgatttagcgctcgcctattcccccggtgt 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 3191 gaccccgaccaaatcgctggcaacacagcgtgatttagcgctcgcctattcccccggtgt 3132
Query: 61 tgcggtcccctgtttagaaatccaagcagatcccgctgcctcttatcgttatacctccag 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 3131 tgcggtcccctgtttagaaatccaagcagatcccgctgcctcttatcgttatacctccag 3072
Query: 121 aggcaatttagttgctgtgatttccaatggcacggcggttttaggtttaggcaacattgg 180
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 3071 aggcaatttagttgctgtgatttccaatggcacggcggttttaggtttaggcaacattgg 3012
Query: 181 tgcattagcgggaaaaccggtaatggaagggaaaggggtgttattcaaaaaatttgccgg 240
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 3011 tgcattagcgggaaaaccggtaatggaagggaaaggggtgttattcaaaaaatttgccgg 2952
Query: 241 tgtcaacgtatttgatatcgaaattgacgaaagagatccagataaattagtcgatattat 300
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 2951 tgtcaacgtatttgatatcgaaattgacgaaagagatccagataaattagtcgatattat 2892
Query: 301 tgcttcgctagaacccacttttggtggcattaacttggaagatattaaagccccagaatg 360
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 2891 tgcttcgctagaacccacttttggtggcattaacttggaagatattaaagccccagaatg 2832
Query: 361 tttctatattgaacaaaaattacgtgagcggatgaaaattcctgttttccatgatgacca 420
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 2831 tttctatattgaacaaaaattacgtgagcggatgaaaattcctgttttccatgatgacca 2772
Query: 421 acatggtaccgctattatcagtgctgctgcgattttgaatggcttacgtatcgtgaaaaa 480
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 2771 acatggtaccgctattatcagtgctgctgcgattttgaatggcttacgtatcgtgaaaaa 2712
Query: 481 agacattgccaaggttaaattgattgcctcgggcgcgggtgccgcatcgattgcgtgttt 540
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 2711 agacattgccaaggttaaattgattgcctcgggcgcgggtgccgcatcgattgcgtgttt 2652
Query: 541 aaatttattggtcagtttaggtttaccgcgtgaaaatattatcgtctgtgattcaaaagg 600
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 2651 aaatttattggtcagtttaggtttaccgcgtgaaaatattatcgtctgtgattcaaaagg 2592
Query: 601 ggtgattttccatgg 615
|||||||||||||||
Sbjct: 2591 ggtgattttccatgg 2577
FT CDS complement(983..3259) FT /codon_start=1 FT /transl_table=11 FT /gene="mdh_1" FT /locus_tag="PM0002" FT /product="Mdh" FT /db_xref="GOA:Q9CPN5" FT /db_xref="InterPro:IPR016040" FT /db_xref="UniProtKB/TrEMBL:Q9CPN5" FT /protein_id="AAK02086.1" FT /translation="MDAQLRQAALDFHEFPTPGKIEVTPTKSLATQRDLALAYSPGVAV FT PCLEIQADPAASYRYTSRGNLVAVISNGTAVLGLGNIGALAGKPVMEGKGVLFKKFAGV FT NVFDIEIDERDPDKLVDIIASLEPTFGGINLEDIKAPECFYIEQKLRERMKIPVFHDDQ FT HGTAIISAAAILNGLRIVKKDIAKVKLIASGAGAASIACLNLLVSLGLPRENIIVCDSK FT GVIFHGRDERMDETKKLYAIEDNGKRTLAEVINDADIFLGCSAAGTLTQDMVKTMAANP FT LILALANPDPEILPPLAKAVRPDAIVCTGRSDYPNQVNNVLCFPFIFRGALDVSATAIN FT EEMKLAAVHAIADLALAEQSEVVTSAYGETELSFGPEYLIPKPFDPRLIVKIAPAVAKA FT AMDSGVATRPIKDFDAYIEKLTQFVYKTNLFMKPVFAQAKQNKKRVLLTDGEESRVLHA FT VQEIATLGIATPILLGRPSVIAQKIKQLGLHIQEGRDFELVDIENNPYFEECYKTYHNL FT LKRKGITPAGAQRKMLHNPTVIGATLLQLGKADAMLCGLVGPYASHLSNIKEVIGVQPC FT VPTPATVNGLVLPTGNLFITDTFVNHNPTAQELAEITIMAANEVSRFGIEPKVALVSHS FT NFGTFDDPSAVKMREVLHLVKEKAPDLIIDGEMHCDVALNEKLRQDIMPDSPLKGAANL FT LVMPNMEAARISLNLLQGTATPITVGPILMGMNKPVHILTSASSVRRIINMVAIAAANV FT EPTCK"
Поищем гомологи этого гена в геноме Pasteurella multocida программой
BLASTN.
Для этого сначала выберем запись AP009048, программой ENTRET получим файл ap009048.entret, затем вырежем программой seqret участок последовательности, соответствующий 3628988-3630817 CDS.
В результате получим файл: ap009048.fasta
Затем этот файл дадим на обработку программе BLASTN для поиска гомологов в геноме Pasteurella multocida.
Введем следующую последовательность команд:
blastall -p blastn -d index -i ap009048.fasta > ap009048-pm
Полученный файл:
ap009048-pm
Первоначально, поставив порог E-value=0.001, BLASTN не нашел ни одного гомолога. Затем, изменив порог на 10.0, было получено 13 результатов, среди них E-Value лучшей находки составляет 0.013.
Название геномной последовательности: AE006179
Координаты выравнивания: 1593-1627
Лучшая находка:
Query: 214 tcaccgctgatttcgttgatgaaagatcaggtgga 248
||||| ||||| ||||| ||||||||||| |||||
Sbjct: 1593 tcaccactgatctcgttaatgaaagatcaagtgga 1627
| TBLASTN | BLASTN | |
| AE006179 |
E-value: 9*10-63
Координаты в банке: 2577..3191 Длина: 614 |
E-value: 0.013
Координаты в банке: 1593..1627 Длина: 34 |