Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~vampire/term3/Practise4.html
Дата изменения: Fri Oct 6 19:00:17 2006
Дата индексирования: Tue Oct 2 11:40:03 2012
Кодировка: Windows-1251
Practice4

Занятие 4. Поиск сходных нуклеотидных последовательной, не кодирующих белки

На главную страницу третьего семестра

Наша задача — выбрать тРНК у кишечной палочки (Escherichia coli K-12) и найти наиболее похожую на нее последовательность в родственном геноме. В качестве "родственного" генома взят геном достаточно далекого организма – геном сенной палочки (Bacillus subtilis).

  1. Была выбрана тРНК которая была использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи deoD_Ecoli.
  2. В 4-ой позиции белка находится пролин. Соответствующий ему кодон CCA.

    E.coli использует три разных тРНК для данного аминокислотного остатка.
    Таблица 1. Выбор т-РНК
    (шаблон отчета)

     Аминокислотный остаток в 4-ой позиции белка DEOD_ECOLI P
      Соответствующий кодон в гене 5'-CCA-3'
      Идеальный антикодон 5'-UGG-3'
      Сколько можно было бы ожидать разных тРНК для остатка P, если опираться на генетический код? 3
      Сколько разных тРНК для остатка P аннотировано в геноме кишечной палочки? 3
      Характеристика выбранной для дальнейшего изучения тРНК:
          имя гена proM
          локализация гена в геноме 3980758..3980834
          распознаваемый кодон CCD
          антикодон UGG

    Результат поиска всех пролиновых тРНК у Escherichia coli K-12

    FT   gene            2284233..2284309
    FT                   /gene="proL"
    FT                   /locus_tag="b2189"
    FT                   /note="synonyms: proW, ECK2183, JWR0042"
    FT   tRNA            2284233..2284309
    FT                   /gene="proL"
    FT                   /locus_tag="b2189"
    FT                   /product="tRNA-Pro"
    FT                   /anticodon=(pos:2284267..2284269,aa:Pro)
    FT                   /note="codons recognized: CCY; anticodon: GGG proline
    FT                   tRNA2; go_component: cytoplasm [goid 0005737]; go_process:
    FT                   tRNA metabolism [goid 0006399]"
    .
    .
    FT   gene            complement(3706639..3706715)
    FT                   /gene="proK"
    FT                   /locus_tag="b3545"
    FT                   /note="synonyms: proV, ECK3532, JWR0080"
    FT   tRNA            complement(3706639..3706715)
    FT                   /gene="proK"
    FT                   /locus_tag="b3545"
    FT                   /product="tRNA-Pro"
    FT                   /anticodon=(pos:3706679..3706681,aa:Pro)
    FT                   /note="codon recognized: CCG; proline tRNA1; go_component:
    FT                   cytoplasm [goid 0005737]; go_process: tRNA metabolism [goid
    FT                   0006399]"
    .
    .
    FT   gene            3980758..3980834
    FT                   /gene="proM"
    FT                   /locus_tag="b3799"
    FT                   /note="synonyms: proU, ECK3792, JWR0091"
    FT   tRNA            3980758..3980834
    FT                   /gene="proM"
    FT                   /locus_tag="b3799"
    FT                   /product="tRNA-Pro"
    FT                   /anticodon=(pos:3980792..3980794,aa:Pro)
    FT                   /note="codons recognized: CCD; anticodon: UGG proline
    FT                   tRNA3; go_component: cytoplasm [goid 0005737]; go_process:
    FT                   tRNA metabolism [goid 0006399]"

  3. Поиск гомологичных тРНК в родственном геноме
  4. Наша задача — найти в геноме Bacillus subtilis последовательность, наиболее похожую на последовательность тРНК из E.coli, выбранную в упр. 1. Поиск надо провести с помощью 4-х разных программ для быстрого поиска сходных нуклеотидных последовательностей.

    Таблица 2. Поиск гомологичной т-РНК

    Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
    Длина якоря 6   11  28  11 
    Результаты поиска 83 находки  10 находок No hits found 4 находки
    Число находок с E-value < 0,01  
    Характеристика лучшей находки:
          E-value 2.2e-05  2e-11    1e-11 
          длина выравнивания 78  72    72 
          вес выравнивания 40.6 bits (145)  63.9 bits (32)    63.9 bits (32) 
          координаты в геноме 11462 - 11538  158707 - 158636    158707 - 158636 
    Аннотация лучшей находки по записи EMBL:
          имя гена trnO-Ile trnB-Pro   trnB-Pro
          это тРНК? ДА ДА   ДА 
          это тоже пролиновая тРНК? НЕТ ДА   ДА 

    На основании этой таблицы можно сделать вывод, что в данном случае FASTA работает хуже, чем BLASTN и discontiguous MegaBLAST. А MegaBLAST с параметрами по умолчанию для этой задачи не подходит.

    Для работы были использованы следующие команды:

    grep 'codon.*Pro' ecoli.embl > codonPro.txt
    formatdb -i bs_genome.fasta -p F -n bs
    blastall -p blastn -d bs -i trna.fasta -o trna.html -T T
    megablast -d bs -i trna.fasta -o trna1.html -T T -D 2
    megablast -d bs -i trna.fasta -o trna2.html -T T -D 2 -t 16 -N 2 -W 11
    fasta34 trna.fasta bs_genome.fasta 6 -O trna3.html -E 0.01 -d 1 -b 20 -m 6


©Кармушаков Азар