Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.fbb.msu.ru/~smivic/Projects/Term_4/tree1.html
Дата изменения: Mon Mar 8 17:19:35 2010
Дата индексирования: Tue Oct 2 11:01:54 2012
Кодировка: Windows-1251
Деревья - учебный сайт Смирновой Виктории

Учебный сайт Смирновой Виктории

Главная Проекты Семестры


Филогенетические деревья. Занятия 1 и 2.


  1. Отобранные бактерии

    НазваниеМнемоника
    Rhizobium etliRHIEC
    Ralstonia pickettiiRALPJ
    Erwinia carotovoraERWCT
    Salmonella typhimuriumSALTY
    Yersinia pseudotuberculosisYERPS
    Vibrio fischeriVIBFM
    Proteus mirabilisPROMH
  2. Скобочная формула дерева

       (RHIEC, (RALPJ, (VIBFM, (PROMH, (YERPS, (ERWCT, SALTY))))));
      
  3. Изображение дерева


  4. Ветви дерева

    Дерево содержит четыре нетривиальные ветви:
    1) {RHIEC, RALPJ} против {VIBFM, PROMH, YERPS, ERWCT, SALTY}
    2) {RHIEC, RALPJ, VIBFM,} против {PROMH, YERPS, ERWCT, SALTY}
    3) {RHIEC, RALPJ, VIBFM, PROMH} против {YERPS, ERWCT, SALTY}
    4) {RHIEC, RALPJ, VIBFM, PROMH, YERPS} против {ERWCT, SALTY}

    Занятие 2.

  5. Таксоны выбранных бактерий
  6. (определены с помощью таксономического сервиса NCBI:
    НазваниеТаксон
    Rhizobium etliBacteria; Proteobacteria; Alphaproteobacteria; Rhizobiales; Rhizobiaceae; Rhizobium/Agrobacterium group; Rhizobium
    Ralstonia pickettiiBacteria; Proteobacteria; Betaproteobacteria; Burkholderiales; Burkholderiaceae; Ralstonia
    Erwinia carotovoraBacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Pectobacterium
    Salmonella typhimuriumBacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Salmonella; Salmonella enterica; Salmonella enterica subsp. enterica
    Yersinia pseudotuberculosisBacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Yersinia
    Vibrio fischeriBacteria; Proteobacteria; Gammaproteobacteria; Vibrionales; Vibrionaceae; Aliivibrio
    Proteus mirabilisBacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; Enterobacteriaceae; Proteus

    Ветвь {VIBFM, PROMH, YERPS, ERWCT, SALTY} выделяет Гамма-протеобактерии.
    Ветвь {PROMH, YERPS, ERWCT, SALTY} выделяет энтеробактерии.
     
  7. Выбранная функция: Энолаза (ENO)

    Файл с последовательностями белков ENO_RHIEC, ENO_RALPJ, ENO_VIBFM, ENO_PROMH, ENO_YERPS, ENO_ERWCT, ENO_SALTY в fasta-формате.

  8. Выравнивание отобранных белков программой muscle:
    файл msf
    файл fasta


     

  9. *Диагностические позиции выравнивания

    Импортированное в GeneDoc выравнивание (выделены консервативные для группы гаммапротеобактерий позиции. Для энтеробактерий позиции те же, другую группу составить нельзя):

    Диагностические позиции выравнивания - позиции, в которых все последовательности из данного таксона содержат некоторый остаток, не встречающийся в этой позиции в последовательностях, не относящихся к таксону. Диагностические позиции: K3, V5, K6, A23, E24, H26, F31, M/L34, A35, V71, G73, P74, A76, K85, D86, F106, A124, K126, H133, I134, L135, N138, T140, S145, E158, N163, Q172, K180, A194, V196, K198, K200, A220, E228, A232, L237, K239, T242, K268, F270, T271, E274,H277, Q285, Q306, D312, F345, K359, D363, A380, A390, A417, P423, N425, K428, E429, K431, Q433.
     
  10. Реконструкция дерева программой fprotpars.

    Программа выдала 3 дерева. Скобочные формулы:
      
      (((RALPJ,RHIEC),(((YERPS,ERWCT),SALTY),PROMH)),VIBFM)[0.3333];
      ((((RALPJ,RHIEC),((YERPS,ERWCT),SALTY)),PROMH),VIBFM)[0.3333];
      ((((RALPJ,RHIEC),(YERPS,(ERWCT,SALTY))),PROMH),VIBFM)[0.3333];
      
    Изображения:


    Сравним первое из полученных деревьев с правильным. Его нетривиальные ветви:
    1){RALPJ, RHIEC} против {YERPS, ERWCT, SALTY, PROMH, VIBFM}
    2){RHIEC, RALPJ, VIBFM,} против {PROMH, YERPS, ERWCT, SALTY}
    3){RHIEC, RALPJ, VIBFM, PROMH} против {YERPS, ERWCT, SALTY}
    4){RHIEC, RALPJ, VIBFM, PROMH, SALTY} против {ERWCT, YERPS}
    Разбиения 1, 2 и 3 у деревьев совпадают, но 4-ые различные: у правильного дерева есть ветви {RHIEC, RALPJ, VIBFM, PROMH, YERPS} против {ERWCT, SALTY}, но нет {RHIEC, RALPJ, VIBFM, PROMH, SALTY} против {ERWCT, YERPS}.


     

  11. Оценка эволюционных расстояний между последовательностями программой fprotdist.

    Матрица расстояний:
      
            VIBFM     PROMH     SALTY     ERWCT     YERPS     RHIEC     RALPJ 
    VIBFM   0.000000  0.152839  0.142313  0.143594  0.121746  0.525515  0.447445
    PROMH   0.152839  0.000000  0.095445  0.106934  0.106114  0.526616  0.457518
    SALTY   0.142313  0.095445  0.000000  0.053870  0.063430  0.484270  0.435582
    ERWCT   0.143594  0.106934  0.053870  0.000000  0.041740  0.507924  0.431272
    YERPS   0.121746  0.106114  0.063430  0.041740  0.000000  0.500986  0.426479
    RHIEC   0.525515  0.526616  0.484270  0.507924  0.500986  0.000000  0.435659
    RALPJ   0.447445  0.457518  0.435582  0.431272  0.426479  0.435659  0.000000
    
      
    Аддитивность: если есть четыре последовательности A,B,C,D, то из трех сумм
    1) d(A,B) + d(C,D) 2) d(A,C) + d(B,D) 3) d(A,D) + d(B,C)
    две равны между собой и больше третьей.
    Возьмем VIBFM, ERWCT, YERPS и RALPJ.
    1)0,143594+0,426479=0,568384
    2)0,121746+0,431272=0,553018
    3)0,447445+0,041740=0,489185
    1 и 2 различаются на 0,015366, больше 3-ей.

    'Ультраметрическое пространство': d (A,B) <= max(d (A,C), d (B,C))
    Для PROMH, SALTY и YERPS: 0.095445 <= max(0.106114, 0.063430) - верно (меньше на 0,010669)
    Для VIBFM, RHIEC и RALPJ: 0.525515 <= max(0.447445, 0.435659) - не верно (больше на 0,07807)

     
  12. Реконструкция дерева программой fneighbor.

    Результаты действия двух алгоритмов (слева Neighbor-Joining, справа UPGMA):

    Скобочные формулы:

    ((RHIEC:0.25253,RALPJ:0.18313):0.19101,(PROMH:0.06152,(SALTY:0.02692,(ERWCT:0.02172,YERPS:0.02002):0.01086):0.01014):0.01769,VIBFM:0.07764);

    ((VIBFM:0.07006,(PROMH:0.05142,(SALTY:0.02932,(ERWCT:0.02087,YERPS:0.02087):0.00845):0.02209):0.01865):0.16712,(RHIEC:0.21783,RALPJ:0.21783):0.01935);

    Приведенные деревья имеют одинаковые нетривиальные ветви, но отличаются ими от настоящего: нет ветви {RHIEC, RALPJ, VIBFM, PROMH} против {YERPS, ERWCT, SALTY} и, соответственно, {RHIEC, RALPJ, VIBFM, PROMH, YERPS} против { ERWCT, SALTY}. У деревьев различны длины ветвей. Алгоритм UPGMA выдает укорененное дерево, хотя на изображении, созданном TreeDyn этого не видно. Дерево, построенное через Neighbor-Joining - явно не ультраметрическое.



© Smirnova Victoriya, 2009