Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~kinta/Term4/protocol2.html
Дата изменения: Tue Mar 6 21:12:46 2007
Дата индексирования: Tue Oct 2 10:06:51 2012
Кодировка: Windows-1251
evolution назад к четвертому семестру

Филогенетические деревья - моделирование эволюции гена


1.) Изображение дерева, описанного заданной формулой.

С помощью графического редактора Paint было получено изображение дерева, описанного заданной формулой:

2.) Описание ветвей дерева как разбиения множества листьев (считая дерево бескорневым).

Описание разбиений оформлено в виде таблички, столбцы которой соответствуют листьям дерева, а строки - ветвям дерева, при этом дним символом помечены листья, находящиеся по одну сторону от данной ветви:
ABCDEF
..****
...***
....**

3.) Получение искуственных мутантных последовательностей, соответствующих листьям и узлам дерева, считая, что в корне находится последовательность гена белка DYR_ECOLI.

4.) Реконструкция дерева алгоритмами UPGMA, Neighbor-joining и максимального правдоподобия.

В результате реконструкции дерева алгоритмом максимального правдоподобия с помощью программы fdnaml (команда fdnaml all.fasta -ttratio 1 -auto) было получено следующее "текстово-графическое" изображение дерева:

  +-----B         
  |  
  |                    +-------------------------F         
  |          +---------4  
  |  +-------3         +---------E         
  |  |       |  
  1--2       +--------D         
  |  |  
  |  +------C         
  |  
  +----A         

Чтобы реконструировать дерево алгоритмами UPGMA или Neighbor-joining, сначала надо посчитать попарные расстояния между последовательностями программой fdnadist: fdnadist all.fasta -ttratio 1 -auto.
После этого этот файл был подан на вход программе fneighbor: (fneighbor all.fdnadist -auto для реконструкции алгоритмом Neighbor-joining и fneighbor all.fdnadist -treetype u -auto для реконструкции алгоритмом UPGMA).
В первом случае было получено следующее изображение:

  +----B         
  ! 
  !  +-----C         
  3--4 
  !  !     +---------D         
  !  +-----2 
  !        !       +----------E         
  !        +-------1 
  !                +------------------------F         
  ! 
  +-----A         

Во 2ом такое:
                           +-------A         
                        +--1 
                 +------2  +-------B         
                 !      ! 
           +-----3      +----------C         
           !     ! 
  +--------4     +-----------------D         
  !        ! 
--5        +-----------------------E         
  ! 
  +--------------------------------F         

Сравнение реконструированных деревьев между собой и с правильным деревом

Для сравнение предложено было сделать таблицу, в левой части которой приведены (в виде точек и звездочек) все ветви, встреченные во всех деревьях (исходном и трех реконструкциях), а в правой добавлены четыре столбца, соостветствующие четырем деревьям. Знаком + отмечено, в каких деревьях встретилась каждая из ветвей.
ABCDEF правильное дерево1ое2ое3ее
..**** ++++
...*** ++++
....** ++++

Таким образом, мы видим, что ветви во всех трех реконструкциях определены правильно, наиболее наглядным мне показалось дерево, реконструированное алгоритмом UPGMA.


Филогенетические деревья (продолжение) - bootstrap и drawtree


5.) Бутстреп-анализ выравнивания мутированных последовательностей

С помощью программы fseqboot было создано 100 бутстреп-реплик выравнивания: fseqboot all.fasta -auto . Результатом выполнения команды стал файл all.fseqboot.
Он был подан на вход программе fdnaml, в выходном файле all.treefile содержится 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний.
Далее файл all.treefile был подан на вход программе fconsense, в выходной файл программой были помещены результаты бутстреп-анализа.
Выходной файл all.fconsense содержит следующее неукорененное дерево:
 
        +---------------------------A
         |
  +------|      +--------------------B
  |      |      |
  |      +-46.0-|             +------F
  |             |      +-75.0-|
  |             +-49.0-|      +------E
  |                    |
  |                    +-------------D
  |
  +----------------------------------C

Реальные данные:
ABCDEF
..****
...***
....**

Результаты бутстеп-анализа:
ABCDEF сколько раз встречается (из 100)
.*.*** 46
...*** 49
....** 75

Таким образом, видно, что 2 из 3 ветвей найдены верно. А 3яя ветвь - не совпадает с реальной, но интересно то, что программа все же выдает эту ветвь - она имеет наибольшую встречаемость среди ветвей, не отраженных в структуре дерева (28 из 100).

6.) Создание изображения своего дерева программой fdrawtree

Скобочная формула была помещена в отдельный файл, который был подан на вход программе fdrawtree. В результате было получено следующее изображение:


© Виноградова Светлана