Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Try2Fly/t3_files/Report12.doc
Дата изменения: Mon Dec 19 12:56:54 2005
Дата индексирования: Tue Oct 2 12:08:49 2012
Кодировка: koi8-r

Сравнение разных способов оценки эволюционных расстояний между
гомологичными нуклеотидными последовательностями

(Занятие 12)

. Сравнение разных способов оценки эволюционных расстояний между
гомологичными нуклеотидными последовательностями:

Истинные расстояния в моей модели (число точечных замен на 100
нуклеотидов):

|R |A |B |C |D |E |F |N2 |N3 |N4 |N5 | |R | |90 |90 |90 |100 |100 |100
|15 |50 |70 |15 | |A | | |40 |80 |160 |190 |190 |75 |40 |20 |105 | |B |
| | |80 |160 |190 |190 |75 |40 |20 |105 | |C | | | | |160 |190 |190
|75 |40 |60 |105 | |D | | | | | |200 |200 |85 |120 |140 |115 | |E |
| | | | | |170 |115 |150 |170 |85 | |F | | | | | | | |115 |150
|170 |85 | |N2 | | | | | | | | |35 |55 |30 | |N3 | | | | | |
| | | |20 |65 | |N4 | | | | | | | | | | |85 | |
Uncorrected distances (среднее число несовпадающих нуклеотидов на 100
позиций):

|R |A |B |C |D |E |F |N2 |N3 |N4 |N5 | |R | |45,26 |45,4 |43,97 |46,7
|48,28 |47,13 |9,34 |29,31 |38,51 |10,2 | |A | | |24,14 |41,38 |56,03
|65,37 |62,93 |39,37 |25,57 |13,07 |48,85 | |B | | | |40,8 |58,76 |65,95
|63,65 |40,95 |23,85 |12,64 |49,86 | |C | | | | |57,61 |62,64 |62,64
|39,22 |24,43 |34,2 |49,43 | |D | | | | | |63,65 |61,93 |42,67 |50,29
|53,59 |48,71 | |E | | | | | | |61,93 |51,15 |59,34 |63,36 |43,1 | |F
| | | | | | | |50 |57,33 |61,64 |42,24 | |N2 | | | | | | | |
|22,7 |32,47 |17,1 | |N3 | | | | | | | | | |14,08 |35,34 | |N4 |
| | | | | | | | | |43,53 | |
Попарные эволюционные расстояния, вычисленные по методу Джукса - Кантора:

|R |A |B |C |D |E |F |N2 |N3 |N4 |N5 | |R | |69,37 |69,73 |66,18 |73,08
|77,39 |74,24 |9,97 |37,17 |54,03 |10,97 | |A | | |29,13 |60,18 |103,1
|154 |137 |55,82 |31,28 |14,37 |79,02 | |B | | | |58,9 |114,8 |158,6
|141,6 |59,22 |28,71 |13,85 |81,97 | |C | | | | |109,6 |135,3 |135,3
|55,52 |29,55 |45,65 |80,69 | |D | | | | | |141,6 |131 |63,12 |83,26
|94,03 |78,61 | |E | | | | | | |131 |85,93 |117,5 |139,7 |64,12 | |F
| | | | | | | |82,4 |108,4 |129,4 |62,12 | |N2 | | | | | | |
| |27,04 |42,55 |19,4 | |N3 | | | | | | | | | |15,6 |47,8 | |N4
| | | | | | | | | | |65,14 | |
> Вторая и третья матрицы были вычислены инструментом
distmat пакета EMBOSS

по множественному выравниванию, построенному программой
emma c параметром

-gapopen 100 (для того что бы исключить появление гэпов -
мутациями в последовательностях были только замены);
> A, B, C, D, E и F - соответствующие листья модельного
дерева;
> R - корень модельного дерева (узел 1);
> N2, N3, N4 и N5 - соответствующие узлы модельного дерева.

По данным вышеприведенных матриц был построен график сравнения двух
методов оценки эволюционных расстояний.


График зависимости оценки двух методов определения эволюционных расстояний
от "истинных" расстояний между последовательностей

(расстояния даны на длину последовательности в 100 нуклеотидов):






























> График со светло-зелеными маркерами - зависимость оценки
по методу неоткорректированных расстояний (uncorrected
distances);
> График со светло-синими маркерами - зависимость оценки
методом Джукса-Кантора

(Jukes-Cantor distances);
> Красная прямая - график "идеальной" оценки (линейной
зависимости

[Оцененные расстояния]*3/4=[Истинные растояния]).

"Идеальная" оценка представляет из себя вышеприведенную зависимость,
потому что программа msbar, с помощью которой были получены
мутированные последовательности, считает прямые (происходящие в
процессе одного элементарного эволюционного события) замены нуклеотида
сам на себя (A=>A, T=>T, etc.) мутациями, что, конечно, не является
верным. Таким образом, величина 3/4, на которую умножаются оцененные
расстояния, это вероятность того, что из четырех возможных вариантов
(X=>A, X=>T, X=>G, X=>C), случайно выбранный окажется настоящей
мутацией.

Как можно заметить из графика, оценка методом Джукса-Кантора является
гораздо более верной, чем методом неоткорректированных расстояний -
последняя близка к истинной только при очень небольших числах замен -
не более половины от длины поледовательности, в то время как Джукс-
Кантор в начале полностью соответствует "идеальной" зависимости, давая
некоторый разброс только при числе мутаций, превышающем длину
последовательности (хотя и в этом случае его аппроксимация очень близка
к графику y=3/4x). Данные наблюдения обьясняются тем фактом, что метод
Джукса-Кантора, в отличие от метода неоткорректированных расстояний
учитывает возможность обратных замен. Высокая точность оценок также
является следствием того, что наша модель равновероятностна (скорость
эволюции/мутирования одинакова).






-----------------------
Истинные расстояния

О
ц
е
н
е
н
н
ы
е

р
а
с
с
т
о
я
н
и
я