Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~Redwitch/t3_files/bootstrap.doc
Дата изменения: Tue Dec 20 16:03:35 2005
Дата индексирования: Tue Oct 2 13:12:29 2012
Кодировка: koi8-r

Бутстреп-анализ и визуализация деревьев в пакете PHYLIP

Бутстреп-анализ выравнивания мутированных последовательностей,
соответствующих листьям данного дерева

. GeneDoc: перевести выравнивание в PHYLIP-формат;
. Seqboot: получение 100 бутстреп-реплик выравнивания;
. Dnaml: получение 100 скобочных формул;
. Consense: бутстреп-анализ.

Заметим, что значение транзиции/трансверсии = 1.

Бутстреп-анализ - это процесс проверки достоверности ветвей некоторого
дерева. Для этого необходима большая выборка деревьев, сделанная следующим
образом: создаются 100 случайных выравниваний путем последовательного
удаления одной позиции и замены ее на копию одной из оставшихся. Так
делается до тех пор, пока ни будет заменена половина позиций. В итоге,
анализируется выборка деревьев, а также подсчитывается, в скольких из ста
деревьев получилась та или иная ветка. Считается, что если в ста деревьях
присутствует некоторая ветка, то она достоверна, то есть, должна быть на
реальном дереве.

Полученное консенсусное дерево выглядит следующим образом:

+--------------------A
|
+100.0-| +------E
| | +100.0-|
| +-83.0-| +------F
+------| |
| | +-------------D
| |
| +---------------------------C
|
+----------------------------------B

Реальное дерево выглядит так.

Топология дерева восстановлена правильно. Бутстреп-значения промежуточных
ветвей больше 70, значит, ветви достоверные.

|Реальное дерево: |Консенсус |
|топология | |
| |Топология:|Бутстре|
| | |п |
| |ABCDEF | |
|111100 |111100 |100.00 |
|011000 |011000 |100.00 |
|111000 |111000 |83.00 |





Jackknife-анализ выравнивания мутированных последовательностей,
соответствующих листьям данного дерева

. GeneDoc: перевести выравнивание в PHYLIP-формат;
. Seqboot: получение 100 jackknife-реплик выравнивания;
. Dnaml: получение 100 скобочных формул;
. Consense: jackknife-анализ.

Методика jackknife-анализа отличается от бутстрепа лишь тем, что после
удаления некоторого столбика выравнивания, он не замещается на копию
некоторого оставшегося. Возожно, преимущество создания копии заключается в
том, что остается прежняя длина выравнивания.

Полученное консенсусное дерево выглядит так:

+--------------------A
|
+100.0-| +------E
| | +100.0-|
| +-76.0-| +------F
+------| |
| | +-------------D
| |
| +---------------------------C
|
+----------------------------------B


Топология также восстановлена правильно, но видно, что одна из ветвей имеет
меньший «вес»: 76. Это можно объяснить тем, что эта ветвь короткая (9 замен
на реальном дереве) и на некоторых деревьях «привита» не туда. Подобного
рода ошибка уже встречалась в случае реконструкции дерева программой
ednaml.

|Реальное дерево: |Консенсус |
|топология | |
| |Топология:|Jackkni|
| | |fe |
| |ABCDEF | |
|111100 |111100 |100.00 |
|011000 |011000 |100.00 |
|111000 |111000 |76.00 |

Графические изображения дерева с помощью пакета PHYLIP

Рисовать будем дерево, ранее полученное с помощью метода Neighbor-Joining
(здесь одно второе).

. Drawtree: бескорневой вид;
. Retree: переукоренение дерева, полученного предыдущей программой;
. Drawgram: укорененная в среднюю точку филограмма, ориентированная
горизонтально.

Получены следующие изображения:

[pic] [pic]
Дерево было укоренено верно: начальный предок в реальном дереве
располагается примерно в средней точке.


Восстановление предковой последовательности для выравнивания мутированных
последовательностей и сравнение с реальной предковой последовательностью

. Dnaml: получение 1 скобочной формулы по исходному выравниванию в
формате PHYLIP, а также восстановление нуклеотидных
последовательностей в узлах дерева.

Получено следующее дерево:

+-----B
+-----1
| +-----C
|
| +-------------------------F
| +-----4
2--3 +-------------------E
| |
| +-----------D
|
+--------A

Известно, что предковая последовательность реального дерева лежит на самом
деле между листом F и узлом 4.
Сравним восстановленную последовательность узла 4 с реальной предковой.

Для получения последовательности узла 4 выполним:
grep " 4" outfile > 4_seq.fasta
Для получения выравниваний:
needle X.fasta 4_seq.fasta

При составлении выравнивания с реальной предковой последовательностью
получим значение идентичности: 63,8%.
В целом, значение не большое.
Проверим также сходство полученной последовательности с последовательностью
ближайшего узла (x2). Значение идентичности: 70,7%.

По полученным данным можно сделать вывод, что программа не очень точно
реконструирует предковую последовательность в узлах.