Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~mashik/t4_html/phyl_tree_analysis.html
Дата изменения: Sun May 28 15:55:22 2006
Дата индексирования: Tue Oct 2 15:07:35 2012
Кодировка: Windows-1251
Исследование филогенетического дерева На главную страницу четвертого семестра

Исследование филогенетического дерева белков семейства глобинов (PF00042) из Felidae и Galliformes

  Составление выборки белковых последовательнотей семейства глобинов(PF00042) было произведено с помощью поисковой системы SRS следующим образом (см. таблицу):

Формулировка запроса Запрос Кол-во белков
   В первом поле запроса SRS был поставлен указатель DBxref и  прописан идентификатор Pfam белкового семейства глобинов  PF00042.
   Во втором поставлен указатель Taxonomy и через логический  знак или ( | ) прописаны два изучаемых таксона  Felidae и Galliformes.
  ([uniprot-DBxref_:PF00042*] & ([uniprot-Taxonomy:
  Felidae*] | [uniprot-Taxonomy:Galliformes*]))
41
В поле AccessionNumber было задано следущее: Q8WWM9 | P09105| P02008| P69905| P68871| P02042| P02100| P69891| P69892| Q9NPG2 ((((((((([uniprot-AccNumber:Q8WWM9*] | [uniprot-AccNumber:P09105*]) | [uniprot-AccNumber:P02008*]) | [uniprot-AccNumber:P69905*]) | [uniprot-AccNumber:P68871*]) | [uniprot-AccNumber:P02042*]) | [uniprot-AccNumber:P02100*]) | [uniprot-AccNumber:P69891*]) | [uniprot-AccNumber:P69892*]) | [uniprot-AccNumber:Q9NPG2*]) 10
Аналогично для внешней группы (([uniprot-AccNumber:P02144*] | [uniprot-AccNumber:P02202*]) | [uniprot-AccNumber:Q9DGJ1*]) 3

Для выполнения задания была составлена
выборка, в которую были включены три части (список соответствующих организмов прилагается):
  1. Белки семейства глобинов (PF00042) из Felidae и Galliformes;
  2. Глобины человека — Q8WWM9, P09105, P02008, P69905, P68871, P02042, P02100, P69891, P69892, Q9NPG2;
  3. Внешняя группа (outgroup) — P02144, P02202, Q9DGJ1;

Затем было сделанно множественное выравнивание данных последовательностей, и с помощью ClustalX было получено филогенетическое дерево:




На рисунке довольно много ортологов и всего три пары паралогов.

К паралогам можно отнести следующие пары:

1. HBE_CHICK и HBRH_CHICK (отмечены оранжевым цветом в правой части рисунка).
2. HBG2_HUMAN и HBG1_HUMAN (отмечены серым цветом в правой части рисунка).
3. По-видимому, Q5QSB1_CHICK и Q5QRU6_CHICK (отмечены красным цветом в левой части рисунка).

Все остальные пары, отмеченные разными цветами, по-видимому, представляют собой ортологи.

Надо также отметить, что выделение "пар" ортологов не совсем верно. Часто бывает, что ортологичную группу составляют более двух белков (генов). Примером может служить группа ортологов HBA (Hemoglobin alpha subunit), расположенных в нескольких кластерах в правой верхней части дерева. Сами кластеры также можно считать ортологичными.
Пары ортологов определялись по наличию общего предка и по соответствию между их последовательностью ответвления на полученном филогенетическом дереве и последовательностью ответвления организмов, которым они принадлежат на таксономическом дереве.

Таксономического дерево, соответствующее нашей белковой выборке, было получено с помощью Taxonomy Browser NCBIю Для выполнения этой задачи мы проследовали с NCBI Taxonomy Homepage по ссылке Taxonomy common tree и указали в окошке открывшейся страницы путь к файлу с перечнем оранизмов. Построенное дерево было сохранено в 2 вариантах: текстовом формате (save as text tree) или в виде скобочной структуры формата phylip (save as phylip tree). Далее, на основе скобочной структуры дерево было визуализировано в программе GenMaster. Длины всех ветвей на представленном дереве полностью одинаковы, поскольку они не отображают эволюционные расстояния между таксонами, а лишь указывают на их иерархию и взаимную принадлежность. Окончательный вариант дерева приведен ниже:



  Посмотреть текстовый вариант таксономического дерева можно здесь.