Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/FBB/year_03/doc/term3/material_9.doc
Дата изменения: Thu Nov 18 11:53:42 2004
Дата индексирования: Sat Dec 22 07:22:05 2007
Кодировка: koi8-r

I. Формула Джукса-Кантора для вычисления расстояния между двумя
нуклеотидными последовательностями


[pic]

f - частота отличий в парном нуклеотидном выравнивании (доля позиций
выравнивания, содержащих разные буквы)
d - количество произошедших замен (в пересчете на 1 нуклеотид)


II. Вычисление величин Ka и Ks

1. Вычисление количества синонимичных и несинонимичных нуклеотидных отличий
между парой последовательностей.

Рассмотрим один кодон в выравнивании. Вычислим количество синонимичных
(sd) и несинонимичных (nd) нуклеотидных отличий для данного кодона. Если
для данного кодона в двух последовательностях наблюдается только одно
отличие, то значения данных величин определяется однозначно путем
выявления синонимичности или несинонимичности данной замены. Например, в
случае пары GTT (Val) и GTA (Val), sd = 1 и nd = 0. В случае, когда в
данном кодоне два отличия, например TTT (Phe) и GTA (Val), существует два
разных пути, которые могли привести к такому отличию: путь 1, TTT(Phe) >
GTT(Val) > GTA(Val); путь 2, TTT(Phe) > TTA(Leu) > GTA(Val). На каждом
пути произошло ровно по две замены, синонимичность или несинонимичность
каждой из которых однозначно определяется. В результате для первого пути
имеем sd = 1 и nd = 1, а для второго пути sd = 0 и nd = 2. Т.к. мы не
знаем, какой путь в действительности был реализован, то, усредняя sd и nd
по обоим путям, получаем для данного кодона sd = 0,5 и nd = 1,5. В
случае трёх отличий в кодоне аналогичным образом рассматривают все
возможные пути и вычисляют средние значения sd и nd.

Суммируя по всем кодонам, получаем полные количества синонимичных (Sd) и
несинонимичных (Nd) нуклеотидных отличий между парой последовательностей:
[pic], [pic], где L - длина выравнивания.


2. Вычисление количества синонимичных и несинонимичных сайтов для пары
нуклеотидных последовательностей.

Рассмотрим одну из последовательностей и произвольный кодон в этой
последовательности. Рассмотрим по отдельности каждую из трех позиций
данного кодона (i = 1, 2, 3). Для каждой позиции введем понятие
"синонимичности" позиции (fi), которая определяет долю синонимичных замен
в данной позиции (при неизменности остальных двух). Например, для кодона
TTA (Leu), f1 = 1/3, т.к. только одна из трех замен нуклеотида T в первой
позиции является синонимичной (T>C); f2 = 0, т.к. ни одна из трех замен
нуклеотида T во второй позиции не является синонимичной; f3 = 1/3, т.к.
только одна из трех замен нуклеотида A в третьей позиции является
синонимичной (A > G). Таким образом, суммируя значения синонимичности
для каждой позиции fi, определим количество синонимичных позиций
(сайтов) s для данного кодона.
[pic]
Соответственно количество несинонимичных сайтов n опредляется как:
[pic], т.к. полное количество сайтов в кодоне равно 3. Например, в случае
кодона TTA, рассмотренного выше, s = 2/3 и n = 7/3. Величины s и n,
будучи поделены на 3, дают нам вероятность синонимичной и несинонимичной
замены при случайном изменении одного из нуклеотидов в произвольной
позиции данного кодона.

Суммируя значения s и n по всем кодонам первой последовательности,
получаем количества синонимичных S1 и несинонимичных N1 сайтов в первой
последовательности. Аналогичным образом вычисляем значения данных величин
для второй последовательности (S2 и N2).

Усредняя полученные значения по обеим последовательностям:
[pic] и [pic], получаем среднее количество синонимичных и несинонимичных
сайтов.


3. Вычисление наблюдаемых частот синонимичных (pS) и несинонимичных (pN)
отличий.

[pic]
[pic]


4. Вычисление количества синонимичных (Ks) и несинонимичных (Ka) замен.

Применяя формулу Джукса - Кантора, вычислим количества синонимичных и
несинонимичных замен на 1 нуклеотид по наблюдаемым частотам.

[pic]
[pic]