|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.fbb.msu.ru/~podkovkina/tr4pr1.html
Дата изменения: Fri Mar 21 18:28:35 2008 Дата индексирования: Mon Oct 1 20:04:48 2012 Кодировка: Windows-1251 |
Здесь хранится белковая последовательность моего белка GYRB_ECOLY
здесь хранится ген моего белка ABCDEF.fasta
С помощью пакета Blast(BlastP) была найдена белковая последовательность, идентичная моей на 77%.
Само выравнивание:
>sp|Q9KVX3|GYRB_VIBCH DNA gyrase subunit B
Length=805
Score = 1286 bits (3329), Expect = 0.0, Method: Compositional matrix adjust.
Identities = 628/806 (77%), Positives = 706/806 (87%), Gaps = 3/806 (0%)
Query 1 MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKEII 60
MSN+YDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDN+IDEALAG+CK+I+
Sbjct 1 MSNNYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNSIDEALAGYCKDIV 60
Query 61 VTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV 120
VTIH DNSVSV DDGRGIPT +HPEE VSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV
Sbjct 61 VTIHEDNSVSVSDDGRGIPTEMHPEEKVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGV 120
Query 121 SVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPSLETFTNVT 180
SVVNALS+K+ L I R GKIH Q Y HGVPQAPLAV GETE+TGT VRFWPS +TFTN+
Sbjct 121 SVVNALSEKVLLTIYRGGKIHSQTYHHGVPQAPLAVVGETERTGTTVRFWPSAQTFTNI- 179
Query 181 EFEYEILAKRLRELSFLNSGVSIRLRDKRD-GKEDHFHYEGGIKAFVEYLNKNKTPIHPN 239
EF Y+ILAKRLRELSFLNSGVSI+L D+R+ K+DHF YEGGI+AFV +LN+NKTPIH
Sbjct 180 EFHYDILAKRLRELSFLNSGVSIKLTDEREEDKKDHFMYEGGIQAFVTHLNRNKTPIHEK 239
Query 240 IFYFSTEK-DGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAYMD 298
+F+F+ E+ DGI VEVA+QWNDGFQENIYCFTNNIPQRDGGTHLAGFR A+TRTLN YMD
Sbjct 240 VFHFNQEREDGISVEVAMQWNDGFQENIYCFTNNIPQRDGGTHLAGFRGALTRTLNNYMD 299
Query 299 KEGYSKKAKVSATGDDAREGLIAVVSVKVPDPKFSSQTKDKLVSSEVKSAVEQQMNELLA 358
KEG+SKKA+ + +GDDAREGL AVVSVKVPDPKFSSQTKDKLVSSEVKSAVE MNE LA
Sbjct 300 KEGFSKKAQAATSGDDAREGLTAVVSVKVPDPKFSSQTKDKLVSSEVKSAVESAMNEKLA 359
Query 359 EYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLADCQERDPALS 418
++L ENP++AK V KIIDAARAREAAR+AREMTRRKGALDLAGLPGKLADCQE+DPALS
Sbjct 360 DFLAENPSEAKNVCSKIIDAARAREAARKAREMTRRKGALDLAGLPGKLADCQEKDPALS 419
Query 419 ELYLVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI 478
ELY+VEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI
Sbjct 420 ELYIVEGDSAGGSAKQGRNRKNQAILPLKGKILNVEKARFDKMLSSQEVATLITALGCGI 479
Query 479 GRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQPPLYKVK 538
GRDEYNPDKLRYH+IIIMTDADVDGSHIRTLLLTFFYRQMPE++ERG++YIAQPPLYKVK
Sbjct 480 GRDEYNPDKLRYHNIIIMTDADVDGSHIRTLLLTFFYRQMPELIERGYIYIAQPPLYKVK 539
Query 539 KGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNATQKMINRME 598
KGKQEQYIKD+EAM+QYQ+++A+DGA LH NA APALAGE LEKLV +YNA K++ RM
Sbjct 540 KGKQEQYIKDEEAMNQYQVALAMDGAELHVNADAPALAGEPLEKLVQQYNAAIKLVERMS 599
Query 599 RRYPKAMLKELIYQPTLTEADLSDEQTVTRWVNALVSELNDKEQHGSQWKFDVHTNAEQN 658
RRYP AML ELIY P + +D+ V W LV +LN KE SQ+ V NAE N
Sbjct 600 RRYPYAMLHELIYVPRINAELCADKAAVEAWTQRLVEQLNAKEVGASQYSVLVEHNAELN 659
Query 659 LFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDAFIERGERRQPVAS 718
++ P ++VRTHGV +Y L + I EY ++ L E L GL+E AFI+RGER QP++S
Sbjct 660 VYLPKIQVRTHGVTHEYLLSADLINSKEYAKLADLSEALDGLIEAGAFIKRGERVQPISS 719
Query 719 FEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRMLRVTVKDAIAADQLFT 778
F ALDWL+KESRRGLSIQRYKGLGEMNP+QLWETTMDPE+RRM++VT++DA+ AD+LFT
Sbjct 720 FAAALDWLIKESRRGLSIQRYKGLGEMNPDQLWETTMDPETRRMMQVTIEDAVGADELFT 779
Query 779 TLMGDAVEPRRAFIEENALKAANIDI 804
TLMGD VEPRRAFIE NALK AN+D+
Sbjct 780 TLMGDQVEPRRAFIETNALKVANLDV 805
последовательность белка из Vibrio cholera GYRB_VIBCH
ген данного белка из полного генома Vibrio cholera ae003852.fasta
При помощи программы needle были посторены 2 выравнивания: белковое и нуклеотидное- с параметрами по умолчнию.
Белковое выравнивание можно посмотреть в этом файле- res.file Нуклеотидное выравнивание можно посмотеть в этом файле- res2.file Когда я изменила параметры , выравнивание практически полностью совпало с белковым(различие в том, что в нуклеотидном выравнивании программа needle поставила больше гепов.Но полного соответствия добиться не удалось ни при каких параметрах)(-gapopen 20 -gapextend 10) Выравнивание можно посмотреть здесьres4.file
Pal2nal
PAL2NAL - программа, преобразующая множественное выравнивание последовательностей белков и соответствующих ДНК (или мРНК) в выравнивание с разбивкой на кодоны.Программа выдает это выравнивание даже в том случае, если поданный на вход фрагмент последовательности ДНК будет не полностью совпадать с белковым выравниванием или будет содержать UTRs и полиадениновые хвосты.Данная программа может так же анализировать псевдогены, т.к. она справляется со сдвигом рамки считывания. В полученном выравнивании можно так же рассчитать количество синонимичных и несинонимичных замен на один сайт.При помощи данной программы было получено следующее выравнивание: pal2nal output
Непонятно, почему программа указала несоответствие кодона atg метионину. Так же, были найдены несколько других аминокислот, которые действительно не соответствуют своим кодонам. Причина такого несоответствия мне не очень понятна.
Для подсчета Ka/Ks необходимо в "Option settings" в графе "Remove gaps, inframe stop codons" выбрать "Yes".
Таким образом для моего выравнивания программа подсчитала, что KA/KS = 0.0207 (посмотреть выдачу программы можно здесь) Вывод:поскольку значение KA/KS много меньще единицы можно предположить , что на мой ген действует стабилизирующий отбор.
вернуться на страницу четвертого семестра
©Подковкина Анна