Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~anuta_al/Aleksandrova_Pr5.html
Дата изменения: Mon May 25 16:33:06 2009 Дата индексирования: Tue Oct 2 05:07:39 2012 Кодировка: Windows-1251 |
- выполнение команды "ls" позволяет просмотреть содержимое активной директории (диска H).
- при выполнении команды "ls .." Linux перемещает в директорию, содержащую выход к собственной рабочей директории (список студентов 1-ого курса ФББ).
- совокупность команд "cd .." а потом "ls" позволяет вернуться в предыдущую директорию, а повтор команды перенаправляет в предпредыдущую директорию (в данном случае это года по поступлению).
- команда "pwd" отображает полный путь к домашней директории.
- при помощи команды "cd Term_2", а затем с помощью "cd Practices5" я вошла в нужную мне директорию, а при помощи команды "ls" просмотрела ее содержимое.
- пакет программ EMBOSS "seqret sw:p15043 -auto" создает в директории новый файл "recq_ecoli.fasta, в чем мы убеждаемся при помощи команды "ls". Затем, выполнив команду "more recq_ecoli.fasta", можно просмотреть содержимое данного файла: последовательность белка Recq_Ecoli в формате Fasta.
- пакет программEMBOSS "entret sw:p15043 -auto" создает в директории новый файл "recq_ecoli.entret", представляющий собой файл UniProt.
- клавиши "вверх" и "вниз" позволяют не вводить одни и те же команды по несколько раз. То есть стрелочкой "вверх" можно выбрать любую введенную ранее команду, стрелочкой "вниз" - вернуться к вводу.
- команда "history" выдает список всех введенных ранее команд.
- команда "more w
Последовательность моего белка:
После того, как я изменила параметры по умолчанию (штраф за образование гэпа, штраф за его тпродление), увеличив их вдвое, произошли следущие изменения:
пробел 219-221 в 1-м выравнивании заполнился, но образовался пробел 234-235. В остальном выранивание не изменилось.
Длина первого выравнивания - 690, процент идентичности - 24,2 %, процент сходства - 38,9 %, процент гэпов - 39,9%, общий вес - 759,5.
Длина второго выравнивания - 689, процент идентичности - 23,8 %, процент сходства - 37,3 %, процент гэпов - 39,6%, общий вес - 647.
Изменения в длине выравнивания и в весе замен соответсвуют изменению в выравнивании.
Полученный файл: op.needle
Запустив прграмму needle командой needle recq_ecoli.fasta P50729.fasta GD.msf -aformat msf,
я получила файл GD.msf , пригодный для чтения в GenDoc.
Выравнивание при обычных параметрах сохранено в файле opt.water :
II. Построить и сравнить оптимальные глобальное и оптимальное локальное выравнивание 2-х последовательностей
>RECQ_ECOLI P15043 RecName: Full=ATP-dependent DNA helicase recQ; EC=3.6.1.-;
MAQAEVLNLESGAKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIP
ALLLNGLTVVVSPLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCRTGQIRLLY
IAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEYAALGQLRQRFPTLPFMAL
TATADDTTRQDIVRLLGLNDPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQEQRGKSGI
IYCNSRAKVEDTAARLQSKGISAAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGI
NKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAWLRRCLEEKPQGQL
QDIERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPCGNCDICLDPPKQYDGSTDAQIAL
STIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLG
LVTQNIAQHSALQLTEAARPVLRGESSLQLAVPRIVALKPKAMQKSFGGNYDRKLFAKLR
KLRKSIADESNVPPYVVFNDATLIEMAEQMPITASEMLSVNGVGMRKLERFGKPFMALIR
AHVDGDDEE
Последовательность родственного белка:
>RECQ_BACSU P50729 RecName: Full=ATP-dependent DNA helicase recQ; EC=3.6.1.-; AltName: Full=Recombination protein S;
MTKLQQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYMLDGMVL
IVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLEHIHRYKFLYLSPEALQSPY
VLEKLKSVPISLFVIDEAHCISEWGHDFRPDYSKLGQLRKKLGHPPVLALTATATKETLQ
DVMNLLELQHAVRHLNSVNRPNIALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRKW
AKELAGEIKSKTSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRY
VIHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDFELQEQIIQMESVTAEEIADVIR
VLEKTEERDERRLRDVLLQYGVGETQARMMIHLFMQGKTSVELMKKEISYRMELKLEKMH
RVSFLLQRDGCLRQALLTYFDESYEPDDGNLPCCSHCGFDLSLYEQKGERSKMAPLDSWS
SELHRIFSLQTVGELN
Пользуясь программой seqret, я создала файл opt.needle с поседовательностью белка, родственного моему.
Таким образом я построила полное оптимальное выравнивание двух белков - моего и родственного:
RECQ_ECOLI 1 MAQAEVLNLESGAKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTG 50
.:..:|.|.:.||:..|:.||::||:::|||:|.:.::|||
RECQ_BACSU 1 ---------MTKLQQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTG 41
RECQ_ECOLI 51 GGKSLCYQIPALLLNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQ 99
||||||||:|..:|:|:.::||||:|||:|||.||:|.| ..||.|||..
RECQ_BACSU 42 GGKSLCYQLPGYMLDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSML 91
RECQ_ECOLI 100 TREQQLEVMTGCRTGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAH 149
.|:::..|:. ...:.:.||::||.|.....||.|......|..:||||
RECQ_BACSU 92 NRQERQFVLE--HIHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAH 139
RECQ_ECOLI 150 CISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLN 199
|||:|||||||:|:.|||||::....|.:||||||...|.||::.||.|.
RECQ_BACSU 140 CISEWGHDFRPDYSKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQ 189
RECQ_ECOLI 200 DPLIQISSFDRPNIRYML---MEKFKPLDQLMRYVQEQRGKSGIIYCNSR 246
..:..::|.:||||...: .:..:.:|::::.|:..:| .||:||.:|
RECQ_BACSU 190 HAVRHLNSVNRPNIALRVENAADTAEKIDRVIQLVENLQG-PGIVYCPTR 238
RECQ_ECOLI 247 AKVEDTAARLQSKGISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVA 295
...::.|..::||..|.| .||.|||:..|..:|::|..:.|.::..|.|
RECQ_BACSU 239 KWAKELAGEIKSKTSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNA 288
RECQ_ECOLI 296 FGMGINKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD- 344
||||::||::|:|:||.:|:..|::.||.|||||||.|:.::|...|.|
RECQ_BACSU 289 FGMGVDKPDIRYVIHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDF 338
RECQ_ECOLI 345 ----------------MAWLRRCL---EEKPQGQLQDI------------ 363
:|.:.|.| ||:.:.:|:|:
RECQ_BACSU 339 ELQEQIIQMESVTAEEIADVIRVLEKTEERDERRLRDVLLQYGVGETQAR 388
RECQ_ECOLI 364 --------------------------ERHKLNAMGAFAEAQTCRRLVLLN 387
:..|::.:....:...|.|..||.
RECQ_BACSU 389 MMIHLFMQGKTSVELMKKEISYRMELKLEKMHRVSFLLQRDGCLRQALLT 438
RECQ_ECOLI 388 YFGEGRQEPCGNCDIC------------------LDPPKQYDGSTDAQIA 419
||.|..:...||...| :.|...:........:
RECQ_BACSU 439 YFDESYEPDDGNLPCCSHCGFDLSLYEQKGERSKMAPLDSWSSELHRIFS 488
RECQ_ECOLI 420 LSTIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHW 469
|.|:|.:|
RECQ_BACSU 489 LQTVGELN------------------------------------------ 496
RECQ_ECOLI 470 VSVIRQLIHLGLVTQNIAQHSALQLTEAARPVLRGESSLQLAVPRIVALK 519
RECQ_BACSU 496 -------------------------------------------------- 496
RECQ_ECOLI 520 PKAMQKSFGGNYDRKLFAKLRKLRKSIADESNVPPYVVFNDATLIEMAEQ 569
RECQ_BACSU 496 -------------------------------------------------- 496
RECQ_ECOLI 570 MPITASEMLSVNGVGMRKLERFGKPFMALIRAHVDGDDEE 609
RECQ_BACSU 496 ---------------------------------------- 496
Файл "opt.needle" содержит информацию о данном выравнивании, а именно:
названия белков, штрафы за гэпы, длины выравнивания, процент идентичности, процент сходства, количество гэпов, а также само глобальное выравнивание.
RECQ_ECOLI 1 MAQAEVLNLESGAKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTG 50
.:..:|.|.:.||:..|:.||::||:::|||:|.:.::|||
RECQ_BACSU 1 ---------MTKLQQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTG 41
RECQ_ECOLI 51 GGKSLCYQIPALLLNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQ 99
||||||||:|..:|:|:.::||||:|||:|||.||:|.| ..||.|||..
RECQ_BACSU 42 GGKSLCYQLPGYMLDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSML 91
RECQ_ECOLI 100 TREQQLEVMTGCRTGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAH 149
.|:::..|:. ...:.:.||::||.|.....||.|......|..:||||
RECQ_BACSU 92 NRQERQFVLE--HIHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAH 139
RECQ_ECOLI 150 CISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLN 199
|||:|||||||:|:.|||||::....|.:||||||...|.||::.||.|.
RECQ_BACSU 140 CISEWGHDFRPDYSKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQ 189
RECQ_ECOLI 200 DPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQ--EQRGKSGIIYCNSRA 247
..:..::|.:||||...:.......:::.|.:| |.....||:||.:|.
RECQ_BACSU 190 HAVRHLNSVNRPNIALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRK 239
RECQ_ECOLI 248 KVEDTAARLQSKGISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAF 296
..::.|..::||..|.| .||.|||:..|..:|::|..:.|.::..|.||
RECQ_BACSU 240 WAKELAGEIKSKTSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAF 289
RECQ_ECOLI 297 GMGINKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPADMA 346
|||::||::|:|:||.:|:..|::.||.|||||||.|:.::|...|.|..
RECQ_BACSU 290 GMGVDKPDIRYVIHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDFE 339
RECQ_ECOLI 347 WLRRCL--------------------EEKPQGQLQDI------------- 363
...:.: ||:.:.:|:|:
RECQ_BACSU 340 LQEQIIQMESVTAEEIADVIRVLEKTEERDERRLRDVLLQYGVGETQARM 389
RECQ_ECOLI 364 -------------------------ERHKLNAMGAFAEAQTCRRLVLLNY 388
:..|::.:....:...|.|..||.|
RECQ_BACSU 390 MIHLFMQGKTSVELMKKEISYRMELKLEKMHRVSFLLQRDGCLRQALLTY 439
RECQ_ECOLI 389 FGEGRQEPCGNCDIC------------------LDPPKQYDGSTDAQIAL 420
|.|..:...||...| :.|...:........:|
RECQ_BACSU 440 FDESYEPDDGNLPCCSHCGFDLSLYEQKGERSKMAPLDSWSSELHRIFSL 489
RECQ_ECOLI 421 STIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHWV 470
.|:|.:|
RECQ_BACSU 490 QTVGELN------------------------------------------- 496
RECQ_ECOLI 471 SVIRQLIHLGLVTQNIAQHSALQLTEAARPVLRGESSLQLAVPRIVALKP 520
RECQ_BACSU 496 -------------------------------------------------- 496
RECQ_ECOLI 521 KAMQKSFGGNYDRKLFAKLRKLRKSIADESNVPPYVVFNDATLIEMAEQM 570
RECQ_BACSU 496 -------------------------------------------------- 496
RECQ_ECOLI 571 PITASEMLSVNGVGMRKLERFGKPFMALIRAHVDGDDEE 609
RECQ_BACSU 496 --------------------------------------- 496
RECQ_ECOLI 14 KQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALL 63
:|.|.:.||:..|:.||::||:::|||:|.:.::|||||||||||:|..:
RECQ_BACSU 5 QQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYM 54
RECQ_ECOLI 64 LNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTREQQLEVMTGCR 112
|:|:.::||||:|||:|||.||:|.| ..||.|||...|:::..|:. .
RECQ_BACSU 55 LDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--H 102
RECQ_ECOLI 113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY 162
..:.:.||::||.|.....||.|......|..:|||||||:|||||||:|
RECQ_BACSU 103 IHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAHCISEWGHDFRPDY 152
RECQ_ECOLI 163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN 212
:.|||||::....|.:||||||...|.||::.||.|...:..::|.:|||
RECQ_BACSU 153 SKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQHAVRHLNSVNRPN 202
RECQ_ECOLI 213 IRYML---MEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDTAARLQSK 259
|...: .:..:.:|::::.|:..:| .||:||.:|...::.|..::||
RECQ_BACSU 203 IALRVENAADTAEKIDRVIQLVENLQG-PGIVYCPTRKWAKELAGEIKSK 251
RECQ_ECOLI 260 GISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFV 308
..|.| .||.|||:..|..:|::|..:.|.::..|.|||||::||::|:|
RECQ_BACSU 252 TSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRYV 301
RECQ_ECOLI 309 VHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD-------------- 344
:||.:|:..|::.||.|||||||.|:.::|...|.|
RECQ_BACSU 302 IHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDFELQEQIIQMESVT 351
RECQ_ECOLI 345 ---MAWLRRCL---EEKPQGQLQDI------------------------- 363
:|.:.|.| ||:.:.:|:|:
RECQ_BACSU 352 AEEIADVIRVLEKTEERDERRLRDVLLQYGVGETQARMMIHLFMQGKTSV 401
RECQ_ECOLI 364 -------------ERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPCGNC 400
:..|::.:....:...|.|..||.||.|..:...||.
RECQ_BACSU 402 ELMKKEISYRMELKLEKMHRVSFLLQRDGCLRQALLTYFDESYEPDDGNL 451
RECQ_ECOLI 401 DIC------------------LDPPKQYDGSTDAQIALSTIGRVN 427
..| :.|...:........:|.|:|.:|
RECQ_BACSU 452 PCCSHCGFDLSLYEQKGERSKMAPLDSWSSELHRIFSLQTVGELN 496
Длина выравнивания: 495, процент идентичности: 33,7%, процент сходства: 53,3%, процент гэповых участков: 17,0%, общий вес: 763, 5, Gap_penalty: 10.0, Extend_penalty: 0.5.
Несложно заметить, что это локальное выравнивание отличается от соответсвующего по параметрам глобального выравнивания только тем, что начинается первое с 1-ого а.о., а 2-ое начинается с 14-ого (для RECQ_ECOLI) и с 5-ого (для RECQ_BACSU). В остальном выравнивания полностью совпадают.
Выравнивание при увеличении параметров вдвое: op.water :
RECQ_ECOLI 14 KQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALL 63
:|.|.:.||:..|:.||::||:::|||:|.:.::|||||||||||:|..:
RECQ_BACSU 5 QQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYM 54
RECQ_ECOLI 64 LNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTREQQLEVMTGCR 112
|:|:.::||||:|||:|||.||:|.| ..||.|||...|:::..|:. .
RECQ_BACSU 55 LDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--H 102
RECQ_ECOLI 113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY 162
..:.:.||::||.|.....||.|......|..:|||||||:|||||||:|
RECQ_BACSU 103 IHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAHCISEWGHDFRPDY 152
RECQ_ECOLI 163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN 212
:.|||||::....|.:||||||...|.||::.||.|...:..::|.:|||
RECQ_BACSU 153 SKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQHAVRHLNSVNRPN 202
RECQ_ECOLI 213 IRYMLMEKFKPLDQLMRYVQ--EQRGKSGIIYCNSRAKVEDTAARLQSKG 260
|...:.......:::.|.:| |.....||:||.:|...::.|..::||.
RECQ_BACSU 203 IALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRKWAKELAGEIKSKT 252
RECQ_ECOLI 261 ISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVV 309
.|.| .||.|||:..|..:|::|..:.|.::..|.|||||::||::|:|:
RECQ_BACSU 253 SSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRYVI 302
RECQ_ECOLI 310 HFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD 344
||.:|:..|::.||.|||||||.|:.::|...|.|
RECQ_BACSU 303 HFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGD 337
Длина выравнивания: 335, процент идентичности: 43,0%, процент сходства: 65,1%, процент гэпов: 1,8%, Gap_penalty: 20.0, Extend_penalty: 1.0
Сравнивая между собой глобальное выравнивание при увеличении параметров вдвое с соответствующим локальным выравниванием, можно отметить только одно изменение: при локальном выравнивании изменяются рамки, для RECQ_ECOLI: 14-344, для RECQ_BACSU: 5-337.
Выравнивание при уменьшении параметров вдвое: o.water :
RECQ_ECOLI 17 LQET----FGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPAL 62
||:| ||:..|:.||::||:::|||:|.:.::|||||||||||:|..
RECQ_BACSU 4 LQQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGY 53
RECQ_ECOLI 63 LLNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTR-EQQ--LEVM 108
:|:|:.::||||:|||:|||.||:|.| ..||.|||...| |:| ||
RECQ_BACSU 54 MLDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE-- 101
RECQ_ECOLI 109 TGCRTGQI---RLLYIAPERLMLDNFLEHLAHWNPV-LLAVDEAHCISQW 154
.| :.||::||.|.....||.|.. .|: |..:|||||||:|
RECQ_BACSU 102 ------HIHRYKFLYLSPEALQSPYVLEKLKS-VPISLFVIDEAHCISEW 144
RECQ_ECOLI 155 GHDFRPEYAALGQLRQRF--PTLPFMALTATADDTTRQDIVRLLGLNDPL 202
||||||:|:.|||||::. | |.:||||||...|.||::.||.|...:
RECQ_BACSU 145 GHDFRPDYSKLGQLRKKLGHP--PVLALTATATKETLQDVMNLLELQHAV 192
RECQ_ECOLI 203 IQISSFDRPNIRYML------MEKFKPLDQLMRYVQEQRGKSGIIYCNSR 246
..::|.:||||...: .|| :|::::.|:..:| .||:||.:|
RECQ_BACSU 193 RHLNSVNRPNIALRVENAADTAEK---IDRVIQLVENLQG-PGIVYCPTR 238
RECQ_ECOLI 247 --AKVEDTAARLQSKGISAAA--YHAGLENNVRADVQEKFQRDDLQIVVA 292
|| :.|..::|| .|:.| ||.|||:..|..:|::|..:.|.::..
RECQ_BACSU 239 KWAK--ELAGEIKSK-TSSRADFYHGGLESGDRILIQQQFIHNQLDVICC 285
RECQ_ECOLI 293 TVAFGMGINKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDP 342
|.|||||::||::|:|:||.:|:..|::.||.|||||||.|:.::|...|
RECQ_BACSU 286 TNAFGMGVDKPDIRYVIHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAP 335
RECQ_ECOLI 343 ADMAWLRRCLEEKPQGQLQDIERHKLNAMGAFAEAQTCRRLVLLNYFGEG 392
.|. :||: :::
RECQ_BACSU 336 GDF-------------ELQE-------------------QII-------- 345
RECQ_ECOLI 393 RQEPCGNCDICLDPPKQYDGSTDAQIALSTIGRVNQRFGMGYVVEVIR-- 440
|.:..|..:|| :|||
RECQ_BACSU 346 ----------------QMESVTAEEIA-----------------DVIRVL 362
RECQ_ECOLI 441 ----GANNQRIRDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLGLVTQNI 486
..:.:|:||. |..||:|..:: |.:|||
RECQ_BACSU 363 EKTEERDERRLRDV----LLQYGVGETQA--------RMMIHL------- 393
RECQ_ECOLI 487 AQHSALQLTEAARPVLRGESSLQLAVPRIVALKPKAMQKSFGGNYDRKLF 536
.::|::|::| |:|.. :|..:|
RECQ_BACSU 394 --------------FMQGKTSVEL------------MKKEI--SYRMEL- 414
RECQ_ECOLI 537 AKLRK-------------LRKSIA---DES------NVP--PYVVFNDAT 562
||.| ||:::. ||| |:| .:..| |.:
RECQ_BACSU 415 -KLEKMHRVSFLLQRDGCLRQALLTYFDESYEPDDGNLPCCSHCGF-DLS 462
RECQ_ECOLI 563 LIE-------MAEQMPIT--ASEM---LSVNGVG 584
|.| || |:. :||: .|:..||
RECQ_BACSU 463 LYEQKGERSKMA---PLDSWSSELHRIFSLQTVG 493
Длина выравнивания: 634, процент идентичности: 32,2%, процент сходства: 49,1%, процент гэпов: 33,1%, Gap_penalty: 5.0, Extend_penalty: 0.25.
Сравнение между собой локального выравнивания с обычными параметрами с локальными выравниваниями при использовании в 2 раза меньших параметров (одинаковые участки будут отмечены жирным шрифтом):
RECQ_ECOLI 14 KQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALL 63
:|.|.:.||:..|:.||::||:::|||:|.:.::|||||||||||:|..:
RECQ_BACSU 5 QQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYM 54
RECQ_ECOLI 64 LNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTREQQLEVMTGCR 112
|:|:.::||||:|||:|||.||:|.| ..||.|||...|:::..|:. .
RECQ_BACSU 55 LDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--H 102
RECQ_ECOLI 113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY 162
..:.:.||::||.|.....||.|......|..:|||||||:|||||||:|
RECQ_BACSU 103 IHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAHCISEWGHDFRPDY 152
RECQ_ECOLI 163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN 212
:.|||||::....|.:||||||...|.||::.||.|...:..::|.:|||
RECQ_BACSU 153 SKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQHAVRHLNSVNRPN 202
RECQ_ECOLI 213 IRYML---MEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDTAARLQSK 259
|...: .:..:.:|::::.|:..:| .||:||.:|...::.|..::||
RECQ_BACSU 203 IALRVENAADTAEKIDRVIQLVENLQG-PGIVYCPTRKWAKELAGEIKSK 251
RECQ_ECOLI 260 GISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFV 308
..|.| .||.|||:..|..:|::|..:.|.::..|.|||||::||::|:|
RECQ_BACSU 252 TSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRYV 301
RECQ_ECOLI 309 VHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD-------------- 344
:||.:|:..|::.||.|||||||.|:.::|...|.|
RECQ_BACSU 302 IHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDFELQEQIIQMESVT 351
RECQ_ECOLI 345 ---MAWLRRCL---EEKPQGQLQDI------------------------- 363
:|.:.|.| ||:.:.:|:|:
RECQ_BACSU 352 AEEIADVIRVLEKTEERDERRLRDVLLQYGVGETQARMMIHLFMQGKTSV 401
RECQ_ECOLI 364 -------------ERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPCGNC 400
:..|::.:....:...|.|..||.||.|..:...||.
RECQ_BACSU 402 ELMKKEISYRMELKLEKMHRVSFLLQRDGCLRQALLTYFDESYEPDDGNL 451
RECQ_ECOLI 401 DIC------------------LDPPKQYDGSTDAQIALSTIGRVN 427
..| :.|...:........:|.|:|.:|
RECQ_BACSU 452 PCCSHCGFDLSLYEQKGERSKMAPLDSWSSELHRIFSLQTVGELN 496
Сравнение локального выравнивания с увеличенными вдвое параметрами с выравниванием, параметры которого двое меньше стандартных параметров (жирным шрифтом отмечены одинаковые участки):
RECQ_ECOLI 14 KQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALL 63
:|.|.:.||:..|:.||::||:::|||:|.:.::|||||||||||:|..:
RECQ_BACSU 5 QQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYM 54
RECQ_ECOLI 64 LNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTREQQLEVMTGCR 112
|:|:.::||||:|||:|||.||:|.| ..||.|||...|:::..|:. .
RECQ_BACSU 55 LDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--H 102
RECQ_ECOLI 113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY 162
..:.:.||::||.|.....||.|......|..:|||||||:|||||||:|
RECQ_BACSU 103 IHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAHCISEWGHDFRPDY 152
RECQ_ECOLI 163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN 212
:.|||||::....|.:||||||...|.||::.||.|...:..::|.:|||
RECQ_BACSU 153 SKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQHAVRHLNSVNRPN 202
RECQ_ECOLI 213 IRYMLMEKFKPLDQLMRYVQ--EQRGKSGIIYCNSRAKVEDTAARLQSKG 260
|...:.......:::.|.:| |.....||:||.:|...::.|..::||.
RECQ_BACSU 203 IALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRKWAKELAGEIKSKT 252
RECQ_ECOLI 261 ISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVV 309
.|.| .||.|||:..|..:|::|..:.|.::..|.|||||::||::|:|:
RECQ_BACSU 253 SSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRYVI 302
RECQ_ECOLI 310 HFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD 344
||.:|:..|::.||.|||||||.|:.::|...|.|
RECQ_BACSU 303 HFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGD 337
Итак, в глобальных выравниваниях за исключением участков 219-221 по RECQ_ECOLI первой цепи и 209-211 второй).
Различия выравнивания с обычными параметрами и выравнивания с увеличенными вдвое парематрами всего лишь в двух местах, в остальных участках выравнивания идентичны.
Opt.water (Gap_penalty: 10.0, Extend_penalty: 0.5.):
RECQ_ECOLI 213 IRYML---MEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDTAARLQSK 259
|...: .:..:.:|::::.|:..:| .||:||.:|...::.|..::||
RECQ_BACSU 203 IALRVENAADTAEKIDRVIQLVENLQG-PGIVYCPTRKWAKELAGEIKSK 251
Op.water (Gap_penalty: 20.0, Extend_penalty: 1.0):
RECQ_ECOLI 213 IRYMLMEKFKPLDQLMRYVQ--EQRGKSGIIYCNSRAKVEDTAARLQSKG 260
|...:.......:::.|.:| |.....||:||.:|...::.|..::||.
RECQ_BACSU 203 IALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRKWAKELAGEIKSKT 252
Соответствующие локальные выравнивания полностью совпадают с соответствующими глобальными выравниваниями.
Дополнительные задания
Для выполнения этого задания я воспользовалась командой dotmatcher -help. Таким образом я узнала, что при помощи программы dotmatcher можно построить график, расширения файла, содержащего график, могут быть следущими: ps, hpgl, hp7470, hp7580, meta, cps, x11, tekt, tek, none, data, xterm.
В Putty вводим команду dotmatcher recq_ecoli.fasta P50729.fasta dotmatcher.ps -graph. В результате получился следущий график: