Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~aelita/Term2/block2/pr6.html
Дата изменения: Thu Apr 3 22:15:12 2008
Дата индексирования: Tue Oct 2 17:04:09 2012
Кодировка: Windows-1251
Task 1 (UniProt)

Программа BLASTP..

  1. Задание 1.
    первая часть:
    Вводимый белок-гомолог HSLV_HAEIN.
    Итог:
    HSLV_HAEIN: порядковый номер-1,score- 354, e-value - 9e-98
    HSLV_ECOLI: порядковый номер-13,score- 280, e-value -2e-75.
    Последний белок - HSLV_CAMJR (score-217, e-value - 2e-56), он является последним,так как стоит порог по количеству.
    Для измения выдачи результатов нужно поменять параметры: на начальной странице есть поле "Algorithm parameters" ,в котором есть подполя: max target sequences( количество выданных на странице выравниваемых последовательностей), expect threshold - максимум e-value, word size- шрифт букв.
    Часть 2(использование pdb):
    Pdb- код первой последовательности - 1G3I,идентификаторы цепей - G,Score -352, E-value -3e-98,


    Итог выравнивания:
    Query 2 TTIVSVRRNGQVVVGGDGQVSLGNTVMKGNARKVRRLYNGKVLAGFAGGTADAFTLFELF 61
    TTIVSVRRNGQVVVGGDGQVSLGNTVMKGNARKVRRLYNGKVLAGFAGGTADAFTLFELF
    Sbjct 1 TTIVSVRRNGQVVVGGDGQVSLGNTVMKGNARKVRRLYNGKVLAGFAGGTADAFTLFELF 60

    Query 62 ERKLEMHQGHLLKSAVELAKDWRTDRALRKLEAMLIVADEKESLIITGIGDVVQPEEDQI 121
    ERKLEMHQGHLLKSAVELAKDWRTDRALRKLEAMLIVADEKESLIITGIGDVVQPEEDQI
    Sbjct 61 ERKLEMHQGHLLKSAVELAKDWRTDRALRKLEAMLIVADEKESLIITGIGDVVQPEEDQI 120

    Query 122 LAIGSGGNYALSAARALVENTELSAHEIVEKSLRIAGDICVFTNTNFTIEELPN 175
    LAIGSGGNYALSAARALVENTELSAHEIVEKSLRIAGDICVFTNTNFTIEELPN
    Sbjct 121 LAIGSGGNYALSAARALVENTELSAHEIVEKSLRIAGDICVFTNTNFTIEELPN 174

    Начало и конец для первого выравнивания во входной последовательности(2-61) и в находке (1-60),начало и конец для первого выравнивания во входной последовательности(62-121) и в находке (61-120), начало и конец для первого выравнивания во входной последовательности(122-175) и в находке (121-174) процент совпадений-100% (Identities = 174/174 (100%))
  2. Задание 2.Поиск белка по части его последовательности
    В задание предлагалось выравнивать треть последовательности белка HSLV_HAEIN(>MTTIVSVRRNGQVVVGGDGQVSLGNTVMKGNARKVRRLYNGKVLAGFAGGTADAFTLF -ее первая треть).
    Исходнаяпоследовательность не является первой,она третяя по счету,однако если учитываь,что Score(117) и E_value(2е-26) всех первых четырех последовательностей равны между собой, то можно считать,что исходная последовательность не является первой,потому что последовательности даны вначале в алфавитном порядке.
  3. Задание 3.Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
    Исходное выравнивание белка HSLV_Haein с белком HSLV_AERS4.
    Score = 274 bits (701), Expect = 1e-73, Method: Compositional matrix adjust. Identities = 139/173 (80%), Positives = 153/173 (88%), Gaps = 1/173 (0%)
    Полное глобальное выравнивание.
    Aligned_sequences: 2
    1: HSLV_HAEIN
    2: HSLV_AERS4
    Matrix: EBLOSUM62
    Gap_penalty: 11.0
    Extend_penalty: 1.0
    Length: 178, Identity:139/178 (78.1%), Similarity:153/178 (86.0%), Gaps: 4/178 ( 2.2%), Score: 677.0.
    Cравнение результатов выравнивания.
    На участке от 1 до 173 аминокислотного остатка первой и 1-172 второй последовательности результаты выравнивания совпадают,гепы( всего один геп) и штрафы совпадают.(Соответственно,"+" - это ".." , " " - это "."). Далее наблюдаются отличие,существенно влияющее на результат выравнивания:в blaste на этом выравнивание заканчивается,тогда как в needle продолжается д
    Можно сделать определенный вывод о несовпадении результатов выравнивания:проценты identity и positives/similarity соответствующих последовательностей не совпадают,так как используются различные длины сравниваемых участков(173 и 178 соответственно),результаты же самих выравниваний одинаковы.
    Аналогично не совпадает процент гепов,так как в выравнивании с помощью blast используется участок длиной 173 аминокислотных остатка,в который входит только один геп, тогда как в выравнивание needle входит участок длиной 178,где уже на 3 гепа больше.

    Частичное выравнивание с помощью программы water.
    Aligned_sequences: 2
    1: HSLV_HAEIN
    2: HSLV_AERS4
    Matrix: EBLOSUM62
    Gap_penalty: 11.0
    Extend_penalty: 1.0
    Length: 173
    Identity: 139/173 (80.3%)
    Similarity: 153/173 (88.4%)
    Gaps: 1/173 ( 0.6%)
    Score: 680.0
    Cравнение результатов выравнивания.
    Оба выравнивания практически полностью совпадают,так же как и процентные результаты по identity, similarity (отличие в десятые доли процента,которые не отбражаются в blast).
  4. Дополнительное задание 1.Изменение параметров сравнения.
    Исходная матрица сравнения - PAM70.
    При использовании этой матрицы в процессе сравнения для белка HSLV_HAEIN результаты: Score = 374 bits (844), Expect = 2e-103, Identities = 175/175 (100%), Positives = 175/175 (100%), Gaps = 0/175 (0%).
    HSLV_ECOLI(13 по счету): Score = 298 bits (671), Expect = 2e-80, Identities = 140/174 (80%), Positives = 152/174 (87%), Gaps = 1/174 (0%).
    Для HSLV_AERS4: Score = 287 bits (646), Expect = 4e-77, Identities = 140/173 (80%), Positives = 152/173 (87%), Gaps = 1/173 (0%).
    Для последнего результата HSLV_NITWN: Score = 226 bits (507), Expect = 1e-58, Identities = 108/173 (62%), Positives = 138/173 (79%), Gaps = 2/173 (1%).
    Отличие этого сравнения от сравнения по матрице BLOSUM62 в значения score(значения выше).

    Исходная матрица Blosum62.Existence 9, extension 2.
    Также поменялись значения score, e-value,значение score возросло,а e-value упало.
    HSLV_HAEIN: Score = 369 bits (909), Expect = 3e-102, Identities = 175/175 (100%), Positives = 175/175 (100%), Gaps = 0/175 (0%)
    HSLV_ECOLI:Score = 293 bits (718), Expect = 5e-79,Identities = 139/173 (80%), Positives = 153/173 (88%), Gaps = 1/173 (0%)
    HSLV_AERS4:Score = 286 bits (702), Expect = 4e-77,Identities = 139/173 (80%), Positives = 153/173 (88%), Gaps = 1/173 (0%)
    Последний результат(для стандартного параметра 11,1):HSLV_CAMJR ,HSLV_CAMJE :Score = 217 bits (552), Expect = 2e-56, Identities = 102/174 (58%), Positives = 138/174 (79%), Gaps = 3/174 (1%)
    Последний результат(для параметра 9,2):HSLV_RHILO:Score = 226 bits (552), Expect = 6e-59, Identities = 108/173 (62%), Positives = 136/173 (78%), Gaps = 3/173 (1%)
  5. Задание 2.Интерфейс к BLAST на сайте EBI.
    Достаточно приятный сайт на вид,здесь на первый взгляд значительно больше полей и возможностей для сравнения последовательностей,нежели на сервере NCBI.Здесь можно выбирать вариант отображения результата:есть возможность определить score, длину последовательности сравнения, определенное e-value.На сайте дан более расширенный набор матриц сравнения.В процессе сравнения выдается по умолчанию 50 схожих последовательностей ,причем в исходной таблице отображаются не только Score, e-value,но также длина сравниваемой последовательности, Identity, Positives, а названия схожих белков даются сразу со ссылкой на информацию в банке Uniprot, что весьма удобно.Есть возможность просмотреть отдельно каждое выравнивание отдельно,можно скачать результат выравнивания.

Главная страница

Первый семестр.

Второй семестр.


©Александра Литвинчук,2008