Работа с программой BLAST
Поиск белка по его последовательности
(i) С помощью программы BLASTP на сервере NCBI в банке SwissProt
был проведен поиск аминокислотной последовательности BioA_ECOLI.
Были получены следующие данные:
- Порядковый номер белка BioA_ECOLI 584840
- Score 850 bits
- E-value 0.0
(ii) При поиске той же последовательности в банке данных PDB получены следующие данные:
- PDB-коды: 1QJ5, 1MLZ, 1MLY, 1QJ3
- Идентификаторы цепи - A, B
- Score 845 bits;
- E-value 0.0
- Начало и конец выравнивания во входной последовательности (Query) 1429
- В найденой последовательности (Subject) 1429
- Процент совпадений (Identity) 428/429 (99%)
Данные по PDB практически не отличаются, за исключением процента совпадений.
Поиск белка по его гомологу
В банке данных SwissProt программой BLASTP был выполнен поиск белка BioA_ECOLI по его гомологу BioA_BUCAI.
- Порядковый номер белка BioA_ECOLI 584840
- Score 521 bits
- E-value 4e-147
- Начало и конец выравнивания во входной последовательности (Query) 1427
- В наденной последовательности (Subject) 1427
- Процент совпадений (Identity) 256/427 (59%)
Последовательность белка BioA_BUCAI была на выдаче первой.
Поиск белка по фрагментам его последовательности
1. Входная последовательность составлена из с 1й по 11ю и с 65й по 76ю аминокислоты белка BioA_ECOLI.
Учитывая то, что программа Blast строит локальные выравнивания, из-за присутствия потенциального гэпа в 64 аминокислоты,
что достаточно много, на выходе получается выравнивание только с 63й по 76ю аминокислоты белка BioA_ECOLI.
- Порядковый номер белка BioA_ECOLI 584840
- Score 27.3 bits
- E-value 7e-04
- Начало и конец выравнивания во входной последовательности (Query) 1023
- В найденной последовательности (Subject) 6376
- Процент совпадений (Identity) 13/14 (92%)
2. В данном случае использовалась входная последовательность, составленная из с 1й по 11ю и с 26й по 37ю аминокислоты белка BioA_ECOLI.
Поэтому для программы построения локальных выравниваний оказалось возможным построить выравнивание по всей искуственно созданной последовательности, содержащейся в файле thirdprot2.fasta.
- Порядковый номер белка BioA_ECOLI 584840
- Score 41.2 bits
- E-value 7e-04
- Начало и конец выравнивания во входной последовательности (Query) 123
- В найденной последовательности (Subject) 137
- Процент совпадений (Identity) 23/37 (62%)
©Dzhanibekova Anastasia