Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~lu.andreeva/profile.html
Дата изменения: Fri May 28 16:09:46 2010
Дата индексирования: Tue Oct 2 03:32:47 2012
Кодировка: Windows-1251
profile

Учебный сайт Люды Андреевой


Поиск белка с заданной функциональной специфичностью

Первый этап: описание функциональных особенностей заданной группы


В качестве белка-прототипа был задан белок кишечной палочки GalR_Ecoli.Это ДНК-связывающий транскрипционный фактор, репрессирующий транскрипцию оперонов, участвующих в транспорте и катаболизме D-галактозы. Эти опероны активны как в отсутствии D-галактозы и глюкозы, так и в присутствии D-галактозы и отсутствии глюкозы.
GalR принадлежит семейству GalR/LacI транскрипционных регуляторов, белки которого состоят из двух доменов: консервативного N-концевого ДНК-связывающего и отвечающего за димеризацию и связывание с эффектором С-концевого.
В отсутствие D-галактозы GalR репрессирует оперон galETKM, т.е. связывается с двумя операторами в присутствии HU.
(Данные взяты из EcoCyc)
Эффектор GalR - бета-D-галактоза:

Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности


Создать хорошее множественное выравнивание доменов заданной группы белков
Доменная структура белка-прототипа GalR_Ecoli (согласно БД PFAM):

ДНК-связывающий домен - LacI. По данным PFAM, домен LacI находится на N-концевом участке белка между 3 и 48 а\к. В БД InterPro представлены все мотивы данного домена для белка-прототипа, среди которых наибольшим оказался мотив, предложенный БД SMART (более длинные мотивы из предложенных находятся ближе к середине или С-концу, поэтому они выбраны не были). Дальнейшая работа проводилась с использованием именно этой БД.
Из БД SMART было получено представительское выравнивание доменов в формате FASTA (smart.fasta) и последовательности ДНК-связывающих доменов всех бактериальных белков (dna_trer_all.fasta).
Из полученного файла с помощью скрипта были выбраны последовательности с идентификаторами, которые, по мнению эксперта, обладают данной специфичностью. Не все последовательности, указанные экспертом, попали в файл, поэтому они были взяты из UniProt. К последовательностям была добавлена последовательность GalR_Ecoli, и они были выровнены программой ClustalW2. Полученный файл с выравниванием:dna_al.fasta. Файл с удаленными матрицами, заданными smart.fasta: dna_trer_al.fasta.
Единое множественное выравнивание заданных доменов всех групп специфичности
К полученному выравниванию добавим другие группы ДНК-связывающих доменов:

На картинке каждая группа ДНК-связывающих доменов покрашена своим цветом.
Наблюдается четыре позиции, консервативные для всех групп: S20, I/L23, Y48, I/V39. Вероятно, они обуславливают взаимодействие с гистонами или ДНК (однако маловероятно, что гидрофобные I, L, V могут участвовать в таком взаимодействии).
В выравнивании исследуемой группы trer было найдено 35 консервативных позиций, анализ особенностей этой группы от других основывался имеено на этих позициях. Отличительными особенностями данной группы являются следующие консервативные позиции (всего 4):
55 S - полярный остаток против неполярных V, M, L в остальных группах;
58 M - против L в остальных группах;
74 R/K - против отрицательно заряженных (D) и полярных (S,T);
77 S - против N, D, L в остальных группах.
Таким образом, присутствуют кардинальные отличия группы trer от остальных ДНК-связывающих доменов.
Лого-изображения
Полного выравнивания заданных доменов:

Выравнивания группы trer:

Третий этап: поиск в протеоме по профилю

Есть выравнивание ДНК-связывающих доменов одной группы - trer: dna_trer.fasta
С помощью pfw добавим веса в выравнивание:
pfw -m dna_trer.fasta > dna_trer_weighted.fasta
По выравниванию сделаем профиль:
pfmake -m dna_trer_weighted.fasta /usr/share/pftools23/blosum45.cmp > trerprofile.prf
Искать белки по заданному профилю будем в протеоме Tolumonas auensis DSM 9187:
pfsearch -C 10.0 -f trerprofile.prf Tolumonas.fasta > tolumonas_trer.search
В результате подошли белки 1, 4, 5, 7, 11 и 16 из протеома (см. tolumonas_trer.search).
Теперь с помощью ClustalW2 выровняем найденные белки с исходной выборкой trer под построенный профиль. Полученное выравнивание в файле.

Как ни странно, в полученном выравнивании нет консервативных позиций, совпадающих с таковыми в исходном выравнивании trer. Вполне вероятно, что белков с данным ДНК-связывающим доменом в протеоме Tolumonas auensis DSM 9187 нет.

©Andreeva_2010