Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~lu.andreeva/profile.html
Дата изменения: Fri May 28 16:09:46 2010
Дата индексирования: Tue Oct 2 03:32:47 2012
Кодировка: Windows-1251
Учебный сайт Люды Андреевой
Поиск белка с заданной функциональной специфичностью
Первый этап: описание функциональных особенностей заданной группы
В качестве белка-прототипа был задан белок кишечной палочки GalR_Ecoli.Это
ДНК-связывающий транскрипционный фактор, репрессирующий транскрипцию оперонов, участвующих
в транспорте и катаболизме D-галактозы. Эти опероны активны как в отсутствии D-галактозы и
глюкозы, так и в присутствии D-галактозы и отсутствии глюкозы.
GalR принадлежит семейству GalR/LacI транскрипционных регуляторов, белки которого состоят из
двух доменов: консервативного N-концевого ДНК-связывающего и
отвечающего за димеризацию и связывание с эффектором С-концевого.
В отсутствие D-галактозы GalR репрессирует оперон galETKM, т.е. связывается с двумя операторами
в присутствии HU.
(Данные взяты из EcoCyc)
Эффектор GalR - бета-D-галактоза:
Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности
Создать хорошее множественное выравнивание доменов заданной группы белков
Доменная структура белка-прототипа GalR_Ecoli (согласно БД PFAM):
ДНК-связывающий домен - LacI.
По данным PFAM, домен LacI находится на N-концевом участке белка между 3 и 48 а\к.
В БД InterPro представлены все мотивы данного домена для белка-прототипа, среди которых
наибольшим оказался мотив, предложенный БД SMART (более длинные мотивы из предложенных
находятся ближе к середине или С-концу, поэтому они выбраны не были). Дальнейшая работа проводилась с
использованием именно этой БД.
Из БД SMART было получено представительское выравнивание доменов в формате FASTA
(smart.fasta) и последовательности ДНК-связывающих доменов всех бактериальных белков
(dna_trer_all.fasta).
Из полученного файла с помощью скрипта были выбраны последовательности с идентификаторами,
которые, по мнению эксперта, обладают данной специфичностью.
Не все последовательности, указанные экспертом, попали в файл, поэтому они были взяты из
UniProt. К последовательностям была добавлена последовательность GalR_Ecoli, и они
были выровнены программой ClustalW2. Полученный файл с выравниванием:dna_al.fasta. Файл
с удаленными матрицами, заданными smart.fasta: dna_trer_al.fasta.
Единое множественное выравнивание заданных доменов всех групп специфичности
К полученному выравниванию добавим другие группы ДНК-связывающих доменов:
На картинке каждая группа ДНК-связывающих доменов покрашена своим цветом.
Наблюдается четыре позиции, консервативные для всех групп:
S20, I/L23, Y48, I/V39. Вероятно,
они обуславливают взаимодействие с гистонами или ДНК (однако маловероятно, что гидрофобные I, L, V
могут участвовать в таком взаимодействии).
В выравнивании исследуемой группы trer было найдено 35 консервативных позиций, анализ особенностей этой группы
от других основывался имеено на этих позициях. Отличительными особенностями данной группы
являются следующие консервативные позиции (всего 4):
55 S - полярный остаток против неполярных V, M, L в остальных группах;
58 M - против L в остальных группах;
74 R/K - против отрицательно заряженных (D) и полярных (S,T);
77 S - против N, D, L в остальных группах.
Таким образом, присутствуют кардинальные отличия группы trer от остальных ДНК-связывающих доменов.
Лого-изображения
Полного выравнивания заданных доменов:
Выравнивания группы trer:
Третий этап: поиск в протеоме по профилю
Есть выравнивание ДНК-связывающих доменов одной группы - trer: dna_trer.fasta
С помощью pfw добавим веса в выравнивание:
pfw -m dna_trer.fasta > dna_trer_weighted.fasta
По выравниванию сделаем профиль:
pfmake -m dna_trer_weighted.fasta /usr/share/pftools23/blosum45.cmp > trerprofile.prf
Искать белки по заданному профилю будем в протеоме Tolumonas auensis DSM 9187:
pfsearch -C 10.0 -f trerprofile.prf Tolumonas.fasta > tolumonas_trer.search
В результате подошли белки 1, 4, 5, 7, 11 и 16 из протеома
(см. tolumonas_trer.search).
Теперь с помощью ClustalW2 выровняем найденные белки с исходной выборкой trer под построенный профиль.
Полученное выравнивание в файле.