Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~serge2006/DNA_protein/DNA_protein.html
Дата изменения: Sun Feb 3 03:06:02 2008
Дата индексирования: Tue Oct 2 15:07:53 2012
Кодировка: Windows-1251
DNA-protein contacts

Занятие 9. Исследование белок-нуклеиновых контактов

назад

1. Заданный PDB-код: 1L3T [DNA_pol_A (DNA polymerase family A)].
Скачать из банка соответствующий PDB-файл: http://www.rcsb.org/pdb/explore/explore.do?structureId=1L3T.
Direct pdb download link: http://www.rcsb.org/pdb/download/downloadFile.do?fileFormat=pdb&compression=NO&structureId=1L3T.
Если оказалось, что в структуре одна цепь ДНК, хотя ожидается две, необходимо скачать биологическую единицу данного комплекса с сайта PDB.
1L3T is a 10 base pair protein-DNA product complex, produced by placing a crystal of the 9 base pair complex (1L3S) in a stabilization solution containing dTTP

2. Исследование контактов между молекулами белка и нуклеиновой кислоты
За полярный контакт принимается пара полярных атомов, расположенных на расстоянии до 3.5A. За неполярный контакт принимается пара неполярных атомов, один из которых расположен в гидрофобной аминокислоте, на расстоянии не более 4.5A.

Обрабатывался оригинальный PDB файл (в нем нуклеотиды обозначаются не A,T,G,C, а DA,DT,DG,DC и используется ', а не * в "названиях" атомов).
Скрипт pdb_show.scr позволяет сначала увидеть необходимые множества атомов (вызуально проверить правильность скрипта, а потом, выполняя поочередно команды select t# (# - цифры от 1 до 8), записать число атомов, предположительно образующих контак соответствующего типа (см. описание внутри файла скрипта).

Таблица. Контакты разного типа в комплексе 1L3T.

  Полярные Гидрофобные Всего
Контакты белка с ...      
... остатками 2'-дезоксирибозы 9 61 70
... остатками фосфорной кислоты 23 - 23
... остатками азотистых оснований со стороны большой бороздки 1 11 12
... остатками азотистых оснований со стороны малой бороздки 4 3 7
Всего 37 75 112

ДНК в структуре похожа на B-форму, видимо поэтому неспецифичных связей белка с сахаро-фосфатным остовом в два раза больше, чем более специфичных связей с азотистыми основаниями. Большинство контактов образуется (возможно) между сахаром и белком, а такие контакты не особо специфичны. Вероятно, это связано с тем, что данный белок - ДНК-полимераза I (семейство А), а а ее функции не связанны с жесткой специфичностью к последовательности азотистых оснований.


3. Специфические контакты, обеспечивающие узнавание сайта в молекуле ДНК.
Поиск специфических взаимодействий в основном с азотистыми основаниями.
Полярное, например ARG615 (:A) - T29 (:B), C5 (:C):

Гидрофобное, например TYR714 (:A) - T3, A4 (:C):
Для получения этих картинок написан скрипт: pdb_pics.scr.

4. Описание функций исследованного белка
  • UniProt
    • UniProt AC: P52026. http://beta.uniprot.org/uniprot/P52026
    • UniProt ID: DPO1_BACST
    • Название белка: ДНК полимераза I
    • Ген: polA
    • Организм: Bacillus stearothermophilus (Geobacillus stearothermophilus)
    • Функции: полимеразная активность; 5' -> 3' экзонуклеазная активность

  • Pfam: http://pfam.sanger.ac.uk/family?acc=PF00476

  • SRS: (Library page: UniProtKB, UniProtKB/Swiss-Prot, UniProtKB/TrEMBL; Quick search: DPO1_BACST). Выбираем более новую запись. В ней в части Database cross-references есть подраздел Pfam, в котором перечислены домены:
    • PF01367: 5'-3' exonuclease, C-terminal SAM fold.
    • PF02739: 5'-3' exonuclease, N-terminal resolvase-like domain.
      Эти 2 домена обычно расположены вместе, и чаще всего отвечают за 5' -> 3' нуклеазную активность. Число аминокислот, разделяющих два 53EXO домена, и наличие of ?сопровождающих мотивов? позволяет определять несколько белковых семейств. В эубактериальных ДНК-полимеразах (семейство A) эти домены обычно разделены 4 аминокислотами. The pattern DNA_POLYMERASE_A () is always present towards the C-terminus. В нескольких эукариотических структурно-зависимых эндонуклеазах и экзонуклеазах домены 53EXO разделены 24 и 27 аминокислотами. В некоторых белках из семейства Herpesviridae (Герпесвирусов), два 53EXO домена разделены от 50 до 120 аминокислотами. Эти белки участвуют в подавлении экспрессии генов хозяина. Эти домены расположены еще дальше друг от друга в белках, отвечающих за репарацию эукариотической ДНК.
    • PF00476; DNA_pol_A. Synonym: DNA nucleotidyltransferase (DNA-directed).
      ДНК-зависимые ДНК полимеразы - основные ферменты, катализирующие точную репликацию ДНК. Для начала синтеза новой цепи ДНК им требуется маленькая молекула РНК или белок в качестве праймера. Несколько полимераз принадлежат к этой ?семье?.
В 3 задании были представлены ARG615 и TYR714. Обе аминокислоты принадлежат домену DNA_pol_A (PF00476). На странице Pfam в разделе Alignments можно просмотреть выравнивание в удобном виде (Seed, jalview). В открывшемся java-приложении будет выравнивание, при наведении мышки на ак снизу появляется ее название и номер в белке.
Таким образом было установлено, что TYR714 полностью консервативен, а ARG615 консервативен на 75% (в выравнивании из 12 последовательностей). В выравнивании из 1000 последовательностей обе эти аминокислоты остаются сильноконсервативными.
Это выравнивание в формате msf: align.msf. Упрощенный вариант с формате html: align.html.


5. Построение схемы контактов белка с ДНК
Программа nucplot предназначена для визуализации контактов между ДНК и белком.
Программа работает только с конвертированным форматом pdb. Для конвертации можно использовать скрипт new2old (format: new2old xxxx.pdb xxxx.ent).
Команда: nucplot 1L3T.ent. Среди выдачи программы будет файл nucplot.ps, его нужно конвертировать в *.pdf. Получившийся файл (переименован): 1L3T_nucplot.pdf.
Схема контактов:

Таблица. Контакты разного типа в комплексе 1L3T по данным nucplot.

  Синие=водородные Красные=nonbonded,<3.35A Всего
Контакты белка с ...      
... остатками 2'-дезоксирибозы 2 6 8
... остатками фосфорной кислоты 0 5+1 6
... остатками азотистых оснований 2 28 30
Всего 4 40 44

На схеме присутствует полярный контакт (с ARG615), рассмотренный в задании 3.
Интересными выглядят T24 и G28 - они образуют 4 и 5 nonbonded контактов соответственно, и, вероятно, играют существенную роль в узнавании фрагмента ДНК белком.
Программой nucplot найдено меньше связей, чем скриптом в расмоле потому, что в nucplot на Nonbonded contact to DNA (< 3.35A). В RasMol же пределом гидрофобных взаимодействий было 4.5A. Еще, судя по лог-файлу, больше 40 атомов из нуклеотидов не распознано программой; их бОльшая часть - OP?, которые участвуют в образовании полярных контактов с остатками фосфорной кислоты.
Для лучшего понимания, что такое "Nonbonded contact to DNA (< 3.35A)", был изучен файл (также из выдачи программы) 1L3T.bond. В нем отмечен второй пример из задания 3 (TYR A 714 CB T C 3 C2* 3.20). Видимо, Nonbonded contact - это пары атомов, расположенных в пределах указанного расстояния (<3.35A), между которыми нет ковалентных связей (водородных): например, связи с металлом. Скорее всего это электростатические и Ван дер Ваальсовые взаимодействия. 1.


назад

© Serge I. Mitrofanov, 2007Последнее обновление: 02.02.2008