Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~vovan/Practice9/analysis.html
Дата изменения: Mon Nov 13 18:12:16 2006
Дата индексирования: Tue Oct 2 12:14:31 2012
Кодировка: Windows-1251

Поисковые слова: полярная шапка
Занятие 9
На главную страницу третьего семестра.

Занятие 9. Исследование белок-нуклеиновых контактов.



Задание ?1. Различия между файлами 1awc.pdb и 1awc.mmol.pdb


Чтобы в дальнейшем было проще ориентироваться в субъединичном и молекулярном строении комплекса, введем общее описание структур, входящих в файл 1awc.mmol.pdb:
  1. PDB-код комплекса - 1awc.
  2. Название: GA binding protein alpha/beta domain bound to DNA
  3. Oрганизм-источник: Mus musculus. Mouse.
  4. В файле представлены: белок GABP, состоящий из двух субъединиц: gabp_alpha, со следующей доменной организацией: ets домен и 30-ть С-концевых остатков; gapb_beta1 со следующей доменной организацией: анкирин повторяющийся домен; есть двухцепочечная молекула ДНК
  5. ID цепей молекул: альфа субъединица белка GABP (ets-содержащая): chain A; бета субъединица белка GABP (анкирин-содержащая): chain B; цепи ДНК обозначены как chain D, chain E

Посмотрев внимательно на модели молекул в выше перечисленных файлах и на их описание в этих же файлах, были определены следующие различия:
Параметры различий модель из файла 1awc.pdb модель из файла 1awc.mmol.pdb
Метод анализа структур Для установления структуры комплекса использовался метод рентгеноструктурного анализа (из названия метода ясно, что в качестве интерферирующих лучей использовалось рентгеновское (Х-лучи) излучение. Для установления структуры комплекса использовался также метод рентгеноструктурного анализа.
После долгих мучительных попыток более подробно разобраться в кристаллографических выкладках исследования этой структуры, удалось найти одну строчку REMARK 300 в файле 1awc.mmol.pdb, косвенно указывающий на отличие этих двух файлов: "пропущенная группа"(SPACE GROUP) C121 P1
Презентация моделей в Rasmol'e ввиде ribbons, раскраска по цепям Участок последовательности альфа-субъединицы 339-343А представлен как неструктурированный участок последовательности. Участок последовательности альфа-субъединицы 339-343А распознан как бета-тяж, входящий в единую систему с другими тремя тяжами, таким образом генерируя четырех-тяжевый бета-лист.
Сравнение координат атомов абсцисса и аппликата любого атома на 0.009 и 0.001 соответственно больше, чем координаты в файле 1awc.mmol.pdb абсцисса и аппликата любого атома на 0.009 и 0.001 соответственно меньше, чем координаты в файле 1awc.pdb. Таким образом, можно заключить, что произошел "параллельный перенос" атомов всего комплекса в плоскости OXZ. Зачем и какие выгоды из этого достигаются, для меня осталось загадкой.
Сравнение размера файлов с моделями структур размер файла около 263КБ. В файле представлено много информации о структуре, описаны подробно вторичная топология полимеров, включенных в комплекс, различные рентгеноструктурные константы и расчеты. размер файла 198КБ. В основном представлена лишь информация о координатах атомов, и общие данные о способе анализа комплекса.

В целом, структуры идентичны. Видимо, изменение координат атомов и некоторые изменения, касающиеся SPACE GROUP, влияют на работу определенных программ и по-сути являются лишь доработкой формата .pdb, настройкой для работы под этими программами. Интересно, в обоих файлах нумерация как А- так и В-цепи начинается не с первого остатка, а с 320-ого у цепи А и с 5-го для цепи В. Видимо, для определенных целей, изучался контакт ДНК с нецелым белком, а только его частью.

Задание ?2. Исследование контактов между молекулами GABP и ДНК.


Был создан файл add.def., с помощью которого определялись необходимые компоненты ДНК, как то: полярные/неполярные остатки дезоксирибозы (rpol/rnepol); остатки фосфорной кислоты (ppol); пол/непол. остатки азотистых оснований со стороны большой бороздки (mjgpol/mjgnepol); пол./непол. остатки азотистых оснований со стороны малой бороздки (migpol/mignepol). Затем необходимо было разобраться, что конкретно требуется в задании: как я понял, надо было написать скрипт, который генерировал бы изображение атомов белка, участвующих в контактах с ДНК, перечисленных в таблице. Тогда разберемся более подробно с контактами, написанными в таблице. Для всех определенных типов атомов ДНК необходимо определить полярные контакты (водородные связи, ионные взаимодействия) с атомами белка. Ясное дело, что полярные контакты образуются между атомами *.N??? и *.O??? как со стороны ДНК, так и со стороны белка. Но полярные группы есть в составе как полярных аминокислот, так и неполярных (например Tyr, Trp) - это сказано к тому, что подсказка насчет использования предопределенных множеств атомов белковой молекулы polar и hydrophobic носит несколько странный характер: может, наоброт, ее не стоит использовать? Также полярные молекулы могут иметь протяженные участки гидрофобных контактов (напр. Lys, Arg - их длинные гидрофобные "хвосты"). Таким образом, если исследовать контакты, как того требует задание: полярный контакт, или водородная связь, имеет место, если оба контактирующих атома полярны; соответственно, неполярный контакт, или гидрофобное взаимодействие, предполагает, что оба атома неполярны, то есть именно атомы во взаимных контактах либо оба полярны, либо оба неполярны, то необходимость в подсказке использовать предопределенные в RasMol множества атомов белковой молекулы polar и hydrophobic может оказаться лишней. В принципе, она нужна, но тогда получаются несколько разные результаты, если опираться на подсказку, или нет. Действительно, при использовании этого выражения, можно генерировать следующий скрипт (лучше в Rasmol'e рассматривать изображения при полноэкранном режиме, так как zoom=400):
script dna.def
script add.def
restrict none
zoom 400
select within (3.5, rpol) and polar
cpk 150
color red
set fontsize 14
set fontstroke 1
label %n %r %a %c
echo protein atoms, generating polar contacts of protein with deoxyribose
pause
cpk off 
label off

select within (4.5, rnepol) and hydrophobic and not (*.o???,*.n???)
cpk 150
color blue
label %n %r %a %c
echo protein atoms, generating hydrophobic contacts of protein with deoxyribose
pause
cpk off 
label off

select within (3.5, ppol) and polar and (*.o???,*.n???)
cpk 150
color red
label %n %r %a %c
echo protein atoms, generating polar contacts of protein with phosphatic acid
pause
cpk off 
label off

select within (3.5, ppol) and hydrophobic and (*.o???,*.n???)
cpk 150
color red
label %n %r %a %c
echo protein atoms, generating polar contacts of hydrophobic protein's residues, 
echo containing polar atoms, with phosphatic acid
pause
cpk off 
label off

select within (3.5, mjgpol) and polar and (*.o???,*.n???)
cpk 150
color red
label %n %r %a %c
echo protein atoms, generating polar contacts of protein with bases, 
echo situated in major groove
pause
cpk off 
label off

select within (4.5, mjgnepol) and hydrophobic and not (*.o???,*.n???)
cpk 150
color blue
echo protein atoms, generating hydrophobic contacts of protein with bases, 
echo situated in major groove
label %n %r %a %c
pause
cpk off 
label off

select within (3.5, migpol) and polar and (*.o???,*.n???)
cpk 150
color red
label %n %r %a %c
echo  protein atoms, generating polar contacts of protein with bases, 
echo situated in minor groove there are no contacts
pause
cpk off 
label off

select within (4.5, mignepol) and hydrophobic and not (*.o???,*.n???)
cpk 150
color red
label %n %r %a %c
echo protein atoms, generating hydrophobic contacts of protein with bases, 
echo situated in minor groove: there are no contacts


Итак имеем следующую таблицу контактов:

Таблица ?1. Контакты разного типа в комплексе GABP:DNA

  Полярные Гидрофобные Всего
Контакты белка с ...      
... остатками 2'-дезоксирибозы GLN_321A (NE2); LYS_364A (NZ). Всего 2 контакта. MET_369A (CE); ALA_377A (CB) (CA); PHE_395A (CE1) (CD1) (CZ). Всего 6 контактов.
... остатками фосфорной кислоты ARG_394A (NH2) (NE); TYR_371A (OH); LYS_389A (NZ); LYS_373A (NZ); TYR_382A (OH); LYS_364A (NZ); TYR_381A (OH); GLN_321A (NE2). Всего 9 контактов. (контакты гидрофобных молекул аминокислот содержащих полярные атомы, с молекулой ДНК, как раз через полярные взаимодействия, но отнесены в данный столбец, так как исходная аминокислота неполярна)TRP_360A (NE1); LEU_322A (N); PHE_395A (N). Всего 3 контакта.  12 
... остатками азотистых оснований со стороны большой бороздки ARG_379A (NH2) (NE); ARG_376A (NE) (NH2); TYR_380A (OH). Всего 5 контактов.  ALA_377A (CA) (CB). Всего 2 контакта.
... остатками азотистых оснований со стороны малой бороздки     0 контактов 

Если же не опираться на данную подсказку о полярных и гидрофобных множествах атомов, то скрипт получится иной:
script dna.def
script add.def
restrict none
zoom 400
select within (3.5, rpol) and protein and (*.n???,*.o???)
cpk 150
color red
set fontsize 14
set fontstroke 1
label %n %r %a %c
echo protein atoms, generating polar contacts of protein with deoxyribose
pause
cpk off 
label off

select within (4.5, rnepol) and protein and not  (*.n???,*.o???)
cpk 150
color blue
label %n %r %a %c
echo protein atoms, generating hydrophobic contacts of protein with deoxyribose
pause
cpk off 
label off

select within (3.5, ppol) and protein and (*.n???,*.o???)
cpk 150
color red
label %n %r %a %c
echo protein atoms, generating polar contacts of protein with phosphatic acid
pause
cpk off 
label off

select within (3.5, mjgpol) and protein and (*.n???,*.o???)
cpk 150
color red
label %n %r %a %c
echo protein atoms, generating polar contacts of protein with bases, 
echo situated in major groove
paus
cpk off 
label off

select within (4.5, mjgnepol) and protein and not  (*.n???,*.o???)
cpk 150
color blue
echo protein atoms, generating hydrophobic contacts of protein with bases, 
echo situated in major groove
label %n %r %a %c
pause
cpk off 
label off

select within (3.5, migpol) and protein and (*.n???,*.o???)
cpk 150
color red
label %n %r %a %c
echo  protein atoms, generating polar contacts of protein with bases, 
echo situated in minor groove there are no contacts
pause
cpk off 
label off

select within (4.5, mignepol) and protein and not  (*.n???,*.o???)
cpk 150
color red
label %n %r %a %c
echo protein atoms, generating hydrophobic contacts of protein with bases, 
echo situated in minor groove: there are no contacts

"Примечание к скриптам": привожу объяснение, почему именно так выглядят необходимые в функциональном плане, строки: можно заметить, что общий вид таков: в первом скрипте для гидрофобных контактов select within (4.5, mjgnepol) and hydrophobic and not (*.n???,*.o???) и во втором скрипте select within (4.5, mjgnepol) and protein and not (*.n???,*.o???). На счет первых слов select within (4.5, mjgnepol) все ясно, так как этим вычисляются любые атомы, как бы то ни было находящиеся рядом с установленной в add.def группой атомов. Различия начинаются со следующих множеств: в первом случае выделяются множества гидрофобных (или полярных - для полярного контакта) "атомов" и только гидрофобные атомы (and not (*.n???,*.o???) - будут выделены только атомы углерода, серы (если есть), причем ,что интересно, даже в случае использования hydrophobic, все равно находились и атомы N, O, если только они входили в состав гидрофобных аминокислот (тем самым доказывая предположение, что множество hydrophobic относится не к атомам, а к аминокислотам. Во втором случае использовалось иное множество and protein and not (*.n???,*.o???), тем самым выделяя только атомы ВСЕГО БЕЛКА, и гидрофобные атомы. Тем самым множество расширялось до гидрофобных атомов как полярных, так и неполярных аминокислот. Тем самым второй способ становится более сильным, находит большее количество контактов.
В качестве дополнения ко второму скрипту также сделан другой скрипт, генерирующий изображение этого связывающего участка белка с ДНК в более репрезентабельном виде. Картинку такого скрипта можно видеть здесь.
Итак, число контактов в таблице несколько увеличивается:

Таблица ?2. Контакты разного типа в комплексе GABP:DNA

  Полярные Гидрофобные Всего
Контакты белка с ...      
... остатками 2'-дезоксирибозы GLN_321A (NE2); LYS_364A (NZ). Всего 2 контакта. MET_369A (CE); ALA_377A (CB) (CA); PHE_395A (CE1) (CD1) (CZ); GLN_321A (CD) (CC); LYS_373A (CE); TYR_381A (CE1); ARG_379 (CD); LYS_389A (CE); ARG_394 (CD), (CG). Всего 14 контактов. 16! 
... остатками фосфорной кислоты ARG_394A (NH2) (NE); TYR_371A (OH); LYS_389A (NZ); LYS_373A (NZ); TYR_382A (OH); LYS_364A (NZ); TYR_381A (OH); GLN_321A (NE2). Всего 9 контактов. (контакты гидрофобных молекул аминокислот содержащих полярные атомы, с молекулой ДНК, как раз через полярные взаимодействия, но отнесены в данный столбец, так как исходная аминокислота неполярна)TRP_360A (NЕ1); LEU_322A (N); PHE_395A (N). Всего 3 контакта.  12 
... остатками азотистых оснований со стороны большой бороздки ARG_379A (NH2) (NE); ARG_376A (NE) (NH2); TYR_380A (OH). Всего 5 контактов.  ALA_377A (CA) (CB); LYS_373A (C) (CA) (CB) (CG); TYR_380A (CZ) (CD2) (CE2); ARG_376A (CZ) (CG) (CB) (CD); ARG_379A (CD) (CZ). Всего 15 контактов.  20! 
... остатками азотистых оснований со стороны малой бороздки     0 контактов 

"Примечание к таблицам": в каждой графе указаны имя аминокислоты и ее номер в последовательности белка, в скобочках - имя атома в данной аминокислоте.
Как заметно во втором случае добавились только неспецифичные гидрофобные взаимодействия, которые вполне могут реализовываться между углеродным скелетом как полярных, так и неполярных аминокислот. Таким образом, я хочу показать, что в Rasmol'e предопределенное множества Polar и Hidrophobic видимо относятся не к атомам, а к аминокислотным остаткам, содержащим какие-то группы атомов, ответственных за полярность, иначе сложно объснить столь сильные различия двух таблиц только по гидрофобным контактам. Но даже при таком раскладе, можно сделать некоторые выводы:
  1. Очевидно, обе таблицы определенно указывают на тот факт, что наибольшее число как специфичных (полярные контакты: водородные связи, ионные взаимодействия), так и менее специфичных (гидрофобный контакт) взаимодействий генерируют атомы ДНК в составе оснований большой бороздки и кислородные атомы остатков фосфорной кислоты (правда с этими атомами есть только полярные контакты - так как сами атомы фосфорных групп полярны!!) . Это очень логично: полярный контакт между белком и атомами фосфорных групп способствует "заякориванию" белкового комплекса на последовательности ДНК (так как такие взаимодействия, особенно в низко диэлектрическом (диэлектрическая проницаемость часто приближается к двум, когда у воды она равно 80-ти!!) микроокружении повышает энергию полярных связей (ионных взаимодействий) до очень высоких значений (см. Финкельштейн "Физика белка"). А специфичные контакты белка с атомами оснований в большой бороздке способствуют узнаванию белковым комплексом того сайта в последовательности ДНК, на который он настроен работать: либо как фактор транскрипции, либо как рестриктаза, либо как индуктор/репрессор активности генов или др.
  2. Все атомы найдены только в составе альфа-субъединицы белка GABP (Chain A), явно подтверждая функцию этой субъединицы как ДНК-сязывающей.
  3. В обеих таблицах отсутствуют контакты белка с основаниями из малой бороздки ДНК, четко давая понять, что в основном специфичные контакты устанавливаются только в большой бороздке. А это в свою очередь может стать указателем на тот факт, что белковый контакт обеспечивается не каким-нибудь неструктурированным участком белковой глобулы (петля), а целым упорядоченным элементом вторичной структуры (альфа-спираль или бета-тяж), так как большая бороздка на десятки ангстрем шире, чем малая, а этого достаточно, чтобы, например, альфа-спираль "влезла" в большую бороздку. Но это ничуть не умаляет заслуги малой бороздки: хоть в ней нет контактов, но можно предположить, что в некоторых контактах, белок может индуцировать искривление B-формы ДНК, расширяя большую, и уменьшая малую бороздки (правда, не в моем случае: нет никаких конформационных изменений, визуально определяемых). И малая бороздка работает как некая пружина: то сжимается (если есть белок), то расширяется (белок "сделал дело, и ушел").
  4. Посмотрев внимательно на номера аминокислот, образующих данный контакт, можно заметить, что они образуют своеобразный кластер: 364А-395А и один гидрофобный контакт с 321А. Если посмотреть на вторичную структуру данного участка, то выясняется, что это [альфа-спираль]-[бета-шпилька из двух коротких бета-тяжей]. [как потом было выяснено, такой мотив называется "winged helix" - "крылатая спираль" (дословный перевод, можно наверное и более поэтично: "парящая альфа-спираль"). А по аннотации белка, данный участок попадает на ETS-домен. Также привожу иную картинку "с торца" ДНК молекулы, чтобы еще более убедиться в положении контактов, где красным цветом покрашена интересующая нас "узнающая" альфа-спираль.

На рисунке представлен контакт альфа-субъединицы белка с ДНК. Красным цветом выделены непосредственно вторичная структура аминокислот, генерирующих контакт, зеленым - бета-тяж в шпильке, который правда не дает вклада в контакт, но образующий упорядоченную структуру с контактирующим бета-тяжем: красивую бета-шпильку. Остальное - раскраска по цепям)

Задание ?3. Поиск специфических контактов, обеспечивающих узнавание сайта в молекуле ДНК.


Итак, в таблицах задания ?2 уже суммированы имена аминокислот и их атомов, участвующих во взаимодействиях с ДНК. Что касается специфичности, то, как было сказано выше, за нее ответственны те аминокислоты, которые образуют контакт с основаниями большой бороздки, фактически вклиниваются в эту щель. Также стоит сказать, что специфичность могут обеспечивать, как полярный контакт, так и неполярный (например, узнавание неполярной метильной группы тимина). Вот эти аминокислоты: LYS_373A (4-e непол. контакта), ARG_376A (2-а поляр., 4-е непол. контакта), ALA_377A (два непол. контакта), ARG_379A (2-а поляр., 2-а непол. контакта), TYR_380A (один поляр., три непол. контакта). Из этого списка выбрана наиболее "заякоренная" аминокислота: ARG_376A. Итак, в Rasmol'e построено изображение взаимодействия этой аминокислоты с основаниями большой бороздки. Используя команду в Rasmol'e:

select within (4.5, 376a) and (mjgpol, mjgnepol)


(как видно, порог выбран в 4.5 ангстрема, дабы не потерять гидрофобные контакты, а полярные взаимодействия попадут в этот интервал). Всего было найдено 13 атомов в данном окружении, представленные на картинке ниже в шариковой модели, по ним определялись основания большой бороздки, представленные в проволочной модели на картинке. Остаток ARG_376A представлен в spacefill true модели, чтобы показать, насколько тесно он соседствует с атомами оснований ДНК, сильно заякорен в большой бороздке. Интересно отметить, что контакт псевдосимметричен: три пиримидина одной цепи ДНК и три пурина другой (причем только два основания из каждой цепи образуют комплементарную пару см картинку ?2) цепи взаимодействуют с ARG. Также если учесть тот факт, что на виток В-ДНК приходится 10 нуклеотидов (или 20 в обеих цепях) и по размерам большая бороздка соотносится к малой как приблизительно 2:1 (приближение взято из результатов выполнения практикума ?7), то на большую бороздку приходится примерно 6 нуклеотидов из каждой цепочки (или 12 всего вместе из обеих цепей), то видно что остаток ARG_376a контактирует с 50% оснований, входящих в большую бороздку!!! (6/12=1/2). Даже такой грубый математический подход подтверждает важность данного аминокислотного остатка в специфическом заякоривании молекулы белка на точно определенном сайте ДНК.

На рисунке_?1 представлена красным в spacefill true model аминокислота ARG, в голубых и светло-зеленых тонах в wireframe model: основания
большой бороздки ДНК, в cpk model - атомы оснований, контактирующих с остатком аминокислоты генерирующих контакт, зеленым - бета-тяж в шпильке, который правда не дает вклада в контакт, но образующий упорядоченную структуру со значимым бета-тяжем.

На рисунке_?2 представлена интересная топология оснований ДНК, играющих роль в контакте с ARG

Задание ?4. Описание функций исследованного белка.


По данным UniProt/Swiss-prot (AC: Q00422), функция белка GABP следующая: GABP является траскрипционным фактором, взаимодействующим с богатыми пуринами повторами (GA-повторы). Используя в описании UniProt'a таблицу "Family and domain databases", была выбрана ссылка PF00178; Ets в поле PFAM, так как Ets-домен альфа субъединицы белка GABP является ДНК-связывающим. Итак, AC семейства ДНК-связывающих доменов Ets: PF00178. По данным Pfam'a, особенности этого семейства таковы: Ets-domain (erythroblast transformation specific domain) - "специфичный домен эритробластомы" (если я не ошибаюсь, то трансформация эритробластов - ядерных предшественников эритроцитов - является одним из видов рака) богат положительно заряженными и ароматическими остатками, связывается с пурин-богатыми сегментами ДНК. ETS-домен идентифицирован во многих транскрипционных факторах: PU.1, human erg, human elf-1, human elk-1, GA binding protein и др. В основном располагается на С-конце белка, кроме ELF-1,ELK-1,ELK-3, ERF - у них найден домен на N-конце. ETS-домен содержит: три альфа-спирали, 4-х тяжевой бета-лист, в следующем порядке: альфа1-бета1-бета2-альфа2-альфа3-бета3-бета4, образуя winged helixturnhelix (wHTH) топологию. Третья спираль контактирует с большой бороздкой ДНК. Для разных белков семейства характерна разная специфичность к сайтам ДНК. ETS-домен и фланкирующие аминокислотные остатки белков влияют на аффинность связывания, и изменение одного аминокислотного остатка в ETS-домене может привести к изменению специфичности действия всего белка. Также в составе генома ретровируса E26 были определены онкогены v-myb, v-ets. V-ets и с-ets-1, клеточные предшественники, являются ДНК-связывающими белками. Ets-1 отличается от v-ets С-концевым участком. Во многих видах, с-ets-1 существует в разных изоформах, возникающих в ходе альтернативного сплайсинга и дифферинцированного фосфорилирования.
Для проверки консервативности выбранного остатка (по нумерации .pdb-файла: ARG_376a, но для поиска его локализации в выравнивании, особенно из PFAM'a [он дает лишь последовательности доменов, а не всего белка], я искал такую последовательность "KLSRALR", где первым R является как раз ARG_376 по нумерации .pdb), были скачаны как полное (466 последовательностей), так и частичное (15 последовательностей) выравнивания последовательностей белков, входящих в данное семейство. Так вот, как в полном, так и частичном выравнивании, данный остаток проявляет удивительную консервативность: нет даже замен на родственный лизин. Это подтверждает важность этого остатка в образовании множественных контактов с основаниями ДНК, задействующих фактически всю боковую группу аминокислоты, особенно гуанидиновую (иначе сложно объяснить отсутствие родственных замен на лизин).

Частичное выравнивание белков, принадлежащих семейству ETS-домен содержащих белков. Красным выделен высоко консервативный аргинин.

Задание ?5. Построение схемы контактов белка с ДНК.


В строке Unix вводилась следующая команда:

nucplot 1awc.mmol.pdb


В результате было получено много разных файлов, описывающих контакты ДНК и белка, среди которых был файл nucplot.ps, содержащий описание этих взаимодействий. Вторая (из трех) страница содержит желаемое изображение:

Итак, по данным двух таблиц и выводам программы nucplot, можно составить новую таблицу сравнения:
 GLN_321A 1/2LEU_322A 1/0TRP_360A 1/0LYS_364A 1/0MET_369A 0/1 TYR_371A 1/0LYS_373A 1/4ARG_376A 2/4ALA_377A 0/2
Таблица_?1, составленная по итогам использования скрипта ?1 1/0X X X X X 1/0 2/0 X
Таблица_?2, составленная по итогам использования скрипта ?2  X X X X X X X X X
Результат программы nucplot 1/0 XX X0/0 X0/02/00/0
 ARG_379A 2/2TYR_380A 1/3TYR_381A 1/1TYR_382A 1/0LYS_389A 1/1ARG_394A 2/2PHE_395A 1/3TYR_397A 1*/0
Таблица_?1, составленная по итогам использования скрипта ?1 2/0 1/0 1/0 X1/0 2/0 X 0/0
Таблица_?2, составленная по итогам использования скрипта ?2  X X X X X X X0/0
Результат программы nucplot 3*/01*/01/0 X1/01/01/01*/0

Примечание к таблице*: на первый взгляд, эта таблица выглядит как перечисление непонятных дробей и иксов, хотя на самом деле в ней есть некоторый смысл. Каждая дробь L/M является следующим указателем [кол-во атомов аминокислотного остатка, образующих полярный контакт]/[кол-во атомов аминокислотного остатка, образующих неполярный контакт]; {X} означает, что данная дробь полностью совпадает с приведенной в "шапке" - под названием аминокислотного остатка. Если эта дробь не совпадает, то в ячейке приводится соответствующее значение. Итак, заметно, так как контакты в шапке были составлены по итогам скрипта ?2, то понятное дело все иксы стоят против ячеек с данными второй таблицы. "Звездочка" над цифрой означает, что один из полярных контактов является водородной связью, реализуемой через воду. Результат первой таблицы отличается от результатов второй таблицы только отсутствием гидрофобных взаимодействий между полярными аминокислотами (их неполярными участками) и неполярными атомами ДНК. Результат программы, как интересно отметить, находит большинство полярных контактов, даже через молекулы воды (высчитывает водяные мостики), но правда мало определяет гидрофобные контакты (хотя может их действительно там нет???). В целом, результат несколько напоминает результат первой таблицы. В принципе, можно заключить, что в программе также используется алгоритм деления множества всех "атомов" на множества "polar" и "hydrophobic" (так как результаты отличимы от второй таблицы только по количеству определенных гидрофобных контактов.
Тогда возникает резонный вопрос: где, в какой строке правда?? На мой взгляд, правда есть общее результатов всех методов, приведенных выше. То есть, если соединить все результаты воедино, то получится общая картина взаимодействия белка с молекулой ДНК. На счет рентабельности команды nucprot, можно сказать, что она отлично определяет полярные контакты и водяные мостики, но гидрофобные взаимодействия находятся слабо. Возможно, этому причины в различных порогах определения гидрофобного контакта: в моем случае порог составлял 4.5 ангстрема, в программе, возможно, меньше.





©Володя Рудько