Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/FBB/year_02/term_6/block_4/cr3_mod3.doc
Дата изменения: Wed Apr 27 21:45:22 2005
Дата индексирования: Sat Dec 22 07:23:55 2007
Кодировка: koi8-r

Добавленные, по сравнению с предыдущей версией, пункты залиты светло-
зеленым!

Зачетное задание 3

Deadline для группы 301 -21 апр
Deadline для группы 302 - 26 апр

В файле Student_PDBcode.xls для каждого студента указан PDB код РСА
расшифровки структуры белка или комплекса молекул, а также pdf-файл со
статьей авторов структуры.


Выберите один из белков (если имеется комплекс) и один его домен (если
белок многодоменный).


Цель задания:


I Классифицировать белок (домен) по структуре


II Составить выборку (из 5 представителей) белков (доменов) со сходной
структурой и найти геометрической ядро и консервативное гидрофобной ядро
белка (домена). (Тем самым, предсказать функции многих остатков!)
Охарактеризовать различия глобальной формы сравниваемых белков.

III (*) Описать особенности поверхности белка (домена) и его контактов с
(одной) другой субъединицей (в случае, если структура содержит один
мономер, задание необходимо уточнить с преподавателем)



Необходимо представить:



* Отчет (файл XXXXX_cr3.doc где XXXXX - фамилия)


* PDB файл XXXXX_fit.ent, содержащий множественное пространственное
выравнивание белка и 4-х его гомологов с известной 3D структурой. Цепочки
разных субъединиц должны иметь разные имена (а именно, A, B, C, D, E).


* Скрипт (файл XXXXX.def) для RASMOL, в котором определены множества
> geom_core - а/к остатки из каждой цепи, составляющие геометрическое
ядро
> hf_core - консервативное гидрофобное ядро в Ваше структуре; а также,
возможно, дополнительные ядра, представляющие интерес, под именами
core_I ( I = 1, 2, .)


* Структурное выравнивание последовательностей белка и четырех его
гомологов, в котором отмечены для каждой из пяти последовательностей:
> остатки, боковые цепи которых участвуют в образовании гидрофобного
ядра
> консервативное гидрофобное ядро
> остатки, C? атомы которых входят в геометрическое ядро

(три варианта представления: (1) рисунок в тексте отчета с разметкой
цветами или другим полиграфским способом; (2) если рисунок большой, то
можно сохранить его в отдельном файле в формате .doc или другом, и
включить указание на него в разделе "сопроводительные материалы"; (3)
файл XXXXX.msf, включенный в сопроводительные материалы, с разметкой
средствами GeneDoc - например, добавлением фиктивных
последовательностей с отметками в них)
* (*) PDB-файл с биологической единицей данного комплекса сфайл,
визуализирующий
> Поверхность контакта белка с другими субъединицами
> Полости в белке (если есть)
> Карманы на поверхности (1-2, наиболее значимые, с вашей точки зрения)


* (**) Множественное выравнивание последовательностей семейства, к
которому принадлежит выбранный белок (домен), в которое включены
последовательности 5-и белков выборки


(**) отмечен не обязательный пункт;
(*) можно заменить выполнением задания практикума Pr_surface, указав это в
отчете

Перечисленные файлы должны содержаться в директории
..\Term6\Bioinformatics\Cr_3


Других файлов в директории не должно быть.




Отчет должен содержать[1]


Название типа "Исследование пространственной структуры белка .
представленной в банке PDB, код YYYYY. Часть II. "

Фамилию автора отчета

Аннотацию: примерно такую "Отчет содержит результаты сравнения структуры
.... со структурами 4х гомологичных доменов. Найдено геометрическое ядро
(оно состоит из ... С_alpha атомов) и консервативное гидрофобное ядро
семейства. Благодаря этому удалось объяснить эволюционную консервативность
... остатков, определенную с помощью выравнивания последовательностей. (*)
Охарактеризован контакт домена ... с ...."


Введение содержащее ссылку на предыдущий отчет и задачу данного отчета.
Примерно так: "Отчет является продолжением .... В данной работе
исследованы косервативные особенности белка ..... Для этого составлена
выборка из 5 структурно сходных доменов . Сравнительный анализ структур
позволяет аннотировать функцию отдельных аминокислотных остатков,
охарактеризовать эволюцию белков (доменов), проверить выравнивание
последовательностей и выделить в нем участки биологически обоснованного
сходства, .

Охарактеризовано также взаимодействие белка . с ... "


Материалы и методы.
Выборка структурных гомологов составлена с помощью ......

Структура белка классифицирована в соответствии с БД SCOP и CATH

Множественное пространственное выравнивание построено с помощью..
Визуальный анализ показал, что выравнивание ... {безукоризненное, плохое,
одна структура выровнена программой неправильно....}. Для коррекции выбраны
{визуально наиболе сходные, консервативные по последовательности,
формирующие активный центр ...... }участки равной длины (см. Табл.). По
нашему предположению, именно они наиболее пространственно консервативны. По
этим участкам выполнено совмещение структур с помощью SwissPDBviewer'а
(команда Fit molecule by selection). Результат лежит в файле....

Структурное выравнивание последовательностей построено с помощью .....
Визуальная проверка показала, что требуются исправления, которые и были
внесены. Оно представлено в {файле ..., на рис. ...}

Геометрическое ядро определено по совпадению положения C_alpha атомов всех
пяти структур с точностью до 2 ангстрем в файле с пространственным
выравниванием. Для этого использован скрипт ..

Гидрофобное ядро в каждой структуре определено с помощью .. Порог d
расстояния взаимодействующих неполярных атомов выбран . ангстрем.

Различие глобальной формы структур оценивалось по числу атомов, одной, не
попадающих в ... ангстремную окрестность другой в совмещенном файле.

Поверхность ...

Результаты включающие разделы

Выборка структурных гомологов. Сервис .... предложил для домена ... ...
сходных доменов. Были отобраны следующие .. Их выбор связан с тем, что ..
Сходство 5и доменов, по результатам сервиса ... описано в таблице 1.

Таблица1. Выборка доменов, сходных по пространственной структуре с доменом
.. белка .. из записи PDB ... Столбцы 2 и 3 описывают сходство с исходной
структурой по данным ...
|PDB |Длина |R.m.s| |Название белка, организм-источник|
|код, |выравн|.d. | | |
|цепь |и-вани|(е) | | |
| |я | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |

Из таблицы 1 следует, что сходство 4-х доменов с исходной структурой
распространяется на . часть полипептидной цепи, при этом среднее
квадратичное отклонение C_alpa атомов [невелико]. Т.о. сходство для .
[всех, некоторых] можно оценить как хорошее.

Структурная классификация доменов
Структурная классификация 5 доменов выборки представлена в табл. 2

Табл. 2 Классификация доменов выборки в соответствии с БД SCOP (A) и БД БД
CATH (B)
|A |
|PDB |Класс |Укладка |Суперсемейст|Семейство |Всего |
|код,| |(фолд) |во | |белков в |
|цепь| | | | |семействе |
| | | | | | |
| | | | | | |
| | | | | | |
| | | | | | |
| | | | | | |
|B |
|PDB |Класс |Архитек|Тополо|Суперсемейст|Семейство |Всего |
|код,| |тура |гия |во | |белков в |
|цепь| | | | | |семействе |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |
| | | | | | | |

Из таблицы видно, что все домены принадлежат ... и в той, и в другой
классификации, хотя, как можно судить по числу представителей, семейства в
этих классификациях не совпадают. [Так, домены .. принадлежат разным
семействам по . и одному - по ..]

Множественное пространственное выравнивание структур и геометрическое ядро
выборки.

Множественное пространственное выравнивание 5 доменов представлено в
сопроводительных материалах, файл ...., и на рис.1. Процедура построения
этого выравнивания описана в Материалах и методах. Визуально хорошо
совмещаются структуры .., .., и .. Совмещение их распространяется примерно
на .. часть полипептидной цепи. Другие ...

Рис.1 Совмещенные в пространстве полипептидные цепи пяти доменов выборки
(остовная модель). Красным окрашена структура .., зеленым - ..., ...






С помощью пространственного выравнивания было найдено геометрическое ядро
выборки (см. Материалы и методы). Оно представлено в таблице 3 и может быть
визуализировано с помощью скрипт-файла .. для программы Rasmol, включенного
в сопроводительные материалы.


Табл.3 Геометрическое ядро выборки..
|1 |3 |37-39 |43-45 |78-80 |2-4 |67-69 |
|2 |... |... |... |... |... |... |
|3 | | | | | | |
|.. | | | | | | |

Из таблицы видно, что геометрическое ядро выборки состоит из .. C_alpha
атомов в каждой структуре, что составляет .% от числа остатков исходного
домена.

Сравнение глобальной формы белков (доменов)

Результаты сравнения глобальной формы доменов представлены в табл. 3.

Таблица 3. Попарное сходство глобальной формы доменов выборки. Для каждой
пары доменов X, Y указано число атомов структуры X, попавших в 5
ангстремную окрестность структуры Y в пространственном выравнивании всех 5
доменов и процент от общего числа атомов структуры X. В ячейке X,X указано
число атомов структуры X (атомы водорода не включены)
| |PDB |PDB |PDB |PDB код,|PDB код, |
| |код, |код, |код, |цепочка |цепочка |
| |цепочка|цепочка|цепочк| | |
| | | |а | | |
| |A |B |C |D |E |
|PDB код,|A |2500 |2000 |.. |.. |... |
|цепочка | |(100%) |(80%) | | | |
|PDB код,|B |1500 |2000 |... |... |... |
|цепочка | |(75%) |(100%) | | | |
|PDB код,|C | | | | | |
|цепочка | | | | | | |
|PDB код,|D | | | | | |
|цепочка | | | | | | |
|PDB код,|E | | | | | |
|цепочка | | | | | | |

Из таблицы видно, что ..
Интересно, что ..

Структурное выравнивание последовательностей
Приведенное на рис. 2 [в файле . из сопроводительных материалов]
выравнивание последовательностей 5-и доменов выборки построено на основании
пространственного выравнивания полипептидных цепей.

Рис. 2 Структурное выравнивание, соответствующее пространственному
выравниванию доменов выборки. В первой строке знакими "=" выделены
участки, на которых имеет место сходство в расположении полипептидных цепей
(участки биологически обоснованного выравнивания); позиции, соответствующие
геометрическому ядру семейства, отмечены крестиками в последней строке;
остатки, боковые цепи которых имеют атомы, входящие в гидрофобное ядро, в
каждой структуре залиты зеленым; позиции консервативного гидрофобного ядра
залиты темно-зеленым. Консервативные и функционально консервативные позиции
выравнивания выделены жирным шрифтом.










Из рис.2 следует, что все NN консервативных позиций принадлежат участкам
биологически обоснованного выравнивания. Из них .. принадлежат
геометрическому ядру, .. - консервативному гидрофобному ядру.


Косервативное гидрофобное ядро

С помощью сервиса . для каждой структуры найдены гиброфобные кластеры.
Кластер наибольшего размера считался гидрофобным ядром домена. Найденные
гидрофобные ядра отмечены в структурном выравнивании (см. рис. 2), что
позволило определить консервативное гидрофобное ядро


(*) Описание особенностей поверхности белка
. Есть ли области поверхности, выделяющиеся по электростатическому
потенциалу, можно ли объяснить эти неоднородности
. Есть ли полости в белке и карманы на поверхности, которые могут иметь
функциональную значимость
. Описание площади контакта


Обсуждение


Предлагаю обсудить следующие положения (если это применимо к вашей
ситуации)

Совпадают ли семейства в классификациях SCOP и CATH (на вашем примере)
Какой раздел (один белок, семейство, суперсемейство) представляет изучаемая
выборка.
Какие части белка (домена) консервативны по структуре, а какие -
вариабельны? Велико ли геометрическое ядро? Где расположено? Различаются ли
домены по глобальной форме? Насколько существенны различия?

Соответствие между консервативными позициями выравнивания
последовательностей и консервативными по структуре участками полипептидной
цепи. Имеются ли в выравнивании последовательностей консервативные остатки
вне участков биологически обоснованного пространственного выравнивания?
Являются ли консервативными остатки в позициях из геометрического ядра.

Что можно сказать о консервативном гидрофобном ядре домена, и возможно,
других гидрофобных кластерах? Где расположено? велико ли? Являются ли
консервативными по последовательности остатки, вносящие вклад в
консервативное гидрофобное ядро? Включает ли консервативное гидрофобное
ядро полярные аминокислотные остатки?

Функциональная аннотация некоторых консервативных по последовательности
остатков (из консервативного гидрофобного ядра; .)

Сопроводительные материалы - перечисление файлов, с данными, на которые
ссылается текст, с указанием что в каждом файле лежит


Литературу (если использовали)


Методические указания

Поиск в PDB белков со сходной структурой

Отобрать 4 белка со сходной структурой (плюс свой = 5).

Выбирать не самых близких представителей, но таких, у которых
действительно полипептидные цепи могут быть совмещены.

Если есть ЯМР расшифровки, то взять одну.

Выполните сначала поиск по сходству структур, составьте выборку и
обязательно проверьте ее (и, при необходимости, откорректируйте) по БД
структурных классификаций доменов SCOP и CATH


Для поиска можно использовать следующие сервисы
a. DALI server (алгоритм DALI, Holm, Sander, 1993)

http://www.ebi.ac.uk/dali/index.html

Содержит базу данных FSSP с результатами поиска для всех
структур из PDB. Поэтому ответ можно получить сразу.

Результат поиска по "своей" структуре высылается по почте
b. Secondary Strucutre matching tool, SSM, на сайте MSD (E.
Krissinel and K. Henrick, 2003)

http://www.ebi.ac.uk/msd-srv/ssm

Реализован на многопроцессорном компьютере, работает
быстро.


c. Combinatorial Extension algorithm, SE (Shindyanov&Bourne, 1998)

http://cl.sdsc.edu/ce.html.

Быстрый алгоритм поиска по PDB



Адреса БД структурных классификаций

d. Structural Classification of Proteins, SCOP (Murzin, Brenner,
Hubbard, Chothia, 1995).

http://scop.mrc-lmb.cam.ac.uk/scop/
e. CATH: Class, Architecture, Topology, Homologous superfamily
(Orengo, Michie, Jones, Jones, Swindells, Thornton, 1997)
http://www.biochem.ucl.ac.uk/bsm/cath_new/index.html
f. Families of Structurally Similar Proteins, FSSP (Holm, Ouzounis,
Sander, Tuparev, Vriend, 1992)

http://www.bioinfo.biocenter.helsinki.fi:8080/dali/index.html



Навигация в CATH

- Поиском по PDB коду выходите на список доменов в структуре (по мнению
CATH; иногда мнение этой базы данных вызывает у меня удивление.).
- Переходите по гиперссылке на страницу одно из доменов.

В верхней части страницы получаете иерархическую классификацию
данного домена.
o Перейдя по гиперссылке на страницу более высокого уровня
классификации, в разделе Summary найдете число ниже лежащих
классов. Например, на странице уровня Homology Superfamily
найдете число Sequence Families в этом Homology Superfamily (под
буквой S), число "Non-identical" доменов в этом Homology
Superfamily (под буквой N), и т.п. Хорошо написанные всплывающие
подсказки помогают разобраться где что.

Ниже лежит список классов нижележащего уровня. Если уровень
Homology Superfamily, то там приведен список Sequence Families в
этом Homology Superfamily.
В нижней части страницы найдете список сходных доменов из разных
структур (если гиперссылка на такую структуру не работает, то можно ее
найти по PDB коду). Читайте все столбцы, оценивающие сходство, чтобы
понять хорошо ли это сходство! Опять же всплывающие подсказки помогут.


Навигация в SCOP

- Используя Keyword search, найдите по PDB коду ссылки на домены этого
белка (по мнению SCOP) и перейдите на страницу одного из них. Всегда
страница устроена одинаково:
o В верхнем списке ( Lineage) перечислены вышестоящие уровни
классификации
o В нижнем списке перечислены классы следующего (вниз) уровня.
Треугольно-красно-желтая маленькая кнопка позволяет
визуализировать представителя соответствующего класса с помощью
Chime (on-line версии Rasmol). Есть удобные кнопки, позволяющие
убрать лишнее, кроме одного домена (если он не совпадает с цепью
или всей структурой); правая кнопка мыши вызывает меню примерно
такое же, как в обычном Rasmol.
o Переходом по уровням можно дойти до нижнего, PDB Entry Domain.
На этом уровне появляется новая маленькая кнопка L, переходом по
которой можно получить координатный файл с одним доменом (а не
всем комплексом), последовательность и др.
o Статистику по суперсемействам, семействам и др. можно посчитать,
походив по ссылкам, а можно и получить сразу из БД Astral
(http://astral.berkeley.edu/) => SCOP parseable classification
files (from SCOP site) Для удобства классификационный файл,
полученный с этой страницы, уже лежит в директории Cr_3 и
открывается Excel. В нем только нужно разобраться! Вот кусочек
этого файла:

46456 cl a - All alpha proteins
46457 cf a.1 - Globin-like
46458 sf a.1.1 - Globin-like
46459 fa a.1.1.1 - Truncated hemoglobin
46460 dm a.1.1.1 - Protozoan/bacterial hemoglobin
46461 sp a.1.1.1 - Ciliate (Paramecium caudatum)
14982 px a.1.1.1 d1dlwa_ 1dlw A:
100068 px a.1.1.1 d1uvya_ 1uvy A:
46462 sp a.1.1.1 - Green alga (Chlamydomonas eugametos)
14983 px a.1.1.1 d1dlya_ 1dly A:
100067 px a.1.1.1 d1uvxa_ 1uvx A:
81667 sp a.1.1.1 - Cyanobacteria (Synechocystis sp.), pcc 6803
79572 px a.1.1.1 d1mwba_ 1mwb A:
97827 px a.1.1.1 d1rtxa_ 1rtx A:
63437 sp a.1.1.1 - Mycobacterium tuberculosis, HbN
62301 px a.1.1.1 d1idra_ 1idr A:
62302 px a.1.1.1 d1idrb_ 1idr B:
88965 sp a.1.1.1 - Mycobacterium tuberculosis, HbO
85673 px a.1.1.1 d1ngka_ 1ngk A:
85674 px a.1.1.1 d1ngkb_ 1ngk B:
85675 px a.1.1.1 d1ngkc_ 1ngk C:
85676 px a.1.1.1 d1ngkd_ 1ngk D:
85677 px a.1.1.1 d1ngke_ 1ngk E:
85678 px a.1.1.1 d1ngkf_ 1ngk F:
85679 px a.1.1.1 d1ngkg_ 1ngk G:
85680 px a.1.1.1 d1ngkh_ 1ngk H:
85681 px a.1.1.1 d1ngki_ 1ngk I:
85682 px a.1.1.1 d1ngkj_ 1ngk J:
85683 px a.1.1.1 d1ngkk_ 1ngk K:
85684 px a.1.1.1 d1ngkl_ 1ngk L:
74660 fa a.1.1.4 - Nerve tissue mini-hemoglobin (neural globin)
74661 dm a.1.1.4 - Nerve tissue mini-hemoglobin (neural globin)
74662 sp a.1.1.4 - Milky ribbon-worm (Cerebratulus lacteus)
72890 px a.1.1.4 d1kr7a_ 1kr7 A:
46463 fa a.1.1.2 - Globins
46464 dm a.1.1.2 - Hemoglobin I
46465 sp a.1.1.2 - Ark clam (Scapharca inaequivalvis)
14984 px a.1.1.2 d3sdha_ 3sdh A:
-

1й стб. - код строки,
2стб - уровень строки: cl - класс, cf - укладка (фолд); sf -
суперсемейство; fa - семейство; dm - домен; sp - вид; px - домен белка,
нижний уровень,
3стб - код вида x.k.l.m., где x - код класса, k - укладки, l -
суперсемейства, m - семейства;
4 стб. Для строки нижнего уровня содержит PDB код и цепочку белка

5 стб. То же, в боле привычном виде с указанием "от-до" если необходимо

Задача: найти число семейств в суперсемействе, содержащем домен,
совпадающий с цепочкой A PDB структуры 1dlw.
Решение: находим класификационный код (стб.3) 1dlw A (стб. 5) - это
a.1.1.1. Значит, суперсемейство имеет код a.1.1. Отбираем записи уровня
"семейство " (fa) с кодами вида a.1.1.m, m- любое. Это делается с помощью
Excel. Каждая из отобранных строк - одно семейство, принадлежащее
суперсемейству, содержащему 1dlw цепь A; их число - и есть ответ. В
приведенном выше фрагменте таких семейств три ( n=1, 4, 2)






В случае, если окажется, что у вашего белка нет родственников со сходной
структурой, выберите белки (домены), ближайшие по структурной классификации


Построение множественного пространственного выравнивания
Перечисленные выше сервисы позволяют сохранить как структурное
выравнивание последовательностей, так и пространственное выравнивание
структур. Не всегда построенные выравнивания удовлетворительны. Для
построения пространственных и структурных множественных выравниваний можно
использовать также следующие сервисы:
g. MultiProt -( алгоритм MUSTA, Leibowits, Nussinov, Wolfson, 2001)

http://bioinfo3d.cs.tau.ac.il/
h. SARF (Spatial ARangement of backbone Fragments, Alexandrov,
1996)

http://123d.ncifcrf.gov/
В любом случае выравнивания должны быть проверены и "утверждены"
Вами.
Переименуйте цепи так, чтобы не было одинаковых имен цепей у разных
белков (SwissPDBviewer, Edit => Rename current layer). Назовите цепи A, B,
C, D, E (заглавными буквами!); тогда предлагаемый мною скрипт gcore_2a.def
для Rasmol не придется переделывать.
Окончательное множественное пространственной выравнивание должно быть
построено по геометрическому ядру, например, командой Fit molecules from
selection из SwissPDBViewer'а.
Таким образом, по первоначальному пространственному выравниванию
находится предварительное геометрическое ядро (см. ниже), по нему структуры
совмещаются, находится геометрическое ядро в новом совмещении. Может
получиться что нужна вторая и даже третья итерации этой процедуры.


ППостроение геометрического ядра
В файле с совмещенными структурами найдите C? атомы, занимающие
одинаковое положение в пространстве с точностью до 2 ангстрем (2 ангстрема
не есть мировая константа; ее можно и изменить в зависимости от
обстоятельств, указав это, естественно, в материалах и методах).
Можно использовать скрипт gcore_2A.def для RASMOL. В нем
предполагается, что цепи имеют имена A, B, C, D, E. Он может находить
"лишние" С_alpha, но в основном работает правильно (скриптовый язык RASMOL
не позволяет реализовать полностью адекватный алгоритм). Предлагается
следующая процедура корректировки: из найденных совпадений в пространстве
C? атомов из 5 структур определяются непрерывные вдоль полипептидной цепи
участки; интервалы длины 1 (1 остаток во всех 5 структурах) между
участками присоединяются к геометрическому ядру, участки длины 1 удаляются
из геометрического ядра.


ППостроение структурного выравнивания
Выравнивание последовательностей по структуре выдает каждая из программ,
строящих пространственное выравнивание, включая SwissPDBviewer (открыть
окно Alignment из меню Windows; далее - меню Fit => Generate structural
alignment). Не всегда автоматически построенное структурное выравнивание
хорошее. Поэтому необходима визуальная проверка этого выравнивания в
подозрительных местах, и, при необходимости, ручная корректировка
средствами GeneDoc.

Консервативное гидрофобное ядро
Для нахождения гидрофобного ядра в одной структуре используйте сервис
http://monkey.belozersky.msu.ru/~mlt/HF_page.html

Сначала визуализируйте гидрофобные кластеры, перейдя на страницу Chime
Page. В большинстве случаев гидрофобное ядро - это кластер из наибольшего
числа неполярных атомов. Если визуально ядро не кажется правильно
найденным, то можно изменить параметр d в форме. Смысл d: контактирующими
считаются неполярные атомы на расстоянии не более чем d ангстрем. Поэтому
уменьшение d приводит к уменьшению кластеров.

Сервис выдает не только картинку, но и файл (открываемый в Excel) с
перечислением атомов, образующих каждый гидрофобный кластер; и Rasmol
скрипт, в котором определены кластеры своими именами core1, core2, ..
На структурном выравнивании отметьте не остатки, атомы из которых входят в
гидрофобное ядро в данной структуре.

Те позиции выравнивания, в которых остаток из каждой из 5 структур дает
вклад в гидрофобное ядро, будем считать консервативным гидрофобным ядром.

Сравнение формы белков
Для каждой пары структур в файле с пространственным выравниванием найдите
число атомов первой, попадающих в 5 анстремную окрестность второй (и
наоборот). Выполнить это можно одной комендой в Rasmol. 5 ангстрем - тоже
не мировая константа; примерно, она отражает размер боковых цепей остатков.
Т.о. разное положение боковых цепей при сходстве формы белка не очень
скажется на полученных числах.

Для ускорения работы предлагаю использовать скрипт compare.def для Rasmol,
облегчающий эту работу.


Найденные числа (и процент от общего числа атомов первой структуры) внесите
в таблицу.

-----------------------
[1] Образцы текста и форматы таблиц, естественно, не являются
обязательными, и могут быть изменены автором, желательно, в сторону
улучшения (