Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~leushkin/term4/GO2.html
Дата изменения: Thu Mar 29 02:46:22 2007
Дата индексирования: Tue Oct 2 07:29:19 2012
Кодировка: Windows-1251
GO2

четвертый семестр

Функции генов и их продуктов. Онтологии, GO

Дополнительные упражнения

  1. Описание связей между терминами в онтологиях GO
    Для белка ДНК-полимераза-I находится 17 ассоциированных терминов GO, а для построения графа можно подавать только 10. Поэтому были отобраны наиболее точные записи (располагаются внизу дерева), так как остальные в любом случае будут рисоваться как родительские. Терминов, имеющих связи более чем с двумя родителями нет, но зато есть целых семь терминов имеющих связи с двумя родителями. Один из самых нижних (то есть наиболее точно описывающих функцию терминов) является термин response to DNA damage stimulus (GO:0006974) — клеточный ответ на сигналы от повреждения ДНК. Родительскими терминами являются: response to endogenous stimulus (GO:0009719) — ответ на внутренние стимулы и response to stress (GO:0006950), обозначающий, по всей видимости внутренние стимулы. Наша запись является частным случаем каждого из этих двух процессов (может быть реакцией как на внешние, так и на внутренние стимулы). Поэтому и связи типа "is_a" (черные).



    В качестве обратного (более распространенного примера) можно привести пример двух видов экзонуклеазной активности (также связи "is_a"): 3'-5' и 5'-3' экзонуклеазные активности.



    Связей типа "part_of" (красного цвета) гораздо меньше, они встречаются обычно на более высоких уровнях (три из них: процесс, функция, компонент — части онтологии гена). Простым примером является пара клетка—часть клетки. При этом часть клетки и сама клетка являются частными случаями клеточного компонента (последний может включать и внеклеточный вещество, например). Часть клетки никак не может быть ее частным случаем.



  2. Описание функции белка в БД EcoCyc

    Принципиально новых функций для ДНК-полимеразы I не обнаружено (интересно, что кроме привычного названия PolA есть ResA и B3863). Но в комментариях библиотеки дано более подробное описание. Сравним его с ранее полученным с помощью GOA.

      GOA EcoCyc
    Где? Внутри клетки, в цитоплазме. В ссылках указывается термин GO:0005737 — цитоплазма
    Зачем, для чего? Репликация ДНК, репарация ДНК и участие в клеточном ответе на повреждения ДНК. Перечислены теже самые биологические процессы
    Молекулярный механизм? ДНК-направленная ДНК-полимеразная активность. Имеет как 3'-5' так и 5'-3' экзонуклеазные активности.
    Нуклеотидилтрансферазной активность.
    Участвует в смещении UvrABC и заполнении гэпов, которые она оставляет. Также участвует в MutHLS-опосредованной репарации микрогэпов на ДНК. Может удалять неправильные нуклеотиды после действия эндонуклеазы (то есть когда создатся конец).
    В процессе полимеризации надстраивает цепь на 20-40 нуклеотидов (максимум до 100). Играет важную роль в пристраивании первого рибонуклеотида фрагмента Оказаки (без него этот процесс протекает только у 10% мутантов). Но он же считается и основным ферментом, удаляющим РНК-праймеры и замещающим их на ДНК.
    В замечании об экзонуклеазной активности сказано, что белок активнее работает в 3'-5', чем в 5'-3' направлении. Но именно 3'-5'-экзонуклеазная активность играет основную роль в проверке: белок не ищет специально несоответствия, а останавливается на этом месте и поэтому успевает выполнить экзонуклеазную функцию.
    Указано, что фрагмент Кленова имеет 5'-экзонуклеазную и полимеразную активности, а второй (C-концевой домен необходим для осуществления 3'-экзонуклеазной активности.
    Специфичность? Белок не обладает специфичностью в смысле связывания с ДНК. Связыается с ДНК, как и многие другие белки, с помощью HhH мотива независимо от последовательности нуклеотидов. (GO:0043565 с ссылкой на IPR003583). Но отвечая на вопрос "с чем?", говорим с ДНК (а не с РНК), а это и есть вопрос о специфичности. Связывается с регулятором транскрипции cueR (получено из эксперимента по физическому взаимодействию белков — IPI). Гораздо подробнее описана специфичность связывания. Pol1 связывает по одному нуклеотиду через водород малой бороздки ДНК и присоединяется только к краю двухцепочечного разырыва или к концу цепи. Большее сродство имеет к праймерам, содержащим несовпадения, и вторичным структурам на ДНК — шпилькам. Имеет специальный сайт связывания с 3'-концом ДНК.


    В одной из многочисленных ссылок указывается классификация белка как фермента:
    3 — Гидролаза
    3.1 — Гидролиз эфирных связей.
    3.1.11 — Экзорибонуклеаза, образующая 5'-фосфомоноэфиры
    Следующего уточнения нет, так как конкретный субстрат все время разный (последовательность ДНК сильно различается).

    В отличие от GOA в EcoCyс есть ссылки на экспериментальные статьи, доказывающие его экзонуклеазные и полимеразную активность.
    Также имеются данные о доменной структуре и ссылки на результаты рентгено-структурного анализа (PDB-код: 1KFD).
    В заключении перечислю три реакции, иллюстрирующие три типа активности белка:
    1. Присоединение дезоксирибонуклеотидтрифосфата к ДНК (кофактор — ион магния).

      Экспериментальное подтверждение.
    2. Отщепление нуклеотида с 3'-конца (кофактор — ион марганца).
      Экспериментальное подтверждение.
    3. Отщепление нуклеотида с 5'-конца.
      Экспериментальное подтверждение.
  3. Исследование качества аннотации белков аппарата Гольджи Saccharomyces cerevisiae в UniProt

    Для обозначения способа доказательства функции в банке GO используется 14 кодов. Доказательства имеют разные уровни доверия.


    Остальные формы нельзя отнести чисто к одной или другой категории (например, авторские утверждения или полное отсутствие данных о функции).

    Для записи UniProt очень часто бывает несколько аннотаций GO. Но все они прикреплены к одной записи. Поэтому схема поиска несколько иная:
    1. Получим все DBxref_ для всех записей Uniprot в одном файле с помощью запроса в SRS.
      ((([uniprot-Organism:Saccharomyces*] &  [uniprot-Organism:cerevisiae*]) |  [uniprot-Organism:Saccharomyces cerevisiae*]) &
        ((([uniprot-DBxref_:GO*] & [uniprot-DBxref_:C:*]) &  [uniprot-DBxref_:*Golgi*]) |  [uniprot-DBxref_:GO C: *Golgi*])) 
      (Важно, чтобы они были в одном файле и в формате list, а не table — опция выбирается выбирается при подаче запроса. Иначе теряется большая часть информации о ресурсе доказательства: для экономии места второй раз для одного и того же белка коды не пишут. Также важно, чтобы каждый фрагмент аннотации занимал отдельную строку (для подсчета с помощью grep)).
    2. C помощью команды grep посчитаем все строки, где встретилось слово GO.
      grep GO: last5.txt -c 
      
      Всего 1158 ссылок на GO. Но на долю компьютерных данных приходится всего три ссылки GO:
      grep IGC: last5.txt -c 
      
      0 находок

      grep IEA: last5.txt -c 
      
      3 находки

      grep ISS: last5.txt -c 
      
      0 находок

      По этим данным можно сделать вывод, что Saccharomyces cerevisiae является очень хорошо изученным организмом. Основная доля информации получена в ходе различных экспериментов. Ну и действительно, пекарские дрожжи известный модельный организм. В основном как раз таки информация о его геноме и протеоме используется для компьютерных предсказаний у других организмов.


      ©Леушкин Евгений.