Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~leushkin/term4/GO.html
Дата изменения: Thu Mar 29 02:27:36 2007
Дата индексирования: Tue Oct 2 07:07:53 2012
Кодировка: Windows-1251
GO

четвертый семестр

Функции генов и их продуктов. Онтологии, GO

Обязательные упражнения

  1. Поиск термина в словарях GO.

    Локализация белка (из таблицы) — аппарат Гольджи.
    По фразе Golgi apparatus найдено 6 терминов.
    Терминов, отвечающих клеточной структуре: 2.
    Из них только термин с accession GO:0005794 содержит полное описание органоида.
    Название онтологии — клеточный компонент (ответ на вопрос где?). По-русски можно назвать клеточный компонент, но в общем случае cellular component может обозначать и межклеточное вещество.
    Термин аппарат Гольджи имеет с родоначальным термином cellular component такую связь:
        клеточный компонент (объяснение функции через локализацию)
          в клетке (частный случай: именно клетка, а не клеточный компнент)
            в части клетки
              внутриклеточный (частный случай части клетки)
                внутриклеточный компонент
                  цитоплазма (а не ядро, например)
                    компонент цитоплазмы
                      аппарат Гольджи
                   
    Определение (definition): сложный мембранный органоид эукариотических клеток, состоящий из плоских везикул без рибосом, имеет более-менее регулярную структуру. Аппарат Гольджи отличается от ЭПР, часто имея более толстые мембраны, представленные секциями в форме характерных полукругов, так что проксимальная (или цис-сторона) соприкасается с ЭПР, а секреторные везикулы отщепляются с дистальной (транс-стороны). На клетку позвоночного приходится обычно один такой органоид, тогда как в беспозвоночных и растениях, где их обычно называбт диктиосомами, может быть рзбросан по цитоплазме. В аппарате Гольджи происходит модификация белков, синтезированных на рибосомах шероховатого ЭПР; этот процесс включает присоединение олигосахаридов и образование гликопротеинов, сортировку и упаковку белков для транспорта в разные участки клетки. Основываясь на функции и структуре, выделяют три части аппарата Гольджи: цис, транс и промежуточную, лежащую между двумя предыдущими.


  2. Описание функции ДНК-полимеразы I (P00582) с помощью GOA

      Онтология GO (имя) Количество ассоциированных терминов GO Краткий ответ на вопрос
    Где? Клеточный компонент (component) 2 (ссылок 3) Внутри клетки, в цитоплазме.
    Зачем, для чего? Биологический процесс (process) 3 (ссылок 5) Репликация ДНК, репарация ДНК и участи в клеточном ответе на повреждения ДНК.
    Молекулярный механизм? Молекулярная функция (function) 7 (ссылок 7) Обладает полимеразной активностью (способен наращивать цепь ДНК). Имеет как 3'-5' так и 5'-3' экзонуклеазные активности (частные случаи экзонуклеазной активности, которая в свою очередь является частным случаем гидролазной). Это напрямую связано с нуклеотидилтрансферазной активностью (отщепленные нуклеотиды нужно куда-то девать).
    Специфичность? Молекулярная функция (function) (В GO нет отдельной онтологии для специфичности) 5 (ссылок 11) Белок не обладает специфичностью в смысле связывания с ДНК. Связыается с ДНК, как и многие другие белки, с помощью HhH мотива независимо от последовательности нуклеотидов. (GO:0043565 с ссылкой на IPR003583). Но отвечая на вопрос "с чем?", говорим с ДНК (а не с РНК), а это и есть вопрос о специфичности. Связывается с регулятором транскрипции cueR (получено из эксперимента по физическому взаимодействию белков — IPI).

    Практически все данные указаны по результатам электронной аннотации (IEA). Ссылка на оригинальную статью (IDA) есть только для GO:0005737 (в числе цитоплазматических белков E. coli был выделен и DPO1). Остальные ссылки даны на базы данных InterPro и UniProt. Вопрос о специфичности звучит несколько двусмысленно: с одной стороны связывание с ДНК дает информацию о специфичности (именно с ДНК), а с другой — неспецифическое (в не зависимости от последовательности действие белка. Но во втором случае это уже не имеет отношение к одной из четырех онтологий функции.

  3. Создание больших выборок белков с определенными функциями
    Протеом аппарата Гольджи Saccharomeces cerevisiae. Результаты поиска в UniProt, 17.03.2007 г.
      Количество записей Запрос
    Всего (поиск по всему протеому Saccharomyces cerevisiae) 7472 (([uniprot-Organism:Saccharomyces*] & [uniprot-Organism:cerevisiae*]) | [uniprot-Organism:Saccharomyces cerevisiae*])
    С идентификаторами GO. 5624 ((([uniprot-Organism:Saccharomyces*] & [uniprot-Organism:cerevisiae*]) | [uniprot-Organism:Saccharomyces cerevisiae*]) & [uniprot-DBxref_:GO:*])
    С идентификаторами всех 3-х онтологий GO (В UniProt онтологии обозначаются буквенно: процесс — P (Process), функция — F (Function), компонент — C (Component). 3333 ((([uniprot-Organism:Saccharomyces*] & [uniprot-Organism:cerevisiae*]) | [uniprot-Organism:Saccharomyces cerevisiae*]) & (((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*]) | [uniprot-DBxref_:GO: F: C: P:*]))
    С идентификаторами всех 3-х онтологий GO в аппарате Гольджи. 177 (((([uniprot-Organism:Saccharomyces*] & [uniprot-Organism:cerevisiae*]) | [uniprot-Organism:Saccharomyces cerevisiae*]) & (((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*]) | [uniprot-DBxref_:GO: F: C: P:*])) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:*Golgi*]) | [uniprot-DBxref_:GO C: *Golgi*]))
    С идентификаторами хотя бы одной из онтологий (в нашем случае С) и в аппарате Гольджи. 235 ((([uniprot-Organism:Saccharomyces*] & [uniprot-Organism:cerevisiae*]) | [uniprot-Organism:Saccharomyces cerevisiae*]) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:*Golgi*]) | [uniprot-DBxref_:GO: C: *Golgi*]))
    С идентификаторами всех 3-х онтологий GO, в аппарате Гольджи и только с самыми хорошими доказательствами функции (коды только IDA или TAS) 13 ((((([uniprot-Organism:Saccharomyces*] & [uniprot-Organism:cerevisiae*]) | [uniprot-Organism:Saccharomyces cerevisiae*]) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:*Golgi*]) | [uniprot-DBxref_:GO: C: *Golgi*])) & ((((((((((((([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]) ! [uniprot-DBxref_:IEA:*]) ! [uniprot-DBxref_:IEP:*]) ! [uniprot-DBxref_:IGI:*]) ! [uniprot-DBxref_:IMP:*]) ! [uniprot-DBxref_:IPI:*]) ! [uniprot-DBxref_:ISS:*]) ! [uniprot-DBxref_:NAS:*]) ! [uniprot-DBxref_:ND:*]) ! [uniprot-DBxref_:RCA:*]) ! [uniprot-DBxref_:NR:*]) ! [uniprot-DBxref_:IGC:*]) ! [uniprot-DBxref_:IC*])) & (((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) | [uniprot-DBxref_:GO: C: F: P:*]))
    С идентификаторами всех 3-х онтологий GO, и в аппарате Гольджи и у которых встречается хотя бы один раз самое хорошее доказательство функции (коды только IDA или TAS) 160 (((([uniprot-Organism:Saccharomyces*] & [uniprot-Organism:cerevisiae*]) | [uniprot-Organism:Saccharomyces cerevisiae*]) & ((((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:*Golgi*]) & [uniprot-DBxref_:P:*]) | [uniprot-DBxref_:GO: F: C: *Golgi* P:*])) & ([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]))

     

    Для запросов использовалось слово Golgi, так как принадлежность к органоиду часто обозначается просто одним словом Golgi, так как при запросе Golgi apparatus не будут найдены, например, белки, участвующие в везикулярном транспорте (белки везикул постоянно циркулируют между мембранами аппарата Гольджи и другими мембранами (например, заменив *Golgi* на GO:0005794, получим всего 33 записи). Но и лишнего ничего не будет найдено, так как никаких других структур Гольджи у дрожжей нет.
    Чтобы не находить ненужных находок типа ген IDA, нужно проверить индексы. Если имеется ввиду доказательство, то всегда ставится двоеточие после кода. Таким способом можно избежать случайных находок.
    Во-первых, идентификаторы GO есть только у 2/3 белков Saccharomyces cerevisiae. То есть даже первый этап приписания функции еще не окончен. Около 2/3 c идентификаторами GO имеют все три онтологии. С аппаратом Гольджи все те же 2/3: из 235, кто имеет хотя бы один идентификатор GO, только 165 имеют все три. Но зато из этих 177 в 160 есть хотя бы один идентификатор IDA или TAS, дающие практически полностью уверенность в белке. Но в целом, работы еще очень много, так как с самыми хорошими доказательствами функции для белков из аппарата Гольджи нашлось только 13 белков (при поиске последней группы запрещали записи со всеми свидетельствами, кроме IDA и TAS).


    ©Леушкин Евгений.