Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~tregubova/projects/Term_4/block2/task7.html
Дата изменения: Tue May 25 16:01:39 2010
Дата индексирования: Sat Jun 26 02:29:14 2010
Кодировка: Windows-1251
Задание 7

Функции. Онтологии базы данных GO

 
  

1.Знакомство с терминологией GO


Описание функции белка CDD_ECOLI в соответствии с GO-аннотацией

  Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
(краткое описание, близкое к тексту определения термина(ов) GO
Где? Cellular Component 1 Цитозоль.Часть клетки,не содержащая клеточных органелл,но содержащая,например,белковые комплексы.
Зачем, для чего? Biological Process 3 Участие в процессе метаболизма цитидина.Т.е. в химической реакции цитидина,цитозинового рибозида,и других нуклеозидов.
Молекулярный механизм? Molecular Function 6 Цитидиновая деаминазная активность.Катализ реакции
цитидин + H2O = уридин + NH3 
Специфичность? Molecular Function 6 Cвязыванием ионов цинка.Селективное и нековалентное взаимодействие с ионами цинка

Описание терминов GO

GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
GO:0005829
Словарь Cellular Component
не нашлось Список родительских терминов:
GO:0044444 : cytoplasmic part.Часть цитоплазмы.Связь GO:0005829 is a GO:0044444,т.е.ее частный случай
GO:0005737 : cytoplasm.Цитоплазма.Связь GO:0044444 part of GO:0005737,т.е. ее часть
GO:0044424 : intracellular part.Внутриклеточная среда.Cвязь GO:0005737 is a GO:0044424,т.е. ее частный случай
Граф c родительскими терминами
GO:0044445 cytosolic part.Часть цитозоли.Связь GO:0044445 part of GO:0005829.Т.е. ее часть.
GO:0004126 cytidine aminohydrolase activity
cytosine nucleoside deaminase activity
Список родительских терминов:
GO:0019239 : deaminase activity.Деаминазная активность.Связь GO:0004126 is a GO:0019239,т.е.ее частный случай
GO:0003824 : catalytic activity.Каталитическая активность.Связь GO:0019239 is a GO:0003824,т.е. ее частный случай
GO:0003674 : molecular_function.Функции.Связь GO:0003824 is a GO:0003674,т.е.ее частный случай
Графс родительскими терминами.
не нашлось
GO:0046087 cytidine metabolism Список родительских терминов
GO:0046131 : pyrimidine ribonucleoside metabolic process.Процесс метаболизма пиримидиновых рибонуклеозидов.Связь GO:0046087 is a GO:0046131,т.е.ее частный случай.
GO:0006213 : pyrimidine nucleoside metabolic process.Процесс метаболизма пиримидиновых нуклеозидов.Связь GO:0046131 is a GO:0006213,т.е.е частный случай. GO:0009116 : nucleoside metabolic process.Процесс метаболизма нуклеозидов.Связь GO:0006213 is a GO:0009116 ,т.е.ее частный случай.
Граф c родительским деревом
Список дочерних терминов:
GO:0051747 DNA demethylase activity.ДНК демиталазная активность.Связь GO:0051747 is a GO:0016787 ,т.е.ее частный случай.
GO:0008233 peptidase activity.Пептидазная активность.Cвязь GO:0008233 is a GO:0051747,т.е.ее частный случай

Оценка качества функциональной аннотации белков в UniProt


Русское название:корова
Английское название:cow
Латинское название:Bos taurus
Ранг таксона:вид
NCBI_TaxID:9913

В базе данных SRS поле ProteinExist может принимать одно из следующих значений:
1:evidence at protein level(существование белка доказано экспериментально)
2:evidence at transcript level(существование белка предположили из-за наличия продуктов экспрессии)
3:interred from homology(существование белка предполагают из-за наличия ортологов в близкородственных видах)
4:predicted(не доказано существование белка)
5:uncertain (доказательство существования белка ненадежно)

Соотношение между реальными и гипотетическими белками из Bos taurus(по данным UniProt)

  Количество в UniProt
Существование белка доказано экспериментально 1351
Известны только соответствующие транскрипты 11846
Гипотетический белок, предсказан по гомологии 876
Иные предсказанные гипотетические белки 1514

Определение качества функциональной аннотации в UniProt

Коды экспериментального доказательства функции:
EXP: Inferred from Experiment
IDA: Inferred from Direct Assay
IPI: Inferred from Physical Interaction
IMP: Inferred from Mutant Phenotype
IGI: Inferred from Genetic Interaction
IEP: Inferred from Expression Pattern

Запрос в SRS:
(([swissprot-NCBI_TaxId:9913*] & ([swissprot-ProteinExistence:1: evidence at protein level]) > (((([swissprot-DBxref:GO:*] & [swissprot-DBxref:P:*]) & [swissprot-DBxref:F:*]) & [swissprot-DBxref:C:*]) & ((((([swissprot-DBxref:EXP:*] | [swissprot-DBxref:IDA:*]) | [swissprot-DBxref:IPI:*]) | [swissprot-DBxref:IMP:*]) | [swissprot-DBxref:IGI:*]) | [swissprot-DBxref:IEP:*])))
Получилось 100 находка.Что немного.

Использование GO для работы с массовыми данными.

Получение выборки последовательностей белков с заданной функцией.
Для выполнения задания мне досталась функция фосфорилирование ( phosphorylation ). Наиболее подходящий GO идентификатор - GO:0016310, biological process (P).
Был составлен запрос к SRS:
((([uniprot-Organism:Bos*] & [uniprot-Organism:taurus*]) | [uniprot-Organism:Bos taurus*]) & [uniprot-DBxref_:GO:0016310*]) Получилось 4 находоки.В файле их последовательности.
Определение главной функции в большом списке
GO ID p-value Ontology
GO:0005886 1.56e-12 cellular component
GO:0005515 7.52e-09 molecular function
GO:0005624 1.78e-06 cellular component
GO:0000267 1.78e-06 cellular component

Основная функция представленных в списке белов-образование цитоплазматической мембраны.