- Сравнение разных записей в EMBL
Идентификатор записи EMBL |
Тип молекулы |
Класс данных |
Раздел EMBL |
Дата создания документа |
Описание |
Длина последовательности |
U00096 |
Геномная ДНК (genomic DNA) |
Standard (STD) |
Прокариоты (PRO) |
23.02.2006 |
Полный геном Escherichia coli К-12 MG1655 |
4639675 |
AP009048 |
Геномная ДНК (genomic DNA) |
Standard (STD) |
Прокариоты (PRO) |
22.01.2006 |
Полный геном Escherichia coli W3110 DNA
|
4646332 |
U00006 |
Геномная ДНК (genomic DNA) |
Standard (STD) |
Прокариоты (PRO) |
22.09.1993 |
Хромосомный участок E. coli с 89.2 по 92.8 мин.
E. coli chromosomal region from 89.2 to 92.8 minutes |
176195 |
X01700 |
Геномная ДНК (genomic DNA) |
Standard (STD) |
Прокариоты (PRO) |
02.07.1986 |
Регион промотора гена фосфоенолпируват карбоксилазы
E. coli ( PPC ,
EC 4.1.1.31 ) |
360 |
X05903 |
Геномная ДНК (genomic DNA) |
Standard (STD) |
Прокариоты (PRO) |
02.04.1988 |
Ген ррс фосфоенолпируваткарбоксилазы (EC 4.1.1.31)
E. coli ppc gene for phosphoenolpyruvate carboxylase (EC 4.1.1.31) |
3106 |
X55417 |
Геномная ДНК (genomic DNA) |
Standard (STD) |
Прокариоты (PRO) |
22.04.1992 |
Ген ацетилонитин дезацетилазы Escherichia coli
( argE Gene ). The chromosomal acetylornithine
deacetylase ( argE ) gene. |
2070 |
В банке SwissProt были найдены ссылки на записи в банке
EMBL:
DR EMBL; X05903; CAA29332.1; -; Genomic_DNA.
DR EMBL; X55417; -; NOT_ANNOTATED_CDS; Genomic_DNA.
DR EMBL; U00006; AAC43062.1; -; Genomic_DNA.
DR EMBL; U00096; AAC76938.1; -; Genomic_DNA.
DR EMBL; AP009048; BAE77355.1; -; Genomic_DNA.
DR EMBL; X01700; CAA25847.1; -; Genomic_DNA.
Затем при помощи SRS одним запросом
((((([embl-AccNumber:X05903*] | [embl-AccNumber:X55417*]) | [embl-AccNumber:U00006*]) | [embl-AccNumber:U00096*]) | [embl-AccNumber:AP009048*]) | [embl-AccNumber:X01700*])
найдены пять соответствующих embl-записей.
- Различия:
- Что бросилось в глаза - продолжительные промежутки между записями. Наиболее "древней" оказалась запись о некоем
argE-гене. Достаточно давнишней оказалась запись о хромосомном участке "from 89.2 to 92.8
minutes". Самой поздней записью явился сам геном E. coli, это понятно, получить полный геном намного трудней и сложней,
чем хромосомный участок, к примеру.
- У всех записей большой разброс в длине последовательностей, от 360 до 4639675.
- Не совсем понятна связь argE-гена, хромосомного участка и фосфоенолпируват
карбоксилазы. С участком еще легко, там могла вполне быть последовательность, кодирующая
CAPP_ECOLI, но связь argE-гена и
CAPP_ECOLI мне пока неизвестна, быть может, временно. =)
- Cходства:
- Все записи - ДНК-молекулы.
- Записи стандартного типа.
- Относятся к прокариотам.
- Сравнение описаний гена Escherichia coli в двух разных записях EMBL
Последовательности, кодирующие белок СAPP_ECOLI в двух записях банка EMBL
|
I |
II |
ID записи |
U00006 |
U00096 |
Начало гена в записи |
15688 |
4148470 |
Конец гена в записи |
18339 |
4151121 |
Направление гена |
обратное (complement) |
обратное (complement) |
Примечания* |
Это часть полного генома кишечной палочки, была получена в ходе его секвенирования.
Содержит зашифрованные гены белков, транслируемых в организме E. coli. Ген ppc кодирует белок
CAPP_ECOLI. Имеется два промотoра:(18436..18464)&(18455..18490). |
|
Были извлечены фрагменты (CAPP_gene1.fasta,
CAPP_gene2.fasta) нуклеотидных последовательностей из обоих записей, кодирующие
фосфоенолпируват карбоксилазу. С помощью needle фрагменты выравнены междy собой
(gene1_gene2.needle).
Процент идентичности 100%.
- Знакомство с записью гена из эукариотического генома
Было предложено поработать с EMBL-записью с идентификационным номером
L44140.
Мой ген - GdX.
- Схематичное изображение структуры транслируемых участков (изображены только первый и последний транслируемые участки):
Ген на комплементарной цепи:
5'-[<=155959..156069]--...--[<=156956..157003]----3'
- В гене 3 экзона и 3 интрона.
- Для подсчета их длины использовались возможности Excel
(gene.xls).
- Cамый длинный интрон (156753..156955) - 245;
Самый короткий интрон (156070..156190) - 119.
- Самый длинный экзон (156191..156399) - 209;
Самый короткий экзон (156956..157038) - 83.