|
Документ взят из кэша поисковой машины. Адрес
оригинального документа
: http://kodomo.cmm.msu.ru/~danilenko/embl.html
Дата изменения: Tue Dec 18 00:19:11 2007 Дата индексирования: Tue Oct 2 00:20:33 2012 Кодировка: Windows-1251 |
| Идентификатор записи EMBL | Тип молекулы |
Класс данных
|
Раздел EMBL
|
Дата создания документа |
Описание
|
Длина последовательности
|
| M11843 | геномная ДНК | стандартные | прокариоты | 18-ноябрь-1986 | Escherichia coli histidine-tRNA synthetase (hisS), complete cds | 1679 |
| AP009048 | геномная ДНК | стандартные | прокариоты | 22-январь-2006 | Escherichia coli W3110 DNA, complete genome | 4646332 |
| U00096 | геномная ДНК | стандартные | прокариоты | 23-февраль-2006 | Escherichia coli K12 MG1655, complete genome. | 4639675 |
Все записи относятся к стандартному классу данных. Одна из последовательностей ДНК была создана давно - в 1986 году - и является записью кода только для одного белка, поэтому короткая. Две другие записи - полные геномы, они соответственно, длиннее, чем ген белка, но разной длины. Записи созданы в 2006 году почти в одно время. Последовательность, кодирующая белок SYH_ECOLI, не отличается от последовательности полного гена (идентичность 100%).
Выравнивание
Program: needle
Rundate: Wed 19 Sep 2007 08:29:59
Commandline: needle
[-asequence] SYH_ECOLI_gene1.fasta
[-bsequence] SYH_ECOLI_gene2.fasta
[-outfile] gene1-gene2.needle
-auto
Align_format: srspair
Report_file: gene1-gene2.needle
=======================================
Aligned_sequences: 2
1: M11843
2: U00096
Matrix: EDNAFULL
Gap_penalty: 10.0
Extend_penalty: 0.5
Length: 1275
Identity: 1275/1275 (100.0%)
Similarity: 1275/1275 (100.0%)
Gaps: 0/1275 ( 0.0%)
Score: 6375.0
=======================================
M11843 1 gtggcaaaaaacattcaagccattcgcggcatgaacgattacctgcctgg 50
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1 gtggcaaaaaacattcaagccattcgcggcatgaacgattacctgcctgg 50
M11843 51 cgaaacggccatctggcagcgcattgaaggcacactgaaaaacgtgctcg 100
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 51 cgaaacggccatctggcagcgcattgaaggcacactgaaaaacgtgctcg 100
M11843 101 gcagctacggttacagtgaaatccgcttgccgattgtagagcagaccccg 150
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 101 gcagctacggttacagtgaaatccgcttgccgattgtagagcagaccccg 150
M11843 151 ctattcaaacgtgcgattggtgaagtcaccgacgtggttgaaaaagagat 200
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 151 ctattcaaacgtgcgattggtgaagtcaccgacgtggttgaaaaagagat 200
M11843 201 gtacacctttgaggatcgcaatggcgacagcctgactctgcgccctgaag 250
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 201 gtacacctttgaggatcgcaatggcgacagcctgactctgcgccctgaag 250
M11843 251 ggacggcgggctgtgtacgcgccggcatcgagcatggtcttctgtacaat 300
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 251 ggacggcgggctgtgtacgcgccggcatcgagcatggtcttctgtacaat 300
M11843 301 caggaacagcgtctgtggtatatcgggccgatgttccgtcacgagcgtcc 350
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 301 caggaacagcgtctgtggtatatcgggccgatgttccgtcacgagcgtcc 350
M11843 351 gcagaaagggcgttatcgtcagttccatcagttgggctgcgaagttttcg 400
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 351 gcagaaagggcgttatcgtcagttccatcagttgggctgcgaagttttcg 400
M11843 401 gtctgcaaggtccggatatcgacgctgaactgattatgctcactgcccgc 450
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 401 gtctgcaaggtccggatatcgacgctgaactgattatgctcactgcccgc 450
M11843 451 tggtggcgcgcgctgggtatttccgagcacgtaactcttgagctgaactc 500
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 451 tggtggcgcgcgctgggtatttccgagcacgtaactcttgagctgaactc 500
M11843 501 tatcggttcgctggaagcacgcgccaattaccgcgatgcgctggtggcat 550
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 501 tatcggttcgctggaagcacgcgccaattaccgcgatgcgctggtggcat 550
M11843 551 tccttgagcagcataaagaaaagctggacgaagactgcaaacgccgcatg 600
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 551 tccttgagcagcataaagaaaagctggacgaagactgcaaacgccgcatg 600
M11843 601 tacactaacccgctgcgcgtgctggattcaaaaaatccggaagtgcaggc 650
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 601 tacactaacccgctgcgcgtgctggattcaaaaaatccggaagtgcaggc 650
M11843 651 gcttctcaacgacgctccggcattaggtgactatctggacgaggaatctc 700
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 651 gcttctcaacgacgctccggcattaggtgactatctggacgaggaatctc 700
M11843 701 gtgagcattttgccggtctgtgcaaactgctggagagcgcggggatcgct 750
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 701 gtgagcattttgccggtctgtgcaaactgctggagagcgcggggatcgct 750
M11843 751 tacaccgtaaaccagcgtctggtgcgtggtctggattactacaaccgtac 800
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 751 tacaccgtaaaccagcgtctggtgcgtggtctggattactacaaccgtac 800
M11843 801 cgttttcgagtgggtgactaacagtctcggctcccagggcaccgtgtgtg 850
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 801 cgttttcgagtgggtgactaacagtctcggctcccagggcaccgtgtgtg 850
M11843 851 caggcggtcgttatgacggtcttgtggaacaactgggcggtcgtgcaaca 900
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 851 caggcggtcgttatgacggtcttgtggaacaactgggcggtcgtgcaaca 900
M11843 901 ccggctgtcggttttgctatgggcctcgaacgtcttgtattgttagtaca 950
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 901 ccggctgtcggttttgctatgggcctcgaacgtcttgtattgttagtaca 950
M11843 951 ggccgttaatccggaatttaaagccgatcctgttgtcgatatatacctgg 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 951 ggccgttaatccggaatttaaagccgatcctgttgtcgatatatacctgg 1000
M11843 1001 tggcttcaggtgctgatacacaatctgcggctatggcattagctgagcgt 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1001 tggcttcaggtgctgatacacaatctgcggctatggcattagctgagcgt 1050
M11843 1051 ctgcgtgatgaattaccgggcgtgaaattgatgaccaaccacggcggcgg 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1051 ctgcgtgatgaattaccgggcgtgaaattgatgaccaaccacggcggcgg 1100
M11843 1101 caactttaagaaacagtttgcccgtgctgataaatggggtgcccgcgttg 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1101 caactttaagaaacagtttgcccgtgctgataaatggggtgcccgcgttg 1150
M11843 1151 ctgtggtgctgggtgagtctgaagtggctaacggcacagcagtagtgaag 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1151 ctgtggtgctgggtgagtctgaagtggctaacggcacagcagtagtgaag 1200
M11843 1201 gatttgcgctctggtgagcaaacggcagttgcgcaggatagcgtagccgc 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
U00096 1201 gatttgcgctctggtgagcaaacggcagttgcgcaggatagcgtagccgc 1250
M11843 1251 gcatttgcgcacgttactgggttaa 1275
|||||||||||||||||||||||||
U00096 1251 gcatttgcgcacgttactgggttaa 1275
| I | II | |
| ID записи | M11843 | U00096 |
| Начало гена в записи | 204 | 2637323 |
| Конец гена в записи | 1478 | 2638597 |
| Направление гена | прямое | обратное |
| Примечания | GTG старт-кодон; N-конец белка секвенирован | гистидин т-РНКсинтетаза; рабочая среда - цитоплазма; функция: аминоацилирование тРНК для трансляции белков [goid 0006418] |
Рассмотрим следующую запись: область Х хромосомы человека от гена филамина до глюкоза-6-фосфат-дегидрогеназа кодирующего гена. AC L44140, геномная ДНК, стандартный класс данных. Ген XAP-5.
..--[119119..119185]--...--[119322..119383]--...--[119650..119726]--.
..--[120110..120164]--...--[120312..120360]--...--[120458..120528]--.
..--[120638..120748]--...--[120853..121077]-->