Документ взят из кэша поисковой машины. Адрес оригинального документа : http://kodomo.cmm.msu.ru/~pouliakhina/info/protocol_2.doc
Дата изменения: Mon Nov 5 16:34:08 2007
Дата индексирования: Tue Oct 2 13:19:09 2012
Кодировка: koi8-r

Отчет за занятие 2 первого блока третьего семестра

11 сентября 2007г.


1 Задание ?1. Сравнение разных записей в EMBL

Цель: сравнить записи банка данных EMBL, полученные в ответ на запрос по
accession number белка malk_ecoli.

Краткое описание работы: в работе использовался банк данных EMBL(SRS). На
ввод были поданы AC's белка Malk_ecoli (malk_ecoli). Запрос производился по
следующим полям: ID, Molecule, Data class, Division, Sequence Length, Entry
Creation Date. Description. Полученные результаты были внесены в таблицу.

Результаты: полученные находки банка EMBL сведены в Таблицу1.

|ID |Тип |Класс |Раздел |Дата |Описание |Длина |
|записи |молекул|данных |EMBL |создания| |посл. |
|EMBL |ы | | |документ| | |
| | | | |а | | |
|U00096 |Геномна|Стандар|Прокариоты|23 |Escherichia coli |4639675 |
| |я ДНК |т | |февраля |K12 MG1655, | |
| | | | |2006 |complete genome. | |
|AP00904|Геномна|Стандар|Прокариоты|22 |Escherichia coli |4646332 |
|8 |я ДНК |т | |января |K12 MG1655, | |
| | | | |2006 |complete genome. | |
|J01648 |Геномна|Стандар|Прокариоты|02 |E.coli malB region |6545 |
| |я ДНК |т | |апреля |promoter, malK-lamB| |
| | | | |1988 |and malEFG operons:| |
| | | | | |including malE, | |
| | | | | |malF, malG, malK, | |
| | | | | |lamB, and molA | |
| | | | | |genes coding for | |
| | | | | |maltose binding and| |
| | | | | |maltose uptake | |
| | | | | |proteins and the | |
| | | | | |lambda receptor | |
| | | | | |protein. | |
|U00006 |Геномна|Стандар|Прокариоты|22 |E. coli chromosomal|176195 |
| |я ДНК |т | |сентября|region from 89.2 to| |
| | | | |1993 |92.8 minutes. | |
|V00303 |Геномна|Стандар|Прокариоты|03 |E. coli genes malK |600 |
| |я ДНК |т | |ноября |and malE N-terminal| |
| | | | |1982 |sequences). | |

Выводы: - Тип молекулы: все молекулы относятся к классу геномная ДНК

- Класс данных: стандартный. Это говорит об отсутствии особенностей при
получении этих данных.

- Раздел EMBL: Т.к. все найденные записи содержат данные о ДНК прокариотныз
организмов, они относятся к разделу "PRO".

- Дата создания документа: Видно (и вполне логично), что полный геном
Escherichia coli был секвенирован гораздо позже, чем отдельные гены.

- Длина: Длина дана в парах оснований.

- Описание:


2 Задание ?2. Сравнение описаний гена Escherichia coli в двух разных
записях EMBL

Цель: сравнить описаний гена Escherichia coli в двух разных записях EMBL,
полученных в первом задании.

Краткое описание работы: accession number, по которому был произведен поиск
двух записей EMBL, был получен следующим образом:


entret embl:J01648 -auto

entret embl:U00006 -auto


Были получены файлы J01648.entret и U00006.entret, из которых потом были
извлечены гены malk. Извлечение гена из записи EBML было произведено с
помощью команды seqret: seqret j01648.entret -sask

seqret u00006.entret -sask

Для сравнения последовательностей использовалась команда needle:

needle j01648.fasta u00006.fasta j01648-u00006.needle -auto

Результаты: результаты были сведены в Таблицу2.

| |I |II |
|ID записи |J01648 |U00006 |
|Начало гена |3281 |112026 |
|в записи | | |
|Конец гена в|4393 |113141 |
|записи | | |
|Направление |прямое |прямое |
|гена | | |
|Примечания | | |

Выводы: Выводы: было выяснено, что поседовательности совпадают на 99.6%.
Отличия обусловлены заменами, приведенными в Таблице3, а также вставками в
позициях 657, 658 и 719 последовательности J01648, которые привели к сдвигу
рамки и, соответственно, уменьшению веса выравнивания.

|Позиция от |Нуклеотид |Нуклеотид |Позиция в |
|начала |из J01648 |из U00006 |кодоне: 1, 2,|
|кодир. посл.| | |3 |
|305 |с |t |2 |
|306 |t |g |3 |

Возникает вопрос: синонимична ли замена? Ответ: нет. Это обусловлено тем,
что данные нуклеотиды составляют часть триплета, кодирующего одну
аминокислоту - Пролин и Лейцин соответственно. Замена может оказаться
критичной, т.к. эти аминокислоты достаточно сильно различаются по своим
химическим свойствам.

3 Задание ?3. Знакомство с записью гена из эукариотического генома

Цель: схематично изобразить структуру транслируемых участков гена gs19,
определить общее число экзонов в гене, длину самого длинного и самого
короткого интрона и экзона. Краткое описание работы: длина экзонов
рассчитывалась по следующей формуле: l=x2-x1+1 , где х1 и х2 - первый и
последний нуклеотид экзона соответственно.

Результат: схематичное изображение гена gs19:

--[224735..224850]--[226744..226816]--->
Общее число экзонов в гене - 2

Длина интрона - 1893 нт

Длина более длинного экзона - [224735..224850] - 116 нт

Длина более короткого экзона - [226744..226816] - 73 нт


Выводы: видно, что длина интрона превышает длину экзона более, чем в 16
раз. Скорее всего, это говорит о том, что большинство геномов
эукариотических организмов не являются кодирующими.