Документ взят из кэша поисковой машины. Адрес оригинального документа : http://dualopt1.cmm.msu.ru/pub/Education/WebHome/nanobiomodel_pract_simple.doc
Дата изменения: Thu Apr 29 20:32:26 2010
Дата индексирования: Fri Feb 28 20:28:19 2014
Кодировка: koi8-r

Pepsin P00791 (PEPA_PIG), 3PSG

>sp|P00791|PEPA_PIG Pepsin A OS=Sus scrofa GN=PGA

MKWLLLLSLVVLSECLVKVPLVRKKSLRQNLIKNGKLKDFLKTHKHNPASKYFPEAAALI

GDEPLENYLDTEYFGTIGIGTPAQDFTVIFDTGSSNLWVPSVYCSSLACSDHNQFNPDDS

STFEATSQELSITYGTGSMTGILGYDTVQVGGISDTNQIFGLSETEPGSFLYYAPFDGIL

GLAYPSISASGATPVFDNLWDQGLVSQDLFSVYLSSNDDSGSVVLLGGIDSSYYTGSLNW

VPVSVEGYWQITLDSITMDGETIACSGGCQAIVDTGTSLLTGPTSAIANIQSDIGASENS

DGEMVISCSSIDSLPDIVFTINGVQYPLSPSAYILQDDDSCTSGFEGMDVPTSSGELWIL

GDVFIRQYYTVFDRANNKVGLAPVA

Search string:

GLAYPSISASGATPVFDNLWDQGLVSQDLFSVYLSSNDDSGSVVLLGGIDSSYYTGSLNW

Build model for P27822 (PEPA3_RABIT)

Alcohol dehydrogenase P00327 (ADH1E_HORSE), 6adh

>sp|P00327|ADH1E_HORSE Alcohol dehydrogenase E chain OS=Equus caballus

MSTAGKVIKCKAAVLWEEKKPFSIEEVEVAPPKAHEVRIKMVATGICRSDDHVVSGTLVT

PLPVIAGHEAAGIVESIGEGVTTVRPGDKVIPLFTPQCGKCRVCKHPEGNFCLKNDLSMP

RGTMQDGTSRFTCRGKPIHHFLGTSTFSQYTVVDEISVAKIDAASPLEKVCLIGCGFSTG

YGSAVKVAKVTQGSTCAVFGLGGVGLSVIMGCKAAGAARIIGVDINKDKFAKAKEVGATE

CVNPQDYKKPIQEVLTEMSNGGVDFSFEVIGRLDTMVTALSCCQEAYGVSVIVGVPPDSQ

NLSMNPMLLLSGRTWKGAIFGGFKSKDSVPKLVADFMAKKFALDPLITHVLPFEKINEGF

DLLRSGESIRTILTF

Search string

CVNPQDYKKPIQEVLTEMSNGGVDFSFEVIGRLDTMVTALSCCQEAYGVSVIVGVPPDSQ

Build model for P06757 (ADH1_RAT)

Actin P68135 (ACTS_RABIT) 1atn

>sp|P68135|ACTS_RABIT Actin, alpha skeletal muscle OS=Oryctolagus cuniculus
GN=ACTA1

MCDEDETTALVCDNGSGLVKAGFAGDDAPRAVFPSIVGRPRHQGVMVGMGQKDSYVGDEA

QSKRGILTLKYPIEHGIITNWDDMEKIWHHTFYNELRVAPEEHPTLLTEAPLNPKANREK

MTQIMFETFNVPAMYVAIQAVLSLYASGRTTGIVLDSGDGVTHNVPIYEGYALPHAIMRL

DLAGRDLTDYLMKILTERGYSFVTTAEREIVRDIKEKLCYVALDFENEMATAASSSSLEK

SYELPDGQVITIGNERFRCPETLFQPSFIGMESAGIHETTYNSIMKCDIDIRKDLYANNV

MSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILASLSTFQQMWIT

KQEYDEAGPSIVHRKCF

Search string

DLAGRDLTDYLMKILTERGYSFVTTAEREIVRDIKEKLCYVALDFENEMATAASSSSLEK

Build model for P20399 (ACT2_XENTR)

Glycogen phosphorylase P00489 (PYGM_RABIT) 6gpb

>sp|P00489|PYGM_RABIT Glycogen phosphorylase, muscle form OS=Oryctolagus
cuniculus GN=PYGM

MSRPLSDQEKRKQISVRGLAGVENVTELKKNFNRHLHFTLVKDRNVATPRDYYFALAHTV

RDHLVGRWIRTQQHYYEKDPKRIYYLSLEFYMGRTLQNTMVNLALENACDEATYQLGLDM

EELEEIEEDAGLGNGGLGRLAACFLDSMATLGLAAYGYGIRYEFGIFNQKICGGWQMEEA

DDWLRYGNPWEKARPEFTLPVHFYGRVEHTSQGAKWVDTQVVLAMPYDTPVPGYRNNVVN

TMRLWSAKAPNDFNLKDFNVGGYIQAVLDRNLAENISRVLYPNDNFFEGKELRLKQEYFV

VAATLQDIIRRFKSSKFGCRDPVRTNFDAFPDKVAIQLNDTHPSLAIPELMRVLVDLERL

DWDKAWEVTVKTCAYTNHTVLPEALERWPVHLLETLLPRHLQIIYEINQRFLNRVAAAFP

GDVDRLRRMSLVEEGAVKRINMAHLCIAGSHAVNGVARIHSEILKKTIFKDFYELEPHKF

QNKTNGITPRRWLVLCNPGLAEIIAERIGEEYISDLDQLRKLLSYVDDEAFIRDVAKVKQ

ENKLKFAAYLEREYKVHINPNSLFDVQVKRIHEYKRQLLNCLHVITLYNRIKKEPNKFVV

PRTVMIGGKAAPGYHMAKMIIKLITAIGDVVNHDPVVGDRLRVIFLENYRVSLAEKVIPA

ADLSEQISTAGTEASGTGNMKFMLNGALTIGTMDGANVEMAEEAGEENFFIFGMRVEDVD

RLDQRGYNAQEYYDRIPELRQIIEQLSSGFFSPKQPDLFKDIVNMLMHHDRFKVFADYEE

YVKCQERVSALYKNPREWTRMVIRNIATSGKFSSDRTIAQYAREIWGVEPSRQRLPAPDE

KIP

Search string

QNKTNGITPRRWLVLCNPGLAEIIAERIGEEYISDLDQLRKLLSYVDDEAFIRDVAKVKQ

Build model for C0H9H1 (C0H9H1_SALSA)

Penicillin-binding protein P15555 (DAC_STRSR) 3pte from Streptomyces sp.
(strain R61)

>sp|P15555|DAC_STRSR D-alanyl-D-alanine carboxypeptidase OS=Streptomyces
sp. (strain R61)

MVSGTVGRGTALGAVLLALLAVPAQAGTAAAADLPAPDDTGLQAVLHTALSQGAPGAMVR

VDDNGTIHQLSEGVADRATGRAITTTDRFRVGSVTKSFSAVVLLQLVDEGKLDLDASVNT

YLPGLLPDDRITVRQVMSHRSGLYDYTNDMFAQTVPGFESVRNKVFSYQDLITLSLKHGV

TNAPGAAYSYSNTNFVVAGMLIEKLTGHSVATEYQNRIFTPLNLTDTFYVHPDTVIPGTH

ANGYLTPDEAGGALVDSTEQTVSWAQSAGAVISSTQDLDTFFSALMSGQLMSAAQLAQMQ

QWTTVNSTQGYGLGLRRRDLSCGISVYGHTGTVQGYYTYAFASKDGKRSVTALANTSNNV

NVLNTMARTLESAFCGKPTTAKLRSATSSATTVERHEDIAPGIARD

Search string

TNAPGAAYSYSNTNFVVAGMLIEKLTGHSVATEYQNRIFTPLNLTDTFYVHPDTVIPGTH

Build model for B5GSI8 (B5GSI8_STRCL)

Acetylcholinesterase P22303 (ACES_HUMAN) 1f8u

>sp|P22303|ACES_HUMAN Acetylcholinesterase OS=Homo sapiens GN=ACHE

MRPPQCLLHTPSLASPLLLLLLWLLGGGVGAEGREDAELLVTVRGGRLRGIRLKTPGGPV

SAFLGIPFAEPPMGPRRFLPPEPKQPWSGVVDATTFQSVCYQYVDTLYPGFEGTEMWNPN

RELSEDCLYLNVWTPYPRPTSPTPVLVWIYGGGFYSGASSLDVYDGRFLVQAERTVLVSM

NYRVGAFGFLALPGSREAPGNVGLLDQRLALQWVQENVAAFGGDPTSVTLFGESAGAASV

GMHLLSPPSRGLFHRAVLQSGAPNGPWATVGMGEARRRATQLAHLVGCPPGGTGGNDTEL

VACLRTRPAQVLVNHEWHVLPQESVFRFSFVPVVDGDFLSDTPEALINAGDFHGLQVLVG

VVKDEGSYFLVYGAPGFSKDNESLISRAEFLAGVRVGVPQVSDLAAEAVVLHYTDWLHPE

DPARLREALSDVVGDHNVVCPVAQLAGRLAAQGARVYAYVFEHRASTLSWPLWMGVPHGY

EIEFIFGIPLDPSRNYTAEEKIFAQRLMRYWANFARTGDPNEPRDPKAPQWPPYTAGAQQ

YVSLDLRPLEVRRGLRAQACAFWNRFLPKLLSATDTLDEAERQWKAEFHRWSSYMVHWKN

QFDHYSKQDRCSDL

Search string

DPARLREALSDVVGDHNVVCPVAQLAGRLAAQGARVYAYVFEHRASTLSWPLWMGVPHGY

Build model for Q29499 (ACES_RABIT)

Carbonic anhydrase P00918 (CAH2_HUMAN) 1ca2

>sp|P00918|CAH2_HUMAN Carbonic anhydrase 2 OS=Homo sapiens GN=CA2

MSHHWGYGKHNGPEHWHKDFPIAKGERQSPVDIDTHTAKYDPSLKPLSVSYDQATSLRIL

NNGHAFNVEFDDSQDKAVLKGGPLDGTYRLIQFHFHWGSLDGQGSEHTVDKKKYAAELHL

VHWNTKYGDFGKAVQQPDGLAVLGIFLKVGSAKPGLQKVVDVLDSIKTKGKSADFTNFDP

RGLLPESLDYWTYPGSLTTPPLLECVTWIVLKEPISVSSEQVLKFRKLNFNGEGEPEELM

VDNWRPAQPLKNRQIKASFK

Search string

WHKDFPIAKGERQSPVDIDTHTAKYDPSLKPLSVSYDQATSLRILNNGHAFNVEFDDS

Build model for P00922 (CAH2_SHEEP)

Citrate Synthase P00889 (CISY_PIG) 1cts

>sp|P00889|CISY_PIG Citrate synthase, mitochondrial OS=Sus scrofa GN=CS

MALLTAAARLFGAKNASCLVLAARHASASSTNLKDILADLIPKEQARIKTFRQQHGNTVV

GQITVDMMYGGMRGMKGLVYETSVLDPDEGIRFRGYSIPECQKMLPKAKGGEEPLPEGLF

WLLVTGQIPTEEQVSWLSKEWAKRAALPSHVVTMLDNFPTNLHPMSQLSAAITALNSESN

FARAYAEGIHRTKYWELIYEDCMDLIAKLPCVAAKIYRNLYREGSSIGAIDSKLDWSHNF

TNMLGYTDAQFTELMRLYLTIHSDHEGGNVSAHTSHLVGSALSDPYLSFAAAMNGLAGPL

HGLANQEVLVWLTQLQKEVGKDVSDEKLRDYIWNTLNSGRVVPGYGHAVLRKTDPRYTCQ

REFALKHLPHDPMFKLVAQLYKIVPNVLLEQGKAKNPWPNVDAHSGVLLQYYGMTEMNYY

TVLFGVSRALGVLAQLIWSRALGFPLERPKSMSTDGLIKLVDSK

Search string

HGLANQEVLVWLTQLQKEVGKDVSDEKLRDYIWNTLNSGRVVPGYGHAVLRKTDPRYTCQ

Build model for Q8VHF5 (CISY_RAT)

Glucose oxidase from Penicillium amagasakiense P81156 (GOX_PENAG) 1gpe

>sp|P81156|GOX_PENAG Glucose oxidase OS=Penicillium amagasakiense

YLPAQQIDVQSSLLSDPSKVAGKTYDYIIAGGGLTGLTVAAKLTENPKIKVLVIEKGFYE

SNDGAIIEDPNAYGQIFGTTVDQNYLTVPLINNRTNNIKAGKGLGGSTLINGDSWTRPDK

VQIDSWEKVFGMEGWNWDNMFEYMKKAEAARTPTAAQLAAGHSFNATCHGTNGTVQSGAR

DNGQPWSPIMKALMNTVSALGVPVQQDFLCGHPRGVSMIMNNLDENQVRVDAARAWLLPN

YQRSNLEILTGQMVGKVLFKQTASGPQAVGVNFGTNKAVNFDVFAKHEVLLAAGSAISPL

ILEYSGIGLKSVLDQANVTQLLDLPVGINMQDQTTTTVSSRASSAGAGQGQAVFFANFTE

TFGDYAPQARDLLNTKLDQWAEETVARGGFHNVTALKVQYENYRNWLLDEDVAFAELFMD

TEGKINFDLWDLIPFTRGSVHILSSDPYLWQFANDPKFFLNEFDLLGQAAASKLARDLTS

QGAMKEYFAGETLPGYNLVQNATLSQWSDYVLQNFRPNWHAVSSCSMMSRELGGVVDATA

KVYGTQGLRVIDGSIPPTQVSSHVMTIFYGMALKVADAILDDYAKSA

Search string

QGAMKEYFAGETLPGYNLVQNATLSQWSDYVLQNFRPNWHAVSSCSMMSRELGGVVDATA

Build model for A2QZ31 (A2QZ31_ASPNC)

Src Tyrosine Kinase P12931 (SRC_HUMAN) 2src

>sp|P12931|SRC_HUMAN Proto-oncogene tyrosine-protein kinase Src OS=Homo
sapiens GN=SRC

MGSNKSKPKDASQRRRSLEPAENVHGAGGGAFPASQTPSKPASADGHRGPSAAFAPAAAE

PKLFGGFNSSDTVTSPQRAGPLAGGVTTFVALYDYESRTETDLSFKKGERLQIVNNTEGD

WWLAHSLSTGQTGYIPSNYVAPSDSIQAEEWYFGKITRRESERLLLNAENPRGTFLVRES

ETTKGAYCLSVSDFDNAKGLNVKHYKIRKLDSGGFYITSRTQFNSLQQLVAYYSKHADGL

CHRLTTVCPTSKPQTQGLAKDAWEIPRESLRLEVKLGQGCFGEVWMGTWNGTTRVAIKTL

KPGTMSPEAFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYMSKGSLLDFLKGETGKY

LRLPQLVDMAAQIASGMAYVERMNYVHRDLRAANILVGENLVCKVADFGLARLIEDNEYT

ARQGAKFPIKWTAPEAALYGRFTIKSDVWSFGILLTELTTKGRVPYPGMVNREVLDQVER

GYRMPCPPECPESLHDLMCQCWRKEPEERPTFEYLQAFLEDYFTSTEPQYQPGENL

Search string

LRLPQLVDMAAQIASGMAYVERMNYVHRDLRAANILVGENLVCKVADFGLARLIEDNEYT

Build model for A0JNB0 (FYN_BOVIN)

Catalase P04040 (CATA_HUMAN) 1qqw

>sp|P04040|CATA_HUMAN Catalase OS=Homo sapiens GN=CAT

MADSRDPASDQMQHWKEQRAAQKADVLTTGAGNPVGDKLNVITVGPRGPLLVQDVVFTDE

MAHFDRERIPERVVHAKGAGAFGYFEVTHDITKYSKAKVFEHIGKKTPIAVRFSTVAGES

GSADTVRDPRGFAVKFYTEDGNWDLVGNNTPIFFIRDPILFPSFIHSQKRNPQTHLKDPD

MVWDFWSLRPESLHQVSFLFSDRGIPDGHRHMNGYGSHTFKLVNANGEAVYCKFHYKTDQ

GIKNLSVEDAARLSQEDPDYGIRDLFNAIATGKYPSWTFYIQVMTFNQAETFPFNPFDLT

KVWPHKDYPLIPVGKLVLNRNPVNYFAEVEQIAFDPSNMPPGIEASPDKMLQGRLFAYPD

THRHRLGPNYLHIPVNCPYRARVANYQRDGPMCMQDNQGGAPNYYPNSFGAPEQQPSALE

HSIQYSGEVRRFNTANDDNVTQVRAFYVNVLNEEQRKRLCENIAGHLKDAQIFIQKKAVK

NFTEVHPDYGSHIQALLDKYNAEKPKNAIHTFVQSGSHLAAREKANL

Search string

MAHFDRERIPERVVHAKGAGAFGYFEVTHDITKYSKAKVFEHIGKKTPIAVRFSTVAGES

Build model for Q9XZD5 (CATA_TOXGO)

Fructose 1,6-bisphosphate Aldolase P04075 (ALDOA_HUMAN)

>sp|P04075|ALDOA_HUMAN Fructose-bisphosphate aldolase A OS=Homo sapiens
GN=ALDOA

MPYQYPALTPEQKKELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYR

QLLLTADDRVNPCIGGVILFHETLYQKADDGRPFPQVIKSKGGVVGIKVDKGVVPLAGTN

GETTTQGLDGLSERCAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQ

NGIVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHAC

TQKFSHEEIAMATVTALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTF

SYGRALQASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESLFVS

NHAY

Search string

NGIVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHAC

Build model for P53447 (ALDOB_SPAAU)

Практическое занятие по курсу «Введение в молекулярное моделирование нано-
и биоструктур»


Вариант ? 10/01.

Цель занятия - используя средства поиска доступные в Internet, найти белок,
содержащий заданную аминокислотную последовательность, определить круг его
гомологов, построить множественное выравнивание гомологов, построить модель
пространственной структуры выбранного белка-гомолога. Ознакомиться с
работой программы молекулярной графики pyMOL, различными способами
визуализации белковой структуры. Подготовить модельную структуру белка-
гомолога для проведения расчётов по методу молекулярной динамики, провести
расчёт траектории длительностью в 5 пс, обработать полученную траекторию.

Полученные результаты (идентификаторы найденных белков гомологов, краткое
описание функции найденного белка, парное и множественное выравнивание
гомологов, Log-file построения модельной структуры, командные файлы
подготовки МД расчёта и пр.) сохраняйте в файл, который необходимо
представить при сдаче практического задания.

Задана а/к последовательность:

ELRHIDLVEGDEGRMCINTEWGAFGDDGSLEDIRTEFDRELDRGSLNPGKQLFEKMVSGM

Руководство по выполнению практического задания.

Откройте главную страницу на сайте EXPASY по адресу http://us.expasy.org
Выберите пункт BLAST
Введите заданную Вам последовательность в окно поиска, выберите опцию
«Exclude fragment sequences», выберите значение опции «Comparison Matrix»
BLOSUM62 и нажмите на кнопку "Run BLAST" (будьте предельно внимательны при
наборе последовательности. Проверьте правильность её набора перед тем, как
посылать запрос на её поиск)
Изучите внимательно результаты поиска и выберите последовательность
аннотированного белка (из базы данных Swiss-Prot), демонстрирующего
наибольшую гомологию с заданной Вам а/к последовательностью
Кликнув на указатель выбранной Вами последовательности, откройте
соответствующий документ базы данных Swiss-Prot в новом окне и внимательно
изучите его - название белка и синонимы названия, из какого организма он
выделен, возможное краткое описание выполняемой функции, проверьте наличие
пространственной структуры для этого белка и запомните идентификатор
разрешённой с наибольшим разрешением и содержащей наибольшее число а/к
остатков в мономере, убедитесь, что последовательность белка содержит
заданную Вам цепочку символов. Сохраните в отчёте полученную информацию.
Откроите в новом ссылку на информацию БД PFAM относительно Вашего белка.
Определите из скольких доменов БД PFAM состоит последовательность Вашего
белка, изучите информацию по каждому домену (кол-во входящих а/к
последовательностей, размеры, краткое описание функции). Результаты
сохраните в отчёте.
В окне, содержащем результаты поиска гомологов Вашей последовательности
программой BLAST отметьте в крайней левой колонке 10-15 последовательностей
из БД Swiss-PROT (sp), включая последовательность выбранного Вами белка,
после чего в пункте меню «Send selected sequences to» выберите «Clustal W
(multiple alignment)» и нажмите на клавишу «Submit query», после чего Вы
окажитесь на странице "CLustalW XXL". В окне последовательностей Вам
необходимо подправить названия последовательностей, чтобы после символа ">"
был записан только Swiss-PROT идентификатор для каждой из
последовательностей (типа ">HXK1_RAT"). После чего введите в
соответствующее поле свой email address и нажмите на клавишу "Run
ClustalW". Получите доступ к своему почтовому ящику в новом окне, изучите
присланное Вам множественное выравнивание и сохраните его в отчёте.
Откроите новое окно Internet browser и идите на главную страницу банка
белковых структур по адресу http://www.rcsb.org
Введите идентификатор выбранной Вами структуры и нажмите на кнопку «Search»
Изучите информацию, представленную Вам на странице поиска и убедитесь в
том, что под этим идентификатором содержится структура белка, информацию о
котором Вы нашли в базе данных Swiss-Prot.
Выберите пункт "Download Files" в формате "PDB File (Text)", сохраните
загруженный файл на диске Вашего компьютера
Вызовите программу pyMOL и загрузите в неё скачанную Вами структуру.
Изучите её внимательно и изобразите на ней элементы вторичной структуры.
Если для найденного Вами белка в соответствующем Swiss-Prot документе
описан каталитический центр, выделите составляющие его аминокислотные
остатки в CPK представлении цветом, соответствующим типу атомов. Полученную
картинку сохраните в виде графического файла и поместите в отчёт.
Откроите новое окно по адресу http://www.ebi.ac.uk/thornton-
srv/databases/pdbsum/. Введите PDB идентификатор выбранной Вами белковой
структуры в окно "PDB code (4 chars)". Ознакомьтесь с приведённой
информацией. Выберите субъединицу «А» в меню "Contents" -> "Protein
chains". Изучите расположение элементов вторичной структуры по первичной
последовательности белка, положение а/к остатков активного центра и центров
связывания. Измените цвет а/к остатков первичной последовательности
согласно их консервативности для чего кликните на иконку дерева слева от
«Analysis of sequence's residue conservation». Изучите расположение
консервативных а/к остатков по первичной структуре, сохраните этот рисунок
и поместите его в отчёт.
Откроите новое окно Internet browser и идите на главную страницу базы
данных ферментов BRENDA (http://www.brenda.uni-koeln.de) и введите в
соответствующее окно название найденного Вами белка, нажмите на кнопку
«Search». Выберите из предложенного набора описаний ферментов тот, который
соответствует синонимам и EC номеру белка, описанным в соответствующем
Swiss-Prot документе. Прочитайте информацию о функции этого белка.
Откройте главную страницу на сайте EXPASY по адресу http://us.expasy.org ,
выберите пункт "SWISS-MODEL", прочитайте информацию на странице сервера
моделирования по гомологиям, после чего выберите режим "Automated Mode",
введите свой email address, идентификатор задания (кот. Будет отражаться в
строке "Subject" полученный Вами emails), введите либо "UniProt AC Code"
одного из гомологов найденного Вами белка, либо его а/к последовательность
(без сигнального пептида). Получите доступ к Вашему почтовому ящику,
сохраните полученную модельную структуру на диск, сохраните в отчёте
основную информацию о процессе построения модельной структуры
(множественное выравнивание и процент идентичности последовательностей,
сколько петель было достроено, энергию окончательной модельной структуры)
Изучите полученную модельную структуру с помощью программы pyMOL, наложите
модельную структуру на рентгеновскую структуру изученную Вами ранее и
определите RMSD по атомам пептидной цепи, сохраните эту информацию в
отчёте.