«применение информационных технологий в молекулярной биологии»



БЕЛОРУССКИЙ Муниципальный Институт


Выпускная работа по
«Основам информационных технологий»


Магистрантка кафедры молекулярной биологии

Матвейчик Татьяна Геннадьевна

Руководители:

доктор, д.б.н. Евтушенков Анатолий Николаевич,

помощник Шешко Сергей Михайлович


Минск – 2008 г.

ОГЛАВЛЕНИЕ



ОГЛАВЛЕНИЕ 3

Реферат на тему 4

«ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ «применение информационных технологий в молекулярной биологии» В МОЛЕКУЛЯРНОЙ БИОЛОГИИ» 4

ВВЕДЕНИЕ 5

^ БАЗЫ ДАННЫХ ПО МОЛЕКУЛЯРНОЙ БИОЛОГИИ 7

База познаний по молекулярной и общей биологии человека (HUMBIO) 8

КОМПЬЮТЕРНЫЙ АНАЛИЗ Био МОЛЕКУЛ 14

Пророчество белок-кодирующих участков 16

Точечные матрицы гомологии (ТМГ) 17

Способы поиска повторов в «применение информационных технологий в молекулярной биологии» последовательностях ДНК 18

ЗАКЛЮЧЕНИЕ 19

^ Перечень ЛИТЕРАТУРЫ 20

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 21

Веб РЕСУРСЫ 22

ДЕЙСТВУЮЩИЙ ЛИЧНЫЙ Веб-сайт 24

ГРАФ НАУЧНЫХ ИНТЕРЕСОВ 25

Презентация магистерской диссертации 26

^ Перечень ЛИТЕРАТУРЫ К ВЫПУСКНОЙ РАБОТЕ 29



БЕЛОРУССКИЙ Муниципальный Институт

Био ФАКУЛЬТЕТ


Реферат на тему

^ «ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ «применение информационных технологий в молекулярной биологии» В МОЛЕКУЛЯРНОЙ БИОЛОГИИ»


Реферат выполнила

студентка магистратуры

био факультета БГУ

кафедры молекулярной биологии

Матвейчик Татьяна


Минск

2008
ВВЕДЕНИЕ
Молекулярная биология имеет огромное количество точек соприкосновения с новыми информационными технологиями. В связи со специфичностью работы в данной области биологии нереально «применение информационных технологий в молекулярной биологии» представить для себя решение исследовательских задач без использования ресурсов Internet [5]. Нужным условием действенной работы является, сначала, информированность в соответственной области, интеграция и обобщение данных, приобретенных в разных исследовательских центрах. Таким макаром «применение информационных технологий в молекулярной биологии», создаются базы данных (EMBL, GenBank), дозволяющие получить ценную информацию, сравнить и проанализировать большой объем данных, внести свой вклад в достижение общей цели [6]. Без сотворения спец информационного обеспечения просто нереально держаться на плаву в «применение информационных технологий в молекулярной биологии» море скопленной к истинному времени инфы; классификация и автоматизация процессов – залог фуррора в исследовательской работе молекулярного биолога.

Казалось бы, биология древняя наука, мы отлично знакомы с достижениями традиционной биологии, но настоящий всеобщий энтузиазм «применение информационных технологий в молекулярной биологии» вызван последними исследовательскими работами, приобретенными с внедрением новых технических достижений. 1-ые работы по генетике, проведенные Менделем в более 100 годов назад, в свое время позабытые, а позже восстановленные и общепризнанные сначала XX века «применение информационных технологий в молекулярной биологии», дали представление о наличии задатков (генов), определяющих передачу признаков из поколения в поколение. Но исключительно в последние 50 лет был достигнут несопоставимый прогресс в выявлении носителя генетической инфы (ДНК, дезоксирибонуклеиновой «применение информационных технологий в молекулярной биологии» кислоты; РНК, рибонуклеиновой кислоты); расшифрованы механизмы матричных процессов в системе ДНК – РНК   белок. Последние 20 лет связаны с открытием и широким внедрением полимеразной цепной реакции (ПЦР), отработкой техники клонирования ДНК. Проект «Геном человека», направленный «применение информационных технологий в молекулярной биологии» на расшифровку людского генома, объявленный в конце прошедшего столетия, стал глобальным событием в истории биологии, вызвал резонанс в научном мире [4].

В свою очередь программирование – относительно юная, прогрессивно развивающаяся область деятельности для насыщенного «применение информационных технологий в молекулярной биологии» сотрудничества, широкой компьютеризации и адаптации алгоритмов для решения задач молекулярной биологии, разработки новых действенных подходов в реализации тестов, построении статических и динамических моделей [5], автоматизации и упрощении уже имеющихся рутинных способов получения и обработки «применение информационных технологий в молекулярной биологии» инфы.

В текущее время просто нереально представить прогресс в области биологии без насыщенного использования достижений ряда смежных и сопутствующих дисциплин. В тесноватом симбиозе с естественными и точными науками был совершен прорыв в «применение информационных технологий в молекулярной биологии» молекулярной биологии; перспективы взаимодействия беспредельны. Современная наука ориентирована на неширокую специализацию, что подразумевает как более эффективную работу обученных профессионалов в определенной области, так и все более вырастающую необходимость насыщенного неизменного «применение информационных технологий в молекулярной биологии» обмена информацией и параллельно обеспеченность спец оборудованием; будущее за сокращением процесса технического воплощения теоретических разработок. При помощи современного программного и технического обеспечения нано- и микрообъекты и процессы стали «видимы и осязаемы», стало вероятным задавать условия «применение информационных технологий в молекулярной биологии» и фиксировать огромное количество характеристик в искусственно воссозданных системах с следующей интерпретацией относительно реальных объектов и систем.


^ БАЗЫ ДАННЫХ ПО МОЛЕКУЛЯРНОЙ БИОЛОГИИ

Молекулярная биология является активно развивающейся областью, открытой для проникания новейших «применение информационных технологий в молекулярной биологии» информационных технологий. Так к истинному времени молекулярный биолог имеет в собственном распоряжении современное программное обеспечение, призванное облегчить и ускорить работу; нужен грамотный подход к уже имеющимся технологиям, чтоб адаптировать их к «применение информационных технологий в молекулярной биологии» использованию в критериях данного опыта, внести надлежащие корректировки для работы в соответственной специализации.

В текущее время есть сотки Web-сайтов, которые доступны для обзора и поиска данных по молекулярной биологии и «применение информационных технологий в молекулярной биологии» другим смежным дисциплинам. Любая из их имеет собственный формат хранения данных, различную степень избыточности, связи с схожими либо подобными базами данных. Любая база данных имеет также свои средства доступа к инфы - разные поисковые программки «применение информационных технологий в молекулярной биологии», программные средства визуализации, пополнения базы. Наикрупнейшие хранилища первичных структур ДНК и аминокислотных последовательностей (такие, как EMBL , GenBank , DDBJ , SWISS-PROT , PIR и др.) пополняются исследователями, расшифровавшими последовательности, при помощи «применение информационных технологий в молекулярной биологии» автоматической системы пополнения баз данных по сети Веб. Многие базы данных, работающие над коллекционированием однородной инфы, координируют свои усилия, осуществляя международное разделение труда, это можно проиллюстрировать примером сотрудничества 3-х глобальных коллекций последовательностей нуклеотидов EMBL «применение информационных технологий в молекулярной биологии» (Европа), GenBank (США), DDBJ (Япония). Вместе с вставленными базами данных в ближайшее время появилось много специализированных информационных ресурсов, они обхватывают широкий диапазон. Это хранилища последовательностей ДНК и кДНК, спец базы данных по отдельным «применение информационных технологий в молекулярной биологии» регуляторным мотивам нуклеотидных последовательностей, базы данных по экспрессии генов, библиотеки геномов, карт, последовательностей РНК, белков, белковых мотивов, по продукции белков. Есть базы данных по протеомике, структурам белков, мутациям, метаболическим путям и регуляции «применение информационных технологий в молекулярной биологии», по трансгеннным организмам, анатомии, биохимии, также по научной литературе, по существующему в этих областях исследовательских работ программному обеспечению. Есть даже база данных по базам данных. Это текстовый файл с аннотациями более чем «применение информационных технологий в молекулярной биологии» на 400 био баз данных. Он содержит короткое описание предназначения базы, создателей, ссылки и адреса. Для того, чтоб обеспечить ориентирование в этом широком информационном пространстве, журнальчик Nucleic Acids Research каждый год «применение информационных технологий в молекулярной биологии» 1-ый собственный номер посвящает описаниям баз данных, изготовленным их создателями.
^ База познаний по молекулярной и общей биологии человека (HUMBIO)
Современные базы данных молекулярно-биологической инфы стали важным инвентарем исследователей биологов. Стремительно «применение информационных технологий в молекулярной биологии» вырастает как количество инфы включенной в базы данных, так и их число. Но, можно с уверенностью сказать, что в базы данных врубается жалкая часть размещенной в литературе инфы. Это обосновано трудностями связанными с формализацией данных «применение информационных технологий в молекулярной биологии». В базы данных вводится просто формализуемая информация, т.е. информация, которую можно представить в виде таблиц. Это связано с тем, что современные базы данных создаются на базе реляционных СУБД, адаптированных «применение информационных технологий в молекулярной биологии» к работе с табличными данными. Полная формализация инфы о сложных био системах фактически является невозможной. Это связано с тем, что познания в области молекулярной биологии оживленно развиваются и потому их очень тяжело обрисовать в «применение информационных технологий в молекулярной биологии» какой или заблаговременно спроектированной жесткой системе, комфортной для компьютерной обработки. В отделе биоинформатики ИМГ РАН была разработана концепция глобальной интеграции био познаний и баз данных на базе гипертекстовой технологии «применение информационных технологий в молекулярной биологии». Она была представлена на Мировом конгрессе по численным данным (KODATA) в 1990 г. В согласовании с этой концепцией в течение 1995 - 1999 гг сотворена база познаний по биологии человека. База познаний по биологии человека (HUMBIO «применение информационных технологий в молекулярной биологии»), интегрирующая познания по биологии человека от физиологического до молекулярного уровня с данными, представленными в компьютерных сетях и огромном количестве интернациональных баз данных по молекулярной биологии. В текущее время 1-ая версия системы размещена в «применение информационных технологий в молекулярной биологии» Вебе на сервере Отдела биоинформатики ИМГ РАН по адресу http://OBI .IMG. RAS. RU . Невзирая на то, что в системе более детально представлена информация, касающаяся человека, энциклопедия дает широкий обзор по разным нюансам современной «применение информационных технологий в молекулярной биологии» молекулярной и клеточной биологии, генетике, биохимии и может служить в качестве образовательной системы широкого профиля, связываюшей медицину и современную молекулярную биологию.

Система состоит из 2-ух основных частей: компьютерной энциклопедии (гипертекстовой базы данных «применение информационных технологий в молекулярной биологии»), включающей фактографическую информацию по разным разделам биологии человека и инфы из интернациональных баз данных, присоединенной к компьютерной энциклопедии \ через контекстные ссылки при помощи особых программ-драйверов. Международные базы данных «применение информационных технологий в молекулярной биологии» (БД последовательностей нуклеиновых кислот и белков, БД трехмерных структур белков, и др. могут подсоединяться к Компьютерной энциклопедии или через Веб, или употребляться с сервера локальной сети, что в текущее время существенно эффективней. Компьютерная «применение информационных технологий в молекулярной биологии» энциклопедия состоит из отдельных записей, с выделенными в тексте ключевиками либо маркерами. Переход из записи в запись происходит при входе в ключевое слово (гипертекст). Входами в компьютерную энциклопедию является разветвленная система оглавлений и система «применение информационных технологий в молекулярной биологии» каталогов. Независящие друг от друга записи из интернациональных баз данных соединяются воединыжды в группы и классифицируются средством установления связей с определенными разделами компьютерной энциклопедии. Таким макаром гипертекст употребляется для «применение информационных технологий в молекулярной биологии» интеграции и структурирования множества различной инфы по биологии человека, представленной в литературе и компьютерных базах данных и сетях.

Для облегчения работы юзеров дизайн компьютерной энциклопедии построен по аналогии со структурой печатных источников «применение информационных технологий в молекулярной биологии». Главным входом в систему являются подробные оглавления – по физиологии, клеточной биологии, биохимии, молекулярной биологии, иммунологии, патологии и др. Войдя в подходящий раздел по оглавлению, юзер производит навигацию по сети взаимосвязанных записей (гипертекстовой сети), выбирая «применение информационных технологий в молекулярной биологии» нужную информацию. Вероятен также прямой поиск записей по имени либо включению слов в имя записи в каталогах. Существует возможность вводить в базу данных и соединять с другими не только лишь текстовые, и стандартные «применение информационных технологий в молекулярной биологии» мультимедиа, да и разные специальные объекты. Для их изображения разрабатываются особые программки, применяемые как встраиваемые составляющие браузера. Компьютерная энциклопедия состоит из разделов, соответственных главным фронтам науки о человеке - физиология, клеточная «применение информационных технологий в молекулярной биологии» биология, генетика, биохимия, молекулярная биология, патология. Источниками инфы являлись более пользующиеся популярностью книжки по подходящим фронтам и авторские обзоры. Общий объем системы - около 50 Мб текста (без учета записей интернациональных баз данных и записей из «применение информационных технологий в молекулярной биологии» Веба). В системе описано около 7000 генов, около 2500 белков и их многофункциональных связей, приведено более 10 тыщ библиографических ссылок, около 800 рисунков. Организован доступ к базам данных последовательностей нуклеиновых кислот (БД EMBL, GENBANK), базе данных «применение информационных технологий в молекулярной биологии» последовательностей белков (SWISSPROT), базе данных трехмерных структур белков (PDB (Брукхевенская БД) и др. Сделанная база познаний по биологии человека является сейчас единственной системой, где дано связное описание функционирования био систем «применение информационных технологий в молекулярной биологии» человека от физиологического до молекулярного уровня организации.

ДНК

AMmtDB - database of multi-aligned metazoa mitochondrial DNA sequences

URL: http://bighost.area.ba.cnr.it/srs6bin/wgetz?-page+LibInfo+-lib+AMMTDB


ASDB - database of alternatively spliced genes

URL «применение информационных технологий в молекулярной биологии»: http://cbcg.nersc.gov/asdb


COMPEL - a database on COMPosite ELements

URL: http://compel.bionet.nsc.ru/


DBEST [dbEST] - Data Base of Expressed Sequence Tags

URL: http://www.ebi.ac.uk/embl/Access/est «применение информационных технологий в молекулярной биологии».html


dbSNP - the NCBI database of genetic variation

URL: http://www.ncbi.nlm.nih.gov/SNP/


DBSTS [dbSTS] - DataBase of Sequence-Tagged Sites

URL: http://www.ebi.ac.uk/embl/Access/sts.html


DDBJ - DNA Data Bank «применение информационных технологий в молекулярной биологии» of Japan

URL: http://www.ddbj.nig.ac.jp/


EID - the Exon-Intron Database

URL: http://mcb.harvard.edu/gilbert/EID


EMBL - the EMBL Nucleotide Sequence Database

URL: http://www.ebi.ac.uk/embl «применение информационных технологий в молекулярной биологии»/


EPD - Eukaryotic Promoter Database

URL: http://www.epd.isb-sib.ch/


ExInt - an eukaryotic Exon Intron Database

URL: http://intron.bic.nus.edu.sg/exint/newexint/exint.html


GenBank

URL: http://www.ncbi.nlm.nih.gov/Genbank «применение информационных технологий в молекулярной биологии»/GenbankOverview.html


Genew - the Human Gene Nomenclature Database

URL: http://www.gene.ucl.ac.uk/cgi-bin/nomenclature/searchgenes.pl


HGMD - Human Gene Mutation Database

URL: http://archive.uwcm.ac.uk/uwcm/mg/hgmd0.html


HGNDB «применение информационных технологий в молекулярной биологии» - Human Gene Nomenclature DataBase

URL: http://www.gene.ucl.ac.uk/cgi-bin/nomenclature/searchgenes.pl


HOVERGEN - HOmologous VERtebrate GENs database

URL: http://pbil.univ-lyon1.fr/databases/hovergen.html


HvrBase - primates mtDNA control region sequences compilation

URL: http «применение информационных технологий в молекулярной биологии»://www.hvrbase.de/


KEGG - Kyoto Encyclopedia of Genes and Genomes

URL: http://www.genome.ad.jp/kegg/


MIDB - an eukaryotic Mismatched Intron DataBase

URL: http://sege.ntu.edu.sg/wester/midb/


MitBASE «применение информационных технологий в молекулярной биологии» Pilot - a database on nuclear genes involved in mitochondrial biogenesis and its regulation in Saccharomyces cerevisiae

URL: http://www3.ebi.ac.uk/Research/Mitbase/mitbiog.pl


NDB - Nucleic acid DataBank

URL: http://ndbserver.rutgers.edu «применение информационных технологий в молекулярной биологии»/


OMIA - On-line Mendelian Inheritance in Animals

URL: http://www.angis.su.oz.au/Databases/BIRX/omia/


OMIM - On-line Mendelian Inheritance in Man

URL: http://www.ncbi.nlm.nih.gov/omim/


ooTFD - object oriented Transcription «применение информационных технологий в молекулярной биологии» Factors Database

URL: http://www.ifti.org/


^ PLACE - PLAnt Cis-acting regulatory DNA Elements database

URL: http://www.dna.affrc.go.jp/htdocs/PLACE/


РНК

5S rRNA - 5S ribosomal RNAs database

URL: http://rose «применение информационных технологий в молекулярной биологии».man.poznan.pl/5SData/Main.html


ExpressDB (EXD)

URL: http://arep.med.harvard.edu/ExpressDB/


LSU rRNA - Large SubUnit rRNA database

URL: http://www.psb.ugent.be/rRNA/lsu/


RDP, RDP-II - Ribosomal «применение информационных технологий в молекулярной биологии» Database Project

URL: http://rdp.cme.msu.edu/html/


RISSC - Ribosomal Intergenic Spacer Sequence Collection

URL: http://ulises.umh.es/RISSC/


SELEX_DB - a database on in vitro selected oligomers adapted for recognizing natural sites and for «применение информационных технологий в молекулярной биологии» analyzing both SNPs and site-directed mutagenesis data

URL: http://wwwmgs.bionet.nsc.ru/mgs/systems/selex/


SSU rRNA - Small SubUnit rRNA database

URL: http://www.psb.ugent.be/rRNA/ssu/index.html


БЕЛКИ

AARSDB - AminoAcyl «применение информационных технологий в молекулярной биологии»-tRNASynthetases DataBase

URL: http://rose.man.poznan.pl/aars/index.html


ASTRAL - The ASTRAL Compendium for Sequence and Structure Analysis

URL: http://astral.stanford.edu/


CluSTr - a database of clusters of SWISS-PROT «применение информационных технологий в молекулярной биологии»+TrEMBL proteins

URL: http://www.ebi.ac.uk/clustr


^ ENZYME - ENZYME nomenclature database

URL: http://www.expasy.ch/enzyme/


FSSP - Fold classification based on Structure-Structure alignment of Proteins

URL: http://www2.ebi.ac.uk/dali/fssp/


GTOP «применение информационных технологий в молекулярной биологии» - Genomes TO Protein structures and functions

URL: http://spock.genes.nig.ac.jp/~genome/gtop.html


Histones - Histone sequence database

URL: http://genome.nhgri.nih.gov/histones/


HSSP - Homology-derived Secondary Structure of «применение информационных технологий в молекулярной биологии» Proteins

URL: http://www.sander.ebi.ac.uk/hssp/


HUGE - Human Unidentified Gene-Encoded large protein database

URL: http://www.kazusa.or.jp/huge


ISSD - Integrated Sequence-Structure Database

URL: http://www.protein.bio.msu «применение информационных технологий в молекулярной биологии».ru/issd/index.htm


MSD - Macromolecular Structure Database

URL: http://msd.ebi.ac.uk/index.html


OWL - protein sequence database

URL: http://bioinf.man.ac.uk/dbbrowser/OWL/


PALI - a database of Phylogeny and ALIgnment of homologous «применение информационных технологий в молекулярной биологии» protein structures

URL: http://pauling.mbu.iisc.ernet.in/~pali


PIR - Protein Information Resource

URL: http://www-nbrf.georgetown.edu/


PIR-ALN - database of Protein sequence ALligNments

URL: http://pir.georgetown.edu/pirwww/dbinfo/piraln «применение информационных технологий в молекулярной биологии».html


PMD - Protein Mutant Database

URL: http://www.genome.ad.jp/htbin/www_bfind?pmd


PROSITE - PROtein SITEs and patterns dictionary

URL: http://www.expasy.ch/prosite/


Rebase - Restriction Enzyme database

URL: http://rebase.neb.com/rebase/rebase «применение информационных технологий в молекулярной биологии».html


SCOP - Structural Classification Of Proteins

URL: http://scop.mrc-lmb.cam.ac.uk/scop/


SWISS-PROT - the protein sequence data bank

URL: http://www.ebi.ac.uk/swissprot/


TIGRFAMs - a protein family resource for the functional «применение информационных технологий в молекулярной биологии» identification of proteins

URL: http://www.tigr.org/TIGRFAMs


trEMBL - EMBL protein-coding DNA sequence features translated into peptide sequences

URL: http://www.expasy.ch/sprot_


^ КОМПЬЮТЕРНЫЙ АНАЛИЗ Био МОЛЕКУЛ

Компьютерный анализ «применение информационных технологий в молекулярной биологии» является принципиальным инвентарем исследования ДНК [1]. В текущее время секвенирование ДНК получило самые широкие масштабы. По данным компании Intergrated genomics на октябрь 2001 г. (WWW.Integratedgenomics.com) размещены полные последовательности геномов 74 организмов включая 11 архебактерий, 48 эубактерий, 15 эукариот. На «применение информационных технологий в молекулярной биологии» подходе 212 геномов прокариот и 157 эукариот. Общее число нуклеотидов в секвенированных последовательностях превысило 1010. В 2001 году вышло приметное событие. 15 февраля в журнальчике Nature и 16 февраля в журнальчике Science [8] о собственных работах «применение информационных технологий в молекулярной биологии» по расшифровке генома человека и о первых результатах его анализа объявили две группы исследователей, работавших над этой неувязкой, - интернациональный консорциум и личная компания Celera Genomics. На сегодня секвенированы и общедоступны порядка 88% генома в предварительном «применение информационных технологий в молекулярной биологии» виде и 25% в окончательном (когда нуклеотиды выверены с точностью 99.99%). Тем был положен конец гонке, продолжавшейся пару лет, и наступила пост-геномная эра. Оглядываясь вспять, мы вспоминаем, что в 1977 г. были разработаны «применение информационных технологий в молекулярной биологии» способы прямого определения последовательностей нуклеотидов, и началась эпоха секвенирования. Скоро, хотя и не так скачкообразно, произошла революция в вычислительной технике. Исследователям из различных областей познания стали доступны ЭВМ различного класса. Началась «применение информационных технологий в молекулярной биологии» эпоха компьютерной генетики. Пару лет спустя появились индивидуальные компы, и компьютерная генетика вошла молекулярно-биологические лаборатории. В секвенированных последовательностях заключено неограниченное количество инфы, связанной с молекулярной генетикой этих организмов. Для извлечения этой инфы разрабатываются «применение информационных технологий в молекулярной биологии» способы с целью решения самых различных задач молекулярной генетики, либо как сейчас гласить, геномики. Сделаны бессчетные программки анализа последовательностей [1]. Особое развитие в пост-геномную эру получают системы анализа огромных геномов. Огромное внимание «применение информационных технологий в молекулярной биологии» уделяется задачке поиска повторов, потому что ранее было понятно, и секвенирование геномов это подтвердило, что повторы разного типа составляют значительную долю геномов (к примеру, выше 50% генома человека). Повторы, по последней мере, некие «применение информационных технологий в молекулярной биологии» классы повторов, играют важную структурную либо многофункциональную роль в геноме. С другой стороны, поиск повторов и тем паче поиск повторов в БД - нетривиальная и поэтому увлекательная алгоритмическая задачка. В ближайшее время «применение информационных технологий в молекулярной биологии» большой энтузиазм вызывают альфа-сателлитные ДНК генома приматов. Альфа-сателлиты приматов представляют собой протяженные кластеры циклических последовательностей ДНК, которые в геноме человека занимают ~5%, участвуют в организации центромер всех хромосом приматов, имеют «применение информационных технологий в молекулярной биологии» сложную многоуровневую структурную компанию, перемежаются с другими повторами. Анализ последовательностей альфа-сателлитов является нужным шагом на пути исследования эволюции хромосом. [2]
^ Пророчество белок-кодирующих участков
Пророчество белок-кодирующих участков на вновь секвенированных последовательностях является принципиальной задачей «применение информационных технологий в молекулярной биологии» аннотирования генома. Вначале больше секвенировали прокариотические последовательности. Белок-кодирующие участки прокариотических генов представляют собой часть открытой рамки считывания от инициирующего кодона ATG, пореже других кодонов, и заканчивающихся терминирующим кодоном «применение информационных технологий в молекулярной биологии». Эта триплетная структура определяет некие статистические особенности белок-кодирующих последовательностей. К примеру, неодинаковые частоты использования разных нуклеотидов в первом, втором и 3-ем положении кодона. Не считая того, общей закономерностью как про- , так «применение информационных технологий в молекулярной биологии» и эукариотических генов является неодинаковая частота использования синонимических кодонов. Исходя из этих особенностей были предложены универсальные, не зависящие от определенного организма способы пророчества белок-кодирующих областей. Последующие исследования проявили, что внедрение синонимических кодонов находится в «применение информационных технологий в молекулярной биологии» зависимости от 3'-соседних нуклеотидов, другими словами от контекста. Тогда провели систематическое исследование воздействия контекста, а конкретно воздействия позиций 1,2 кодона и позиций 1,2,3 3'-соседнего кодона на внедрение нуклеотида в 3-ем положении «применение информационных технологий в молекулярной биологии» кодона. Было показано, что по последней мере в E. coli учет позиций 1,2 3'-соседнего кодона существенно снимает вырождение третьей позиции кодона. Это позволило, во-1-х, сделать программку так именуемой оборотной трансляции Q>BTRN с гарантированным «применение информационных технологий в молекулярной биологии» уровнем уникальности нуклеотидов, что очень принципиально для тестов, связанных с конструированием праймеров для PCR при клонировании генов белков с известной первичной структурой; во-2-х, сделать программку Q>5RCG кодирующих областей с «применение информационных технологий в молекулярной биологии» более высочайшим разрешением, чем в более ранешних способах [7]. В этой программке для пророчества кодирующих областей использован байесовский подход. При всем этом при разработке статистических моделей кодирующих и некодирующих областей были применены контекстные частоты «применение информационных технологий в молекулярной биологии» нуклеотидов в 3-ем положении кодона. В 1992 Fickett и Tung провели сравнительное исследование разных способов пророчества кодирующих участков и узнали, что обозначенные подходы заняли фаворитные позиции по точности пророчества посреди других способов «применение информационных технологий в молекулярной биологии». В предстоящем эти подходы были улучшены Бородовским и соавт. Для поиска генов эукариот предложено огромное количество способов. Более четкое пророчество экзонов дожно включать выравнивание с последовательностями EST и учет экзон-интронной структуры «применение информационных технологий в молекулярной биологии» гомологичных генов из других организмов. [3]
^ Точечные матрицы гомологии (ТМГ)
Построение точечной матрицы гомологии является пользующимся популярностью способом сопоставления 2-ух нуклеотидных последовательностей. Способ анализа гомологичных участков при помощи точечных матриц гомологии заключается в нахождении и «применение информационных технологий в молекулярной биологии» отображении на прямоугольной матрице общих для 2-ух последовательностей слов, другими словами подпоследовательностей длиной W, в каких совпадает более M букв. Характеристики W и M именуются параметрами фильтрации, а величина W «применение информационных технологий в молекулярной биологии» именуется размером окна. (Время от времени употребляется несколько хорошее определение ТМГ). Такое построение обладает большой наглядностью, потому что гомологичные участки выявляются в виде диагональных линий. После того как были секвенированы огромные «применение информационных технологий в молекулярной биологии» геномы и потребовалось их сопоставление, время сопоставления таких геномов опять стало неприемлемо огромным. Для преодоления этого барьера было предложено несколько подходов.[8]
^ Способы поиска повторов в последовательностях ДНК
Геном эукариот характеризуется 2-мя основными особенностями:

1)Повторенность последовательностей «применение информационных технологий в молекулярной биологии»;

2) Разделением по составу на разные куски, характеризуемые специфичным содержанием нуклеотидов;

Повторенная ДНК состоит из нуклеотидных последовательностей различной длины и состава, которые встречаются в геноме пару раз или в тандемно-повторенном «применение информационных технологий в молекулярной биологии», или в диспергированном виде. Последовательности ДНК, которые не повторяются, именуются уникальной ДНК (single-copy DNA). Размер части генома, занятой циклическими последовательностями, обширно варьирует меж таксонами. У дрожжей он добивается 20%, у млекопитающих до 60% всей «применение информационных технологий в молекулярной биологии» ДНК повторяется. У растений процент повторенных последовательностей может превосходить 80%.

Для поиска повторов употребляются разные способы, которые можно поделить на несколько групп. 1-ые 3 группы решают задачку, когда максимум что понятно про «применение информационных технологий в молекулярной биологии» повторы - примерная длина и степень дивергенции.

(1) Четкие способы. В эту группу включены способы, которые гарантируют обнаружение всех специфицированных повторов .

(2) Приближенные, в том числе эвристические способы строятся с целью ускорения четких способов.

(3) Способы, использующие статистические особенности «применение информационных технологий в молекулярной биологии» последовательности, к примеру, способы сжатия, фурье-трансформации, байесовский подход. Но эти способы работают лишь на протяженных

кластерах сравнимо маленьких повторов.

(4) Поиск по эталону. Эта группа отличается тем, что макет повтора известен заблаговременно «применение информационных технологий в молекулярной биологии». Эталон может быть представлен одиночной последовательностью, консенсусом, консенсусной матрицей либо более сложной моделью. К примеру, многие известные повторы собраны в БД RepBase (http://www.girinst.org/~server/repbase.html). В случае недлинного повтора «применение информационных технологий в молекулярной биологии», когда внутренние делеции-вставки маловероятны, для поиска употребляется обычное сканирование последовательности данной моделью. В случае длинноватого макета употребляются способы поиска выравнивания макета с исследуемой последовательностью. Таковой подход применяется в «применение информационных технологий в молекулярной биологии» программке SSEARCH. Для ускорения поиска употребляют эвристики, связанные с затравками из на сто процентов совпадающих фрагментов (BLAST, PSI-BLAST и др.).




ЗАКЛЮЧЕНИЕ
Современная биология стала производителем беспримерно большущих объемов экспериментальных данных, осмысливание «применение информационных технологий в молекулярной биологии» которых нереально без вербования современных информационных технологий и действенных математических способов анализа данных и моделирования био систем и процессов. Прогресс населения земли в 21-м веке будет неразрывно связан с биологией и информатикой. Ответы на многие «применение информационных технологий в молекулярной биологии» глобальные вызовы, стоящие перед современной цивилизацией, критичным образом зависят от развития этих наук, их взаимодействия и использования их достижений. В ответ на эту острую потребность появляется новое научное направление – математическая «применение информационных технологий в молекулярной биологии» биология и биоинформатика. Научное направление нацелено на решение задачки исследования био объектов способами арифметики и информатики. В особенности быстрый прогресс информационных технологий наблюдается в последние десятилетия 20-го века, хронологически совпадая с революцией в биологии «применение информационных технологий в молекулярной биологии».

В связи с этим появилась возможность решения новых задач, которые появляются при описании сложных био объектов. К числу таких относятся системы уравнений огромных размерностей, нелинейные системы, моделирование стохастических процессов и другие. Особенностями «применение информационных технологий в молекулярной биологии» решаемых задач являются необходимость работы с большенными объемами данных, огромные времена компьютерных расчетов и особенные требования к производительности вычислительной техники. Не считая того, интенсивно употребляются новые сетевые технологии и распределенные ресурсы (базы «применение информационных технологий в молекулярной биологии» данных, спец вычислительные серверы). Для реализации нового научного направления нужно объединение усилий биологов, математиков и профессионалов в области информационных технологий.[3]

^


Перечень ЛИТЕРАТУРЫ

  1. Гельфанд М. С. Комьютерный анализ последовательностей ДНК «применение информационных технологий в молекулярной биологии» / М. С. Гельфанд // Молекулярная биология – 1998 – т.32 – №1 – С. 103-120.

  2. Гельфанд М. С. БИОИНФОРМАТИКА: ОТ Опыта К КОМПЬЮТЕРНОМУ АНАЛИЗУ И Опять К Тесту / М. С.Гельфанд, В. А. Любецкий // ВЕСТНИК Русской Академии – 2003. – том 73. – № 11. – C. 987-994.

  3. Гельфанд М. Инструкция геномов «применение информационных технологий в молекулярной биологии»: от последовательности к функции / "Компьютерра" – 2001. – №36.

  4. Baxevanis A. D., Ouellette B. F. F. Bioinformatics: a practical guide to the analysis of genes and proteins / John Wiley & Sons, Inc. – 2001. – electronic.

  5. Baxevanis «применение информационных технологий в молекулярной биологии» A. D., Ouellette B. F. F. Bioinformatics: methods of biochemical analysis / John Wiley & Sons, Inc. – 2001. – electronic.

  6. Gibas C., Jambeck P. Developing bioinformatics computer skills / O’Relly. – 2001. – p. 466.

  7. Lesk A. M. Introduction in bioinformatics / Oxford «применение информационных технологий в молекулярной биологии» University Press Inc., New York. – 2002. – p. 255.

  8. Venter J. C. The Sequence of the Human Genome / J. Craig Venter [et al.] //Science – 2001. – Vol. 291. – no. 5507. – pp. 1304 – 1351.



^ ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Internet 5

Базы данных 5, 7, 8, 9, 10, 16, 19, 20, 22

ДНК 5, 7, 11, 14, 18, 26

Компьютерный анализ «применение информационных технологий в молекулярной биологии» 14

Молекулярная биология 4, 5, 7

нуклеотид 7, 15, 16, 18

секвенирование 14



^ Веб РЕСУРСЫ


  1. www.pubmed.com

Английский веб-сайт – база статей на биологическую и мед тему. Всегда содержит последние статьи на ту либо иную тему в платном варианте. Материалы постарше можно отыскать «применение информационных технологий в молекулярной биологии» в доступной бесплатной форме. Не считая того, рядом с каждой ссылкой на статью имеется ссылка на поиск материалов по той же теме. Недочет – далековато не всегда можно отыскать статьи старше «применение информационных технологий в молекулярной биологии» 6 лет.


  1. www.molbiol.ru

Русский веб-сайт – неплохой ассистент молекулярному биологу. Содержит перечень методик, прописи смесей, ссылки на нужные веб-сайты и базы данных, последние анонсы биологии, форум. Тут можно оставлять запрос на «применение информационных технологий в молекулярной биологии» статью, которая содержится в Вебе в платном варианте и «добрые люди» посодействуют отыскать бесплатный вариант. Также тут можно просить старенькые статьи, которых за давностью лет нет в базах. Веб-сайт очень полезен как в плане «применение информационных технологий в молекулярной биологии» практическом, так и в плане получения инфы.


  1. www.molbiol.edu.ru

Веб-сайт, на котором, не считая методик и прописей, можно отыскать описание программ, подходящих для работы в лаборатории молекулярной биологии. Также тут «применение информационных технологий в молекулярной биологии» есть полезные советы по правильной организации рабочего времени и сил. Неплох для студентов и аспирантов.


  1. www.horizonpress.com

Тут можно отыскать новые книжки на биологическую тему (микробиология), ознакомиться с событиями произошедшими «применение информационных технологий в молекулярной биологии» в области микробиологии. Полезен для общего развития…


  1. www.scicentral.com

На веб-сайте расположены последние анонсы в области биологии, физики, химии и инженерных наук. Даны ссылки на рабочие лаборатории в области той либо другой науки «применение информационных технологий в молекулярной биологии». Неплохой источник новостей.


  1. www.ncbi.nlm.nih.gov

Официальный веб-сайт Государственного Центра Биотехнологической Инфы (NCBI). На веб-сайте расположена молекулярная база данных – BLAST, банк генов (GeneBank), база статей и другие разделы «применение информационных технологий в молекулярной биологии». Нередко употребляется для поиска генов и сопоставления гомологии.


  1. www.гугл.scholar.com

Поисковая машина, английский веб-сайт. Организован для поиска научной инфы. Комфортен для поиска английских статей.


  1. www.nigma.ru

Умственная поисковая машина, русский «применение информационных технологий в молекулярной биологии» веб-сайт. На веб-сайте есть ссылки на словари, библиотеки. Комфортная система для поиска русских статей.


  1. www.science.ru

Поисковая машина веб-сайтов, где расположены данные на ту либо иную тему. На веб «применение информационных технологий в молекулярной биологии»-сайте можно находить статьи и другие веб-сайты.


  1. www.blackwell-synergy.com

На веб-сайте собраны ссылки на несколько журналов в главном на сельскохозяйственную тему. Посреди статей огромное количество в свободном доступе «применение информационных технологий в молекулярной биологии». Комфортная поисковая машина.


  1. www.nehudlit.ru

Веб-сайт, на котором расположены полезные книжки по различным областям познания. Тут их можно скачать. Большой недочет веб-сайта, что не всегда книжки доступны. Сам «применение информационных технологий в молекулярной биологии» веб-сайт также нередко находится в «ремонте», потому недоступен.


^ ДЕЙСТВУЮЩИЙ ЛИЧНЫЙ Веб-сайт


http://tat-matvejchik.narod.ru/


ГРАФ НАУЧНЫХ ИНТЕРЕСОВ

Студентки магистратуры Матвейчик Т.Г. Био факультет.

Специальность молекулярная генетика


Смежные специальности


03.00.07 – микробиология

  1. Эволюция и филогенетическое «применение информационных технологий в молекулярной биологии»  положение микробов;

  2. Выделение, культивирование и идентификация микробов;

  3. Морфология, физиология, биохимия и генетика микробов;

  4. Исследование разных форм отношений меж микроорганизмами (сапрофитизим, паразитизм, симбиоз, антагонизм и др.);

  5. Обмен веществ микробов;







03.00.15 – генетика

  1. Геносистематика. Анализ гомологии и гомеологии «применение информационных технологий в молекулярной биологии» геномов. Молекулярно-генетические маркеры в геносистематике. Сравнительный геномный анализ гомеологии видов (родов).







Основная специальность


03.00.26 – молекулярная генетика

  1. Молекулярная организация ядерного генома и структура гена.

  2. Механизмы репликации ДНК.

  3. Гены и регуляторные структуры, определяющие процессы транскрипции и «применение информационных технологий в молекулярной биологии» трансляции.

  4. Молекулярные механизмы рекомбинации и конверсии генов.

  5. Повторяющиеся последовательности ДНК, транспозоны, ретротранспозоны.

  6. Способы молекулярно-генетического картирования геномов.

  7. Механизмы мутационного процесса. Механизмы репарации, способы их исследования.

  8. Способы локализации и клонирования «применение информационных технологий в молекулярной биологии» генов.

  9. Секвенирование ДНК, генов, геномов.

  10. Конструирование рекомбинантных молекул ДНК, синтез генов.







Сопутствующие специльности


06.01.11 – защита растений, биол.

  1. Биология, этиология, и особенности развития патологических процессов в разных экологических критериях, диагностика организмов, вредящих растениям (грибов, микробов, вирусов «применение информационных технологий в молекулярной биологии», насекомых, клещей, нематод, мышей, цветковых паразитов, сорняков и др.).

  2. Разработка и улучшение способов фитосанитарного мониторинга агроценозов, прогнозов численности и развития вредных организмов. Оптимизация сроков проведения защитных мероприятий и оценка их угрозы для «применение информационных технологий в молекулярной биологии» среды.






^ Презентация магистерской диссертации

























^ Перечень ЛИТЕРАТУРЫ К ВЫПУСКНОЙ РАБОТЕ



  1. 1Гельфанд М. С. Комьютерный анализ последовательностей ДНК / М. С. Гельфанд // Молекулярная биология – 1998 – т.32 – №1 – С. 103-120.

  2. Гельфанд М. С. БИОИНФОРМАТИКА: ОТ Опыта К КОМПЬЮТЕРНОМУ АНАЛИЗУ «применение информационных технологий в молекулярной биологии» И Опять К Тесту / М. С.Гельфанд, В. А. Любецкий // ВЕСТНИК Русской Академии – 2003. – том 73. – № 11. – C. 987-994.

  3. Гельфанд М. Инструкция геномов: от последовательности к функции / "Компьютерра" – 2001. – №36.

  4. Baxevanis A. D., Ouellette B. F. F. Bioinformatics: a «применение информационных технологий в молекулярной биологии» practical guide to the analysis of genes and proteins / John Wiley & Sons, Inc. – 2001. – electronic.

  5. Baxevanis A. D., Ouellette B. F. F. Bioinformatics: methods of biochemical analysis / John Wiley & Sons, Inc. – 2001. – electronic.

  6. Gibas C «применение информационных технологий в молекулярной биологии»., Jambeck P. Developing bioinformatics computer skills / O’Relly. – 2001. – p. 466.

  7. Lesk A. M. Introduction in bioinformatics / Oxford University Press Inc., New York. – 2002. – p. 255.

  8. Venter J. C. The Sequence of the Human Genome / J «применение информационных технологий в молекулярной биологии». Craig Venter [et al.] //Science – 2001. – Vol. 291. – no. 5507. – pp. 1304 – 1351.

  9. www.molbiol.edu.ru;

  10. www.bionet.nsc.ru;




primenenie-filosofii-k-zhizni.html
primenenie-fiziki-v-kriminalisticheskih-issledovaniyah-referat.html
primenenie-fotoforeza-ekzoderila-pri-onihomikozah-14-03-11-vosstanovitelnaya-medicina-sportivnaya-medicina-lechebnaya-fizkultura-kurortologiya-i-fizioterapiya-14-01-10-kozhnie-i-venericheskie-bolezni.html