Информация о структуре белка хранится ва его синтез осуществляется_Роль uPHK в процессе биосинтеза белка_Роль mPHK в процессе биосинтеза. Где происходит биосинтез белка. Ядро эукариот хранит информацию о первичной структуре природных полимеров. Первичная структура фибриллярных белков также высоко регулярна, периодична, — потому-то из нее и образуется обширная регулярная вторичная структура.
Адрес доставки белка указан уже в матричной РНК
Тегиструктура белка это, где хранится информация о структуре белка, кто открыл первичную структуру белка, для определения белка применяют в химии, какая структура молекулы белка определяется. Информацию о первичной структуре белка можно получить непосредственно из генетической последовательности ДНК или РНК, которая кодирует данный белок. Первичная структура фибриллярных белков также высоко регулярна, периодична, — потому-то из нее и образуется обширная регулярная вторичная структура. Проблема, решению которой посвящены многотомные монографии и работа целых институтов, кому-то может показаться несложной — как предсказать трехмерную структуру любого белка по его аминокислотной последовательности, где эта структура однозначно закодирована. Информация о первичной структуре белка содержится в его генетической. Место, где хранится информация о первичной структуре белка, это генетический код, закодированный в геноме организма.
Строение и функции белков. Денатурация белка
Она содержит огромное количество данных о белках, включая их последовательность аминокислот, структуру, функцию, экспрессию и их взаимодействие с другими молекулами. В ней можно найти информацию о трехмерной структуре белков, а также о взаимодействии белков с другими молекулами. Геномные базы данных являются важным инструментом для исследования белков и позволяют ученым получать доступ к большому объему информации о первичной структуре белка. Они обеспечивают широкие возможности для изучения белков и их роли в биологических процессах, а также для развития новых методов диагностики и лечения различных заболеваний.
Зачем нужна информация о первичной структуре белка? Информация о первичной структуре белка играет ключевую роль в понимании его функциональности и свойств. Первичная структура белка представляет собой упорядоченную последовательность аминокислот, которая определяется генетической информацией в ДНК.
Эта последовательность аминокислот влияет на формирование вторичной, третичной и четвертичной структуры белка, что, в свою очередь, определяет его биологическую активность и функциональность. Изучение первичной структуры белка позволяет установить его порядок аминокислот, что важно для понимания его происхождения, эволюции и связи с другими белками. Также, зная первичную структуру белка, можно предсказать его функцию и взаимодействие с другими молекулами, что имеет большое значение для разработки лекарств и биоматериалов.
Белки являются строительными блоками жизни, и их форма тесно связана с их функциями. Возможность предсказать структуру белка дает ученым лучшее понимание того, что он делает и как он работает. Мы надеемся, что эта расширенная база данных поможет огромному количеству ученых в их важной работе и откроет совершенно новые возможности для научных открытий. База данных белковых структур AlphaFold, которая находится в свободном доступе для научного сообщества, была расширена с почти одного миллиона белковых структур до более чем 200 миллионов структур, охватывающих почти каждый организм на Земле , чей геном был секвенирован. Расширение включает в себя предсказанные формы для самого широкого круга видов, включая растения, бактерии, животных и другие организмы, открывая новые направления исследований в области наук о жизни. Демис Хассабис, основатель и генеральный директор DeepMind, сказал: «Мы были поражены скоростью, с которой AlphaFold уже стал важным инструментом для сотен тысяч ученых в лабораториях и университетах по всему миру.
Глава 2: Где и как хранится информация о первичной структуре белка Информация о первичной структуре белка содержится в гене, который представляет собой участок ДНК.
Ген состоит из нуклеотидов, и каждая тройка нуклеотидов называется кодоном. Кодон определяет конкретную аминокислоту, которая должна быть включена в белковую цепь. Используя генетический код, клетка «читает» последовательность кодонов и синтезирует соответствующую последовательность аминокислот. Таким образом, генетическая информация в ДНК определяет структуру белка и его функцию. Место сохранения генетической информации в клетке — ядро. В первичной структуре ДНК информация о белке записывается в последовательности нуклеотидов. После этого РНК транслируется в белковую цепь.
Таким образом была заложена основная парадигма биоинформатики: разработка инструментов компьютерного представления биологических данных, обеспечение их хранения и доступности; статистическая обработка результатов экспериментов и реконструкция на этой основе математических и компьютерных моделей биологических процессов. Это определило место нового направления среди других биологических дисциплин: с помощью биоинформационного подхода появилась возможность уточнять существующие модели биологических систем и создавать новые, на основе которых можно планировать эксперименты. Появление в 1990-х гг. Наконец, в 2001 г. К настоящему времени секвенировано уже более 4,3 тыс.
В процессе высокопроизводительного секвенирования генома молекулы ДНК дробятся на короткие 50—200 нуклеотидов фрагменты ДНК, последовательность которых можно автоматически идентифицировать. В результате получаются большие массивы данных, представляющие собой результат расшифровки коротких последовательностей во множестве копий, полностью или частично перекрывающихся между собой. Для того чтобы реконструировать весь геном, нужно решить обратную задачу — собрать из этих фрагментов полные нуклеотидные последовательности, составляющие отдельные хромосомы. Для решения задачи ассемблирования сборки генома имеется два принципиальных подхода. Во-первых, сборку последовательностей можно вести «вслепую», на основании лишь известных фрагментов метод сборки de novo.
В этом случае используется тот факт, что благодаря перекрыванию коротких фрагментов одна и та же последовательность ДНК может быть «покрыта» многократно. Такой подход оправдан в случае, если геном организма неизвестен. Основной проблемой при этом является наличие в геноме большого числа одинаковых последовательностей, определить точное местоположение которых методами одной лишь биоинформатики невозможно. Однако для высших организмов характерен избыток повторенной ДНК, что существенно затрудняет сборку геномов de novo из коротких фрагментов. В результате приходится применять более трудоемкие и дорогие экспериментальные методы, позволяющие получить фрагменты большей до тысячи нуклеотидов длины.
Другой подход используется тогда, когда геном вида, к которому принадлежит организм, уже секвенирован. В этом случае требуется только определить положение отдельных секвенированных фрагментов в известной последовательности. Такая процедура «картирования» намного проще, чем сборка de novo, однако и она требует применения специальных алгоритмов из-за огромного размера данных типичная задача — картировать на геном человека сотни миллионов фрагментов. Этот подход очень удобен для повторного секвенирования геномов, которое проводится для выявления степени внутривидовых различий ДНК, анализа состава транскриптома РНК-продуктов «считывания» генов и выявления различия в нем на разных стадиях развития организма. Один из наиболее известных проектов в этой области — международный проект «1000 геномов», направленный на изучение редких и распространенных генных вариаций полиморфизмов в 14 популяциях человека на основе повторного секвенирования геномов свыше тысячи человек.
Проводим опознание В последние годы было обнаружено, что вопреки первоначальным ожиданиям в геномах высших организмов доля ДНК, кодирующей белки, очень невелика. Структура нуклеотидных последовательностей этих генов прерывистая и содержит кодирующие экзоны и некодирующие интроны участки, а также регуляторные участки, с которыми связываются белки, запускающие процесс транскрипции считывания ДНК. Идентификация структуры гена — одна из наиболее актуальных задач биоинформатики, для решения которой используются методы машинного обучения нейронные сети и другие подобные алгоритмы. В этом случае для известных достоверных последовательностей и структур генов предварительно рассчитываются наборы статистических параметров частоты встречаемости определенных нуклеотидных фрагментов, корреляции между их расположением в последовательности, наличие регуляторных последовательностей и пр. Однако наиболее ценную информацию для «опознания» генов дает сравнение нуклеотидной последовательности генома с последовательностями уже известных генов родственных видов.
Такой же принцип широко используется и для предсказания функции «нового» гена: на основе гомологии общности происхождения ему приписывается известная функция родственного гена.
Торжество компьютерных методов: предсказание строения белков
Завершение геномных проектов, следующих один за другим [4] , фактически избавило исследователей от рутины по «классическому» секвенированию белковых молекул — последовательности всех белков конвертируются из прочтённых геномов множества организмов в аннотированные базы данных, доступные через интернет. Так, число последовательностей в базе Swiss-Prot версия 55. Получить такое фантастическое число последовательностей стало возможным благодаря современным высокопроизводительным технологиям секвенирования геномов [5] , делающим задачу прочтения всей ну или почти всей ДНК нового вида или даже отдельной особи! Другая ситуация складывается с определением пространственного строения белковых молекул: инструментарий для решения этой задачи — рентгеноструктурный анализ РСА и спектроскопия ядерного магнитного резонанса ЯМР — ещё не достиг той степени зрелости, чтобы можно было получить структуру любого интересующего исследователей белка с ограниченными временными и материальными затратами. Сложность заключается в получении нужных количеств белка, подготовке препарата, пригодного для изучения дифракции рентгеновских лучей или ядерного магнитного резонанса в меченном изотопами образце, и в анализе данных. Каждый этап этой задачи часто требует уникального подхода и поэтому не может быть полностью автоматизирован. Особенно сложно охарактеризовать структуру белков, образующих сложные молекулярные комплексы, и интегральные белки биологических мембран составляющих до трети от общего числа белков в большинстве организмов. Поэтому, даже с учётом того, что расшифровкой структур белков занимаются не только научные коллективы по собственной инициативе, но и международный консорциум PSI Protein Structure Initiative , задачей которого является максимально полная и широкая структурная характеризация всего белкового разнообразия в живом мире, число белков с известной структурой сравнительно невелико.
Выход из сложившейся ситуации могут дать методики теоретического предсказания пространственной структуры, решающим преимуществом которых является сравнительно высокая скорость и низкая трудоёмкость получения моделей строения белков. Оборотной стороной этого преимущества оказывается «качество» моделей — точность предсказания, которая не всегда является достаточной для практически важных задач например, изучения взаимодействия рецептора с лигандами. Разумеется, работая с теоретически предсказанными моделями белков, надо критически относиться к полученным результатам и быть готовым к тому, что полученные результаты необходимо проверять с помощью независимых методов — что, в прочем, касается большинства научных областей, работа в которых ещё не превратилась в чистую технологию. Далее мы рассмотрим базовые теоретические предпосылки, делающие предсказание трёхмерного строения молекул белков возможным и в общем виде основные методики, использующиеся сегодня в этой области. Фолдинг: возможно ли предсказать структуру белка на компьютере? Фолдинг — сворачивание белков и других биомакромолекул из развёрнутой конформации в «нативную» форму — физико-химический процесс, в результате которого белки в своей естественной «среде обитания» растворе, цитоплазме или мембране приобретают характерные только для них пространственную укладку и функции [6]. Фолдинг причисляют к списку крупнейших неразрешённых научных проблем современности — поскольку процесс этот далёк от окончательного понимания [7].
Само собой, парадокс Левинталя — кажущийся. Решение его заключается в том, что молекула, конечно, никогда не принимает подавляющего большинства теоретически возможных конформаций. Кооперативные эффекты фолдинга — одновременное формирование «зародышей» вторичной структуры, являющихся энергетически стабильными и уже не изменяющимися в процессе дальнейшего сворачивания — приводят к тому, что молекула белка находит «кратчайший путь» на воображаемой гиперплоскости потенциальной энергии к точке, соответствующей нативной конформации белка. Нативная конформация при этом отделена заметным «энергетическим промежутком» potential energy gap от подавляющего числа несвёрнутых форм, а ближайшая её «окрестность» очень «узкая», впрочем определяет естественную конформационную подвижность молекулы. Ограниченность понимания механизмов фолдинга связана ещё и с тем, что его сложно наблюдать экспериментально: это достаточно быстрый динамический процесс, «разглядывать» который нужно на уровне отдельных молекул! И хотя сейчас уже проводят изучение сворачивания а точнее, разворачивания на отдельных молекулах [10] , это не пока не привело к принципиально новому уровню понимания механизма фолдинга — а ведь такое понимание могло бы дать эффективный алгоритм теоретического моделирования этого процесса. Биологические молекулы моделируют чаще всего с применением подхода эмпирических силовых полей [11] , позволяющего, в отличие от «абсолютно корректного» квантово-химического подхода см.
Однако такое радикальное ускорение времени расчётов не может даваться даром: хотя многие компьютерные эксперименты в эмпирических силовых полях и дают реалистичные результаты, некоторые важнейшие для фолдинга кооперативные взаимодействия — такие как гидрофобный эффект или влияние молекул растворителя — не сводятся к парным взаимодействиям между отдельными атомами и не могут быть корректно учтены в этом подходе. Существует два основных препятствия тому, чтобы запустить моделирование молекулярной динамики МД какого-нибудь белка в необходимом окружении и «в кремнии» пронаблюдать фолдинг, получив в конце процесса желанную структуру. Во-первых, характерные времена сворачивания всё же находятся на уровне миллисекунд, а максимально достижимое время моделирования на данном этапе развития вычислительной техники редко превышает одну микросекунду. Но, даже если представить, что мы не ограничены в мощностях компьютеров, всё равно остаются сомнения в возможности современных энергетических функций эффективно справиться с фолдингом — точность этих функций, управляющих эволюцией молекулы внутри компьютера, может оказаться недостаточной для того, чтобы направить сворачивание в нужном направлении. Кроме того, алгоритм, моделирующий подвижность, может навсегда «зациклить» молекулу в локальном энергетическом минимуме, чего никогда не случается в реальном процессе сворачивания. Однако определённые успехи в моделировании фолдинга с помощью молекулярной динамики всё же есть: небольшие белки — вроде 36-аминокислотного фрагмента виллина — удаётся свернуть в МД длительностью около микросекунды, запуская расчёты на суперкомпьютере или в распределённой вычислительной сети [12]. Итак, использование метода молекулярной динамики как средства моделирования процесса фолдинга пока что нецелесообразно и практически не достижимо.
Однако существует возможность предсказать результат фолдинга — то есть, трёхмерную структуру белка. Теоретические подходы, служащие этой цели, делятся на две большие группы: ab initio или de novo фолдинг — методики, не использующие в явном виде данных о структуре других белков, — и сопоставительное моделирование или моделирование на основании гомологии. Квантовая химия в расчётах свойств белковых молекул Как известно, уравнение Шрёдингера — «плоть и кровь» квантовых физики и химии — наиболее точный на сегодняшний день способ описать строение и динамику молекул. Однако точное аналитическое решение возможно получить лишь для крайне простых систем — например, атома гелия. Во всех более сложных случаях прибегают к численному решению приближений этого уравнения — так называемым полуэмпирическим методам квантовой химии. Методы эмпирических силовых полей такие как молекулярная динамика [11] не имеют никакого отношения к квантовой химии и «обращаются» с атомами моделируемых молекул в частности, белков как с классическими упругими частицами, связанными системой парных взаимодействий. Параметры этих взаимодействий очень простых, надо отметить как раз и называются силовым полем и определяют поведение системы при моделировании.
Электронные эффекты, такие как поляризуемость атомов, перенос электрона, образование и разрыв химических связей, а также кооперативные гидрофобные взаимодействия смоделированы в этом подходе быть не могут. Фолдинг «из первых принципов» Необходимо сразу отметить, что термин «ab initio фолдинг», часто применяемый для обозначения методов компьютерного предсказания структуры белка без использования структурных данных о других белках, не имеет отношения к тому ab initio, которое бытует в квантовой химии. Квантово-химический термин ab initio лат. Однако все вычисления, как правило, производятся в эмпирических силовых полях, описывающих парные взаимодействия в классической системе частиц, представляющей молекулу белка. Сами же эти силовые поля в неявном виде включают данные о структуре молекул не обязательно белковых — такие как парциальные заряды и массу атомов, а также длины и углы валентных связей, — и к квантово-механическим методам отношения не имеют.
Код ДНК вырожден потому, что: 1 один код он кодирует одну аминокислоту 2 один кодон кодирует несколько аминокислот 3 между кодонами есть знаки препинания 4 одна аминокислота кодируется несколькими кодонами 5. Эволюционное значение генетического кода заключается в том, что он: 1 триплетен 2 индивидуален 3 универсален 4 вырожден БЛОК 4: 1. Транскрипция происходит: 1 в ядре 2 на рибосомах 3 в цитоплазме 4 на каналах гладкой ЭПС 5.
Определение 3 Процесс переноса и-РНК из ядра к месту синтеза белка называется трансляцией. Механизм биосинтеза белка Сам синтез белковых молекул происходит на мембранах ЭПС эндоплазматической сетки.
Органеллой , ответственной за синтез белка является рибосома. Рибосомы «нанизываются» на молекулу и-РНК, образуя полисому. Т-РНК имеет форму «трилистика».
В его верхушке находится триплет нуклеотидов так называемый антикодон. Он образует комплементарную пару с соответствующим триплетом и-РНК кодоном.
Экстрактор информации Бурное развитие экспериментальных методов исследований в биологии, биомедицине и биотехнологии сопровождалось резким скачком в объеме получаемых новых знаний и, как следствие, научных публикаций. В настоящее время в базе данных PubMed — официальном хранилище публикаций биологического и биомедицинского профиля — содержится более 20 млн рефератов научных статей. Число публикаций растет столь быстро, что всю имеющуюся на сегодня информацию принципиально невозможно проанализировать без использования компьютерных средств. Поэтому в мире активно развиваются методы интеллектуального анализа данных, направленные на извлечение информации из научных текстов. Такой компьютерный анализ текстов часто называют текст-майнинг от англ. В этих технологиях широкое применение нашли методы семантических правил или шаблонов. В веб-программировании семантический шаблон представляет собой регулярное выражение формальное описание задачи поиска в тексте данных, отвечающих определенным условиям , где порядок встречаемости различных концептов отражает последовательность слов в предложении, на основании которого можно сделать вывод о наличии факта взаимодействия двух или более объектов, описанных в этом предложении.
Вершинами таких сетей являются молекулярно-генетические объекты, заболевания и процессы, а связями между ними — типы взаимодействий и ассоциаций. Было создано более 2 тыс. Система обладает дружественным интерфейсом пользователя со многими функциями, включая отсылку на сайты молекулярно-генетических баз данных, а также рефераты статей, из которых была экстрагирована информация. Применение текст-майнинга к анализу публикаций из базы данных PubMed позволило получить информацию относительно более чем 5 млн фактов, касающихся молекулярно-генетических событий в клетках различных тканей и организмов. Эти знания имеют чрезвычайно большое значение для автоматизации процесса реконструкции генных сетей. Система ANDSystem также активно используется для интерпретации экспериментальных данных. Например, была проведена реконструкция и анализ сетей молекулярно-генетических взаимодействий ряда белков у различных штаммов бактерии Helicobacter pylori, выделенных у пациентов с хроническими гастритами и опухолями желудка. Показано, что различия в экспрессии этих белков могут быть связаны с адаптацией бактерий к различным условиям среды, т. С помощью ANDSystem были обнаружены кластеры белков, которые могут участвовать в процессах адаптации организма человека к экстремальным условиям, в том числе к условиям невесомости Ларина и др.
В настоящее время с использованием ANDSystem ведутся работы по реконструкции и анализу молекулярно-генетических сетей, вовлеченных в жизненный цикл вируса гепатита С в рамках европейского международного проекта FP7. Биоинформатику, возникшую на стыке информационных технологий и биологии, поначалу рассматривали как средство поддержки научных исследований. Однако со временем становилось все более очевидным, что эта наука — важная и неотъемлемая часть биологии, без которой ее дальнейшее развитие просто невозможно себе представить. Тесный союз биологии и информационных технологий обеспечивает одновременный бурный рост обеим этим научным дисциплинам. Необходимость решать новые широкомасштабные биологические задачи требует создания все более производительных алгоритмов для анализа данных и увеличения вычислительных мощностей компьютеров. Это, в свою очередь, дает возможность ставить новые эксперименты и получать новые знания, углубляющие наши представления о структуре и функционировании биологических объектов. Литература Деменков П. Ларина И. Подколодная О.
Колчанова Н.
Структура белка
Наследственная информация – это информация о строении белка (информация о том, какие аминокислоты в каком порядке соединять при синтезе первичной структуры белка). Именно последовательность нуклеотидов называется генетической информацией, а участок последовательности, в котором хранится информация о первичной структуре белка это и есть ген. Тегиструктура белка это, где хранится информация о структуре белка, кто открыл первичную структуру белка, для определения белка применяют в химии, какая структура молекулы белка определяется. Информация о первичной структуре белка хранится в молекуле ДНК, которая является генетическим материалом всех живых организмов. Тегиструктура белка это, где хранится информация о структуре белка, кто открыл первичную структуру белка, для определения белка применяют в химии, какая структура молекулы белка определяется. DeepMind выпускает расширенную базу данных воссозданных ИИ структур всех известных белков, об этом объявила материнская компания Google Alphabet.
Важнейшее открытие за 50 лет: алгоритм DeepMind научили определять структуру белка
Как называется отрезок молекулы ДНКсодержаий информацию о первичной структуре одного белка? Поэтому вся информация о белке хранится в ядре, а точнее только о первичной структуре, а уже первичной структурой опеределяется и дальнейшие свойства этого белка. Информация о структуре белка закодирована в ДНК. Дезоксирибонуклеиновая кислота имеет очень сложную структуру, которую не до конца удалось раcшифровать ученым в наши дни. Как информация из ядра передаются в цитоплазму?
«Ситуация изменилась кардинально»: ИИ научился предсказывать структуру белка (Science, США)
Сигнальную функцию выполняют белки- гормоны , цитокины , факторы роста и др. Гормоны переносятся кровью. Большинство гормонов животных — это белки или пептиды. Связывание гормона с его рецептором является сигналом, запускающим ответную реакцию клетки.
Гормоны регулируют концентрации веществ в крови и клетках, рост, размножение и другие процессы. Примером таких белков служит инсулин , который регулирует концентрацию глюкозы в крови. Клетки взаимодействуют друг с другом с помощью сигнальных белков, передаваемых через межклеточное вещество.
К таким белкам относятся, например, цитокины и факторы роста. Цитокины — пептидные сигнальные молекулы. Они регулируют взаимодействия между клетками, определяют их выживаемость, стимулируют или подавляют рост, дифференцировку , функциональную активность и апоптоз , обеспечивают согласованность действий иммунной, эндокринной и нервной систем.
Примером цитокинов может служить фактор некроза опухоли , который передаёт сигналы воспаления между клетками организма [79]. Основная статья: Транспортная функция белков Молекулярная модель кальциевого канала, вид сверху Растворимые белки, участвующие в транспорте малых молекул, должны иметь высокое сродство аффинность к субстрату, когда он присутствует в высокой концентрации, и легко его высвобождать в местах низкой концентрации субстрата. Примером транспортных белков можно назвать гемоглобин , который переносит кислород из лёгких к остальным тканям и углекислый газ от тканей к лёгким, а также гомологичные ему белки, найденные во всех царствах живых организмов [80].
Некоторые мембранные белки участвуют в транспорте малых молекул через мембрану клетки, изменяя её проницаемость. Липидный компонент мембраны водонепроницаем гидрофобен , что предотвращает диффузию полярных или заряженных ионы молекул. Мембранные транспортные белки принято подразделять на белки-каналы и белки-переносчики.
Как называется молекула переносчик аминокислот к месту синтеза белка? Как называется триплет на и-РНК кодирующий одну аминокислоту? Сколько видов аминокислот участвует в биосинтезе белка в живых организмах?
Секвенирование пептидов позволяет восстановить первичную структуру белка. Генетические последовательности Информацию о первичной структуре белка можно получить непосредственно из генетической последовательности ДНК или РНК, которая кодирует данный белок. С помощью методов молекулярной биологии и биоинформатики можно извлечь соответствующую информацию о последовательности аминокислот. Использование различных образцов для анализа первичной структуры белка позволяет получить ценные данные о его составе и устройстве. Эти данные могут быть использованы для изучения функций белка, в разработке лекарственных препаратов и в других областях биологии и медицины. Методы анализа первичной структуры белка Анализ первичной структуры белка включает в себя изучение порядка аминокислотных остатков в цепи белка. Для этого существуют различные методы и техники: Метод Описание Секвенирование Секвенирование дает информацию о последовательности аминокислот в белке. Существуют различные методы секвенирования, такие как Sanger-секвенирование и метод масс-спектрометрии. Картирование пептидов Картирование пептидов позволяет определить, какие аминокислоты присутствуют в белке и в каком порядке. Этот метод основан на химической разрезке белка и последующем анализе образовавшихся пептидов.
Решение его заключается в том, что молекула, конечно, никогда не принимает подавляющего большинства теоретически возможных конформаций. Кооперативные эффекты фолдинга — одновременное формирование «зародышей» вторичной структуры, являющихся энергетически стабильными и уже не изменяющимися в процессе дальнейшего сворачивания — приводят к тому, что молекула белка находит «кратчайший путь» на воображаемой гиперплоскости потенциальной энергии к точке, соответствующей нативной конформации белка. Нативная конформация при этом отделена заметным «энергетическим промежутком» potential energy gap от подавляющего числа несвёрнутых форм, а ближайшая её «окрестность» очень «узкая», впрочем определяет естественную конформационную подвижность молекулы. Ограниченность понимания механизмов фолдинга связана ещё и с тем, что его сложно наблюдать экспериментально: это достаточно быстрый динамический процесс, «разглядывать» который нужно на уровне отдельных молекул! И хотя сейчас уже проводят изучение сворачивания а точнее, разворачивания на отдельных молекулах [10] , это не пока не привело к принципиально новому уровню понимания механизма фолдинга — а ведь такое понимание могло бы дать эффективный алгоритм теоретического моделирования этого процесса. Биологические молекулы моделируют чаще всего с применением подхода эмпирических силовых полей [11] , позволяющего, в отличие от «абсолютно корректного» квантово-химического подхода см. Однако такое радикальное ускорение времени расчётов не может даваться даром: хотя многие компьютерные эксперименты в эмпирических силовых полях и дают реалистичные результаты, некоторые важнейшие для фолдинга кооперативные взаимодействия — такие как гидрофобный эффект или влияние молекул растворителя — не сводятся к парным взаимодействиям между отдельными атомами и не могут быть корректно учтены в этом подходе. Существует два основных препятствия тому, чтобы запустить моделирование молекулярной динамики МД какого-нибудь белка в необходимом окружении и «в кремнии» пронаблюдать фолдинг, получив в конце процесса желанную структуру.
Во-первых, характерные времена сворачивания всё же находятся на уровне миллисекунд, а максимально достижимое время моделирования на данном этапе развития вычислительной техники редко превышает одну микросекунду. Но, даже если представить, что мы не ограничены в мощностях компьютеров, всё равно остаются сомнения в возможности современных энергетических функций эффективно справиться с фолдингом — точность этих функций, управляющих эволюцией молекулы внутри компьютера, может оказаться недостаточной для того, чтобы направить сворачивание в нужном направлении. Кроме того, алгоритм, моделирующий подвижность, может навсегда «зациклить» молекулу в локальном энергетическом минимуме, чего никогда не случается в реальном процессе сворачивания. Однако определённые успехи в моделировании фолдинга с помощью молекулярной динамики всё же есть: небольшие белки — вроде 36-аминокислотного фрагмента виллина — удаётся свернуть в МД длительностью около микросекунды, запуская расчёты на суперкомпьютере или в распределённой вычислительной сети [12]. Итак, использование метода молекулярной динамики как средства моделирования процесса фолдинга пока что нецелесообразно и практически не достижимо. Однако существует возможность предсказать результат фолдинга — то есть, трёхмерную структуру белка. Теоретические подходы, служащие этой цели, делятся на две большие группы: ab initio или de novo фолдинг — методики, не использующие в явном виде данных о структуре других белков, — и сопоставительное моделирование или моделирование на основании гомологии. Квантовая химия в расчётах свойств белковых молекул Как известно, уравнение Шрёдингера — «плоть и кровь» квантовых физики и химии — наиболее точный на сегодняшний день способ описать строение и динамику молекул.
Однако точное аналитическое решение возможно получить лишь для крайне простых систем — например, атома гелия. Во всех более сложных случаях прибегают к численному решению приближений этого уравнения — так называемым полуэмпирическим методам квантовой химии. Методы эмпирических силовых полей такие как молекулярная динамика [11] не имеют никакого отношения к квантовой химии и «обращаются» с атомами моделируемых молекул в частности, белков как с классическими упругими частицами, связанными системой парных взаимодействий. Параметры этих взаимодействий очень простых, надо отметить как раз и называются силовым полем и определяют поведение системы при моделировании. Электронные эффекты, такие как поляризуемость атомов, перенос электрона, образование и разрыв химических связей, а также кооперативные гидрофобные взаимодействия смоделированы в этом подходе быть не могут. Фолдинг «из первых принципов» Необходимо сразу отметить, что термин «ab initio фолдинг», часто применяемый для обозначения методов компьютерного предсказания структуры белка без использования структурных данных о других белках, не имеет отношения к тому ab initio, которое бытует в квантовой химии. Квантово-химический термин ab initio лат. Однако все вычисления, как правило, производятся в эмпирических силовых полях, описывающих парные взаимодействия в классической системе частиц, представляющей молекулу белка.
Сами же эти силовые поля в неявном виде включают данные о структуре молекул не обязательно белковых — такие как парциальные заряды и массу атомов, а также длины и углы валентных связей, — и к квантово-механическим методам отношения не имеют. Поэтому целесообразно будет в дальнейшем использовать термин «de novo фолдинг» лат. Наиболее «физически корректные» подходы из этой группы заключаются в основном в расчётах МД для моделирования процесса и результата фолдинга см. В остальных же случаях — тоже, впрочем, относящихся к маленьким белкам не более 150 аминокислотных остатков , — прибегают к дополнительным приближениям с целью уменьшить вычислительную сложность расчёта. Для увеличения вычислительной эффективности, в de novo подходах часто используются упрощённые модели представления белка — отдельные аминокислотные остатки, присутствующие в модели, представлены не так подробно, как в «полноатомных» подходах: вся боковая цепь моделируется лишь одним-двумя центрами «псевдоатомами». Так, например, боковая цепь триптофана содержит 16 атомов, а в упрощённом виде их может быть всего два-три и только один — для менее объемных остатков. De novo фолдинг проводится в специальном силовом поле также упрощённом по сравнению, например, с используемыми в МД , оценивая огромное количество вариантов укладки сворачиваемой молекулы по значению потенциальной энергии. Идентификация конформации, значительно с «зазором» более «низкой» по потенциальной энергии, чем остальные, может служить признаком конца поиска — аналогично тому, как нативная конформация с некоторым отрывом отстоит от несвёрнутых промежуточных состояний.
Конечно, кроме корректной функции потенциальной энергии, требуется преодолеть «комбинаторный взрыв», создаваемый парадоксом Левинталя. Очевидно, что перебрать все конформации, чтобы выбрать самую низкую по энергии, невозможно, а из-за слабого понимания механизмов сворачивания белка повторить тот «кратчайший путь», который ведёт к нативной структуре, на компьютере пока не удаётся. Чтобы как-то приблизиться к природному механизму сворачивания, исследователи пытаются выделить в последовательности моделируемого белка структурно консервативные фрагменты аналогичные тем, что в природе сворачиваются первыми и в дальнейшем уже остаются неизменными и как бы «собирают мозаику» из этих фрагментов. Эта процедура, тоже чрезвычайно ресурсоёмкая всё равно требуется перебрать астрономическое число вариантов! Рисунок 1. De novo фолдинг: предсказание пространственной структуры небольших белков. Программа Rosetta генерирует ансамбль моделей, получающихся после «сборки» структурно-консервативных фрагментов молекулы в специализированном силовом поле. Короткие 4—10 аминокислотных остатков фрагменты последовательности моделируемого белка выступают «зародышами» структуры будущей модели причём в разных моделях они различаются и «перекрываются» , а конформацию этим фрагментам «назначают», используя конформации гомологичных фрагментов из белков с уже известной структурой.
В этом смысле, de novo не является моделированием «заново» в полном смысле слова, но «заимствование» локальных структурных фрагментов такой небольшой длины в данном случае не считается использованием структуры белков-гомологов целиком.