Белки используют систему замков и ключей для связывания с ДНК
Вы можете думать о ДНК как о цепочке букв — As, Cs, Ts и Gs — которые вместе излагают информацию, необходимую для построения и функционирования клеток. Каждая клетка вашего тела имеет одну и ту же ДНК. Таким образом, чтобы клетки могли выполнять свои разные роли, они должны иметь возможность включать и выключать определенные гены с точным контролем. Например, гены, активные в клетке мозга, отличаются от генов, активных в клетке кожи.
Это достигается частично благодаря действию «ДНК-связывающих белков», которые фиксируются в геноме человека в определенных местах, чтобы включать или выключать гены. Теперь исследователи из Института Гладстона во главе с Кэтрин Поллард, доктор философии, сделали важное открытие о том, как эти белки связываются с ДНК.
Ученые традиционно считали, что ДНК-связывающие белки используют паттерны в коде генома As, Cs, Ts и Gs, чтобы направлять их в нужное место, причем данный белок связывается только с определенной последовательностью букв. Однако многие белки связываются с несколькими различными буквенными комбинациями, и два разных белка могут распознавать один и тот же паттерн.
Несмотря на это множество перекрывающихся паттернов, белки никогда не смущаются тем, где они должны связываться. В новом исследовании, опубликованном в Cell Systems , ученые из Гладстона обнаружили, что белки должны полагаться на другой ключ, чтобы знать, где связывать: трехмерную форму ДНК.
«В течение десятилетий нам было трудно объяснить, как белки находят правильные места для связывания в ДНК, и как они делают это особым образом и без привязки к неправильным местам», — говорит Поллард, старший исследователь и директор Институт Гладстона Науки Данных и Биотехнологии. «Мы предположили, что это можно объяснить структурным аспектом генома».
Это потому, что цепочка букв ДНК также представляет собой физическую трехмерную структуру, скрученную в знаменитую форму двойной спирали и упакованную в микроскопическую упаковку. Внутри лестничной конструкции между перекладинами и боковыми частями можно найти множество изгибов, канавок и зазоров. Поллард и ее команда поняли, что эти вариации создают тип замочной скважины, в которую попадают белки. Если канавки на белке не совпадают с канавками на геноме, ключ не подходит.
«Существует богатая научная литература о том, как белки взаимодействуют друг с другом или связываются с химическими веществами, и это всегда через своего рода механизм блокировки и ключа; почему белки, связывающиеся с ДНК, могут быть другими?» сказал г-н Абул Хассан Самее, доктор философии, научный сотрудник в Гладстоне, который является первым автором исследования. «Мы думаем, что белки пристыковываются к ДНК как трехмерная структура, точно так же, как когда они взаимодействуют с другими белками или химическими веществами»
Более ранние работы выявили возможность того, что форма ДНК предоставляет белкам дополнительную информацию о том, где связываться, но было неясно, насколько эти формы оказали влияние. Чтобы проверить свою теорию, исследователи адаптировали общий алгоритм машинного обучения, обычно используемый для идентификации буквенных последовательностей, с которыми связаны белки, за исключением того, что теперь они искали шаблоны в форме. Они обнаружили, что более 80 процентов белков связываются с определенной формой формы в геноме.
Исследователи говорят, что, хотя белки часто не читают алфавитный код генома, последовательность букв по-прежнему жизненно важна для определения места, где эти белки связываются, а потому, что это определяет форму генома. Любопытно, что очень разные буквенные последовательности могут обозначать одну и ту же структуру, в то время как несколько разные буквенные последовательности могут привести к совершенно разным структурам.
Этот факт помогает объяснить две самые большие загадки в связывании белка с ДНК. Во-первых, белки, которые связываются с несколькими различными буквенными последовательностями, оказываются на одном и том же пространственном паттерне, и, во-вторых, белки, которые, кажется, имеют общие буквенные последовательности, фактически прикрепляются к очень различным формам. Более того, белки, которые часто связываются с геномом в паре, притягиваются к определенным формам, которые могут отличаться от форм, которые они распознают, когда связываются в одиночку.
Вся текущая работа была проделана с компьютерным моделированием, поэтому следующий шаг исследователей — доказать свою теорию, используя молекулярные эксперименты.
«Было принято, что паттерн As, Cs, Ts и Gs, где белок, связанный с ДНК, имеет особую форму», — сказал Поллард, который также является профессором в Калифорнийском университете в Сан-Франциско и исследователем Чана Цукерберга. «Но никто не смотрел, чтобы увидеть, могут ли другие места связывания, которые не могут быть объяснены с этим шаблоном букв, иметь такую же форму. Если мы можем показать в чашке, что белки могут распознавать местоположение ДНК из-за его формы, даже когда оно не содержит установленную последовательность букв, я думаю, что это будет изменение игры «.
В последние годы ученые обнаружили, что большинство генетических мутаций, которые приводят к болезни, не в самих генах. Вместо этого они встречаются в так называемой «темной ДНК» — 99% человеческого генома, который влияет на то, как, когда и где гены включаются или выключаются. Своим недавним открытием исследователи открыли дверь для понимания нового способа, которым мутации могут влиять на экспрессию генов и, как следствие, функционирование клеток.
«Сейчас прилагаются огромные усилия, чтобы понять, как мутации в этой темной ДНК вызывают заболевание, и это важно, потому что для большинства сложных заболеваний большинство генетических мутаций находятся за пределами генов», — объясняет Сами. «Каждый смотрел на последовательности букв и спрашивал, не нарушают ли мутации эти последовательности, но наша работа показывает, что вам также нужно спросить, меняет ли мутация форму ДНК. У вас может быть мутация, которая изменяет последовательность букв, но если он не меняет форму, он не всегда меняет связывание белка «.
Статья «Алгоритм обнаружения форм-мотивов de novo раскрывает предпочтения факторов транскрипции для формы ДНК по сравнению с мотивами-последовательностями» была опубликована в журнале Cell Systems 16 января 2019 года.