EA201890565A1 20190430 Номер и дата охранного документа [PDF] EAPO2019\PDF/201890565 Полный текст описания [**] EA201890565 20160825 Регистрационный номер и дата заявки US62/209,466 20150825 Регистрационные номера и даты приоритетных заявок US2016/048798 Номер международной заявки (PCT) WO2017/035416 20170302 Номер публикации международной заявки (PCT) EAA1 Код вида документа [PDF] eaa21904 Номер бюллетеня [**] КОМПОЗИЦИИ И СПОСОБЫ УЛУЧШЕНИЯ СПЕЦИФИЧНОСТИ В ГЕНОМНОЙ ИНЖЕНЕРИИ С ПРИМЕНЕНИЕМ РНК-НАПРАВЛЯЕМЫХ ЭНДОНУКЛЕАЗ Название документа [8] G01N 33/53, [8] G01N 33/543, [8] G01N 33/553 Индексы МПК [US] Джозефс Эрик, [US] Коцак Девран, [US] Маршалек Петр, [US] Герсбах Чарльз А. Сведения об авторах [US] ДЬЮК ЮНИВЕРСИТИ Сведения о заявителях
 

Патентная документация ЕАПВ

 
Запрос:  ea201890565a*\id

больше ...

Термины запроса в документе

Реферат

[RU]

В данном документе раскрываются оптимизированные направляющие РНК (gRNA) и способы конструирования и применения указанных оптимизированных gRNA, которые характеризуются повышенной специфичностью связывания с мишенью и уменьшенным нецелевым связыванием.


Полный текст патента

(57) Реферат / Формула:

В данном документе раскрываются оптимизированные направляющие РНК (gRNA) и способы конструирования и применения указанных оптимизированных gRNA, которые характеризуются повышенной специфичностью связывания с мишенью и уменьшенным нецелевым связыванием.


Евразийское (21) 201890565 (13) A1
патентное
ведомство
(12)
ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ЕВРАЗИЙСКОЙ ЗАЯВКЕ
(43) Дата публикации заявки 2019.04.30
(22) Дата подачи заявки 2016.08.25
(51) Int. Cl.
G01N33/53 (2006.01) G01N33/543 (2006.01) G01N33/553 (2006.01)
(54) КОМПОЗИЦИИ И СПОСОБЫ УЛУЧШЕНИЯ СПЕЦИФИЧНОСТИ В ГЕНОМНОЙ ИНЖЕНЕРИИ С ПРИМЕНЕНИЕМ РНК-НАПРАВЛЯЕМЫХ ЭНДОНУКЛЕАЗ
(31) (32)
62/209,466
2015.08.25
(33) US
(86) PCT/US2016/048798
(87) WO 2017/035416 2017.03.02
(88) 2017.04.06
(71) Заявитель:
ДЬЮК ЮНИВЕРСИТИ (US)
(72) Изобретатель:
Джозефс Эрик, Коцак Девран, Маршалек Петр, Герсбах Чарльз А.
(US)
(74)
Представитель: Медведев В.Н. (RU)
(57) В данном документе раскрываются оптимизированные направляющие РНК (gRNA) и способы конструирования и применения указанных оптимизированных gRNA, которые характеризуются повышенной специфичностью связывания с мишенью и уменьшенным нецелевым связыванием.
ОПИСАНИЕ ИЗОБРЕТЕНИЯ
2420-548474ЕА/019 КОМПОЗИЦИИ И СПОСОБЫ УЛУЧШЕНИЯ СПЕЦИФИЧНОСТИ В ГЕНОМНОЙ
ИНЖЕНЕРИИ С ПРИМЕНЕНИЕМ РНК-НАПРАВЛЯЕМЫХ ЭНДОНУКЛЕАЗ Перекрестная ссылка на родственные заявки
[0001] Данная заявка заявляет приоритет по предварительной заявке на патент США № 62/209466, поданной 25 августа 2015 г., которая включена в данный документ посредством ссылки во всей своей полноте.
Заявление о государственной заинтересованности
[0002] Настоящее изобретение было создано при государственной поддержке в соответствии с Федеральными грантами № МСВ1244297 и СВЕТ1151035, выданными Национальным научным фондом (National Science Foundation), и F32GM11250201, R01DA036865 и DP2OD008586, выданными Национальными институтами здравоохранения (National Institutes of Health). Правительство обладает определенными правами на настоящее изобретение.
Область техники
[0003] Настоящее изобретение направлено на оптимизированные
направляющие РНК (gRNA) и способы конструирования и применения
указанных gRNA, которые характеризуются повышенной
специфичностью связывания с мишенью и уменьшенным нецелевым связыванием.
Предпосылки изобретения
[0004] РНК-направляемые эндонуклеазы, в частности белок Cas9, привлекли внимание в качестве потенциального "идеального инструмента для геномной инженерии", поскольку их можно направлять с помощью одиночной молекулы "направляющей РНК", чтобы вырезать ДНК практически с любой последовательностью. Недавно эту способность использовали для ряда перспективных биологических и медицинских применений, порождая беспрецедентное воодушевление и надежду на их будущее использование. Однако на практике геномная инженерия требует чрезвычайно точного контроля над способностью избирательно нацеливаться и вырезать точные последовательности ДНК, чтобы нецелевая ДНК не была случайно повреждена и не подверглась мутации.
[0005] Cas9 представляет собой эндонуклеазу
прокариотического CRISPR (короткие палиндромные повторы, регулярно расположенные группами) типа II - CRISPR-ассоциированного (Cas) ответа на встраивающуюся чужеродную ДНК. Во время этого ответа Cas9 сначала связывается дуплексом РНК CRISPR (crRNA): traлэ-активирующая crRNA (tracrRNA), а затем направляется для расщепления ДНК, которая содержит сайты "протоспейсера" размером 20 пар оснований (п. о.), комплементарные вариабельному сегменту размером 2 0 п. о. из crRNA (фиг. 1А). При связывании одиночной направляющей РНК
(sgRNA) комплекс Cas9-sgRNA связывается с последовательностями "протоспейсера" размером 2 0 п. о. в целевой ДНК при условии, что за протоспейсером непосредственно следует прилегающий к протоспейсеру мотив (РАМ, в данном документе "TGG"). После связывания эндонуклеаза Cas9 осуществляет двухнитевые разрывы
(треугольники) в протоспейсере. По сути, единственным ограничением для последовательностей, на которые может целенаправленно воздействовать Cas9, является то, что короткий прилегающий к протоспейсеру мотив (РАМ), такой как "NGG" в случае Cas9 S. pyogenes, должен следовать непосредственно за сайтами протоспейсера в молекуле чужеродной ДНК. Анализ в ходе проведения кристаллографических и биохимических экспериментов показывает, что специфичность связывания и расщепления протоспейсера придается сначала путем распознавание сайтов РАМ собственно белком Cas9 с последующим встраиванием нити связанным комплексом РНК и прямым спариванием оснований по Уотсону-Крику с протоспейсером (фиг. 1А).
[0006] Способность Cas9 модульно "программироваться" с помощью одиночной РНК-шпильки для целенаправленного воздействия на практически любой сайт ДНК породила необычайный энтузиазм после того, как системы CRISPR-Cas9 повторно адаптировали для ряда разнообразных биотехнологических применений. В частности, была сконструирована одиночная направляющая РНК (sgRNA)-шпилька, которая объединяет ключевые компоненты дуплексов crRNA: tracrRNA в одиночные функциональные молекулы. С помощью этой sgRNA Cas9 можно вводить в различные организмы с получением
целенаправленных двухнитевых разрывов in vivo для проведения масштабной и в то же время простой геномной инженерии. Cas9 без нуклеазной активности (D10A/H840A, известную как "dCas9") и химерные производные dCas9 также использовали для изменения экспрессии генов путем целенаправленного связывания на промоторных сайтах или рядом с ними in vivo, а также для введения целенаправленных эпигенетических модификаций.
[0007] Нецелевое связывание и расщепление с помощью Cas9
является проблемой, поскольку оно может отрицательно повлиять на
его потенциальное использование на практике. Значительные усилия
были предприняты для улучшения специфичности активности
Cas9/dCas9. Во-первых, наиболее масштабные усилия в значительной
степени проводятся за счет интеллектуального выбора
последовательностей-мишеней без аналогичных других
последовательностей в геноме, хотя недавнее исследование показало, что эти способы показали неудовлетворительные результаты в их способности прогнозировать нецелевое расщепление. Кроме того, также были предприняты усилия по непосредственному конструированию самого белка путем введения точечных мутаций, которые, как было установлено, модулируют или увеличивают специфичность связывания РАМ или протоспейсера. Производные Cas9, которые вызывают разрыв только одной нити ДНК, а не осуществляют расщепление двухнитевой ДНК, также используют парами ("парные никазы") с допущением, что вероятность нецелевого однонитевого разрыва в нескольких сайтах, достаточно близко расположенных относительно друг к другу, для получения двунитевого разрыва, будет чрезвычайно редкой. И наконец, был проведен ряд работ по созданию самих вариантов направляющей РНК в попытке достичь большей специфичности. Прежние усилия, когда к направляющим РНК добавляли 5'-удлинения, чтобы дополнить дополнительные нуклеотиды за протоспейсером, не показали повышенной специфичности расщепления Cas9 in vivo. Скорее всего, они расщеплялись приблизительно до своей стандартной длины в живых клетках (фиг. 1А) . Для применений в геномной инженерии, особенно для применений с целью терапии, требуется исключительная специфичность при целенаправленном воздействии на
ген, чтобы не повреждать нецелевую ДНК и не допускать запрещенных мутаций. Тем не менее, существует ряд сообщений о нецелевом связывании и расщеплении с помощью Cas9, что может отрицательно повлиять на ее потенциальное использование на практике.
[0008] Остается потребность в уменьшении нецелевого связывания и повышении специфичности нуклеазы при использовании системы CRISPR/Cas9.
Краткое описание изобретения
[0009] Настоящее изобретение направлено на способ получения
оптимизированной направляющей РНК (gRNA). Способ
предусматривает: а) идентификацию представляющей интерес целевой
области, при этом представляющая интерес целевая область
содержит последовательность протоспейсера; Ь) определение
полинуклеотидной последовательности полноразмерной gRNA, которая
нацеливается на представляющую интерес целевую область, при этом
полноразмерная gRNA содержит нацеливающиеся на протоспейсер
последовательность или сегмент; с) определение по меньшей мере
одного или нескольких нецелевых сайтов для полноразмерной gRNA;
d) получение полинуклеотидной последовательности первой gRNA,
при этом первая gRNA содержит полинуклеотидную
последовательность полноразмерной gRNA и сегмент РНК, при этом сегмент РНК содержит полинуклеотидную последовательность, имеющую М нуклеотидов в длину, которая комплементарна нуклеотидному сегменту нацеливающихся на протоспейсер последовательности или сегменту, при этом РНК расположена на 5'-конце полинуклеотидной последовательности полноразмерной gRNA, при этом первая gRNA необязательно содержит линкер между 5'-концом полинуклеотидной последовательности полноразмерной gRNA и сегментом РНК, при этом линкер содержит полинуклеотидную последовательность, имеющую N нуклеотидов в длину, при этом первая gRNA способна встраиваться в последовательность протоспейсера, и связываться с последовательностью ДНК, которая комплементарна последовательности протоспейсера, и образовывать дуплекс с протоспейсером, и при этом первая gRNA способна встраиваться в нецелевой сайт, и связываться с
последовательностью ДНК, которая комплементарна нецелевому
сайту, и образовывать нецелевой дуплекс; е) вычисление
оценочного показателя или вычислительное моделирование кинетики
встраивания и времени нахождения, в течение которого gRNA
остается встроенной в дуплексы протоспейсера и нецелевого сайта,
где динамику встраивания оценивают нуклеотид за нуклеотидом
путем определения энергетических различий между дополнительным
встраиванием отличающейся gRNA и повторным отжигом первой gRNA
на последовательности ДНК, которая комплементарна
последовательности протоспейсера; f) сравнение значений предполагаемого времени нахождения в сайтах протоспейсера и/или нецелевых сайтах первой gRNA со значениями предполагаемого времени нахождения полноразмерной gRNA или усеченной gRNA (tru-gRNA) в сайтах протоспейсера и/или нецелевых сайтах; д) рандомизацию от 0 до N нуклеотидов в линкере и от 0 до М нуклеотидов в первой gRNA, и получение второй gRNA, и повторение стадии (е) со второй gRNA; h) идентификацию оптимизированной gRNA на основе последовательности gRNA, которая удовлетворяет критериям конструирования; и i) тестирование оптимизированной gRNA in vivo для определения специфичности связывания.
[0010] Настоящее изобретение направлено на способ получения
оптимизированной направляющей РНК (gRNA). Способ
предусматривает: а) идентификацию представляющей интерес целевой
области, при этом представляющая интерес целевая область
содержит последовательность протоспейсера; Ь) определение
полинуклеотидной последовательности полноразмерной gRNA, которая
нацеливается на представляющую интерес целевую область, при этом
полноразмерная gRNA содержит нацеливающиеся на протоспейсер
последовательность или сегмент; с) определение по меньшей мере
одного или нескольких нецелевых сайтов для полноразмерной gRNA;
d) получение полинуклеотидной последовательности первой gRNA,
при этом первая gRNA содержит полинуклеотидную
последовательность полноразмерной gRNA и сегмент РНК, при этом сегмент РНК содержит полинуклеотидную последовательность, имеющую М нуклеотидов в длину, которая комплементарна нуклеотидному сегменту нацеливающихся на протоспейсер
последовательности или сегменту, при этом РНК расположена на 3'-
конце полинуклеотидной последовательности полноразмерной gRNA,
при этом первая gRNA необязательно содержит линкер между 3' -
концом полинуклеотидной последовательности полноразмерной gRNA и
сегментом РНК, при этом линкер содержит полинуклеотидную
последовательность, имеющую N нуклеотидов в длину, при этом
первая gRNA способна встраиваться в последовательность
протоспейсера, и связываться с последовательностью ДНК, которая
комплементарна последовательности протоспейсера, и образовывать
дуплекс с протоспейсером, и при этом первая gRNA способна
встраиваться в нецелевой сайт, и связываться с
последовательностью ДНК, которая комплементарна нецелевому
сайту, и образовывать нецелевой дуплекс; е) вычисление
оценочного показателя или вычислительное моделирование кинетики
встраивания и времени нахождения, в течение которого gRNA
остается встроенной в дуплексы протоспейсера и нецелевого сайта,
где динамику встраивания оценивают нуклеотид за нуклеотидом
путем определения энергетических различий между дополнительным
встраиванием отличающейся gRNA и повторным отжигом первой gRNA
на последовательности ДНК, которая комплементарна
последовательности протоспейсера; f) сравнение значений предполагаемого времени нахождения в сайтах протоспейсера и/или нецелевых сайтах первой gRNA со значениями предполагаемого времени нахождения полноразмерной gRNA или усеченной gRNA (tru-gRNA) в сайтах протоспейсера и/или нецелевых сайтах; д) рандомизацию от 0 до N нуклеотидов в линкере и от 0 до М нуклеотидов в первой gRNA, и получение второй gRNA, и повторение стадии (е) со второй gRNA; h) идентификацию оптимизированной gRNA на основе последовательности gRNA, которая удовлетворяет критериям конструирования; и i) тестирование оптимизированной gRNA in vivo для определения специфичности связывания.
[ООН] Настоящее изобретение направлено на оптимизированную gRNA, полученную с помощью описанных выше способов.
[0012] Настоящее изобретение направлено на выделенный полинуклеотид, кодирующий описанную выше оптимизированную gRNA.
[0013] Настоящее изобретение направлено на вектор,
содержащий описанный выше выделенный полинуклеотид.
[0014] Настоящее изобретение направлено на клетку, содержащую описанный выше выделенный полинуклеотид или описанный выше вектор.
[0015] Настоящее изобретение направлено на набор, содержащий описанный выше выделенный полинуклеотид, описанный выше вектор или описанную выше клетку.
[0016] Настоящее изобретение направлено на способ эпигемного редактирования в клетке-мишени или в субъекте. Способ предусматривает приведение клетки или субъекта в контакт с эффективным количеством молекулы оптимизированной gRNA, описанной выше, и слитого белка, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
[0017] Настоящее изобретение направлено на способ сайт-специфического расщепления ДНК в клетке-мишени или в субъекте. Способ предусматривает приведение клетки или субъекта в контакт с эффективным количеством молекулы оптимизированной gRNA, описанной выше, и слитого белка или белка Cas9, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
[0018] Настоящее изобретение направлено на способ редактирования генома в клетке. Способ предусматривает введение в клетку эффективного количества молекулы оптимизированной gRNA,
описанной выше, и слитого белка, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
[0019] Настоящее изобретение направлено на способ модулирования экспрессии генов в клетке. Способ предусматривает приведение клетки в контакт с эффективным количеством оптимизированной gRNA, описанной выше, и слитого белка, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
Краткое описание графических материалов
[0020] На ФИГ. 1А показано схематическое изображение активности Cas9.
[0021] На ФИГ. 1В показано изображение атомно-силовой микроскопии (AFM) dCas9-sgRNA, связанной с последовательностью протоспейсера в пределах одной меченой стрептавидином молекулы ДНК, полученной из локуса AAVS1 человека.
[0022] На ФИГ. 1C-1D показана фракция связанной ДНК, занимаемой Cas9/dCas9-sgRNA по длине полученного из AAVS1 (ФИГ. 1С) или сконструированного ДНК-субстрата (ФИГ. 1D) , разработанного с рядом полностью комплементарных и частично комплементарных последовательностей протоспейсера. Вертикальные линии представляют сегменты (23 п.о.), где каждый значимый признак расположен на соответствующих субстратах.
[0023] На ФИГ. 2A-2D показано модулирование сродства и
специфичности связывания вариантами направляющих РНК. На ФИГ. 2А показана схема dCas9, связанной с единой направляющей РНК с усечением двух нуклеотидов с ее 5'-конца (tru-gRNA, фиолетовый). На ФИГ. 2В показан схематический и предполагаемый механизм dCas9, связанной с единой направляющей РНК с удлинением 5'-конца, которое образует шпильку с РАМ-дистальным сегментом связывания ее нацеливающейся области (hp-gRNA, синий). На ФИГ. 2С показано сродство моносайтового связывания (КА) для dCas9 с tru-gRNA (фиолетовый, л=2 57) вдоль сконструированного ДНК-субстрата (см. ФИГ. 1D). Пунктирная линия показывает моносайтовое сродство dCas9-sgRNA для сравнения. На ФИГ. 2D показано сродство моносайтового связывания (КА) для dCas9 с направляющими РНК с 5'-шпильками, которые перекрывают нуклеотиды, комплементарные последним шести (прб-gRNA, синий) или десяти (hplO-gRNA, зеленый) РАМ-дистальным нуклеотидам протоспейсера.
[0024] На ФИГ. 3A-3D показано, что Cas9 подвергается
прогрессивному конформационному переходу, поскольку она
связывается с сайтами, которые все в большей степени
соответствуют последовательности протоспейсера. На ФИГ. ЗА
показана фракция связанной ДНК, занимаемой Cas9/dCas9 по длине
ДНК-субстратов, причем цвета, представляющие популяции
Cas9/dCas9, сгруппированы по их структурам (по
среднеквадратичной разнице после выравнивания, см. текст). Различные признаки на ДНК, которые использовали для сайт-специфического анализа структурных свойств Cas9/Cas9, метили как неспецифические последовательности (а; "2 0ММ"), сайты, содержащие 10 РАМ-дистальных ошибочных спариваний в протоспейсере ((3, "10ММ") , сайты, содержащие 5 РАМ-дистальных ошибочных спариваний в протоспейсере (у, "5ММ") или сайт полного протоспейсера (8 или s для dCas9 или Cas9, соответственно; "ОММ"). Среднее по ансамблю значение первичных кластеров и цветовое кодирование в соответствии со сгруппированными структурами, которые они представляют, представлено на ФИГ. ЗС. На ФИГ. ЗВ показан объем в зависимости от высоты наблюдаемой
Cas9/dCas9 с цветовым кодированием по кластеру, к которому относится каждый белок. Пунктирные линии обозначают области, которые, вероятно, состоят из агрегатов (вверху справа) или стрептавидиновых меток, адсорбированных вблизи ДНК (внизу слева). Для сравнения - средняя высота стрептавидиновых концевых меток: 0,92 нм±0,00б нм (SEM); средний объем стрептавидиновых концевых меток: 0,110 - 104 нм3±0, 0 02 - 104 нм3 (SEM) ; л=1941. На ФИГ. 3D показаны средние объемы и высоты Cas9/dCas9 с sgRNA (красные круги, с красными метками для Cas9 и синими метками для dCas9) или tru-gRNA (фиолетовые круги), связанных у каждого признака на субстратах. Обратите внимание, что только dCas9 с tru-gRNA должны взаимодействовать с первыми 3 или 8 РАМ-дистальными ошибочными спариваниями сайтов 5ММ и 10ММ (здесь, соответственно, обозначены "ЗММ" и "8ММ"). Для стандартных ошибок средних объемов и высот см. таблицу 2. Для Cas9/dCas9 с sgRNA их структурные свойства у каждого признака статистически отличаются (8-s, а - s: р < 0,05; а - (3: р < 0, 005; (3 - у, у - 8: р < < 0,0005. Т2-критерий Хотеллинга).
[0025] На ФИГ. 4A-4D показаны эксперименты согласно кинетическому методу Монте-Карло (KMC), выявляющие различия в стабильности R-петли или структуру, образованную дуплексом протоспейсера с внедряющейся направляющей РНК, в стабильно связанной Cas9 для разных вариантов направляющей РНК. На ФИГ. 4А показана схема встраивания нити протоспейсера (зеленый цвет) с помощью направляющей РНК (красный цвет) для экспериментов KMC. R-петля выделена. Скорости перехода для встраивания (vf для скорости т -> т+1, где т представляет собой степень встраивания нити или, что то же самое, длину R-петли) или повторного отжига дуплекса (vr для скорости т -> т - 1) являются функцией ближайших соседних энергий гибридизации ДНК:ДНК и РНК:ДНК. Подробнее смотри в тексте и разделе Дополнительные способы. На ФИГ. 4В показано относительное время, когда R-петля имеет размер т, для sg-RNA (красный цвет) или tru-gRNA (фиолетовый цвет), полученное из экспериментов KMC "в равновесии" (моделирование начато при л?=20 или 18, соответственно) . Моделирование проводили до t> 10000
(условных единиц). На ФИГ. 4С показана динамика "дыхания" R-петли согласно кинетическому методу Монте-Карло для sgRNA
(красный цвет) и tru-gRNA (фиолетовый цвет) после полного
встраивания (моделирование начато при т=20 или 18,
соответственно). Звездочки отмечают начальное положение для
моделирования. (вставка) Гистограмма соответствующей
продолжительности сроков, в течение которых R-петля составляет> 1б
п. о. в длину. На ФИГ. 4D показана предполагаемая модель для
механизмов, управляющих специфичностью Cas9/dCas9, на основании
результатов AFM-визуализации и экспериментов согласно
кинетическому методу Монте-Карло (KMC) (см. основной текст).
Cas9/dCas9 связывается с РАМ, и направляющая РНК встраивается в
примыкающий к РАМ дуплекс протоспейсера. В ходе этого
встраивания нити направляющая РНК должна вытеснять
комплементарную нить протоспейсера. Конкуренция между
встраиванием и повторным отжигом дуплекса приводит к динамической ("дышащей") структуре R-петли. Стабильность I4r,°-i7r,° сайтов взаимодействия протоспейсера с направляющей РНК, которая резко возрастает при связывании в 19ом и 2 0ом сайтах, способствует конформационному изменению в Cas9/dCas9, которое обеспечивает возможность расщепления ДНК Cas9.
[0026] На ФИГ. 5А-5С показано, что эксперименты согласно кинетическому методу Монте-Карло (KMC) выявляют различия в способности преодолевать ошибочные спаривания (ММ) и внедряться в протоспейсер в зависимости от структуры направляющей РНК. На ФИГ. 5А-5В показано фрагментарное заполнение по времени длины R-петель т для sgRNA (ФИГ. 5А) или tru-gRNA (ФИГ. 5В) в ходе встраивания, полученное в экспериментах согласно KMC (начато при m=10, отмечено звездочкой). Белые X указывают положения ошибочных спариваний. Моделирование проводили до t> 10000
(условных единиц) и результаты представляют собой среднее по 100 испытаниям. На ФИГ. 5С показана типичная динамика согласно KMC для встраивания нити (начало при л?=10) с ошибочно спаренным сайтом в л?=14 (стрелка) для sgRNA (красный цвет) и tru-gRNA
(фиолетовый цвет). В то время как sgRNA в значительной степени
стабильно внедряются после обхода ошибочного спаривания, tru-gRNA повторно задерживаются за ошибочным спариванием в результате присущей им изменчивости R-петель (см. ФИГ. 4) .
[0027] На ФИГ. 6А-6В показано, что экспериментальные (Hsu et al. (2013) Nature biotechnology, 31, 827-832) частоты разрезания в целевых сайтах, содержащих одно ошибочное спаривание rG-dG, rC-dC, rA-dA и rU-dT в РАМ-дистальной области (> 10го сайта протоспейсера), коррелируют со стабильностью R-петли, определенной в экспериментах согласно кинетическому методу Монте-Карло. На ФИГ. 6А показаны 1одю(р-значение) корреляции между частотой разрезания Cas9 и стабильностью R-петли в сайтах т (фрагмент времени, когда направляющая РНК остается связанной с протоспейсером в сайте т, см. текст) в ходе встраивания нити, начатого в сайте т. (i) Стабильность в сайтах ш=10 до 177=14 имеет высокую обратную корреляцию с вероятностью того, что направляющая РНК отойдет от протоспейсера до преодоления ошибочного спаривания (ФИГ. 15В), тогда как (ii) сайты от т=14 до т=17 ассоциированы (согласно изображениям AFM) с конформационным изменением, которое индуцирует расщепляющую активность. Цвет соответствует коэффициенту корреляции. На ФИГ. 6В показано, что экспериментальная частота разрезания не коррелирует в значительной степени с расчетными свободными энергиями равновесного связывания направляющей РНК протоспейсера (AG°37) (слева) , в то время как она коррелирует со стабильностью сайта т=14 в ходе встраивания нити (справа). Планки погрешности представляют собой стандартные ошибки среднего времени пребывания в сайте т=14. Для этих экспериментов согласно кинетическому методу Монте-Карло max(t)=100 (условных единиц). Цветная полоса используется для отображения местоположения ошибочно спаренного сайта (ММ).
[0028] На ФИГ. 7А-7С показано краткое изложение предполагаемых механизмов, посредством которых структура направляющей РНК влияет на специфичность Cas9/dCas9. На ФИГ. 7А показано, что для единой направляющей РНК (sgRNA) первые несколько нуклеотидов РНК (которые связываются с 18-20-м сайтами
протоспейсера) стабилизируют дыхание и связывание R-петли в 14-17-ом сайтах протоспейсера, обеспечивают возможность эффективного конформационного перехода в активное состояние для обеспечения расщепления. Однако данная повышенная стабильность, придаваемая этими основаниями, обеспечивает временную стабилизацию в ошибочно спаренных сайтах и конформационное изменение, позволяющее расщепление. Во многих случаях, преодолев ошибочное спаривание, R-петли остаются стабильно полностью встроенными. На ФИГ. 7В показано, что для направляющих РНК с первыми несколькими (здесь 2) усеченными нуклеотидами (tru-gRNA) пониженная стабильность R-петли (характеризующейся значительной изменчивостью) снижает вероятность сохранения активной конформации. Когда в протоспейсере есть сайты ошибочного спаривания, изменчивость R-петли гарантирует, что она будет быстро и многократно "повторно остановлена" за ошибочным спариванием и в значительной степени испытает помехи в этих сайтах. На ФИГ. 7С показано, что хотя оказалось, что "простые" продления 5'-конца направляющей РНК для целенаправленного воздействия на протоспейсер и соседние сайты за протоспейсером in vivo отщепляются обратно приблизительно до длины sgRNA (ФИГ. 7А) , направляющие РНК с 5'-шпильками, комплементарными сегментам, целенаправленно воздействующим "РАМ-дистально" (пр-gRNA), как ожидается, остаются защищенными в структуре Cas9/dCas9 до встраивания. После связывания сайта РАМ и инициирования встраивания нити с помощью hp-gRNA при связывании с полным протоспейсером шпилька открывается и может иметь место полное встраивание нити. Если в целевом сайте имеются РАМ-дистальные ошибочные спаривания, то энергетически более выгодно, чтобы шпилька оставалась закрытой и встраивание нити было затруднено. Остается необходимость проверить способность Cas9-hp-gRNA расщеплять РНК.
[0029] На ФИГ. 8А-8В показана чистота экспрессированной Cas 9 и dCas9 в геле SDS очищенных продуктов Cas 9 (ФИГ. 8А) и dCas9 (ФИГ. 8В) (номинальная молекулярная масса: 160 кДа). Элюированные полосы показывают, что продукт имеет чистоту ~ 95%.
[0030] На ФИГ. 9А-9С показаны дополнительные изображения
Cas9/dCas9, связанной с ДНК. А) Распределение связывания dCas9 с
субстратом, не характеризующимся гомологией с
последовательностью протоспейсера AAVsl (сравните с ФИГ. 1)
(п=443). Наложение представляет собой распределение кумулятивных
вероятностей (CDF) сайтов РАМ (CDFPAM, черный цвет) и CDF
оснований, связанных dCas9 (красный цвет, CDFCaS9) • Сравнение
начинается за 100 оснований с каждого конца, чтобы избежать
артефактов, вводимых за счет перекрытия со стрептавидиновой
меткой (критерий отбора ДНК) и связывания с незащищенными тупыми
концами ДНК (что приводит к ожидаемому увеличению
неспецифического связывания). В) Абсолютное различие Dn между CDF
связывания белка и сайтов РАМ. Пунктирная линия представляет
собой критерий Колмогорова-Смирнова для степени соответствия
двух распределений. С) CDF связывания сравнивали с CDF
распределений РАМ из 100000 случайным образом полученных
последовательностей с одинаковыми вероятностями G, А, Т и С с
использованием MATLAB. Вертикальная красная линия представляет
собой экспериментальную Sup(Dn), указывая, что экспериментальное
связывание dCas9 более близко соответствует экспериментальному
распределению РАМ, чем для 71,20% полученных
последовательностей.
[0031] На ФИГ. 10А-1°С показано связывание с "нонсенс"-субстратом, не характеризующимся гомологией (> 3 п.о.) с последовательностью протоспейсера. (А) Изображения dCas9 в отдельности. (В) Гистограмма (л=423) объема (слева) и высоты
(справа) dCas9, изображенной отдельно, с гаусовским сглаживанием основных пиков. Согласно гаусовскому сглаживанию: средняя высота составляет 1,746 нм (95% доверительный интервал: 1,689 нм -1,802 нм) со стандартным отклонением 0,441 нм, и средний объем составляет 1302 нм3 (95% доверительный интервал: 12 66 нм3~1337 нм3) со стандартным отклонением 259, 1 нм3 (отметим, что поскольку dCas9 здесь не имеет ДНК в своем канале связывания, их зарегистрированные объемы могут казаться искусственно низкими из-за снижения механической устойчивости к зонду AFM) . Высоты измеряли относительно медианного значения 10-пиксельной области,
окружающей каждый белок, и объемы записаны в виде смежных признаков, превышающих в два раза стандартное отклонение локальных высот фона. (С) Дополнительные типичные изображения dCas9, связанной с ДНК, которая была помечена на одном конце моновалентным стрептавидином.
[0032] На ФИГ. 11A-11D показана репрезантивная фигура dCas9-sgRNA, связанная с РНК, и пример процессинга структурных свойств белка. На ФИГ. НА показано типичное широкопольное изображение dCas9, связанной со сконструированной ДНК. На ФИГ. 11В показан крупный план выделенной области. Белые стрелки представляют одновалентный стрептавидин, а красные стрелки белки dCas9. На ФИГ. 11C-11D показан пример извлечения из исходного изображения (ФИГ. НС) и выделения (ФИГ. 11D) структур Cas9/dCas9. Это извлечение повторяли для каждого выделенного белка, связанного с ДНК, затем попарно выравнивали посредством итерационного перевода, вращения и отражения, чтобы свести к минимуму их среднеквадратичное топологическое различие. Из этих сведенных к минимуму среднеквадратичных различий составляли матрицу расстояний, группировали каждый белок по методу Laio и Rodriguez (2014) Science (New York, N.Y.), 344, 1492-1496, затем сопоставляли популяции структур по кластеру обратно с их сайтами на ДНК (ФИГ. 2А, ФИГ. 10А-10С).
[0033] На ФИГ. 12А-12В показаны свойства Cas9/dCas9-sgRNA, сопоставленные с их соответствующими сайтами связывания. Верх: расположенные друг над другом гистограммы объема (слева), максимальных высот (посередине) и структур (сгруппированные по среднеквадратичной разнице) после выравнивания (справа, см. текст) для всех условий эксперимента. Популяции окрашены в соответствии со сгруппированным объемом, высотой или структурным кластером, как показано на графике рассеяния ниже. Распределение связывания извлеченных молекул Cas9/dCas9 (ФИГ. 10А-10С) близко соответствует распределению всего набора данных (ФИГ. 1C-1D, ФИГ. 8А-8В), указывая, что процедура отбора является объективной и выбранные белки являются типичными представителями всего набора данных. Ниже: график рассеяния объема в зависимости от максимальной высоты всех Cas9/dCas9 с цветовым кодированием по
сгруппированному объему (слева), максимальной высоте (посередине) и структурному кластеру (справа).
[0034] На ФИГ. 13 показаны структурные свойства Cas9/dCas9 с tru-gRNA и hp-gRNA в их соответствующих сайтах связывания. Фракция связанной ДНК, занимаемой Cas9/dCas9, вместе со сконструированным ДНК-субстратом с цветами, представляющими популяции Cas9/dCas9, сгруппированные в соответствии с их структурами (см. ФИГ. ЗС) . Структуры белка классифицировали в соответствии с dCas9/Cas9 с sgRNA, которые они наиболее близко напоминали (по среднеквадратическому отклонению после выравнивания, см. текст). Для ссылки, на сконструированных ДНК-субстратах расположение полного сайта протоспейсера: 144-167 п.о.; расположение сайта 10 MM (8ММ): 452-465 п.о.; расположение сайта 5ММ (ЗММ): 592-610 п.о. Наблюдались аналогичные тенденции, которые встречались у dCas9/Cas9 и sgRNA: поскольку dCas9 связывается с сайтами, которые все больше спариваются ошибочно, доля популяции, группирующейся с наибольшей группой (желтый) растет, хотя этот эффект подавлен в tru-gRNA со значительной долей популяции, группирующейся с меньшими популяциями (зеленый и синий) даже в полном сайте протоспейсера. Эффект для hplO-gRNA особенно выражен, подчеркивая, что она характеризуется слабым сродством к нецелевым сайтам.
[0035] На ФИГ. 14А-14С показана модель встраивания нити в
протоспейсеры ДНК с помощью направляющих РНК и предполагаемые
стабильности связывания РНК, встроенной в протоспейсер с РАМ-
дистальными ошибочными спариваниями. На ФИГ. 14А показана
схематическая модель встраивания нити в протоспейсеры ДНК с
помощью направляющих РНК. См. также ФИГ. 4А. Предполагается, что
направляющая РНК диссоциирует при т=1. На ФИГ. 14В показано
расчетное распределение вероятностей времени диссоциации для
направляющей РНК, первоначально встроенной до т=5, для
протоспейсеров с различным количеством смежных РАМ-дистальных
ошибочных спариваний. Длительность этих значений времени
диссоциации можно рассматривать как аппроксимацию
предрасположенности связывания dCas9 в этих сайтах. Звездочка отмечает времена диссоциации для популяции направляющих РНК,
которые изначально не могут полностью внедриться после первоначального встраивания до л?=5. Встроенные РНК являются высоко нестабильными в сайтах протоспейсера с 15 РАМ-дистальными ошибочными спариваниями (15ММ), и редко наблюдали в эксперименте Cas9/dCas9, связанную в этих сайтах (ФИГ. 1D) . Рассчитано, что встроенная РНК (перед диссоциацией) в сайтах протоспейсера с 10 или 5 РАМ-дистальными ошибочными спариваниями (10ММ и 5ММ) остается значительно дольше, чем в сайтах с 15ММ, но в пределах одного порядка величины друг от друга; обнаружили, что их предрасположенность к связыванию должна быть приблизительно равна и ниже, чем у полных сайтов протоспейсера (ОММ) в экспериментах AFM. Функции плотности распределения вероятности рассчитывали с использованием способа Q-матрицы, как описано
(Sakmann et al. (1995) Single-channel recording, Springer; 2nd ed.), с помощью последовательность-специфичных скоростей перехода между т состояниями (vf и vr, см. раздел Дополнительные способы). На ФИГ. 14С показано изучение предполагаемых периодов полужизни связывания РНК-протоспейсер в протоспейсерах с различными количествами РАМ-дистальных ошибочных спариваний, свидетельствуя, что существует приблизительно три режима, при которых стабильности встроенных РНК являются сходными: те, которые несут > 11 РАМ-дистальных ошибочных спариваний (низкая стабильность); те, которые несут 3-11 РАМ-дистальных ошибочных спариваний (средняя стабильность); и те, которые несут < 3 РАМ-дистальных ошибочных спариваний (высокая стабильность). Результаты являются качественно аналогичными распределению dCas9 на сконструированном субстрате, наблюдаемому посредством AFM
(ФИГ. 1D).
[0036] На ФИГ. 15 показано стимулированное среднее время первого прохода для преодоления ошибочно спаренного сайта в ходе встраивания нити с помощью sgRNA и tru-gRNA. Стимулированное
(согласно кинетическому методу Монте-Карло) среднее время первого прохода для преодоления ошибочно спаренного сайта в ходе встраивания нити с помощью sgRNA (синий цвет) и tru-gRNA
(красный цвет) для разных положений ошибочно спаренного сайта. Планки погрешностей представляют собой стандартные отклонения
зарегистрированного времени первого прохода. Последовательность протоспейсера (сайт AAVS1) в рамке.
[0037] На ФИГ. 16А-16В показаны корреляции между частотой расщепления Cas9 (Hsu et al. (2013) Nature Biotechnology, 31, 827-832) и измерениями стабильности R-петли, полученными согласно кинетическому методу Монте-Карло. На ФИГ. 16А показано, что статистическая мощность и сила корреляционных связей между стабильностью сайтов R-петли (согласно кинетическому методу Монте-Карло, см. основной текст) и экспериментальной частотой расщепления по Hsu et al. (2013) Nature Biotechnology, 31, 8278 32, снижается с увеличением длительности моделирования (от max(t)=100 до max(t)=1000 условных единиц). Этот результат свидетельствует о том, что кинетика встраивания нити может быть важным предиктором скорости нецелевого расщепления. На ФИГ. 16В показана корреляция между фрагментами времени, в течение которого R-петля имеет размер т относительно вероятности того, что испытание согласно кинетическому методу Монте-Карло предсказывает, что внедряющаяся нить будет диссоциировать до преодоления ошибочного спаривания. Связывание в сайтах 10 ~ 1415 очень сильно отрицательно коррелирует (-0,5-0,85) с вероятностью диссоциации до преодоления ошибочного спаривания, в то время как из экспериментов с AFM-визуализацией обнаружили, что связыванием в сайтах ~> 1б ассоциировано с конформационным изменением в Cas9/dCas9.
[0038] На ФИГ. 17 показано краткое изложение данных Deep-Seq со сравнением целевых активностей.
[0039] На ФИГ. 18 показано краткое изложение данных Deep-Seq со сравнением увеличения специфичности.
[0040] На ФИГ. 19 показан протоспейсер 1, Dystrophin; на дорожке 1 показан контроль GFP; на дорожке 2 показана полная gRNA; на дорожке 3 показана Tru-gRNA 19 нт; на дорожке 4 показана Tru-gRNA 18 нт; на дорожке 5 показана Tru-gRNA 17 нт; на дорожке б показана Tru-gRNA 16 нт; на дорожке 7 показана Нр-gRNA 4 п. о.; на дорожке 8 показана Hp-gRNA 5 п. о.; на дорожке 9 показана Hp-gRNA б п.о.; на дорожке 10 показана Hp-gRNA 7 п. о.;
на дорожке 11 показана Hp-gRNA 8 п.о., и на дорожке 12 показана Hp-gRNA 9 п. о., шпилька 1 (дорожка 12, 9 нт hp) GtgaataaattcgCCTACTCAGACTGTTACTC (SEQ ID NO: 335), где курсивом показана часть шпильки и подчеркнута петля шпильки.
[0041] На ФИГ. 20 показан протоспейсер 1, Dystrophin, внутренние петли.
[0042] На ФИГ. 21 показаны рассчитанные вторичные структуры 5'-концов нацеливающихся на протоспейсер сегментов hp-gRNA, используемых для экспериментов Deep Seq (с помощью программного пакета NuPack). Цвета представляют собой вероятность того, что каждый нуклеотид, существующий в этой вторичной структуре, находится в равновесии.
[0043] На ФИГ. 22 показан Dystrophin, частоты вставок/делеций, все сайты.
[0044] На ФИГ. 23 показан Dystrophin, целевая мишень/сумма(нецелевые мишени).
[0045] На ФИГ. 24 показан протоспейсер 2, ЕМХ1; на дорожке
1 показан контроль GFP; на дорожке 2 показана полная gRNA; на дорожке 3 показана Tru-gRNA; на дорожке 4 показана hp-gRNA 10 п.о., и на дорожке 5 показана hp-gRNA б п.о., шпилька 1. Преобразования - Surv_0Tl=DS_0T2; Surv_OT53=DS_OT3.
[0046] На ФИГ. 25А и 25В показан протоспейсер 2, ЕМХ1, tru-hps, внутренние петли.
[0047] На ФИГ. 26А-26С показаны структуры шпильки. На ФИГ.
2 6А показана шпилька 1, которая представляет собой 5'-шпильку в б п.о. На ФИГ. 2 6В показана шпилька 2, которая представляет собой 5'- шпильку в 5 п. о. на 18 нт (усеченной) gRNA. На ФИГ.
2 6С показана шпилька 3, которая представляет собой 5'- шпильку в
3 п. о .
[0048] На ФИГ. 27 показан ЕМХ1, частоты вставок/делеций, все сайты.
[0049] На ФИГ. 28 показан ЕМХ1, частоты вставок/делеций, низкие уровни нецелевых участков.
[0050] На ФИГ. 29 показан ЕМХ1, целевая
мишень/сумма(нецелевые мишени).
[0051] На ФИГ. 30 показан протоспейсер 3, VEGFA1. На
дорожке 1 показан контроль GFP; на дорожке 2 показана полная gRNA; на дорожке 3 показана Tru-gRNA; на дорожке 4 показана hp-gRNA 10 п.о., и на дорожке 5 показана hp-gRNA б п.о.
[0052] На ФИГ. 31 показан протоспейсер 3, VEGFA1: рат-проксимальные шпильки. На дорожке 1 показан контроль GFP; на дорожке 2 показана полная gRNA; на дорожке 3 показана hp-gRNAl; на дорожке 4 показана hp-gRNA2; на дорожке 5 показана hp-gRNA3; на дорожке б показана hp-gRNA4; на дорожке 7 показана hp-gRNA5 и на дорожке 8 показана hp-gRNA6.
[0053] На ФИГ. 32 показан протоспейсер 3, VEGFA1: рат-проксимальные шпильки.
[0054] На ФИГ. 33 показан протоспейсер 3, VEGF1, внутренние петли. На дорожке 1 показан контроль; на дорожке 2 показана полная; на дорожке 3 показана 2 нт hp; на дорожке 4 показана 3 нт hp, шпилька 5; и на дорожке 5 показана 4 нт hp.
[0055] На ФИГ. 34А и 34В показано, что эксперименты Deep-seq для шпилек 1, 2 и 3 не удались. На ФИГ. 25А показана шпилька 4 - полученная на основе вычислений шпилька, разработанная для распознавания нецелевого сайта 2 при сохранении целевой активности. На ФИГ. 25В показана шпилька 5-5'- шпилька в 4 п.о. (обычно gRNA имеет значительную 3'-вторичную структуру).
[0056] На ФИГ. 35 показан VEGF1, частоты вставок/делеций, все сайты.
[0057] На ФИГ. 36 показан VEGF1, частоты вставок/делеций, низкие уровни нецелевых участков.
[0058] На ФИГ. 37 показан VEGF1, целевая
мишень/сумма(нецелевые мишени).
[0059] На ФИГ. 38 показан протоспейсер 4, VEGFA3. На дорожке 1 показан контроль GFP; на дорожке 2 показана полная gRNA, на дорожке 3 показана Tru-gRNA; на дорожке 4 показана hp-gRNA в 3 п. о.; на дорожке 5 показана hp-gRNA в 4 п. о.; на дорожке б показана hp-gRNA в 5 п.о.; на дорожке 7 показана hp-gRNA в б п.о. и на дорожке 8 показана hp-gRNA в 10 п.о.
[0060] На ФИГ. 3 9 показаны gRNA4, VEGFA3: pam-проксимальные шпильки. На дорожке 1 показан контроль GFP; на дорожке 2 показана полная gRNA; на дорожке 3 показана hp-gRNAl; на дорожке
4 показана hp-gRNA2; на дорожке 5 показана hp-gRNA3; на дорожке б показана hp-gRNA4; на дорожке 7 показана hp-gRNA5 и на дорожке 8 показана hp-gRNA6.
[0061] На ФИГ. 40А показана шпилька 1 - шпилька в 4 п.о., нацеливающаяся на 3'- область.
[0062] На ФИГ. 40В показана шпилька 2 - шпилька в 4 п.о., нацеливающаяся на 3'- область с неоднозначностью пар G-U.
[0063] На ФИГ. 40 показана шпилька 3 - шпилька в 4 п.о., нацеливающаяся на 3' - область с неоднозначностью пар G-U (вариант дизайна).
[0064] На ФИГ. 41 показан VEGF3, частоты вставок/делеций, все сайты.
[0065] На ФИГ. 42 показан VEGF3, частоты вставок/делеций, низкие уровни нецелевых участков.
[0066] На ФИГ. 43 показан VEGF3, целевая
мишень/сумма(нецелевые мишени).
[0067] На ФИГ. 44А показана шпилька, разработанная для нацеливания на ген ЕМХ1.
[0068] На ФИГ. 44В показана последовательность EMXl-sgl шпильки с ФИГ. 4 4А.
[0069] На ФИГ. 44С показано воздействие уменьшения длины протоспейсера и увеличения длины шпильки на специфичность.
[0070] На ФИГ. 45A-45D показаны последовательности ДНК/РНК.
[0071] На ФИГ. 46 показана фигура, которая описывает анализ Surveyor.
[0072] На ФИГ. 47 показана устойчивость AsCpfl и LbCpfl к crRNA с ошибочным спариванием или усечением и эндогенные модификации генов с помощью AsCpfl и LbCpfl с использованием crRNA, которые содержат основания с одним ошибочным спариванием. Активность, определяемая с помощью анализа Т7Е1; планки погрешностей, s.e.m.; п=3 (взято у Kleinstiver et al., Nat. Biotech. 34:869-875).
[0073] На ФИГ. 48 показаны результаты анализа surveyor для hp-gRNA, использованных с системой CRISPR V типа, в котором шпильку добавляют к 3'-концу полноразмерной gRNA для отмены нецелевой активности.
Подробное описание изобретения
[0074] В данном документе раскрываются композиция и способы для сайт-специфического целенаправленного воздействия на ДНК и эпигеномного редактирования генов и/или регуляции транскрипции, как например: расщепление ДНК и активация или репрессия гена. Настоящее изобретение направлено на модульный способ конструирования и использования оптимизированных направляющих РНК, имеющих структуры шпильки (hpgRNA), которые могут быть легко встроены в существующую биотехнологическую инфраструктуру и которые приводят к контролируемому уменьшению нецелевой активности при сохранении способности специфично нацеливаться на соответствующую последовательность ДНК. Способы, описанные в данном документе, обеспечивают новый подход к конструированию оптимизированной gRNA, который работает более эффективно, чем другие доступные способы, и их можно использовать в сочетании с другими белок-специфическими средствами улучшения, особенно повышающими высокоэффективную производительность.
[0075] Раскрытые способы и оптимизированные gRNA имеют большое преимущество в том, что они легко адаптируются к существующим методологиям и инфраструктурам, уже имеющим место для осуществления геномной инженерии с направляющими РНК. В некоторых вариантах осуществления Cas9, dCas9 или Cpfl доставляют в клетку с использованием вирусных векторов вместе с векторами, кодирующими транскрипцию оптимизированных gRNA в клетке. В соответствии с настоящим изобретением потребуется лишь несколько дополнительных нуклеотидов для вектора, кодирующего оптимизированную gRNA, что можно легко адаптировать под современные и стандартные практические методики. Подобно усеченным направляющим РНК (tru-gRNA), оптимизированные gRNA или hpgRNA можно использовать в комбинации с парными никазами, например, или с другими модификациями самих эндонуклеаз для дополнительного улучшения специфичности. Провели серию экспериментов in vitro, которая показала, что применение оптимизированных gRNA, полученных с использованием описанных в данном документе способов, увеличивает специфичность связывания ДНК относительно наиболее доступных вариантов gRNA (см. фиг. 2).
Применение оптимизированной gRNA устраняет или значительно ослабляет активность мишеней, содержащих лишь несколько ошибочно спаренных последовательностей ДНК, которые, как правило, являются сайтами, в которых имеет место нецелевая активность РНК-направляемых эндонуклеаз. Оптимизированная gRNA также обеспечивает специфичность расщепляющей активности в клетках млекопитающих в сайтах, которые, как известно, индуцируют нецелевую активность даже при наиболее известных улучшениях в отношении направляющих РНК. Настоящее изобретение представляет собой универсально применимый способ снижения нецелевой активности РНК-направляемых эндонуклеаз, в частности Cas9, путем внесения изменений в структуру направляющей РНК. 1. Определения
[0076] Подразумевается, что термины "содержат(содержит)",
"включают(включает)", "имеющий", "имеет", "может",
"включает(включают)" и их варианты, используемые в данном документе, являются открытыми переходными фразами, терминами или словами, которые не исключают возможность наличия дополнительных действий или структур. Формы единственного числа включают ссылки на множественное число, если контекст явно не указывает на иное. Настоящее изобретение также охватывает другие варианты осуществления, "содержащие" варианты осуществления или элементы, представленные в данном документе, "состоящие из" них и "по сути, состоящие из них, независимо от того, изложены они явным образом или нет.
[0077] При упоминании в данном документе числовых диапазонов каждое промежуточное число в них охватывается явным образом с той же степенью точности. Например, в случае диапазона 6-9 в дополнение к б и 9 охватываются числа 7 и 8, а в случае диапазона 6,0-7,0 явным образом охватываются числа 6,0, 6,1, 6,2, 6,3, 6,4, 6,5, 6,6, 6,7, 6,8, 6,9 и 7,0.
[0078] Если не определено иное, все технические и научные термины, используемые в данном документе, имеют то же значение, которое обычно понимает специалист в данной области. В случае противоречий данный документ, содержащий определения, будет иметь преимущественную силу. Предпочтительные способы и
материалы описаны ниже, хотя при практическом осуществлении или тестировании настоящего изобретения можно использовать способы и материалы, аналогичные или эквивалентные описанным в данном документе. Все публикации, заявки на патенты, патенты и другие ссылочные материалы, упомянутые в данном документе, включены посредством ссылки во всей своей полноте. Материалы, способы и примеры, раскрытые в данном документе, являются только иллюстративными и не подразумеваются как ограничивающие.
[0079] "Аденоассоциированный вирус" или "AAV", используемый в данном документе взаимозаменяемо, относится к небольшому вирусу, принадлежащему к роду Dependovirus семейства Parvoviridae, который инфицирует людей и некоторые другие виды приматов. В настоящее время AAV не вызывает болезни, и, следовательно, вирус вызывает очень умеренный иммунный ответ.
[0080] Используемый в данном документе термин "область связывания" относится к области в целевой области для нуклеазы, которая распознается и связывается нуклеазой, такой как Cas9.
[0081] Используемый в данном документе термин "хроматин" относится к организованному комплексу хромосомной ДНК, связанному с гистонами.
[0082] "Цис-регуляторные элементы" или "CRE", используемые в данном документе взаимозаменяемо, относятся к областям некодирующей ДНК, которые регулируют транскрипцию близлежащих генов. CRE выявлены рядом с геном или генами, которые они регулируют. Как правило, CRE регулируют транскрипцию гена, функционируя в качестве сайтов связывания для факторов транскрипции. Примеры CRE включают промоторы, энхансеры, супер-энхансеры, сайленсеры, инсуляторы и регуляторныне области локуса.
[0083] "Короткие палиндромные повторы, регулярно расположенные группами" и "CRISPR", используемые в данном документе взаимозаменяемо, относятся к локусам, содержащим множественные короткие прямые повторы, которые встречаются в геномах примерно 4 0% секвенированных бактерий и 90% секвенированных архей.
[0084] Используемое в данном документе выражение
"кодирующая последовательность" или "кодирующая нуклеиновая кислота" означает нуклеиновые кислоты (молекулу РНК или ДНК) , которые содержат нуклеотидную последовательность, кодирующую белок. Кодирующая последовательность может дополнительно включать сигналы инициации и терминации, функционально связанные с регуляторными элементами, включая промотор и сигнал полиаденилирования, способный управлять экспрессией в клетках индивидуума или млекопитающего, которому вводят нуклеиновую кислоту. Кодирующая последовательность может быть кодон-оптимизированной.
[0085] Используемое в данном документе выражение
"комплементарная последовательность" или "комплементарное"
означает, что нуклеиновая кислота может образовывать пары
оснований согласно Уотсону-Крику (например, A-T/U и C-G) или
Хугстену между нуклеотидами или нуклеотидными аналогами молекул
нуклеиновых кислот. "Комплементарность" относится к свойству,
разделяемому двумя последовательностями нуклеиновой кислоты, за
счет которого, когда они выровнены антипараллельно друг другу,
нуклеотидные основания в каждом положении будут
комплементарными.
[0086] Термины "корректирование", "редактирование генома" и
"восстановление", используемые в данном документе, относятся к
изменению мутантного гена, который кодирует усеченный белок или
вообще не кодирует какой-либо белок, за счет чего достигается
экспрессия полноразмерного функционального или полноразмерного
частично функционального белка. Корректирование или
восстановление мутантного гена может включать в себя замену области гена, которая имеет мутацию, или замену всего мутантного гена копией гена, которая не имеет мутации, с помощью механизма репарации, такого как репарация с участием гомологичной рекомбинации (HDR). Корректирование или восстановление мутантного гена может также включать в себя репарацию мутации со сдвигом рамки, которая является причиной преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга, путем создания двухнитевого разрыва в гене, который затем репарируют с использованием негомологичного
соединения концов (NHEJ). За счет NHEJ может добавляться или
удаляться по меньшей мере одна пара оснований в ходе репарации,
что может восстанавливать соответствующую рамку считывания и
устранять преждевременный стоп-кодон. Коррекция или
восстановление мутантного гена также может включать в себя
разрушение аберрантного сайта акцептора сплайсинга или
последовательности донора сплайсинга. Коррекция или
восстановление мутантного гена может также включать удаление сегмента гена, не являющегося важным, путем одновременного воздействия двух нуклеаз на одну и ту же нить ДНК, чтобы восстановить соответствующую рамку считывания путем удаления ДНК между двумя сайтами-мишенями для нуклеаз и репарации разрыва ДНК с помощью NHEJ.
[0087] Используемый в данном документе термин "деметилазы" относится к ферменту, который удаляет метильные (СНЗ-) группы из нуклеиновых кислот, белков (в частности, гистонов) и других молекул. Ферменты-деметилазы важны в механизмах эпигенетической модификации. Белки-деметилазы изменяют регуляцию транскрипции генома за счет осуществления контроля уровней метилирования, которые имеют место на ДНК и гистонах, и, в свою очередь, регулируют состояние хроматина в определенных локусах генов внутри организмов. Выражение "гистоновая деметилаза" относится к деметилазе, которая удаляет метильные группы из гистонов. Существует несколько семейств гистоновых деметилаз, которые действуют на разные субстраты и играют различную роль в клеточной функции. Зависимые от Fe(II) лизиновые деметилазы могут представлять собой деметилазу JMJC. Деметилаза JMJC является гистоновой деметилазой, содержащей домен JumonjiC (JmjC). Деметилаза JMJC может быть представителем семейства гистоновых деметилаз KDM3, KDM4, KDM5 или KDM6.
[0088] Выражение "сверхчувствительные к ДНКазе I сайты" или "DHS", используемые в данном документе взаимозаменяемо, относятся к сайтам докинга для факторов транскрипции и модификаторов хроматина, включая рЗОО, которые координируют экспрессию дистального целевого гена.
[0089] Термины "донорная ДНК", "донорная матрица" и
"матрица репарации", используемые в данном документе взаимозаменяемо, относятся к фрагменту или молекуле двухнитевой ДНК, которая включает в себя по меньшей мере часть представляющего интерес гена. Донорная ДНК может кодировать полнофункциональный белок или частично функциональный белок.
[0090] Термин "эндогенный ген", используемый в данном документе, относится к гену, который происходит из организма, ткани или клетки. Эндогенный ген является нативным для клетки, находится в своем нормальном геномном и хроматиновом окружении и не является гетерологичным по отношению к клетке. Такие клеточные гены включают, например, гены животных, гены растений, гены бактерий, гены простейших, гены грибов, митохондриальные гены и гены хлоропластов. Выражение "эндогенный целевой ген", используемое в данном документе, относится к эндогенному гену, на который нацеливается оптимизированная gRNA и система на основе CRISPR/Cas9 или на основе CRISPR/Cpfl.
[0091] Термин "энхансер", используемый в данном документе, относится к некодирующим последовательностям ДНК, содержащим множественные сайты связывания активатора и репрессора. Энхансеры изменяются в диапазоне от 50 до 1500 п. о. в длину и могут быть либо проксимальными, в 5'-сторону относительно промотора, в пределах любого интрона регулируемого гена, либо дистальными, в интронах соседних генов или в межгенных областях вдали от локуса, или в областях на разных хромосомах. Более одного энхансера могут взаимодействовать с промотором. Аналогичным образом энхансеры могут регулировать более одного гена без ограничения сцепления и могут "пропускать" соседние гены для регуляции более отдаленных генов. Регуляция транскрипции может вовлекать элементы, расположенные в хромосоме, отличающейся от той, где находится промотор. Проксимальные энхансеры или промоторы соседних генов могут служить в качестве платформ для привлечения более дистальных элементов.
[0092] Термин "мышечная дистрофия Дюшенна" или "DMD", используемый в данном документе взаимозаменяемо, относится к рецессивному, фатальному, Х-сцепленному нарушению, которое
приводит к дегенерации мышц и впоследствии к смертельному исходу. DMD является распространенным наследственным моногенным заболеванием и встречается у 1 из 3500 мужчин. DMD является результатом врожденных или спонтанных мутаций, которые вызывают нонсенс-мутации или мутации со сдвигом рамки в гене дистрофина. Большинство мутаций дистрофина, которые являются причиной DMD, представляют собой делеции экзонов, которые разрушают рамку считывания и приводят к преждевременной терминации трансляции в гене дистрофина. Пациенты с DMD обычно теряют способность физически поддерживать на протяжении детства, постепенно становятся слабее в подростковом возрасте и умирают в возрасте от двадцати до тридцати лет.
[0093] Используемый в данном документе термин "дистрофии" относится к стержнеобразному цитоплазматическому белку, который является частью белкового комплекса, соединяющего цитоскелет мышечного волокна с окружающим внеклеточным матриксом через клеточную мембрану. Дистрофии обеспечивает структурную стабильность дистрогликанового комплекса клеточной мембраны, который отвечает за регуляцию целостности и функции мышечных клеток. Ген дистрофина или "ген DMD", используемые в данном документе взаимозаменяемо, образован 2,2 миллионами пар оснований в локусе Хр21. Размер первичного транскрипта составляет приблизительно 2400 т. о., при этом размер зрелой мРНК составляет приблизительно 14 т. о. 7 9 экзонов кодируют белок, образованный более чем 3500 аминокислотами.
[0094] "Экзон 51", используемый в данном документе, относится к 51му экзону гена дистрофина. Экзон 51 часто является смежным с положениями делеций, разрушающих рамку считывания, у пациентов с DMD, и в клинических испытаниях на него был направлен пропуск экзона, основанный на применении олигонуклеотидов. Недавно в клиническом испытании с пропуском экзона 51 с помощью соединения этерлипсена сообщали о значительном положительном функциональном эффекте в течение 4 8 недель со средним количеством дистрофин-положительных волокон 47% по сравнению с исходным уровнем. Мутации в экзоне 51 идеально подходят для устойчивой коррекции посредством
редактирования генома на основе NHEJ.
[0095] Выражения "сдвиг рамки" или "мутация сдвига рамки", используемые в данном документе взаимозаменяемо, относятся к типу мутации гена, при которой добавление или делеция одного или нескольких нуклеотидов вызывает сдвиг в рамке считывания кодонов в мРНК. Сдвиг в рамке считывания может привести к изменению аминокислотной последовательности при трансляции белка, такой как миссенс-мутация или преждевременный стоп-кодон.
[0096] Выражение "полноразмерная gRNA" или "стандартная gRNA", используемое в данном документе взаимозаменяемо, относится к gRNA, которая включает в себя "каркас" и последовательность или сегмент, нацеливающиеся на протоспейсер, которые обычно составляют 2 0 нуклеотидов в длину.
[0097] Выражение "функциональный" и "полнофункциональный", используемое в данном документе взаимозаменяемо, описывает белок, который обладает биологической активностью. Выражение "функциональный ген" относится к гену, транскрибируемому в мРНК, которая подвергается трансляции в функциональный белок.
[0098] Выражение "слитый белок", используемое в данном документе, относится к химерному белку, созданному путем соединения двух или более генов, которые исходно кодировали отдельные белки. Трансляция гибридного гена приводит к получению одного полипептида с функциональными свойствами, полученными от каждого из исходных белков.
[0099] Выражение "генетическая конструкция", используемое в
данном документе, относится к молекулам ДНК или РНК, которые
содержат нуклеотидную последовательность, кодирующую белок.
Кодирующая последовательность включает в себя сигналы инициации
и терминации, функционально связанные с регуляторными
элементами, в том числе промотор и сигнал полиаденилирования,
способный управлять экспрессией в клетках индивидуума, которому
вводят молекулу нуклеиновой кислоты. Используемое в данном
документе выражение "экспрессируемая форма" относится к генным
конструкциям, которые содержат необходимые регуляторные
элементы, функционально связанные с кодирующей
последовательностью, которая кодирует белок, за счет чего, когда
он присутствует в клетке индивидуума, кодирующая последовательность будет экспрессироваться.
[00100] Используемое в данном документе выражение
"генетическое заболевание" относится к заболеванию, частично или
полностью, прямо или косвенно, вызванному одним или несколькими
нарушениями в геноме, особенно к состоянию, которое присутствует
от рождения. Нарушение может быть мутацией, вставкой или
делецией. Нарушение может влиять на кодирующую
последовательность гена или его регуляторную последовательность. Генетическое заболевание может представлять собой без ограничения DMD, гемофилию, кистозный фиброз, хорею Гентингтона, семейную гиперхолестеринемию (дефект рецептора LDL) , гепатобластому, болезнь Вилсона, врожденную печеночную порфирию, наследственные нарушения обменных процессов в печени, синдром Леша-Нихана, серповидно-клеточную анемию, талассемию, пигментную ксеродермию, анемию Фанкони, пигментный ретинит, атаксию телеангиэктазию, синдром Блума, ретинобластому и болезнь Тай-Сакса.
[00101] Термин "геном", используемый в данном документе, относится к полному набору генов или генетического материала, присутствующего в клетке или организме. Геном включает в себя ДНК или РНК в РНК-вирусах. Геном включает в себя как гены
(кодирующие области), так и некодирующую ДНК и геномы митохондрий и хлоропластов.
[00102] Термины "направляющая РНК", "gRNA", "одиночная gRNA" и "sgRNA", используемые в данном документе взаимозаменяемо, относятся к короткой синтетической РНК, состоящей из последовательности "каркаса", необходимой для связывания с Cas9 или связывания с Cpfl, и определяемого пользователем "спейсера" или "нацеливающейся последовательности"
(также называемой в данном документе как последовательность или сегмент, нацеливающиеся на протоспейсер), которая определяет геномную мишень, подлежащую модификации. Термины "hpgRNA", "hp-gRNA" и "оптимизированная gRNA", используемые в данном документе взаимозаменяемо, относятся к gRNA, которая имеет дополнительные нуклеотиды с 5'-конца или 3'-конца, которые могут образовывать
вторичную структуру со всеми последовательностью или сегментом, нацеливающимися на протоспейсер, или их частью.
[00103] Термин "гистоновые ацетилтрансферазы" или "НАТ", используемый в данном документе взаимозаменяемо, относится к ферментам, которые ацетилируют консервативные аминокислоты лизина на гистоновых белках путем переноса ацетильной группы с ацетил-СоА с образованием s-N-ацетиллизина. ДНК обернута вокруг гистонов и при переносе ацетильной группы на гистоны гены могут включаться и выключаться. В целом ацетилирование гистонов повышает экспрессию генов, поскольку оно связано с активацией транскрипции и ассоциировано с эухроматином. Гистоновые ацетилтрансферазы также могут ацетилировать негистоновые белки, такие как ядерные рецепторы и другие транскрипционные факторы для облегчения экспрессии генов.
[00104] Термин "гистоновые деацетилазы" или "HDAC", используемый в данном документе взаимозаменяемо, относится к классу ферментов, которые удаляют ацетильные группы (0=С-СН3) из аминокислоты s-N-ацетиллизин на гистоне, что позволяет гистонам обертывать ДНК более плотно. HDAC также называют лизиндеацетилазами (KDAC) с целью описания их функции, а не их мишени, которая также включает негистоновые белки.
[00105] Термин "гистоновая метилтрансфераза" или "НМТ", используемый в данном документе взаимозаменяемо, относится к гистон-модифицирующим ферментам (например, гистон-лизин N-метилтрансферазам и гистон-аргинин N-метилтрансферазам) , которые катализируют перенос одной, двух или трех метильных групп на остатки лизина и аргинина гистоновых белков. Присоединение метильных групп происходит преимущественно на конкретных остатках лизина или аргинина на гистонах НЗ и Н4.
[00106] Термин "репарация с участием гомологичной рекомбинации" или "HDR", используемый в данном документе взаимозаменяемо, относится к механизму в клетках для репарации двухнитевых повреждений ДНК, когда в ядре присутствует гомологичная часть ДНК, в основном в фазе клеточного цикла G2 и S. В HDR используется матрица донорной ДНК для управления
репарацией, и ее можно использовать для создания специфических изменений последовательности в геноме, включая целенаправленное добавление целых генов. Если донорная матрица предоставляется вместе с сайт-специфической нуклеазой, например с системой на основе CRISPR/Cas9 или системой на основе CRISPR/Cpfl, то клеточный аппарат осуществляет репарацию разрыва путем гомологичной рекомбинации, которая усиливается на несколько порядков в присутствии расщепления ДНК. Когда фрагмент гомологичной ДНК отсутствует, вместо этого может происходить негомологичное соединение концов.
[00107] Термин "геном", используемый в данном документе, относится к полному набору генов или генетического материала, присутствующего в клетке или организме. Геном включает в себя ДНК или РНК в РНК-вирусах. Геном включает в себя как гены (кодирующие области), так и некодирующую ДНК и геномы митохондрий и хлоропластов.
[00108] Выражение "редактирование генома", используемое в данном документе, относится к изменению гена. Редактирование генома может включать в себя корректирование или восстановление мутантного гена. Редактирование генома может включать в себя нокаут гена, такого как мутантный ген или нормальный ген. Редактирование генома можно использовать для лечения заболеваний или улучшения восстановления мышц путем изменения представляющего интерес гена.
[00109] Выражение "идентичная" или "идентичность", используемое в данном документе в контексте двух или более нуклеиновых кислот или полипептидных последовательностей, означает, что последовательности имеют определенный процент остатков, которые являются одинаковыми в указанной области. Процент может быть рассчитан путем оптимального выравнивания двух последовательностей, сравнения двух последовательностей в указанной области, определения количества положений, в которых одинаковый остаток встречается в обеих последовательностях, с получением количества совпадающих положений, разделяя количество совпадающих положений на общее количество положений в указанной области и умножая результат на 100, чтобы получить процент
идентичности последовательности. В тех случаях, когда две последовательности имеют разную длину или выравнивание дает в результате одну или несколько ступеней в шахматном порядке, а указанная область сравнения включает только одну последовательность, то при расчете эти остатки одной последовательности включаются в знаменатель, но не в числитель. При сравнении ДНК и РНК тимин (Т) и урацил (U) можно считать эквивалентом. Идентификацию можно проводить вручную или с использованием компьютерного алгоритма для работы с последовательностями, такого как BLAST или BLAST 2.0.
[00110] Термин "инсуляторы", используемый в данном документе, относится к генетическому пограничному элементу, который блокирует взаимодействие между энхансерами и промоторами. При расположении между энхансером и промотором инсулятор может ингибировать их последующие взаимодействия. Инсуляторы могут определять набор генов, на которые может оказывать влияние энхансер. Инсуляторы необходимы в тех случаях, когда два соседних гена на хромосоме имеют значительно отличающиеся режимы транскрипции, а индуцирующие или подавляющие механизмы одного гена не препятствуют функции соседнего гена. Было обнаружено, что инсуляторы также группируются на границах доменов топологической ассоциации (TAD) и могут играть роль в разделении генома на "районы хромосом" - геномные области, в пределах которых происходит регуляция. Считается, что активность инсулятора осуществляется главным образом за счет ЗО-структуры ДНК, опосредованной белками, в том числе CTCF. Инсуляторы могут функционировать посредством нескольких механизмов. Многие энхансеры образуют петли ДНК, которые при активации транскрипции помещают их в тесной физической близости с промоторными областями. Инсуляторы могут способствовать образованию петель ДНК, которые препятствуют образованию петель промотор-энхансер. Барьерные инсуляторы могут препятствовать распространению гетерохроматина от молчащего гена к активно транскрибируемому гену.
[00111] Выражение "встраивание", используемое в данном документе, относится к разрушению дуплекса ДНК в области
протоспейсера в целевой области целевого гена, например с помощью gRNA, которая связывается с последовательностью ДНК, комплементарной протоспейсеру.
[00112] Термин "кинетика встраивания", используемый в данном документе, относится к скорости, с которой происходит встраивание. Кинетика встраивания может относиться к скорости, с которой направляющая РНК встраивается в дуплекс, либо к "полному встраиванию", так что протоспейсер полностью встроен, или к скорости, с которой сегмент ДНК протоспейсера, связанный с направляющей РНК, удлиняется по мере его вытеснения из его комплементарной нити и связывания с направляющей РНК нуклеотид за нуклеотидом от его РАМ-проксимальной области до полного встраивания.
[00113] Выражение "время нахождения", используемое в данном документе, относится к периоду времени, в течение которого gRNA остается встроенной в область в целевой области целевого гена.
[00114] Выражение "области контроля локуса", используемое в
данном документе, относится к цис-регуляторному элементу
дальнего действия, который усиливает экспрессию связанных генов
на дистальных участках хроматина. Он функционирует в зависимости
от количества копий и является тканеспецифичным, как видно по
избирательной экспрессии генов р-глобина в эритроидных клетках.
Уровни экспрессии генов могут быть модифицированы с помощью LCR
и проксимальных по отношению к гену элементов, таких как
промоторы, энхансеры и сайленсеры. LCR функционирует путем
привлечения хроматин-модифицирующих, коактиваторных и
транскрипционных комплексов. Его последовательность является консервативной у многих позвоночных, при этом консервативность определенных сайтов может указывать на важность функции.
[00115] Выражение "ошибочно спаренный" или "ММ", используемое в данном документе взаимозаменяемо, относится к ошибочно спаренным основаниям, которые включают пары G/T или А/С. Ошибочные спаривания обычно связаны с таутомеризацией оснований во время G2 Повреждение репарируется путем распознавания деформации, вызванной ошибочным спариванием,
определения матричной и нематричной нити и вырезания ошибочно встроенного основания и замены его соответствующим нуклеотидом.
[00116] Используемый в данном документе термин "модуляция" может означать любое изменение активности, такое как регуляция, понижающая регуляция, повышающая регуляция, снижение, ингибирование, увеличение, уменьшение, деактивация или активация.
[00117] Термин "мутантный ген" или "мутированный ген", используемый в данном документе взаимозаменяемо, относится к гену, который был подвергнут выявляемой мутации. Мутантный ген подвергся изменению, такому как потеря, получение или обмен генетического материала, что влияет на нормальную передачу и экспрессию гена. Термин "разрушенный ген", используемый в данном документе, относится к мутантному гену, в которым имеется мутация, являющаяся причиной преждевременного стоп-кодона. Продукт разрушенного гена усечен по сравнению с продуктом полноразмерного неразрушенного гена.
[00118] Выражение "путь негомологичного соединения концов (NHEJ)", используемое в данном документе, относится к пути репарации двухнитевых разрывов ДНК путем прямого лигирования концов разрыва без необходимости в гомологичной матрице. Независимое от матрицы повторное лигирование концов ДНК с помощью NHEJ представляет собой стохастический, подверженный ошибкам процесс репарации, который вводит случайные микровставки и микроделеции (вставки-делеции) в точке разрыва ДНК. Этот способ можно использовать для намеренного разрушения, делеции или изменения рамки считывания последовательностей целевых генов. В NHEJ обычно используют короткие гомологичные последовательности ДНК, называемые микрогомологиями, для управления репарацией. Эти микрогомологии часто присутствуют в однонитевых липких концах на конце двухнитевых разрывов. Когда липкие концы идеально совместимы, то NHEJ обычно репарирует разрыв точно, однако может иметь место неточная репарация, приводящая к потере нуклеотидов, но гораздо более часто липкие концы несовместимы.
[00119] Используемое в данном документе выражение
"нормальный ген" относится к гену, который не подвергался изменениям, таким как потеря, получение или обмен генетического материала. Нормальный ген подвергается нормальной передаче генов и экспрессии генов.
[00120] Выражение "опосредованное нуклеазой NHEJ", используемое в данном документе, относится к NHEJ, которое инициируется после того, как нуклеаза, такая как cas9, разрезает двухнитевую ДНК.
[00121] Используемые в данном документе термины "нуклеиновая кислота", или "олигонуклеотид", или "полинуклеотид" означают по меньшей мере два нуклеотида, ковалентно связанных друг с другом. Изображение одиночной нити также определяет последовательность комплементарной нити. Таким образом, нуклеиновая кислота также охватывает комплементарную нить изображенной одиночной нити. Множество вариантов нуклеиновой кислоты можно использовать для той же цели, как и указанную нуклеиновую кислоту. Таким образом, нуклеиновая кислота также охватывает по сути идентичные нуклеиновые кислоты и их комплементарные нити. Одиночная нить обеспечивает зонд, который может гибридизироваться с целевой последовательностью в жестким условиях гибридизации. Таким образом, нуклеиновая кислота также охватывает зонд, который гибридизируется в жестких условиях гибридизации.
[00122] Нуклеиновая кислота может быть однонитевой или двухнитевой или может содержать части как двухнитевой, так и однонитеввой последовательности. Нуклеиновая кислота может представлять собой ДНК, как геномную, так и кДНК, РНК или гибридную молекулу, где нуклеиновая кислота может содержать комбинации дезоксирибо- и рибонуклеотидов, и при этом комбинации оснований включают урацил, аденин, тимин, цитозин, гуанин, инозин, ксантин, гипоксантин, изоцитозин и изогуанин. Нуклеиновые кислоты можно получать с помощью способов химического синтеза или с помощью рекомбинантных способов.
[00123] Термин "целевой сайт", используемый в данном документе, относится к целевой области или последовательности в геноме, на которую предусмотрено нацеливание gRNA. В идеальном
случае целевой сайт имеет идеальную гомологию (100% идентичность или гомологию) с последовательностью целевой ДНК без гомологии в другом месте генома.
[00124] Термин "нецелевой сайт", используемый в данном документе, относится к области генома, которая имеет частичную гомологию или частичную идентичность с целевым сайтом или целевой областью gRNA, но gRNA не предназначена или не сконструирована для нацеливания на него.
[00125] Используемое в данном документе выражение "функционально связанный" означает, что экспрессия гена находится под контролем промотора, с которым он пространственно соединен. Промотор может располагаться 5' (выше) или 3' (ниже) относительно гена под его контролем. Расстояние между промотором и геном может быть приблизительно таким же, как и расстояние между этим промотором и геном, который он контролирует, в гене, из которого получен промотор. Как известно в данной области, изменение этого расстояния может быть осуществлено без потери промоторной функции.
[00126] Термины "белок рЗОО", "ЕР300" или "Е1А-связывающий белок рЗОО", используемые в данном документе взаимозаменяемо, относятся к ассоциированному с аденовирусом Е1А клеточному белку-коактиватору транскрипции рЗОО, кодируемому геном ЕР300. рЗОО представляет собой высококонсервативную ацетилтрансферазу, принимающую участие в широком спектре клеточных процессов. рЗОО функционирует как гистоновая ацетилтрансфераза, которая регулирует транскрипцию посредством ремоделирования хроматина и принимает участие в процессах клеточной пролиферации и дифференцировки клеток.
[00127] Выражение "частично функциональный", используемое в данном документе, описывает белок, который кодируется мутантным геном и характеризуется меньшей биологической активностью, чем функциональный белок, но большей, чем нефункциональный белок.
[00128] Выражение "преждевременный стоп-кодон" или "стоп-
кодон вне рамки", используемые в данном документе
взаимозаменяемо, относятся к нонсенс-мутации в
последовательности ДНК, которая является причиной стоп-кодона в месте, которое обычно не обнаруживается в гене дикого типа. Преждевременный стоп-кодон может приводить к усечению или укорочению белка по сравнению с полноразмерной версией белка.
[00129] Используемый в данном документе термин "первичная клетка" относится к клеткам, отобранным непосредственно из живой ткани (например, материала-биоптата). Первичные клетки могут быть предназначены для выращивания in vitro. Эти клетки претерпели лишь несколько удвоений популяции и поэтому являются более характерными для основного функционального компонента ткани, из которой они получены, по сравнению с непрерывными (опухолевыми или искусственно иммортализированными) клеточными линиями, что представляет собой в большей степени репрезентативную модель для состояния in vivo. Первичные клетки могут быть отобраны у разных видов, таких как мышь или человек.
[00130] Термин "последовательность протоспейсера" или "сегмент протоспейсера", используемое в данном документе взаимозаменяемо, относится к последовательности ДНК, на которую нацеливается нуклеаза Cas9 или нуклеаза Cpfl в бактериальной адаптивной иммунной системе CRISPR. В системе CRISPR/Cas9 за последовательностью протоспейсера обычно располагается смежный с протоспейсером мотив (РАМ); при этом РАМ расположен на 5'-конце. В системе CRISPR/Cpfl за РАМ располагается последовательность протоспейсера; РАМ расположен на 3'-конце.
[00131] Выражение "нацеливающаяся на протоспейсер последовательность" или "нацеливающийся на протоспейсер сегмент", используемое в данном документе взаимозаменяемо, относится к нуклеотидной последовательности gRNA, которая соответствует последовательности протоспейсера и облегчает нацеливание системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl на последовательность протоспейсера.
[00132] Используемый в данном документе термин "промотор" означает молекулу синтетического или природного происхождения, которая способна обеспечивать, активировать или усиливать экспрессию нуклеиновой кислоты в клетке. Промотор может содержать одну или несколько специфических последовательностей
регуляции транскрипции для дополнительного усиления экспрессии и/или для изменения пространственной экспрессии и/или временной экспрессии. Промотор может также содержать дистальные энхансерные или репрессорные элементы, которые могут располагаться в нескольких тысячах пар оснований или в любом месте генома от сайта инициации транскрипции. Промотор может быть получен из источников, включая вирусы, бактерии, грибы, растения, насекомых и животных. Промотор может регулировать экспрессию генетического компонента конститутивно или дифференциально с учетом клетки, ткани или органа, в которых происходит экспрессия, или с учетом стадии развития, на которой происходит экспрессия, или в ответ на внешние раздражители, такие как физиологические стрессы, гормоны, токсины, лекарственные средства, патогены, ионы металлов или индуцирующие средства. Типичные примеры промоторов включают промотор бактериофага Т7, промотор бактериофага ТЗ, промотор SP6, промотор лактозного оперона, промотор tac, поздний промотор SV4 0, ранний промотор SV4 0, промотор RSV-LTR, промотор IE CMV, ранний промотор SV4 0 или поздний промотор SV4 0 и промотор IE CMV.
[00133] Выражение "прилегающий к протоспейсеру мотив" или "РАМ", используемое в данном документе, относится к последовательности ДНК, которая располагается непосредственно за последовательностью ДНК, на которую нацеливается Cas9, или располагается непосредственно перед последовательностью ДНК, на которую нацеливается нуклеаза Cpfl в бактериальной адаптивной иммунной системе CRISPR. РАМ является компонентом встраивающихся вируса или плазмиды, но не является компонентом локуса бактериальной CRISPR. Cas9 и Cpfl не будут успешно связывать или расщеплять последовательность целевой ДНК, если после нее не расположена или ей не предшествует последовательность РАМ соответственно. РАМ является важным компонентом нацеливания (не выявленным в бактериальном геноме), который отличает собственную бактериальную ДНК от несобственной ДНК, предотвращая тем самым нацеливание на локус CRISPR и его разрушение нуклеазой.
[00134] Термин "рекомбинантный" при использовании в
отношении, например, клетки или нуклеиновой кислоты, белка или вектора указывает на то, что клетка, нуклеиновая кислота, белок или вектор были модифицированы путем введения гетерологичных нуклеиновой кислоты или белка или изменения нативных нуклеиновой кислоты или белка, или что клетка получена из клетки, модифицированной таким образом. Таким образом, например, рекомбинантные клетки экспрессируют гены, не выявляемые в нативной (природного происхождения) форме клетки, или экспрессируют вторую копию нативного гена, которая при иных обстоятельствах характеризуется нормальной или аномальной экспрессией, недостаточной экспрессией или вовсе не экспрессируется.
[00135] Термины "сайленсеры" или "репрессоры", используемые
в данном документе взаимозаменяемо, относятся к
последовательности ДНК, способной связывать факторы регуляции транскрипции и предотвращать экспрессию генов в виде белков. Сайленсер является специфичным по отношению к последовательности элементом, который индуцирует отрицательное воздействие на транскрипцию своего конкретного гена. Есть множество положений, в которых элемент-сайленсер может располагаться в ДНК. Наиболее распространенное положение находится выше относительно целевого гена, где оно может способствовать подавлению транскрипции гена. Это расстояние может сильно варьироваться от приблизительно -2 0 п. о. до -2 000 п. о. выше относительно гена. Определенные сайленсеры могут находиться ниже по отношению к промотору, расположенному внутри интрона или экзона самого гена. Сайленсеры также были обнаружены в 3'-нетранслируемой области (3' UTR) мРНК. В ДНК существует два основных типа сайленсеров, представляющих собой классический элемент-сайленсер и неклассический отрицательный регуляторный элемент (NRE). В случае классических сайленсеров ген активно подавляется элементом-сайленсером, главным образом, путем вмешательства в сборку общего фактора транскрипции (GTF). NRE пассивно подавляют ген, как правило, путем ингибирования других элементов, которые находятся выше относительно гена.
[00136] Термин "скелетная мышца", используемый в данном
документе, относится к типу поперечно-полосатой мышцы, которая находится под контролем соматической нервной системы и прикреплена к костям пучками коллагеновых волокон, известных как сухожилия. Скелетная мышца состоит из отдельных компонентов, известных как миоциты, или "мышечные клетки", иногда в разговорной речи называемые "мышечными волокнами". Миоциты образуются в результате слияния развивающихся миобластов (тип эмбриональной клетки-предшественника, из которой возникает мышечная клетка) в процессе, известном как миогенез. Эти длинные цилиндрические многоядерные клетки также называются мышечными волокнами.
[00137] Выражение "состояние скелетных мышц", используемое в данном документе, относится к состоянию, связанному со скелетной мышцей, как например: мышечные дистрофии, старение, дегенерация мышц, заживление ран и мышечная слабость или атрофия.
[00138] Термины "субъект и "пациент", используемые в данном
документе взаимозаменяемо, относятся к любому позвоночному
животному, включая без ограничения млекопитающее
(напримергкорову, свинью, верблюда, ламу, лошадь, козу, кролика, овцу, хомяков, морскую свинку, кошку, собаку, крысу и мышь, приматов, не относящихся к человеку (например, обезьяну, такую как яванский макак или макак-резус, шимпанзе и т. д.), и человека). В некоторых вариантах осуществления субъект представляет собой человека или не является человеком. Субъекта или пациента можно подвергать другим формам лечения.
[00139] Выражение "супер-энхансер", используемое в данном документе, относится к области генома млекопитающего, содержащей множественные энхансеры, которые в совокупности связываются с комплексом белков транскрипционных факторов для управления транскрипцией генов, принимающих участие в формировании клеточной идентичности. Супер-энхансеры часто выявляют рядом с генами, являющимися важными для контроля и определения клеточной идентичности, и их можно использовать для быстрого определения ключевых точек, регулирующих клеточную идентичность. У энхансеров есть несколько количественно измеряемых признаков,
которые имеют диапазон значений, и эти признаки обычно повышены у супер-энхансеров. Супер-энхансеры связаны с более высокими уровнями белков, регулирующих транскрипцию, и ассоциированы с более высоко экспрессируемыми генами. Экспрессия генов, ассоциированных с супер-энхансерами, особенно чувствительна к внесениям изменений, что может облегчить переходы клеточного состояния или объяснить чувствительность ассоциированных с супер-энхансерами генов к малым молекулам, которые нацелены на транскрипцию.
[00140] Термин "энхансер-мишень", используемый в данном документе, относится к энхансеру, на который нацеливается gRNA и система на основе CRISPR/Cas9. Энхансер-мишень может располагаться в пределах целевой области.
[00141] Термин "целевой ген", используемый в данном документе, относится к любой нуклеотидной последовательности, кодирующей известный или предполагаемый генный продукт. Целевой ген может представлять собой мутированный ген, вовлеченный в генетическое заболевание.
[00142] Термины "целевая область", "целевая
последовательность", "протоспейсер" или "последовательность протоспейсера", используемые в данном документе взаимозаменяемо, относятся к области целевого гена, на которую нацеливается система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl.
[00143] Термин "транскрибируемая область", используемый в данном документе, относится к области ДНК, которая транскрибируется в молекулу однонитевой РНК, известную как информационная РНК, что приводит в результате к переносу генетической информации с молекулы ДНК на информационную РНК. В ходе транскрипции РНК-полимераза считывает матричную нить в направлении 3'-5' и синтезирует РНК от 5' до 3'. Последовательность мРНК комплементарна нити ДНК.
[00144] Выражение "регуляторный элемент-мишень",
используемое в данном документе, относится к регуляторному элементу, на который осуществляется нацеливание gRNA и системы на основе CRISPR/Cas9. Регуляторный элемент-мишень может
находиться в целевой области.
[00145] Термин "транскрибируемая область", используемый в данном документе, относится к области ДНК, которая транскрибируется в молекулу однонитевой РНК, известную как информационная РНК, что приводит в результате к переносу генетической информации с молекулы ДНК на информационную РНК. В ходе транскрипции РНК-полимераза считывает матричную нить в направлении 3'-5' и синтезирует РНК от 5' до 3'. Последовательность мРНК комплементарна нити ДНК.
[0014 6] Термин "сайт инициации транскрипции" или "TSS", используемый взаимозаменяемо, относится к первому нуклеотиду транскрибируемой последовательности ДНК, где РНК-полимераза начинает синтезировать транскрипт РНК.
[00147] Используемый в данном документе термин "трансген" относится к гену или генетическому материалу, содержащему последовательность гена, которая была выделена из одного организма и введена в другой отличающийся организм. Этот ненативный сегмент ДНК может сохранять способность продуцировать РНК или белок в трансгенном организме или может изменять нормальную функцию генетического кода трансгенного организма. Введение трансгена может изменить фенотип организма.
[00148] Термин "tru gRNA", используемый в данном документе, относится к полноразмерной направляющей РНК с нуклеотидами, усеченными с ее 5'-конца, как правило, 2 нуклеотидами.
[00149] Термин "транс-регуляторные элементы", используемый в данном документе, относится к областям некодирующей ДНК, которые регулируют транскрипцию генов, удаленных от гена, из которого их транскрибировали. Транс-регуляторные элементы могут находиться на одной и той же или на другой хромосоме относительно целевого гена. Примеры транс-регуляторных элементов включают энхансеры, супер-энхансеры, сайленсеры, инсуляторы и области контроля локуса.
[00150] Выражение "вариант", используемое в данном документе, в отношении нуклеиновой кислоты означает (i) часть или фрагмент эталонной нуклеотидной последовательности (в том
числе нуклеотидные последовательности, которые имеют вставки или
делеции по сравнению с эталонными нуклеотидными
последовательностями); (ii) последовательность, комплементарную эталонной нуклеотидной последовательности или ее части; (iii) нуклеиновую кислоту, по сути, идентичную эталонной нуклеиновой кислоте или комплементарной ей последовательности; или (iv) нуклеиновую кислоту, которая гибридизируется в жестких условиях с эталонной нуклеиновой кислотой, последовательностью, комплементарной ей, или последовательностями, по сути, идентичными им.
[00151] "Вариант" в отношении пептида или полипептида, который за счет вставки, делеции или консервативной замене аминокислот отличается по аминокислотной последовательности, но сохраняет по меньшей мере один тип биологической активности. Вариант также может означать белок с аминокислотной последовательностью, которая, по сути, идентична аминокислотной последовательности эталонного белка, который сохраняет по меньшей мере один тип биологической активности. В данной области признается, что консервативная замена аминокислоты, т. е. замена аминокислоты другой аминокислотой с аналогичными свойствами (например, гидрофильностью, относительным количеством и распределением заряженных участков), обычно предусматривает незначительное изменение. Эти незначительные изменения можно частично идентифицировать, учитывая индекс гидропатичности аминокислот, как это понимают в уровне техники. Kyte et al., J. Mol. Biol. 157:105-132 (1982) . Индекс гидропатичности аминокислоты определяется с учетом гидрофобности и заряда. Из уровня техники известно, что аминокислоты с аналогичными индексами гидропатичности можно заменять, и при этом функция белка по-прежнему будет сохраняться. В одном аспекте заменяют аминокислоты с индексами гидропатичности, составляющими+2. Гидрофобность аминокислот также можно использовать для выявления замен, которые в результате будут давать белки, сохраняющие биологическую функцию. Учет гидрофильности аминокислот в контексте пептида позволяет рассчитывать наибольшую локальную
усредненную гидрофильность этого пептида. Замены можно проводить с аминокислотами, у которых различие значений гидрофильности находится в пределах+2. Как на индекс гидрофобности, так и на значение гидрофильности аминокислот влияет определенная боковая цепь этой аминокислоты. В соответствии с этим наблюдением понимают, что совместимость аминокислотных замен с биологической функцией зависит от относительного сходства аминокислот и, в частности, боковых цепей этих аминокислот, что выявляют на основе гидрофобности, гидрофильности, заряда, размера и других свойств.
[00152] Термин "вектор", используемый в данном документе, означает последовательность нуклеиновой кислоты, содержащую точку начала репликации. Вектор может представлять собой вирусный вектор, бактериофаг, бактериальную искусственную хромосому или искусственную хромосому дрожжей. Вектор может представлять собой ДНК- или РНК-вектор. Вектор может быть самореплицирующимся внехромосомным вектором, а предпочтительно представляет собой плазмидную ДНК. Например, вектор может кодировать Cas 9 и по меньшей мере одну оптимизированную нуклеотидную последовательность gRNA любой из SEQ ID N0: 14 9315, 321-323 и 326-329.
[00153] Если не указано иное, научные и технические термины, используемые применительно к настоящему изобретению, должны иметь значения, которые обычно понимаются специалистами в данной области. Например, любые цифровые или словесные обозначения на иллюстрациях и методики, используемые применительно к клеточной и тканевой культуре, молекулярной биологии, иммунологии, микробиологии, генетике и химии и гибридизации белка и нуклеиновых кислот, описанные в данном документе, являются такими, которые хорошо известны и обычно используются в данной области. Смысл и объем терминов должны быть четкими и понятными; в случае, однако, любой скрытой двусмысленности, определения, представленные в данном документе, превалируют над любым словарным или внешним определением. Кроме того, если иное не требуется по контексту, термины единственного
числа включают множественное число, а термины множественного числа включают единственное число. 2. Система CRISPR
[00154] Система CRISPR представляет собой нуклеазную систему микроорганизмов, вовлечена в защиту от встраивающихся фагов и плазмид, что обеспечивает форму приобретенного иммунитета. Локусы CRISPR в микробных хозяевах могут содержать комбинацию CRISPR-ассоциированных (Cas) генов, а также элементов некодирующей РНК, способных программировать специфичность CRISPR-опосредованного расщепления нуклеиновой кислоты. Короткие сегменты чужеродной ДНК, называемые спейсерами, включаются в состав генома между повторами CRISPR и служат в качестве "памяти" о прошлых воздействиях. Cas 9 образует комплекс с 3'-концом одиночной направляющей РНК ("sgRNA"), а пара белок-РНК распознает свою геномную мишень посредством комплементарного спаривания оснований между 5'-концом последовательности sgRNA и предварительно определенной последовательностью ДНК размером 2 0 п. о., известной как протоспейсер. Этот комплекс направлен на гомологичные локусы патогенной ДНК через области, кодируемые в РНК CRISPR ("crRNA"), то есть протоспейсеры и мотивы, смежные с протоспейсером (РАМ), в патогенном геноме. Некодирующая матрица CRISPR транскрибируется и расщепляется в пределах прямых повторов на короткие crRNA, содержащие отдельные спейсерные последовательности, которые направляют Cas-нуклеазы в целевой сайт (протоспейсер). Путем простого обмена последовательности распознавания размером 2 0 п. о. экспрессированной химерной sgRNA нуклеазу Cas9 можно направлять на новые мишени в геноме. Спейсеры CRISPR используют для распознавания и сайленсинга экзогенных генетических элементов с помощью способа, аналогичного RNAi у эукариотических организмов.
[00155] Известны три класса систем CRISPR (эффекторные системы типов I, II и III). Эффекторная система типа II осуществляет двухнитевой разрыв в целевой ДНК на четырех последовательных стадиях с использованием одного эффекторного фермента Cas9 для расщепления dsDNA. По сравнению с эффекторными системами типа I и типа III, для которых требуется несколько
различных эффекторов, действующих как в виде комплекса, эффекторная система типа II может функционировать в альтернативной среде, такой как эукариотические клетки. Эффекторная система типа II состоит из длинной npe-crRNA, которая транскрибируется из спейсер-содержащего локуса CRISPR, белка Cas9 и tracrRNA, которая участвует в процессинге npe-crRNA. tracrRNA гибридизируются с областями повторов, разделяющими спейсеры npe-crRNA, инициируя тем самым расщепление dsRNA с помощью эндогенной РНКазы III. Это расщепление сопровождается вторым событием расщепления внутри каждого спейсера Cas9, производя зрелые crRNA, которые остаются связанными с tracrRNA и Cas9, образуя комплекс Cas9:crRNA-tracrRNA.
[00156] Было показано, что сконструированная форма эффекторной системы типа II из Streptococcus pyogenes функционирует в клетках человека для конструирования генома. В этой системе белок Cas9 направляли на целевые сайты в геноме с помощью синтетически восстановленной "направляющей РНК" ("gRNA", также используемой в данном документе взаимозаменяемо как химерная sgRNA, которая для Cas9 представляет собой слитую конструкцию crRNA-tracrRNA, что устраняет необходимость в РНКазе III и процессинге crRNA в целом.
[00157] Комплекс Cas9:crRNA-tracrRNA раскручивает ДНК-
дуплекс и ищет последовательности, соответствующие crRNA, для
расщепления. Распознавание мишени происходит при выявлении
комплементарности между последовательностью "протоспейсера" в
последовательности целевой ДНК и оставшейся спейсерной
последовательности в crRNA. Cas9 опосредует расщепление целевой
ДНК, если на 3'-конце протоспейсера также присутствует мотив,
смежный с протоспейсером (РАМ). Для нацеливания на протоспейсер
последовательность должна непосредственно сопровождаться
мотивом, смежным с протоспейсером (РАМ), короткой
последовательностью, распознаваемой нуклеазой Cas9, которая требуется для расщепления ДНК. Различные системы типа II имеют разные требования к РАМ. Система CRISPR из S. pyogenes может иметь последовательность РАМ для этой Cas9 (SpCas9) в виде 5'-
NRG-3', где R представляет собой А или G и характеризует специфичность этой системы в клетках человека. Уникальной способностью системы на основе CRISPR/Cas9 является эффективная способность одновременно нацеливаться на несколько различных геномных локусов путем совместной экспрессии одного белка Cas9 с двумя или более sgRNA. Например, система типа II из Streptococcus pyogenes в естественных условиях предпочитает применение последовательности "NGG", где "N" может быть любым нуклеотидом, но также принимает другие последовательности РАМ, такие как "NAG", в сконструированных системах (Hsu et al. (2013) Nature Biotechnology, 31, 827-832) . Аналогично Cas9, полученная из Neisseria meningitidis (NmCas9), как правило, имеет нативный РАМ из NNNNGATT, но имеет активность со множеством РАМ, включая РАМ NNNNGNNN с высокой степенью вырожденности (Esvelt et al. Nature Methods (2013) doi:10.1038/nmeth.2681). 3. Система на основе CRISPR/Cas9
[1] В данном документе представлены системы CRISPR/Cas9, включающие в себя оптимизированную gRNA, такую как шпилечная gRNA (также называемую в данном документе "hpgRNA" или "hp-gRNA"), которые позволяют улучшить нацеливание на ДНК для применения в эпигемном редактировании и регуляции транскрипции, как, например, в частности, расщепление представляющей интерес целевой области, такой как целевой ген, или активация или репрессия экспрессии целевого гена. Оптимизированные gRNA обеспечивают повышенную специфичность связывания с мишенью, уменьшая в то же время нецелевое связывание и нецелевую активность систем на основе CRISPR/Cas9 и CRISPR/Cpfl путем модулирования времени нахождения в нецелевых местоположениях с тем, чтобы минимизировать любую активность в этих нецелевых сайтах.
[2] Оптимизированная gRNA может модулировать активности Саэ9-слитого белка путем модулирования времени нахождения Cas9 в этих местоположениях и модулирования общей кинетики встраивания без учета активности второго домена. Кроме того, связывание gRNA с протоспейсером на 5'-конце нацеливающего на протоспейсер сегмента также может быть связано с расщеплением за счет Cas9.
Снижение связывания с нецелевыми сайтами ограничивало бы потенциал полного встраивания/расщепления в этих нецелевых сайтах. Было показано, что разработанная форма эффекторной системы типа II из Streptococcus pyogenes функционирует в клетках человека для конструирования генома. В этой системе белок Cas9 направляли на геномные целевые сайты с помощью синтетически восстановленной "направляющей РНК" ("gRNA", также используемой в данном документе взаимозаменяемо как химерная одиночная направляющая РНК ("sgRNA") ) , которая для Cas9 представляет собой слитую конструкцию crRNA-tracrRNA, которая устраняет необходимость в РНКазе III и процессинге crRNA в целом. В данном документе представлены системы на основе CRISPR/Cas9 для применения в редактировании генома и лечении генетических заболеваний. Системы на основе CRISPR/Cas9 могут быть сконструированы для нацеливания на любой ген, в том числе гены, вовлеченные в генетическое заболевание, старение, регенерацию тканей или заживление ран. Системы на основе CRISPR/Cas9 могут включать в себя белок Cas9 или слитый белок Cas9 и по меньшей мере одну оптимизированную gRNA, как описано ниже. Слитый белок Cas9 может, например, включать в себя домен с активностью, отличающейся от той, которая является эндогенной для Cas9, такой как домен трансактивации.
[00158] Целевой ген может иметь мутацию, такую как мутация со сдвигом рамки или нонсенс-мутация. Если целевой ген имеет мутацию, которая является причиной преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга, то система на основе CRISPR/Cas9 может быть сконструирована для распознавания и связывания нуклеотидной последовательности выше или ниже преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга. Система на основе CRISPR-Cas9 может быть также использована для разрушения нормального сплайсинга гена путем целенаправленного воздействия на акцепторы и доноры сплайсинга, чтобы вызвать пропуск преждевременных стоп-кодонов или восстановить поврежденную рамку считывания. Система на
основе CRISPR/Cas9 может опосредовать или не опосредовать нецелевые изменения в кодирующих белок областях генома. 1. Cas9
[00159] Система на основе CRISPR/Cas9 может включать в себя белок Cas9 или слитый белок Cas9. Белок Cas9 представляет собой эндонуклеазу, которая расщепляет нуклеиновую кислоту и кодируется локусами CRISPR, и принимает участие в системе CRISPR типа II. Белок Cas9 может быть из любых видов бактерий или архей, например Streptococcus pyogenes. Белок Cas 9 может быть мутирован таким образом, что нуклеазная активность инактивирована. Инактивированный белок Cas9 из Streptococcus pyogenes (iCas9, также называемый "dCas9") без эндонуклеазной активности ранее нацеливали на гены в клетках бактерий, дрожжей и человека с помощью gRNA для сайленсинга экспрессии генов посредством стерических затруднений. Оба используемых в данном документе термина "iCas9" и "dCas9" относятся к белку Cas9, который имеет аминокислотные замены D10A и Н8 4 0А и характеризуется инактивированной нуклеазной активностью. В некоторых вариантах осуществления можно использовать инактивированный белок Cas9 из Neisseria meningitides, такой как NmCas9. Например, система на основе CRISPR/Cas9 может включать в себя iCas9 под SEQ ID N0: 1.
ii. Слитый белок Cas9
[3] Система на основе CRISPR/Cas9 может включать в себя слитый белок из белка Cas9, который не обладает нуклеазной активностью, такого как dCas9, и второго домена. Второй домен может включать в себя домен активации транскрипции, такой как домен VP64 или домен рЗОО, домен репрессии транскрипции, такой как домен KRAB, нуклеазный домен, домен фактора освобождения транскриптов, домен модификации гистонов, домен ассоциации нуклеиновых кислот, ацетилазный домен, деацетилазный домен, метилазный домен, такой как домен ДНК-метилазы, деметилазный домен, домен фосфорилирования, домен убиквитинилирования или домен сумоилирования. Второй домен может быть модификатором метилирования ДНК или петлеобразования хроматина.
[00160] В некоторых вариантах осуществления слитый белок
может включать домен dCas9 и активатор транскрипции. Например, слитый белок может включать в себя аминокислотную последовательность под SEQ ID N0: 2. В других вариантах осуществления слитый белок может включать в себя домен dCas9 и репрессор транскрипции. Например, слитый белок содержит аминокислотную последовательность под SEQ ID N0:3. В дополнительных аспектах слитый белок может включать в себя домен dCas9 и сайт-специфическую нуклеазу, которая отличается от нуклеазы Cas9 по активности.
[00161] Слитый белок может содержать два гетерологичных полипептидных домена, где первый полипептидный домен содержит белок Cas, а второй полипептидный домен не обладает нуклеазной активностью. Слитый белок может включать в себя белок Cas9 или мутированный белок Cas9, как описано выше, гибридизированный со вторым полипептидным доменом, который обладает нуклеазной активностью. Второй полипептидный домен может обладать нуклеазной активностью, которая отличается от нуклеазной активности белка Cas9. Нуклеазой или белком, обладающим нуклеазной активностью, является фермент, способный расщеплять фосфодиэфирные связи между нуклеотидными субъединицами нуклеиновых кислот. Нуклеазы обычно дополнительно разделяют на эндонуклеазы и экзонуклеазы, хотя некоторые из ферментов могут попадать в обе категории. Хорошо известными нуклеазами являются дезоксирибонуклеаза и рибонуклеаза.
(1) Система активации генов на основе CRISPR/Cas9 [4] Система на основе CRISPR/Cas9 может представлять собой систему активации генов на основе CRISPR/Cas9, которая может активировать функцию регуляторных элементов с исключительной специфичностью эпигеномного редактирования. Систему активации генов на основе CRISPR/Cas9 можно использовать для скрининга энхансеров, инсуляторов, сайленсеров и областей контроля локуса, на которые можно нацеливаться для увеличения или уменьшения экспрессии целевого гена. Эту технологию можно использовать для закрепления функции за предполагаемыми регуляторными элементами, идентифицированными с помощью геномных исследований, таких как проекты ENCODE и Roadmap Epigenomics.
[5] Система активации генов на основе CRISPR/Cas9 может активировать экспрессию гена путем модификации метилирования ДНК, петлеобразования хроматина или катализа ацетилирования лизина 27 гистона НЗ на его целевых сайтах, что приводит к устойчивой активации транскрипции целевых генов за счет промоторов и проксимальных и дистальных энхансеров. Система активации генов на основе CRISPR/Cas9 является высокоспецифичной и может нацеливаться на целевой ген с использованием только одной направляющей РНК. Система активации генов на основе CRISPR/Cas9 может активировать экспрессию одного гена или семейства генов путем нацеливания на энхансеры в дистальных местоположениях в геноме.
(a) Белок гистон-ацетилтрансфераза (HAT)
[6] Система активации генов на основе CRISPR/Cas9 может включать в себя белок гистон-ацетилтрансферазы, такой как белок рЗОО, CREB-связывающий белок (СВР, аналог рЗОО), GCN5 или PCAF или их фрагмент. Ацетилирование гистонов в регуляторных элементах с использованием программируемого слитого белка на основе CRISPR/Cas9 представляет собой эффективную стратегию увеличения экспрессии генов-мишеней. Гистон-ацетилтрансфераза на основе CRISPR/Cas9, которая может быть нацелена на любой сайт в геноме, характеризуется уникальной способностью активировать дистальные регуляторные элементы. Белок гистон-ацетилтрансфераза может включать в себя белок рЗОО человека или его фрагмент. Белок гистон-ацетилтрансферазы может включать в себя дикий тип белка рЗОО человека, или мутантный белок рЗОО человека, или их фрагменты. Белок гистон-ацетилтрансфераза может включать в себя коровый лизин-ацетилтрансферазный домен белка рЗОО человека, то есть ядро HAT рЗОО (также известное как "рЗОО Соге").
(b) Система активации CRISPR/'dCas9P300 Core
[7] Белок рЗОО регулирует активность многих генов в тканях во всем организму. Белок рЗОО играет роль в регуляции роста и деления клеток, побуждая клетки созревать и принимать специализированные функции (дифференцироваться) и предупреждая рост злокачественных опухолей. Белок рЗОО может активировать транскрипцию путем связывания факторов транскрипции с комплексом
белков, которые осуществляют транскрипцию в ядре клетки. Белок рЗОО также функционирует как гистон-ацетилтрансфераза, которая регулирует транскрипцию посредством ремоделирования хроматина.
[8] Гибридный белок dCas9p300 Соге является высокоактивным и легко программируемым инструментом для искусственного манипулирования ацетилированием в целевых эндогенных локусах, что приводит к регуляции генов, контролируемых проксимальным и дистальным энхансерами. рЗОО Core ацетилирует лизин 27 на гистоне НЗ (НЗК27ас) и может обеспечить накопление НЗК27ас. Гибридизация каталитического корового домена рЗОО с dCas9 может приводить к значительно более высокой трансактивации расположенных ниже генов, чем непосредственная гибридизация полноразмерного белка рЗОО, несмотря на устойчивую экспрессию белка. Слитый белок dCas9p300 Соге также может проявлять повышенную способность к трансактивации по сравнению с dCas9vp64, в том числе в контексте каркаса №n-dCas9, особенно в областях дистального энхансера, в которых dCas9vp64 демонстрирует незначительную, если таковая имеется, измеримую ниже транскрипционную активность. Кроме того, dCas9p300 Соге демонстрирует точную и устойчивую специфичность транскрипции по всему геному. dCas9p300 Соге может быть способным к мощной активации транскрипции и одновременному накоплению ацетилирования в промоторах, на которые нацелен эпигенетически модифицированный энхансер.
[9] dCas9p300 Соге может активировать экспрессию генов с помощью одиночной gRNA, которая нацеливается на промотор и/или охарактеризованный энхансер и связывает их. Эта технология также дает возможность синтетически трансактивировать дистальные гены из предполагаемых и известных регуляторных областей и упрощает трансактивацию посредством применения одного программируемого эффектора и одного целевого сайта. Эти возможности обеспечивают возможность мультиплексирования для одновременного нацеливания на несколько промоторов и/или энхансеров. рЗОО, полученный от млекопитающих, может обеспечить преимущества над эффекторными доменами, полученными из вирусов, для применений in vivo путем минимизации потенциальной иммуногенности.
[10] Активация генов с помощью dCas9p30CbCore является
высокоспецифичной для целевого гена. В некоторых вариантах осуществления рЗОО Core включает в себя аминокислоты 1048-1664 из SEQ ID N0: 2 (т. е. SEQ ID N0: 4) . В некоторых вариантах осуществления система активации генов на основе CRISPR/Cas9 включает в себя слитый белок dCas9p300 Соге под SEQ ID N0: 2 или слитый белок Mn-dCas9P300 Соге под SEQ ID N0: 5.
(2) Система репрессии генов на основе CRISPR/Cas9 [11] Система на основе CRISPR/Cas9 может представлять собой систему репрессии генов на основе CRISPR/Cas9, которая может ингибировать функцию регуляторных элементов с исключительной специфичностью эпигеномного редактирования. В некоторых вариантах осуществления система репрессии генов на основе CRISPR/Cas9, такая как включающая в себя dCas9KRAB, может оказывать влияние на активность дистального энхансера путем высокоспецифического ремоделирования эпигенетического состояния целевых генетических локусов.
(а) Система репрессии генов CRISPR/'d.CasS> KRRB
[12] Репрессор dCas9KRAB представляет собой высокоспецифичный инструмент для эпигеномного редактирования, который может использоваться в скринингах с потерей функции для изучения функции генов и обнаружения мишеней для разработки лекарственных средств. dCas9KRAB характеризуется исключительной специфичностью нацеливания на конкретный энхансер, осуществляет сайленсинг только целевых генов этого энхансера и создает репрессивное гетерохроматиновое окружение в этом сайте. dCas9-KRAB можно использовать для скрининга новых регуляторных элементов в эндогенном геномном контексте путем сайленсинга проксимальных или дистальных регуляторных элементов и соответствующих генных мишеней. Специфичность репрессоров dCas9-KRAB позволяет использовать их из-за специфичности по всему транскриптому для сайленсинга эндогенных генов. Эпигенетические механизмы нарушения в целевом локусе, такие как метилирование гистонов.
[13] Домен KRAB, общий гетерохроматин-образующий мотив во встречающихся в природе факторах транскрипции типа "цинковые пальцы", был генетически связан с dCas9 для создания РНК-нацеливаемого синтетического репрессора, dCas9KRAB. Kruppel
ассоциированный бокс ("KRAB") привлекает гетерохроматин-образующие факторы: Kapl, НР1, SETDB1, NuRD. Он индуцирует триметилирование НЗКО, деацетилирование гистонов. Синтетические репрессоры на основе KRAB могут вызывать эффективный сайленсинг экспрессии отдельных генов, и их использовали для репрессии онкогенов, ингибирования репликации вирусов и лечения доминантно-негативных заболеваний.
4. Система на основе CRISPR/Cpfl
[00162] Раскрытая оптимизированная gRNA может
использоваться с системой коротких палиндромных повторов,
регулярно расположенных группами, из Prevotella и Francisella 1
или ("CRISPR/Cpf1"). Система CRISPR/Cpfl, технология
редактирования ДНК, аналогичная системе CRISPR/Cas9, обнаружена в бактериях Prevotella и Francisella и предотвращает генетические повреждения, вызываемые вирусами. Cpfl представляет собой РНК-направляемую эндонуклеазу системы CRISPR/Cas класса II, содержащей белок из 1300 аминокислот. Гены Cpfl ассоциированы с локусом CRISPR, кодирующим эндонуклеазу, которая использует направляющую РНК для нахождения и расщепления вирусной ДНК. Cpfl представляет собой более мелкую и более простую эндонуклеазу, чем Cas9, и имеет молекулу sgRNA меньшего размера (примерно в два раза меньше нуклеотидов по сравнению с Cas9), поскольку функционально Cpfl не нуждается в tracrRNA и требуется только crRNA. Примеры Cpfl, которую можно использовать с оптимизированной gRNA, включают Cpfl из бактерий Acidaminococcus и Lachnospiraceae.
[00163] Локусы Cpfl кодируют белки Casl, Cas2 и Cas4, которые характеризуются большей схожестью с такими белками системы типа I и III, чем типа II. Локус Cpfl содержит смешанный альфа/бета-домен RuvC-I, после которого следуют спиральная область RuvC-II и домен, подобный домену типа "цинковые пальцы". Белок Cpfl имеет RuvC-подобный эндонуклеазный домен, который подобен RuvC-домену Cas9. Cpfl не имеет эндонуклеазного домена HNH, а на N-конце Cpfl отсутствует альфа-спиральный блок распознавания Cas9. Структура домена Cpfl CRISPR-Cas показывает, что Cpfl является функционально уникальным, и классифицируется
как система CRISPR типа V класса 2.
[00164] Система CRISPR/Cpfl состоит из фермента Cpfl и направляющей РНК, которая находит и располагает комплекс в точном месте на двойной спирали для расщепления целевой ДНК. В механизме активности систем CRISPR/Cpfl выделяют три стадии: адаптацию, образование crRNA и интерференцию. На стадии адаптации белки Casl и Cas2 облегчают адаптацию небольших фрагментов ДНК к комплексу CRISPR. Стадия образования crRNA включает процессинг npe-cr-RNA с получением зрелых crRNA для направления белка Cas. На стадии интерференции Cpfl связывается с crRNA с образованием бинарного комплекса для идентификации и расщепления последовательности целевой ДНК.
[00165] Комплекс Cpfl-crRNA расщепляет целевую ДНК или РНК путем идентификации мотива, смежного с протоспейсером, 5'-YTN-3' (где "Y" представляет собой пиримидин, a "N" представляет собой любое нуклеотидное основание) или 5'-TTN-3', в отличие от богатого G РАМ, на который нацеливается Cas9. РАМ, на который нацеливается Cpfl, расположен на 5'-стороне направляющей РНК в отличие от РАМ, на который нацеливается Cas9, который расположен на 3'-стороне направляющей РНК. После идентификации РАМ Cpfl осуществляет двухнитевой разрыв ДНК, содержащий подобные липким выступающие концы из 4-х или 5 нуклеотидов, в отличие от разрезов, которые осуществляет Cas9, оставляя тупые концы, повышая тем самым эффективность генетических вставок и специфичности во время NHEJ или HDR. TTN-сайты РАМ являются более применимым для геномной инженерии человека, чем GGN-сайты РАМ, поскольку геном человека в значительно степени более богат по содержанию Т, чем по содержанию G. Нацеливающий на протоспейсер сегмент gRNA для Cpfl находится на ее крайнем 3'-конце, тогда как gRNA Cas9 находятся на ее крайнем 5'-конце.
5. gRNA
[00166] Система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl может включать в себя по меньшей мере одну gRNA, такую как оптимизированная gRNA, описываемая в данном документе, которая нацеливается на последовательность нуклеиновой кислоты. Эта gRNA обеспечивает специфическое нацеливание системы на
основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl на целевую область или целевой ген. Для системы на основе CRISPR/Cas9 gRNA является слитой конструкцией из двух некодирующих РНК: crRNA и tracrRNA. gRNA или sgRNA может нацеливаться на любую требуемую последовательность ДНК путем обмена последовательности, кодирующей протоспейсер размером 20 п. о., который обеспечивает специфичность нацеливания, путем комплементарного спаривания оснований с требуемой целевой ДНК. gRNA имитирует встречающийся в природе дуплекс crRNA:tracrRNA, принимающий участие в эффекторной системе типа II. Этот дуплекс, который может включать, например, 42-нуклеотидную crRNA и 7 5-нуклеотидную tracrRNA, действует как направляющий для Cas9 для расщепления целевой нуклеиновой кислоты. gRNA может нацеливаться на целевую область целевого гена и связываться с ней. Для системы на основе CRISPR/Cpfl gRNA представляет собой crRNA.
[00167] Система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl может включать в себя по меньшей мере одну gRNA, такую как оптимизированная gRNA, описываемая в данном документе, где gRNA нацеливаются на различные последовательности ДНК. Целевые последовательности ДНК могут быть перекрывающимися. После целевой последовательности или протоспейсера следует последовательность РАМ на 3'-конце протоспейсера. Различные системы типа II имеют разные требования к РАМ. Например, в системе типа II из Streptococcus pyogenes используется последовательность "NGG", где "N" может представлять собой любой нуклеотид.
б. Способы получения оптимизированной направляющей РНК (gRNA)
[00168] Настоящее раскрытие направлено на способы получения оптимизированных gRNA, таких как шпилечные gRNA (также называемые в данном документе "hpgRNA" и "hp-gRNA"). Оптимизированная gRNA включает в себя нуклеотидную последовательность полноразмерной gRNA и нуклеотиды, добавленные на 5'-конце или 3'-конце полноразмерной gRNA. В некоторых вариантах осуществления полноразмерная gRNA может быть сконструирована с использованием такой программы, как SgRNA
designer, CRISPR MultiTargeter или SSFinder. Нуклеотиды, добавленные к 5'-концу для системы CRISPR/Cas9 или к 3'-концу для системы CRISPR/Cpfl полноразмерной gRNA, могут образовывать вторичные структуры путем гибридизации или частичной гибридизации с нуклеотидами в нацеливающейся на протоспейсер последовательности полноразмерной gRNA. Вторичная структура модулирует связывание или расщепление ДНК, нарушая встраивание gRNA в ДНК-дуплекс. Вторичная структура оказывает влияние на кинетику встраивания gRNA, а не на энергию связывания gRNA с комплементарной нитью ДНК. Как описано в приведенных ниже примерах, направляющие РНК систем CRISPR-Cas типа II связываются с протоспейсерами посредством процесса, обеспечиваемого Cas9, известного как "встраивание нити", где сам белок Cas9 сначала связывается с мотивом, смежным с протоспейсером (РАМ), и расплавляет его путем непосредственных взаимодействий с последующим спариванием оснований 3'-конца gRNA с прилегающими к РАМ нуклеотидами ("затравочной" областью), продолжая затем спаривание оснований нуклеотид за нуклеотидом от 3'- до 5'-конца gRNA с протоспейсером. Аналогичные механизмы используются с системой CRISPR/Cpfl.
[00169] Нуклеотиды, добавленные к 5'-концу или 3'-концу полноразмерной gRNA, не просто добавляются для гибридизации с нацеливающимся на протоспейсер сегментом направляющей РНК
(шпильки), а чтобы блокировать доступ к протоспейсеру при термодинамическом равновесии. Как описано в примерах, равновесные термодинамические свойства вторичной структуры
(такие как температура плавления вторичной структуры gRNA) вовсе
не коррелируют со специфичностью направляющей РНК. Скорее, в
случае расщепления и при последующей программируемой работе для
связывания Cas9 (как измерено с помощью ChlP-Seq в клетках (см.
doi:10.1038/nbt.2916; doi:10.1038/nbt.2889)) существует
значительная и существенная корреляция между ними и оценкой кинетики встраивания нити, а также структурой, конкструированием и функцией направляющих РНК, которые модулируют встраивание нити в протоспейсер, которые обязательно отличаются от шпилек, предназначенных для термодинамической конкуренции за связывание
в равновесии с целевыми и нецелевыми сайтами. Например, элементы
вторичной структуры, которые сконструированы для того, чтобы
быть стабильными в равновесии (такие как РНК, которая образует
подобную шпильке структуру, содержащую внутренние неоднозначные
пары rG-rU в пределах стебля), могут быстро дестабилизироваться
в ходе встраивания нити (например, когда неоднозначные пары rG-
rU становятся терминальной парой оснований структуры стебля,
поскольку соседние нуклеотиды встраиваются в протоспейсер, что
приводит к значительному энергетическому ухудшению в отношении
вторичной структуры РНК, модулируя встраивание нити и кинетику
связывания при помощи полностью отдельного механизма, а не
просто блокируя доступ к протоспейсеру при термодинамическом
равновесии. Вторичные структуры, которые стабильны в равновесии,
но быстро дестабилизируются в ходе встраивания нити, можно
сконструировать с использованием способов, описанных в данном
документе, таким образом, чтобы они различали целевые и
нецелевые сайты с минимальными термодинамическими
энергетическими различиями между сайтами (в результате одиночного внутреннего ошибочного спаривания, скажем), которые нельзя различить на практике с помощью цис-блокирующей или термодинамической конкуренции. Когда встраивание в целевой сайт дестабилизирует шпильку, содержащую неоднозначные пары G-U, сайты различают кинетически при встраивании. Например, сайты VEGFA1, описанные в примерах ниже (целевым сайтом является GGGTGGGGGGAGTTTGCTCC, а нецелевым сайтом 2 является GGATGGAGGGAGTTTGCTCC; ошибочные спаривания подчеркнуты), были способны уменьшить нецелевое расщепление на 93% и 98% по сравнению со стандартной или полноразмерной направляющей РНК или усеченной направляющей РНК соответственно, с использованием сконструированных вычислительным путем вторичных структур, которые учитывают встраивание нити.
[00170] Кроме того, нуклеотиды могут быть добавлены к 5'-концу или 3'-концу полноразмерной gRNA для разрушения "встречающейся в природе" вторичной структуры нацеливающегося на протоспейсер сегмента gRNA в "затравочной" области для усиления инициации встраивания нити направляющей РНК. Следовательно,
добавление этих нуклеотидов, которые образуют вторичные структуры, что изменяет встраивание нити путем гибридизации частично гибридизирующихся нуклеотидов в нацеливающейся на протоспейсер последовательности для модулирования связывания или расщепления ДНК, представляют собой другой класс модификации направляющей РНК.
[00171] Оптимизированные gRNA предназначены для минимизации
связывания на нецелевом сайте и обеспечения возможности
связывания с последовательностью протоспейсера. В некоторых
вариантах осуществления нецелевой сайт является известным или
прогнозируемым нецелевым сайтом. В некоторых вариантах
осуществления способ предусматривает: идентификацию
представляющей интерес целевой области, при этом представляющая
интерес целевая область содержит последовательность
протоспейсера; определение полинуклеотидной последовательности
полноразмерной gRNA, которая нацеливается на представляющую
интерес целевую область, при этом полноразмерная gRNA содержит
нацеливающиеся на протоспейсер последовательность или сегмент;
определение по меньшей мере одного или нескольких нецелевых
сайтов для полноразмерной gRNA; получение полинуклеотидной
последовательности первой gRNA, при этом первая gRNA содержит
полинуклеотидную последовательность полноразмерной gRNA и
сегмент РНК, при этом сегмент РНК содержит полинуклеотидную
последовательность, имеющую М нуклеотидов в длину, которая
комплементарна нуклеотидному сегменту нацеливающихся на
протоспейсер последовательности или сегменту, при этом РНК
расположена на 5'-конце полинуклеотидной последовательности
полноразмерной gRNA, при этом первая gRNA необязательно содержит
линкер между 5'-концом полинуклеотидной последовательности
полноразмерной gRNA и сегментом РНК, при этом линкер содержит
полинуклеотидную последовательность, имеющую N нуклеотидов в
длину, при этом первая gRNA способна встраиваться в
последовательность протоспейсера, и связываться с
последовательностью ДНК, которая комплементарна
последовательности протоспейсера, и образовывать дуплекс с протоспейсером, и при этом первая gRNA способна встраиваться в
нецелевой сайт, и связываться с последовательностью ДНК, которая
комплементарна нецелевому сайту, и образовывать нецелевой
дуплекс; вычисление оценочного показателя или вычислительное
моделирование кинетики встраивания и времени нахождения, в
течение которого gRNA остается встроенной в дуплексы
протоспейсера и нецелевого сайта, где динамику встраивания
оценивают нуклеотид за нуклеотидом путем определения
энергетических различий между дополнительным встраиванием
отличающейся gRNA и повторным отжигом первой gRNA на
последовательности ДНК, которая комплементарна
последовательности протоспейсера; сравнение значений
предполагаемого времени нахождения в сайтах протоспейсера и/или нецелевых сайтах первой gRNA со значениями предполагаемого времени нахождения полноразмерной gRNA или усеченной gRNA (tru-gRNA) в сайтах протоспейсера и/или нецелевых сайтах; рандомизацию от 0 до N нуклеотидов в линкере и от 0 до М нуклеотидов в первой gRNA, и получение второй gRNA, и повторение стадии (е) со второй gRNA; идентификацию оптимизированной gRNA на основе последовательности gRNA, которая удовлетворяет критериям конструирования; и тестирование оптимизированной gRNA in vivo для определения специфичности связывания.
[00172] В некоторых вариантах осуществления способ
предусматривает: идентификацию представляющей интерес целевой
области, при этом представляющая интерес целевая область
содержит последовательность протоспейсера; определение
полинуклеотидной последовательности полноразмерной gRNA, которая нацеливается на представляющую интерес целевую область, при этом полноразмерная gRNA содержит нацеливающиеся на протоспейсер последовательность или сегмент; определение по меньшей мере одного или нескольких нецелевых сайтов для полноразмерной gRNA; получение полинуклеотидной последовательности первой gRNA, при этом первая gRNA содержит полинуклеотидную последовательность полноразмерной gRNA и сегмент РНК, при этом сегмент РНК содержит полинуклеотидную последовательность, имеющую М нуклеотидов в длину, которая комплементарна нуклеотидному сегменту нацеливающихся на протоспейсер последовательности или сегменту,
при этом РНК расположена на 3'-конце полинуклеотидной
последовательности полноразмерной gRNA, при этом первая gRNA
необязательно содержит линкер между 3'-концом полинуклеотидной
последовательности полноразмерной gRNA и сегментом РНК, при этом
линкер содержит полинуклеотидную последовательность, имеющую N
нуклеотидов в длину, при этом первая gRNA способна встраиваться
в последовательность протоспейсера, и связываться с
последовательностью ДНК, которая комплементарна
последовательности протоспейсера, и образовывать дуплекс с
протоспейсером, и при этом первая gRNA способна встраиваться в
нецелевой сайт, и связываться с последовательностью ДНК, которая
комплементарна нецелевому сайту, и образовывать нецелевой
дуплекс; вычисление оценочного показателя или вычислительное
моделирование кинетики встраивания и значений времени
нахождения, в течение которого gRNA остается встроенной в
дуплексы протоспейсера и нецелевого сайта, где динамику
встраивания оценивают нуклеотид за нуклеотидом путем определения
энергетических различий между дополнительным встраиванием
отличающейся gRNA и повторным отжигом первой gRNA на
последовательности ДНК, которая комплементарна
последовательности протоспейсера; сравнение значений
предполагаемого времени нахождения в сайтах протоспейсера и/или нецелевых сайтах первой gRNA со значениями предполагаемого времени нахождения полноразмерной gRNA или усеченной gRNA (tru-gRNA) в сайтах протоспейсера и/или нецелевых сайтах; рандомизацию от 0 до N нуклеотидов в линкере и от 0 до М нуклеотидов в первой gRNA, и получение второй gRNA, и повторение стадии (е) со второй gRNA; идентификацию оптимизированной gRNA на основе последовательности gRNA, которая удовлетворяет критериям конструирования; и тестирование оптимизированной gRNA in vivo для определения специфичности связывания.
[00173] В некоторых вариантах осуществления энергетические балансы дополнительного встраивания отличающейся gRNA определяют путем определения энергетического баланса по меньшей мере одного из (I) нарушения спаривания оснований ДНК-ДНК, (II) образования пар оснований РНК-ДНК, (III) энергетического различия,
возникающего в результате разрушения или образования отличающейся вторичной структуры внутри не встроенной направляющей РНК, и (IV) образования или разрушения взаимодействий между вытесненной нитью ДНК, которая комплементарна протоспейсеру, и нуклеотидами любыми неспаренными нуклеотидами направляющей РНК, которые не вовлечены во вторичные структуры. В некоторых вариантах осуществления энергетический баланс повторного отжига первой gRNA с последовательностью ДНК, которая комплементарна последовательности протоспейсера, определяют путем определения энергетического баланса по меньшей мере одного из (I) образования пар оснований ДНК-ДНК, (II) разрушения пар оснований РНК-ДНК, (III) энергетического различия, возникающего в результате разрушения или образования отличающейся вторичной структуры внутри новой не встроенной направляющей РНК, и (IV) образования или разрушения взаимодействий между вытесненной нитью ДНК, которая комплементарна протоспейсеру, и любыми неспаренными нуклеотидами направляющей РНК, которые не вовлечены во вторичные структуры. В некоторых вариантах осуществления способ дополнительно предусматривает определение энергетических факторов по меньшей мере одного из (V) спаривания оснований среди ошибочных спариваний, (VI) взаимодействий с белком Cas9 и/или (VII) дополнительных эвристических показателей, где дополнительные эвристические показатели относятся к продолжительности связывания, степени встраивания, стабильности встраивающейся направляющей РНК или другим расчетным/моделируемым свойствам встраивания gRNA для расщепляющей активности Cas9.
[00174] В системе на основе CRISPR/Cas9 или системе на основе CRISPR/Cpfl можно использовать gRNA, такую как оптимизированная gRNA, описанная в данном документе, с различными последовательностями и длиной. В некоторых вариантах осуществления полноразмерная gRNA может содержать нацеливающийся на протоспейсер сегмент, который соответствует полинуклеотидной последовательности целевой ДНК (т. е. протоспейсеру). В некоторых вариантах осуществления нацеливающийся на протоспейсер сегмент может иметь по меньшей мере 10 нуклеотидов, по меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотидов,
меньшей
мере
нуклеотид,
меньшей
мере
нуклеотида,
меньшей
мере
нуклеотида,
меньшей
мере
нуклеотида,
меньшей
мере
нуклеотидов
, по меньшей мере
3 0 нуклеотидов
или по
меньшей мере 35 нуклеотидов. gRNA может нацеливаться по меньшей мере на одно из области промотора, области энхансера, области репрессора, области инсулятора, области сайленсера, области, вовлеченной в образование петли ДНК с промоторной областью, области сплайсинга гена или транскрибируемой области целевого гена. В некоторых вариантах осуществления полноразмерная gRNA содержит нацеливающийся на протоспейсер сегмент, имеющий от приблизительно 15 до 2 0 нуклеотидов.
[00175] В некоторых вариантах осуществления сегмент РНК
содержит от 2 до 2 0 нуклеотидов, от 3 до 10 нуклеотидов или от 5
до 8 нуклеотидов. В некоторых вариантах осуществления сегмент
РНК содержит от 2 до 2 0 нуклеотидов, от 3 до 10 нуклеотидов или
от 5 до 8 нуклеотидов, которые комплементарны
последовательности, нацеливающейся на протоспейсер. В некоторых вариантах осуществления М составляет от 1 до 20, от 1 до 19, от 1 до 18, от 1 до 17, от 1 до 16, от 1 до 15, от 1 до 14, от 1 до 13, от 1 до 12, от 1 до 11, от 1 до 10, от 1 до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 2 до 20, от 2 до 19, от 2 до 18, от 2 до 17, от 2 до 16, от 2 до 15, от 2 до 14, от 2 до 13, от 2 до 12, от 2 до 11, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2 до 5, от 3 до 20, от 3 до 19, от 3 до 18, от 3 до 17, от 3 до 16, от 3 до 15, от 3 до 14, от 3 до 13, от 3 до 12, от 3 до 11, от 3 до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до б, от 3 до 5, от 4 до 20, от 4 до 19, от 4 до 18, от 4 до 17, от 4 до 16, от 4 до 15, от 4 до 14, от 4 до 13, от 4 до 12, от 4 до 11, от 4 до 10, от 4 до 9, от 4 до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 19, от 5 до 18, от 5 до 17, от 5 до 16, от 5 до 15, от 5 до 14, от 5 до 13, от 5 до 12,
от 5 до 11, от 5 до 10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20, от б до 19, от б до 18, от б до 17, от б до 16, от б до 15, от б до 14, от б до 13, от б до 12, от б до 11, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до 20, от 7 до 19, от 7 до 18, от 7 до 17, от 7 до 16, от 7 до 15, от 7 до 14, от 7 до 13, от 7 до 12, от 7 до 11, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 19, от 8 до 18, от 8 до 17, от 8 до 16, от 8 до 15, от 8 до 14, от 8 до 13, от 8 до 12, от 8 до 11, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 19, от 9 до 18, от 9 до 17, от 9 до 16, от 9 до 15, от 9 до 14, от 9 до 13, от 9 до 12, от 9 до 11 или от 9 до 10. Например, М может составлять 1, 2, 3, 4, 5, б, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20. В некоторых вариантах осуществления сегмент РНК может иметь от 1 до 20, от 1 до 19, от 1 до 18, от 1 до 17, от 1 до 16, от 1 до 15, от 1 до 14, от 1 до 13, от 1 до 12, от 1 до 11, от 1 до 10, от 1 до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 2 до 20, от 2 до 19, от 2 до 18, от 2 до 17, от 2 до 16, от 2 до 15, от 2 до 14, от 2 до 13, от 2 до 12, от 2 до 11, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2 до 5, от 3 до 20, от 3 до 19, от 3 до 18, от 3 до 17, от 3 до 16, от 3 до 15, от 3 до
14, от 3 до 13, от 3 до 12, от 3 до 11, от 3 до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до б, от 3 до 5, от 4 до 20, от 4 до 19, от 4 до 18, от 4 до 17, от 4 до 16, от 4 до 15, от 4 до 14, от 4 до 13, от 4 до 12, от 4 до 11, от 4 до 10, от 4 до 9, от 4 до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 19, от 5 до 18, от 5 до 17, от 5 до 16, от 5 до 15, от 5 до 14, от 5 до 13, от 5 до 12, от 5 до 11, от 5 до 10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20, от б до 19, от б до 18, от б до 17, от б до 16, от б до 15, от б до 14, от б до 13, от б до 12, от б до 11, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до 20, от 7 до 19, от 7 до 18, от 7 до 17, от 7 до 16, от 7 до
15, от 7 до 14, от 7 до 13, от 7 до 12, от 7 до 11, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 19, от 8 до 18, от 8 до 17, от 8 до 16, от 8 до 15, от 8 до 14, от 8 до 13, от 8 до 12, от 8 до 11, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 19, от 9 до 18, от 9 до 17, от 9 до 16, от 9 до 15, от 9 до 14, от 9
14,
до 13, от 9 до 12, от 9 до 11 или от 9 до 10 нуклеотидов, некоторые или все из которых комплементарны нацеливающейся на протоспейсер последовательности. В некоторых вариантах осуществления сегмент РНК может иметь 1, 2, 3, 4, 5, б, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 2 0 нуклеотидов.
[00176] В некоторых вариантах осуществления N составляет от 1 до 20, от 1 до 19, от 1 до 18, от 1 до 17, от 1 до 16, от 1 до 15, от 1 до 14, от 1 до 13, от 1 до 12, от 1 до 11, от 1 до 10, от 1 до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 2 до 20, от 2 до 19, от 2 до 18, от 2 до 17, от 2 до 16, от 2 до 15, от 2 до 14, от 2 до 13, от 2 до 12, от 2 до 11, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2 до 5, от 3 до 20, от 3 до 19, от 3 до 18, от 3 до 17, от 3 до 16, от 3 до 15, от 3 до
14, от 3 до 13, от 3 до 12, от 3 до 11, от 3 до 10, от 3 до 9,
от 3 до 8, от 3 до 7, от 3 до 6, от 3 до 5, от 4 до 20, от 4 до
19, от 4 до 18, от 4 до 17, от 4 до 16, от 4 до 15, от 4 до 14,
от 4 до 13, от 4 до 12, от 4 до 11, от 4 до 10, от 4 до 9, от 4
до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 19,
от 5 до 18, от 5 до 17, от 5 до 16, от 5 до 15, от 5 до 14, от 5
до 13, от 5 до 12, от 5 до 11, от 5 до 10, от 5 до 9, от 5 до 8,
от 5 до 7, от 5 до б, от б до 20, от б до 19, от б до 18, от б
до 17, от б до 16, от б до 15, от б до 14, от б до 13, от б до
12, от б до 11, от б до 10, от б до 9, от б до 8, от б до 7, от
7 до 20, от 7 до 19, от 7 до 18, от 7 до 17, от 7 до 16, от 7 до
15, от 7 до 14, от 7 до 13, от 7 до 12, от 7 до 11, от 7 до 10,
от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 19, от 8 до 18, от 8
до 17, от 8 до 16, от 8 до 15, от 8 до 14, от 8 до 13, от 8 до
12, от 8 до 11, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 19,
от 9 до 18, от 9 до 17, от 9 до 16, от 9 до 15, от 9 до 14, от 9
до 13, от 9 до 12, от 9 до 11 или от 9 до 10. Например, N может
составлять 1, 2, 3, 4, 5, б, 7, 8, 9, 10, 11, 12, 13, 14, 15,
16, 17, 18, 19 или 20. В некоторых вариантах осуществления
линкер содержит от 1 до 2 0 нуклеотидов, от 3 до 10 нуклеотидов
или от 5 до 8 нуклеотидов. Например, линкер может иметь от 1 до
20, от 1 до 19, от 1 до 18, от 1 до 17, от 1 до 16, от 1 до 15,
от 1 до 14, от 1 до 13, от 1 до 12, от 1 до 11, от 1 до 10, от 1
до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 2 до 20, от 2 до 19, от 2 до 18, от 2 до 17, от 2 до 16, от 2 до 15, от 2 до 14, от 2 до 13, от 2 до 12, от 2 до 11, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2 до 5, от 3 до 20, от 3 до 19, от 3 до 18, от 3 до 17, от 3 до 16, от 3 до 15, от 3 до 14, от 3 до 13, от 3 до 12, от 3 до 11, от 3 до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до б, от 3 до 5, от 4 до 20, от 4 до 19, от 4 до 18, от 4 до 17, от 4 до 16, от 4 до 15, от 4 до 14, от 4 до 13, от 4 до 12, от 4 до 11, от 4 до 10, от 4 до 9, от 4 до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 19, от 5 до 18, от 5 до 17, от 5 до 16, от 5 до 15, от 5 до 14, от 5 до 13, от 5 до 12, от 5 до 11, от 5 до 10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20, от б до 19, от б до 18, от б до 17, от б до 16, от б до 15, от б до 14, от б до 13, от б до 12, от б до 11, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до 20, от 7 до 19, от 7 до 18, от 7 до 17, от 7 до 16, от 7 до 15, от 7 до 14, от 7 до 13, от 7 до 12, от 7 до 11, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 19, от 8 до 18, от 8 до 17, от 8 до 16, от 8 до 15, от 8 до 14, от 8 до 13, от 8 до 12, от 8 до 11, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 19, от 9 до 18, от 9 до 17, от 9 до 16, от 9 до 15, от 9 до 14, от 9 до 13, от 9 до 12, от 9 до 11 или от 9 до 10 нуклеотидов, некоторые или все из которых комплементарны нацеливающейся на протоспейсер последовательности. В некоторых вариантах осуществления линкер может иметь 1, 2, 3, 4, 5, б, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 2 0 нуклеотидов. В некоторых вариантах осуществления линкер может включать в себя стабилизирующий линкер, такой как тетрапетля. Примеры тетрапетли включают без ограничения ANYA, CUYG, GNRA, UMAC и UNCG.
[00177] В некоторых вариантах осуществления сегмент РНК и/или целенаправленно воздействующая на протоспейсер последовательность обеспечивает вторичную структуру. В некоторых вариантах осуществления вторичная структура образуется за счет частичной гибридизации целенаправленно воздействующей на протоспейсер последовательности с сегментом РНК. В некоторых вариантах осуществления вторичная структура модулирует
связывание или расщепление ДНК посредством Cas9 путем нарушения встраивания оптимизированной gRNA в дуплекс протоспейсера или нецелевой дуплекс. В некоторых вариантах осуществления вторичная структура сохраняет 5'-конец gRNA стабильным в белке и защищает оптимизированную gRNA в Cas9 с целью предотвращения разрушения.
[00178] В некоторых вариантах осуществления вторичная
структура образуется путем гибридизации всего или части сегмента
РНК с нуклеотидами на 5'-конце нацеливающихся на протоспейсер
последовательности или сегмента, нуклеотидами в середине
нацеливающихся на протоспейсер последовательности или сегмента,
и/или нуклеотидами на 3'-конце нацеливающихся на протоспейсер
последовательности или сегмента. В некоторых вариантах
осуществления сегменты, смежные по отношению к сегменту РНК,
гибридизируются с нацеливающимися на протоспейсер
последовательностью или сегментом. В некоторых вариантах осуществления сегменты, которые не являются смежными по отношению к сегменту РНК, гибридизируются с нацеливающимися на протоспейсер последовательностью или сегментом. В некоторых вариантах осуществления вторичная структура представляет собой шпильку.
[00179] В некоторых вариантах осуществления вторичная структура является стабильной при комнатной температуре или при 37°С. В некоторых вариантах осуществления общая равновесная свободная энергия вторичной структуры составляет менее приблизительно 2 ккал/моль при температуре от приблизительно 4°С до приблизительно 50°С, как, например, при комнатной температуре или при 37°С. Например, общая равновесная свободная энергия вторичной структуры может составлять менее приблизительно 10 ккал/моль, менее приблизительно 5 ккал/моль, менее приблизительно 4 ккал/моль, менее приблизительно 3 ккал/моль, менее приблизительно 2 ккал/моль, менее приблизительно 1 ккал/моль или менее приблизительно 0,5 ккал/моль при температуре от приблизительно 4°С до приблизительно 50°С, от приблизительно 4°С до приблизительно 4 0°С, от приблизительно 4°С до приблизительно 37°С, от приблизительно 4°С до приблизительно
30°С, от приблизительно 4°С до приблизительно 25°С, от приблизительно 4°С до приблизительно 2 0°С, от приблизительно 4°С до приблизительно 10°С, от приблизительно 5°С до приблизительно 50°С, от приблизительно 5°С до приблизительно 4 0°С, от приблизительно 5°С до приблизительно 37°С, от приблизительно 5°С до приблизительно 30°С, от приблизительно 5°С до приблизительно 25°С, от приблизительно 5°С до приблизительно 20°С, от приблизительно 5°С до приблизительно 10°С, от приблизительно 10°С до приблизительно 50°С, от приблизительно 10°С до приблизительно 4 0°С, от приблизительно 10°С до приблизительно 37°С, от приблизительно 10°С до приблизительно 30°С, от приблизительно 10°С до приблизительно 25°С, от приблизительно 10°С до приблизительно 2 0°С, от приблизительно 2 0°С до приблизительно 50°С, от приблизительно 2 0°С до приблизительно 4 0°С, от приблизительно 2 0°С до приблизительно 37°С, от приблизительно 20°С до приблизительно 30°С, от приблизительно 25°С до приблизительно 50°С, от приблизительно 25°С до приблизительно 40°С, от приблизительно 25°С до приблизительно 37°С или от приблизительно 2 5°С до приблизительно 3 0°С. В некоторых вариантах осуществления сегмент РНК гибридизируется или образует неканонические пары оснований по меньшей мере с двумя нуклеотидами нацеливающихся на протоспейсер последовательности или сегмента. В некоторых вариантах осуществления неканоническая пара оснований представляет собой rU-rG.
[00180] В некоторых вариантах осуществления от 1 до 20 нуклеотидов в линкере отбирают случайным образом. Например, от 1 до 20, от 1 до 15, от 1 до 10, от 1 до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 1 до 4, от 1 до 3, от 1 до 2, от 2 до 20, от 2 до 15, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2 до 5, от 2 до 4, от 3 до 20, от 3 до 15, от 3 до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до б, от 3 до 5, от 3 до 4, от 4 до 20, от 4 до 15, от 4 до 10, от 4 до 9, от 4 до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 15, от 5 до
10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20, от б до 15, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до 20, от 7 до 15, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 15, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 15 или от 9 до
10, от 10 до 20, от 10 до 15 или от 15 до 20 нуклеотидов в
линкере могут быть отобраны случайным образом.
[00181] В некоторых вариантах осуществления от 1 до 20 нуклеотидов в сегменте РНК отбирают случайным образом. Например, от 1 до 20, от 1 до 15, от 1 до 10, от 1 до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 1 до 4, от 1 до 3, от 1 до 2, от
2 до 20, от 2 до 15, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до
7, от 2 до б, от 2 до 5, от 2 до 4, от 3 до 20, от 3 до 15, от 3
до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до б, от 3 до 5, от
3 до 4, от 4 до 20, от 4 до 15, от 4 до 10, от 4 до 9, от 4 до
8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 15, от 5
до 10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20,
от б до 15, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до
20, от 7 до 15, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от
8 до 15, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 15 или от 9
до 10, от 10 до 20, от 10 до 15 или от 15 до 20 нуклеотидов в
сегменте РНК могут быть отобраны случайным образом.
[00182] В некоторых вариантах осуществления стадию (д) повторяют X раз, получая тем самым gRNA в количестве X и повторяя стадию (е) с каждым количеством X gRNA, где X составляет от 0 до 20. В некоторых вариантах осуществления X может составлять от 1 до 20, от 1 до 19, от 1 до 18, от 1 до 17, от 1 до 16, от 1 до 15, от 1 до 14, от 1 до 13, от 1 до 12, от 1 до 11, от 1 до 10, от 1 до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 2 до 20, от 2 до 19, от 2 до 18, от 2 до 17, от 2 до 16, от 2 до 15, от 2 до 14, от 2 до 13, от 2 до 12, от 2 до
11, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2
до 5, от 3 до 20, от 3 до 19, от 3 до 18, от 3 до 17, от 3 до
16, от 3 до 15, от 3 до 14, от 3 до 13, от 3 до 12, от 3 до 11,
от 3 до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до б, от 3 до
5, от 4 до 20, от 4 до 19, от 4 до 18, от 4 до 17, от 4 до 16,
от 4 до 15, от 4 до 14, от 4 до 13, от 4 до 12, от 4 до 11, от 4
до 10, от 4 до 9, от 4 до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 19, от 5 до 18, от 5 до 17, от 5 до 16, от 5 до 15, от 5 до 14, от 5 до 13, от 5 до 12, от 5 до 11, от 5 до 10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20, от б до
19, от б до 18, от б до 17, от б до 16, от б до 15, от б до 14, от б до 13, от б до 12, от б до 11, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до 20, от 7 до 19, от 7 до 18, от 7 до 17, от 7 до 16, от 7 до 15, от 7 до 14, от 7 до 13, от 7 до 12, от 7 до 11, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 19, от 8 до 18, от 8 до 17, от 8 до 16, от 8 до 15, от 8 до 14, от 8 до 13, от 8 до 12, от 8 до 11, от 8 до 10, от 8 до 9, от 9 до
20, от 9 до 19, от 9 до 18, от 9 до 17, от 9 до 16, от 9 до 15, от 9 до 14, от 9 до 13, от 9 до 12, от 9 до 11 или от 9 до 10. Например, X может составлять 1, 2, 3, 4, 5, б, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20.
[00183] В некоторых вариантах осуществления кинетику встраивания и время нахождения вычисляют с использованием кинетической методики Монте-Карло или алгоритма Гиллеспи. В некоторых вариантах осуществления кинетику встраивания и время нахождения можно определить с использованием "детерминистских" способов, таких как дифференциальные уравнения, моделирующие встраивание нити, которые известны специалисту в данной области. Кинетическая методика Монте-Карло (KMC) представляет собой компьютерное моделирование по методике Монте-Карло, предназначенное для моделирования временной эволюции некоторых процессов, происходящих в природе. Данные процессы, как правило, представляют собой процессы, которые происходят при известных скоростях перехода между состояниями. Эти известные скорости перехода представляют собой исходные вводимые данные для алгоритма KMC. Алгоритм Гиллеспи (также известный как алгоритм Дуба-Гиллеспи) генерирует статистически правильную траекторию (возможное решение) стохастического уравнения. Алгоритм Гиллеспи можно использовать для моделирования еще более сложных систем. Этот алгоритм особенно полезен для моделирования реакций внутри клеток, где количество реагентов обычно исчисляется десятками молекул (или меньше). Математически он представляет собой
вариант динамической методики Монте-Карло и подобен кинетическим методикам Монте-Карло. Алгоритм Гиллеспи позволяет проводить дискретное и стохастическое моделирование системы с несколькими реагентами, поскольку каждая реакция моделируется в явном виде. Траектория, соответствующая одиночному моделированию Гиллеспи, представляет собой точную выборку из функции распределения масс, являющейся решением основного уравнения.
[00184] В некоторых вариантах осуществления критериями конструирования могут быть специфичность, модулирование продолжительности связывания и/или расчетная специфичность расщепления. Например, оптимизированная gRNA может быть сконструирована так, чтобы ее продолжительность связывания была больше или равная продолжительности связывания полной gRNA в целевом сайте и/или продолжительность связывания была меньше или равная продолжительности связывания полноразмерной gRNA в нецелевом сайте. В некоторых вариантах осуществления оптимизированную gRNA выбирают так, чтобы ее продолжительность связывания была меньше или равная продолжительности связывания полноразмерной gRNA по меньшей мере с тремя нецелевыми сайтами, где нецелевые сайты прогнозируют как ближайшие нецелевые сайты, или прогнозируется, что они имеют наивысшую идентичность с целевыми сайтами. В некоторых вариантах осуществления критерии конструирования предусматривают время нахождения или скорость расщепления в нецелевом сайте, которые меньше или равны продолжительности нахождения или скорости расщепления полноразмерной gRNA или усеченной gRNA в нецелевом сайте, и/или прогнозируемую степень целевой активности, которая превышает 10% от прогнозируемой степени целевой активности полноразмерной gRNA или усеченной gRNA.
[00185] В некоторых вариантах осуществления
оптимизированную gRNA тестируют на стадии i) с использованием чувствительной к ошибочному спариванию нуклеазы для определения активности CRISPR, например с использованием анализа surveyor, или анализа с эндонуклеазой I из Т7 (Т7Е1), или методик секвенирования нового поколения, таких как Illumina MiSeq или GUIDE-Seq. В некоторых вариантах осуществления оптимизированную
gRNA тестируют на стадии i) с использованием анализа с репортером, где активность Саэ9-слитого белка изменяет экспрессию репортерного белка, такого как GFP. GUIDE-Seq представляет собой анализ, который был разработан для анализа нецелевых расщеплений.
[00186] В некоторых вариантах осуществления целевую область
можно определить на основе близости последовательности к
последовательности РАМ с использованием программы, такой как
CRISPR design (Ran, et al. Nature Protocols (2013) 8:2281-2308)
и инструмента CCTop (Stemmer, PLoS One (2015) 10:e0124633). В
некоторых вариантах осуществления целевые сайты могут включать в
себя промоторы, сайты гиперчувствительности к ДНКазе I, сайты
хроматина, доступные для транспозазы, сайты метилирования ДНК,
сайты связывания факторов транскрипции, эпигенетические метки,
локусы количественных признаков экспрессии и/или области,
связанные с признаками человека или фенотипами в исследованиях
генетических ассоциаций. Целевые сайты могут быть определены
путем секвенирования сайтов расщепления ДНКазой (DNase-seq),
анализа хроматина, доступного для транспозазы, с
высокопроизводительным секвенированием (ATAC-seq), ChlP-секвенирования, секвенирования самотранскрибирующихся активных регуляторных областей (STARR-Seq), секвенирования одиночных молекул в реальном времени (SMRT), секвенирования выделенных с помощью формальдегида регуляторных элементов (FAIRE-seq), секвенирования сайтов расщепления микрококковой нуклеазы (MNase-seq) , секвенирования после обработки бисульфитом при сниженном представительстве (RRBS-seq), полногеномного секвенирования с предварительной обработкой бисульфитом, секвенирования после иммунопреципитации метилированной ДНК (MEDIP-seq) или исследований генетических ассоциаций. В некоторых вариантах осуществления нецелевые сайты могут быть определены с использованием CasOT (PKU Zebrafish Functional Genomics group, Пекинский университет), CHOPCHOP (Гарвардский университет), CRISPR Design, (Массачусетский технологический институт), CRISPR Design tool (Институт Броудов при МТИ и Гарварде), CRISPR/Cas9 gRNA finder (Университет Колорадо) , CRISPRfinder (Университет
Париж-юг), E-CRISP (DKFZ, Немецкий центр исследования рака), CRISPR gRNA Design tool (DNA 2.0), PROGNOS (Университет Эмори/Технологический институт Джорджии), ZiFiT (Массачусетская больница общего профиля). Примеры инструментов, которые можно использовать для определения целевых областей и нецелевых сайтов, описаны в международной патентной заявке № WO2016109255, которая включена в данный документ посредством ссылки во всей ее полноте.
7. Целевой ген
[00187] Раскрываемая в данном документе система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl может быть сконструирована для нацеливания на любой целевой ген и его расщепления. Например, gRNA, такая как оптимизированная gRNA, описанная в данном документе, может нацеливаться на целевую область в целевом гене и связываться с ней. Целевой ген может представлять собой эндогенный ген, трансген или вирусный ген в клеточной линии. В некоторых вариантах осуществления целевой ген может представлять собой известный ген. В некоторых вариантах осуществления целевой ген является неизвестным геном. gRNA может нацеливаться на любую последовательность нуклеиновой кислоты. Целевая последовательность нуклеиновой кислоты может представлять собой ДНК. ДНК может представлять собой любой ген. Например, gRNA может нацеливаться на ген, такой как DMDr ЕМХ1, или VEGFA.
[00188] В некоторых аспектах целевой ген представляет собой ген, связанный с заболеванием. В некоторых вариантах осуществления клетка-мишень представляет собой клетку млекопитающего. В некоторых вариантах осуществления геном включает в себя геном человека. В некоторых вариантах осуществления целевой ген может представлять собой прокариотический ген или эукариотический ген, такой как ген млекопитающего. Например, система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl может нацеливаться на ген млекопитающего, такой как DMD (ген дистрофина), ЕМХ1, VEGFA, IL1RN, MYOD1, ОСТ4, ЕВЕ, HBG, HBD, EBB, MYOCD (миокардин) , PAX7 (белок парного бокса Рах-7), гены FGF1 (фактор роста
фибробластов-1), такие как FGF1A, FGF1B и FGF1C. Другие целевые гены включают без ограничения Atf3, Axudl, Btg2, c-Fos, c-Jun, Cxcll, Cxcl2, Ednl, Ereg, Fos, Gadd45b, Ier2, Ier3, Ifrdl, Illb, 116, Irfl, Junb, Lif, Nfkbia, Nfkbiz, Ptgs2, Slc25a25, Sqstml, Tieg, Tnf, Tnfaip3, Zfp36, Birc2, Ccl2, Ccl20, Ccl7, Cebpd, Ch25h, CSF1, Cx3cll, CxcllO, Cxcl5, Gch, Icaml, Ifi47, Ifngr2, MmplO, Nfkbie, Npall, p21, Relb, Ripk2, Rndl, Slpr3, Stxll, Tgtp, Tlr2, Tmeml40, Tnfaip2, Tnfrsf6, Vcaml, 1110004C05Rik
(номер доступа в GenBank BC010291), Abcal, AI561871 (номер доступа в GenBank BI143915), AI882074 (номер доступа в GenBank ВВ730912), Artsl, AW049765 (номер доступа в GenBank ВС026642.1), СЗ, Casp4, Сс15, Сс19, Cdsn, Enpp2, Gbp2, H2-D1, Н2-К, H2-L, Ifitl, Ii, I113ral, Illrll, Lcn2, Lhfpl2, LOC677168 (номер доступа в GenBank AK019325), Mmpl3, Mmp3, Mt2, Nafl, Ppicap, Prnd, PsmblO, Saa3, Serpina3g, Serpinfl, Sod3, Statl, Tapbp, U90926 (номер доступа в GenBank NM_020562), Ubd, A2AR
(аденозиновый рецептор A2A), B7-H3 (также называемый CD276), В7-
Н4 (также называемый VTCN1), BTLA (аттенюатор В- и Т-лимфоцитов;
также называемый CD272), CTLA-4 (ассоциированный с
цитотоксическими Т-лимфоцитами белок 4; также называемый CD152), IDO (индоламин-2,3-диоксигеназа) KIR (иммуноглобулиноподобный рецептор клеток-киллеров), LAG3 (ген активации лимфоцитов-3) , PD-1 (рецептор программируемой смерти 1 (PD-1)), TIM-3 (Т-клеточный иммуноглобулиновый домен и муциновый домен 3) и VISTA
(иммуноглобулиновый V-домен, супрессор активации Т-клеток). В некоторых вариантах осуществления целевой ген представляет собой ген DMD (дистрофии), ЕМХ1 или VEGFA.
8. Композиции для редактирования генома
[00189] Настоящее изобретение направлено на композиции для
редактирования генома, геномной перестройки или изменения
экспрессии целевого гена. Композиции включают оптимизированную
gRNA, получаемую с помощью раскрытого способа, с системой на
основе CRISPR/Cas9 или системой на основе CRISPR/Cpfl. В
некоторых вариантах осуществления gRNA может различать целевые и
нецелевые сайты с минимальными термодинамическими
энергетическими различиями между сайтами и обеспечивать
повышенную специфичность. В некоторых вариантах осуществления оптимизированная gRNA модулирует встраивание нити в протоспейсер.
[00190] Увеличение специфичности достигается за счет добавления удлинения к 5'-концу или 3'-концу полноразмерной или стандартной gRNA, так что образуется структура "шпильки", которая является самокомплементарной сегменту полноразмерной или стандартной gRNA, которая нацеливается на протоспейсер, например, нацеливающейся на протоспейсер последовательности. См. фиг. 1В и фиг. 2В. Шпильки служат кинетическим барьером для встраивания нити в протоспейсер, но шпильки вытесняются в ходе встраивания нити в полные целевые сайты, в результате чего может происходить полное встраивание.
[00191] Как показано на фиг. 2D, предпочтительно происходит связывание dCas9 с полными протоспейсерами, что убедительно указывает на то, что шпильки фактически вытесняются во в ходе встраивания. Раскрытые оптимизированные gRNA, которые представляют собой шпильки, сконструировали для увеличения специфичности связывания с целевыми сайтами путем ингибирования встраивания, если были ошибочные спаривания между мишенью и РАМ-дистальной нацеливающей областью направляющей РНК. В этих случаях энергетически более выгодно, чтобы шпильки оставались закрытыми, а присутствие шпильки, очевидно, способствует плавлению и отсоединению Cas9/dCas9 от этих сайтов.
[00192] Оптимизированные gRNA с 5'-шпильками или 3'-шпильками (hpgRNA) значительно повышали специфичность связывания по сравнению со стандартными направляющими РНК и с наилучшими доступными вариантами направляющих РНК (см. примеры) , а также устраняли или значительно ослабляли связывание в сайтах протоспейсера, содержащих ошибочные спаривания. Увеличение длины шпильки увеличивало специфичность связывания dCas9. Оптимизированные gRNA и hpgRNA можно использовать для редактирования сродства и специфичности связывания Cas9/dCas9 или Cpf1. Исходя из размера и структуры шпильки, шпилька hpgRNA может быть размещена в канале связывания ДНК молекулы Cas9/dCas9 и защищена от разрушения. В некоторых вариантах осуществления
длину шпильки, длину петли и состав петли можно изменять для обеспечения более точного контроля этих свойств. В некоторых вариантах осуществления шпилька может составлять от приблизительно 1 до приблизительно 2 0 нуклеотидов или от приблизительно 3 до приблизительно 10 нуклеотидов в длину. Например, шпилька может составлять в длину от 1 до 20, от 1 до 19, от 1 до 18, от 1 до 17, от 1 до 16, от 1 до 15, от 1 до 14, от 1 до 13, от 1 до 12, от 1 до 11, от 1 до 10, от 1 до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 2 до 20, от 2 до 19, от 2 до 18, от 2 до 17, от 2 до 16, от 2 до 15, от 2 до 14, от 2 до 13, от 2 до 12, от 2 до 11, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2 до 5, от 3 до 20, от 3 до 19, от 3 до
18, от 3 до 17, от 3 до 16, от 3 до 15, от 3 до 14, от 3 до 13, от 3 до 12, от 3 до 11, от 3 до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до 6, от 3 до 5, от 4 до 20, от 4 до 19, от 4 до 18, от 4 до 17, от 4 до 16, от 4 до 15, от 4 до 14, от 4 до 13, от 4 до 12, от 4 до 11, от 4 до 10, от 4 до 9, от 4 до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 19, от 5 до 18, от 5 до 17, от 5 до 16, от 5 до 15, от 5 до 14, от 5 до 13, от 5 до 12, от 5 до 11, от 5 до 10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20, от б до 19, от б до 18, от б до 17, от б до 16, от б до 15, от б до 14, от б до 13, от б до 12, от б до 11, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до 20, от 7 до
19, от 7 до 18, от 7 до 17, от 7 до 16, от 7 до 15, от 7 до 14, от 7 до 13, от 7 до 12, от 7 до 11, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 19, от 8 до 18, от 8 до 17, от 8 до 16, от 8 до 15, от 8 до 14, от 8 до 13, от 8 до 12, от 8 до 11, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 19, от 9 до 18, от 9 до 17, от 9 до 16, от 9 до 15, от 9 до 14, от 9 до 13, от 9 до 12, от 9 до 11 или от 9 до 10. Например, шпилька может составлять 1, 2, 3, 4, 5, б, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 2 0 или от приблизительно 5 до приблизительно 8 нуклеотидов в длину.
[00193] В некоторых вариантах осуществления петля может составлять от приблизительно 1 до приблизительно 20 нуклеотидов, от приблизительно 3 до приблизительно 10 нуклеотидов или от
приблизительно 5 до приблизительно 8 нуклеотидов в длину. Например, петля может составлять в длину от 1 до 20, от 1 до 19, от 1 до 18, от 1 до 17, от 1 до 16, от 1 до 15, от 1 до 14, от 1 до 13, от 1 до 12, от 1 до 11, от 1 до 10, от 1 до 9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 2 до 20, от 2 до 19, от 2 до 18, от 2 до 17, от 2 до 16, от 2 до 15, от 2 до 14, от 2 до 13, от 2 до 12, от 2 до 11, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2 до 5, от 3 до 20, от 3 до 19, от 3 до 18, от 3 до 17, от 3 до 16, от 3 до 15, от 3 до 14, от 3 до 13, от 3 до 12, от 3 до 11, от 3 до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до б, от 3 до 5, от 4 до 20, от 4 до 19, от 4 до 18, от 4 до 17, от 4 до 16, от 4 до 15, от 4 до 14, от 4 до 13, от 4 до 12, от 4 до 11, от 4 до 10, от 4 до 9, от 4 до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 19, от 5 до 18, от 5 до 17, от 5 до 16, от 5 до 15, от 5 до 14, от 5 до 13, от 5 до 12, от 5 до 11, от 5 до 10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20, от б до 19, от б до 18, от б до 17, от б до 16, от б до 15, от б до 14, от б до 13, от б до 12, от б до 11, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до 20, от 7 до 19, от 7 до 18, от 7 до 17, от 7 до 16, от 7 до 15, от 7 до 14, от 7 до 13, от 7 до 12, от 7 до 11, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 19, от 8 до 18, от 8 до 17, от 8 до 16, от 8 до 15, от 8 до 14, от 8 до 13, от 8 до 12, от 8 до 11, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 19, от 9 до 18, от 9 до 17, от 9 до 16, от 9 до 15, от 9 до 14, от 9 до 13, от 9 до 12, от 9 до 11 или от 9 до 10. В некоторых вариантах осуществления петля может составлять 1, 2, 3, 4, 5, б, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 2 0 или от приблизительно 5 до приблизительно 8 нуклеотидов в длину.
[00194] В некоторых вариантах осуществления в состав петли могут входить от приблизительно 1 до приблизительно 2 0 нуклеотидов, от приблизительно 3 до приблизительно 10 нуклеотидов или от приблизительно 5 до приблизительно 8 нуклеотидов. Например, в состав петли могут входить от 1 до 20, от 1 до 19, от 1 до 18, от 1 до 17, от 1 до 16, от 1 до 15, от 1 до 14, от 1 до 13, от 1 до 12, от 1 до 11, от 1 до 10, от 1 до
9, от 1 до 8, от 1 до 7, от 1 до б, от 1 до 5, от 2 до 20, от 2 до 19, от 2 до 18, от 2 до 17, от 2 до 16, от 2 до 15, от 2 до 14, от 2 до 13, от 2 до 12, от 2 до 11, от 2 до 10, от 2 до 9, от 2 до 8, от 2 до 7, от 2 до б, от 2 до 5, от 3 до 20, от 3 до 19, от 3 до 18, от 3 до 17, от 3 до 16, от 3 до 15, от 3 до 14, от 3 до 13, от 3 до 12, от 3 до 11, от 3 до 10, от 3 до 9, от 3 до 8, от 3 до 7, от 3 до б, от 3 до 5, от 4 до 20, от 4 до 19, от 4 до 18, от 4 до 17, от 4 до 16, от 4 до 15, от 4 до 14, от 4 до 13, от 4 до 12, от 4 до 11, от 4 до 10, от 4 до 9, от 4 до 8, от 4 до 7, от 4 до б, от 4 до 5, от 5 до 20, от 5 до 19, от 5 до 18, от 5 до 17, от 5 до 16, от 5 до 15, от 5 до 14, от 5 до 13, от 5 до 12, от 5 до 11, от 5 до 10, от 5 до 9, от 5 до 8, от 5 до 7, от 5 до б, от б до 20, от б до 19, от б до 18, от б до 17, от б до 16, от б до 15, от б до 14, от б до 13, от б до 12, от б до 11, от б до 10, от б до 9, от б до 8, от б до 7, от 7 до 20, от 7 до 19, от 7 до 18, от 7 до 17, от 7 до 16, от 7 до 15, от 7 до 14, от 7 до 13, от 7 до 12, от 7 до 11, от 7 до 10, от 7 до 9, от 7 до 8, от 8 до 20, от 8 до 19, от 8 до 18, от 8 до 17, от 8 до 16, от 8 до 15, от 8 до 14, от 8 до 13, от 8 до 12, от 8 до 11, от 8 до 10, от 8 до 9, от 9 до 20, от 9 до 19, от 9 до 18, от 9 до 17, от 9 до 16, от 9 до 15, от 9 до 14, от 9 до 13, от 9 до 12, от 9 до 11 или от 9 до 10. В некоторых вариантах осуществления в состав петли могут входить 1, 2, 3, 4, 5, б, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или от приблизительно 5 до приблизительно 8 нуклеотидов.
[00195] Композиции могут включать в себя вирусный вектор и систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе. В некоторых вариантах осуществления композиция включает в себя модифицированный вектор на основе AAV и нуклеотидную последовательность, кодирующую систему на основе CRISPR/Cas9 по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе. Композиция может дополнительно содержать донорную ДНК или трансген. Эти композиции могут быть использованы в редактировании генома, в конструировании генома и в коррекции
или уменьшении эффектов мутаций в генах, вовлеченных в генетические заболевания.
[00196] Целевой ген может быть вовлечен в дифференцировку клетки или любой другой процесс, в котором может быть желательна активация, репрессия или разрушение гена, или может иметь мутацию, такую как делеция, мутация со сдвигом рамки или нонсенс-мутация. Если целевой ген имеет мутацию, которая является причиной преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга, то система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, может быть сконструирована для распознавания и связывания нуклеотидной последовательности выше или ниже преждевременного стоп-кодона, аберрантного сайта акцептора сплайсинга или аберрантного сайта донора сплайсинга. Система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, может также использоваться для разрушения нормального сплайсинга генов путем целенаправленного воздействия на акцепторы и доноры сплайсинга, чтобы вызвать пропуск преждевременных стоп-кодонов или восстановить поврежденную рамку считывания. Система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, может опосредовать или не опосредовать нецелевые изменения в областях генома, кодирующих белок.
[00197] В некоторых вариантах осуществления система на основе CRISPR/Cas9 индуцирует или осуществляет репрессию целевого гена в по меньшей мере приблизительно 1 раз, по меньшей мере приблизительно 2 раза, по меньшей мере приблизительно 3 раза, по меньшей мере приблизительно 4 раза, по меньшей мере приблизительно 5 раз, по меньшей мере приблизительно б раз, по меньшей мере приблизительно 7 раз, по меньшей мере приблизительно 8 раз, по меньшей мере приблизительно 9 раз, по меньшей мере приблизительно 10 раз, по меньшей мере 15 раз, по меньшей мере 20 раз, по меньшей мере 30 раз, по меньшей мере 40
раз, по меньшей мере 50 раз, по меньшей мере 60 раз, по меньшей мере 70 раз, по меньшей мере 80 раз, по меньшей мере 90 раз, по меньшей мере 100 раз, по меньшей мере приблизительно 110 раз, по меньшей мере 120 раз, по меньшей мере 130 раз, по меньшей мере 140 раз, по меньшей мере 150 раз, по меньшей мере 160 раз, по меньшей мере 17 0 раз, по меньшей мере 180 раз, по меньшей мере 190 раз, по меньшей мере 200 раз, по меньшей мере приблизительно 300 раз, по меньшей мере 400 раз, по меньшей мере 500 раз, по меньшей мере 600 раз, по меньшей мере 700 раз, по меньшей мере 800 раз, по меньшей мере 900 раз, по меньшей мере 1000 раз, по меньшей мере 1500 раз, по меньшей мере 2000 раз, по меньшей мере 2500 раз, по меньшей мере 3000 раз, по меньшей мере 3500 раз, по меньшей мере 4000 раз, по меньшей мере 4500 раз, по меньшей мере 5000 раз, по меньшей мере 600 раз, по меньшей мере 7000 раз, по меньшей мере 8000 раз, по меньшей мере 9000 раз, по меньшей мере 10000 раз, по меньшей мере 100000 раз по сравнению с контрольным уровнем экспрессии гена. Контрольным уровнем генной экспрессии целевого гена может быть уровень генной экспрессии целевого гена в клетке, на которую не оказывают воздействия какой-либо из систем на основе CRISPR/Cas9.
а. Модифицированный лентивирусный вектор
[00198] Композиции для редактирования генома, геномной
перестройки или изменения генной экспрессии целевого гена могут
включать в себя модифицированный лентивирусный вектор.
Модифицированный лентивирусный вектор включает в себя первую
полинуклеотидную последовательность, кодирующую систему,
нацеливающуюся на ДНК, и вторую полинуклеотидную
последовательность, кодирующую по меньшей мере одну sgRNA. Первая полинуклеотидная последовательность может быть функционально связана с промотором. Промотор может представлять собой конститутивный промотор, индуцируемый промотор, репрессируемый промотор или регулируемый промотор.
[00199] Вторая полинуклеотидная последовательность кодирует по меньшей мере 1 gRNA, такую как оптимизированная gRNA, описанная в данном документе. Например, вторая полинуклеотидная последовательность может кодировать по меньшей мере 1 gRNA, по
меньшей мере 2 gRNA, по меньшей мере 3 gRNA, по меньшей мере 4 gRNA, по меньшей мере 5 gRNA, по меньшей мере б gRNA, по меньшей мере 7 gRNA, по меньшей мере 8 gRNA, по меньшей мере 9 gRNA, по меньшей мере 10 gRNA, по меньшей мере 11 gRNA, по меньшей мере 12 gRNA, по меньшей мере 13 gRNA, по меньшей мере 14 gRNA, по меньшей мере 15 gRNA, по меньшей мере 16 gRNA, по меньшей мере 17 gRNA, по меньшей мере 18 gRNA, по меньшей мере 19 gRNA, по меньшей мере 2 0 gRNA, по меньшей мере 2 5 gRNA, по меньшей мере 3 0 gRNA, по меньшей мере 35 gRNA, по меньшей мере 4 0 gRNA, по меньшей мере 4 5 gRNA или по меньшей мере 50 gRNA. Вторая полинуклеотидная последовательность может кодировать от 1 gRNA до 50 gRNA, от 1 gRNA до 4 5 gRNA, от 1 gRNA до 4 0 gRNA, от 1 gRNA до 35 gRNA, от 1 gRNA до 3 0 gRNA, от 1 gRNA до 2 5 разных gRNA, от 1 gRNA до 2 0 gRNA, от 1 gRNA до 16 gRNA, от 1 gRNA до 8 разных gRNA, от 4 разных gRNA до 50 разных gRNA, от 4 разных gRNA до 4 5 разных gRNA, от 4 разных gRNA до 4 0 разных gRNA, от 4 разных gRNA до 35 разных gRNA, от 4 разных gRNA до 3 0 разных gRNA, от 4 разных gRNA до 2 5 разных gRNA, от 4 разных gRNA до 2 0 разных gRNA, от 4 разных gRNA до 16 разных gRNA, от 4 разных gRNA до 8 разных gRNA, от 8 разных gRNA до 50 разных gRNA, от 8 разных gRNA до 4 5 разных gRNA, от 8 разных gRNA до 4 0 разных gRNA, от 8 разных gRNA до 35 разных gRNA, от 8 разных gRNA до 3 0 разных gRNA, от 8 разных gRNA до 2 5 разных gRNA, от 8 разных gRNA до 2 0 разных gRNA, от 8 разных gRNA до 16 разных gRNA, от 16 разных gRNA до 50 разных gRNA, от 16 разных gRNA до 45 разных gRNA, от 16 разных gRNA до 4 0 разных gRNA, от 16 разных gRNA до 35 разных gRNA, от 16 разных gRNA до 3 0 разных gRNA, от 16 разных gRNA до 2 5 разных gRNA или от 16 разных gRNA до 2 0 разных gRNA. Каждая из полинуклеотидных последовательностей, кодирующих разные gRNA, может быть функционально связана с промотором. Промоторы, которые функционально связаны с разными gRNA, могут быть одним и тем же промотором. Промоторы, которые функционально связаны с разными gRNA, могут быть разными промоторами. Промотор может представлять собой конститутивный промотор, индуцируемый промотор, репрессируемый промотор или регулируемый промотор. По меньшей мере одна gRNA может связываться с геном-мишенью или
целевым локусом. Если включено более одной gRNA, каждая из gRNA связывается с другой целевой областью в пределах одного целевого локуса, или каждая из gRNA связывается с другой целевой областью в пределах разных генных локусов.
Ь. Векторы на основе аденоассоциированного вируса
[00200] AAV может использоваться для доставки композиций в клетку с использованием различных конфигураций конструкции. Например, AAV может доставлять кассеты экспрессии системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl и gRNA в разных векторах. В качестве альтернативы, если используются белки Cas9 малого размера, полученные из таких видов, как Staphylococcus aureus или Neisseria meningitidis, то и кассета экспрессии Cas9, и до двух кассет экспрессии gRNA могут быть объединены в одном векторе на основе AAV с пределом упаковки, составляющим 4,7 т. о.
[00201] Композиция, описанная выше, включает в себя модифицированный вектор на основе аденоассоциированного вируса (AAV). Модифицированный вектор на основе AAV может быть способен к доставке и экспрессировать систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl в клетке млекопитающего. Например, модифицированный вектор на основе AAV может представлять собой вектор AAV-SASTG (Piacentino et al. (2012) Human Gene Therapy 23:635-646). Модифицированный вектор на основе AAV может быть на основе одного или нескольких из ряда типов капсида, включая AAV1, AAV2, AAV5, AAV6, AAV8 и AAV9. Модифицированный вектор на основе AAV может быть на основе псевдотипа AAV2 с альтернативными тропными к мышцам капсидами AAV, таким как векторы AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5 и AAV/SASTG, которые эффективно трансдуцируют скелетную мышцу или сердечную мышцу путем системной и местной доставки (Seto et al. Current Gene Therapy (2012) 12:139-151).
9. Клетки-мишени
[00202] Раскрываемая в данном документе gRNA, такая как описанная в данном документе оптимизированная gRNA, может быть использована с системой CRISPR/Cas9 с любым типом клетки. В некоторых вариантах осуществления клетка представляет собой
клетку бактерий, клетку грибов, клетку архей, клетку растений или клетку животных, как, например, клетка млекопитающего. В некоторых вариантах осуществления это может быть орган или организм животного. В некоторых вариантах осуществления клетка может представлять собой любой тип клетки или линию клеток, в том числе без ограничения клетки 293-Т, клетки ЗТЗ, клетки 721, клетки 9L, клетки А2780, клетки A2780ADR, клетки A2780cis, клетки А172, клетки А20, клетки А253, клетки А431, клетки А-549, клетки ALC, клетки В1б, клетки В35, клетки ВСР-1, клетки BEAS-2В, клетки bEnd.3, клетки ВНК-21, клетки BR 2 93, клетки ВхРСЗ, клетки С2С12, клетки СЗН-10Т1/2, клетки Сб/Зб, клетки Са1-27, клетки СНО, клетки COR-L23, клетки COR-L23/CPR, клетки COR-L23/5010, клетки COR-L23/R23, клетки C0S-7, клетки COV-434, клетки CML Т1, клетки СМТ, клетки СТ2 6, клетки D17, клетки DH82, клетки DU145, клетки DuCaP, клетки EL4, клетки ЕМ2, клетки ЕМЗ, клетки EMT6/AR1, клетки EMT6/AR10.О, клетки FM3, клетки Н1299, клетки Н69, клетки НВ54, клетки НВ55, клетки НСА2, клетки НЕК-293, клетки HeLa, клетки Hepalclc7, клетки HL-60, клетки НМЕС, клетки НТ-29, клетки Jurkat, клетки J558L, клетки JY, клетки К562, клетки Ки812, клетки KCL22, клетки KG1, клетки KY01, клетки LNCap, клетки Ma-Mel 1, 2, 3... 48, клетки МС-38, клетки MCF-7, клетки MCF-10A, клетки MDA-MB-231, клетки MDA-MB-468, клетки MDA-MB-435, клетки MDCK II, клетки MDCK II, клетки MG63, клетки MOR/0.2R, клетки MONO-MAC б, клетки MRC5, клетки MTD-1A, клетки MyEnd, клетки NCI-H69/CPR, клетки NCI-H69/LX10, клетки NCI-H69/LX20, клетки NCI-H69/LX4, клетки NIH-3T3, клетки NALM-1, клетки NW-145, клетки OPCN/OPCT, клетки Peer, клетки PNT-1A/PNT 2, клетки Raji, клетки RBL, клетки RenCa, клетки RIN-5F, клетки RMA/RMAS, клетки Saos-2, клетки Sf-9, клетки SiHa, клетки SkBr3, клетки Т2, клетки T-47D, клетки Т84, клетки ТНР1, клетки U373, клетки U87, клетки U937, клетки VCaP, клетки Vero, клетки WM39, клетки WT-49, клетки ХбЗ, клетки YAC-1, клетки YAR, GM12878, К562, эмбриональные стволовые клетки человека HI, HeLa-S3, HepG2, HUVEC, SK-N-SH, IMR90, A549, MCF7, НМЕС или LHCM, CD14+, CD2 0+, первичные клетки сердца или печени, дифференцированные клетки HI, 8988Т, Adult CD4 naive, Adult CD4 ThO, Adult CD4 Thl,
AG04449, AG04450, AG09309, AG09319, AG10803, AoAF, AoSMC,
BC_Adipose_UHN00001, BC_Adrenal_Gland_H12803N, BC_Bladder_01-
11002, BC_Brain_H11058N, BC_Breast_02-03015, BC_Colon_01-11002,
BC_Colon_H12817N, BC_Esophagus_01-11002, BC_Esophagus_H12817N,
BC_Jejunum_H12 817N, BC_Kidney_01-11002, BC_Kidney_H12817N,
BC_Left_Ventricle_N41, BC_Leukocyte_UHN0 02 04, BC_Liver_01-11002,
BC_Lung_01-11002, BC_Lung_H12 817N, BC_Pancreas_H12817N,
BC_Penis_H12817N, BC_Pericardium_H12529N, BC_Placenta_UHN0018 9,
BC_Prostate_Gland_H12 817N, BC_Rectum_N2 9, BC_Skeletal_Muscle_01-
11002, BC_Skeletal_Muscle_H12817N, BC_Skin_01-11002,
BC_Small_Intestine_01-11002, BC_Spleen_H12817N, BC_Stomach_01-
11002, BC_Stomach_H12817N, BC_Testis_N30, BC_Uterus_BN0765,
BE2_C, BG02ES, BG02ES-EBD, BJ, bone_marrow_HS27a,
bone_marrow_HS5, bone_marrow_MSC, Breast_OC, Caco-2,
CD20+_RO01778, CD2 0+_RO017 94, CD34+_Mobilized,
CD4+_Naive_Wbl1970 640, CD4+_Naive_Wb78495824, Cerebellum_OC,
Cerebrum_frontal_OC, Chorion, CLL, CMK, Colo829, Colon_BC,
Colon_OC, Cord_CD4_naive, Cord_CD4_ThO, Cord_CD4_Thl,
децидуальной оболочки, Dnd41, ECC-1, Endometrium_OC,
Esophagus_BC, фибробласты, Fibrobl_GM03348, FibroP,
FibroP_AG0 8 3 95, FibroP_AG08396, FibroP_AG2 0443,
Frontal_cortex_OC, GC_B_cell, глиобластомы, GM04503, GM04504, GM06990, GM08714, GM10248, GM10266, GM10847, GM12801, GM12812, GM12813, GM12864, GM12865, GM12866, GM12867, GM12868, GM12869, GM12870, GM12871, GM12872, GM12873, GM12874, GM12875, GM12878-XiMat, GM12891, GM12892, GM13976, GM13977, GM15510, GM18505, GM18507, GM18526, GM18951, GM19099, GM19193, GM19238, GM19239, GM19240, GM20000, H0287, Hl-нейроны, H7-hESC, H9ES, H9ES-AFP-, H9ES-AFP+, H9ES-CM, H9ES-E, H9ES-EB, H9ES-EBD, HAc, HAEpiC, HAh, HAL, HAoAF, HAoAF_6090101.11, HAoAF_6111301.9, HAoEC, HAoEC_7071706.1, HAoEC_8061102.1, HA-sp, HBMEC, HBVP, HBVSMC, HCF, HCFaa, HCH, HCH_0011308.2P, HCH_8100808.2, HCM, HConF, HCPEpiC, HCT-116, Heart_OC, Heart_STL003, HEEpiC, HEK293, HEK293T, HEK2 93-T-REx, гепатоциты, HFDPC, HFDPC_0100503.2, HFDPC_0102703.3, HFF,HFF-Myc, HFL11W, HFL24W, HGF, HHSEC, HIPEpiC, HL-60, HMEpC, HMEpC 6022801.3, HMF, hMNC-CB, hMNC-
СВ_8072802.6, hMNC-CB_9111701.6, hMNC-PB, hMNC-PB_0022330.9,
hMNC-PB_0082430.9, hMSC-AT, hMSC-AT_0102604.12, hMSC-
AT_9061601.12, hMSC-BM, hMSC-BM_0050602.11, hMSC-BM_0051105.11,
hMSC-UC, hMSC-UC_0052501.7, hMSC-UC_0081101 . 7 , HMVEC-dAd, HMVEC-
dBl-Ad, HMVEC-dBl-Neo, HMVEC-dLy-Ad, HMVEC-dLy-Neo, HMVEC-dNeo,
HMVEC-LB1, HMVEC-LLy, HNPCEpiC, HOB, HOB_0090202.1, HOB_0091301,
HPAEC, HPAEpiC, HPAF, HPC-PL, HPC-PL_0032601.13, HPC-
PL_0101504.13, HPDE6-E6E7, HPdLF, HPF, HPIEpC, HPIEpC_9012801.2 ,
HPIEpC_9041503.2, HRCEpiC, HRE, HRGEC, HRPEpiC, HSaVEC,
HSaVEC_0022202.16, HSaVEC_9100101.15, HSMM, HSMM_emb, HSMM_FSHD,
HSMMtube, HSMMtube_emb, HSMMtube_FSHD, HT-1080, HTR8 svn, Huh-7,
Huh-7.5, HVMF, HVMF_6091203.3, HVMF_6100401.3, HWP, HWP_0092205,
HWP_8120201.5, iPS, iPS_CWRUl, iPS_hFib2_iPS4, iPS_hFib2_iPS5,
iPS_NIHill, iPS_NIHi7, Ishikawa, Jurkat, Kidney_BC, Kidney_OC,
LHCN-M2, LHSR, Liver_OC, Liver_STL004, Liver_STL011, LNCaP,
Loucy, Lung_BC, Lung_OC, Lymphoblastoid_cell_line, M059J,
MCFIOA-Er-Src, MCF-7, MDA-MB-231, Medullo, Medullo_D341,
Mel_2183, меланоциты, Monocytes-CD14+, Monocytes-CD14+_RO01746,
Monocytes-CD14+_RO01826, MRT_A204, MRT_G401, MRT_TTC549,
миометрия, Naive_B_cell, NB4, NH-A, NHBE, NHBE_RA, NHDF,
NHDF_0060801.3, NHDF_7071701.2, NHDF-Ad, NHDF-neo, NHEK,
NHEM.f_M2, NHEM.f_M2_5 0713 02.2, NHEM.f_M2_6022001, NHEM_M2,
NHEM_M2_7 011001.2, NHEM_M2_7 012 3 03, NHLF, NT2-D1,
Olf_neurosphere, остеобласты, ovcar-3, PANC-1, Pancreas_OC,
PanlsletD, Panlslets, PBDE, PBDEFetal, PBMC, PFSK-1, pHTE,
Pons_OC, PrEC, ProgFib, предстательной железы, Prostate_OC,
Psoas_muscle_OC, Raji, RCC_7860, RPMI-7951, RPTEC, RWPE1, SAEC,
SH-SY5Y, Skeletal_Muscle_BC, SkMC, SKMC, SkMC_8121902.17,
SkMC_9011302, SK-N-MC, SK-N-SH_RA, Small_intestine_OC,
Spleen_OC, звездчатые, Stomach_BC, T_cells_CD4+, T-47D, T98G,
TBEC, Thl, Thl_Wb33676984, Thl_Wb54553204, Thl7, Th2,
Th2_Wb33676984, Th2_Wb54553204, Treg_Wb78495824,
Treg_Wb83319432, U20S, U87, UCH-1, уротелиальные, WERI-Rb-1 и WI-38. В некоторых вариантах осуществления клетка-мишень может представлять собой любую клетку, такую как первичная клетка, клетка НЕК293, клетка 293Ts, клетка SKBR3, клетка А431, клетка
К562, клетка НСТНб, клетка HepG2 или группы K-Ras-зависимых и K-Ras-независимых клеток.
10. Способы эпигеномного редактирования
[00203] Настоящее изобретение относится к способу
эпигемного редактирования в клетке-мишени или субъекте с
использованием системы на основе CRISPR/Cas9 или системы на
основе CRISPR/Cpfl. Способ может быть использован для активации
или подавления целевого гена. Способ включает приведение в
контакт клетки или субъекта с эффективным количеством
оптимизированной молекулы gRNA, описываемой в данном документе,
и системой на основе CRISPR/Cas9 или системой на основе
CRISPR/Cpfl. В некоторых вариантах осуществления
оптимизированная gRNA кодируется полинуклеотидной
последовательностью и упакована в лентивирусный вектор. В некоторых вариантах осуществления лентивирусный вектор содержит кассету экспрессии, содержащую промотор, функционально связанный с полинуклеотидной последовательностью, кодирующей sgRNA. В некоторых вариантах осуществления промотор, функционально связанный с полинуклеотидом, кодирующим оптимизированную gRNA, является индуцируемым.
11. Способы сайт-специфического расщепления ДНК
[00204] Настоящее раскрытие относится к способу сайт-специфического расщепления ДНК в клетке-мишени или субъекте с использованием системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl. Способ включает приведение в контакт клетки или субъекта с эффективным количеством оптимизированной молекулы gRNA, описываемой в данном документе, и системой на основе CRISPR/Cas9 или системой на основе CRISPR/Cpfl. В некоторых вариантах осуществления оптимизированная gRNA кодируется полинуклеотидной последовательностью и упакована в лентивирусный вектор. В некоторых вариантах осуществления лентивирусный вектор содержит кассету экспрессии, содержащую промотор, функционально связанный с полинуклеотидной последовательностью, кодирующей sgRNA. В некоторых вариантах осуществления промотор, функционально связанный с полинуклеотидом, кодирующим оптимизированную gRNA, является индуцируемым.
составлять от
по меньшей мере 1
gRNA до
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных
gRNA,
меньшей
мере
gRNA
меньшей
мере
разных gRNA, от по меньшей мере 4 разных gRNA до по меньшей мере 4 5 разных gRNA, от по меньшей мере 4 разных gRNA до по меньшей мере 4 0 разных gRNA, от по меньшей мере 4 разных gRNA до по меньшей мере 35 разных gRNA, от по меньшей мере 4 разных gRNA до по меньшей мере 3 0 разных gRNA, от по меньшей мере 4 разных gRNA до по меньшей мере 2 5 разных gRNA, от по меньшей мере 4 разных gRNA до по меньшей мере 2 0 разных gRNA, от по меньшей мере 4 разных gRNA до по меньшей мере 16 разных gRNA, от по меньшей мере 4 разных gRNA до по меньшей мере 12 разных gRNA, от по
меньшей мере 4 разных gRNA до по меньшей мере 8 разных gRNA, от по меньшей мере 8 разных gRNA до по меньшей мере 50 разных gRNA, от по меньшей мере 8 разных gRNA до по меньшей мере 4 5 разных gRNA, от по меньшей мере 8 разных gRNA до по меньшей мере 4 0 разных gRNA, от по меньшей мере 8 разных gRNA до по меньшей мере 35 разных gRNA, от по меньшей мере 8 разных gRNA до по меньшей мере 3 0 разных gRNA, от по меньшей мере 8 разных gRNA до по меньшей мере 2 5 разных gRNA, от 8 разных gRNA до по меньшей мере 2 0 разных gRNA, от по меньшей мере 8 разных gRNA до по меньшей мере 16 разных gRNA или от 8 разных gRNA до по меньшей мере 12 разных gRNA.
[00206] gRNA может содержать полинуклеотидную
последовательность, комплементарную последовательности целевой ДНК, после которой следует последовательность РАМ. gRNA может содержать "G" на 5'-конце комплементарной полинуклеотидной последовательности. gRNA может содержать полинуклеотидную последовательность из по меньшей мере 10 пар оснований, по меньшей мере 11 пар оснований, по меньшей мере 12 пар оснований, по меньшей мере 13 пар оснований, по меньшей мере 14 пар оснований, по меньшей мере 15 пар оснований, по меньшей мере 16 пар оснований, по меньшей мере 17 пар оснований, по меньшей мере 18 пар оснований, по меньшей мере 19 пар оснований, по меньшей мере 2 0 пар оснований, по меньшей мере 21 пары оснований, по меньшей мере 22 пар оснований, по меньшей мере 23 пар оснований, по меньшей мере 2 4 пар оснований, по меньшей мере 2 5 пар оснований, по меньшей мере 3 0 пар оснований или по меньшей мере 35 пар оснований, комплементарную последовательности целевой ДНК, после которой следует последовательность РАМ. Последовательность РАМ может представлять собой "NGG", где "N" может представлять собой любой нуклеотид. gRNA может нацеливаться по меньшей мере на одно из промоторной области, энхансерной области или транскрибируемой области целевого гена. В некоторых вариантах осуществления gRNA нацеливается на последовательность нуклеиновой кислоты, имеющую полинуклеотидную последовательность по меньшей мере одного из SEQ ID NO: 13-148, 316, 317 или 320. gRNA может включать в себя последовательность
нуклеиновой кислоты по меньшей мере одного из SEQ ID NO: 14 9315, 321-323 или 326-329.
12. Способы коррекции мутантного гена и лечения субъекта [00207] Настоящее раскрытие также направлено на способ коррекции мутантного гена у субъекта. Способ предусматривает введение в клетку субъекта композиции, описанной выше. Применение композиции для доставки системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, в клетку может восстанавливать экспрессию полнофункционального или частично функционального белка с помощью матрицы репарации или донорной ДНК, которая может заменять весь ген или область, содержащую мутацию. Система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl, содержащая по меньшей мере одну gRNA, такую как оптимизированная gRNA, описанная в данном документе, может использоваться для введения сайт-специфических двухнитевых разрывов в целевых геномных локусах. Сайт-специфические двухнитевые разрывы создаются тогда, когда система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, связывается с последовательностями целевой ДНК, позволяя тем самым расщепление целевой ДНК. Это расщепление ДНК может стимулировать естественный механизм репарации ДНК, сводящийся к одному из двух возможных путей репарации: репарации с участием гомологичной рекомбинации (HDR) или негомологичного соединения концов (NHEJ).
[00208] Настоящее раскрытие направлено на редактирование генома с использованием системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, без матрицы репарации, которые могут эффективно корректировать рамку считывания и восстанавливать экспрессию функционального белка, вовлеченного в генетическое заболевание. Раскрытая система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, может предусматривать
использование подходов коррекции на основе репарации с участием гомологичной рекомбинации или опосредованного нуклеазой негомологичного соединения концов (NHEJ), обеспечивающих эффективную коррекцию в линиях первичных клеток с ограниченной пролиферацией, которые могут не поддаваться гомологичной рекомбинации или генной коррекции на основе отбора. Эта стратегия объединяет быструю и надежную сборку активной системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, с эффективным способом редактирования генов для лечения генетических заболеваний, вызванных мутациями в несущественных кодирующих областях, которые являются причиной сдвига рамки, преждевременных стоп-кодонов, аберрантных сайтов доноров сплайсинга или аберрантных сайтов акцепторов сплайсинга.
а. Опосредованное нуклеазой негомологичное соединение концов
[00209] Восстановление экспрессии белка из эндогенного мутированного гена может проводиться путем NHEJ-опосредованной репарации ДНК без участия матрицы. В отличие от временного способа нацеливания на РНК целевого гена коррекция рамки считывания целевого гена в геноме с помощью временно экспрессирующейся системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, может приводить к полному восстановлению экспрессии целевого гена каждой модифицированной клеткой и во всем ее потомстве.
[00210] Коррекция гена с помощью опосредованного нуклеазой NHEJ может исправлять мутированный целевой ген и предлагает несколько потенциальных преимуществ над путем HDR. Например, NHEJ не требует донорной матрицы, которая может вызывать неспецифический инсерционный мутагенез. В отличие от HDR, NHEJ эффективно работает на всех стадиях клеточного цикла и поэтому может эффективно использоваться как в делящихся, так и в постмитотических клетках, как, например, в мышечных волокнах. Это обеспечивает надежное, полное восстановление гена,
являющееся альтернативой пропуску экзонов на основе олигонуклеотидов или фармакологически инициируемому сквозному прохождению стоп-кодонов, и теоретически может потребоваться всего лишь обработка одним лекарственным средством. Коррекцию гена на основе NHEJ с использованием системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, а также других сконструированных нуклеаз, включая мегануклеазы и нуклеазы типа "цинковые пальцы", можно комбинировать с другими существующими платформами ex vivo и in vivo для клеточной и генной терапии в дополнение к описанному в данном документе способу электропорации плазмид. Например, доставка системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl путем переноса генов на основе мРНК или в виде очищенных белков, способных проникать через клетку, может обеспечить возможность использования подхода к редактированию генома без ДНК, что позволит избегнуть любой возможности инсерционного мутагенеза. Ь. Репарация с участием гомологичной рекомбинации [00211] Восстановление экспрессии белка из эндогенного мутированного гена может предусматривать репарацию с участием гомологичной рекомбинации. Способ, описанный выше, дополнительно включает введение донорной матрицы в клетку. Донорная матрица может включать в себя нуклеотидную последовательность, кодирующую полнофункциональный белок или частично функциональный белок. Например, донорная матрица может включать в себя конструкцию дистрофина с уменьшенным размером, называемую минидистрофином ("минидис"), полнофункциональную конструкцию дистрофина для восстановления мутантного гена дистрофина или фрагмент гена дистрофина, который после гомологичной репарации приводит к восстановлению мутантного гена дистрофина. 13. Способы редактирования генома
[00212] Настоящее раскрытие также направлено на редактирование генома с помощью системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, описанных выше, для восстановления экспрессии полнофункционального или частично функционального белка с использованием матрицы репарации или донорной ДНК, которая может заменить весь ген или область,
содержащую мутацию. Система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl может использоваться для введения сайт-специфических двухнитевых разрывов в целевых геномных локусах. Сайт-специфические двухнитевые разрывы создаются тогда, когда система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl связывается с последовательностями целевой ДНК с помощью gRNA, позволяя тем самым расщепление целевой ДНК. Система на основе CRISPR/Cas9 и система на основе CRISPR/Cpfl имеют преимущество усовершенствованного редактирования генома из-за их высокого уровня успешной и эффективной генетической модификации. Это расщепление ДНК может стимулировать естественный механизм репарации ДНК, сводящийся к одному из двух возможных путей репарации: репарации с участием гомологичной рекомбинации (HDR) или негомологичного соединения концов (NHEJ).
[00213] Настоящее раскрытие направлено на редактирование генома с использованием системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl без матрицы репарации, которые могут эффективно корректировать рамку считывания и восстанавливать экспрессию функционального белка, вовлеченного в генетическое заболевание. Раскрытые система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl и способы могут предусматривать использование подходов коррекции на основе репарации с участием гомологичной рекомбинации или опосредованного нуклеазой негомологичного соединения концов (NHEJ), что обеспечивает возможность эффективной коррекции в линиях первичных клеток с ограниченной пролиферацией, которые могут не поддаваться гомологичной рекомбинации или генной коррекции на основе отбора. Эта стратегия объединяет быструю и надежную сборку активной системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl с эффективным способом редактирования генов для лечения генетических заболеваний вызванных мутациями в несущественных кодирующих областях, которые являются причиной сдвига рамки, преждевременных стоп-кодонов, аберрантных сайтов доноров сплайсинга или аберрантных сайтов акцепторов сплайсинга.
[00214] Настоящее раскрытие предусматривает способы
коррекции мутантного гена в клетке и лечения субъекта, страдающего от генетического заболевания, такого как DMD. Способ может включать в себя введение в клетку или субъекту системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, полинуклеотида или вектора, кодирующего указанную систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, или композицию, содержащую указанную систему на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, как описано выше. Способ может включать в себя введение системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, такое как введение белка Cas9, белка Cpfl, слитого белка Cas9, содержащего второй домен, нуклеотидной последовательности, кодирующей указанный белок Cas9, белок Cpfl или слитый белок Cas9, и/или по меньшей мере одной gRNA, где gRNA нацеливаются на разные последовательности ДНК. Целевые последовательности ДНК могут быть перекрывающимися. Количество gRNA, вводимой в клетку, может составлять по меньшей мере 1 gRNA, по меньшей мере 2 разные gRNA, по меньшей мере 3 разные gRNA, по меньшей мере 4 разные gRNA, по меньшей мере 5 разных gRNA, по меньшей мере б разных gRNA, по меньшей мере 7 разных gRNA, по меньшей мере 8 разных gRNA, по меньшей мере 9 разных gRNA, по меньшей мере 10 разных gRNA, по меньшей мере 15 разных gRNA, по меньшей мере 2 0 разных gRNA, по меньшей мере 3 0 разных gRNA или по меньшей мере 50 разных gRNA, описанных выше. gRNA может включать в себя последовательность нуклеиновой кислоты по меньшей мере одного из SEQ ID NO: 149-315, 321-323 или 32 6-32 9. Способ может предусматривать репарацию с участием гомологичной рекомбинации или негомологичное соединение концов. 14. Конструкции и плазмиды
[00215] Композиции, описанные выше, могут содержать генетические конструкции, которые кодируют систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, раскрываемую в данном документе. Генетическая конструкция, такая как плазмида, может содержать нуклеиновую кислоту, которая кодирует систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, как например: белок Cas9, белок Cpfl и слитые белки Cas 9 и/или по меньшей мере одну из оптимизированных gRNA, описанных в данном
документе. Композиции, как описано выше, могут содержать генетические конструкции, которые кодируют модифицированный вектор на основе AAV и последовательность нуклеиновой кислоты, которая кодирует систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе. Генетическая конструкция, такая как плазмида, может содержать нуклеиновую кислоту, которая кодирует систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе. Композиции, как описано выше, могут содержать генетические конструкции, которые кодируют модифицированный лентивирусный вектор, раскрываемый в данном документе. Генетическая конструкция, такая как плазмида, может содержать нуклеиновую кислоту, которая кодирует Саз9-слитый белок, и по меньшей мере одну sgRNA. Генетическая конструкция может присутствовать в клетке в виде функционирующей внехромосомной молекулы. Генетическая конструкция может быть линейной минихромосомой, включающей центромеру, теломеры или плазмиды или космиды.
[00216] Генетическая конструкция также может быть частью генома рекомбинантного вирусного вектора, в том числе рекомбинантного лентивируса, рекомбинантного аденовируса и рекомбинантного аденоассоциированного вируса. Генетическая конструкция может быть частью генетического материала в аттенуированных живых микроорганизмах или рекомбинантных микробных векторах, которые заселяют клетки. Генетические конструкции могут содержать регуляторные элементы для экспрессии генов кодирующих последовательностей нуклеиновой кислоты. Регуляторные элементы могут представлять собой промотор, энхансер, инициирующий кодон, стоп-кодон или сигнал полиаденилирования.
[00217] Последовательности нуклеиновой кислоты могут составлять генетическую конструкцию, которая может представлять собой вектор. Вектор может быть способным к экспрессированию слитого белка, такого как Саэ9-слитый белок, в клетке
млекопитающего. Вектор может быть рекомбинантным. Вектор может содержать гетерологичную нуклеиновую кислоту, кодирующую Cas 9-слитый белок. Вектор может представлять собой плазмиду. Вектор может быть применим для трансфекции клеток нуклеиновой кислотой, кодирующей СаэЭ-слитый белок, при этом трансформированную клетку-хозяина культивируют и поддерживают в условиях, при которых происходит экспрессия системы СаэЭ-слитого белка.
[00218] Кодирующие последовательности могут быть оптимизированы для стабильности и высоких уровней экспрессии. В некоторых случаях кодоны выбирают для уменьшения образования вторичной структуры РНК, такой как структура, образовавшаяся вследствие внутримолекулярного связывания.
[00219] Вектор может содержать гетерологичную нуклеиновую
кислоту, кодирующую систему на основе CRISPR/Cas9 или систему на
основе CRISPR/Cpfl, и может дополнительно содержать инициирующий
кодон, который может располагаться выше кодирующей
последовательности системы на основе CRISPR/Cas9 или системы на
основе CRISPR/Cpfl, и стоп-кодон, который может располагаться
ниже кодирующей последовательности системы на основе CRISPR/Cas9
или системы на основе CRISPR/Cpfl. Инициирующий кодон и кодон
терминации могут находиться в рамке с кодирующей
последовательностью системы на основе CRISPR/Cas9 или системы на
основе CRISPR/Cpfl. Вектор также может содержать промотор,
который функционально связан с кодирующей последовательностью
системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl.
Промотор, функционально связанный с кодирующей
последовательностью системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, может представлять собой промотор из обезьяньего вируса 40 (SV40), промотор вируса опухоли молочной железы мыши (MMTV), промотор вируса иммунодефицита человека (ВИЧ), такой как промотор длинного концевого повтора (LTR) вируса иммунодефицита крупного рогатого скота (BIV), промотор вируса Молони, промотор вируса птичьего лейкоза (ALV), промотор цитомегаловируса (CMV), такой как промотор гена немедленного раннего ответа CMV, промотор вируса Эпштейна-Барр (EBV) или промотор вируса саркомы Рауса (RSV). Промотор также может
представлять собой промотор из гена человека, такого как ген убиквитина С человека (hUbC), актина человека, миозина человека, гемоглобина человека, креатина мышц человека или металлотионеина человека. Промотор также может быть тканеспецифическим промотором, таким как специфический для мышц или кожи промотор, природный или синтетический. Примеры таких промоторов описаны в публикации патентной заявки США № US20040175727, содержание которой включено в данный документ во всей своей полноте.
[00220] Вектор также может содержать сигнал
полиаденилирования, который может располагаться ниже системы на
основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl. Сигнал
полиаденилирования может представлять собой сигнал
полиаденилирования SV4 0, сигнал полиаденилирования LTR, сигнал полиаденилирования бычьего гормона роста (bGH), сигнал полиаденилирования гормона роста человека (hGH) или сигнал полиаденилирования р-глобина человека. Сигнал полиаденилирования SV4 0 может представлять собой сигнал полиаденилирования из вектора рСЕР4 (Invitrogen, Сан-Диего, Калифорния).
[00221] Вектор также может содержать энхансер выше системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl,т. е кодирующей последовательности белка Cas9, белка Cpfl или Cas9-слитого белка или sgRNA, такой как оптимизированная gRNA, описанная в данном документе. Энхансер может быть необходим для экспрессии ДНК. Энхансер может представлять собой энхансер гена актина человека, миозина человека, гемоглобина человека, креатина мышц человека, или энхансер из вируса, такого как один из CMV, НА, RSV или EBV. Энхансеры для осуществления функции полинуклеотидами описаны в патентах США №№ 5593972, 5962428 и в заявке WO94/016737, содержание каждого из которых полностью включено посредством ссылки. Вектор также может содержать точку начала репликации млекопитающих, чтобы поддерживать вектор вне хромосомы и создавать множественные копии вектора в клетке. Вектор также может содержать регуляторную последовательность, которая может хорошо подходить для экспрессии генов в клетке млекопитающего или человека, в которую вводится вектор. Вектор
также может содержать репортерный ген, такой как ген зеленого флуоресцентного белка ("GFP"), и/или селектируемый маркер, такой как ген резистентности к гигромицину ("Нудго").
[00222] Вектор может представлять собой векторы экспрессии или системы для получения белка с помощью стандартных методик и с помощью общедоступных исходных материалов, включенных в справочник Sambrook et al., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989), который полностью включен посредством ссылки. В некоторых вариантах осуществления вектор может содержать последовательность нуклеиновой кислоты, кодирующую систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, в том числе последовательность нуклеиновой кислоты, кодирующую белок Cas9, белок Cpfl или Саэ9-слитый белок, и последовательность нуклеиновой кислоты, кодирующую по меньшей мере одну gRNA, содержащую последовательность нуклеиновой кислоты, по меньшей мере одного из SEQ ID N0: 149-315, 321-323 или 32 6-32 9.
15. Фармацевтические композиции
[00223] Композиция может быть в составе фармацевтической композиции. Фармацевтическая композиция может содержать от приблизительно 1 нг до приблизительно 10 мг ДНК, кодирующей систему на основе CRISPR/Cas9, систему на основе CRISPR/Cpfl или белковый компонент системы на основе CRISPR/Cas9, т. е. белок Cas9, белок Cpfl или СаэЭ-слитый белок. Фармацевтическая композиция может содержать от приблизительно 1 нг до приблизительно 10 мг ДНК модифицированного вектора на основе AAV и нуклеотидной последовательности, кодирующей систему на основе CRISPR/Cas9, по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе. Фармацевтическая композиция может содержать от приблизительно 1 нг до приблизительно 10 мг ДНК модифицированного лентивирусного вектора. Фармацевтические композиции в соответствии с настоящим изобретением составляют в соответствии с используемым способом введения. В тех случаях, когда фармацевтические композиции представляют собой инъекционные фармацевтические композиции, они являются стерильными, свободны от пирогенов и не содержат
частиц. Предпочтительно использование изотонического состава. Как правило, добавки для изотоничности могут включать хлорид натрия, декстрозу, маннит, сорбит и лактозу. В некоторых случаях предпочтительными являются изотонические растворы, такие как фосфатно-буферный солевой раствор. Стабилизаторы включают желатин и альбумин. В некоторых вариантах осуществления в состав добавляют сосудосуживающее средство.
[00224] Композиция может дополнительно содержать
фармацевтически приемлемое вспомогательное вещество.
Фармацевтически приемлемое вспомогательное вещество может
представлять собой функциональные молекулы, такие как
наполнители, адъюванты, носители или разбавители.
Фармацевтически приемлемое вспомогательное вещество может представлять собой средство, облегчающее трансфекцию, которое может включать поверхностно-активные средства, такие как иммуностимулирующие комплексы (ISC0MS), неполный адъювант Фрейнда, аналог LPS, в том числе монофосфориллипид А, мурамиловые пептиды, аналоги хинона, везикулы, такие как сквален и сквален, гиалуроновая кислота, липиды, липосомы, ионы кальция, вирусные белки, полианионы, поликатионы или наночастицы или другие известные средства, облегчающие трансфекцию.
[00225] Средство, облегчающее трансфекцию, представляет собой полианион, поликатион, в том числе поли-Ь-глутамат (LGS), или липид. Средство, облегчающее трансфекцию, представляет собой поли-Ь-глутамат, а более предпочтительно поли-Ь-глутамат присутствует в композиции для редактирования генома в концентрации, составляющей менее б мг/мл. Средство, облегчающее трансфекцию, может также включать поверхностно-активные средства, такие как иммуностимулирующие комплексы (ISC0MS), неполный адъювант Фрейнда, аналог LPS, в том числе монофосфориллипид А, мурамиловые пептиды, аналоги хинона и везикулы, такие как сквален и сквален, причем также можно использовать гиалуроновую кислоту при введении в сочетании с генетической конструкцией. В некоторых вариантах осуществления ДНК-вектор, кодирующий композицию, также может включать в себя средство, облегчающее трансфекцию, такое как липиды, липосомы, в
том числе лецитиновые липосомы, или другие липосомы, известные в данной области, в виде смеси ДНК-липосом (см., например, W09324640), ионы кальция, вирусные белки, полианионы, поликатионы или наночастицы или другие известные средства, облегчающие трансфекцию. Предпочтительно средство, облегчающее трансфекцию, представляет собой полианион, поликатион, в том числе поли-Ъ-глутамат (LGS), или липид. 16. Конструкции и плазмиды
[00226] Композиции, описанные выше, могут содержать
генетические конструкции, которые кодируют систему на основе
CRISPR/Cas9 или систему на основе CRISPR/Cpfl, раскрываемую в
данном документе. Генетическая конструкция, такая как плазмида
или вектор экспрессии, может содержать нуклеиновую кислоту,
которая кодирует систему на основе CRISPR/Cas9 или систему на
основе CRISPR/Cpfl, и/или по меньшей мере с одной gRNA, такой
как оптимизированная gRNA, описанная в данном документе.
Композиции, описанные выше, могут содержать генетические
конструкции, которые кодируют модифицированный лентивирусный
вектор и последовательность нуклеиновой кислоты, которая
кодирует систему на основе CRISPR/Cas9 или систему на основе
CRISPR/Cpfl, раскрываемую в данном документе. Генетическая
конструкция, такая как плазмида, может содержать нуклеиновую
кислоту, которая кодирует систему на основе CRISPR/Cas9 или
систему на основе CRISPR/Cpfl. Композиции, как описано выше,
могут содержать генетические конструкции, которые кодируют
модифицированный лентивирусный вектор. Генетическая конструкция,
такая как плазмида, может содержать нуклеиновую кислоту, которая
кодирует систему на основе CRISPR/Cas9 или систему на основе
CRISPR/Cpfl, и по меньшей мере одну sgRNA, такую как
оптимизированная gRNA, описанная в данном документе.
Генетическая конструкция может присутствовать в клетке в виде
функционирующей внехромосомной молекулы. Генетическая
конструкция может быть линейной минихромосомой, включающей центромеру, теломеры или плазмиды или космиды.
[00227] Генетическая конструкция также может быть частью генома рекомбинантного вирусного вектора, в том числе
рекомбинантного лентивируса, рекомбинантного аденовируса и рекомбинантного аденоассоциированного вируса. Генетическая конструкция может быть частью генетического материала в аттенуированных живых микроорганизмах или рекомбинантных микробных векторах, которые заселяют клетки. Генетические конструкции могут содержать регуляторные элементы для экспрессии генов кодирующих последовательностей нуклеиновой кислоты. Регуляторные элементы могут представлять собой промотор, энхансер, инициирующий кодон, стоп-кодон или сигнал полиаденилирования.
[00228] Последовательности нуклеиновой кислоты могут составлять генетическую конструкцию, которая может представлять собой вектор. Вектор может быть способным к экспрессии слитого белка, такого как система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl, в клетке млекопитающего. Вектор может быть рекомбинантным. Вектор может содержать гетерологичную нуклеиновую кислоту, кодирующую слитый белок, такой как система на основе CRISPR/Cas9. Вектор может представлять собой плазмиду. Вектор может быть применим для трансфекции клеток нуклеиновой кислотой, кодирующей систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, при этом трансформированную клетку-хозяина культивируют и поддерживают в условиях, при которых происходит экспрессия системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl.
[00229] Кодирующие последовательности могут быть оптимизированы для стабильности и высоких уровней экспрессии. В некоторых случаях кодоны выбирают для уменьшения образования вторичной структуры РНК, такой как структура, образовавшаяся вследствие внутримолекулярного связывания.
[00230] Вектор может содержать гетерологичную нуклеиновую кислоту, кодирующую систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, и может дополнительно содержать инициирующий кодон, который может располагаться выше кодирующей последовательности системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, и стоп-кодон, который может располагаться ниже кодирующей последовательности системы на основе CRISPR/Cas9
или системы на основе CRISPR/Cpfl. Инициирующий кодон и кодон терминации могут находиться в рамке с кодирующей последовательностью системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl. Вектор также может содержать промотор, который функционально связан с кодирующей последовательностью системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl. Система на основе CRISPR/Cas9 или система на основе CRISPR/Cpfl могут находиться под индуцируемым светом или химически индуцируемым контролем для обеспечения возможности динамического контроля в пространстве и времени. Промотор, функционально связанный с кодирующей последовательностью системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, может представлять собой промотор из обезьяньего вируса 40 (SV40), промотор вируса опухоли молочной железы мыши (MMTV), промотор вируса иммунодефицита человека (ВИЧ), такой как промотор длинного концевого повтора (LTR) вируса иммунодефицита крупного рогатого скота (BIV), промотор вируса Молони, промотор вируса птичьего лейкоза (ALV), промотор цитомегаловируса (CMV), такой как промотор гена немедленного раннего ответа CMV, промотор вируса Эпштейна-Барр (EBV) или промотор вируса саркомы Рауса (RSV) . Промотор также может представлять собой промотор из гена человека, такого как ген убиквитина С человека (hUbC), актина человека, миозина человека, гемоглобина человека, креатина мышц человека или металлотионеина человека. Промотор также может быть тканеспецифическим промотором, таким как специфический для мышц или кожи промотор, природный или синтетический. Примеры таких промоторов описаны в публикации патентной заявки США № US20040175727, содержание которой включено в данный документ во всей своей полноте.
[00231] Вектор также может содержать сигнал
полиаденилирования, который может располагаться ниже системы на
основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl. Сигнал
полиаденилирования может представлять собой сигнал
полиаденилирования SV4 0, сигнал полиаденилирования LTR, сигнал полиаденилирования бычьего гормона роста (bGH), сигнал полиаденилирования гормона роста человека (hGH) или сигнал
полиаденилирования р-глобина человека. Сигнал полиаденилирования SV4 0 может представлять собой сигнал полиаденилирования из вектора рСЕР4 (Invitrogen, Сан-Диего, Калифорния).
[00232] Вектор также может содержать энхансер выше системы на основе CRISPR/Cas9, или системы на основе CRISPR/Cpfl, и/или sgRNA, такой как оптимизированная gRNA, описанная в данном документе. Энхансер может быть необходим для экспрессии ДНК. Энхансер может представлять собой энхансер гена актина человека, миозина человека, гемоглобина человека, креатина мышц человека или энхансер из вируса, такого как один из CMV, НА, RSV или EBV. Энхансеры для осуществления функции полинуклеотидами описаны в патентах США №№ 5593972, 5962428 и в заявке WO94/016737, содержание каждого из которых полностью включено посредством ссылки. Вектор также может содержать точку начала репликации млекопитающих, чтобы поддерживать вектор вне хромосомы и создавать множественные копии вектора в клетке. Вектор также может содержать регуляторную последовательность, которая может хорошо подходить для экспрессии генов в клетке млекопитающего или человека, в которую вводится вектор. Вектор также может содержать репортерный ген, такой как ген зеленого флуоресцентного белка ("GFP"), и/или селектируемый маркер, такой как ген резистентности к гигромицину ("Нудго").
[00233] Вектор может представлять собой векторы экспрессии или системы для получения белка с помощью стандартных методик и с помощью общедоступных исходных материалов, включенных в справочник Sambrook et al., Molecular Cloning and Laboratory Manual, Second Ed., Cold Spring Harbor (1989), который полностью включен посредством ссылки. В некоторых вариантах осуществления вектор может содержать последовательность нуклеиновой кислоты, кодирующую систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, и последовательность нуклеиновой кислоты, кодирующую по меньшей мере одну gRNA, такую как оптимизированная gRNA, описанная в данном документе.
[00234] В некоторых вариантах осуществления gRNA, такая как оптимизированная gRNA, описанная в данном документе, кодируется
полинуклеотидной последовательностью и упакована в лентивирусный вектор. В некоторых вариантах осуществления лентивирусный вектор включает в себя кассету экспрессии. Кассета экспрессии может включать в себя промотор, функционально связанный с полинуклеотидной последовательностью, кодирующей gRNA, такую как оптимизированная gRNA, описанная в данном документе. В некоторых вариантах осуществления промотор, функционально связанный с полинуклеотидом, кодирующим gRNA, является индуцируемым, i. Векторы на основе аденоассоциированного вируса [00235] Композиция, описанная выше, включает в себя модифицированный вектор на основе аденоассоциированного вируса
(AAV) . Модифицированный вектор на основе AAV может обладать повышенным тропизмом к сердечной и скелетной мышечной ткани. Модифицированный вектор на основе AAV может быть способен доставлять и экспрессировать систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl по меньшей мере с одной gRNA, такой как оптимизированная gRNA, описанная в данном документе, в клетке млекопитающего. Например, модифицированный вектор на основе AAV может представлять собой вектор AAV-SASTG (Piacentino et al. (2012) Human Gene Therapy 23:635-646). Модифицированный вектор на основе AAV может доставлять нуклеазы в скелетную и сердечную мышцу in vivo. Модифицированный вектор на основе AAV может быть на основе одного или нескольких из ряда типов капсида, включая AAV1, AAV2, AAV5, AAV6, AAV8 и AAV9. Модифицированный вектор на основе AAV может быть на основе псевдотипа AAV2 с альтернативными тропными к мышцам капсидами AAV, таким как векторы AAV2/1, AAV2/6, AAV2/7, AAV2/8, AAV2/9, AAV2.5 и AAV/SASTG, которые эффективно трансдуцируют скелетную мышцу или сердечную мышцу путем системной и местной доставки
(Seto et al. Current Gene Therapy (2012) 12:139-151). 17. Способы доставки
[00236] В данном документе предусмотрен способ доставки системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl и оптимизированной gRNA, описанной в данном документе, для обеспечения генетических конструкций и/или белков системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl. Доставка
системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl
и оптимизированной gRNA, описанной в данном документе, может
осуществлять с помощью трансфекции или электропорации системы на
основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl и
оптимизированной gRNA, описанной в данном документе, в виде
одной или нескольких молекул нуклеиновой кислоты, которые
экспрессируются в клетке и доставляются на поверхность клетки.
Белок системы на основе CRISPR/Cas9 или системы на основе
CRISPR/Cpfl можно доставлять в клетку. Молекулы нуклеиновых
кислот можно подвергать электропорации с использованием
устройств BioRad Gene Pulser Xcell или Маха Nucleofector lib
или другого устройства для электропорации. Можно использовать
несколько различных буферов, в том числе раствор для
электропорации BioRad, фосфатно-буферный солевой раствор от
Sigma с № D8537 (PBS) , Invitrogen OptiMEM I (ОМ) или Amaxa
Nucleofector solution V (N.V.). Трансфекции могут
предусматривать реагент для трансфекции, такой как Lipofectamine 2000 .
[00237] Вектор, кодирующий белок системы на основе
CRISPR/Cas9 или системы на основе CRISPR/Cpfl, можно доставлять
в модифицированную клетку-мишень в ткани или субъекте путем
инъекции ДНК (также называемой ДНК-вакцинацией) с
электропорацией in vivo и без нее, опосредованно липосомами, с
помощью наночастиц и/или рекомбинантных векторов. Рекомбинантный
вектор можно доставить с помощью любой вирусной формы. Вирусная
форма может представлять собой рекомбинантный лентивирус,
рекомбинантный аденовирус и/или рекомбинантный
аденоассоциированный вирус.
[00238] Нуклеотид, кодирующий белок системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl, можно вводить в клетку для индуцирования генной экспрессии целевого гена. Например, одну или несколько нуклеотидных последовательностей, кодирующих систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl, нацеливающуюся на целевой ген, можно вводить в клетку млекопитающего. После доставки системы на основе CRISPR/Cas9 или системы на основе CRISPR/Cpfl в клетку и, как
результат, вектора в клетки млекопитающего, трансфицированные клетки будут экспрессировать систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl. Систему на основе CRISPR/Cas9 или систему на основе CRISPR/Cpfl можно вводить млекопитающему для индуцирования или модулирования генной экспрессии целевого гена у млекопитающего. Млекопитающее может представлять собой человека, примата, отличного от человека, корову, свинью, овцу, козу, антилопу, бизона, водного буйвола, быка, оленя, ежа, слона, ламу, альпаку, мышей, крыс или курицу, предпочтительно человека, корову, свинью или курицу.
[00239] Способы введения нуклеиновой кислоты в клетку-
хозяина известны в данной области, и любой известный способ
можно применять для введения нуклеиновой кислоты (например,
конструкции для экспрессим) в клетку. Подходящие способы
включают в себя, например, вирусную трансфекцию или инфекцию
бактериофагом, трансфекцию, конъюгацию, слияние протопластов,
липофекцию, электропорацию, осаждение фосфатом кальция,
опосредованную полиэтиленимином (PEI) трансфекцию,
опосредованную DEAE-декстраном трансфекцию, опосредованную липосомами трансфекцию, технологию биобаллистической пушки, осаждение фосфатом кальция, прямую микроинъекцию, опосредованную наночастицами доставку нуклеиновой кислоты и им подобные. В некоторых вариантах осуществления композицию можно доставлять с помощью мРНК-доставки и доставки рибонуклеопротеинового (RNP) комплекса.
18. Пути введения
[00240] Композиции могут вводиться субъекту различными
путями, включая пероральный, парентеральный, сублингвальный,
трансдермальный, ректальный, трансмукозальный, местный,
посредством ингаляции, посредством буккального введения,
внутриплевральный, внутривенный, внутриартериальный,
внутрибрюшинный, подкожный, внутримышечный, интраназальный, интратекальный и внутрисуставной или их комбинации. Для ветеринарного применения композицию можно вводить в виде отвечающего требованиям приемлемого состава в соответствии с обычной ветеринарной практикой. Ветеринар может легко определить
схему применения и способ введения, который наиболее подходит для конкретного животного. Композиции можно вводить традиционными шприцами, безыгольными устройствами для инъекций, "пушками для проведения баллистической трансфекции" или другими физическими способами, такими как электропорация ("ЕР"), "гидродинамический метод" или ультразвук.
[00241] Композицию можно доставить млекопитающему с помощью нескольких технологий, включая инъекцию ДНК (также называемую вакцинацией ДНК) с электропорацией in vivo и без нее, опосредованную липосомами, с помощью наночастиц, рекомбинантных векторов, таких как рекомбинантный лентивирус, рекомбинантный аденовирус и рекомбинантный адено-ассоциированный вирус. Композицию можно вводить в скелетную мышцу или сердечную мышцу. Например, композицию можно вводить в переднюю большеберцовую мышцу.
19. Наборы
[00242] В данном документе предусмотрен набор, который можно использовать для сайт-специфического связывания ДНК. Набор содержит композицию, как описано выше, и инструкции для использования указанной композиции. Инструкции, включенные в наборы, могут быть прикреплены к упаковочному материалу или могут быть включены в виде листка-вкладыша в упаковке. Хотя инструкции обычно представляют собой письменные или печатные материалы, они не ограничены таковыми. Любой носитель, способный хранить такие инструкции и сообщать их конечному пользователю, рассматривается в данном изобретении. Такие носители включают в себя без ограничения электронные носители (например, магнитные диски, кассеты, картриджи, чипы), оптические носители (например, CD ROM) и тому подобное. Используемый в данном документе термин "инструкции" может включать адрес интернет-сайта, который предоставляет инструкции.
[00243] Композиция может включать модифицированный вектор на основе лентивируса и нуклеотидную последовательность, кодирующую систему на основе CRISPR/Cas9 и оптимизированную gRNA, как описано выше. Система на основе CRISPR/Cas9, как описано выше, может быть включена в набор для специфического
связывания и нацеливания на конкретную регуляторную область гена-мишени.
2 0. Примеры
[00244] Смысл вышеизложенного может быть лучше раскрыт при рассмотрении следующих примеров, которые представлены в иллюстративных целях и не предназначены для ограничения объема настоящего изобретения.
Пример 1
Материалы и способы
[00245] Материалы. Буфер трис-HCl (рН 7,6) получали от Corning Life Sciences. Моногидрат монокалиевой соли L-глутаминовой кислоты, дитиотреитол (DTT) и хлорид магния получали из Sigma Aldrich Co., LLC.
[00246] Клонирование плазмид экспрессии Cas9, dCas9 и sgRNA. Плазмиды, кодирующие Cas9, dCas9 и sgRNA, которые нацеливаются на локус AAVS1 хромосомы 19 человека, клонировали, экспрессировали и очищали с использованием стандартных методов. Субстраты ДНК, используемые для визуализации-(i) субстрат 1198 п.о., полученный из сегмента локуса AAVS1 хромосомы 19 человека; (ii) "сконструированный" ДНК-субстрат 989 п.о., содержащий серию из шести полных, частичных или ошибочно спаренных целевых сайтов; и (iii) "нонсенс"-субстрат 107 8 п.о., не содержащий гомологии с протоспейсером (> 3 п.о.)-также получали с использованием стандартных методов. Плазмиды, кодирующие Cas9 дикого типа и dCas9, получали из Addgene (плазмида 39312 и плазмида 47106). Плазмиды для экспрессии Cas9 и dCas9 в бактериях клонировали с использованием Gateway Cloning (Life Technologies). Коротко, ПЦР использовали для амплификации генов Cas9 и dCas9 и добавления фланкирующих сайтов attLl и attL2. ВР-рекомбинацию проводили для переноса этих генов на челночный вектор, после чего проводили LP-рекомбинацию для переноса этих генов на pDestl7, которая добавляет N-концевую гексагистидиновую метку (Life Technologies). Плазмиды, кодирующие химерную sgRNA и варианты sgRNA (описанные ниже), клонировали, как описано выше (Perez-Pinera et al., (2013) Nature methods, 10, 973-976).
[00247] Экспрессия и очистка Cas9, dCas9. Плазмидами,
кодирующими Cas9 или dCas9, трансформировали компетентные клетки SoluBL21 (Genlantis) в соответствии со стандартными методами
(Sambrook, J., Fritsch, E.F. and Maniatis, T. (1989) Molecular cloning. Cold Spring Harbor Laboratory Press, New York). Отдельные колонии использовали для инокуляции 2 5 мл стартовых культур. 2 5 мл стартовых культур выращивали в течение ночи и использовали для инокуляции 1 л культур. Инокулированные культуры объемом 1 л выращивали в течение 5 часов при 2 5°С, после чего температуру снижали до 1б°С и индуцировали экспрессию белка добавлением 0,1 мМ IPTG. Индуцированные культуры выращивали еще в течение 12 часов при 1б°С. Клетки собирали центрифугированием при 4 000 х g и хранили при -8 0°С с целью длительного хранения.
[00248] Клеточный осадок ресуспендировали в 30 мл буфера для лизиса (50 мМ трис-НС1, 500 мМ NaCl, 10 мМ МдС12, 10% об. глицерина, 0,2% Тритона-1000 и 1 мМ PMSF). Клеточную суспензию лизировали ультразвуком при 30% рабочем цикле в течение 5 минут. Затем суспензию центрифугировали в течение 30 минут при 12000 х д. Затем супернатант отбирали и инкубировали со смолой Ni-NTA
(Qiagen) в течение 30 минут при осторожном перемешивании. Затем смолу загружали в колонку, промывали промывочным буфером (35 мМ имидизола, 50 мМ трис-НС1, 500 мМ NaCl, 10 мМ МдС12, 10% об. глицерина) и элюировали элюирующим буфером (12 0 мМ имидизола, 50 мМ Трис-НС1, 500 мМ NaCl, 10 мМ МдС12, 10% об./об. глицерина). Затем центрифужные фильтры Ultracel-30k использовали для обмена растворителей на буфер для хранения (50 мМ трис-НС1, 500 мМ NaCl, 10 мМ МдС12, 10% об./об. глицерина). Затем образцы делили на аликвоты и замораживали при -8 0°С. Типичные полиакриламидные гели с SDS очищенных Cas 9 и dCas9 представлены на Фигуре S1, указывая чистоту приблизительно > 95%.
[00249] Экспрессия и очистка вариантов sgRNA и направляющей RNA. Направляющие РНК транскрибировали in vitro с помощью набора для транскрипции MEGAshortscript Т7 (Life Technologies. ДНК-матрицы с промотором Т7 получали с помощью ПЦР из плазмид для направляющих РНК и реакции устанавливали в соответствии с инструкциями изготовителя. Матрицы Т7 для направляющих РНК с 2
усеченными нуклеотидами с 5'-конца (tru-gRNA) и направляющих РНК с 5'-удлинениями, которые формируют шпильки (hp-gRNA), получали с помощью ПЦР из плазмид стандартных gRNA. Затем РНК очищали с использованием экстракции фенол-хлороформом с помощью стандартных методов (Sambrook et al. (1989) Molecular cloning. Cold Spring Harbor Laboratory Press, New York).
[00250] Получение ДНК-субстратов. Геномную ДНК
экстрагировали и очищали из клеточной линии НЕК2 93Т с использованием набора DNeasy (Qiagen), следуя протоколу изготовителя. Затем локус AAVS1 амплифицировали с использованием ПЦР. Субстрат размером 1198 п.о., полученный из AAVS1, конструировали посредством прямой ПЦР из геномной ДНК с использованием праймеров из Integrated DNA Technologies (IDT): 5'-\Bt\-CCAGGATCAGTGAAACGCAC-3' и 5'-GAGCTCTACTGGCTTCTGCG-3', где \Bt\ представляет биотинилирование праймера на 5'-конце. ' Сконструированный' ДНК-субстрат, который содержит ряд РАМ и полных или частичных сайтов протоспейсера, заказывали в виде двух gBlock-фрагментов, каждый из которых содержит сайт рестрикции EcoRI на одном конце. Субстраты расщепляли, лигировали вместе и затем обогащали посредством ПЦР с праймерами (Integrated DNA Technologies, IDT) : 5'-\Bt\-CATGACGTGCAGCAAGC-3' и 5'-CGACGATGCGCTGAATC-3'. Для конструирования 'нонсенс'субстрата, не содержащего гомологичных сайтов (более чем 3 п.о.) для протоспейсера, синтезировали конструкцию ДНК размером 690 п.о. (GeneScript, Inc.), содержащую ряд сайтов рестрикции, и дополнительную длину ДНК из лямбда-ДНК (New England Biolabs) субклонировали в конструкцию; затем субстрат размером 107 8 п. о. амплифицировали в ПЦР с использованием праймеров (IDT): 5'-\Bt\-GACCTGCAGGCATGCAAGCTTGG-3' и 5'- CAGCGTCCCCGGTTGTGAATCT-3'. Все ДНК очищали в геле, разбавляли до 2 5 нМ в рабочем буфере (20 мМ трис-HCl (рН 7,6), 100 мМ глутамата калия, 5 мМ МдС12 и 0,4 мМ DTT) и инкубировали с 4 0-кратным избытком мономерного стрептавидина (Howarth et al., (2006) Nature methods, 3, 267273) в течение 10 минут до инкубации с Cas9/dCas9.
[00251] Натрийдодецилсульфат-полиакриламидные гели
очищенного Cas9 и dCas9 представлены на ФИГ. 8А-8В, указывая
чистоту приблизительно 95%.
[00252] Атомно-силовая микроскопия. Атомно-силовую
микроскопию (AFM) проводили на воздухе с использованием Bruker (nee Veeco) Nanoscope V Multimode с зондами RTSEP (Bruker) (номинальный коэффициент жесткости 4 0 Н/м, резонансная частота 300 кГц) . До экспериментов белок и направляющие РНК смешивали в соотношении 1:1,5 в течение 10 минут. Белок и ДНК смешивали в растворе рабочего буфера в течение по меньшей мере 10 минут (до 35 минут) при комнатной температуре, осаждали в течение 8 секунд на свежерасщепленной слюде (Ted Pella, Inc.) которую обрабатывали 3-аминопропилсилоксаном (как описано ранее (24)), промывали ультрачистой (> 17 Mfi) водой и сушили на воздухе. Белки предварительно недолго центрифугировали перед инкубацией с ДНК. При использовании стандартной sgRNA получили изображение по меньшей мере четырех препаратов для каждого экспериментального условия и по меньшей мере двух для экспериментов с другими вариантами направляющей РНК. В общем случае изображения получили с разрешающей способностью 102 4 х 102 4 на квадратных площадках размером 2,75 микрон или 2048 х 2048 на квадратных площадках размером 5,5 микрон при 1-1,5 линии/с для каждого образца. Изображения нескольких тысяч (~ 2500-6000) молекул ДНК были проанализированы для каждого экспериментального условия.
[00253] Визуализация и детализация ДНК с экстраразрешакщей
способноствю. Полученные изображения AFM сплющивали и
выравнивали (по плоскости, построчно и с помощью выравнивания
полинома 3го порядка) с использованием программного обеспечения
для анализа изображений с открытым исходным кодом для
сканирующей зондовой микроскопии Gwyddion
(http://gwyddion.net/), а затем экспортировали в MATLAB (Mathworks, Inc.) . Области 151 х 151 пикселей (405 нм х 405 нм) , содержащие каждую молекулу ДНК, сортировали путем проверки четко идентифицируемой метки стрептавидина, наличия по меньшей мере одной связанной молекулы Cas9/dCas9 и четкого сквозного пути для обеспечения отсутствия агрегации или наложения на другие молекулы ДНК. Контур ДНК прослеживали вручную и отмечали
оцененные границы стрептавидина и Cas9/dCas9. Затем кривую записи алгоритмически уточняли с помощью способа, основанного на Wiggins et al. (2006) Nature nanotechnology, 1, 137-141. Начиная с взвешенного центра тяжести стрептавидина (xi), оценивали положение следующего элемента каркаса (х2) с шагом 2,5 нм по направлению к ближайшим прослеженным вручную точкам за пределами расчетной границы стрептавидина. 11-пиксельная линия нарисована на двукратной линейной интерполяции изображения ДНК перпендикулярно сегменту линии (хх-х2) в х2. х2 перемещается в положение на нормальной линии с максимальной топографической высотой, а затем корректируется до 2,5 нм из хх на новой линии (хх-х2) . Затем положения х3 ... хп итерационно оценивают с использованием ближайших прослеженных вручную точек для создания исходного предположения для следующего положения в каркасе, затем корректируют, как и раньше, и процесс коррекции продолжают до тех пор, пока точка хп не будет находиться менее чем в 2,5 нм от конца отслеживания молекулы ДНК. Когда очищенная кривая записи входит в расчетные границы молекулы Cas9/dCas9 в точке х±, положение ДНК вместо этого рассчитывают как точку на кубическом сплайне Эрмита (с использованием точек х±_!, х±, Xj и Xj+1, где Xj представляет собой первую точку нарисованной кривой записи за расчетной границей Cas9/dCas9), расположенную на расстоянии 2,5
НМ ОТ Xi .
[00254] По завершении кривой записи извлекают высоту ДНК вдоль контура (относительно средней высоты пикселя изображения локальной области). Расчетные границы стрептавидина и Cas9/dCas9 итерационно расширяли и стягивали вокруг исходной оценки, пока они не расширялись до смежной области более чем на (n,d+ad) , где \xd и cd представляют собой среднее и стандартное отклонение высоты визуализируемой ДНК за расчетными положениями связанных белков, и оценку сводили.
[00255] Чтобы учесть любой инструментальный гистерезис, который может исказить кажущуюся длину ДНК, длину ДНК нормализовали, и только молекулы ДНК, первоначально измеренные как 2 0% от их расчетной длины (учитывая известное количество пар
оснований, 0,33 нм на пару оснований), использовали для дальнейшего анализа (для субстрата AAVS1 - отслуживаемое количество: 804; номинальная длина: 1198 п.о., средняя длина записи: 1283 п.о., станд. откл: 154 п.о.; для сконструированного субстрата - отслеживаемое количество: 1520, номинальная длина: 986 п.о., средняя длина записи: 1071 п.о., станд. откл: 124 п.о.; для 'нонсенс'-субстрата - отслеживаемое количество: 616, номинальная длина: 1078 п.о., средняя длина записи: 1217 п.о., станд. откл: 135 п.о.). Эта стадия не позволяет нам ненадлежащим образом анализировать, например, две молекулы ДНК, которые оказались на одной прямой, ДНК, которая может быть фрагментирована, или ДНК, которая могла быть расщеплена Cas9 и разделена (что было редко, см. основной текст).
[00256] Гистограммы связывания на ФИГ. 1C-1D, ФИГ. 2C-2D и ФИГ. 9 получили путем сопоставления относительного местоположения каждого связанного белка с основаниями, перекрываемыми (интерполяция по соседним элементам) белком, и суммированием общего количества белков, связанных с каждым сайтом (если один Cas9/dCas9 можно интерпретировать как находящийся в контакте с несколькими (к) сайтами, каждую область контакта утяжеляли на 1/к в гистограмме связывания). Пики в гистограмме связывания согласовывали с эмпирической функцией Гаусса ехр (- ( (х-д)/w)2) , где \х среднее положение пика и w -параметр ширины пика (w=V2a, где а - стандартное отклонение), с использованием MATLAB.
[00257] Определение кажущихся констант диссоциации dCas9. Кажущиеся константы диссоциации dCas9 с различными вариантами направляющих РНК определяли, как описано ранее (Yang et al.
(2005) Nucleic Acids Res., 33, 4322-4334). Коротко, при известных концентрациях раствора dCas9-нaпpaвляющaя RNA
([dCas9]0) и молекул ДНК ([DNA]0) подсчитывали соответствующее количество 'сконструированных' молекул ДНК со связанными белками и без них (фракция ДНК, связанной белками @dCas9) • После визуализации ДНК со связанными белками (см. выше) определяли среднее количество белков, связанных молекулой ДНК {ndCas9) . Общие
константы диссоциации рассчитывают как KdrRliK= [ДНК] [dCas9] / [ДНК •
dCas9] = (l - <9dCas9) ([dCas9]0 - ndCas9 [ДНК] 0) / ((c)dcasg)
[00258] Протоспейсер-специфические константы диссоциации Kd, протоспейсер рассчитывают аналогично, используя вместо этого ^dcasэ,протоспейсер/ фракции ДНК с dCas9, связанным в пределах ширины одного пика гауссовского распределения в их соответствующих гистограммах связывания (т. е. см. Таблицу 1), тогда как сайт-специфические константы ассоциации KarSS=Kdr ss_1 с использованием фракций каждого сайта на ДНК со связанным dCas9 (c)dCas9,ss-
[00259] Выравнивание и группирование белков. Извлекали изображения белков Cas9 и dCas9, которые были выделены и наблюдались только при контакте с ДНК в одном местоположении. Эти признаки выбирали как те, у которых характеристики более чем
(|j,d+2c7d) , которые полностью помещаются в контур 134 нм х 134 нм, где |j,d и ad представляют собой среднее и стандартное отклонение высоты ДНК, на которой связаны белки; этот этап по существу вызывал удаление большей части аггрегированного/плотно упакованного Cas9/dCas9 из набора, а также этих белков из изображений с более выраженными внешними шумами. После четырехкратной интерполяции по соседним элементам каждую характеристику белка с топографической высотой, превышающей
(|j,d+Gd) г выравнивали путем повторного смещения, вращения и отражения относительно друг друга, чтобы свести к минимуму среднеквадратические отклонения между их топографическими высотами. Матрицу расстояний составили по этому сведенному к минимуму среднеквадратическому отклонению, затем белки со стандартной sgRNA группировали в соответствии с этим критерием с помощью способа Rodriguez и Laio (27); белки с вариантами направляющих РНК группировали в соответствии с ближайшей структурой Cas9/dCas9 со стандартной sgRNA. Средние по ансамблю структуры извлекали путем выполнения безэталонного выравнивания по каждому представителю отдельных кластеров способом Penczek, Radermacher и Frank (28). Свойства популяций Cas9/dCas9 в каждом признаке (таком как сайты протоспейсера) на ДНК определяли с использованием белков, связанных в пределах ширины одного пика
гауссовских распределений, соответствующих гистограммам
связывания (т. е., см. Таблицу 1).
[00260] Кинетический метод Монте-Карло (KMC) для встраивания нити направляющей РНК и 'дыхания' R-петли. Эксперименты согласно кинетическому методу Монте-Карло (KMC) для моделирования встраивания нити направляющими РНК в сайтах протоспейсера выполняли с использованием алгоритма Гиллеспи
(непрерывное время, дискретное состояние) ((Gillespie (1976) Journal of computational physics, 22, 403-434), реализованного в MATLAB. Встраивание нити моделируют как одномерное случайное блуждание в зависящем от положения потенциале, определяемом по относительным, зависимым от соседних элементов свободным энергиям связывания ДНК:ДНК и РНК:ДНК. См., например, ФИГ. 4А. То есть, основания направляющей РНК спаривают с протоспейсером до сайта протоспейсера m (1> т> 2 0 для sgRNA и 1> т> 18 для усеченной sgRNA (tru-gRNA)) и, в первом приближении, прямую скорость
(скорость дополнительного встраивания направляющей РНК) vf оценивают с помощью симметричной аппроксимации согласно ехр(-
(AG°(m +1)РНК:ДНК - AG°(m +1) днк:днк) /2RT) , где R представляет собой постоянную Больцмана, Т представляет собой температуру (здесь 37°С для соответствия используемому набору параметров), AG° (m+1) РНК:ДНК представляет собой свободную энергию спаривания оснований между РНК и протоспейсером в сайте m+1 и AG° (m+1) ДНк:днк представляет собой свободную энергию спаривания оснований между протоспейсером и комплементарной ему нитью ДНК (поправочный член 1/2 включен для соответствия детальному равновесию). vf в состоянии т=2 0 или 18 для sgRNA или tru-gRNA устанавливали равным 0. Обратную скорость (скорость повторной гибридизации между протоспейсером и его комплементарной нитью ДНК) vr рассчитывали аналогичным образом пропорционально ехр(-
(AG° (m) днк: ДНК AG° (m) РНК:днк)/2RT) ; если состояние m-1,
моделирование останавливали (что означает диссоциацию направляющей РНК - протоспейсера). Начиная с момента времени t=0
(в условных единицах времени), для каждой итерации алгоритма определяют m-зависимые скорости и два случайных числа гг и г2
получают из равномерного распределения между 0 и 1. t продвигается на At=log (г_г) / (Vf+vr) . Состояние т увеличивается до Л1+1, если r2> vf / (vf+vr) , или снижается до т - 1 в противном случае. Для 'равновесных' измерений 'дыхания' R-петли т инициировали при 177=2 0 (или 18 в случае tru-gRNA) и алгоритм повторяли до t> 10000. Для измерений динамики "кинетики встраивания" (такой как в присутствии ошибочно спаренных оснований), 177 инициировали при 177=10 (до t=1000) .
[00261] Параметры свободной энергии получают из
литературных источников для экспериментов при 1М NaCl и 37°С.
Свободные энергии зависимой от последовательности гибридизации
ДНК: ДНК AG° (Х) ДНК:ДНК получали из SantaLucia et al. (1996)
Biochemistry, 35, 3555-3562; свободные энергии зависимой от
последовательности гибридизации РНК: РНК AG° (Х) РНК:ДНК получали из
Sugimoto et al. (1995) Biochemistry, 34, 11211-11216; и значения
AG° (х) рнк:днк в случаях введенных точечных ошибочных спариваний
rG-dG, rC-dC, rA-dA и rU-dT получали из Watkins et al. (2011)
Nucleic acids research, 39, 1894-1902 (при условиях с несколько
большей концентрацией соли). Последовательность использованного
протоспейсера представляет собой 'ATCCTGTCCCTAGTGGCCCC' (SEQ ID
NO: 336), целевой сайт AAVS1, как в экспериментах AFM;
последовательность комплементарной протоспейсеру ДНК
представляет собой 'GGGGCCACTAGGGACAGGAT' (SEQ ID NO: 337) и последовательность направляющей РНК представляет собой 'GGGGCCACUAGGGACAGGAU' (SEQ ID NO: 33 8) для sgRNA или 'GGCCACUAGGGACAGGAU' (SEQ ID NO: 33 9) для усеченной РНК.
[00262] Корреляции между стабильностью R-петли, полученной в KMC, и экспериментальными скоростями расщепления Cas9. Для анализа корреляций между взаимодействиями направляющей РНК протоспейсера и скоростями расщепления Cas9 in vivo извлекали последовательности направляющих РНК и целевой ДНК по Hsu et al. (2013) Nature biotechnology, 31, 827-832 и их экспериментально определенную оценку максимального правдоподобия (MLE) частот разрезания с помощью Cas9. Последовательности направляющих РНК и
целевой ДНК по Hsu et al. (2013) Nature Biotechnology, 31, 827832 с однонуклеотидными РАМ-дистальными (> 10 п.о. от сайта РАМ) ошибочными спариваниями по типу rG-dG, rC-dC, rA-dA и rU-dT и экспериментально определенную оценку максимального правдоподобия
(MLE) частот разрезания с помощью Cas9 в этих сайтах импортировали (л=13б) в сценарий выполнения KMC. Моделирования встраивания нити, начатые при m=10, повторяли 1000 раз для каждой последовательности (до t=100) с получением среднего отрезка времени т> 16 и сопоставляли с эмпирическими скоростями расщепления. Значимость определяли путем взятия бустрап-выборок средней доли занятости с MLE частот разрезания посредством перестановки 100000 раз, затем пересчета коэффициентов корреляции и р-значений. Свободные энергии связывания направляющей РНК - протоспейсера оценивали путем суммирования по энергиям ближайших соседних элементов с использованием наборов параметров, перечисленных выше, и корректировали с помощью фактора инициации -3,1 ккал моль-1.
[00263] Данные dCas9-tru-gRNA и dCas9-hp-gRNA для сравнения со структурными свойствами dCas9-sgRNA. При сравнении измерений высоты и объема белков в экспериментах условия визуализации AFM должны оставаться в основном одинаковыми, чтобы не вводить артефакты. Это, как правило, не представляет проблемы, например, при сравнении высот и объемов dCas9, связанной с различными сайтами на сконструированных молекулах ДНК, но представляет собой проблему при сравнении структурных свойств dCas9/Cas9 при использовании разных направляющих РНК или ДНК-субстратов. В качестве контроля использовали высоты и объемы белков стрептавидина, используемых для маркировки концов отслуживаемых молекул ДНК, которые должны оставаться неизменными при всех экспериментальных условиях для разных экспериментов. Для экспериментов с sgRNA средние значения высоты стрептавидинов отличались менее чем на 0,1 нм (среднее различие: 0,087 нм; стандартное отклонение различий: 0,052 нм) и их средние объемы
(1098 нм3) отличались менее чем на 15 нм3 (среднее различие: 14,461 нм3; стандартное отклонение различий: 10,419 нм3). Однако
средние значения высоты и объема в экспериментах с tru-gRNA и hp-gRNA отличались от средних значений высоты и объема с sgRNA на вплоть до 0,14 нм и 225 нм3, соответственно. Чтобы непосредственно сравнить результаты этих экспериментов, значения высоты dCas9 с tru-gRNA и hp-gRNA на сконструированной ДНК смещали на их разницу в средних высотах по сравнению со значениями высоты с sgRNA и объемы пересчитывали с помощью процентной разницы средних объемов. Пример 2
Атомно-силовая микроскопия фиксирует специфическое и неспецифическое связывание Cas9/dCas9 вдоль сконструированных ДНК-субстратов с высоким разрешением
[00264] Анализ кристаллографических и биохимических экспериментов показывает, что специфичность связывания и расщепления протоспейсера придается сначала путем распознавания сайтов РАМ самим Cas9 с последующим встраиванием нити связанным комплексом РНК и прямым спариванием оснований по Уотсону-Крику с протоспейсером (ФИГ. 1А) , хотя полная механистическая картина еще не выяснена. Чтобы непосредственно исследовать относительные предрасположенности к связыванию с сайтами протоспейсера и нецелевыми сайтами с одномолекулярным разрешением, 50 нМ комплексов Cas9-sgRNA или dCas9-sgRNA, нацеливающихся на локус AAVS1 хромосомы 19 человека, визуализировали с помощью AFM на воздухе после инкубации с одним из трех ДНК-субстратов (2,5 нМ):
[00265] (i) сегмент размером 1198 п.о. из локуса AAVS1, содержащий полный целевой сайт после РАМ (hre 'TGG') (ФИГ. 1С);
[00266] (ii) сконструированный ДНК-субстрат размером 989 п. о., содержащий серию из шести полных, частичных или ошибочно спаренных целевых сайтов, каждый из которых отделен с помощью приблизительно 150 п.о. (ФИГ. 1D) . Ошибочные спаривания в этих сайтах могут охватывать как 'затравочные' (РАМ-проксимальные, приблизительно 12 п.о.), так и 'незатравочные' (РАМ-дистальные) области протоспейсера. Только сайты РАМ в этом сконструированном субстрате были в этих специально разработанных местоположениях; и
[00267] (iii) "нонсенс"-ДНК размером 1078 п.о. без гомологии (последовательности свыше 3 п.о.) с целевой последовательностью (ФИГ. 9А-9С).
[00268] На ФИГ. 1С показано, что dCas9 и Cas9 демонстрируют почти одинаковые распределения связывания на субстрате AAVS1 (л=404 и л=250, соответственно) . На ФИГ. 1D показано, что на скоструированном субстрате (л=53б) dCas9 связывается с наивысшей предрасположенностью с полным протоспейсером без ошибочно спаренных (ММ) сайтов (пик 1, позже называемый полным или "ОММ" сайтом), а также с сайтами с 5 или 10 ошибочно спаренными основаниями, дистальными относительно сайта РАМ (третий и четвертый признаки от метки стрептавидина, упоминаемые позже как сайты "5ММ" или "10ММ", соответственно), хотя и со сниженным сродством. Сайты, содержащие большее количество ошибочных спариваний (второй и пятый признаки) или имеющие два РАМ-проксимальных ошибочно спаренных нуклеотида (шестой признак), связываются со значительно более низкими скоростями. (ниже) Распределение сайтов РАМ ('TGG') в каждом из субстратов.
[00269] Структурно Cas9 из S. pyogenes представляет собой мономерный белок размером 160 кДа, приблизительно 10 нм х 10 нм х 5 нм (согласно кристаллическим структурам), примерно разделенный на две блоко-подобные половины, каждая из которых содержит нуклеазный домен. В соответствии с рентгеновскими структурами dCas9 - sgRNA, визуализированные посредством AFM, выглядят как крупные овальные структуры (ФИГ. 10А-10С), после инкубирования Cas9 или dCas9 с ДНК эти структуры, связанные вдоль ДНК, наблюдали и устанавливали как Cas9 или dCas9, соответственно (ФИГ. 1В, ФИГ. 10А-1°С и ФИГ. 11A-11D). Чтобы однозначно определить последовательность сайтов, связанных Cas9 и dCas9, молекулы биотинилированной ДНК метили с одного конца с помощью моновалентной стрептавидиновой метки до AFM-визуализации. Молекулы ДНК, которые наблюдали со связанными белками Cas9 или dCas9, отбирали для дальнейшего анализа и визуализировали с экстраразрешающей способностью в соответствии с модифицированным протоколом, адаптированным из протокола Wiggins et al. (25), и
сайты, связанные с Cas9/dCas9, извлекали (подробности см. в разделе Дополнительные способы).
[00270] Этот способ оказался чрезвычайно устойчивым (таблица 1): на ДНК, связанной Cas9 или dCas9, наблюдается отчетливое накопление белков, сконцентрированных именно в месте расположения сайтов протоспейсера с прилегающим РАМ (в пределах ожидаемых 23 п.о., ФИГ. 1C-D), и проявляется в виде острых пиков. Никаких таких очевидных пиков не наблюдается в ДНК-субстрате, не содержащем целевых сайтов (ФИГ. 9А-9С). Стандартное отклонение ширины пиков составляло от 3 6 до 60 п. о., что является значительным улучшением по сравнению с экспериментами по связыванию с использованием одномолекулярной флуоресценции, которые приводят к стандартным отклонениям ширины пика а приблизительно 1000 п.о.). Средняя кажущаяся занимаемая Cas9/dCas9 площадь на ДНК покрывает 78,1 п.о. ±37,9 п.о.; это расширение кажущейся занимаемой площади на ~2 0 п. о. занимаемой Cas 9 площади на ДНК, определяемое биохимическими и кристаллографическими способами, является хорошо известным результатом свертывания изображений с шириной острия AFM. Ранее in vitro наблюдалось, что Cas9 остается связанным с целевой ДНК в течение длительных периодов времени (> 10 мин) после предполагаемого расщепления ДНК в качестве однооборотной эндонуклеазы и не может быть вытеснена из расщепленных нитей без жесткой химической обработки. Большинство молекул ДНК, наблюдаемых со связанным Cas9, выглядят как полученные из полноразмерного AAVS1 субстраты с очень небольшим (~ 5%) процентом субстратов, которые были расщеплены и разделены. После отслеживания этих молекул ДНК, наблюдали, что Cas9 связывается с этими "полноразмерными" субстратами с почти одинаковым распределением, как и dCas9 (двухсторонний тест Колмогорова-Смирнова, уровень значимости 5%) (ФИГ. 1С).
Таблица 1. Пики, зарегистрированные в гистограммах связывания на ФИГ. 1C-D для Cas9/dCas9-sgRNA и ФИГ. 2С для dCas9 с sgRNA, имеющими усечение 2 нуклеотидов на 5'- конце (tru-gRNA) , на основании эмпирической подгонки к функции Гаусса ос
ехр(- ( (х-ц) /w)2)
Направляю щая РНК:
sqPvNAa
tru-qKNAb
sqPvNA
ДНК,
Субстрат:
Сконструированная ДНК:
Сконструированная ДНК:
полученная
из AAVsl:
Общее
количеств
виЗуалиЗи
л=536
л=257
л=404
л=2 5
рованных
молекул
ДНК: с
Имя
местополо жения:
Полный сайт
Сайт 10ММ d
Сайт 5 ММ е
Полны й
сайт
Сайт 10MMf
Сайт 5ММЗ
Полны й
сайт
Полн
сайт
Cas9/dCas 9
dCas9
dCas9
dCas9
dCas9
dCas9
dCas9
dCas9
Cas9
Местополо жение:h
144167
452465
592-610
144167
452-465
592-610
316339
316339
ц1 пика (95% дов. инт.):
151, 3 (151, 1
151,6)
467, 6 (466,6
468,5)
600, 6 (599,5, 601,7)
159, 0 (158, 2,
159, 7
462, 9 (462,1, 463,6)
592, 0 (590,9, 593,0)
327, 7 (327, 3,
328,2
315,
(314
,4,
315,
Ширина
пика^
w=V2a
51,46 (51,53
57, 5 (55,84
70,8 (68,72,
53, 98 (52,2
54, 44 (52,07,
67, 88 (64,27,
84,10 (83,1 2,
58,7 (56, 8,
(95% дов. инт.):
52,38)
59,16)
72,89)
55, 76
56,81)
71,49)
85,27
60, 6
# dCas9k:
287
180,5
211,9
84,5
58,75
74, 33
#/(2w)
(пересчит
ывается
плотности
0,5688
0,5399
0,6894
0,6994
на полном
сайте,
95% конф.
инт.):
а Стандартная единая направляющая РНК (sgRNA)
ь Единая направляющая РНК с 2 нуклеотидами, усеченными с 5'-конца (tru-gRNA)
с Количество молекул ДНК, наблюдаемых как с моновалентной стрептавидиновой меткой, так и со связанным белком, которые затем визуализировали (подробнее см. раздел Вспомогательные способы).
d Целевой сайт с 10 РАМ-дистальными ошибочно спаренными нуклеотидами
е Целевой сайт с 5 РАМ-дистальными ошибочно спаренными нуклеотидами
f Предполагается, что на сконструированном ДНК-субстрате tru-gRNA будет взаимодействовать только с первыми 8 из 10 РАМ-дистальных ошибочно спаренных нуклеотидов на сайте 10ММ.
g Предполагается, что на сконструированном ДНК-субстрате tru-gRNA будет взаимодействовать только с первыми 3 из 5 РАМ-дистальных ошибочно спаренных нуклеотидов на сайте 5ММ.
h п. о. с меченого стрептавидином конца (от РАМ до конца сайта)
1 Максимум пика в гистограмме связывания (из гауссовского распределения)
з Ширина пика - л/2а, а - стандартное отклонение k Количество молекул dCas9, наблюдаемых в пределах ширины 1 пика (V2o) сайта связывания. Если Cas9/dCas9 вступает в контакт с ДНК в п сайтах, такую молекулу утяжеляют на 1/п. Если молекула перекрывает одновременно сайты 10ММ и 5ММ, # утяжеляли дополнительно на 1/2.
[00271] Изучая время пребывания dCas9 связанным с различными местоположениями вдоль сконструированного субстрата, можно определить относительную предрасположенность связывания dCas9 с различными ошибочно спаренными и частичными целевыми сайтами (ФИГ. 1D, таблица 1) . Общую константу диссоциации между dCas9 и полным ДНК-субстратом оценили как 2,70 нМ (±1,58 нМ, 95% доверительный интервал, таблица 2). Константа диссоциации dCas9, особенно в сайте полного (идеально совпадающего) протоспейсера
(в пределах ширины одного пика в гистограмме связывания), расположенного в субстрате, составляет 44,67 нМ (±1,04 нМ, 95% доверительный интервал). В ранее проведенных анализах электрофоретической подвижности (EMSA) оценили связывание dCas9-sgRNA с сайтами протоспейсера на коротких молекулах ДНК (~ 50 п.о.), составляющее от 0,5 нМ до 2 нМ. В то время как увеличение константы диссоциации в наблюдаемых сайтах протоспейсера может быть связано с наличием множественных нецелевых сайтов на сконструированном ДНК-субстрате, типично, что константы диссоциации, определенные с помощью AFM, почти на порядок выше, чем те, которые определены в традиционных анализах (2 6) . Эта разница часто объясняется неспецифическими взаимодействиями белков с тупыми концами более короткой ДНК, которые не учитываются в EMSA.
Таблица 2. Кажущиеся константы диссоциации для dCas9 с различными вариантами направляющей РНК из 'сконструированных' ДНК-субстратов размером 989 п.о. (например, ФИГ. ID, 2С и 2D), которые содержат ряд полностью или частично комплементарных сайтов протоспейсера
шесть РАМ-дистальных нацеливающихся нуклеотидов (см. текст)
d sgRNA с дополнительной 5'-шпилькой, которая перекрывает десять РАМ-дистальных нацеливающихся нуклеотидов (см. текст)
[00272] На сконструированном субстрате dCas9 относительно устойчива к дистальным ошибочным спариваниям (проявляя 50-60% предрасположенность к связыванию по сравнению с полным целевым сайтом, ФИГ. 1D и таблица 1) и имеет такое же кажущееся сродство (в пределах доверительного интервала) к целевым сайтам, содержащим 5 и 10 дистальных ошибочных спариваний (ММ) . Однако связывание с сайтами протоспейсера, содержащими только два прилегающих к РАМ ошибочных спаривания, происходило с аналогичной предрасположенностью, как с сайтами с 15 или даже 2 0 (только сайт РАМ) дистальными ошибочными спариваниями (приблизительно 5-10% предрасположенность к связыванию по сравнению с идеальной мишенью, приблизительно такая, как фоновый сигнал связывания), открытие, согласующееся с предыдущими биохимическими исследованиями. Хотя на сконструированном субстрате нет сайтов РАМ, за исключением прилегающих к протоспейсеру сайтов, на полученном из AAVS1 субстрате имеется отчетливый "плечевой пик" повышенного связывания Cas 9 и dCas9 вблизи мишени AAVS1, которая особенно обогащена сайтами РАМ. На "нонсенс"-субстрате и сегментах полученного из AAVS1 субстрата вдали от целевых сайтов едва заметные накопления dCas9 тесно отражали распределение сайтов РАМ (двухсторонний тест Колмогорова-Смирнова, уровень значимости 5%) и распределение dCas9 на "нонсенс"-субстрате более точно отражало экспериментальное распределение РАМ, чем для 71,20% из 100 000 случайно генерируемых последовательностей с теми же распределениями dA, dT, dC и dG (ФИГ. 9А-9С) . Поскольку связывание dCas9 вдоль 'нонсенс'-субстрата (с 879 сайтами РАМ в 1079 п.о.) так хорошо соответствует распределению сайтов РАМ, это интерпретировали как измерение реальных взаимодействий dCas9-PAM. По оценкам, средняя константа моносайтовой диссоциации для связывания dCas9 вдоль "неспецифического" субстрата составляла приблизительно 8 67 нМ (стандартное
отклонение+2 0 9 нМ) . Это можно понять как оценку константы диссоциации связи dCas9 на ДНК без гомологии протоспейсера. Пример 3
sgRNA с усечением двух нуклеотидов на 5'-концах (tru-gRNA) не увеличивают специфичность связывания dCas9 in vitro
[00273] Было обнаружено, что Cas 9 по-прежнему проявляет расщепляющую активность, даже если до четырех нуклеотидов направляющего (нацеливающегося на протоспейсер) сегмента sgRNA или crRNA усекали с 5'-концов и Fu et al. (21) недавно показали, что применение sgRNA с этими 5'-усечениями (оптимально на 2-3 нуклеотида) может фактически приводить к увеличению на порядок точности расщепления Cas9 in vivo. Это может свидетельствовать о том, что повышенная чувствительность к сайтам ошибочного спаривания (ММ) с использованием этих усеченных sgRNA
(называемых "tru-gRNA", ФИГ. 2А) была результатом их уменьшенной энергии связи между направляющей РНК и сайтами протоспейсера. Это означает, что энергия связи, придаваемая дополнительными 5'-нуклеотидами на sgRNA, может компенсировать любые ошибочно спаренные нуклеотиды и стабилизировать Cas9 в некорректных сайтах, тогда как tru-gRNA будут относительно менее стабильными на ДНК, если есть ошибочные спаривания.
[00274] В качестве теста этого предложенного механизма dCas9 визуализировали с tru-gRNA с двухнуклеотидным 5'-усечением относительно ранее использованной sgRNA. Комплексы dCas9-tru-gRNA инкубировали с сконструированными субстратами, которые содержали ряд полных и частичных сайтов протоспейсера. Снова обнаружили отчетливый пик точно в полном сайте протоспейсера
(ФИГ. 2С и паблица 1), хотя кажущаяся константа ассоциации по отношению к dCas9 с полной sgRNA в этом сайте значительно уменьшается (т. е., константа диссоциации увеличивается, см. таблицу 2) . Однако по сравнению со связыванием в полных сайтах протоспейсера нецелевое связывание dCas9 с tru-gRNA на сайтах протоспейсера с РАМ-дистальными ошибочными спариваниями фактически увеличивается по сравнению с dCas9 с sgRNA (ФИГ. 2С и таблица 1) . Подобно dCas9 с sgRNA, dCas9 с tru-gRNA связывается
с протоспейсером с 10 или 5 РАМ-дистальными сайтами ошибочного спаривания с приблизительно равными предрасположенностями (следует отметить, что только предполагается, что tru-gRNA будет взаимодействовать с первыми 8 и 3 ошибочными спариваниями в этих сайтах, соответственно). Эти результаты свидетельствуют о том, что повышенная точность расщепления с использованием tru-gRNA не обязательно обеспечивается при относительном снижении предрасположенности связывания в нецелевых сайтах или снижении относительной стабильности при наличии ошибочных спариваний. Скорее всего, хотя могут быть некоторые "пороговые" эффекты, когда уменьшение константы ассоциации ниже ~4-5 х 106 М эффективно устраняет расщепляющую активность in vivo, эти и дополнительные результаты, представленные ниже, показывают, что повышенная специфичность, проявляемая tru-gRNA, может быть вызвана различием в самом механизме расщепления. Более того, эти данные свидетельствуют о том, что, хотя tru-gRNA могут улучшить специфичность расщепления у активного Cas9, они могут не улучшать специфичность их связывающей активности для применений с привлечением dCas9 (или химерных производных) in vivo.
[00275] Кроме того, в предыдущих сообщениях было показано, что tru-gRNA, которые имеют 5'-усечения (оптимально на 2-3 нуклеотида) в нацеливающемся на протоспейсер сегменте, могут приводить к увеличению точности расщепления Cas9 in vivo на порядок (ФИГ. 2А) , при этом результаты, показанные в разделе Примеры, указывают на то, что усеченные gRNA не улучшают специфичности связывания dCas9 (ФИГ. 2С) . На ФИГ. 2С показано сродство связывания dCas9 со стандартной gRNA (пунктирная линия) по сравнению со сродством связывания dCas9 с tru-gRNA (trugRNA, фиолетовая линия) на молекуле ДНК, которая содержит полный протоспейсер (сайт i), а также сайты протоспейсеров с 5 и 10 РАМ-дистальными ошибочными спариваниями (сайты ii и iii, соответственно). На ФИГ. 2С показано, что стандартные направляющие РНК сохраняют значительную способность связываться с этими нецелевыми сайтами (содержащими ошибочные спаривания) и что trugRNA не проявляют относительного усиления специфичности
связывания в сайтах, которые содержат ошибочные спаривания в 5 и 10 нуклеотидах на РАМ-дистальном конце протоспейсера. Распределение связывания dCas9 с tru-gRNA демонстрирует отчетливые пики ее сродства точно в сайтах протоспейсеров с 10 РАМ-дистальными ошибочными спариваниями и 5 РАМ-дистальными ошибочными спариваниями, демонстрируя, что она не обладает повышенной специфичностью связывания по сравнению с полными sgRNA (см. таблицу 1). "Пики" в гистограмме связывания указывают на специфическое стабильное связывание в этих нецелевых сайтах. Фактически, связывание dCas9-trugRNA в нецелевых сайтах в действительности увеличивается относительно связывания с протоспейсером со стандартной направляющей РНК. Это неизбирательное связывание может ограничить их полезность для dCas9 и химерных производных dCas9. Это может также отражать отмеченное для данной системы нецелевое расщепление, которое, хотя и улучшено по сравнению со стандартными направляющими РНК, по-прежнему значимо в некоторых нецелевых сайтах. Для сравнения, не было обнаруженр никакого специфического связывания hpgRNA в этих сайтах с ошибочными спариваниями (ФИГ. 2D) . hpgRNA связаны в этих сайтах с примерно одинаковым сродством, так как они неспецифически связаны с ДНК без гомологии с протоспейсером с уменьшением на -22% максимального наблюдаемого сродства нецелевого связывания относительно усеченных gRNA. Кроме того, исходя из узкой геометрии канала связывания ДНК в Cas9, мы ожидаем, что наличие закрытой шпильки в ошибочно спаренных протоспейсерах может ингибировать конформационное изменение в Cas9, необходимое для выполнения расщепления (ФИГ. 1В).
[00276] Значительные усилия были предприняты для того, чтобы охарактеризовать эту нецелевую активность и улучшить специфичность Cas9/dCas9 посредством разумного выбора целевых последовательностей протоспейсера; оптимизации структуры sgRNA, например, путем усечения первых двух 5'-нуклеотидов в sgRNA; и применения "вносящих два однонитевых разрыва" ферментов Cas9, но четкое понимание точного механизма РНК-направляемого расщепления, поскольку оно относится к структурной биологии Cas 9, будет иметь важное значение для разработки производных
Cas 9 и направляющих РНК с повышенной точностью для их новых приложений в медицине и биологии.
[00277] В соответствии с этой целью в данном случае применяют атомно-силовую микроскопию (AFM) для анализа отдельных белков Cas9 и dCas9 S. pyogenes, поскольку они связываются с мишенями вдоль сконструированных ДНК-субстратов после инкубации с различными вариантами sgRNA. Этот метод позволяет непосредственно анализировать одновременно сайт связывания и структуру отдельных белков Cas9/dCas9, предоставляя большой объем механистической информации относительно специфичности Cas9/dCas9 с одномолекулярным разрешением. В соответствии с традиционными биохимическими исследованиями мы обнаружили, что значительное связывание Cas9/dCas9 с sgRNA происходит в сайтах, содержащих до 10 ошибочно спаренных пар оснований в целевой последовательности. Однако, хотя применение направляющих РНК с двумя нуклеотидами, усеченными с 5'-конца (tru-gRNA), как ранее показано in vivo, приводило к снижению нецелевого мутагенеза с помощью Cas9 вплоть до 5000 раз, in vitro обнаружили сходные особенности связывания dCas9 и tru-gRNA с ошибочно спаренными мишеням, как для стандартной sgRNA. Обнаружено, что добавление шпильки к 5'-концу sgRNA, которая частично перекрывает область связывания с мишенью в направляющей РНК, увеличивает специфичность dCas9 за счет общего снижения предрасположенности связывания с ДНК. Результаты авторов настоящего изобретения показывают, что общая стабильность связывания направляющей РНК-ДНК не обязательно определяет специфичность расщепления Cas9, когда ошибочные спаривания расположены на расстоянии более 10 п.о. от РАМ.
Пример 4
Направляющие РНК с 5'-шпильками, комплементарными "РАМ-дистально" нацеливающимся сегментам (hp-gRNA), модулируют абсолютную связывающую предрасположенность и профиль dCas9, связанных с ДНК с ошибочно спаренными протоспейсерами in vitro
[00278] Специфичность dCas9 можно увеличить путем удлинения 5'-конца sgRNA таким образом, чтобы она образовала структуру шпильки, которая перекрывает "РАМ-дистально" нацеливающийся (или
"незатравочный") сегмент sgRNA (ФИГ. 2В) . После того, как сайт РАМ связан и начато встраивание направляющей РНК в ДНК, шпилька открывается при связывании с полным протоспейсером и может произойти полное встраивание нити. Если в целевом сайте имеются РАМ-дистальные ошибочные спаривания, то энергетически более выгодно, чтобы шпилька оставалась закрытой и встраивание нити было затруднено. В последнее время аналогичные топологии использовались для "динамических циклов ДНК", которые вызываются встраиванием нити. В этих системах шпильки служат кинетическими барьерами для встраивания, причем скорости встраивания олигонуклеотидов замедлялись на несколько порядков в случаях попытки встраивания в мишени с ошибочными спариваниями. Шпильки здесь могут вытесняться во время встраивания в полные целевые сайты, но ингибируют встраивание, если имеются ошибочные спаривания между мишенью и незатравочной нацеливающейся областью направляющей РНК (ФИГ. 2В) . В этих случаях энергетически более выгодно, чтобы шпильки оставались закрытыми. Несмотря на предыдущие усилия, которые добавили 5'-удлинения к sgRNA, чтобы обеспечить комплементарность дополнительным нуклеотидам за протоспейсером, эти направляющие РНК не показали повышенной специфичности расщепления Cas9 in vivo. Скорее всего они расщеплялись приблизительно до своей стандартной длины в живых клетках. Основываясь на размере и структуре шпильки, шпилька может быть размещена в канале связывания ДНК молекулы Cas9/dCas9 и защищена от разрушения.
[00279] sgRNA получали с 5'-шпильками (hp-gRNA), которые перекрывали нуклеотиды, комплементарные последним шести (hp 6-gRNA) или десяти (hplO-gRNA) РАМ-дистальным сайтам протоспейсера. При сопоставлении наблюдаемых мест связывания dCas9-hp-gRNA на сконструированном ДНК-субстрате (ФИГ. 2D) острые пики наблюдали точно в сайте протоспейсера (РАМ и протоспейсер расположены в сайтах 144-167, с пиком связывания в сайте 154,0 (95% доверительный интервал: 153,3-154,8) для dCas9-hp6-gRNA и в 158,3 (95% доверительный интервал: 157,6-158,9) для dCas9-hplO-gRNA) . Специфические пики в сайтах с 5 и 10 дистальными ошибочными спариваниями значительно сплющены, причем
dCas9 и hplO-gRNA проявляют значительно уменьшенное сродство к нецелевым сайтам (снижение на 22% относительно dCas9 с trugRNA) . Пики сродства на полных сайтах протоспейсера подразумевают, что шпильки действительно открыты при полном встраивании. л=243 для прб-gRNA и л=212 для hplO-gRNA. dCas9 с hp-gRNA показывают сходное снижение сродства к целевому сайту, как и с tru-gRNA, однако в отличие от dCas9 с tru-gRNA, dCas9 с hp-RNA не демонстрирует каких-либо острых пиков связывания в нецелевых сайтах, что в противном случае указывало бы на сильное специфическое связывание. С hp6-gRNA наблюдали накопление связывания вокруг сайтов протоспейсеров с 5 или 10 ошибочно спаренными РАМ-дистальными сайтами. Поскольку у них отсутствуют острые пики связывания, наблюдаемые с sgRNA и tru-gRNA, эти накопления вряд ли указывают на специфическое связывание, а скорее могут указывать на то, что dCas9 диссоциировался из этих сайтов при адсорбции на поверхности. Это означало бы очень слабое связывание в этих нецелевых сайтах в случае hp6-gRNA.
[00280] В случае hplO-gRNA связывание с этими ошибочно спаренными сайтами находится приблизительно на уровне неспецифического связывания в любом другом месте на субстрате, что представляет собой уменьшение на 22% максимального наблюдаемого сродства нецелевого связывания по сравнению с trugRNA (уменьшение максимальной наблюдаемой константы ассоциации с 3,18 х 106 М до 2,48 х 106 М, ФИГ. 2D). Это увеличение специфичности hplO-gRNA также отражается в сходной константе диссоциации связи, как у hp6-gRNA, с сайтами протоспейсера, но в значительном увеличении общей константы диссоциации ко всему
(специфическому+неспецифическому) сконструированному субстрату
(таблица 2).
[00281] Отчетливое накопление именно в полных сайтах протоспейсера предполагает, что при встраивании в полные сайты протоспейсера шпильки в hp-gRNA фактически открываются, так как в противном случае нуклеотиды, которые связывают РАМ-дистальные сайты протоспейсера, были бы захвачены в шпильке. Вероятным механизмом для улучшения специфичности связывания является то,
что при отсутствии открытия в сайтах протоспейсеров с РАМ-дистальными ошибочными спариваниями присутствие шпильки способствует выплавлению направляющей РНК из этих нецелевых сайтов. Результаты показывают, что hp-gRNA можно использовать для настройки сродства и специфичности связывания Cas9/dCas9, а дополнительная манипуляция с длиной шпильки, длиной петли и композицией петли может обеспечить возможность более точного контроля этих свойств. Пример 5
Cas 9 и dCas9 подвергаются прогрессивному структурному переходу, поскольку они связываются с сайтами ДНК, которые все в большей степени соответствуют целевой последовательности протоспейсера.
[00282] С использованием просвечивающей электронной микроскопии с негативным окрашиванием (ТЕМ) было обнаружено, что при связывании sgRNA структура dCas9 уплотняется и поворачивается, чтобы открыть предполагаемый канал связывания ДНК между двумя его блоками. После связывания с ДНК, содержащей последовательность РАМ и протоспейсера, dCas9 подвергается второй структурной переориентации с расширением конформации. Предполагалось, что роль этого второго перехода связана с встраиванием нити sgRNA или выравниванием двух основных нуклеазных сайтов Cas 9 с двумя разделенными нитями ДНК. Однако эти исследования проводили только в присутствии или отсутствии ДНК, содержащей полностью совпадающие последовательности протоспейсеров, и изучение перехода между этими конформациями в частично совпадающих сайтах протоспейсеров может дать представление о механизме нецелевого связывания и расщепления. Поэтому помимо определения относительной предрасположенности связывания использовали AFM-визуализацию для фиксации этих предполагаемых конформационных переходов Cas9 и dCas9, поскольку они связаны с ДНК в сайтах с различной комплементарностью с протоспейсером. Извлекали объемы и максимальные топографические высоты белков Cas9 и dCas9 с sgRNA, которые находились отдельно на ДНК (л=839), и сопоставляли эти значения с их соответствующими сайтами связывания на ДНК (ФИГ. 3, ФИГ. 11A-11D
и ФИГ. 12А-12В). Распределение сайтов связывания почти идентично распределению полного набора данных, указывая на то, что этот отбор был объективным и репрезентативным. Записанное изображение каждого из этих белков извлекали (ФИГ. 11C-11D) и попарно выравнивали с помощью итерационного вращения, отражения и перевода. Структуры белка группировали в соответствии с их попарным топографическим среднеквадратическим отклонением (ФИГ. 12А-12В и таблица 3) . Явное преимущество этого метода заключается в том, что он естественным образом группирует любой моновалентный стрептавидин или любые агрегированные белки Cas9/dCas9, которые совместно локализуются на поверхности с ДНК, отдельно от тех, которые установлены как индивидуальные молекулы Cas9/dCas9, что позволяет провести объективный анализ структурных свойств этих белков на ДНК. Анализ распределения сайтов связывания с предполагаемыми молекулами стрептавидина либо агрегированными белками показывает, что они являются редкими и равномерно распределенными вдоль ДНК и, следовательно, не мешают анализу распределения сайтов связывания (ФИГ. 12А-12В) .
[00283] В сайтах, не содержащих гомологии к мишеням, например, на "нонсенс"-ДНК-субстрате, молекулы dCas9 с sgRNA были преимущественно меньшего размера и яйцевидными (ФИГ. ЗС (iii) и таблица 3). Но поскольку белки dCas9 связываются с целевыми последовательностями со возрастающей комплементарностью (ФИГ. 3 (а - 8) ) , их высота и объем значительно увеличиваются (ФИГ. 3D и 12А-12В, таблица 2) относительно неспецифического связывания, достигая максимального размера в последовательности протоспейсера. Это увеличение также сопровождается сдвигом в популяции dCas9 (ФИГ. ЗА и 12А-12В, таблица 2) из сгруппированных структур с более плоскими и яйцевидными конформациями (ФИГ. 3C(ii) и C3(iii), синий и зеленый) к тем, которые все чаще группируются с более округлыми структурами, имеющими крупный центральный выступ (ФИГ. 3C(i), желтый цвет). Эта последняя наблюдаемая конформация, вероятно, представляет собой расширенную конформацию, ранее наблюдаемую посредством
ТЕМ, а в последнее время и с помощью эксклюзионной хроматографии, и, по-видимому, является активным состоянием, где нуклеазные домены Cas9 расположены надлежащим образом вокруг ДНК, так что расщепление может происходить наиболее эффективно.
[00284] Каталитически активный Cas9 подвергается
значительному увеличению размера, поскольку он также связывается
с протоспейсерной последовательностью (ФИГ. 3 (s)); однако имеется
небольшое, но статистически значимое уменьшение размера по
сравнению с dCas9, и конформация Cas 9 в полных сайтах
протоспейсера имеет тенденцию группироваться с более плоскими
(зелеными) структурами. Поскольку одновременно не
контролировали, была ли расщеплена ДНК во время визуализации, неясно, является ли это еще одним конформационным изменением после расщепления ДНК, или является результатом мутационных различий между Cas9 и dCas9; однако, поскольку связывание и встраивание нити ранее были определены как ограничивающие скорость этапы, вероятно, что ДНК внутри Cas9 расщепляется во время этих измерений.
(Cas9)
9, 1%)
G: 32% (± 11,4%)
B: 26% (± 10,7%)
10 MM (dCas9)
Сконстру ированна я
sgRNA
Y: 25% (± 8,9%)
G: 31% (± 9,7%)
B: 34% (± 9, 9%)
0,5510 ± 0, 011
1,601 ± 0, 026
5 MM (dCas9)
Сконстру ированна я
sgRNA
Y: 34% (± 8,8%)
G: 34% (± 8,8%)
B: 25% (± 8,1%)
0, 6055 ± 0, 024
1,790 ± 0, 049
Неспециф ический (Cas9+dC as9)
AAVSI+HO нсенсс
sgRNA
274
Y: 21% (± 4,8%)
G: 17% (± 4,5%)
B: 39% (± 5, 8%)
0,4780 ± 0, 015
1,553 ± 0, 034
Протоспе йсер (dCas9)
Сконстру ированна я
trugRNA9
Y: 26% (±
12,5%)
G: 17% (±
10,7%)
B: 34% (± 13,6%)
0,5421 ± 0, 041
1,761 ± 0, 079
(10 MM) (dCas9)d
Сконстру ированна я
trugRNA
Y: 13% (±
11,5%)
G: 38% (±
16, 7%)
B: 19% (± 13,5%)
0,5123 ± 0, 049
1, 665 ± 0, 099
(5 MM
(dCas9)d , f
Сконстру ированна я
trugRNA
Y: 18% (± 12,8%) G: 29% (± 15,3%)
B: 24% (± 14,2%)
0,5346 ± 0, 048
1,705 ± 0, 084
Неспециф ический (dCas9)
Сконстру ированна я
trugRNA
Y: 14% (± 8,0%)
G: 17% (± 8, 6%)
B: 29% (± 10,5%)
0,4554 ± 0, 035
1,532 ± 0, 059
Протоспе йсер (dCas9)
Сконстру ированна я
hp 6-gRNAg
Y: 26% (±
12,5%)
G: 17% (±
10,7%)
B: 34% (± 13,6%)
0,5940 ± 0, 043
1,860 ± 0, 109
Неспециф ический (dCas9)
Сконстру ированна я
hp 6-gRNA
Y: 13% (±
11,5%)
G: 38% (±
16, 7%)
0,4656 ± 0, 024
1,572 ± 0, 047
Протоспе йсер (dCas9)
Сконстру ированна я
hplO-gRNAg
В: 19^ 13,5%) "47
Y: 26^ 12,5%) G: 17 s 10,7%) В: 34^ 13,6%)
0,6304 0, 038 1,837 ± 0, 076
Неспециф ический (dCas9)
Сконстру ированна я
hplO-gRNA 32
Y: 13е, 11,5%) G: 3 8 ^ 16, 7%) В: 19е, 13,5%)
0,5181 0, 027 1, 644 ± 0, 050
а Общее количество молекул, наблюдаемых в пределах двух стандартных отклонений от этих сайтов. Ниже: доля популяции в основных трех структурных кластерах (±95% доверительный интервал при биномиальном распределении), окрашенная как на ФИГ. 2 в основном тексте (У=желтый кластер, 6=зеленый кластер, В=светло-синий кластер). Полное распределение свойств по кластерам на ФИГ. 12А-12В.
ь Стандартная ошибка среднего
с Стандартная ошибка среднего
d Отклоненная нулевая гипотеза о распределении высота-объем отличается (р > 0,05; Т2-критерий Хотеллинга)
е Предполагается, что на сконструированном ДНК-субстрате tru-gRNA будет взаимодействовать только с первыми 8 из 10 РАМ-дистальных ошибочно спаренных нуклеотидов на сайте 10ММ (отмечены "8ММ" на ФИГ. 3D).
f Предполагается, что на сконструированном ДНК-субстрате tru-gRNA будет взаимодействовать только с первыми 3 из 5 РАМ-дистальных ошибочно спаренных нуклеотидов на сайте 5ММ (отмечены
"ЗММ" на ФИГ. 3D).
g См. дополнительный комментарий 1 в поддержку информации относительно коррекции высот и объемов белков с tru-gRNA и hpgRNA, чтобы их можно было сравнить с таковыми с sgRNA.
пример 6
Взаимодействия между направляющей РНК и ДНК-мишенью внутри или вблизи 16го сайта протоспейсера стабилизирует конформационное изменение Cas9/dCas9
[00285] AFM-визуализация непосредственно показывает, что хотя dCas9/Cas9 сохраняет значительную предрасположенность связывать сайты протоспейсера с наличием до десяти дистальных ошибочных спариваний, связывание с сайтами ДНК, которые все больее комплементарны протоспейсеру, приводит к увеличению сдвига в популяции белков dCas9/Cas9 в сторону того, что похоже на активную конформацию. Примечательно, что наблюдается аналогичный сдвиг в структуре между нецелевыми сайтами и идеально соответствующими сайтами для dCas9 с hp-gRNA (таблица 2 и ФИГ. 13) . Известно, что наличие комплементарных РАМ-дистальных последовательностей связано с повышенной стабильностью Cas9 на ДНК. Недавно было обнаружено, что связывание Cas9 с однонитевой ДНК с увеличением РАМ-дистальной комплементарности к протоспейсеру (от 10 до 2 0 сайтов) приводит к увеличению изменения размера белка. Это также было связано с переходом активности Cas9 от внесения однонитевого разрыва к полному расщеплению. Здесь мы можем непосредственно определить объемы Cas9/dCas9, связанной на сайтах двухнитевой ДНК. Анализ структурных свойств отдельных белков Cas9/dCas9 на двухнитевой ДНК обнаруживает устойчивый конформационный переход со все более соответствующими целевыми последовательностями, который согласуется с механизмом "конформационного отбора", где спаривание оснований sgRNA с этими дистальными сайтами также стабилизирует активную конформацию, так что может происходить эффективное расщепление, тогда как связывание с сайтами с многочисленными дистальными ошибочными спариваниями сдвигает равновесие от активной структуры (т. е. см. ФИГ. 4D) .
[00286] По этому принципу мы видим, что данный эффект
значительно подавлен для dCas9 с tru-gRNA (ФИГ. 3D и таблица 3) с меньшими сдвигами между структурными популяциями, в пределах которых группируются белки (ФИГ. 13) . Кроме того, хотя мы видим статистическую разницу между свойствами высоты-объема dCas9-trugRNA, которые неспецифически связаны, и теми, которые связаны в полном или частичном сайтах протоспейсера (р < 0,05; Т2-критерий Хотеллинга), в сайтах, которые все более соответствуют протоспейсеру (10ММ, 5ММ и полные сайты протоспейсера), их структурные свойства не являются статистически различимыми (ФИГ. 3D и таблица 3). Недавно возникло предположение, что, хотя встраивание в первые 10 п.о. протоспейсера инициирует конформационное изменение в Cas9, полное встраивание направляющей РНК в протоспейсер помогает привести к дальнейшему смещению в полностью активное состояние. Поэтому предполагали, что наблюдаемое подавление конформационного изменения во все более соответствующих сайтах протоспейсера для dCas9 с tru-gRNA
(по сравнению с таковыми с sgRNA) было результатом снижения стабильности этих направляющих РНК в РАМ-дистальных сайтах.
[00287] Чтобы изучить относительную стабильность sgRNA и tru-gRNA в этих сайтах, проводили исследование согласно кинетическому методу Монте-Карло (KMC) динамической структуры R-петли, то есть структуры, образованной встраивающейся направляющей РНК, связанной с сегментом непрерывной ДНК, раскрывая однонитевую петлю комплементарной ДНК этого сегмента
(ФИГ. 4А) - во время и после встраивания нити. Для более
подробной информации см. раздел Дополнительные способы. Коротко,
используя алгоритм Гиллеспи, моделировали встраивание нити
направляющей РНК, связанной с сайтом протоспейсера т, в виде
последовательной нуклеотид за нуклеотидом конкуренции между
встраиванием (нарушение спаривания оснований между
протоспейсером и комплементарной ему нитью ДНК, затем замена парами оснований протоспейсер-направляющая РНК) и повторным отжигом (обратимым), с зависимыми от последовательности скоростями встраивания и повторного отжига vf и vr, соответственно (ФИГ. 4А) . В первом приближении аппроксимируют скорость перехода из состояния т в т+1, vf, пропорционально ехр(
(AG° (m +1)РНК:ДНК - AG° (m +1) днк:днк) /2RT) , где AG° (m+1) РНк:днк представляет собой свободную энергию спаривания оснований между РНК и протоспейсером в сайте л?+1 и AG° (л?+1) ДНК:ДНК представляет собой свободную энергию спаривания оснований между протоспейсером и комплементарной ему нитью ДНК в m+l (R идеальная газовая постоянная, Т - температура, а член 1/2 включен для соответствия детальному равновесию). vr аналогично оценивают пропорционально ехр (- (AG° (Л?) ДНК:ДНК ~ AG° (Л?) РНК:ДНК)/2RT) . Скорости перехода этого типа ранее использовали для вычислительных исследований нуклеотидного спаривания и стабильности, и здесь они позволили нам фиксировать общую динамику R-петли зависимым от последовательности образом.
[00288] В общем случае пары оснований РНК:ДНК энергетически сильнее, чем пары оснований ДНК:ДНК, и при равновесии по интегральным кривым KMC видно, что направляющие РНК стабильно связаны с протоспейсером, как и ожидалось (ФИГ. 4С) . Тем не менее, хотя sgRNA довольно стабильна и остается почти полностью встроенной - в ходе 95% моделируемой динамики нить остается встроенной до 19го сайта протоспейсера (ФИГ. 4В) - tru-gRNA проявляет значительные колебания повторного отжига протоспейсера в РАМ-дистальных сайтах (ФИГ. 4В и 4С). Поскольку единственным различием между dCas9-sgRNA и dCas9-tru-gRNA является простое усечение двух 5'-нуклеотидов в направляющей РНК, и поскольку мы наблюдаем ингибирование конформационного изменения dCas9-sgRNA в сайтах, содержащих 5 РАМ-дистальных ошибочных спариваний, эти результаты показывают, что конформационное изменение в полностью активном состоянии стабилизируется взаимодействием между направляющей РНК и протоспейсером вблизи 16го сайта протоспейсера, которое нарушается при нестабильности tru-gRNA в этой области. Фактически эксперименты KMC показывают, что средняя продолжительность нахождения между полным встраиванием и повторным отжигом ДНК обратно к 1бу сайту уменьшается на два порядка при замене sgRNA на tru-gRNA (ФИГ. 4С, вставка). Этот результат согласуется с более ранним свидетельством того, что хотя активность Cas9 с вариантами tru-gRNA с усечениями 2 или 3
нуклеотидов (нт) модулировалась в зависимости от особенности последовательности, расщепление во всех тестируемых случаях резко снижалось на ~ 90% - 100% при усечении 4 нт и устранялось после усечения 5 нт. Конформационное изменение для состояния активации белка стабилизируется этими взаимодействиями на 16м сайте протоспейсера или вблизи него. Это свидетельство подтверждается стабильностью gRNA в 14м - 17м положениях протоспейсера, которую оценивали в дополнительных экспериментах KMC, описанных ниже, и которая коррелировала с экспериментальным нецелевым расщеплением in vivo (см. ниже), в то время как стабильности направляющей РНК в сайтах протоспейсера 18-2 0 не было.
пример 7
Флуктуации R-петли направляющей РНК-протоспейсера предлагают механизм устойчивости к ошибочному спариванию под влиянием Cas9/dCas9 и повышенной специфичности расщепления под влиянием tru-gRNA
[00289] Чтобы исследовать механизмы, с помощью которых Cas9 или dCas9 могут переносить ошибочные спаривания в протоспейсерах или приобретать чувствительность к ним, провели серию экспериментов KMC с использованием сайта протоспейсера AAVS1, куда ввели один или два РАМ-дистальных (> 10 п.о. от РАМ) ошибочных спаривания (ФИГ. 5) . Cas9, как правило, более устойчив к РАМ-дистальным ошибочным спариваниям, чем к РАМ-проксимальным ошибочным спариваниям. Однако Hsu et al. (2013) Nature Biotechnology, 31, 827-832 выявили значительные и вариабельные различия в расчетных скоростях расщепления Cas 9 в протоспейсерах, содержащих РАМ-дистальные ошибочные спаривания, в зависимости от особенности последовательности, типа ошибочного спаривания и сайта ошибочного спаривания. Основываясь на наших экспериментах AFM и более ранних экспериментах KMC, мы предположили, что различия в скорости расщепления также могут быть результатом разной стабильности направляющей РНК вблизи 16го сайта протоспейсера. Для этого моделирования изучали только последовательности с парами протоспейсер-направляющая РНК,
которые приводили бы к изолированным ошибочным спариваниям rG-dG, rC-dC, rA-dA и rU-dT, для которых зависящие от последовательности термодинамические данные являются наиболее полными и подходят для модели KMC. Не ожидается, что эффекты этих ошибочно спаренных оснований существенно снижают общую энергию связи между sgRNA и протоспейсером (Таблица 4); например, одиночные rG-dG, гС-dC, rA-dA и rU-dT ошибочные спаривания снижают температуру плавления РНК:ДНК в среднем на 1,7°С. Скорее всего их эффект, как ожидается, будет кинетическим, а не термодинамическим по своей природе, препятствуя смещению нити при ошибочном спаривании. Поэтому инициировали эксперименты согласно кинетическому методу Монте-Карло, исходя из 10го сайта протоспейсера (начальная длина R-петли т=10), такого как будет иметь место при встраивании нити.
Таблица 4. Последовательности и оценка максимального правдоподобия (MLE) частот разрезания по Hsu et al. (2013) Nature Biotechnology, 31, 827-832, применяемые для корреляционного анализа (сайт ошибочного спаривания в целевой последовательности выделен жирным шрифтом).
Целевая последовательность
SEQ ID NO
Нацеливающаяся на протоспейсер область направляющей РНК
SEQ CD NO
MLE частоты разрезания
(Hsu et al.
(2013))
Расчет ная AG°37 (ккал/ моль)
TTCTTCTTCTGCTCGGACTC
GUGUCCGAG СAGAAGAAGAA
149
0,10384
-32,16
TTCTTCTTCTGCTCGGACTC
GACU С С GAG СAGAAGAAGAA
150
0,12609
-31,4
TTCTTCTTCTGCTCGGACTC
GAGAC С GAG СAGAAGAAGAA
151
0,13145
-32,69
TTCTTCTTCTGCTCGGACTC
GAGU G С GAG СAGAAGAAGAA
152
0,097464
-32,33
TTCTTCTTCTGCTCGGACTC
GAGU С G GAG СAGAAGAAGAA
153
0,12704
-33,43
TTCTTCTTCTGCTCGGACTC
GAGU С С СAG СAGAAGAAGAA
154
0,079556
-31,37
TTCTTCTTCTGCTCGGACTC
GAGUCCGUG СAGAAGAAGAA
155
0,11197
-32,36
TTCTTCTTCTGCTCGGACTC
GAGU С С GAC СAGAAGAAGAA
156
0,04788
-31,9
TTCTTCTTCTGCTCGGACTC
GAGU С С GAG GAGAAGAAGAA
157
0,085461
-32,83
TTCTTCTTCTGCTCGGACTC
GAGUCCGAGCU GAAGAAGAA
158
0,074938
-32,22
TTCTTCTTCTGCTCGGACTC
GUGUCCGAG СAGAAGAAGAA
159
0,15588
-32,16
TTCTTCTTCTGCTCGGACTC
GACU С С GAG СAGAAGAAGAA
160
0,11015
-31,4
TTCTTCTTCTGCTCGGACTC
GAGAC С GAG СAGAAGAAGAA
161
0,11435
-32,69
TTCTTCTTCTGCTCGGACTC
GAGU G C GAG CAGAAGAAGAA
162
0,15072
-32,33
TTCTTCTTCTGCTCGGACTC
GAGU C G GAG CAGAAGAAGAA
163
0,11567
-33,43
TTCTTCTTCTGCTCGGACTC
GAGU С С CAG CAGAAGAAGAA
164
0,070181
-31,37
TTCTTCTTCTGCTCGGACTC
GAGUCCGUG CAGAAGAAGAA
165
0,10538
-32,36
TTCTTCTTCTGCTCGGACTC
GAGU С C GAC CAGAAGAAGAA
166
0,064145
-31,9
TTCTTCTTCTGCTCGGACTC
GAGU С C GAG GAGAAGAAGAA
167
0,085148
-32,83
TTCTTCTTCTGCTCGGACTC
GAGUCCGAGCU GAAGAAGAA
168
0,064903
-32,22
CCCTAGTCATTGGAGGTGAC
GACACCUCCAAUGACUAGGG
169
0,062949
-32,19
CCCTAGTCATTGGAGGTGAC
GUGACCUCCAAUGACUAGGG
170
0,063313
-31,73
CCCTAGTCATTGGAGGTGAC
GUCUCCUCCAAUGACUAGGG
171
0,068655
-31,72
CCCTAGTCATTGGAGGTGAC
GUCAGCUCCAAUGACUAGGG
172
0,073003
-32
CCCTAGTCATTGGAGGTGAC
GU CAC GU С CAAU GACUAG G G
173
0,037401
-32,63
CCCTAGTCATTGGAGGTGAC
GU CAC CAC CAAU GACUAG G G
174
0,038197
-32,11
CCCTAGTCATTGGAGGTGAC
GUCACCUGCAAUGACUAGGG
175
0,041758
-31,63
CCCTAGTCATTGGAGGTGAC
GUCACCUCGAAUGACUAGGG
176
0,067751
-32,23
CCCTAGTCATTGGAGGTGAC
GUCACCUCCUAUGACUAGGG
177
0,031653
-31,62
CCCTAGTCATTGGAGGTGAC
GUCACCUCCAUUGACUAGGG
178
0,027161
-31,77
ATGGGGAGGACATCGATGTC
GUCAUCGAUGUCCUCCCCAU
179
0,027124
-31,26
AT G G G GAG GACAT C GATGT C
GAGAU C GAU GU C CU С С C CAU
180
0,022366
-31,7
ATGGGGAGGACATCGATGTC
GACUU C GAU GU C CU С С C CAU
181
0,01127
-30,92
AT G G G GAG GACAT C GATGT C
GACAAC GAU GU C CU С С C CAU
182
0,011836
-31,44
AT G G G GAG GACAT C GATGT C
GACAUGGAUGUCCUCCCCAU
183
0,009146
-31,83
AT G G G GAG GACAT С GATGT C
GACAU C CAU GU C CU С С C CAU
184
0,006333
-30,27
ATGGGGAGGACATCGATGTC
GACAU CGUUGUCCUCCC CAU
185
0,006232
-31,06
AT G G G GAG GACAT C GATGT C
GACAU C GAAGU C CU С С C CAU
186
0,007085
-31,64
AT G G G GAG GACAT C GATGT C
GACAU C GAU CUCCUCCC CAU
187
0,001545
-30,32
AT G G G GAG GACAT C GATGT C
GACAU C GAU GAC CU С С C CAU
188
0,00025
-31,59
ATCACATCAACCGGTGGCGC
GGGCCACCGGUUGAUGUGAU
189
0,15963
-35,23
ATCACATCAACCGGTGGCGC
GCCCCACCGGUUGAUGUGAU
190
0,14121
-32,17
ATCACATCAACCGGTGGCGC
GCGGCACCGGUUGAUGUGAU
191
0,18743
-33,43
ATCACATCAACCGGTGGCGC
GCGCGACCGGUUGAUGUGAU
192
0,1634
-33,63
ATCACATCAACCGGTGGCGC
GCGCCUCCGGUUGAUGUGAU
193
0,15877
-33,12
ATCACATCAACCGGTGGCGC
GCGCCAGCGGUUGAUGUGAU
194
0,029249
-33,4
ATCACATCAACCGGTGGCGC
GCGCCACGGGUUGAUGUGAU
195
0,12208
-34,13
ATCACATCAACCGGTGGCGC
GCGCCACCCGUUGAUGUGAU
196
0,051622
-31,57
ATCACATCAACCGGTGGCGC
GCGCCACCGCUUGAUGUGAU
197
0,004914
-31,74
ATCACATCAACCGGTGGCGC
GCGCCACCGGAUGAUGUGAU
198
0,032227
-33,79
GAGTTTCTCATCTGTGCCCC
G G G С CACAGAU GAGAAACU C
199
0,015879
-33,54
CCAGCTTCTGCCGTTTGTAC
GUUCAAACGGCAGAAGCUGG
200
0,037469
-33,17
CCAGCTTCTGCCGTTTGTAC
GUACUAACGGCAGAAGCUGG
201
0,059921
-32,92
CCAGCTTCTGCCGTTTGTAC
GUACAAAC G G GAGAAG CU G G
202
0,032605
-33,43
TTCCTCCTCCAGCTTCTGCC
G С CAGAAG CU G GAG GAG GAA
203
0,000481
-35,94
TTCCTCCTCCAGCTTCTGCC
G G CACAAG CU G GAG GAG GAA
204
0,041538
-37, 4
TTCCTCCTCCAGCTTCTGCC
G G CAGAAC CU G GAG GAG GAA
205
0,047874
-37, 5
TTCCTCCTCCAGCTTCTGCC
G G CAGAAG CAG GAG GAG GAA
206
0,050381
-38,61
TTCCTCCTCCAGCTTCTGCC
G G CAGAAG CU C GAG GAG GAA
207
0,006459
-36,92
CCGGTTGATGTGATGGGAGC
GCACCCAUCACAUCAACCGG
208
0,03967
-33,31
CCGGTTGATGTGATGGGAGC
GCUCCCUUCACAUCAACCGG
209
0,033426
-32,52
CCGGTTGATGTGATGGGAGC
GCUCCCAACACAUCAACCGG
210
0,035651
-33,04
CCGGTTGATGTGATGGGAGC
GCUCCCAUCAGAUCAACCGG
211
0,03209
-33, 3
GCAGCAAGCAGCACTCTGCC
GGCAGUGUGCUGCUUGCUGC
212
0,004014
-32,46
GCAGCAAGCAGCACTCTGCC
GGCAGAGUGCAGCUUGCUGC
213
0,000219
-33,11
GCTTGGGCCCACGCAGGGGC
GCCCCAGCGUGGGCCCAAGC
214
0,001487
-38,81
GCTTGGGCCCACGCAGGGGC
GCCCCUGCCUGGGCCCAAGC
215
0,003322
-36,77
GCTTCGTGGCAATGCGCCAC
GUGGCCCAUUGCCACGAAGC
216
0,000463
-32,67
GCTTGGGCCCACGCAGGGGC
GCCCCUGCGUCGGCCCAAGC
217
-37,12
AAGCTGGACTCTGGCCACTC
GAGUGGCCUGAGUCCAGCUU
218
0,010169
-33,02
TTCTTCTTCTGCTCGGACTC
GAGAC C GAG CAGAAGAAGAA
219
0,084395
-32,69
TTCTTCTTCTGCTCGGACTC
GAGU С C GAG GAGAAGAAGAA
220
0,051852
-32,83
TTCTTCTTCTGCTCGGACTC
GAGUCCGAGCU GAAGAAGAA
221
0,050685
-32,22
GAGTTTCTCATCTGTGCCCC
GGGGCACAGUUGAGAAACUC
222
0,004503
-34,16
TTCCTCCTCCAGCTTCTGCC
G G CAGAAG GU G GAG GAG GAA
223
0,006035
-38,83
TTCCTCCTCCAGCTTCTGCC
G G CAGAAG CAG GAG GAG GAA
224
0,011364
-38,61
AG CAGAAGAAGAAG G G С T С C
GGAGCCCUUGUUCUUCUGCU
225
0,007206
-29,83
AAGCTGGACTCTGGCCACTC
GAGUGGCCUGAGUCCAGCUU
226
-33,02
CCCTAGTCATTGGAGGTGAC
GACACCUCCAAUGACUAGGG
227
0,053611
-32,19
CCCTAGTCATTGGAGGTGAC
GUGACCUCCAAUGACUAGGG
228
0,05399
-31,73
CCCTAGTCATTGGAGGTGAC
GUCUCCUCCAAUGACUAGGG
229
0,070404
-31,72
CCCTAGTCATTGGAGGTGAC
GUCAGCUCCAAUGACUAGGG
230
0,067678
-32
CCCTAGTCATTGGAGGTGAC
GU CAC GU С CAAU GACUAG G G
231
0,03597
-32,63
CCCTAGTCATTGGAGGTGAC
GU CAC CAC CAAU GACUAG G G
232
0,025207
-32,11
CCCTAGTCATTGGAGGTGAC
GUCACCUGCAAUGACUAGGG
233
0,056019
-31,63
CCCTAGTCATTGGAGGTGAC
GUCACCUCGAAUGACUAGGG
234
0,065347
-32,23
CCCTAGTCATTGGAGGTGAC
GUCACCUCCUAUGACUAGGG
235
0,063769
-31,62
CCCTAGTCATTGGAGGTGAC
100
GUCACCUCCAUUGACUAGGG
236
0,052644
-31,77
ATGGGGAGGACATCGATGTC
101
GUCAUCGAUGUCCUCCCCAU
237
0,020295
-31,26
AT G G G GAG GACAT C GATGT C
102
GAGAU C GAU GU C CU С С C CAU
238
0,012126
-31,7
ATGGGGAGGACATCGATGTC
103
GACUU C GAU GU C CU С С C CAU
239
0,007202
-30,92
AT G G G GAG GACAT C GATGT C
104
GACAAC GAU GU C CU С С C CAU
240
0,010912
-31,44
AT G G G GAG GACAT C GATGT C
105
GACAUGGAUGUCCUCCCCAU
241
0,009292
-31,83
AT G G G GAG GACAT С GATGT C
106
GACAU C CAU GU C CU С С C CAU
242
0,006125
-30,27
ATGGGGAGGACATCGATGTC
107
GACAU CGUUGUCCUCCC CAU
243
0,007805
-31,06
AT G G G GAG GACAT С GATGT C
108
GACAU C GAAGU C CU С С C CAU
244
0,010174
-31,64
AT G G G GAG GACAT C GATGT C
109
GACAU C GAU CUCCUCCC CAU
245
0,003595
-30,32
AT G G G GAG GACAT C GATGT C
110
GACAU C GAU GAC CU С С C CAU
246
0,000206
-31,59
ATCACATCAACCGGTGGCGC
111
GGGCCACCGGUUGAUGUGAU
247
0,18977
-35,23
ATCACATCAACCGGTGGCGC
112
GCCCCACCGGUUGAUGUGAU
248
0,13525
-32,17
ATCACATCAACCGGTGGCGC
113
GCGGCACCGGUUGAUGUGAU
249
0,14749
-33,43
ATCACATCAACCGGTGGCGC
114
GCGCGACCGGUUGAUGUGAU
250
0,13952
-33,63
ATCACATCAACCGGTGGCGC
115
GCGCCUCCGGUUGAUGUGAU
251
0,13949
-33,12
ATCACATCAACCGGTGGCGC
116
GCGCCAGCGGUUGAUGUGAU
252
0,031221
-33, 4
ATCACATCAACCGGTGGCGC
117
GCGCCACGGGUUGAUGUGAU
253
0,14776
-34,13
ATCACATCAACCGGTGGCGC
118
GCGCCACCCGUUGAUGUGAU
254
0,050539
-31,57
ATCACATCAACCGGTGGCGC
119
GCGCCACCGCUUGAUGUGAU
255
0,003982
-31,74
ATCACATCAACCGGTGGCGC
120
GCGCCACCGGAUGAUGUGAU
256
0,015494
-33,79
GAGTTTCTCATCTGTGCCCC
121
G G G С CACAGAU GAGAAACU C
257
0,025334
-33,54
CCAGCTTCTGCCGTTTGTAC
122
GUUCAAACGGCAGAAGCUGG
258
0,062094
-33,17
CCAGCTTCTGCCGTTTGTAC
123
GUACUAACGGCAGAAGCUGG
259
0,080429
-32,92
CCAGCTTCTGCCGTTTGTAC
124
GUACAAAC G G GAGAAG CU G G
260
0,032505
-33,43
TTCCTCCTCCAGCTTCTGCC
125
G С CAGAAG CU G GAG GAG GAA
261
0,00117
-35,94
TTCCTCCTCCAGCTTCTGCC
126
G G CACAAG CU G GAG GAG GAA
262
0,034381
-37, 4
TTCCTCCTCCAGCTTCTGCC
127
G G CAGAAC CU G GAG GAG GAA
263
0,059128
-37, 5
TTCCTCCTCCAGCTTCTGCC
128
G G CAGAAG CAG GAG GAG GAA
264
0,05162
-38,61
TTCCTCCTCCAGCTTCTGCC
129
G G CAGAAG CU C GAG GAG GAA
265
0,007682
-36,92
CCGGTTGATGTGATGGGAGC
130
GCACCCAUCACAUCAACCGG
266
0,093725
-33,31
CCGGTTGATGTGATGGGAGC
131
GCUCCCUUCACAUCAACCGG
267
0,075435
-32,52
CCGGTTGATGTGATGGGAGC
132
GCUCCCAACACAUCAACCGG
268
0,091723
-33,04
CCGGTTGATGTGATGGGAGC
133
GCUCCCAUCAGAUCAACCGG
269
0,070319
-33, 3
GCAGCAAGCAGCACTCTGCC
134
GGCAGUGUGCUGCUUGCUGC
270
0,006754
-32,46
GCAGCAAGCAGCACTCTGCC
135
GGCAGAGUGCAGCUUGCUGC
271
0,000545
-33,11
GCTTGGGCCCACGCAGGGGC
136
GCCCCAGCGUGGGCCCAAGC
272
0,004676
-38,81
GCTTGGGCCCACGCAGGGGC
137
GCCCCUGCCUGGGCCCAAGC
273
0,001918
-36,77
GCTTCGTGGCAATGCGCCAC
138
GUGGCCCAUUGCCACGAAGC
274
0,001045
-32,67
GCTTGGGCCCACGCAGGGGC
139
GCCCCUGCGUCGGCCCAAGC
275
-37,12
AAGCTGGACTCTGGCCACTC
140
GAGUGGCCUGAGUCCAGCUU
276
0,008891
-33,02
TTCTTCTTCTGCTCGGACTC
141
GAGAC C GAG CAGAAGAAGAA
277
0,091861
-32,69
TTCTTCTTCTGCTCGGACTC
142
GAGU С C GAG GAGAAGAAGAA
278
0,062783
-32,83
TTCTTCTTCTGCTCGGACTC
143
GAGUCCGAGCU GAAGAAGAA
279
0,044444
-32,22
GAGTTTCTCATCTGTGCCCC
144
GGGGCACAGUUGAGAAACUC
280
0,0053
-34,16
TTCCTCCTCCAGCTTCTGCC
145
G G CAGAAG GU G GAG GAG GAA
281
0,00714
-38,83
TTCCTCCTCCAGCTTCTGCC
146
G G CAGAAG CAG GAG GAG GAA
282
0,019945
-38,61
AG CAGAAGAAGAAG G G С T С C
147
GGAGCCCUUGUUCUUCUGCU
283
0,007996
-29,83
AAGCTGGACTCTGGCCACTC
148
GAGUGGCCUGAGUCCAGCUU
284
0,006102
-33,02
[00290] Затем проводили эксперименты KMC для исследования кинетики встраивания нити в присутствии РАМ-дистальных ошибочных спариваний. Во всех случаях (по 1000 испытаний каждый) направляющие РНК остаются достаточно стабильно связанными даже тогда, когда имеются ошибочные спаривания ( т. е. не наблюдаются при полном расплавлении) и часто могут быстро обходить эти сайты для завершения полного встраивания (ФИГ. 5С и ФИГ. 14А-14С), хотя среднее время первого прохождения полного встраивания нити значительно варьировало в зависимости от положения сайта ошибочного спаривания (ФИГ. 14А-14С). R-петли довольно стабильны во время встраивания (ФИГ. 5А) , так как sgRNA часто способны оставаться полностью встроенными даже при наличии множественных ошибочных спариваний. Результаты качественно напоминают результаты ранее проведенных in vitro исследований связывания и расщепления dCas9/Cas9 на ошибочно спаренных мишенях. Однако в случае tru-gRNA (ФИГ. 5В) R-петли часто останавливаются за сайтами ошибочного спаривания. Среднее время первого прохода через ошибочное спаривание аналогично как для sgRNA, так и для tru-gRNA (ФИГ. 14А-14С), но проверка динамики для KMC показывает, что из-за присущей изменчивости R-петли tru-gRNA, tru-gRNA часто быстро "повторно останавливаются" за ошибочным спариванием (ФИГ. 5С) . Для sgRNA эта повторная остановка является гораздо более редкой. Следовательно, в сочетании с AFM-визуализацией результаты экспериментов KMC предполагают, что происхождение повышенной специфичности tru-gRNA заключается не в различии во время связывания, а в изменчивости ее R-петли (ФИГ. 4D) , так что она повторно останавливается за ошибочными спариваниями даже после первоначального их обхода, что делает Cas9 менее склонным принимать активную конформацию. Относительно sgRNA, как только ошибочное спаривание обойдено, она может оставаться полностью встроенной с относительно небольшими отклонениями, что свидетельствует о механизме толерантности к ошибочному спариванию. Пример 8
Стабильность взаимодействия направляющей РНК с 14-17-м положениями протоспейсера коррелирует с экспериментальными
значениями скорости нецелевого расщепления Cas9, в то время как общие энергии связи направляющей РНК и протоспейсера не коррелируют
[00291] Чтобы проверить, связана ли стабильность R-петли на или вблизи 16го положения протоспейсера, которую связали согласно исследованиям AFM с конформационным изменением в Cas9, с активностью Cas 9 in vivo, выполняли анализ согласно кинетическому методу Монте-Карло (KMC) стабильности R-петли на последовательностях, использованных Hsu et al. (2013) Nature Biotechnology, 31, 827-832. Набор данных Hsu et al. (2013) Nature Biotechnology, 31, 827-832 состоял из измерений частоты расщепления в пятнадцати различных мишенях-протоспейсерах, содержащих различные точечные мутации, относительно направляющей РНК, которые выполняли для исследования специфичности расщепления Cas9. Этот набор данных содержал 13 6 пар протоспейсер-направляющая РНК, имеющих одно изолированное ошибочное спаривание по типу rG-dG, rC-dC, rA-dA и rU-dT в PAM-дистальной области (таблица 4), которые мы исследовали с использованием способов KMC, инициированных при размере R-петли лг=10, для моделирования встраивания. Включение одного сайта ошибочного спаривания из этого набора уменьшало величину их общей свободной энергии связи направляющей РНК-протоспейсера в среднем только приблизительно на 6% по сравнению с идеально соответствующими мишенями, хотя, как уже упоминалось, имело место широкое распределение частот разрезания Cas9, наблюдаемое для этих пар направляющих РНК и протоспейсеров, происхождение которого не было очевидным.
[00292] Средний отрезок времени, в течение которого РНК стабильно связывалась с каждым сайтом протоспейсера, определяли для каждой направляющей РНК более чем в 1000 испытаний, который затем сопоставляли с оценкой расщепляющей активности Cas9 с максимальным правдоподобием (таблица 4, ФИГ. 6 и ФИГ. 15). Умеренную (0,433), но статистически значимую (р < 1 х 10~6) корреляцию обнаружили между стабильностью направляющей РНК в 16м положении протоспейсера и описанной нецелевой расщепляющей
активностью. Примечательно, что не была обнаружена статистически значимая корреляция между скоростью расщепления и предсказанными энергиями связи ДНК:РНК в отдельности (0,0786; р=0,3631) (ФИГ. 6А и 6В) . В дополнение к стабильности R-петли в 16м положении также обнаружили значимую корреляцию для стабильности 17го сайта протоспейсера и описанного расщепления (таблица 5) , но это не относилось к сайтам> 18го сайта (ФИГ. б) . Хотя представленная в данном документе кинетическая модель Монте-Карло основана на относительно простой модели встраивания нити, эти результаты также свидетельствуют о том, что стабильность 16го - 17го сайтов протоспейсера и, следовательно, сопутствующие конформационные изменения, которые мы наблюдали, связаны с расщепляющей активностью Cas9 in vivo (ФИГ. 4D).
Таблица 5. Корреляции между экспериментальными (Hsu et al. (2013) Nature Biotechnology, 31, 827-832) частотами разрезания в целевых сайтах, содержащих одно ошибочное спаривание rG'dG, rC'dC, rA-dA и rU *dT в РАМ-дистальной области (> 10го сайта протоспейсера)3 и измерения стабильности направляющая РНК протоспейсер
loam (р-значение)
Коэффициент корреляции
Hsu et al. (2 013) расчетная частота разрезания в зависимости от энергии связи направляющей РНК протоспейсера13
-0,4400
(0,0786)
Расчетная частота разрезания по Hsu et al. в зависимости от положения сайта ошибочного спаривания
-5,8258
0,3990
Расчетная частота разрезания по Hsu et al. в зависимости от фрагментарного
т=14
-9,5550
0,5078
т=15
-7,4854
0,4522
т=16
-б,9510
0,4333
т=17
-3,9270
0,3191
т=18
-0,7639
(0,1159)
времени, в течение
т=19
-0,5546
(0,1058)
которого
направляющая РНК
связана в сайтах >
тго сайта
т=20
-0,2346
(-0,0176)
протоспейсера в
смоделированнной
R-петле (КМС)С
а л=136.
ьДля подробной информации см. таблицу 4.
сДля подробной информации см. текст. Max(t)=100.
[00293] Большая часть анализа была ограничена взаимодействиями с 16м - 18м нуклеотидами протоспейсера из-за наблюдаемых структурных различий между dCas9 с tru-gRNA и sgRNA. Однако также наблюдалось увеличение силы и статистической значимости корреляций между расщеплением и стабильностью 14го и 15го сайтов протоспейсера (ФИГ. 6) с наибольшей значимостью для корреляции в 14м сайте. Поскольку R-петля является динамической структурой (ФИГ. 4D), возможно, что взаимодействия с этими сайтами являются теми критическими взаимодействиями, которые, как считается, ответственны за расщепление ДНК. Усечение направляющей РНК на 4 или 5 нуклеотидов может устранить расщепляющую активность при достаточной дестабилизации R-петли в 14м или 15м положении во многом таким же образом, как tru-gRNA дестабилизирует R-петлю в 16м - 17м сайтах. Однако, поскольку в данной модели в 14й и 15й сайты необходимо встраивание всякий раз, когда 16й сайт связан с sgRNA, вполне вероятно, что эти положения дополнительно информативны, поскольку они также сильнее отрицательно коррелировали с вероятностью диссоциации sgRNA из дуплекса до обхода сайта ошибочного спаривания (ФИГ. 6Ai и ФИГ. 16В), еще один механизм, с помощью которого расщепление не сможет произойти. В настоящее время нет кристаллографических свидетельств, которые непосредственно связывают встраивание нити с наблюдаемым конформационным изменением, которое, как полагают, обеспечивает возможность
расщепления. Однако на основании доказательств, обеспеченных экспериментами AFM, представленными в данном документе, и результатов кинетических моделирований Монте-Карло мы заключаем, что стабильность направляющей gRNA в 14м - 17м сайтах протоспейсера во время встраивания имеет решающее значение для этого конформационного изменения и, в конечном счете, специфичности расщепления Cas9.
[00294] Кроме того, R-петля как динамическая структура в
конкуренции между встраиванием нити и повторным отжигом ДНК
может быть полезна в понимании механизмов нецелевого расщепления
и толерантности к ошибочному спариванию. Никакой статистически
значимой корреляции не было обнаружено между скоростью
расщепления и предсказанными энергиями связи ДНК-РНК в
отдельности (ФИГ. 6В), указывая на то, что кинетику встраивания
нити можно рассмотреть при попытке определения активности Cas9 в
нецелевых сайтах. Хотя расщепление устраняется, когда 4 или 5
нуклеотидов усечены в направляющей РНК, Cas 9 все еще способен
расщеплять ДНК с вплоть до б дистальными сайтами ошибочного
спаривания. Временные неспецифические взаимодействия в этих РАМ-
дистальных сайтах могут достаточно стабилизировать
конформационные сдвиги, необходимые для расщепления. Поскольку
мы наблюдаем популяции меньшинства dCas9-sgRNA в частичных
сайтах протоспейсера со структурами, аналогичными тем, что
находятся в полном протоспейсере (желтый, ФИГ. ЗС (i)), эта
популяция может представлять долю Cas9 во временно
стабилизированной активной конформации. Таким образом, эта
популяция может нести ответственность за нецелевое расщепление.
[00295] В то время как специфичность связывания Cas9/dCas9 во многом определяется взаимодействием с РАМ-проксимальной областью, специфичность расщепления ДНК, скорее всего, определяется конформационным изменением в активированную структуру, которая стабилизируется путем взаимодействия направляющей РНК в области 14й -17й п.о. протоспейсера (ФИГ. 4D) . Эксперименты согласно кинетическому методу Монте-Карло показывают, что R-петля, образованная во время встраивания нити направляющей РНК, может быть довольно динамичной структурой,
даже когда направляющая РНК остается стабильно связанной, что предполагает механизм улучшения специфичности tru-gRNA и происхождения нецелевого расщепления посредством временной стабильности направляющей РНК-протоспейсера в критической области вокруг сайтов ошибочного спаривания. Предлагаемые механизмы для воздействия каждого из вариантов sgRNA на специфичность Cas9/dCas9 суммированы на ФИГ. 7.
[00296] С использованием AFM было обнаружено, что hp-gRNA значительно ослабили или устранили специфическое связывание в гомеологичных мишенях. hp-gRNA могут быть полезными для модулирования сродства связывания и специфичности dCas9 в их потенциальных применениях в биологии и медицине. В частности, исходя из узкой геометрии канала связывания Cas9, наличие закрытой шпильки в ошибочно спаренных протоспейсерах может ингибировать конформационное изменение Cas9 в активное состояние. Открытие шпильки в hp-gRNA при связывании также может быть использовано в качестве зависимого от связывания сигнала in vivo, например, для образования динамических структур ДНК/РНК только при связывании с определенными сайтами.
[00297] Ранее проведенные исследования усечения направляющей РНК подняли вопрос о том, почему в естественных системах Cas9 используется crRNA, которая нацеливается на сайты протоспейсера размером 2 0 п.о., когда для расщепления требуется только направляющая последовательность из 16 нуклеотидов, а дополнительные нуклеотиды (> 18) не улучшают специфичность расщепления in vivo. Эти результаты свидетельствуют о том, что присутствие "лишних" 5'-нуклеотидов, которые связываются с 19м и 2 0м сайтами протоспейсера, буферизует этот неустойчивый повторный отжиг на критических 14м - 17м сайтах протоспейсера, обеспечивая возможность осуществления эффективного конформационного изменения в активное состояние и последующего расщепления. Результаты экспериментов AFM и KMC показывают, что стабильность направляющей РНК в этих сайтах сдвигает равновесную структуру Cas9 в сторону активной конформации при полном встраивании (ФИГ. 4А), тогда как изменчивость R-петель для "усеченных" направляющих РНК уменьшает давление для смещения равновесия в
активное состояние. Неизбирательная активность Cas9 с sgRNA относительно tru-gRNA также может иметь эволюционные преимущества в своей роли средства адаптивного иммунитета у прокариот к инвазивной ДНК, поскольку ДНК внедряющихся фагов подвергается быстрым точечным мутациям в сайтах, на которые нацелен Cas9, чтобы избегать расщепления.
[00298] Конструирование последовательностей направляющей РНК для применений Cas9/dCas9 in vivo было сфокусировано главным образом на предотвращении мишеней с множеством сайтов с подобными последовательностями в геноме. Тем не менее, недавнее исследование, изучающее нецелевое расщепление, показало, что существующие способы прогнозирования нецелевой активности были в значительной степени неэффективными. Стабильность R-петли во время встраивания коррелирует со скоростями нецелевого расщепления значительно лучше, чем энергии связи направляющей РНК-протоспейсера в отдельности или положение ошибочного спаривания (еще один важный критерий, используемый при проектировании направляющей РНК, таблица 3). Стабильность R-петли в более короткие моменты времени после начала встраивания коррелировала с экспериментальной скоростью расщепления намного лучше, чем долгосрочная стабильность в экспериментах KMC (ФИГ. 16А), указывая на то, что кинетика встраивания нити является фактором в предсказании нецелевой активности.
Пример 9
Тестирование in vivo
[00299] Активность оптимизированной gRNA тестировали в живых клетках для исследования специфичности связывания dCas9. Несколько gRNA-шпилек (hp-gRNA) разрабатывали для каждого из четырех целевых местоположений (протоспейсеров) в геноме человека (ФИГ. 17 и 18) . Одно из них было в гене дистрофина
(ФИГ. 19-23), другое было в гене ЕМХ1 (ФИГ. 24-29 и 44), а две мишени были в гене VEGFA, помечены VEGFA1 (ФИГ. 30-37) и VEGFA3
(ФИГ. 38-43) . Все эксперименты проводили в клетках НЕК293Т.
[00300] Дополнительные нуклеотиды (нт) добавляли к 5'-концу полной направляющей РНК (gRNA, полная длина 2 0 нт) и разрабатывали для образования шпилек и вторичных структур путем
гибридизации с нуклеотидами, целенаправленно воздействующими на 5'-протоспейсер, или с нуклеотидами в середине или на 3'-конце области, нацеливающейся на протоспейсер, для модулирования активности связывания и расщепления Cas9 относительно протоспейсеров.
[00301] Одну вторичную структуру нацеливающейся на VEGFA1 hp-gRNA компьютерно разрабатывали с использованием способов, описанных в данном документе, для предотвращения связывания в известном нецелевом сайте, позволяя при этом связывание с полным протоспейсером (ФИГ. 44А-44С). Hp-gRNA выбирали так, чтобы иметь продолжительность связывания, большую чем продолжительность связывания полной gRNA в целевом сайте или равную ей, и продолжительность связывания, меньшую чем продолжительность связывания полноразмерной gRNA в 3 главных нецелевых сайтах или равную ей. Другие 5'-структуры разрабатывали с включением неоднозначных пар dG-rU для модулирования энергии вторичных структур hp-gRNA или добавляли к концу усеченных gRNA (tru-gRNA, <2 0 нт) , которые сами, как было показано, стимулировали высокую специфичность активности Cas9.
[00302] Работа с клетками. Для проведения анализа глубокого секвенирования клетки 2 93Т трансфицировали плазмидами, которые экспрессировали Cas9 и представляющую интерес gRNA. Клетки инкубировали в течение 4 дней, позволяя Cas9 и gRNA проявлять свою максимальную активность. Затем клетки собирали и их геномную ДНК очищали. Использовали gRNA, которые были хорошо охарактеризованы в литературе (т. е. были известны их целевые и нецелевые сайты).
[00303] Анализ Surveyor. По сравнению с глубоким секвенированием анализ surveyor ниже по производительности и менее чувствителен. Однако анализ surveyor является более быстрым и менее техническим при анализе данных, обеспечивая изображения на геле. Таким образом, surveyor выполняли в качестве первого прохода и наилучшие условия анализировали в трех повторах с глубоким секвенированием. Как глубокое секвенирование, так и Surveyor представляют собой способы количественной оценки мутационных событий, вызванных Cas9+gRNA.
[00304] Работа с клетками для Surveyor была такой же, как описано выше. После очистки геномной ДНК разрабатывали праймеры для амплификации целевого сайта. В этом эксперименте использовали пул из 200 тыс. клеток, и каждая из них имела другую мутацию, поскольку репарация ДНК была стохастической. Сайт по всем 2 00 тыс. клеткам амплифицировали для создания гетерогенного продукта ПЦР: некоторые ампликоны имели делеции, некоторые имели вставки, а некоторые были дикого типа и немодифицированы из-за того, что каждая клетка стохастически (то есть случайно, со сниженной точностью) репарировала сайты разреза Cas9.
[00305] Гетерогенный ПЦР-пул нагревали и репарировали, а в некоторых случаях разные нити отжигали друг с другом: нить ДНК дикого типа могла связаться с ДНК со вставкой, или вставка могла связаться с делецией. Когда это происходит, образуется небольшой "пузырь", и эта структура называется гетеродуплексом ДНК (см. ФИГ. 4 6) .
[00306] Нуклеазу surveyor использовали для обнаружения этих гетеродуплексов путем их расщепления. Затем расщепление ДНК было посредником для мутационной активности Cas9. ПЦР-пул разделяли на геле и интенсивность этих расщепленных полос использовали для количественной оценки уровня активности Cas9.
[00307] Глубокое секвенирование. Праймеры разрабатывали для амплификации этих известных мишеней/нецелевых участков. В этой PCR использовали высоконадежную полимеразу. На этих праймерах также присутствовали адаптеры Illumina, так что их можно было пометить штрихкодом и загрузить на платформу Illumina Mi-Seq. На фигурах и в кратком описании графических материалов описано количество шпилек, количество мишеней, количество нецелевых участков, охват секвенирования и т. д. Хороший охват получили во всех образцах, используемых в анализе. Среднее число прочтений/образцов составило 20000. Наименьшее количество прочтений образца составило 1700. Очень небольшое количество мишеней не генерировало достаточное количество выровненных прочтений и не было включено в анализ.
[00308] Полученные данные секвенирования анализировали с
использованием программного обеспечения CRISPResso (Pinello et al. Nat Biotechnol. (2016) 34(7) :695-697) ), которое выравнивает прочтения глубокого секвенирования с определенными сайтами известных нецелевых или целевых местоположений. Результаты этого программного обеспечения сопоставляли с внутрилабораторными сценариями, в которых выполнялось глобальное выравнивание прочтений глубокого секвенирования с геномом человека и очень хорошо коррелировало. Мутационные частоты определяли количественно с использованием CRISPResso, и полученные данные отображали на демонстрируемых гистограммах для каждого гена-мишени .
[00309] Сначала конструкции тестировали с использованием анализа Surveyor для проверки вставок/делеций после экспрессии Cas9 и hp-gRNA в клетках НЕК в целевом сайте и нецелевых сайтах, на которые, как известно, целенаправленно воздействовали с использованием стандартных gRNA (см. таблицу 6) . Активность в этих сайтах сравнивали со стандартной gRNA и усеченными gRNA (tru-gRNA). Они показаны ниже в виде гелей, демонстрирующих расщепление нуклеазой Surveyor ПЦР-амплифицированной геномной ДНК, где расщепление указывает на мутагенез при помощи Cas9. Таблица 6
Протоспейсеры Геномные мишени
1 целевая,
Дистрофии 1 нецелевая
ЕМХ1 1 целевая, 7 нецелевых VEGFA1 1 целевая, 10 нецелевых
VEGFA3 1 целевая, 22 нецелевых
[00310] Наиболее перспективные конструкции hp-gRNA выбрали для дополнительного количественного анализа с использованием секвенирования нового поколения для оценки активности Cas9 в целевых и нецелевых сайтах в клетках НЕК. Специфичность определяли как целевые хиты/сумма(нецелевые хиты).
[00311] В то время как активность Cas9 в целом была равна или несколько уменьшалась при использовании hp-gRNA, каждая hp
gRNA, выбранная для экспериментов глубокого секвенирования, показала повышенную специфичность по сравнению с полными gRNA и в большинстве случаев была равна или больше, чем tru-gRNA, с точки зрения специфичности.
[00312] В одном случае шпилька hp-gRNA, нацеливающаяся на ЕМХ1, демонстрировала > 6000-кратное улучшение специфичности по сравнению с полной gRNA (по сравнению с tru-gRNA с " 100-кратным улучшением по сравнению с gRNA). Нацеливающаяся на VEGFA1 hpgRNA с вычислительно разработанной вторичной структурой с использованием внутрилабораторного алгоритма значительно превосходила активность tru-gRNA с точки зрения специфичности (в 18 раз по сравнению с 3-кратным улучшением при использовании gRNA). Эти hp-gRNA тестировали в сочетании с Cas9 из S. pyogenes. На ФИГ. 44А-44С показаны анализы Surveyor нацеливающихся на ЕМХ1 hp-gRNA с Cas9 из S. aureous, проявляющих целевую активность и не обнаруживающих нецелевой активности в отличие от tru-gRNA, которые проявили значительную нецелевую активность.
Пример 10
hp-gRNA для системы CRISPR/Cpfl
[00313] Эксперименты разработали для воспроизведения результатов Kleinstiver et al. , Nat. Biotech. (2016) 34:869-874. Kleinstiver и соавт. использовали полноразмерные gRNA, чтобы показать, что Cpfl из Lachnospiraceae восприимчив к разрезанию в нецелевых сайтах с ошибочными спариваниями 8-9 нуклеотидов в дополнение к РАМ-дистальным сайтам при использовании gRNA, которые имели ошибочные спаривания с целевым сайтом в разных местоположениях (ФИГ. 47) . В этом примере направляющие РНК-шпильки, используемые с системой CRISPR-Cas типа V CRISPR-Cpfl, разрабатывали и испытывали, как описано выше, с использованием способов по настоящему изобретению.
[00314] Для тестирования нецелевой активности Cpfl с дополнительными элементами вторичной структуры и без них на ген DNMT1 (ТТТС CTGATGGGTCCATGTCTGTTACTC (SEQ ID N0: 330) ) нацеливались для расщепления с помощью Cpfl. "Нецелевую
активность" тестировали с использованием направляющих РНК, которые имели ошибочно спаренный нуклеотид в положении 9, например, CTGATGGTqCATGTCTGTTA (SEQ ID NO: 331), с использованием полноразмерных направляющих РНК длиной 2 0 нуклеотидов или усеченных gRNA длиной 17 нуклеотидов CTGATGGTgCATGTCTG (SEQ ID NO: 332) . Элементы вторичной структуры длиной 9 нуклеотидов добавляли к 3'-концу направляющих РНК с Cpfl для гибридизации с сегментом направляющей РНК, окружающим ошибочно спаренный нуклеотид, где в этом случае "линкерный" элемент состоял из 4 3'-нт сегмента, нацеливающегося на протоспейсер, т. е. CTGATGGTgCATGTCT GTTA AGACAT G сАС СA (SEQ ID NO: 333) и CTGATGGTgCATG TCTG CATGсACСA (SEQ ID NO: 334). Анализ Surveyor показывает, что включение этих дополнительных 3'-элементов уменьшило или устранило нецелевую активность в сайте DNMT1, проявляемую полными или усеченными gRNA.
[00315] hp-gRNA разрабатывали с конструкцией "внутренней" шпильки, в которой 4 РАМ-дистальных нуклеотида служили в качестве петли. Шпильку добавляли к 3'-концу gRNA. В таблице 7 показаны последовательности hp-gRNA с промежутком в последовательностях, который разделяет эту область. Ошибочное спаривание показано в нижнем регистре.
[00316] Результаты исследования Surveyor этих hp-gRNA показаны на ФИГ. 4 8 и демонстрируют, что добавление шпильки к 3'-концу устраняло нецелевую активность. Дорожка 1 показывает контроль; дорожка 2 показывает полноразмерную gRNA, содержащую ошибочно спаренный нуклеотид в положении 9; дорожка 3 показывает полноразмерную gRNA, содержащую ошибочно спаренный нуклеотид в положении 9 и дополнительную структуру 3'-шпильки; дорожка 4 показывает усеченную gRNA, содержащую ошибочно спаренный нуклеотид в положении 9; и дорожка 5 показывает усеченную gRNA, содержащую ошибочно спаренный нуклеотид в положении 9 и дополнительную структуру 3'-шпильки. Используемые праймеры Surveyor также показаны в Таблице 7.
[00317] Cpfl переносит ошибочные спаривания в нуклеотидах 8-10 при использовании нормальных направляющих РНК и расщепляет ДНК в этих нецелевых сайтах (ФИГ. 47) . Как показано на ФИГ. 48,
hp-gRNA Cpfl смогли устранить нецелевую активность, продемонстрированную у Kleinstiver, тогда как усеченные gRNA не могли.
сопровождающие примеры являются просто иллюстративными и не должны рассматриваться в качестве ограничений объема настоящего изобретения, которое определяется исключительно прилагаемой формулой изобретения и ее эквивалентами.
[00319] Различные изменения и модификации раскрытых вариантов осуществления будут очевидны для специалистов в данной области техники. Такие изменения и модификации, включая без ограничения те, которые связаны с химическими структурами, заместителями, производными, промежуточными соединениями, синтезами, композициями, составами или способами применения
настоящего изобретения, могут быть сделаны без отхода от его сути и объема.
[00320] В целях обеспечения полноты различные аспекты настоящего изобретения изложены в следующих пронумерованных пунктах.
[00321] Пункт 1. Способ получения оптимизированной
направляющей РНК (gRNA), при этом способ предусматривает: а)
идентификацию представляющей интерес целевой области, при этом
представляющая интерес целевая область содержит
последовательность протоспейсера; Ь) определение
полинуклеотидной последовательности полноразмерной gRNA, которая
нацеливается на представляющую интерес целевую область, при этом
полноразмерная gRNA содержит нацеливающиеся на протоспейсер
последовательность или сегмент; с) определение по меньшей мере
одного или нескольких нецелевых сайтов для полноразмерной gRNA;
d) получение полинуклеотидной последовательности первой gRNA,
при этом первая gRNA содержит полинуклеотидную
последовательность полноразмерной gRNA и сегмент РНК, при этом сегмент РНК содержит полинуклеотидную последовательность, имеющую М нуклеотидов в длину, которая комплементарна нуклеотидному сегменту нацеливающихся на протоспейсер последовательности или сегменту, при этом РНК расположена на 5'-конце полинуклеотидной последовательности полноразмерной gRNA, при этом первая gRNA необязательно содержит линкер между 5'-концом полинуклеотидной последовательности полноразмерной gRNA и сегментом РНК, при этом линкер содержит полинуклеотидную последовательность, имеющую N нуклеотидов в длину, при этом первая gRNA способна встраиваться в последовательность протоспейсера, и связываться с последовательностью ДНК, которая комплементарна последовательности протоспейсера, и образовывать дуплекс с протоспейсером, и при этом первая gRNA способна встраиваться в нецелевой сайт, и связываться с последовательностью ДНК, которая комплементарна нецелевому сайту, и образовывать нецелевой дуплекс; е) вычисление оценочного показателя или вычислительное моделирование кинетики встраивания и времени нахождения, в течение которого gRNA
остается встроенной в дуплексы протоспейсера и нецелевого сайта,
где динамику встраивания оценивают нуклеотид за нуклеотидом
путем определения энергетических различий между дополнительным
встраиванием отличающейся gRNA и повторным отжигом первой gRNA
на последовательности ДНК, которая комплементарна
последовательности протоспейсера; f) сравнение значений предполагаемого времени нахождения в сайтах протоспейсера и/или нецелевых сайтах первой gRNA со значениями предполагаемого времени нахождения полноразмерной gRNA или усеченной gRNA (trugRNA) в сайтах протоспейсера и/или нецелевых сайтах; д) рандомизацию от 0 до N нуклеотидов в линкере и от 0 до М нуклеотидов в первой gRNA, и получение второй gRNA, и повторение стадии (е) со второй gRNA; h) идентификацию оптимизированной gRNA на основе последовательности gRNA, которая удовлетворяет критериям конструирования; и i) тестирование оптимизированной gRNA in vivo для определения специфичности связывания.
[00322] Пункт 2. Способ получения оптимизированной
направляющей РНК (gRNA), при этом способ предусматривает: а)
идентификацию представляющей интерес целевой области, при этом
представляющая интерес целевая область содержит
последовательность протоспейсера; Ь) определение
полинуклеотидной последовательности полноразмерной gRNA, которая
нацеливается на представляющую интерес целевую область, при этом
полноразмерная gRNA содержит нацеливающиеся на протоспейсер
последовательность или сегмент; с) определение по меньшей мере
одного или нескольких нецелевых сайтов для полноразмерной gRNA;
d) получение полинуклеотидной последовательности первой gRNA,
при этом первая gRNA содержит полинуклеотидную
последовательность полноразмерной gRNA и сегмент РНК, при этом сегмент РНК содержит полинуклеотидную последовательность, имеющую М нуклеотидов в длину, которая комплементарна нуклеотидному сегменту нацеливающихся на протоспейсер последовательности или сегменту, при этом РНК расположена на 3' -конце полинуклеотидной последовательности полноразмерной gRNA, при этом первая gRNA необязательно содержит линкер между 3' -концом полинуклеотидной последовательности полноразмерной gRNA и
сегментом РНК, при этом линкер содержит полинуклеотидную
последовательность, имеющую N нуклеотидов в длину, при этом
первая gRNA способна встраиваться в последовательность
протоспейсера, и связываться с последовательностью ДНК, которая
комплементарна последовательности протоспейсера, и образовывать
дуплекс с протоспейсером, и при этом первая gRNA способна
встраиваться в нецелевой сайт, и связываться с
последовательностью ДНК, которая комплементарна нецелевому
сайту, и образовывать нецелевой дуплекс; е) вычисление
оценочного показателя или вычислительное моделирование кинетики
встраивания и времени нахождения, в течение которого gRNA
остается встроенной в дуплексы протоспейсера и нецелевого сайта,
где динамику встраивания оценивают нуклеотид за нуклеотидом
путем определения энергетических различий между дополнительным
встраиванием отличающейся gRNA и повторным отжигом первой gRNA
на последовательности ДНК, которая комплементарна
последовательности протоспейсера; f) сравнение значений предполагаемого времени нахождения в сайтах протоспейсера и/или нецелевых сайтах первой gRNA со значениями предполагаемого времени нахождения полноразмерной gRNA или усеченной gRNA (trugRNA) в сайтах протоспейсера и/или нецелевых сайтах; д) рандомизацию от 0 до N нуклеотидов в линкере и от 0 до М нуклеотидов в первой gRNA, и получение второй gRNA, и повторение стадии (е) со второй gRNA; h) идентификацию оптимизированной gRNA на основе последовательности gRNA, которая удовлетворяет критериям конструирования; и i) тестирование оптимизированной gRNA in vivo для определения специфичности связывания.
[00323] Пункт 3. Способ по пункту 1 или пункту 2, где энергетический баланс дополнительного встраивания отличающейся gRNA определяют путем определения энергетического баланса по меньшей мере одного из (I) нарушения спаривания оснований ДНК-ДНК, (II) образования пар оснований РНК-ДНК, (Ш) энергетического различия, возникающего в результате разрушения или образования отличающейся вторичной структуры внутри не встроенной направляющей РНК, и (IV) образования или разрушения взаимодействий между вытесненной нитью ДНК, которая
комплементарна протоспейсеру, и любыми неспаренными нуклеотидами направляющей РНК, которые не вовлечены во вторичные структуры.
[00324] Пункт 4. Способ по любому из пунктов 1-3, где
энергетический баланс повторного отжига первой gRNA с
последовательностью ДНК, которая комплементарна
последовательности протоспейсера, определяют путем определения энергетического баланса по меньшей мере одного из (I) образования пар оснований ДНК-ДНК, (II) разрушения пар оснований РНК-ДНК, (Ш) энергетического различия, возникающего в результате разрушения или образования отличающейся вторичной структуры внутри новой не встроенной направляющей РНК, и (IV) образования или разрушения взаимодействий между вытесненной нитью ДНК, которая комплементарна протоспейсеру, и любыми неспаренными нуклеотидами направляющей РНК, которые не вовлечены во вторичные структуры.
[00325] Пункт 5. Способ по пункту 3 или пункту 4,
дополнительно предусматривающий определение энергетических
факторов по меньшей мере одного из (V) спаривания оснований
среди ошибочных спариваний, (VI) взаимодействий с белком Cas 9
и/или (VII) дополнительных эвристических показателей, где
дополнительные эвристические показатели относятся к
продолжительности связывания, степени встраивания, стабильности
встраивающейся направляющей РНК или другим
расчетным/моделируемым свойствам встраивания gRNA для расщепляющей активности Cas9.
[00326] Пункт 6. Способ по любому из пунктов 1-5, где полноразмерная gRNA содержит от приблизительно 15 до 2 0 нуклеотидов.
[00327] Пункт 7. Способ по любому из пунктов 1-5, где М составляет от 1 до 20.
[00328] Пункт 8. Способ по пункту 7, где М составляет от 4 до 10.
[00329] Пункт 9. Способ по любому из пунктов 1-8, где
сегмент РНК содержит от 2 до 15 нуклеотидов, которые
комплементарны нацеливающейся на протоспейсер
последовательности.
[00330] Пункт 10. Способ по любому из пунктов 1-9, где N составляет от 1 до 20.
[00331] Пункт 11. Способ по пункту 10, где N составляет от 3 до 10.
[00332] Пункт 12. Способ по любому из пунктов 1-11, где сегмент РНК и/или нацеливающаяся на протоспейсер последовательность обеспечивают вторичную структуру.
[00333] Пункт 13. Способ по пункту 12, где вторичная структура образуется путем частичной гибридизации нацеливающейся на протоспейсер последовательности с сегментом РНК.
[00334] Пункт 14. Способ по пункту 13, где вторичная структура модулирует связывание или расщепление ДНК посредством Cas9 путем нарушения встраивания оптимизированной gRNA в дуплекс протоспейсера или нецелевой дуплекс.
[00335] Пункт 15. Способ по любому из пунктов 12-14, где вторичная структура образуется путем гибридизации всего или части сегмента РНК с нуклеотидами на 5'-конце нацеливающихся на протоспейсер последовательности или сегмента, нуклеотидами в середине нацеливающихся на протоспейсер последовательности или сегмента, и/или нуклеотидами на 3'-конце нацеливающихся на протоспейсер последовательности или сегмента.
[00336] Пункт 16. Способ по любому из пунктов 12-15, где вторичная структура представляет собой шпильку.
[00337] Пункт 17. Способ по любому из пунктов 12-16, где вторичная структура является стабильной при комнатной температуре или при 37°С.
[00338] Пункт 18. Способ по любому из пунктов 12-17, где общая равновесная свободная энергия вторичной структуры составляет менее приблизительно 2 ккал/моль при комнатной температуре или при 37°С.
[00339] Пункт 19. Способ по любому из пунктов 1-18, где сегмент РНК гибридизируется или образует неканонические пары оснований по меньшей мере с двумя нуклеотидами нацеливающихся на протоспейсер последовательности или сегмента.
[00340] Пункт 20. Способ по пункту 19, где неканоническая
пара оснований представляет собой rU-rG.
[00341] Пункт 21. Способ по любому из пунктов 1-20, где оптимизированную gRNA применяют с системой на основе CRISPR/Cas9 или с системой на основе CRISPR/Cpfl в клетке.
[00342] Пункт 22. Способ по любому из пунктов 1-21, где вторичная структура защищает оптимизированную gRNA в системе на основе CRISPR/Cas9 или системе на основе CRISPR/Cpfl с целью предотвращения разрушения в клетке.
[00343] Пункт 23. Способ по любому из пунктов 1-22, где 12 0 нуклеотидов рандомизированы в линкере.
[00344] Пункт 24. Способ по любому из пунктов 1-23, где 12 0 нуклеотидов рандомизированы в сегменте РНК.
[00345] Пункт 25. Способ по любому из пунктов 1-24, где стадию (д) повторяют X раз, с получением тем самым gRNA в количестве X, и повторяют стадию (е) с каждым количеством X gRNA, где X составляет от 0 до 20.
[00346] Пункт 26. Способ по любому из пунктов 1-25, где кинетику встраивания и время нахождения вычисляют с применением кинетической методики Монте-Карло или алгоритма Гиллеспи.
[00347] Пункт 27. Способ по любому из пунктов 1-2 6, где кинетика встраивания представляет собой скорость, с которой направляющая РНК встраивается в дуплекс протоспейсера с обеспечением полного встраивания таким образом, что встраивание в протоспейсер является полностью осуществленным, и/или скорость, с которой сегмент ДНК протоспейсера, связанной с gRNA, удлиняется по мере его вытеснения из его комплементарной нити и связывания с gRNA нуклеотид за нуклеотидом от его РАМ-проксимальной области до полного встраивания.
[00348] Пункт 28. Способ по любому из пунктов 1-27, где критерии конструирования предусматривают специфичность, модуляцию продолжительности связывания и/или расчетную специфичность расщепления.
[0034 9] Пункт 29. Способ по пункту 28, где критерии конструирования предусматривают оптимизированную gRNA с продолжительностью связывания, которая больше или равна продолжительности связывания полноразмерной gRNA с целевым
сайтом, и/или с продолжительностью связывания, которая меньше или равна продолжительности связывания полноразмерной gRNA с нецелевым сайтом.
[00350] Пункт 30. Способ по пункту 2 9, где критерии конструирования предусматривают оптимизированную gRNA с продолжительностью связывания, которая меньше или равна продолжительности связывания полноразмерной gRNA по меньшей мере с тремя нецелевыми сайтами, где нецелевые сайты согласно прогнозированию представляют собой ближайшие нецелевые сайты, или прогнозируется, что они имеют наивысшую степень идентичности с целевыми сайтами.
[00351] Пункт 31. Способ по пункту 28, где критерии конструирования предусматривают время нахождения или скорость расщепления в нецелевом сайте, которые меньше или равны времени нахождения или скорости расщепления полноразмерной gRNA или усеченной gRNA в нецелевом сайте, и/или прогнозируемый показатель целевой активности, который составляет более 10% от прогнозируемого показателя целевой активности полноразмерной gRNA или усеченной gRNA.
[00352] Пункт 32. Способ по любому из пунктов 1-31, где оптимизированную gRNA тестируют на стадии i) с применением анализа surveyor, методик секвенирования нового поколения или GUIDE-Seq.
[00353] Пункт 33. Способ по любому из пунктов 1-32, где оптимизированная gRNA сконструирована для минимизации связывания в нецелевом сайте и обеспечения возможности связывания с последовательностью протоспейсера.
[00354] Пункт 34. Способ по любому из пунктов 1-33, где нецелевой сайт представляет собой известный или прогнозируемый нецелевой сайт.
[00355] Пункт 35. Способ по любому из пунктов 1-34, где полноразмерная gRNA нацелена на ген млекопитающего.
[00356] Пункт 36. Способ по любому из пунктов 1-35,где целевой ген предусматривает эндогенный целевой ген или трансген.
[00357] Пункт 37. Способ по любому из пунктов 1-36, где целевой ген представляет собой ген, связанный с заболеванием.
[00358] Пункт 38. Способ по любому из пунктов 1-37, где геном-мишенью является ген DMD, ЕМХ1 или VEGFA.
[00359] Пункт 39. Способ по пункту 38, где ген VEGFA представляет собой VEGFA1 или VEGFA3.
[00360] Пункт 40. Оптимизированная gRNA, полученная с помощью способа по любому из пунктов 1-39.
[00361] Пункт 41. Оптимизированная gRNA по пункту 40, где gRNA может различать целевые и нецелевые сайты с минимальными термодинамическими энергетическими различиями между сайтами.
[00362] Пункт 42. Оптимизированная gRNA по пункту 40 или пункту 41, где оптимизированная gRNA модулирует встраивание нити в протоспейсер.
[00363] Пункт 43. Оптимизированная gRNA по любому из пунктов 4 0-42, где оптимизированная gRNA содержит нуклеотидную последовательность по меньшей мере из одного из SEQ ID NO: 149315, 321-323 и 326-329.
[00364] Пункт 44. Выделенный полинуклеотид, кодирующий оптимизированную gRNA по любому из пунктов 40-43.
[00365] Пункт 45. Вектор, содержащий выделенный полинуклеотид по пункту 44.
[00366] Пункт 46. Клетка, содержащая выделенный полинуклеотид по пункту 4 4 или вектор по пункту 45.
[00367] Пункт 47. Набор, содержащий выделенный полинуклеотид по пункту 44, вектор по пункту 4 5 или клетку по пункту 46.
[00368] Пункт 48. Способ эпигеномного редактирования в клетке-мишени или субъекте, при этом способ предусматривает приведение клетки или субъекта в контакт с эффективным количеством молекулы оптимизированной gRNA по любому из пунктов 40-43 или слитого нуклеотида по пункту 44 и слитого белка, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации
гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
[00369] Пункт 49. Способ сайт-специфического расщепления ДНК в клетке-мишени или субъекте, при этом способ предусматривает приведение клетки или субъекта в контакт с эффективным количеством молекулы оптимизированной gRNA по любому из пунктов 40-43 или выделенного полинуклеотида по пункту 44 и слитого белка или белка Cas9, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
[00370] Пункт 50. Способ редактирования генома в клетке, при этом способ предусматривает введение в клетку эффективного количества молекулы оптимизированной gRNA по любому из пунктов 40-43 или выделенного полинуклеотида по пункту 44 и слитого белка, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
[00371] Пункт 51. Способ по пункту 50, где редактирование генома предусматривает коррекцию мутантного гена или вставку трансгена.
[00372] Пункт 52. Способ по пункту 51, где исправление мутантного гена включает делецию, перестройку или замену мутантного гена.
[00373] Пункт 53. Способ по любому из пунктов 51 или 52, где коррекция мутантного гена предусматривает опосредованное нуклеазой негомологичное соединение концов или репарацию с участием гомологичной рекомбинации.
[00374] Пункт 54. Способ модулирования экспрессии гена в клетке, при этом способ предусматривает приведение клетки в контакт с эффективным количеством молекулы оптимизированной gRNA по любому из пунктов 40-43 или выделенного полинуклеотида по пункту 4 4 и слитого белка, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
[00375] Пункт 55. Способ по пункту 54, где экспрессию гена, по меньшей мере одного целевого гена, модулируют, если уровни экспрессии гена, по меньшей мере одного целевого гена, увеличены или уменьшены по сравнению с уровнями экспрессии нормального гена, по меньшей мере для одного целевого гена.
[00376] Пункт 56. Способ по пункту 54 или пункту 55, где слитый белок содержит домен dCas9 и активатор транскрипции.
[00377] Пункт 57. Способ по пункту 56, где слитый белок содержит аминокислотную последовательность под SEQ ID N0: 2.
[00378] Пункт 58. Способ по пункту 54 или пункту 55, где слитый белок содержит домен dCas9 и репрессор транскрипции.
[00379] Пункт 59. Способ по пункту 58, где слитый белок содержит аминокислотную последовательность под SEQ ID N0:3.
[00380] Пункт 60. Способ по пункту 54 или пункту 55, где слитый белок содержит домен dCas9 и сайт-специфическую нуклеазу.
[00381] Пункт 61. Способ по любому из пунктов 48-60, где
оптимизированная gRNA кодируется полинуклеотидной
последовательностью и упакована в лентивирусный вектор.
[00382] Пункт 62. Способ по пункту 61, где лентивирусный
вектор содержит кассету экспрессии, содержащую промотор, функционально связанный с полинуклеотидной последовательностью, кодирующей gRNA.
[00383] Пункт 63. Способ по пункту 62, где промотор, функционально связанный с полинуклеотидом, кодирующим оптимизированную gRNA, является индуцируемым.
[00384] Пункт 64. Способ по любому из пунктов 61-63, где лентивирусный вектор дополнительно содержит полинуклеотидную последовательность, кодирующую белок Cas9 или слитый белок.
[00385] Пункт 65. Способ по любому из пунктов 48-64, где по меньшей мере один целевой ген представляет собой ген, связанный с заболеванием.
[00386] Пункт 66. Способ по любому из пунктов 48-65, где клетка-мишень представляет собой эукариотическую клетку.
[00387] Пункт 67. Способ по любому из пунктов 48-66, где клетка-мишень представляет собой клетку млекопитающего.
[00388] Способ по любому из пунктов 48-67, где клетка-мишень представляет собой клетку НЕК2 93Т.
Дополнение - Последовательности
Cas 9 из Streptococcus pyogenes (с D10A, Н840А) (SEQ ID NO:
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETA EATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIV DEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQ LVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPN FKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKA PLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPI LEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKI LTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEWDKGASAQSFIERMTNFDKNLPNEKV LPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKK IECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEER LKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHD DSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKWDELVKVMGRHKPENIVIEM ARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQE LDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKL ITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKV ITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAWGTALIKKYPKLESEFVYGDYKVYDVR KMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATV RKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVA KVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRK RMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISE FSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTST KEVLDATLIHQSITGLYETRIDLSQLGGD
dCas9p300 core. (Addgene Plasmid 61357) аминокислотная последовательность; ЗХ эпитоп "Flag", Последовательность ядерной локализации, Cas9 Streptococcus pyogenes (D10A, H840A) , эффектор рЗОО Core, эпитоп " НА" (SEQ ID NO: 2)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGRG^KKYSIGLAIGTNSVGWAVITDE YKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSN EMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLR LIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARL SKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLA QIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLP EKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNG
SIPHQIHLGE LHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEE T ITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRK PAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSR KLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLA GSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKV LTRSDKNRGKSDNVPSEEWKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQ LVE TRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAWGTALIKKYPKLESEFVYGDYK\T!fDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKT EITLANGEIRKRPLIE TNGE TGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKE SILP KRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLWAKVEKGKSKKLKSVKE LLGITIMERSSFEК NPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLAS HYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIRE QAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYE TRIDLSQLGGD PIAGS KAS PKKKRKVGRAIFKPEE LRQALMPTLEALYRQDPESLPFRQPVDPQLLGIPDYFDIV KSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVM QSLGYCCGRKLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQ PQT TINKEQFSKRKND TLDPE LFVE СТЕ CGRKMHQICVLHHE11WPAGFVCDGCLKKSARTRKE NKFSAKRLPSTRLGTFLENRWDFLRRQNHPESGEVTVRWHASDKTVEVKPGMKARFVDSGEM AESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAV YHEILIGYLEYVKKLGYTTGHIWACPPSE GDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSE RIVHDYKDIFKQATEDRLTSAKE LPYFE GDFWPNVLEESIKE LEQEEEERKREENTSNE S TDVT KGD SKNAKKKNNKKTSKNKS SLSRGNKKKPGMPNVSNDLSQKLYATME KHKEVFFVTRLIAGPA ANSLPPIVDPDPLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQDYPYDV PDYAS
dCas9KRAB (SEQ ID NO: 3)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGRGMDKKYSIGLAIGTNSVGWAVITDE YKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSN EMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLR LIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARL SKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLA QIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLP EKYKEIFFDQSKNGYAGYIDGGAS QEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRT FDNG SIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEET ITPWNFEEWDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRK
PAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSR KLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLA GSPAIKKGILQTVKWDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELG SQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKV LTRSDKNRGKSDNVPSEEWKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQ LVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHA HDAYLNAWGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKT EITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILP KRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLWAKVEKGKSKKLKSVKELLGITIMERSSFEK NPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLAS HYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIRE QAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADPKKKRKVASDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQILYRNVMLENYKNLVS LGYQLTKPDVILRLEKGEEPWLVEREIHQETHPDSETAFEIKSSVPKKKRKVAS
Nm-dCas9p300 Core: (Addgene Plasmid 61365) аминокислотная последовательность;Cas9 Neisseria meningitidis (D16A, D587A, H588A, N611A), последовательность ядерной локализации, эффектор рЗОО Core, эпитоп "НА" (SEQ ID NO: 51
MAAFKPNPINYILGLAIGIASVGWAM\^IDEDENPICLIDLGVRVFERAEVPKTGDSLA MARRLARSVRRL TRRRAHRLLRARRLLKRE GVLQAAD FDENGLIKSLPNTPWQLRAAALDRKLT PLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEК ESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAV QKMLGHC TFE РАЕ PKAAKNTY TAE RFIWLTKLNNLRILEQGSERPLTD ТЕRATLMDE PYRKSKL TYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQ DEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDE ACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPWLRALSQARKVINGVVRRYGSPARIHIETAR EVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGK EINLGRLNEKGYVEIAAALPFSRTWDDSFNNKVLVLGSEAQNKGNQTPYEYFNGKDNSREWQE F KARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASN GQITNLLRGFWGLRKVRAENDRHHALDAVWACSTVAMQQKITRFVRYKEMNAFDGKTIDKE TG EVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTP LFVSRAPNRKMS GQGHME TVKSAKRLDE GV SVLRVPL TQLKLKD LE KMVNRE RE PKLYEALKAR LE AHKDD PAKAFAE PFYKYDKAGNRTQQVKAVRVE QVQKTGVWVRNHNGIADNATMVRVDVFE К GDKYYLVPIYSWQVAKGILPDRAWQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGY FASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVRS
RAD PKKKRKVEASGRAIFKPEELRQALMPTLEALYRQDPESLPFRQPVDPQLLGIPDYFDIVKS PMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQS LGYCCGRKLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQ T TINKEQFSKRKND TLDPE LFVE СТЕ CGRKMHQICVLHHE11WPAGFVCDGCLKKSARTRKENK FSAKRLPSTRLGTFLENRWDFLRRQNHPESGEVTVRWIiASDKTVEVKPGMKARFVDSGEMAE SFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYH EILIGYLEYVKKLGYTTGHIWACPPSE GDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERI VHDYKDIFKQATEDRLTSAKE LPYFE GDFWPNVLEESIKELEQEEEERKREENTSNE S TDVTKG D SKNAKKKNNKKTSKNKS SLSRGNKKKPGMPNVSNDLSQKLYATME KHKE VFFVIRLIAGPAAN SLPPIVDPDPLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQDYPYDVPD YAS
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> DUKE UNIVERSITY
<120> КОМПОЗИЦИИ И СПОСОБЫ УЛУЧШЕНИЯ СПЕЦИФИЧНОСТИ В ГЕНОМНОЙ ИНЖЕНЕРИИ С ПРИМЕНЕНИЕМ РНК-НАПРАВЛЯЕМЫХ ЭНДОНУКЛЕАЗ
<130> 028193-9240-WO00
<140> PCT/US2016/048798 <141> 2016-08-25
<150> 62/209,466
<151> 2015-08-25 <160> 348
<170> PatentIn версия 3.5
<210> 1 <211> 1368 <212> БЕЛОК
<213> Streptococcus pyogenes
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2 <211> 2048 <212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический полипептид
<400> 2
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Arg Gly Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr
35 40 45
Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser
50 55 60
Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys
65 70 75 80
Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala
85 90 95
Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn
100 105 110
Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val
115 120 125
Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu
130 135 140
Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu
145 150 155 160
Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys
165 170 175
Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala
180 185 190
Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp
195 200 205
Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val
210 215 220
Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly
225 230 235 240
Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg
245 250 255
Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu
260 265 270
Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
275 280 285
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp
290 295 300
Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
305 310 315 320
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu
325 330 335
Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
340 345 350
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr
355 360 365
Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
370 375 380
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly
385 390 395 400
Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu
405 410 415
Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp
420 425 430
Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
435 440 445
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe
450 455 460
Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
465 470 475 480
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
485 490 495
Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn
500 505 510
Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
515 520 525
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro
530 535 540
Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr
545 550 555 560
Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser
565 570 575
Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
580 585 590
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu
595 600 605
Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
610 615 620
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp
625 630 635 640
Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu
645 650 655
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys
660 665 670
Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
675 680 685
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
690 695 700
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
705 710 715 720
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
725 730 735
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
740 745 750
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
755 760 765
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys
770 775 780
Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
785 790 795 800
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met
805 810 815
Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
820 825 830
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu
835 840 845
Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
850 855 860
Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser
865 870 875 880
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp
885 890 895
Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys
900 905 910
Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
915 920 925
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser
930 935 940
Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
945 950 955 960
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr
965 970 975
Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
980 985 990
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
995 1000 1005
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1010 1015 1020
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1025 1030 1035
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1040 1045 1050
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1055 1060 1065
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1070 1075 1080
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1085 1090 1095
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1100 1105 1110
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1115 1120 1125
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1130 1135 1140
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1145 1150 1155
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1160 1165 1170
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1175 1180 1185
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1190 1195 1200
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1205 1210 1215
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1220 1225 1230
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1235 1240 1245
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1250 1255 1260
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1265 1270 1275
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1280 1285 1290
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1295 1300 1305
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1310 1315 1320
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1325 1330 1335
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1340 1345 1350
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1355 1360 1365
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1370 1375 1380
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1385 1390 1395
Gln Leu Gly Gly Asp Pro Ile Ala Gly Ser Lys Ala Ser Pro Lys
1400 1405 1410
Lys Lys Arg Lys Val Gly Arg Ala Ile Phe Lys Pro Glu Glu Leu
1415 1420 1425
Arg Gln Ala Leu Met Pro Thr Leu Glu Ala Leu Tyr Arg Gln Asp
1430 1435 1440
Pro Glu Ser Leu Pro Phe Arg Gln Pro Val Asp Pro Gln Leu Leu
1445 1450 1455
Gly Ile Pro Asp Tyr Phe Asp Ile Val Lys Ser Pro Met Asp Leu
1460 1465 1470
Ser Thr Ile Lys Arg Lys Leu Asp Thr Gly Gln Tyr Gln Glu Pro
1475 1480 1485
Trp Gln Tyr Val Asp Asp Ile Trp Leu Met Phe Asn Asn Ala Trp
1490 1495 1500
Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr Lys Tyr Cys Ser Lys
1505 1510 1515
Leu Ser Glu Val Phe Glu Gln Glu Ile Asp Pro Val Met Gln Ser
1520 1525 1530
Leu Gly Tyr Cys Cys Gly Arg Lys Leu Glu Phe Ser Pro Gln Thr
1535 1540 1545
Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg Asp Ala
1550 1555 1560
Thr Tyr Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys Glu Lys Cys
1565 1570 1575
Phe Asn Glu Ile Gln Gly Glu Ser Val Ser Leu Gly Asp Asp Pro
1580 1585 1590
Ser Gln Pro Gln Thr Thr Ile Asn Lys Glu Gln Phe Ser Lys Arg
1595 1600 1605
Lys Asn Asp Thr Leu Asp Pro Glu Leu Phe Val Glu Cys Thr Glu
1610 1615 1620
Cys Gly Arg Lys Met His Gln Ile Cys Val Leu His His Glu Ile
1625 1630 1635
Ile Trp Pro Ala Gly Phe Val Cys Asp Gly Cys Leu Lys Lys Ser
1640 1645 1650
Ala Arg Thr Arg Lys Glu Asn Lys Phe Ser Ala Lys Arg Leu Pro
1655 1660 1665
Ser Thr Arg Leu Gly Thr Phe Leu Glu Asn Arg Val Asn Asp Phe
1670 1675 1680
Leu Arg Arg Gln Asn His Pro Glu Ser Gly Glu Val Thr Val Arg
1685 1690 1695
Val Val His Ala Ser Asp Lys Thr Val Glu Val Lys Pro Gly Met
1700 1705 1710
Lys Ala Arg Phe Val Asp Ser Gly Glu Met Ala Glu Ser Phe Pro
1715 1720 1725
Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile Asp Gly Val
1730 1735 1740
Asp Leu Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser Asp
1745 1750 1755
Cys Pro Pro Pro Asn Gln Arg Arg Val Tyr Ile Ser Tyr Leu Asp
1760 1765 1770
Ser Val His Phe Phe Arg Pro Lys Cys Leu Arg Thr Ala Val Tyr
1775 1780 1785
His Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly
1790 1795 1800
Tyr Thr Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp
1805 1810 1815
Asp Tyr Ile Phe His Cys His Pro Pro Asp Gln Lys Ile Pro Lys
1820 1825 1830
Pro Lys Arg Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Ala
1835 1840 1845
Val Ser Glu Arg Ile Val His Asp Tyr Lys Asp Ile Phe Lys Gln
1850 1855 1860
Ala Thr Glu Asp Arg Leu Thr Ser Ala Lys Glu Leu Pro Tyr Phe
1865 1870 1875
Glu Gly Asp Phe Trp Pro Asn Val Leu Glu Glu Ser Ile Lys Glu
1880 1885 1890
Leu Glu Gln Glu Glu Glu Glu Arg Lys Arg Glu Glu Asn Thr Ser
1895 1900 1905
Asn Glu Ser Thr Asp Val Thr Lys Gly Asp Ser Lys Asn Ala Lys
1910 1915 1920
Lys Lys Asn Asn Lys Lys Thr Ser Lys Asn Lys Ser Ser Leu Ser
1925 1930 1935
Arg Gly Asn Lys Lys Lys Pro Gly Met Pro Asn Val Ser Asn Asp
1940 1945 1950
Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys His Lys Glu Val
1955 1960 1965
Phe Phe Val Ile Arg Leu Ile Ala Gly Pro Ala Ala Asn Ser Leu
1970 1975 1980
Pro Pro Ile Val Asp Pro Asp Pro Leu Ile Pro Cys Asp Leu Met
1985 1990 1995
Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His Leu
2000 2005 2010
Glu Phe Ser Ser Leu Arg Arg Ala Gln Trp Ser Thr Met Cys Met
2015 2020 2025
Leu Val Glu Leu His Thr Gln Ser Gln Asp Tyr Pro Tyr Asp Val
2030 2035 2040
Pro Asp Tyr Ala Ser 2045
<210> 3
<211> 1521
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический полипептид
<400> 3
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Arg Gly Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr
35 40 45
Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser
50 55 60
Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys
65 70 75 80
Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala
85 90 95
Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn
100 105 110
Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val
115 120 125
Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu
130 135 140
Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu
145
150
155
160
Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys
165 170 175
Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala
180 185 190
Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp
195 200 205
Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val
210 215 220
Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly
225 230 235 240
Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg
245 250 255
Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu
260 265 270
Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
275 280 285
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp
290 295 300
Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
305 310 315 320
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu
325 330 335
Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
340 345 350
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr
355 360 365
Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
370 375 380
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly
385 390 395 400
Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu
405 410 415
Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp
420 425 430
Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
435 440 445
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe
450 455 460
Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
465 470 475 480
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
485 490 495
Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn
500 505 510
Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
515 520 525
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro
530 535 540
Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr
545 550 555 560
Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser
565 570 575
Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
580 585 590
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu
595 600 605
Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
610 615 620
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp
625 630 635 640
Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu
645 650 655
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys
660
665
670
Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
675 680 685
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
690 695 700
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
705 710 715 720
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
725 730 735
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
740 745 750
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
755 760 765
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys
770 775 780
Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
785 790 795 800
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met
805 810 815
Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
820 825 830
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu
835 840 845
Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
850 855 860
Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser
865 870 875 880
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp
885 890 895
Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys
900 905 910
Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
915
920
925
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser
930 935 940
Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
945 950 955 960
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr
965 970 975
Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
980 985 990
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
995 1000 1005
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1010 1015 1020
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1025 1030 1035
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1040 1045 1050
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1055 1060 1065
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1070 1075 1080
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1085 1090 1095
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1100 1105 1110
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1115 1120 1125
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1130 1135 1140
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1145 1150 1155
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1160
1165
1170
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1175 1180 1185
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1190 1195 1200
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1205 1210 1215
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1220 1225 1230
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1235 1240 1245
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1250 1255 1260
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1265 1270 1275
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1280 1285 1290
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1295 1300 1305
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1310 1315 1320
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1325 1330 1335
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1340 1345 1350
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1355 1360 1365
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1370 1375 1380
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1385 1390 1395
Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys
1400 1405 1410
Val Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu
1415 1420 1425
Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp
1430 1435 1440
Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met
1445 1450 1455
Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr
1460 1465 1470
Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp
1475 1480 1485
Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu
1490 1495 1500
Thr Ala Phe Glu Ile Lys Ser Ser Val Pro Lys Lys Lys Arg Lys
1505 1510 1515
Val Ala Ser 1520
<210> 4 <211> 617 <212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический полипептид
<400> 4
Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1 5 10 15
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
20 25 30
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
35 40 45
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
50 55 60
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
65 70 75 80
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
85 90 95
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
100 105 110
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
115 120 125
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
130 135 140
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
145 150 155 160
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
165 170 175
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
180 185 190
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
195 200 205
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
210 215 220
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn
225 230 235 240
Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
245 250 255
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
260 265 270
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
275 280 285
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
290 295 300
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
305 310 315 320
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
325 330 335
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
340 345 350
Leu Gly Gly Asp Pro Ile Ala Gly Ser Lys Ala Ser Pro Lys Lys Lys
355 360 365
Arg Lys Val Gly Arg Ala Ile Phe Lys Pro Glu Glu Leu Arg Gln Ala
370 375 380
Leu Met Pro Thr Leu Glu Ala Leu Tyr Arg Gln Asp Pro Glu Ser Leu
385 390 395 400
Pro Phe Arg Gln Pro Val Asp Pro Gln Leu Leu Gly Ile Pro Asp Tyr
405 410 415
Phe Asp Ile Val Lys Ser Pro Met Asp Leu Ser Thr Ile Lys Arg Lys
420 425 430
Leu Asp Thr Gly Gln Tyr Gln Glu Pro Trp Gln Tyr Val Asp Asp Ile
435 440 445
Trp Leu Met Phe Asn Asn Ala Trp Leu Tyr Asn Arg Lys Thr Ser Arg
450 455 460
Val Tyr Lys Tyr Cys Ser Lys Leu Ser Glu Val Phe Glu Gln Glu Ile
465 470 475 480
Asp Pro Val Met Gln Ser Leu Gly Tyr Cys Cys Gly Arg Lys Leu Glu
485 490 495
Phe Ser Pro Gln Thr Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile
500 505 510
Pro Arg Asp Ala Thr Tyr Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys
515 520 525
Glu Lys Cys Phe Asn Glu Ile Gln Gly Glu Ser Val Ser Leu Gly Asp
530 535 540
Asp Pro Ser Gln Pro Gln Thr Thr Ile Asn Lys Glu Gln Phe Ser Lys
545 550 555 560
Arg Lys Asn Asp Thr Leu Asp Pro Glu Leu Phe Val Glu Cys Thr Glu
565 570 575
Cys Gly Arg Lys Met His Gln Ile Cys Val Leu His His Glu Ile Ile
580 585 590
Trp Pro Ala Gly Phe Val Cys Asp Gly Cys Leu Lys Lys Ser Ala Arg
595 600 605
Thr Arg Lys Glu Asn Lys Phe Ser Ala 610 615
<210> 5
<211> 1726
<212> БЕЛОК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический полипептид
<400> 5
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Ala
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp
20 25 30
Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Ala Ala Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Ala Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg Ser
1070 1075 1080
Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Arg
1085 1090 1095
Ala Ile Phe Lys Pro Glu Glu Leu Arg Gln Ala Leu Met Pro Thr
1100 1105 1110
Leu Glu Ala Leu Tyr Arg Gln Asp Pro Glu Ser Leu Pro Phe Arg
1115 1120 1125
Gln Pro Val Asp Pro Gln Leu Leu Gly Ile Pro Asp Tyr Phe Asp
1130 1135 1140
Ile Val Lys Ser Pro Met Asp Leu Ser Thr Ile Lys Arg Lys Leu
1145 1150 1155
Asp Thr Gly Gln Tyr Gln Glu Pro Trp Gln Tyr Val Asp Asp Ile
1160 1165 1170
Trp Leu Met Phe Asn Asn Ala Trp Leu Tyr Asn Arg Lys Thr Ser
1175 1180 1185
Arg Val Tyr Lys Tyr Cys Ser Lys Leu Ser Glu Val Phe Glu Gln
1190 1195 1200
Glu Ile Asp Pro Val Met Gln Ser Leu Gly Tyr Cys Cys Gly Arg
1205 1210 1215
Lys Leu Glu Phe Ser Pro Gln Thr Leu Cys Cys Tyr Gly Lys Gln
1220 1225 1230
Leu Cys Thr Ile Pro Arg Asp Ala Thr Tyr Tyr Ser Tyr Gln Asn
1235 1240 1245
Arg Tyr His Phe Cys Glu Lys Cys Phe Asn Glu Ile Gln Gly Glu
1250 1255 1260
Ser Val Ser Leu Gly Asp Asp Pro Ser Gln Pro Gln Thr Thr Ile
1265 1270 1275
Asn Lys Glu Gln Phe Ser Lys Arg Lys Asn Asp Thr Leu Asp Pro
1280 1285 1290
Glu Leu Phe Val Glu Cys Thr Glu Cys Gly Arg Lys Met His Gln
1295 1300 1305
Ile Cys Val Leu His His Glu Ile Ile Trp Pro Ala Gly Phe Val
1310 1315 1320
Cys Asp Gly Cys Leu Lys Lys Ser Ala Arg Thr Arg Lys Glu Asn
1325 1330 1335
Lys Phe Ser Ala Lys Arg Leu Pro Ser Thr Arg Leu Gly Thr Phe
1340 1345 1350
Leu Glu Asn Arg Val Asn Asp Phe Leu Arg Arg Gln Asn His Pro
1355 1360 1365
Glu Ser Gly Glu Val Thr Val Arg Val Val His Ala Ser Asp Lys
1370 1375 1380
Thr Val Glu Val Lys Pro Gly Met Lys Ala Arg Phe Val Asp Ser
1385 1390 1395
Gly Glu Met Ala Glu Ser Phe Pro Tyr Arg Thr Lys Ala Leu Phe
1400 1405 1410
Ala Phe Glu Glu Ile Asp Gly Val Asp Leu Cys Phe Phe Gly Met
1415 1420 1425
His Val Gln Glu Tyr Gly Ser Asp Cys Pro Pro Pro Asn Gln Arg
1430 1435 1440
Arg Val Tyr Ile Ser Tyr Leu Asp Ser Val His Phe Phe Arg Pro
1445 1450 1455
Lys Cys Leu Arg Thr Ala Val Tyr His Glu Ile Leu Ile Gly Tyr
1460 1465 1470
Leu Glu Tyr Val Lys Lys Leu Gly Tyr Thr Thr Gly His Ile Trp
1475 1480 1485
Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr Ile Phe His Cys His
1490 1495 1500
Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg Leu Gln Glu Trp
1505 1510 1515
Tyr Lys Lys Met Leu Asp Lys Ala Val Ser Glu Arg Ile Val His
1520 1525 1530
Asp Tyr Lys Asp Ile Phe Lys Gln Ala Thr Glu Asp Arg Leu Thr
1535 1540 1545
Ser Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro Asn
1550 1555 1560
Val Leu Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu
1565 1570 1575
Arg Lys Arg Glu Glu Asn Thr Ser Asn Glu Ser Thr Asp Val Thr
1580 1585 1590
Lys Gly Asp Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr
1595 1600 1605
Ser Lys Asn Lys Ser Ser Leu Ser Arg Gly Asn Lys Lys Lys Pro
1610 1615 1620
Gly Met Pro Asn Val Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala
1625 1630 1635
Thr Met Glu Lys His Lys Glu Val Phe Phe Val Ile Arg Leu Ile
1640 1645 1650
Ala Gly Pro Ala Ala Asn Ser Leu Pro Pro Ile Val Asp Pro Asp
1655 1660 1665
Pro Leu Ile Pro Cys Asp Leu Met Asp Gly Arg Asp Ala Phe Leu
1670 1675 1680
Thr Leu Ala Arg Asp Lys His Leu Glu Phe Ser Ser Leu Arg Arg
1685 1690 1695
Ala Gln Trp Ser Thr Met Cys Met Leu Val Glu Leu His Thr Gln
1700 1705 1710
Ser Gln Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1715 1720 1725
<210> 6
<211> 100
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 6
ggggccacua gggacaggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 7 <211> 98 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 7
ggccacuagg gacaggaugu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60 uuaucaacuu gaaaaagugg caccgagucg gugcuuuu 98
<210> 8 <211> 112 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 8
ggggccccuu cgggggccac uagggacagg auguuuuaga gcuagaaaua gcaaguuaaa 60 auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 112
<210> 9 <211> 116 <212> РНК
<213> Искусственная последовательность
<220>
gguaguggcc ccuucggggg ccacuaggga caggauguuu uagagcuaga aauagcaagu 60
uaaaauaagg cuaguccguu aucaacuuga aaaaguggca ccgagucggu gcuuuu 116
<210> 10 <211> 1198
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 10
ccaggatcag tgaaacgcac cagacagccg cgtcagagca gctcaggttc tgggagaggg 60
tagcgcaggg tggccactga gaaccgggca ggtcacgcat cccccccttc cctcccaccc 120
cctgccaagc tctccctccc aggatcctct ctggctccat cgtaagcaaa ccttagaggt 180
tctggcaagg agagagatgg ctccaggaaa tgggggtgtg tcaccagata aggaatctgc 240
ctaacaggag gtgggggtta gacccaatat caggagacta ggaaggagga ggcctaagga 300
tggggctttt ctgtcaccaa tcctgtccct agtggcccca ctgtggggtg gaggggacag 360
ataaaagtac ccagaaccag agccacatta accggccctg ggaatataag gtggtcccag 420
ctcggggaca caggatccct ggaggcagca aacatgctgt cctgaagtgg acataggggc 480
ccgggttgga ggaagaagac tagctgagct ctcggacccc tggaagatgc catgacaggg 540
ggctggaaga gctagcacag actagagagg taaggggggt aggggagctg cccaaatgaa 600
aggagtgaga ggtgacccgg aatccacagg agaacggggt gtccaggcaa agaaagcaag 660
aggatggaga ggtggctaaa gccagggaga cggggtactt tggggttgtc cagaaaaacg 720
gtgatgatgc aggcctacaa gaaggggagg cgggacgcaa gggagacatc cgtcggagaa 780
ggccatccta agaaacgaga gatggcacag gccccagaag gagaaggaaa agggaaccca 840
gcgagtgaag acggcatggg gttgggtgag ggaggagaga tgcccggaga ggacccagac 900
acggggagga tccgctcaga ggacatcacg tggtgcagcg ccgagaagga agtgctccgg 960
aaagagcatc cttgggcagc aacacagcag agagcaaggg gaagagggag tggaggaaga 1020
cggaacctga aggaggcggc agggaaggat ctgggccagc cgtagaggtg acccaggcca 1080
caagctgcag acagaaagcg gcacaggccc aggggagaga atgcaggtca gagaaagcag 1140
gacctgcctg ggaaggggaa acagtgggcc agaggcggcg cagaagccag tagagctc 1198
<210> 11 <211> 986 <212> ДНК
<213> Искусственная последовательность
<220>
catgacgtgc agcaagcgcg ctgacgcagc taattttatc tatgtgcttc gtcatacgtg 60
atgcatatac tctctgctag ctgactcatt cagctgtact cactcgctgt tgagtctcat 120
acagcgcgag atcaaatgag tcatccaatc ctgtccctag tggcccctat cgtgacactg 180
cactgcagcg tacgcgacag agctagactt cgtttcaata cagactagct actgcgtctg 240
cagagcgctc tcttgtcact tacatcgaag tcaacgcgct cgcgttcaga gatcttctcc 300
aatcctactt tcgacaattt tcgctctcag cgtttgtgtc tgtgcgcgca cacagtctgt 360
gcttcgcttg caactaacgt agcgcttcag cgcatcgtca aagagcgaaa gagtcacagt 420
gtctgtgttc acgtctctat ctttctagtt ctccaatcct gtcccaaaat tgtcgaagac 480
agagtttcgc gaattcgcag cagcgcgatc tctgctcact gcaatctctg actgctgctt 540
ttaagcaatt ctcgcagctc agcatgagta cttgcgatta cagcagtgct cgccaatcct 600
gtccctagtg attttgcagc gtcagcagag ctgatgagat gcagttcagc atcgcagacg 660
agcagcacga agcgagcatc tgtagaaaat cgatcgacgc gcacttgcag agacaccaaa 720
aattgtcgaa agtgaagcct tgtctctcgt tcgcatcaag acacgctatt tctgtctctt 780
aaatgtttca aaaacacatc atgtcttctt cgtgcgagtt cgatgcgcgt gtgcgagacc 840
acgcctgtcc ctagtggccc ctgactctct gtgcattttg agctgcgaaa gtaaagatat 900
cgttcattgc agagacagag ctagtactag tctcagttct tgcactatgc tctcgatgtc 960
tctcttagtg attcagcgca tcgtcg 986
<210> 12 <211> 1078 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 12
gacctgcagg catgcaagct tgggctagcg gagagtcagt tcgcggtact ggaggaggcg 60
gcgcaacgtc gccagctgtc tgcacaggag aaatccctgc tggcgcataa agatgagacg 120
ctggagtaca aacgccagct ggctgcactt ggcgacaagg ttacgtatca ggagcgcctg 180
aacgcgctgg cgcagcaggc ggataaattc gcacagcagc aacgggcaaa acgggccgcc 240
attgatgcga aaagccgggg gctgactgac cggcaggcag aacgggaagc cacggaacag 300
cgcctgaagg aacagtatgg cgataatccg ctggcgctga ataacgtcat gtcagagcag 360
aaaaagacct gggcggctga agaccagctt cgcgggaact ggatggcagg cctgaagtcc 420
ggctggccat gggctgaggc cagctgaggt accgctgagg attgctgagg tgtacagacg 480
ctcaagtcag aggtggcgag agctcccgga gtggctcaca gtcggtggtc cggcagtaca 540
atggattacc gtaagacgga aatcactccc gggtatatga aagagacgac cactgccagg 600
gacgaaagtg caatgcggca tacctcagtg gcgtggagtg caggtataca gattaatccg 660
gcagcgtccg tcgttgttga tattgcttat gaaggctccg gcagtggcga ctggcgtact 720
gacggattca tcgttggggt cggttataaa ttctgattag ccaggtaaca cagtgttatg 780
acagcccgcc ggaaccggtg ggcttttttg tggggtgaat atggcagtaa agatttcagg 840
agtcctgaaa gacggcacag gaaaaccggt acagaactgc accattcagc tgaaagccag 900
acgtaacagc accacggtgg tggtgaacac ggtgggctca gagaatccgg atgaagccgg 960
gcgttacagc atggatgtgg agtacggtca gtacagtgtc atcctgcagg ttgacggttt 1020
tccaccatcg cacgccggga ccatcaccgt gtatgaagat tcacaaccgg ggacgctg 1078
<210> 13 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 13
ttcttcttct gctcggactc 20
<210> 14 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 14
ttcttcttct gctcggactc 20
<210> 15 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 15
ttcttcttct gctcggactc 20
<210> 16 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 16
ttcttcttct gctcggactc
<210> 17 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 17
ttcttcttct gctcggactc 20
<210> 18 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 18
ttcttcttct gctcggactc 20
<210> 19 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 19
ttcttcttct gctcggactc 20
<210> 20 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 20
ttcttcttct gctcggactc 20
<210> 21 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 21
ttcttcttct gctcggactc 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 22
ttcttcttct gctcggactc 20
<210> 23 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 23
ttcttcttct gctcggactc 20
<210> 24 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 24
ttcttcttct gctcggactc 20
<210> 25
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 25
ttcttcttct gctcggactc 20
<210> 26 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 26
ttcttcttct gctcggactc 20
<210> 27 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 27
ttcttcttct gctcggactc
<210> 28 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 28
ttcttcttct gctcggactc 20
<210> 29
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 29
ttcttcttct gctcggactc 20
<210> 30 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 30
ttcttcttct gctcggactc 20
<210> 31 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 31
ttcttcttct gctcggactc 20
<210> 32 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 32
ttcttcttct gctcggactc
<210> 33
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 33
ccctagtcat tggaggtgac 20
<210> 34 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 34
ccctagtcat tggaggtgac 20
<210> 35 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 35
ccctagtcat tggaggtgac 20
<210> 36 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 36
ccctagtcat tggaggtgac 20
<210> 37 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 37
ccctagtcat tggaggtgac 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 38
ccctagtcat tggaggtgac 20
<210> 39 <211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 39
ccctagtcat tggaggtgac 20
<210> 40 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 40
ccctagtcat tggaggtgac 20
<210> 41 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 41
ccctagtcat tggaggtgac 20
<210> 42 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 42
ccctagtcat tggaggtgac 20
<210> 43 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 43
atggggagga catcgatgtc
<210> 44 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 44
atggggagga catcgatgtc 20
<210> 45 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 45
atggggagga catcgatgtc 20
<210> 46
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 46
atggggagga catcgatgtc 20
<210> 47 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 47
atggggagga catcgatgtc 20
<210> 48 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 48
atggggagga catcgatgtc
<210> 49 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 49
atggggagga catcgatgtc 20
<210> 50 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 50
atggggagga catcgatgtc 20
<210> 51 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 51
atggggagga catcgatgtc 20
<210> 52 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 52
atggggagga catcgatgtc 20
<210> 53 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 53
atcacatcaa ccggtggcgc 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 54
atcacatcaa ccggtggcgc 20
<210> 55 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 55
atcacatcaa ccggtggcgc 20
<210> 56 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 56
atcacatcaa ccggtggcgc 20
<210> 57
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 57
atcacatcaa ccggtggcgc 20
<210> 58
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 58
atcacatcaa ccggtggcgc 20
<210> 59 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 59
atcacatcaa ccggtggcgc
<210> 60 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 60
atcacatcaa ccggtggcgc 20
<210> 61 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 61
atcacatcaa ccggtggcgc 20
<210> 62 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 62
atcacatcaa ccggtggcgc 20
<210> 63 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 63
gagtttctca tctgtgcccc 20
<210> 64 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 64
ccagcttctg ccgtttgtac
<210> 65 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 65
ccagcttctg ccgtttgtac 20
<210> 66 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 66
ccagcttctg ccgtttgtac 20
<210> 67 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 67
ttcctcctcc agcttctgcc 20
<210> 68 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 68
ttcctcctcc agcttctgcc 20
<210> 69
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 69
ttcctcctcc agcttctgcc 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 70
ttcctcctcc agcttctgcc 20
<210> 71 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 71
ttcctcctcc agcttctgcc 20
<210> 72 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 72
ccggttgatg tgatgggagc 2 0
<210> 73 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 73
ccggttgatg tgatgggagc 20
<210> 74 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 74
ccggttgatg tgatgggagc 20
<210> 75 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 75
ccggttgatg tgatgggagc
<210> 76 <211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 76
gcagcaagca gcactctgcc 20
<210> 77 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 77
gcagcaagca gcactctgcc 20
<210> 78 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 78
gcttgggccc acgcaggggc 20
<210> 79 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 79
gcttgggccc acgcaggggc 20
<210> 80 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 80
gcttcgtggc aatgcgccac
<210> 81 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 81
gcttgggccc acgcaggggc 20
<210> 82 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 82
aagctggact ctggccactc 20
<210> 83 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 83
ttcttcttct gctcggactc 20
<210> 84 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 84
ttcttcttct gctcggactc 20
<210> 85 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 85
ttcttcttct gctcggactc 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 86
gagtttctca tctgtgcccc 20
<210> 87 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 87
ttcctcctcc agcttctgcc 20
<210> 88 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 88
ttcctcctcc agcttctgcc 20
<210> 89 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 89
agcagaagaa gaagggctcc 20
<210> 90 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 90
aagctggact ctggccactc 20
<210> 91 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 91
ccctagtcat tggaggtgac
<210> 92 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 92
ccctagtcat tggaggtgac 20
<210> 93 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 93
ccctagtcat tggaggtgac 20
<210> 94 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 94
ccctagtcat tggaggtgac 20
<210> 95
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 95
ccctagtcat tggaggtgac 20
<210> 96 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 96
ccctagtcat tggaggtgac
<210> 97
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 97
ccctagtcat tggaggtgac 20
<210> 98 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 98
ccctagtcat tggaggtgac 20
<210> 99 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 99
ccctagtcat tggaggtgac 20
<210> 100 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 100
ccctagtcat tggaggtgac 20
<210> 101 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 101
atggggagga catcgatgtc 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 102
atggggagga catcgatgtc 20
<210> 103 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 103
atggggagga catcgatgtc 20
<210> 104 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 104
atggggagga catcgatgtc 20
<210> 105 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 105
atggggagga catcgatgtc 20
<210> 106
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 106
atggggagga catcgatgtc 20
<210> 107 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 107
atggggagga catcgatgtc
<210> 108
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 108
atggggagga catcgatgtc 20
<210> 109 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 109
atggggagga catcgatgtc 20
<210> 110 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 110
atggggagga catcgatgtc 20
<210> 111 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 111
atcacatcaa ccggtggcgc 20
<210> 112 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 112
atcacatcaa ccggtggcgc
<210> 113 <211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 113
atcacatcaa ccggtggcgc 20
<210> 114 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 114
atcacatcaa ccggtggcgc 20
<210> 115 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 115
atcacatcaa ccggtggcgc 20
<210> 116 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 116
atcacatcaa ccggtggcgc 20
<210> 117 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 117
atcacatcaa ccggtggcgc 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 118
atcacatcaa ccggtggcgc 20
<210> 119 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 119
atcacatcaa ccggtggcgc 20
<210> 120 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 120
atcacatcaa ccggtggcgc 20
<210> 121 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 121
gagtttctca tctgtgcccc 20
<210> 122 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 122
ccagcttctg ccgtttgtac 20
<210> 123 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 123
ccagcttctg ccgtttgtac
<210> 124 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 124
ccagcttctg ccgtttgtac 20
<210> 125 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 125
ttcctcctcc agcttctgcc 20
<210> 126 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 126
ttcctcctcc agcttctgcc 20
<210> 127 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 127
ttcctcctcc agcttctgcc 20
<210> 128 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 128
ttcctcctcc agcttctgcc
<210> 129 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 129
ttcctcctcc agcttctgcc 20
<210> 130 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 130
ccggttgatg tgatgggagc 20
<210> 131 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 131
ccggttgatg tgatgggagc 20
<210> 132 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 132
ccggttgatg tgatgggagc 20
<210> 133 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 133
ccggttgatg tgatgggagc 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 134
gcagcaagca gcactctgcc 20
<210> 135
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 135
gcagcaagca gcactctgcc 20
<210> 136 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 136
gcttgggccc acgcaggggc 20
<210> 137
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 137
gcttgggccc acgcaggggc 20
<210> 138 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 138
gcttcgtggc aatgcgccac 20
<210> 139
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 139
gcttgggccc acgcaggggc
<210> 140 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 140
aagctggact ctggccactc 20
<210> 141 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 141
ttcttcttct gctcggactc 20
<210> 142 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 142
ttcttcttct gctcggactc 20
<210> 143 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 143
ttcttcttct gctcggactc 20
<210> 144 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 144
gagtttctca tctgtgcccc
<210> 145
<211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 145
ttcctcctcc agcttctgcc 20
<210> 146
<211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 146
ttcctcctcc agcttctgcc 20
<210> 147 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 147
agcagaagaa gaagggctcc 20
<210> 148 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 148
aagctggact ctggccactc 20
<210> 149 <211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 149
guguccgagc agaagaagaa 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 150
gacuccgagc agaagaagaa 20
<210> 151 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 151
gagaccgagc agaagaagaa 20
<210> 152 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 152
gagugcgagc agaagaagaa 20
<210> 153 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 153
gagucggagc agaagaagaa 20
<210> 154 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 154
gagucccagc agaagaagaa 20
<210> 155 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 155
gaguccgugc agaagaagaa
<210> 156 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 156
gaguccgacc agaagaagaa 20
<210> 157 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 157
gaguccgagg agaagaagaa 20
<210> 158
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 158
gaguccgagc ugaagaagaa 20
<210> 159 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 159
guguccgagc agaagaagaa 20
<210> 160 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 160
gacuccgagc agaagaagaa
<210> 161 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 161
gagaccgagc agaagaagaa 20
<210> 162 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 162
gagugcgagc agaagaagaa 20
<210> 163 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 163
gagucggagc agaagaagaa 20
<210> 164 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 164
gagucccagc agaagaagaa 20
<210> 165 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 165
gaguccgugc agaagaagaa 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 166
gaguccgacc agaagaagaa 20
<210> 167 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 167
gaguccgagg agaagaagaa 20
<210> 168 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 168
gaguccgagc ugaagaagaa 20
<210> 169 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 169
gacaccucca augacuaggg 20
<210> 170 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 170
gugaccucca augacuaggg 20
<210> 171 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 171
gucuccucca augacuaggg
<210> 172 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 172
gucagcucca augacuaggg 20
<210> 173 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 173
gucacgucca augacuaggg 20
<210> 174 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 174
gucaccacca augacuaggg 20
<210> 175 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 175
gucaccugca augacuaggg 20
<210> 176 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 176
gucaccucga augacuaggg
<210> 177 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 177
gucaccuccu augacuaggg 20
<210> 178 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 178
gucaccucca uugacuaggg 20
<210> 179
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 179
gucaucgaug uccuccccau 20
<210> 180 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 180
gagaucgaug uccuccccau 20
<210> 181 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 181
gacuucgaug uccuccccau 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 182
gacaacgaug uccuccccau 20
<210> 183 <211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 183
gacauggaug uccuccccau 20
<210> 184 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 184
gacauccaug uccuccccau 20
<210> 185 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 185
gacaucguug uccuccccau 20
<210> 186
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 186
gacaucgaag uccuccccau 20
<210> 187 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 187
gacaucgauc uccuccccau
<210> 188 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 188
gacaucgaug accuccccau 20
<210> 189 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 189
gggccaccgg uugaugugau 20
<210> 190 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 190
gccccaccgg uugaugugau 20
<210> 191 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 191
gcggcaccgg uugaugugau 20
<210> 192 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 192
gcgcgaccgg uugaugugau
<210> 193 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 193
gcgccuccgg uugaugugau 20
<210> 194 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 194
gcgccagcgg uugaugugau 20
<210> 195
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 195
gcgccacggg uugaugugau 20
<210> 196 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 196
gcgccacccg uugaugugau 20
<210> 197 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 197
gcgccaccgc uugaugugau 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 198
gcgccaccgg augaugugau 20
<210> 199 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 199
gggccacaga ugagaaacuc 20
<210> 200 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 200
guucaaacgg cagaagcugg 20
<210> 201 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 201
guacuaacgg cagaagcugg 20
<210> 202 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 202
guacaaacgg gagaagcugg 20
<210> 203 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 203
gccagaagcu ggaggaggaa
<210> 204 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 204
ggcacaagcu ggaggaggaa 20
<210> 205 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 205
ggcagaaccu ggaggaggaa 20
<210> 206 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 206
ggcagaagca ggaggaggaa 20
<210> 207 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 207
ggcagaagcu cgaggaggaa 20
<210> 208 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 208
gcacccauca caucaaccgg
<210> 209 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 209
gcucccuuca caucaaccgg 2 0
<210> 210 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 210
gcucccaaca caucaaccgg 20
<210> 211 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 211
gcucccauca gaucaaccgg 20
<210> 212 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 212
ggcagugugc ugcuugcugc 20
<210> 213 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 213
ggcagagugc agcuugcugc 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 214
gccccagcgu gggcccaagc 20
<210> 215 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 215
gccccugccu gggcccaagc 20
<210> 216 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 216
guggcccauu gccacgaagc 20
<210> 217
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 217
gccccugcgu cggcccaagc 20
<210> 218 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 218
gaguggccug aguccagcuu 20
<210> 219 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 219
gagaccgagc agaagaagaa
<210> 220 <211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 220
gaguccgagg agaagaagaa 20
<210> 221 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 221
gaguccgagc ugaagaagaa 20
<210> 222 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 222
ggggcacagu ugagaaacuc 20
<210> 223 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 223
ggcagaaggu ggaggaggaa 20
<210> 224 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 224
ggcagaagca ggaggaggaa
<210> 225 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 225
ggagcccuug uucuucugcu 20
<210> 226
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 226
gaguggccug aguccagcuu 20
<210> 227 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 227
gacaccucca augacuaggg 20
<210> 228
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 228
gugaccucca augacuaggg 20
<210> 229 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 229
gucuccucca augacuaggg 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 230
gucagcucca augacuaggg 20
<210> 231 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 231
gucacgucca augacuaggg 20
<210> 232 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 232
gucaccacca augacuaggg 20
<210> 233 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 233
gucaccugca augacuaggg 20
<210> 234 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 234
gucaccucga augacuaggg 20
<210> 235
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 235
gucaccuccu augacuaggg
<210> 236 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 236
gucaccucca uugacuaggg 20
<210> 237 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 237
gucaucgaug uccuccccau 20
<210> 238 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 238
gagaucgaug uccuccccau 20
<210> 239 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 239
gacuucgaug uccuccccau 20
<210> 240 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 240
gacaacgaug uccuccccau
<210> 241 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 241
gacauggaug uccuccccau 20
<210> 242 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 242
gacauccaug uccuccccau 20
<210> 243 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 243
gacaucguug uccuccccau 20
<210> 244 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 244
gacaucgaag uccuccccau 20
<210> 245 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 245
gacaucgauc uccuccccau 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 246
gacaucgaug accuccccau 2 0
<210> 247 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 247
gggccaccgg uugaugugau 20
<210> 248 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 248
gccccaccgg uugaugugau 20
<210> 249 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 249
gcggcaccgg uugaugugau 20
<210> 250 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 250
gcgcgaccgg uugaugugau 20
<210> 251 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 251
gcgccuccgg uugaugugau
<210> 252 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 252
gcgccagcgg uugaugugau 20
<210> 253 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 253
gcgccacggg uugaugugau 20
<210> 254 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 254
gcgccacccg uugaugugau 20
<210> 255 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 255
gcgccaccgc uugaugugau 20
<210> 256 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 256
gcgccaccgg augaugugau
<210> 257
<211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 257
gggccacaga ugagaaacuc 20
<210> 258 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 258
guucaaacgg cagaagcugg 20
<210> 259
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 259
guacuaacgg cagaagcugg 20
<210> 260 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 260
guacaaacgg gagaagcugg 20
<210> 261 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 261
gccagaagcu ggaggaggaa 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 262
ggcacaagcu ggaggaggaa 20
<210> 263 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 263
ggcagaaccu ggaggaggaa 20
<210> 264 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 264
ggcagaagca ggaggaggaa 20
<210> 265 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 265
ggcagaagcu cgaggaggaa 20
<210> 266 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 266
gcacccauca caucaaccgg 20
<210> 267 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 267
gcucccuuca caucaaccgg
<210> 268
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 268
gcucccaaca caucaaccgg 20
<210> 269 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 269
gcucccauca gaucaaccgg 20
<210> 270 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 270
ggcagugugc ugcuugcugc 20
<210> 271 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 271
ggcagagugc agcuugcugc 20
<210> 272 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 272
gccccagcgu gggcccaagc
<210> 273 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 273
gccccugccu gggcccaagc 20
<210> 274 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 274
guggcccauu gccacgaagc 20
<210> 275 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 275
gccccugcgu cggcccaagc 20
<210> 276 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 276
gaguggccug aguccagcuu 20
<210> 277 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 277
gagaccgagc agaagaagaa 20
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 278
gaguccgagg agaagaagaa 20
<210> 279 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 279
gaguccgagc ugaagaagaa 20
<210> 280 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 280
ggggcacagu ugagaaacuc 20
<210> 281 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 281
ggcagaaggu ggaggaggaa 20
<210> 282 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 282
ggcagaagca ggaggaggaa 20
<210> 283 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 283
ggagcccuug uucuucugcu
<210> 284 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 284
gaguggccug aguccagcuu 20
<210> 285 <211> 24
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 285
gagttcctac tcagactgtt actc 24
<210> 286 <211> 26 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 286
gtgagttcct actcagactg ttactc 26
<210> 287 <211> 28 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 287
gtctgagttc ctactcagac tgttactc 28
<210> 288 <211> 24 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 288
gtattcgtac tcagactgtt actc
<210> 289 <211> 26 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 289
gagtattcgt actcagactg ttactc 26
<210> 290 <211> 25 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 290
gacttcggtc cgagcagaag aagaa 25
<210> 291 <211> 26 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 291
ggacttcggt ccgagcagaa gaagaa 26
<210> 292 <211> 28 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 292
gcggacttcg gtccgagcag aagaagaa 28
<210> 293 <211> 24 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 293
gcgggagtcc gagcagaaga agaa 24
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 294
gtcgggagtc cgagcagaag aagaa 2 5
<210> 295
<211> 26 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 295
gctcgggagt ccgagcagaa gaagaa 26
<210> 296 <211> 30 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 296
gttcacttcg gggtgggggg agtttgctcc 30
<210> 297
<211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 297
gttcattcgg ggtgggggga gtttgctcc 29
<210> 298 <211> 28 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 298
gtccttcggg gtggggggag tttgctcc 28
<210> 299 <211> 30 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 299
gcttccttcg gggtgggggg agtttgctcc
<210> 300 <211> 30 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 300
gtttccttcg gggtgggggg agtttgctcc 30
<210> 301 <211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 301
gctccttcgg ggtgggggga gtttgctcc 29
<210> 302 <211> 30 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 302
gcccacttcg gggtgggggg agtttgctcc 30
<210> 303 <211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 303
gcccattcgg ggtgggggga gtttgctcc 29
<210> 304 <211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 304
gccccttcgg ggtgggggga gtttgctcc
<210> 305 <211> 30
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 305
gcatccttcg gtgtgggggg agtttgctcc 30
<210> 306
<211> 25 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 306
gccccgggtg gggggagttt gctcc 25
<210> 307 <211> 24 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 307
gcccgggtgg ggggagtttg ctcc 24
<210> 308
<211> 23 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 308
gccgggtggg gggagtttgc tcc 23
<210> 309 <211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 309
gcacgttcgg gtgagtgagt gtgtgcgtg 29
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 310
gtacgttcgg gtgagtgagt gtgtgcgtg 29
<210> 311 <211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 311
gcatgttcgg gtgagtgagt gtgtgcgtg 29
<210> 312 <211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 312
gtatgttcgg gtgagtgagt gtgtgcgtg 29
<210> 313 <211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 313
gcgcgttcgg gtgagtgagt gtgtgcgtg 29
<210> 314 <211> 29 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 314
gcgtgttcgg gtgagtgagt gtgtgcgtg 29
<210> 315 <211> 28 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 315
gtaggttcgc ctactcagac tgttactc
<210> 316 <211> 21
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 316
ggcctcccca aagcctggcc a 21
<210> 317 <211> 21 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 317
gacctcccca tagcctggcc a 21
<210> 318 <211> 6 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 318
gggagt 6
<210> 319 <211> 6 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 319
gggagg 6
<210> 320 <211> 27 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 320
tttcctgatg gtccatgtct gttactc
<210> 321
<211> 27
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид <400> 321
tttcgtgatg gtccatgtct gttactc 27
<210> 322 <211> 27 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 322
tttccagttg gtccatgtct gttactc 27
<210> 323 <211> 27 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 323
tttcctgatg gtccatgtct gttactg 27
<210> 324 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический праймер
<400> 324
ctgggactca ggcgggtcac 20
<210> 325 <211> 25 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический праймер
<400> 325
cctcacacaa cagcttcatg tcagc 25
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 326
ctgatggtgc atgtctgtta 20
<210> 327 <211> 17 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 327
ctgatggtgc atgtctg 17
<210> 328 <211> 32 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 328
ctgatggtgc atgtctgtta agacatgcac ca 32
<210> 329
<211> 26 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 329
ctgatggtgc atgtctgcat gcacca 26
<210> 330 <211> 28 <212> ДНК
<213> Неустановленное
<220>
<223> Описание неизвестного: Олигонуклеотид DNMT1
<400> 330
tttcctgatg ggtccatgtc tgttactc 28
<210> 331 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 331
ctgatggtgc atgtctgtta
<210> 332 <211> 17 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 332
ctgatggtgc atgtctg 17
<210> 333 <211> 32 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 333
ctgatggtgc atgtctgtta agacatgcac ca 32
<210> 334
<211> 26
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 334
ctgatggtgc atgtctgcat gcacca 26
<210> 335
<211> 32 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 335
gtgagtaggt tcgcctactc agactgttac tc 32
<210> 336 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 336
atcctgtccc tagtggcccc
<210> 337 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 337
ggggccacta gggacaggat 20
<210> 338
<211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 338
ggggccacua gggacaggau 20
<210> 339 <211> 18 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<400> 339
ggccacuagg gacaggau 18
<210> 340 <211> 20 <212> ДНК
<213> Неустановленное
<220>
<223> Описание неизвестного: Олигонуклеотид для целевого сайта VEGFA1
<400> 340
gggtgggggg agtttgctcc 20
<210> 341 <211> 20 <212> ДНК
<213> Неустановленное
<220>
<223> Описание неизвестного: Олигонуклеотид для нецелевого сайта VEGFA1
<400> 341
ggatggaggg agtttgctcc 20
<220>
<223> Описание искусственной последовательности: Синтетическая 6xHis метка
<400> 342
His His His His His His 1 5
<210> 343 <211> 20
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический праймер
<220>
<223> 5'-биотинилирование
<400> 343
ccaggatcag tgaaacgcac 2 0
<210> 344 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический праймер
<400> 344
gagctctact ggcttctgcg 20
<210> 345 <211> 17 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический праймер
<220>
<223> 5'-биотинилирование
<400> 345
catgacgtgc agcaagc 17
<210> 346 <211> 17 <212> ДНК
<213> Искусственная последовательность
<220>
<400> 346
cgacgatgcg ctgaatc
<210> 347
<211> 23 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический праймер
<220>
<223> 5'-биотинилирование
<400> 347
gacctgcagg catgcaagct tgg 23
<210> 348 <211> 22 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: Синтетический праймер
<400> 348
cagcgtcccc ggttgtgaat ct
ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ получения оптимизированной направляющей РНК (gRNA), при этом способ предусматривает:
a) идентификацию представляющей интерес целевой области,
при этом представляющая интерес целевая область содержит
последовательность протоспейсера;
b) определение полинуклеотидной последовательности
полноразмерной gRNA, которая нацеливается на представляющую
интерес целевую область, при этом полноразмерная gRNA содержит
нацеливающиеся на протоспейсер последовательность или сегмент;
c) определение по меньшей мере одного или нескольких нецелевых сайтов для полноразмерной gRNA;
d) получение полинуклеотидной последовательности первой gRNA, при этом первая gRNA содержит полинуклеотидную последовательность полноразмерной gRNA и сегмент РНК, при этом сегмент РНК содержит полинуклеотидную последовательность, имеющую М нуклеотидов в длину, которая комплементарна нуклеотидному сегменту нацеливающихся на протоспейсер последовательности или сегмента, при этом сегмент РНК расположен на 5'-конце полинуклеотидной последовательности полноразмерной gRNA, при этом первая gRNA необязательно содержит линкер между 5'-концом полинуклеотидной последовательности полноразмерной gRNA и сегментом РНК, при этом линкер содержит полинуклеотидную последовательность, имеющую N нуклеотидов в длину, при этом первая gRNA способна встраиваться в последовательность протоспейсера, и связываться с последовательностью ДНК, которая комплементарна последовательности протоспейсера, и образовывать дуплекс с протоспейсером, и при этом первая gRNA способна встраиваться в нецелевой сайт, и связываться с последовательностью ДНК, которая комплементарна нецелевому сайту, и образовывать нецелевой дуплекс;
e) вычисление оценочного показателя или вычислительное моделирование кинетики встраивания и времени нахождения, в течение которого первая gRNA остается встроенной в дуплексы протоспейсера и нецелевого сайта, где динамику встраивания оценивают нуклеотид за нуклеотидом путем определения
c)
энергетических различий между дополнительным встраиванием
отличающейся gRNA и повторным отжигом первой gRNA с
последовательностью ДНК, которая комплементарна
последовательности протоспейсера;
f) сравнение значений предполагаемого времени нахождения в сайтах протоспейсера и/или нецелевых сайтах первой gRNA со значениями предполагаемого времени нахождения полноразмерной gRNA или усеченной gRNA (tru-gRNA) в сайтах протоспейсера и/или нецелевых сайтах;
д) рандомизацию от 0 до N нуклеотидов в линкере и от 0 до М нуклеотидов в первой gRNA, и получение второй gRNA, и повторение стадии (е) со второй gRNA;
h) идентификацию оптимизированной gRNA на основе
последовательности gRNA, которая удовлетворяет критериям
конструирования; и
i) тестирование оптимизированной gRNA in vivo для
определения специфичности связывания.
2. Способ получения оптимизированной направляющей РНК (gRNA), при этом способ предусматривает:
a) идентификацию представляющей интерес целевой области,
при этом представляющая интерес целевая область содержит
последовательность протоспейсера;
b) определение полинуклеотидной последовательности
полноразмерной gRNA, которая нацеливается на представляющую
интерес целевую область, при этом полноразмерная gRNA содержит
нацеливающиеся на протоспейсер последовательность или сегмент;
c) определение по меньшей мере одного или нескольких нецелевых сайтов для полноразмерной gRNA;
d) получение полинуклеотидной последовательности первой gRNA, при этом первая gRNA содержит полинуклеотидную последовательность полноразмерной gRNA и сегмент РНК, при этом сегмент РНК содержит полинуклеотидную последовательность, имеющую М нуклеотидов в длину, которая комплементарна нуклеотидному сегменту нацеливающихся на протоспейсер последовательности или сегмента, при этом сегмент РНК расположен на 3'-конце полинуклеотидной последовательности полноразмерной
c)
gRNA, при этом первая gRNA необязательно содержит линкер между 3'-концом полинуклеотидной последовательности полноразмерной gRNA и сегментом РНК, при этом линкер содержит полинуклеотидную последовательность, имеющую N нуклеотидов в длину, при этом первая gRNA способна встраиваться в последовательность протоспейсера, и связываться с последовательностью ДНК, которая комплементарна последовательности протоспейсера, и образовывать дуплекс с протоспейсером, и при этом первая gRNA способна встраиваться в нецелевой сайт, и связываться с последовательностью ДНК, которая комплементарна нецелевому сайту, и образовывать нецелевой дуплекс;
e) вычисление оценочного показателя или вычислительное
моделирование кинетики встраивания и времени нахождения, в
течение которого первая gRNA остается встроенной в дуплексы
протоспейсера и нецелевого сайта, где динамику встраивания
оценивают нуклеотид за нуклеотидом путем определения
энергетических различий между дополнительным встраиванием
отличающейся gRNA и повторным отжигом первой gRNA с
последовательностью ДНК, которая комплементарна
последовательности протоспейсера;
f) сравнение значений предполагаемого времени нахождения в сайтах протоспейсера и/или нецелевых сайтах первой gRNA со значениями предполагаемого времени нахождения полноразмерной gRNA или усеченной gRNA (tru-gRNA) в сайтах протоспейсера и/или нецелевых сайтах;
д) рандомизацию от 0 до N нуклеотидов в линкере и от 0 до М нуклеотидов в первой gRNA, и получение второй gRNA, и повторение стадии (е) со второй gRNA;
h) идентификацию оптимизированной gRNA на основе
последовательности gRNA, которая удовлетворяет критериям
конструирования; и
i) тестирование оптимизированной gRNA in vivo для
определения специфичности связывания.
3. Способ по п. 1 или п. 2, где энергетический баланс дополнительного встраивания отличающейся gRNA определяют путем определения энергетического баланса по меньшей мере одного из
(I) нарушения спаривания оснований ДНК-ДНК, (II) образования пар оснований РНК-ДНК, (III) энергетического различия, возникающего в результате разрушения или образования отличающейся вторичной структуры внутри не встроенной направляющей РНК, и (IV) образования или разрушения взаимодействий между вытесненной нитью ДНК, которая комплементарна протоспейсеру, и любыми неспаренными нуклеотидами направляющей РНК, которые не вовлечены во вторичные структуры.
4. Способ по п. 3, где энергетический баланс повторного
отжига первой gRNA с последовательностью ДНК, которая
комплементарна последовательности протоспейсера, определяют
путем определения энергетического баланса по меньшей мере одного
из (I) образования пар оснований ДНК-ДНК, (II) разрушения пар
оснований РНК-ДНК, (III) энергетического различия, возникающего
в результате разрушения или образования отличающейся вторичной
структуры внутри новой не встроенной направляющей РНК, и (IV)
образования или разрушения взаимодействий между вытесненной
нитью ДНК, которая комплементарна протоспейсеру, и любыми
неспаренными нуклеотидами направляющей РНК, которые не вовлечены
во вторичные структуры.
5. Способ по п. 4, дополнительно предусматривающий определение энергетических факторов по меньшей мере одного из (V) спаривания оснований среди ошибочных спариваний, (VI) взаимодействий с белком Cas 9 и/или (VII) дополнительных эвристических показателей, где дополнительные эвристические показатели относятся к продолжительности связывания, степени встраивания, стабильности встраивающейся направляющей РНК или другим расчетным/моделируемым свойствам встраивания gRNA для расщепляющей активности Cas9.
6. Способ по п. 1 или п. 2, где полноразмерная gRNA содержит от приблизительно 15 до 2 0 нуклеотидов.
7. Способ по п. 1 или п. 2, где М составляет от 1 до 20.
8. Способ по п. 7, где М составляет от 4 до 10.
9. Способ по п. 1 или п. 2, где сегмент РНК содержит от 2 до 15 нуклеотидов, которые комплементарны нацеливающейся на протоспейсер последовательности.
7.
10. Способ по п. 1 или п. 2, где N составляет от 1 до 20.
11. Способ по п. 10, где N составляет от 3 до 10.
12. Способ по п. 1 или п. 2, где сегмент РНК и/или нацеливающаяся на протоспейсер последовательность обеспечивают вторичную структуру.
13. Способ по п. 12, где вторичная структура образуется путем частичной гибридизации нацеливающейся на протоспейсер последовательности с сегментом РНК.
14. Способ по п. 13, где вторичная структура модулирует связывание или расщепление ДНК посредством Cas9 путем нарушения встраивания оптимизированной gRNA в дуплекс протоспейсера или нецелевой дуплекс.
15. Способ по п. 12, где вторичная структура образуется путем гибридизации всего или части сегмента РНК с нуклеотидами на 5'-конце нацеливающихся на протоспейсер последовательности или сегмента, нуклеотидами в середине нацеливающихся на протоспейсер последовательности или сегмента, и/или нуклеотидами на 3'-конце нацеливающихся на протоспейсер последовательности или сегмента.
16. Способ по п. 12, где вторичная структура представляет собой шпильку.
17. Способ по п. 12, где вторичная структура является стабильной при комнатной температуре или при 37°С.
18. Способ по п. 12, где общая равновесная свободная энергия вторичной структуры составляет менее приблизительно 2 ккал/моль при комнатной температуре или при 37°С.
19. Способ по п. 12, где сегмент РНК гибридизируется или образует неканонические пары оснований по меньшей мере с двумя нуклеотидами нацеливающихся на протоспейсер последовательности или сегмента.
20. Способ по п. 19, где неканоническая пара оснований представляет собой rU-rG.
21. Способ по п. 1 или п. 2, где оптимизированную gRNA применяют с системой на основе CRISPR/Cas9 или с системой на основе CRISPR/Cpfl в клетке.
7.
22. Способ по п. 1 или п. 2, где вторичная структура защищает оптимизированную gRNA в системе на основе CRISPR/Cas9 или системе на основе CRISPR/Cpfl с целью предотвращения разрушения в клетке.
23. Способ по п. 1 или п. 2, где 1-20 нуклеотидов рандомизированы в линкере.
24. Способ по п. 1 или п. 2, где 1-20 нуклеотидов рандомизированы в сегменте РНК.
25. Способ по п. 1 или п. 2, где стадию (д) повторяют X раз, с получением тем самым gRNA в количестве X, и повторяют стадию (е) с каждым количеством X gRNA, где X составляет от 0 до 20 .
26. Способ по п. 1 или п. 2, где кинетику встраивания и время нахождения вычисляют с применением кинетической методики Монте-Карло или алгоритма Гиллеспи.
27. Способ по п. 1 или п. 2, где кинетика встраивания представляет собой скорость, с которой направляющая РНК встраивается в дуплекс протоспейсера с обеспечением полного встраивания таким образом, что встраивание в протоспейсер является полностью осуществленным, и/или скорость, с которой сегмент ДНК протоспейсера, связанной с gRNA, удлиняется по мере его вытеснения из его комплементарной нити и связывания с gRNA нуклеотид за нуклеотидом от его РАМ-проксимальной области до полного встраивания.
28. Способ по п. 1 или п. 2, где критерии конструирования предусматривают специфичность, модуляцию продолжительности связывания и/или расчетную специфичность расщепления.
29. Способ по п. 28, где критерии конструирования предусматривают оптимизированную gRNA с продолжительностью связывания, которая больше или равна продолжительности связывания полноразмерной gRNA с целевым сайтом, и/или с продолжительностью связывания, которая меньше или равна продолжительности связывания полноразмерной gRNA с нецелевым сайтом.
30. Способ по п. 2 9, где критерии конструирования предусматривают оптимизированную gRNA с продолжительностью
29.
связывания, которая меньше или равна продолжительности связывания полноразмерной gRNA по меньшей мере с тремя нецелевыми сайтами, где нецелевые сайты согласно прогнозированию представляют собой ближайшие нецелевые сайты, или прогнозируется, что они имеют наивысшую степень идентичности с целевыми сайтами.
31. Способ по п. 28, где критерии конструирования предусматривают время нахождения или скорость расщепления в нецелевом сайте, которые меньше или равны времени нахождения или скорости расщепления полноразмерной gRNA или усеченной gRNA в нецелевом сайте, и/или прогнозируемый показатель целевой активности, который составляет более 10% от прогнозируемого показателя целевой активности полноразмерной gRNA или усеченной gRNA.
32. Способ по п. 1 или п. 2, где оптимизированную gRNA тестируют на стадии i) с применением анализа surveyor, методик секвенирования нового поколения или GUIDE-Seq.
33. Способ по п. 1 или п. 2, где оптимизированная gRNA сконструирована для минимизации связывания в нецелевом сайте и обеспечения возможности связывания с последовательностью протоспейсера.
34. Способ по п. 1 или п. 2, где нецелевой сайт представляет собой известный или прогнозируемый нецелевой сайт.
35. Способ по п. 1 или п. 2, где полноразмерная gRNA нацелена на ген млекопитающего.
36. Способ по п. 1 или п. 2, где целевой ген предусматривает эндогенный целевой ген или трансген.
37. Способ по п. 1 или п. 2, где целевой ген предусматривает ген, связанный с заболеванием.
38. Способ по п. 1 или п. 2, где целевой ген представляет собой ген DMD, ЕМХ1 или VEGFA.
39. Способ по п. 38, где ген VEGFA представляет собой VEGFA1 или VEGFA3.
40. Оптимизированная gRNA, полученная с помощью способа по п. 1 или п. 2.
41. Оптимизированная gRNA по п. 40, где gRNA может
различать целевые и нецелевые сайты с минимальными термодинамическими энергетическими различиями между сайтами.
42. Оптимизированная gRNA по п. 40, где оптимизированная gRNA модулирует встраивание нити в протоспейсер.
43. Оптимизированная gRNA по п. 40, где оптимизированная gRNA содержит нуклеотидную последовательность по меньшей мере из одного из SEQ ID NO: 149-315, 321-323 и 326-329.
44. Выделенный полинуклеотид, кодирующий оптимизированную gRNA по п. 4 0.
45. Вектор, содержащий выделенный полинуклеотид по п. 44.
46. Клетка, содержащая выделенный полинуклеотид по п. 4 4 или вектор по п. 45.
47. Набор, содержащий выделенный полинуклеотид по п. 44, вектор по п. 4 5 или клетку по п. 46.
48. Способ эпигеномного редактирования в клетке-мишени или субъекте, при этом способ предусматривает приведение клетки или субъекта в контакт с эффективным количеством молекулы оптимизированной gRNA по п. 40 и слитого белка, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
49. Способ сайт-специфического расщепления ДНК в клетке-мишени или субъекте, при этом способ предусматривает приведение клетки или субъекта в контакт с эффективным количеством молекулы оптимизированной gRNA по п. 40 и слитого белка или белка Cas9, при этом слитый белок содержит первый полипептидный домен, содержащий дефицитную по нуклеазной активности Cas9, и второй полипептидный домен с активностью, выбранной из группы, состоящей из активности активации транскрипции, активности репрессии транскрипции, нуклеазной активности, активности фактора освобождения транскриптов, активности модификации
42.
гистонов, активности ассоциации нуклеиновых кислот, ДНК-метилазной активности и прямой или непрямой ДНК-деметилазной активности.
50. Способ редактирования генома в клетке, при этом способ
предусматривает введение в клетку эффективного количества
молекулы оптимизированной gRNA по п. 4 0 и слитого белка, при
этом слитый белок содержит первый полипептидный домен,
содержащий дефицитную по нуклеазной активности Cas9, и второй
полипептидный домен с активностью, выбранной из группы,
состоящей из активности активации транскрипции, активности
репрессии транскрипции, нуклеазной активности, активности
фактора освобождения транскриптов, активности модификации
гистонов, активности ассоциации нуклеиновых кислот, ДНК-
метилазной активности и прямой или непрямой ДНК-деметилазной
активности.
51. Способ по п. 50, где редактирование генома предусматривает коррекцию мутантного гена или вставку трансгена.
52. Способ по п. 51, где коррекция мутантного гена предусматривает делецию, перестройку или замену мутантного гена.
53. Способ по п. 51, где коррекция мутантного гена предусматривает опосредованное нуклеазой негомологичное соединение концов или репарацию с участием гомологичной рекомбинации.
54. Способ модулирования экспрессии гена в клетке, при этом
способ предусматривает приведение клетки в контакт с эффективным
количеством молекулы оптимизированной gRNA по п. 4 0 и слитого
белка, при этом слитый белок содержит первый полипептидный
домен, содержащий дефицитную по нуклеазной активности Cas9, и
второй полипептидный домен с активностью, выбранной из группы,
состоящей из активности активации транскрипции, активности
репрессии транскрипции, нуклеазной активности, активности
фактора освобождения транскриптов, активности модификации
гистонов, активности ассоциации нуклеиновых кислот, ДНК-
метилазной активности и прямой или непрямой ДНК-деметилазной
активности.
55. Способ по п. 54, где экспрессию гена, по меньшей мере
одного целевого гена, модулируют, если уровни экспрессии гена, по меньшей мере одного целевого гена, увеличены или уменьшены по сравнению с уровнями экспрессии нормального гена, по меньшей мере для одного целевого гена.
56. Способ по п. 54, где слитый белок содержит домен dCas9
и активатор транскрипции.
57. Способ по п. 56, где слитый белок содержит
аминокислотную последовательность под SEQ ID N0: 2.
58. Способ по п. 54, где слитый белок содержит домен dCas9
и репрессор транскрипции.
59. Способ по п. 58, где слитый белок содержит
аминокислотную последовательность под SEQ ID N0:3.
60. Способ по п. 54, где слитый белок содержит домен dCas9 и сайт-специфическую нуклеазу.
61. Способ по любому из пп. 48-60, где оптимизированная gRNA кодируется полинуклеотидной последовательностью и упакована в лентивирусный вектор.
62. Способ по п. 61, где лентивирусный вектор содержит кассету экспрессии, содержащую промотор, функционально связанный с полинуклеотидной последовательностью, кодирующей gRNA.
63. Способ по п. 62, где промотор, функционально связанный с полинуклеотидом, кодирующим оптимизированную gRNA, является индуцируемым.
64. Способ по п. 61, где лентивирусный вектор дополнительно содержит полинуклеотидную последовательность, кодирующую белок Cas9 или слитый белок.
65. Способ по любому из пп. 4 8-64, где по меньшей мере один целевой ген представляет собой ген, связанный с заболеванием.
66. Способ по любому из пп. 48-65, где клетка-мишень представляет собой эукариотическую клетку.
67. Способ по любому из пп. 48-66, где клетка-мишень представляет собой клетку млекопитающего.
68. Способ по любому из пп. 48-67, где клетка-мишень представляет собой клетку НЕК293Т.
По доверенности
5G|-
эо|.
ю !¦
(c)>
РАМ: II
.спаривание
ДНК, полученная из AAVS1
ПОЯСНЕНИЕ: Ошибочное;
РАМ
Спаривания Протоспейсер
> dCa s.9
4О0 -ёоо *"^ю~"Тооо"
Расстояние вдоль ДНК (п. о.)
ПНИ ИII ММ
(ill
Сконструированная ДНК
СЗ) (5) Ш -'(4)
i f
Э 20" 4О0 600 80Q10C Расстояние вдоль ДНК (п. о.)
( I I
спариваниями
; I
И '
hp6-gRNA hplO-gRNA
:.r:.':..
GO CO
О 9ПП ШШ ЯПО ЙПП Расстояние вдоль ДНК (п. о.)
Расстояние вдоль ДНК (п. о.)
(белковые агрегаты)
определены как
Cast/ dCas9
I О-йЩр ? _ (моноваленгный) <\ "¦*+* стрептавидин
-0,5 1 1,5 2 2,5 3 3,5 4 Высота (нм)
Фиг. ЗА - ЗВ
Фиг. ЗС - 3D
I шшш sgRNA [
rm I
R-петля
2 4 6 8 10121416182:0 Длина R-петли (п. о.)
2 4 6 8- 1012 1416 18 Длина R-петли (п. о.)
100 150 200 250 300 350 400 Время (произв. единиц)
Фиг. 4D
А) °мм
1ММ
sgRNA
2MM
lilliBi
шшшшштшшшшй^шшшшшшшшшшшшгжгж^шшшмшттшшжшт 11 в^шшш^шжшшш^^х^^^-^^ш^ш^^ш^^ш^ш^^ш^шш^^^^ш^ш
в) 0т,мм'(tm)да
J -5 #ййо" ffiiям'^' <' <'t/iл". Ш- Щ'кЛШ Ш Ш Ш'. /к- Ш-'Ш.Ш> . У & 'iff:
1 i тштшмттшттттттшшмжшж 12 №1ШШ11М1№Х <^ 'штшшшш.
wfllw fwfiwlf икр aw kovkP годоеи доггтеъ ник л" клк жждек нтнп! л!" ли"
кбб^й" wЈ vw "aiЈyra "ойбас '".а" "сг иойга^ liSwiaa им jiftsS ада ^ci"S"i
4 ^шшшш^ш^ш^шш^ш^ш^шшшш^ш^шшшш^ш ifliiiHHHiiiiiHiiiH
оо со
Энергия связывания
12 14 16 18 20 Средний отрезок времени (KMC) РНК, связавшаяся в сайтах > m
0,7 0,6 0,5 0,4 0,3 0,2 ОД о,
0 0,05 0,1 0,15 0,2
MLE частоты разрезания
(Hsu et al. (2013) Nat. Biotechnol)
О СП
Фиг. 6А - 6В
Обнаружение
A) sgRNA
f sgRNA с
"простым" 5'-удлинением
(Ran et al.)
Конформационное изменение
Удлинение
•*v-v* gRNA-ДНК
Образование пар,
стабилизированное в
ключевых 16-18 п. о.
l h 11 у .kJq",h -0-г,п. о.
Временные взаимодействия gRNA и РАМ-дистальной ДНК в ошибочно спаренных протоспейсерах обеспечивают возможность конформационного изменения для
Расщепление
в) tru-gRNA
Образование пар gRNA-ДНкЧолныЙ протоспейсер
дестабилизировано в 14-17
п. о. ' протоспейсера
Ji Ifl^- it tJM.fl Mir.'.L's
'Дистальное ошибочное спаривание
CD CO
С) hp-gRNA
(tm) ti t нт .-fin l
Изменчивости R-петли для tru-gRNA обеспечивает возможность того, что будут многократно пересекаться несовпадения
и значительно затруднено в тех сайтах Полный протоспейсер
i' i " 1 I ' чаш \J (шпилька
Дистальное вытеснена)
'"^Д^:I [J.i(
Шпилька способствует плавлению gRNA-ДНК в сайтах ошибочного спаривания
(шпилька не вытеснена)
Сж9
0,2:
0,15 г
0-1
<
0,05:
()•
-о,0-4
3G 4О0 600 Ш
Расстояние вдоль ДНК (п. о.)
MIIIIJIHLIH жт^.
зт w mm щт ¦¦¦¦"х>
Расстояние вдоль ДНК (п. о.)
со со
Объем
Высота
Структурный кластер
О 200 4ии 600 800 1000 Расстояние вдоль ДНК (п. о.)
ДНК, полученная из AAVS1 ДНК
о m
МШШВ &
МШш
0 200 400 600 800 1000 Расстояние вдоль ДНК (п. о.)
0 200 400 600 800 1000 Расстояние вдоль ДНК (п. о.)
200 400 600 800 1000 Расстояние вдоль ДНК (п. о.)
СП СП
Фиг. 12А
Объем
Высота
Структурный
Сконструированная ДНК
'¦A%.- ¦/
'Нонсенс' ДНК
XT* (N
400 600 800 1000 Расстояние вдоль ДНК (п. о.)
CD СО
0,5 1 1,5 2 2,5 3 3,5 4 4,5 Высота (нм)
0,5 1 1,5 2 2,5 3 3,5 4 4,5 Высота (нм)
нз ° ю
0,5 1 1,5 2 2,5 3 3,5 4 4,5 Высота (нм)
-gRNA
hp6-gRNA
hplO-gRNA
35 ^
I {.
\ л
- -Я
'ого Зое 1000
i i
. il
Расстояние (п. о.)
Расстояние (п. о.
Расстояние (п. о.)
Д) Модель встраивания нити протоспейсера ДНК с помощью направляющей РНК
Гш \
Ш' Г"
'"¦"'."'/У'-Г'
15ММ /
юмм
V ,5ММ
омм.
о i.
'Высокая стабильность
• J
5 f
к \
к \
I t ¦
Pi t ¦
s I к
я ~ I
6 j
8 j
к \
Умер.
стабильность
Низкая стабильность
1SS 1el 1ft2 T93 1S* FFL8 11*
Время t (произв. единиц)
is-
Количество РАМ-дистальных
ошибочных спариваний
fiOO t
о и о м
о ю
Красная и голубые линии
Голубая )
линия
о о с
° I
(-4
о "
С Т G Т С ССТ А €3 Т G G G С С С I
CD CO
Рч "
100 I"
0 Ms
10 12 14 16 18
Сайт ошибочного спаривания
Корр. В)
Корр.
{ #
О 5
-ОД
0 4
(". макс. " (t)
-0,2
-0,3
t макс.
-0,2 2 9
J1!
.20
-0,4
t/Z-0,5
-0,7
f-0,8
Средний отрезок времени (KMC) РНК, связанная с протоспейсером в сайтах > m
Средний отрезок времени (KMC) РНК, связанная с протоспейсером в сайтах > m
Фиг. 16А - 16В
Целевая активность, нормализована по полной gRNA
Кратность повышения специфичности по сравнению с полной
gRNA
sag
AW-
Дистрофии
Tru
ipi si hp2
Фиг. 18
Мишень
Нецелевая мишень
ho со
Дорожка 1 Дорожка 2 Дорожка 3 Дорожка 4 Дорожка 5
Контроль,
Полная
Dys int_4L"4HJS
Oysint~.4l~.5H~5. шпилька 2 Dysim_4L 8Н S
g tctgagt ТССТ
Ш agt ТССТ ACTCAGACTGTTACTC g tgagt ТССТ ACTCAGACTGTTACTC
: ACTCAGACTGTTACTC
SEQ ID NO:
285 286 287
Шпилька 19 п. о., 5'-шпилька
Структура MFE при
- 1,0
Свободная энергия вторичной структуры: - 12 ккал/моль
Фиг. 21А
Шпилька 25 п. о., 5'-шпилька
Свободная энергия вторичной структуры: - 4,50 ккал/моль
Структура MFE при 37,0°С
20
lb
10 ¦ ¦
^ Контроль Ш Полная Tru
'^"ll'P'A"
со со
Dys-ON
Dys-ОТЗ
Фиг. 22
Показатель специфичности
Фиг. 23
Мишень
Нецелевая мишень 1
Нецелевая мишень 53
Контроль Полная
Tru-hps
CO CO
Дорожка 1
DVS1
па s
Дорожка 2
DYS1
Shp
ив s
Дорожка 3
[-МХ1.
_3hp
ГгЗ"_
Дорожка 4
LMX1
A hp
if-.т..
Дорожка 5
ЕМХ1
5 hp
TflS
ft ГАС Г С А ЬАСГОТ ! АГГС
G .-ifitatfCR TACTCAGACTGTTACTC
g ac ttcg gtccgagcagaegaagaa gg ac ttcg gtccgagcagaagaagaa gcgg ttcg gtccgegeagaagaagaa
SEQ ID NO:
283 289 290 291 292
Контроль Полная
int-hps 1-3
SEQ ID NO:
CO CO
Дорожка 1 GFP Контроль Дорожка 2 Полная
Дорожка 3 ?^> <:^Г_413Н_$,Шпилька 3 g egg GAGT CCGAGCAGAAGAAGAA
Дорожка 4 ЈMXiint_4L_4H_S g tegg GAGT CCGAGCAGAAGAAGAA
Дорожка 5 Efv1xl-nt 4L 6H S g GAGT CCGAGCAGAAGAAGAA
293 294 295
Структура MFE при 37,0°С
Свободная энергия вторичной структуры: - 2,80 ккал/моль
40
35
30
¦ Контроль
:;" Ш Полная
20 - " ; ^ ¦ ¦ - ¦ - - ¦ ..............Ш.Тш
¦ . со
:: v.. ^-> Я>
¦-> : т УО прз со
," '¦' ;:*'": ... ж
" Ш '' ... Г" **iT! v... _ , -"
EMX1--QN EMXI--OT2 ЕМХ1-ОТЗ FVOtl OT4 EMX1--OT5 EMX1-OT7 EMX1--QT12
Фиг. 27
1,4
1,2
0,8 0,6
0,4 0,2
?9% vVs. vv\
> -5-">
WW ¦ > '¦> ¦">
¦ Контроль
-i'Tra ш hpl hp'2
I 1
CJJ CO
EMXI-OT2
EMX1--OT3
EMX1-OT4
/1X1-
EMX1-OT12
Фиг. 28
Показатель специфичности
Фиг. 29
1 2 3 4 5
Целевая мишень
Нецелевая мишень 3
со со
о5 со
12 3 4
МИШСНЬ **и &Ь"8ч" ffP'ttw S ЧГ"
Нецелевая <> !s"*w мишень 1
со со
о5 со
Нецелевая мишень 3
"инШотёнот &1§Ш$8$8Шт w$$8s$$$ &x 5§PS
Дорожка
3 EJ VEGF1 I S
4 EJ-VEGfl-2_S
5 EJ--VF.GF1.-3_S
6 EJ-VEGF1-4_S ШПилька1
7 EJ-V'EGfI-5_S
8 EJ-VEGFl-6 3
SEQ ID NO
G TTCAC TTCG G GGTGСGGGG AGTTTGCTCC 296
G TTCA TTCG GGGTGGGGGGAGTTTGCTCC 297
G TCC TTCG GGGTGGGGGGAGTTTGCTCC 298
G CTTCC TTCG GGGTGGGGGGAGTTTGCTCC 299
G TTTCC TTCG GGGTGGGGGGAGTTTGCTCC 300
G CTCC TTCG GGGTGGGGGGAGTTTGCTCC 301
1 2
3 4 5
1 2 3 4 5
4-" CO
Дорожка SEQ ID NO:
3 VEGFlint_4L__4H_S g cccc GGGT GGGGGGAGTTTGCTCC 306
4 VEGFlint Al iH S, шпилька 5 8 ccc GGGT GGGGGGAGTTTGCTCC 307
b VEGFlint_4l._2H_> g cc GGGT GGGGGGAG TTTGCTCC 308
Структура MFE при 37,0°С
Структура MFE при 37,0°С
L% 1
Щ 1
ш 1
s Контроль i Полная ! Тш
.Ш.Ьр5.
4-" СО
Л, V
4">
-4.'
Показатель специфичности
Фиг. 37
Мишень
Нецелевая мишень 20
4-" СО
Преобразование
Surv OT2CNDS ОТ2
Дорожка
SEQ ID NO:
EJ-VEGF3-1 S bpj G CACG TTCG GGTGAGTCAGTGTGTGCGTG 309
EJ-VEGH3-2 S ':?p"- G TACG TTCG GGTGAGTOAGTGTGTGCGTG 310
EJ-4'EGF3-3_S hp3 G CATG TTCG GGTGAGTOAGTGTGTGCGTG 311
EJ-VEGF3 ¦ 4_S G TATG T TCG GGTG AGTG AG TGTGTG CG TG 312
EJ-VEGF3-5_S G CGCG TTCG GGTG AGTG AG TGTGTGCG TG 313
EJ-VEGF3-6 S G CGTG TTCG GGTG AG TGAGTGTGTGCGTG 314
Полная 22,17609557 Полная 23,44021291
ЕЛ 14,62010307 П7 12,8315672
U l 17,96688778 LJU 16,5260316 4-"
EJ3 15,45320881 EJ9 14,90816768 ^
Ei4 18,09621804 CI.10 15,88223119 CO
?5 о LJli 16,7829789
нь 11,03398795 LIT/ 10,77677544
Структура MFE при 37,0°С
,1,0
Структура MFE при 37,0°С
1и>
0,8
0.6
10,4
0,2
0,0
о и
К о о н tr
и о
" к о и
и к
Свободная энергия вторичной структуры: - 5, ккал/моль
Фиг. 40В
Структура MFE при 37,0°С
Фиг. 41
^Контроль "Полная
Показатель специфичности
С С TAG Т С AG А С Т G Т ТАС Т С SEQ ID N0: 315
Фиг. 44А
Мишень
NNGRRN
SEQ, SD N0; 316 SEQ. ID NO; 318 SEQ ID NO: 317 SEQ ID NO: 319
Вставка/делеция fm $ ' &№t 11
СП CO
Уменьшение длины протоспейсера
Увеличение длины шпильки
21 нт * 18 нт 2 нтНр -* 5 нтНр
Целевая мишень
Вставка/делеция %: ND 32,2 30,5 29,2 15,0 31,8 30,5 31,5 30,2
Нецелевая мишень
Вставка/делеция %: ND 29,7 27,3 5,5 ND ND ND ND ND
Сайты РАМ, помеченные ЖЕЛТЫМ цветом (для простоты только сайты РАМ GGT\ которые соответствуют РАМ в нативной мишени AAVS1 помечены); последовательности, комплементарные протоспейсеру, помечены Е?55ЯЯ1Я1 цветом; и последовательности, ошибочно спаренные с последовательностями протоспейсера, выделены КРАСНЫМ цветом
sgRNA (SEP ID Ж): 6):
GGGGCCACUAGGGACAGGAUguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacu ugaaaaaguggcaccgagucggugcuuuu
tru-gRNA (SEQ ID NO; 7):
GGCCACUAGGGACAGGAXJguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuuga
aaaagu ggcaccgagucggugcuuuu
hp6-gRNA (SEP ID NO i 8): o5 ggGGCCCCuucgGGGGCCACUAGGGACAGGAUguuuuagagcuagaaauagcaaguuaaaauaaggc uaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu
hplO-gRNA (SEQ ID NO: 9):
ggUAGUGGCCCCuucgGGGGCCACUAGGGACAGGAUguuuuagagcuagaaauagcaaguuaaaa
uaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu
Субстрат, полученный из
AAVS1 (SEQ ШNO 10').'
CX^A^gaicag^
gagaacegggeaggteacgcatecccccctteeefe_^^ cgiaagcaaaccUagag^ileTG^^
aftaaccggcccTX_j^a
TGG acat aggg gc с cggglTjCJG aggaagaa gae tagctgagclctcggaccccTj_^aagatg__Q_LigacagggggcTj_"
Gaagagetegcacagaetagagaggtaaggggggiag
aggagaacggggtgtЂ_C7Ajigcaaagaaag
ggugt_Ii__Agaaaaacggtgatgat^^
сс1аамадасйацацаТССсасацессССАиаадцацааццааааяццаасССАасаац1даацасй,цса FGG.uutT ,QCr utg а,ац fcai-.ga,tja,gatgccc дг> а.аа.ацасС'САдас ас шщцадцагсс HCtcagaggacatcaegTCrCH geagegecg agaaggaagtgck4,_gaaagageaicc!_^
acctgaaggagge ugcagggaaggatcTG GgCC.'A gcegtagaggtgaeC'CA g"CCA caagct gc agacagaaage ggc acaggcO_A_.gggagagaatgcaggi <. agagaaagcaggaccigi:c'i'GGwлa_.gg_.aaaeац'g &G •A VX-.-.x ggcggc
gcagaagCCAytagagctc
Сконструированный
субстрат (SEQ ID NO: 1IV
catgacgtgcagcaagcgcgetgacgcagctaattltatctatg^ tacteactcgctgttgagttfeatacagegc^
acactgc^.ctgcagcgt^gcgacagagcluyucUЈgtttea^ aagtcaacgcgctegcgttcagagatcttclO^
gcgeacacagK/r^tgcltcgettgcaart^^
a tctttctagt 1 сгС <1А§Щ caetgeaatc^
gaaaatcgatcgacgcgcacttgcagagacaCCA^^^^^^I^^^^^i^^^yL ttgtctctcgttcgoatcaag
а с ас ц ct a i it otgtctcttaaatgtttc aaaaacacatc atgtcttettegtgegagttcgatgcgcgtgtgega
cagttcUgcactatgctctcgatgtctctcttagtgattcagcgcatcgtcg
"Нонсенс" субстрат (SEQ ID NO: 12):
gacctgcaggcatgcaagciT__C__gct agcggagagtcagUcgcggtac T____3agga ggcggcgcaacglc_ЈC__uc tgtctg
cacaggagaaatccctgc__GGcgcataaagatgagacgcT_GG
ttacglBtcaggagcgcctgaacgegcJJ_^
atgcgaaaagccgggggctgactgaccggc^ggcagaacgggaag cc~cT!QЈkc gctgaataac gtc atgtcagagc agaaaaagaccTG GgcggctgaagaCCA qcttc gcgggaacTGGaTG
GcaggcctgaagtccggcTj__ЂCOV
gtcagaggTGGcgag^
tcceggg r atal^aaauauacuaCCAct-.CCAugaacgaaagtgcaarucu^oatacorca-TGGc gJ_|_G agtucaggtat аса gattaatc eg _c a gc gtcc -tcgtt grf _ata 11 gcttat gaaggctccggea gTGOc лас TGGc gtactgaeggaitcatc gtT (____ggtcgg t talaaattc tgatt agCCA^ggi aa uicagtgttatgacagcccgccggaacc^e't'GGgctttttt'^ rGG.-^gt ga a t aTGGca gi ana cat it cagga gl cct gna a gacggcacBggaaaaccggtacagaacl scaCC A Ucagct gaaagCCAgacgi aacagcaCCAcg^TGGTGGtgaacacggTGff^^
agt acggtc agtac agtgtc atcctgc aggttg acggitt tCCACX'Ai cgcacgccgggaЈ___At с accgtgtatgaagattcacaac
cggggacgctg
Гомодуплексы
Гетеродуплексы
АТГТТТ_Т
:? ^ :J. ;^ о? г - и! :#
Фиг. 46
ст> со
1. ;_"' з; :4. в 6 7 8: #: -ш::ii::i^:t3/f4 1§ is 17 is it 20 21 22 23
Несовпадающее положение в спейсере
5 ¦-SO :-45- Ж::
ТТТС€ТШТШТС€ ТТТ :11 Т15АТСШТ СС. ТТТССД€ТТб6ТССАТеТСТ <5ТТАСТС 2
320) 321) 322)
TTTiXTOAT66TCCATGTCT0TTACm 23
(SEQ ID NO: 323)
:::::
::::
¦: <¦: <№: <
?:?:?
?:?:?
?:?:'
(19)
(19)
(19)
(19)
(19)
109
112
112
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 9
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 9
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 11
<223> Описание искусственной последовательности: Синтетический полинуклеотид
<400> 11
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 22 <211> 20 <212> ДНК
<210> 22 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 38 <211> 20 <212> ДНК
<210> 38 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 54 <211> 20 <212> ДНК
<210> 54 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 70 <211> 20 <212> ДНК
<210> 70 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 86 <211> 20 <212> ДНК
<210> 86 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 102 <211> 20 <212> ДНК
<210> 102 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 118 <211> 20 <212> ДНК
<210> 118 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 134 <211> 20 <212> ДНК
<210> 134 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 150 <211> 20 <212> РНК
<210> 150 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 166 <211> 20 <212> РНК
<210> 166 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 182 <211> 20 <212> РНК
<210> 182 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 198 <211> 20 <212> РНК
<210> 198 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 214 <211> 20 <212> РНК
<210> 214 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 230 <211> 20 <212> РНК
<210> 230 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 246 <211> 20 <212> РНК
<210> 246 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 262 <211> 20 <212> РНК
<210> 262 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 278 <211> 20 <212> РНК
<210> 278 <211> 20 <212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 294 <211> 25 <212> ДНК
<210> 294 <211> 25 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 310 <211> 29 <212> ДНК
<210> 310 <211> 29 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 326 <211> 20 <212> ДНК
<210> 326 <211> 20 <212> ДНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<223> Описание искусственной последовательности: Синтетический олигонуклеотид
<210> 342 <211> 6
<212> БЕЛОК
<210> 342 <211> 6
<212> БЕЛОК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: Синтетический праймер
<223> Описание искусственной последовательности: Синтетический праймер
173
173
Фиг. 1А- 1D
Фиг. 1А- 1D
Фиг. 2А - 2В
Фиг. 2А - 2В
Фиг. 2С - 2D
Фиг. 2С - 2D
Фиг. 2С - 2D
Фиг. 2С - 2D
Фиг. 4А - 4С
Фиг. 4А - 4С
Фиг. 4А - 4С
Фиг. 4А - 4С
Фиг. 4А - 4С
Фиг. 5А - 5В
Фиг. 5А - 5В
Фиг. 5А - 5В
Фиг. 5А - 5В
Фиг. 5А - 5В
Фиг. 5А - 5В
Фиг. 5С
Фиг. 5С
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 7A - 7C
Фиг. 8А-8В
Фиг. 8А-8В
Фиг. 9А - 9С
Фиг. 9А - 9С
11D
Фиг. 11А -
11D
Фиг. 11А -
11D
Фиг. 11А -
11D
Фиг. 11А -
Фиг. 12В
Фиг. 12В
Фиг. 12В
Фиг. 12В
Фиг. 12В
Фиг. 12В
Фиг. 12В
Фиг. 12В
Фиг. 13
Фиг. 13
Фиг. 13
Фиг. 13
Фиг. 13
Фиг. 13
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 14A - 14C
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 19
Фиг. 19
Фиг. 20
Фиг. 20
Фиг. 24
Фиг. 24
Фиг. 25A
Фиг. 25A
Фиг. 25A
Фиг. 25A
Фиг. 25B
Фиг. 25B
Фиг. 25B
Фиг. 25B
Фиг. 25B
Фиг. 25B
Фиг. 25B
Фиг. 25B
Фиг. 26С
Фиг. 26С
Фиг. 26С
Фиг. 30
Фиг. 30
Фиг. 31А
Фиг. 31А
Фиг. 31А
Фиг. 31А
Фиг. 31B
Фиг. 31B
Фиг. 32
Фиг. 32
Фиг. 32
Фиг. 32
Фиг. 33
Фиг. 33
Фиг. 33
Фиг. 33
Фиг. 33
Фиг. 33
Фиг. 35
Фиг. 35
Фиг. 35
Фиг. 35
Фиг. 35
Фиг. 35
Фиг. 35
Фиг. 35
Фиг. 36
Фиг. 36
Фиг. 38
Фиг. 38
Фиг. 39А
Фиг. 39А
Фиг. 39B
Фиг. 39B
Фиг. 39B
Фиг. 39B
Фиг. 40С
Фиг. 40С
Фиг. 40С
Фиг. 40С
Фиг. 42
Фиг. 42
Фиг. 43
Фиг. 43
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 44С
Фиг. 45A
Фиг. 45A
Фиг. 45B
Фиг. 45B
Фиг. 45C
Фиг. 45C
Фиг. 45D
Фиг. 45D
Фиг. 47
Фиг. 47
Фиг. 47
Фиг. 47
Фиг. 47
Фиг. 47
Фиг. 47
Фиг. 47
Фиг. 47
Фиг. 47
Фиг. 48
Фиг. 48