EA201691581A1 20170228 Номер и дата охранного документа [PDF] EAPO2017\PDF/201691581 Полный текст описания [**] EA201691581 20150314 Регистрационный номер и дата заявки US61/953,333 20140314 Регистрационные номера и даты приоритетных заявок US2015/020622 Номер международной заявки (PCT) WO2015/139008 20150917 Номер публикации международной заявки (PCT) EAA1 Код вида документа [PDF] eaa21702 Номер бюллетеня [**] СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ НАПРАВЛЕННОЙ МОДИФИКАЦИИ ГЕНОВ С ПРИМЕНЕНИЕМ ОПОСРЕДОВАННОЙ ОЛИГОНУКЛЕОТИДАМИ РЕПАРАЦИИ ГЕНОВ Название документа [8] A01H 9/00, [8] C12N 15/82, [8] C12N 15/87, [8] C12N 5/00, [8] C12N 9/16 Индексы МПК [US] Битхэм Питер Р., [US] Гокал Грегори Ф.В., [US] Шопке Кристиан, [US] Сауэр Ноэль, [US] Пирс Джеймс, [US] Сегами Роза Е., [US] Мозорук Джерри Сведения об авторах [US] КИБУС ЮС ЛЛС, [NL] КИБУС ЮРОП Б.В. Сведения о заявителях
 

Патентная документация ЕАПВ

 
Запрос:  ea201691581a*\id

больше ...

Термины запроса в документе

Реферат

[RU]

Согласно настоящему изобретению предложены способы и композиции для внесения направленных изменений в последовательность ДНК. В различных аспектах и вариантах реализации предложены способы и композиции для модификации последовательности ДНК в клетке (такой как клетка растений, бактерий, дрожжей, грибов, водорослей или млекопитающих). В некоторых аспектах и вариантах реализации модификация ДНК включает комбинирование олигонуклеотидов для репарации генов с подходами, которые повышают доступность компонентов механизмов репарации генов клетки-мишени, таких как агент для разрезания ДНК.


Полный текст патента

(57) Реферат / Формула:

Согласно настоящему изобретению предложены способы и композиции для внесения направленных изменений в последовательность ДНК. В различных аспектах и вариантах реализации предложены способы и композиции для модификации последовательности ДНК в клетке (такой как клетка растений, бактерий, дрожжей, грибов, водорослей или млекопитающих). В некоторых аспектах и вариантах реализации модификация ДНК включает комбинирование олигонуклеотидов для репарации генов с подходами, которые повышают доступность компонентов механизмов репарации генов клетки-мишени, таких как агент для разрезания ДНК.


(19)
Евразийское
патентное
ведомство
(21) 201691581 (13) A1
(12) ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ЕВРАЗИЙСКОЙ ЗАЯВКЕ
(43) Дата публикации заявки 2017.02.28
(22) Дата подачи заявки 2015.03.14
(51) Int. Cl.
A01H 9/00 (2006.01) C12N15/82 (2006.01) C12N15/87 (2006.01)
C12N 5/00 (2006.01)
C12N 9/16 (2006.01)
(54) СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ НАПРАВЛЕННОЙ МОДИФИКАЦИИ ГЕНОВ С ПРИМЕНЕНИЕМ ОПОСРЕДОВАННОЙ ОЛИГОНУКЛЕОТИДАМИ РЕПАРАЦИИ ГЕНОВ
(31) (32) (33)
(86) (87) (71)
(72)
(74)
61/953,333; 62/051,579; 62/075,816; 62/075,811; 62/133,129
2014.03.14; 2014.09.17; 2014.11.05; 2014.11.05; 2015.03.13
PCT/US2015/020622
WO 2015/139008 2015.09.17
Заявитель:
КИБУС ЮС ЛЛС (US); КИБУС ЮРОП Б.В. (NL)
Изобретатель:
Битхэм Питер Р., Гокал Грегори Ф.В., Шопке Кристиан, Сауэр Ноэль, Пирс Джеймс, Сегами Роза Е., Мозорук Джерри (US)
Представитель: Нилова М.И. (RU)
(57) Согласно настоящему изобретению предложены способы и композиции для внесения направленных изменений в последовательность ДНК. В различных аспектах и вариантах реализации предложены способы и композиции для модификации последовательности ДНК в клетке (такой как клетка растений, бактерий, дрожжей, грибов, водорослей или млекопитающих). В некоторых аспектах и вариантах реализации модификация ДНК включает комбинирование олигонуклеотидов для репарации генов с подходами, которые повышают доступность компонентов механизмов репарации генов клетки-мишени, таких как агент для разрезания ДНК.
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ
НАПРАВЛЕННОЙ МОДИФИКАЦИИ ГЕНОВ С ПРИМЕНЕНИЕМ ОПОСРЕДОВАННОЙ ОЛИГОНУКЛЕОТИДАМИ РЕПАРАЦИИ ГЕНОВ
5 ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
[0001] Настоящая заявка испрашивает приоритет на основании предварительной заявки на патент США № 61/953333, поданной 14 марта 2014 г.; предварительной заявки на патент США № 62/051579, поданной 17 сентября 2014 г.; предварительной заявки на патент США № 62/075811, поданной 5 ноября 2014 г.; 62/075816, поданной 5 ноября 2014 г.; и 10 предварительной заявки на патент США № 62/133129, поданной 13 марта 2015 г., содержание каждой из которых настоящим полностью включено посредством ссылки, включая все таблицы, фигуры и формулу изобретения.
ОБЛАСТЬ ТЕХНИКИ
[0002] Настоящее описание по меньшей мере отчасти относится к направленным 15 генетическим мутациям и модификациям, включая способы и композиции для получения таких мутаций и модификаций.
УРОВЕНЬ ТЕХНИКИ
[0003] Следующее описание приведено исключительно для облегчения понимания настоящего изобретения, и не предполагается, что оно описывает или составляет известный 20 уровень техники по отношению к описанию настоящего изобретения.
[0004] В патенте Соединенных Штатов № 6271360 описаны способы и композиции для введения заранее определенных генетических изменений в целевые гены живой клетки путем введения олигодезоксинуклеотида, кодирующего заранее определенную замену. Указанные олигодезоксинуклеотиды эффективны в клетках млекопитающих, птиц, 25 растений и бактерий.
[0005] В патенте Соединенных Штатов № 8771945 описаны векторы и системы векторов, некоторые из которых кодируют один или более компонентов комплекса CRISPR, а также способы конструирования и применения таких векторов.
[0006] Патент Соединенных Штатов № 8470973 "относится к способам селективного 30 узнавания полипептидом пары оснований в последовательности ДНК, к модифицированным полипептидам, которые специфично распознают одну или более пар оснований в последовательности ДНК, и к ДНК, которая модифицирована таким образом,
чтобы ее мог специфично узнавать полипептид, и к применениям указанных полипептида и ДНК для специфичного нацеливания на ДНК, а также к способам модуляции экспрессии целевых генов в клетке".
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
5 [0007] Согласно настоящему изобретению предложены способы и композиции для осуществления направленного генетического изменения ДНК в клетке. Некоторые аспекты и варианты реализации относятся к улучшению эффективности направленного модифицирования определенных положений в геномных или других последовательностях нуклеотидов. В тексте настоящей заявки описано, что нуклеиновые кислоты, которые 10 направляют определенные изменения в геноме, можно комбинировать с различными подходами, чтобы повысить доступность компонентов природных систем репарации, присутствующих в клетках, которые являются мишенью для модификации.
[0008] В первом аспекте предложены способы введения опосредованной GRON (олигонуклеооснование для репарации генов) мутации в целевую последовательность
15 дезоксирибонуклеиновой кислоты (ДНК) в клетке растения. В некоторых вариантах реализации указанные способы могут включать, среди прочего, культивирование клетки растения при условиях, которые усиливают один или более процессов репарации клеточной ДНК, перед и/или одновременно с доставкой GRON в клетку растения; и/или доставку в клетку растения GRON, длина которого составляет больше, чем 15 оснований, при этом
20 GRON необязательно содержит один или более; или два или более сайтов мутации для их введения в целевую ДНК.
[0009] "Олигонуклеотид для репарации генов" или "GRON" в данной заявке означает олигонуклеооснование (например, смешанные дуплексные олигонуклеотиды, молекулы, содержащие ненуклеотидные части, одноцепочечные олигодезоксинуклеотиды,
25 двухцепочечные олигодезоксинуклеотиды и другие молекулы для репарации генов), которые, при определенных условиях, могут направлять введение делеций, вставок или замен одного или, в некоторых вариантах реализации, нескольких нуклеотидов в последовательность ДНК. Такое редактирование генома путем опосредованной олигонуклеотидами репарации генов может включать как системы репарации, не
30 основанные на гомологии (например, негомологичное соединение концов), так и системы репарации, основанные на гомологии (например, направляемую гомологией репарацию). GRON обычно конструируют таким образом, чтобы он точно выравнивался с геномной мишенью, за исключением сконструированного(-ых) несовпадения(-й). Данные несовпадения могут быть распознаны и исправлены с привлечением одной или более из
эндогенных для клетки систем репарации ДНК. В некоторых вариантах реализации GRON или олигонуклеотид может быть разработан таким образом, чтобы он содержал несколько отличий от целевой последовательности организма. Не все данные отличия могут влиять на белковую последовательность, транслированную с указанной целевой последовательности, 5 ив одном или более случаях они известны как молчащие изменения. Множество вариаций структуры, химического состава и функций GRON описаны в других местах в данной заявке. В различных вариантах реализации используемый в данной заявке GRON может содержать одну или более модификаций. Например, используемый в данной заявке GRON может содержать одну или более модификаций, которые привлекают аппарат репарации 10 ДНК к целевому (несовпадающему) сайту, и/или которые предотвращают рекомбинацию части или всего GRON (в отличие от желательной целевой(-ых) делеции(-й), вставки(-вок), замены (замен) или тому подобного) в геномную ДНК целевой последовательности ДНК, и/или которые повышают стабильность GRON.
[0010] В различных вариантах реализации GRON может содержать как РНК-, так и ДНК-15 нуклеотиды, и/или другие типы нуклеооснований. В некоторых вариантах реализации один или более из ДНК- или РНК-нуклеотидов содержат модификацию.
[ООН] В одном аспекте предложен способ, позволяющий вызвать генетическое изменение в клетке растения, при этом указанный способ включает воздействие на клетку агента для разрезания ДНК и GRON, например, GRON, который модифицирован, как предложено в
20 данной заявке. В некоторых вариантах реализации указанный GRON может быть модифицирован, например, группой СуЗ, группой 3PS, 2'О-метильной группой или другой модификацией, которая предложена в данной заявке. В другом аспекте предложена клетка растения, которая содержит агент для разрезания ДНК и GRON, например, где GRON модифицирован, например, группой СуЗ, группой 3PS, 2'О-метильной группой или другой
25 модификацией. В некоторых вариантах реализации указанный агент для разрезания ДНК представляет собой один или более агентов для разрезания ДНК, выбранных из CRISPR, TALEN, цинкового пальца, мегануклеазы и разрезающего ДНК антибиотика. В некоторых вариантах реализации агент для разрезания ДНК представляет собой CRISPR. В некоторых вариантах реализации агент для разрезания ДНК представляет собой TALEN. В некоторых
30 вариантах реализации длина GRON составляет от 15 до 60 нуклеооснований; или длина составляет от 30 до 40 нуклеооснований; или длина составляет от 35 до 45 нуклеооснований; или длина составляет от 20 до 70 нуклеооснований; или длина составляет от 20 до 200 нуклеооснований; или длина составляет от 30 до 180 нуклеооснований; или длина составляет от 50 до 160 нуклеооснований; или длина составляет от 70 до 150
нуклеооснований; или длина составляет от 70 до 210 нуклеооснований; или длина составляет от 80 до 120 нуклеооснований; или длина составляет от 90 до 110 нуклеооснований; или длина составляет от 95 до 105 нуклеооснований; или длина составляет от 80 до 300 нуклеооснований; или длина составляет от 90 до 250 5 нуклеооснований; или длина составляет от 100 до 150 нуклеооснований; или длина составляет от 100 до 200 нуклеооснований; или длина составляет от 100 до 210 нуклеооснований; или длина составляет от 100 до 300 нуклеооснований; или длина составляет от 150 до 200 нуклеооснований; или длина составляет от 200 до 300 нуклеооснований; или длина составляет от 250 до 350 нуклеооснований; или длина
10 составляет от 50 до 110 нуклеооснований; или длина составляет от 50 до 200 нуклеооснований; или длина составляет от 150 до 210 нуклеооснований; или длина составляет от 20 до 1000 нуклеооснований; или длина составляет от 100 до 1000 нуклеооснований; или длина составляет от 200 до 1000 нуклеооснований; или длина составляет от 300 до 1000 нуклеооснований; или длина составляет от 400 до 1000
15 нуклеооснований; или длина составляет от 500 до 1000 нуклеооснований; или длина составляет от 600 до 1000 нуклеооснований; или длина составляет от 700 до 1000 нуклеооснований; или длина составляет от 800 до 1000 нуклеооснований; или длина составляет от 900 до 1000 нуклеооснований; или длина составляет от 300 до 800 нуклеооснований; или длина составляет от 400 до 600 нуклеооснований; или длина
20 составляет от 500 до 700 нуклеооснований; или длина составляет от 600 до 800 нуклеооснований; или длина составляет более 30 нуклеооснований; или длина составляет более 35 нуклеооснований; или длина составляет более 40 нуклеооснований; или длина составляет более 50 нуклеооснований; или длина составляет более 60 нуклеооснований; или длина составляет более 65 нуклеооснований; или длина составляет более 70
25 нуклеооснований; или длина составляет более 75 нуклеооснований; или длина составляет более 80 нуклеооснований; или длина составляет более 85 нуклеооснований; или длина составляет более 90 нуклеооснований; или длина составляет более 95 нуклеооснований; или длина составляет более 100 нуклеооснований; или длина составляет более 110 нуклеооснований; или длина составляет более 125 нуклеооснований; или длина составляет
30 более 150 нуклеооснований; или длина составляет более 165 нуклеооснований; или длина составляет более 175 нуклеооснований; или длина составляет более 200 нуклеооснований; или длина составляет более 250 нуклеооснований; или длина составляет более 300 нуклеооснований; или длина составляет более 350 нуклеооснований; или длина составляет более 400 нуклеооснований; или длина составляет более 450 нуклеооснований; или длина
35 составляет более 500 нуклеооснований; или длина составляет более 550 нуклеооснований;
или длина составляет более 600 нуклеооснований; или длина составляет более 700 нуклеооснований; или длина составляет более 800 нуклеооснований; или длина составляет более 900 нуклеооснований.
[0012] GRON могут быть нацелены как на некодирующие (NC), так и на кодирующие (С) 5 области целевого гена. В качестве примера, на фигурах 27 и 28, соответственно, изображены C-GRON и NC-GRON, подходящие для введения мутаций в геном риса, чтобы ввести одну или более из следующих замен аминокислот в ген ацетил-кофермент-А-карбоксилазы (АККазы). В качестве эталона условились использовать систему нумерации аминокислот АККазы пластиды из лисохвоста мышехвостниковидного {Alopecurus
10 myosuroides] Am). Нумерация для АККазы, используемая в данной заявке, основана на нумерации для эталонной последовательности белка АККазы лисохвоста мышехвостниковидного (SEQ Ш NO: 1) или на аналогичных аминокислотных остатках в паралоге АККазы (V = CY3; Н = З'-DMT-dC-CPG). В следующей таблице перечислены мутации АККазы, которые позволяют получить фенотип, устойчивый к одному или более
15 из перечисленных гербицидов: аллоксидиму, бутроксидиму, клетодиму, клопроксидиму, циклоксидиму, сетоксидиму, тепралоксидиму, тралкоксидиму, хлоразифопу, клодинафопу, клофопу, диклофопу, феноксапропу, феноксапропу-П, фентиапропу, флуазифопу, флуазифопу-П, галоксифопу, галоксифопу-П, изоксапирифопу, пропахизафопу, хизалофопу, хизалофопу-П, трифопу, пиноксадену, агрономически приемлемым солям и
20 сложным эфирам любого из данных гербицидов, и их комбинациям.
Замена аминокислоты
Изменение кодона
Замена аминокислоты
Изменение кодона
I1781A
АТА
GCT
C2088F
TGC
ттт
АТА
GCC
TGC
ттс
АТА
GCA
АТА
GCG
C2088G
TGC
GGT
TGC
GGC
I1781L
АТА
СТТ
TGC
GGA
АТА
СТС
TGC
GGG
АТА
СТА
АТА
CTG
С2088Н
TGC
CAT
АТА
ТТА
TGC
САС
АТА
TTG
С2088К
TGC
AAA
I1781M
АТА
ATG
TGC
AAG
I1781N
АТА
ААТ
C2088L
TGC
СТТ
АТА
ААС
TGC
СТС
TGC
СТА
I1781S
АТА
ТСТ
TGC
CTG
АТА
ТСС
TGC
ТТА
Замена аминокислоты
Изменение кодона
Замена аминокислоты
Изменение кодона
АТА
ТСА
TGC
TTG
АТА
TCG
C2088N
TGC
ААТ
I1781T
АТА
ACT
TGC
ААС
АТА
АСС
АТА
АСА
С2088Р
TGC
ест
АТА
ACG
TGC
ССС
TGC
ССА
I1781V
АТА
GTT
TGC
CCG
АТА
GTC
АТА
GTA
C2088Q
TGC
САА
АТА
GTG
TGC
CAG
G1783C
GGA
TGT
C2088R
TGC
CGT
GGA
TGC
TGC
CGC
TGC
CGA
А1786Р
GCT
ест
TGC
CGG
GCT
ССС
TGC
AGA
GCT
ССА
TGC
AGG
GCT
CCG
C2088S
TGC
ТСТ
D2078G
GAT
GGT
TGC
ТСС
GAT
GGC
TGC
ТСА
GAT
GGA
TGC
TCG
GAT
GGG
С2088Т
TGC
ACT
D2078K
GAT
AAA
TGC
АСС
GAT
AAG
TGC
АСА
TGC
ACG
D2078T
GAT
ACT
GAT
АСС
C2088V
TGC
GTT
GAT
АСА
TGC
GTC
GAT
ACG
TGC
GTA
TGC
GTG
S2079F
AGC
ТТТ
AGC
ТТС
C2088W
TGC
TGG
К2080Е
AAG
GAA
AAG
GAG
[0013] Аналогично, на фигурах 29 и 30, соответственно, изображены (кодирующие) С-GRON и (некодирующие) NC-GRON, подходящие для введения мутаций в геном льна, чтобы ввести одну или более из следующих замен аминокислот в ген 5-енолпирувил-5 шикимат-3-фосфат-синтазы (EPSPS) (при этом все нумерации указаны относительно последовательности аминокислот белка AroA Е. coli (прокариотического эквивалента EPSPS) (таких, какие описаны в патенте США № 8268622). (V = CY3; Н = З'-DMT-dC-CPG).
В следующей таблице перечислены мутации EPSPS, которые позволяют получить фенотип, устойчивый к глифосату, агрономически приемлемым солям и сложным эфирам данного гербицида, и их комбинациям.
Замена аминокислоты
Изменение кодона
G96A
GGA
GCT
GGA
GCC
GGA
GCA
GGA
GCG
T97I
АСА
АТТ
АСА
АТС
АСА
АТА
Р101А
CCG
GCT
CCG
GCC
CCG
GCA
CCG
GCG
P101S
CCG
ТСТ
CCG
ТСС
CCG
ТСА
CCG
TCG
Р101Т
CCG
ACT
CCG
АСС
CCG
АСА
CCG
ACG
5 [0014] Термин "CRISPR" в данной заявке относится к элементам; т.е. к гену cas (CRISPR-ассоциированному), к его транскрипту (например, мРНК) или белку, и по меньшей мере к одной спейсерной последовательности CRISPR (короткие палиндромные повторы, регулярно расположенные группами, также известные как SPIDR - разделенные спейсерами прямые повторы); которые, когда они эффективным образом присутствуют или
10 экспрессируются в клетке, могут влиять на расщепление целевой последовательности ДНК посредством аппарата клетки CRISPR/CAS, например, как описано в Cong, L. и др., Science, том 339, № 6121 стр. 819-823 (2013); Jinek и др., Science, том 337:816-821 (2013); Wang и др., RNA, том 14, стр. 903-913 (2008); Zhang и др., Plant Physiology, том 161, стр. 20-27 (2013), Zhang и др., заявка согласно РСТ № PCT7US2013/074743; и Charpentier и др., заявка
15 согласно РСТ № PCT7US2013/032589. В некоторых вариантах реализации, таких как, например, CRISPR для применения в эукариотической клетке, CRISPR, который предложен в данной заявке, также может включать дополнительный элемент, который содержит
последовательность одного или более функциональных сигналов ядерной локализации. CRISPR, которые предложены в данной заявке, можно экспрессировать в клетке, вводить в клетку, и/или они могут присутствовать в клетке (такой как клетка растения) любым из множества способов или проявлений. Например, CRISPR, который предложен в данной 5 заявке, может содержать или включать один или более из: CRISPR на плазмиде, никазу CRISPR на плазмиде, CRISPRa на плазмиде или CRISPRi на плазмиде, как описано далее:
[0015] CRISPR на плазмиде: Рекомбинантный вектор экспрессии, содержащий:
(i) последовательность нуклеотидов, кодирующую РНК, нацеленную на ДНК (например, РНК-проводник), при этом РНК, нацеленная на ДНК, содержит:
10 а. первый фрагмент, включающий последовательность нуклеотидов,
которая комплементарна некоторой последовательности в целевой ДНК (например, протоспейсер, спейсер или крРНК); и
Ь. второй фрагмент, который взаимодействует с сайт-направленным
модифицирующим полипептидом (например, транс-активирующую крРНК
15 или тра-крРНК); и
(ii) последовательность нуклеотидов, кодирующую сайт-направленный модифицирующий полипептид (например, ген cas), при этом указанный сайт-направленный полипептид содержит:
a. РНК-связывающий участок, который взаимодействует с РНК,
20 нацеленной на ДНК (например, узнающий фрагмент REC); и
b. участок активности, который вызывает двухцепочечные разрывы в
целевой ДНК (например, нуклеазный фрагмент NUC), при этом место
введения двухцепочечных разрывов в целевой ДНК определяется РНК,
нацеленной на ДНК.
25 [0016] Никаза CRISPR на плазмиде. Рекомбинантный вектор экспрессии, содержащий:
(i) последовательность нуклеотидов, кодирующую РНК, нацеленную на
ДНК (например, РНК-проводник), при этом РНК, нацеленная на ДНК, содержит:
a. первый фрагмент, включающий последовательность нуклеотидов, которая комплементарна некоторой последовательности в целевой ДНК
30 (например, протоспейсер, спейсер или крРНК); и
b. второй фрагмент, который взаимодействует с сайт-направленным модифицирующим полипептидом (например, транс-активирующую крРНК или тра-крРНК); и
(ii) последовательность нуклеотидов, кодирующую сайт-направленный
модифицирующий полипептид (например, ген cas), при этом указанный сайт-направленный полипептид содержит:
a. РНК-связывающий участок, который взаимодействует с РНК,
5 нацеленной на ДНК (например, фрагмент REC); и
b. участок активности, который вызывает одноцепочечные разрывы в
целевой ДНК (например, фрагмент NUC), при этом место введения
одноцепочечных разрывов в целевой ДНК определяется РНК, нацеленной на
ДНК.
10 [0017] CRISPRa на плазмиде. Рекомбинантный вектор экспрессии, содержащий:
(i) последовательность нуклеотидов, кодирующую РНК, нацеленную на
ДНК (например, РНК-проводник), при этом РНК, нацеленная на ДНК, содержит:
a. первый фрагмент, включающий последовательность нуклеотидов, которая комплементарна некоторой последовательности в целевой ДНК
15 (например, протоспейсер, спейсер или крРНК); и
b. второй фрагмент, который взаимодействует с сайт-направленным модифицирующим полипептидом (например, транс-активирующую крРНК или тра-крРНК); и
(ii) последовательность нуклеотидов, кодирующую сайт-направленный
20 модифицирующий полипептид (например, ген cas), при этом указанный сайт-
направленный полипептид содержит:
a. РНК-связывающий участок, который взаимодействует с РНК,
нацеленной на ДНК (например, фрагмент REC); и
b. участок активности, который модулирует транскрипцию (например,
25 фрагмент NUC; в некоторых вариантах реализации повышает уровень
транскрипции) целевой ДНК, при этом конкретный сайт модуляции транскрипции в целевой ДНК определяется РНК, нацеленной на ДНК. [0018] CRISPRi на плазмиде. Рекомбинантный вектор экспрессии, содержащий:
(i) последовательность нуклеотидов, кодирующую РНК, нацеленную на ДНК
30 (например, РНК-проводник), при этом РНК, нацеленная на ДНК, содержит:
а. первый фрагмент, содержащий последовательность нуклеотидов, которая комплементарна некоторой последовательности в целевой ДНК (например, протоспейсер, спейсер или крРНК); и
b. второй фрагмент, который взаимодействует с сайт-направленным модифицирующим полипептидом (например, транс-активирующую крРНК или тра-крРНК); и
(ii) последовательность нуклеотидов, кодирующую сайт-направленный
модифицирующий полипептид (например, ген cas), при этом указанный сайт-направленный полипептид содержит:
a. РНК-связывающий участок, который взаимодействует с РНК, нацеленной на ДНК (например, фрагмент REC); и
b. участок активности, который модулирует транскрипцию/трансляцию (например, фрагмент NUC; в некоторых вариантах реализации снижает уровень транскрипции/трансляции) целевой ДНК, при этом конкретный сайт модуляции транскрипции/трансляции целевой ДНК определяется РНК, нацеленной на ДНК.
[0019] Для каждого из CRISPR на плазмиде, никазы CRISPR на плазмиде, CRISPRa на плазмиде и CRISPRi на плазмиде в некоторых вариантах реализации один или более соответствующих элементов, в качестве альтернативы, могут быть введены, могут экспрессироваться или присутствовать в клетке в виде РНК (например, мРНК) или белка, вместо того, чтобы присутствовать на плазмиде. Доставку защищенной мРНК можно осуществить, как описано в Kariko, и др., патент США № 8278036.
[0020] В некоторых вариантах реализации каждый из указанных CRISPRi и CRISPRa может включать деактивированный cas9 (dCas9). Деактивированный cas9 все еще связывается с целевой ДНК, но не обладает активностью, способной ее разрезать. Не способный проявлять нуклеазную активность Cas9 может образоваться в результате точечных мутаций D10А и Н840А, которые инактивируют два его каталитических домена.
[0021] В некоторых вариантах реализации CRISPRi ингибирует инициацию или элонгацию транскрипции, создавая стерическое препятствие для РНК-полимеразы П. CRISPRi необязательно можно усилить (CRISPRei) путем слияния сильного репрессорного домена с С-концом белка dCas9. В некоторых вариантах реализации репрессорный домен привлекает и использует модификаторы хроматина. В некоторых вариантах реализации репрессорный домен может включать, но не ограничен доменами, описанными в Kagale, S. и др., Epigenetics, том 6, номер 2, стр. 141-146 (2011):
1. LDLNRPPPVEN - репрессорный домен OsERF3 (мотив LxLxPP)
2. LRLFGVNM - репрессорный домен AtBRD (мотив R/KLFGV)
3. LKLFGVWL - репрессорный домен AtHsfBl (мотив R/KLFGV)
4. LDLELRLGFA - репрессорный домен AtSUP (мотив EAR)
5. ERSNSIELRNSFYGRARTSPWSYGDYDNCQQDHDYLLGFSWPPRSYTCSFCKREF RS AQ ALGGHMNVHRRDRARLRLQQ SPS S S STPSPP YPNPNYS YSTMANSPPPHHS PLTLFPTLSPPSSPRYRAGLIRSLSPKSKHTPENACKTKKSSLLVEAGEATRFTSKD
5 ACKILRNDEIISLELEIGLrNESEQDLDLELRLGFA*- целый ген AtSUP, содержащий
репрессорный домен (мотив EAR).
[0022] В некоторых вариантах реализации активации транскрипции CRISPRa добиваются путем применения белка dCas9, содержащего слитый с его С-концом активатор транскрипции. В некоторых вариантах реализации активация может включать, но не 10 ограничена перечисленными: VP64 (4Х VP 16), активирующий домен AtERF98 или конкатемеры AtERF98x4, такие как описанные в Cheng, AW и др., Cell Research, стр. 1-9 (2013); Perez-Pinera, Р. и др., Nature Methods, том 10, стр. 913-976 (2013); Maeder, мл. и др., Nature Methods, том 10, стр. 977-979 (2013), и Mali, Р., и др., Nature Biotech., том 31, стр. 833-838 (2013).
15 [0023] В некоторых вариантах реализации CRISPR содержит никазу. В некоторых вариантах реализации используют две или более никаз CRISPR. В некоторых вариантах реализации указанные две или более никаз разрезают противоположные цепи целевой нуклеиновой кислоты. В других вариантах реализации указанные две или более никаз делают разрезы на одной и той же цепи целевой нуклеиновой кислоты.
20 [0024] В данной заявке термин "репрессорный белок" или "репрессор" относится к белку, который связывается с оператором ДНК или с РНК, чтобы предотвратить транскрипцию или трансляцию, соответственно.
[0025] В данной заявке термин "репрессия" относится к ингибированию транскрипции или трансляции путем связывания репрессорного белка с определенным сайтом на ДНК или 25 мРНК. В некоторых вариантах реализации репрессия включает существенное изменение уровня транскрипции или трансляции по меньшей мере в 1,5 раза, в других вариантах реализации по меньшей мере в 2 раза, и в других вариантах реализации по меньшей мере в пять раз.
[0026] В данной заявке термин "активаторный белок" или "активатор", по отношению к 30 транскрипции и/или трансляции гена, относится к белку, который связывается с оператором ДНК или с РНК, чтобы усилить или повысить уровень транскрипции или трансляции, соответственно.
[0027] В данной заявке по отношению к транскрипции и/или трансляции гена "активация" относится к усилению или повышению уровня транскрипции или трансляции путем связывания активаторного белка с определенным сайтом на ДНК или мРНК. В некоторых вариантах реализации активация включает существенное изменение уровня транскрипции или трансляции по меньшей мере в 1,5 раза, в некоторых вариантах реализации по меньшей мере в 2 раза, и в некоторых вариантах реализации по меньшей мере в пять раз.
[0028] В некоторых вариантах реализации условия, которые усиливают один или более процессов репарации клеточной ДНК, могут включать одно или более из следующих условий: введение в GRON или в ДНК клетки растения одного или более сайтов, которые являются мишенями для эксцизионной репарации оснований, введение в GRON или в ДНК клетки растения одного или более сайтов, которые являются мишенями для негомологичного соединения концов, введение в GRON или в ДНК клетки растения одного или более сайтов, которые являются мишенями для опосредованного микрогомологией соединения концов, введение в GRON или в ДНК клетки растения одного или более сайтов, которые являются мишенями для гомологичной рекомбинации, и введение в GRON или в ДНК клетки растения одного или более сайтов, которые являются мишенями для влияния на репарацию (например, эксцизионную репарацию оснований (ЭРО); репарацию путем гомологичной рекомбинации (ГР); репарацию ошибочно спаренных оснований (РОСО); репарацию путем негомологичного соединения концов (НГСК), которая включает классическую и альтернативную НГСК; и эксцизионную репарацию нуклеотидов (ЭРН)).
[0029] В данной заявке описано, что GRON для применения в настоящем изобретении могут содержать одно или более из следующих изменений относительно обычных нуклеотидов РНК и ДНК:
один или более нуклеотидов, лишенных азотистого основания;
один или более нуклеотидов 8'-оксо-с1А и/или 8'-OKCO-dG;
перевернутое основание на его 3'-конце;
один или более 2'-0-метил-нуклеотидов;
один или более РНК-нуклеотидов;
один или более РНК-нуклеотидов на его 5'-конце, и в некоторых вариантах реализации 2, 3, 4, 5, 6, 7, 8, 9, 10 или более; при этом указанные один или более из РНК-нуклеотидов могут быть дополнительно модифицированы; один или более РНК-нуклеотидов на его 3'-конце, и в некоторых вариантах реализации 2, 3, 4, 5, 6, 7, 8, 9, 10 или более; при этом указанные один или более из РНК-нуклеотидов могут быть дополнительно модифицированы;
один или более 2'-0-метил-РНК-нуклеотидов на его 5'-конце, и в некоторых вариантах реализации 2, 3, 4, 5, 6, 7, 8, 9, 10 или более; интеркалирующий краситель; 5'-концевой кэп;
модификацию каркаса, выбранную из группы, состоящей из фосфотиоатной модификации, метилфосфонатной модификации, модификации запертой нуклеиновой кислотой (ЗНК), модификации 0-(2-метоксиэтилом) (МОЕ), модификации двумя фосфотиоатами (ди-PS) и модификации пептидо-нуклеиновой кислотой (ПНК);
одну или более внутрицепочечных поперечных сшивок; один или более флуоресцентных красителей, конъюгированных с ними, и в некоторых вариантах реализации на 5'- или 3'-конце GRON; и одно или более оснований, которые повышают энергию гибридизации. Не подразумевают, что данный перечень накладывает ограничения. [0030] Термин "неоднозначное основание" в данной заявке относится к замене одного или более нуклеотидных оснований в эталонной последовательности нуклеотидов, причем указанная замена не изменяет последовательность аминокислот, кодируемую с участием указанного нуклеотида, относительно эталонной последовательности.
[0031] Термин "не нуклеотидный" или "нуклеотид, лишенный азотистого основания", используемый в данной заявке, относится к любой группе или соединению, которое можно включить в цепь нуклеиновых кислот вместо одной или более нуклеотидных единиц, включая любые замены сахара и/или фосфата, и которое позволяет остальным основаниям проявлять их ферментативную активность. Указанная группа или соединение лишено азотистого основания в том смысле, что оно не содержит широко известного нуклеотидного основания, такого как аденозин, гуанин, цитозин, урацил или тимин. Оно может содержать замены в положениях 2' или 3' на -Н или -ОН, как описано в данной области и в данной заявке.
[0032] В данной заявке описано, что в некоторых вариантах реализации качество GRON и эффективность превращения можно улучшить путем синтеза всего или части GRON с применением нуклеотидных мультимеров, таких как димеры, тримеры, тетрамеры и т.д., что улучшает его чистоту.
[0033] В некоторых вариантах реализации целевая последовательность дезоксирибонуклеиновой кислоты (ДНК) находится в клетке растения, например, целевая последовательность ДНК находится внутри генома клетки растения. Клетка растения
может быть нетрансгенной или трансгенной, и целевая последовательность ДНК может представлять собой трансген или эндогенный ген указанной клетки растения.
[0034] В некоторых вариантах реализации условия, которые усиливают один или более процессов репарации клеточной ДНК, включают введение одного или более соединений, 5 которые вызывают одно- или двухцепочечные разрывы ДНК, в клетку растения перед, или одновременно, или после доставки GRON в клетку растения. Примеры соединений описаны в данной заявке.
[0035] Способы и композиции, описанные в данной заявке, применимы для растений в целом. Исключительно в качестве примера, вид растения может быть выбран из группы,
10 состоящей из следующих видов: канола, подсолнечник, кукуруза, табак, сахарная свекла, хлопчатник, маис, пшеница (включая, но не ограничиваясь перечисленными: Triticum spp., Triticum aestivum, Triticum durum Triticum timopheevii, Triticum monococcum, Triticum spelta, Triticum zhukovskyi и Triticum urartu, и их гибриды), ячмень (включая, но не ограничиваясь перечисленными: Hordeum vulgarе L., Hordeum comosum, Hordeum depressum, Hordeum
15 intercedens, Hordeum jubatum, Hordeum marinum, Hordeum marinum, Hordeum parodii, Hordeum pusillum, Hordeum secalinum и Hordeum spontaneum), рис (включая, но не ограничиваясь перечисленными: индийскую разновидность Oryza sativa, японскую разновидность Oryza sativa, яванскую разновидность Oryza sativa, разновидность glutinosa Oryza sativa (клейкий рис), ароматную группу Oryza sativa (например, басмати) и Oryza
20 sativa (группу плавающего риса)), люцерна, ячмень, сорго, томат, манго, персик, яблоко, груша, клубника, банан, дыня, маниока, картофель, морковь, латук, лук, соевый боб, виды сои, сахарный тростник, горох, нут, горох полевой, садовый боб, чечевица, репа, брюква, брюссельская капуста, люпин, цветная капуста, капуста кормовая, конские бобы, тополь, сосна, эвкалипт, виноград, цитрусовое растение, тритикале, люцерна, рожь (включая, но не
25 ограничиваясь перечисленными: Secale sylvestre, Secale strictum, Secale cereale, Secale vavilovii, Secale africanum, Secale ciliatoglume, Secale ancestrale и Secale montanum), овес, дерн (включая, но не ограничиваясь перечисленными: газонная трава, включая Zoysia japonica, Agrostrispalustris, Poapratensis, Poa annua, Digitaria sanguinalis, Cyperus rotundus, Kyllinga brevifolia, Cyperus amuricus, Erigeron canadensis, Hydrocotyle sibthorpioides,
30 Kummerowia striata, Euphorbia humifusa и Viola arvensis) и кормовые травы, лен, масличный рапс, хлопчатник, горчица, огурец, вьюнок, бальзамин, перец, баклажан, бархатец, лотос, кочанная капуста, нивяник, гвоздика, тюльпан, ирис, лилия, дающие орехи растения, если они еще конкретно не упомянуты. Это также может относиться в целом или частично ко всем другим биологическим системам, включая, но не ограничиваясь перечисленными:
клетки бактерий, дрожжей, грибов, водорослей и млекопитающих, и даже их органеллы (например, митохондрии и хлоропласты). В некоторых вариантах реализации указанный организм или клетка принадлежит к виду, выбранному из группы, состоящей из: Escherichia coli, Mycobacterium smegmatis, Baccillus subtilis, Chlorella, Bacillus thuringiensis, 5 Saccharomyces cerevisiae, Yarrowia lipolytica, Chlamydamonas rhienhardtii, Pichia pastoris, Corynebacterium, Aspergillus niger и Neurospora crassa. В некоторых вариантах реализации дрожжи представляют собой Yarrowia lypolitica. В других вариантах реализации дрожжи не являются Saccharomyces cerevisiae. В некоторых вариантах реализации указанное растение или клетка растения принадлежит к видам, выбранным из группы, состоящей из:
10 Arabidopsis thaliana, Solarium tuberosum, Solarium phureja, Oryza sativa, Glicine max, Amaranthus, tuberculatus, Linum usitatissimum и Zea mays. Виды растения могут быть выбраны из группы, состоящей из однодольных растений семейства трав Роасеае. Семейство Роасеае можно разделить на две основных клады: кладу, включающую подсемейства Bambusoideae, Ehrhartoideae и Pooideae (кладу ВЕР), и кладу, включающую
15 подсемейства Panicoideae, Arundinoideae, Chloridoideae, Centothecoideae, Micrairoideae, Aristidoideae и Danthonioideae (кладу PACCMAD). Подсемейство Bambusoideae включает трибу Oryzeae. Указанные виды растений могут относиться к растениям из клады ВЕР, в частности, к растениям из подсемейств Bambusoideae и Ehrhartoideae. Клада BET включает подсемейства Bambusoideae, Ehrhartoideae и группу Triticodae, но не другие группы
20 подсемейства Pooideae. Культурные растения BET представляют собой растения, выращиваемые для применения в пищу или в качестве кормов, которые являются представителями подклады BET, например, ячмень, кукуруза, и т.д.
[0036] В некоторых вариантах реализации указанные способы дополнительно включают воспроизведение растения, содержащего мутацию, введенную с помощью GRON, из клетки 25 растения, и могут включать сбор семян от растения.
[0037] В соответствующих аспектах настоящее описание относится к клеткам растения, содержащим геномную модификацию, введенную с помощью GRON согласно способам, описанным в данной заявке, к растению, содержащему геномную модификацию, введенную с помощью GRON согласно способам, описанным в данной заявке, или к 30 семени, содержащему геномную модификацию, введенную с помощью GRON согласно способам, описанным в данной заявке; или к потомству семени, содержащего геномную модификацию, введенную с помощью GRON согласно способам, описанным в данной заявке.
[0038] Другие варианты реализации настоящего описания должны стать очевидны после ознакомления со следующим подробным описанием, типичными вариантами реализации и формулой изобретения.
КРАТКОЕ ОПИСАНИЕ ФИГУР
5 [0039] На фиг. 1 изображено превращение BFP в GFP, опосредованное GRON, мечеными фосфотиоатом (PS) (содержащими по 3 молекулы PS на каждом конце GRON (3PS-GRON)), и GRON, мечеными 5'-Cy3/3'-idC.
[0040] На фиг. 2 изображены GRON, содержащие РНК/ДНК, называемые в данной заявке "2'-0-метил GRON".
10 [0041] На фиг. 3 представлено схематическое изображение расположения гена bjp, на который нацелены BFP5 CRISPR.
[0042] На фиг. 4 показаны результаты влияния CRISPR, в который внедрили либо СуЗ-, либо 3PS-GRON различной длины, на процент превращения BFP в GFP в трансгенной по BFP модельной системе Arabidopsis thaliana.
15 [0043] На фиг. 5 показаны результаты влияния CRISPR, в который внедрили 3PS-GRON различной длины, на процент превращения BFP в GFP в трансгенной по BFP модельной системе Arabidopsis thaliana.
[0044] На фиг. 6 представлено схематическое изображение конструкций GRON, используемых в примере 9.
20 [0045] На фиг. 7 показаны значения среднего процента GFP-положительных протопластов из трансгенной по BFP модельной системы Arabidopsis thaliana, измеренные с помощью проточной цитометрии для 71 -мерных GRON.
[0046] На фиг. 8 показаны значения среднего процента GFP-положительных протопластов из трансгенной по BFP модельной системы Arabidopsis thaliana, измеренные 25 с помощью проточной цитометрии для 201 -мерных GRON.
[0047] На фиг. 9 из показано влияние CRISPR, в которые внедрили кодирующие и некодирующие GRON, на средний процент GFP-положительных клеток в трансгенной по BFP модельной системе Arabidopsis thaliana.
[0048] На фиг. 10 представлено схематическое изображение прикрепления 30 одноцепочечного GRON или двухцепочечной ДНК к комплексу CRISPR/Cas.
[0049] На фиг. 11 показаны результаты влияния опосредования CRISPR и GRON превращения BFP в GFP в трансгенной по BFP модельной системе Arabidopsis thaliana при различных длинах спейсеров.
[0050] На фиг. 12 показаны результаты влияния опосредования CRISPR и GRON 5 превращения BFP в GFP в трансгенной по BFP модельной системе Arabidopsis thaliana, где спейсеры кодировались плазмидой (плазмидой с РНК-проводником) или использовались в качестве ампликона (ампликона с РНК-проводником).
[0051] На фиг. 13 показаны результаты влияния опосредования CRISPR и GRON превращения BFP в GFP в трансгенной по BFP модельной системе Arabidopsis thaliana для 10 немодифицированных по сравнению с ЗР8-модифицированными 41-мерными GRON.
[0052] На фиг. 14 показаны результаты секвенирования нового поколения 3- и 6-недельных микрокаллюсов Linum usitatissimum (лен), полученных из протопластов из кончика побега, обработанных ПЭГ с плазмидой CRISPR в момент времени Т = 0.
[0053] На фиг. 15 показаны результаты секвенирования нового поколения 3- и 615 недельных микрокаллюсов Linum usitatissimum, полученных из протопластов из кончика побега, обработанных ПЭГ с плазмидой CRISPR в момент времени Т = 0.
[0054] На фиг. 16 показана нуклеазная активность и редактирование генов CRISPR-Cas в протопластах A. thaliana. 16А: Распределение инсерционно-делеционных мутаций по их размеру, определенному путем глубокого секвенирования, в протопластах, обработанных
20 плазмидой CRISPR-Cas (ВС-1), через 72 ч после доставки. Инсерционно-делеционные мутации представляли 0,79% от всех считанных положений. 16В: Редактирование BFP с получением GFP измеряли по проценту GFP-флуоресцирующих протопластов, обнаруженных с помощью проточной цитометрии через 72 ч после доставки плазмиды (ВС-1) и GRON (CG-6). Представленные результаты не нормировали на эффективность
25 трансфекции. Планки погрешностей представляют собой стандартную ошибку среднего (п = 9).
[0055] На фиг. 17 показано редактирование генов в протопластах A. thaliana с применением CRISPR-Cas в комбинации с GRON с различными длинами и химическими модификациями. 17а: Сравнение 3PS-GRON и немодифицированного GRON по 30 эффективности редактирования гена BFP с получением GFP, измеренной с помощью проточной цитометрии через 72 ч после доставки плазмиды (ВС-1) и GRON (CG-1) или (CG-2). 17Ь: Сравнение различных длин GRON по эффективности редактирования гена BFP с получением GFP, измеренной с помощью проточной цитометрии через 72 ч после
доставки плазмиды (ВС-2) и GRON (CG-5) или (CG-8). 17с: Сравнение 3PS- и 2'-0-Ме-GRON по эффективности редактирования гена BFP с получением GFP, измеренной с помощью проточной цитометрии через 72 ч после доставки плазмиды (ВС-1) и GRON (CG-6), (CG-9) или (CG-10). 17d: Сравнение 3PS- и СуЗ-GRON по эффективности 5 редактирования гена BFP с получением GFP, измеренной с помощью проточной цитометрии через 72 ч после доставки плазмиды (ВС-3) и GRON (CG-3) или (CG-4). Планки погрешностей представляют собой стандартную ошибку среднего (п = 3). (CG-1): BFP, антисмысловой, 41 и.о., немодифицированный; (CG-2): BFP, антисмысловой, 41 и.о., модифицированный 3PS; (CG-3): BFP, смысловой, 41 и.о., модифицированный 3PS; (CG-10 4): BFP, смысловой, 41 и.о., модифицированный СуЗ; (CG-5): BFP, смысловой, 60 и.о., модифицированный 3PS; (CG-6): BFP, антисмысловой, 201 и.о., модифицированный 3PS; (CG-8): BFP, смысловой, 201 и.о., модифицированный 3PS; (CG-9): BFP, антисмысловой, 201 и.о., модификация 2'-0-Ме на первом с 5'-конца основании РНК; (CG-10): BFP, антисмысловой, 201 и.о., модификации 2'-0-Ме на первых девяти с 5'-конца основаниях 15 РНК.
[0056] На фиг. 18 показана нуклеазная активность и редактирование генов TALEN в протопластах A. thaliana и L. usitatissimum. 18а: Распределение инсерционно-делеционных мутаций по их размеру, определенному путем глубокого секвенирования, в протопластах Arabidopsis, обработанных плазмидой TALEN (ВТ-1), через 72 ч после доставки.
20 Инсерционно-делеционные мутации представляют собой 0,51% от всех считанных данных. 18Ь: Редактирование гена BFP с получением GFP, измеренное с помощью проточной цитометрии через 48 ч после доставки плазмиды (ВТ-1) и GRON (CG-7). 18с: Типичное распределение инсерционно-делеционных мутаций на основании их длины в п.о. в протопластах L. usitatissimum, обработанных TALEN (LuET-1), нацеленными на гены
25 EPSPS, через 7 дней после доставки. Суммарная частота инсерционно-делеционных мутаций составляет 0,50%. 18d: редактирование гена EPSPS L. usitatissimum, измеренное путем глубокого секвенирования, через 7 дней после доставки плазмиды (LuET-1) и GRON (CG-11) в протопласты. Процент от всех прочтений представляет собой количество прочтений, включающих обе замены T97I и Р101 А, как процент от всех прочтений. Планки
30 погрешностей представляют собой стандартную ошибку среднего (п = 3). (CG-7): BFP, смысловой, 201 и.о., модифицированный 3PS; (CG-11): EPSPS, смысловой, 144 и.о., модифицированный СуЗ.
[0057] На фиг. 19 показано влияние вызывающих двухцепочечные разрывы антибиотиков зеоцина и флеомицина на редактирование BFP с получением GFP в протопластах
трансгенного A. thaliana. Протопласты обрабатывали зеоцином или флеомицином в течение 90 мин перед введением GRON с помощью ПЭГ (CG2). Успешное редактирование приводило к флуоресценции GFP. Протопласты с зеленой флуоресценцией подсчитывали, применяя цитометр Attune с акустической фокусировкой.
5 [0058] На фиг. 20 показаны трансгенные клетки A. thaliana с превращенным BFP через пять дней после доставки GRON в трансгенные по BFP протопласты, которое приводило к превращению BFP в GFP. Зеленая флуоресценция свидетельствовала об успешном редактировании BFP с получением GFP. А: изображение поля зрения высокой освещенности; В: то же поле зрения в синем свете. Планки погрешностей представляют 10 собой стандартную ошибку среднего (п = 4); (CG2): BFP, антисмысловой, 41 и.о., модифицированный 3PS; (CG12) BFP, антисмысловой, 41 и.о., модифицированный 3PS, не являющийся мишенью. Изображения получали с помощью системы ImageXpress Micro (Molecular Devices, Саннивейл, Калифорния, США) Масштабная метка = 20 мкм.
[0059] На фиг. 21 показаны конструкции CRISPR-Cas и TALEN. 21 А: Схематическое 15 изображение плазмиды CRISPR-Cas. Промотор маннопин-синтазы (Mas) запускает транскрипцию гена Cas9, который кодон-оптимизирован для высших растений. Ген Cas9 содержит два сигнала ядерной локализации (NLS) SV40 на обоих концах гена и 2Х эпитопную метку FLAG. Промотор U6 A. thaliana запускает транскрипцию каркаса РНК-проводника, и транскрипцию прекращают, используя поли(Т)-сигнал. 21В: Схематическое 20 изображение плазмиды TALEN. Промотор Mas запускает транскрипцию правого и левого плечей Tale, соединенных посредством последовательности 2А, через которую "препрыгивает" рибосома. Эндонуклеаза Fokl соединена с 3'-концом каждого плеча Tale. 5'-конец левого Tale содержит сигнал ядерной локализации (NLS) и метку с эпитопом V5. rbcT представляет собой терминатор гена RBCSE9 Pisum sativum.
25 [0060] На фиг. 22 показаны целевые участки нуклеазы в BFP и EPSPS. а: Целевой участок гена BFP для протоспейсеров CRISPR-Cas, ВС-1, ВС-2 и ВС-3, и для ВТ-1 TALEN, левого и правого плечей Tale. Последовательность РАМ показана красным. Сайты связывания TALEN выделены жирным шрифтом и подчеркнуты. Сайт редактирования BFP с получением GFP САС-> ТАС (H66Y) выделен жирным зеленым шрифтом. Ь: Целевой
30 участок гена EPSPS для TALEN, LuET-1, левого и правого плечей Tale. Сайты модификации EPSPS АСА> АТА и CCG> GCG (T97I и PI01 А) выделены зеленым цветом.
[0061] На фиг. 23 показана последовательность аминокислот продукта гена АККазы Alopecurus myosuroides (лисохвоста мышехвостниковидного) (SEQ ID NO: 1).
[0062] На фиг. 24 показана последовательность аминокислот продукта гена EPSPS Escherichia coli (SEQ ID NO: 2).
[0063] На фиг. 25 показаны примеры аналогичных положений EPSPS.
[0064] На фиг. 26 показаны примеры последовательностей АККазы.
5 ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[0065] Направленная генетическая модификация, опосредованная олигонуклеотидами, представляет собой полезную методику для применения с целью специфического изменения коротких участков ДНК с получением делеций, коротких вставок и точечных мутаций. Данные способы включают спаривание/отжиг ДНК, а затем события
10 репарации/рекомбинации ДНК. Сначала нуклеиновая кислота гибридизуется с комплементарной цепью в двухцепочечной ДНК в ходе процесса, опосредованного клеточными белковыми факторами. В результате такого отжига образуется расположенная по центру несовпадающая пара оснований (в случае точечной мутации), что приводит к нарушению структуры, которое наиболее вероятно стимулирует эндогенный белковый
15 аппарат, чтобы инициировать второй этап процесса репарации: сайт-специфическую модификацию хромосомной последовательности, и/или таковой в органеллах (например, митохондриях и хлоропластах). Такое вновь введенное несовпадение побуждает аппарат репарации ДНК осуществить второе событие репарации, что приводит к окончательному исправлению целевого сайта. Способы и композиции согласно настоящему изобретению в
20 различных аспектах и вариантах реализации, описанных в данной заявке, могут улучшить данные способы, предлагая новые подходы, которые повышают доступность компонентов репарации ДНК, таким образом, повышая эффективность и воспроизводимость опосредованных репарацией генов модификаций целевых нуклеиновых кислот.
[0066] Эффективные способы сайт-направленных модификаций генома желательны для 25 исследования, клинической генотерапии, промышленной микробиологии и агрикультуры. В одном подходе применяют образующие триплекс олигонуклеотиды (TFO), которые сайт-специфическим образом связываются в виде третьих цепей с дуплексом ДНК, чтобы опосредовать направленный мутагенез. Такие TFO могут осуществлять свое действие либо путем доставки соединенного с ними мутагена, такого как псорален или хлорамбуцил 30 (Havre и др., Proc Nat'l Acad Sci, U.S.A. 90:7879-7883, 1993; Havre и др., J Virol 67:73237331, 1993; Wang и др., Mol Cell Biol 15:1759-1768, 1995; Takasugi и др., Proc Nat'l Acad Sci, U.S.A. 88:5602-5606, 1991; Belousov и др., Nucleic Acids Res 25:3440-3444, 1997), либо путем связывания с достаточной аффинностью, чтобы вызвать допускающую ошибки репарацию (Wang и др., Science 271:802-805, 1996).
[0067] Другая стратегия геномной модификации включает индукцию гомологичной рекомбинации между экзогенным фрагментом ДНК и целевым геном. Данный подход успешно применяли для нацеливания на выбранные гены и их нарушения в клетках млекопитающих, и он позволил получить трансгенных мышей, несущих нокауты 5 определенных генов (Capeechi и др., Science 244:1288-1292, 1989; Wagner, патент США номер 4873191). В данном подходе полагаются на перенос селектируемых маркеров, чтобы позволить выделение желательных рекомбинантов. Без селекции в обычных экспериментах по переносу генов отношение гомологичного встраивания к негомологичному встраиванию трансфицированной ДНК мало, и обычно находится в
10 диапазоне от 1:1000 или меньше (Sedivy и др., Gene Targeting, W. Н. Freeman и Co., Нью-Йорк, 1992). Такая низкая эффективность гомологичного встраивания ограничивает практическую ценность переноса генов для экспериментального применения или генотерапии. Частоту гомологичной рекомбинации можно увеличить путем повреждения целевого сайта облучением УФ и выбранными канцерогенами (Wang и др., Mol Cell Biol
15 8:196-202, 1988), а также сайт-специфическими эндонуклеазами (Sedivy и др., Gene Targeting, W. Н. Freeman и Co., Нью-Йорк, 1992; Rouet и др., Proc Nat'l Acad Sci, U.S.A. 91:6064-6068, 1994; Segal и др., Proc Nat'l Acad Sci, U.S.A. 92:806-810, 1995). Кроме того, повреждение ДНК, вызванное направленными на триплекс фотоаддуктами псоралена, может стимулировать рекомбинацию внутри и между внехромосомными векторами (Segal
20 и др., Proc Nat'l Acad Sci, U.S.A. 92:806-810, 1995; Faruqi и др., Mol Cell Biol 16:6820-6828, 1996; Glazer, патент США номер 5962426).
[0068] Линейные донорные фрагменты более рекомбиногенны, чем их кольцевые аналоги (Folger и др., Mol Cell Biol 2:1372-1387, 1982). На рекомбинацию в некоторых вариантах реализации также может влиять длина непрерывного участка гомологии между донорным 25 и целевым сайтами, при этом короткие фрагменты, по-видимому, часто представляют собой неэффективные субстраты для рекомбинации (Rubnitz и др., Mol Cell Biol 4:2253-2258, 1984). Тем не менее, несколько недавних исследовательских работ было сфокусировано на применении коротких фрагментов ДНК или гибридов ДНК/РНК для редактирования генов (Kunzelmann и др., Gene Ther 3:859-867, 1996).
30 [0069] Термины "последовательность нуклеиновой кислоты", "последовательность нуклеотидов" и "полинуклеотидная последовательность" в данной заявке относятся к олигонуклеотиду или полинуклеотиду, и их фрагментам или частям, и к ДНК или РНК геномного или синтетического происхождения, которая может быть одно- или двухцепочечной, и представляет собой смысловую или антисмысловую цепь.
[0070] В данной заявке термины "олигонуклеотид" и "олигомер" относятся к полимеру нуклеооснований, состоящему из по меньшей мере приблизительно 10 нуклеооснований и вплоть до приблизительно 1000 нуклеооснований.
[0071] Термины "модифицирующая ДНК молекула" и "модифицирующий ДНК реагент" 5 в данной заявке относятся к молекуле, которая способна узнавать и специфично связываться с последовательностью нуклеиновой кислоты в геноме клетки, и которая способна модифицировать целевую последовательность нуклеотидов в геноме, при этом узнавание и специфическое связывание модифицирующей ДНК молекулы с последовательностью нуклеиновой кислоты не зависит от белков. В данной заявке термин
10 "не зависит от белков" по отношению к модифицирующей ДНК молекуле означает, что модифицирующая ДНК молекула не требует присутствия и/или активности белка и/или фермента для узнавания и/или специфичного связывания с последовательностью нуклеиновой кислоты. Примерами модифицирующих ДНК молекул служат, но не ограничены перечисленными, образующие триплекс олигонуклеотиды, пептидные
15 нуклеиновые кислоты, полиамиды и олигонуклеотиды, которые предназначены для стимуляции изменения генов. Модифицирующие ДНК молекулы согласно настоящему описанию в некоторых вариантах реализации отличаются от последовательностей нуклеиновых кислот известного уровня техники, которые применяют для гомологичной рекомбинации (Wong и Capeechi, Molec. Cell. Biol. 7:2294-2295, 1987), тем, что
20 последовательности нуклеиновых кислот известного уровня техники, которые применяют для гомологичной рекомбинации, зависят от белков. В данной заявке термин "зависят от белков" по отношению к молекуле означает, что для молекулы требуется присутствие и/или активность белка и/или фермента для узнавания и/или специфичного связывания указанной молекулы с последовательностью нуклеиновой кислоты. Способы определения того,
25 требуется ли для модифицирующей ДНК молекулы присутствие и/или активность белка и/или фермента для узнавания и/или специфичного связывания с последовательностью нуклеиновой кислоты, находятся в рамках компетенции в данной области техники (см., например, Dennis и др. Nucl. Acids Res. 27:4734-4742, 1999). Например, модифицирующую ДНК молекулу можно инкубировать in vitro с последовательностью нуклеиновой кислоты
30 в отсутствие каких-либо белков и/или ферментов. Обнаружение специфичного связывания между модифицирующей ДНК молекулой и последовательностью нуклеиновой кислоты демонстрирует, что модифицирующая ДНК молекула не зависит от белка. С другой стороны, отсутствие специфичного связывания между модифицирующей ДНК молекулой и последовательностью нуклеиновой кислоты демонстрирует, что модифицирующая ДНК
35 молекула зависит от белков и/или требует присутствия дополнительных факторов.
[0072] "Образующий триплекс олигонуклеотид" (TFO) представляет собой последовательность ДНК или РНК, которая способна связываться с большой бороздкой дуплекса спиралей ДНК или РНК с образованием тройной спирали. Хотя длина TFO не ограничена каким-либо конкретным значением, предпочтительная длина TFO составляет 5 250 нуклеотидов или менее, 200 нуклеотидов или менее или 100 нуклеотидов или менее, или от 5 до 50 нуклеотидов, или от 10 до 25 нуклеотидов, или от 15 до 25 нуклеотидов. Хотя некоторая степень специфичности последовательностей между TFO и дуплексом ДНК необходима для образования тройной спирали, нет конкретной необходимой степени специфичности, при условии, что тройная спираль способна образоваться. Аналогичным
10 образом, нет определенной необходимой степени авидности или аффинности между TFO и двойной спиралью, при условии, что тройная спираль способна образоваться. Без намерения ограничить длину последовательности нуклеотидов, с которой специфично связывается TFO, в одном варианте реализации последовательность нуклеотидов, с которой специфично связывается TFO, состоит из от 1 до 100, в некоторых вариантах реализации от
15 5 до 50, в еще других вариантах реализации от 10 до 25, и в других вариантах реализации от 15 до 25 нуклеотидов. Кроме того, "тройная спираль" представляет собой двуспиральную нуклеиновую кислоту с олигонуклеотидом, который связан с целевой последовательностью внутри двуспиральной нуклеиновой кислоты. "Двуспиральная" нуклеиновая кислота может быть любой двухцепочечной нуклеиновой кислотой, включая
20 двухцепочечную ДНК, двухцепочечную РНК и смешанные дуплексы ДНК и РНК. Длина двухцепочечной нуклеиновой кислоты не ограничена каким-либо конкретным значением. Тем не менее, в предпочтительных вариантах реализации ее длина больше, чем 500 п.о., в некоторых вариантах реализации больше, чем 1 т.п.н., и в некоторых вариантах реализации больше, чем приблизительно 5 т.п.н. Во многих применениях двуспиральная нуклеиновая
25 кислота представляет собой клеточную геномную нуклеиновую кислоту. Образующий триплекс олигонуклеотид может связаться с целевой последовательностью параллельно (с той же направленностью) или антипараллельно (с противоположной направленностью).
[0073] "Пептидные нуклеиновые кислоты", "полиамиды" или "ПНК" представляют собой нуклеиновые кислоты, в которых фосфатный каркас заменен на полиамидную структуру на
30 основе N-аминоэтил глицина. ПНК обладают более высокой аффинностью к комплементарным нуклеиновым кислотам, чем их природные аналоги, следующие правилу спаривания оснований по Уотсону-Крику. ПНК могут образовывать высоко стабильные трехспиральные структуры с ДНК со следующей стехиометрией: (ПНК)2.ДНК. Хотя длина пептидных нуклеиновых кислот и полиамидов не ограничена каким-либо конкретным
35 значением, предпочтительная длина пептидных нуклеиновых кислот и полиамидов
составляет 200 нуклеотидов или менее, в некоторых вариантах реализации 100 нуклеотидов или менее, и в некоторых вариантах реализации от 5 до 50 нуклеотидов. Без намерения ограничить длину последовательности нуклеотидов, с которой специфично связывается пептидная нуклеиновая кислота и полиамид, в одном варианте реализации длина 5 последовательности нуклеотидов, с которой специфично связывается пептидная нуклеиновая кислота и полиамид, составляет от 1 до 100, в некоторых вариантах реализации от 5 до 50, в еще других вариантах реализации от 5 до 25, и в других вариантах реализации от 5 до 20 нуклеотидов.
[0074] Термин "клетка" относится к отдельной клетке. Термин "клетки" относится к 10 популяции клеток. Популяция может быть чистой популяцией, содержащей один тип клеток. Аналогичным образом, популяция может содержать более чем один тип клеток. В настоящем описании не накладывается ограничение на количество типов клеток, которые может содержать популяция клеток. Клетка, описанная в данной заявке, включает, без ограничения, клетки каллюса растения, клетки с клеточными стенками и без них, 15 прокариотические клетки и эукариотические клетки.
[0075] Термин "синхронизировать" или "синхронизированные", употребляемый по отношению к образцу клеток, или "синхронизированные клетки", или "популяция синхронизированных клеток" относится к множеству клеток, которые обработали таким образом, чтобы популяция клеток находилась в одинаковой фазе клеточного цикла. Нет
20 необходимости в том, чтобы все клетки в образце были синхронизированы. Небольшой процент клеток могут остаться не синхронизированными с большинством клеток в образце. Предпочтительный диапазон синхронизированных клеток составляет от 10 до 100%. Более предпочтительный диапазон составляет от 30 до 100%. Также нет необходимости в том, чтобы клетки представляли собой чистую популяцию одного типа клеток. Образец может
25 содержать более чем один тип клеток. В этом отношении, лишь один из представленных типов клеток может быть синхронизирован или может находиться в отличной фазе клеточного цикла относительно другого типа клеток в образце.
[0076] Термин "синхронизированная клетка", употребляемый по отношению к отдельной клетке, означает, что на указанную клетку воздействовали таким образом, что она 30 находится в фазе клеточного цикла, которая отличается от фазы клеточного цикла указанной клетки перед воздействием. В качестве альтернативы "синхронизированная клетка" относится к клетке, на которую воздействовали, чтобы изменить (т.е., увеличить или уменьшить) продолжительность фазы клеточного цикла, на которой указанная клетка
находилась перед воздействием, по сравнению с контрольной клеткой (например, клеткой в отсутствие воздействия).
[0077] Термин "клеточный цикл" относится к физиологическому и морфологическому прогрессированию изменений, которые претерпевают клетки, когда они делятся (т.е. 5 пролиферируют). Общепринято, что клеточный цикл состоит из фаз, названных "интерфаза", "профаза", "метафаза", "анафаза" и "телофаза". Кроме того, части клеточного цикла можно назвать "М (митоз)", "S (синтез)", "GO", "G1 (интервал 1)" и "G2 (интервал 2)". Более того, клеточный цикл включает периоды прогрессирования, переходные между перечисленными выше фазами.
10 [0078] Термин "ингибирование клеточного цикла" относится к прекращению
прогрессирования клеточного цикла в клетке или популяции клеток. Ингибирование клеточного цикла обычно вызывается воздействием на клетки агента (химического, белкового или другого), который препятствует аспектам физиологии клетки, чтобы предотвратить продолжение клеточного цикла.
15 [0079] "Пролиферация" или "рост клеток" относится к способности исходной клетки периодически делиться на две дочерние клетки, что приводит к общему увеличению количества клеток в популяции. Популяция клеток может находиться в организме или в устройстве для культивирования.
[0080] Термин "способный модифицровать ДНК" или "средства модификации ДНК" 20 относится к процедурам, а также к эндогенным или экзогенным агентам или реагентам, которые обладают способностью вызывать или могут способствовать индукции изменений в последовательности нуклеотидов целевого фрагмента ДНК. Такие изменения можно осуществить путем делеции, вставки или замены одного или более оснований в целевом фрагменте ДНК. Нет необходимости в том, чтобы изменения последовательности ДНК 25 приводили к функциональным изменениям какого-либо гена, кодируемого целевой последовательностью. Более того, нет необходимости в том, чтобы изменения в ДНК были внесены в любой конкретной доле или проценте клеток.
[0081] Термин "интересующая последовательность нуклеотидов" относится к любой последовательности нуклеотидов, воздействие на которую средний специалист в данной 30 области техники может счесть желательным по какой-либо причине. Такие последовательности нуклеотидов включают, но не ограничены перечисленными: кодирующие последовательности структурных генов (например, репортерных генов, генов селективных маркеров, онкогенов, генов лекарственной устойчивости, факторов роста и т.д.) и некодирующие регуляторные последовательности, которые не кодируют мРНК или
белковый продукт (например, последовательность промотора, последовательность энхансера, последовательность полиаденилирования, последовательность терминации, регуляторные РНК, такие как миРНК и т.д.
[0082] "Последовательность аминокислот", "полипептидная последовательность", 5 "пептидная последовательность" и "пептид" используют взаимозаменяемо в данной заявке для описания последовательности аминокислот.
[0083] "Целевая последовательность" в данной заявке относится к двуспиральной нуклеиновой кислоте, содержащей последовательность длиной больше, чем 8 нуклеотидов, но меньше, чем 201 нуклеотид. В некоторых вариантах реализации длина целевой 10 последовательности составляет от 8 до 30 оснований. Целевую последовательность, обычно, определяют по последовательности нуклеотидов на одной из цепей двуспиральной нуклеиновой кислоты.
[0084] В данной заявке "богатая пуринами последовательность" или "полипуриновая последовательность" по отношению к последовательности нуклеотидов на одной из цепей
15 двуспиральной последовательности нуклеиновой кислоты представляет собой непрерывную последовательность нуклеотидов, в которой более чем 50% нуклеотидов целевой последовательности содержат пуриновое основание. Тем не менее, предпочтительно, чтобы богатая пуринами целевая последовательность содержала больше, чем 60% пуриновых нуклеотидов, в некоторых вариантах реализации больше, чем 75%
20 пуриновых нуклеотидов, в других вариантах реализации больше, чем 90% пуриновых нуклеотидов, и в еще других вариантах реализации на 100% состоит из пуриновых нуклеотидов.
[0085] В данной заявке "богатая пиримидинами последовательность" или "полипиримидиновая последовательность" по отношению к последовательности
25 нуклеотидов на одной из цепей двуспиральной последовательности нуклеиновой кислоты представляет собой непрерывную последовательность нуклеотидов, в которой более чем 50% нуклеотидов целевой последовательности содержат пиримидиновое основание. Тем не менее, предпочтительно, чтобы богатая пиримидинами целевая последовательность содержала больше, чем 60% пиримидиновых нуклеотидов и в некоторых вариантах
30 реализации больше, чем 75% пиримидиновых нуклеотидов. В некоторых вариантах реализации указанная последовательность содержит больше, чем 90% пиримидиновых нуклеотидов, и в других вариантах реализации на 100% состоит из пиримидиновых нуклеотидов.
[0086] "Вариант" первой последовательности нуклеотидов представляет собой последовательность нуклеотидов, которая отличается от первой последовательности нуклеотидов (например, тем, что содержит одну или более делеций, вставок или замен, которые можно обнаружить, применяя гибридизационные анализы или применяя 5 секвенирование ДНК). В объем данного определения входит обнаружение изменений или модификаций в геномной последовательности первой последовательности нуклеотидов. Например, гибридизационные анализы можно применять для обнаружения (1) изменений в паттерне рестрикционных фрагментов, способных гибридизоваться с первой последовательностью нуклеотидов, при включении в геном (т.е., анализ полиморфизма
10 длин рестрикционных фрагментов (ПДРФ)), (2) неспособности выбранной части первой последовательности нуклеотидов гибридизоваться с образцом геномной ДНК, который содержит первую последовательность нуклеотидов (например, применяя аллель-специфические олигонуклеотидные зонды), (3) неправильной или неожиданной гибридизации, такой как гибридизация с локусом, отличным от нормального хромосомного
15 локуса для первой последовательности нуклеотидов (например, применяя флуоресцентную гибридизацию in situ (FISH) с препаратами метафазных хромосом и т.д.). Один пример варианта представляет собой мутированную последовательность дикого типа.
[0087] Термины "нуклеиновая кислота" и "немодифицированная нуклеиновая кислота" в данной заявке относятся к любому из четырех известных оснований
20 дезоксирибонуклеиновых кислот (т.е. к гуанину, аденину, цитозину и тимину). Термин "модифицированная нуклеиновая кислота" относится к нуклеиновой кислоте, структура которой изменена по сравнению со структурой немодифицированной нуклеиновой кислоты. Наглядным примером таких модификаций будут замещающие ковалентные модификации оснований, такие как алкилирование атомов азота в аминогруппе и
25 гетероцикле, а также насыщение двойных связей.
[0088] В данной заявке термины "мутация" и "модификация" и их грамматические эквиваленты, когда их применяют по отношению к последовательности нуклеиновой кислоты, используют взаимозаменяемо для описания делеций, вставки, замены, разрыва цепи и/или введения аддукта. "Делеция" представляет собой замену в последовательности 30 нуклеиновой кислоты, при которой один или более нуклеотидов отсутствуют. "Вставка" или "добавление" представляет собой такую замену в последовательности нуклеиновой кислоты, которая привела к добавлению одного или более нуклеотидов. "Замена" происходит в результате замещения одного или более нуклеотидов молекулой, которая представляет собой отличную молекулу от замещенного одного или более нуклеотидов.
Например, нуклеиновую кислоту можно заменить на отличную нуклеиновую кислоту, примером чего служит замещение тимина на цитозин, аденин, гуанин или уридин. Замену пиримидина на пиримидин (например, нуклеотидные замены С на Т или Т на С) или пурина на пурин (например, нуклеотидные замены G на А или А на G) называют транзициями, 5 тогда как замену пиримидина на пурин или пурина на пиримидин (например, G на Т, или G на С, или А на Т, или А на С) называют трансверсиями. В качестве альтернативы нуклеиновую кислоту можно заменить на модифицированную нуклеиновую кислоту, примером чего служит замещение тимина на тимингликоль. Мутации могут приводить к несовпадению. Термин "несовпадение" относится к нековалентному взаимодействию
10 между двумя нуклеиновыми кислотами, при этом каждая нуклеиновая кислота расположена на отдельной полинуклеотидной последовательности, которая не следует правилу спаривания оснований. Например, в частично комплементарных последовательностях 5'-AGT-3' и 5'-ААТ-3' присутствует несовпадение G-A (транзиция). Термины "введение аддукта" или "образование аддукта" относятся к ковалентному или
15 нековалентному соединению молекулы с одним или более нуклеотидами в последовательности ДНК таким образом, что соединение приводит к снижению уровня репликации и/или транскрипции ДНК (в некоторых вариантах реализации от 10% до 100%, в других вариантах реализации от 50% до 100% и в некоторых вариантах реализации от 75% до 100%).
20 [0089] Термин "агент для разрезания ДНК" относится к молекуле, которая осуществляет разрыв цепи. Неограничивающие примеры включают мегануклеазы, TALE/TALEN, антибиотики, цинковые пальцы и системы CRISPR или CRISPR/cas.
[0090] Термин "разрыв цепи" когда он употребляется по отношению к двухцепочечной последовательности нуклеиновой кислоты, включает одноцепочечной разрыв и/или
25 двухцепочечной разрыв. Одноцепочечной разрыв (ник) относится к разрыву в одной из двух цепей двухцепочечной последовательности нуклеиновой кислоты. Напротив, двухцепочечной разрыв относится к разрыву обеих цепей двухцепочечной последовательности нуклеиновой кислоты, что может привести к образованию тупых или ступенчатых концов. Разрывы цепей можно ввести в двухцепочечную последовательность
30 нуклеиновой кислоты либо непосредственно (например, с помощью ионизирующего излучения или обработки некоторыми химическими веществами), либо опосредованно (например, путем ферментативного расщепления в основании нуклеиновой кислоты).
[0091] Термины "мутантная клетка" и "модифицированная клетка" относятся к клетке, которая содержит по меньшей мере одну модификацию в геномной последовательности указанной клетки.
[0092] Термин "часть", когда его применяют по отношению к последовательности 5 нуклеотидов, относится к фрагментам данной последовательности нуклеотидов. Размер фрагментов может находиться в диапазоне от 5 нуклеотидных остатков до целой последовательности нуклеотидов без одного остатка нуклеиновой кислоты.
[0093] Говорят, что у молекул ДНК есть "5'-концы" и "3'-концы", потому что мононуклеотиды вступают в реакцию с образованием олигонуклеотидов таким образом,
10 что 5'-фосфат одного пентозного кольца мононуклеотида присоединяется к 3'-кислороду соседнего в одном направлении путем образования фосфодиэфирной связи. Следовательно, конец олигонуклеотида называют "5'-концом", если его 5'-фосфат не соединен с 3'-кислородом пентозного кольца мононуклеотида. Конец олигонуклеотида называют "3'-концом", если его 3'-кислород не соединен с 5'-фосфатом другого пентозного кольца
15 мононуклеотида. В данной заявке последовательность нуклеиновой кислоты, даже если она находится внутри большего олигонуклеотида, также может иметь 5'- и 3'-концы. Как в линейной, так и в кольцевой молекуле ДНК отдельные элементы называют расположенными "против хода транскрипции" или расположенными с 5'-стороны от элементов, расположенных "по ходу транскрипции" или с 3'-стороны. Данная
20 терминология отражает то, что транскрипция идет в направлении от 5'-конца к 3'-концу вдоль цепи ДНК. Промоторный и энхансерный элементы, которые направляют транскрипцию связанного с ними гена, как правило расположены с 5 '-стороны или против хода транскрипции от кодирующей области. Тем не менее, энхансерные элементы могут оказывать свое действие даже когда они расположены с 3'-стороны от промоторного
25 элемента и кодирующей области. Сигналы терминации транскрипции и полиаденилирования расположены с 3 '-стороны или по ходу транскрипции от кодирующей области.
[0094] Термин "рекомбинантная молекула ДНК" в данной заявке относится к молекуле ДНК, которая состоит из фрагментов ДНК, соединенных друг с другом с помощью методик 30 молекулярной биологии.
[0095] Термин "рекомбинантный белок" или "рекомбинантный полипептид" в данной заявке относится к белковой молекуле, которую экспрессируют с применением рекомбинантной молекулы ДНК.
[0096] В данном тексте термины "вектор" и "носитель" используют взаимозаменяемо по отношению к молекулам нуклеиновых кислот, которые переносят фрагмент(ы) ДНК от одной клетки к другой.
[0097] Термины "в функциональной комбинации", "в функциональном порядке" и 5 "функционально связанный" в данном тексте относятся к соединению последовательностей нуклеиновых кислот таким образом, что получают молекулу нуклеиновой кислоты, способную направлять транскрипцию данного гена и/или синтез желательной белковой молекулы. Указанные термины также относятся к соединению последовательностей аминокислот таким образом, что получают функциональный белок.
10 [0098] Термин "трансфекция" в данной заявке относится к внедрению чужеродной ДНК в клетки. Трансфекцию можно осуществить с помощью различных способов, известных в данной области техники, включая копреципитацию ДНК с фосфатом кальция, опосредованную ДЭАЭ-декстраном трансфекцию, опосредованную полибреном трансфекцию, электропорацию, микроинъекцию, слияние липосом, трансфекцию
15 липофектином, слияние протопластов, ретровирусную инфекцию, биолистику (т.е. бомбардировку частицами) и тому подобные способы.
[0099] В данном тексте термины "комплементарный" или "комплементарность" применяют по отношению к "полинуклеотидам" и "олигонуклеотидам" (которые представляют собой взаимозаменяемые термины, которые относятся к последовательности
20 нуклеотидов), связанные по правилам спаривания оснований. Например, последовательность "5'-CAGT-3"' комплементарна последовательности "5'-ACTG-3"\ Комплементарность может быть "частичной" или "тотальной". "Частичная" комплементарность соблюдается, когда одно или более оснований нуклеиновых кислот не подходит для образования пары по правилам спаривания оснований. "Тотальная" или
25 "полная" комплементарность между нуклеиновыми кислотами соблюдается, когда все без исключения основания нуклеиновых кислот подходят для образования пары с другими основаниями по правилам спаривания оснований. Степень комплементарности между цепями нуклеиновых кислот может оказывать существеное влияние на эффективность и силу гибридизации между цепями нуклеиновых кислот. Это может иметь особое значение
30 в реакциях амплификации, а также в способах детектирования, которые зависят от связывания между нуклеиновыми кислотами. Для удобства термины "полинуклеотиды" и "олигонуклеотиды" включают молекулы, которые содержат нуклеозиды.
[0100] В данном тексте термины "гомология" и "гомологичный" по отношению к последовательностям нуклеотидов относятся к степени комплементарности с другими
последовательностями нуклеотидов. Может наблюдаться частичная гомология или полная гомология (т.е. идентичность). Применительно к двухцепочечной последовательности нуклеиновой кислоты, такой как кДНК или геномный клон, термин "по существу гомологичный" относится к любой последовательности нуклеиновой кислоты (например, 5 зонду), которая может гибридизоваться с любой или обеими цепями двухцепочечной последовательности нуклеиновой кислоты при условиях низкой строгости, описанных выше. Последовательность нуклеотидов, которая частично комплементарна, т.е. "по существу гомологична" последовательности нуклеиновой кислоты, представляет собой такую последовательность, которая по меньшей мере частично ингибирует гибридизацию
10 полностью комплементарной последовательности с целевой последовательностью нуклеиновой кислоты. Ингибирование гибридизации полностью комплементарной последовательности с целевой последовательностью можно исследовать, применяя гибридизационный анализ (саузерн-блоттинг или нозерн-блоттинг, гибридизацию в растворе и тому подобные анализы) при условиях низкой строгости. По существу
15 гомологичная последовательность или зонд будут конкурировать и ингибировать связывание (т.е. гибридизацию) полностью гомологичной последовательности с целевой последовательностью при условиях низкой строгости. Это вовсе не значит, что условия низкой строгости допускают неспецифическое связывание; условия низкой строгости требуют, чтобы связывание двух последовательностей друг с другом представляло собой
20 специфическое (т.е., избирательное) взаимодействие. Отсутствие неспецифического связывания можно исследовать, применяя вторую целевую последовательность, у которой отсутствует даже частичная комплементарность (например, идентичность менее чем приблизительно на 30%); в отсутствие неспецифического связывания зонд не будет гибридизоваться со второй некомплементарной мишенью.
25 [0101] Условия низкой строгости включают условия, эквивалентные связыванию или гибридизации при 68°С в растворе, состоящем из 5 х SSPE (43,8 г/л NaCl, 6,9 г/л NaHiPO^HiO и 1,85 г/л ЭДТА, рН подведен до 7,4 с помощью NaOH), 0,1% ДСН, 5 х реагента Денхардта (50 х реагент Денхардта содержит на 500 мл: 5 г фиколла (типа 400, Pharmacia), 5 г БСА (фракция V; Sigma)) и 100 мкг/мл денатурированной ДНК из молок
30 лососевых, после чего следует промывка в растворе, содержащем 2,0 х SSPE, 0,1% ДСН при комнатной температуре, когда используют зонд длиной от приблизительно 100 до приблизительно 1000 нуклеотидов.
[0102] Кроме того, в данной области техники хорошо известны условия, которые вызывают гибридизацию при условиях высокой строгости (например, повышение
температуры этапов гибридизации и/или промывки, применение формамида в растворе для гибридизации и т.д.). Условия высокой строгости, когда их применяют по отношению к гибридизации нуклеиновых кислот, включают условия, эквивалентные связыванию или гибридизации при 68°С в растворе, состоящем из 5 х SSPE, 1% ДСН, 5 х реагента Денхардта 5 и 100 мкг/мл денатурированной ДНК из молок лососевых, после чего следует промывка в растворе, содержащем 0,1 х SSPE и 0,1% ДСН при 68°С, когда используют зонд длиной от приблизительно 100 до приблизительно 1000 нуклеотидов.
[0103] В данной области техники хорошо известно, что можно использовать множество эквивалентных условий чтобы получить условия низкой строгости; факторы, такие как
10 длина и природа зонда (ДНК, РНК, состав оснований) и природа мишени (ДНК, РНК, состав оснований, нахождение в растворе или иммобилизация и т.д.) и концентрация солей и других компонентов (например, присутствие или отсутствие формамида, сульфата декстрана, полиэтиленгликоля), а также компоненты раствора для гибридизации, можно изменять, чтобы получить условия низкой строгости гибридизации, отличные от
15 перечисленых выше условий, но эквивалентные им.
[0104] Термин "эквивалент", употребляемый для описания того, как условие гибридизации относится к интересующему условию гибридизации, означает, что условие гибридизации и интересующее условие гибридизации приводят к гибридизации последовательностей нуклеиновых кислот, у которых наблюдается одинаковый диапазон
20 процентов (%) гомологии. Например, если интересующее условие гибридизации приводит к гибридизации первой последовательности нуклеиновой кислоты с другими последовательностями нуклеиновых кислот, которые гомологичны на 50% - 70% первой последовательности нуклеиновой кислоты, то другое условие гибридизации называют эквивалентным интересующему условию гибридизации, если данное другое условие
25 гибридизации также приводит к гибридизации первой последовательности нуклеиновой кислоты с другими последовательностями нуклеиновых кислот, которые гомологичны на 50% - 70% первой последовательности нуклеиновой кислоты.
[0105] В данном тексте термин "гибридизация" используют для обозначения спаривания комплементарных нуклеиновых кислот с применением любого процесса, посредством 30 которого цепь нуклеиновой кислоты соединяется с комплементарной цепью путем спаривания оснований с образованием гибридизационного комплекса. На гибридизацию и силу гибридизации (т.е. силу ассоциации между нуклеиновыми кислотами) оказывают влияние такие факторы, как степень комплементарности между нуклеиновыми кислотами,
используемая строгость условий, Тт образованного гибрида и отношение G:C в нуклеиновых кислотах.
[0106] В данной заявке термин "гибридизационный комплекс" относится к комплексу, который образуется между двумя последовательностями нуклеиновых кислот благодаря 5 образованию водородных связей между комплементарными основаниями G и С и между комплементарными основаниями А и Т; данные водородные связи можно дополнительно стабилизировать межплоскостными взаимодействиями оснований. Две комплементарные последовательности нуклеиновых кислот связываются водородными связями в антипараллельной конфигурации. Гибридизационный комплекс может образоваться в
10 растворе (например, анализ Cot или Rot) или между одной последовательностью нуклеиновой кислоты, присутствующей в растворе, и другой последовательностью нуклеиновой кислоты, иммобилизованной на твердой подложке (например, на нейлоновой мембране или нитроцеллюлозном фильтре, используемых при саузерн-блоттинге и нозерн-блоттинге, дот-блоттинге, или на предметном стекле, используемом при гибридизации in
15 situ, включая FISH (флуоресцентную гибридизацию in situ)).
[0107] В данном тексте термин "Тт" используют для обозначения "температуры плавления". Температура плавления представляет собой температуру, при которой половина популяции двухцепочечных молекул нуклеиновых кислот диссоциирует на отдельные цепи. Уравнение для вычисления Тт нуклеиновых кислот хорошо известно в
20 данной области техники. Как указано в стандартных опорных источниках, упрощенную оценку значения Тт можно получить с помощью уравнения: Тт = 81,5 + 0,41 (% G + С), когда нуклеиновая кислота находится в водном растворе при 1 М NaCl (см., например, Anderson и Young, Quantitative Filter Hybridization, в Nucleic Acid Hybridization, 1985). В других источниках содержатся более изощренные вычисления, в которых для расчета Тт
25 учитываются структурные свойства, а также особенности последовательности.
[0108] В данном тексте термин "строгость" используют по отношению к условиям температуры, ионной силы и присутствия других соединений, таких как органические растворители, при которых осуществляют гибридизацию нуклеиновых кислот. "Строгость" обычно наблюдается в диапазоне от приблизительно Тт - 5°С (на 5°С ниже температуры 30 плавления зонда) до температуры, приблизительно на 20°С - 25°С ниже Тт. Для специалистов в данной области техники будет очевидно, что строгую гибридизацию можно использовать, чтобы определить или обнаружить идентичные полинуклеотидные последовательности или чтобы определить или обнаружить похожие или родственные полинуклеотидные последовательности.
[0109] Термины "специфическое связывание", "специфичность связывания" и их грамматические эквиваленты, когда их применяют для описания связывания первой последовательности нуклеотидов со второй последовательностью нуклеотидов, относятся к предпочтительному взаимодействию между первой последовательностью нуклеотидов и 5 второй последовательностью нуклеотидов по сравнению с взаимодействием между второй последовательностью нуклеотидов и третьей последовательностью нуклеотидов. Специфическое связывание представляет собой относительный термин, который не требует абсолютной специфичности связывания; другими словами, термин "специфическое связывание" не требует того, чтобы вторая последовательность нуклеотидов
10 взаимодействовала с первой последовательностью нуклеотидов при отсутствии взаимодействия между второй последовательностью нуклеотидов и третьей последовательностью нуклеотидов. Скорее, достаточно, чтобы уровень взаимодействия между первой последовательностью нуклеотидов и второй последовательностью нуклеотидов был больше, чем уровень взаимодействия между второй последовательностью
15 нуклеотидов и третьей последовательностью нуклеотидов. "Специфическое связывание" первой последовательности нуклеотидов со второй последовательностью нуклеотидов также означает, что взаимодействие между указанной первой последовательностью нуклеотидов и указанной второй последовательностью нуклеотидов зависит от наличия конкретной структуры на или внутри первой последовательности нуклеотидов; другими
20 словами, вторая последовательность нуклеотидов скорее узнает и связывается с определенной структурой на или внутри первой последовательности нуклеотидов, чем с нуклеиновыми кислотами или с последовательностями нуклеотидов вообще. Например, если вторая последовательность нуклеотидов специфична к структуре "А", которая находится на или внутри первой последовательности нуклеотидов, присутствие третьей
25 последовательности нуклеиновой кислоты, содержащей структуру А, уменьшит количество вторых последовательностей нуклеотидов, которые свяжутся с первыми последовательностями нуклеотидов.
[ОНО] В тексте настоящей заявки термин "амплифицируемая нуклеиновая кислота" используют по отношению к нуклеиновым кислотам, которые можно амплифицировать с 30 помощью любого способа амплификации. Предполагается, что термин "амплифицируемая нуклеиновая кислота" обычно будет включать "эталонную матрицу".
[0111] Термины "гетерологичная последовательность нуклеиновой кислоты" или "гетерологичная ДНК" используют взаимозаменяемо для описания последовательности нуклеотидов, которую лигируют с последовательностью нуклеиновой кислоты, с которой
она не лигирована в природе, или с которой она лигирована в отличном положении в природе. Гетерологичная ДНК не является эндогенной для клетки, в которую ее внедряют, но ее получают из другой клетки. Как правило, хотя и не обязательно, такая гетерологичная ДНК кодирует РНК и белки, которые обычно не продуцируются клеткой, в которой ее 5 экспрессировали. Примеры гетерологичной ДНК включают репортерные гены, регуляторные последовательности транскрипции и трансляции, белки селектируемых маркеров (например, белки, которые придают лекарственную устойчивость) и т.д.
[0112] "Амплификация" представляет собой получение дополнительных копий последовательности нуклеиновой кислоты, и ее, как правило, осуществляют, применяя
10 методики полимеразной цепной реакции, хорошо известные в данной области техники (Dieffenbach С W и G S Dveksler (1995) PCR Primer, a Laboratory Manual, Cold Spring Harbor Press, Плэйнвью, Нью-Йорк). В данном тексте термин "полимеразная цепная реакция" ("ПОР") относится к способу, описанному К. В. Mullis в патентах США под номерами 4683195 и 4683202, которые настоящим включены в данную заявку посредством ссылки, в
15 которых описан способ повышения концентрации фрагмента целевой последовательности в смеси геномной ДНК без проведения клонирования или очистки. Длину амплифицированного фрагмента желательной целевой последовательности определяют по относительным положениям двух олигонуклеотидных праймеров по отношению друг к другу и, следовательно, такая длина является контролируемым параметром. Благодаря
20 тому, что данный процесс состоит из повторяющихся этапов, такой способ называют "полимеразной цепной реакцией" ("ПЦР"). Так как желательные амплифицированные фрагменты целевой последовательности становятся преобладающими последовательностями в смеси (в отношении концентрации), их называют "амплифицированными с помощью ПЦР".
25 [0113] С помощью ПЦР возможно амплифицировать одну копию определенной целевой последовательности в геномной ДНК до уровня, детектируемого несколькими различными методиками (например, путем гибридизации с меченым зондом; включения биотинилированных праймеров, после чего осуществляют детектирование конъюгата авидин-фермент; включения в амплифицированный фрагмент 32Р-меченых
30 дезоксинуклеотидтрифосфатов, таких как dCTP или dATP). Помимо геномной ДНК любую олигонуклеотидную последовательность можно амплифицировать с помощью подходящего набора молекул праймеров. В частности, амплифицированные фрагменты, созданные в процессе ПЦР, сами по себе являются эффективными матрицами для последующих амплификаций с помощью ПЦР.
[0114] Один такой предпочтительный способ, особенно для коммерческих применений, основан на широко применяемой методике ПЦР в реальном времени TaqMan(r), и в нем аллель-специфическая ПЦР скомбинирована с блокирующим реагентом (АСБ-ПЦР) для подавления амплификации аллеля дикого типа. АСБ-ПЦР можно применять для 5 обнаружения генеративных или соматических мутаций в ДНК или РНК, экстрагированных из любого типа ткани, включая фиксированные в формалине заключенные в парафин образцы опухоли. Выработан набор правил для разработки реагента, позволяющий чувствительное и избирательное обнаружение отдельных точечных замен, вставок или делеций по сравнению с исходным аллелем дикого типа при тысячекратном или большем 10 избытке (Morlan J, Baker J, Sinicropi D Mutation Detection by Real-Time PCR: A Simple, Robust and Highly Selective Method. PLoS ONE 4(2): e4584, 2009).
[0115] Термины "полимеразная цепная реакция с обратной транскрипцией" и "ОТ-ПЦР" относятся к способу обратной транскрипции последовательности РНК с получением смеси последовательностей кДНК, после чего увеличивают концентрацию желательного 15 фрагмента транскрибированных последовательностей кДНК в смеси без клонирования или очистки. Обычно, РНК подвергают обратной транскрипции с применением единственного праймера (например, праймера олиго-dT) перед амплификацией с помощью ПЦР желательного фрагмента транскрибированной ДНК с применением двух праймеров.
[0116] В данном тексте термин "праймер" относится к олигонуклеотиду, либо 20 встречающемуся в природе, как в очищенном переваре рестриктазами, либо полученному синтетическим путем, который способен действовать в качестве точки инициации синтеза, когда его помещают в условия, при которых вызывается синтез продукта элонгации праймера, который комплементарен цепи нуклеиновой кислоты (т.е. в присутствии нуклеотидов и индуцирующего агента, такого как ДНК-полимераза, и при подходящей 25 температуре и рН). В некоторых вариантах реализации для максимальной эффективности праймера при амплификации он одноцепочечной, но, в качестве альтернативы, он может быть двухцепочечным. Если праймер двухцепочечной, данный праймер сначала обрабатывают для разделения его цепей перед применением для получения продуктов элонгации. В некоторых вариантах реализации праймер представляет собой 30 олигодезоксирибонуклеотид. Праймер должен быть достаточно длинным, чтобы запускать синтез продуктов элонгации в присутствии индуцирующего агента. Точные длины праймеров будут зависесть от многих факторов, включая температуру, источник праймера и применяемый способ.
[0117] В данном тексте термин "зонд" относится к олигонуклеотиду (т.е., последовательности нуклеотидов), либо встречающемуся в природе, как в очищенном переваре рестриктазами, либо полученному синтетическим путем, рекомбинантным путем или путем амплификации с помощью ПЦР, который способен гибридизоваться с другим 5 интересующим олигонуклеотид ом. Зонд может быть одноцепочечным или двухцепочечным. Зонды полезны для обнаружения, идентификации и выделения определенных последовательностей генов. Предполагается, что любой зонд, используемый в настоящем описании, будет помечен любой "репортерной молекулой", чтобы его можно было детектировать с помощью любой системы обнаружения, включая, но не 10 ограничиваясь перечисленными: ферментативную (например, ELISA, а также гистохимические анализы на основе ферментов), флуоресцентную, радиоактивную и люминесцентную системы. Не предполагается, что настоящее описание ограничено какой-либо конкретной системой обнаружения или меткой.
[0118] В данном тексте термины "эндонуклеазы рестрикции" и "ферменты рестрикции" 15 относятся к бактериальным ферментам, каждый из которых разрезает или надрезает двух-или одноцепочечную ДНК в определенном сайте последовательности нуклеотидов или рядом с ним, например, можно применять эндонуклеазный домен эндонуклеазы рестрикции типа IIS (например, Fokl), как описано в Kim и др., 1996, Proc. Nat'l. Acad. Sci. USA, 6:1 156-60.
20 [0119] В данном тексте термин "олигонуклеотид, имеющий последовательность нуклеотидов, кодирующую ген", означает последовательность нуклеиновой кислоты, содержащую кодирующую область гена, т.е. последовательность нуклеиновой кислоты, которая кодирует продукт гена. Кодирующая область может присутствовать в любой из следующих форм: кДНК, геномная ДНК или РНК. Если она присутствует в форме ДНК, то
25 олигонуклеотид может быть одноцепочечным (т.е. смысловая цепь) или двухцепочечным. Дополнительно "олигонуклеотид, имеющий последовательность нуклеотидов, кодирующую ген", может содержать подходящие регуляторные элементы, такие как энхансеры, промоторы, границы сплайсинга, сигналы полиаденилирования и т.д., при необходимости, чтобы позволить правильную инициацию транскрипции и/или правильный
30 процессинг первичного транскрипта РНК. Более того, кодирующая область согласно настоящему описанию может содержать эндогенные энхансеры, границы сплайсинга, внедренные последовательности, сигналы полиаденилирования и т.д.
[0120] Сигналы, контролирующие транскрипцию у эукариот, включают "энхансерные" элементы. Энхансеры состоят из коротких групп последовательностей ДНК, которые
специфично взаимодействуют с клеточными белками, вовлеченными в транскрипцию (Maniatis, Т. и др., Science 236:1237, 1987). Энхансерные элементы были выделены из различных эукариотических источников, включая гены из клеток растений, дрожжей, насекомых, млекопитающих и вирусов. Выбор конкретного энхансера зависит от того, 5 какой тип клеток будут применять для экспрессии интересующего белка.
[0121] Присутствие "сигналов сплайсинга" в векторе экспрессии часто приводит к более высоким уровням экспрессии рекомбинантного транскрипта. Сигналы сплайсинга опосредуют удаление интронов из первичного транскрипта РНК и состоят из донорного и акцепторного сайтов сплайсинга (Sambrook, J. и др., Molecular Cloning: A Laboratory 10 Manual, 2ое изд., Cold Spring Harbor Laboratory Press, Нью-Йорк, стр. 16.7-16.8, 1989). Широко применяемый донорный и акцепторный сайт сплайсинга представляет собой границу сплайсинга из РНК 16S SV40.
[0122] Для эффективной экспрессии рекомбинантных последовательностей ДНК в эукариотических клетках требуется экспрессия сигналов, направляющих эффективную
15 терминацию и полиаденилирование полученного транскрипта. Сигналы терминации транскрипции, как правило, расположены по ходу транскрипции от сигнала полиаденилирования, и их длина составляет несколько сотен нуклеотидов. Термин "поли(А)-сайт" или "поли(А)-последовательность" в данной заявке обозначает последовательность ДНК, которая направляет как терминацию, так и полиаденилирование
20 образующегося транскрипта РНК. Эффективное полиаденилирование рекомбинантного транскрипта желательно, так как транскрипты, в которых нет поли(А)-хвоста, нестабильны и быстро деградируют. Поли(А)-сигнал, применяемый в векторе экспрессии, может быть "гетерологичным" или "эндогенным". Эндогенный поли(А)-сигнал представляет собой поли(А)-сигнал, который обычно расположен на 3'-конце кодирующей области данного
25 гена в геноме. Гетерологичный поли(А)-сигнал представляет собой поли(А)-сигнал, который выделяют из одного гена и помещают с 3 '-стороны от другого гена.
[0123] В данном тексте термин "промотор", "промоторный элемент" или "последовательность промотора" относится к последовательности ДНК, которая, когда ее помещают на 5'-конце от олигонуклеотидной последовательности (т.е. она предшествует 30 ей), способна контролировать транскрипцию указанной олигонуклеотидной последовательности с образованием мРНК. Промотор обычно расположен с 5'-стороны (т.е. против хода транскрипции) от олигонуклеотидной последовательности, транскрипцию которой с образованием мРНК он контролирует, и предоставляет сайт для специфического связывания РНК-полимеразы и для инициации транскрипции.
[0124] Термин "активность промотора", когда его употребляют по отношению к последовательности нуклеиновой кислоты, относится к способности последовательности нуклеиновой кислоты инициировать транскрипцию олигонуклеотидной последовательности с образованием мРНК.
5 [0125] Термин "тканеспецифический", когда его употребляют по отношению к промотору, относится к промотору, который способен направлять селективную экспрессию олигонуклеотидной последовательности в определенном типе ткани при относительном отсутствии экспрессии того же олигонуклеотида в отличном типе ткани. Тканеспецифичность промотора можно оценить, например, путем функционального
10 связывания репортерного гена с последовательностью промотора с получением репортерной конструкции, введения указанной репортерной конструкции в геном растения или животного таким образом, что репортерная конструкция встраивается в каждую ткань полученого в результате этого трансгенного животного, и обнаружения экспрессии репортерного гена (например, обнаружения мРНК, белка или активности белка,
15 кодируемого репортерным геном) в различных тканях трансгенного растения или животного. Селективность не обязательно должна быть абсолютной. Обнаружение большего уровня экспрессии репортерного гена в одной или более тканях по сравнению с уровнем экспрессии репортерного гена в других тканях показывает, что данный промотор специфичен для тканей, в которых обнаружены большие уровни экспрессии.
20 [0126] Термин "специфический для типа клеток" применительно к промотору относится к промотору, который способен направлять избирательную экспрессию олигонуклеотидной последовательности в определенном типе клеток при относительном отсутствии экспрессии той же олигонуклеотидной последовательности в отличном типе клеток в той же ткани. Термин "специфический для типа клеток" применительно к
25 промотору также означает промотор, способный вызывать избирательную экспрессию олигонуклеотида на некоторой области внутри одной ткани. Опять же, селективность не обязательно должна быть абсолютной. Специфичность промотора для типа клеток можно оценить, применяя способы, хорошо известные в данной области техники, например, иммуногистохимическое окрашивание, описанное в данной заявке. Вкратце, срезы ткани
30 заключают в парафин, и заключенные в парафин срезы приводят во взаимодействие с первичным антителом, которое специфично к полипептидному продукту, кодируемому олигонуклеотидной последовательностью, экспрессия которой контролируется указанным промотором. В качестве альтернативы изготовлению парафиновых срезов можно получить криосрезы образцов. Например, срезы можно замораживать до и в процессе изготовления
срезов, что позволяет избежать потенциального влияния остаточного парафина. Меченому (например, конъюгированному с пероксидазой) вторичному антителу, которое специфично к первичному антителу, позволяют связаться со срезами ткани, и обнаруживают специфическое связывание (например, с помощью системы авидин/биотин) путем 5 микроскопии.
[0127] Термины "избирательная экспрессия," "избирательно экспрессировать" и их грамматические эквиваленты относятся к сравнению относительных уровней экспрессии на двух или более интересующих участках. Например, термин "избирательная экспрессия", когда его применяют по отношению к ткани, относится к по существу большему уровню
10 экспрессии интересующего гена в конкретной ткани или к по существу большему количеству клеток, которые экспрессируют данный ген в данной ткани, по сравнению, соответственно, с уровнем экспрессии того же гена и количеством клеток, экспрессирующих тот же ген, в другой ткани (т.е. селективность не обязательно должна быть абсолютной). Избирательная экспрессия не требует, хотя и может включать
15 экспрессию интересующего гена в конкретной ткани и полное отсутствие экспрессии того же гена в другой ткани. Аналогично, "избирательная экспрессия" в данной заявке по отношению к типам клеток относится к значительно большему уровню экспрессии или к значительно большему количеству клеток, которые экспрессируют интересующий ген, в конкретном типе клеток, по сравнению, соответственно, с уровнями экспрессии гена и с
20 количеством клеток, экспрессирующих данный ген, в другом типе клеток.
[0128] Термин "непрерывный", когда его применяют по отношению к двум или более последовательностям нуклеотидов, означает, что последовательности нуклеотидов лигированы последовательно либо в отсутствие находящихся между ними последовательностей, либо в присутствии находящихся между ними последовательностей, 25 которые не содержат одного или более регуляторных элементов.
[0129] В данном тексте термины "молекула нуклеиновой кислоты, кодирующая", "нуклеотид, кодирующий", "последовательность ДНК, кодирующая" и "ДНК, кодирующая" относятся к порядку или последовательности дезоксирибонуклеотидов в цепи дезоксирибонуклеиновой кислоты. Порядок данных дезоксирибонуклеотидов 30 определяет порядок аминокислот в полипептидной (белковой) цепи. Последовательность ДНК, таким образом, кодирует последовательность аминокислот.
[0130] Термин "изолированный", когда его применяют по отношению к нуклеиновой кислоте, как в формулировке "изолированный олигонуклеотид", относится к последовательности нуклеиновой кислоты, которую отделили от по меньшей мере одной
контаминирующей нуклеиновой кислоты, с которой она обычно связана в природном источнике. Изолированная нуклеиновая кислота представляет собой нуклеиновую кислоту, присутствующую в форме или окружении, которые отличны от формы или окружения, в которых она встречается в природе. Наоборот, неизолированные нуклеиновые кислоты 5 представляют собой нуклеиновые кислоты, такие как ДНК и РНК, которые обнаружены в таком состоянии, в котором они существут в природе. Например, данная последовательность ДНК (например, ген) обнаружена на хромосоме клетки-хозяина в непосредственной близости от соседних генов; последовательности РНК, такие как определенная последовательность мРНК, кодирующая определенный белок, обнаружены в
10 клетке в виде смесей со множеством других мРНК, которые кодируют множество белков. Тем не менее, изолированная нуклеиновая кислота, кодирующая интересующий полипептид, включает, в качестве примера, такую нуклеиновую кислоту в клетках, обычно экспрессирующих интересующий полипептид, в которых нуклеиновая кислота находится в хромосомном или внехромосомном положении, отличном от такового в природных
15 клетках, или иным образом фланкирована отличной последовательностью нуклеиновой кислоты, чем встречающаяся в природе. Изолированная нуклеиновая кислота или олигонуклеотид может находиться в одноцепочечной или двухцепочечной форме. Изолированную нуклеиновую кислоту можно легко обнаружить (при необходимости) с помощью различных методик (например, гибридизации, дот-блоттинга и т.д.) Если для
20 экспрессии белка нужно применять изолированную нуклеиновую кислоту или олигонуклеотид, указанный олигонуклеотид будет содержать по меньшей мере смысловую или кодирующую цепь (т.е. олигонуклеотид может быть одноцепочечным). В качестве альтернативы он может содержать как смысловую, так и антисмысловую цепи (т.е., олигонуклеотид может быть двухцепочечным).
25 [0131] В данном тексте термин "очищенный" или "очищать" относится к удалению одного или более (нежелательных) компонентов из образца. Например, если рекомбинантные полипептиды экспрессируются в бактериальных клетках-хозяевах, полипептиды очищают путем удаления белков клетки-хозяина, тем самым повышая процент рекомбинантных полипептидов в образце.
30 [0132] В данном тексте термин "по существу очищенный" относится к молекулам, либо к последовательностям нуклеиновых кислот, либо к последовательностям аминокислот, которые удалены из природного окружения, выделены или отделены, и по меньшей мере на 60% свободны, в некоторых вариантах реализации на 75% свободны и в других вариантах реализации на 90% свободны от других компонентов, с которыми они
ассоциированы в природе. "Изолированный полинуклеотид", следовательно, представляет собой по существу очищенный полинуклеотид.
[0133] В данном тексте термин "кодирующая область", когда его применяют по отношению к структурному гену, относится к последовательностям нуклеотидов, которые 5 кодируют аминокислоты, обнаруживаемые в образующемся полипептиде в результате трансляции молекулы мРНК. Кодирующая область у эукариот, как правило, ограничена с 5'-стороны нуклеотидным триплетом "ATG", который кодирует начальный метионин, и с 3'-стороны одним из трех триплетов, которые представляют собой стоп-кодоны (т.е. ТАА, TAG, TGA).
10 [0134] "Кодирующая последовательность" означает последовательность нуклеиновой кислоты, или комплементарную ей последовательность, или ее часть, которую можно транскрибировать и/или транслировать для получения мРНК и/или полипептида, или их фрагментов. Кодирующие последовательности включают экзоны в геномной ДНК или несозревшие первичные транскрипты РНК, которые соединяются биохимическим
15 аппаратом клетки с образованием зрелой мРНК. Антисмысловая цепь представляет собой последовательность, комплементарную такой нуклеиновой кислоте, и по ней можно установить кодирующую последовательность.
[0135] "Некодирующая последовательность" означает последовательность нуклеиновой кислоты, или комплементарную ей последовательность, или ее часть, которая не 20 транскрибируется в последовательность аминокислот in vivo, или с которой не взаимодействуют тРНК, чтобы поместить или попробовать поместить аминокислоту. Некодирующие последовательности включают как интронные последовательности в геномной ДНК, так и незрелые первичные транскрипты РНК и ассоциированные с генами последовательности, такие как промоторы, энхансеры, сайленсеры и т.д.
25 [0136] В данном тексте термин "структурный ген" или "структурная последовательность нуклеотидов" относится к последовательности ДНК, кодирующей РНК или белок, которые не контролируют экспрессию других генов. Наоборот, "регуляторный ген" или "регуляторная последовательность" представляет собой ген, который кодирует продукты (например, транскрипционные факторы), контролирующие экспрессию других генов.
30 [0137] В данном тексте термин "регуляторный элемент" относится к генетическому элементу, который контролирует некоторый аспект экспрессии последовательностей нуклеиновых кислот. Например, промотор представляет собой регуляторный элемент, который способствует инициации транскрипции функционально связанной с ним
кодирующей области. Другие регуляторные элементы включают сигналы сплайсинга, сигналы полиаденилирования, сигналы терминации и т.д.
[0138] В данном тексте термин "сайт связывания пептидного транскрипционного фактора" или "сайт связывания транскрипционного фактора" относится к 5 последовательности нуклеотидов, которая связывает белковые транскрипционные факторы и, тем самым, контролирует некоторый аспект экспрессии последовательностей нуклеиновых кислот. Например, сайты связывания Sp-1 и API (активаторного белка 1) представляют собой примеры сайтов связывания пептидных транскрипционных факторов.
[0139] В данном тексте термин "ген" означает последовательности
10 дезоксирибонуклеотидов, содержащие кодирующую область структурного гена. "Ген" также может содержать нетранслируемые последовательности, расположенные рядом с кодирующей областью на обоих 5'- и 3'-концах таким образом, что ген соответствует полноразмерной мРНК. Последовательности, которые расположены с 5'-стороны от кодирующей области и которые присутствуют на мРНК, называют 5'-нетранслируемыми
15 последовательностями. Последовательности, которые расположены с 3'-стороны или по ходу транскрипции от кодирующей области и которые присутствуют на мРНК, называют 3'-нетранслируемыми последовательностями. В объем термина "ген" входит как кДНК, так и геномные формы гена. Геномная форма или клон гена содержит кодирующую область, прерывающуюся некодирующими последовательностями, называемыми "интронами", или
20 "промежуточными участками", или "промежуточными последовательностями". Интроны представляют собой фрагменты гена, которые транскрибируются в гетерогенную ядерную РНК (гяРНК); интроны могут содержать регуляторные элементы, такие как энхансеры. Интроны удаляются или "сплайсируются" из ядерного или первичного транскрипта; следовательно, интроны отсутствуют в транскрипте информационной РНК (мРНК).
25 Функция мРНК в процессе трансляции состоит в указании последовательности или порядка аминокислот в образующемся полипептиде. Ген, как правило, представлен в одном локусе. В нормальном диплоидном организме у гена есть две аллели. В тетраплоидном картофеле, тем не менее, у каждого гена есть 4 аллели. В сахарном тростнике, который является додекаплоидным, может быть 12 аллелей на ген. Конкретные примеры включают лен, у
30 которого есть два локуса EPSPS, в каждом из которых по две аллели, и рис, у которого есть одна гомомерная пластидная АККаза с двумя аллелями.
[0140] Вдобавок к интронам геномные формы гена также могут содержать последовательности, расположенные на обоих 5'- и 3'-концах последовательностей, которые присутствуют в транскрипте РНК. Данные последовательности называют
"фланкирующими" последовательностями или участками (такие фланкирующие последовательности расположены с 5'- или 3'-стороны от нетранслируемых последовательностей, присутствующих на транскрипте мРНК). 5'-фланкирующий участок может содержать регуляторные последовательности, такие как промоторы и энхансеры, 5 которые контролируют или влияют на транскрипцию гена. 3'-фланкирующий участок может содержать последовательности, которые направляют терминацию транскрипции, пост-транскрипционное расщепление и полиаденилирование.
[0141] "Не относящееся к человеку животное" относится к любому животному, которое не является человеком, и включает позвоночных, таких как грызуны, не относящиеся к 10 человеку приматы, овечьи, бычьи, жвачные, зайцеобразные, свиные, козьи, лошадиные, псовые, кошачьи, пернатые и т.д. Предпочтительные не относящиеся к человеку животные выбраны из отряда грызунов. "Не относящееся к человеку животное" дополнительно относится к амфибиям (например, Xenopus), рептилиям, насекомым (например, Drosophila) и другим не относящимся к млекопитающим видам животных.
15 [0142] В данном тексте термин "трансгенный" относится к организму или клетке, которая содержит полученную из другого организма ДНК, которая после ее доставки в организм или клетку встраивается в геном соматической и/или половой клетки растения или животного. "Трансген" означает последовательность ДНК, которая частично или полностью гетерологична (т.е. не присутствует в природе) для растения или животного, в
20 котором ее обнаружили, или которая гомологична эндогенной последовательности (т.е. последовательности, которую обнаруживают в указанном животном в природе) и встроена в указанное растение или животное в положение в геноме, которое отличается от такового у встречающейся в природе последовательности. Трансгенные растения или животные, которые содержат один или более трансгенов, входят в объем настоящего описания. Кроме
25 того, "трансгенный" в данной заявке относится к организму, у которого модифицировали и/или "нокаутировали" (сделали нефункциональными или функционирующими на пониженном уровне, т.е. "нокаутрующая" мутация) один или более генов с помощью способов согласно настоящему описанию, путем гомологичной рекомбинации, мутации посредством TFO или с помощью аналогичных процессов. Например, в некоторых
30 вариантах реализации трансгенный организм или клетка содержит внедренную ДНК, которая включает чужеродный промотор и/или кодирующую область.
[0143] "Трансформированная клетка" представляет собой клетку или линию клеток, которая получила способность расти в культуре на протяжении нескольких поколений, способность расти в мягком агаре, и/или клеточный рост которой более не ингибируется
межклеточными контактами. В этом отношении, трансформация относится к внедрению чужеродного генетического материала в клетку или организм. Трансформацию можно осуществить с помощью любого известного способа, который позволяет успешно внедрять нуклеиновые кислоты в клетки и который приводит к экспрессии внедренной нуклеиновой 5 кислоты. "Трансформация" включает, но не ограничена такими способами, как трансфекция, микроинъекция, электропорация, нуклеофекция и липофекция (опосредованный липосомами перенос генов). Трансформацию можно осуществить путем применения любого вектора экспрессии. Например, предполагается применение бакуловируса для введения чужеродной нуклеиновой кислоты в клетки насекомого. 10 Термин "трансформация" также включает такие способы, как опосредованная Р-элементом трансформация зародышевой линии целых насекомых. Кроме того, трансформация относится к клеткам, которые оказались трансформированными естественным путем, обычно посредством генетической мутации.
[0144] В данном тексте "экзогенный" означает, что ген, кодирующий белок, обычно не 15 экспрессируется в данной клетке. Кроме того, "экзогенный" относится к гену, которым трансфицирована клетка для повышения нормального (т.е. естественного) уровня экспрессии данного гена.
[0145] Пептидная последовательность и нуклеотидная последовательность могут быть "эндогенными" или "гетерологичными" (т.е. "чужеродными"). Термин "эндогенный"
20 относится к последовательности, которая в природе находится в клетке, в которую ее ввели, при условии, что она не содержит какую-либо модификацию по сравнению со встречающейся в природе последовательностью. Термин "гетерологичный" относится к последовательности, которая не эндогенна для клетки, в которую ее ввели. Например, гетерологичная ДНК содержит последовательность нуклеотидов, которую лигировали, или
25 на которую воздействовали, чтобы она стала лигированной, с последовательностью нуклеиновой кислоты, с которой она не лигирована в природе или с которой она лигирована в отличном положении в природе. Гетерологичная ДНК также включает последовательность нуклеотидов, которая в природе находится в клетке, в которую ее ввели, и которая содержит какую-либо модификацию по сравнению со встречающейся в
30 природе последовательностью. Как правило, хотя и не обязательно, гетерологичная ДНК кодирует гетерологичную РНК и гетерологичные белки, которые обычно не продуцируются клеткой, в которую ее ввели. Примеры гетерологичных ДНК включают репортерные гены, последовательности, контролирующие транскрипцию и трансляцию,
последовательности ДНК, которые кодируют белки селектируемых маркеров (например, белки, которые придают лекарственную устойчивость), и т.д.
[0146] Конструкции
5 [0147] Молекулы нуклеиновых кислот, описанные в данной заявке (например, сайт-специфические нуклеазы или РНК-проводники для коротких полиндромных повторов, регулярно расположенных группами (CRISPR)), можно применять для получения конструкций рекомбинантных нуклеиновых кислот. В одном варианте реализации молекулы нуклеиновых кислот согласно настоящему описанию можно применять для 10 получения конструкций нуклеиновых кислот, например, кассет экспрессии для экспрессии в интересующем растении, микроорганизме или животном. Такая экспрессия может быть временной, например, когда конструкция не встроена в геном хозяина, или может поддерживаться под контролем, предлагаемым промотором и положением конструкции внутри генома хозяина, если она становится встроенной.
15 [0148] Кассеты экспрессии могут содержать регуляторные последовательности, функционально связанные с сайт-специфической нуклеазой или последовательностями РНК-проводников, описанными в данной заявке. Кассета может дополнительно содержать по меньшей мере один дополнительный ген, которым нужно котрансформировать данный организм. В качестве альтернативы дополнительный ген(ы) может находиться на
20 нескольких кассетах экспрессии.
[0149] Конструкции нуклеиновых кислот можно снабдить множеством сайтов рестрикции для вставки последовательности, кодирующей сайт-специфическую нуклеазу, под транскрипционный контроль регуляторных участков. Конструкции нуклеиновых кислот могут дополнительно содержать молекулы нуклеиновых кислот, кодирующие гены 25 селектируемых маркеров.
[0150] Для получения конструкций нуклеиновых кислот можно применять любой промотор. Промотор может быть нативным или аналогичным, или чужеродным или гетерологичным, по отношению к последовательностям нуклеиновых кислот растения-хозяина, микроба-хозяина или животного-хозяина, описанным в данной заявке. Кроме того, 30 промотор может представлять собой природную последовательность или, в качестве альтернативы, синтетическую последовательность. Если промотор "чужероден" или "гетерологичен" для растения-хозяина, микроба-хозяина или животного-хозяина, предполагается, что данный промотор не обнаруживают в нативном растении, микробе или
животном, в которое внедрили указанный промотор. В данном тексте химерный ген включает кодирующую последовательность, функционально связанную с участком инициации транскрипции, который гетерологичен кодирующей последовательности.
[0151] Последовательности сайт-направленных нуклеаз, описанные в данной заявке, 5 можно экспрессировать, применяя гетерологичные промоторы.
[0152] Для получения конструкций для контроля экспрессии последовательностей сайт-направленных нуклеаз можно применять любой промотор, такой как конститутивные, предпочитаемые данной тканью, индуцируемые или другие промоторы для экспрессии в растениях, микробах или животных. Конститутивные промоторы включают, например,
10 коровый промотор Rsyn7 и другие конститутивные промоторы, описанные в WO 99/43 838 и патенте США № 6072050; коровый промотор 35S CaMV (Odell и др. Nature 313:810-812; 1985); промотор актина риса (McElroy и др., Plant Cell 2:163-171, 1990); промотор убиквитина (Christensen и др., Plant Mol. Biol. 12:619-632, 1989 и Christensen и др., Plant Mol. Biol. 18:675-689, 1992); pEMU (Last и др., Theor. Appl. Genet. 81:581-588, 1991); MAS (Velten
15 и др., EMBO J. 3:2723-2730, 1984); промотор ALS (патент США № 5659026) и тому подобные промоторы. Другие конститутивные промоторы включают, например, промоторы, описанные в патентах США № 5608149; 5608144; 5604121; 5569597; 5466785; 5399680; 5268463; 5608142 и 6177611.
[0153] Предпочтительные для данной ткани промоторы можно применять, чтобы 20 направлять сайт-направленную экспрессию нуклеазы в конкретной ткани растения. Такие предпочтительные для данной ткани промоторы включают, но не ограничены перечисленными: предпочтительные для листа промоторы, предпочтительные для корня промоторы, предпочтительные для семени промоторы и предпочтительные для стебля промоторы. Предпочтительные для данной ткани промоторы включают промоторы, 25 описанные в Yamamoto и др., Plant J. 12(2):255-265, 1997; Kawamata и др., Plant Cell Physiol. 38(7):792-803, 1997; Hansen и др., Mol. Gen Genet. 254(3):337-343, 1997; Russell и др., Transgenic Res. 6(2):157-168, 1997; Rinehart и др., Plant Physiol. 1 12(3): 1331-1341, 1996; Van Camp и др., Plant Physiol. 1 12(2):525-535, 1996; Canevascini и др., Plant Physiol. 112(2): 513524, 1996; Yamamoto и др., Plant Cell Physiol. 35(5):773-778, 1994; Lam, Results Probl. Cell 30 Differ. 20:181-196, 1994; Orozco и др. Plant Mol Biol. 23(6): 1129-1138, 1993; Matsuoka и др., Proc Nat'l. Acad. Sci. USA 90(20):9586- 9590, 1993; и Guevara-Garcia и др., Plant J. 4(3):495-505, 1993.
[0154] Конструкции нуклеиновых кислот также могут содержать участки терминации транскрипции. Если используют участки терминации транскрипции, то для получения
конструкций нуклеиновых кислот можно применять любой участок терминации. Например, участок терминации можно получить из другого источника (т.е., чужеродного или гетерологичного для данного промотора). Примеры участков терминации, которые доступны для применения в конструкциях согласно настоящему описанию, включают 5 участки терминации из плазмиды Ti A. tumefaciens, такие как участки терминации октопинсинтазы и нопалинсинтазы. См. также Guerineau и др., Mol. Gen. Genet. 262:141144, 1991; Proudfoot, Cell 64:671-674, 1991; Sanfacon и др., Genes Dev. 5:141-149, 1991; Mogen и др., Plant Cell 2:1261-1272, 1990; Munroe и др., Gene 91:151-158, 1990; Ballas и др., Nucleic Acids Res. 17:7891-7903, 1989; и Joshi и др., Nucleic Acid Res. 15:9627-9639, 1987.
10 [0155] В сочетании с любым из аспектов, вариантов реализации, способов и/или композиций, описанных в данной заявке, нуклеиновые кислоты можно оптимизировать для повышенной экспрессии в трансформированном растении. То есть, нуклеиновые кислоты, кодирующие белки сайт-направленных нуклеаз, можно синтезировать, применяя предпочтительные для данного растения кодоны для улучшения их экспрессии. См.,
15 например, в Campbell и Gowri (Plant Physiol. 92:1-11, 1990) обсуждение применения предпочтительных для данного хозяина кодонов. В данной области техники доступны способы синтеза предпочтительных для данного растения генов. См., например, патенты США № 5380831 и 5436391, и Murray и др., Nucleic Acids Res. 17:477-498, 1989. См. также, например, Lanza и др., ВМС Systems Biology 8:33-43, 2014; Burgess-Brown и др., Protein
20 Expr. Purif. 59:94-102, 2008; Gustafsson и др., Trends Biotechnol 22:346-353, 2004.
[0156] Кроме того, в последовательности нуклеиновых кислот, описанные в данной заявке, можно ввести другие модификации. Например, известны дополнительные модификации последовательности для повышения уровня экспрессии гена в клетке-хозяине. Такие модификации включают исключение последовательностей, кодирующих
25 ложные сигналы полиаденилирования, сигналы сайтов сплайсинга экзонов/интронов, подобные транспозонам повторы и другие подобные хорошо изученные последовательности, которые могут мешать экспрессии генов. Содержание G-C в последовательности также можно отрегулировать до уровней, нормальных для целевой клетки-хозяина, которые рассчитывают, опираясь на известные гены, экспрессируемые в
30 клетке-хозяине. Кроме того, последовательность можно модифицировать, чтобы избежать образования предсказанных шпилечных вторичных структур мРНК.
[0157] Другие последовательности нуклеиновых кислот также можно применять для получения конструкций согласно настоящему описанию, например, для повышения экспрессии последовательности, кодирующей сайт-направленную нуклеазу. Такие
последовательности нуклеиновых кислот включают интрон 1 из гена AdhI маиса (Callis и др., Genes and Development 1:1183-1200, 1987) и лидерные последовательности (W-последовательность) из вируса табачной мозаики (TMV), вируса хлоротической пятнистости маиса и вируса мозаики люцерны (Gallie и др., Nucleic Acid Res. 15:8693-8711, 5 1987; и Skuzeski и др., Plant Mol. Biol. 15:65-79, 1990). Было показано, что первый интрон из локуса shrunken-1 маиса повышает экспрессию генов в химерных генетических конструкциях. В патентах США под номерами 5424412 и 5593874 описано применение определенных интронов в конструкциях для экспрессии генов, и Gallie и др. (Plant Physiol. 106:929-939, 1994) также показали, что интроны можно применять для регуляции
10 экспрессии генов на тканеспецифической основе. Для дополнительного усиления или для оптимизации экспрессии гена сайт-направленной нуклеазы векторы экспрессии в растениях, описанные в данной заявке, также могут содержать последовательности ДНК, содержащие участки прикрепления к ядерному матриксу (MAR). Клетки растения, трансформированные с помощью таких модифицированных систем экспрессии, затем
15 могут осуществлять сверхэкспрессию или конститутивную экспрессию последовательности нуклеотидов согласно настоящему описанию.
[0158] Экспрессионные конструкции, описанные в данной заявке, также могут содержать последовательности нуклеиновых кислот, способные направлять экспрессию последовательности сайт-направленной нуклеазы в хлоропласт или другие органеллы и
20 структуры как в прокариотах, так и в эукариотах. Такие последовательности нуклеиновых кислот включают нацеливающие на хлоропласт последовательности, которые кодируют транзитный пептид хлоропласта, чтобы направлять продукт интересующего гена в хлоропласта клетки растения. Такие транзитные пептиды известны в данной области техники. По отношению к нацеливающим на хлоропласт последовательностям
25 "функционально связанный" означает, что указанная последовательность нуклеиновой кислоты, кодирующая транзитный пептид (т.е. нацеливающая на хлоропласт последовательность), соединена с молекулами нуклеиновых кислот сайт-направленной нуклеазы, описанными в данной заявке, таким образом, что две указанные последовательности непрерывны и находятся в одной рамке считывания. См., например,
30 Von Heijne и др., Plant Mol. Biol. Rep. 9:104-126, 1991; Clark и др., J. Biol. Chem. 264:1754417550, 1989; Della-Cioppa и др., Plant Physiol. 84:965-968, 1987; Romer и др., Biochem. Biophys. Res. Commun. 196:1414-1421, 1993; и Shah и др., Science 233:478-481, 1986.
[0159] Нацеливающие на хлоропласт последовательности известны в данной области техники и включают малую субъединицу рибулоза-1,5-бисфосфаткарбоксилазы (Rubisco)
хлоропласта (de Castro Silva Filho и др., Plant Mol. Biol. 30:769-780, 1996; Schnell и др., J. Biol. Chem. 266(5):3335-3342, 1991); 5-(енолпирувил)шикимат-3-фосфатсинтазу (EPSPS) (Archer и др., J. Bioenerg. Biomemb. 22(6):789-810, 1990); триптофансинтазу (Zhao и др., J. Biol. Chem. 270(1 1):6081- 6087, 1995); пластоцианин (Lawrence и др., J. Biol. Chem. 5 272(33):20357-20363, 1997); хоризматсинтазу (Schmidt и др., J. Biol. Chem. 268(36):27447-27457, 1993); и белок, связывающий поглощающий свет хлорофилл a/b (LHBP) (Lamppa и др., J. Biol. Chem. 263:14996-14999, 1988). См. также Von Heijne и др., Plant Mol. Biol. Rep. 9:104-126, 1991; Clark и др., J. Biol. Chem. 264:17544-17550, 1989; Della-Cioppa и др., Plant Physiol. 84:965-968, 1987; Romer и др., Biochem. Biophys. Res. Commun. 196:1414-1421, 10 1993; и Shah и др., Science 233 :478-481, 1986.
[0160] В сочетании с любым из аспектов, вариантов реализации, способов и/или композиций, описанных в данной заявке, конструкции нуклеиновых кислот можно получить таким образом, чтобы направить экспрессию мутантной последовательности, кодирующей сайт-направленную нуклеазу, из хлоропласта клетки растения. Способы
15 трансформации хлоропластов известны в данной области техники. См., например, Svab и др., Proc. Nat'l. Acad. Sci. USA 87:8526-8530, 1990; Svab nMaliga, Proc. Nat'l. Acad. Sci. USA 90:913-917, 1993; Svab и Maliga, EMBO J. 12:601-606, 1993. Способ основан на доставке с помощью биобаллистической пушки ДНК, содержащей селектируемый маркер, и нацеливании данной ДНК на пластидный геном посредством гомологичной рекомбинации.
20 Кроме того, трансформацию пластиды можно осуществить путем трансактивации молчащего трансгена, котрый несет пластида, посредством предпочитаемой данной тканью экспрессии кодируемой ядром и направленной в пластиду РНК-полимеразы. Такая система была описана в McBride и др. Proc. Nat'l. Acad. Sci. USA 91:7301-7305, 1994.
[0161] Интересующие нуклеиновые кислоты, которые нужно направить в хлоропласт, 25 можно оптимизировать, чтобы они экспрессировались в хлоропласте, чтобы учесть различия в использовании кодонов между ядром растения и данной органеллой. Таким образом, интересующие нуклеиновые кислоты можно синтезировать, применяя предпочитаемые хлоропластом кодоны. См., например, патент США № 5380831, который включен в данную заявку посредством ссылки.
30 [0162] Конструкции нуклеиновых кислот можно применять для трансформации клеток растения и воспроизведения трансгенных растений, содержащих последовательности, кодирующие сайт-направленную нуклеазу. Доступно множество векторов для трансформации растений и способов трансформации растений. См., например, патент США № 6753458, An, G. и др., Plant Physiol., 81:301-305, 1986; Fry, J. и др., Plant Cell Rep. 6:321
325, 1987; Block, M., Theor. Appl Genet. 76:767-774, 1988; Hinchee и др., Stadler. Genet. Symp,203212,203-212, 1990; Cousins и др., Aust. J. Plant Physiol. 18:481-494, 1991; Chee, P. P. и Slightom, J. L., Gene,l 18:255-260, 1992; Christou и др., Trends. Biotechnol. 10:239-246, 1992; DUalluinHAp.,Bio/Technol. 10:309-3 14, 1992; Dhir и др., Plant Physiol. 99:81-88, 1992; 5 Casas и др., Proc. Nat'l. Acad Sci. USA 90:11212-11216, 1993; Christou, P., In Vitro Cell. Dev. Biol.-Plant 29P:1 19-124, 1993; Davies, и др., Plant Cell Rep. 12:180-183, 1993; Dong, J. А. и McHughen, A., Plant Sci. 91:139-148, 1993; Franklin, С. I. и Trieu, T. N., Plant. Physiol. 102:167, 1993; Golovkin и др., Plant Sci. 90:41-52, 1993; Guo Chin Sci. Bull. 38:2072-2078; Asano, и др., Plant Cell Rep. 13, 1994; Ayeres N. M. и Park, W. D., Crit. Rev. Plant. Sci. 13:219-239, 1994;
10 Barcelo и др., Plant. J. 5:583-592, 1994; Becker, и др., Plant. J. 5:299-307, 1994; Borkowska и др., Acta. Physiol Plant. 16:225- 230, 1994; Christou, P., Agro. Food. Ind. Hi Tech. 5:17-27, 1994; Eapen и др., Plant Cell Rep. 13:582-586, 1994; Hartman и др., Bio-Technology 12:919923, 1994; Ritala и др., Plant. Mol. Biol. 24:317-325, 1994; и Wan, Y. С. и Lemaux, P. G., Plant Physiol. 104:3748, 1994. Клетки растения также можно трансформировать указанными
15 конструкциями, применяя гомологичную рекомбинацию.
[0163] Термин "дикого типа", когда он употребляется по отношению к пептидной последовательности и нуклеотидной последовательности, относится к пептидной последовательности и нуклеотидной последовательности (локусу/гену/аллелю), соответственно, которая обладает свойствами такой пептидной последовательности и
20 нуклеотидной последовательности, выделенной из встречающегося в природе источника. Пептидная последовательность и нуклеотидная последовательность дикого типа представляет собой такую последовательность, которая наиболее часто встречается в популяции и, таким образом, произвольно обозначается как "нормальная" форма последовательности или пептидная последовательность и нуклеотидная
25 последовательность "дикого типа", соответственно. "Дикого типа" также может относиться к последовательности в определенном положении или положениях нуклеотида, или к последовательности в определенном положении или положениях кодона, или к последовательности в определенном положении или положениях аминокислоты.
[0164] "Консенсусная последовательность" представляет собой последовательность 30 аминокислот или нуклеотидов, которая содержит идентичные аминокислоты или нуклеотиды, или функционально эквивалентные аминокислоты или нуклеотиды, в по меньшей мере 25% указанной последовательности. Идентичные или функционально эквивалентные аминокислоты или нуклеотиды не обязательно должны быть непрерывными.
[0165] Термин "Brassica" в данной заявке относится к растениям рода капусты. Примеры видов Brassica включают, но не ограничены перечисленными: В. carinata, В. elongate, В. fruticulosa, В. juncea, В. парт, В. narinosa, В. nigra, В. oleracea, В. perviridis, В. гора (синоним В. campestris), В. rupestris, В. septiceps и В. tournefortii.
5 [0166] Нуклеооснование представляет собой основание, которое в некоторых предпочтительных вариантах реализации представляет собой пурин, пиримидин или их производное или аналог. Нуклеозиды представляют собой нуклеооснования, которые содержат пентозафуранозильную группу, например, возможно содержащий заместители рибозид или 2'-дезоксирибозид. Нуклеозиды могут быть соединены одной из нескольких 10 связывающих молекул, которые могут содержать или могут не содержать фосфор. Нуклеозиды, которые соединены не содержащими заместителей фосфодиэфирными связями, называют нуклеотидами. Термин "нуклеооснование" в данной заявке включает пептидные нуклеооснования, субъединицы пептидных нуклеиновых кислот и морфолиновые нуклеооснования, а также нуклеозиды и нуклеотиды.
15 [0167] Олигонуклеооснование представляет собой полимер, содержащий нуклеооснования; в некоторых вариантах реализации по меньшей мере его часть может гибридизоваться путем спаривания оснований по Уотсону-Крику с ДНК, обладающей комплементарной последовательностью. Цепь олигонуклеооснований может содержать один 5' - и один 3'-конец, которые представляют собой крайние нуклеооснования полимера.
20 Конкретная цепь олигонуклеооснований может содержать нуклеооснования всех типов. Олигонуклеооснование представляет собой соединение, содержащее одну или более цепей олигонуклеооснований, которые могут быть комплементарны и гибридизованы путем спаривания оснований по Уотсону-Крику. Нуклеооснования рибо-типа включают содержащие пентозафуранозил нуклеооснования, где 2'-атом углерода представляет собой
25 метилен, содержащий в качестве заместителя гидроксил, алкилокси или галоген. Нуклеооснования дезоксирибо-типа представляют собой нуклеооснования, отличные от нуклеооснований рибо-типа, и включают все нуклеооснования, которые не содержат пентозафуранозильную группу.
[0168] В некоторых вариантах реализации цепь олигонуклеооснования может включать 30 как цепи олигонуклеооснований, так и фрагменты или участки цепей олигонуклеооснований. У цепи олигонуклеооснований может быть 3'-конец и 5'-конец, и если цепь олигонуклеооснований имеет одинаковую протяженность с цепью, то 3'- и 5'-концы цепи также представляют собой 3' - и 5'-концы цепи.
[0169] В данном тексте термин "кодон" относится к последовательности, состоящей из трех соседних нуклеотидов (либо РНК, либо ДНК), представляющей собой генетический код, который определяет вставку конкретной аминокислоты в полипептидную цепь в процессе синтеза белка или представляет собой сигнал остановки синтеза белка. Термин 5 "кодон" также применяют по отношению к соответствующим (и комплементарным) последовательностям из трех нуклеотидов в информационной РНК, в которые транскрибируется исходная ДНК.
[0170] В данном тексте термин "гомология" относится к подобию последовательностей среди белков и ДНК. Термин "гомология" или "гомологичный" относится к степени 10 идентичности. Может наблюдаться как частичная гомология, так и полная гомология. Частично гомологичная последовательность представляет собой такую последовательность, которая менее чем на 100% идентична другой последовательности.
[0171] "Гетерозиготный" относится к нахождению различных аллелей в одном или более генетических локусах на гомологичных фрагментах хромосом. В данной заявке
15 "гетерозиготный" также может относиться к образцу, клетке, популяции клеток или организму, в котором можно обнаружить различные аллели в одном или более генетических локусах. Гетерозиготные образцы также можно определить с помощью способов, известных в данной области техники, таких как, например, секвенирование нуклеиновых кислот. Например, если на электроферограмме секвенирования выявляют два
20 пика в одном локусе и оба пика приблизительно одинакового размера, то образец можно охарактеризовать как гетерозиготный. Или если один пик меньше, чем другой, но составляет по меньшей мере приблизительно 25% от размера большего пика, то образец можно охарактеризовать как гетерозиготный. В некоторых вариантах реализации меньший пик составляет по меньшей мере приблизительно 15% от размера большего пика. В других
25 вариантах реализации меньший пик составляет по меньшей мере приблизительно 10% от размера большего пика. В других вариантах реализации меньший пик составляет по меньшей мере приблизительно 5% от размера большего пика. В других вариантах реализации обнаружен минимальный размер меньшего пика.
[0172] В данном тексте "гомозиготный" относится к нахождению идентичных аллелей в 30 одном или более генетических локусах на гомологичных фрагментах хромосом. "Гомозиготный" также относится к образцу, клетке, популяции клеток или организму, в котором можно обнаружить одинаковые аллели в одном или более генетических локусах. Гомозиготные образцы можно определить с помощью способов, известных в данной области техники, таких как, например, секвенирование нуклеиновых кислот. Например,
если на электроферограмме секвенирования выявляют одиночный пик в конкретном локусе, то образец можно назвать "гомозиготным" по отношению к данному локусу.
[0173] Термин "гемизиготный" относится к гену или фрагменту гена, присутствующему только однократно в генотипе клетки или организма, потому что второй аллель удален или 5 отсутствует на гомологичном фрагменте хромосомы. В данном тексте "гемизиготный" также может относиться к образцу, клетке, популяции клеток или организму, в котором аллель в одном или более генетических локусах можно обнаружить только однократно в генотипе.
[0174] Термин "статус зиготности" в данном тексте относится к образцу, популяции 10 клеток или организму, являющемуся гетерозиготным, гомозиготным или гемизиготным, что определяют с помощью способов тестирования, известных в данной области техники и описанных в данной заявке. Термин "статус зиготности нуклеиновой кислоты" означает определение того, является ли источник нуклеиновой кислоты гетерозиготным, гомозиготным или гемизиготным. "Статус зиготности" может относиться к различиям в 15 одном положении нуклеотида в последовательности. В некоторых способах статус зиготности образца по отношению к единичной мутации можно классифицировать как гомозиготность по дикому типу, гетерозиготность (т.е. одна аллель дикого типа и одна мутантная аллель), гомозиготность по мутации или гемизиготность (т.е. одна копия либо аллели дикого типа, либо мутантной аллели).
20 [0175] В данном тексте термин "RTDS" относится к системе быстрой доставки признака(tm) (RTDS), разработанной в Cibus. RTDS представляет собой систему сайт-специфической модификации генов, то есть эффективную для внесения точных изменений в последовательность гена без включения чужеродных генов или регуляторных последовательностей.
25 [0176] Термин "приблизительно" в данном тексте означает в количественном выражении плюс или минус 10%. Например, в объем термина "приблизительно 3%" будет входить 2,7 - 3,3% и в объем термина "приблизительно 10%" будет входить 9 - 11%. Более того, если термин "приблизительно" используется в данном тексте в сочетании с количественным показателем, должно быть очевидно, что дополнительно к значению плюс или минус 10%,
30 точное значение количественного показателя также предусмотрено и описано. Например, термин "приблизительно 3%" в явной форме предусматривает, описывает и включает точно 3%.
[0177] RTDS и репарационные олигонуклеотиды (GRON)
[0178] Настоящее описание в общем смысле относится к новым способам улучшения эффективности направленного модифицирования определенных положений в геномных или других последовательностях нуклеотидов. Кроме того, настоящее описание относится к целевой ДНК, которую модифицировали, мутировали или пометили с помощью 5 подходов, описанных в данной заявке. Настоящее описание также относится к клеткам, ткани и организмам, которые были модифицированы с помощью способов согласно настоящему описанию. Настоящее описание основывается на разработке композиций и способов, отчасти относящихся к успешной системе трансформации - системе быстрой доставки признака (RTDS(tm), Cibus US LLC).
10 [0179] RTDS основана на изменении целевого гена путем применения собственной системы репарации генов клетки для специфичной модификации последовательности гена in situ без вставки чужеродной ДНК и последовательностей, регулирующих экспрессию генов. Данная процедура позволяет осуществить точную замену в генетической последовательности, при этом остальной геном остается неизменным. В
15 противоположность обычным трансгенным ГМО, при данном способе не происходит встраивания чужеродного генетического материала, а также не остается никакого чужеродного генетического материала в растении. Изменения в генетической последовательности, введенные с помощью RTDS, вводятся не произвольно. Поскольку задействованные гены остаются в нативном положении, не возникает случайных,
20 неконтролируемых или неблагоприятных паттернов экспрессии.
[0180] RTDS, который осуществляет данную замену, представляет собой химически синтезированный олигонуклеотид (GRON), описанный в данной заявке, который может состоять как из оснований ДНК, так и из модифицированных оснований РНК, а также из других химических молекул, и RTDS разработан таким образом, чтобы он гибридизовался
25 в целевом генетическом положении для получения несовпадающей пары оснований (пар оснований). Такая несовпадающая пара оснований выступает в роли сигнала для привлечения собственной естественной системы репарации генов клетки в данный сайт и исправления (замены, вставки или делеций) указанного нуклеотида(ов) в данном гене. После завершения процесса редактирования молекула RTDS деградирует, и вновь
30 модифицированный или репарированный ген экспрессируется под контролем нормальных эндогенных для него механизмов.
[0181] Способы и композиции, описанные в данной заявке, можно осуществить или сделать с помощью "олигонуклеооснований для репарации генов" (GRON) с конформациями и химическими составами, подробно описанными в данном тексте и ниже.
"Олигонуклеооснования для репарации генов", представленные в данной заявке, также
были описаны в опубликованной научной и патентной литературе с использованием других
названий, включая "рекомбинагенные олигонуклеооснования"; "химерные
олигонуклеотиды РНК/ДНК"; "химерные олигонуклеотиды"; "смешанные дуплексные
5 олигонуклеотиды" (MDON); "РНК/ДНК олигонуклеотиды (RDO)"; "нацеленные на гены
олигонуклеотиды"; "генопласты"; "одноце почечные модифицированные
олигонуклеотиды"; "одноцепочечные олигодезоксинуклеотидные мутационные векторы" (SSOMV); "дуплексные мутационные векторы" и "гетеродуплексные мутационные векторы". Олигонуклеооснование для репарации генов можно ввести в клетку растения, 10 применяя любой способ, широко используемый в данной области техники, включая, но не ограничиваясь перечисленными: микроносители (биолистическую доставку), микроволокна, опосредованное полиэтиленгликолем (ПЭГ) поглощение, электропорацию и микроинъекцию.
[0182] В одном варианте реализации олигонуклеооснование для репарации генов
15 представляет собой смешанные дуплексные олигонуклеотиды (MDON), при этом нуклеотиды РНК-типа смешанного дуплексного олигонуклеотида делают устойчивыми к РНКазе путем замены 2'-гидроксила на функциональную группу фтора, хлора или брома или путем добавления заместителя для 2'-0. Подходящие заместители включают заместители, описанные в Kmiec П. Альтернативные заместители включают заместители,
20 описанные в патенте США номер 5334711 (Sproat), и заместители, описанные в публикациях патентов ЕР 629 387 и ЕР 679 657 (в совокупности, Martin Applications), которые настоящим включены в данную заявку посредством ссылки. В данном тексте производное рибонуклеотида с 2'-фтором, хлором или бромом или рибонуклеотид, в котором 2'-ОН замещена на заместитель, описанный в Martin Applications или Sproat,
25 называют "2'-замещенным рибонуклеотид ом". В данном тексте термин "нуклеотид РНК-типа" означает 2'-гидроксил или 2'-замещенный нуклеотид, который соединен с другими нуклеотидами смешанного дуплексного олигонуклеотида посредством не содержащей заместители фосфодиэфирной связи или любых из искусственных средств соединения, описанных в Kmiec I или Kmiec П. В данном тексте термин "нуклеотид дезоксирибо-типа"
30 означает нуклеотид, содержащий 2'-Н, который может быть соединен с другими нуклеотидами олигонуклеооснования для репарации генов посредством не содержащей заместители фосфодиэфирной связи или любого из искусственных средств соединения, описанных в Kmiec I или Kmiec П.
[0183] В некотором варианте реализации настоящего описания олигонуклеооснование для репарации генов представляет собой смешанный дуплексный олигонуклеотид (MDON), который соединен исключительно не содержащими заместителей фосфодиэфирными связями. В альтернативных вариантах реализации сединение осуществляется посредством 5 содержащих заместители фосфодиэфиров, фосфодиэфирных производных и мостиков, не основанных на фосфоре, описанных в Kmiec П. В еще одном варианте реализации каждый нуклеотид РНК-типа в смешанном дуплексном олигонуклеотиде представляет собой 2'-замещенный нуклеотид. Особенно предпочтительные варианты реализации 2'-замещенных рибонуклеотидов представляют собой рибонуклеотиды, содержащие в качестве
10 заместителей 2'-фтор, 2'-метокси, 2'-пропилокси, 2'-алилокси, 2'-гидроксиэтилокси, 2'-метоксиэтилокси, 2'-фторпропилокси и 2'-трифторпропилокси. Более предпочтительные варианты реализации 2'-замещенных рибонуклеотидов представляют собой рибонуклеотиды, содержащие в качестве заместителей 2'-фтор, 2'-метокси, 2'-метоксиэтилокси и 2'-алилокси. В другом варианте реализации смешанный дуплексный
15 олигонуклеотид соединен не содержащими заместителей фосфодиэфирными связями.
[0184] Хотя смешанные дуплексные олигонуклеотиды (MDON), содержащие лишь один тип 2'-замещенного нуклеотида РНК-типа, более удобно синтезировать, способы согласно настоящему описанию можно осуществить со смешанными дуплексными олигонуклеотидами, содержащими два или более типов нуклеотидов РНК-типа. Функция
20 фрагмента РНК может остаться не затронутой после прерывания, вызванного внедрением дезоксинуклеотида между двумя тринуклеотидами РНК-типа, соответственно, в объем термина фрагмент РНК входит такой "прерванный фрагмент РНК". Не прерванный фрагмент РНК называют непрерывным фрагментом РНК. В альтернативном варианте реализации фрагмент РНК может содержать чередующиеся устойчивые к РНКазе и не
25 содержащие заместители 2'-ОН нуклеотиды. Смешанные дуплексные олигонуклеотиды в некоторых вариантах реализации состоят из менее чем 100 нуклеотидов и в других вариантах реализации состоят из менее чем 85 нуклеотидов, но более чем 50 нуклеотидов. Первая и вторая цепи спарены по Уотсону-Крику. В одном варианте реализации цепи смешанного дуплексного олигонуклеотида ковалентно связаны посредством линкера,
30 такого как одноцепочечной гекса-, пента- или тетрануклеотид, таким образом, что первая и вторая цепи являются фрагментами одной олигонуклеотидной цепи, содержащей один 3'-и один 5'-конец. 3'- и 5'-концы могут быть защищены путем добавления "шпилечного кэпа", посредством чего 3'- и 5'-концевые нуклеотиды спарены по Уотсону-Крику с соседними нуклеотидами. Кроме того, можно поместить второй шпилечный кэп в место
соединения между первой и второй цепями в отдалении от 3'- и 5'-концов, чтобы стабилизировать спаривание по Уотсону-Крику между первой и второй цепями.
[0185] Первая и вторая цепи содержат два участка, которые гомологичны двум фрагментам целевого гена/аллели, т.е., обладают одинаковыми последовательностями с 5 целевым геном/аллелью. Гомологичный участок содержит нуклеотиды фрагмента РНК и может содержать один или более нуклеотидов ДНК-типа из соединительного фрагмента ДНК, а также может содержать нуклеотиды ДНК-типа, которые не находятся внутри внедренного фрагмента ДНК. Две области гомологии разделены, и каждая расположена рядом с областью, последовательность которой отличается от последовательности целевого
10 гена, названной "гетерологичным участком". Гетерологичный участок может содержать один, два или три несовпадающих нуклеотида. Несовпадающие нуклеотиды могут быть непрерывными или в качестве альтернативы могут быть разделены одним или двумя нуклеотидами, которые гомологичны целевому гену/аллели. В качестве альтернативы гетерологичный участок также может содержать вставку одного, двух, трех или пяти или
15 меньшего количества нуклеотидов. В качестве альтернативы последовательность смешанного дуплексного олигонуклеотида может отличаться от последовательности целевого гена/аллели лишь делецией одного, двух, трех или пяти или меньшего количества нуклеотидов из смешанного дуплексного олигонуклеотида. В данном случае считают, что длина и положение гетерологичного участка представляет собой длину делеций, даже если
20 ни одного нуклеотида смешанного дуплексного олигонуклеотида не находится внутри гетерологичного участка. Расстояние между фрагментами целевого гена, которые комплементарны двум гомологичным участкам, идентично длине гетерологичного участка, в котором предполагается замена или замены. Если гетерологичный участок содержит вставку, то она разделяет гомологичные участки в смешанном дуплексном
25 олигонуклеотиде на большее расстояние, чем их комплементарные гомологичные фрагменты находятся в гене/аллели, и обратное справедливо, когда гетерологичный участок кодирует делецию.
[0186] Каждый из фрагментов РНК смешанных дуплексных олигонуклеотидов является частью гомологичного участка, т.е., участка последовательности, который идентичен 30 фрагменту целевого гена, и данные фрагменты РНК совместно в некоторых вариантах реализации содержат по меньшей мере 13 нуклеотидов РНК-типа, и в некоторых вариантах реализации от 16 до 25 нуклеотидов РНК-типа, или в еще других вариантах реализации 18 - 22 нуклеотида РНК-типа, или в некоторых вариантах реализации 20 нуклеотидов. В одном варианте реализации фрагменты РНК гомологичных участков разделены и расположены
рядом, т.е., "соединены" внедренным фрагментом ДНК. В одном варианте реализации каждый нуклеотид гетерологичного участка представляет собой нуклеотид внедренного фрагмента ДНК. Внедренный фрагмент ДНК, который содержит гетерологичный участок смешанного дуплексного олигонуклеотида, называют "мутаторным фрагментом".
5 [0187] В другом варианте реализации настоящего описания олигонуклеооснование для репарации генов (GRON) представляет собой одноцепочечной олигодезоксинуклеотидный мутационный вектор (SSOMV), такой как описанный в международной заявке на патент PCT7USOO/23457, в патентах США под номерами 6271360, 6479292 и 7060500, которые полностью включены посредством ссылки. Последовательность SSOMV основана на тех
10 же принципах, что и мутационные векторы, описанные в патентах США под номерами 5756325; 5871984; 5760012; 5888983; 5795972; 5780296; 5945339; 6004804 и 6010907 и в международных публикациях под номерами WO 98/49350; WO 99/07865; WO 99/58723; WO 99/58702 и WO 99/40789. Последовательность SSOMV содержит два участка, которые гомологичны целевой последовательности, разделенные участком, который содержит
15 желательные генетические изменения, называемым мутаторным участком. Последовательность мутаторного участка может иметь ту же длину, что и последовательность, которая разделяет гомологичные участки в целевой последовательности, но обладает другой последовательностью. Такой мутаторный участок может вызывать замену. В качестве альтернативы гомологичные участки в SSOMV могут
20 непрерывно следовать друг за другом, тогда как участки в целевом гене, обладающие одинаковыми последовательностями, могут быть разделены одним, двумя или более нуклеотидами. Такой SSOMV вызывает делецию в целевом гене нуклеотидов, которые отсутствуют в SSOMV. Наконец, последовательность целевого гена, которая идентична гомологичным участкам, может быть непрерывна в целевом гене, но разделена одним,
25 двумя или более нуклеотидами в последовательности SSOMV. Такой SSOMV вызывает вставку в последовательность целевого гена. В некоторых вариантах реализации SSOMV не гибридизуется сам с собой.
[0188] Нуклеотиды SSOMV представляют собой дезоксирибонуклеотиды, которые соединены немодифицированными фосфодиэфирными связями за исключением того, что 30 З'-концевая и/или 5'-концевая межнуклеотидные связи или, в качестве альтернативы две 3'-концевые и/или 5'-концевые межнуклеотидные связи могут представлять собой фосфоротиоат или фосфороамидат. В данной заявке межнуклеотидная связь представляет собой связь между нуклеотидами SSOMV и не включает связь между 3'-концом нуклеотида или 5'-концом нуклеотида и блокирующим заместителем. В конкретном варианте
реализации длина SSOMV составляет 21-55 дезоксинуклеотидов, и общая длина участков гомологии, соответственно, составляет по меньшей мере 20 дезоксинуклеотидов, и длина каждого из по меньшей мере двух участков гомологии должна составлять по меньшей мере 8 дезоксинуклеотидов.
5 [0189] SSOMV может быть сконструирован таким образом, чтобы он был комплементарным либо кодирующей, либо некодирующей цепи целевого гена. Если желательная мутация представляет собой замену одного основания, предпочтительно, чтобы как мутаторный нуклеотид, так и целевой нуклеотид представляли собой пиримидин. В тех случаях, когда это соответствует достижению требуемого функционального 10 результата, предпочтительно, чтобы как мутаторный нуклеотид, так и целевой нуклеотид в комплементарной цепи представляли собой пиримидины. Особенно предпочтительными являются SSOMV, которые кодируют трансверсионные мутации, то есть мутаторный нуклеотид С или Т не сопряжен, соответственно, с нуклеотидом С или Т в комплементарной цепи.
15 [0190] Конструирование фрагмента Оказаки/2'-ОМЕ GRON. В различных вариантах реализации GRON может содержать как РНК-, так и ДНК-нуклеотиды и/или другие типы нуклеооснований. В некоторых вариантах реализации один или более из ДНК- или РНК-нуклеотидов включают модификацию. В некоторых вариантах реализации первый 5'-нуклеотид представляет собой РНК-нуклеотид и остальные нуклеотиды представляют
20 собой ДНК-нуклеотиды. В других дополнительных вариантах реализации первый 5'-РНК-нуклеотид модифицирован 2-О-Ме. В других вариантах реализации первые два, три, четыре, пять, шесть, семь, восемь, девять, десять или более 5'-нуклеотидов представляют собой РНК-нуклеотиды и остальные нуклеотиды представляют собой ДНК-нуклеотиды. В других дополнительных вариантах реализации один или более из первых двух, трех,
25 четырех, пяти, шести, семи, восьми, девяти, десяти или более 5'-РНК-нуклеотидов модифицированы 2-О-Ме. В клетках растений двухцепочечные разрывы в ДНК обычно репарируются путем репарации ДНК - НГСК. В данном пути не требуется матрица для репарации ДНК и, следовательно, он склонен к ошибкам. Преимущество применения данного пути для репарации ДНК в клетке растения состоит в том, что этот путь быстрый,
30 распространенный и, что наиболее важно, может происходить в то время, когда в клетке не происходит репликация ДНК. Другой путь репарации ДНК, который осуществляет репарацию двухцепочечных разрывов за пределами репликативной вилки в клетках растений, называется гомологичной рекомбинацией (ГР); тем не менее, в отличие от пути НГСК, данный тип репарации точный и требует использования матрицы ДНК (GRON).
Поскольку данные GRON имитируют фрагменты Оказаки в ДНК-репликативной вилке целевых генов, их применение с агентом для разрезания двухцепочечной ДНК не очевидно для специалистов в данной области.
[0191] Повышение эффективности
[0192] В настоящем описании предложено множество подходов для повышения эффективности изменения целевого гена с применением репарационных олигонуклеотидов, которые можно применять отдельно или в комбинации друг с другом. Такие подходы включают:
1. Введение в репарационные олигонуклеотиды модификаций, которые привлекают аппарат репарации ДНК к целевому (несовпадающему) сайту.
A. Включение одного или более сайтов с удаленными основаниями в олигонуклеотид (например, в пределах 10 оснований, и в некоторых вариантах реализации с 5 основаниями желательного участка несовпадения) создает повреждение, которое является переходным при эксцизионной репарации оснований (ЭРО), и которое привлекает аппарат ЭРО в окрестность сайта, подлежащего изменению с помощью олигонуклеотида для репарации. Модифицированные олигонуклеотиды dSpacer (фуран с удаленным основанием) можно получить, как описано, например, в Takeshita и др., J. Biol. Chem., 262:10171-79, 1987.
B. Включение соединений, которые вызывают одно- или двухцепочечные разрывы, либо внутрь олигонуклеотида, либо вместе с олигонуклеотидом, вызывает повреждение, которое репарируется с помощью НГСК, опосредованного микрогомологией соединения концов (ОМСК) и гомологичной рекомбинации. В качестве примера, антибиотики из семейства блеомицина, нуклеазы с цинковыми пальцами, Fokl (или любой класс ферментов рестрикции типа IIS) и другие нуклеазы можно ковалентно соединить с 3'- или 5'-концами олигонуклеотидов для репарации, чтобы ввести двухцепочечные разрывы вблизи сайта, на изменение которого направлен олигонуклеотид для репарации. Антибиотики из семейства блеомицина представляют собой разрезающие ДНК гликопептиды, которые включают блеомицин, зеоцин, флеомицин, таллисомицин, пеплеомицин и другие антибиотики.
C. Включение в олигонуклеотид одного или более 8'-оксо-ёА или -dG (например, в пределах 10 оснований, и в некоторых вариантах реализации с 5 основаниями
желательного участка несовпадения) создает повреждение, которое аналогично повреждениям, вызываемым активными формами кислорода. Данные повреждения индуцируют так называемую систему "репарации выталкивания". См., например, Kim и др., J. Biochem. Mol. Biol. 37:657-62, 2004.
Повышение стабильности репарационных олигонуклеотидов:
Включение перевернутого основания (idC) в 3'-конец олигонуклеотида для получения 3'-блокированного конца на олигонуклеотиде для репарации.
Включение одного или более 2'-0-метил-нуклеотидов или оснований, которые повышают энергию гибридизации (см., например, WO2007/073149) в 5'- и/или 3'-конец олигонуклеотида для репарации.
Включение одного или множества 2'-0-метил-РНК-нуклеотидов в 5'-конец олигонуклеотида для репарации, что приводит к получению оснований ДНК, которые создают желательный сайт несовпадения, в результате чего образуется подобная фрагменту Оказаки структура нуклеиновой кислоты.
Конъюгирование (с 5'- или 3'-концом) интеркалирующих красителей, таких как акридин, псорален, бромистый этидий и красители Syber.
Добавление 5'-концевого кэпа, такого как Т/А зажим, молекулы холестерина, SFMA (HEX), riboC и амидита.
Модифицирование остова, например, посредством фосфотиоата, 2'-О метила, метилфосфонатов, запертой нуклеиновой кислоты (ЗНК), МОЕ (метоксиэтила), ди-PS и пептидной нуклеиновой кислоты (ПНК).
Перекрестное сшивание олигонуклеотида для репарации, например, с помощью реагентов внутрицепочечного перекрестного сшивания, таких как цисплатин и митомицин С.
Конъюгирование с флуоресцентными красителями, такими как СуЗ, DY547, СуЗ.5, СуЗВ, Су5 и DY647.
Повышение энергии гибридизации олигонуклеотида для репарации посредством включения оснований, которые повышают энергию гибридизации (см., например, WO2007/073149).
Повышение качества синтеза олигонуклеотида для репарации путем применения мультимеров (димеров, тримеров, тетрамеров и т.д.) нуклеотида в качестве строительных блоков для синтеза. В результате этого требуется меньшее
количество этапов соединения, и легче отделить полноразмерные продукты от строительных блоков.
5. Применение длинных репарационных олигонуклеотидов (т.е. длиной более чем
55 нуклеотидов, например, с такими длинами, которые описаны в данном тексте),
5 например, с одной или более мутациями или двумя или более мутациями, на
которые нацелен олигонуклеотид для репарации.
[0193] Примеры описанных выше подходов представлены в таблице 1.
Тип олигонуклеотида
Модификации
различные положения с 5'-и 3'-стороны от преобразущегося основания. 44-мер
Модификации остова
2'-ОМе
Тримеры
Амидиты тримера, СуЗ, idC
Репарация выталкивания
8'-OKCo-dA, 5' СуЗ, idC
Репарация выталкивания
8'-OKCo-dA, 5' СуЗ, idC
Двухцепочечной разрыв
Блеомицин
Кросслинкер
Цисплатин
Кросслинкер
Митомицин С
Фасилитаторы
супероснования с 5'- и 3'-стороны от преобразущегося олигонуклеотида
2-aMHHO-dA и 2-тио-Т
Суперолигонуклеотиды
2'-aMHHO-d, 5'-СуЗ, idC
Суперолигонуклеотиды
2-тио-Т, 5'-СуЗ, idC
Суперолигонуклеотиды
7-деаза-А, 5'-СуЗ, idC
Суперолигонуклеотиды
7-деаза-О, 5'-СуЗ, idC
Суперолигонуклеотиды
Пропанил-dC, 5'-СуЗ, idC
Интеркалирующие красители
5'-псорален/ЗЧс1С
Псорален, idC
Интеркалирующие красители
5'-бромистый этидий
Бромистый этидий
Интеркалирующие красители
5'-красители Syber
Красители Syber
Модификации 5'
5'-холестерин/ЗЧс1С
Холестерин
Двойная мутация
Длинный олигонуклеотид (55 и более оснований) w/ 2 мутации
Любая модификация
Модификации 5'
5'-SFMA HEX/3'-idC
SIM A HEX, idC
Тип олигонуклеотида
Модификации
Модификации остова
Метилф осф онаты
Модификации остова
знк
Модификации остова
МОЕ (метоксиэтил)
Замены СуЗ
СуЗ. 5
Замены СуЗ
Су5
Модификации остова
Ди-PS
Модификации 5'
riboC для nm ветви
Модификации остова
ПНК
Замены СуЗ
DY647
Модификации 5'
5'-ветвь
Симметричная ветвь амидит/idC
[0195] Перечисленные выше модификации также могут включать известные модификации нуклеотидов, такие как метилирование, 5'-интеркалирующие красители, модификации 5' - и 3'-концов, модификации каркаса, кросслинкеры, циклизацию и кэпы, и 5 замену одного или более из встречающихся в природе нуклеотидов на аналогичный, такой как инозин. Модификации нуклеотидов включают вставки акридина, амина, биотина, cascade blue, холестерина, СуЗ@ Су5@, Су5.5@, дабцила, дигоксигенина, динитрофенила, Edans, 6-FAM, флуоресцеина, З'-глицерила, HEX, IRD-700, IRD-800, JOE, фосфата псоралена, родамина, ROX, тиола (SH), спейсеров, TAMRA, ТЕТ, AMCA-S", SE, BODIPY0,
10 Marina Blue@, Pacific Blue@, Oregon Green@, родаминового зеленого@, родаминового красного@, Rhodol Green@ и техасского красного@. Модификации полинуклеотидного остова включают метилфосфонат, 2'-ОМе-метилфосфонат-РНК, фосфотиоат-РНК, 2'-ОМе-РНК. Модификации оснований включают 2-aMHHO-dA, 2-аминопурин, 3'-(ddA), З'-dA (кордицепин), 7-flea3a-dA, 8-Br-dA, 8-OKCO-dA, N6-Me-dA, сайт с удаленным основанием
15 (dSpacer), биотин-dT, 2'-ОМе-5Ме-С, 2'-ОМе-пропинил-С, 3'-(5-Me-dC), 3'-(ddC), 5-Br-dC, 5-1-duc, 5-Me-dC, 5-F-dC, карбокси-dT, обратимый dA, обратимый dC, обратимый dG, обратимый dT, обратимый dU, 7-flea3a-dG, 8-Br-dG, 8-OKCo-dG, 06-Me-dG, S6-,HHn-dG, 4-метилиндол, 5-нитроиндол, 2'-ОМе-инозин, 2'-dT, Об-фенил-dT, 4-метилиндол, 2'-дезоксинебуларин, 5-нитроиндол, 2-аминопурин, dP (аналог пурина), dK (аналог
20 пиримидина), 3-нитропиррол, 2-Tno-dT, 4-Tno-dT, биотин-dT, карбокси-dT, 04-Me-dT, 04-триазол-dT, 2'-ОМе-пропинил-и, 5-Br-dU, 2'-dU, 5-F-dU, 5-I-dU, 04-тpиaзoл-dU. В объем
указанных терминов также входят пептидные нуклеиновые кислоты (ПНК), аналог ДНК, в котором остов представляет собой псевдопептид, состоящий из единиц Тч[-(2-аминоэтил)-глицина вместо сахара. ПНК имитируют поведение ДНК и связываются с комплементарными цепями нуклеиновых кислот. Нейтральный остов ПНК приводит к 5 более сильному связыванию и большей специфичности, чем обычно достигаемая. Кроме того, уникальные химические, физические и биологические свойства ПНК применялись для получения эффективных биомолекулярных средств, антисмысловых и антигенных агентов, молекулярных зондов и биосенсоров.
[0196] Олигонуклеооснования могут содержать одноцепочечной(ые) разрыв(ы), гэп(ы), 10 модифицированные нуклеотиды, такие как модифицированные олигонуклеотидные остовы, нуклеотиды, лишенные азотистого основания, или другие химические молекулы. В дополнительном варианте реализации по меньшей мере одна цепь олигонуклеооснования содержит по меньшей мере один дополнительный модифицированный нуклеотид, например, 2'-0-метил-модифицированный нуклеотид, такой как МОЕ (метоксиэтил), 15 нуклеотид, содержащий 5'-фосфотиоатную группу, концевой нуклеотид, соединенный с холестерильным производным, 2'-дезокси-2'-фтор-модифицированный нуклеотид, 2'-дезокси-модифицированный нуклеотид, запертый нуклеотид, нуклеотид с удаленным основанием (нуклеооснование отсутствует или вместо него присутствует гидроксильная группа (см., например, Glen Research, http://www.glenresearch.com/GlenReports/GR21-20 14.html)), 2'-амино-модифицированный нуклеотид, 2'-алкил-модифицированный нуклеотид, морфолин-нуклеотид, фосфорамидит и нуклеотид, содержащий искусственное основание. Сюда также включены различные соли, смешанные соли и свободные кислоты.
[0197] Предпочтительные модифицированные олигонуклеотидные остовы включают, например, фосфотиоаты, хиральные фосфотиоаты, фосфодитиоаты, фосфотриэфиры,
25 аминоалкилфосфотриэфиры, метил- и другие алкилфосфонаты включая 3'-
алкиленфосфонаты, 5'-алкиленфосфонаты и хиральные фосфонаты, фосфинаты,
фосфорамидаты, включая 3'-аминофосфорамидат и аминоалкилфосфорамидаты,
тионофосфорамидаты, тионоалкилфосфонаты, тионоалкилфосфотриэфиры,
селенофосфаты и боранофосфаты с нормальными 3' - 5' связями, их аналоги с 2' - 5' связями,
30 и соединения с обращенной полярностью, в которых одна или более связей между нуклеотидами представляет собой 3' - 3', 5' - 5' или 2' - 2' связи. Предпочтительные олигонуклеотиды с обращенной полярностью содержат одну связь 3' - 3' между нуклеотидами в самом близком к 3'-концу положении, т.е. один обращенный нуклеозидный остаток, у которого может быть удалено основание (нуклеооснование отсутствует или
вместо него присутствует гидроксильная группа). Наиболее частым применением обращенной связи является добавление связи 3' - 3' к концу антисмыслового олигонуклеотида с фосфотиоатным остовом. Связь 3' - 3' дополнительно защищает антисмысловой олигонуклеотид от разрушения экзонуклеазой путем создания 5 олигонуклеотида с двумя 5'-ОН концами и без З'-ОН конца. Обращенные связи можно ввести в определенные положения в процессе синтеза олигонуклеотида путем применения "обращенных фосфорамидитов". Данные реагенты содержат фосфорамидитные группы в положении 5'-ОН и защитную группу диметокситритила (DMT) в положении З'-ОН. Обычно, защитная группа DMT находится на 5'-ОН и фосфорамидит находится на З'-ОН.
10 [0198] Примеры модифицированных оснований включают, но не ограничены перечисленными: 2-аминопурин, 2'-аминобутирилпиренуридин, 2'-аминоуридин, 2'-дезоксиуридин, 2'-фторцитидин, 2'-фторуридин, 2,6-диаминопурин, 4-тиоуридин, 5-бромуридин, 5-фторцитидин, 5-фторуридин, 5-индоуридин, 5-метилцитидин, инозин, N3-метилуридин, 7-деаза-гуанин, 8-аминогексиламиноаденин, 6-тиогуанин, 4-тиотимин, 215 тиотимин, 5-йодоуридин, 5-йодоцитидин, 8-бромгуанин, 8-бромаденин, 7-деазааденин, 7-диазагуанин, 8-оксогуанин, 5,6-дигидроуридин и 5-гидроксиметилуридин. Данные синтетические единицы доступны для приобретения (например, их можно приобрести в Glen Research Company); и их можно включить в ДНК путем химического синтеза.
[0199] Примеры модификации молекулы сахара представляют собой 3 '-дезоксилирование, 20 2'-фторирование и арабинозидирование, тем не менее, они не должны рассматриваться как ограниченные перечисленными модификациями. Включение таких модификаций в ДНК также возможно путем химического синтеза.
[0200] Примеры модификаций 5'-конца представляют собой 5'-аминирование, 5'-биотинилирование, 5'-флуоресцеинилирование, 5'-тетрафторфлуоресцеинилирование, 5'-25 тионирование и 5'-дабсилирование, тем не менее они не должны рассматриваться как ограниченные перечисленными модификациями.
[0201] Примеры модификаций 3'-конца представляют собой 3'-аминирование, 3'-биотинилирование, 2,3-дидеоксидирование, 3'-тионирование, 3'-дабсилирование, 3'-карбоксилование и 3 '-холестеринирование, тем не менее, они не должны рассматриваться 30 как ограниченные перечисленными модификациями.
[0202] В одном предпочтительном варианте реализации олигонуклеооснование может содержать 5'-блокирующий заместитель, который присоединен к 5'-концевым атомам углерода посредством линкера. Химическая природа линкера не является критичной, в отличие от его длины, которая в некоторых вариантах реализации должна составлять по
меньшей мере 6 атомов, и сам линкер должен быть гибким. Можно применять различные нетоксичные заместители, такие как биотин, холестерин или другие стероиды или неинтеркалирующий катионный флуоресцентный краситель. Особенно предпочтительными в качестве реагентов для получения олигонуклеооснований являются 5 реагенты под торговыми наименованиями СуЗ(tm) и Су5(tm) в Glen Research (теперь GE Healthcare), Стерлинг, Виргиния, которые представляют собой блокированные фосфорамидиты, которые при включении в олигонуклеотид позволяют получить 3,3,3',3'-тетраметил-ГЧ,№-изопропил, содержащий в качестве заместителей индомонокарбоцианиновый и индодикарбоцианиновый красители, соответственно. СуЗ
10 является особенно предпочтительным. Если индокарбоцианин содержит в качестве заместителя N-оксиалкил, его можно удобно соединить с 5'-концом олигодезоксинуклеотида как фосфодиэфир с 5'-концевым фосфатом. Если используют доступный для приобретения фосфорамидит СуЗ, как указано, то полученная 5'-модификация состоит из блокирующего заместителя и линкера вместе, которые
15 представляют собой N-гидроксипропил, N'-фосфатидилпропил 3,3,3',3'-тетраметил-индомонокарбоцианин. Другие предложенные красители включают родамин 6G, тетраметилродамин, сульфородамин 101, мероцианин 540, Atto565, Atto550 26, СуЗ.5, Dy547, Dy548, Dy549, Dy554, Dy555, Dy556, Dy560, mStrawberry и mCherry.
[0203] В предпочтительном варианте реализации индокарбоцианиновый краситель 20 является тетра-замещенным в 3- и 3'- положениях индольных колец. Без ограничения теорией такие заместители не позволяют красителю быть интеркалирующим красителем. Вид заместителей в данных положениях не является критичным.
[0204] Конструкции олигонуклеотидов, описанные в данной заявке, также можно применять в качестве более эффективных донорных матриц в комбинации с другими 25 методиками редактирования или рекомбинации ДНК, включая, но не ограничиваясь перечисленными: направленное воздействие на гены с применением сайт-специфической гомологичной рекомбинации посредством нуклеаз с цинковыми пальцами, эффекторные нуклеазы, подобные активаторам транскрипции (TALEN), или короткие полиндромные повторы, регулярно расположенные группами (CRISPR).
30 [0205] Настоящее описание в некоторых аспектах и вариантах реализации в общем смысле относится к способам эффективной модификации геномной клеточной ДНК и/или рекомбинации ДНК в геномную ДНК клеток. Хотя способы согласно настоящему изобретению не ограничены каким-либо конкретным применением, некоторые способы, предложенные в данной заявке, могут, в некоторых вариантах реализации, быть полезны,
например, для введения модификации в геном клетки с целью определения влияния данной модификации на клетку. Например, модификацию можно ввести в последовательность нуклеотидов, которая кодирует фермент, чтобы определить, изменяет ли данная модификация ферментативную активность указанного фермента, и/или чтобы определить 5 положение каталитической области фермента. В качестве альтернативы модификацию можно ввести в кодирующую последовательность ДНК-связывающего белка, чтобы определить, изменится ли ДНК-связывающая активность данного белка, и, таким образом, установить конкретную ДНК-связывающую область внутри данного белка. В качестве другой альтернативы можно ввести модификацию в некодирующую регуляторную 10 последовательность (например, в промотор, энхансер, регуляторную последовательность РНК (миРНК) и т.д.), чтобы определить влияние данной модификации на уровень экспрессии второй последовательности, которая функционально связана с некодирующей регуляторной последовательностью. Это может потребоваться, например, для определения конкретной последовательности, которая обладает регуляторной активностью.
15 [0206] Агенты для разрезания ДНК
[0207] Одна стратегия для направленного нарушения гена состоит в образовании одноцепочечных или двухцепочечных разрывов ДНК с применением агента для разрезания ДНК, такого как сайтспецифичная эндонуклеаза. Эндонуклеазы наиболее часто применяют для направленного нарушения генов в организмах, которые обычно устойчивы к более
20 традиционным способам направленного воздействия на гены, таких как модели водорослей, растений и крупных животных, включая людей. Например, в настоящее время осуществляют клинические испытания у человека, предусматривающие применение нуклеаз с цинковыми пальцами для лечения и предотвращения ВИЧ-инфекции. Кроме того, конструирование эндонуклеаз на сегодняшний день применяют при попытках нарушить
25 гены, которые приводят к образованию нежелательных фенотипов в зерновых культурах.
[0208] Цинковые пальцы
[0209] Один класс сконструированных эндонуклеаз представляет собой класс эндонуклеаз с цинковыми пальцами. В эндонуклеазах с цинковыми пальцами совмещают домен неспецифичного расщепления, обычно из эндонуклеазы Fokl, с доменами белков с 30 цинковыми пальцами, которые сконструированы таким образом, чтобы они связывались с определенными последовательностями ДНК. Модульная структура эндонуклеаз с цинковыми пальцами делает их универсальной платформой для создания сайт-специфичных двухцепочечных разрывов в геноме. Так как эндонуклеаза Fokl расщепляет в виде димера, одна стратегия для предотвращения случаев расщепления вне целевого сайта
состоит в разработке доменов с цинковыми пальцами, которые связываются со смежными сайтами из 9 пар оснований. См. также патенты США с номерами 7285416; 7521241; 7361635; 7273923; 7262054; 7220719; 7070934; 7013219; 6979539; 6933113; 6824978; описание каждого из которых настоящим полностью включено в данную заявку 5 посредством ссылки.
[0210] TALEN
[0211] TALEN представляют собой направляемые на мишень нуклеазы, которые вызывают одно- и двухцепочечные разрывы в определенных сайтах ДНК, которые затем репарируются с помощью механизмов, которые можно применять, чтобы внести изменения 10 в последовательность в сайте расщепления.
[0212] Основной структурный элемент, который применяют для конструирования ДНК-связывающего участка TALEN, представляет собой домен с высоко консервативным повтором, полученный из встречающихся в природе TALE, кодируемых протеобактериями вида Xanthomonas. TALEN связывает ДНК посредством группы высоко консервативных 15 повторов из 33 - 35 аминокислот, которые фланкированы дополнительными полученными из TALE доменами на амино-концах и карбокси-концах указанных повторов.
[0213] Такие повторы TALE специфично связываются с одиночным основанием ДНК, которое идентифицируют два гипервариабельных остатка, обычно обнаруживаемым в положениях 12 и 13 повтора, при этом количество повторов в группе соответствует длине
20 желательной целевой нуклеиновой кислоты, конкретный повтор выбирают, чтобы он подходил к целевой последовательности нуклеиновой кислоты. В некоторых вариантах реализации размер целевой нуклеиновой кислоты составляет от 15 до 20 пар оснований, чтобы максимизировать селективность к целевому сайту. Расщепление целевой нуклеиновой кислоты обычно происходит в пределах 50 пар оснований от сайта связывания
25 TALEN. Компьютерные программы для разработки сайта узнавания TALEN были описаны в данной области техники. См., например, Cermak и др., Nucleic Acids Res. 2011 г., июль; 39(12): е82.
[0214] После разработки TALEN таким образом, чтобы они подходили к желательной целевой последовательности, их можно рекомбинантно экспрессировать и вводить в 30 протопласты как экзогенные белки, или экспрессировать с плазмиды внутри протопласта, или вводить в виде мРНК.
[0215] Мегануклеазы
[0216] Хоминг-эндонуклеазы, также известные как мегануклеазы, представляют собой сайт-специфические эндонуклеазы, которые образуют двухцепочечные разрывы в геномной ДНК с высокой степенью специфичности благодаря большим (например, > 14 п.о.) сайтам расщепления. Несмотря на то, что специфичность хоминг-эндонуклеаз к 5 целевым сайтам позволяет точное позиционирование индуцированных разрывов ДНК, сайты расщепления хоминг-эндонуклеазами встречаются редко и вероятность обнаружения встречающегося в природе сайта расщепления в целевом гене низка.
[0217] Другой класс искусственных эндонуклеаз представляет собой сконструированные мегануклеазы. Сконструированные хоминг-эндонуклеазы получают путем модификации
10 специфичности существующих хоминг-эндонуклеаз. В одном подходе в последовательность аминокислот встречающихся в природе хоминг-эндонуклеаз вводят вариации, а затем полученные сконструированные хоминг-эндонуклеазы подвергают скринингу, чтобы выбрать функциональные белки, которые расщепляют целевой сайт связывания. В другом подходе химерные хоминг-эндонуклеазы конструируют путем
15 комбинирования сайтов узнавания двух различных хоминг-эндонуклеаз, чтобы получить новый сайт узнавания, состоящий из половин сайтов каждой хоминг-эндонуклеазы. См., например, патент США номер 8338157.
[0218] Системы CRISPR или CRISPR/cas
[0219] CRISPR-Cas система включает три основных компонента для разработки: 1) ген, 20 транскрипт (например, мРНК) или белок Cas; 2) РНК-проводник (пРНК); и 3) крРНК (РНК CRISPR), которые представляют собой фрагменты РНК, образованные в результате процессинга транскриптов РНК, кодирующих группы повторов CRISPR, которые содержат участок "протоспейсера", комплементарный сайту чужеродной ДНК (например, целевому участку эндогенной ДНК), и часть повтора CRISPR. См., например, заявки РСТ № 25 WO/2014/093661 и WO/2013/176772.
[0220] Ген, транскрипт (например, мРНК) или белок Cas (CRISPR-
ассоциированный).
[0221] Временная экспрессия Cas с плазмидного вектора, непосредственная доставка белка Cas и/или непосредственная доставка мРНК Cas в клетки растений. Гены Cas кодон-30 оптимизировали для экспрессии в высших растениях, водорослях или дрожжах, и их экспрессия запускается либо конститутивным, либо индуцируемым, либо тканеспецифичным, либо видоспецифичным промотором, в соответствующих случаях. Сигналы терминации транскрипции и полиаденилирования Cas представляли собой любой из NosT, RBCT, HSP18.2T или других геноспецифичных или видоспецифичных
терминаторов. Генные кассеты или мРНК Cas могут содержать интроны, либо нативные, либо в комбинации с геноспецифичными промоторами и/или синтетическими промоторами. Белок Cas может содержать одну или более последовательностей сигналов ядерной локализации (NLS), мутаций, делеций, изменений, или может быть укороченным. В системах временной экспрессии генные кассеты Cas можно комбинировать с другими компонентами системы CRISPR-Cas, такими как кассеты РНК-проводника на том же векторе временной экспрессии. В качестве альтернативы, генные кассеты Cas могут находиться и экспрессироваться с конструкций, независимых от кассет РНК-проводника или от других компонентов системы CRISPR-Cas. CRISPR-ассоциированный (Cas) ген кодирует белки с различными предсказанными активностями, воздействующими на нуклеиновые кислоты, такие как нуклеазы, геликазы и полимераза. Гены Cas включают cas9. Cas9 представляет собой ген, кодирующий большой белок, содержащий предсказанный RuvC-подобный и HNH-эндонуклеазный домены, и он ассоциирован с системой приобретенного иммунитета CRISPR, которая присутствует у большинства архей и у многих бактерий. Белок Cas9 состоит из двух фрагментов:
1) Узнающий (REC) фрагмент, который состоит из трех доменов:
a) ВН (спиральный мостик)
b) REC 1 - способствует направляемому РНК нацеливанию на ДНК
c) REC2 - способствует направляемому РНК нацеливанию на ДНК
2) Нуклеазный (NUC) фрагмент, который состоит из трех доменов:
a) RuvC, который способствует направляемому РНК нацеливанию на ДНК; эндонуклеазная активность
b) HNH - эндонуклеазная активность
c) PI - взаимодействие с РАМ
[0222] В других вариантах реализации ген cas может представлять собой гомолог cas9, в котором домены RuvC, HNH, REC и ВН высоко консервативны. В некоторых вариантах реализации гены Cas принадлежат к следующим видам.
[0223] РНК-проводник (пРНК)
[0224] пРНК или опРНК (отдельный РНК-проводник) сконструирован как фрагмент, соединяющий крРНК и часть транс-активирующей последовательности РНК CRISPR (тра-крРНК), который направляет Cas9 к определенной целевой последовательности ДНК, которая комплементарна участку протоспейсера. РНК-проводник может включать кассету экспрессии, содержащую конструкцию химерной РНК с длинным гибридом тра-крРНК, коротким гибридом тра-крРНК или нативной группой CRISPR + конформация тра-крРНК.
Химерный пРНК объединяет специфичность нацеливания крРНК со свойствами каркаса тра-крРНК в один транскрипт. Временная экспрессия пРНК контролируется видоспецифичными промоторами высших растений для РНК-полимеразы III, такими как промоторы из семейства генов малых ядерных РНК (мяРНК) U6 или U3 (Wang и др. 2008). 5 Терминация транскрипции пРНК контролируется последовательностью поли(аТ) из 6 - 20 нуклеотидов, согласно Wang и др. 2008. Кассеты экспрессии пРНК расположены на тех же векторах временной экспрессии, что и другие компоненты системы CRISPR-Cas, или на отличных векторах. Транскрипты пРНК можно синтезировать in vitro и доставить непосредственно в клетки растений, независимо или в комбинации с векторами временной 10 экспрессии пРНК.
[0225] Целевой участок
[0226] РНК-проводники содержат два компонента, которые определяют специфичность к
целевому участку ДНК: протоспейсер и примыкающий к протоспейсеру мотив (РАМ).
Протоспейсерная последовательность, обычно состоящая из 20 нуклеотидов, но
5 изменяющаяся в зависимости от ДНК-мишени, обеспечивает специфичность комплекса
CRISPR-Cas к последовательности ДНК. ДНК-мишени также содержат
последовательность из трех нуклеотидов (РАМ) NNG или NAG, где N обозначает любой нуклеотид, находящийся непосредственно с 3'-стороны или по ходу транскрипции от протоспейсера.
10 [0227] Однокомпонентный подход
[0228] Аналогично Le Cong и др. (2013) и другим исследованиям, применили упрощенный "однокомпонентный подход" к редактированию генов CRISPR-Cas, в котором единая конструкция для временной экспрессии содержала все компоненты комплекса CRISPR-Cas, т.е. кассеты экспрессии как пРНК, так и Cas. Это позволяло легко
15 осуществлять модульное конструирование для нацеливания на одиночный локус или множество локусов в любом данном растении или культуре. Нацеливания на множество локусов можно добиться путем простой замены в специфичных к мишени кассетах пРНК. Кроме того, видоспецифичные промоторы, терминаторы или другие усиливающие экспрессию элементы можно легко присоединить и отсоединить от векторов временной
20 экспрессии "однокомпонентного подхода", позволяя оптимальную экспрессию как пРНК, так и белка Cas видоспецифичным способом.
[0229] Двухкомпонентный подход
[0230] В двухкомпонентном подходе кассеты экспрессии Cas и пРНК расположены на различных векторах временной экспрессии. Это позволяет доставлять компоненты 25 редактирования генов CRISPR-Cas отдельно, позволяя добиться различных соотношений РНК-проводника и Cas в одной и той же клетке. Аналогично однокомпонентному подходу, двухкомпонентный подход также позволяет легко изменять промоторы, терминаторы или другие элементы, влияющие на экспрессию компонентов CRISPR-Cas, и позволяет нацеливание на ДНК видоспецифичным способом.
30 [0231] Антибиотики
[0232] Другой класс эндонуклеаз представляет собой антибиотики, которые представляют собой разрезающие ДНК гликопептиды, такие как антибиотики семейства
блеомицина, которые включают блеомицин, зеоцин, флеомицин, таллисомицин, пеплеомицин и другие антибиотики, которые дополнительно описаны в данной заявке.
[0233] В направленной рекомбинации генов можно применять другие модифицирующие ДНК молекулы. Например, можно применять пептидные нуклеиновые кислоты, чтобы 5 вызвать модификации в геноме целевой клетки или клеток (см., например, Ecker, патент США номер 5986053, включенный в данную заявку посредством ссылки). Вкратце, синтетические нуклеотиды, содержащие по меньшей мере частично пептидный остов, применяют для нацеливания на гомологичную геномную последовательность нуклеотидов. После связывания с двуспиральной ДНК, или посредством мутагена, лигированного с 10 пептидной нуклеиновой кислотой, происходит модификация целевой последовательности ДНК и/или рекомбинация. Специфичность нацеливания определяется степенью гомологии между нацеливающей последовательностью и геномной последовательностью.
[0234] Более того, настоящее описание не ограничено конкретными способами, которые применяются в данной заявке для модификации геномных последовательностей. В
15 действительности, предполагается множество способов. Например, нацеливание на гены можно осуществить, применяя олигонуклеотиды, образующие тройную спираль (TFO). TFO можно получить синтетическим путем, например, с помощью ПЦР или путем применения устройства, синтезирующего гены. Кроме того, TFO можно выделить из геномной ДНК, если обнаружены подходящие природные последовательности. TFO можно
20 применять множеством способов, включая, например, способ присоединения к мутагену, такому как, но не ограничиваясь перечисленными: псорален или хлорамбуцил (см., например, Havre и др., Proc Nat'l Acad Sci, U.S.A. 90:7879-7883, 1993; Havre и др., J Virol 67:7323-7331, 1993; Wang и др., Mol Cell Biol 15:1759-1768, 1995; Takasugi и др., Proc Nat'l Acad Sci, U.S.A. 88:5602-5606, 1991; Belousov и др., Nucleic Acids Res 25:3440-3444, 1997).
25 Более того, например, TFO можно присоединить к донорному дуплексу ДНК (см., например, Chan и др., J Biol Chem 272:11541-11548, 1999). TFO также могут действовать путем связывания с достаточной аффинностью, чтобы вызвать допускающую ошибки репарацию (Wang и др., Science 271:802-805, 1996).
[0235] Способы, описанные в данной заявке, не обязательно ограничены природой или 30 типом применяемого ДНК-модифицирующего реагента. Например, такие ДНК-модифицирующие реагенты высвобождают радикалы, которые приводят к разрыву цепи ДНК. В качестве альтернативы указанные реагенты алкилируют ДНК с образованием аддуктов, которые будут блокировать репликацию и транскрипцию. В альтернативном варианте указанные реагенты образуют поперечные сшивки или молекулы, которые
ингибируют клеточные ферменты, приводя к разрывам цепей. Примеры ДНК-модифицирующих реагентов, которые присоединяют к олигонуклеотидам для получения образующих триплекс олигонуклеотидов (TFO), включают, но не ограничены перечисленными: индолокарбазолы, нафталиндиимид (NDI), трансплатин, блеомицин, 5 аналоги циклопропапирролоиндола и фенантродигидродиоксины. В частности, индолокарбазолы представляют собой ингибиторы топоизомеразы I. Ингибирование данных ферментов приводит к разрывам цепей и образованию аддуктов с ДНК и белками (Arimondo и др., Bioorganic and Medicinal Chem. 8, 777, 2000). NDI представляет собой фотоокислитель, который может окислять гуанины, что может вызывать мутации в сайтах
10 с остатками гуанина (Nunez и др., Biochemistry, 39, 6190, 2000). Было показано, что трансплатин реагирует с ДНК в триплексной мишени, когда TFO связан с указанным реагентом. Данная реакция вызывает образование аддуктов ДНК, которые будут мутагенными (Columbier и др., Nucleic Acids Research, 24: 4519, 1996). Блеомицин представляет собой реагент, вносящий разрывы в ДНК, широко применяемый в качестве
15 аналога радиации. Его соединяли с олигонуклеотидами и показали, что он активен в качестве реагента, вносящего разрывы в ДНК, в таком формате (Sergeyev, Nucleic Acids Research 23, 4400, 1995; Kane, и др., Biochemistry, 34, 16715, 1995). Аналоги циклопропапирролоиндола соединяли с TFO и показали, что они алкилируют ДНК в последовательности триплексной мишени. После этого алкилированная ДНК будет
20 содержать химические аддукты, которые будут мутагенными (Lukhtanov, и др., Nucleic Acids Research, 25, 5077, 1997). Фенантродигидродиоксины представляют собой замаскированные хиноны, которые высвобождают радикалы при фотоактивации. Их соединяли с TFO и показали, что они вводят разрывы в дуплекс ДНК при фотоактивации (Bendinskas и др., Bioconjugate Chem. 9, 555, 1998).
25 [0236] В настоящем описании предполагаются другие способы индуцирования модификаций и/или рекомбинации. Например, другой вариант реализации включает индукцию гомологичной рекомбинации между экзогенным фрагментом ДНК и целевым геном (см., например, Capeechi и др., Science 244:1288-1292, 1989) путем применения пептидных нуклеиновых кислот (ПНК) с аффинностью к целевому сайту. Другие
30 дополнительные способы включают сайт-специфическое узнавание и нацеливание на ДНК с помощью полиамидов (см., например, Dervan и др., Curr Opin Chem Biol 3:688-693, 1999; Biochemistry 38:2143-2151, 1999) и путем применения нуклеаз с сайт-специфической активностью (например, белков с цинковыми пальцами, TALEN, мегануклеаз и/или CRISPR).
[0237] Настоящее описание не ограничено какой-либо конкретной частотой модификации и/или рекомбинации. В некоторых вариантах реализации способы, описанные в данной заявке, приводят к частоте модификации целевой последовательности нуклеотидов от 0,2% до 3%. Тем не менее, предполагается, что любая частота (т.е. между 5 0% и 100%) модификации и/или рекомбинации входит в объем настоящего описания. Частота модификации и/или рекомбинации зависит от способа, применяемого для индуцирования модификации и/или рекомбинации, от применяемого типа клеток, конкретного целевого гена и применяемого мутирующего ДНК реагента, если его используют. Кроме того, способ, используемый для обнаружения модификации и/или
10 рекомбинации, вследствие ограничений способа детектирования, не может обнаружить все возникшие модификации и/или рекомбинации. Более того, некоторые события модификации и/или рекомбинации могут быть молчащими и не проявлять детектируемых признаков того, что данная модификация и/или рекомбинация произошла. Невозможность обнаружить молчащие события модификации и/или рекомбинации приводит к заниженной
15 оценке модификации и/или рекомбинации. По данным и другим причинам настоящее описание не обязательно ограничено какой-либо конкретной частотой модификаций и/или рекомбинаций. В одном варианте реализации частота модификаций и/или рекомбинаций составляет от 0,01% до 100%. В другом варианте реализации частота модификаций и/или рекомбинаций составляет от 0,01% до 50%. В еще одном варианте реализации частота
20 модификаций и/или рекомбинаций составляет от 0,1% до 10%. В еще одном варианте реализации частота модификаций и/или рекомбинаций составляет от 0,1% до 5%.
[0238] В данном тексте термин "частота мутаций" по отношению к популяции клеток, которые обработаны модифицирующей ДНК молекулой, которая способна вводить мутацию в целевой сайт генома клетки, относится к количеству клеток в обработанной
25 популяции, которые содержат данную мутацию в целевом сайте, по отношению к общему количеству клеток, которые обработаны модифицирующей ДНК молекулой. Например, по отношению к популяции клеток, которая обработана модифицирующей ДНК молекулой TFO, которая присоединена к псоралену, разработанной таким образом, чтобы она вводила мутацию в целевой сайт генома клетки, частота мутаций, равная 5%, означает, что из
30 каждых 100 клеток, которые обработаны ТТО-псораленом, 5 клеток содержат мутацию в целевом сайте.
[0239] Хотя настоящее описание не обязательно ограничено какой-либо степенью точности при модификации и/или рекомбинации ДНК в клетке, предполагается, что в некоторых вариантах реализации настоящего описания требуется более высокая степень
точности, в зависимости от желаемого результата. Например, для определенных изменений последовательности, необходимых для репарации генов (например, для изменения определенного основания), требуется более высокая степень точности по сравнению с получением нокаута гена, при котором необходимо лишь нарушение гена. При применении 5 способов согласно настоящему описанию достигаются более высокие уровни точности в методиках модификации и/или гомологичной рекомбинации, чем при применении способов известного уровня техники.
[0240] Доставка олигонуклеооснований для репарации генов в клетки растения
[0241] Для доставки олигонуклеооснований для репарации генов можно применять 10 любой широко известный способ, применяемый для трансформации клетки растения. Примеры способов перечислены ниже. Способы и композиции, предложенные в данной заявке, могут включать любой из множества способов трансфекции клеток модифицирующим ДНК реагентом или реагентами. Способы введения модифицирующих ДНК реагентов в клетку или клетки хорошо известны в данной области техники и 15 включают, но не ограничены перечисленными: микроинъекцию, электропорацию, пассивную адсорбцию, копреципитацию ДНК с фосфатом кальция, опосредованную ДЭАЭ-декстраном трансфекцию, опосредованную полибреном трансфекцию, слияние липосом, трансфекцию липофектином, нуклеофекцию, слияние протопластов, ретровирусную инфекцию, биолистическую трансфекцию (т.е. бомбардировку частицами) 20 и тому подобные способы.
[0242] Применение металлических микроносителей (микросфер) для внедрения больших фрагментов ДНК в клетки растения, имеющие целлюлозные клеточные стенки, путем метательного проникновения (далее называемого биолистической доставкой) хорошо известны специалистам в соответствующей области техники. В патентах США под 25 номерами 4945050; 5100792 и 5204253 описаны основные методики выбора микроносителей и устройств для их проектирования.
[0243] Конкретные условия применения микроносителей в способах, описанных в данной заявке, могут включать условия, описанные в международной публикации WO 99/07865. В типичной методике ледяные микроносители (60 мг/мл), смешанный дуплексный 30 олигонуклеоитид (60 мг/мл), 2,5 М СаСЬ и 0,1 М спермидин добавляют в указанном порядке; смесь осторожно перемешивают, например посредством встряхивания, в течение 10 минут, а затем оставляют при комнатной температуре на 10 минут, после чего микроносители разбавляют 5 объемами этанола, центрифугируют и перерастворяют в 100% этаноле. Хорошие результаты можно получить для концентрации в адгезивном растворе 8
- 10 мкг/мкл микроносителей, 14 - 17 мкг/мкл смешанного дуплексного олигонуклеотида, 1,1 - 1,4 М СаСЬ и 18 - 22 мМ спермидина. Оптимальные результаты наблюдали при условиях, включающих 8 мкг/мкл микроносителей, 16,5 мкг/мкл смешанного дуплексного олигонуклеотида, 1,3 М СаСЬ и 21 мМ спермидин.
5 [0244] Олигонуклеооснования для репарации генов также можно внедрить в клетки растения, применяя микроволокна для проникновения через клеточную стенку и клеточную мембрану. В патенте США номер 5302523, Coffee и др., описано применение волокон карбида кремния для облегчения трансформации суспензионных культур кукурузы Black Mexican Sweet. Любой механический способ, который можно применять для введения ДНК 10 с целью трансформации клетки растения с применением микроволокон, можно использовать для доставки олигонуклеооснований для репарации генов для трансмутации.
[0245] Наглядный способ микроволоконной доставки олигонуклеооснования для репарации генов описан далее. Стерильные микроволокна (2 мкг) суспендируют в 150 мкл растительной культуральной среды, содержащей приблизительно 10 мкг смешанного 15 дуплексного олигонуклеотида. Суспензионной культуре дают возможность отстояться, и равные объемы уплотненных клеток и стерильной суспензии волокно/нуклеотид встряхивают на вортексе в течение 10 минут и высевают. Селективные среды вносят сразу же или с задержкой вплоть до приблизительно 120 часов, по мере целесообразности для конкретного свойства.
20 [0246] В альтернативном варианте реализации олигонуклеооснования для репарации генов можно доставлять в клетку растения путем электропорации протопласта, полученного из части растения. Протопласты получают путем ферментативной обработки части растения, в частности, листа, согласно методикам, которые хорошо известны среднему специалисту в данной области техники. См., например, Gallois и др., 1996, в
25 Methods in Molecular Biology 55:89-107, Humana Press, Тотова, Нью-Джерси; Kipp и др., 1999, в Methods in Molecular Biology 133:213-221, Humana Press, Тотова, Нью-Джерси. Протопласты не обязательно нужно культивировать в ростовых средах перед электропорацией. Типичные условия для электропорации следующие: 300000 протопластов в общем объеме 0,3 мл при концентрации олигонуклеооснования для
30 репарации генов в диапазоне 0,6 - 4 мкг/мл.
[0247] В альтернативном варианте реализации нуклеиновые кислоты поглощаются протопластами растения в присутствии модифицирующего мембрану агента полиэтиленгликоля согласно методикам, хорошо известным специалистам в данной области техники. В альтернативном варианте реализации олигонуклеооснования для
репарации генов можно доставить путем впрыскивания через микрокапилляр в клетки растения или в протопласты.
[0248] В альтернативном варианте реализации нуклеиновые кислоты заключены в микрогранулы, состоящие из альгината кальция, и поглощаются протопластами растения в 5 присутствии модифицирующего мембрану агента полиэтиленгликоля (см., например, Sone и др., 2002, Liu и др., 2004).
[0249] В альтернативном варианте реализации нуклеиновые кислоты замораживают в воде и вводят в клетки растения в виде микрочастиц путем бомбардировки (см., например, Gilmore, 1991, патент США № 5219746; Brinegar и др.)
10 [0250] В альтернативном варианте реализации нуклеиновые кислоты, присоединенные к наночастицам, вводят в интактные клетки растения путем инкубации клеток в суспензии, содержащей наночастицы (см., например, Pasupathy и др., 2008), или путем доставки в интактные клетки посредством бомбардировки частицами или в протопласты путем совместной инкубации (см., например, Тогпеу и др., 2007).
15 [0251] В альтернативном варианте реализации нуклеиновые кислоты включают в комплекс с проникающими пептидами и доставляют в клетки путем совместной инкубации (см., например, Chugh и др., 2008, WO 2008148223 Al; Eudes и Chugh).
[0252] В альтернативном варианте реализации нуклеиновые кислоты вводят в интактные клетки путем электропорации (см., например, Не и др., 1998, US 2003/0115641 Al, Dobres и 20 др.).
[0253] В альтернативном варианте реализации нуклеиновые кислоты доставляют в клетки сухих зародышей путем их вымачивания в растворе с нуклеиновыми кислотами (см., например, Topfer и др., 1989, Senaratna и др., 1991) или, в других вариантах реализации, вводят посредством технологии Cellsqueeze (SQZ Biotech).
25 [0254] Выбор растений
[0255] В различных вариантах реализации растения, описанные в данной заявке, могут быть любого вида из двудольных, однодольных или голосемянных растений, включая любые виды древесных растений, которые растут как дерево или кустарник, любые травяные виды или любые виды, которые дают съедобные фрукты, семена или овощи, или 30 любые виды, которые дают яркие или ароматные цветы. Например, растение можно выбрать из группы, состоящей из следующих видов растений: канола, подсолнечник, кукуруза, табак, сахарная свекла, хлопчатник, маис, пшеница, ячмень, рис, люцерна, ячмень, сорго, томат, манго, персик, яблоко, груша, клубника, банан, дыня, маниока,
картофель, морковь, латук, лук, соя культурная, виды сои, сахарный тростник, горох, нут, горох полевой, конский боб, чечевица, репа, брюква, брюссельская капуста, люпин, цветная капуста, капуста кормовая, кормовые бобы, тополь, сосна, эвкалипт, виноград, цитрусовое растение, тритикале, люцерна, рожь, овес, дерн и кормовые травы, лен, масличный рапс, 5 горчица, огурец, вьюнок, бальзамин, перец, баклажан, бархатец, лотос, кочанная капуста, нивяник, гвоздика, тюльпан, ирис, лилия, и растения, дающие орехи, если они еще конкретно не упомянуты.
[0256] Можно исследовать устойчивость или толерантность к гербициду растений и клеток растений, применяя широко известные в данной области техники способы, 10 например, путем выращивания растения или клетки растения в присутствии гербицида и измерения скорости роста по сравнению со скоростью роста в отсутствие гербицида.
[0257] В тексте настоящей заявки по существу нормальный рост растения, органа растения, ткани растения или клетки растения представляет собой скорость роста или скорость деления клеток растения, органа растения, ткани растения или клетки растения, 15 которая составляет по меньшей мере 35%, по меньшей мере 50%, по меньшей мере 60% или по меньшей мере 75% от скорости роста или скорости деления клетки соответствующего растения, органа растения, ткани растения или клетки растения, экспрессирующей интересующий белок дикого типа.
[0258] В данной заявке по существу нормальное развитие растения, органа растения, 20 ткани растения или клетки растения представляет собой происхождение одного или более событий развития в растении, органе растения, ткани растения или клетке растения, которое по существу одинаково с таковым, происходящим в соответствующем растении, органе растения, ткани растения или клетке растения, экспрессирующей указанный белок дикого типа.
25 [0259] В некоторых вариантах реализации органы растения, представленные в данной заявке, включают, но не ограничены перечисленными: листья, стебли, корни, вегетативные почки, цветочные почки, меристемы, эмбрионы, семядоли, эндосперм, чашелистики, лепестки, пестики, плодолистики, тычинки, пыльники, микроспоры, пыльцу, пыльцевые трубки, семяпочки, завязи и фрукты, или срезы, ломтики или пластинки, взятые из них.
30 Ткани растения включают, но не ограничены перечисленными: каллусные ткани, покровные ткани, проводящие ткани, запасающие ткани, меристематические ткани, ткани листа, ткани побега, ткани корня, ткани галла, ткани опухоли растения и репродуктивные ткани. Клетки растения включают, но не ограничены перечисленными: изолированные клетки с клеточными стенками, их агрегаты различного размера и протопласты.
[0260] Растения являются по существу "толерантными" к соответствующему гербициду, когда их подвергают его воздействию и получают кривую дозовой зависимости, которая сдвинута вправо по сравнению с таковой, полученной для аналогичным образом подвергнутого воздействию данного гербицида нетолерантного подобного растения. Для 5 таких кривых дозовой зависимости "доза" нанесена на график на ось х и "процент убитых", "гербицидное действие" и т.д., нанесено на график на ось у. Для толерантных растений потребуется больше гербицида, чем для нетолерантных подобных растений, чтобы получить данное гербицидное действие. Растения, которые по существу "устойчивы" к гербициду, проявляют несколько, если вообще проявляют, некротических, литических, 10 хлоротических или других повреждений, когда их подвергают воздействию гербицида при концентрациях и интенсивности, которые обычно используют в агрохимическом сообществе, чтобы убить сорняки в поле. Растения, которые устойчивы к гербициду, также толерантны к гербициду.
[0261] Получение растений
15 [0262] Известны способы культивирования различных тканей различных видов растения и регенерации растений из них. Например, наращивание культурного сорта канолы в культуре ткани описано в любом из следующих источников, но не ограничено любыми из перечисленных далее источников: Chuong и др., "A Simple Culture Method for Brassica hypocotyls Protoplasts", Plant Cell Reports 4:4-6, 1985; Barsby, T. L., и др., "A Rapid and
20 Effective Alternative Procedure for the Regeneration of Plants from Hypocotyl Protoplasts of Brassica napus", Plant Cell Reports (Spring, 1996); Kartha, К., и др., "In vitro Plant Formation from Stem Explants of Rape", Physiol. Plant, 31:217-220, 1974; Narasimhulu, S., и др., "Species Specific Shoot Regeneration Response of Cotyledonary Explants of Brassicas", Plant Cell Reports (Spring 1988); Swanson, E., "Microspore Culture in Brassica", Methods in Molecular Biology,
25 том 6, глава 17, стр. 159, 1990.
[0263] Дальнейшее размножение сорта может происходить в культуре ткани и путем регенерации. Культивирование различных тканей сои и регенерация растений из них хорошо известны и опубликованы во многих источниках. Например, можно сослаться на следующие источники: Komatsuda, Т. и др., "Genotype X Sucrose Interactions for Somatic 30 Embryogenesis in Soybeans", Crop Sci. 31:333-337, 1991; Stephens, P. А., и др., "Agronomic Evaluation of Tissue-Culture-Derived Soybean Plants", Theor. Appl. Genet. 82:633-635, 1991; Komatsuda, Т. и др., "Maturation and Germination of Somatic Embryos as Affected by Sucrose and Plant Growth Regulators in Soybeans Glycine gracilis Skvortz and Glycine max (L.) Merr.", Plant Cell, Tissue and Organ Culture, 28:103-113, 1992; Dhir, S. и др., "Regeneration of Fertile
Plants from Protoplasts of Soybean (Glycine max L. Merr.); Genotypic Differences in Culture Response", Plant Cell Reports 11:285-289, 1992; Pandey, P. и др., "Plant Regeneration from Leaf and Hypocotyl Explants of Glycine wightii (W. and A.) VERDC. var. longicauda", Japan J. Breed. 42:1-5, 1992; и Shetty, К., и др., "Stimulation of In Vitro Shoot Organogenesis in Glycine max 5 (Merrill.) by Allantoin and Amides", Plant Science 81:245-251, 1992. Описания патента США номер 5024944, выданного 18 июня 1991 г., авторы Collins и др., и патента США номер 5008200, выданного 16 апреля 1991 г., авторы Ranch и др., настоящим полностью включены в данную заявку посредством ссылки.
[0264] Типичные варианты реализации.
10 [0265] Дополнительно к аспектам и вариантам реализации, описанным и приведенным в других местах настоящего описания, в особенности предложен следующий перечень лишь некоторых из конкретных вариантов реализации.
1. Способ, позволяющий вызвать генетическое изменение в клетке, указанный способ включает воздействие на указанную клетку агента для разрезания ДНК и
15 модифицированного GRON.
2. Клетка, содержащая агент для разрезания ДНК и GRON.
3. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанные клетки принадлежат к одному или более видам клеток, выбранным из группы, состоящей из клеток растения, бактерий, дрожжей,
20 грибов, водорослей и млекопитающих.
4. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанные клетки принадлежат к одному или более видам клеток, выбранным из группы, состоящей из: Escherichia coli, Mycobacterium smegmatis, Baccillus subtilis, Chlorella, Bacillus thuringiensis, Saccharomyces cerevisiae, Yarrowia
25 lipolytica, Chlamydamonas rhienhardtii, Pichiapastoris, Corynebacterium, Aspergillus niger,
Neurospora crassa, Arabidopsis thaliana, Solanum tuberosum, Solanum phureja, Oryza sativa, Glicine max, Amaranthus, tuberculatus, Linum usitatissimum и Zea mays.
5. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанная клетка представляет собой Yarrowia lipolytica.
30 6. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный клетка представляет собой клетку дрожжей, которые не относятся к Saccharomyces cerevisiae.
7. Способ, позволяющий вызвать генетическое изменение в клетке растения, указанный
способ включает воздействие на указанную клетку агента для разрезания ДНК и
модифицированного GRON.
8. Клетка растения, содержащая агент для разрезания ДНК и модифицированный GRON.
5 9. Способ, позволяющий вызвать генетическое изменение в клетке растения, указанный способ включает воздействие на указанную клетку агента для разрезания ДНК и GRON, который содержит ДНК и РНК.
10. Клетка растения, содержащая агент для разрезания ДНК, который содержит ДНК и РНК.
10 11. Способ, позволяющий вызвать генетическое изменение в гене ацетилкофермент А-карбоксилазы (АККазы) в клетке, отличающийся тем, что указанное генетическое изменение вызывает замену в белке ацетилкофермент А-карбоксилазы (АККазы) в одном или более положениях аминокислот, указанные положения выбраны из группы, состоящей из 1781, 1783, 1786, 2078, 2079, 2080 и 2088, на основании нумерации
15 эталонной последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или
в аналогичном аминокислотном остатке в паралоге АККазы, указанный способ включает воздействие на указанную клетку модифицированного GRON.
12. Способ, позволяющий вызвать генетическое изменение в гене ацетилкофермент А-карбоксилазы (АККазы) в клетке, отличающийся тем, что указанное генетическое
20 изменение вызывает замену в белке ацетилкофермент А-карбоксилазы (АККазы) в
одном или более положениях аминокислот, указанные положения выбраны из группы, состоящей из 1781, 1783, 1786, 2078, 2079, 2080 и 2088, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге АККазы, указанный способ
25 включает воздействие на указанную клетку агента для разрезания ДНК и
модифицированного GRON.
13. Способ получения растения или клетки растения, включающий введение в клетку растения олигонуклеооснования для репарации генов (GRON), нацеленного на мутацию в гене ацетилкофермент А-карбоксилазы (АККазы) для получения клетки растения с
30 геном АККазы, который экспрессирует белок АККазы, содержащий мутацию в одном
или более положениях аминокислот, соответствующих положению, выбранному из группы, состоящей из 1781, 1783, 1786, 2078, 2079, 2080 и 2088, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста
мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге АККазы.
14. Способ получения растения или клетки растения, включающий введение в клетку растения агента для разрезания ДНК и олигонуклеооснования для репарации генов
5 (GRON), нацеленного на мутацию в гене ацетилкофермент А-карбоксилазы (АККазы)
для получения клетки растения с геном АККазы, который экспрессирует белок АККазы,
содержащий мутацию в одном или более положениях аминокислот, соответствующих
положению, выбранному из группы, состоящей из 1781, 1783, 1786, 2078, 2079, 2080 и
2088, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста
10 мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге
АККазы.
15. Фертильное растение, содержащее ген ацетилкофермент А-карбоксилазы (АККазы), который кодирует белок, содержащий мутацию в положении 2078, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста
15 мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге
АККазы.
16. Фертильное растение - рис, содержащее ген ацетилкофермент А-карбоксилазы (АККазы), который кодирует белок, содержащий мутацию в положении 2078, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста
20 мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге
АККазы.
17. Клетка растения, содержащая ген ацетилкофермент А-карбоксилазы (АККазы), который кодирует белок, содержащий мутацию в положении 2078, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста
25 мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге
АККазы, и которая дополнительно содержит ген ацетилкофермент А-карбоксилазы (АККазы), который кодирует белок, содержащий мутацию в одном или более положениях аминокислот, указанные положения выбраны из группы, состоящей из 1781, 1783, 1786, 2079, 2080 и 2088, на основании нумерации эталонной
30 последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или в
аналогичном аминокислотном остатке в паралоге АККазы.
18. Фертильное растение, содержащее ген ацетилкофермент А-карбоксилазы (АККазы), который кодирует белок, содержащий мутацию в положении 2078, на основании
18.
нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге АККазы, и которое дополнительно содержит ген ацетилкофермент А-карбоксилазы (АККазы), который кодирует белок, содержащий мутацию в одном или более положениях аминокислот, указанные положения выбраны из группы, состоящей из 1781, 1783, 1786, 2079, 2080 и 2088, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге АККазы.
Способ, позволяющий вызвать генетическое изменение в гене ацетилкофермент А-карбоксилазы (АККазы) в клетке, отличающийся тем, что указанное генетическое изменение вызывает замену в белке ацетилкофермент А-карбоксилазы (АККазы) в положении 2078, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге АККазы, указанный способ включает воздействие на указанную клетку модифицированного GRON.
Способ, позволяющий вызвать генетическое изменение в гене ацетилкофермент А-карбоксилазы (АККазы) в клетке, отличающийся тем, что указанное генетическое изменение вызывает замену в белке ацетилкофермент А-карбоксилазы (АККазы) в положении 2078, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге АККазы, указанный способ включает воздействие на указанную клетку агента для разрезания ДНК и модифицированного GRON.
Способ, растение или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанная мутация или замена в гене ацетилкофермент А-карбоксилазы (АККазы), если она присутствует, позволяет получить белок ацетилкофермент А-карбоксилазу (АККазу), содержащий одну или более замен, выбранных из группы, состоящей из замены: изолейцина на аланин в положении, соответствующем положению 1781 в последовательности SEQ Ш NO: 1; изолейцина на лейцин в положении, соответствующем положению 1781 в последовательности SEQ Ш NO: 1; изолейцина на метионин в положении, соответствующем положению 1781 в последовательности SEQ Ш NO: 1; изолейцина на аспарагин в положении, соответствующем положению 1781 в последовательности SEQ Ш NO: 1; изолейцина на серии в положении, соответствующем положению 1781 в последовательности SEQ Ш NO: 1; изолейцина на треонин в положении,
соответствующем положению 1781 в последовательности SEQ Ш NO: 1; изолейцина на валин в положении, соответствующем положению 1781 в последовательности SEQ Ш NO: 1; глицина на цистеин в положении, соответствующем положению 1783 в последовательности SEQ Ш NO: 1; аланина на пролин в положении, соответствующем положению 1786 в последовательности SEQ Ш NO: 1; аспартата на глицин в положении, соответствующем положению 2078 в последовательности SEQ Ш NO: 1; аспартата на лизин в положении, соответствующем положению 2078 в последовательности SEQ Ш NO: 1; аспартата на треонин в положении, соответствующем положению 2078 в последовательности SEQ Ш NO: 1; серина на фенилаланин в положении, соответствующем положению 2079 в последовательности SEQ Ш NO: 1; лизина на глутамат в положении, соответствующем положению 2080 в последовательности SEQ Ш NO: 1; цистеина на фенилаланин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на глицин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на гистидин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на лизин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на лейцин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на аспарагин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на пролин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на глутамин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на аргинин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на серии в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на треонин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на валин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; и цистеина на триптофан в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1.
22. Растение или клетка согласно любому из предшествующих вариантов реализации или растение или клетка растения, полученные с помощью любого из способов согласно предшествующим вариантам реализации, отличающиеся тем, что указанное растение или клетка содержит белок ацетилкофермент А-карбоксилазу (АККазу), содержащий одну или более замен, выбранных из группы, состоящей из замены: изолейцина на аланин в положении, соответствующем положению 1781 в последовательности SEQ Ш
NO: 1; изолейцина на лейцин в положении, соответствующем положению 1781 в
последовательности SEQ Ш NO: 1; изолейцина на метионин в положении,
соответствующем положению 1781 в последовательности SEQ Ш NO: 1; изолейцина на
аспарагин в положении, соответствующем положению 1781 в последовательности SEQ
5 Ш NO: 1; изолейцина на серии в положении, соответствующем положению 1781 в
последовательности SEQ Ш NO: 1; изолейцина на треонин в положении, соответствующем положению 1781 в последовательности SEQ Ш NO: 1; изолейцина на валин в положении, соответствующем положению 1781 в последовательности SEQ Ш NO: 1; глицина на цистеин в положении, соответствующем положению 1783 в
10 последовательности SEQ Ш NO: 1; аланина на пролин в положении, соответствующем
положению 1786 в последовательности SEQ Ш NO: 1; аспартата на глицин в положении, соответствующем положению 2078 в последовательности SEQ Ш NO: 1; аспартата на лизин в положении, соответствующем положению 2078 в последовательности SEQ Ш NO: 1; аспартата на треонин в положении, соответствующем положению 2078 в
15 последовательности SEQ Ш NO: 1; серина на фенилаланин в положении,
соответствующем положению 2079 в последовательности SEQ Ш NO: 1; лизина на глутамат в положении, соответствующем положению 2080 в последовательности SEQ Ш NO: 1; цистеина на фенилаланин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на глицин в положении, соответствующем
20 положению 2088 в последовательности SEQ Ш NO: 1; цистеина на гистидин в
положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на лизин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на лейцин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на аспарагин в
25 положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1;
цистеина на пролин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на глутамин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на аргинин в положении, соответствующем положению 2088 в последовательности SEQ
30 Ш NO: 1; цистеина на серии в положении, соответствующем положению 2088 в
последовательности SEQ Ш NO: 1; цистеина на треонин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; цистеина на валин в положении, соответствующем положению 2088 в последовательности SEQ Ш NO: 1; и цистеина на триптофан в положении, соответствующем положению 2088 в
35 последовательности SEQ Ш NO: 1.
23. Растение или клетка согласно любому из предшествующих вариантов реализации или
растение или клетка, полученные с помощью любого из способов согласно
предшествующим вариантам реализации, отличающиеся тем, что указанное растение
или клетка растения содержит ген ацетилкофермент А-карбоксилазу (АККазу), который
5 кодирует белок, содержащий мутацию в одном или более положениях аминокислот,
указанные положения выбраны из группы, состоящей из 1781, 1783, 1786, 2078, 2079, 2080 и 2088, на основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге АККазы.
10 24. Растение или клетка согласно любому из предшествующих вариантов реализации или растение или клетка, полученные с помощью любого из способов согласно предшествующим вариантам реализации, отличающиеся тем, что указанное растение или клетка содержит ген ацетилкофермент А-карбоксилазы (АККазы), который кодирует белок, содержащий мутацию в положении 2078, на основании нумерации
15 эталонной последовательности SEQ Ш NO: 1 лисохвоста мышехвостниковидного, или
в аналогичном аминокислотном остатке в паралоге АККазы, и которая дополнительно содержит ген ацетилкофермент А-карбоксилазы (АККазы), который кодирует белок, содержащий мутацию в одном или более положениях аминокислот, указанные положения выбраны из группы, состоящей из 1781, 1783, 1786, 2079, 2080 и 2088, на
20 основании нумерации эталонной последовательности SEQ Ш NO: 1 лисохвоста
мышехвостниковидного, или в аналогичном аминокислотном остатке в паралоге АККазы.
[0266] Для любых способов, растений, клеток или иного в каждом из указанных предшествующих вариантов реализации АККазы 11-24 далее описаны подходящие 25 мутации:
Замена аминокислоты
Изменение кодона
Замена аминокислоты
Изменение кодона
I1781A
АТА
GCT
C2088F
TGC
ттт
АТА
GCC
TGC
ттс
АТА
GCA
АТА
GCG
C2088G
TGC
GGT
TGC
GGC
I1781L
АТА
СТТ
TGC
GGA
АТА
СТС
TGC
GGG
АТА
СТА
АТА
CTG
С2088Н
TGC
CAT
АТА
ТТА
TGC
САС
АТА
TTG
Замена аминокислоты
Изменение кодона
Замена аминокислоты
Изменение кодона
С2088К
TGC
AAA
I1781M
АТА
ATG
TGC
AAG
I1781N
АТА
ААТ
C2088L
TGC
СТТ
АТА
ААС
TGC
СТС
TGC
СТА
I1781S
АТА
ТСТ
TGC
CTG
АТА
ТСС
TGC
ТТА
АТА
ТСА
TGC
TTG
АТА
TCG
C2088N
TGC
ААТ
I1781T
АТА
ACT
TGC
ААС
АТА
АСС
АТА
АСА
С2088Р
TGC
ест
АТА
ACG
TGC
ССС
TGC
ССА
I1781V
АТА
GTT
TGC
CCG
АТА
GTC
АТА
GTA
C2088Q
TGC
САА
АТА
GTG
TGC
CAG
G1783C
GGA
TGT
C2088R
TGC
CGT
GGA
TGC
TGC
CGC
TGC
CGA
А1786Р
GCT
ест
TGC
CGG
GCT
ССС
TGC
AGA
GCT
ССА
TGC
AGG
GCT
CCG
C2088S
TGC
ТСТ
D2078G
GAT
GGT
TGC
ТСС
GAT
GGC
TGC
ТСА
GAT
GGA
TGC
TCG
GAT
GGG
С2088Т
TGC
ACT
D2078K
GAT
AAA
TGC
АСС
GAT
AAG
TGC
АСА
TGC
ACG
D2078T
GAT
ACT
GAT
АСС
C2088V
TGC
GTT
GAT
АСА
TGC
GTC
GAT
ACG
TGC
GTA
TGC
GTG
S2079F
AGC
ТТТ
AGC
ТТС
C2088W
TGC
TGG
К2080Е
AAG
GAA
AAG
GAG
[0267] Альтернативные мутации включают, но не ограничены перечисленными далее мутациями:
S2079A
AGC
GCT
AGC
GCC
AGC
GCA
AGC
GCG
G1783A
GGA
GCT
GGA
GCC
GGA
GCA
GGA
GCG
A1786G
GCT
GGT
GCT
GGC
GCT
GGA
GCT
GGG
[0268] Касательно вариантов реализации 11 - 24, положения, соответствующие 1781т, 1783, 1786, 2078, 2079 и 2080, на основании нумерации эталонной последовательности лисохвоста мышехвостниковидного, хорошо известны в данной области, и их легко получить из подходящих баз данных последовательностей. В качестве примера в следующей таблице показаны соответствующие положения в последовательности АККазы риса:
Am: Alopecurus myosuroide; Osl: индийская разновидность Oryza sativa; OsJ: японская разновидность Oryza sativa.
25. Способ получения растения или клетки растения с мутированным геном EPSPS,
5 включающий введение в клетку растения олигонуклеооснования для репарации генов
(GRON), нацеленного на введение мутации в ген 5-енолпирувилшикимат-З-
фосфатсинтазы (EPSPS), для получения клетки растения с геном EPSPS, который
экспрессирует белок EPSPS, содержащий мутацию в одном или более положениях
аминокислот, соответствующих положению, выбранному из группы, состоящей из 96,
10 97 и 101, на основании нумерации последовательности аминокислот для эталонной
последовательности Escherichia coli SEQ Ш N0: 2, или в аналогичном аминокислотном остатке в паралоге EPSPS.
26. Способ получения растения или клетки растения с мутированным геном EPSPS, включающий введение в клетку растения агента для разрезания ДНК и
15 олигонуклеооснования для репарации генов (GRON), нацеленного на введение мутации
в ген 5-енолпирувилшикимат-З-фосфатсинтазы (EPSPS), для получения клетки растения с геном EPSPS, который экспрессирует белок EPSPS, содержащий мутацию в одном или более положениях аминокислот, соответствующих положению, выбранному из группы, состоящей из 96, 97 и 101, на основании нумерации последовательности
20 аминокислот для эталонной последовательности Escherichia coli SEQ Ш NO: 2, или в
аналогичном аминокислотном остатке в паралоге EPSPS.
27. Растение или клетка с мутированным геном EPSPS, отличающиеся тем, что указанное растение или клетка получены с помощью способа введения в клетку растения агента для разрезания ДНК и олигонуклеооснования для репарации генов (GRON),
25 нацеленного на введение мутации в ген 5-енолпирувилшикимат-З-фосфатсинтазы
(EPSPS), для получения клетки растения с геном EPSPS, который экспрессирует белок EPSPS, содержащий мутацию в одном или более положениях аминокислот,
соответствующих положению, выбранному из группы, состоящей из 96, 97 и 101, на основании нумерации последовательности аминокислот для эталонной последовательности Escherichia coli SEQ Ш NO: 2, или в аналогичном аминокислотном остатке в паралоге EPSPS.
5 28. Растение или клетка согласно любому из предшествующих вариантов реализации или растение или клетка, полученные с помощью любого из способов согласно предшествующим вариантам реализации, отличающиеся тем, что указанное растение или клетка растения экспрессируют белок EPSPS, содержащий мутацию в одном или более положениях аминокислот, выбранных из группы, состоящей из замены: глицина
10 на аланин в положении, соответствующем положению 96 в последовательности SEQ Ш
N0: 2; треонина на изолейцин в положении, соответствующем положению 97 в последовательности SEQ Ш N0: 2; пролина на аланин в положении, соответствующем положению 101 в последовательности SEQ Ш N0: 2; пролина на серии в положении, соответствующем положению 101 в последовательности SEQ Ш N0: 2; и пролина на
15 треонин в положении, соответствующем положению 101 в последовательности SEQ Ш
N0: 2.
29. Растение или клетка согласно любому из предшествующих вариантов реализации или растение или клетка, полученные с помощью любого из способов согласно предшествующим вариантам реализации, отличающиеся тем, что указанное растение
20 или клетка растения экспрессируют белок EPSPS, содержащий комбинации мутаций,
выбранные из группы, состоящей из замены: треонина на изолейцин в положении, соответствующем положению 97 в последовательности SEQ Ш N0: 2, и пролина на аланин в положении, соответствующем положению 101 в последовательности SEQ Ш N0: 2; треонина на изолейцин в положении, соответствующем положению 97 в
25 последовательности SEQ Ш N0: 2, и пролина на аланин в положении, соответствующем
положению 101 в последовательности SEQ Ш N0: 2; треонина на изолейцин в положении, соответствующем положению 97 в последовательности SEQ Ш N0: 2, и пролина на серии в положении, соответствующем положению 101 в последовательности SEQ Ш N0: 2; и треонина на изолейцин в положении, соответствующем положению 97
30 в последовательности SEQ Ш N0: 2, и пролина на треонин в положении,
соответствующем положению 101 в последовательности SEQ Ш N0: 2.
[0269] Касательно вариантов реализации 25 - 30, положения, соответствующие 96, 97 и 101, на основании нумерации эталонной последовательности Escherichia coli SEQ Ш NO: 2, хорошо известны в данной области, и их легко получить из соответствующих баз данных
последовательностей. См., например, патент США № 8268622. В качестве примера в следующей таблице показаны соответствующие положения в последовательности EPSPS
льна:
EPSPS льна
EPSPS Е. coli
Ген 1
Ген 2
G96 Т97 Р101
G176 Т177 Р181
G177 Т178 Р182
[0270] Последовательность EPSPS Е. coli представляет собой АгоА со следующей последовательностью:
MESLTLQPIARVDGTimPGSKTVSNRALLLAALAHGKTVLTNLLDSDDVRHML NALTALGVSYTLSADRTRCEIIGNGGPLHAEGALELFLGNAGTAMRPLAAALCL GSNDIVLTGEPRMKERPIGHLVDALRLGGAKITYLEQENYPPLRLQGGFTGGNV DVDGSVSSQFLTALLMTAPLAPEDTVIRIKGDLVSKPYroiTLNLMKTFGVEIENQ HYQQF VVKGGQ S YQ SPGT YLVEGD AS S AS YFL AAAAIKGGTVK VTGIGRNSMQ GDIRFADVLEKMGATICWGDDYISCTRGELNAroMDMNHIPDAAMTIATAALFA KGTTRLRNIYNWRVKETDRLFAMATELRKVGAEVEEGHDYIRITPPEKLNFAEIA T YNDHRM AMCF SL V AL SDTP VTILDPKC T AKTFPD YFEQL ARIS Q A A
[0271] Последовательность гена 1 льна представляет собой lcl - g41452_1333 со следующей последовательностью:
MALVTKICGGANAVALPATFGTRRTKSISSSVSFRSSTSPPSLKQRRRSGNVAAAAAA
PLRVSASLTTAAEKASTVPEEVVLQPIKDISGIVTLPGSKSLSNRILLLAALSEGTTVVD
NLLNSDDVHYMLGALKTLGLNVEHSSEQKRAIVEGCGGVFPVGKLAKNDIELFLGN
AGTAMRPLTAAVTAAGGNSSYILDGVPRMRERPIGDLVVGLKQLGADVTCSSTSCPP
VHVNGQGGLPGGKVKLSGSISSQYLTALLMAAPLALGDVEIEIVDKLISVPYVDMTL
KLMERFGVAVEHSGSWDRFFVKGGQKYKSPGNAYVEGDASSASYFLAGAAITGGTI
TVEGCGTSSLQGDVKFAEVLEKMGAKVIWTENSVTVTGPPRDASGRKHLRAVDVN
MNKMPDVAMTLAVVALYADGPTAIRDVASWRVKETERMIAICTELRKLGATVEEGP
DYCIITPPEKLNIAEroTYDDHRMAMAFSLAACADVPVTIRDPGCTKKTFPDYFEVLE
RYTKH
[0272] Последовательность гена 2 льна представляет собой lcl - g40547_1271 со следующей последовательностью:
М AQ VTKIC GGAN AV ALP ATFGTRRTK SISSSVSFRSSTSPP SLKQRRLLGN V А А А А А А
APLRISASLATAAEKASTVPEEIVLQPIKDISGIVTLPGSKSLSNRILLLAALSEGKTVV
DNLLNSDDVHYMLGALKTLGLNVEHSSEQKRAIVEGRGGVFPVGKLGKNDIELFLG
NAGTAMRPLTAAVTAAGGNSSYILDGVPRMRERPIGDLVVGLKQLGADVSCSSTSCP
PVHVNAKGGLPGGKVKLSGSISSQYLTALLMAAPLALGDVEIEIVDKLISVPYVDMT
LKLMERFGVAVEHSGSWDRFFVKGGQKYKSPGNAYVEGDASSASYFLAGAAITGGT
ITVEGCGTSSLQGDVKFAEVLEKMGAKVTWTETSVTVTGPPRDASGKKHLRAVDVN
MNKMPDVAMTLAVVALYADGPTAIRDVASWRVKETERMIAVCTELRKLGATVEEG
PDYCIITPPEKLSIAEIDTYDDHRMAMAFSLAACADVPVTIRDPGCTKKTFPDYFEVLE
RYTKH
30. Способ или клетка согласно любому из предшествующих вариантов реализации,
5 отличающиеся тем, что указанный агент для разрезания ДНК представляет собой один
или более агентов для разрезания, выбранных из CRISPR, TALEN, цинкового пальца, мегануклеазы и разрезающего ДНК антибиотика.
31. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой CRISPR или TALEN.
32. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой CRISPR.
33. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой TALEN.
34. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой один или более разрезающих ДНК антибиотиков, выбранных из группы, состоящей из блеомицина, зеоцина, флеомицина, таллисомицина и пеплеомицина.
35. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой зеоцин.
36. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON одноцепочечный.
37. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON представляет собой химически защищенный олигонуклеотид.
38. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит химически защищенный олигонуклеотид с защитной группой на 5'-конце.
39. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит химически защищенный олигонуклеотид с защитной группой на 3'-конце.
40. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит химически защищенный олигонуклеотид с защитной группой на 5'- и 3'-концах.
31.
41. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит одну или более групп, выбранных
из группы СуЗ, группы 3PS и 2'-0-метильной группы.
42. Способ или клетка согласно любому из предшествующих вариантов реализации,
5 отличающиеся тем, что указанный GRON содержит группу СуЗ.
43. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит группу СуЗ у первого основания на
5'-конце.
44. Способ или клетка согласно любому из предшествующих вариантов реализации,
10 отличающиеся тем, что указанный GRON содержит группу СуЗ у первого основания на
3'-конце.
45. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит группу 3PS.
46. Способ или клетка согласно любому из предшествующих вариантов реализации,
15 отличающиеся тем, что указанный GRON содержит две или более групп 3PS.
47. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит три или более групп 3PS.
48. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит группу 3PS у первого основания на
20 5'-конце.
49. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит группу 3PS у первого основания на 3'-конце.
50. Способ или клетка согласно любому из предшествующих вариантов реализации,
25 отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу.
51. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит две или более 2'-0-метильных
групп.
52. Способ или клетка согласно любому из предшествующих вариантов реализации,
30 отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу у первого
основания на 5'-конце.
53. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу у первого
основания на 5'-конце и не содержит каких-либо других 2'-0-метильных групп.
54. Способ или клетка согласно любому из предшествующих вариантов реализации,
5 отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом
из первых двух или более оснований на 5'-конце.
55. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом
из первых трех или более оснований на 5'-конце.
10 56. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых четырех или более оснований на 5' -конце.
57. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом
15 из первых пяти или более оснований на 5'-конце.
58. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых шести или более оснований на 5'-конце.
59. Способ или клетка согласно любому из предшествующих вариантов реализации,
20 отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом
из первых семи или более оснований на 5'-конце.
60. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом
из первых восьми или более оснований на 5'-конце.
25 61. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых девяти или более оснований на 5'-конце.
62. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом
30 из первых десяти или более оснований на 5'-конце.
63. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанный GRON содержит 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 РНК-
оснований на 5'-конце.
64. Способ или клетка согласно любому из предшествующих вариантов реализации,
5 отличающиеся тем, что указанный GRON содержит неоднозначную пару оснований
относительно последовательности-мишени для генетического изменения.
65. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что длина указанного GRON составляет от 15 до 60 нуклеотидов.
66. Способ или клетка согласно любому из предшествующих вариантов реализации,
10 отличающиеся тем, что длина указанного GRON составляет 41 нуклеотид.
67. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет от 50 до 110 нуклеотидов.
68. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет 101 нуклеотид.
15 69. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет от 150 до 210 нуклеотидов.
70. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что длина указанного GRON составляет 201 нуклеотид.
71. Способ или клетка согласно любому из предшествующих вариантов реализации,
20 отличающиеся тем, что длина указанного GRON составляет от 70 до 210 нуклеотидов.
72. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 70 нуклеотидов.
73. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 100 нуклеотидов.
25 74. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 165 нуклеотидов.
75. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что длина указанного GRON составляет более 175 нуклеотидов.
76. Способ или клетка согласно любому из предшествующих вариантов реализации,
30 отличающиеся тем, что длина указанного GRON составляет более 185 нуклеотидов.
77. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 195 нуклеотидов.
78. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 200 нуклеотидов.
79. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 210 нуклеотидов.
80. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 220 нуклеотидов.
81. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 230 нуклеотидов.
82. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 240 нуклеотидов.
83. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 250 нуклеотидов.
84. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 260 нуклеотидов.
85. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 270 нуклеотидов.
86. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 280 нуклеотидов.
87. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 290 нуклеотидов.
88. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 300 нуклеотидов.
89. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 400 нуклеотидов.
90. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 500 нуклеотидов.
91. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 600 нуклеотидов.
77.
92. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 700 нуклеотидов.
93. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 800 нуклеотидов.
5 94. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что длина указанного GRON составляет более 900 нуклеотидов.
95. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что длина указанного GRON составляет более 1000 нуклеотидов.
96. Способ или клетка согласно любому из предшествующих вариантов реализации,
10 отличающиеся тем, что указанное растение выбрано из группы, состоящей из
следующих растений: канола, подсолнечник, кукуруза, табак, сахарная свекла,
хлопчатник, маис, пшеница, ячмень, рис, люцерна, ячмень, сорго, томат, манго, персик,
яблоко, груша, клубника, банан, дыня, маниока, картофель, морковь, латук, лук, соевый
боб, виды сои, сахарный тростник, горох, нут, горох полевой, садовый боб, чечевица,
15 репа, брюква, брюссельская капуста, люпин, цветная капуста, капуста кормовая,
конские бобы, тополь, сосна, эвкалипт, виноград, цитрусовое растение, тритикале, люцерна, рожь, овес, дерн и кормовые травы, лен, масличный рапс, горчица, огурец, вьюнок, бальзамин, перец, баклажан, бархатец, лотос, кочанная капуста, нивяник, гвоздика, тюльпан, ирис и лилия.
20 97. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение представляет собой канолу.
98. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанное растение представляет собой кукурузу.
99. Способ или клетка согласно любому из предшествующих вариантов реализации,
25 отличающиеся тем, что указанное растение представляет собой маис.
100. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение представляет собой рис.
101. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение представляет собой сорго.
30 102. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение представляет собой картофель.
103. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение представляет собой соевый боб.
104. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение представляет собой лен.
5 105. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение представляет собой масличный рапс.
106. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанное растение представляет собой маниоку.
107. Способ или клетка согласно любому из предшествующих вариантов реализации,
10 отличающиеся тем, что указанное растение представляет собой подсолнечник.
108. Способ, позволяющий вызвать генетическое изменение в клетке растения,
указанный способ включает воздействие на указанную клетку CRISPR и
модифицированного GRON.
109. Способ или клетка согласно любому из предшествующих вариантов реализации,
15 отличающиеся тем, что вносится множество генетических изменений.
110. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что применяется два или более РНК-проводников.
111. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что каждый из более чем одного РНК-проводников комплементарен
20 отдельной мишени для генетического изменения.
112. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что CRISPR содержит никазу.
113. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что агент для разрезания ДНК содержит две или более никаз.
25 114. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что две или более никаз разрезают противоположные цепи целевой последовательности нуклеиновой кислоты.
115. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что две или более никаз разрезают одну и ту же цепь целевой
30 последовательности нуклеиновой кислоты.
116. Нетрансгенное устойчивое или толерантное к гербициду растение, полученное с
помощью способа или из клетки согласно любому из предшествующих вариантов
реализации.
117. Способ или клетка согласно любому из предшествующих вариантов реализации, 5 отличающиеся тем, что указанная клетка растения содержит генетическое изменение
или мутацию в ацетилкофермент А-карбоксилазе (АККазе), и выбрана из группы, состоящей из клеток следующих растений: ячменя, кукурузы, проса, овса, ржи, риса, сорго, сахарного тростника, газонных трав и пшеницы.
118. Способ или клетка согласно любому из предшествующих вариантов реализации, 10 отличающиеся тем, что указанная клетка растения содержит генетическое изменение
или мутацию в ацетилкофермент А-карбоксилазе (АККазе) и устойчива или толерантна к одному или более гербицидам.
119. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанная клетка растения содержит генетическое изменение
15 или мутацию в ацетилкофермент А-карбоксилазе (АККазе) и устойчива к одному или
более ингибирующим АККазу гербицидам.
120. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанная клетка растения содержит генетическое изменение или мутацию в ацетилкофермент А-карбоксилазе (АККазе) и устойчива к одному или
20 более гербицидам, выбранным из группы, состоящей из: аллоксидима, бутроксидима,
клетодима, клопроксидима, циклоксидима, сетоксидима, тепралоксидима, тралкоксидима, хлоразифопа, клодинафопа, клофопа, диклофопа, феноксапропа, феноксапропа-П, фентиапропа, флуазифопа, флуазифопа-П, галоксифопа, галоксифопа-П, изоксапирифопа, пропахизафопа, хизалофопа, хизалофопа-П, трифопа, пиноксадена,
25 агрономически приемлемых солей и сложных эфиров любого из данных гербицидов и
их комбинаций.
121. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанная клетка растения содержит генетическое изменение или мутацию в 5-енолпирувилшикимат-З-фосфатсинтазе (EPSPS) и что указанная
30 клетка растения выбрана из группы, состоящей из клеток следующих растений:
кукуруза, пшеница, рис, ячмень, сорго, овес, рожь, сахарный тростник, соя, хлопчатник, сахарная свекла, масличный рапс, канола, лен, маниока, подсолнечник, картофель, табак, томат, люцерна, тополь, сосна, эвкалипт, яблоко, латук, горох, чечевица, виноград и газонные травы.
122. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение или клетка растения содержат генетическое изменение или мутацию в 5-енолпирувилшикимат-З-фосфатсинтазе (EPSPS) и что указанное растение или клетка растения устойчивы к по меньшей мере одному
5 гербициду.
123. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение или клетка растения содержит генетическое изменение или мутацию в 5-енолпирувилшикимат-З-фосфатсинтазе (EPSPS) и что указанное растение или клетка растения устойчивы к гербициду из семейства
10 фосфонометилглицинов.
124. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение или клетка растения содержит генетическое изменение или мутацию в 5-енолпирувилшикимат-З-фосфатсинтазе (EPSPS) и что указанное растение или клетка растения устойчивы к глифосату.
15 125. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное растение или клетка растения содержит генетическое изменение или мутацию в 5-енолпирувилшикимат-З-фосфатсинтазе (EPSPS) и что указанное растение или клетка растения выбраны из группы, состоящей из клеток следующих растений: кукуруза, пшеница, рис, ячмень, сорго, овес, рожь, сахарный
20 тростник, соя, хлопчатник, сахарная свекла, масличный рапс, канола, лен, маниока,
подсолнечник, картофель, табак, томат, люцерна, тополь, сосна, эвкалипт, яблоко, латук, горох, чечевица, виноград и газонные травы.
126. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение или мутация в клетке
25 возникает в одной аллели гена.
127. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение или мутация в клетке возникает в двух аллелях гена.
128. Способ или клетка согласно любому из предшествующих вариантов реализации,
30 отличающиеся тем, что указанное генетическое изменение или мутация в клетке
возникает в трех аллелях гена.
129. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанное генетическое изменение или мутация в клетке
возникает в четырех аллелях гена.
130. Способ или клетка согласно любому из предшествующих вариантов реализации,
5 отличающиеся тем, что указанное генетическое изменение или мутация в клетке
возникает в одной, двух, трех, четырех, пяти, шести, семи, восьми, девяти, десяти, одиннадцати или двенадцати аллелях гена.
131. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение или мутация в клетке
10 включает делецию или вставку, приводящую к нокауту одной аллели гена.
132. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение или мутация в клетке включает делецию или вставку, приводящую к нокауту двух аллелей гена.
133. Способ или клетка согласно любому из предшествующих вариантов реализации,
15 отличающиеся тем, что указанное генетическое изменение или мутация в клетке
включает делецию или вставку, приводящую к нокауту трех аллелей гена.
134. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанное генетическое изменение или мутация в клетке
включает делецию или вставку, приводящую к нокауту четырех аллелей гена.
20 135. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение или мутация в клетке включает делецию или вставку, приводящую к нокауту одной, двух, трех, четырех, пяти, шести, семи, восьми, девяти, десяти, одиннадцати или двенадцати аллелей гена.
136. Способ или клетка согласно любому из предшествующих вариантов реализации,
25 отличающиеся тем, что указанное генетическое изменение или мутация в клетке
возникает в одной аллели гена, и вторая аллель гена содержит делецию или вставку, приводящую к нокауту указанной второй аллели.
137. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанное генетическое изменение или мутация в клетке
30 возникает в одной аллели гена, и вторая аллель и третья аллель гена содержит делецию
или вставку, приводящую к нокауту указанной второй аллели и указанной третьей аллели.
138. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение или мутация в клетке возникает в одной аллели гена, и вторая аллель, третья аллель и четвертая аллель гена содержит делецию или вставку, приводящую к нокауту указанной второй аллели, указанной третьей аллели и указанной четвертой аллели.
139. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение в клетке включает по меньшей мере одну мутацию в одной аллели и по меньшей мере один нокаут в другой аллели.
140. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение в клетке включает по меньшей мере одну мутацию в одной аллели и по меньшей мере один нокаут в по меньшей мере одной другой аллели.
141. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение в клетке включает по меньшей мере одну мутацию в одной аллели и по меньшей мере один нокаут в по меньшей мере двух других аллелях.
142. Способ или клетка согласно любому из предшествующих вариантов реализации, отличающиеся тем, что указанное генетическое изменение в клетке включает по меньшей мере одну мутацию в одной аллели и по меньшей мере один нокаут в по меньшей мере трех других аллелях.
143. Способ или клетка согласно любому из предшествующих вариантов реализации,
отличающиеся тем, что указанное генетическое изменение в клетке включает по
меньшей мере одну мутацию в одной аллели и нокаут во всех других аллелях.
ПРИМЕРЫ
[0273] Далее следуют примеры, в которых проиллюстрированы процедуры применения на практике способов и композиций, описанных в данной заявке. Данные примеры не должны истолковываться, как накладывающие ограничения.
[0274] Пример 1. Длина GRON.
[0275] У Sommer и др. (Mol Biotechnol. 33:115-22, 2006) описана репортерная система для обнаружения изменения генов in vivo, которая основывается на изменении одного нуклеотида, приводящем к преобразованию синей и зеленой флуоресценции в вариантах
зеленого флуоресцентного белка (GFP). Такая репортерная система пригодна для применения в следующих экспериментах с использованием Arabidopsis thaliana в качестве модельного вида, чтобы оценить эффективность превращения GRON после модификации длины GRON.
[0276] Вкратце, для данного и последующих примеров получали линию Arabidopsis thaliana с несколькими копиями гена синего флуоресцентного белка с помощью способов, известных специалистам в данной области техники (см., например, Clough и Brent, 1998). Из корня данной линии получали меристематические культуры ткани, которые применяли для выделения и культивирования протопластов (см., например, Mathur и др., 1995). Доставки GRON в протопласты добивались путем опосредованного полиэтиленгликолем (ПЭГ) поглощения GRON протопластами. Применяли способ с использованием 96-луночного формата, аналогичный таковому, описанному в Fujiwara и Kato (2007). Протокол вкратце описан далее. Приведенные объемы соответствуют объемам, добавляемым в отдельные лунки 96-луночного планшета.
1. Смешивали 6,25 мкл GRON (80 мкМ) с 25 мкл протопластов, полученных из меристематической ткани трансгенного по BFP корня Arabidopsis thaliana, при концентрации 5 х 106 клеток/мл в каждой лунке 96-луночного планшета.
2. Добавляли 31,25 мкл 40 % раствора ПЭГ и перемешивали протопласты.
3. Обработанные клетки инкубировали на льду в течение 30 мин.
4. В каждую лунку добавляли 200 мкл раствора W5 и перемешивали клетки.
5. Планшеты оставляли для инкубации на льду в течение 30 мин, позволяя протопластам осесть на дно каждой лунки.
6. Удаляли 200 мкл среды над осевшими протопластами.
7. Добавляли 85 мкл культуральной среды (MSAP, см. Mathur и др., 1995).
8. Планшеты инкубировали при комнатной температуре в темноте в течение 48 часов. Конечная концентрация GRON после добавления культуральной среды составляла 8 мкМ.
[0277] Через сорок восемь часов после доставки GRON образцы анализировали с помощью проточной цитометрии для того, чтобы обнаружить протопласты, зеленая и желтая флуоресценция которых отличается от таковой у контрольных протопластов (BFP0 обозначает ненацеливающие GRON без изменения по сравнению с BFP-мишенью; С представляет собой схему кодирующей нити и NC представляет собой схему
не кодирующей нити). Замена одного нуклеотида С на Т (кодирующая нить) или направленная мутация нуклеотида G на А (некодирующая нить) в центре молекул BFP4. Зеленая флуоресценция вызывалась введением направленной мутации в ген BFP, что приводило к синтезу GFP. Результаты показаны на фигуре 1.
5 [0278] В таблице 2 показана последовательность типичного 101-мера и 201-мера BFP4/NC 5'-3PS/3'-3PS GRON, разработанного для превращения гена синего флуоресцентного белка (BFP), чтобы он давал зеленую флуоресценцию. 3PS обозначает 3 фосфотиоатных связи на каждом из 5' - и 3'-концов олигонуклеотида.
[0279] Таблица 2. Типичные последовательности нуклеотидов GRON для 10 превращения BFP в GFP.
Название GRON
Последовательность нуклеотидов GRON
BFP4/NC 101-мер
G* T*C*G TGC TGC TTC ATG TGG TCG GGG TAG CGG CTG AAG CAC TGC ACG CCG TAG GTG AAG GTG GTC ACG AGG GTG GGC CAG GGC ACG GGC AGC TTG CCG G*T*G* G
BFP0/NC 101-мер
G* T*C*G TGC TGC TTC ATG TGG TCG GGG TAG CGG CTG AAG CAC TGC ACG CCG TGG GTG AAG GTG GTC ACG AGG GTG GGC CAG GGC ACG GGC AGC TTG CCG G*T*G *G
BFP4/C 101-мер
С *C*A*C CGG CAA GCT GCC CGT GCC CTG GCC CAC CCT CGT GAC CAC CTT CAC СТА CGG CGT GCA GTG CTT CAG CCG СТА ССС CGA CCA CAT GAA GCA GCA C*G*A *C
BFP0/C 101-мер
C*C*A*CCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCAC CTTCACCCACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATG AAGCAGCAC*G*A* С
BFP4/NC 201-мер
A*A*G*ATGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACT TGAAGAAGTCGTGCTGCTTCATGTGGTCTGGGTAGCGGCTGAAGC ACTGCACGCCGTAGGTGAAGGTGGTCACGAGGGTGGGCCAGGGCA CGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGC CG TAGGTGGCATCGCCCTCG *C*C*C
BFP0/NC 201-мер
A*A*G*TGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTT GAAGAAGTCGTGCTGCTTCATGTGGTCGGGGTAGCGGCTGAAGCA CTGCACGCCGTGGGTGAAGGTGGTCACGAGGGTGGGCCAGGGCAC GGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCC G TAGGTGGCATCGCCCTCG *C*C*C
BFP4/C 201-мер
G*G*G*CGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTC ATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGA CCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCA CATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTA CGTCCAGGA GCGCACCAT *C*T*T
BFP0/C 201-мер
G*G*G*CGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTC ATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGA CCACCTTCACCCACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCA CATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTA CGTCCAGGA GCGCACCAT*C*T*T
* = PS-СВЯЗЬ ((
юсфотиоатная)
[0280] Пример 2. Уровни превращения при применении GRON, меченых 5'-Су 3/3'-idC.
[0281] Целью данной серии примеров было сравнение эффективности GRON, меченых фосфотиоатом (PS) (содержащих 3 PS-группы на каждом конце GRON), с эффективностью 5 GRON, меченых 5'-Cy3/3'-idC. GRON, меченые 5'-Cy3/3'-idC, содержали 5'-СуЗ (флуорофор амидит) и З'-idC (перевернутое основание). Эффективность оценивали по превращению синего флуоресцентного белка (BFP), после которого он давал зеленую флуоресценцию.
[0282] Во всех трех примерах, в которых опосредованная ПЭГ доставка GRON в 10 протопласты проводилась либо в отдельных пробирках Falcon (обозначенных "пробирки"), либо в 96-луночных планшетах (обозначенных "96-луночный планшет"), не наблюдали существенного различия в эффективности превращения BFP в GFP между различными химическими составами GRON, что определили с помощью цитометрии (фигура 1).
[0283] Пример 3. Сравнение между 41-мерным GRON BFP4/NC 5'-3PS/3'-3PS и 2'-15 O-Me-GRON.
[0284] Целью данной серии примеров было сравнение эффективности превращения посредством GRON, меченых фосфотиоатом (PS) (с 3 PS-группами на каждом конце GRON), с эффективностью превращения посредством 2'-O-Me-GRON или "GRON фрагментов Оказаки" в присутствии и отсутствие представителя семейства блеомицина -20 зеоцина(tm) (1 мг/мл), чтобы вызвать разрывы ДНК. Схемы данных GRON изображены на фигуре 2. GRON доставляли в протопласты Arabidopsis thaliana с BFP путем обработки ПЭГ и определяли превращение BFP в GFP через 24 ч после обработки с помощью цитометрии. Образцы, обработанные зеоцином (1 мг/мл), инкубировали с зеоцином в течение 90 мин на льду перед обработкой ПЭГ.
25 [0285] Обычно присутствие зеоцина (1 мг/мл) повышало превращение BFP в GFP, что определяли с помощью цитометрии (таблица 3). Как в присутствии, так и отсутствие зеоцина, NC Оказаки GRON, содержащий одну 2'-ОМе группу на первом основании РНК на 5'-конце GRON, более эффективно превращал BFP в GFP по сравнению с NC Оказаки GRON, содержащим одну 2'-ОМе группу на каждом из первых девяти 5'-концевых
30 оснований РНК (фигура 2 и таблица 3).
[0286] Во всех примерах не наблюдали существенного различия между 41-мерным BFP4/NC 5'-3PS/3'-3PS и 71-мерным BFP4/NC GRON фрагмента Оказаки, который содержал одну 5' 2'-О группу на первом 5'-основании РНК (обозначен BFP4 71-мер (1)
NC), в превращении BFP в GFP как в присутствии, так и в отсутствие 1 мг/мл зеоцина, что определили с помощью цитометрии (фигура 2 и таблица 3). Важно отметить, что в присутствии зеоцина (что также ожидается для блеомицина, флеомицина, таллисомицина, пеплеомицина и других представителей данного семейства антибиотиков) такое превращение не зависело от конкретной нити (т.е. исследованные конструкции GRON как с кодирующей (С), так и с не кодирующей (NC) нитью в данных примерах проявляли приблизительно равную активность).
[0287] Таблица 3. Сравнение стандартной конструкции GRON с конструкциями GRON фрагментов Оказаки в присутствии и отсутствие гликопептидного антибиотика зеоцина.
Зеоцин (+)
Эксп. название
BFP4 41-мер
BFP4 71-мер (0)
BFP4 71-мер (1)
BFP4 71-мер (9)
АРТ043
0,13
0,0875
0,2275
0,2075
0,355
0,2275
0,2325
0,195
АРТ066
1,9
0,713
0,762
0,683
1,318
0,7103
0,769
0,883
Среднее
1,015
0,40025
0,49475
0,44525
0,8365
0,4689
0,50075
0,539
Ст.отклон
1,251579
0,442295
0,377949
0,336229
0,680944
0,341391
0,379363
0,486489
Ст. ошибка
0,885134
0,312797
0,26729
0,237786
0,481573
0,241436
0,268291
0,344052
BFP4 71-мер (1)
Первые 10 п.о. с 5'-конца представляют собой РНК и первая п.о. на 5'-конце содержит 2'-0-Ме
BFP4 71-мер (9)
Первые 10 п.о. с 5'-конца представляют собой РНК и первые девять п.о. на 5'-конце содержат 2'-О-Me
[0288] Пример 4. Сравнение 41-мерного, 101-мерного и 201-мерного BFP4/NC 5'-3PS/3'-3PS GRON.
5 [0289] Целью данной серии примеров было сравнение эффективности превращения (в присутствии и отсутствие зеоцина) посредством GRON, меченых фосфотиоатом (PS) (с 3 PS-группами на каждом конце GRON), различной длины: 41-мерного, 101-мерного и 201-мерного, - показанных в таблице 2. Снова присутствие зеоцина (1 мг/мл) повышало частоту превращений BFP в GFP, что определили с помощью цитометрии (таблица 4). Ход кривой
10 во всех трех примерах был линейным при возрастании длины NC GRON как в присутствии, так и в отсутствие зеоцина. За исключением BFP-4/NC/101 и BFP-4/C/101 в присутствии зеоцина, уровни превращения были практически равны, но меньше, чем у 41-мерного NC GRON. Это противоположно всем предшествующим примерам, в которых применяли кодирующие и не кодирующие GRON BFP-4/41, где некодирующий GRON всегда сильно
15 превосходил кодирующий GRON. Такая асимметрия частоты превращения также распространялась на BFP-4/201 GRON, применяемые в данной серии примеров.
[0290]
Зеоцин (-)
Эксп. название
BFP4 41-мер
BFP4 101-мер
BFP4 201-мер
АРТ038
0,05
0,01
0,1025
0,025
0,5725
0,025
АРТ066
0,109
0,007
0,214
0,047
0,566
0,035
Среднее
0,0795
0,0085
0,15825
0,036
0,56925
0,03
Ст.отклон
0,0417193
0,002121
0,078842
0,015556
0,004596
0,007071
Ст. ошибка
0,02950446
0,0015
0,055758
0,011002
0,00325
0,005001
[0291] Пример 5. Доставка белка Cas9 в растения.
[0292] В данном примере используется доставка рекомбинантного белка Cas9 напрямую 5 в клетки растения в качестве альтернативы доставке плазмиды экспрессии CRISPR-Cas. В данном способе применяют носители, такие как проникающие в клетку пептиды (СРР),
реагенты для трансфекции посредсвом липосом, полиэтиленгликоль (ПЭГ), либо отдельно, либо в комбинации, чтобы обеспечить возможность доставки активного рекомбинантного белка Cas9 в клетки.
[0293] Методы
5 [0294] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из
индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Меченый флуоресцентной меткой рекомбинантный белок Cas9 (1 мкг), предварительно покрытый проникающими в клетку пептидами (СРР) при соотношении СРР к грузу 20:1, 10:1 или 5:1,
10 или при другом соотношении (ТАТ, пенетратин, Chariot(tm), РЕР-1 или другие, в качестве примера), или инкапсулированный с помощью липосомальных реагентов затем смешивали с высеянными протопластами и инкубировали при 23 °С в течение 2 - 6 ч, чтобы позволить комплексам Саз9/носитель проникнуть в клетки. В другой серии обработок меченый флуоресцентной меткой рекомбинантный белок Cas9 (1 мкг), либо предварительно
15 покрытый СРР, как описано выше, либо не покрытый, вводили в протопласты, применяя методику ПЭГ. Протопласты затем анализировали с помощью проточной цитометрии через 24 ч после обработки, чтобы определить процент Саз9-положительных протопластов при данной обработке.
[0295] Пример 6. CRISPR с 201-мерными ± неоднозначное основание GRON.
20 [0296] Цель данной серии примеров состояла в демонстрации превращения BFP в GFP в нашей трансгенной по BFP модельной системе Arabidopsis thaliana с применением CRISPR для создания целевых двухцепочечных разрывов в гене bjp и 201-мерных GRON, которые опосредуют превращение. BFP CRISPR нацелен на кодирующую цепь гена bjp, и изменяемый сайт находится на расстоянии 27 п.о. против хода транскрипции от
25 последовательности РАМ (фигура 3). GRON используют в качестве матрицы для репарации двухцепочечного разрыва, созданного CRISPR в гене bjp, и наряду с превращением целевого гена BFP в GFP, он вводит неоднозначное основание в ген bjp, которое также соответствует последовательности РАМ BFP CRISPR. Неоднозначное основание в последовательности РАМ BFP CRISPR предположительно минимизирует повторное
30 разрезание гена bjp посредством CRISPR после того, как произошло превращение. Данная серия примеров поможет изучить, повысит ли эффективность превращения введение неоднозначного основания в последовательность РАМ BFP CRISPR в измененных генах bjp или нет.
[0297] Методы
[0298] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из
индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды, кодирующие CRISPR, содержали промотор маннопинсинтазы (MAS), запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9, и промотор U6 Arabidopsis, запускающий экспрессию опРНК, с терминатором поли-Т10. Плазмиды CRISPR вместе с GRON вводили в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл и 0,16 мкМ, соответственно. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем анализировали с помощью проточного цитометра, чтобы определить процент GFP-положительных протопластов при данной обработке.
[0301] Результаты
[0299] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессируются с одной и той же плазмиды. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсер ную последовательность, используемую для того, чтобы направить нуклеазу Cas9 к целевому гену BFP. В данном примере BFP нацелен на ген bjp (фигура 3). 201-мерные GRON, нацеленные на BFP с неоднозначными основаниями или без них, использовали, чтобы определить их влияние на уровень превращения BFP в GFP. В таблице 5 приведен перечень GRON и соответствующих их последовательностей.
[0302] При применении BFP CRISPR, BFP4/C GRON с неоднозначными основаниями до 3,5 раз более эффективно превращает BFP в GFP по сравнению с BFP4/C GRON без неоднозначных оснований (таблица 6). Наблюдают 5,9-кратное повышение уровня превращения BFP в GFP, когда BFP4/C GRON с неоднозначным основанием применяют 5 вместо BFP4/NC GRON с неоднозначным основанием (таблица 6). Следовательно, BFP4/C GRON с неоднозначным основанием наиболее эффективно превращает BFP в GFP, когда его применяют вместе с BFP CRISPR.
[0303] Выводы
[0304] Включение в GRON неоднозначного основания, которое изменяет
10 последовательность РАМ в BFP CRISPR в измененном целевом гене, повышает уровень превращения BFP в GFP. Превращение BFP в GFP посредством BFP CRISPR вместе с GRON с неоднозначным основанием подтверждали с помощью секвенирования нового поколения (результаты не представлены). Кроме того, способность BFP CRISPR расщеплять ДНК и вызывать инсерционно-делеционные мутации в гене bjp подтверждали 15 с помощью секвенирования нового поколения (результаты не представлены).
[0305] ТАБЛИЦА 6. Процент превращения BFP в GFP, определенный с помощью цитометрии через 72 ч после опосредованной ПЭГ доставки BFP CRISPR и GRON в протопласты, полученные из трансгенной по BFP линии 21-15-09 Arabidopsis thaliana.
Эксп. назван ие
Процент GFP-положительных клеток (ст.отклон)
CRISPR: BFP5
BFP4/C GRON
BFP4/NC GRON
(-)
неоднозначное
(+)1 неоднозначное
(-)
неоднозначное
(+)1 неоднозначное
Эксп. 1
0,46 (0,07)
1,59(0,06)
0,08 (0,02)
0,27 (0,04)
Эксп. 2
0,24 (0,03)
0,61 (0,05)
0,04 (0,01)
0,16 (0,04)
20 [0306] Пример 7. CRISPR с модифицированными СуЗ GRON.
[0307] Цель данной серии примеров состояла в демонстрации превращения BFP в GFP в нашей трансгенной по BFP модельной системе Arabidopsis thaliana с применением CRISPR для создания целевых двухцепочечных разрывов в гене bjp и GRON для опосредования превращения. BFP6 CRISPR (CR:BFP6), используемый в данных примерах, нацелен на ген 25 bjp и вызывает двухцепочечный разрыв в ДНК около изменяемого сайта. GRON, применяемые вместе с BFP6 CRISPR, содержат кодирующую последовательность гена bjp вблизи изменяемого сайта, и помечены с 5'-конца - СуЗ и с 3'-конца - перевернутым основанием idC, и их называют в данной заявке СуЗ GRON. Данные GRON исследовали
при трех различных длинах: в виде 41-меров, 101-меров и 201-меров, и их непосредственно сравнивали с 3PS-GRON, которые отличаются от СуЗ GRON только тем, что они содержат 3 фосфотиоатные связи на обоих 5'- и 3'-концах GRON. Данные GRON в данном тексте называют 3PS-GRON. См. в таблице 7 перечень GRON, применяемых в данных примерах.
5 [0308] Методы
[0309] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из
индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды, кодирующие CRISPR, содержали промотор Mas, запускающий экспрессию кодирующей
10 последовательности Cas9, с терминатором rbcSE9, и промотор U6 Arabidopsis thaliana, запускающий экспрессию опРНК, с терминатором поли-Т10. Плазмиды CRISPR вместе с GRON вводили в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл для CRISPR и 8,0 мкМ для 41-мерного, 0,32 мкМ для 101-мерного и 0,16 мкМ для 201-мерного GRON. При обработке только GRON конечная
15 концентрация GRON после опосредованной ПЭГ доставки составляла 8,0 мкМ для 41-мерного, 5,0 мкМ для 101-мерного и 2,5 мкМ для 201-мерного GRON. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем анализировали с помощью проточного цитометра, чтобы определить процент GFP-положительных протопластов при данной обработке.
20 [0310] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессируются с одной и той же плазмиды. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную последовательность, используемую для того, чтобы направить нуклеазу Cas9 к целевому
25 гену BFP. В данном эксперименте использовали BFP6 CRISPR (5'-GGTGCCGCACGTCACGAAGTCGG-3'), который нацелен на ген bjp. Указанные GRON содержат кодирующую последовательность гена bjp около изменяемого сайта. В таблице 7 приведен перечень используемых GRON.
[0312] Результаты
[0313] При применении BFP6 CRISPR, СуЗ GRON при всех исследованных длинах 5 способны опосредовать превращение BFP в GFP также эффективно, как и 3PS-GRON (фигура 4). В целом, в образцах, содержащих BFP6 CRISPR и GRON, наблюдали более высокие уровни превращения BFP в GFP по сравнению с образцами, содержащими только GRON (фигура 4), что демонстрирует положительное влияние, которое оказывают CRISPR на повышение уровней превращения.
10 [0314] Пример 8. CRISPR с GRON различного размера.
[0315] Цель данной серии примеров состояла в демонстрации превращения BFP в GFP в нашей трансгенной по BFP модельной системе Arabidopsis thaliana с применением CRISPR для создания целевых двухцепочечных разрывов в гене bjp и GRON различной длины, чтобы опосредовать превращение. BFP CRISPR, применяемый в данных примерах, нацелен
15 на ген bjp и вызывает двухцепочечный разрыв в ДНК около изменяемого сайта. GRON, применяемые вместе с BFP CRISPR, содержат кодирующую последовательность гена bjp вблизи изменяемого сайта и помечены как по 5'-концу, так и по 3'-концу 3 фосфотиоатными связями, и в данном тексте их называют 3PS-GRON. Данные GRON исследовали при трех различных длинах: 60-меры, 101-меры и 201-меры, - и их
20 непосредственно сравнивали с обработкой только GRON. См. в таблице 8 перечень GRON, применяемых в данных примерах.
[0316] Методы
[0317] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из
индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в 25 количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды,
кодирующие CRISPR, содержали промотор Mas, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9, и промотор U6 Arabidopsis thaliana, запускающий экспрессию опРНК, с терминатором поли-Т10. Плазмиды CRISPR вместе с GRON вводили в протопласты с помощью опосредованной ПЭГ доставки в конечной 5 концентрации 0,05 мкг/мкл для CRISPR и 0,547 мкМ для 60-мерного, 0,32 мкМ для 101-мерного и 0,16 мкМ для 201-мерного GRON. При обработке только GRON конечная концентрация GRON после опосредованной ПЭГ доставки составляла 7,5 мкМ для 60-мера, 5,0 мкМ для 101-мера и 2,5 мкМ для 201-мера. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем их анализировали с помощью проточной цитометрии, 10 чтобы определить процент GFP-положительных протопластов при данной обработке.
[0318] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессируются с одной и той же плазмиды. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную 15 последовательность, используемую для того, чтобы направить нуклеазу Cas9 к целевому гену BFP. Спейсерная последовательность BFP CRISPR представляет собой 5'-GTCGTGCTGCTTCATGTGGT-3'. В данном примере использовали BFP CRISPR, который нацелен на ген bjp. Указанные GRON содержат кодирующую последовательность гена bjp около изменяемого сайта. В таблице 8 приведен перечень применяемых GRON.
20 [0319] ТАБЛИЦА 8. Перечень GRON, применяемых в данных примерах.
Название GRON
Химия GRON
Последовательность GRON
BFP4/C 60-мер (1 неоднозначное)
3PS
5'-GTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGCrACCCAGACCACATGAAGCAG-3'
BFP4/C 101-мер (1 неоднозначное)
3PS
5'-CCACCGGCAAGCTGCCCGTGCCCrGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAG TGCTTCAGCCGCTACCCAGACCACATGAAGCAGCACGAC-3'
BFP4/C 201-мер (1 неоднозначное)
3PS
5'-GGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCG GCAAGCrGCCCGTGCCCTGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAG CCGCTACCCAGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTC CAGGA GCGCACCATCTT-3'
[0320] Результаты
[0321] При применении BFP CRISPR, GRON с длинами > 101 нт лучше опосредовали превращение BFP в GFP, когда их непосредственно сравнивали с GRON длиной 60 нт 25 (фигура 5). В целом, в образцах, содержащих BFP CRISPR и GRON, наблюдались более
высокие уровни превращения BFP в GFP по сравнению с образцами, содержащими только GRON (фигура 5), что демонстрирует положительное влияние, которое оказывают CRISPR на повышение уровней превращения. Данный результат дополнительно демонстрирует, что длина GRON, который наиболее эффективно опосредует превращение BFP в GFP, когда 5 его используют вместе с CRISPR, должна быть > 101 нт.
[0322] Пример 9. CRISPR с 2'-0-Me-GRON.
[0323] Цель данных примеров состояла в демонстрации превращения BFP в GFP в нашей трансгенной по BFP модельной системе Arabidopsis thaliana с применением CRISPR для создания целевых двухцепочечных разрывов в гене bjp и GRON для опосредования
10 превращения. BFP CRISPR, применяемый в данном примере, нацелен на ген bjp и вызывает двухцепочечный разрыв в ДНК около изменяемого сайта. GRON, применяемые вместе с BFP CRISPR, содержат либо кодирующую, либо некодирующую последовательность гена bjp вблизи изменяемого сайта, при этом первые десять оснований с 5'-конца GRON представляют собой РНК-основания вместо ДНК-оснований. Данные РНК основания
15 помечены 2'-0-Ме-группой(-ами) либо по первому с 5'-конца РНК-основанию, либо по первым девяти с 5'-конца РНК-основаниям, как изображено на фигуре 6. Такие GRON в данном тексте называют 2'-0-Me-GRON, и непосредственно сравнивают их с 3PS-GRON аналогичной длины, которые содержат ДНК-основания с 3 фосфотиоатными связями на обоих 5'- и 3'-концах GRON. Такие GRON в данном тексте называют 3PS-GRON. См. в
20 таблице 9 перечень GRON, применяемых в данных примерах.
[0324] Методы
[0325] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из
индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды,
25 кодирующие CRISPR, содержали промотор Mas, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9, и промотор U6 Arabidopsis, запускающий экспрессию опРНК, с терминатором поли-Т10. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Плазмиды CRISPR вместе с GRON вводили в протопласты с помощью опосредованной ПЭГ доставки
30 в конечной концентрации 0,05 мкг/мкл для CRISPR, 0,5 мкМ для 71-мерного и 0,16 мкМ для 201-мерного GRON. При обработке только GRON конечная концентрация GRON после опосредованной ПЭГ доставки составляла 5,0 мкМ для 71-мера и 2,5 мкМ для 201-мера. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем анализировали
с помощью проточного цитометра, чтобы определить процент GFP-положительных протопластов при данной обработке.
[0326] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессируются 5 с одной и той же плазмиды. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную последовательность, используемую для того, чтобы направить нуклеазу Cas9 к целевому гену BFP. Спейсерная последовательность BFP CRISPR представляет собой 5'-CTCGTGACCACCTTCАСССА-3'. В данном примере использовали BFP CRISPR, который 10 нацелен на ген bjp. Указанные GRON содержат либо кодирующую, либо некодирующую последовательность гена bjp около изменяемого сайта. В таблице 9 показан перечень указанных применяемых GRON.
[0327] ТАБЛИЦА 9. Перечень GRON, применяемых в данных примерах.
Название GRON
Химия GRON
Последовательность GRON
BFP4/C 71-мер
3PS
5'-GCUGCCCGUGCCCTGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCC GCTACCCCG-3'
BFP4/NC 71-мер
3PS
5'-TTCATGTGGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGAGGGT GGGCCAGGG-3'
BFP4/C 201-мер
3PS
5'-GGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGC TGCCCGTGCCCTGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGCTA CCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAG CGCACCATCTT-3'
BFP4/NC 201-мер
5'-AAGATGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTT CATGTGGTCTGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGAGGGTGGG CCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGC ATCGCCCTCGCCC-3'
BFP4/C 71-мер
2'-0-Ме
5'-gcugcccgugCCCTGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGC TACCCCG-3'
BFP4/NC 71-мер
2'-0-Ме
5'-uucaugugguCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGAGGGT GGGCCAGGG-3'
BFP4/C 201-мер
2'-0-Ме
5'-gggcgagggcGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTG CCCGTGCCCTGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGCTACC CCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCG CACCATCTT-3'
BFP4/NC 201-мер
2'-0-Ме
5'-aagauggugcGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTCA TGTGGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGAGGGTGGGC CAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCA TCGCCCTCGCCC-3'
[0328] Результаты
[0329] 71-мерный и 201-мерный 2'-0-Ме GRON проявляли аналогичный уровень 5 превращения BFP в GFP по сравнению с различными типами защитных групп GRON согласно (0), (1) или (9) с применением BFP CRISPR (фигуры 7 и 8). 2'-0-Me-GRON более эффективно, чем аналогичные 3PS-GRON, опосредуют превращение BFP в GFP с применением BFP CRISPR (фигуры 7 и 8).
[0330] Пример 10. Внедрение никаз CRISPR с GRON.
10 [0331] Цель данных примеров состояла в демонстрации превращения BFP в GFP в нашей трансгенной по BFP модельной системе Arabidopsis thaliana с применением CRISPR для направленного создания одноцепочечных разрывов в гене bjp и GRON для опосредования превращения. BFP1 CRISPR (CR:BFP1), применяемый в данном примере, нацелен на ген bjp и содержит мутации в каталитических остатках (D10А в RuvC и Н840А в HNH), которые
15 вызывают одноцепочечные разрывы в ДНК гена bjp около изменяемого сайта на любой из цепей ДНК: комплементарной или некомплементарной РНК-проводнику, соответственно. Данные CRISPR в данной заявке называют никазой BFP1 CRISPR D10A и никазой BFP1
CRISPR H840A и применяют либо отдельно, либо вместе с опРНК BFP5 на отдельной плазмиде. Если в данном примере применяют вместе несколько никаз CRISPR, то они могут разрезать либо одну и ту же цепь ДНК, либо противоположные цепи ДНК. Если оба белка Cas9, которые содержат одинаковые мутации: либо D10A, либо Н840А, - применяют 5 вместе, то они разрезают одну и ту же цепь ДНК. Напротив, если два белка Cas9 применяют вместе, и один из них содержит мутацию D1 OA, а другой содержит мутацию Н840А, то они разрезают противоположные цепи ДНК. GRON, применяемые вместе с никазами CRISPR, содержат либо кодирующую, либо некодирующую последовательность гена bjp вблизи изменяемого сайта, при этом одно неоднозначное основание расположено в 10 последовательности РАМ BFP5 CRISPR. Данные GRON содержат 3 фосфотиоатные связи на каждом из 5'- и З'-концов, и в данном тексте их называют 3PS-GRON. См. в таблице 10 перечень GRON, применяемых в данных примерах. Никазы CRISPR непосредственно сравнивают с аналогичными CRISPR, которые способны направленно вызывать двухцепочечные разрывы в ДНК гена bjp.
15 [0332] Методы
[0333] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из
индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды, кодирующие CRISPR, содержали промотор Mas, запускающий экспрессию кодирующей
20 последовательности Cas9, с терминатором rbcSE9, и промотор U6 Arabidopsis thaliana, запускающий экспрессию опРНК, с терминатором поли-Т10. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Ген Cas9 содержит мутации в каталитических остатках: либо D10A в RuvC, либо Н840А в HNH. Плазмиды CRISPR вместе с GRON внедряли в протопласты с помощью опосредованной
25 ПЭГ доставки в конечной концентрации 0,05 мкг/мкл для CRISPR и 0,16 мкМ для 201-мера. При обработке только GRON конечная концентрация GRON после опосредованной ПЭГ доставки составляла 2,5 мкМ для 201-мера. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем анализировали с помощью проточного цитометра, чтобы определить процент GFP-положительных протопластов при данной обработке.
30 [0334] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессируются с одной и той же плазмиды. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную последовательность, используемую для того, чтобы направить нуклеазу Cas9 к целевому
гену BFP. В данном примере применяли опРНК BFPl и BFP5, которые нацелены на различные участки гена bjp около изменяемого сайта. Спейсер BFP1 (5'-CTCGTGACCACCTTCACCCA-3') нацелен на кодирующую цепь гена bjp, тогда как спейсер BFP5 (5'-GTCGTGCTGCTTCATGTGGT-3') нацелен на некодирующую цепь. 5 Указанные GRON содержат либо кодирующую, либо некодирующую последовательность гена bfp около изменяемого сайта. В таблице 10 показан перечень указанных применяемых GRON.
10 [0336] Результаты
[0337] Обе никазы CRISPR (D1 OA и H840А) более эффективно опосредовали превращение BFP в GFP, когда BFPl CRISPR и BFP5 CRISPR использовали вместе, а не отдельно (фигура 9). Кроме того, когда никазы BFP1 и BFP5 D10A CRISPR использовали вместе с С/201 1W (1 неоднозначное) GRON, то превращение BFP в GFP было значительно выше по
15 сравнению с обработками, при которых данные никазы CRISPR использовали вместе с NC/201 1W GRON (фигура 9). Когда никазы BFP1 и BFP5 Н840А CRISPR применяли вместе, наблюдали приблизительно одинаковый уровень превращения BFP в GFP для любого из С/201 и NC/201 1W GRON (фигура 9). Данные уровни превращения BFP в GFP были немного выше, чем когда BFP5 CRISPR использовали отдельно, и немного ниже, чем
20 когда BFPl CRISPR использовали отдельно (фигура 9).
[0338] Пример 11. Применение CRISPR для нацеливания на множество генов.
[0339] Цель данного примера состояла в демонстрации превращения множества генов одновременно в данной популяции протопластов, полученных из модельной системы Arabidopsis thaliana, применяя CRISPR для создания двухцепочечных разрывов в целевых
генах и GRON для опосредования превращения. CRISPR, применяемые в данном примере, нацеливают как на ген BFP, так и на ген синтетазы ацетогидроксикислот (AHAS) в геноме Arabidopsis thaliana путем введения в протопласты плазмид(ы), кодирующих(-ей) ген Cas9 и нескольких опРНК, нацеленных на два данных различных гена. ОпРНК представляет 5 собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Это позволит Cas9 вызвать двухцепочечные разрывы в обоих генах BFP и AHAS в присутствии GRON, которые будут опосредовать их превращение.
[0341] Протопласты Arabidopsis Thaliana, полученные из индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды, кодирующие CRISPR, содержали промотор 5 Mas, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9, и промотор U6 Arabidopsis thaliana, запускающий экспрессию множества различных опРНК, с терминатором поли-Т10. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Плазмиды CRISPR вместе с GRON внедряли в протопласты с помощью опосредованной ПЭГ доставки в конечной
10 концентрации 0,05 мкг/мкл для CRISPR и 0,16 мкМ для 201-мера. При обработках GRON отдельно получали конечную концентрацию GRON после опосредованной ПЭГ доставки, равную 2,5 мкМ для 201-мера. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем их анализировали с помощью проточного цитометра и анализа с помощью аллель-специфической ПЦР, чтобы определить процент протопластов как с превращенным
15 BFP в GFP, так и с превращенной AHAS, соответственно, при данной обработке.
[0342] В анализе методом аллель-специфической ПЦР 10-16 повторов по 5000 геномных эквивалентов геномной ДНК использовали в первоначальных реакциях ПЦР.
[0343] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых
20 экспрессировались с одной и той же или с множества плазмид. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную последовательность, применяемую, чтобы направить нуклеазу Cas9 к целевым генам. В данном примере различные опРНК и GRON использовали для нацеливания на множество генов около изменяемых сайтов в них; BFP спейсер (5'-
25 CTCGTGACCACCTTCACCCA-3') и спейсер AHAS (5'-
TGGTTATGCAATTGGAAGATCGC-3'). В таблице 11 описаны указанные применяемые GRON.
ACGAATAGTGGCrAGCrCTTGCACATTCATTATAAA-3'
[0345] Результаты
[0346] Превращение BFP в GFP и изменение AHAS определяли через 144 ч после опосредованной ПЭГ доставки плазмид BFP и AHAS CRISPR и BFP/C 201-мерного и 5 AHAS(W)574/NC 201-мерного GRON в трансгенную по BFP линию клеток Arabidopsis thaliana. Результаты проточной цитометрии выявили, что обработка 1 привела к превращению 0,20% BFP в GFP (таблица 12). Анализ методом аллель-специфической ПЦР выявил, что обработка 1 привела к 0,01% протопластов с измененной AHAS (таблица 12). Обработки одним только GRON привели к минимальному превращению при анализе с 10 помощью обоих способов (таблица 12). Данный пример демонстрирует успешное одновременное превращение двух независимых целевых генов (BFP и AHAS) внутри данной популяции протопластов, полученных из трансгенной по BFP модельной системы Arabidopsis thaliana.
[0347] ТАБЛИЦА 12. Измерение превращения обоих генов BFP и AHAS через 144 ч 15 после опосредованной ПЭГ доставки плазмид CRISPR и GRON в данную популяцию протопластов, полученных из трансгенной по BFP модельной системы Arabidopsis thaliana, либо с помощью: (1) проточной цитометрии, которая позволяет определить процент GFP-положительных протопластов, либо с помощью (2) аллель-специфической ПЦР, которая позволяет определить процент протопластов с измененной AHAS.
Обработ ка
CRISPR
GRON
Превращение BFP в GFP
AHAS - замена W574L
Проточная питометрия
Алле ль -специфическая ПЦР
CR-BFP и CR-AHAS
BFP/C 201-мер и AHAS(W)574/NC 201-мер
0,20%
-0,01%
Нет
BFP/C 201-мер и AHAS(W)574/NC 201- мер
0,01%
-0,001%
Нет
Нет
0,01%
-0,001%
[0348] Пример 12. Доставка мРНК Cas9 в клетки растений.
[0349] В данном примере используется непосредственная доставка рекомбинантной мРНК Cas9 в клетки растений в качестве альтернативы доставке плазмид экспрессии CRISPR-Cas. Данный способ включает (1) синтез in vitro модифицированной мРНК и (2) доставку данной 25 модифицированной мРНК в клетки растений.
[0351] мРНК Cas9 транскрибировали in vitro, применяя РНК-полимеразу, такую как Т7, ТЗ или SP6, по матрице линеаризованной плазмиды, содержащей компоненты 5'-НТО, кодирующую последовательность (CDS) указанного белка и З'-НТО. Одна РНК-5 полимераза может внедрять один модифицированный нуклеозид лучше, чем другой. 5'-НТО может содержать элементы, которые улучшают его стабильность, такие как MiR-122 из вируса гепатита С (Shimakami и др., 2012). Синтез in vitro позволял включить нуклеозиды, которые обладают защитными свойствами и обеспечивают хорошую трансляцию в целевых клетках растений. Рекомбинантную мРНК Cas9 защищали кэпом и 10 добавляли к ней поли(А)-последовательность.
[0352] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Рекомбинантную мРНК Cas9 доставляли в клетки растений с помощью одного из следующих средств 15 (перечень неокончательный): проникающих в клетку пептидов (СРР), реагентов для трансфекции посредсвом липосом, полиэтиленгликоля (ПЭГ), - либо отдельно, либо в комбинации, чтобы обеспечить возможность доставки активной рекомбинантной мРНК Cas9 в клетки.
[0353] Пример 13. CRISPR-Cas для прикрепления ДНК, РНК или белков.
20 [0354] В данном примере используется модифицированная кассета отдельного РНК-проводника (опРНК), в которой линкерная последовательность (может также именоваться прикрепляющей последовательностью) добавлена к 3'-концу тра-крРНК, но 5'-конец сигнала терминации РНК-полимеразы III такой, как показано в примере ниже (фигура 10). ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК
25 (тра-крРНК). Хотя это предпочтительно, расположение линкера не ограничено 3'-концом тра-крРНК и было исследовано в нескольких положениях в кассете опРНК. Линкерная последовательность может иметь различную длину в нуклеотидах или вторичную структуру, которые будут улучшать прикрепление или повышать количество молекул, прикрепившихся посредством триплексных взаимодействий.
30 [0355] Линкер позволит спаривание оснований по Уотсону-Крику с ДНК, РНК или белками, которые содержат комплементарную последовательность (фигура 10). Кроме того, линкерная последовательность в кассетах опРНК разработана таким образом, чтобы она содержала усовершенствованную вторичную и третичную структуру, образующую
участки более сложного многогранного взаимодействия, к которым прикрепится множество молекул ДНК, РНК или белка.
[0356] Общая концепция состоит в том, что комплекс CRISPR-Cas будет прикреплять биологические молекулы к сайту нуклеазной активности, тем самым повышая вероятность 5 редактирования генов. Данные биологические молекулы включают GRON, которые будут опосредовать превращение целевого гена(-ов). Прикрепляющие линкеры можно добавить к опРНК просто применяя, например, генные нити или гибридизованные олигонуклеотиды.
[0357] Методы
[0358] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из
10 индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды, прикрепляющие CRISPR-Cas, содержат промотор Mas, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9 и
[359] промотор U6 Arabidopsis thaliana, запускающий экспрессию опРНК с линкерной 15 последовательностью, которая комплементарна полинуклеотидному участку размером 15 -30 п.о., расположенному на 201-мерном редактирующем GRON, нацеленном на bjp (как показано на фигуре 10). Кассета прикрепления опРНК заканчивается терминатором поли-Т10. Плазмиды CRISPR-Cas вместе с GRON внедряли в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл для CRISPR и 0,16 20 мкМ для 201-мерного GRON. При обработке только GRON конечная концентрация GRON после опосредованной ПЭГ доставки составляла 2,5 мкМ для 201-мера. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем анализировали с помощью проточного цитометра, чтобы определить процент GFP-положительных протопластов при данной обработке.
25 [0359] CRISPR состоит из двух компонентов: кодон-оптимизированных для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, - оба из которых экспрессируются с одной и той же или с различных плазмид. ОпРНК представляет собой слитые РНК CRISPR (крРНК), и транс-активирующую крРНК (тра-крРНК), и линкер. Участок крРНК содержит спейсерную последовательность, используемую для того, чтобы направить нуклеазу Cas9 к
30 целевому гену BFP. В данном примере используют CRISPR, который нацелен на ген bjp. Указанные GRON содержат либо кодирующую, либо некодирующую последовательность гена bjp около изменяемого сайта.
[0360] Пример 14. CRISPR с укороченным РНК-проводником.
[0361] Цель данного примера состояла в демонстрации превращения BFP в GFP в протопластах, полученных из трансгенной по BFP модельной системы Arabidopsis thaliana, применяя CRISPR для создания двухцепочечных разрывов в целевых генах и GRON для опосредования превращения. CRISPR, применяемые в данном примере, нацеливают на ген 5 bjp в геноме Arabidopsis thaliana путем введения в протопласты плазмид(ы), кодирующих(-ей) ген Cas9 и одну из двух опРНК различной длины. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). КрРНК, которая направляет Cas9 к целевым генам, называется спейсером и ее длина обычно составляет 20 нт (CR:BFP1 20-нт), тем не менее, в данных примерах мы исследовали эффективность 10 применения спейсера меньшей длины, равной 17 нт (CR:BFP1 17-нт), для опосредования превращения BFP в GFP.
[0363] Протопласты Arabidopsis Thaliana, полученные из индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды, кодирующие CRISPR, содержали промотор 5 Mas, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9 и промотор U6 Arabidopsis thaliana, запускающий экспрессию множества различных опРНК, с терминатором поли-Т10. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Плазмиды CRISPR вместе с GRON внедряли в протопласты с помощью опосредованной ПЭГ доставки в конечной 10 концентрации 0,05 мкг/мкл для CRISPR и 0,16 мкМ для 201-мера. При обработках GRON отдельно получали конечную концентрацию GRON после опосредованной ПЭГ доставки, равную 2,5 мкМ для 201-мера. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем их анализировали с помощью проточного цитометра, чтобы определить процент превращения BFP в GFP при данной обработке.
15 [0364] CRISPR состоит из двух компонентов: кодон-оптимизированных для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессировались с одной и той же или с множества плазмид. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную последовательность, применяемую, чтобы направить нуклеазу Cas9
20 к целевым генам. В данных примерах исследовали две различные длины спейсеров BFP 1: 20 нт (5'-CTCGTGACCACCTTCACCCA-3') и 17 нт (5'-GTGACCACCTTCACCCA-3'). В таблице 13 описан используемый GRON.
[0365] ТАБЛИЦА 13. Перечень GRON, применяемых в данном примере.
Название GRON
Химия GRON
Последовательность GRON
BFP4/NC 201-мер 3W
3PS
5'-AAGATGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCG TGCTGCTTCATGTGGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTACGTAAACGTGGTCACG AGGGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCG TAGGTGGCATCGCCCTCGCCC-3'
25 [0366] Результаты
[0367] Уменьшение длины протоспейсера BFPl от 20 п.о. до 17 п.о. приводило к сходным уровням превращения BFP в GFP, равным 0,163% и 0,177%, соответственно, через 72 ч после опосредованной ПЭГ доставки плазмид и GRON в трансгенную по BFP модельную систему Arabidopsis thaliana (фигура 11).
[0368] Пример 15. CRISPR с РНК-проводником в виде ампликона.
[0369] Цель данного примера состояла в демонстрации превращения BFP в GFP в протопластах, полученных из трансгенной по BFP модельной системы Arabidopsis thaliana, 5 с применением CRISPR для создания двухцепочечных разрывов в целевых генах и GRON для опосредования превращения. CRISPR, применяемые в данном примере, нацеливают на ген bjp в геноме Arabidopsis thaliana путем введения в протопласты плазмид(ы), кодирующих(-ей) ген Cas9, и одной из опРНК, которая либо кодируется плазмидой, либо вводится в протопласты в виде ампликона. ОпРНК представляет собой слитые РНК CRISPR 10 (крРНК) и транс-активирующую крРНК (тра-крРНК). КрРНК направляет Cas9 к целевым генам, где Cas9 создает двухцепочечный разрыв, a GRON используют в качестве матрицы для превращения BFP в GFP сайт-направленным способом.
[0370] Методы
[0371] Протопласты Arabidopsis Thaliana, полученные из индуцированной ткани корня, 15 высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды, кодирующие CRISPR, содержали промотор Mas, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9 и промотор U6 Arabidopsis, запускающий экспрессию множества различных опРНК, с терминатором поли-Тю. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и 20 транс-активирующую крРНК (тра-крРНК). Плазмиды CRISPR вместе с GRON внедряли в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл для CRISPR и 0,16 мкМ для 201-мера. При обработках GRON отдельно получали конечную концентрацию GRON после опосредованной ПЭГ доставки, равную 2,5 мкМ для 201-мера. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем их 25 анализировали с помощью проточного цитометра, чтобы определить процент превращения BFP в GFP при данной обработке.
[0372] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, - оба из которых экспрессировались с одной и той же или с множества плазмид. ОпРНК представляет собой 30 слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную последовательность, применяемую, чтобы направить нуклеазу Cas9 к целевым генам. В данных примерах один и тот же РНК-проводник BFP6 (5'-GGTGCCGCACGTCACGAAGTCGG-3') доставляли в протопласты либо в виде ампликона, либо кодируемым плазмидой. В таблице 14 описаны указанные применяемые GRON.
[0374] Результаты
[0375] Доставка РНК-проводника BFP6 в виде ампликона (CR:BFP6 (ампликона с РНК-5 проводником)) вместе с плазмидой, содержащей только Cas9, приводила к сходным уровням превращения BFP в GFP при сравнении с обработками, когда РНК-проводник (плазмида с РНК-проводником) и Cas9 кодировались отдельными плазмидами, через 72 ч после опосредованной ПЭГ доставки плазмид и GRON в трансгенную по BFP модельную систему Arabidopsis thaliana (фигура 12).
10 [0376] Пример 16. CRISPR с ^модифицированными GRON.
[0377] Цель данного примера состояла в демонстрации превращения BFP в GFP в нашей трансгенной по BFP модельной системе Arabidopsis thaliana с применением CRISPR для создания целевых двухцепочечных разрывов в гене bjp и GRON для опосредования превращения. BFP CRISPR, применяемый в данном примере, нацелен на ген bjp и вызывает
15 двухцепочечный разрыв в ДНК около изменяемого сайта. 3PS-GRON содержат ДНК-основания с 3 фосфотиоатными связями на обоих 5' - и 3'-концах GRON, и в данном тексте их называют 3PS-GRON. 3PS-GRON напрямую сравнивали с аналогичными немодифицированными GRON по опосредованному ими превращению BFP в GFP с применением BFP CRISPR в нашей трансгенной по BFP модельной системе Arabidopsis
[0379] Методы
20 thaliana. См. в таблице 15 перечень GRON, применяемых в данных примерах.
[0380] Трансгенные по BFP протопласты Arabidopsis thaliana, полученные из
индуцированной ткани корня, высевали на 96-луночный планшет с плоским дном в количестве 250000 клеток на лунку при плотности 1 х 107 клеток/мл. Плазмиды, кодирующие CRISPR, содержали промотор Mas, запускающий экспрессию кодирующей 5 последовательности Cas9, с терминатором rbcSE9 и промотор U6 Arabidopsis, запускающий экспрессию опРНК, с терминатором поли-Т10. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Плазмиды CRISPR вместе с GRON вводили в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл для CRISPR, 0,16 мкМ для 41-мерных GRON. При обработке 10 только GRON конечная концентрация GRON после опосредованной ПЭГ доставки составляла 0,8 мкМ для 41-мера. Протопласты инкубировали в темноте при 23 °С в течение 72 часов, а затем анализировали с помощью проточного цитометра, чтобы определить процент GFP-положительных протопластов при данной обработке.
[0381] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии 15 в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессируются с одной и той же плазмиды. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную последовательность, используемую для того, чтобы направить нуклеазу Cas9 к целевому гену BFP. Спейсерная последовательность BFP CRISPR представляет собой 5'-20 CTCGTGACCACCTTCАСССА-3'. В данном примере использовали BFP CRISPR, который нацелен на ген bjp. Указанные GRON содержат некодирующую последовательность гена bjp около изменяемого сайта. В таблице 16 показан перечень указанных применяемых GRON.
[0383] Результаты
[0384] 41-мерные 3PS-GRON более эффективно, чем аналогичные немодифицированные GRON, опосредуют превращение BFP в GFP с применением BFP CRISPR (фигура 13).
[0385] Пример 17. TALEN и GRON в клетках льна.
[0386] Цель данного примера состояла в демонстрации изменения EPSPS в протопластах и в микрокаллюсах льна через 24 часа и через 3-недели, соответственно, после доставки плазмид TALEN и GRON. TALEN, применяемые в данном примере, нацеливают на ген epsps в геноме Linum usitatissimum путем введения в протопласты, полученные из кончика 5 побега, плазмид(ы), кодирующих(-ей) TALEN, которые создают двухцепочечный разрыв, и GRON, который используют в качестве матрицы для изменения гена EPSPS сайт-направленным способом.
[0387] Методы
[0388] Протопласты льна выделяли из кончиков побегов, полученных из пророщенных in 10 vitro семян. Плазмиды TALEN вместе с GRON вводили в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл и 0,5 мкМ, соответственно. Протопласты инкубировали в темноте при 25 °С в течение до 48 ч в жидкой среде, или заключали в альгинатные гранулы (5 х 105 клеток/мл) и культивировали в жидкой среде, чтобы вызвать деление клеток и образование микрокаллюсов. Образцы 15 протопластов или микрокаллюсов, полученные через 24 ч или через 3 недели после доставки ДНК, анализировали с помощью NGS, чтобы определить процент клеток (прочтений ДНК), несущих целевую мутацию при данной обработке. Также оценивали процент инсерционно-делеционных мутаций, созданных в ходе несовершенной НГСК-опосредованной репарации ДНК.
20 [0389] Конструкции TALEN содержат два плеча (левое и правое), каждое из которых состоит из подобного TAL-эффектору ДНК-связывающего домена, соединенного с каталитическим расщепляющим ДНК доменом из Fokl. Подобный TAL-эффектору ДНК-связывающий домен направляет плечи TALEN к определенным сайтам ДНК, что позволяет эндонуклеазам Fokl с каждого плеча димеризоваться друг с другом и расщепить
25 двухцепочечную ДНК. Кодирующие TALEN плазмиды содержат MasP::LuEPSPS_^eBoe rae4o)-T2A-LuEPSPS_(npaBoe плечо) с терминатором rbcSE9. Последовательность LuEPSPSJjieBoe плечо) представляет собой 5'-TGGAACAGCTATGCGTCCG-3' и последовательность LuEPSPS_(npaBoe плечо) представляет собой 5'-TGAGTTGCCTCCAGCGGCT-3'. GRON (144-меры), нацеленные на LuEPSPS, с
30 неоднозначными основаниями или без них использовали, чтобы определить их влияние на уровень изменения.
[0390] Результаты
[0391] Протопласты и микрокаллюсы, полученные через 24 ч или через 3 недели после доставки ДНК, соответственно, содержали 0,067% и 0,051% измененного EPSPS,
соответственно, что определили путем секвенирования нового поколения (фигура 14). Кроме того, данные результаты показывают, что TALEN активен и способен расщепить целевой ген epsps в Linum usitatissimum и создать инсерционно-делеционные мутации в 2,60% протопластов через 24 часа и в 1,84% микрокаллюсов через 3 недели или раньше. 5 Более того, изменение EPSPS и инсерционно-делеционные мутации сохранялись до 3 недель после введения плазмиды с TALEN и GRON.
[0392] Пример 18. CRISPR и GRON в клетках льна.
[0393] Цель данного примера состояла в демонстрации активности Cas9 в микрокаллюсах льна через три и шесть недель после доставки плазмиды Cas9. CRISPR, применяемые в
10 данном примере, нацеливают на ген epsps в геноме Linum usitatissimum путем введения в протопласты, полученные из кончика побега, плазмид(ы), кодирующих(-ей) ген Cas9, и опРНК. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). КрРНК направляет Cas9 к целевым генам, где Cas9 создает двухцепочечный разрыв в гене epsps сайт-направленным способом. При репарации
15 двухцепочечных разрывов в гене epsps распространенным путем НГСК будут создаваться инсерционно-делеционные мутации вблизи сайта расщепления.
[0394] Методы
[0395] Протопласты льна выделяли из кончиков побегов, полученных из пророщенных in vitro семян. Кодирующие CRISPR плазмиды содержали промотор Mas, запускающий
20 экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9, и промотор U6 Arabidopsis thaliana, запускающий экспрессию опРНК, с терминатором поли-Тю. Плазмиды CRISPR вводили в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл. Протопласты заключали в альгинатные гранулы (5 х 105 клеток/мл), культивировали в жидкой среде и инкубировали на ротационном шейкере (30
25 об/мин) в темноте при 25°С. Микрокаллюсы, развившиеся из отдельных клеток, анализировали с помощью NGS через 3 и 6 недель после доставки плазмиды CRISPR, чтобы определить процент клеток (прочтений ДНК), несущих инсерционно-делеционные мутации, созданные в результате склонного к ошибкам НГСК-опосредованного пути репарации ДНК.
30 [0396] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессируются с одной и той же плазмиды. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную
последовательность, применяемую, чтобы нацелить нуклеазу Cas9 на целевой ген. В данном примере CRISPR нацелен на ген epsps.
[0397] Результаты
[0398] У 3- и 6-недельных микрокаллюсов наблюдали 46,5% и 54,7% инсерционно-5 делеционных мутаций, соответственно, что определили путем секвенирования нового поколения (фигура 15). Полученные результаты показали, что Cas9 активен и способен расщепить целевой ген EPSPS в Linum usitatissimum и образовать инсерционно-делеционные мутации. Более того, данные инсерционно-делеционные мутации сохранялись до 6 недель после внедрения плазмиды CRISPR.
[0399] Пример 19. Конструирование разработанных нуклеаз. [0400] CRISPR-Cas
[0401] Для конструирования плазмид временной экспрессии CRISPR-Cas9 синтезировали кодон-оптимизированный для экспрессии в высших растениях ген SpCas9, содержащий 5 сигнал ядерной локализации (NLS) SV40 на обоих N- и С-концах и метку 2х FLAG на N-конце, в виде серий GeneArt(r) Strings(tm) (Life Technology, Карлсбад, Калифорния), затем клонировали по ходу транскрипции от промотора маннопинсинтазы (MAS) и против хода транскрипции от терминатора рибулозобисфосфаткарбоксилазы (rbcsE9) гороха с помощью способа Гибсона. Затем кассету опРНК, состоящую из химерного РНК-
10 проводника, экспрессия которого запускалась с промотора U6 Arabidopsis, синтезировали в виде GeneArt(r) Strings(tm), а затем встраивали в конструкцию, содержащую Cas9, применяя способ Гибсона, с получением pBCRISPR. Для того, чтобы химерный РНК-проводник сделать специфичным к соответствующей целевой последовательности, пары ДНК-олигонуклеотидов, кодирующих вариабельные последовательности-мишени для опРНК
15 длиной 20 нт (расширенная таблица с данными № 2), гибридизовали с получением коротких двухцепочечных фрагментов с липкими концами длиной 4 п.о. Указанные фрагменты лигировали в расщепленную Bbsl плазмиду pBCrispr с получением CRISPR-Cas-конструкций ВС-1, ВС-2 и ВС-3.
[0402] TALEN
20 [0403] Разработку и конструирование конструкций, экспрессирующих TALEN: ВТ-1 и LuET-1, - осуществляли, основываясь на правилах, описанных в Cermak и др., Nucleic Acids Res. 39, е82 (2011). Целевую последовательность выбирали, основываясь на сайте редактирования генов и двух высоковариабельных остатках (Repeat Variable Diresidue, RVD), следуя правилам, согласно которым NG, HD, N1 и NN распознают Т, С, А и G,
25 соответственно. Сборку эффекторного домена TAL, соединенного с гетеродимерными доменами Fokl, осуществляли с помощью коммерчески доступной услуги (GeneArt; Life Technologies). Мономеры TALEN клонировали по ходу транскрипции от промотора Mas и против хода транскрипции от терминатора rbcE9, применяя способ Гибсона, и экспрессировали в виде элементов, соединенных с 2А.
30 [0404] Культура клеток и выделение протопластов
[0405] Семена Arabidopsis со стерилизованной поверхностью проращивали на твердой среде Уг MS (минералы и витамины согласно XX; Уг концентрации; 87,7 мМ сахароза) при 28°С при 12-часовом светотемновом цикле. Материал корня из 2- - 3-недельных проростков
собирали и поддерживали в жидкой среде Уг MS при условиях низкой освещенности при 28°С. Культуры корня переносили и поддерживали в MSAR (0,22% 1/2MS, 87,7 мМ сахароза, 11,4 мкМ IAA, 2,3 мкМ 2,4-D, 1,5 мкМ 2iP, рН 5,8) в течение трех недель перед выделением протопластов. Корни разрезали на фрагменты приблизительно по 6 мм и 5 инкубировали в растворе MS АР (0,22% 1/2 MS, 87,7 мМ сахароза, 11,4 мкМ IAA, 2,3 мкМ 2,4-D, 1,5 мкМ 2iP и 400 мМ маннит, рН 5,8), содержащем ферменты, расщепляющие клеточную стенку (1,25% целлюлаза RS, 0,25% мацерозим R-10, 0,6 М маннит, 5 мМ MES, 0,1% БСА), в течение 3 - 4 ч в темноте при легком взбалтывании. Высвобожденные протопласты собирали и пропускали через стерильный фильтр с размером пор 100 мкм и
10 фильтр с размером пор 35 мкм. Фильтрат протопластов смешивали с 0,8-кратным объемом среды с градиентом плотности Optiprep(tm) (Sigma) и аккуратно перемешивали. Раствор 60% W5 (154MMNaCl, 5 MMKCI, 125 мМ СаС12*2Н20, 5 мМ глюкоза, IOMMMES, (рН5,8))/40% Optiprep, а затем раствор 90% W5/10% Optiprep медленно наслаивали на раствор фильтрат/Optiprep, чтобы получить градиент, который центрифугировали при
15 относительном ускорении 198 RCF в течение 10 мин. Белый слой протопластов собирали и смешивали с 2-кратным объемом W5. Протопласты центрифугировали при 44 RCF в течение 10 мин и ресуспендировали в растворе ТМ (14,8 мМ MgCh*6H20, 5 мМ MES, 572 мМ маннит, (рН 5,8)) при плотности, равной 1 х 107 клеток/мл. Для экспериментов с зеоцином(tm) (Life Technologies, Карлсбад, Калифорния) и флеомицином (InvivoGen, Сан-
20 Диего, Калифорния), протопласты держали в ТМ с рН, подведенным до 7,0, в течение 90 мин на льду перед трансфекцией. Концентрации антибиотика см. на фигуре 1 с расширенными данными.
[0406] Протопласты льна выделяли из кончиков побегов, полученных из 3-недельных проростков, пророщенных in vitro. Кончики побега мелко нарезали с помощью скальпеля,
25 предварительно плазмолизовали в течение 1 ч при комнатной температуре в В-среде (соли и витамины В5 (Gamborg и др., 1968), 4 мМ СаСЬ, 0,1 М глюкоза, 0,3 М маннит, 0,1 М глицин, 250 мг/л гидролизата казеина, 10 мг/л L-UHCTCHH-HCL, 0,5% поливинилпирролидона (молекулярная масса 10000), 0,1% БСА, 1 мг/л ВАР, 0,2 мг/л NAA, и 0,5 мг/л 2,4-D), и инкубировали в растворе расщепляющих клеточную стенку ферментов,
30 содержащем В-среду, дополненную 0,66% целлюлазой YC и 0,16% мацерозимом R-10, на ротационном шейкере (50 об/мин) при 25 °С в течение 5 ч. Высвобожденные протопласты просеивали и очищали путем центрифугирования в градиенте плотности, используя слои Optiprep (Sigma), подсчитывали с помощью гемоцитометра и держали неподвижными в течение ночи в темноте при плотности 0,5 х 106 протопластов/мл среды В.
[0407] Трансфекция протопластов
[0408] В 96-луночном планшете с плоским дном 2,5 х 105 клеток на лунку трансфицировали 10 пмоль GRON, 10 пмоль GRON плюс 3,25 мкг конструкции, экспрессирующей CRISPR-Cas или TALEN, или имитации конструкции, применяя ПЭГ 5 (270 мМ маннит, 67,5 мМ Ca(N03)2, 38,4% ПЭГ 1500 (рН 5,8)). Клетки и ДНК инкубировали с ПЭГ на льду в течение 30 минут, а затем промывали с помощью 200 мкл раствора W5. Наконец, добавляли 85 мкл MSAP++ (MSAP, содержащий 50 нМ фитосульфокин-а и 20 мкМ н-пропилгаллат), и культивировали клетки в условиях низкой освещенности при 28°С.
[0409] Через приблизительно 18 ч культивирования протопласты трансфицировали 10 плазмидой TALEN вместе с GRON (20 мкг плазмиды и 0,2 нмоль GRON/106 протопластов), применяя опосредованную ПЭГ доставку. Обработанные протопласты инкубировали в темноте при 25 °С в течение до 48 ч в среде В, или заключали в альгинатные гранулы через 24 ч после трансфекции, и культивировали в жидкой среде V-KM, чтобы вызвать деление клеток и образование микрокаллюсов. Для экспериментов с антибиотиками 1,25 х 105 15 клеток на лунку трансфицировали 8 мкМ GRON CG13, применяя раствор ПЭГ, описанный выше.
[0410] Цитометрия
Через семьдесят два часа после трансфекции клетки анализировали с помощью цитометрии, применяя цитометр Attune(r) с акустической фокусировкой (Applied 20 Biosystems(r)) с возбуждением и детектированием испускания, подходящими для GFP. В качестве фонового уровня брали таковой для обработанных ПЭГ протопластов без доставки ДНК. Для экспериментов с антибиотиками протопласты, обработанные зеоцином или флеомицином перед трансфекцией, анализировали с помощью цитометрии через 48 ч после трансфекции.
25 [0411] АНАЛИЗ ПУТЕМ СЕКВЕНИРОВАНИЯ
[0412] Геномную ДНК выделяли из обработанных CRISPR-Cas или TALEN протопластов, применяя набор NucleoSpin(r) Plant II, следуя рекомендациям производителя (Machery-Nagel, Бетлехем, Пенсильвания). Ампликоны, фланкирующие целевой участок TALEN или CRISPR, получали, применяя полимеразу Phusion(r) со 100 нг геномной ДНК и праймерами
30 BFPF-1 (5'-GGACGACGGCAACTACAAGACC-3')/
BFPR-1 (5' -ТAAACGGCCACAAGTTCAGC-3') для CRISPR и TALEN Arabidopsis; или LuEPF-1 (5' -GC AT AGC AGTGAGC AGAAGC-3')/
LuEPR-1 5'-AGAAGCTGAAAGGCTGGAAG-3' для TALEN L. usitatissimum. Полученные ампликоны очищали и концентрировали, применяя колонки Qiaquick MinElute (Qiagen, Валенсия, Калифорния). Глубокое секвенирование ампликонов осуществляли в GeneWiz (Саут-Плейнфилд, Нью-Джерси), используя 2 запуска по 250 п.о. на MiSeq (Dlumina, Сан-5 Диего, Калифорния). Для анализа результатов файлы fastq для прочтения 1 и прочтения 2 импортировали в CLC Genomics Workbench 7.0.4 (CLCBio, Бостон, Массачусетс). Парные прочтения объединяли в одну последовательность, если их последовательности перекрывались. Последовательность ампликона идентифицировали, если его последовательность или обратная ей последовательность и комплементарная
10 последовательность содержали последовательности как прямого, так и обратного праймеров. Встречаемость уникальной последовательности в образце регистрировали в виде относительного содержания. Процент инсерционно-делеционных мутаций или редактирований гена рассчитывали путем деления количества прочтений с редактированием или инсерционно-делеционной мутацией на суммарное количество
15 секвенированных прочтений, а затем умножения на 100.
[0413] Последовательности протоспейсеров CRISPR-Cas
Название Последовательность (от 5' к 3') Ссылка на фигуру
ВС-1 CTCGTGACCACCTTCACCCA la; lb; 2а; 2с
ВС-2 GTCGTGCTGCTTCATGTGGT 2Ь
ВС-3 GGCTGAAGCACTGCACGCCG 2d
20 [0414] Последовательности связывающего TALEN домена.
Название в _ , ,, ,п Ссылка
Последовательность (от 5 к 3 ) ,
статье на фигуру
ВТ-1 Левое плечо: TGGTCGGGGTAGCGGCTGA
Правое плечо: TCGTGACCACCTTCACCCA '
LuET-1 Левое плечо: TGGAACAGCTATGCGTCCG
Правое плечо: TGAGTTGCCTCCAGCGGCT '
[0415] Используемые последовательности GRON.
Названы е
Последовательность (от 5'к 3')
Химия
Ссылка на фигуру
CGI
GCTGAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGAGGG
Немодифицированный
CG2
G*C*T*GAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGA*G*G*G
(*) = 3PS
CG3
C*C*C*TCGTGACCACCTTCACCTACGGCGTGCAGTGCTTC*A*G*C
(*) = 3PS
2d, За
CG4
VCCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCH
V = CY3; H = 3'DMT dC CPG
CG5
G*T*G*ACCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGCTACCCAGACCACATGAAG*C*A*G
(*) = 3PS
CG6
A*A*G*ATGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTCATGT GGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGAGGGTGGGCCAGGGCAC GGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCATCGCCCTCG*C*C* С
(*) = 3PS
lb, 2с
CG7
G*G*G*CGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCC CGTGCCCTGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCA CATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCAT*C*T*T
(*) = 3PS
CG8
G*G*G*CGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCC CGTGCCCTGGCCCACCCTCGTGACCACCTTCACCTACGGCGTGCAGTGCTTCAGCCGCTACCCAGACCA CATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCAT*C*T*T
(*) = 3PS
CG9
A*A*G*ATGGTGCGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTCATGT GGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTACGTAAACGTGGTCACGAGGGTGGGCCAGGGCACG GGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCATCGCCCTCG*C*C*C
(*) = 3PS
CG10
(a)agauggugcGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTCATGTGGTC GGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGAGGGTGGGCCAGGGCACGGGC AGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCATCGCCCTCGCCC
Строчные = РНК-основания: (основание) = 2'-0-Me Заглавные = ДНК-основания
CG11
(a)(a)(g)(a)(u)(g)(g)(u)(g)cGCTCCTGGACGTAGCCTTCGGGCATGGCGGACTTGAAGAAGTCGTGCTGCTTC ATGTGGTCGGGGTAGCGGCTGAAGCACTGCACGCCGTAGGTGAAGGTGGTCACGAGGGTGGGCCAGGG CACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCATCGCCCTCGCC С
Строчные = РНК-основания: (основание) = 2'-0-Ме Заглавные = ДНК-основания
CG12
VCGGTCGGTAAACTGGCGAAGAACGATATTGAACTTTTCCTTGGAAATGCTGGAATAGCTATGCGTGCG CTGACAGCTGCTGTAACAGCCGCTGGAGGCAACTCAAGGTCCCTTCCCTCAACTCCTTCCAGCCTTTCA GCTTCTTH и
VCGGTCGGTAAACTGGCGAAGAACGATATTGAACTTTTCCTTGGAAATGCTGGAATAGCTATGCGTGCG
CTGACAGCTGCTGTAACAGCCGCTGGAGGCAACTCAAGGTTCCTTCCCTCAACTCCTTCCAGCCTTTCA
GCTTCTTH
V = СУЗ; Н = 3'DMT dC CPG
Зс, 3d
CG13
G*C*T*GAAGCACTGCACGCCGTGGGTGAAGGTGGTCACGA*G*G*G
(*) = 3PS
Фиг. 1 с расшир. данными
[0416] Статистический анализ
[0417] Статистическую значимость определяли, применяя критерий стьюдента с двусторонним распределением. Р-значения < 0,05 считали статистически значимыми. Результаты представлены в виде среднего ± стандартная ошибка среднего.
[0418] Результаты
[0419] Нуклеазная активность CRISPR-Cas и редактирование генов в протопластах А. thaliana.
[0420] Сконструированные нуклеазы, такие как TAL-эффекторные нуклеазы (TALEN), и ассоциированную с короткими палиндромными повторами, регулярно расположенными группами (CRISPR), эндонуклеазу Cas9 (CRISPR-Cas9) можно запрограммировать для нацеливания и расщепления двухцепочечной ДНК с высокой специфичностью. TALEN состоят из двух плечей, в каждом из которых содержится подобный TAL-эффектору ДНК-связывающий домен (TALE), соединенный с каталитическим ДНК-нуклеазным доменом Fokl. Указанные домены TALE направляют плечи TALEN к определенным сайтам ДНК, позволяя димеризацию эндонуклеаз Fokl и последующее образование двухцепочечных разрывов (DSB). Система CRISPR-Cas9 состоит из двух компонентов: нуклеазы Cas9 Streptococcus pyogenes (SpCas9) и химерных двух слитых РНК (крРНК и тра-крРНК), называемых сконструированными отдельными РНК-проводниками (опРНК). ОпРНК способствует специфичности целевой нуклеиновой кислоты к Cas9 посредством спаривания ее первых двадцати 5'-оснований с ДНК-мишенью, что впоследствии приводит к сайт-специфическому двухцепочечному разрыву.
[0421] В растениях двухцепочечные разрывы обычно репарируются путем склонной к ошибкам репарации ДНК посредством негомологичного соединения концов (НГСК), что приводит к случайным делециям и/или вставкам (инсерционно-делеционным мутациям) в сайте репарации. Напротив, для точного редактирования генома вызванные нуклеазой двухцепочечные разрывы около целевой замены должны репарироваться направляемой гомологией репарацией (НГР), путем репарации, который более точен, чем НГСК, так как для него требуется гомологичная матрица ДНК, в большинстве случаев сестринская хроматида. Используя путь НГР можно применять сконструированный олигонуклеотид в качестве матрицы для репарации для редактирования ДНК специфично, если ДНК разрезается нуклеазами, или
неспецифично, если он используется в комбинации с вызывающими двухцепочечные разрывы антибиотиками.
[0422] На фиг. 16 изображена нуклеазная активность CRISPR-Cas9 в протопластах Arabidopsis thaliana, полученных из трансгенной по BFP модельной системы, в которой стабильно встроенный ген BFP может быть превращен в GFP путем редактирования кодона, кодирующего Н66 (CAC-> ТАС H66Y). Когда клетки обрабатывали CRISPR-Cas9 (ВС-1), вызванные НГСК инсерционно-делеционные мутации образовывались с частотой 0,79% около локуса Н66 гена BFP, что выявили с помощью глубокого секвенирования (фиг. 16а). Большинство инсерционно-делеционных мутаций представляли собой одиночные п.о., и ни одна из мутаций не была длиннее, чем 9 п.о. Напротив, клетки обработанные только GRON или обработанные имитирующими конструкциями, не содержали инсерционно-делеционных мутаций (результаты не представлены). Полученные результаты показали, что нуклеаза CRISPR-Cas9 способна активно нацеливаться на ген BFP в данной трансгенной модельной системе.
[0423] Касательно эффективности CRISPR-Cas9 в комбинации с GRON в
опосредовании редактирования гена BFP с получением GFP в протопластах, полученных из нашей трансгенной модельной системы, мы наблюдали 7,4-кратное улучшение в редактировании BFP с получением GFP, когда CRISPR-Cas9 и модифицированные фосфотиоатом (PS) GRON (CG6) вводили одновременно, по сравнению с обработками GRON отдельно или CRISPR-Cas9 отдельно (фиг. 16Ь). Данные результаты демонстрируют, что введение CRISPR-Cas9 с модифицированными PS GRON в протопласты Arabidopsis значительно повышает частоту редактирования гена BFP с получением GFP.
[0424] Три соседние модификации PS (называемые в данном тексте 3PS) на обоих 5'-и 3'-концах GRON положительно влияют на редактирование BFP с получением GFP по сравнению с немодифицированным GRON. Когда модифицированный 3PS GRON (CG2) комбинируют с CRISPR-Cas9 (ВС-1), редактирование BFP с получением GFP происходит более эффективно по сравнению с немодифицированной матрицей GRON (CGI; фиг. 17а). Кроме того, наблюдалась положительная корреляция между редактированием и длиной GRON (фиг. 17Ь). В совокупности данные результаты показали, что как модификация, так и длина GRON могут сильно повысить частоту редактирования генов в растениях, таких как Arabidopsis, в присутствии CRISPR-Cas9.
[0425] Когда либо модифицированный 3PS GRON длиной 201 нуклеооснование (н.о.) (CG6), либо 2'-0-метил-модифицированные GRON длиной 201 н.о. (CG9) или (CG10), включающие первые десять оснований РНК на 5'-конце, при этом первое РНК-основание или первые 9 РНК-оснований модифицированы 2'-0-метильной группой, вводили вместе с CRISPR-Cas9 (ВС-1) в протопласты Arabidopsis, не наблюдали статистически значимого различия между ними в редактировании BFP с получением GFP (фиг. 17с). Аналогично, когда либо модифицированный 3PS GRON длиной 201 н.о. (CG3), либо модифицированный СуЗ GRON длиной 201 н.о. (CG4), содержащие 5'-СуЗ и перевернутое основание З'-idC, вводили вместе с CRISPR-Cas9 (ВС-3) в протопласты Arabidopsis, не наблюдаемый статистически значимого различия в частоте редактирования (фиг. 17d). В целом, данные результаты показывают, что разнообразные модификации GRON могут сильно увеличить частоту редактирования генов в Arabidopsis в присутствии CRISPR-Cas9.
[0426] На основании данных результатов с CRISPR-Cas9 и модифицированными GRON определили, что модифицированные GRON вместе с парами TALEN, нацеленные на ген BFP, также приводят к улучшенному редактированию гена BFP с получением GFP. Для того, чтобы сначала показать эффективную нуклеазную активность в локусе BFP, протопласты Arabidopsis обработали TALEN (ВТ-1) и обнаружили 0,51 % инсерционно-делеционных мутаций в ожидаемом сайте расщепления или около него с помощью глубокого секвенирования, это указывает на то, что TALEN настолько же активны, как и CRISPR-Cas9 в данной модельной системе (фиг. 18а). Большинство делеций были > 10 п.о., но менее чем 50 п.о., тогда как вставки, значительно менее распространенные, чем делеций, были длиной три п.о. или менее. Затем мы исследовали эффективность редактирования BFP с получением GFP с помощью TALEN вместе с модифицированным GRON. Наблюдали 9,2-кратное увеличение частоты редактирования BFP с получением GFP, когда вводили как BFP TALEN (ВТ-1), так и 3PS-GRON (CG7), по сравнению с 3PS-GRON отдельно (фиг. 18Ь). Аналогично описанным выше экспериментам с CRISPR-Cas, данные результаты демонстрируют, что введение TALEN с модифицированными 3PS GRON в протопласты Arabidopsis также значительно повышало частоту редактирования гена BFP с получением GFP.
[0427] Локусы EPSPS (5'-енолпирувилшикимат-3-фосфатсинтазы) в Linum
usitatissimum (обычный лен) также использовали в качестве мише в данной системе. Гены EPSPS кодируют фермент в шикиматном пути, который участвует в биосинтезе
ароматических аминокислот фенилаланина, тирозина и триптофана. В растениях EPSPS является мишенью для гербицида - глифосата, где он действует как конкурентный ингибитор в сайте связывания фосфоенолпирувата.
[0428] Были выбраны TALEN, нацеленные на сайт около двух локусов (T97I и Р101 А) в L. usitatissimum, при редактировании которого EPSPS станет толерантным к глифосату (фиг. 18Ь с расширенными данными). При доставке в протопласты TALEN (LuET-1) вместе с 5'-СуЗ-модифицированным GRON длиной 144 н.о. (CG11), содержащим целевые изменения в T97I и Р101А, наблюдали частоты редактирования генов 0,19% в обоих локусах и частоты инсерционно-делеционных мутаций 0,5% через семь дней после внедрения (фиг. 18с, 18d). Большинство инсерционно-делеционных мутаций были 10 п.о. или менее (фиг. 18с). Полученные результаты демонстрируют, что введение TALEN с модифицированными СуЗ GRON в протопласты L. usitatissimum значительно повышало частоту редактирования гена EPSPS, а также что несколько замен нуклеотидов можно осуществить, применяя один GRON.
[0429] Пример 20. Влияние на превращение двух антибиотиков - представителей семейства блеомицина.
[0430] Цель данной серии примеров состояла в оценке влияния антибиотиков на эффективность превращения.
[0431] Методы
[0432] Протопласты из линии Arabidopsis thaliana с несколькими копиями гена синего флуоресцентного белка обрабатывали GRON, как описано в примере 1, со следующими изменениями: перед добавлением GRON протопласты выдерживали в течение 90 минут на льду в растворе ТМ (14,8 мМ MgCh х 6Н2О, 5 мМ 2-(№морфолино)этансульфоновая кислота, 572 мМ маннит), дополненном 0, 250 или 1000 мкг/мл зеоцина(tm) или флеомицина. рН указанных растворов подводили до 7,0. Процент клеток с зеленой флуоресценцией, возникшей в результате превращения BFP в GFP, оценивали с помощью проточной цитометрии, как описано в примере 1.
[0433] Результаты
[0434] Зеоцин и флеомицин при обеих применяемых концентрациях (250 и 1000 мкг/мл) приводили к повышению частоты редактирования гена BFP с получением GFP (см. фигуру 19). Клетки с зеленой флуоресценцией, возникшей в результате
редактирование гена BFP с получением GFP, наблюдали через пять дней после доставки GRON (фигура 20).
[0435] Ссылочные материалы.
1. LeCong и др. 2013 Science : том 339 номер 6121 стр. 819-823.
2. Jinek и др. 2012 Science. 337:816-21
3. Wang и др. 2008 RNA 14: 903-913
4. Zhang и др. 2013. Plant Physiol. 161: 20-27
[0436] Пример 21. CRISPR и GRON в клетках риса.
[0437] Цель данного эксперимента состояла в демонстрации изменения АККазы в Oryza sativa через 120 часов после опосредованной ПЭГ доставки плазмид CRISPR-Cas и GRON в протопласты. CRISPR-Cas, используемые в данном эксперименте, нацеливают на ген АККазы в геноме риса путем введения в протопласты плазмид(ы), кодирующих(-ей) ген Cas9, и опРНК. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). КрРНК направляет Cas9 к целевому гену, где Cas9 создает двухцепочечный разрыв в гене АККазы (accase), a GRON используют в качестве матрицы для изменения гена АККазы (accase) сайт-направленным способом.
[0438] Методы
[0439] Протопласты риса выделяли из каллюсов. Кодирующие CRISPR-Cas плазмиды содержали промотор убиквитина из кукурузы, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9, и промотор U6 риса, запускающий экспрессию опРНК, с терминатором поли-Тю. Плазмиды CRISPR-Cas вводили в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл. Использовали GRON со следующей последовательностью 5'-V С TGA ССТ GAA СТТ GAT СТС ААТ ТАА ССС TTG CGG TTC CAG ААС ATT GCC ТТТ TGC AGT ССТ СТС AGC АТА GCA СТС ААТ GCG GTC TGG GTT TAT СТТ GCT ТСС ААС GAC ААС ССА AGC ССС ТСС TCG TAG СТС TGC AGC CAT GGG ААТ GTA GAC AAA GGC AGG CTG ATT GTA TGT CCT AAG GTT СТС ААС AAT AGT CGA GCC H-3' в конечной концентрации 0,8 мкМ. Протопласты заключали в агарозу (2,5 х 106 клеток/мл), культивировали в жидкой среде и инкубировали на ротационном шейкере (60 об/мин) в темноте при 28°С. Отдельные образцы анализировали с помощью NGS через 120 часов после доставки плазмиды CRISPR-Cas и/или GRON, чтобы определить процент клеток (прочтений ДНК), несущих измененную АККазу и содержащих инсерционно-делеционные мутации в гене АККазы.
[0440] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых экспрессируются с одной и той же плазмиды. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсерную последовательность (5'-ACGAGGAGGGGCTTGGGTTGTGG-3), применяемую, чтобы нацелить нуклеазу Cas9 на целевой ген. В данном эксперименте CRISPR был нацелен на ген АККазы.
[0441] Результаты
[0442] Через 120 ч протопласты риса содержали 0,026% измененной АККазы, что определили путем секвенирования нового поколения. Для контролей только с GRON без CRISPR-Cas выявили минимальный уровень изменения АККазы, составляющий 0,002%, через 120 часов и для необработанных контролей не выявили изменения. Кроме того, данные результаты показывают, что CRISPR-Cas активен и способен расщепить целевой ген АККазы и создать инсерционно-делеционные мутации на уровне 8,0%.
[0443] Ссылочные материалы.
5. LeCong и др. 2013 Science : том 339, номер 6121, стр. 819-823.
6. Лпек и др. 2012 Science. 337:816-21
7. Wang и др. 2008 RNA 14: 903-913
8. Zhang и др. 2013. Plant Physiol. 161: 20-27
[0444] Пример 22. CRISPR и GRON в клетках риса.
[0445] Краткое описание. Целевые мутации в АККазе были обнаружены в девятнадцатинедельных каллюсах с помощью анализов ПЦР и секвенирования ДНК.
[0446] Введение
[0447] Цель данного эксперимента состояла в демонстрации изменения АККазы в каллюсах Oryza sativa после опосредованной ПЭГ доставки плазмид CRISPR-Cas и GRON в протопласты. CRISPR-Cas, используемые в данном эксперименте, нацеливали на ген АККазы в геноме риса путем введения в протопласты плазмид(ы), кодирующих(-ей) ген Cas9, и опРНК. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). КрРНК направляет Cas9 к целевому гену, где Cas9 создает либо двухцепочечный разрыв, либо одноцепочечный разрыв в определенном положении в гене АККазы, и указанные GRON используют в качестве матрицы для изменения гена АККазы сайт-направленным способом.
[0448] Результаты
[0449] Целевые мутации АККазы Oryza sativa, описанные ниже в таблицах, обнаружили в девятнадцатинедельных каллюсах с помощью анализов ПЦР и секвенирования ДНК.
[0450] Методы
[0451] Протопласты риса выделяли из суспензионных культур, инициированных полученными из зрелых семян эмбриогенными каллюсами. Плазмиды CRISPR-Cas с GRON в конечной концентрации 0,05 мкг/мкл и 0,8 мкМ, соответственно, вводили в протопласты с помощью способа опосредованной ПЭГ доставки. Типичный диапазон конечных концентраций плазмид CRISPR-Cas включает, но не ограничен: 0,01 - 0,2 мкг/мкл. Типичный диапазон конечных концентраций GRON включает, но не ограничен: 0,01 - 4 мкМ. Плазмиды, кодирующие CRISPR-Cas, содержат промотор убиквитина из кукурузы, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9, и промотор U6 риса, запускающий экспрессию опРНК, с
терминатором поли-Тю. Данные о последовательностях указанных GRON представлены в таблице 3. После обработки ПЭГ протопласты заключали в агарозу (1,25 х 106 клеток/мл), культивировали в жидкой среде и инкубировали на ротационном шейкере (60 об/мин) в темноте при 28°С. Типичный диапазон концентраций заключенных в агарозу протопластов включает, но не ограничен: 0,625 х 106 - 2,5 х 106 клеток/мл. Образцы после каждой обработки анализировали с помощью секвенирования нового поколения через 4 недели после обработки плазмидой CRISPR-Cas и/или GRON, чтобы определить долю клеток (прочтений ДНК), несущих измененную АККазу. Микрокаллюсы после приводящих к изменению обработок высвобождали на твердую селекционную среду, содержащую клетодим (0,25 - 0,5 мкМ) или сетоксидим (2,5 мкМ). Отдельные линии каллюсов, растущие на данной селекционной среде, через 19 недель культивирования анализировали с помощью собственных способов скрининга, а также путем секвенирования ДНК, чтобы определить отдельные каллюсы, содержащие целевые изменения АККазы.
[0452] CRISPR состоит из двух компонентов: Cas9, такого как кодон-
оптимизированный для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9), и опРНК, - оба из которых экспрессируются с плазмид(ы). Cas9 и опРНК также можно доставить посредством мРНК/РНК или белка/РНК, соответственно. ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсер с последовательностями, описанными в таблице 2, который применяли, чтобы нацелить нуклеазу Cas9 на целевой ген. В данном эксперименте CRISPR нацелен на ген АККазы риса.
[0453] Перечень изменений в двух различных положениях в гене АККазы Oryza sativa: сайте 1 и сайте 2. Для каждого сайта возможны все комбинации изменений.
АККаза Oryza sativa
Сайт 1
Сайт 2
I1781A
D2078G
I1781L
D2078K
I1781M
D2078T
1178 IN
S2079F
I1781S
К2080Е
I1781T
C2088F
I1781V
C2088G
G1783C
С2088Н
А1786Р
С2088К
АККаза Oryza
sativa
Сайт 1
Сайт 2
C2088L
C2088N
С2088Р
C2088Q
C2088R
C2088S
С2088Т
C2088V
C2088W
[0454] Перечень спейсерных последовательностей РНК-проводника CRISPR-Cas, используемых в данном эксперименте. Длина спейсера может изменяться вплоть до ± 20 п.о. Несовпадения внутри спейсерной последовательности могут допускаться размером до 10 п.о.
АККаза Oryza
Номер образца
Спейсерная последовательность РНК (от 5' к 3')
sativa
Сайт 1
Сайт 2
CAUAAGAUGCAGCUAGACAG
AGCUAGACAGUGGUGAAAUU
UAGACAGUGGUGAAAUUAGG
AGACAGUGGUGAAAUUAGGU
GUGGGUUAUUGAUUCUGUUG
UGGGUUAUUGAUUCUGUUGU
UAUUGAUUCUGUUGUGGGCA
UCUGUUGUGGGCAAGGAAGA
GUGGGCAAGGAAGAUGGACU
CAAGGAAGAUGGACUUGGUG
CUUGGUGUGGAGAAUAUACA
CUAUUGCCAGUGCUUAUUCU
UGCUUAUUCUAGGGCAUAUA
UUUACACUUACAUUUGUGAC
UUUGUGACUGGAAGAACUGU
ACUGGAAGAACUGUUGGAAU
GGAGCUUAUCUUGCUCGACU
AUAUGCCCUAGAAUAAGCAC
GAUAAGAUGCAGCUAGACAG
GGCUAGACAGUGGUGAAAUU
GAGACAGUGGUGAAAUUAGG
GGACAGUGGUGAAAUUAGGU
АККаза Oryza
Номер образца
Спейсерная последовательность РНК (от 5' к 3')
GGGGUUAUUGAUUCUGUUGU
sativa
Сайт 1
Сайт 2
GAUUGAUUCUGUUGUGGGCA
GCUGUUGUGGGCAAGGAAGA
GAAGGAAGAUGGACUUGGUG
GUUGGUGUGGAGAAUAUACA
GUAUUGC СAGUGCUUAUUCU
GGCUUAUUCUAGGGCAUAUA
GUUACACUUACAUUUGUGAC
GUUGUGACUGGAAGAACUGU
GCUGGAAGAACUGUUGGAAU
GUAUGCCCUAGAAUAAGCAC
CGACUAUUGUUGAGAACCUU
UGCCUUUGUCUACAUUCCCA
CCCAUGGCUGCAGAGCUACG
AUGGCUGCAGAGCUACGAGG
UGGCUGCAGAGCUACGAGGA
GGCUGCAGAGCUACGAGGAG
СAGAGCUAC GAGGAGGGGCU
AGAGCUACGAGGAGGGGCUU
ACGAGGAGGGGCUUGGGUUG
GCAUUGAGUGCUAUGCUGAG
UAUGCUGAGAGGACUGCAAA
GACUGCAAAAGGCAAUGUUC
GGCAAUGUUCUGGAACCGCA
GCAAUGUUCUGGAACCGCAA
GGUUAAUUGAGAUCAAGUUC
UGAGAUCAAGUUCAGGUCAG
GUUCAGGUCAGAGGAACUCC
AACUCCAGGAUUGCAUGAGU
CAAGCCGACUCAUGCAAUCC
UUGAUCUCAAUUAACCCUUG
UCUCAGCAUAGCACUCAAUG
GCAUAGCACUCAAUGCGGUC
CAUAGCACUCAAUGCGGUCU
UCCUCGUAGCUCUGCAGCCA
AGCCAUGGGAAUGUAGACAA
AUGGGAAUGUAGACAAAGGC
CAGGCUGAUUGUAUGUCCUA
GGACUAUUGUUGAGAACCUU
GGCCUUUGUCUACAUUCCCA
АККаза Oryza
Номер образца
Спейсерная последовательность РНК (от 5' к 3')
GCCAUGGCUGCAGAGCUACG
sativa
Сайт 1
Сайт 2
GUGGCUGCAGAGCUACGAGG
GGGCUGCAGAGCUACGAGGA
GAGAGCUAC GAGGAGGGGCU
GGAGCUACGAGGAGGGGCUU
GCGAGGAGGGGCUUGGGUUG
GAUGCUGAGAGGACUGCAAA
GGAGAUCAAGUUCAGGUCAG
GACUCCAGGAUUGCAUGAGU
GAAGCCGACUCAUGCAAUCC
GUGAUCUCAAUUAACCCUUG
GCUCAGCAUAGCACUCAAUG
GAUAGCACUCAAUGCGGUCU
GCCUCGUAGCUCUGCAGCCA
GGCCAUGGGAAUGUAGACAA
GUGGGAAUGUAGACAAAGGC
GAGGCUGAUUGUAUGUCCUA
[0455] Перечень последовательностей GRON, подходящих для применения в данном эксперименте, предложен в таблице ниже (V=CY3; H=3'DMT dC CPG).
VGTCATAGCACATAAGATGCAGCTAGACAGTGGTGAAATTAGGTGGGTTATTGATT CTGTTGTGGGCAAGGAAGATGGACTTGGTGTGGAGAATGCTCATGGAAGTGCTGC TATTGCCAGTGCTTATTCTAGGGCATATAAGGAGACATTTACACTTACATTTGTGA CTGGAAGAACTGTTGGAATAGGAGCTTATCTTGCTCH
VGAGCAAGATAAGCTCCTATTCCAACAGTTCTTCCAGTCACAAATGTAAGTGTAAA TGTCTCCTTATATGCCCTAGAATAAGCACTGGCAATAGCAGCACTTCCATGCAGAT TCTCCACACCAAGTCCATCTTCCTTGCCCACAACAGAATCAATAACCCACCTAATT TCACCACTGTCTAGCTGCATCTTATGTGCTATGACH
VGTCATAGCACATAAGATGCAGCTAGACAGTGGTGAAATTAGGTGGGTTATTGATT CTGTTGTGGGCAAGGAAGATGGACTTGGTGTGGAGAATATACATTGCAGTGCTGCT ATTGCCAGTGCTTATTCTAGGGCATATAAGGAGACATTTACACTTACATTTGTGAC TGGAAGAACTGTTGGAATAGGAGCTTATCTTGCTCH
VGAGCAAGATAAGCTCCTATTCCAACAGTTCTTCCAGTCACAAATGTAAGTGTAAA TGTCTCCTTATATGCCCTAGAATAAGCACTGGCAATAGCAGCACTGCAATGTATAT TCTCCACACCAAGTCCATCTTCCTTGCCCACAACAGAATCAATAACCCACCTAATT TCACCACTGTCTAGCTGCATCTTATGTGCTATGACH
VGTCATAGCACATAAGATGCAGCTAGACAGTGGTGAAATTAGGTGGGTTATTGATT CTGTTGTGGGCAAGGAAGATGGACTTGGTGTGGAGAATATACATGGAAGTGCTCC AATTGCCAGTGCTTATTCTAGGGCATATAAGGAGACATTTACACTTACATTTGTGA CTGGAAGAACTGTTGGAATAGGAGCTTATCTTGCTCH
VGAGCAAGATAAGCTCCTATTCCAACAGTTCTTCCAGTCACAAATGTAAGTGTAAA TGTCTCCTTATATGCCCTAGAATAAGCACTGGCAATGGTAGCACTTCCATGTATATT CTCCACACCAAGTCCATCTTCCTTGCCCACAACAGAATCAATAACCCACCTAATTT CACCACTGTCTAGCTGCATCTTATGTGCTATGACH
VCTGACCTGAACTTGATCTCAATTAACCCTTGCGGTTCCAGAACATTGCCTTTTGCA GTCCTCTCAGCATAGCACTCAATGCGGTCTGGGTTTATCTTGCTTCCAACGACAAC CCAAGCCCCTCCTCGTAGCTCTGCAGCCATGGGAATGTAGACAAAGGCAGGCTGA TTGTATGTCCTAAGGTTCTCAACAATAGTCGAGCCH
VGGCTCGACTATTGTTGAGAACCTTAGGACATACAATCAGCCTGCCTTTGTCTACA TTCCCATGGCTGCAGAGCTACGAGGAGGGGCTTGGGTTGTGGTTGGTAGCAAGAT AAACCCAGACCGCATTGAGTGCTATGCTGAGAGGACTGCAAAAGGCAATGTTCTG GAACCGCAAGGGTTAATTGAGATCAAGTTCAGGTCAGH
VCTGACCTGAACTTGATCTCAATTAACCCTTGCGGTTCCAGAACATTGCCTTTTGCA GTCCTCTCAGCATAGCACTCAATGCGGTCTGGGTTTATCTTAAAATCAACGACAAC CCAAGCCCCTCCTCGTAGCTCTGCAGCCATGGGAATGTAGACAAAGGCAGGCTGA TTGTATGTCCTAAGGTTCTCAACAATAGTCGAGCCH
VGGCTCGACTATTGTTGAGAACCTTAGGACATACAATCAGCCTGCCTTTGTCTACA TTCCCATGGCTGCAGAGCTACGAGGAGGCGCTTGGGTTGTGGTTGATAGCAAGATA AACCCAGACCGCATTGAGAGGTATGCTGAGAGGACTGCAAAAGGCAATGTTCTGG AACCGCAAGGGTTAATTGAGATCAAGTTCAGGTCAGH
VGGCTCGACTATTGTTGAGAACCTTAGGACATACAATCAGCCTGCCTTTGTCTACA TTCCCATGGCTGCAGAGCTACGAGGAGGGGCTTGGGTTGTGGTTGATAGCGAAAT AAACCCAGACCGCATTGAGTGCTATGCTGAGAGGACTGCAAAAGGCAATGTTCTG GAACCGCAAGGGTTAATTGAGATCAAGTTCAGGTCAGH
VCTGACCTGAACTTGATCTCAATTAACCCTTGCGGTTCCAGAACATTGCCTTTTGCA GTCCTCTCAGCATAGCACTCAATGCGGTCTGGGTTTATTTCGCTATCAACCACAAC CCAAGCGCCTCCTCGTAGCTCTGCAGCCATGGGAATGTAGACAAAGGCAGGCTGA TTGTATGTCCTAAGGTTCTCAACAATAGTCGAGCCH
VGGCTCGACTATTGTTGAGAACCTTAGGACATACAATCAGCCTGCCTTTGTCTACA TTCCCATGGCTGCAGAGCTACGAGGAGGGGCTTGGGTTGTGGTTGATAGCAAGAT AAACCCAGACCGCATTGAGCGTTATGCTGAGAGGACTGCAAAAGGCAATGTTCTG GAACCGCAAGGGTTAATTGAGATCAAGTTCAGGTCAGH
VCTGACCTGAACTTGATCTCAATTAACCCTTGCGGTTCCAGAACATTGCCTTTTGCA GTCCTCTCAGCATATTGCTCAATGCGGTCTGGGTTTATCTTGCTATCAACGACAACC CAAGCCCCTCCTCGTAGCTCTGCAGCCATGGGAATGTAGACAAAGGCAGGCTGATT GTATGTCCTAAGGTTCTCAACAATAGTCGAGCCH
[0456] Пример 23. CRISPR и GRON в клетках льна.
[0457] Краткое описание. Целевые мутации в LuEPSPS обнаружили в
четырехнедельных каллюсах с помощью анализов ПЦР и секвенирования ДНК.
[0458] Введение
[0459] Цель данного эксперимента состояла в демонстрации изменения генов EPSPS в геноме Linum usitatissimum в протопластах, полученных из кончика побега, с помощью опосредованной ПЭГ доставки плазмид CRISPR-Cas и GRON. CRISPR-Cas и GRON, используемые в данном эксперименте, нацелены на гены EPSPS в геноме льна. CRISPR состоит из двух компонентов: Cas9, такого как кодон-оптимизированный для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9), и опРНК, оба из которых экспрессируются с плазмид(ы). Cas9 и опРНК также можно доставить посредством мРНК/РНК или белка/РНК, соответственно. ОпРНК представляет собой слитые РНК
CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). КрРНК направляет Cas9 к целевым генам, где Cas9 создает либо двухцепочечный разрыв, либо одноцепочечный разрыв в генах EPSPS, и указанные GRON используют в качестве матрицы для изменения генов EPSPS сайт-направленным способом.
[0460] Результаты
[0461] Целевые мутации в LuEPSPS (T97I и/или Р101А, Р101Т или P101S и/или G96A) были обнаружены в четырехнедельных каллюсах с помощью анализов ПНР и секвенирования ДНК. Побеги воспроизводили из данных измененных каллюсов.
[0462] Методы
[0463] Протопласты льна выделяли из кончиков побегов, полученных из пророщенных in vitro семян. Кодирующие CRISPR-Cas плазмиды содержали промотор Mas, запускающий экспрессию кодирующей последовательности Cas9, с терминатором rbcSE9, и промотор U6 Arabidopsis thaliana, запускающий экспрессию опРНК, с терминатором поли-Тю. Плазмиды CRISPR-Cas вводили в протопласты с помощью опосредованной ПЭГ доставки в конечной концентрации 0,05 мкг/мкл. GRON, нацеленные на каждый из указанных двух генов льна LuEPSPS (таблица 2), использовали в конечной концентрации 4,0 мкМ. Типичный диапазон конечных концентраций плазмид CRISPR-Cas включает, но не ограничен: 0,01 - 0,2 мкг/мкл. Типичный диапазон конечных концентраций GRON включает, но не ограничен: 0,01 - 4 мкМ. Протопласты заключали в альгинатные гранулы (5 х 105 клеток/мл), культивировали в жидкой среде и инкубировали на ротационном шейкере (30 об/мин) в темноте при 25°С. Типичный диапазон концентраций заключенных в альгинатные гранулы протопластов включает, но не ограничен: 3,0 X 105 - 7,5 X 105 клеток/мл. Микрокаллюсы, развившиеся из отдельных клеток, анализировали с помощью секвенирования нового поколения через 3 и 7 недель после доставки плазмиды CRISPR-Cas и GRON, чтобы определить долю клеток (прочтений ДНК), несущих целевые мутации в генах LuEPSPS. Каллюсы большего размера вырастили из 8-недельных измененных микрокаллюсов, высеяных на твердую среду для регенерации, и побеги начали дифференцироваться из полученных каллюсов через приблизительно 4-8 недель. Измененные каллюсы и побеги с целевыми мутациями в гене EPSPS обнаружили с помощью анализов ПЦР и секвенирования ДНК.
[0464] CRISPR состоит из двух компонентов: кодон-оптимизированного для экспрессии в растениях Cas9 Streptococcus pyogenes (SpCas9) и опРНК, оба из которых
экспрессируются с плазмид(ы). ОпРНК представляет собой слитые РНК CRISPR (крРНК) и транс-активирующую крРНК (тра-крРНК). Участок крРНК содержит спейсер с последовательностями, описанными в таблице ниже, который применяли, чтобы нацелить нуклеазу Cas9 на целевые гены EPSPS.
[0465] Перечень спейсерных последовательностей РНК-проводника CRISPR-Cas, используемых в данном эксперименте. Длина спейсера может изменяться вплоть до ± 20 п.о. Несовпадения внутри спейсерной последовательности могут допускаться размером до 10 п.о.
Гены
Номер образца
Спейсерная последовательность РНК (от 5' к 3')
LuEPSPS
С AG A AGC GCGC С AUUGUUGA
CGCGCCAUUGUUGAAGGUUG
CGCGCCAUUGUUGAAGGUCG
GCCAUUGUUGAAGGUUGUGG
GCCAUUGUUGAAGGUCGUGG
AGGUUGUGGUGGUGUGUUUC
AGGUCGUGGUGGUGUGUUUC
UGUGGUGGUGUGUUUCCGGU
CGUGGUGGUGUGUUUCCGGU
UGUGUUUCCGGUCGGUAAAC
UGUUUCCGGUCGGUAAACUG
AACGAUAUUGAACUUUUCCU
ААС GAUAUC GAACUUUUC CU
GAACUUUUCCUUGGAAAUGC
ACAGCUGCUGUAACAGCCGC
GCUGCUGUAACAGCCGCUGG
AACUCAAGCUACAUACUCGA
AACUCAAGCUACAUACUCGA
CGAAUGAGAGAGAGACCAAU
CGAAUGAGAGAGAGACCGAU
AG AG AG АС С A AUUGGAGAUU
CCAAUUGGAGAUUUGGUUGU
CCGAUUGGAGAUUUAGUUGU
CCAACAACCAAAUCUCCAAU
CCAACAACUAAAUCUCCAAU
AUUGGUCUCUCUCUCAUUCG
AUCGGUCUCUCUCUCAUUCG
GU AGCUUGAGUUGC CUC CAG
GCUGUUACAGCAGCUGUCAG
UAGCUGUUCCAGCAUUUCCA
UUCUUCGCCAGUUUACCGAC
UUCUUCCCCAGUUUACCGAC
ACCACCACAACCUUCAACAA
ACCACCACGACCUUCAACAA
GAGAAGCGC GCC AUUGUUGA
GGCGCCAUUGUUGAAGGUUG
GGC GCC AUUGUUGA AGGUC G
GGGUUGUGGUGGUGUGUUUC
GGGUCGUGGUGGUGUGUUUC
GGUGGUGGUGUGUUUCCGGU
GGUGGUGGUGUGUUUCCGGU
GGUGUUUCCGGUCGGUAAAC
GGUUUCCGGUCGGUAAACUG
GACGAUAUUGAACUUUUCCU
GACGAUAUCGAACUUUUCCU
GCAGCUGCUGUAACAGCCGC
GACUCAAGCUACAUACUCGA
GACUCAAGCUACAUACUCGA
GGA AUGAGAGAGAGAC С A AU
GGAAUGAGAGAGAGACCGAU
GGAG AG AC С A AUUGGAGAUU
GCAAUUGGAGAUUUGGUUGU
GCGAUUGGAGAUUUAGUUGU
GCAACAACCAAAUCUCCAAU
GCAACAACUAAAUCUCCAAU
GUUGGUCUCUCUCUCAUUCG
GUCGGUCUCUCUCUCAUUCG
GAGCUGUUCCAGCAUUUCCA
GUCUUCGCCAGUUUACCGAC
GUCUUCCCCAGUUUACCGAC
GCCACCACAACCUUCAACAA
GCCACCACGACCUUCAACAA
[0466] Перечень последовательностей GRON, подходящих для применения в данном эксперименте, предложен в таблице ниже (V = CY3; Н = 3'DMT dC CPG).
VCGGTCGGTAAACTGGCGAAGAACGATATTGAACTTTTCCTTGGAAATGCT GCTATAGCTATGCGTGCGCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTCCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGGACCTTGAGTTGCC TCCAGCGGCTGTTACAGCAGCTGTCAGCGGACGCATAGCTGTGGCAGCATT TCCAAGGAAAAGTTCAATATCGTTCTTCGCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGCGAAGAACGATATTGAACTTTTCCTTGGAAATGCTGGAAT
AGCTATGCGTGCGCTGACAGCTGCTGTAACAGCCGCTGGAGGCAACTCAAGGTCC
CTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGGACCTTGAGTTGCC
TCCAGCGGCTGTTACAGCAGCTGTCAGCGCACGCATAGCTATTCCAGCATT
TCCAAGGAAAAGTTCAATATCGTTCTTCGCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGCGAAGAACGATATTGAACTTTTCCTTGGAAATGCT GGAATTGCTATGCGTTCTCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTCCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGGACCTTGAGTTGCC TCCAGCGGCTGTTACAGCAGCTGTCAGTGAACGCATAGCAATTCCAGCATT TCCAAGGAAAAGTTCAATATCGTTCTTCGCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGCGAAGAACGATATTGAACTTTTCCTTGGAAATGCT GGAATCGCTATGCGTACTCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTCCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGGACCTTGAGTTGCC
TCCAGCGGCTGTTACAGCAGCTGTCAGTGTACGCATAGCAATTCCAGCATT
TCCAAGGAAAAGTTCAATATCGTTCTTCGCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGCGAAGAACGATATTGAACTTTTCCTTGGAAATGCT GGAATTGCTATGCGTGCGCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTCCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGAACCTTGAGTTGCC
TCCAGCGGCTGTTACAGCAGCTGTCAGCGCACGCATAGCTATTCCAGCATT
TCCAAGGAAAAGTTCGATATCGTTCTTCCCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGCGAAGAACGATATTGAACTTTTCCTTGGAAATGCT GGAATAGCTATGCGTGCTCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTCCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGGACCTTGAGTTGCC
TCCAGCGGCTGTTACAGCAGCTGTCAGCGCACGCATAGCTGTTCCAGCATT
TCCAAGGAAAAGTTCAATATCGTTCTTCGCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGGGAAGAACGATATCGAACTTTTCCTTGGAAATGCT GCTATAGCTATGCGTGCGCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTTCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGAACCTTGAGTTGCC TCCAGCGGCTGTTACAGCAGCTGTCAGCGGACGCATAGCTGTTGCAGCATT TCCAAGGAAAAGTTCGATATCGTTCTTCCCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGGGAAGAACGATATCGAACTTTTCCTTGGAAATGCT GGAATAGCTATGCGTGCGCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTTCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGAACCTTGAGTTGCC
TCCAGCGGCTGTTACAGCAGCTGTCAGCGCACGCATAGCTATTCCAGCATT
TCCAAGGAAAAGTTCGATATCGTTCTTCCCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGGGAAGAACGATATCGAACTTTTCCTTGGAAATGCT GGAATTGCTATGCGTTCTCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTTCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGAACCTTGAGTTGCC TCCAGCGGCTGTTACAGCAGCTGTCAGTGAACGCATAGCGATTCCAGCATT TCCAAGGAAAAGTTCGATATCGTTCTTCCCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGGGAAGAACGATATCGAACTTTTCCTTGGAAATGCT GGAATCGCTATGCGTACTCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTTCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGAACCTTGAGTTGCC
TCCAGCGGCTGTTACAGCAGCTGTCAGTGTACGCATAGCTATTCCAGCATTT
CCAAGGAAAAGTTCGATATCGTTCTTCCCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGGGAAGAACGATATCGAACTTTTCCTTGGAAATGCT GGAATCGCTATGCGTGCGCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTTCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGAACCTTGAGTTGCC TCCAGCGGCTGTTACAGCAGCTGTCAGCGGACGCATAGCTATTCCAGCATT TCCAAGGAAAAGTTCGATATCGTTCTTCCCCAGTTTACCGACCGH
VCGGTCGGTAAACTGGGGAAGAACGATATCGAACTTTTCCTTGGAAATGCT GGAATAGCTATGCGTGCTCTGACAGCTGCTGTAACAGCCGCTGGAGGCAAC TCAAGGTTCCTTCCCTCAACTCCTTCCAGCCTTTCAGCTTCTTH
VAAGAAGCTGAAAGGCTGGAAGGAGTTGAGGGAAGGAACCTTGAGTTGCC TCCAGCGGCTGTTACAGCAGCTGTCAGGGAACGCATAGCTGTTCCAGCATT TCCAAGGAAAAGTTCGATATCGTTCTTCCCCAGTTTACCGACCGH
[0467] Для специалиста в данной области техники должно быть очевидно, что настоящее описание хорошо подходит для осуществления целей и достижения задач и преимуществ, которые упомянуты, а также свойствены им. Примеры, предложенные в данной заявке, представляют собой типичные предпочтительные варианты реализации, они иллюстративны и не предполагают ограничения объема настоящего описания.
[0468] Для специалиста в данной области техники будет очевидно, что в настоящее описание, изложенное в данной заявке, можно внести разнообразные изменения и модификации, не отклоняясь от объема и сущности настоящего описания.
[0469] Настоящее описание, наглядно изложенное в данной заявке, можно подходящим образом осуществить в отсутствие любого элемента или элементов, ограничения или ограничений, которые конкретно не описаны в данной заявке. Таким образом, например, в каждом случае в данной заявке любой из терминов "включающий", "состоящий по существу из" и "состоящий из" можно заменить на любой из двух других терминов. Термины и формулировки, которые были использованы, применяли для описания, а не ограничения, и не предполагается, что при применении таких терминов и формулировок исключаются какие-либо эквиваленты показанных и описанных свойств или их частей, но очевидно, что возможны различные модификации в рамках заявленного объема настоящего описания. Таким образом, должно быть очевидно, что хотя настоящее описание было описано конкретными предпочтительными вариантами реализации и необязательными свойствами, специалисты в данной области техники могут прибегнуть к модификациям и вариациям идей, описанных в данной заявке, и что такие модификации и вариации считают входящими в объем настоящего описания, установленный прилагаемой формулой изобретения.
[0470] Таким образом, должно быть очевидно, что хотя настоящее описание было конкретно описано предпочтительными вариантами реализации и возможными свойствами, специалисты в данной области могут прибегнуть к модификации, усовершенствованию и вариации изложенного описания, и считают, что такие модификации, улучшения и вариации входят в объем настоящего описания. Материалы,
способы и примеры, приведенные в данном тексте, представляют собой примеры предпочтительных вариантов реализации, являются типичными, и не предполагается, что они ограничивают объем настоящего описания.
[0471] Настоящее описание было изложено широко и в общих чертах в данном тексте. Каждый из указанных более узких видов и субгенерических групп, соответствующих общему описанию, также являются частью настоящего описания. Это включает общее изложение настоящего описания при условии, что отрицательное ограничение исключает любой объект изобретения из класса, независимо от того, конкретно перечислен или нет исключенный материал в данной заявке.
[0472] Кроме того, если свойства или аспекты настоящего описания изложены в терминах групп Маркуша, то для специалистов в данной области будет очевидно, что настоящее описание также, вследствие этого, изложено в терминах любого отдельного представителя или подгруппы представителей группы Маркуша.
[0473] Все публикации, заявки на патент, патенты и другие ссылочные материалы, упомянутые в данной заявке, явным образом полностью включены посредством ссылки, до той же степени, как если бы каждый был отдельно включен посредством ссылки. В случае противоречия настоящее описание, включая определения, будет иметь преимущественную силу.
[0474] Другие варианты реализации описаны в приведенной ниже формуле изобретения.
СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ
КИБУС ЮС ЛЛС КИБУС ЮРОП Б.В.
<12 0> СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ НАПРАВЛЕННОЙ МОДИФИКАЦИИ ГЕНОВ С ПРИМЕНЕНИЕМ ОПОСРЕДОВАННОЙ ОЛИГОНУКЛЕОТИДАМИ РЕПАРАЦИИ ГЕНОВ
<130> CIBUS-029-PCT
<140> PCT/US2015/020622 <141> 2015-03-14
<150> 62/133,129
<151> 2015-03-13
<150> 62/075,816
<151> 2014-11-05
<150> 62/075,811 <151> 2014-11-05
<150> 62/051,579 <151> 2014-09-17
<150> 61/953,333 <151> 2014-03-14
<160> 253
<170> PatentIn версия 3.5
<210> 1 <211> 2320
<212> Белок
<213> Alopecurus myosuroides
<400> 1
Met Gly Ser Thr His Leu Pro Ile Val Gly Phe Asn Ala Ser Thr Thr
1 5 10 15
Pro Ser Leu Ser Thr Leu Arg Gln Ile Asn Ser Ala Ala Ala Ala Phe
20 25 30
Gln Ser Ser Ser Pro Ser Arg Ser Ser Lys Lys Lys Ser Arg Arg Val
35 40 45
Lys Ser Ile Arg Asp Asp Gly Asp Gly Ser Val Pro Asp Pro Ala Gly
50 55 60
His Gly Gln Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro
65 70 75 80
Lys Glu Gly Ala Ser Ala Pro Asp Val Asp Ile Ser His Gly Ser Glu
85 90 95
Asp His Lys Ala Ser Tyr Gln Met Asn Gly Ile Leu Asn Glu Ser His
100 105 110
Asn Gly Arg His Ala Ser Leu Ser Lys Val Tyr Glu Phe Cys Thr Glu
115 120 125
Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly
130 135 140
Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp
145 150 155 160
Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro
165 170 175
Glu Asp Met Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe
180 185 190
Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln
195 200 205
Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro
210 215 220
Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr
225 230 235 240
Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met Asn Ala
245 250 255
Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val
260 265 270
Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Ile Pro Leu Glu Leu
275 280 285
Cys Leu Asp Ser Ile Pro Glu Glu Met Tyr Arg Lys Ala Cys Val Thr
290 295 300
Thr Ala Asp Glu Ala Val Ala Ser Cys Gln Met Ile Gly Tyr Pro Ala
305 310 315 320
Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val
325 330 335
Asn Asn Asp Asp Glu Val Lys Ala Leu Phe Lys Gln Val Gln Gly Glu
340 345 350
Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ser Gln Ser Arg
355 360 365
His Leu Glu Val Gin Leu Leu Cys Asp Glu Tyr Gly Asn Val Ala Ala
370 375 380
Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile
385 390 395 400
Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu
405 410 415
Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala
420 425 430
Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe
435 440 445
Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Ser
450 455 460
Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly
465 470 475 480
Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asp
485 490 495
Asn Gly Gly Gly Tyr Asp Ile Trp Arg Lys Thr Ala Ala Leu Ala Thr
500 505 510
Pro Phe Asn Phe Asp Glu Val Asp Ser Gln Trp Pro Lys Gly His Cys
515 520 525
Val Ala Val Arg Ile Thr Ser Glu Asn Pro Asp Asp Gly Phe Lys Pro
530 535 540
Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val
545 550 555 560
Trp Gly Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala
565 570 575
Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Glu Thr Arg Ser Ala
580 585 590
Ala Ile Thr Ser Met Ser Leu Ala Leu Lys Glu Ile Gln Ile Arg Gly
595 600 605
Glu Ile His Thr Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Pro
610 615 620
Asp Phe Arg Glu Asn Thr Ile His Thr Gly Trp Leu Asp Thr Arg Ile
625 630 635 640
Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val
645 650 655
Gly Gly Ala Leu Tyr Lys Thr Ile Thr Thr Asn Ala Glu Thr Val Ser
660 665 670
Glu Tyr Val Ser Tyr Leu Ile Lys Gly Gln Ile Pro Pro Lys His Ile
675 680 685
Ser Leu Val His Ser Thr Ile Ser Leu Asn Ile Glu Glu Ser Lys Tyr
690 695 700
Thr Ile Glu Ile Val Arg Ser Gly Gln Gly Ser Tyr Arg Leu Arg Leu
705 710 715 720
Asn Gly Ser Leu Ile Glu Ala Asn Val Gln Thr Leu Cys Asp Gly Gly
725 730 735
Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu
740 745 750
Glu Ala Gly Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Leu Leu
755 760 765
Gln Asn Asp His Asp Pro Ser Arg Leu Leu Ala Glu Thr Pro Cys Lys
770 775 780
Leu Leu Arg Phe Leu Ile Ala Asp Gly Ala His Val Asp Ala Asp Val
785 790 795 800
Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser
805 810 815
Pro Ala Ala Gly Val Ile Asn Val Leu Leu Ser Glu Gly Gln Ala Met
820 825 830
Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala
835 840 845
Val Lys Arg Ala Glu Pro Phe Glu Gly Ser Phe Pro Glu Met Ser Leu
850 855 860
Pro Ile Ala Ala Ser Gly Gln Val His Lys Arg Cys Ala Ala Ser Leu
865 870 875 880
Asn Ala Ala Arg Met Val Leu Ala Gly Tyr Asp His Ala Ala Asn Lys
885 890 895
Val Val Gln Asp Leu Val Trp Cys Leu Asp Thr Pro Ala Leu Pro Phe
900 905 910
Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg
915 920 925
Arg Leu Lys Ser Glu Leu Glu Gly Lys Tyr Asn Glu Tyr Lys Leu Asn
930 935 940
Val Asp His Val Lys Ile Lys Asp Phe Pro Thr Glu Met Leu Arg Glu
945 950 955 960
Thr Ile Glu Glu Asn Leu Ala Cys Val Ser Glu Lys Glu Met Val Thr
965 970 975
Ile Glu Arg Leu Val Asp Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu
980 985 990
Gly Gly Arg Glu Ser His Ala His Phe Ile Val Lys Ser Leu Phe Glu
995 1000 1005
Glu Tyr Leu Ser Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser
1010 1015 1020
Asp Val Ile Glu Arg Leu Arg Leu Gln Tyr Ser Lys Asp Leu Gln
1025 1030 1035
Lys Val Val Asp Ile Val Leu Ser His Gln Gly Val Arg Asn Lys
1040 1045 1050
Thr Lys Leu Ile Leu Ala Leu Met Glu Lys Leu Val Tyr Pro Asn
1055 1060 1065
Pro Ala Ala Tyr Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn
1070 1075 1080
His Lys Arg Tyr Tyr Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu
1085 1090 1095
Glu Gln Thr Lys Leu Ser Glu Leu Arg Thr Ser Ile Ala Arg Asn
1100 1105 1110
Leu Ser Ala Leu Asp Met Phe Thr Glu Glu Lys Ala Asp Phe Ser
1115 1120 1125
Leu Gln Asp Arg Lys Leu Ala Ile Asn Glu Ser Met Gly Asp Leu
1130 1135 1140
Val Thr Ala Pro Leu Pro Val Glu Asp Ala Leu Val Ser Leu Phe
1145 1150 1155
Asp Cys Thr Asp Gln Thr Leu Gln Gln Arg Val Ile Gln Thr Tyr
1160 1165 1170
Ile Ser Arg Leu Tyr Gln Pro Gln Leu Val Lys Asp Ser Ile Gln
1175 1180 1185
Leu Lys Tyr Gln Asp Ser Gly Val Ile Ala Leu Trp Glu Phe Thr
1190 1195 1200
Glu Gly Asn His Glu Lys Arg Leu Gly Ala Met Val Ile Leu Lys
1205 1210 1215
Ser Leu Glu Ser Val Ser Thr Ala Ile Gly Ala Ala Leu Lys Asp
1220 1225 1230
Ala Ser His Tyr Ala Ser Ser Ala Gly Asn Thr Val His Ile Ala
1235 1240 1245
Leu Leu Asp Ala Asp Thr Gln Leu Asn Thr Thr Glu Asp Ser Gly
1250 1255 1260
Asp Asn Asp Gln Ala Gln Asp Lys Met Asp Lys Leu Ser Phe Val
1265 1270 1275
Leu Lys Gln Asp Val Val Met Ala Asp Leu Arg Ala Ala Asp Val
1280 1285 1290
Lys Val Val Ser Cys Ile Val Gln Arg Asp Gly Ala Ile Met Pro
1295 1300 1305
Met Arg Arg Thr Phe Leu Leu Ser Glu Glu Lys Leu Cys Tyr Glu
1310 1315 1320
Glu Glu Pro Ile Leu Arg His Val Glu Pro Pro Leu Ser Ala Leu
1325 1330 1335
Leu Glu Leu Asp Lys Leu Lys Val Lys Gly Tyr Asn Glu Met Lys
1340 1345 1350
Tyr Thr Pro Ser Arg Asp Arg Gln Trp His Ile Tyr Thr Leu Arg
1355 1360 1365
Asn Thr Glu Asn Pro Lys Met Leu His Arg Val Phe Phe Arg Thr
1370 1375 1380
Leu Val Arg Gln Pro Ser Ala Gly Asn Arg Phe Thr Ser Asp His
1385 1390 1395
Ile Thr Asp Val Glu Val Gly His Ala Glu Glu Pro Leu Ser Phe
1400 1405 1410
Thr Ser Ser Ser Ile Leu Lys Ser Leu Lys Ile Ala Lys Glu Glu
1415 1420 1425
Leu Glu Leu His Ala Ile Arg Thr Gly His Ser His Met Tyr Leu
1430 1435 1440
Cys Ile Leu Lys Glu Gln Lys Leu Leu Asp Leu Val Pro Val Ser
1445 1450 1455
Gly Asn Thr Val Val Asp Val Gly Gln Asp Glu Ala Thr Ala Cys
1460 1465 1470
Ser Leu Leu Lys Glu Met Ala Leu Lys Ile His Glu Leu Val Gly
1475 1480 1485
Ala Arg Met His His Leu Ser Val Cys Gln Trp Glu Val Lys Leu
1490 1495 1500
Lys Leu Val Ser Asp Gly Pro Ala Ser Gly Ser Trp Arg Val Val
1505 1510 1515
Thr Thr Asn Val Thr Gly His Thr Cys Thr Val Asp Ile Tyr Arg
1520 1525 1530
Glu Val Glu Asp Thr Glu Ser Gln Lys Leu Val Tyr His Ser Thr
1535 1540 1545
Ala Leu Ser Ser Gly Pro Leu His Gly Val Ala Leu Asn Thr Ser
1550 1555 1560
Tyr Gln Pro Leu Ser Val Ile Asp Leu Lys Arg Cys Ser Ala Arg
1565 1570 1575
Asn Asn Lys Thr Thr Tyr Cys Tyr Asp Phe Pro Leu Thr Phe Glu
1580 1585 1590
Ala Ala Val Gln Lys Ser Trp Ser Asn Ile Ser Ser Glu Asn Asn
1595 1600 1605
Gln Cys Tyr Val Lys Ala Thr Glu Leu Val Phe Ala Glu Lys Asn
1610 1615 1620
Gly Ser Trp Gly Thr Pro Ile Ile Pro Met Gln Arg Ala Ala Gly
1625 1630 1635
Leu Asn Asp Ile Gly Met Val Ala Trp Ile Leu Asp Met Ser Thr
1640 1645 1650
Pro Glu Phe Pro Ser Gly Arg Gln Ile Ile Val Ile Ala Asn Asp
1655 1660 1665
Ile Thr Phe Arg Ala Gly Ser Phe Gly Pro Arg Glu Asp Ala Phe
1670 1675 1680
Phe Glu Ala Val Thr Asn Leu Ala Cys Glu Lys Lys Leu Pro Leu
1685 1690 1695
Ile Tyr Leu Ala Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala Asp
1700 1705 1710
Glu Val Lys Ser Cys Phe Arg Val Gly Trp Thr Asp Asp Ser Ser
1715 1720 1725
Pro Glu Arg Gly Phe Arg Tyr Ile Tyr Met Thr Asp Glu Asp His
1730 1735 1740
Asp Arg Ile Gly Ser Ser Val Ile Ala His Lys Met Gln Leu Asp
1745 1750 1755
Ser Gly Glu Ile Arg Trp Val Ile Asp Ser Val Val Gly Lys Glu
1760 1765 1770
Asp Gly Leu Gly Val Glu Asn Ile His Gly Ser Ala Ala Ile Ala
1775 1780 1785
Ser Ala Tyr Ser Arg Ala Tyr Glu Glu Thr Phe Thr Leu Thr Phe
1790 1795 1800
Val Thr Gly Arg Thr Val Gly Ile Gly Ala Tyr Leu Ala Arg Leu
1805 1810 1815
Gly Ile Arg Cys Ile Gln Arg Ile Asp Gln Pro Ile Ile Leu Thr
1820 1825 1830
Gly Phe Ser Ala Leu Asn Lys Leu Leu Gly Arg Glu Val Tyr Ser
1835 1840 1845
Ser His Met Gln Leu Gly Gly Pro Lys Ile Met Ala Thr Asn Gly
1850 1855 1860
Val Val His Leu Thr Val Pro Asp Asp Leu Glu Gly Val Ser Asn
1865 1870 1875
Ile Leu Arg Trp Leu Ser Tyr Val Pro Ala Asn Ile Gly Gly Pro
1880 1885 1890
Leu Pro Ile Thr Lys Ser Leu Asp Pro Ile Asp Arg Pro Val Ala
1895 1900 1905
Tyr Ile Pro Glu Asn Thr Cys Asp Pro Arg Ala Ala Ile Ser Gly
1910 1915 1920
Ile Asp Asp Ser Gln Gly Lys Trp Leu Gly Gly Met Phe Asp Lys
1925 1930 1935
Asp Ser Phe Val Glu Thr Phe Glu Gly Trp Ala Lys Thr Val Val
1940 1945 1950
Thr Gly Arg Ala Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala
1955 1960 1965
Val Glu Thr Gln Thr Met Met Gln Leu Val Pro Ala Asp Pro Gly
1970 1975 1980
Gln Pro Asp Ser His Glu Arg Ser Val Pro Arg Ala Gly Gln Val
1985 1990 1995
Trp Phe Pro Asp Ser Ala Thr Lys Thr Ala Gln Ala Met Leu Asp
2000 2005 2010
Phe Asn Arg Glu Gly Leu Pro Leu Phe Ile Leu Ala Asn Trp Arg
2015 2020 2025
Gly Phe Ser Gly Gly Gln Arg Asp Leu Phe Glu Gly Ile Leu Gln
2030 2035 2040
Ala Gly Ser Thr Ile Val Glu Asn Leu Arg Thr Tyr Asn Gln Pro
2045 2050 2055
Ala Phe Val Tyr Ile Pro Lys Ala Ala Glu Leu Arg Gly Gly Ala
2060 2065 2070
Trp Val Val Ile Asp Ser Lys Ile Asn Pro Asp Arg Ile Glu Cys
2075 2080 2085
Tyr Ala Glu Arg Thr Ala Lys Gly Asn Val Leu Glu Pro Gln Gly
2090 2095 2100
Leu Ile Glu Ile Lys Phe Arg Ser Glu Glu Leu Lys Glu Cys Met
2105 2110 2115
Gly Arg Leu Asp Pro Glu Leu Ile Asp Leu Lys Ala Arg Leu Gln
2120 2125 2130
Gly Ala Asn Gly Ser Leu Ser Asp Gly Glu Ser Leu Gln Lys Ser
2135 2140 2145
Ile Glu Ala Arg Lys Lys Gln Leu Leu Pro Leu Tyr Thr Gln Ile
2150 2155 2160
Ala Val Arg Phe Ala Glu Leu His Asp Thr Ser Leu Arg Met Ala
2165 2170 2175
Ala Lys Gly Val Ile Arg Lys Val Val Asp Trp Glu Asp Ser Arg
2180 2185 2190
Ser Phe Phe Tyr Lys Arg Leu Arg Arg Arg Leu Ser Glu Asp Val
2195 2200 2205
Leu Ala Lys Glu Ile Arg Gly Val Ile Gly Glu Lys Phe Pro His
2210 2215 2220
Lys Ser Ala Ile Glu Leu Ile Lys Lys Trp Tyr Leu Ala Ser Glu
2225 2230 2235
Ala Ala Ala Ala Gly Ser Thr Asp Trp Asp Asp Asp Asp Ala Phe
2240 2245 2250
Val Ala Trp Arg Glu Asn Pro Glu Asn Tyr Lys Glu Tyr Ile Lys
2255 2260 2265
Glu Leu Arg Ala Gln Arg Val Ser Arg Leu Leu Ser Asp Val Ala
2270 2275 2280
Gly Ser Ser Ser Asp Leu Gln Ala Leu Pro Gln Gly Leu Ser Met
2285 2290 2295
Leu Leu Asp Lys Met Asp Pro Ser Lys Arg Ala Gln Phe Ile Glu
2300 2305 2310
Glu Val Met Lys Val Leu Lys 2315 2320
<210> 2 <211> 427 <212> Белок
<213> Escherichia coli
<400> 2
Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile
1 5 10 15
Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala
20 25 30
Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp
35 40 45
Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr
50 55 60
Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly
65 70 75 80
Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
85 90 95
Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp
100 105 110
Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His
115 120 125
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu
130 135 140
Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly
145 150 155 160
Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu
165 170 175
Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys
180 185 190
Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met
195 200 205
Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val
210 215 220
Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu
225 230 235 240
Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys
245 250 255
Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly
260 265 270
Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys
275 280 285
Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile
290 295 300
Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr
305 310 315 320
Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn
325 330 335
Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu
340 345 350
Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile
355 360 365
Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp
370 375 380
His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro
385 390 395 400
Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr
405 410 415
Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala 420 425
<210> 3 <211> 11
<212> Белок <213> Неизвестный
<220>
<223> Описание неизвестного:
репрессорный домен OsERF3 (мотив LxLxPP motif)
<400> 3
Leu Asp Leu Asn Arg Pro Pro Pro Val Glu Asn
1 5 10
<210> 4 <211> 6 <212> Белок <213> Неизвестный
<220>
<223> Описание неизвестного:
репрессорный домен OsERF3 ( мотив LxLxPP motif)
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Любая аминокислота
<220>
<221> MOD_RES <222> (4)..(4)
<223> Любая аминокислота
<400> 4
Leu Xaa Leu Xaa Pro Pro 1 5
<210> 5 <211> 8 <212> Белок <213> Неизвестный
<220>
<223> Описание неизвестного:
репрессорный домен AtBRD ( мотив R/KLFGV)
<400> 5
Leu Arg Leu Phe Gly Val Asn Met 1 5
<210> 6 <211> 5
<212> Белок <213> Неизвестный
<220>
<223> Описание неизвестного:
репрессорный домен AtBRD ( мотив R/KLFGV)
<220>
<221> MOD_RES <222> (1)..(1)
<223> Arg или Lys
<400> 6
Xaa Leu Phe Gly Val
1 5
<210> 7
<211> 8
<212> Белок <213> Неизвестный
<220>
<223> Описание неизвестного:
репрессорный домен AtHsfBl (мотив R/KLFGV)
<400> 7
Leu Lys Leu Phe Gly Val Trp Leu 1 5
<210> 8
<211> 10
<212> Белок <213> Неизвестный
<220>
<223> Описание неизвестного:
репрессорный домен AtSUP ( мотив EAR)
<400> 8
Leu Asp Leu Glu Leu Arg Leu Gly Phe Ala
1 5 10
<210> 9
<211> 203
<212> Белок <213> Неизвестный
<220>
<223> Описание неизвестного:
целый ген AtSUP, содержащий репрессорный домен (мотив EAR)
<400> 9
Glu Arg Ser Asn Ser Ile Glu Leu Arg Asn Ser Phe Tyr Gly Arg Ala
1 5 10 15
Arg Thr Ser Pro Trp Ser Tyr Gly Asp Tyr Asp Asn Cys Gln Gln Asp
20 25 30
His Asp Tyr Leu Leu Gly Phe Ser Trp Pro Pro Arg Ser Tyr Thr Cys
35 40 45
Ser Phe Cys Lys Arg Glu Phe Arg Ser Ala Gln Ala Leu Gly Gly His
50 55 60
Met Asn Val His Arg Arg Asp Arg Ala Arg Leu Arg Leu Gln Gln Ser
65 70 75 80
Pro Ser Ser Ser Ser Thr Pro Ser Pro Pro Tyr Pro Asn Pro Asn Tyr
85 90 95
Ser Tyr Ser Thr Met Ala Asn Ser Pro Pro Pro His His Ser Pro Leu
100 105 110
Thr Leu Phe Pro Thr Leu Ser Pro Pro Ser Ser Pro Arg Tyr Arg Ala
115 120 125
Gly Leu Ile Arg Ser Leu Ser Pro Lys Ser Lys His Thr Pro Glu Asn
130 135 140
Ala Cys Lys Thr Lys Lys Ser Ser Leu Leu Val Glu Ala Gly Glu Ala
145 150 155 160
Thr Arg Phe Thr Ser Lys Asp Ala Cys Lys Ile Leu Arg Asn Asp Glu
165 170 175
Ile Ile Ser Leu Glu Leu Glu Ile Gly Leu Ile Asn Glu Ser Glu Gln
180 185 190
Asp Leu Asp Leu Glu Leu Arg Leu Gly Phe Ala
195 200
<210> 10
<211> 427
<212> Белок <213> Escherichia coli
<400> 10
Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile
1 5 10 15
Asn Leu Pro Gly Ser Lys Thr Val Ser Asn Arg Ala Leu Leu Leu Ala
20 25 30
Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp
35 40 45
Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr
50 55 60
Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly
65 70 75 80
Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
85 90 95
Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp
100 105 110
Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His
115 120 125
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu
130 135 140
Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly
145 150 155 160
Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu
165 170 175
Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys
180 185 190
Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met
195 200 205
Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val
210 215 220
Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu
225 230 235 240
Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys
245 250 255
Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly
260 265 270
Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys
275 280 285
Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile
290 295 300
Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr
305 310 315 320
Ala Ala Leu Phe Ala Lys Gly Thr Thr Arg Leu Arg Asn Ile Tyr Asn
325 330 335
Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu
340 345 350
Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile
355 360 365
Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp
370 375 380
His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro
385 390 395 400
Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr
405 410 415
Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala 420 425
<210> 11 <211> 518 <212> Белок
<213> Linum usitatissimum
<400> 11
Met Ala Leu Val Thr Lys Ile Cys Gly Gly Ala Asn Ala Val Ala Leu
1 5 10 15
Pro Ala Thr Phe Gly Thr Arg Arg Thr Lys Ser Ile Ser Ser Ser Val
20 25 30
Ser Phe Arg Ser Ser Thr Ser Pro Pro Ser Leu Lys Gln Arg Arg Arg
35 40 45
Ser Gly Asn Val Ala Ala Ala Ala Ala Ala Pro Leu Arg Val Ser Ala
50 55 60
Ser Leu Thr Thr Ala Ala Glu Lys Ala Ser Thr Val Pro Glu Glu Val
65 70 75 80
Val Leu Gln Pro Ile Lys Asp Ile Ser Gly Ile Val Thr Leu Pro Gly
85 90 95
Ser Lys Ser Leu Ser Asn Arg Ile Leu Leu Leu Ala Ala Leu Ser Glu
100 105 110
Gly Thr Thr Val Val Asp Asn Leu Leu Asn Ser Asp Asp Val His Tyr
115 120 125
Met Leu Gly Ala Leu Lys Thr Leu Gly Leu Asn Val Glu His Ser Ser
130 135 140
Glu Gln Lys Arg Ala Ile Val Glu Gly Cys Gly Gly Val Phe Pro Val
145 150 155 160
Gly Lys Leu Ala Lys Asn Asp Ile Glu Leu Phe Leu Gly Asn Ala Gly
165 170 175
Thr Ala Met Arg Pro Leu Thr Ala Ala Val Thr Ala Ala Gly Gly Asn
180 185 190
Ser Ser Tyr Ile Leu Asp Gly Val Pro Arg Met Arg Glu Arg Pro Ile
195 200 205
Gly Asp Leu Val Val Gly Leu Lys Gln Leu Gly Ala Asp Val Thr Cys
210 215 220
Ser Ser Thr Ser Cys Pro Pro Val His Val Asn Gly Gln Gly Gly Leu
225 230 235 240
Pro Gly Gly Lys Val Lys Leu Ser Gly Ser Ile Ser Ser Gln Tyr Leu
245 250 255
Thr Ala Leu Leu Met Ala Ala Pro Leu Ala Leu Gly Asp Val Glu Ile
260 265 270
Glu Ile Val Asp Lys Leu Ile Ser Val Pro Tyr Val Asp Met Thr Leu
275 280 285
Lys Leu Met Glu Arg Phe Gly Val Ala Val Glu His Ser Gly Ser Trp
290 295 300
Asp Arg Phe Phe Val Lys Gly Gly Gln Lys Tyr Lys Ser Pro Gly Asn
305 310 315 320
Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Gly
325 330 335
Ala Ala Ile Thr Gly Gly Thr Ile Thr Val Glu Gly Cys Gly Thr Ser
340 345 350
Ser Leu Gln Gly Asp Val Lys Phe Ala Glu Val Leu Glu Lys Met Gly
355 360 365
Ala Lys Val Ile Trp Thr Glu Asn Ser Val Thr Val Thr Gly Pro Pro
370 375 380
Arg Asp Ala Ser Gly Arg Lys His Leu Arg Ala Val Asp Val Asn Met
385 390 395 400
Asn Lys Met Pro Asp Val Ala Met Thr Leu Ala Val Val Ala Leu Tyr
405 410 415
Ala Asp Gly Pro Thr Ala Ile Arg Asp Val Ala Ser Trp Arg Val Lys
420 425 430
Glu Thr Glu Arg Met Ile Ala Ile Cys Thr Glu Leu Arg Lys Leu Gly
435 440 445
Ala Thr Val Glu Glu Gly Pro Asp Tyr Cys Ile Ile Thr Pro Pro Glu
450 455 460
Lys Leu Asn Ile Ala Glu Ile Asp Thr Tyr Asp Asp His Arg Met Ala
465 470 475 480
Met Ala Phe Ser Leu Ala Ala Cys Ala Asp Val Pro Val Thr Ile Arg
485 490 495
Asp Pro Gly Cys Thr Lys Lys Thr Phe Pro Asp Tyr Phe Glu Val Leu
500 505 510
Glu Arg Tyr Thr Lys His 515
<210> 12
<211> 519
<212> Белок
<213> Linum usitatissimum
<400> 12
Met Ala Gln Val Thr Lys Ile Cys Gly Gly Ala Asn Ala Val Ala Leu
1 5 10 15
Pro Ala Thr Phe Gly Thr Arg Arg Thr Lys Ser Ile Ser Ser Ser Val
20 25 30
Ser Phe Arg Ser Ser Thr Ser Pro Pro Ser Leu Lys Gln Arg Arg Leu
35 40 45
Leu Gly Asn Val Ala Ala Ala Ala Ala Ala Ala Pro Leu Arg Ile Ser
50 55 60
Ala Ser Leu Ala Thr Ala Ala Glu Lys Ala Ser Thr Val Pro Glu Glu
65 70 75 80
Ile Val Leu Gln Pro Ile Lys Asp Ile Ser Gly Ile Val Thr Leu Pro
85 90 95
Gly Ser Lys Ser Leu Ser Asn Arg Ile Leu Leu Leu Ala Ala Leu Ser
100 105 110
Glu Gly Lys Thr Val Val Asp Asn Leu Leu Asn Ser Asp Asp Val His
115 120 125
Tyr Met Leu Gly Ala Leu Lys Thr Leu Gly Leu Asn Val Glu His Ser
130 135 140
Ser Glu Gln Lys Arg Ala Ile Val Glu Gly Arg Gly Gly Val Phe Pro
145 150 155 160
Val Gly Lys Leu Gly Lys Asn Asp Ile Glu Leu Phe Leu Gly Asn Ala
165 170 175
Gly Thr Ala Met Arg Pro Leu Thr Ala Ala Val Thr Ala Ala Gly Gly
180 185 190
Asn Ser Ser Tyr Ile Leu Asp Gly Val Pro Arg Met Arg Glu Arg Pro
195 200 205
Ile Gly Asp Leu Val Val Gly Leu Lys Gln Leu Gly Ala Asp Val Ser
210 215 220
Cys Ser Ser Thr Ser Cys Pro Pro Val His Val Asn Ala Lys Gly Gly
225 230 235 240
Leu Pro Gly Gly Lys Val Lys Leu Ser Gly Ser Ile Ser Ser Gln Tyr
245 250 255
Leu Thr Ala Leu Leu Met Ala Ala Pro Leu Ala Leu Gly Asp Val Glu
260 265 270
Ile Glu Ile Val Asp Lys Leu Ile Ser Val Pro Tyr Val Asp Met Thr
275 280 285
Leu Lys Leu Met Glu Arg Phe Gly Val Ala Val Glu His Ser Gly Ser
290 295 300
Trp Asp Arg Phe Phe Val Lys Gly Gly Gln Lys Tyr Lys Ser Pro Gly
305 310 315 320
Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala
325 330 335
Gly Ala Ala Ile Thr Gly Gly Thr Ile Thr Val Glu Gly Cys Gly Thr
340 345 350
Ser Ser Leu Gln Gly Asp Val Lys Phe Ala Glu Val Leu Glu Lys Met
355 360 365
Gly Ala Lys Val Thr Trp Thr Glu Thr Ser Val Thr Val Thr Gly Pro
370 375 380
Pro Arg Asp Ala Ser Gly Lys Lys His Leu Arg Ala Val Asp Val Asn
385 390 395 400
Met Asn Lys Met Pro Asp Val Ala Met Thr Leu Ala Val Val Ala Leu
405 410 415
Tyr Ala Asp Gly Pro Thr Ala Ile Arg Asp Val Ala Ser Trp Arg Val
420 425 430
Lys Glu Thr Glu Arg Met Ile Ala Val Cys Thr Glu Leu Arg Lys Leu
435 440 445
Gly Ala Thr Val Glu Glu Gly Pro Asp Tyr Cys Ile Ile Thr Pro Pro
450 455 460
Glu Lys Leu Ser Ile Ala Glu Ile Asp Thr Tyr Asp Asp His Arg Met
465 470 475 480
Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Asp Val Pro Val Thr Ile
485 490 495
Arg Asp Pro Gly Cys Thr Lys Lys Thr Phe Pro Asp Tyr Phe Glu Val
500 505 510
Leu Glu Arg Tyr Thr Lys His 515
<210> 13
<211> 101
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 13
gtcgtgctgc ttcatgtggt cggggtagcg gctgaagcac tgcacgccgt aggtgaaggt 60 ggtcacgagg gtgggccagg gcacgggcag cttgccggtg g 101
<210> 14 <211> 101 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 14
gtcgtgctgc ttcatgtggt cggggtagcg gctgaagcac tgcacgccgt gggtgaaggt 60 ggtcacgagg gtgggccagg gcacgggcag cttgccggtg g 101
<210> 15 <211> 101 <212> ДНК
<213> Искусственная последовательность
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 15
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccttcacc tacggcgtgc 60 agtgcttcag ccgctacccc gaccacatga agcagcacga c 101
<210> 16 <211> 101 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 16
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccttcacc cacggcgtgc 60 agtgcttcag ccgctacccc gaccacatga agcagcacga c 101
<210> 17 <211> 201 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 17
aagatggtgc gctcctggac gtagccttcg ggcatggcgg acttgaagaa gtcgtgctgc 60
ttcatgtggt ctgggtagcg gctgaagcac tgcacgccgt aggtgaaggt ggtcacgagg 120
gtgggccagg gcacgggcag cttgccggtg gtgcagatga acttcagggt cagcttgccg 180
taggtggcat cgccctcgcc c 201
<210> 18 <211> 200 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 18
aagtggtgcg ctcctggacg tagccttcgg gcatggcgga cttgaagaag tcgtgctgct 60
tcatgtggtc ggggtagcgg ctgaagcact gcacgccgtg ggtgaaggtg gtcacgaggg 120
tgggccaggg cacgggcagc ttgccggtgg tgcagatgaa cttcagggtc agcttgccgt 180
aggtggcatc gccctcgccc 200
<210> 19 <211> 201 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 19
gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 60
gctgcccgtg ccctggccca ccctcgtgac caccttcacc tacggcgtgc agtgcttcag 120
ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 180
cgtccaggag cgcaccatct t 201
<210> 20 <211> 201 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 20
gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 60
gctgcccgtg ccctggccca ccctcgtgac caccttcacc cacggcgtgc agtgcttcag 120
ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 180
cgtccaggag cgcaccatct t 201
<210> 21 <211> 10 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 21 tttttttttt
<210> 22 <211> 201 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 22
gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 60
gctgcccgtg ccctggccca ccctcgtgac caccttcacc tacggcgtgc agtgcttcag 120
ccgctaccca gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 180
cgtccaggag cgcaccatct t
201
<210> 23 <211> 23 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 23
ggtgccgcac gtcacgaagt cgg 23
<210> 24 <211> 41 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 24
ccctcgtgac caccttcacc tacggcgtgc agtgcttcag c 41
<210> 25 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 25
gtcgtgctgc ttcatgtggt 20
<210> 26 <211> 60 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 26
gtgaccacct tcacctacgg cgtgcagtgc ttcagccgct acccagacca catgaagcag 60
<210> 27 <211> 101 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 27
ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac caccttcacc tacggcgtgc 60
agtgcttcag ccgctaccca gaccacatga agcagcacga c
101
<210> 28 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 28
ctcgtgacca ccttcaccca 20
<210> 29 <211> 71 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<223> Описание комбинированной молекулы ДНК/РНК: синтетический олигонуклеотид
<400> 29
gcugcccgug ccctggccca ccctcgtgac caccttcacc tacggcgtgc agtgcttcag 60 ccgctacccc g 71
<210> 30 <211> 71 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 30
ttcatgtggt cggggtagcg gctgaagcac tgcacgccgt aggtgaaggt ggtcacgagg 60 gtgggccagg g 71
<210> 31 <211> 71 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<223> Описание комбинированной молекулы ДНК/ РНК: синтетический олигонуклеотид
<400> 31
uucauguggu cggggtagcg gctgaagcac tgcacgccgt aggtgaaggt ggtcacgagg 60
gtgggccagg g
<210> 32 <211> 201 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<223> Описание комбинированной молекулы ДНК/ РНК: синтетический олигонуклеотид
<400> 32
aagauggugc gctcctggac gtagccttcg ggcatggcgg acttgaagaa gtcgtgctgc 60
ttcatgtggt cggggtagcg gctgaagcac tgcacgccgt aggtgaaggt ggtcacgagg 120
gtgggccagg gcacgggcag cttgccggtg gtgcagatga acttcagggt cagcttgccg 180
taggtggcat cgccctcgcc c 201
<210> 33 <211> 23 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 33
tggttatgca attggaagat cgc 23
<210> 34 <211> 201 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 34
agctgctgca aacagcaaca tgttcgggaa tatctcgtcc tcctgagccg gatccccgag 60
aaatgtgtga gctcggttag ctttgtagaa gcgatcttcc aattgcataa ccatgccaag 120
atgctggttg tttaataaaa gtaccttcac tggaagattc tctacacgaa tagtggctag 180
ctcttgcaca ttcattataa a 201
<210> 35 <211> 17 <212> ДНК
<213> Искусственная последовательность
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<210> 36 <211> 201 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 36
aagatggtgc gctcctggac gtagccttcg ggcatggcgg acttgaagaa gtcgtgctgc 60
ttcatgtggt cggggtagcg gctgaagcac tgcacgccgt acgtaaacgt ggtcacgagg 120
gtgggccagg gcacgggcag cttgccggtg gtgcagatga acttcagggt cagcttgccg 180
taggtggcat cgccctcgcc c 201
<210> 37 <211> 41 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 37
gctgaagcac tgcacgccgt aggtgaaggt ggtcacgagg g 41
<210> 38 <211> 19 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 38
tggaacagct atgcgtccg 19
<210> 39 <211> 19 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 39
tgagttgcct ccagcggct 19
<220>
<223> Описание искусственной последовательности: синтетический праймер
<400> 40
ggacgacggc aactacaaga cc 22
<210> 41 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический праймер
<400> 41
taaacggcca caagttcagc 20
<210> 42 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический праймер
<400> 42
gcatagcagt gagcagaagc 20
<210> 43 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический праймер
<400> 43
agaagctgaa aggctggaag 20
<210> 44 <211> 20 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 44
ggctgaagca ctgcacgccg 20
<211> 19
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 45
tggtcggggt agcggctga 19
<210> 46
<211> 19 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 46
tcgtgaccac cttcaccca 19
<210> 47
<211> 42 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 47
ccctcgtgac caccttcacc tacggcgtgc agtgcttcag cc 42
<210> 48
<211> 201 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 48
aagatggtgc
gctcctggac
gtagccttcg
ggcatggcgg
acttgaagaa
gtcgtgctgc
ttcatgtggt
cggggtagcg
gctgaagcac
tgcacgccgt
aggtgaaggt
ggtcacgagg
120
gtgggccagg
gcacgggcag
cttgccggtg
gtgcagatga
acttcagggt
cagcttgccg
180
taggtggcat
cgccctcgcc
201
<210> 49 <211> 145 <212> ДНК
<213> Искусственная последовательность
<400> 49
cggtcggtaa actggcgaag aacgatattg aacttttcct tggaaatgct ggaatagcta 60
tgcgtgcgct gacagctgct gtaacagccg ctggaggcaa ctcaaggtcc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 50 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 50
cggtcggtaa actggcgaag aacgatattg aacttttcct tggaaatgct ggaatagcta 60
tgcgtgcgct gacagctgct gtaacagccg ctggaggcaa ctcaaggttc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 51 <211> 41 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 51
gctgaagcac tgcacgccgt gggtgaaggt ggtcacgagg g 41
<210> 52 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 52
ctgacctgaa cttgatctca attaaccctt gcggttccag aacattgcct tttgcagtcc 60
tctcagcata gcactcaatg cggtctgggt ttatcttgct tccaacgaca acccaagccc 120
ctcctcgtag ctctgcagcc atgggaatgt agacaaaggc aggctgattg tatgtcctaa 180
ggttctcaac aatagtcgag ccc 203
<210> 53 <211> 23 <212> ДНК
<213> Искусственная последовательность
<400> 53
acgaggaggg gcttgggttg tgg 23
<210> 54 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 54
cauaagaugc agcuagacag 20
<210> 55 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 55
agcuagacag uggugaaauu 20
<210> 56 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 56
uagacagugg ugaaauuagg 20
<210> 57 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 57
agacaguggu gaaauuaggu 20
<210> 58 <211> 20 <212> РНК
<213> Искусственная последовательность
<400> 58
guggguuauu gauucuguug 20
<210> 59 <211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 59
uggguuauug auucuguugu 20
<210> 60 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 60
uauugauucu guugugggca 20
<210> 61 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 61
ucuguugugg gcaaggaaga 20
<210> 62 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 62
gugggcaagg aagauggacu 20
<210> 63 <211> 20 <212> РНК
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 63
caaggaagau ggacuuggug 20
<210> 64 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 64
cuuggugugg agaauauaca 20
<210> 65 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 65
cuauugccag ugcuuauucu 20
<210> 66 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 66
ugcuuauucu agggcauaua 20
<210> 67 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 67
uuuacacuua cauuugugac 20
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 68
uuugugacug gaagaacugu 20
<210> 69 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 69
acuggaagaa cuguuggaau 20
<210> 70 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 70
ggagcuuauc uugcucgacu 20
<210> 71 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 71
auaugcccua gaauaagcac 20
<210> 72 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 72
gauaagaugc agcuagacag 20
<211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 73
ggcuagacag uggugaaauu 20
<210> 74 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 74
gagacagugg ugaaauuagg 20
<210> 75
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 75
ggacaguggu gaaauuaggu 20
<210> 76 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 76
gggguuauug auucuguugu 20
<210> 77 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 78
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 78
gcuguugugg gcaaggaaga 20
<210> 79
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 79
gaaggaagau ggacuuggug 20
<210> 80 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 80
guuggugugg agaauauaca 20
<210> 81 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 81
guauugccag ugcuuauucu 20
<210> 82 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 83 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 83
guuacacuua cauuugugac 20
<210> 84 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 84
guugugacug gaagaacugu 20
<210> 85 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 85
gcuggaagaa cuguuggaau 20
<210> 86
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 86
guaugcccua gaauaagcac 20
<210> 87 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 88 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 88
ugccuuuguc uacauuccca 20
<210> 89 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 89
cccauggcug cagagcuacg 20
<210> 90 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 90
auggcugcag agcuacgagg 20
<210> 91 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 91
uggcugcaga gcuacgagga 20
<210> 92 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
ggcugcagag cuacgaggag
<210> 93 <211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 93
cagagcuacg aggaggggcu 20
<210> 94 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 94
agagcuacga ggaggggcuu 20
<210> 95 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 95
acgaggaggg gcuuggguug 20
<210> 96 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 96
gcauugagug cuaugcugag 20
<210> 97 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 98 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 98
gacugcaaaa ggcaauguuc 20
<210> 99 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 99
ggcaauguuc uggaaccgca 20
<210> 100 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 100
gcaauguucu ggaaccgcaa 20
<210> 101 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 101
gguuaauuga gaucaaguuc 20
<210> 102 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 103 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 103
guucagguca gaggaacucc 20
<210> 104 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 104
aacuccagga uugcaugagu 20
<210> 105 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 105
caagccgacu caugcaaucc 20
<210> 106 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 106
uugaucucaa uuaacccuug 20
<210> 107 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 107
ucucagcaua gcacucaaug 20
<210> 108
<211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 108
gcauagcacu caaugcgguc 20
<210> 109 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 109
cauagcacuc aaugcggucu 20
<210> 110 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 110
uccucguagc ucugcagcca 20
<210> 111 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 111
agccauggga auguagacaa 20
<210> 112 <211> 20 <212> РНК
<213> Искусственная последовательность
<400> 112
augggaaugu agacaaaggc 20
<210> 113 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 113
caggcugauu guauguccua 20
<210> 114 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 114
ggacuauugu ugagaaccuu 20
<210> 115
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 115
ggccuuuguc uacauuccca 20
<210> 116 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 116
gccauggcug cagagcuacg 20
<210> 117
<211> 20 <212> РНК
<213> Искусственная последовательность
<400> 117
guggcugcag agcuacgagg 20
<210> 118
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 118
gggcugcaga gcuacgagga 20
<210> 119
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 119
gagagcuacg aggaggggcu 20
<210> 120 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 120
ggagcuacga ggaggggcuu 20
<210> 121 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 121
gcgaggaggg gcuuggguug 20
<210> 122 <211> 20 <212> РНК
<213> Искусственная последовательность
<400> 122
gaugcugaga ggacugcaaa 20
<210> 123 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 123
ggagaucaag uucaggucag 20
<210> 124 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 124
gacuccagga uugcaugagu 20
<210> 125 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 125
gaagccgacu caugcaaucc 20
<210> 126
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 126
gugaucucaa uuaacccuug 20
<210> 127 <211> 20 <212> РНК
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 127
gcucagcaua gcacucaaug 20
<210> 128 <211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 128
gauagcacuc aaugcggucu 20
<210> 129 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 129
gccucguagc ucugcagcca 20
<210> 130 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 130
ggccauggga auguagacaa 20
<210> 131 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 131
gugggaaugu agacaaaggc 20
<220>
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
<400> 132
gaggcugauu guauguccua 20
<210> 133 <211> 203
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 133
gtcatagcac ataagatgca gctagacagt ggtgaaatta ggtgggttat tgattctgtt 60
gtgggcaagg aagatggact tggtgtggag aatgctcatg gaagtgctgc tattgccagt 120
gcttattcta gggcatataa ggagacattt acacttacat ttgtgactgg aagaactgtt 180
ggaataggag cttatcttgc tcc 203
<210> 134 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 134
gagcaagata agctcctatt ccaacagttc ttccagtcac aaatgtaagt gtaaatgtct 60
ccttatatgc cctagaataa gcactggcaa tagcagcact tccatgcaga ttctccacac 120
caagtccatc ttccttgccc acaacagaat caataaccca cctaatttca ccactgtcta 180
gctgcatctt atgtgctatg acc 203
<210> 135 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 135
gtcatagcac ataagatgca gctagacagt ggtgaaatta ggtgggttat tgattctgtt 60
gtgggcaagg aagatggact tggtgtggag aatatacatt gcagtgctgc tattgccagt 120
gcttattcta gggcatataa ggagacattt acacttacat ttgtgactgg aagaactgtt 180
ggaataggag cttatcttgc tcc
203
<210> 136 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 136
gagcaagata agctcctatt ccaacagttc ttccagtcac aaatgtaagt gtaaatgtct 60
ccttatatgc cctagaataa gcactggcaa tagcagcact gcaatgtata ttctccacac 120
caagtccatc ttccttgccc acaacagaat caataaccca cctaatttca ccactgtcta 180
gctgcatctt atgtgctatg acc 203
<210> 137 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 137
gtcatagcac ataagatgca gctagacagt ggtgaaatta ggtgggttat tgattctgtt 60
gtgggcaagg aagatggact tggtgtggag aatatacatg gaagtgctcc aattgccagt 120
gcttattcta gggcatataa ggagacattt acacttacat ttgtgactgg aagaactgtt 180
ggaataggag cttatcttgc tcc 203
<210> 138 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 138
gagcaagata agctcctatt ccaacagttc ttccagtcac aaatgtaagt gtaaatgtct 60
ccttatatgc cctagaataa gcactggcaa tggtagcact tccatgtata ttctccacac 120
caagtccatc ttccttgccc acaacagaat caataaccca cctaatttca ccactgtcta 180
gctgcatctt atgtgctatg acc 203
<210> 139 <211> 203 <212> ДНК
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 139
ggctcgacta ttgttgagaa ccttaggaca tacaatcagc ctgcctttgt ctacattccc 60
atggctgcag agctacgagg aggggcttgg gttgtggttg gtagcaagat aaacccagac 120
cgcattgagt gctatgctga gaggactgca aaaggcaatg ttctggaacc gcaagggtta 180
attgagatca agttcaggtc agc 203
<210> 140 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 140
ctgacctgaa cttgatctca attaaccctt gcggttccag aacattgcct tttgcagtcc 60
tctcagcata gcactcaatg cggtctgggt ttatcttaaa atcaacgaca acccaagccc 120
ctcctcgtag ctctgcagcc atgggaatgt agacaaaggc aggctgattg tatgtcctaa 180
ggttctcaac aatagtcgag ccc 203
<210> 141 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 141
ggctcgacta ttgttgagaa ccttaggaca tacaatcagc ctgcctttgt ctacattccc 60
atggctgcag agctacgagg aggcgcttgg gttgtggttg atagcaagat aaacccagac 120
cgcattgaga ggtatgctga gaggactgca aaaggcaatg ttctggaacc gcaagggtta 180
attgagatca agttcaggtc agc 203
<210> 142 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
ggctcgacta ttgttgagaa ccttaggaca tacaatcagc ctgcctttgt ctacattccc 60
atggctgcag agctacgagg aggggcttgg gttgtggttg atagcgaaat aaacccagac 120
cgcattgagt gctatgctga gaggactgca aaaggcaatg ttctggaacc gcaagggtta 180
attgagatca agttcaggtc agc 203
<210> 143 <211> 203
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 143
ctgacctgaa cttgatctca attaaccctt gcggttccag aacattgcct tttgcagtcc 60
tctcagcata gcactcaatg cggtctgggt ttatttcgct atcaaccaca acccaagcgc 120
ctcctcgtag ctctgcagcc atgggaatgt agacaaaggc aggctgattg tatgtcctaa 180
ggttctcaac aatagtcgag ccc 203
<210> 144 <211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 144
ggctcgacta ttgttgagaa ccttaggaca tacaatcagc ctgcctttgt ctacattccc 60
atggctgcag agctacgagg aggggcttgg gttgtggttg atagcaagat aaacccagac 120
cgcattgagc gttatgctga gaggactgca aaaggcaatg ttctggaacc gcaagggtta 180
attgagatca agttcaggtc agc 203
<210> 145
<211> 203 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 145
ctgacctgaa cttgatctca attaaccctt gcggttccag aacattgcct tttgcagtcc 60
tctcagcata ttgctcaatg cggtctgggt ttatcttgct atcaacgaca acccaagccc 120
ctcctcgtag ctctgcagcc atgggaatgt agacaaaggc aggctgattg tatgtcctaa 180
ggttctcaac aatagtcgag ccc 203
<210> 146 <211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 146
cagaagcgcg ccauuguuga 20
<210> 147
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 147
cgcgccauug uugaagguug 20
<210> 148 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 148
cgcgccauug uugaaggucg 20
<210> 149 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 149
gccauuguug aagguugugg 20
<210> 150 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
gccauuguug aaggucgugg
<210> 151
<211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 151
agguuguggu gguguguuuc 20
<210> 152 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 152
aggucguggu gguguguuuc 20
<210> 153 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 153
ugugguggug uguuuccggu 20
<210> 154 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 154
cgugguggug uguuuccggu 20
<210> 155 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 156 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 156
uguuuccggu cgguaaacug 20
<210> 157 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 157
aacgauauug aacuuuuccu 20
<210> 158 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 158
aacgauaucg aacuuuuccu 20
<210> 159 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 159
gaacuuuucc uuggaaaugc 20
<210> 160 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 161 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 161
gcugcuguaa cagccgcugg 20
<210> 162 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 162
aacucaagcu acauacucga 20
<210> 163 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 163
aacucaagcu acauacucga 20
<210> 164 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 164
cgaaugagag agagaccaau 20
<210> 165 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<400> 165
cgaaugagag agagaccgau 20
<210> 166 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 166
agagagacca auuggagauu 20
<210> 167 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 167
ccaauuggag auuugguugu 20
<210> 168
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 168
ccgauuggag auuuaguugu 20
<210> 169
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 169
ccaacaacca aaucuccaau 20
<210> 170 <211> 20 <212> РНК
<213> Искусственная последовательность
<400> 170
ccaacaacua aaucuccaau 20
<210> 171 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 171
auuggucucu cucucauucg 20
<210> 172 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 172
aucggucucu cucucauucg 20
<210> 173 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 173
guagcuugag uugccuccag 20
<210> 174 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 174
gcuguuacag cagcugucag 20
<210> 175 <211> 20 <212> РНК
<213> Искусственная последовательность
<400> 175
uagcuguucc agcauuucca 20
<210> 176 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 176
uucuucgcca guuuaccgac 20
<210> 177 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 177
uucuucccca guuuaccgac 20
<210> 178 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 178
accaccacaa ccuucaacaa 20
<210> 179 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 179
accaccacga ccuucaacaa 20
<210> 180 <211> 20 <212> РНК
<213> Искусственная последовательность
<400> 180
gagaagcgcg ccauuguuga 20
<210> 181 <211> 20
<212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 181
ggcgccauug uugaagguug 20
<210> 182 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 182
ggcgccauug uugaaggucg 20
<210> 183 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 183
ggguuguggu gguguguuuc 20
<210> 184 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 184
gggucguggu gguguguuuc 20
<210> 185 <211> 20 <212> РНК
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 185
ggugguggug uguuuccggu 2 0
<210> 186 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 186
ggugguggug uguuuccggu 20
<210> 187 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 187
gguguuuccg gucgguaaac 20
<210> 188 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 188
gguuuccggu cgguaaacug 20
<210> 189 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 189
gacgauauug aacuuuuccu 20
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 190
gacgauaucg aacuuuuccu 20
<210> 191 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 191
gcagcugcug uaacagccgc 20
<210> 192 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 192
gacucaagcu acauacucga 20
<210> 193 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 193
gacucaagcu acauacucga 20
<210> 194 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 194
ggaaugagag agagaccaau 20
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 195
ggaaugagag agagaccgau 20
<210> 196 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 196
ggagagacca auuggagauu 20
<210> 197 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 197
gcaauuggag auuugguugu 20
<210> 198 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 198
gcgauuggag auuuaguugu 20
<210> 199 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 200 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 200
gcaacaacua aaucuccaau 20
<210> 201 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 201
guuggucucu cucucauucg 20
<210> 202 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 202
gucggucucu cucucauucg 20
<210> 203 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 203
gagcuguucc agcauuucca 20
<210> 204 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<210> 205 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 205
gucuucccca guuuaccgac 20 <210> 206
<211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 206
gccaccacaa ccuucaacaa 20
<210> 207 <211> 20 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 207
gccaccacga ccuucaacaa 20
<210> 208 <211> 145
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 208
cggtcggtaa actggcgaag aacgatattg aacttttcct tggaaatgct gctatagcta 60
tgcgtgcgct gacagctgct gtaacagccg ctggaggcaa ctcaaggtcc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 209
<211> 145 <212> ДНК
<213> Искусственная последовательность
<400> 209
aagaagctga aaggctggaa ggagttgagg gaagggacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagcgga cgcatagctg tggcagcatt tccaaggaaa agttcaatat 120
cgttcttcgc cagtttaccg accgc 145
<210> 210 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 210
aagaagctga aaggctggaa ggagttgagg gaagggacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagcgca cgcatagcta ttccagcatt tccaaggaaa agttcaatat 120
cgttcttcgc cagtttaccg accgc 145
<210> 211 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 211
cggtcggtaa actggcgaag aacgatattg aacttttcct tggaaatgct ggaattgcta 60
tgcgttctct gacagctgct gtaacagccg ctggaggcaa ctcaaggtcc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 212 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 212
aagaagctga aaggctggaa ggagttgagg gaagggacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagtgaa cgcatagcaa ttccagcatt tccaaggaaa agttcaatat 120
cgttcttcgc cagtttaccg accgc 145
<210> 213 <211> 145 <212> ДНК
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 213
cggtcggtaa actggcgaag aacgatattg aacttttcct tggaaatgct ggaatcgcta 60
tgcgtactct gacagctgct gtaacagccg ctggaggcaa ctcaaggtcc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 214 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 214
aagaagctga aaggctggaa ggagttgagg gaagggacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagtgta cgcatagcaa ttccagcatt tccaaggaaa agttcaatat 120
cgttcttcgc cagtttaccg accgc 145
<210> 215 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 215
cggtcggtaa actggcgaag aacgatattg aacttttcct tggaaatgct ggaattgcta 60
tgcgtgcgct gacagctgct gtaacagccg ctggaggcaa ctcaaggtcc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 216 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 216
aagaagctga aaggctggaa ggagttgagg gaaggaacct tgagttgcct ccagcggctg 60 ttacagcagc tgtcagcgca cgcatagcta ttccagcatt tccaaggaaa agttcgatat 120
cgttcttccc cagtttaccg accgc
145
<210> 217
<211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 217
cggtcggtaa actggcgaag aacgatattg aacttttcct tggaaatgct ggaatagcta 60
tgcgtgctct gacagctgct gtaacagccg ctggaggcaa ctcaaggtcc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 218
<211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 218
aagaagctga aaggctggaa ggagttgagg gaagggacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagcgca cgcatagctg ttccagcatt tccaaggaaa agttcaatat 120
cgttcttcgc cagtttaccg accgc 145
<210> 219 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 219
cggtcggtaa actggggaag aacgatatcg aacttttcct tggaaatgct gctatagcta 60
tgcgtgcgct gacagctgct gtaacagccg ctggaggcaa ctcaaggttc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 220 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
ttacagcagc tgtcagcgga cgcatagctg ttgcagcatt tccaaggaaa agttcgatat 120 cgttcttccc cagtttaccg accgc 145
<210> 221 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 221
cggtcggtaa actggggaag aacgatatcg aacttttcct tggaaatgct ggaatagcta 60
tgcgtgcgct gacagctgct gtaacagccg ctggaggcaa ctcaaggttc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 222 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 222
aagaagctga aaggctggaa ggagttgagg gaaggaacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagcgca cgcatagcta ttccagcatt tccaaggaaa agttcgatat 120
cgttcttccc cagtttaccg accgc 145
<210> 223 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 223
cggtcggtaa actggggaag aacgatatcg aacttttcct tggaaatgct ggaattgcta 60
tgcgttctct gacagctgct gtaacagccg ctggaggcaa ctcaaggttc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 224 <211> 145 <212> ДНК
<213> Искусственная последовательность
<400> 224
aagaagctga aaggctggaa ggagttgagg gaaggaacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagtgaa cgcatagcga ttccagcatt tccaaggaaa agttcgatat 120 cgttcttccc cagtttaccg accgc 145
<210> 225 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 225
cggtcggtaa actggggaag aacgatatcg aacttttcct tggaaatgct ggaatcgcta 60
tgcgtactct gacagctgct gtaacagccg ctggaggcaa ctcaaggttc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 226 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 226
aagaagctga aaggctggaa ggagttgagg gaaggaacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagtgta cgcatagcta ttccagcatt tccaaggaaa agttcgatat 120
cgttcttccc cagtttaccg accgc 145
<210> 227 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 227
cggtcggtaa actggggaag aacgatatcg aacttttcct tggaaatgct ggaatcgcta 60
tgcgtgcgct gacagctgct gtaacagccg ctggaggcaa ctcaaggttc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 228 <211> 145 <212> ДНК
<213> Искусственная последовательность
полинуклеотид
<400> 228
aagaagctga aaggctggaa ggagttgagg gaaggaacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagcgga cgcatagcta ttccagcatt tccaaggaaa agttcgatat 120
cgttcttccc cagtttaccg accgc 145
<210> 229 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 229
cggtcggtaa actggggaag aacgatatcg aacttttcct tggaaatgct ggaatagcta 60
tgcgtgctct gacagctgct gtaacagccg ctggaggcaa ctcaaggttc cttccctcaa 120
ctccttccag cctttcagct tcttc 145
<210> 230 <211> 145 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 230
aagaagctga aaggctggaa ggagttgagg gaaggaacct tgagttgcct ccagcggctg 60
ttacagcagc tgtcagggaa cgcatagctg ttccagcatt tccaaggaaa agttcgatat 120
cgttcttccc cagtttaccg accgc 145
<210> 231 <211> 71 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<223> Описание комбинированной молекулы ДНК/РНК: синтетический олигонуклеотид
<400> 231
uucauguggu cggggtagcg gctgaagcac tgcacgccgt gggtgaaggt ggtcacgagg 60
gtgggccagg g
<210> 232 <211> 71 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<223> Описание комбинированной молекулы ДНК/ РНК: синтетический олигонуклеотид
<400> 232
gcugcccgug ccctggccca ccctcgtgac caccttcacc cacggcgtgc agtgcttcag 60 ccgctacccc g 71
<210> 233 <211> 10 <212> РНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 233
gcugcccgug 10
<210> 234 <211> 10 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 234
gggcgagggc 10
<210> 235 <211> 111 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 235
ccctgggaat ctgaaagaag agaagcaggc ccatttatat gggaaagaac aatagtattt 60 cttatatagg cccatttaag ttgaaaacaa tcttcaaaag tcccacatcg c 111
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 236
ggagcgagcg gagcgguaca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 237 <211> 48 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<221> модифицированное основание <222> (1)..(14)
<223> a, c, t, g, неизвестное или другое
<220>
<221> модифицированное основание <222> (35)..(48)
<223> a, c, t, g, неизвестное или другое
<400> 237
nnnnnnnnnn nnnntgtacc gctccgctcg ctccnnnnnn nnnnnnnn 4 8
<210> 238 <211> 48 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<221> модифицированное_основание
<222> (1)..(14)
<223> a, c, t, g, неизвестное или другое
<220>
<221> модифицированное_основание
<222> (35)..(35)
<223> a, c, t, g, неизвестное или другое
<220>
<221> модифицированное_основание
<222> (38)..(48)
<223> a, c, t, g, неизвестное или другое
<210> 239
<211> 177 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический полинуклеотид
<400> 239
ttagataaga aaacgaagct gagtttatat acagctagag tcgaagtagt gattgtcgtg 60
accaccttca cccagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 120
caacttgaaa aagtggcacc gagtcggtgc ccaggtcaag ttcacgaccc ttttttt 177
<210> 240 <211> 81 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 240
ccaccctcgt gaccaccttc acccacggcg tgcagtgctt cagccgctac cccgaccaca 60 tgaagcagca cgacttcttc a 81
<210> 241 <211> 23 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 241
ctcgtgacca ccttcaccca cgg 23
<210> 242 <211> 23 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 242
ccgaccacat gaagcagcac gac 23
<210> 243 <211> 23 <212> ДНК
<213> Искусственная последовательность
<400> 243
ccacggcgtg cagtgcttca gcc 23
<210> 244 <211> 66 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 244
ccaccctcgt gaccaccttc acccacggcg tgcagtgctt cagccgctac cccgaccaca 60 tgaagc 66
<210> 245 <211> 70 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 245
ggaaatgctg gaacagctat gcgtccgctg acagctgctg taacagccgc tagaggcaac 60 tcaaggttcc 70
<210> 246 <211> 7589 <212> ДНК
<213> Alopecurus myosuroides
aagttcatgc ggagtgtccg gacatgggct aatgatacat ttgggtcaga gaaggcgatt 660
cagttgatag ctatggcaac tccggaagac atgagaataa atgcagagca cattagaatt 720
gctgatcagt ttgttgaagt acctggtgga acaaacaata acaactatgc aaatgtccaa 780
ctcatagtgg agatagcaga gagaactggt gtctccgccg tttggcctgg ttggggccat 840
gcatctgaga atcctgaact tccagatgca ctaactgcaa aaggaattgt ttttcttggg 900
ccaccagcat catcaatgaa cgcactaggc gacaaggttg gttcagctct cattgctcaa 960
gcagcagggg ttcccactct tgcttggagt ggatcacatg tggaaattcc attagaactt 1020
tgtttggact cgatacctga ggagatgtat aggaaagcct gtgttacaac cgctgatgaa 1080
gcagttgcaa gttgtcagat gattggttac cctgccatga tcaaggcatc ctggggtggt 1140
ggtggtaaag ggattagaaa ggttaataat gatgacgagg tgaaagcact gtttaagcaa 1200
gtacagggtg aagttcctgg ctccccgata tttatcatga gacttgcatc tcagagtcgt 1260
catcttgaag tccagctgct ttgtgatgaa tatggcaatg tagcagcact tcacagtcgt 1320
gattgcagtg tgcaacgacg acaccaaaag attatcgagg aaggaccagt tactgttgct 1380
cctcgtgaaa cagtgaaaga gctagagcaa gcagcaagga ggcttgctaa ggccgtgggt 1440
tacgtcggtg ctgctactgt tgaatatctc tacagcatgg agactggtga atactatttt 1500
ctggagctta atccacggtt gcaggttgag cacccagtca ccgagtcgat agctgaagta 1560
aatttgcctg cagcccaagt tgcagttggg atgggtatac ccctttggca gattccagag 1620
atcagacgtt tctacggaat ggacaatgga ggaggctatg atatttggag gaaaacagca 1680
gctctcgcta ctccattcaa ctttgatgaa gtagattctc aatggccgaa gggtcattgt 1740
gtggcagtta ggataaccag tgagaatcca gatgatggat tcaagcctac tggtggaaaa 1800
gtaaaggaga taagttttaa aagtaagcca aatgtctggg gatatttctc agttaagtct 1860
ggtggaggca ttcatgaatt tgcggattct cagtttggac acgtttttgc ctatggagag 1920
actagatcag cagcaataac cagcatgtct cttgcactaa aagagattca aattcgtgga 1980
gaaattcata caaacgttga ttacacggtt gatctcttga atgccccaga cttcagagaa 2040
aacacgatcc ataccggttg gctggatacc agaatagcta tgcgtgttca agctgagagg 2100
cctccctggt atatttcagt ggttggagga gctctatata aaacaataac caccaatgcg 2160
gagaccgttt ctgaatatgt tagctatctc atcaagggtc agattccacc aaagcacata 2220
tcccttgtcc attcaactat ttctttgaat atagaggaaa gcaaatatac aattgagatt 2280
gtgaggagtg gacagggtag ctacagattg agactgaatg gatcacttat tgaagccaat 2340
gtacaaacat tatgtgatgg aggcctttta atgcagctgg atggaaatag ccatgttatt 2400
tatgctgaag aagaagcggg tggtacacgg cttcttattg atggaaaaac atgcttgcta 2460
cagaatgacc atgatccgtc aaggttatta gctgagacac cctgcaaact tcttcgtttc 2520
ttgattgccg atggtgctca tgttgatgct gatgtaccat acgcggaagt tgaggttatg 2580
aagatgtgca tgcccctctt gtcgcctgct gctggtgtca ttaatgtttt gttgtctgag 2640
ggccaggcga tgcaggctgg tgatcttata gcgagacttg atctcgatga cccttctgct 2700
gtgaagagag ccgagccatt tgaaggatct tttccagaaa tgagccttcc tattgctgct 2760
tctggccaag ttcacaaaag atgtgctgca agtttgaacg ctgctcgaat ggtccttgca 2820
ggatatgacc atgcggccaa caaagttgtg caagatttgg tatggtgcct tgatacacct 2880
gctcttcctt tcctacaatg ggaagagctt atgtctgttt tagcaactag acttccaaga 2940
cgtcttaaga gcgagttgga gggcaaatac aatgaataca agttaaatgt tgaccatgtg 3000
aagatcaagg atttccctac cgagatgctt agagagacaa tcgaggaaaa tcttgcatgt 3060
gtttccgaga aggaaatggt gacaattgag aggcttgttg accctctgat gagcctgctg 3120
aagtcatacg agggtgggag agaaagccat gcccacttta ttgtcaagtc cctttttgag 3180
gagtatctct cggttgagga actattcagt gatggcattc agtctgacgt gattgaacgc 3240
ctgcgcctac aatatagtaa agacctccag aaggttgtag acattgtttt gtctcaccag 3300
ggtgtgagaa acaaaacaaa gctgatactc gcgctcatgg agaaactggt ctatccaaac 3360
cctgctgcct acagagatca gttgattcgc ttttcttccc tcaaccataa aagatattat 3420
aagttggctc ttaaagctag tgaacttctt gaacaaacca agctcagcga actccgcaca 3480
agcattgcaa ggaacctttc agcgctggat atgttcaccg aggaaaaggc agatttctcc 3540
ttgcaagaca gaaaattggc cattaatgag agcatgggag atttagtcac tgccccactg 3600
ccagttgaag atgcacttgt ttctttgttt gattgtactg atcaaactct tcagcagaga 3660
gtgattcaga catacatatc tcgattatac cagcctcaac ttgtgaagga tagcatccag 3720
ctgaaatatc aggattctgg tgttattgct ttatgggaat tcactgaagg aaatcatgag 3780
aagagattgg gtgctatggt tatcctgaag tcactagaat ctgtgtcaac agccattgga 3840
gctgctctaa aggatgcatc acattatgca agctctgcgg gcaacacggt gcatattgct 3900
ttgttggatg ctgataccca actgaataca actgaagata gtggtgataa tgaccaagct 3960
caagacaaga tggataaact ttcttttgta ctgaaacaag atgttgtcat ggctgatcta 4020
cgtgctgctg atgtcaaggt tgttagttgc attgttcaaa gagatggagc aatcatgcct 4080
atgcgccgta ccttcctctt gtcagaggaa aaactttgtt acgaggaaga gccgattctt 4140
cggcatgtgg agcctccact ttctgcactt cttgagttgg ataaattgaa agtgaaagga 4200
tacaatgaga tgaagtatac accgtcacgt gatcgtcagt ggcatatata cacacttaga 4260
aatactgaaa atccaaaaat gctgcacagg gtatttttcc gaacacttgt cagacaaccc 4320
agtgcaggca acaggtttac atcagaccat atcactgatg ttgaagtagg acacgcagag 4380
gaacctcttt catttacttc aagcagcata ttaaaatcgt tgaagattgc taaagaagaa 4440
ttggagcttc acgcgatcag gactggccat tctcatatgt acttgtgcat attgaaagag 4500
caaaagcttc ttgaccttgt tcctgtttca gggaacactg ttgtggatgt tggtcaagat 4560
gaagctactg catgctctct tttgaaagaa atggctttaa agatacatga acttgttggt 4620
gcaagaatgc atcatctttc tgtatgccag tgggaagtga aacttaagtt ggtgagcgat 4680
gggcctgcca gtggtagctg gagagttgta acaaccaatg ttactggtca cacctgcact 4740
gtggatatct accgggaggt cgaagataca gaatcacaga aactagtata ccactccacc 4800
gcattgtcat ctggtccttt gcatggtgtt gcactgaata cttcgtatca gcctttgagt 4860
gttattgatt taaaacgttg ctctgccagg aacaacaaaa ctacatactg ctatgatttt 4920
ccattgacat ttgaagctgc agtgcagaag tcgtggtcta acatttccag tgaaaacaac 4980
caatgttatg ttaaagcgac agagcttgtg tttgctgaaa agaatgggtc gtggggcact 5040
cctataattc ctatgcagcg tgctgctggg ctgaatgaca ttggtatggt agcctggatc 5100
ttggacatgt ccactcctga atttcccagc ggcagacaga tcattgttat cgcaaatgat 5160
attacattta gagctggatc atttggccca agggaagatg catttttcga agctgtaacc 5220
aacctggctt gtgagaagaa gcttccactt atctacttgg ctgcaaactc tggtgctcgg 5280
attggcattg ctgatgaagt aaaatcttgc ttccgtgttg gatggactga tgatagcagc 5340
cctgaacgtg gatttaggta catttatatg actgacgaag accatgatcg tattggctct 5400
tcagttatag cacacaagat gcagctagat agtggcgaga tcaggtgggt tattgattct 5460
gttgtgggaa aagaggatgg actaggtgtg gagaacatac atggaagtgc tgctattgcc 5520
agtgcctatt ctagggcgta cgaggagaca tttacactta cattcgttac tggacgaact 5580
gttggaatcg gagcctatct tgctcgactt ggcatacggt gcatacagcg tattgaccag 5640
cccattattt tgaccgggtt ttctgccctg aacaagcttc ttgggcggga ggtgtacagc 5700
tcccacatgc agttgggtgg tcccaaaatc atggcgacga atggtgttgt ccatctgact 5760
gttccagatg accttgaagg tgtttctaat atattgaggt ggctcagcta tgttcctgca 5820
aacattggtg gacctcttcc tattacaaaa tctttggacc caatagacag acccgttgca 5880
tacatccctg agaatacatg tgatcctcgt gcagccatca gtggcattga tgacagccaa 5940
gggaaatggt tgggtggcat gtttgacaaa gacagttttg tggagacatt tgaaggatgg 6000
gcgaagacag tagttactgg cagagcaaaa cttggaggga ttcctgttgg tgttatagct 6060
gtggagacac agaccatgat gcagctcgtc cccgctgatc caggccagcc tgattcccac 6120
gagcggtctg ttcctcgtgc tgggcaagtt tggtttccag attctgctac caagacagcg 6180
caggcgatgt tggacttcaa ccgtgaagga ttacctctgt tcatacttgc taactggaga 6240
ggcttctctg gagggcaaag agatcttttt gaaggaattc tgcaggctgg gtcaacaatt 6300
gttgagaacc ttaggacata caatcagcct gcctttgtat atatccccaa ggctgcagag 6360
ctacgtggag
gagcctgggt
cgtgattgat
agcaagataa
acccagatcg
catcgagtgc
6420
tatgctgaga
ggactgcaaa
gggtaatgtt
ctcgaacctc
aagggttgat
tgagatcaag
6480
ttcaggtcag
aggaactcaa
agaatgcatg
ggtaggcttg
atccagaatt
gatagatctg
6540
aaagcaagac
tccagggagc
aaatggaagc
ctatctgatg
gagaatccct
tcagaagagc
6600
atagaagctc
ggaagaaaca
gttgctgcct
ctgtacaccc
aaatcgcggt
acgttttgcg
6660
gaattgcacg
acacttccct
tagaatggct
gctaaaggtg
tgatcaggaa
agttgtagac
6720
tgggaagact
ctcggtcttt
cttctacaag
agattacgga
ggaggctatc
cgaggacgtt
6780
ctggcaaagg
agattagagg
tgtaattggt
gagaagtttc
ctcacaaatc
agcgatcgag
6840
ctgatcaaga
aatggtactt
ggcttctgag
gcagctgcag
caggaagcac
cgactgggat
6900
gacgacgatg
cttttgtcgc
ctggagggag
aaccctgaaa
actataagga
gtatatcaaa
6960
gagcttaggg
ctcaaagggt
atctcggttg
ctctcagatg
ttgcaggctc
cagttcggat
7020
ttacaagcct
tgccgcaggg
tctttccatg
ctactagata
agatggatcc
ctctaagaga
7080
gcacagttta
tcgaggaggt
catgaaggtc
ctgaaatgat
caaatgatac
caacacatcc
7140
aatacagtat
gtgcatgata
tctgtttctc
ttgaagtaca
tatatagatg
gatacaaggc
7200
ggctgtaact
gatggtagct
aatctgggcc
aaccattact
tttgtgaact
tgctggtggc
7260
ctttattatt
caaggcacag
ctcgccttcg
gaccccctcc
ggctggttga
tgatgagtgt
7320
aactggatgt
gttagttctg
ctgccacaga
attcgagaag
gataggggca
tgcgggtttt
7380
gcctcctgtt
ggcaagaaca
ctggtgattt
tgagttcttg
ttatgtggac
tgtggtagtc
7440
ttgtttcgct
gtagttctgt
gatgttctat
ctcctgtaat
tctagtcttg
ggagagtgat
7500
tcagatgtcc
attcaatttt
gaacttgaat
aataatatgc
tttgtaggcc
tatgcgtacc
7560
agtatgtgga
ataaatgttc
gttgagtta
7589
<210> 247 <211> 2320
<212> Белок
<213> Alopecurus myosuroides
<400> 247
Met Gly Ser Thr His Leu Pro Ile Val Gly Phe Asn Ala Ser Thr Thr
1 5 10 15
Pro Ser Leu Ser Thr Leu Arg Gln Ile Asn Ser Ala Ala Ala Ala Phe
20 25 30
Gln Ser Ser Ser Pro Ser Arg Ser Ser Lys Lys Lys Ser Arg Arg Val
35 40 45
Lys Glu Gly Ala Ser Ala Pro Asp Val Asp Ile Ser His Gly Ser Glu
85 90 95
Asp His Lys Ala Ser Tyr Gln Met Asn Gly Ile Leu Asn Glu Ser His
100 105 110
Asn Gly Arg His Ala Ser Leu Ser Lys Val Tyr Glu Phe Cys Thr Glu
115 120 125
Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly
130 135 140
Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp
145 150 155 160
Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro
165 170 175
Glu Asp Met Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe
180 185 190
Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln
195 200 205
Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro
210 215 220
Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr
225 230 235 240
Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met Asn Ala
245 250 255
Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val
260 265 270
Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Ile Pro Leu Glu Leu
275 280 285
Cys Leu Asp Ser Ile Pro Glu Glu Met Tyr Arg Lys Ala Cys Val Thr
290 295 300
Thr Ala Asp Glu Ala Val Ala Ser Cys Gln Met Ile Gly Tyr Pro Ala
305 310 315 320
Asn Asn Asp Asp Glu Val Lys Ala Leu Phe Lys Gln Val Gln Gly Glu
340 345 350
Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ser Gln Ser Arg
355 360 365
His Leu Glu Val Gln Leu Leu Cys Asp Glu Tyr Gly Asn Val Ala Ala
370 375 380
Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile
385 390 395 400
Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu
405 410 415
Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala
420 425 430
Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe
435 440 445
Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Ser
450 455 460
Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly
465 470 475 480
Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asp
485 490 495
Asn Gly Gly Gly Tyr Asp Ile Trp Arg Lys Thr Ala Ala Leu Ala Thr
500 505 510
Pro Phe Asn Phe Asp Glu Val Asp Ser Gln Trp Pro Lys Gly His Cys
515 520 525
Val Ala Val Arg Ile Thr Ser Glu Asn Pro Asp Asp Gly Phe Lys Pro
530 535 540
Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val
545 550 555 560
Trp Gly Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala
565 570 575
Ala Ile Thr Ser Met Ser Leu Ala Leu Lys Glu Ile Gln Ile Arg Gly
595 600 605
Glu Ile His Thr Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Pro
610 615 620
Asp Phe Arg Glu Asn Thr Ile His Thr Gly Trp Leu Asp Thr Arg Ile
625 630 635 640
Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val
645 650 655
Gly Gly Ala Leu Tyr Lys Thr Ile Thr Thr Asn Ala Glu Thr Val Ser
660 665 670
Glu Tyr Val Ser Tyr Leu Ile Lys Gly Gln Ile Pro Pro Lys His Ile
675 680 685
Ser Leu Val His Ser Thr Ile Ser Leu Asn Ile Glu Glu Ser Lys Tyr
690 695 700
Thr Ile Glu Ile Val Arg Ser Gly Gln Gly Ser Tyr Arg Leu Arg Leu
705 710 715 720
Asn Gly Ser Leu Ile Glu Ala Asn Val Gln Thr Leu Cys Asp Gly Gly
725 730 735
Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu
740 745 750
Glu Ala Gly Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Leu Leu
755 760 765
Gln Asn Asp His Asp Pro Ser Arg Leu Leu Ala Glu Thr Pro Cys Lys
770 775 780
Leu Leu Arg Phe Leu Ile Ala Asp Gly Ala His Val Asp Ala Asp Val
785 790 795 800
Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser
805 810 815
Pro Ala Ala Gly Val Ile Asn Val Leu Leu Ser Glu Gly Gln Ala Met
820 825 830
Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala
835 840 845
Val Lys Arg Ala Glu Pro Phe Glu Gly Ser Phe Pro Glu Met Ser Leu
850 855 860
Pro Ile Ala Ala Ser Gly Gln Val His Lys Arg Cys Ala Ala Ser Leu
865 870 875 880
Asn Ala Ala Arg Met Val Leu Ala Gly Tyr Asp His Ala Ala Asn Lys
885 890 895
Val Val Gln Asp Leu Val Trp Cys Leu Asp Thr Pro Ala Leu Pro Phe
900 905 910
Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg
915 920 925
Arg Leu Lys Ser Glu Leu Glu Gly Lys Tyr Asn Glu Tyr Lys Leu Asn
930 935 940
Val Asp His Val Lys Ile Lys Asp Phe Pro Thr Glu Met Leu Arg Glu
945 950 955 960
Thr Ile Glu Glu Asn Leu Ala Cys Val Ser Glu Lys Glu Met Val Thr
965 970 975
Ile Glu Arg Leu Val Asp Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu
980 985 990
Gly Gly Arg Glu Ser His Ala His Phe Ile Val Lys Ser Leu Phe Glu
995 1000 1005
Glu Tyr Leu Ser Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser
1010 1015 1020
Asp Val Ile Glu Arg Leu Arg Leu Gln Tyr Ser Lys Asp Leu Gln
1025 1030 1035
Lys Val Val Asp Ile Val Leu Ser His Gln Gly Val Arg Asn Lys
1040 1045 1050
Thr Lys Leu Ile Leu Ala Leu Met Glu Lys Leu Val Tyr Pro Asn
1055 1060 1065
Pro Ala Ala Tyr Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn
1070 1075 1080
Glu Gln Thr Lys Leu Ser Glu Leu Arg Thr Ser Ile Ala Arg Asn
1100 1105 1110
Leu Ser Ala Leu Asp Met Phe Thr Glu Glu Lys Ala Asp Phe Ser
1115 1120 1125
Leu Gln Asp Arg Lys Leu Ala Ile Asn Glu Ser Met Gly Asp Leu
1130 1135 1140
Val Thr Ala Pro Leu Pro Val Glu Asp Ala Leu Val Ser Leu Phe
1145 1150 1155
Asp Cys Thr Asp Gln Thr Leu Gln Gln Arg Val Ile Gln Thr Tyr
1160 1165 1170
Ile Ser Arg Leu Tyr Gln Pro Gln Leu Val Lys Asp Ser Ile Gln
1175 1180 1185
Leu Lys Tyr Gln Asp Ser Gly Val Ile Ala Leu Trp Glu Phe Thr
1190 1195 1200
Glu Gly Asn His Glu Lys Arg Leu Gly Ala Met Val Ile Leu Lys
1205 1210 1215
Ser Leu Glu Ser Val Ser Thr Ala Ile Gly Ala Ala Leu Lys Asp
1220 1225 1230
Ala Ser His Tyr Ala Ser Ser Ala Gly Asn Thr Val His Ile Ala
1235 1240 1245
Leu Leu Asp Ala Asp Thr Gln Leu Asn Thr Thr Glu Asp Ser Gly
1250 1255 1260
Asp Asn Asp Gln Ala Gln Asp Lys Met Asp Lys Leu Ser Phe Val
1265 1270 1275
Leu Lys Gln Asp Val Val Met Ala Asp Leu Arg Ala Ala Asp Val
1280 1285 1290
Lys Val Val Ser Cys Ile Val Gln Arg Asp Gly Ala Ile Met Pro
1295 1300 1305
Met Arg Arg Thr Phe Leu Leu Ser Glu Glu Lys Leu Cys Tyr Glu
1310 1315 1320
Glu Glu Pro Ile Leu Arg His Val Glu Pro Pro Leu Ser Ala Leu
1325 1330 1335
Leu Glu Leu Asp Lys Leu Lys Val Lys Gly Tyr Asn Glu Met Lys
1340 1345 1350
Tyr Thr Pro Ser Arg Asp Arg Gln Trp His Ile Tyr Thr Leu Arg
1355 1360 1365
Asn Thr Glu Asn Pro Lys Met Leu His Arg Val Phe Phe Arg Thr
1370 1375 1380
Leu Val Arg Gln Pro Ser Ala Gly Asn Arg Phe Thr Ser Asp His
1385 1390 1395
Ile Thr Asp Val Glu Val Gly His Ala Glu Glu Pro Leu Ser Phe
1400 1405 1410
Thr Ser Ser Ser Ile Leu Lys Ser Leu Lys Ile Ala Lys Glu Glu
1415 1420 1425
Leu Glu Leu His Ala Ile Arg Thr Gly His Ser His Met Tyr Leu
1430 1435 1440
Cys Ile Leu Lys Glu Gln Lys Leu Leu Asp Leu Val Pro Val Ser
1445 1450 1455
Gly Asn Thr Val Val Asp Val Gly Gln Asp Glu Ala Thr Ala Cys
1460 1465 1470
Ser Leu Leu Lys Glu Met Ala Leu Lys Ile His Glu Leu Val Gly
1475 1480 1485
Ala Arg Met His His Leu Ser Val Cys Gln Trp Glu Val Lys Leu
1490 1495 1500
Lys Leu Val Ser Asp Gly Pro Ala Ser Gly Ser Trp Arg Val Val
1505 1510 1515
Thr Thr Asn Val Thr Gly His Thr Cys Thr Val Asp Ile Tyr Arg
1520 1525 1530
Glu Val Glu Asp Thr Glu Ser Gln Lys Leu Val Tyr His Ser Thr
1535 1540 1545
Ala Leu Ser Ser Gly Pro Leu His Gly Val Ala Leu Asn Thr Ser
1550 1555 1560
Tyr Gln Pro Leu Ser Val Ile Asp Leu Lys Arg Cys Ser Ala Arg
1565 1570 1575
Asn Asn Lys Thr Thr Tyr Cys Tyr Asp Phe Pro Leu Thr Phe Glu
1580 1585 1590
Ala Ala Val Gln Lys Ser Trp Ser Asn Ile Ser Ser Glu Asn Asn
1595 1600 1605
Gln Cys Tyr Val Lys Ala Thr Glu Leu Val Phe Ala Glu Lys Asn
1610 1615 1620
Gly Ser Trp Gly Thr Pro Ile Ile Pro Met Gln Arg Ala Ala Gly
1625 1630 1635
Leu Asn Asp Ile Gly Met Val Ala Trp Ile Leu Asp Met Ser Thr
1640 1645 1650
Pro Glu Phe Pro Ser Gly Arg Gln Ile Ile Val Ile Ala Asn Asp
1655 1660 1665
Ile Thr Phe Arg Ala Gly Ser Phe Gly Pro Arg Glu Asp Ala Phe
1670 1675 1680
Phe Glu Ala Val Thr Asn Leu Ala Cys Glu Lys Lys Leu Pro Leu
1685 1690 1695
Ile Tyr Leu Ala Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala Asp
1700 1705 1710
Glu Val Lys Ser Cys Phe Arg Val Gly Trp Thr Asp Asp Ser Ser
1715 1720 1725
Pro Glu Arg Gly Phe Arg Tyr Ile Tyr Met Thr Asp Glu Asp His
1730 1735 1740
Asp Arg Ile Gly Ser Ser Val Ile Ala His Lys Met Gln Leu Asp
1745 1750 1755
Ser Gly Glu Ile Arg Trp Val Ile Asp Ser Val Val Gly Lys Glu
1760 1765 1770
Asp Gly Leu Gly Val Glu Asn Ile His Gly Ser Ala Ala Ile Ala
1775 1780 1785
Gly Ile Arg Cys Ile Gln Arg Ile Asp Gln Pro Ile Ile Leu Thr
1820 1825 1830
Gly Phe Ser Ala Leu Asn Lys Leu Leu Gly Arg Glu Val Tyr Ser
1835 1840 1845
Ser His Met Gln Leu Gly Gly Pro Lys Ile Met Ala Thr Asn Gly
1850 1855 1860
Val Val His Leu Thr Val Pro Asp Asp Leu Glu Gly Val Ser Asn
1865 1870 1875
Ile Leu Arg Trp Leu Ser Tyr Val Pro Ala Asn Ile Gly Gly Pro
1880 1885 1890
Leu Pro Ile Thr Lys Ser Leu Asp Pro Ile Asp Arg Pro Val Ala
1895 1900 1905
Tyr Ile Pro Glu Asn Thr Cys Asp Pro Arg Ala Ala Ile Ser Gly
1910 1915 1920
Ile Asp Asp Ser Gln Gly Lys Trp Leu Gly Gly Met Phe Asp Lys
1925 1930 1935
Asp Ser Phe Val Glu Thr Phe Glu Gly Trp Ala Lys Thr Val Val
1940 1945 1950
Thr Gly Arg Ala Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala
1955 1960 1965
Val Glu Thr Gln Thr Met Met Gln Leu Val Pro Ala Asp Pro Gly
1970 1975 1980
Gln Pro Asp Ser His Glu Arg Ser Val Pro Arg Ala Gly Gln Val
1985 1990 1995
Trp Phe Pro Asp Ser Ala Thr Lys Thr Ala Gln Ala Met Leu Asp
2000 2005 2010
Phe Asn Arg Glu Gly Leu Pro Leu Phe Ile Leu Ala Asn Trp Arg
2015 2020 2025
Ala Gly Ser Thr Ile Val Glu Asn Leu Arg Thr Tyr Asn Gln Pro
2045 2050 2055
Ala Phe Val Tyr Ile Pro Lys Ala Ala Glu Leu Arg Gly Gly Ala
2060 2065 2070
Trp Val Val Ile Asp Ser Lys Ile Asn Pro Asp Arg Ile Glu Cys
2075 2080 2085
Tyr Ala Glu Arg Thr Ala Lys Gly Asn Val Leu Glu Pro Gln Gly
2090 2095 2100
Leu Ile Glu Ile Lys Phe Arg Ser Glu Glu Leu Lys Glu Cys Met
2105 2110 2115
Gly Arg Leu Asp Pro Glu Leu Ile Asp Leu Lys Ala Arg Leu Gln
2120 2125 2130
Gly Ala Asn Gly Ser Leu Ser Asp Gly Glu Ser Leu Gln Lys Ser
2135 2140 2145
Ile Glu Ala Arg Lys Lys Gln Leu Leu Pro Leu Tyr Thr Gln Ile
2150 2155 2160
Ala Val Arg Phe Ala Glu Leu His Asp Thr Ser Leu Arg Met Ala
2165 2170 2175
Ala Lys Gly Val Ile Arg Lys Val Val Asp Trp Glu Asp Ser Arg
2180 2185 2190
Ser Phe Phe Tyr Lys Arg Leu Arg Arg Arg Leu Ser Glu Asp Val
2195 2200 2205
Leu Ala Lys Glu Ile Arg Gly Val Ile Gly Glu Lys Phe Pro His
2210 2215 2220
Lys Ser Ala Ile Glu Leu Ile Lys Lys Trp Tyr Leu Ala Ser Glu
2225 2230 2235
Ala Ala Ala Ala Gly Ser Thr Asp Trp Asp Asp Asp Asp Ala Phe
2240 2245 2250
Val Ala Trp Arg Glu Asn Pro Glu Asn Tyr Lys Glu Tyr Ile Lys
2255 2260 2265
Leu Leu Asp Lys Met Asp Pro Ser Lys Arg Ala Gln Phe Ile Glu
2300 2305 2310
Glu Val Met Lys Val Leu Lys 2315 2320
<210> 248
<211> 7425
<212> ДНК
<213> Oryza sativa
<400> 248
atgacatcca cacatgtggc gacattggga gttggtgccc aggcacctcc tcgtcaccag 60
aaaaagtcag ctggcactgc atttgtatca tctgggtcat caagaccctc ataccgaaag 120
aatggtcagc gtactcggtc acttagggaa gaaagcaatg gaggagtgtc tgattccaaa 180
aagcttaacc actctattcg ccaaggtctt gctggcatca ttgacctccc aaatgacgca 240
gcttcagaag ttgatatttc acatggttcc gaagatccca gggggcctac ggtcccaggt 300
tcctaccaaa tgaatgggat tatcaatgaa acacataatg ggaggcatgc ttcagtctcc 360
aaggttgttg agttttgtac ggcacttggt ggcaaaacac caattcacag tgtattagtg 420
gccaacaatg gaatggcagc agctaagttc atgcggagtg tccgaacatg ggctaatgat 480
acttttggat cagagaaggc aattcagctg atagctatgg caactccgga ggatctgagg 540
ataaatgcag agcacatcag aattgccgat caatttgtag aggtacctgg tggaacaaac 600
aacaacaact atgcaaatgt ccaactcata gtggagatag cagagagaac aggtgtttct 660
gctgtttggc ctggttgggg tcatgcatct gagaatcctg aacttccaga tgcgctgact 720
gcaaaaggaa ttgtttttct tgggccacca gcatcatcaa tgcatgcatt aggagacaag 780
gttggctcag ctctcattgc tcaagcagct ggagttccaa cacttgcttg gagtggatca 840
catgtggaag ttcctctgga gtgttgcttg gactcaatac ctgatgagat gtatagaaaa 900
gcttgtgtta ctaccacaga ggaagcagtt gcaagttgtc aggtggttgg ttatcctgcc 960
atgattaagg catcttgggg tggtggtggt aaaggaataa ggaaggttca taatgatgat 1020
gaggttagga cattatttaa gcaagttcaa ggcgaagtac ctggttcccc aatatttatc 1080
atgaggctag ctgctcagag tcgacatctt gaagttcagt tgctttgtga tcaatatggc 1140
aacgtagcag cacttcacag tcgagattgc agtgtacaac ggcgacacca aaagataatc 1200
gaggaaggac cagttactgt tgctcctcgt gagactgtga aagagcttga gcaggcagca 1260
cggaggcttg ctaaagctgt gggttatgtt ggtgctgcta ctgttgaata cctttacagc 1320
atggaaactg gtgaatatta ttttctggaa cttaatccac ggctacaggt tgagcatcct 1380
gtcactgagt ggatagctga agtaaatttg cctgcggctc aagttgctgt tggaatgggt 1440
ataccccttt ggcagattcc agagatcagg cgcttctacg gaatgaacca tggaggaggc 1500
tatgaccttt ggaggaaaac agcagctcta gcgactccat ttaactttga tgaagtagat 1560
tctaaatggc caaaaggcca ctgcgtagct gttagaataa ctagcgagga tccagatgat 1620
gggtttaagc ctactggtgg aaaagtaaag gagataagtt tcaagagtaa accaaatgtt 1680
tgggcctatt tctcagtaaa gtctggtgga ggcatccatg aattcgctga ttctcagttc 1740
ggacatgttt ttgcgtatgg aactactaga tcggcagcaa taactaccat ggctcttgca 1800
ctaaaagagg ttcaaattcg tggagaaatt cattcaaacg tagactacac agttgaccta 1860
ttaaatgcct cagattttag agaaaataag attcatactg gttggctgga taccaggata 1920
gccatgcgtg ttcaagctga gaggcctcca tggtatattt cagtcgttgg aggggcttta 1980
tataaaacag taactgccaa cacggccact gtttctgatt atgttggtta tcttaccaag 2040
ggccagattc caccaaagca tatatccctt gtctatacga ctgttgcttt gaatatagat 2100
gggaaaaaat atacaatcga tactgtgagg agtggacatg gtagctacag attgcgaatg 2160
aatggatcaa cggttgacgc aaatgtacaa atattatgtg atggtgggct tttaatgcag 2220
ctggatggaa acagccatgt aatttatgct gaagaagagg ccagtggtac acgacttctt 2280
attgatggaa agacatgcat gttacagaat gaccatgacc catcaaagtt attagctgag 2340
acaccatgca aacttcttcg tttcttggtt gctgatggtg ctcatgttga tgctgatgta 2400
ccatatgcgg aagttgaggt tatgaagatg tgcatgcccc tcttatcacc cgcttctggt 2460
gtcatacatg ttgtaatgtc tgagggccaa gcaatgcagg ctggtgatct tatagctagg 2520
ctggatcttg atgacccttc tgctgttaag agagctgagc cgttcgaaga tacttttcca 2580
caaatgggtc tccctattgc tgcttctggc caagttcaca aattatgtgc tgcaagtctg 2640
aatgcttgtc gaatgatcct tgcggggtat gagcatgata ttgacaaggt tgtgccagag 2700
ttggtatact gcctagacac tccggagctt cctttcctgc agtgggagga gcttatgtct 2760
gttttagcaa ctagacttcc aagaaatctt aaaagtgagt tggagggcaa atatgaggaa 2820
tacaaagtaa aatttgactc tgggataatc aatgatttcc ctgccaatat gctacgagtg 2880
ataattgagg aaaatcttgc atgtggttct gagaaggaga aggctacaaa tgagaggctt 2940
gttgagcctc ttatgagcct actgaagtca tatgagggtg ggagagaaag tcatgctcac 3000
tttgttgtca agtccctttt tgaggagtat ctctatgttg aagaattgtt cagtgatgga 3060
attcagtctg atgtgattga gcgtctgcgc cttcaacata gtaaagacct acagaaggtc 3120
gtagacattg tgttgtccca ccagagtgtt agaaataaaa ctaagctgat actaaaactc 3180
atggagagtc tggtctatcc aaatcctgct gcctacaggg atcaattgat tcgcttttct 3240
tcccttaatc acaaagcgta ttacaagttg gcacttaaag ctagtgaact tcttgaacaa 3300
acaaaactta gtgagctccg tgcaagaata gcaaggagcc tttcagagct ggagatgttt 3360
actgaggaaa gcaagggtct ctccatgcat aagcgagaaa ttgccattaa ggagagcatg 3420
gaagatttag tcactgctcc actgccagtt gaagatgcgc tcatttcttt atttgattgt 3480
agtgatacaa ctgttcaaca gagagtgatt gagacttata tagctcgatt ataccagcct 3540
catcttgtaa aggacagtat caaaatgaaa tggatagaat cgggtgttat tgctttatgg 3600
gaatttcctg aagggcattt tgatgcaaga aatggaggag cggttcttgg tgacaaaaga 3660
tggggtgcca tggtcattgt caagtctctt gaatcacttt caatggccat tagatttgca 3720
ctaaaggaga catcacacta cactagctct gagggcaata tgatgcatat tgctttgttg 3780
ggtgctgata ataagatgca tataattcaa gaaagtggtg atgatgctga cagaatagcc 3840
aaacttccct tgatactaaa ggataatgta accgatctgc atgcctctgg tgtgaaaaca 3900
ataagtttca ttgttcaaag agatgaagca cggatgacaa tgcgtcgtac cttcctttgg 3960
tctgatgaaa agctttctta tgaggaagag ccaattctcc ggcatgtgga acctcctctt 4020
tctgcacttc ttgagttgga caagttgaaa gtgaaaggat acaatgaaat gaagtatacc 4080
ccatcacggg atcgtcaatg gcatatctac acacttagaa atactgaaaa ccccaaaatg 4140
ttgcaccggg tatttttccg aacccttgtc aggcaaccca gtgtatccaa caagttttct 4200
tcgggccaga ttggtgacat ggaagttggg agtgctgaag aacctctgtc atttacatca 4260
accagcatat taagatcttt gatgactgct atagaggaat tggagcttca cgcaattaga 4320
actggccatt cacacatgta tttgcatgta ttgaaagaac aaaagcttct tgatcttgtt 4380
ccagtttcag ggaatacagt tttggatgtt ggtcaagatg aagctactgc atattcactt 4440
ttaaaagaaa tggctatgaa gatacatgaa cttgttggtg caagaatgca ccatctttct 4500
gtatgccaat gggaagtgaa acttaagttg gactgcgatg gtcctgccag tggtacctgg 4560
aggattgtaa caaccaatgt tactagtcac acttgcactg tggatatcta ccgtgagatg 4620
gaagataaag aatcacggaa gttagtatac catcccgcca ctccggcggc tggtcctctg 4680
catggtgtgg cactgaataa tccatatcag cctttgagtg tcattgatct caaacgctgt 4740
tctgctagga ataatagaac tacatactgc tatgattttc cactggcatt tgaaactgca 4800
gtgaggaagt catggtcctc tagtacctct ggtgcttcta aaggtgttga aaatgcccaa 4860
tgttatgtta aagctacaga gttggtattt gcggacaaac atgggtcatg gggcactcct 4920
ttagttcaaa tggaccggcc tgctgggctc aatgacattg gtatggtagc ttggaccttg 4980
aagatgtcca ctcctgaatt tcctagtggt agggagatta ttgttgttgc aaatgatatt 5040
acgttcagag ctggatcatt tggcccaagg gaagatgcat tttttgaagc tgttaccaac 5100
ctagcctgtg agaagaaact tcctcttatt tatttggcag caaattctgg tgctcgaatt 5160
ggcatagcag atgaagtgaa atcttgcttc cgtgttgggt ggtctgatga tggcagccct 5220
gaacgtgggt ttcagtacat ttatctaagc gaagaagact atgctcgtat tggcacttct 5280
gtcatagcac ataagatgca gctagacagt ggtgaaatta ggtgggttat tgattctgtt 5340
gtgggcaagg aagatggact tggtgtggag aatatacatg gaagtgctgc tattgccagt 5400
gcttattcta gggcatataa ggagacattt acacttacat ttgtgactgg aagaactgtt 5460
ggaataggag cttatcttgc tcgacttggc atccggtgca tacagcgtct tgaccagcct 5520
attattctta caggctattc tgcactgaac aagcttcttg ggcgggaagt gtacagctcc 5580
cacatgcagt tgggtggtcc caaaatcatg gcaactaatg gtgttgtcca tcttactgtt 5640
tcagatgacc ttgaaggcgt ttctaatata ttgaggtggc tcagttatgt tcctgcctac 5700
attggtggac cacttccagt aacaacaccg ttggacccac cggacagacc tgttgcatac 5760
attcctgaga actcgtgtga tcctcgagcg gctatccgtg gtgttgatga cagccaaggg 5820
aaatggttag gtggtatgtt tgataaagac agctttgtgg aaacatttga aggttgggct 5880
aagacagtgg ttactggcag agcaaagctt ggtggaattc cagtgggtgt gatagctgtg 5940
gagactcaga ccatgatgca aactatccct gctgaccctg gtcagcttga ttcccgtgag 6000
caatctgttc ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag 6060
gcattgctgg acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc 6120
ttctctggtg gacaaagaga tctttttgaa ggaattcttc aggctggctc gactattgtt 6180
gagaacctta ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta 6240
cgaggagggg cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat 6300
gctgagagga ctgcaaaagg caatgttctg gaaccgcaag ggttaattga gatcaagttc 6360
aggtcagagg aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa 6420
gcaaaactcg aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat 6480
atagaagctc gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct 6540
gaattgcatg atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac 6600
tgggaagaat cacgatcttt cttctataag agattacgga ggaggatctc tgaggatgtt 6660
cttgcaaaag aaattagagc tgtagcaggt gagcagtttt cccaccaacc agcaatcgag 6720
ctgatcaaga aatggtattc agcttcacat gcagctgaat gggatgatga cgatgctttt 6780
gttgcttgga tggataaccc tgaaaactac aaggattata ttcaatatct taaggctcaa 6840
agagtatccc aatccctctc aagtctttca gattccagct cagatttgca agccctgcca 6900
cagggtcttt ccatgttact agataagatg gatccctcta gaagagctca acttgttgaa 6960
gaaatcagga aggtccttgg ttgaatcata tgatgccaaa actattattg gaggcacaaa 7020
tagcttgtgg accctgtcgg attgttggtg agtgtatatt ggatttgtta gttctgccag 7080
atgaaagtgc aagtctgatg attcatgata ccgtcagttg gcaagaacac cggttaacct 7140
gagtgcttgt ttacaaatgg tcctttatga caatcgttgt ttcgcgctag ttccgtgatc
7200
tactatcatc tgttagacgc tgtaattagt gagtctccgc ggatccacag tatacggttg
7260
agctgttgat tcaattttgg acacgaataa tatgattttg taggcataaa tgcgtctgta
7320
tgtgaaataa attgtctgtt gagttaacac acaagatgac aatatgtttg tgctctactg
7380
ctattgtcca tgaatactga ttgcggaatc aaccacatgc attat
7425
<211> 2327 <212> Белок <213> Oryza sativa
Met Thr Ser Thr His Val Ala Thr Leu Gly Val Gly Ala Gln Ala Pro
1 5 10 15
Pro Arg His Gln Lys Lys Ser Ala Gly Thr Ala Phe Val Ser Ser Gly
20 25 30
Ser Ser Arg Pro Ser Tyr Arg Lys Asn Gly Gln Arg Thr Arg Ser Leu
35 40 45
Arg Glu Glu Ser Asn Gly Gly Val Ser Asp Ser Lys Lys Leu Asn His
50 55 60
Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro Asn Asp Ala
65 70 75 80
Ala Ser Glu Val Asp Ile Ser His Gly Ser Glu Asp Pro Arg Gly Pro
85 90 95
Thr Val Pro Gly Ser Tyr Gln Met Asn Gly Ile Ile Asn Glu Thr His
100 105 110
Asn Gly Arg His Ala Ser Val Ser Lys Val Val Glu Phe Cys Thr Ala
115 120 125
Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly
130 135 140
Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp
145 150 155 160
Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro
165 170 175
Glu Asp Leu Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe
Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln
195 200 205
Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro
210 215 220
Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr
225 230 235 240
Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met His Ala
245 250 255
Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val
260 265 270
Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Val Pro Leu Glu Cys
275 280 285
Cys Leu Asp Ser Ile Pro Asp Glu Met Tyr Arg Lys Ala Cys Val Thr
290 295 300
Thr Thr Glu Glu Ala Val Ala Ser Cys Gln Val Val Gly Tyr Pro Ala
305 310 315 320
Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val
325 330 335
His Asn Asp Asp Glu Val Arg Thr Leu Phe Lys Gln Val Gln Gly Glu
340 345 350
Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ala Gln Ser Arg
355 360 365
His Leu Glu Val Gln Leu Leu Cys Asp Gln Tyr Gly Asn Val Ala Ala
370 375 380
Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile
385 390 395 400
Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu
405 410 415
Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala
420 425 430
Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe
Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Trp
450 455 460
Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly
465 470 475 480
Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asn
485 490 495
His Gly Gly Gly Tyr Asp Leu Trp Arg Lys Thr Ala Ala Leu Ala Thr
500 505 510
Pro Phe Asn Phe Asp Glu Val Asp Ser Lys Trp Pro Lys Gly His Cys
515 520 525
Val Ala Val Arg Ile Thr Ser Glu Asp Pro Asp Asp Gly Phe Lys Pro
530 535 540
Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val
545 550 555 560
Trp Ala Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala
565 570 575
Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Thr Thr Arg Ser Ala
580 585 590
Ala Ile Thr Thr Met Ala Leu Ala Leu Lys Glu Val Gln Ile Arg Gly
595 600 605
Glu Ile His Ser Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Ser
610 615 620
Asp Phe Arg Glu Asn Lys Ile His Thr Gly Trp Leu Asp Thr Arg Ile
625 630 635 640
Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val
645 650 655
Gly Gly Ala Leu Tyr Lys Thr Val Thr Ala Asn Thr Ala Thr Val Ser
660 665 670
Asp Tyr Val Gly Tyr Leu Thr Lys Gly Gln Ile Pro Pro Lys His Ile
675 680 685
Ser Leu Val Tyr Thr Thr Val Ala Leu Asn Ile Asp Gly Lys Lys Tyr
Thr Ile Asp Thr Val Arg Ser Gly His Gly Ser Tyr Arg Leu Arg Met
705 710 715 720
Asn Gly Ser Thr Val Asp Ala Asn Val Gln Ile Leu Cys Asp Gly Gly
725 730 735
Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu
740 745 750
Glu Ala Ser Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Met Leu
755 760 765
Gln Asn Asp His Asp Pro Ser Lys Leu Leu Ala Glu Thr Pro Cys Lys
770 775 780
Leu Leu Arg Phe Leu Val Ala Asp Gly Ala His Val Asp Ala Asp Val
785 790 795 800
Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser
805 810 815
Pro Ala Ser Gly Val Ile His Val Val Met Ser Glu Gly Gln Ala Met
820 825 830
Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala
835 840 845
Val Lys Arg Ala Glu Pro Phe Glu Asp Thr Phe Pro Gln Met Gly Leu
850 855 860
Pro Ile Ala Ala Ser Gly Gln Val His Lys Leu Cys Ala Ala Ser Leu
865 870 875 880
Asn Ala Cys Arg Met Ile Leu Ala Gly Tyr Glu His Asp Ile Asp Lys
885 890 895
Val Val Pro Glu Leu Val Tyr Cys Leu Asp Thr Pro Glu Leu Pro Phe
900 905 910
Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg
915 920 925
Asn Leu Lys Ser Glu Leu Glu Gly Lys Tyr Glu Glu Tyr Lys Val Lys
930 935 940
Phe Asp Ser Gly Ile Ile Asn Asp Phe Pro Ala Asn Met Leu Arg Val
Ile Ile Glu Glu Asn Leu Ala Cys Gly Ser Glu Lys Glu Lys Ala Thr
965 970 975
Asn Glu Arg Leu Val Glu Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu
980 985 990
Gly Gly Arg Glu Ser His Ala His Phe Val Val Lys Ser Leu Phe Glu
995 1000 1005
Glu Tyr Leu Tyr Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser
1010 1015 1020
Asp Val Ile Glu Arg Leu Arg Leu Gln His Ser Lys Asp Leu Gln
1025 1030 1035
Lys Val Val Asp Ile Val Leu Ser His Gln Ser Val Arg Asn Lys
1040 1045 1050
Thr Lys Leu Ile Leu Lys Leu Met Glu Ser Leu Val Tyr Pro Asn
1055 1060 1065
Pro Ala Ala Tyr Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn
1070 1075 1080
His Lys Ala Tyr Tyr Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu
1085 1090 1095
Glu Gln Thr Lys Leu Ser Glu Leu Arg Ala Arg Ile Ala Arg Ser
1100 1105 1110
Leu Ser Glu Leu Glu Met Phe Thr Glu Glu Ser Lys Gly Leu Ser
1115 1120 1125
Met His Lys Arg Glu Ile Ala Ile Lys Glu Ser Met Glu Asp Leu
1130 1135 1140
Val Thr Ala Pro Leu Pro Val Glu Asp Ala Leu Ile Ser Leu Phe
1145 1150 1155
Asp Cys Ser Asp Thr Thr Val Gln Gln Arg Val Ile Glu Thr Tyr
1160 1165 1170
Ile Ala Arg Leu Tyr Gln Pro His Leu Val Lys Asp Ser Ile Lys
1175 1180 1185
Met Lys Trp Ile Glu Ser Gly Val Ile Ala Leu Trp Glu Phe Pro
Glu Gly His Phe Asp Ala Arg Asn Gly Gly Ala Val Leu Gly Asp
1205 1210 1215
Lys Arg Trp Gly Ala Met Val Ile Val Lys Ser Leu Glu Ser Leu
1220 1225 1230
Ser Met Ala Ile Arg Phe Ala Leu Lys Glu Thr Ser His Tyr Thr
1235 1240 1245
Ser Ser Glu Gly Asn Met Met His Ile Ala Leu Leu Gly Ala Asp
1250 1255 1260
Asn Lys Met His Ile Ile Gln Glu Ser Gly Asp Asp Ala Asp Arg
1265 1270 1275
Ile Ala Lys Leu Pro Leu Ile Leu Lys Asp Asn Val Thr Asp Leu
1280 1285 1290
His Ala Ser Gly Val Lys Thr Ile Ser Phe Ile Val Gln Arg Asp
1295 1300 1305
Glu Ala Arg Met Thr Met Arg Arg Thr Phe Leu Trp Ser Asp Glu
1310 1315 1320
Lys Leu Ser Tyr Glu Glu Glu Pro Ile Leu Arg His Val Glu Pro
1325 1330 1335
Pro Leu Ser Ala Leu Leu Glu Leu Asp Lys Leu Lys Val Lys Gly
1340 1345 1350
Tyr Asn Glu Met Lys Tyr Thr Pro Ser Arg Asp Arg Gln Trp His
1355 1360 1365
Ile Tyr Thr Leu Arg Asn Thr Glu Asn Pro Lys Met Leu His Arg
1370 1375 1380
Val Phe Phe Arg Thr Leu Val Arg Gln Pro Ser Val Ser Asn Lys
1385 1390 1395
Phe Ser Ser Gly Gln Ile Gly Asp Met Glu Val Gly Ser Ala Glu
1400 1405 1410
Glu Pro Leu Ser Phe Thr Ser Thr Ser Ile Leu Arg Ser Leu Met
1415 1420 1425
Ser His Met Tyr Leu His Val Leu Lys Glu Gln Lys Leu Leu Asp
1445 1450 1455
Leu Val Pro Val Ser Gly Asn Thr Val Leu Asp Val Gly Gln Asp
1460 1465 1470
Glu Ala Thr Ala Tyr Ser Leu Leu Lys Glu Met Ala Met Lys Ile
1475 1480 1485
His Glu Leu Val Gly Ala Arg Met His His Leu Ser Val Cys Gln
1490 1495 1500
Trp Glu Val Lys Leu Lys Leu Asp Cys Asp Gly Pro Ala Ser Gly
1505 1510 1515
Thr Trp Arg Ile Val Thr Thr Asn Val Thr Ser His Thr Cys Thr
1520 1525 1530
Val Asp Ile Tyr Arg Glu Met Glu Asp Lys Glu Ser Arg Lys Leu
1535 1540 1545
Val Tyr His Pro Ala Thr Pro Ala Ala Gly Pro Leu His Gly Val
1550 1555 1560
Ala Leu Asn Asn Pro Tyr Gln Pro Leu Ser Val Ile Asp Leu Lys
1565 1570 1575
Arg Cys Ser Ala Arg Asn Asn Arg Thr Thr Tyr Cys Tyr Asp Phe
1580 1585 1590
Pro Leu Ala Phe Glu Thr Ala Val Arg Lys Ser Trp Ser Ser Ser
1595 1600 1605
Thr Ser Gly Ala Ser Lys Gly Val Glu Asn Ala Gln Cys Tyr Val
1610 1615 1620
Lys Ala Thr Glu Leu Val Phe Ala Asp Lys His Gly Ser Trp Gly
1625 1630 1635
Thr Pro Leu Val Gln Met Asp Arg Pro Ala Gly Leu Asn Asp Ile
1640 1645 1650
Gly Met Val Ala Trp Thr Leu Lys Met Ser Thr Pro Glu Phe Pro
1655 1660 1665
Ser Gly Arg Glu Ile Ile Val Val Ala Asn Asp Ile Thr Phe Arg
Ala Gly Ser Phe Gly Pro Arg Glu Asp Ala Phe Phe Glu Ala Val
1685 1690 1695
Thr Asn Leu Ala Cys Glu Lys Lys Leu Pro Leu Ile Tyr Leu Ala
1700 1705 1710
Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala Asp Glu Val Lys Ser
1715 1720 1725
Cys Phe Arg Val Gly Trp Ser Asp Asp Gly Ser Pro Glu Arg Gly
1730 1735 1740
Phe Gln Tyr Ile Tyr Leu Ser Glu Glu Asp Tyr Ala Arg Ile Gly
1745 1750 1755
Thr Ser Val Ile Ala His Lys Met Gln Leu Asp Ser Gly Glu Ile
1760 1765 1770
Arg Trp Val Ile Asp Ser Val Val Gly Lys Glu Asp Gly Leu Gly
1775 1780 1785
Val Glu Asn Ile His Gly Ser Ala Ala Ile Ala Ser Ala Tyr Ser
1790 1795 1800
Arg Ala Tyr Lys Glu Thr Phe Thr Leu Thr Phe Val Thr Gly Arg
1805 1810 1815
Thr Val Gly Ile Gly Ala Tyr Leu Ala Arg Leu Gly Ile Arg Cys
1820 1825 1830
Ile Gln Arg Leu Asp Gln Pro Ile Ile Leu Thr Gly Tyr Ser Ala
1835 1840 1845
Leu Asn Lys Leu Leu Gly Arg Glu Val Tyr Ser Ser His Met Gln
1850 1855 1860
Leu Gly Gly Pro Lys Ile Met Ala Thr Asn Gly Val Val His Leu
1865 1870 1875
Thr Val Ser Asp Asp Leu Glu Gly Val Ser Asn Ile Leu Arg Trp
1880 1885 1890
Leu Ser Tyr Val Pro Ala Tyr Ile Gly Gly Pro Leu Pro Val Thr
1895 1900 1905
Asn Ser Cys Asp Pro Arg Ala Ala Ile Arg Gly Val Asp Asp Ser
1925 1930 1935
Gln Gly Lys Trp Leu Gly Gly Met Phe Asp Lys Asp Ser Phe Val
1940 1945 1950
Glu Thr Phe Glu Gly Trp Ala Lys Thr Val Val Thr Gly Arg Ala
1955 1960 1965
Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala Val Glu Thr Gln
1970 1975 1980
Thr Met Met Gln Thr Ile Pro Ala Asp Pro Gly Gln Leu Asp Ser
1985 1990 1995
Arg Glu Gln Ser Val Pro Arg Ala Gly Gln Val Trp Phe Pro Asp
2000 2005 2010
Ser Ala Thr Lys Thr Ala Gln Ala Leu Leu Asp Phe Asn Arg Glu
2015 2020 2025
Gly Leu Pro Leu Phe Ile Leu Ala Asn Trp Arg Gly Phe Ser Gly
2030 2035 2040
Gly Gln Arg Asp Leu Phe Glu Gly Ile Leu Gln Ala Gly Ser Thr
2045 2050 2055
Ile Val Glu Asn Leu Arg Thr Tyr Asn Gln Pro Ala Phe Val Tyr
2060 2065 2070
Ile Pro Met Ala Ala Glu Leu Arg Gly Gly Ala Trp Val Val Val
2075 2080 2085
Asp Ser Lys Ile Asn Pro Asp Arg Ile Glu Cys Tyr Ala Glu Arg
2090 2095 2100
Thr Ala Lys Gly Asn Val Leu Glu Pro Gln Gly Leu Ile Glu Ile
2105 2110 2115
Lys Phe Arg Ser Glu Glu Leu Gln Asp Cys Met Ser Arg Leu Asp
2120 2125 2130
Pro Thr Leu Ile Asp Leu Lys Ala Lys Leu Glu Val Ala Asn Lys
2135 2140 2145
Arg Thr Lys Gln Leu Met Pro Leu Tyr Thr Gln Ile Ala Ile Arg
2165 2170 2175
Phe Ala Glu Leu His Asp Thr Ser Leu Arg Met Ala Ala Lys Gly
2180 2185 2190
Val Ile Lys Lys Val Val Asp Trp Glu Glu Ser Arg Ser Phe Phe
2195 2200 2205
Tyr Lys Arg Leu Arg Arg Arg Ile Ser Glu Asp Val Leu Ala Lys
2210 2215 2220
Glu Ile Arg Ala Val Ala Gly Glu Gln Phe Ser His Gln Pro Ala
2225 2230 2235
Ile Glu Leu Ile Lys Lys Trp Tyr Ser Ala Ser His Ala Ala Glu
2240 2245 2250
Trp Asp Asp Asp Asp Ala Phe Val Ala Trp Met Asp Asn Pro Glu
2255 2260 2265
Asn Tyr Lys Asp Tyr Ile Gln Tyr Leu Lys Ala Gln Arg Val Ser
2270 2275 2280
Gln Ser Leu Ser Ser Leu Ser Asp Ser Ser Ser Asp Leu Gln Ala
2285 2290 2295
Leu Pro Gln Gly Leu Ser Met Leu Leu Asp Lys Met Asp Pro Ser
2300 2305 2310
Arg Arg Ala Gln Leu Val Glu Glu Ile Arg Lys Val Leu Gly
2315 2320 2325
<210> 250 <211> 12486
<212> ДНК <213> Oryza sativa
<400> 250
tcattcttat atattttcat ctgtcagatt tcacacatct ggggatttat cttctctttg 60
tatggcacta cacatttgag aaaccgtgca attctactgt ttggtcagca ggacaacaat 120
gacatccaca catgtggcga cattgggagt tggtgcccag gcacctcctc gtcaccagaa 180
aaagtcagct ggcactgcat ttgtatcatc tgggtcatca agaccctcat accgaaagaa 240
tggtcagcgt actcggtcac ttagggaaga aagcaatgga ggagtgtctg attccaaaaa 300
gcttaaccac tctattcgcc aaggtgacca ctagctactt tacatatgct ataatttgtg 360
ccaaacataa acatgcaatg gctgctatta tttaaacgtt aatgttgaaa tagctgctat 420
aggatacagc aaaaatatat aattgactgg gcaagatgca acaattgttt ttcactaaag 480
ttagttatct tttgctgtaa aagacaactg ttttttacat aaaatggtat taataacctt 540
gtaatattca atgcaacatg ttctcaagta aaaaaaaaca ttgcctggtt gtataagcaa 600
atgtgtcgtt gtagacatct tattaaacct ttttgtgata tctattaccg tagggaacag 660
gggagctgtt taaatctgtt atcatagagt aatatgagaa aagtggattg tgcgactttg 720
gcatgtatac ctgctcaatt tcaaatatat gtctatgtgc aggtcttgct ggcatcattg 780
acctcccaaa tgacgcagct tcagaagttg atatttcaca gtaaggactt tatattttat 840
aataattatt atataatttt ctgacatgtt ttgagaacct caaaacatgt gattgcacct 900
tcctttttta tgtctggttc agaaactgat aagttttgac agtgtttagg atggatcttt 960
gatgcgcaca gtgctttcta atgttttcat ttttgaaagt aatgttttag gaagaaatat 1020
ctgattaaat ttatacttta tctttacaaa agtcaaatgc gttctgtatc aattgcggtt 1080
tgtaatatgg caagaacatg ctttcagaat ttgttcatac aatgctttct ttctattatt 1140
atgtagaaca aatacctaat actttgttca ccttttatag tggacacctc tcacagcttt 1200
ttcagtaagt gatgcaattt tgtacatttg taagatgtgt tccagaaacc ttttctcctg 1260
caattctaat gtacccactc aaactggtat caccaaagat ctccatctga ttgaaaaaaa 1320
gctgcgtgaa gtatgcttat ttatgctaac catacatgat ttatactgtt ttatagtaca 1380
atgcttattt atgctaacca tacataattt tattctgttt tctagtacat tatttgtgcc 1440
cctgaccata aatgatcctt tcttttacag tggttccgaa gatcccaggg ggcctacggt 1500
cccaggttcc taccaaatga atgggattat caatgaaaca cataatggga ggcatgcttc 1560
agtctccaag gttgttgagt tttgtacggc acttggtggc aaaacaccaa ttcacagtgt 1620
attagtggcc aacaatggaa tggcagcagc taagttcatg cggagtgtcc gaacatgggc 1680
taatgatact tttggatcag agaaggcaat tcagctgata gctatggcaa ctccggagga 1740
tctgaggata aatgcagagc acatcagaat tgccgatcaa tttgtagagg tacctggtgg 1800
aacaaacaac aacaactatg caaatgtcca actcatagtg gaggttagtt cagctcatcc 1860
ctcaacacaa cattttcgtt tctatttaag ttagggaaaa atctctacga ccctccaatt 1920
tctgaacatc caattttcac catcaactgc aatcacagat agcagagaga acaggtgttt 1980
ctgctgtttg gcctggttgg ggtcatgcat ctgagaatcc tgaacttcca gatgcgctga 2040
ctgcaaaagg aattgttttt cttgggccac cagcatcatc aatgcatgca ttaggagaca 2100
aggttggctc agctctcatt gctcaagcag ctggagttcc aacacttgct tggagtggat 2160
cacatgtgag ccttgtcttc tcttttttag cttatcatct tatcttttcg gtgatgcatt 2220
atcccaatga cactaaacca taggtggaag ttcctctgga gtgttgcttg gactcaatac 2280
ctgatgagat gtatagaaaa gcttgtgtta ctaccacaga ggaagcagtt gcaagttgtc 2340
aggtggttgg ttatcctgcc atgattaagg catcttgggg tggtggtggt aaaggaataa 2400
ggaaggtttg ttcttcttgt agttatcaag agattgtttg gattgcaagt gtttagtgcc 2460
catagttaac tctggtcttt ctaacatgag taactcaact ttcttgcagg ttcataatga 2520
tgatgaggtt aggacattat ttaagcaagt tcaaggcgaa gtacctggtt ccccaatatt 2580
tatcatgagg ctagctgctc aggtggggcc ttttatggaa gttacacctt ttcccttaat 2640
gttgagttat tccggagtta ttatggttat gttctgtatg tttgatctgt aaattattga 2700
aattcacctc cattggttct ccagattagc agacctacaa ttctacatat ggtttatact 2760
ttataaatac taggatttag ggatcttcat atagtttata catggtattt agatttcatt 2820
tgtaacccta ttgaagacat cctgattgtt gtcttatgta gagtcgacat cttgaagttc 2880
agttgctttg tgatcaatat ggcaacgtag cagcacttca cagtcgagat tgcagtgtac 2940
aacggcgaca ccaaaaggtc tgctgtctca gttaaatcac ccctctgaat gatctacttc 3000
ttgcctgctg cgttggtcag aggaataatg gttgtattct actgaacaga taatcgagga 3060
aggaccagtt actgttgctc ctcgtgagac tgtgaaagag cttgagcagg cagcacggag 3120
gcttgctaaa gctgtgggtt atgttggtgc tgctactgtt gaataccttt acagcatgga 3180
aactggtgaa tattattttc tggaacttaa tccacggcta caggtcggct cctttgacat 3240
tcttcaggaa ttaatttctg ttgaccacat gatttacatt gtcaaatggt ctcacaggtt 3300
gagcatcctg tcactgagtg gatagctgaa gtaaatttgc ctgcggctca agttgctgtt 3360
ggaatgggta tacccctttg gcagattcca ggtaatgctt cttcatttag ttcctgctct 3420
ttgttaattg aatgagctct tatacagacc atgagacaca ttctactgtt aattcatagt 3480
atcccctgac ttgttagtgt tagagataca gagatgtatc acaaattcat tgtatctcct 3540
caaggactgt aaaaatccta taattaaatt tctgaaaatt tgttctttta agcagaaaaa 3600
aaatctctaa attatctccc tgtatacaga gatcaggcgc ttctacggaa tgaaccatgg 3660
aggaggctat gacctttgga ggaaaacagc agctctagcg actccattta actttgatga 3720
agtagattct aaatggccaa aaggccactg cgtagctgtt agaataacta gcgaggatcc 3780
agatgatggg tttaagccta ctggtggaaa agtaaaggtg cggtttcctg atgttaggtg 3840
tatgaattga acacattgct atattgcagc tagtgaaatg actggatcat ggttctctta 3900
ttttcaggag ataagtttca agagtaaacc aaatgtttgg gcctatttct cagtaaaggt 3960
agtcctcaat attgttgcac tgccacatta tttgagttgt cctaacaatt gtgctgcaat 4020
tgttagtttt caactatttg ttgttctgtt tggttgactg gtaccctctc tttgcagtct 4080
ggtggaggca tccatgaatt cgctgattct cagttcggta tgtaaagtta aaagagtaat 4140
attgtctttg ctatttatgt ttgtcctcac ttttaaaaga tattgccttc cattacagga 4200
catgtttttg cgtatggaac tactagatcg gcagcaataa ctaccatggc tcttgcacta 4260
aaagaggttc aaattcgtgg agaaattcat tcaaacgtag actacacagt tgacctatta 4320
aatgtaagga ctaaatatct gcttattgaa ccttgctttt tggttcccta atgccatttt 4380
agtctggcta ctgaagaact tatccatcat gccatttctg ttatcttaaa ttcaggcctc 4440
agattttaga gaaaataaga ttcatactgg ttggctggat accaggatag ccatgcgtgt 4500
tcaagctgag aggcctccat ggtatatttc agtcgttgga ggggctttat atgtaagaca 4560
aactatgcca ctcattagca tttatgtgaa gcaaatgcgg aaaacatgat caatatgtcg 4620
tcttatttaa atttatttat ttttgtgctg cagaaaacag taactgccaa cacggccact 4680
gtttctgatt atgttggtta tcttaccaag ggccagattc caccaaaggt actattctgt 4740
tttttcagga tatgaatgct gtttgaatgt gaaaaccatt gaccataaat ccttgtttgc 4800
agcatatatc ccttgtctat acgactgttg ctttgaatat agatgggaaa aaatatacag 4860
taagtgtgac attcttaatg gggaaactta atttgttgta aataatcaat atcatattga 4920
ctcgtgtatg ctgcatcata gatcgatact gtgaggagtg gacatggtag ctacagattg 4980
cgaatgaatg gatcaacggt tgacgcaaat gtacaaatat tatgtgatgg tgggctttta 5040
atgcaggtaa tatcttcttc ctagttaaag aagatatatc ttgttcaaag aattctgatt 5100
attgatcttt taatgttttc agctggatgg aaacagccat gtaatttatg ctgaagaaga 5160
ggccagtggt acacgacttc ttattgatgg aaagacatgc atgttacagg taatgatagc 5220
cttgttcttt ttagttctag tcacggtgtt tgcttgctat ttgttgtatc tatttaatgc 5280
attcactaat tactatatta gtttgcatca tcaagttaaa atggaacttc tttcttgcag 5340
aatgaccatg acccatcaaa gttattagct gagacaccat gcaaacttct tcgtttcttg 5400
gttgctgatg gtgctcatgt tgatgctgat gtaccatatg cggaagttga ggttatgaag 5460
atgtgcatgc ccctcttatc acccgcttct ggtgtcatac atgttgtaat gtctgagggc 5520
caagcaatgc aggtacattc ctacattcca ttcattgtgc tgtgctgaca tgaacatttc 5580
aagtaaatac ctgtaacttg tttattattc taggctggtg atcttatagc taggctggat 5640
cttgatgacc cttctgctgt taagagagct gagccgttcg aagatacttt tccacaaatg 5700
ggtctcccta ttgctgcttc tggccaagtt cacaaattat gtgctgcaag tctgaatgct 5760
tgtcgaatga tccttgcggg gtatgagcat gatattgaca aggtaaacat catgtcctct 5820
tgttttttct tttgtttatc atgcattctt atgttcatca tgtcctctgg caaatctaga 5880
ttccgctgtc gtttcacaca gatttttctc attctcataa tggtgccaaa cataaatatg 5940
ctgctatatt catcaatgtt ttcactcgat ttctaatttt gcttttgagt tttaaacttt 6000
agtacaatcc atatctaatc tcctttggca acagtgaatc cattatatat atttttatta 6060
aactgctttc tttttcaggt tgtgccagag ttggtatact gcctagacac tccggagctt 6120
cctttcctgc agtgggagga gcttatgtct gttttagcaa ctagacttcc aagaaatctt 6180
aaaagtgagg tatattatgg ttgacaagat agctagtctc atgctctaag gacttgtaca 6240
tttcgccaca taggttaatt ttccatatca agttctaatg tacgatataa aagtagtact 6300
ggcctaaaac agtattggtg gttgactatc tttgttgtgt aagatcaagt atttcttttt 6360
catgcttagt ttgtcaatac ttcacattta tcactgactt gtcgagctaa atgagatttt 6420
atttgatttc tgtgctccat tatttttgta tatatatata tatatttaac tatgactata 6480
tgttatgcct caaacgtttc aaactctttc agttggaggg caaatatgag gaatacaaag 6540
taaaatttga ctctgggata atcaatgatt tccctgccaa tatgctacga gtgataattg 6600
aggtcagtta ttcaatttgt tgtgataatc actgccttaa ctgttcgttc ttttaacaag 6660
cggttttata ggaaaatctt gcatgtggtt ctgagaagga gaaggctaca aatgagaggc 6720
ttgttgagcc tcttatgagc ctactgaagt catatgaggg tgggagagaa agtcatgctc 6780
actttgttgt caagtccctt tttgaggagt atctctatgt tgaagaattg ttcagtgatg 6840
gaattcaggt taacttacct attcgcatta aacaaatcat cagttgtttt atgataaagt 6900
caaaatgttt atatttccca ttcttctgtg gatcaaatat atcacggaca tgatatagtt 6960
tccttaggct atataatggt tcttcatcaa ataatattgc aggaaacagt atagcaaact 7020
atttgtatat actcgagatg gaaattgtta gaaacatcat tgactaaatc tgtcctttgt 7080
tacgctgttt ttgtagtctg atgtgattga gcgtctgcgc cttcaacata gtaaagacct 7140
acagaaggtc gtagacattg tgttgtccca ccaggtaaat ttcttcatgg tctgatgact 7200
tcactgcgaa tggttactga actgtcttct tgttctgaca atgtgacttt tctttgtaga 7260
gtgttagaaa taaaactaag ctgatactaa aactcatgga gagtctggtc tatccaaatc 7320
ctgctgccta cagggatcaa ttgattcgct tttcttccct taatcacaaa gcgtattaca 7380
aggtgaccag gataaacata aataaacgtg aatttttcaa tgaccttttc ttctgacatc 7440
tgaatctgat gaatttcttg catattaata cagttggcac ttaaagctag tgaacttctt 7500
gaacaaacaa aacttagtga gctccgtgca agaatagcaa ggagcctttc agagctggag 7560
atgtttactg aggaaagcaa gggtctctcc atgcataagc gagaaattgc cattaaggag 7620
agcatggaag atttagtcac tgctccactg ccagttgaag atgcgctcat ttctttattt 7680
gattgtagtg atacaactgt tcaacagaga gtgattgaga cttatatagc tcgattatac 7740
caggtatgag aagaaagacc ttttgaaatt atttatatta acatatccta gtaaaacagc 7800
atgctcatca tttcttaaaa aaagtttaca gcacctgatg tttggttact gaccgcatca 7860
ttaaaataaa gttacttgtt gtggagagat gtattttgga acttgtggca catgcagtaa 7920
catgctactg ctcgatatgt ttgctaactt gacaacaata tttttcagcc tcatcttgta 7980
aaggacagta tcaaaatgaa atggatagaa tcgggtgtta ttgctttatg ggaatttcct 8040
gaagggcatt ttgatgcaag aaatggagga gcggttcttg gtgacaaaag atggggtgcc 8100
atggtcattg tcaagtctct tgaatcactt tcaatggcca ttagatttgc actaaaggag 8160
acatcacact acactagctc tgagggcaat atgatgcata ttgctttgtt gggtgctgat 8220
aataagatgc atataattca agaaaggtat gttcatatgc tatgttggtg ctgaaatagt 8280
tatatatgta gttagctggt ggagttctgg taattaacct atcccattgt tcagtggtga 8340
tgatgctgac agaatagcca aacttccctt gatactaaag gataatgtaa ccgatctgca 8400
tgcctctggt gtgaaaacaa taagtttcat tgttcaaaga gatgaagcac ggatgacaat 8460
gcgtcgtacc ttcctttggt ctgatgaaaa gctttcttat gaggaagagc caattctccg 8520
gcatgtggaa cctcctcttt ctgcacttct tgagttggta cgtgatatca tcaaaatgat 8580
aatgttttgg tatggcattg attatcttct atgctctttg tatttattca gcctattgtg 8640
gatacaggac aagttgaaag tgaaaggata caatgaaatg aagtataccc catcacggga 8700
tcgtcaatgg catatctaca cacttagaaa tactgaaaac cccaaaatgt tgcaccgggt 8760
atttttccga acccttgtca ggcaacccag tgtatccaac aagttttctt cgggccagat 8820
tggtgacatg gaagttggga gtgctgaaga acctctgtca tttacatcaa ccagcatatt 8880
aagatctttg atgactgcta tagaggaatt ggagcttcac gcaattagaa ctggccattc 8940
acacatgtat ttgcatgtat tgaaagaaca aaagcttctt gatcttgttc cagtttcagg 9000
gtaagtgcgc atatttcttt ttgggaacat atgcttgctt atgaggttgg tcttctcaat 9060
gatcttctta tcttactcag gaatacagtt ttggatgttg gtcaagatga agctactgca 9120
tattcacttt taaaagaaat ggctatgaag atacatgaac ttgttggtgc aagaatgcac 9180
catctttctg tatgccaatg ggaagtgaaa cttaagttgg actgcgatgg tcctgccagt 9240
ggtacctgga ggattgtaac aaccaatgtt actagtcaca cttgcactgt ggatgtaagt 9300
ttaatcctct agcattttgt tttctttgga aaagcatgtg attttaagcc ggctggtcct 9360
catacccaga cctagtgatc tttatatagt gtagacattt ttctaactgc ttttaattgt 9420
tttagatcta ccgtgagatg gaagataaag aatcacggaa gttagtatac catcccgcca 9480
ctccggcggc tggtcctctg catggtgtgg cactgaataa tccatatcag cctttgagtg 9540
tcattgatct caaacgctgt tctgctagga ataatagaac tacatactgc tatgattttc 9600
cactggtgag ttgactgctc ccttatattc aatgcattac catagcaaat tcatattcgt 9660
tcatgttgtc aaaataagcc gatgaaaatt caaaactgta ggcatttgaa actgcagtga 9720
ggaagtcatg gtcctctagt acctctggtg cttctaaagg tgttgaaaat gcccaatgtt 9780
atgttaaagc tacagagttg gtatttgcgg acaaacatgg gtcatggggc actcctttag 9840
ttcaaatgga ccggcctgct gggctcaatg acattggtat ggtagcttgg accttgaaga 9900
tgtccactcc tgaatttcct agtggtaggg agattattgt tgttgcaaat gatattacgt 9960
tcagagctgg cctgtgagaa tagcagatga gtgggtttca tagcacataa gcaaggaaga attctagggc taggagctta ttcttacagg tgcagttggg atgaccttga gtggaccact ctgagaactc ggttaggtgg cagtggttac ctcagaccat ctgttcctcg tgctggactt ctggtggaca accttaggac gaggggcttg agaggactgc cagaggaact aactcgaagt aagctcgaac tgcatgatac aagaatcacg caaaagaaat tcaagaaatg cttggatgga tatcccaatc gtctttccat atcatttggc gaaacttcct agtgaaatct gtacatttat gatgcagcta tggacttggt atataaggag tcttgctcga ctattctgca tggtcccaaa aggcgtttct tccagtaaca gtgtgatcct tatgtttgat tggcagagca gatgcaaact tgctggacaa caaccgtgaa aagagatctt atacaatcag ggttgtggtt aaaaggcaat ccaggattgc agcaaataaa aaaacagttg atccctcaga atctttcttc tagagctgta gtattcagct taaccctgaa cctctcaagt gttactagat ccaagggaag cttatttatt tgcttccgtg ctaagcgaag gacagtggtg gtggagaata acatttacac cttggcatcc ctgaacaagc atcatggcaa aatatattga acaccgttgg cgagcggcta aaagacagct aagcttggtg atccctgctg gtgtggtttc ggattacctc tttgaaggaa cctgcctttg gatagcaaga gttctggaac atgagtcggc aatggaagtg atgcctctat atggctgcga tataagagat gcaggtgagc tcacatgcag aactacaagg ctttcagatt aaggtaatta atgcattttt tggcagcaaa ttgggtggtc aagactatgc aaattaggtg tacatggaag ttacatttgt ggtgcataca ttcttgggcg ctaatggtgt ggtggctcag acccaccgga tccgtggtgt ttgtggaaac gaattccagt accctggtca cagattctgc tgttcatcct ttcttcaggc tctacattcc taaacccaga cgcaagggtt ttgacccaac ctgacacaaa atactcagat aaggtgtgat tacggaggag agttttccca ctgaatggga attatattca ccagctcaga gcttactgat tgaagctgtt ttctggtgct tgatgatggc tcgtattggc ggttattgat tgctgctatt gactggaaga gcgtcttgac ggaagtgtac tgtccatctt ttatgttcct cagacctgtt tgatgacagc atttgaaggt gggtgtgata gcttgattcc aaccaagact cgctaactgg tggctcgact catggctgca ccgcattgag aattgagatc attaattgat atcgcttcaa tgcgatacgg taagaaagtt gatctctgag ccaaccagca tgatgacgat atatcttaag tttgcaagcc gcttatataa accaacctag cgaattggca agccctgaac acttctgtca tctgttgtgg gccagtgctt actgttggaa cagcctatta agctcccaca actgtttcag gcctacattg gcatacattc caagggaaat tgggctaaga gctgtggaga cgtgagcaat gcgcaggcat agaggcttct attgttgaga gagctacgag tgctatgctg aagttcaggt ctgaaagcaa gaaaatatag tttgctgaat gtggactggg gatgttcttg atcgagctga gcttttgttg gctcaaagag ctgccacagg attctttttc
10020 10080 10140 10200 10260 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880
attacatatg
gctggagaac
tatctaatca
aataatgatt
ataattccaa
tcgttctttt
11940
tatgccatta
tgatcttctg
aaatttcctt
ctttggacac
ttattcagat
ggatccctct
12000
agaagagctc
aacttgttga
agaaatcagg
aaggtccttg
gttgaatcat
atgatgccaa
12060
aactattatt
ggaggcacaa
atagcttgtg
gaccctgtcg
gattgttggt
gagtgtatat
12120
tggatttgtt
agttctgcca
gatgaaagtg
caagtctgat
gattcatgat
accgtcagtt
12180
ggcaagaaca
ccggttaacc
tgagtgcttg
tttacaaatg
gtcctttatg
acaatcgttg
12240
tttcgcgcta
gttccgtgat
ctactatcat
ctgttagacg
ctgtaattag
tgagtctccg
12300
cggatccaca
gtatacggtt
gagctgttga
ttcaattttg
gacacgaata
atatgatttt
12360
gtaggcataa
atgcgtctgt
atgtgaaata
aattgtctgt
tgagttaaca
cacaagatga
12420
caatatgttt
gtgctctact
gctattgtcc
atgaatactg
attgcggaat
caaccacatg
12480
cattat
12486
<210> 251
<211> 2314
<212> Белок
<213> Oryza sativa
<400> 251
Met Thr Ser Thr His Val Ala Thr Leu Gly Val Gly Ala Gln Ala Pro
1 5 10 15
Pro Arg His Gln Lys Lys Ser Ala Gly Thr Ala Phe Val Ser Ser Gly
20 25 30
Ser Ser Arg Pro Ser Tyr Arg Lys Asn Gly Gln Arg Thr Arg Ser Leu
35 40 45
Arg Glu Glu Ser Asn Gly Gly Val Ser Asp Ser Lys Lys Leu Asn His
50 55 60
Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro Asn Asp Ala
65 70 75 80
Ala Ser Glu Val Asp Ile Ser His Gly Ser Glu Asp Pro Arg Gly Pro
85 90 95
Thr Val Pro Gly Ser Tyr Gln Met Asn Gly Ile Ile Asn Glu Thr His
100 105 110
Asn Gly Arg His Ala Ser Val Ser Lys Val Val Glu Phe Cys Thr Ala
115 120 125
Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly
130 135 140
Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro
165 170 175
Glu Asp Leu Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe
180 185 190
Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln
195 200 205
Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro
210 215 220
Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr
225 230 235 240
Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met His Ala
245 250 255
Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val
260 265 270
Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Val Pro Leu Glu Cys
275 280 285
Cys Leu Asp Ser Ile Pro Asp Glu Met Tyr Arg Lys Ala Cys Val Thr
290 295 300
Thr Thr Glu Glu Ala Val Ala Ser Cys Gln Val Val Gly Tyr Pro Ala
305 310 315 320
Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val
325 330 335
His Asn Asp Asp Glu Val Arg Thr Leu Phe Lys Gln Val Gln Gly Glu
340 345 350
Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ala Gln Ser Arg
355 360 365
His Leu Glu Val Gln Leu Leu Cys Asp Gln Tyr Gly Asn Val Ala Ala
370 375 380
Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile
385 390 395 400
Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala
420 425 430
Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe
435 440 445
Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Trp
450 455 460
Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly
465 470 475 480
Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asn
485 490 495
His Gly Gly Gly Tyr Asp Leu Trp Arg Lys Thr Ala Ala Leu Ala Thr
500 505 510
Pro Phe Asn Phe Asp Glu Val Asp Ser Lys Trp Pro Lys Gly His Cys
515 520 525
Val Ala Val Arg Ile Thr Ser Glu Asp Pro Asp Asp Gly Phe Lys Pro
530 535 540
Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val
545 550 555 560
Trp Ala Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala
565 570 575
Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Thr Thr Arg Ser Ala
580 585 590
Ala Ile Thr Thr Met Ala Leu Ala Leu Lys Glu Val Gln Ile Arg Gly
595 600 605
Glu Ile His Ser Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Ser
610 615 620
Asp Phe Arg Glu Asn Lys Ile His Thr Gly Trp Leu Asp Thr Arg Ile
625 630 635 640
Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val
645 650 655
Asp Tyr Val Gly Tyr Leu Thr Lys Gly Gln Ile Pro Pro Lys His Ile
675 680 685
Ser Leu Val Tyr Thr Thr Val Ala Leu Asn Ile Asp Gly Lys Lys Tyr
690 695 700
Thr Ile Asp Thr Val Arg Ser Gly His Gly Ser Tyr Arg Leu Arg Met
705 710 715 720
Asn Gly Ser Thr Val Asp Ala Asn Val Gln Ile Leu Cys Asp Gly Gly
725 730 735
Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu
740 745 750
Glu Ala Ser Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Met Leu
755 760 765
Gln Asn Asp His Asp Pro Ser Lys Leu Leu Ala Glu Thr Pro Cys Lys
770 775 780
Leu Leu Arg Phe Leu Val Ala Asp Gly Ala His Val Asp Ala Asp Val
785 790 795 800
Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser
805 810 815
Pro Ala Ser Gly Val Ile His Val Val Met Ser Glu Gly Gln Ala Met
820 825 830
Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala
835 840 845
Val Lys Arg Ala Glu Pro Phe Glu Asp Thr Phe Pro Gln Met Gly Leu
850 855 860
Pro Ile Ala Ala Ser Gly Gln Val His Lys Leu Cys Ala Ala Ser Leu
865 870 875 880
Asn Ala Cys Arg Met Ile Leu Ala Gly Tyr Glu His Asp Ile Asp Lys
885 890 895
Val Val Pro Glu Leu Val Tyr Cys Leu Asp Thr Pro Glu Leu Pro Phe
900 905 910
Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg
915 920 925
Asn Leu Lys Ser Glu Leu Glu Gly Lys Tyr Glu Glu Tyr Lys Val Lys
930 935 940
Phe Asp Ser Gly Ile Ile Asn Asp Phe Pro Ala Asn Met Leu Arg Val
945 950 955 960
Ile Ile Glu Glu Asn Leu Ala Cys Gly Ser Glu Lys Glu Lys Ala Thr
965 970 975
Asn Glu Arg Leu Val Glu Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu
980 985 990
Gly Gly Arg Glu Ser His Ala His Phe Val Val Lys Ser Leu Phe Glu
995 1000 1005
Glu Tyr Leu Tyr Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser
1010 1015 1020
Asp Val Ile Glu Arg Leu Arg Leu Gln His Ser Lys Asp Leu Gln
1025 1030 1035
Lys Val Val Asp Ile Val Leu Ser His Gln Ser Val Arg Asn Lys
1040 1045 1050
Thr Lys Leu Ile Leu Lys Leu Met Glu Ser Leu Val Tyr Pro Asn
1055 1060 1065
Pro Ala Ala Tyr Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn
1070 1075 1080
His Lys Ala Tyr Tyr Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu
1085 1090 1095
Glu Gln Thr Lys Leu Ser Glu Leu Arg Ala Arg Ile Ala Arg Ser
1100 1105 1110
Leu Ser Glu Leu Glu Met Phe Thr Glu Glu Ser Lys Gly Leu Ser
1115 1120 1125
Met His Lys Arg Glu Ile Ala Ile Lys Glu Ser Met Glu Asp Leu
1130 1135 1140
Asp Cys Ser Asp Thr Thr Val Gln Gln Arg Val Ile Glu Thr Tyr
1160 1165 1170
Ile Ala Arg Leu Tyr Gln Pro His Leu Val Lys Asp Ser Ile Lys
1175 1180 1185
Met Lys Trp Ile Glu Ser Gly Val Ile Ala Leu Trp Glu Phe Pro
1190 1195 1200
Glu Gly His Phe Asp Ala Arg Asn Gly Gly Ala Val Leu Gly Asp
1205 1210 1215
Lys Arg Trp Gly Ala Met Val Ile Val Lys Ser Leu Glu Ser Leu
1220 1225 1230
Ser Met Ala Ile Arg Phe Ala Leu Lys Glu Thr Ser His Tyr Thr
1235 1240 1245
Ser Ser Glu Gly Asn Met Met His Ile Ala Leu Leu Gly Ala Asp
1250 1255 1260
Asn Lys Met His Ile Ile Gln Glu Ser Gly Asp Asp Ala Asp Arg
1265 1270 1275
Ile Ala Lys Leu Pro Leu Ile Leu Lys Asp Asn Val Thr Asp Leu
1280 1285 1290
His Ala Ser Gly Val Lys Thr Ile Ser Phe Ile Val Gln Arg Asp
1295 1300 1305
Glu Ala Arg Met Thr Met Arg Arg Thr Phe Leu Trp Ser Asp Glu
1310 1315 1320
Lys Leu Ser Tyr Glu Glu Glu Pro Ile Leu Arg His Val Glu Pro
1325 1330 1335
Pro Leu Ser Ala Leu Leu Glu Leu Asp Lys Leu Lys Val Lys Gly
1340 1345 1350
Tyr Asn Glu Met Lys Tyr Thr Pro Ser Arg Asp Arg Gln Trp His
1355 1360 1365
Ile Tyr Thr Leu Arg Asn Thr Glu Asn Pro Lys Met Leu His Arg
1370 1375 1380
Val Phe Phe Arg Thr Leu Val Arg Gln Pro Ser Val Ser Asn Lys
1385 1390 1395
Phe Ser Ser Gly Gln Ile Gly Asp Met Glu Val Gly Ser Ala Glu
1400 1405 1410
Glu Pro Leu Ser Phe Thr Ser Thr Ser Ile Leu Arg Ser Leu Met
1415 1420 1425
Thr Ala Ile Glu Glu Leu Glu Leu His Ala Ile Arg Thr Gly His
1430 1435 1440
Ser His Met Tyr Leu His Val Leu Lys Glu Gln Lys Leu Leu Asp
1445 1450 1455
Leu Val Pro Val Ser Gly Asn Thr Val Leu Asp Val Gly Gln Asp
1460 1465 1470
Glu Ala Thr Ala Tyr Ser Leu Leu Lys Glu Met Ala Met Lys Ile
1475 1480 1485
His Glu Leu Val Gly Ala Arg Met His His Leu Ser Val Cys Gln
1490 1495 1500
Trp Glu Val Lys Leu Lys Leu Asp Cys Asp Gly Pro Ala Ser Gly
1505 1510 1515
Thr Trp Arg Ile Val Thr Thr Asn Val Thr Ser His Thr Cys Thr
1520 1525 1530
Val Asp Ile Tyr Arg Glu Met Glu Asp Lys Glu Ser Arg Lys Leu
1535 1540 1545
Val Tyr His Pro Ala Thr Pro Ala Ala Gly Pro Leu His Gly Val
1550 1555 1560
Ala Leu Asn Asn Pro Tyr Gln Pro Leu Ser Val Ile Asp Leu Lys
1565 1570 1575
Arg Cys Ser Ala Arg Asn Asn Arg Thr Thr Tyr Cys Tyr Asp Phe
1580 1585 1590
Pro Leu Ala Phe Glu Thr Ala Val Arg Lys Ser Trp Ser Ser Ser
1595 1600 1605
Thr Ser Gly Ala Ser Lys Gly Val Glu Asn Ala Gln Cys Tyr Val
1610 1615 1620
Lys Ala Thr Glu Leu Val Gln Met Asp Arg Leu Ala Gly Leu Asn
1625 1630 1635
Asp Ile Gly Met Val Ala Trp Thr Leu Lys Met Ser Thr Pro Glu
1640 1645 1650
Phe Leu Ser Gly Arg Glu Ile Ile Val Val Ala Asn Asp Ile Thr
1655 1660 1665
Phe Arg Ala Gly Ser Phe Gly Pro Arg Glu Asp Ala Phe Phe Glu
1670 1675 1680
Ala Val Thr Asn Leu Ala Cys Glu Lys Lys Leu Pro Leu Ile Tyr
1685 1690 1695
Leu Ala Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala Asp Glu Val
1700 1705 1710
Lys Ser Cys Phe Arg Val Gly Trp Ser Asp Asp Gly Ser Pro Glu
1715 1720 1725
Arg Gly Phe Gln Tyr Ile Tyr Leu Ser Glu Glu Asp Tyr Ala Arg
1730 1735 1740
Ile Gly Thr Ser Val Ile Ala His Lys Met Gln Leu Asp Ser Gly
1745 1750 1755
Glu Ile Arg Trp Val Ile Asp Ser Val Val Gly Lys Glu Asp Gly
1760 1765 1770
Leu Gly Val Glu Asn Ile His Gly Ser Ala Ala Ile Ala Ser Ala
1775 1780 1785
Tyr Ser Arg Ala Tyr Lys Glu Thr Phe Thr Leu Thr Phe Val Thr
1790 1795 1800
Gly Arg Thr Val Gly Ile Gly Ala Tyr Leu Ala Arg Leu Gly Ile
1805 1810 1815
Arg Cys Ile Gln Arg Leu Asp Gln Pro Ile Ile Leu Thr Gly Tyr
1820 1825 1830
Ser Ala Leu Asn Lys Leu Leu Gly Arg Glu Val Tyr Ser Ser His
1835 1840 1845
Met Gln Leu Gly Gly Pro Lys Ile Met Ala Thr Asn Gly Val Val
1850 1855 1860
Arg Trp Leu Ser Tyr Val Pro Ala Tyr Ile Gly Gly Pro Leu Pro
1880 1885 1890
Val Thr Thr Pro Leu Asp Pro Pro Asp Arg Pro Val Ala Tyr Ile
1895 1900 1905
Pro Glu Asn Ser Cys Asp Pro Arg Ala Ala Ile Arg Gly Val Asp
1910 1915 1920
Asp Ser Gln Gly Lys Trp Leu Gly Gly Met Phe Asp Lys Asp Ser
1925 1930 1935
Phe Val Glu Thr Phe Glu Gly Trp Ala Lys Thr Val Val Thr Gly
1940 1945 1950
Arg Ala Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala Val Glu
1955 1960 1965
Thr Gln Thr Met Met Gln Thr Ile Pro Ala Asp Pro Gly Gln Leu
1970 1975 1980
Asp Ser Arg Glu Gln Ser Val Pro Arg Ala Gly Gln Val Trp Phe
1985 1990 1995
Pro Asp Ser Ala Thr Lys Thr Ala Gln Ala Leu Leu Asp Phe Asn
2000 2005 2010
Arg Glu Gly Leu Pro Leu Phe Ile Leu Ala Asn Trp Arg Gly Phe
2015 2020 2025
Ser Gly Gly Gln Arg Asp Leu Phe Glu Gly Ile Leu Gln Ala Gly
2030 2035 2040
Ser Thr Ile Val Glu Asn Leu Arg Thr Tyr Asn Gln Pro Ala Phe
2045 2050 2055
Val Tyr Ile Pro Met Ala Ala Glu Leu Arg Gly Gly Ala Trp Val
2060 2065 2070
Val Val Asp Ser Lys Ile Asn Pro Asp Arg Ile Glu Cys Tyr Ala
2075 2080 2085
Glu Arg Thr Ala Lys Gly Asn Val Leu Glu Pro Gln Gly Leu Ile
2090 2095 2100
Glu Ile Lys Phe Arg Ser Glu Glu Leu Gln Asp Cys Met Ser Arg
2105 2110 2115
Asn Lys Asn Gly Ser Ala Asp Thr Lys Ser Leu Gln Glu Asn Ile
2135 2140 2145
Glu Ala Arg Thr Lys Gln Leu Met Pro Leu Tyr Thr Gln Ile Ala
2150 2155 2160
Ile Arg Phe Ala Glu Leu His Asp Thr Ser Leu Arg Met Ala Ala
2165 2170 2175
Lys Gly Val Ile Lys Lys Val Val Asp Trp Glu Glu Ser Arg Ser
2180 2185 2190
Phe Phe Tyr Lys Arg Leu Arg Arg Arg Ile Ser Glu Asp Val Leu
2195 2200 2205
Ala Lys Glu Ile Arg Ala Val Ala Gly Glu Gln Phe Ser His Gln
2210 2215 2220
Pro Ala Ile Glu Leu Ile Lys Lys Trp Tyr Ser Ala Ser His Ala
2225 2230 2235
Ala Glu Trp Asp Asp Asp Asp Ala Phe Val Ala Trp Met Asp Asn
2240 2245 2250
Pro Glu Asn Tyr Lys Asp Tyr Ile Gln Tyr Leu Lys Ala Gln Arg
2255 2260 2265
Val Ser Gln Ser Leu Ser Ser Leu Ser Asp Ser Ser Ser Asp Leu
2270 2275 2280
Gln Ala Leu Pro Gln Gly Leu Ser Met Leu Leu Asp Lys Met Asp
2285 2290 2295
Pro Ser Arg Arg Ala Gln Leu Val Glu Glu Ile Arg Lys Val Leu
2300 2305 2310
Gly
<210> 252 <211> 2327
<212> Белок <213> Oryza sativa
Pro Arg His Gln Lys Lys Ser Ala Gly Thr Ala Phe Val Ser Ser Gly
20 25 30
Ser Ser Arg Pro Ser Tyr Arg Lys Asn Gly Gln Arg Thr Arg Ser Leu
35 40 45
Arg Glu Glu Ser Asn Gly Gly Val Ser Asp Ser Lys Lys Leu Asn His
50 55 60
Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro Asn Asp Ala
65 70 75 80
Ala Ser Glu Val Asp Ile Ser His Gly Ser Glu Asp Pro Arg Gly Pro
85 90 95
Thr Val Pro Gly Ser Tyr Gln Met Asn Gly Ile Ile Asn Glu Thr His
100 105 110
Asn Gly Arg His Ala Ser Val Ser Lys Val Val Glu Phe Cys Thr Ala
115 120 125
Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly
130 135 140
Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp
145 150 155 160
Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro
165 170 175
Glu Asp Leu Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe
180 185 190
Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln
195 200 205
Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro
210 215 220
Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr
225 230 235 240
Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met His Ala
245 250 255
Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Val Pro Leu Glu Cys
275 280 285
Cys Leu Asp Ser Ile Pro Asp Glu Met Tyr Arg Lys Ala Cys Val Thr
290 295 300
Thr Thr Glu Glu Ala Val Ala Ser Cys Gln Val Val Gly Tyr Pro Ala
305 310 315 320
Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val
325 330 335
His Asn Asp Asp Glu Val Arg Thr Leu Phe Lys Gln Val Gln Gly Glu
340 345 350
Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ala Gln Ser Arg
355 360 365
His Leu Glu Val Gln Leu Leu Cys Asp Gln Tyr Gly Asn Val Ala Ala
370 375 380
Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile
385 390 395 400
Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu
405 410 415
Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala
420 425 430
Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe
435 440 445
Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Trp
450 455 460
Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly
465 470 475 480
Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asn
485 490 495
His Gly Gly Gly Tyr Asp Leu Trp Arg Lys Thr Ala Ala Leu Ala Thr
500 505 510
Val Ala Val Arg Ile Thr Ser Glu Asp Pro Asp Asp Gly Phe Lys Pro
530 535 540
Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val
545 550 555 560
Trp Ala Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala
565 570 575
Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Thr Thr Arg Ser Ala
580 585 590
Ala Ile Thr Thr Met Ala Leu Ala Leu Lys Glu Val Gln Ile Arg Gly
595 600 605
Glu Ile His Ser Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Ser
610 615 620
Asp Phe Arg Glu Asn Lys Ile His Thr Gly Trp Leu Asp Thr Arg Ile
625 630 635 640
Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val
645 650 655
Gly Gly Ala Leu Tyr Lys Thr Val Thr Ala Asn Thr Ala Thr Val Ser
660 665 670
Asp Tyr Val Gly Tyr Leu Thr Lys Gly Gln Ile Pro Pro Lys His Ile
675 680 685
Ser Leu Val Tyr Thr Thr Val Ala Leu Asn Ile Asp Gly Lys Lys Tyr
690 695 700
Thr Ile Asp Thr Val Arg Ser Gly His Gly Ser Tyr Arg Leu Arg Met
705 710 715 720
Asn Gly Ser Thr Val Asp Ala Asn Val Gln Ile Leu Cys Asp Gly Gly
725 730 735
Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu
740 745 750
Glu Ala Ser Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Met Leu
755 760 765
Leu Leu Arg Phe Leu Val Ala Asp Gly Ala His Val Asp Ala Asp Val
785 790 795 800
Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser
805 810 815
Pro Ala Ser Gly Val Ile His Val Val Met Ser Glu Gly Gln Ala Met
820 825 830
Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala
835 840 845
Val Lys Arg Ala Glu Pro Phe Glu Asp Thr Phe Pro Gln Met Gly Leu
850 855 860
Pro Ile Ala Ala Ser Gly Gln Val His Lys Leu Cys Ala Ala Ser Leu
865 870 875 880
Asn Ala Cys Arg Met Ile Leu Ala Gly Tyr Glu His Asp Ile Asp Lys
885 890 895
Val Val Pro Glu Leu Val Tyr Cys Leu Asp Thr Pro Glu Leu Pro Phe
900 905 910
Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg
915 920 925
Asn Leu Lys Ser Glu Leu Glu Gly Lys Tyr Glu Glu Tyr Lys Val Lys
930 935 940
Phe Asp Ser Gly Ile Ile Asn Asp Phe Pro Ala Asn Met Leu Arg Val
945 950 955 960
Ile Ile Glu Glu Asn Leu Ala Cys Gly Ser Glu Lys Glu Lys Ala Thr
965 970 975
Asn Glu Arg Leu Val Glu Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu
980 985 990
Gly Gly Arg Glu Ser His Ala His Phe Val Val Lys Ser Leu Phe Glu
995 1000 1005
Glu Tyr Leu Tyr Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser
1010 1015 1020
Asp Val Ile Glu Arg Leu Arg Leu Gln His Ser Lys Asp Leu Gln
1025 1030 1035
Lys Val Val Asp Ile Val Leu Ser His Gln Ser Val Arg Asn Lys
1040 1045 1050
Thr Lys Leu Ile Leu Lys Leu Met Glu Ser Leu Val Tyr Pro Asn
1055 1060 1065
Pro Ala Ala Tyr Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn
1070 1075 1080
His Lys Ala Tyr Tyr Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu
1085 1090 1095
Glu Gln Thr Lys Leu Ser Glu Leu Arg Ala Arg Ile Ala Arg Ser
1100 1105 1110
Leu Ser Glu Leu Glu Met Phe Thr Glu Glu Ser Lys Gly Leu Ser
1115 1120 1125
Met His Lys Arg Glu Ile Ala Ile Lys Glu Ser Met Glu Asp Leu
1130 1135 1140
Val Thr Ala Pro Leu Pro Val Glu Asp Ala Leu Ile Ser Leu Phe
1145 1150 1155
Asp Cys Ser Asp Thr Thr Val Gln Gln Arg Val Ile Glu Thr Tyr
1160 1165 1170
Ile Ala Arg Leu Tyr Gln Pro His Leu Val Lys Asp Ser Ile Lys
1175 1180 1185
Met Lys Trp Ile Glu Ser Gly Val Ile Ala Leu Trp Glu Phe Pro
1190 1195 1200
Glu Gly His Phe Asp Ala Arg Asn Gly Gly Ala Val Leu Gly Asp
1205 1210 1215
Lys Arg Trp Gly Ala Met Val Ile Val Lys Ser Leu Glu Ser Leu
1220 1225 1230
Ser Met Ala Ile Arg Phe Ala Leu Lys Glu Thr Ser His Tyr Thr
1235 1240 1245
Ser Ser Glu Gly Asn Met Met His Ile Ala Leu Leu Gly Ala Asp
1250 1255 1260
Asn Lys Met His Ile Ile Gln Glu Ser Gly Asp Asp Ala Asp Arg
1265 1270 1275
Ile Ala Lys Leu Pro Leu Ile Leu Lys Asp Asn Val Thr Asp Leu
1280 1285 1290
His Ala Ser Gly Val Lys Thr Ile Ser Phe Ile Val Gln Arg Asp
1295 1300 1305
Glu Ala Arg Met Thr Met Arg Arg Thr Phe Leu Trp Ser Asp Glu
1310 1315 1320
Lys Leu Ser Tyr Glu Glu Glu Pro Ile Leu Arg His Val Glu Pro
1325 1330 1335
Pro Leu Ser Ala Leu Leu Glu Leu Asp Lys Leu Lys Val Lys Gly
1340 1345 1350
Tyr Asn Glu Met Lys Tyr Thr Pro Ser Arg Asp Arg Gln Trp His
1355 1360 1365
Ile Tyr Thr Leu Arg Asn Thr Glu Asn Pro Lys Met Leu His Arg
1370 1375 1380
Val Phe Phe Arg Thr Leu Val Arg Gln Pro Ser Val Ser Asn Lys
1385 1390 1395
Phe Ser Ser Gly Gln Ile Gly Asp Met Glu Val Gly Ser Ala Glu
1400 1405 1410
Glu Pro Leu Ser Phe Thr Ser Thr Ser Ile Leu Arg Ser Leu Met
1415 1420 1425
Thr Ala Ile Glu Glu Leu Glu Leu His Ala Ile Arg Thr Gly His
1430 1435 1440
Ser His Met Tyr Leu His Val Leu Lys Glu Gln Lys Leu Leu Asp
1445 1450 1455
Leu Val Pro Val Ser Gly Asn Thr Val Leu Asp Val Gly Gln Asp
1460 1465 1470
Glu Ala Thr Ala Tyr Ser Leu Leu Lys Glu Met Ala Met Lys Ile
1475 1480 1485
His Glu Leu Val Gly Ala Arg Met His His Leu Ser Val Cys Gln
1490 1495 1500
Thr Trp Arg Ile Val Thr Thr Asn Val Thr Ser His Thr Cys Thr
1520 1525 1530
Val Asp Ile Tyr Arg Glu Met Glu Asp Lys Glu Ser Arg Lys Leu
1535 1540 1545
Val Tyr His Pro Ala Thr Pro Ala Ala Gly Pro Leu His Gly Val
1550 1555 1560
Ala Leu Asn Asn Pro Tyr Gln Pro Leu Ser Val Ile Asp Leu Lys
1565 1570 1575
Arg Cys Ser Ala Arg Asn Asn Arg Thr Thr Tyr Cys Tyr Asp Phe
1580 1585 1590
Pro Leu Ala Phe Glu Thr Ala Val Arg Lys Ser Trp Ser Ser Ser
1595 1600 1605
Thr Ser Gly Ala Ser Lys Gly Val Glu Asn Ala Gln Cys Tyr Val
1610 1615 1620
Lys Ala Thr Glu Leu Val Phe Ala Asp Lys His Gly Ser Trp Gly
1625 1630 1635
Thr Pro Leu Val Gln Met Asp Arg Pro Ala Gly Leu Asn Asp Ile
1640 1645 1650
Gly Met Val Ala Trp Thr Leu Lys Met Ser Thr Pro Glu Phe Pro
1655 1660 1665
Ser Gly Arg Glu Ile Ile Val Val Ala Asn Asp Ile Thr Phe Arg
1670 1675 1680
Ala Gly Ser Phe Gly Pro Arg Glu Asp Ala Phe Phe Glu Ala Val
1685 1690 1695
Thr Asn Leu Ala Cys Glu Lys Lys Leu Pro Leu Ile Tyr Leu Ala
1700 1705 1710
Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala Asp Glu Val Lys Ser
1715 1720 1725
Cys Phe Arg Val Gly Trp Ser Asp Asp Gly Ser Pro Glu Arg Gly
1730 1735 1740
Phe Gln Tyr Ile Tyr Leu Ser Glu Glu Asp Tyr Ala Arg Ile Gly
1745 1750 1755
Thr Ser Val Ile Ala His Lys Met Gln Leu Asp Ser Gly Glu Ile
1760 1765 1770
Arg Trp Val Ile Asp Ser Val Val Gly Lys Glu Asp Gly Leu Gly
1775 1780 1785
Val Glu Asn Ile His Gly Ser Ala Ala Ile Ala Ser Ala Tyr Ser
1790 1795 1800
Arg Ala Tyr Lys Glu Thr Phe Thr Leu Thr Phe Val Thr Gly Arg
1805 1810 1815
Thr Val Gly Ile Gly Ala Tyr Leu Ala Arg Leu Gly Ile Arg Cys
1820 1825 1830
Ile Gln Arg Leu Asp Gln Pro Ile Ile Leu Thr Gly Tyr Ser Ala
1835 1840 1845
Leu Asn Lys Leu Leu Gly Arg Glu Val Tyr Ser Ser His Met Gln
1850 1855 1860
Leu Gly Gly Pro Lys Ile Met Ala Thr Asn Gly Val Val His Leu
1865 1870 1875
Thr Val Ser Asp Asp Leu Glu Gly Val Ser Asn Ile Leu Arg Trp
1880 1885 1890
Leu Ser Tyr Val Pro Ala Tyr Ile Gly Gly Pro Leu Pro Val Thr
1895 1900 1905
Thr Pro Leu Asp Pro Pro Asp Arg Pro Val Ala Tyr Ile Pro Glu
1910 1915 1920
Asn Ser Cys Asp Pro Arg Ala Ala Ile Arg Gly Val Asp Asp Ser
1925 1930 1935
Gln Gly Lys Trp Leu Gly Gly Met Phe Asp Lys Asp Ser Phe Val
1940 1945 1950
Glu Thr Phe Glu Gly Trp Ala Lys Thr Val Val Thr Gly Arg Ala
1955 1960 1965
Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala Val Glu Thr Gln
1970 1975 1980
Arg Glu Gln Ser Val Pro Arg Ala Gly Gln Val Trp Phe Pro Asp
2000 2005 2010
Ser Ala Thr Lys Thr Ala Gln Ala Leu Leu Asp Phe Asn Arg Glu
2015 2020 2025
Gly Leu Pro Leu Phe Ile Leu Ala Asn Trp Arg Gly Phe Ser Gly
2030 2035 2040
Gly Gln Arg Asp Leu Phe Glu Gly Ile Leu Gln Ala Gly Ser Thr
2045 2050 2055
Ile Val Glu Asn Leu Arg Thr Tyr Asn Gln Pro Ala Phe Val Tyr
2060 2065 2070
Ile Pro Met Ala Ala Glu Leu Arg Gly Gly Ala Trp Val Val Val
2075 2080 2085
Asp Ser Lys Ile Asn Pro Asp Arg Ile Glu Cys Tyr Ala Glu Arg
2090 2095 2100
Thr Ala Lys Gly Asn Val Leu Glu Pro Gln Gly Leu Ile Glu Ile
2105 2110 2115
Lys Phe Arg Ser Glu Glu Leu Gln Asp Cys Met Ser Arg Leu Asp
2120 2125 2130
Pro Thr Leu Ile Asp Leu Lys Ala Lys Leu Glu Val Ala Asn Lys
2135 2140 2145
Asn Gly Ser Ala Asp Thr Lys Ser Leu Gln Glu Asn Ile Glu Ala
2150 2155 2160
Arg Thr Lys Gln Leu Met Pro Leu Tyr Thr Gln Ile Ala Ile Arg
2165 2170 2175
Phe Ala Glu Leu His Asp Thr Ser Leu Arg Met Ala Ala Lys Gly
2180 2185 2190
Val Ile Lys Lys Val Val Asp Trp Glu Glu Ser Arg Ser Phe Phe
2195 2200 2205
Glu Ile Arg Ala Val Ala Gly Glu Gln Phe Ser His Gln Pro Ala
2225 2230 2235
Ile Glu Leu Ile Lys Lys Trp Tyr Ser Ala Ser His Ala Ala Glu
2240 2245 2250
Trp Asp Asp Asp Asp Ala Phe Val Ala Trp Met Asp Asn Pro Glu
2255 2260 2265
Asn Tyr Lys Asp Tyr Ile Gln Tyr Leu Lys Ala Gln Arg Val Ser
2270 2275 2280
Gln Ser Leu Ser Ser Leu Ser Asp Ser Ser Ser Asp Leu Gln Ala
2285 2290 2295
Leu Pro Gln Gly Leu Ser Met Leu Leu Asp Lys Met Asp Pro Ser
2300 2305 2310
Arg Arg Ala Gln Leu Val Glu Glu Ile Arg Lys Val Leu Gly
2315 2320 2325
<210> 253
<211> 59 <212> ДНК
<213> Искусственная последовательность
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 253
ccttcaccca cggcgtgcag tgcttcagcc gctaccccga ccacatgaag cagcacgac
ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ, позволяющий вызвать генетическое изменение в клетке растения, указанный способ включает воздействие на указанную клетку агента для разрезания ДНК и модифицированного GRON.
2. Клетка растения, содержащая агент для разрезания ДНК и модифицированный GRON.
3. Способ, позволяющий вызвать генетическое изменение в клетке растения, указанный способ включает воздействие на указанную клетку агента для разрезания ДНК и GRON, который содержит ДНК и РНК.
4. Клетка растения, содержащая агент для разрезания ДНК, который содержит ДНК и РНК.
5. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой один или более агентов для разрезания, выбранных из CRISPR, TALEN, цинкового пальца, мегануклеазы и разрезающего ДНК антибиотика.
6. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой CRISPR или TALEN.
7. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой CRISPR.
8. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой TALEN.
9. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой один или более разрезающих ДНК антибиотиков, выбранных из группы, состоящей из блеомицина, зеоцина, флеомицина, таллисомицина и пеплеомицина.
10. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный агент для разрезания ДНК представляет собой зеоцин.
11. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON является одноцепочечным.
12. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON представляет собой химически защищенный олигонуклеотид.
13. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит химически защищенный олигонуклеотид с защитной группой на 5'-конце.
14. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит химически защищенный олигонуклеотид с защитной группой на 3'-конце.
15. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит химически защищенный олигонуклеотид с защитной группой на 5'- и 3'-концах.
16. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит одну или более групп, выбранных из группы СуЗ, группы 3PS и 2'-0-метильной группы.
17. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит группу СуЗ.
18. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит две или более групп СуЗ.
19. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит группу СуЗ у первого основания на 5'-конце.
20. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит группу СуЗ у первого основания на 3'-конце.
21. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит группу 3PS.
22. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит две или более групп 3PS.
23. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит группу 3PS у первого основания на 5'-конце.
24. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит группу 3PS у первого основания на 3'-конце.
25. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу.
26. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит две или более 2'-0-метильных групп.
27. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу у первого основания на 5'-конце.
28. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу у первого основания на 5'-конце и не содержит каких-либо других 2'-0-метильньгх групп.
29. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых двух или более оснований на 5'-конце.
30. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых трех или более оснований на 5'-конце.
31. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых четырех или более оснований на 5'-конце.
32. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых пяти или более оснований на 5'-конце.
33. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых шести или более оснований на 5'-конце.
34. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых семи или более оснований на 5'-конце.
35. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из восьми или более оснований на 5'-конце.
36. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых девяти или более оснований на 5'-конце.
37. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 2'-0-метильную группу на каждом из первых десяти или более оснований на 5'-конце.
38. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 РНК-оснований на 5'-конце.
39. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанный GRON содержит основание, неоднозначное по отношению к последовательности-мишени для генетического изменения.
40. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет от 15 до 60 нуклеотидов.
41. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет 41 нуклеотид.
42. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет от 50 до 110 нуклеотидов.
43. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет 101 нуклеотид.
44. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет от 150 до 210 нуклеотидов.
45. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет 201 нуклеотид.
46. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет от 70 до 210 нуклеотидов.
47. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 70 нуклеотидов.
48. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 165 нуклеотидов.
49. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 175 нуклеотидов.
50. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 185 нуклеотидов.
51. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 195 нуклеотидов.
52. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 200 нуклеотидов.
53. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 210 нуклеотидов.
54. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 220 нуклеотидов.
55. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 230 нуклеотидов.
56. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 240 нуклеотидов.
57. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 250 нуклеотидов.
58. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 260 нуклеотидов.
59. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 270 нуклеотидов.
60. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 280 нуклеотидов.
61. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 290 нуклеотидов.
62. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 300 нуклеотидов.
63. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 400 нуклеотидов.
64. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 500 нуклеотидов.
65. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 600 нуклеотидов.
66. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 700 нуклеотидов.
67. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 800 нуклеотидов.
68. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 900 нуклеотидов.
69. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что длина указанного GRON составляет более 1000 нуклеотидов.
70. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение выбрано из группы, состоящей из следующих растений: канола, подсолнечник, кукуруза, табак, сахарная свекла, хлопчатник, маис, пшеница, ячмень, рис, люцерна, ячмень, сорго, томат, манго, персик, яблоко, груша, клубника, банан, дыня, маниока, картофель, морковь, латук, лук, соевый боб, виды сои, сахарный тростник, горох, нут, горох полевой, садовый боб, чечевица, репа, брюква, брюссельская капуста, люпин, цветная капуста, капуста кормовая, конские бобы, тополь, сосна, эвкалипт, виноград, цитрусовое растение, тритикале, люцерна, рожь, овес, дерн и кормовые травы, лен, масличный рапс, горчица, огурец, вьюнок, бальзамин, перец, баклажан, бархатец, лотос, кочанная капуста, нивяник, гвоздика, тюльпан, ирис, маниока и лилия.
71. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой канолу.
72. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой кукурузу
73. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой маис.
74. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что
указанное растение представляет собой рис.
75. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой сорго.
76. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой картофель.
77. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой соевый боб.
78. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой лен.
79. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой масличный рапс.
80. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой маниоку.
81. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что указанное растение представляет собой подсолнечник.
82. Способ, позволяющий вызвать генетическое изменение в клетке растения, указанный способ включает воздействие на указанную клетку CRISPR и модифицированного GRON.
83. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что вносится множество генетических изменений.
84. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что применяется два или более РНК-проводников.
85. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что каждый из более чем одного РНК-проводников комплементарен отдельной мишени для генетического изменения.
86. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что CRISPR содержит никазу.
87. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что агент для разрезания ДНК содержит две или более никаз.
75.
88. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что две или более никаз разрезают противоположные цепи целевой последовательности нуклеиновой кислоты.
89. Способ или клетка по любому из предшествующих пунктов, отличающиеся тем, что две или более никаз разрезают одну и ту же цепь целевой последовательности нуклеиновой кислоты.
75.
015
0,20
0.15
0.10
0.05
0.00
96-луночный планшет 1
т BFP-0/HC-3PS
Ш BFP-4/NC-3PS Ш GFP-3/NC-Cy3 ? BFP-4/NC-Cy3
Эксп Л Эксп.2
A. GRON фрагментов Оказаки (BFP4 или О/С или NC/71/5' 2'-0-Ме (1))
BFP4/NC: U UCA UQJ GG U CGG GGT AGC G GC TGA AGC ACT GCA CGC CGT AGG TGA AGS TGG TCA CGA GGG TGG GCC AGG G (71-мер)
BFPO/NC: U UCA UGU GG U CGG GGT AGC 6 GC TGA AGC ACT GCA CGC CGT G6G TGA AGG
TGG TCA CGA GGG TGG GCC AGG G (7i_Mep)
BFP4/C: ШЖЭССС TGG ССС A CC CTC ST6 АСС ACC TTC ACC TAC GGC GTG CAG TGC TTC AGC CGC TAC CCC G (71-мер)
BFPO/C: G CUG CCC GUG CC С TGG CCC A CC CTC GTG ACC ACC TTC ACC CAC GGC GTG CAG TGC TTC AGC CGC TAC CCC G ¦¦ (71-мер)
Основания РЕК
2'-0-Me-rpynna на первом 5'-РНК-оеновании
(РНК-основания без 2-О-Ме-групп выделены серым цветом)
В- GROX фрагментов Оказаки (BFP4 или 0 <С или NC/71/5' 2"-0-Ме (9))
BFP4/NC: U UCA UGU GG U CGG GGT AGC G GC TGA AGC ACT GCA CGC CGT AGG TGA AGS TGG TCA CGA GGG TGG GCC AGG G П-мер)
BFPO/NC: U UCA UGU GG U CGG GGT AGC G GC TGA AGC ACT GCA CGC CGT GGG TGA AGS TGG TCA CGA GGG TGG GCC AGG G (71-мер)
BFP4/C: G CUG CCC GUG CC С TGG CCC A CC CTC GTG ACC ACC TTC ACC JAC GGC GTG CAG TGC TTC AGC CGC TAC CCC G C7l-Mepi
BFPO/C: G CUG CCC GUG CCC TGG CCC A CC CTC GTS ACC ACC TTC ACC CAC GGC GTG CAG TGC TTC AGC CGC TAC CCC G П-ыер)
Основания РНК
2*-0-Ме-грутшанавс.ех 5'-РНК-основаниях, за исключением основания, наиболее близко расположенного к первому ДНК-основанию GRON (РНК-основание без 2-0-Ме-групп выделены серым цветом)
ФИГУРА 2
Ген BFP
5 * CCTTCACCCACGGCGTGCAGTGCTTCAGCCGCTACCccgaccacatgAAGCAGCACGAC 3 * 3" GGAAGTCJGGTGCCGCACGTCACGAAGTCGGCGATGG^^GGTGTACTTCGTCGTGCTG 5'
Сиейсерная последовательность BFP CRISPR
I Последовательность РАМ BFP CRISPR |
Сайт превращения: BFP C> T
Неоднозначные основания (последовательность дикого типа)
ФИГУРА 3
Ш ЗкспЛ Ш Экт.2 ? Эксп.З
fc5
CRBFP6
41-мер 3PS
CRBFP6 i 01-мер 3PS
CRBFP6
201-мер
3PS
CIL-BFP6
41-мер
СуЗ
CR.-BFP6
101-мер
СуЗ
мер 3PS мер 3ps Мер3PS ФИГУРА 4
Нет 41-мер СуЗ
Нет 201-
мер СуЗ мер СуЗ
у 4
Ш Ш
CRBFP CRBFP С 6'i-ucp С ИИ-мер
Iw 2?Ъ Ы 3PS
CRBFP
Только
Только т
c/60.Meplw слм_нер с/2Ш_нер
3PS !w 3PS lw 3PS
ФИГУРА 5
71-мер
3 PS
40 п о. ДНК
20 п.о. дек -3 PS
71-мер (0)
30 п.о. ДНК
30 пл. ДНК
рнк.-gcygcccgyg
71-мер
30 п.о. ДНК
30 п.о. ДНК
pffingcucjcccgug
71-мер
(9)
30 п.о. ДНК
30 п.о. днк
РНК-основание с 2'-0-Ме
РНК 1С
ФИГУРА 6А
Сайт превращения BFP в GFP ОТ
201-мер
3 PS~
100 п.о.ДНК
-3 PS
201-мер (0)
90 п.о. днк
100 п.о. ДНК
РНК :gggcgagggc
201-мер (1)
90 п.о.ДНК
ТО п.о.ДНК
рнк:дддсдадддс
201-мер (§)
90 п.о.ДНК
100 п.о. ДНК
РНК-основание с 2'-0-Ме
PHK:;gggcgqgggc
ФИГУРА 6В
Сайт превращения BFP в GFP ?> Т
CR:BFP1 CR;BfP1 CR:BFP1 CR:BFP1 CR:BFP1 CR:BF?1 CR:BfP1 CR:BfP1 NC/71(0) NC/71(1) NC/71(9) C//!(Q) C/71(1) C/71(9) NC/71 3PS C/71 3PS
150% 1.30%
--о
CR:BFPI CR:BFP1 CftBFPI CfcBFPI CR;BFP1 CR;BFP1 CR:BFP1 CR:BFP1 NC/201 (0) NC/201 (1) NC/201 (9) C/20! {0) C/201 (1) C/201 (9) NC/201 3PS C/201 3PS
рЯ Эксп.1 jggj ЗЕСИ.2 . ЕЗ Эксп.З
0.00
-1,00
. л-
_Q=eIs"
CR.1D10A CR:101M CR:145 МОЛ СМИ D1QA CR:1H840A ffi:1№4* CfclftS H840A CfclftS H840A CR:1 CR:5
NC/201 11 C/201 11 NC/201 11 C/201 1W NC/201 11 C/201 11 NC/201 11 C/201 If NC/201 11 C/201 1W
ФИГУРА 9
Пример кассеты опРНК
ttqgqfqqgqwgcggogtcgogtttqttqtqcqgctqgig^
gtecgtiotcoqettgogooggtc
tcggtgc
Промотор U 6
Протоспейсер ;*
тра-кр;
Терминирующая последовательность
Подчеркиванием выделен линкер
CR:BFP1 20 н.т. CiLBFPl 17 н т. Только GRON КС 2ul Только i
NC/201-мер 3w 3PS NC/201-мер 3w 3PS "MeP 3w 3PS
0.2.0%
0.18% 0.16% 0.14% 0.12% 0.10% 0.08% 0,06% 0.04% 0.02% 0.00%
CRBFPl NC 41 -мер 3PS
CRBFP 1
NC/41-мер н ем одифициров анны й
Только GRON
NC/41-мер
3PS
Только GRON NC/41-мер
немодифицированный
_______
Только CRBFP 1
Необработанные
[23 СЕРПЯ 1
0.00%
0.00%
ФИГУРА 13
Обработка Время ¦ GRON TALEN % превращения % инсерций-делеций'
Протопласты **
24 -
Да.
0.06?
2.60
Миврокаппюсы до
3 недели
0.051
1.84
• Обозначает время после опосредованной ПЭГ доставки плазмид TALEN и GRON
** Обозначает, что протопласты и микрокаллюсы не из одного и того же эксперимента.
ФИГУРА 14
Обработка. ** Время *
CRISPR
* Время после опосредованной ПЭГ достав"! плазмид CRISPR. ** Обработки' не из одного и того же эксперимента.
ФИГУРА 15
0.40-
0.30
1 0
1 1 I { I i I + + +
ur>
+¦ + + + +
0.0 ВС-1 + CG-6 +
ФИГУРА 16A
ФИГУРА 16В
0.07
0.06-1 0.05 0.04 0.034 0.02 0.01 0
0.25' 0.2
0.15 0.1
I 0.05
¦-'А Л
'¦',Л
Ш CG5
CG2
CG1
BC-2
Плюс GRON
Только GRON
ФИГУРА 17A
ФИГУРА 17В
45-1
40 -
35 -30 25 -20 -1510 -5
Л -S
'"" Длина инсерций-делеций (п о )
см ю
ФИГУРА 18А
451
40-
35~ 30-
25~ 20~ 151050-
т л
/ / /
pi /
со г-- '-?> \.Г> v "1 o"i "-I i ! I I ! 1 )
Длина ин с ерций - д елеций (п.о.)
...., ¦ / л
V /
V/ ''Л
• /
TALEN + С612 +
Т72
г ¦
ФИГУРА 18С
ФИГУРА 18D
ФИГУРА 20
Конструкции CRISPR-Cas ВС-1, ВС-2 и ВС-3
2х FLAG
NLS
Протоспейсер
MAS
растениях Cas 9
ФИГУРА 21А
Конструкции TALEN ВТ-1 и LuET-1
IMS
евое плечо .
ФИГУРА 21 В
Целевой участок в BFP для CRISPR и TALEN
Y66H
CRISPR-Cas --
вс-1 СШШЖПСАСССАОЮ ю-2 тмшжшмжж
80-3 амсебобтажлжттошзс
TALEN
левое ST-1 правое
ФИГУРА 22 А
Целевой участок в EPSPS дай TALEN
Т97! Р101А
Н ? EPSPSORF ZZZh
197! P10IA - 5'^qcaatqdgtM^etatiegtcj;actgqeqqctqetqtwco^qЂtww"t"tЂ LiiET-1 левое LuET-1 правое
ФИГУРА 22 В
AMY3I0767 - транслированный белок АККаза пластиды Alopecurus
myosuroides (SEQ ID NO: 1)
1 HGSTHLPiVG FNASTTPSLS
51 IRDOGDGSVP OPAGHGQSIR
101 SYQMNSILNE SHNGRHASLS
151 HRSVRTWAND TFGSEKA1QL
201 NNNYANVQLI VEIAERTGVS
251 ASSHNA16DK VGSALIAQAA
301 ACVTTADEAV ASCQHIGYPA
351 GEVPGSPIFI HRLASQSRHL
401 EEGFVTVAPR ETVKELEOAA
451 LNPRLQVEHP VTESIAEVNL
501 YDIWRKTAAL ATPFNFDEVD
551 EISFKSKPNV WGYFSVKSGG
601 LKEIQIRGEI HTNVDYTVDL
651 WYISVVGGAL YKT1TTNAET
701 ESKYTIEIVR SGQGSYRLRL
751 EEEAGGTRLL IDGKTCLLQN
801 PYAEVEVMKM CMPLLSPAAG
851 RAEPFEGSFP EMSLPIAASG
901 LVWCLDTPAL PFLQWEELMS
951 KDFPTEMLRE TIEENLACVS
1001 FIVKSLFEEY LSVEELfSDG
1051 RNKTKLILAL MEKLVYPNPA
1101 TKLSELRTSI ARNLSALDMF
1151 EDALVSLFDC TDQTLQQRVI
1201 EFTEGNHEKR LGAMVILKSL
1251 DADTQLNTTE DSGDNDQAQD
1301 QRDGA1MPMR RTFLLSEEKL
1351 EMKYTPSRDR QWHIYTLRNT
1401 DVEVGHAEEP LSFTSSSILK
1451 LLDLVPVSGN TVv'DVGQDEA
1501 VKLKLV50GP ASGSWRVVTT
1551 SSGPLHGVAL NTSYQPtSVI
1601 SNISSENNQC YVKATELVFA
1651 MSTPEFPSGR QIIVIANDIT
1701 LAANSGARIG IADEVKSCFR
1751 IAHKMQLOSG EIRWVIDSVV
1801 LTFVTGRTVG IGAYLARLGI
1851 MQIGGPKIMA TNGVVHLTVP
1901 DPIDRPVAYI PENTCDPRAA
1951 TVVTGRAKLG GIPVGVIAVE
2001 PDSATKTAQA MLDFNREGLP
2051 NLRTYNQPAF VYIPKAAELR
2101 PQGLIEIKFR SEELKECMGR
2151 ARKKGLLPLY TQIAVRFAEL
2201 RRRLSEDVLA KEIRGVIGEk
2251 DAFVAWRENP ENYKEYIKEL
2301 DKHDPSKRAQ FIEEVMKVLK
TLRQINSAAA AFQSSSPSRS SKKKSRRVKS QGLAGIIOLP KEGASAPDVD ISHGSEDHKA KVYEFCTELG GKTPIHSVLV ANNGMAAAKF 1AHATPEDHR INAEHIRIAD QFVEVPGGTN AVWPGWGHAS ENPELPDALT AKGiVFLGPP GVPTLAWSGS HVEIPLELCL DSIPEEHYRK MIKASWGGGG KGIRKVNNDD EVKALFKQVQ EVQLLCOEYG NVAALHSRDC SVQRRHQKII RRLAKAVGYV GAATVEYLYS METGEYYFLE PAACVAVGMG IPLWQIPEIR RFYGMDNGGG SQWPKGHCVA VRITSENPDD GFKPTGGKVK GIHEFADSQF GHVFAYGETR SAAITSHSLA LNAPDFRENT IhTGWLDTRI AMRVQAERPP VSEYVSYLIK GQ1PPKHISL VHST3SLNIE NGSLIEANVQ TLCDGGLLMQ LDGNSHVIYA DHDPSRLLAE TPCKLLRFLI ADGAHVDADV V1NVLLSEGQ AMQAGDLIAR LDLDQPSAVK QVHKRCAASL NAARMVLAGY DHAANKVVQD VLATRLPRRL KSELEGKYNE YKLNVDHVKI EKEKVTIERL VDPLHSLLK5 YEGGRESHAH IQSDVIERLR LQY5KD10KV VDIVLSHQGV AYRDQLIRFS SLNHKRYYKL ALKASELLEQ TEEKADFSLO DRKLAINESH GDLVTAPLPV QTYISRLYQP QLVKDSIQLK YQDSGVIALW ESVSTAIGAA LKOASHYASS AGNI'VHIALL KMDKLSFVLK QDVVHADLRA ADVKVVSCIV CYEEEPILRH VEPPLSALLE LDKLKVKGYN ENPKMLHRVF FRTLVRQPSA GNRFTSDHIT SLKIAKEELE LHAIRTGHSH MYLCILKEQK TACSLLKEHA LKIHELVGAR MHHLSVCQWE NVTGHTCTVD IYREVEDTES QKLVYHSTAL DLKRCSARNN KTTYCYOFPL TFEAAVQKSW EKNGSWGTP! IPMQRAAGLN DIGMVAWILD FRAGSFGPRE DAFFEAVTNL ACEKKLPLIY VGWTDDSSPE RGFRYIYMTD EDHDRIGSSV GKEDGLGVEN IHGSAAIASA YSRAYEETFT RCIQRIOQPI ILTGFSALNK LLGREVYSSH ODLEGVSNIL RWLSYVPANI GGPLPITK5L ISGIDDSQGK WIGGNFDKD5 FVETFEGWAK TQTMMQLVPA OPGQPDSHER SVPRAGQVWF LFILANWRGF SGGQRDLFEG ILQAGSTIVE GGAWVVIDSK INPDRIECYA ERTAKGNVLE LDPEL1DLKA RLQGANGSLS DGESLQKSIE HDTSLRMAAK GVIRKVVDWE DSRSFFYKRL FPHKSAIELI KKWYLASEAA AAGSTDWDOD RAQRVSRLLS DVAGSSSDLQ ALPQGLSMLL
ФИГУРА 23
Продукт гена EPSPS Е, coli имеет следующую последовательность (номер доступа в UaiPiot P0A6D3. SEQ ID NO: 2)
ИЕ51Т10Р1АИШТ1Н1геЗК5У5К№111М1АНШТУШ11051ЮУКНМ1МАШ1 6 V S YTLSADRTRCE11GII66PLHAEGA LE LF LGNAGTAHRP LAAALC LGS Ю WITGEPR KERPIGHLVDAULGGAKITYLEQENYPPLRLQGGFTffiHVDVDGSVSSQFLTALLUTA PLAPEDTVIRIKSDLҐSKPYroiTLKLHKTFGVEIEN0HYQQFҐVK6GQSYQSPGTYLVE GDASSASYF LAAAAIKGGTVK VTGIGRNSHQGDIR F AOVL EKMGATICWGDDYISCTRGE LNAIDMDHNHIPOAAMTIATMLFAKGTTT'LRIIYNI"Vf(ETDRLFAr"TELRKV"EҐE EQHDYIRITPPEKLNFAElATYNDHRHAfCFSLVALSOTPVTILDPKCTAKTFPDYFEQL ARISQAA
ФИГУРА 24
Белок Ж. coli
Arabidopsis thaliana Petunia, hybrida Brassica napus Zea mays Oryza sativa Arabidopsis thaliana
* Нет истинно гомол <
Номер доступа в :
Genbank
Х00557
AF360224
160
М21084.1
155
Х51475.1
155
Х63374
AF413082
NM 130093
159
юкислот в Е, coli
Т97
Р101
N111
101
111*
179
183
194
174
178
189
174
178
189
102
106
117
169
173
184
178
182
193
FIG.25
AMY310~67 - кДНК АККазы пластиды Alopecurus myosuroides
1 TCGATMACT TCCT6TTGCA TGTCTCTATC TCTATG6ACT MCGGTTCCT AIGTGCAT6C 61 ATCTGTCAGG TTTCCAGACC TGGGGTTTAC AATCAGTTTA TGGCAGTCTG TGTTTGAAGA 121 ACACTGCAAC TCTGCTGTCT GTCCAAAGGG AGGACGATGG GATCCACACA TCTGCCCATT 181 GTCGGGTTTA ATGCATCCAC AACACCATCG CTATCCACTC TTCGCCAGAT AAACTCAGCT 241 GCTSCTGCAT TCCAATCTTC GTCCCCTTCA AGGTCATCCA AGAAGAAAAG CCGACGTGTT 301 AAGTCAATAA GGGATGATGG CGATGGAAGC GTGCCAGACC CTGCAGGCC.A TGGCCAGTCT 361 ATTC6CCAAG GTCTCGCTGG CATCATCGAC CTCCCAAAGG AGGGCGCATC AGCTCCAGAT 421 GTGGACATTT CACATGGGTC TGAAGACCAC AAGGCCTCCT ACCAAATGAA TGGGATACTG 481 AATGAATCAC ATAACGGGAG GCACGCCTCT CTGTCTAAAG TTTATGAATT TTGCACGGAA 541 TTGGGTGGAA AAACACCAAT TCACA6TGTA TTAGTCGCCA ACAATGGAAT GGCAGCAGCT 601 AAGTTCATGC GGAGTGTCCG GACATGGGCT AATGATACAT TTGGGTCAGA GAAGGCGATT 661 CAGTTGATAG CTATGGCAAC TCCGGAAGAC ATGAGAATAA ATGCAGAGCA CATTAGAATT 721 GCTGATCAGT TTGTTGAAGT ACCTGGTGGA ACAAACAATA ACAACTATGC AAATGTCCAA 781 CTCATAGTGG AGATAGCAGA GAGAACTGGT GTCTCCGCCG TTTGGCCTGG TTGGGGCCAT 841 GCATCTGAGA ATCCTGAACT TCCAGATGCA CTAACTGCAA AAGGAATTGT TTTTCTTGGG 901 CCACCAGCAT CATCAATQAA CGCACTAGGC GACAAG6T7G GTTCAGCTCT CATTGCTCAA 961 GCAGCAGGGG TTCCCACTCT TGCTTGGAGT GGATCACATG TGGAAATTCC AT7AGAACTT 1021 TGTTTGGACT CGATACCTGA GGAGATGTAT A6GAMGCCT GTGTTACAAC CGCTGATGAA 1081 GCAGTTGCAA GTTGTCAGAT GATTGGTTAC CCTGCCATGA TCAAGGCATC CTGGGGTGGT 1141 GGTGGTAAAG GGATTAGAAA GGTTAATAAT GATGACGAGG TGAAAGCACT GTTTAAGCAA 1201 GTACAGGGT6 AAGTTCCTGG CTCCCCGATA T1TATCATGA GACTTGCATC TCAGAGTCGT 1261 CATCTTGAAG TCCAGCTGCT TTGTGATGAA TATGGCAATG TA6CAGCACT TCACAGTCGT 1321 GATTGCAGTG TGCAACGACG ACACCAAAAG ATTATC6AGG AAGGACCAGT TACTGTTGCT 1381 CCTCGTGAAA CAGTGAAAGA. GCTAGAGCAA GCAGCAAGGA GGCTTGCTAA GGCCGTGGGT 1441 TAC6TCGGTG CTGCTACTGT TGAATATCTC TACAGCATGG AGACTGGTGA ATACTATTTT 1501 CTGGAGCTTA ATCCACGGT7 GCAGGTTGAG CACCCAGTCA CCGAGTCGAT AGCTGAAGTA 1561 AATTTGCCTG CAGCCCAAGT TGCAGTTGGG ATGGGTATAC CCCT'ITGGCA GATTCCAGAG 1621 ATCAGACGTT TCTACGGAAT GGACAATGGA GGAGGCTATG ATATTTQGAG GAAAACAGCA 1681 GCTCTCGCTA CTCCATTCAA CTTTGATGAA GTAGATTCTC AATGGCCGAA GGGTCATTGT 1741 GTG6CAGTTA GGATAACCAG TGAGAATCCA GATGATGGAT TCAAGCCTAC T6GTGGAAAA 1801 GTAAAGGAGA TAAGTTTTAA AAGTAAGCCA AATGTCTGGG GATATTTCTC AGTTAAGTCT 1861 GGTGGAGGCA TTCAT'GAATT TGCGGATTCT CAGTTTGGAC ACGTTTTTGC CTATGGAGAG 1921 ACTAGATCAG CAGCAAT.AAC CAGCATGTCT CTTGCACTAA AAGAGATTCA AATTCGTGGA 1981 GAAATTCATA CAAACGTTGA TTACACGGTT GATCTCTTGA ATGCCCCAGA CTTCAGAGAA 2041 AACACGATCC ATACCGGTTG GCTGGATACC AGAATA6CTA TGCGTGTTCA AGCTGAGAGG 2101 CCTCCCTGGT ATATTTCAGT GGTTG6AGGA GCTCTATATA AAACAATAAC CACCAATGCG 2161 GAGACCGTTT CTGAATATGT TAGCTATCTC ATCAAGGGTC AGATTCCACC AAAGCACATA 2221 TCCCTTGTCC ATTCAACTAT TTCTTTGAAT ATAGAGGAAA GCAAATATAC AATTGAGATT 2281 GTGAGGAGTG GACAGGGTAG CTACAGATTG AGACTGAATG GATCACTTAT TGAAGCCAAT 2341 GTACAAACAT TATGTGATGG AGGCCTTTTA ATGCAGCTGG ATGGAAATAG CCATGTTATT 2401 TATGCTGAAG AAGAAGCGGG TGGTACACGG CTTCTTATTG ATGGAAAAAC ATGCTTGCTA
2461 CAGAATGACC ATGATCCGTC AAGGTTATTA 2521 TTGATTGCCG ATGGTGCTCA TGTTGATGCT
2581 AAGATGTGCA TGCCCCTCTT GTCGCCTGCT 2641 GGCCAGGCGA TGCAGGCTGG TGATCTTATA 2701 GTGAAGAGAG CCGAGCCATT TGAAG6ATCT 2761 TCTGGCCAAG TTCACAAAAG ATGTGCTGCA 2821 GGATATGACC ATGCGGCCAA CAAAGTTGTG 2881 GCTtTTCCTT TCCTACAATG GGAAGAGCTT 2941 CGTCTTAAGA GCGAGTTGGA G6GCAAATAC 3001 AAGATCAAG6 ATTTCCCTAC CGAGATGCTT 3061 GT77CCGAGA AGGAAATGGT GACAATTGAG 3121 AAGTCATACG AGGGTG6GAG AGAAAGCCAT 3181 GAGTATCTCT CGGTTGAGGA ACTATTCAGT 3241 CTGCGCCTAC AATATAGTAA AGACCTCCAG 3301 GGTGTGAGAA ACAAAACAAA GCTGATACTC 3361 CCTGCTGCCT ACAGAGATCA GTTGATTCGC 3421 AAGTTGGCTC TTAAAGCTAG TGAACTTCTT 3481 AGCATTGCAA GGAACCTTTC A6CGCTGGAT 3541 TTGCAAGACA GAAAATTGGC CATTAATGAG 3601 CCA6TGAA6 ATGCACTTGT TTCTTTGTTT 3661 GTGATTCAGA CATACATATC TCGATTATAC 3721 CT6AAATATC AGGATTCT6G TGTTATTGCT 3781 AAGAGATTGG GTGCTATGGT TATCCTGAAG 3841 GCTGCTCTAA AGGATGCATC ACATTATGCA 3901 TTGTGGATG CTGATACCCA ACTGAATACA 3961 CAAGACAAGA TGGATAAACT TTCTTTTGTA 4021 CGTGCTGCTG ATGTCAAGGT TGTTAGTTGC 4081 AfGCGCCGTA CCTTCCTCTT GTCAGAG6AA 4141 CGGCATGT6G AGCCTCCACT TTCTGCACTT 4201 TACAATGAGA TGAAGTATAC ACCGTCACGT 4261 AATACTGAAA ATCCAAAAAT GCTGCACAGG 4321 AGTGCAGGCA ACAGGTTTAC ATCAGACCAT 4381 GAACCTCTTT CATTTACTTC AAGCAGCATA 4441 TTGGAGCTTC ACGC6ATCAG GACTGGCCAT 4501 CAAAAGCTTC TTGACCTTGT TCCTGTTTCA 4561 6AAGCTACTG CATGCTCTCT TTTGAAAGAA 4621 GCAA6AATGC ATCATCTTTC TGTATGCC.AG 4681 GGGCCTGCCA GTG6TAGCTG GAGAGTTGTA 4741 GTGBATATCT ACCGGGAGGT CGAAGATACA 4801 GCATT'GTCAT CTGGTCCTTT GCATGGTGT7 4861 GTTATTGATT TAAAACGTTG CTCTGCCAGG 4921 CCATGACAT TTGAAGCTGC AGTGCA6AAG
GCTGAGACAC CCTGCAAACT TCTTCGTTTC GATGTACCAT ACGCGGAAGT TGAGGTTATG GCTGGTGTCA TTAATGTTTT GTTGTCTGAG GCGAGACTTG ATCTCGAT6A CCCTTCTGCT TTTCCAGAAA TGAGCCTTCC TATTGCTGCT AGTTTGAACG CTGCTCGAAT 6GTCC7T6CA CAAGATTTGG TATGGTGCCT TGATACACCT ATGTCTGTTT TAGCAACTAG ACTTCCAAGA AATGAATACA AGTTAAATGT TGACCATGTG AGAGA6ACAA TCGAGGAAAA TCTTGCATGT AGGCTTGTTG ACCCTCTGAT GAGCCTGCTG GCCCACTTTA TTGTCAAGTC CCTTTTT6AG GATGGCATTC AGTCTGACGT GATTGAACGC AAGGTTGTAG ACATTGTTTT GTCTCACCAG GCGCTCATGG AGAAACTGGT CTATCCAAAC TTTTCTTCCC TCAACCATAA AAGATA1TAT GAACAAACCA AGCTCAGCGA ACTCCGCACA ATGTTCACCG AGGAAAAGGC AGATTTCTCC AGCATGGGAG ATTTAGTCAC TGCCCCACTG GATTGTACTG ATCAAACTCT TCASCA6A6A CAGCCTCAAC TTGTGAAGGA TAGCATCCAG TTATGGGAAT TCACTGAAGG AAATCATGAG TCACTAGAAT CTGTGTCAAC AGCCATTGGA AGCTCTGCGG GCAACACGGT GCATATTGCT ACT6AAGATA 6TGGTGATAA TGACCAAGCT CTGAAACAAG ATGTTGTCAT GGCTGATCTA ATTGTTCAAA GASATGGAGC AATCATGCCT AAACTTTGTT AC6AGGAAGA GCCGATTCTT CTTGAGTTGG ATAAATTGAA AGTGAAAGGA GATCGTCAGT GGCATATATA CACACTTAGA GTATTTTTCC GAACACTTGT CAGACAACCC ATCACT6ATG TTGAAGTAGG ACAC6CAGAG TTAAAATCGT TGAAGATTGC TAAAGAAGAA TCTCATATGT ACTTGTGCAT ATTGAAAGAG GGGAACACTG TTGTGGATGT TGGTCAAGAT ATGGCTTTAA AGATACATGA ACTTGTTGGT TGGGAAGTGA AACTTAAGTT GGTGAGCGAT ACAACCAATG TTACTGGTCA CACCTGCACT GAATCACAGA AACTAGTATA CCACTCCACC GCACTGAATA CTTCGTATCA GCCTTTGAGT AACAACAAAA CTACATACTG CTATGATTTT TCGTGGTCTA ACATTTCCAG TGAAAACAAC
4981 CAATGTTATG TTAAAGCGAC AGAGCTTGTG TTTGCTGAAA AGAATGGGTC GTGGGGCACT 5041 CCTATAATTC CTATGCAGC6 T6CTGCTGGG CTGAATGACA TTGGTAT6GT AGCCT6GATC 5101 TTGGACATGT CCACTCCTGA ATTTCCCAGC GGCAGACAGA TCATT6TTAT C6CAAAT6AT 5161 ATTACAT7TA GAGCTGGATC ATTTG6CCCA AGGGAAGATG CATTTTTCGA AGCTGTAACC 5221 AACCTGGCTT GTGAGAAGAA GCTTCCACTT ATCTACTTGG CTGCAAACTC TGGTGCTCGG 5281 AT7G6CAT7G CTGATGAAGT AAAATCTTGC TTCCGTGTTG GATGGACTGA TGATAGCAGC 5341 CCTGAACGT6 GATTTAGGTA CATTTATAT6 ACTGACGAAG ACCATGATCG TATTGGCTCT 5401 TCA6TTATAG CACACAAGAT GCAGCTAGAT AGTGGCGAGA TCAGGTGGGT ТАТТйАПСТ 5461 GTTGTGGGAA AAGAGGATGG ACTAG6TGTG GAGAACATAC ATGGAAGTGC TGCTATTGCC 5521 AG TGC CI" ATT CTAGGGCGTA CGAG6AGACA TTTACACTTA CATTCGTTAC TGGACGAACT 5581 GTT6GAATCG GAGCCTATCT TGCTCGACTT GGCATACGGT GCATACAGCG TATTGACCAG 5641 CCCATTATTT TGACCGGGTT TTCTGCCCTG AACAAGCTTC TTGGGCGGGA GGTGTACAGC 5701 TCCCACATGC AGTTGGGTGG TCCCAAAATC ATGGCGACGA ATGGTGTTGT CCATCTGACT 5761 GTTCCAGATG ACCTTGAAGG TGTTTCTAAT ATATTGAGGT GGCTCAGCTA TGTTCCTGCA 5821 AACATTGGTG GACCTCTTCC TATTACAAAA TCTTTGGACC CAATAGACAG ACCCGTTGCA 5881 TACATCCCT6 AGAATACATG TGATCCTCGT GCAGCCATCA GTGGCATTGA TGACAGCCAA 5941 GGGAAATGGT TGGGTGGCAT GTTTGACAAA GACAGTTTTG TGGAGACATT TGAAGGATGG 6001 GCGAA6AGAG ТАбТТАСГбб CAGAGCAAAA CTTGGAGGGA TTCCTGTTGG TGTTATAGCT 6061 GTGGAGACAC AGACCATGAT GCA6CTCGTC CCCGCT6ATC CAGGCCAGCC TGATTCCCAC 6121 GAGCGGTCTG TTCCTCGTGC TGGGCAAGTT TGGTTTCCAG ATTCTGCTAC CAAGACAGCG 6181 CAGGCGATGT TGGACTTCAA. CCGTGAAGGA TTACCTCTGT TCATACTTGC TAACTGGAGA 6241 GGCTTCTCTG GAGGGCAAAG AGATCTTTTT GAAGGAATTC TGCAGGCTGG GTCAACAATT 6301 GTTGAGAACC TTAGGACATA CAATCAGCCT GCCTTTGTAT ATATCCCCAA GGCTGCAGAG 6361 CTACGTGGAG GAGCCTGG8T CGTGATTGAT AGCAAGATAA ACCCAGATCG CATCGAGTGC 6421 TATGCTGAGA GGACTGCAAA GGGTAATGTT CTCGAACCTC AAGGGTTGAT TGAGATCAAG 6481 TTCAGGTCAG AGGAACTCAA AGAAT6CATG ffiTAGGCTTG AT'CCAGAATT GATAGATCTG 6541 AAA6CAAGAC ТССА6ЖА6С AAATGGAAGC CTATCTGATG GAGAATCCCT TCAGAAGAGC 6601 ATAGAAGCTC GGAAGAAACA GTTGCTGCCT CTGTACACCC AAATCGCGGT ACGTTTTGCG 6661 GAATTGCACG ACACTTCCCT TAGAATGGCT GCTAAAGGTG TGATCAGGAA AGTTGTAGAC 6721 TGG6AAGACT CTCG6TCTTT CTTCTACAA6 AGATTACGGA GGAGGCTATC CGAGGACGTT 6781 CTG6CAAAGG AGATTAGAGG TGTAATTGGT GAGAAGTTTC CTCACAAATC AGCGATCGAG 6841 CTGATCAAGA AATGGTACTT GGCTTCTGAG GCAGCTGCAG CAG6AAGCAC CGACTGGGAT 6901 GACGACGAT6 CTTTTGTCGC CTGGAGGGAG AACCCTGAAA ACTATAAGGA GTATATCAAA 6961 GAGCTTAGGG CTCAAAGGGT ATCTCGGTTG CTCTCA6ATG TTGCA66CTC CAGTTCGGAT" 7021 TTACAAGCCT TGCCGCAGG6 TCTTTCCATG CTACTAGATA AGATGGATCC CTCTAAGAGA 7081 GCACAGTTTA TCGAGGAGGT CATGAAGGTC CT6AAATGAT CAAAT6ATAC CAACACATCC 7141 AATACAGTAT GTGCATGATA TCTGTTTCTC TTGAAGTACA TATATAGATG GATACAAG6C 7201 GGCTGTAACT GATG6TAGCT AATCTGGGCC AACCATTACT TTTGTGAACT TGCTGGTG6C 7261 CTTTATTATT CAAGGCACAG CTCGCCTTCG GACCCCCTCC GGCTGGTTGA TGATGAGTGT 7321 AACTGGATGT GTTAGTTCTG CTGCCACAGA ATTCGAGAAG GATAGGGGCA TGCGGGTTTT 7381 GCCTCCTGTT GGCAAGAACA CTGGTGATTT TGAGTTCTTG TTATGTGGAC TGTGGTAGTC 7441 TTGTTTCGCT GTAGTTCTGT GATGTTCTAT CTCCTGTAAT TCTAGTCTTG GGAGAGTGAT 7501 TCAGATGTCC ATTCAATTTT GAACTTGAAT AATAATATGC TTTGTAGGCC TATGCGTACC 7561 AGTATGTGGA ATAAATGTTC GTTGAGTTA
AMY3 1076" - Транслированный белок АККазы пластиды Alovecwus myosuroides
I MGSTHLPIVG FNASTTPSLS TIRQINSAAA AFQSSSPSRS SKKKSRRVKS
51 IRDOGDG5VP DPAGHGQSIR QGlAGifDIP KEGASAPOVD ISHGSEDHKA
101 SYQMNGILNE SHNGRHASLS KVYEFCTELG GKTPIHSVLV ANNGMAAAKF
151 MRSVRTWAND TFGSEKAIQL IAMATPEOMR IMAEHIRIAD QFVEVPGGTN
201 NNNYANVQLI VEIAERTGVS AVWPGW6HAS ENPELPDALT AKGIVFLGPP
251 ASSMMALGDK VGSALIAQAA GVPTLAWSGS HVEIPLELCL DSIPEEMYRK
301 ACVTTADEAV A5CQHIGYPA MIKASWGGGG KGIRKVNNOD EVKALFKQVQ
351 GEVPGSPIFI HRLASQSRHL EVQLLCDEYG NVAALHSRDC SV0RRHQWI
401 EEGPVTVAPR ETVKELEQAA RRLAKAVGYV GAATVEYLYS HETGEYYFLE
451 LNPRLOVEHP VTESIAEVNL PAAQVAVGMG IPLWQIPEIR RFY6MDNGG6
501 YDIWRKTAAL ATPFNFDEVD SQWPKGHCVA VR1TSENPDD GFKPTGGKVK
551 EISFKSKPNV WGYFSVKSGG GIHEFAOSQF GHVFAYGETR SAAITSMSLA
601 IKEIQIRGEl hTKVDYTVDL LNAPDFRENT IHTGWLDTRI AMRVQAERPP
651 WYISVVGGAL YKTITTNAET VSEYVSYLIK GQIPPKHISL VHSTISLNIE
701 ESKYTIEIVR SGQGSYRLRL NGSLIEANVQ TLCDGGLLMQ LDGNSHVIYA
751 EEEAGGTRLL IDGKTCLLQN DHDPSRLLAE TPCKLLRFLI ADGAHVDADV
801 PYAEVEVMKM CMPLLSPAAG VINVLLSEGQ AMQAGDLIAR LDLDOPSAVK
851 RAEPFEGSFP EMSLPIAASG QVHKRCAASL NAARKVLAGY DHAANKWOO
901 LVWCLDTPAL PFLQWEELHS VLATRLPRRL KSELEGKYNE YKLNVDHVKI
951 KDFPTEMLRE TIEENLACVS EKEHVTIERL VDPLH5LLK5 YEGGRESHAH
1001 FIVKSLFEEY LSVEELFSDG IQSDVIERLR LQYSKDLQKV VDIVLSHQGV
1051 RNKTKLILAL MEKLVYPNPA AYRQQLIRFS SLNHKRYYKL ALKASELLEQ
1101 TKLSELRTSI ARNLSALDMF TEEKADFSLQ DRKLAINESM GDLVTAPLPV
1151 EDALVSLFDC TDQTLQQRVT QTYISRLYQP QLVKDSIQLK YQDSGVIALW
1201 EFTEGNHEKR LGAMVILKSL ESVSTAIGAA LKOASHYASS AGNTVHIALL
1251 DADTGLNTTE OSGDNDQAQD KMDKLSFVLK QDVVMADLRA AOVKVVSCIV
1301 QRDGAIMPMR RTFLLSEEKL CYEEEPILRH VEPPLSALLE LDKLKVKGYN
1351 EMKYTPSRDR QWHIYTLRNT ENPKMLHRVF FRTLVRQPSA GNRFTSDHIT
1401 DVEVGHAEEP ISFTSSSILK SIKIAKEELE LHAIRTGHSH NYLCILKEQK
1451 LLDLVPVSGN TVVDVGQDEA TACSLLKEMA LKIHELVGAR HHHLSVCQWE
1501 VKLKLVSDGP ASGSMRVVTT NVTGHTCTVD IYREVEDTES QKLVYH5TAL
1551 SSGPLHGVAL NTSYQPLSVI DLKRCSARNN KTTYCYDFPL TFEAAVQKSW
1601 5NISSENNQC YVKATELVFA EKNGSWGTPI IPMQRAAGLN DIGHVAWILD
1651 MSTPEFPSGR QIIVIANDIT FRAGSFGPRE DAFFEAVTNL ACEKKLPLIY
1701 LAANSGARIG I.ADEVKSCFR VGWTDDSSPE RGFRYIYMTD EDHDRIGSSV
1751 IAHKMQLDSG EIRWVIDSW GKEDGLGVEN IHGSAAIASA YSRAYEETFT
1801 LTFVTGRTVG iGAYLARLGI RCIQRIDQPI ILTGFSALNK LLGREVYSSH
1851 MQLGGP'KIMA TNGVVHLTVP DDLEGVSNIL RWLSYVPANI GGPLPITKSL
1901 DPIDRPVAYI PENTCOPRAA ISGIDDSOGK WLG6HFDKDS FVETFEGWAK
1951 TVVTGRAKLG GIPVGVIAVE TQTMMQLVPA DPGQPDSHER SVPRAGQVWF
2001 PDSATKTAQA MLDFNREGLP LFILANWRGF SGGQRDLFEG ILQAGSTIVE
2051 NLRTYNQPAF VYIPKAAELR GGAWVVIDSK INPDRIECYA ERTA.KGNVLE
2101 PQGLIEIKFR SEELKECMGR LOPELIDLKA RLQGANGSLS DGESLQKSIE
2151 ARKKQLLPLY TQIAVRFAEl HDTSLRMAAK GVIRKVVDWE DSRSFFYKRl
2201 RRRLSEDVLA KEIRGVIGEK FPHKSAfELI KKWYLASEAA AAGSTDWDDD
2251 DAFVAWRENP ENYKEYIKEL RAQRVSRLLS DVAGSSSDLQ ALPQGLSMLL
2301 DKMDPSKRAQ FIEEVMKVLK
кДНК АККазы пластиды Otyza sativa OsQ5g22940 риса (Cypress)
1 ATGACATCCA CACAT6TGSC GACATTGGGA GTTGGTGCCC АШЖСТСС TCGTCACCAG 61 AAAAAGTCAG CTGGCACTGC ATTTGTATCA TCTGGGTCAT CAAGACCCTC ATACCGAAAG 121 AATGGTCAGC GTACTCGGTC ACTTAGGGAA GAAAGCAATG GAGSAGTGTC TGATTCCAAA 181 AAGCTTAACC ACTCTATTCG CCAAGGTCTT GCTGGCATCA TTGACCTCCC AAATGACGCA 241 GCTTCAGAAG TTGATATTTC ACATGGT7CC GAAGATCCCA GGGGGCCTAC GGTCCCAGGT 301 TCCTACCAAA TGAAT6GGAT TATCAATGAA ACACATAATG GGAGGCATGC TTCAGTCTCC 361 AAGGTTGTTG AGTTTTG7AC GGCACTTGGT GGCAAAACAC CAATTCACAG TGTATTAGTG 421 GCCAACAATG GAATGGCAGC AGCTAAGTTC ATGCGGAGTG TCCGAACATG GGCTAATGAT 481 ACTTTTGGAT CAGAGAAGGC AATTCAGCTG ATAGCTATGG CAACTCCGGA GGATCTGAGG 541 ATAAATGCAG AGCACATCAG AATTGCCGAT CAATTTGTAG AGGTACCTGG TGGAACAAAC 601 AACAACAACT ATGCAAATGT CCAACTCATA GTGGAGATAG CA6AGAGAAC AGGTGTTTCT 661 GCTGTTTGGC CTGGTTGGGG TCATGCATCT GAGAATCCTG AACTTCCAGA TGCGCTGACT 721 GCAAAA.GGAA TTGTTTTTCT TGGGCCACCA GCATCATCAA TGCATGCATT AGGAGACAAG 781 GTTGGCTCAG CTCTCATTGC TCAAGCAGCT GGAGTTCCAA CACTTGCTTG GAGTGGATCA 841 CATGTGGAAG TTCCTCTGGA GTGTTGCTTG 6ACTCAATAC CTGATGAGAT GTATAGAAAA 901 GCTTGTGTTA CTACCACAGA GGAAGCAGTT GCAAGTTGTC AGGTGGTTGG TTATCCTGCC 961 ATGATTAAGG CATCTTGGGG TGGTGGTGGT AAAGGAATAA GGAA.GGTTCA TAATGATGAT 1021 GAGGTTAGGA CATTATTTAA GCAAGTTCAA GGCGAAGTAC CTGG1TCCCC AATATTTATC 1081 AT6AGGCTAG CTGCTCAGAG TCGACATCTT GAAGTTCAGT TGCTTTGTGA TCAATATGGC 1141 AACGTAGCAG CACTTCACAG TCGAGATTGC AGTGTACAAC GGCGACACCA AAAGATAATC 1201 GAGGAAGGAC CAGTTACTGT TGCTCCTCGT GAGACTGTGA AAGAGCTTGA GCAGGCAGCA 1261 CGGAGGCTTG CTAAAGCTGT GGGTTATGTT GGTGCTGCTA CTGTTGAATA CCTTTACAGC 1321 ATGGAAACTG GTGAATATTA TTTTCT6GAA CTTAATCCAC GGCTACAGGT TGAGCATCCT 1381 GTCACTGAGT GGATA6CTGA ASTAAATTTG CCTGCGGCTC AAGTTGCTGT TGGAATGGGT 1441 ATACCCCTTT GGCAGATTCC AGAGATCAGG CGCTTCTACG GAATGAACCA T6GAGGAGGC 1501 TATGACCTTT GGAGGAAAAC AGCAGCTCTA GCGACTCCAT TTAACTTTGA TGAAGTAGAT 1561 TCTAAATGGC CAAAAGGCCA CTGCGTAGCT GTTAGAATAA CTAGCGAGGA TCCAGATGAT 1621 GGGTTTAAGC CTACT6GTGG AAAAGTAAAG GAGATAAGTT TCAAGAGTAA ACCAAATGTT 1681 TGGGCCTATT TCTCAGTAAA 6TCT6GTGGA GGCATCCATG AATTCGCTGA TTCTCAGTTC 1741 GGACATGTTT TTGCGTAT6G AACTACTAGA TCGGCAGCAA TAACTACCAT GGCTCTTGCA 1801 CTAAAAGAGG TTCAAATTCG TGGAGAAATT CATTCAAACG TAGACTACAC AGTTGACCTA 1861 TTAAATGCCT CA6ATTTTAG AGAAAATAAG AHCATACTG GTTGGCTGGA TACCAGGATA 1921 GCCATGCGTG TTCAAGCTGA GAGGCCTCCA TGGTATATTT CAGTCGTTGG AGGGGCTTTA 1981 TATAAAACA6 TAACTGCCAA CACGGCCACT GTTTCTGATT ATGTTGGTTA TCTTACCAAG 2041 G6CCAGATTC CACCAAAGCA TATATCCCTT 6TCTATACGA CTGTTGCTTT GAATATAGAT 2101 GGGAAAAAAT ATACAATCGA TACTGTGAGG AGTGGACATG GTAGCTACAG ATTGCGAATG 2161 AATGGATCAA CGGTTGACGC AAATGTACAA ATATTATGTG ATGGTGGGCT TTTAATGCAG 2221 CTGGATG6AA ACAGCCATGT AATTTATGCT GAA'GAAGAGG CCAGTGGTAC ACGACTTCTT 2281 ATTGATGGAA AGACATGCAT 6TTACA6AAT GACCATGACC CATCAAAGTT ATTAGCTGAG 2341 ACACCATGCA AACTTCTTCG TTTCTTGGTT GCTGATGGTG CTCATGTTGA TGCTGATGTA
2401 CCATATGCGG AAGTTGAGGT TAT6MGATG 2461 GTCATACAT6 TTGTAATGTC T6AGGGCCAA 2521 CTGGATCTTG ATGACCCTTC TGCTGTTAAG 2581 CAAATGGGTC TCCCTATTGC TGCTTCTGGC 2641 AATGCTTGTC GAATGATCCT TGCGGGGTAT 2701 TTGGTATACT GCCTAGACAC TCCGGAGCTT 2761 GTTTTAGCAA CTAGACTTCC AAGAAATCTT 2821 TACAAAGTAA AATTTGACTC TGGGATAATC 2881 ATAATTGAGG AAAATCTTGC ATGTGGTTCT 2941 GTTGAGCCTC TTATGAGCCT ACTGAAGTCA 3001 TTTGTTGTCA AGTCCCTTTT TGAGGAGTAT 3061 ATTCAGTCTG ATGTGATTGA. GCGTCTGCGC 3121 GTAGACATTG TGTTGTCCCA CCAGA6TGTT 3181 ATG6AGAGTC TGGTCTATCC AAATCCTGCT 3241 TCCCTTAATC ACAMGCGTA TTACAAGTTG 3301 ACAAAACTTA GTGAGCTCCG TGCAA6AATA 3361 ACTGAGGAAA GCAAGGGTCT CTCCATGCAT 3421 GAAGATTTA6 TCACT'GCTCC ACTGCCAGTT 3481 AGT6ATACAA CTGTTCAACA GAGAGTGATT 3541 CATCTTGTAA AGGACAGTAT CAAAATGAAA 3601 GAATTTCCTG AAGGGCATTT TGATGCAAGA 3661 TGGffiTGCCA TG6TCATTGT CAAGTCTCTT 3721 CTAAAGGAGA CATCACACTA CACTAGCTCT 3781 GGTGCTGATA ATAAGATGCA TATAATTCAA 3841 AMCTTCCCT TGATACTAAA GGATAA.TGTA 3901 ATAAGTTTCA TTGTTCAAAG AGATGAAGCA 3961 TCTGATGAAA AGCTTTCTTA TGAGGAAGAG 4021 TCTGCACTTC TTGAGTTGGA CAAGTTGAAA 4081 CCATCAC666 ATCGTCAATG 6CATATCTAC 4141 TTGCACCGGG TATTTTTCCG AACCCTTGTC 4201 TCGGGCCAGA TTGGTGACAT GGAAGTTGGG 4261 ACCAGCATAT TAAGATCTTT GATGACTGCT 4321 ACTGGCCATT СACACATGГА TTTGCATGTA 4381 CCA6TTTCA6 GGAATACAGT TTTGGATGTT 4441 TTAAAAGAAA TGGCTATGAA GATACATGAA 4501 GTATGCCAAT GGGAAGTGAA ACTTAAGTTG 4561 AGGATTGTAA CAACCAAT6T TACTAGTCAC 4621 GAAGATAAA6 AATCACGGAA GTTAGTATAC 4681 CATGGTGTGG CACTGAATAA TCCATATCAG 4741 TCTGCTAGGA ATAATAGAAC TACATACTGC 4801 GTGAGGAAGT CATG6TCCTC TAGTACCTCT 4861 TGTTATGTTA AAGCTACAGA GTTGGTATTT
TGCATGCCCC TCTTATCACC CGCTTCTGGT 6CAATGCAGG CTGGTGATCT TATAGCTAGG AGAGCTGAGC CGTTCGAAGA TACTTTTCCA CAAGTTCACA AATTATGTGC TGCAAGTCTG GAGCATGATA TTGACAAGGT TGTGCCAGAG CCTTTCCTGC AGTGGGAGGA GCTTATGTCT AAAAGTGAGT TGGAGGGCAA ATATGAGGAA AATGATTTCC CT6CCAATAT GCTACGAGTG GAGAAGGAGA AGGCTACAAA TGAGAGGCTT TATGAGGGTG GGA6A6AAAG TCATGCTCAC CTCTATGTTG AAGAATTGIT CAGTGAT6GA CTTCAACATA GTAAAGACCT ACAGAAGGTC AGAAATAAAA CTAAGCTGAT ACTAAAACTC GCCTACAGGG ATCAATTGAT TCGCTTTTCT GCACTTAAAG CTAGTGAACT TCTTGAACAA 6CAAGGAGCC TTTCAGAGCT GGAGATGTTT AAGCGAGAAA TTGCCATTAA GGAGAGCATG GAAGATGCGC ТСАТТГСТТТ ATTTGATTGT GAGACTTATA TAGCTCGATT ATACCAGCCT TGGATAGAAT CGGGTGTTAT TGCTTTATGG AATGGAGGAG CGGTTCTTGG TGACAAAAGA GAATCACTTT CAATGGCCAT TAGATTTGCA GAGGGCAATA TGATGCATAT TGCTTTGTTG GAAAGTGGTG ATGATGCTGA CAGAATAGCC ACCGATCTGC ATGCCTCTGG TGTGAAAACA CGGATGACAA TGCGTCGTAC CTTCCTTTGG CCAATTCTCC GGCATGTGGA ACCTCCTCTT GTGAAAGGAT ACAATGAAAT GAAGTATACC ACACTTAGAA ATACT6AAAA CCCCAAAAT6 AGGCAACCCA GTGTATCCAA CAAGTTTTCT AGTGCTGAAG AACCTCTGTC ATTTACATCA ATAGAGGAAT TGGAGCTTCA CGCAATTAGA TTGAAAGAAC AAAAGCTTCT TGATCTTGTT GGTCAAGATG AAGCTACTGC ATATTCACTT CTTGTTGGTG CAAGAATGCA CCATCTTTCT GACTGCGATG GTCCTGCCAG TGGTACCTGG ACTTGCACTG TGGATATCTA CCGTGAGATG CATCCCGCCA CTCCGGCGGC TGGTCCTCTG CCT'TTGAGTG TCATTGATCT CAAACGCTGT TATGATTTTC CACTGGCATT TGAAACTGCA GGTGCTTCTA AAGGTGTTGA AAATGCCCAA GCGGACAAAC ATGGGTCATG GGGCACTCCT
4921 TTAfiTTCAM TGSACCffiCC TGCTGfiQCTC 4981 AAGATGTCCA CTCCTGAATT TCCTA6TGGT 5041 ACGTTCAGAG CTGGATCATT TGGCCCAAGG 5101 CTAGCCTGTG AGAAGAAACT TCCTCTTATT 5161 GGCATAGCAG ATGAAGTGAA ATCTTGCTTC 5221 GAACGTGGGT TTCAGTACAT TTATCTAAGC 5281 GTCATAGCAC ATAAGATGCA GCTAGACAGT 5341 GTGGGCAAGG AA6ATGGACT TGGTGTGGAG 5401 GCTTATTCTA GGGCATATAA GGAGACATTT 5461 GGAATAGGAG CTTATCTTGC TCGACTTGGC 5521 ATTATTCTTA CAGGCTATTC TGCACTGAAC 5581 CACATGCAGT TG6GTGGTCC CAAAATCATG 5641 TCAGATGACC TTGAAGGCGT TTCTAATATA 5701 ATTGGTGGAC CACTTCCAGT AACAACACCG 5761 ATTCCTGAGA ACTCGTGTGA TCCTCGAGCG 5821 AAATGGTTAG GTGGTATGTT TGATAAAGAC 5881 AAGACAGTGG TTACTGGCAG AGCAAAGCTT 5941 GAGACTCA6A CCATGATGCA ААСТАТСССГ 6001 CAATCTGTTC CTCGTGCTGG ACAAGTGTGG 6061 GCATTGCTGG ACTTCAACCG TGAAGGATTA 6121 TTCTGTGGTG GACAAAGAGA TCTTTTTGAA 6181 GAGAACCTTA GGACATACAA TCAGCCTGCC 6241 CGAGGAGGGG CTTGGGTTGT GGTT'GATAGC 6301 GCTGAGAGGA CTGCAAAAGG CAATGTTCTG 6361 AG6TCAGAG6 AACTCCAGGA TTGCATGAGT 6421 GCAAAACTC6 AAGTAGCAAA TAAAAATGGA 6481 ATAGAAGCTC GAACAAAACA GTTGATGCCT" 6541 GAATTGCATG ATACATCCCT CAGAATGGCT 6601 TGGGAAGAAT CACGATCTTT CTTCTATAAG 6661 CTT6CAAAAG AAATTAGAGC TGTAGCAGGT 6721 CTGATCAA6A AATGGTATTC AGCTTCACAT 6781 GTTGCTTGGA TGGATAACCC TGAAAACTAC 6841 AGAGTATCCC AATCCCTCTC AAGTCTTTCA 6901 CAGGGTCTTT CCATGTTACT AGATAAGATG 6961 GAAATCAGGA AGGTCCTTGG TTGAATCATA 7021 TAGCTTGTGG ACCCTGTCGG ArrGTTGGTG 7081 ATGAAAGTGC AAGTCT6ATG ATTCATGATA 7141 GAGTGCTTGT TTACAAATGG TCCTTTATGA 7201 TACTATCATC TGTTAGACGC TGTAATTAGT 7261 AGCTGTTGAT TCAATTTTGG ACACGAATAA 7321 TGTGAAATAA ATTGTCTGTT GAGTTAACAC 7381 CTATTGTCCA TGAATACTBA TTGCGeAATC
AATWCATTG GTATGGTAGC TTGGACCTTG AGGGAGATTA TTGTTGTTGC AAATGATATT GAAGATGCAT TTTTTGAAGC TGTTACCAAC TATTTGGCAG CAAATTCTGG TGCTCGAATT CGTGTTGGGT GGTCTGATGA TGGCAGCCCT GAAGAAGACT ATQCTCGTAT TGGCACTTCT GGTGAAATTA GGTGGGTTAT TGATTCTGTT AATATACATG GAAGTGCTGC TATTGCCAGT ACACTTACAT TTGTGACTGG AAGAACTGTT ATCCGGTGCA TACAGCGTCT TGACCAGCCT AAGCTTCTTG GGCGGGAAGT GTACAGCTCC GCAACTAATG GTGTTGTCCA TCTTACTGTT TTGAGGTGGC TCAGTTATGT TCCTGCCTAC TTGGACCCAC CGGACAGACC TGTTGCATAC GCTATCCGTG GTGTTGATGA CAGCCAAGGG AGCTTTGTGG AAACATTTGA AGGTTGGGCT GGTGGAATTC CAGTGGGTGT GATAGCTGTG GCTGACCCTG GTCAGCTTGA TTCCCGTGAG TTTCCAGATT CTGCAACCAA GACTGCGCAG CCTCTGTTCA TCCTC6CTAA CTGGAGAGGC GGAATTCTTC AGGCTGGCTC GACTATTGTT TTTGTCTACA TTCCCATGGC TGCAGAGCTA AAGATAAACC CAGACCGCAT TGAGTGCTAT GAACCGCAAG GGTTAATTGA GATCAAGTTC CGGCTTGACC CAACATTAAT TGATCTGAAA AGTGCTGACA CAAAATCGCT" TCAAGAAAAT CTATATACTC AGATTGCGAT ACGGTTTGCT GCGAAAGGTG TGATTAAGAA AGTTGTGGAC AGATTACGGA GGAGGATCTC TGAGGATGTT GAGCAGTTTT CCCACCAACC A6CAATCGAG GCAGCTGAAT GGGATGATGA CGATGCTTTT AAGGATTATA TTCAATATCT TAAGGCTCAA GATTCCAGCT CAGATTTGCA AGCCCTGCCA GATCCCTCTA GAAGAGCTCA ACTTGTTGAA TGATGCCAAA ACTATTATTG GAGGCACAAA AGTGTATATT GGATTTGTTA GTTCTGCCAG CCGTCAGTTG GCAAGAACAC CGGTTAAGCT CAATCGTTGT TTCGCGCTAG TTCCGTGATC GAGTCTCCGC GGATCCACAG TATACGGTTG TATGATTTTG TAGGCATAAA TGCGTCTGTA ACAAGATGAC AATATGTTTG TGCTCTACTG AACCACATGC ATTAT
Белок АККаза пластины Oryza sativa Os05g22940 риса (C> press)
1 MTSTHVATLG VGAQAPPRHQ KKSAGTAFVS SGSSRPSYRK NGQRTRSLRE
51 E5NGGVSDSK KLNHSIRQGL AGIIDLPNDA ASEVDISHGS EDPRGPTVPG
101 SYQMNGIINE THNGRHASVS KVVEFCTALG GKTPIHSVLV ANNGMAAAKF
151 MRSVRTWAND TFGSEKAIQL IAMATPEDLR INAEHIRIAD QFVEVPGGTN
201 NNNYANVQLi VEIAERTGVS AVWPGWGHAS ENPELPDALT AKGIVFLGPP
251 ASSHHALGDK VGSALIAQAA GVPTLAWSGS HVEVPLECCL DSfPDEHYRK
301 ACVTTTEEAV ASCQVVGYPA MIKASWGGGG KGIRKVHNDD EVRTLFKQVQ
351 GEVP6SPIFI MRLAAQSRHL EVQLLCDQYG NVAALHSROC SVQRRHQKI1
401 EEGPVTVAPR ETVKELEQAA RRLAKAVGYV GAATVEYLYS NET6EYYFLE
451 LNPRLQVEHP VTEWIAEVNL PAAQVAVGMG IPLWOIPEIR RFYGMNHGGG
501 YDLWRKTAAL ATPFNFDEVD SKWPKGHCVA VRITSEDPDD GFKPTGGKVK
551 EISFKSKPNV WAYFSVKSGG GIHEFADSQF GHVFAYGTTR SAAITTMALA
601 LKEVQIRGEI HSNVDYTVDL LNASDFRENK IHTGWLDTRI AMRVQAERPP
651 WYISVVGGAL YKTVTANTAT V5DYVGYLTK GQIPPKHFSl VYTTVALNID
701 GKKYTIDTVR SGHGSYRLRM NGSTVDANVQ ILCDGGLLMQ LDGNSHVIYA
751 EEEAS6TRLL IDGKTCMLQN DHOPSKLLAE TPCKLLRFLV ADGAHVDADV
801 PYAEVEVMKM CMPLLSPASG ViHVVMSEGQ AMQAGDLIAR LDLDDPSAVK
351 RAEPFEDTFP QMGLPfAASG QVHKLCAASL NACRMILAGY EHDIDKVVPE
901 LVYCLOTPEL PFLOWEELMS VLATRLPRNL KSELEGKYEE YKVKFDSGII
951 NDFPANMLRV IIEENLACGS EKEKATNERL VEPLMSLLKS YEGGRESHAH
1001 FVVKSLFEEY LYVEELFSDG IQSDVIERLR LQHSKDLQKV VDIVLSHQSV
1051 RNKTKLILKL MESLVYPNPA AYRDOLIRFS SLNHKAYYKL ALKASELLEG
1101 TXLSELRARI ARSLSELEHF TEESKGLSMH KREIAIKESM EDLVTAPLPV
1151 EDALISLFDC 5DTTVQGRVI ETYIARLYQP HLVKDSIKMK WIESGVIALW
1201 EFPEGHFDAR NGGAVLGDKR WGAMVIVKSL ESLSMAIRFA LKETSHYTSS
1251 EGNMMHIALL GADMKMHIIQ ESGDDADRIA KLPLILKDNV TDLHASGVKT
1301 ISFIVQRDEA RMTMRRTFLW 5DEKL5YEEE PILRHVEPPL SALLELDKLK
1351 VKGYNEMKYT PSRDRQWHIY TLRNTENPKM L4RVFFRTLV RQPSVSNKFS
1401 SGQIGOMEVG SAEEPLSFTS TSILRSLMTA IEELELHAIR TGHSHMYLHV
1451 LKEQKLLDLV PVSGNTVLDV GQDEATAYSL LKEMAMKIHE LVGARMHHLS
1501 VCQWEVKLKL DCDGPASGTW RIVTTNVTSH TCTVQIYREM EDKESRKLVY
1551 HPATPAAGPL HGVALNNPYQ PLSVIDLKRC SARNNRTTYC YDFPLAFETA
1601 VRKSWSSSTS GASK6VENAQ CYVKATELVF ADKHGSWGTP LVQMDRPAGL
1651 NDIGMVAWTL KMSTPEFPSG RE 11 WAND I TFRAGSFGPR EDAFFEAVTN
1701 LACEKKLPLt YLAANSGARI GIADEVKSCF RVGW5DDGSP ERGFQYIYLS
1751 EEDYARIGTS VIAHKMQLDS GEIRWVIDSV VGKEDGLGVE NIHGSAAIAS
1801 AYSRAYKETF TLTFVTGRTV GIGAYLARLG 1RCIQRLDQP IILTGYSALN
1851 KLLGREVYSS HMQLGGPKIM ATNGVVHLTV SDDLEGVSNI LRWLSYVPAY
1901 IGGPLPVTTP LDPPDRPVAY IPENSCDPRA AIRGVDDSQG KWLGGMFDKO
1951 SFVETFEGWA KTVVTGRAKL GGIPVGVIAV ETQTMHQTIP ADPGQLDSRE
2001 QSVPRAGQVW FPDSATKTAQ ALLDFNREGL PLFILANWRG FSGGQRDLFE
2051 GILQA6STIV ENLRTYNQPA FVYIPMAAEL RGGAWVVVDS KINPDRIECY
2101 AERTAKGNVL EPQGLIEIKF RSEELQDCMS RLDPTLIDLK AKLEVANKNG
2151 SADTKSLQEN IEARTKQLMP LYTQIAIRFA ELHDT5LRMA AKGVIKKVVD
2201 WEESRSFFYK RLRRRISEDV LAKEIRAVAG EQFSHQPAIE LIKKWYSASH
2251 AAEWDDDDAF VAWMDNPENY KDYIQYLKAQ RVSQSLSSLS DSSSDLQALP
2301 QGLSHLLDKM DPSRRAOLVE EIRKVLG
Геномная ДНК АККаза пластиды Oryza sativa Os05g22940 риса - АР00821 1 обратео-1я> мпл:ементарный фрагмент
1 ТСАТТСТ7АТ АТАТТТТСАТ CTGTCA6ATT ТСАСАСАТСТ GGG6ATTTAT CTTCTCTTTG 61 TATGGCACTA CACATTTGAG AAACCGTGCA ATTCTACTGT TTGGTCAGCA GGACAACAAT 121 GACATCCACA CATGTGGCGA CATTGGGAGT TG6TGCCCAG GCACCTCCTC GTCACCAGAA 181 AAAGTCAGCT GGCACTGCAT TTGTATCATC TGGGTCATCA AGACCCTCAT ACCGAAAGAA 241 TGGTCAGCGT ACTCGGTCAC TTAGGGAAGA AAGCAATGGA GGAGTGTCTG АТТССААААА 301 GCTTAACCAC TCTATTCGCC AAGGTGACCA CTAGCTACTT TACATATGCT ATAATTTGTG 361 ССАААСАТАА ACATGCAATG GCTGCTATTA TTTAAACGTT AATGTTGAAA TAGCTGCTAT 421 AG6ATACAGC АААААТАТАТ AATTGACTGG GCAAGATGCA ACAATTGTTT TTCACTAAAG 481 TTAGTTATCT TTTGCTGTAA AAGACAACTG ТТТТТТАСАТ AAAATGGTAT ТААТААССТТ 541 GTAATATTCA ATGCAACATG TTCTCAAGTA ААААААААСА TTGCCTGGTT GTATAAGCAA 601 ATGTGTCGTT GTA6ACATCT ТАТТАААССТ TTTTGTGATA TCTATTACCG TAGGGAACAG 661 GGGAGCTGTT TAAATCTGTT ATCATAGAGT AATATGAGAA AAGTGGATTG TGCGACTTTG 721 GCATGTATAC CTGCTCAATT ТСАААТАТАТ GTCTATGTGC AGGTCTTGCT GGCATCATTG 781 АССТСССААА TGACGCAGCT TCAGAAC-TTG АТАТТТСАСА GTAAGGACTT ТАТАТТТТАТ 841 ААТААТТАТТ АТАТААТТТТ CTGACATGTT TTGAGAACCT CAAAACATGT GATTGCACCT 901 ТССТТТТГТА TGTCTGG'TTC AGAAACTGAT AAGTTTTGAC AGTGTTTAGG ATCGATCTTT 961 GATGCGCACA GTGCTTTCTA ATGTTTTCAT TTTTGAAAGT AATGTTTTAG GAAGAAATAT 1021 CTGATTAAAT ТТАТАСТТТА ТСТТТАСААА AGTCAAATGC GTTCTGTATC AATTGCGGTT 1081 TGTAATATGG CAAGAACATG CTTTCAGAAT ШТТСАТАС AATGCTTTCT Т7СТАТТАП 1141 ATGTAGAACA ААТАССТААТ ACTTTGTTCA CCTTTTATAG TGGACACCTC TCACAGCTTT 1201 TTCAGTAAGT GATGCAATTT TGTACATTTG TAAGATGTGT TCCAGAAACC TTTTCTCCTG 1261 СААТТСТААТ GTACCCACTC AAACTGGTAT CACCAAAGAT CTCCATCTGA TTGAAAAAAA 1321 GCTGCGTGAA GTATGC1TAT TTATGCTAAC CATACATGAT TTATACTGTT TTATAGTACA 1381 ATGCTTATTT ATGCTAACCA ТАСАТААТТТ TATTCTGTTT TCTAGTACAT TATTTGTGCC 1441 CCTGACCATA AATGATCCTT TCTTTTACAG TGGTTCCGAA GATCCCAGGG GGCCTACGGT 1501 CCCAGGTTCC TACCAAATGA AIGGGATTAT CAATGAAACA CATAATGGGA GGCATGCTTC 1561 AGTCTCCAAG GTTGTTGAGT T77GTACGGC ACTTGGTGGC ААААСАССАА T7CACAGTGT 1621 ATTAGTGGCC AACAATGGAA TGGCAGCAGC TAAGTTCATG CGGAGTGTCC GAACATGGGC 1681 TAATGATACT TTTGGATCAG AGAAGGCAAT TCAGCTGATA GCTATGGCAA CTCCG6AGGA 1741 TCTGAGGATA AATGCAGAGC ACATCAGAAT TGCCGATCAA TTTGTAGAGG TACCTGGTGG 1801 ААСАААСААС AACAACTATG CAAATGTCCA ACTCATAGTG 6AGGTTAGTT CAGCTCATCC 1861 СТСААСАСАА CATTTTCGTT TCTATTTAAG TTAGGGAAAA ATCTCTACGA СССТССААТТ 1921 TCTGAACATC СААТТТТСАС CATCAACTGC AATCACAGAT AGCAGAGAGA ACAGGTGTTT 1981 CTGCTG7TTG GCCTGGTTGG GGTCATGCAT CTGAGAATCC TGAACTTCCA GATGCGCTGA 2041 CTGCAAAAGG MTTGTTTTT CTTGGGCCAC CAGCATCATC AATGCATGCA TTAGGAGACA 2101 AGGTTGGCTC AGCTCTCATT 6CTCAAGCAG CTGGAGTTCC AACACTTGCT TGGAGTGGAT 2161 CACATGTGAG CCTTGTCTTC TCTTTTTTAG CTTATCATCT TATCTTTTCG GTGATGCATT 2221 ATCCCAATGA CACTAAACCA TAGGTG6AAG TTCCTCTGGA GTGTTGCTTG GACTCAATAC 2281 CTGATGAGAT GTATAGAAAA GCTTGTGTTA CIACCACAGA GGAAGCAGTT GCAAGTTGTC 2341 AGGTGGTTGG TTATCCTGCC ATGATTAAGG CATCTTGGGG TGGTGGTGGT AMGGAATAA
2401 GGAAGGTTTG TTCTTCTTGT AGTTATCAAG AGATTGTTTG GATTGCAAGT GTTTAGTGCC 2461 CATAGTTAAC TCT66TCTTT CTAACATGAG TAACTCAACT TTCTTGCAGG TTCATAATGA 2521 TGATGAGGTT AGGACATTAT TTAAGCAAGT TCAAGGCGAA 6TACCTGGTT ССССААТАГТ 2581 TATCATGAGG CTAGCTGCTC AGGTGGGGCC ГПТАТШАА GTTACACCTT TTCCCTTAAT 2641 GTTGAGTTAT TCCG6AGTTA TTATGGTTAT GTTCTGTATG TTTGATCTGT AAATTATT6A 2701 AATTCACCTC CATTGGTTCT CCAGATTAGC AGACCTACAA TTCTACATAT 6GTTTATACT 2761 TTATAAATAC TAGGATTTAG GGATCTTCAT ATAGTTTATA CATGGTATTT AGATTTCATT 2821 TGTAACCCTA TTGAAGACAT CCTGATTGTT GTCTTATGTA GAGTCGACAT CTT'GAAQTTC 2881 AGTTGCTTTG TGATCAATAT GGCAACGTAG CAGCACTTCA CAGTCGAGAT TGCAGTGTAC 2941 AACGGCGACA CCAAAAGGTC TGCTGTCTCA GTTAAATCAC СССТСТШТ 6ATCTACTTC 3001 TTGCCTGCTG CGTTGGTCAG AGGAATAATG GTTGTATTCT ACTGAACAGA TAATCGAGGA 3061 AGGACCAGTT ACTGTTGCTC CTCGTGAGAC TGTGAAAGAG CTTGAGCAGG CAGCACGGAG 3121 GCTTGCTAAA GCTGT &GGTT ATGTTGGTGC TGCTACTGTT GAATACCTTT ACAGCATGGA 3181 AACTGGTSAA TATTATTTTC TGGAACTTAA TCCACGGCTA CAGGTCGGCT CCTTTGACAT 3241 TCTTCAGGAA TTAATTTCTG TTGACCACAT GATTTACATT GTCAAATGGT CTCACAGGTT 3301 GAGCATCCTG TCACTGAGTG GATAGCTGAA GTAAATTTGC CTGCGGCTCA AGTTGCTGTT 3361 GGAATGGGTA TACCCCTTTG GCAGATTCCA GGTAATGCTT CTTCATTTAG TTCCTGCTCT 3421 TTGTTAATT6 AATGAGCTCT TATACAGACC ATGAGACACA TTCTACTGTT AATTCATA6T 3481 ATCCCCTGAC nGTTAGTGT TAGAGATACA GAGATGTATC ACAAATTCAT TGTATCTCCT 3541 CAAGGACTGT AAAAATCCTA TAATTAAATT TCTGAAAATT TGTTCTTTTA AGCAGAAAAA 3601 AAATCTCTAA ATTATCTCCC T6TATACAGA GATCA6GCGC TTCTACGGAA TGAACCATGG 3661 AGGAGGCTAT GACCTTTGGA GGAAAA.CAGC AGCTCTAGCG ACTCCATTTA ACTTTGATGA 3721 AGTAGATTCT AAATGGCCAA AAGGCCACTG CGTAGCTGTT AGAATAACTA GCGAGGATCC 3781 AGATGAT6GG TTTAAGCCTA CTGGT &GAAA AGTAAAGGTG CGGTTTCCTG AT6TTAGGTG 3841 TAT6AATTGA ACACATTGCT ATATTGCAGC TAGTGAAATG ACTGGATCAT GGTTCTCTTA 3901 TTTTCAGGAG ATAAGTTTCA AGAGTAAACC AAATGTTTGG GCCTATTTCT CAGTAAAGGT 3961 AGTCCTCAAT ATTGTTGCAC TGCCACATTA TTTGAGTTGT CCTAACAATT GTGCTGCAAT 4021 TGTTAGTTTT CAACTATTTG TTGTTCTGTT TGGTTGACTG 6TACCCTCTC TTTGCAGTCT 4081 GGTGGAGGCA TCCATGAATT CGCTGATTCT CAGTTCGGTA TGTAAAGTTA AAAGAGTAAT 4141 ATTGTCTTTG CTATTTATGT TTGTCCTCAC TTTTAAAAGA TATTGCCTTC CATTACAGGA 4201 CATGTTTTTG CGTATGGAAC TACTAGATC6 GCAGCAATAA CTACCATGGC TCTTGCACTA 4261 AAAGAGGTTC AAATTCGTGG AGAAATTCAT TCAAACGTAG ACTACACAGT TGACCTATTA 4321 AATGTAAGGA CTAAATATCT 6CTTATTGAA CCTTGCTTT7 TGGTTCCCTA ATGCCATTTT 4381 AGTCTGGCTA CTGAAGAACT TATCCATCAT &CCATTTCTG TTATCTTAAA TTCAGGCCTC 4441 AGATTTTAGA GAAAATAAGA TTCATACTGG TTGGCTGGAT ACCAGGATAG CCATGCGTGT 4501 TCAAGCT &AG AGGCCTCCAT GGTATATTTC AGTCGTTGGA GGGGCTTTAT ATGTAAGACA 4561 AACTATGCCA CTCATTAGCA TTTATGTGAA GCAAATGCGG AAAACATGAT CAATATGTCG 4621 TCTTATTTAA ATTTATTTAT TTTTGTGCTG CAGAAAACAG TAACTGCCAA CACGGCCACT 4681 GTTTCTGATT ATGTTGGTTA TCTTACCAAG GGCCAGATTC CACCAAAGGT ACTATTCTGT 4741 TTTTT'CAGGA TATGAATGCT 6TTTGAATGT GAAAACCATT GACCATAAAT CCTTGTTT6C 4801 AGCATATATC CCTTGTCTAT ACGACTGTTG CTTTGAATAT' AGATGGGAAA AAATATACAG 4861 TAAGTGTGAC ATTCTTAATG GGGAAACTTA ATTTGTTGTA AATAATCAAT ATCATATTGA
4921 стсетште CTSCATCATA GATCGATACT STSAGSAGTS GACATQGTAG CTACAGATTG
4981 CGAATGAATG GATCAACG6T TGACGCAAAT GTACAAATAT' TATGTGATGG TGGGCTTTTA 5041 AT6CAGGTAA TATCTTCTTC CTAGTTAAAG AAGATATATC TTGTTCAAAG AATTCTGATT 5101 ATTGATCTTT TAATGTTTTC AGCTGGATGG AAACAGCCAT GTAATTTATG CTGAAGAAGA 5161 GGCCAGTGGT ACACGACTTC TTATTGATGG AAAGACATGC ATGTTACAGG TAATGATAGC 5221 CTTGTTCTTT TTAGTTCTAG TCACGGTGTT TGCTTGCTAT TTGTTGTATC TATTTAATGC 5281 ATTCACTAAT TACTATATTA GTTTGCATCA TCAAGTTAAA ATGGAACTTC TTTCTTGCAG 5341 AATGACCATG ACCCATCAAA GTTATTAGCT GAGACACCAT GCAAACTTCT TCGTTTCTTG 5401 GTTGCTGAT6 GTGCTCATST TGATGCTGAT GTACCATATG CGGAAGTTGA 6GTTATGAAG 5461 ATGTGCATGC CCCTCTTATC ACCCGCTTCT GGTGTCATAC ATGTTGTAAT 6TCTGAGGGC 5521 CAA6CAATGC AGGTACATTC CTACATTCCA TTCATTGTGC TGTGCTGACA TGAACATTTC 5581 AAGTAAATAC CTGTAACTTG TTTATTATTC TAGGCTGGTG ATCTTATAGC TAGGCTGGAT 5641 CTTGATGACC CTTCTGCTGT TAAGAGAGCT GAGCCGTTCG AAGATACTTT TCCACAAATG 5701 GGTCTCCCTA TTGCTGCTTC TGGCCAAGTT CACAAATTAT GTGCTGCAAG TCTGAATGCT 5761 TGTCGAATGA TCCTTGCGGG GTATGAGCAT GATATTGACA AGGTAAACAT CATGTCCTCT 5821 TGTTTTTTCT TTTGTTTATC ATGCATTCTT ATGTTCATCA TGTCCTCTGG CAAATCTAGA 5881 TTCCGCTGTC GTTTCACACA GATTTTTCTC ATTCTCATAA TGGTGCCAAA CATAAATATG 5941 CTGCTATATT CATCAATGTT TTCACTCGAT TTCTAATTTT GCTTTTGAGT TTTAAACTTT 6001 AGTACAATCC ATATCTAATC TCCTTTGGCA ACAGTGAATC CATTATATAT ЛТТТТТАТТА 6061 AACTGCTTTC TTTITCAGGT TGTGCCAGAG TTGGTATACT GCCTAGACAC TCCGGAGCTT 6121 CCTTTCCTGC AGTGGGAGGA GCTTATGTC-T GTTTTAGCAA CTAGACTTCC AAGAAATCTT 6181 AAAAGT6AG6 TATATTATGG TTGACAAGAT AGCTAGTCTC ATGCTCTAAG GACTTGTACA 6241 TTTCGCCACA TAGGTTAATT TTCCATATCA AGTTCTAATG TACGATATAA AAGTAGTACT 6301 GGCCTAAAAC AGTATTGGTG GTTGACTATC TTTGTTGTGT AAGATCAAGT ATTTCTTTTT 6361 CATGCTTAGT TTGTCAATAC TTCACATTTA TCACTGACTT GTCGAGCTAA ATGAGATTTT 6421 ATTTGATTTC TGTGCTCCAT TATTTTTGTA TATATATATA ТАТАТТГААС TATGACTATA 6481 TGTTATGCCT CAAACGTTTC AAACTCTTTC AGTTGGAGGG CAAATATGAG GAATACAAAG 6541 TAAAATTTGA CTCTGGGATA ATCAATGATT TCCCTGCCAA TATGCTACGA GTGATAATTG 6601 AGGTCAGTTA TTCAATTTGT TGTGATAATC ACTGCCTTAA CT6TTC6TTC TTTTAACAAG 6661 CGGTTTTATA GGAAAATCTT GCATGTGGTT CTGAGAAGGA GAAGGCTACA AATGAGAGGC 6721 TTGTTGAGCC TCTTATGAGC CTACTGAAGT CATATGAGG3 TGGGAGAGAA AGTCATGCTC 6781 ACTTTGTTGT CAAGTCCCTT TTTGAGGAGT ATCTCTATGT TGAAGAATTG TTCAGTGATG 6841 GAATTCAGGT TAACTTACCT ATTCGCATTA AACAAATCAT CAGTTGTTTT ATGATAAAGT 6901 CAAAATGTTT ATATTTCCCA TTCTTCTGTS GATCAAATAT ATCACGGACA TGATATAGTT 6961 TCCTTAGGCT ATATAATGGT TCTTCATCAA ATAATATTGC AGGAAACAGT ATAGCAAACT 7021 ATTTGTATAT ACTCGAGATG GAAATT'GTTA GAAACATCAT TGACTAAATC TGTCCTTTGT 7081 TACGCTGTTT TTGTAGTCTG ATGTGATTGA GCGTCTGCGC CTTCAACATA GTAAAGACCT 7141 ACAGAAGGTC GTAGACATTG TGTTGTCCCA CCAGGTAAAT TTCTTCATGG TCTGATGACT 7201 TCACTGCGAA TGGTTACTGA ACTGTCTTCT TGTTCTGACA ATGTGACTTT TCTTTGTAGA 7261 GTGTTAGAAA TAAAACTAA8 CTGATACTAA AACTCATGGA GAGTCT6GTC TATCCAAATC 7321 CTGCTGCCTA CAGGGATCAA TTGATTCGCT TTTCTTCCCT TAATCACAAA GCGTATTACA 7381 AGGTGACCA6 GATAAACATA AATAAACGTG AATTTTTCAA T6ACCTTTTC TTCTGACATC
7441 TGAATCTGAT GMTTTCTTG CATATTAATA 7501 GAACAAACAA AACTTAGT6A GCTCC6TGCA 7561 ATGTTTACTG AGGAAAGCAA GGGTCTCTCC 7621 AGCATGGAAG ATTTAGTCAC TGCTCCACTG 7681 GATTGTAGTG ATACAACTGT TCAACAGAGA 7741 CAGGTATGAG AAGAAAGACC TTTTGAAATT 7801 ATGCTCATCA TTTCTTAAM .AAAGTTTACA 7861 TTAAAATAAA GTTACTTGTT GTGGA6AGAT 7921 CATGCTACTG CTCGATATGT TTGCTAA.CTT 7981 AAGGACAGTA TCAAAATGAA ATGGATAGAA 8041 GAAGGGCATT TTGATGCAAG AAATGGAGGA 8101 ATGGTCATTG TCAAGTCTCT ТШТСАСТТ 8161 ACATCACACT ACACTAGCTC TGAG6GCAAT 8221 AATAAGATGC ATATAATTCA AGAAAGGTAT 8281 TATATATGTA GTTAGCTGGT GfiAGTTCTGG 8341 TGATGCTGA.C AGAATAGCCA AACTTCCCTT 8401 TGCCTCTGGT GTGAAAACAA TAAGTTTCAT 8461 GCGTCGTACC TTCCTTTGGT CTGATGAAAA 8521 GCATGTGGAA CCTCCTCTTT CTGCACTTCT 8581 AATG7TTTGG TATGGCATTG ATTATCTTCT 8641 GATACAG6AC AAGTTGAAAG TGAAAGGATA 8701 TCGTCAATGG CATATCTACA CACTTAGAAA 8761 AT7TTTCCGA ACCCTTGTCA GGCAACCCAG 8821 TGGTGACATG GAAGTTGGGA GTGCTGAAGA 8881 AAGATCTTTG ATGACTGCTA TAGAGGAATT 8941 ACACATGTAT TTGCATGTAT TGAAAGAACA 9001 GTAAGTGCGC ATATTTCTTT TTGGGAACAT 9061 GATC'TTCTTA TCTTACTCAG GAATACAGH 9121 TATTCACTTT TAAAAGAAAT -GGCTATGAAG 9181 CATCTTTCTG TATGCCAATG GGAAGTGAAA 9241 GGTACCTGGA GGATTGTAAC AACCAATGTT 9301 TTAATCCTCT AGCATTTTGT TTTCTTTGGA 9361 CATACCCAGA CCTAGTGATC TTTATATAGT 9421 TTTAGATCTA CCGTGAGATG GAAGATAAAG 9481 CTCCGGCGGC TGGTCCTCTG CATGGTGTGG 9541 TCATTGATCT CAAACGCTGT TCTGCTAGGA 9601 CACTGGTGAG TTGACTGCTC CCTTATATTC 9661 TCATGTTGTC AAAATAAGCC GATGAAAATT 9721 GGAAGTCATG GTCCTCTAGT ACCTCTGGTG 9781 ATGTTAAAGC TACAGAGTTG GTATTTGCGG 9841 TTCAAAT6GA CC6SCCTGCT GGGCTCAATG 9901 TGTCCACTCC TGAATTTCCT AGTGGTAGGG
CAGTTGGCAC TTAAAGCTAG TGAACTTCTT AGAATAGCAA 6GAGCCTTTC AGA6CTGGAG ATGCATAAGC GAGAAATTGC CATTAAGGAG CCAGTTGAAG ATGCGCTCAT ТТСТТГАТТТ GTGATTGAGA CT7ATATAGC TCGATFATAC ATTTATATTA ACATATCCTA GTAAAACAGC GCACCTGATG TTTGGTTACT GACCGCATCA GTATTTTGGA ACTTGTGGCA CATGCAGTAA GACAACAATA TTTTTCAGCC TCATCTTGTA TCGGGTGTTA TTGCTTTATG GGAATTTCCT GCGGTTCTTG GTGACAAAAG ATGGGGTGCC TCAATGGCCA TTAGATTTGC ACTAAAGGAG AT6ATGCATA TTGCTTTGTT 6GGTGCTGAT GTTCATATGC TATGTTGGTG CTGAAATAGT TAATTAACCT ATCCCATTGT TCAGTGGTGA GATACTAAAG GATAATGTAA CCGATCTGCA TGTTCAAAGA GATGAAGCAC GGATGACAAT GCTTTCTTAT GAGGAAGAGC CAATTCTCCG TGAGTTGGTA CGTGATATCA TCAAAATGAT ATGCTCTTTG TATTTATTCA GCCTA1TGTG CAATGAAATG AAGTATACCC CATCACGGGA TACTGAAAAC CCCAAAATGT TGCACCGGGT TGTATCCAAC AAGTTTTCTT CGGGCCAGAT ACCTCTGTCA TTTACATCAA CCAGCATATT GGAGCTTCAC GCAATTAGAA CTGGCCATTC AAAGCTTCTT GATCTTGTTC CAGTTTCAGG ATGC'FTGCTT ATGAGGTTGG TCTTCTCAAT TTGGATGTTG GTCAAGATGA AGCTACTGCA ATACATGAAC TTGTTGGTGC AAGAATGCAC CTTAAGTTGG ACTGCGATGG TCCTGCCAGT ACTAGTCACA CTTGCACTGT GGATGTAAGT AAAGCATGTG ATTTTAAGCC GGCT6GTCCT GTAGACATTT TTCTAACTGC ТТТТААПбТ AATCACGGAA 6TTAGTATAC CATCCCGCCA CACTGAATAA TCCATATCAG CCTTTGAGTG ATAATAGAAC TACATACTGC TATGATTTTC AATGCATTAC CATAGCAAAT TCATATTCGT CAAAACTGTA GGCATTTGAA ACTGCAGTGA CTTCTAAAGG TGTTGAAAAT GCCCAATGTT ACAAACATGG GTCATGGGGC ACTCCTTTAG ACATTG6TAT 6GTAGCTTGG ACCTTGAAGA AGATTATTGT TGTTGCAAAT GATATTACGT
9961 TCA6AGCTGG ATCATT7GGC CCAAGGGAAG ATGCATTTTT TGAAGCTGTT ACCAACCTAG
10021 CCTGTGAGAA GAAACTTCCT СТТАТГТАТТ TGGCAGCAAA TTCTGGTGCT CGAATTGGCA
10081 TAGCAGATGA AGTGAAATCT TGCTTCCGTG TTGGGTGGTC TGATGATGGC AGCCCTGAAC
10141 GTGGGTTTCA GTACATTTAT CTAAGCGAAG AAGACTATGC TCGTATTGGC ACTTCTGTCA
10201 TAGCACATAA GATGCAGCTA GACAGTGGTG AAATTAGGTG GGTTATTGAT TCTGTTGTGG
10261 GCAAGGAAGA TGGACTTGGT GTGGAGAATA TACATGGAAG TGCTGCTATT GCCAGTGCTT
10321 ATTCTAGGGC ATATAAGGAG ACATTTACAC TTACATTTGT GACTGGAAGA ACTGTTGGAA
10381 TAGGAGCTTA TCTTGCTCGA CTTGGCATCC GGTGCATACA GCGTCTTGAC C.AGCCTATTA
10441 TTCTTACAGG CTATTCTGCA CTGAACAAGC TTCTTGGGCG GGAAGTGTAC AGCTCCCACA
10501 TGCAGTTGGG TGGTCCCAAA ATCATGGCAA CTAATGGTGT T6TCCATCTT ACTGTTTCAG
10561 ATGACCTT6A AGGCGTTTCT AATATAT7GA GGTGGCTCAG TTAT6TTCCT GCCTACATTG
10621 GTGGACCACT TCCAGTAACA ACACCGTTGG ACCCACCGGA CAGACCTGTT GCATACATTC
10681 CTGAGAACTC GTGTGATCCT CGAGCGGCTA TCCGTGGTGT TGATGACAGC CAAGGGAAAT
10741 GGTTAGGTGG TATGTTTGAT AAAGACAGCT TTGTGGAAAC ATTTGAAGGT TGGGCTAAGA
10801 CA6TGGTTAC TGGCAGAGCA AAGCTTGGTG GAATTCCAGT GGGTGTGATA GCTGTGGAGA
10861 CTCAGACCAT GATGCAAACT ATCCCTGCTG ACCCTGGTCA GCTT6ATTCC CGTGAGCAAT
10921 CTGTTCCTCG TGCTGGACAA GTGTGGTTTC CAGATTCTGC AACCAAGACT GCGCAGGCAT
10981 TGCTGGACTT CAACCGTGAA GGATTACCTC TGTTCATCCT CGCTAACTGG AGAGGCTTCT
11041 CTGGTGGACA AAGAGATCTT TTTGAAGGAA TTCTTCAGGC TGGCTCGACT ATTGTTGAGA
11101 ACCTTAGGAC ATACAATCAG CCTGCCTTT6 TCTACATTCC CATG6CTGCA GAGCTACGAG
11161 GAGGGGCTTG GGTTGTGGTT GATA6CAAGA TAAACCCAGA CCGCATTGAG TGCTATGCTG
11221 AGAGGACTGC AAAAGGCAAT GTTCTGGAAC CGCAAGGGTT AATTGAGATC AAGTTCAGGT
11281 CA6AGGAACT CCAGGATTGC ATGAGTCGGC TTGACCCAAC ATTAATTGAT CTGAAAGCAA
11341 AACTCGAAGT AGCAAATAAA AATGGAAGTG CTGACACAAA ATCGCTTCAA GAAAATATAG
11401 AAGCTCGAAC AAAACAGTTG ATGCCTCTAT ATACTCAGAT TGCGATACGG TTTGCTGAAT
11461 TGCATGATAC ATCCCTCAGA ATGGCTGCGA AAGGTGTGAT TAAGAAAGTT GTGGACTGGG
11521 AAGAATCACG АТС.ПТСТТС TATAAGAGAT TACGGAGGAG GATCTCTGAG GATGTTCTTG
11581 CAAAAGAAAT TAGAGCT6TA GCAGGTGAGC AGTTTTCCCA CCAACCAGCA ATCGAGCTGA
11641 TCAAGAAATG GTATTCAGCT TCACATGCAG CTGAATGGGA TGATSACGAT GCTTTTGTTG
11701 CTTGGATGGA ТААСССТШ AACTACAAGG АТТАТАТТСЛ ATATCTTAAG GCTCAAAGAG
11761 TATCCCAATC CCTCTCAAGT CTTTCAGATT CCAGCTCAGA TTTGCAAGCC CTGCCACAGG
11821 GTCTTTCCAT GTTACTAGAT AAGGTAATTA GCTTACTGAT GCTTATATAA ATTCTTTTTC
11881 ATTACATATG GCTGGAGAAC TATCTAATCA AATAATGATT ATAATTCCAA TCGTTCTTTT
11941 TATGCCATTA TGATCTTCTG АААТТТССГТ CTTTGGACAC TTATTCAGAT GGATCCCTGT
12001 AGAAGAGCTC AACTTGTTGA AGAAATCAGG AAGGTCCTTG GTTGAATCAT ATGATGCCAA
12061 AACTATTATT GGAGGCACAA ATAGCTTGTG GACCCTGTCG GATTGTTGGT GAGTGTATAT
12121 TG6ATTTGTT AGTTCTGCCA GATGAAAGTG CAAGTCTGAT GATTCATGAT A.CCGTCAGTT
12181 GGCAAGAACA CCGGTTAACC TGAGTGCTTG TTTACAAATG GTCCTTTATG ACAATCGTTG
12241 mrCGCGCTA GTTCCGTGAT CTACTATCAT CTGTTAGACG CTGTAATTAG TGAGTCTCCG
12301 CGGATCCACA GTATACGGTT GAGCTGTTGA. TTCMTTTTG GACACGAATA ATATGATTTT
12361 GTAGGCATAA ATGCGTCTGT ATGTGAAATA AATTGTCTGT TGAGTTAACA CACAAGATGA
12421 CAATATGTTT GTGCTCTACT GCTATTGTCC ATGAATACTG ATTGCGGAAT CAACCACATG
12481 CATTAT
EAZ336S5 - Транслированный белок АККазы пластиды Oryza sativa Os05g22940 риса Japonic а
1 MTSTHVATLG VGAQAPPRHQ KKSAGTAFVS SGSSRPSYRK NGQRTRSLRE
51 ESfiGGVSOSK KLUHSIRQGL AG IIP ЕРША ASEVDISHGS EOPRGPTVPG
1G1 SYQMNGIIKE THNGRHASVS KVVEFCTALG GKTPiHSVLV ANNGMAAMF
151 MRSVRTYIAND TFGSEKAIQL IAMATPEDLR IHAEHIRIAD QFVEVPGGTN
201 NMNYANVOLI VEIAERTGVS AVUPGWGHA5 ENPELPDALT AXGIVFLGPP
251 ASSHHAIGDK VGSAL.IAQAA GVPTL.AW5GS HVEVPLECCL DSIPDEMYRK
301 ACVTTTEEAV ASCQVVGYPA MIKASWGGGG KGIRKVHMDD EVRTLFKQVQ
351 GEVPGSPtN MRIAAQSRHL EVQL.LCDQYG NVAALHSRDC 5VQRRNQKII
401 EEGPVTVAPR ETYKELEQM RRLAKAVGYV GAATVEYLYS METGEYYFLE
451 LMPRLQVEHP VTEWIAEVNL PAAQVAVGMG IPLWQIPEIR RFYGMNHGGG
501 YDLWRKTAAL ATPFNFDEVD SKWPKGHCVA VRITSEDPDD GFKFTGGKVK
551 EISFKSKPNV WAYFSVKSGG GIHEFADSQF GHVFAYGTTR SAAITTMALA
601 LKEVQIRGEI HSNVDYTVDL LNASDFRENK IHTGWLDTR! AHRVQAERPP
651 WYISVVGGAL YKTVTANTAT VSDYVGYLTX GOIPPKHISL VYTTVALNID
701 GKKYTIOTYR SGHGSYRLRM NG5TVDANVQ ILCPGGLLMQ LOGNSHVIYA
751 EFEASGTRl.L IDGKTCM1.QN DHDPSKI..LAE TPCKLLRFLV ADGAHVUAW
801 PYAEVEVMKM CMPLLSPASG VIHVVMSEGQ AWOAGDLIAR LDLDDPSAVK
851 RAEPFEDTFP QMGLPIAA5G OVHKLCAA5L MACRHILAGY EHDIDKVVPE
901 LVYCLDTPEL PFLQWEELMS VLATRLPRNL KSELEGKYEE YKVKFDSGII
951 NDFPANMLRV IIEENLACGS EKEKATNERL VEPLMSLLKS YEGGRESHAH
1001 FVVKSLFEEY IYVEELFSOG IQSDVIERLR LQHSKOLQKV VOIVLSHQSV
1051 RNKTKLILKL MESLVYPNPA AYRDQLIRFS SLNHKAYYKL ALKASELLEQ
1101 TKLSELRARI ARSLSELEMF TEESKGLSMH KREIAIKESM EDLVTAPLPV
1151 EDALISLFDC SDTTVQQRVI ETYIARLYQP HLVKDSIKMK WIESGVIALW
1201 EFPEGHFOAR NGGAVLGDKR WGAMVIVKSL ESLSMAIRFA LKETSHYTSS
1251 EGKWHIALL GADNKMhUQ ESGDOADRIA KLPULKDNV TOLHASGVKT
1301 1SFIVQRDEA RMTMRRTFLW SDEKLSYEEE P1LRHVEPPL SALLELDKLK
1351 VKGYNEMKYT PSRDRQWHIY TLRNTENPKM LHRVFFRTLV RGPSVSNKF5
1401 SGQ1GDMEVG SAEEPLSFTS TSILRSLKTA IEELELHAIR TGHSHMYLHtf
1451 LKEQKLLDLV PVSGNTVLDV GQDEATAYSL LKEMAMKIHE IVGARMHHLS
1501 VCQWEVKLKL DCDGPASGTW RIVTTNVTSH TCTVDIYREM EDKESRKLVY
1551 HPATPAAGPL HGVALNNPYQ PLSVIDLKRC SARNNRTTYC YDFFLAFETA
1601 VRKSWSSSTS GASKGVENAQ CYVKATELVQ MDRLAGLMDI GMVAWTLKMS
1651 TPEFLSGREI IVVAND1TFR AGSFGPREDA FFEAVTNLAC EKKLPL'YLA
1701 AMSGARIGIA OEVKSCFRVG WSDDGSPERG FQY1YLSEED YAR1GTSVIA
1751 hXHOLOSGEI RWVIDSVVGK EDGLGVENIH GSMIASAYS RAYKETFTLT
1801 FVTGRTVGIG AYLARLGIRC IQRLOQPIlL TGYSALNKLL (c)EVYSSHMQ
1851 LGGPKIMATN GVVHLTVSDD LEGVSNILRW LSYVPAYIGG PLPVTTPLDP
1301 PDRPVAYIPE NSCDPRMIR GVDDSQGKWL GGMFDKDSFV ETFEGWAKTV
1951 VTGRAKLGGi PVGVIAVETQ TMNQT1PADP GGLDSREQSV PRAGGVWFPO
2001 SATKTAGALL DF'NREGLPLF 1LANWRGFSG GORDLFEG1L QAGS'TIVENL
2051 RTYNGPAFVY IPMAAELRGG AWWVDSKIN PDRIECYAER TAKGNVLEPQ
2101 GLIEIKFRSE ELQ0CM5RLD PTLIDLKAKL EVANK.NGSAD TXSLQENIEA
2151 RTKQIHPLYT QIAIRFAELH DTSLRMAAKG VIKKVVDWEE SRSFFYKRLR
2201 RR1SE0VLAK EIRAVAGEQF SHQPAIELIK KWYSASHAAE WDDDDAFVAW
2251 MDNPENYKDY IQYLKAQRVS QSLSSLSDSS SOLQALPQGL SHLLDKHDPS
2301 RRAGLVEEIR KVLG
ФИГУРА 26F
B9FK36 - Белок АККаза Oryza sativa
10 20 30 40 50 60
MTSTHVATLG VfiAQAPPRHQ KKSAGTAFVS SGSSRPSYRK IGQRTRSLRE ESMGGVSDSK
70 80 90 100 110 120
KLNHSIRQGL AGIIDLPiDA ASEVDISHGS EBPRGPTHP6 SYQMNGIINE THNGRHASVS
130 140 150 160 170 180
KVVEFCTALG GKTPIHSVLV ANNGMAAAKF MRSVRTWAND TFGSEKAIQL IAMATPEDLR
190 200 210 220 230 240
1NAEH1RIAD QFVEVPGGTN NNNYAHVQLI VEIAERTGVS AVUPGUGtttS ENPELPDALT
250 260 270 280 290 300
AffilVFLGPP ASSMHALGDK VGSALIAQAA GVPTLAWSGS HVEVPLECCL OSIPDEMYRK
310 320 330 340 350 360
ACVTPELAV ASCQVVGYPA MIKASWGGGG KGiRKVHNOD EVRTLFKQVQ GEVPGSPIFI
370 380 390 400 410 420
NRUWQSRHL EVQLLCDQYfi NVAALHSRDC SVQRRHQKH EEGPVTVAPR EWKELEQAA
430 440 450 460 470 480
RRLAKAVGYV GAATVEYLYS HETSEYYFLE LHPRLQVEHP VTEWIAEVNL PAAЈ)ҐAҐGHG
490 500 510 520 530 540
IPLWQIPEIR RFYGMNHGGG YDLWftKTAAL ATPFHFOEVD SKWPKGHCVA VRITSEDPDD
550 560 570 580 590 600
GFKPTGGKVK EISFKSKPNV WAYFSVKSGG GIHEFADSQF GHVFAYGTTR SAAITTHALA
§10 620 630 640 650 660
LKEVQIRGEI HSNVDYTVDL LNASDFRENK. IHTGWLDTRI AHRVQAERPP WYISVVGGAL
670 680 690 700 710 720
YKTVTANTAT VSDYVGYLTK GQIPPKHISL VYTTVALNID GKKYTIDTVR SGHGSYRLRM
730 740 750 7'60 770 780
NGSTVDANVQ RCOGGLLMQ LOGKSHVIYA EEEASGTRLL IDGKTCML.QN DMDPSKLLAE
ФИГУРА 26G-1
790 800 810 820 830 840
IPCKLLRPLV ADGAHVDADv" PYAEVEVMKM CMPLLSPASG VIHWMSEGQ AMQAGDLIAR
850 860 S70 880 890 900
LDLDDPSAVH RAEPFEDTFP QMGLPIAASG QҐMtCLCAA5L MACJWILAGY EHDIDKVVPE
910 920 930 940 950 960
LVYCLDTPEL PFLQWEELMS VLATRLPRNL KSELEGKYEE YKVKFDSGII NDFPANMLRV
570 980 990 1000 1010 1020
I1EENLAC6S EKEKAT1ERL VEPLMSLLKS ТЕШКЕЗШН FVVKSLFEEY LYҐEEiFSK
1030 1040 1050 1060 1070 1080
IQSDV1ERLR LQHSKDLQKV VDIVLSHQSV RHKTKLILKL HESLVYPNPA AYRDQLIRFS
1030 1100 1110 1120 1130 1140=
SLNHKAYYKL ALKASELLEQ TKLSELRARI ARSLSELEMF TEESKGLSMH KREIAIKESK
1150 1160 1170 1180 1190 1200
EDLVTAPLPV EDALISLFDC SOTTVQQRVI ETYIARLYQP HLVKDSIKMK WIESGVIALW
1210 1220 1230 1240 1250 1260
EFPEGHFDAR NQSAҐLGDKR WGAHVIVKSL ESLSMAIRFA LKETSHYT5S EGNMMHIALL
1270 12B0 1210 1300 1310 1320=
GAON'KMHIIQ ESGDOADRIA KLPLILKDNV TTJLHASGvKr 1SFIVQRDEA RMT№RTFLM
1330 1340 1350 1360 1370 1380
SOEKLSYEEE PIIRHVEPPL SALLELDKLK VKGYNEMKYT PSRORQWHIY TLRNTENPKM
1390 140=0 1410 1420 1430 1440
1,HRVFFRTLV RQPSVSNKFS SGQIGDMEVG SAEEPLSHS ISIL.RSLKTA IEELELHAIR
1450 1460 1470 1480 1490 1500
T6HSHMYLHV LKEQKLLDLV PVSGNTVLDV GQDEATAY5L LKEMAMKIHE LVGARMHHLS
1510 1520 1530 1540 1550 1560
VCQWEVKLXL DCOGPASGTW RIVTTNVTSH TCTVDIYREM EDKESRKLVY HPATPAAGPL
1570 15S0 1590 1600 1610 1620
HSVALNKPYQ PLSVIDLKRC SARNHRTTYC YDFPLAFETA VRKSWSSSTS 6ASK6ҐE"A0
ФИГУРА 26G-2
1630 1640 1650 1660 1670 1680
CYVKATELVF ADKHGSWGTP LVQHDRPAGL NDIGMVAWTL KMSTPEFPSG КПWAND!
1690 1700 1710 1720 1730 1740
TFRAGSFGPR EDAFFEAVTN LACEKKLPLI YLAANSGARI GIADEVKSCF RVGWSDDGSP
1750 1760 1770 1780 1790 1800
ERGFQYIYLS EEDYAftIG'I'S VIAHKMQLDS GEIRWVIDSV VGKEDGLGVT MIHGSAAIAS
1810 1820 1830 1840 1850 1860
AYSRAYKETF TLTFvTGRTV GIGAYLARLG IRCIGRLDQP IILTGYSALN KLLGREVYSS
1870 1880 1890 1900 1910 1920
HMQLGGPKIN ATNGVVHLTV SDDLEGVSNI LRWLSYVPAY IGGPLPVTTP LDPPORPVAY
1930 1940 1950 I960 1970 1980
IPEN5CDPRA AIRGVDDS06 KWLGGHFDKD SFVETFEGWA KTYVTGRAKL GGlPVfiVIAV
1990 2000 2010 2020 2030 2040
ETQTMMQTIP ADPGQLDSRE QSVPRAGQVW FPDSATKTAQ ALLDFMRE6L PLFILANWRG
2050 2050 2070 2080 2090 2100
FSfiSQRDLFE GILQAGSTIV ENLRTYNGPA FVYIPMAAEL RGGAWVVVDS KINPDRIECY
2110 2120 2130 2140 2150 2160
AERTAKGNVL EPOGLIEIKF RSEELQOCMS RLDPTLIDLK AKLEVANK.NG SADTKSLOEN
2170 2180 2190 2200 2210 2220
IEARTKQLMP LYTQIAIRFA EIHDT8LRHA AKGVIKKVVD WEESRSFFYK RLRRRISEDV
2230 2240 2250 2260 2270 2280
!.AKF IRAV'AG EQFSHQPAIE 1.1KKWYSASH AAEWDDODAF VAWMDNPENY KDYIQYLKAG
2290 2300 2310 2320
RVSQSLSSLS DSSSDLQALP QGLSMLLDKM DPSRRA-QLVE EIRKVLG
ФИГУРА 26G-3
101
104
104
[0340] Методы
123
124
[0350] Методы
[0350] Методы
126
126
127
127
[0362] Методы
129
128
131
131
150
150
<110>
<110>
<220>
<400> 35
gtgaccacct tcaccca
<400> 35
gtgaccacct tcaccca
<210> 40 <211> 22
<210> 40 <211> 22
<212> ДНК
<213> Искусственная последовательность
<212> ДНК
<213> Искусственная последовательность
<210> 45
<210> 45
<223> Описание искусственной последовательности: синтетический
<223> Описание искусственной последовательности: синтетический
полинуклеотид
полинуклеотид
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<213> Искусственная последовательность
<213> Искусственная последовательность
<210> 68 <211> 20
<210> 68 <211> 20
<212> РНК
<213> Искусственная последовательность
<212> РНК
<213> Искусственная последовательность
<210> 73
<210> 73
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 77
gauugauucu guugugggca
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 77
gauugauucu guugugggca
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 82
ggcuuauucu agggcauaua
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 82
ggcuuauucu agggcauaua
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 87
cgacuauugu ugagaaccuu
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 87
cgacuauugu ugagaaccuu
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 92
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 92
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 97
uaugcugaga ggacugcaaa
<400> 97
uaugcugaga ggacugcaaa
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 102
ugagaucaag uucaggucag
<400> 102
ugagaucaag uucaggucag
<223> Описание искусственной последовательности: синтетический
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
олигонуклеотид
<220>
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<213> Искусственная последовательность
<213> Искусственная последовательность
<210> 132 <211> 20
<210> 132 <211> 20
<212> РНК
<213> Искусственная последовательность
<212> РНК
<213> Искусственная последовательность
<213> Искусственная последовательность
<223> Описание искусственной последовательности: синтетический
полинуклеотид
<400> 142
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 150
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 150
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 155
uguguuuccg gucgguaaac
<400> 155
uguguuuccg gucgguaaac
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 160
acagcugcug uaacagccgc
<400> 160
acagcugcug uaacagccgc
<223> Описание искусственной последовательности: синтетический
<223> Описание искусственной последовательности: синтетический
олигонуклеотид
олигонуклеотид
<220>
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<213> Искусственная последовательность
<213> Искусственная последовательность
<210> 190 <211> 20
<210> 190 <211> 20
<212> РНК
<213> Искусственная последовательность
<212> РНК
<213> Искусственная последовательность
<210> 195
<210> 195
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 199
gcaacaacca aaucuccaau
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 199
gcaacaacca aaucuccaau
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 204
gucuucgcca guuuaccgac
<223> Описание искусственной последовательности: синтетический олигонуклеотид
<400> 204
gucuucgcca guuuaccgac
<223> Описание искусственной последовательности: синтетический
<223> Описание искусственной последовательности: синтетический
полинуклеотид
полинуклеотид
<213> Искусственная последовательность
<213> Искусственная последовательность
<400> 220
aagaagctga aaggctggaa ggagttgagg gaaggaacct tgagttgcct ccagcggctg
<400> 220
aagaagctga aaggctggaa ggagttgagg gaaggaacct tgagttgcct ccagcggctg
<223> Описание искусственной последовательности: синтетический полинуклеотид
<223> Описание искусственной последовательности: синтетический полинуклеотид
<220>
<223> Описание искусственной последовательности: синтетический
<220>
<223> Описание искусственной последовательности: синтетический
<211> 100
<211> 100
<212> РНК
<213> Искусственная последовательность
<212> РНК
<213> Искусственная последовательность
<400> 238
nnnnnnnnnn nnnnggagcg agcggagcgg tacanggnnn nnnnnnnn
<400> 238
nnnnnnnnnn nnnnggagcg agcggagcgg tacanggnnn nnnnnnnn
<220>
<223> Описание искусственной последовательности: синтетический олигонуклеотид
Lys Ser Ile Arg Asp Asp Gly Asp Gly Ser Val Pro Asp Pro Ala Gly
50 55 60
Lys Ser Ile Arg Asp Asp Gly Asp Gly Ser Val Pro Asp Pro Ala Gly
50 55 60
His Gly Gln Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro
65 70 75 80
His Gly Gln Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro
65 70 75 80
Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val
325 330 335
Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val
325 330 335
Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Glu Thr Arg Ser Ala
580 585 590
Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Glu Thr Arg Ser Ala
580 585 590
His Lys Arg Tyr Tyr Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu
1085 1090 1095
Ser Ala Tyr Ser Arg Ala Tyr Glu Glu Thr Phe Thr Leu Thr Phe
1790 1795 1800
Ser Ala Tyr Ser Arg Ala Tyr Glu Glu Thr Phe Thr Leu Thr Phe
1790 1795 1800
Val Thr Gly Arg Thr Val Gly Ile Gly Ala Tyr Leu Ala Arg Leu
1805 1810 1815
Val Thr Gly Arg Thr Val Gly Ile Gly Ala Tyr Leu Ala Arg Leu
1805 1810 1815
Gly Phe Ser Gly Gly Gln Arg Asp Leu Phe Glu Gly Ile Leu Gln
2030 2035 2040
Gly Phe Ser Gly Gly Gln Arg Asp Leu Phe Glu Gly Ile Leu Gln
2030 2035 2040
Glu Leu Arg Ala Gln Arg Val Ser Arg Leu Leu Ser Asp Val Ala
2270 2275 2280
Glu Leu Arg Ala Gln Arg Val Ser Arg Leu Leu Ser Asp Val Ala
2270 2275 2280
Gly Ser Ser Ser Asp Leu Gln Ala Leu Pro Gln Gly Leu Ser Met
2285 2290 2295
Gly Ser Ser Ser Asp Leu Gln Ala Leu Pro Gln Gly Leu Ser Met
2285 2290 2295
180
190
185
180
190
185
435
445
440
435
445
440
690 695 700
690 695 700
945
955
960
950
945
955
960
950
1190
1200
1195
1190
1200
1195
Thr Ala Ile Glu Glu Leu Glu Leu His Ala Ile Arg Thr Gly His
Thr Ala Ile Glu Glu Leu Glu Leu His Ala Ile Arg Thr Gly His
1430
1440
1435
1430
1440
1435
1670
1680
1675
1670
1680
1675
Thr Pro Leu Asp Pro Pro Asp Arg Pro Val Ala Tyr Ile Pro Glu
Thr Pro Leu Asp Pro Pro Asp Arg Pro Val Ala Tyr Ile Pro Glu
1910
1920
1915
1910
1920
1915
Asn Gly Ser Ala Asp Thr Lys Ser Leu Gln Glu Asn Ile Glu Ala
Asn Gly Ser Ala Asp Thr Lys Ser Leu Gln Glu Asn Ile Glu Ala
2150 2155 2160
2150 2155 2160
Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp
145 150 155 160
Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp
145 150 155 160
Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu
405 410 415
Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu
405 410 415
Gly Gly Ala Leu Tyr Lys Thr Val Thr Ala Asn Thr Ala Thr Val Ser
660 665 670
Gly Gly Ala Leu Tyr Lys Thr Val Thr Ala Asn Thr Ala Thr Val Ser
660 665 670
Val Thr Ala Pro Leu Pro Val Glu Asp Ala Leu Ile Ser Leu Phe
1145 1150 1155
Val Thr Ala Pro Leu Pro Val Glu Asp Ala Leu Ile Ser Leu Phe
1145 1150 1155
His Leu Thr Val Ser Asp Asp Leu Glu Gly Val Ser Asn Ile Leu
1865 1870 1875
Leu Asp Pro Thr Leu Ile Asp Leu Lys Ala Lys Leu Glu Val Ala
2120 2125 2130
Leu Asp Pro Thr Leu Ile Asp Leu Lys Ala Lys Leu Glu Val Ala
2120 2125 2130
<400> 252
<400> 252
Met Thr Ser Thr His Val Ala Thr Leu Gly Val Gly Ala Gln Ala Pro
1 5 10 15
Met Thr Ser Thr His Val Ala Thr Leu Gly Val Gly Ala Gln Ala Pro
1 5 10 15
Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val
260 265 270
Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val
260 265 270
Pro Phe Asn Phe Asp Glu Val Asp Ser Lys Trp Pro Lys Gly His Cys
515 520 525
Pro Phe Asn Phe Asp Glu Val Asp Ser Lys Trp Pro Lys Gly His Cys
515 520 525
Gln Asn Asp His Asp Pro Ser Lys Leu Leu Ala Glu Thr Pro Cys Lys
770 775 780
Gln Asn Asp His Asp Pro Ser Lys Leu Leu Ala Glu Thr Pro Cys Lys
770 775 780
Trp Glu Val Lys Leu Lys Leu Asp Cys Asp Gly Pro Ala Ser Gly
1505 1510 1515
Thr Met Met Gln Thr Ile Pro Ala Asp Pro Gly Gln Leu Asp Ser
1985 1990 1995
Thr Met Met Gln Thr Ile Pro Ala Asp Pro Gly Gln Leu Asp Ser
1985 1990 1995
Tyr Lys Arg Leu Arg Arg Arg Ile Ser Glu Asp Val Leu Ala Lys
2210 2215 2220
Tyr Lys Arg Leu Arg Arg Arg Ile Ser Glu Asp Val Leu Ala Lys
2210 2215 2220
160
160
ФИГУРА 1
ФИГУРА 1
2/43
2/43
3/43
3/43
3/43
5/43
5/43
5/43
5/43
5/43
5/43
5/43
5/43
5/43
ФИГУРА 7
ФИГУРА 7
ФИГУРА 7
ФИГУРА 7
ФИГУРА 8
ФИГУРА 8
ФИГУРА 8
ФИГУРА 8
ФИГУРА 8
ФИГУРА 8
ФИГУРА 10
ФИГУРА 10
ФИГУРА 10
ФИГУРА 10
ФИГУРА 10
ФИГУРА 10
ФИГУРА 11
ФИГУРА 11
ФИГУРА 12
ФИГУРА 12
15/43
15/43
15/43
15/43
15/43
15/43
15/43
15/43
15/43
15/43
17/43
17/43
17/43
17/43
20/43
20/43
21/43
21/43
21/43
21/43
21/43
21/43
21/43
21/43
23/43
24/43
24/43
27/43
27/43
ФИГУРА 2 6 A-1
ФИГУРА 2 6 A-1
28/43
28/43
фигура 2 6 A-2
фигура 2 6 A-2
29/43
29/43
ФИГУРА26А-3
ФИГУРА26А-3
30/43
30/43
ФИГУРА 26B
ФИГУРА 26B
31/43
31/43
ФИГУРА 26C-1
ФИГУРА 26C-1
32/43
32/43
ФИГУРА 2 6С-2
ФИГУРА 2 6С-2
33/43
33/43
ФИГУРА 26C-3
ФИГУРА 26C-3
34/43
34/43
ФИГУРА 26D
ФИГУРА 26D
35/43
35/43
ФИГУРА 26E-1
ФИГУРА 26E-1
36/43
36/43
ФИГУРА 2 6 Е-2
ФИГУРА 2 6 Е-2
37/43
37/43
ФИГУРА 26E-3
ФИГУРА 26E-3
38/43
38/43
ФИГУРА 26E-4
ФИГУРА 26E-4
39/43
39/43
ФИГУРА 26Е-5
ФИГУРА 26Е-5
40/43
4:1/43
42/43
4:1/43
43/43
43/43