EA201650071A1 20170331 Номер и дата охранного документа [PDF] EAPO2017\PDF/201650071 Полный текст описания [**] EA201650071 20150504 Регистрационный номер и дата заявки DE10 2014 106 327.9 20140507 Регистрационные номера и даты приоритетных заявок DE2015/200295 Номер международной заявки (PCT) WO2015/169314 20151112 Номер публикации международной заявки (PCT) EAA1 Код вида документа [PDF] eaa21703 Номер бюллетеня [**] TAL-ЭФФЕКТОРНАЯ НУКЛЕАЗА ДЛЯ ЦЕЛЕВОГО НОКАУТА ВИЧ-КОРЕЦЕПТОРА CCR5 Название документа [8] C12N 9/22, [8] C12N 15/90 Индексы МПК [GB] Мок Ульрике, [DE] Фесе Борис Сведения об авторах [RU] ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЭйДжиСиТи Сведения о заявителях
 

Патентная документация ЕАПВ

 
Запрос:  ea201650071a*\id

больше ...

Термины запроса в документе

Реферат

[RU]

Изобретение относится к новой TAL-эффекторной нуклеазе (TALEN) для прицельного нокаута ВИЧ-корецептора CCR5. В одном аспекте изобретение представляет пару TAL-эффекторных нуклеаз, включающую в себя первый и второй мономер TAL-эффекторной нуклеазы, причем каждый мономер TAL-эффекторной нуклеазы содержит эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий домен TAL-эффектора, имеющий множество единиц повтора, каждая из которых имеет вариабельные последовательности из двух аминокислотных остатков (Repeat Variable Diresidue, RVD), и при этом а) ДНК-связывающий домен TAL-эффектора первого мономера TAL-эффекторной нуклеазы связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG (SEQ ID NO: 1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG HD HD NG HD NI NG HD HD NG NN, и б) ДНК-связывающий домен TAL-эффектора второго мономера TAL-эффекторной нуклеазы связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT (SEQ ID NO: 2) и/или содержит RVD-последовательность NI NN NI NG NN NG HD NI NH NG HD NI NG NH HD NG HD NG NG.


Полный текст патента

(57) Реферат / Формула:

Изобретение относится к новой TAL-эффекторной нуклеазе (TALEN) для прицельного нокаута ВИЧ-корецептора CCR5. В одном аспекте изобретение представляет пару TAL-эффекторных нуклеаз, включающую в себя первый и второй мономер TAL-эффекторной нуклеазы, причем каждый мономер TAL-эффекторной нуклеазы содержит эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий домен TAL-эффектора, имеющий множество единиц повтора, каждая из которых имеет вариабельные последовательности из двух аминокислотных остатков (Repeat Variable Diresidue, RVD), и при этом а) ДНК-связывающий домен TAL-эффектора первого мономера TAL-эффекторной нуклеазы связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG (SEQ ID NO: 1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG HD HD NG HD NI NG HD HD NG NN, и б) ДНК-связывающий домен TAL-эффектора второго мономера TAL-эффекторной нуклеазы связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT (SEQ ID NO: 2) и/или содержит RVD-последовательность NI NN NI NG NN NG HD NI NH NG HD NI NG NH HD NG HD NG NG.


Евразийское (21) 201650071 (13) A1
патентное
ведомство
(12) ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ЕВРАЗИЙСКОЙ ЗАЯВКЕ
(43) Дата публикации заявки (51) Int. Cl. C12N 9/22 (2006.01)
2017.03.31 C12N15/90 (2006.01)
(22) Дата подачи заявки 2015.05.04
(54) TAL-ЭФФЕКТОРНАЯ НУКЛЕАЗА ДЛЯ ЦЕЛЕВОГО НОКАУТА ВИЧ-КОРЕЦЕПТОРА CCR5
(31) 10 2014 106 327.9
(32) 2014.05.07
(33) DE
(вв) PCT/DE2015/200295
(87) WO 2015/169314 2015.11.12
(71) Заявитель:
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЭйДжиСиТи" (RU)
(72) Изобретатель:
Мок Ульрике (GB), Фесе Борис (DE)
(74) Представитель:
Пустовалова М.Л., Котлов Д.В., Черняев М.А., Яремчук А.А. (RU)
(57) Изобретение относится к новой TAL-эффек-торной нуклеазе (TALEN) для прицельного нокаута ВИЧ-корецептора CCR5. В одном аспекте изобретение представляет пару TAL-эффектор-ных нуклеаз, включающую в себя первый и второй мономер TAL-эффекторной нуклеазы, причем каждый мономер TAL-эффекторной нуклеазы содержит эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связываю-щий домен TAL-эффектора, имеющий множество единиц повтора, каждая из которых имеет вариабельные последовательности из двух аминокислотных остатков (Repeat Variable Diresidue, RVD), и при этом а) ДНК-связывающий домен TAL-эффектора первого мономера TAL-эффекторной нуклеазы связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG (SEQ ID NO: 1) и/или содержит RVD-последовательность NH HD NG I NH NH NG HD NI NG HD HD NG HD NI NG HD | HD NG NN, и б) ДНК-связывающий домен TAL-эффектора второго мономера TAL-эффекторной нуклеазы связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT (SEQ ID NO:
2) и/или содержит RVD-последовательность NI NN
NI NG NN NG HD NI NH NG HD NI NG NH HD
NGHDNGNG.
\ (W)QQ@(NH)^)(m)QQ(m)@@(m)Q@(m)(m)Q@
^^^^^^^^^^^^^^^^^^^
GCTGGTCATCCTCATCCTG
AGATGTCAGTCATGCTCTT
. 5' штю!1^^^^^1шттшшштсшшжтшхшт у С) lllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll 3' тшю"сммш51шстаташтшк^^ 5'
TAL-эффекторная нуклеаза для целевого нокаута ВИЧ-корецептора CCR5
Изобретение относится к новой TAL-эффекторной нуклеазе (TALEN) для целевого нокаута ВИЧ-корецептора CCR5.
Помимо своей основной функции в клетке хемокиновый рецептор CCR5 играет важную роль при ВИЧ-инфекции. Он выступает в роли корецептора для так называемых CCRS-тропных штаммов ВИЧ, являясь посредником начальной ВИЧ-инфекции. Если на поверхности клетки Т-хелпера отсутствует CCR5, ВИЧ не может связаться с клеткой-хозяином, и инфицирование не происходит. Таким образом, гомозиготная делеция (CCR5A32) в гене CCR5, которая встречается, приблизительно, у 1 % западноевропейцев и "белых" американцев ("европеоиды"), практически полностью защищает от ВИЧ-инфицирования CCRS-тропными штаммами. Следовательно, CCR5 является очень интересной мишенью при лечении ВИЧ.
Прежние фармакологические подходы, направленные на блокаду CCR5, требуют пожизненного лечения в рамках комбинированной антиретровирусной терапии, APT. В долгосрочной перспективе это связано с возникновением потенциально тяжелых побочных эффектов, а также с отсутствием комплайэнса пациентов и развитием резистентности. Напротив, генетического разрушения ("нокаута") CCR5 (в плане генной терапии), в идеальном случае, было бы достаточно в качестве однократного лечения, так как генетическая защита распространяется на все дочерние клетки. Это подтверждается не только естественной резистентностью CCR5A32-roM03nroTHbix индивидов, но и описанными случаями успешного лечения ВИЧ-инфекции у так называемого "берлинского пациента" после аллогенной трансплантации стволовых клеток с CCR5A32-гомозиготными донорскими клетками (Hutter G et al. Long-term control of HIV by CCRDelta32/Delta32 stem-cell transplantation. N Engl J Med. 2009, 360: 692-698; Allers К et al. Evidence for the cure of HIV infection by CCR5A32/A32 stem cell transplantation. Blood 2011; 117: 2791-2799).
На основе этих наблюдений были разработаны концепции генетического нокаута CCR5 у ВИЧ -инфицированных пациентов. В настоящее время наиболее перспективные стратегии основаны на так называемых "дизайнерских нуклеазах" (см. например Manjunath N. et al., Newer Gene Editing Technologies toward HIV Gene Therapy, Viruses 2013, 5, 2748-2766). Эти дизайнерские нуклеазы состоят из двух компонентов: распознающего домена, который определяет специфичность в геноме и может быть практически полностью разработан без ограничений, и нуклеазного домена, который индуцирует двухцепочечный разрыв в выбранном месте генома. Негомологичное восстановление концов данного разрыва с помощью внутриклеточных систем быстрой репарации ДНК приводит к смещению (нарушению) открытой рамки считывания целевого
гена и, таким образом, в идеальном случае, к нокауту. Первыми широко применяемыми дизайнерскими нуклеазами были нуклеазы "цинковые пальцы" (ZFN). Например, "Sangamo Biosciences, lnc." в данное время тестирует разработанную ZFN ими CCR5-специфическую нуклеазу цинкового пальца под названием SB-728 (http://vvww.sangamo.com/pipeline/sb-728.html) для клинического применения (Tebas et al., Gene Editing of CCR5 in Autologous CD4 T Cells of Persons Infected with HIV. N Engl J Med 2014;370:901-10). Клинические исследования продемонстрировали осуществимость подхода, однако долгосрочный клинический эффект, выражаемый в виде вирусной нагрузки наблюдался только у испытуемого, который оказался гетерозиготным по естественной мутации CCR5A32.
TAL-эффекторные нуклеазы (эффекторные нуклеазы, подобные активаторам транскрипции, TALEN) являются следующим поколением дизайнерских нуклеаз
(см. например, Mussolino, С, Cathomen Т. TALE nucleases: tailored genome engineering made easy, Curr Opin Biotechnol. 2012, 23(5): 644-50; WO 2011/072246 A2; EP 2510096 A2; WO 2011/154393 A1; WO 2011/159369 A1; WO 2012/093833 A2; WO 2013/182910 A2).
По сравнению с ZFN они отличаются в том числе более высокой специфичностью, что значительно снижает риск таких нецелевых эффектов, как закрепление мутации в другом, отличном от желаемого, месте генома (Handel Е-М, Cathomen Т. Zinc-finger nuclease based genome surgery: it's all about specificity. Curr Gene Ther 2011, 11: 28-37; Mussolino С et alA novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity. Nucleic Acids Res. 2011; 39: 9283-9293).
CCRS-специфические TALEN уже известны (см., например, Mussolino С et al. A novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity. Nucleic Acids Res. 2011; 39: 9283-9293; WO 2011/146121 A1; WO 2012/093833 A2; US 2013/0217131 A1), клиническое исследование, однако пока еще не описано.
По-прежнему существует потребность в средствах для эффективного лечения ВИЧ-инфекции. Поэтому задачей изобретения является создание такого средства. В частности, задачей данного изобретения является создание препарата, при помощи которого может быть достигнут более эффективный нокаут ВИЧ-корецептора CCR5, чем созданный ранее.
Задача решается при осуществлении изобретения по п.1, а также других независимых пунктов формулы изобретения. Частные дополнительные варианты осуществления настоящего изобретения представлены в зависимых пунктах формулы.
В первом аспекте изобретение представляет пару TAL-эффекторных нуклеаз, которая включает в себя первый и второй мономер TAL-эффекторной нуклеазы, причем каждый мономер TAL-эффекторной нуклеазы содержит эндонуклеазный домен со II
типом эндонуклеазной активности и ДНК-связывающий домен TAL-эффектора, имеющий множество единиц повтора, каждая из которых имеет пару вариабельных аминокислот (Repeat Variable Diresidue, RVD), и при этом
а) ДНК-связывающий домен TAL-эффектора первого мономера TAL-эффекторной
нуклеазы связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG
(SEQ ID NO: 1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG
HD HD NG HD NI NG HD HD NG NN,
б) ДНК-связывающий домен TAL-эффектора второго мономера TAL-эффекторной
нуклеазы связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT
(SEQ ID NO: 2) и/или содержит RVD-последовательность NI NN NI NG NN NG HD NI NH
NG HD NI NG NH HD NG HD NG NG.
Пара TAL-эффекторных нуклеаз в соответствии с настоящим изобретением способна вызвать нокаут CCR5 в первичных Т-лимфоцитах с не имеющей себе равных эффективностью > 50%. К тому же, как ни удивительно, изобретение делает возможным последовательный биаллельный нокаут обеих CCRS-аллелей и, таким образом, обеспечивает полную защиту модифицированных клеток от проникновения ВИЧ, вопреки мнению ведущих экспертов в данной области техники, что это в настоящее время невозможно (..Consistent nuclease-mediated biallelic knockdown is not yet tenable", см. Kay, M.A. und Walker, B.D., 2014, Engineering Cellular Resistance to HIV, N Engl J Med 370:968969). Кроме того, было установлено, что TALEN-napa, в соответствии с изобретением, идеально подходит для доставки в клетку, основанной на трансфекции в виде мРНК (щадящего, безопасного и GMP-совместимого метода). Таким образом, изобретение впервые представляет основанное на дизайнерской нуклеазе средство для лечения ВИЧ, которое сочетает в себе высокую нокаут-эффективность и нокаут-селективность с низким уровнем нецелевых эффектов и другие, полезные с фармакологической точки зрения, свойства.
Под "TAL-эффекторная нуклеаза" или "TALEN" (эффекторные нуклеазы, подобные активаторам транскрипции) подразумевается гибридный белок, который содержит ДНК-связывающий домен TAL-эффектора (TALE) и ДНК-расщепляющий домен эндонуклеазы рестрикции. TAL-эффекторы представляют собой ДНК-связывающие белки, которые получаются из таких фитопатогенов, как Xanthomonas spp.
ДНК связывание TAL-эффекторов опосредовано через домен с переменным количеством (как правило, от 5 до 30) единиц повтора ("повторов"), которые, как правило, формируются из 33-35 аминокислот. Каждая единица повтора имеет два высоко вариабельных аминокислотных остатка (repeat-variable diresidue, RVD), расположенных, как правило, в позициях 12 и 13, и связывающихся только с одним основанием целевой
последовательности ДНК. Отношение между RVD и нуклеотидами целевой молекулы ДНК приводятся ниже.
RVD (однолитерный код) RVD (трехлитерный код) Нуклеотид(ы)
NH Asn-His G
HD His-Asp С
NG Asn-Gly T
NI Asn-lle A
NN Asn-Asn R (G, A)
NK Asn-Lys G
NS Asn-Ser N (A, C, G, T)
Под "RVD-последовательностью" здесь подразумевается непрерывная
последовательность RVD в одном ДНК-связывающем домене TAL-эффектора, в котором последовательность указана, если не указано иного, в направлении N-C, т.е. от N-конца к С-концу.
Очевидно, что в данном случае специалисту в данной области техники известно, что "RVD-последовательности" не следуют непосредственно друг за другом, поскольку они не связаны непосредственно друг с другом ковалентными связями, а непосредственно связаны между собой единицы повтора ("повторы"), в которых содержаться RVD, таким образом, соответствующие RVD отделены аминокислотами основной структуры единиц повтора.
Под "последовательностью-мишенью" здесь подразумевается нуклеотидная последовательность, как правило, последовательность ДНК, которая связана связывающим доменом TAL-эффектора.
Раскрытые в данном документе RVD-последовательности, каждая из которых состоит из 19 RVD, имеют следующие последовательности-мишени (в направлении 5'-3'; однолитерный код для аминокислот):
NH HD NG NH NH NG HD NI NG HD HD NG HD NI NG HD HD NG NN GCTGGTCATCCTCATCCTG (SEQ ID NO: 1)
NI NN NI NG NN NG HD NI NH NG HD NI NG NH HD NG HD NG NG AGATGTCAGTCATGCTCTT (SEQ ID NO: 2)
Под "единицей повтора" ("повтором") относительно связывающего домена TAL-эффектора здесь подразумевается непрерывная последовательность, как правило, из 3335, в основном 34 аминокислот, которые, кроме высоко вариабельных аминокислот RVD в
позициях 12 и 13, имеют практически идентичные аминокислотные последовательности. Вполне возможно, что и в консервативной основной структуре единицы повтора, т.е. по сути, в однородной структуре, в которую включены высоко вариабельные аминокислоты RVD, варьируют единичные аминокислоты, например, в позициях 4, 10 и/или 32 в единице повтора из 34 аминокислот. Типичная единица повтора может иметь, например, следующую последовательность аминокислот (подстрочные цифры определяют позицию внутри единицы повтора):
LTPX4QWAIX1oSX12X13GGKQALETVQRLLPVLCQX32HG (SEQ ID NO: 5)
X обозначает любую аминокислоту, при этом в позициях 12 и 13 стоят гипервариабельные аминокислоты RVD. В позиции 4 (Х4) могут стоять, например, аминокислоты Е, Q, D или А, в позиции 32 (Х32) - аминокислоты А или D. В позиции 10 может стоять, например, А или V. Примеры единиц повтора приводятся ниже (XX обозначает гипервариабельные аминокислоты RVD, вариабельные аминокислоты подчеркнуты):
LTPEQWAIASXXGGKQALETVQRLLPVLCQAHG (SEQ ID NO: 6) LTPQQWAIASXXGGKQALETVQRLLPVLCQAHG (SEQ ID NO: 7) LTPDQWAIASXXGGKQALETVQRLLPVLCQDHG (SEQ ID NO: 8) LTPAQWAIASXXGGKQALEWQRLLPVLCQDHG (SEQ ID NO: 9) LTPEQWAIVSXXGGKQALETVQRLLPVLCQAHG (SEQ ID NO: 10)
Связывающий домен TAL-эффектора может включать в себя один или несколько подобных вариантов единиц повтора, причем в расчет принимаются также комбинации различных вариантов.
Крайняя, ближайшая к нуклеазному домену единица повтора может содержать меньше, например, лишь первые 15,16,17,18,19 или 20 аминокислот остальных единиц повтора. Такая единица повтора называется "половинная единица повтора" или "полуповтор".
Под "ДНК-связывающим доменом" здесь подразумевается участок белка, который индуцирует связывание белка с молекулой ДНК. В случае ДНК-связывающего домена TAL-эффектора это происходит посредством описанных выше единиц повтора ("повторов").
Формулировку, согласно которой ДНК-связывающий домен TAL-эффектора связывается с последовательностью-мишенью, следует понимать так, что ДНК-связывающий домен TAL-эффектора за счет его RVD-последовательности специфично связывается с ДНК-последовательностью-мишенью. Вместе с тем не обязательно, хотя
предпочтительно, чтобы с каждым нуклеотидом последовательности-мишени был связан RVD в связывающем домене. Связь между RVD-последовательностью ДНК-связывающего домена TAL-эффектора и последовательностью-мишенью должна быть именно такой, чтобы произошло связывание с последовательностью-мишенью. "Специфично" в данном контексте означает, что связывание происходит в основном только с последовательностью-мишенью.
Под "мономером TAL-эффекторной нуклеазы" подразумевается TAL-эффекторная нуклеаза, которая состоит из одной единственной полипептидной цепи. Под "парой TAL-эффекторных нуклеаз" или "TALEN-парой" подразумевается TALEN, состоящая из двух мономеров TAL-эффекторной нуклеазы. Мономеры представляют собой левое или правое плечо TALEN, которые связывают противоположные нити ДНК и вместе вызывают разрыв ДНК в одном сайте.
Ссылка на TALEN-napy из "левой" или "правой" TALEN, или "левого" или "правого" TALEN-плеча отображает тот факт, что в одной TALEN-nape TALEN-мономеры используются попарно, т.е. вызывают разрыв нитей внутри двухцепочечной ДНК, так как один мономер связывается с последовательностью-мишенью смысловой нити, в то время как другой TALEN-мономер TALEN-пары связывается с последовательностью мишенью комплементарной антисмысловой нити, а именно таким образом, что нуклеазные домены направлены друг к другу, в одном общем участке ДНК, называемом "спейсер", располагаются между последовательностями-мишенями и каждый из нуклеазных доменов вызывает одноцепочечный разрыв. "Левый" и "правый" TALEN-мономеры являются частями определенной TALEN-пары, причем "левой" TALEN зачастую обозначают ту TALEN, которая связывается со смысловой нитью, в то время как "правая" TALEN связывается с комплементарной нитью. Тем не менее, ссылка на "левую" или "правую" TALEN, при этом, необязательно указывает на то, что "левая" TALEN связывается со смысловой нитью, а "правая" - с комплементарной нитью.
Таким образом, к данному изобретению относится также "TALEN-napa", т.е. пара из двух относящихся к изобретению мономеров, каждый из которых представляет левое или правое плечо TALEN. Также к данному изобретению относится пара TAL-эффекторных нуклеаз, содержащая мономер TAL-эффекторной нуклеазы, ДНК-связывающий домен TAL-эффектора которого связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG (SEQ ID NO: 1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG HD HD NG HD NI NG HD HD NG NN; и мономер TAL-эффекторной нуклеазы, ДНК-связывающий домен TAL-эффектора которого связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT (SEQ ID NO: 2) и/или содержит RVD-последовательность NI NN NI NG NN NG HD NI NH NG HD NI NG NH HD NG HD NG NG.
Под "эндонуклеазным доменом со II типом эндонуклеазной активности" подразумевается полипептид, который обладает ДНК-расщепляющей активностью нуклеазы рестрикции и разрезает ДНК внутри или в непосредственной близости от последовательности узнавания, не требующий АТФ и не обладающий активностью метилтрансфераз. Под "эндонуклеазным доменом с IIS типом эндонуклеазной активности" подразумевается домен эндонуклеазы II типа, сайт расщепления которого находиться в непосредственной близости от последовательности узнавания, но не внутри нее.
Под "CCR5" подразумевается человеческий С-С рецептор хемокина 5 (обозначаемый также CD195, CMKBR5 или CC-CKR5). Последовательность человеческого CCR5 показана в SEQ ID NO: 11 (см. номер доступа NC_018914.2 в базе данных NCBI).
Под "вектором" подразумевается система транспортировки для доставки в основном чужеродных нуклеиновых кислот в живую клетку-реципиента путем трансфекции или трансдукции. Под "вектором-переносчиком генов" подразумевается вектор, при помощи которого ген может быть введен в клетку. Векторы (-переносчики генов) хорошо известны специалистам. Примерами векторов-переносчиков генов являются плазмиды, вирусные векторы или мРНК.
Под "нуклеиновой кислотой" подразумевается полимер, мономерами которого являются нуклеотиды. Нуклеотид является соединением, состоящим из остатка сахара, азотсодержащего гетероциклического органического основания (нуклеотидного основания или нуклеооснования) и фосфатной группы. Остатком сахара, как правило, является пентоза, в случае ДНК это дезоксирибоза, в случае РНК это рибоза. Связь между нуклеотидами осуществляется через фосфатную группу при помощи фосфодиэфирных мостиков, как правило, между З'-углеродным атомом сахара нуклеозида (соединения сахара и нуклеооснования) и 5'-углеродным атомом сахара следующего нуклеозида. Термин "нуклеиновая кислота" включает, например, ДНК, РНК и ДНК/РНК-гибриды. В том смысле, в котором он используется здесь, термин "нуклеиновая кислота" относится, прежде всего, к изолированной нуклеиновой кислоте. Под "изолированной нуклеиновой кислотой" подразумевается синтетически изготовленная или извлеченная из ее естественной или изначальной среды нуклеиновая кислота.
Термин "включающий в себя" используется таким образом, что он определяет не только объект, который проявляет признаки, соответствующие исключительно данному понятию, но и объект, который проявляет признаки, соответствующие данному определению, а также дополнительные признаки. Определение объекта благодаря тому, что он включает в себя определенные признаки, включает также определение данного объекта по окончательному списку этих признаков, т.е. по наличию исключительно этих признаков.
В предпочтительном варианте относящейся к изобретению пары TAL-эффекторных нуклеаз, эндонуклеазный домен в каждом мономере TAL-эффекторной нуклеазы является С-концевым по отношению к ДНК-связывающему домену TAL-эффектора. Предпочтительно, каждый повтор, за исключением того, который примыкает непосредственно к эндонуклеазному домену, включает в себя 33-35 аминокислот, преимущественно 34 аминокислоты, причем RVD находятся в каждой единице повтора в позициях 12 и 13. Особое предпочтение отдается всем единицам повтора, за исключением "полуповторов" аминокислотной последовательности соответствующей SEW ID NO: 5, при чем в позиции 4 может стоять Е, Q, D или А, в позиции 10 может стоять А или V и в позиции 32 может стоять А или D. Основная структура единиц повтора может быть одинаковой или различной для всех единиц повтора. Относительно аминокислот возможны изменения одной или нескольких единиц повтора в позициях внутри основной структуры, например, в позициях 4, 10 и/или 32. Единица повтора, непосредственно примыкающая к эндонуклеазному домену, может включать меньшее число аминокислот, например, 15,16, 17, 18, 19 или 20, причем аминокислоты в этом случае собтветствуют преимущественно первым 15,16,17,18,19 или 20 аминокислотам в других повторах. При этом, например, аминокислота в позиции 4 может отличаться, быть, например, Е, Q, D или А, и/или может отличаться аминокислота в позиции 10, быть, например, V вместо А.
Особое предпочтение отдается эндонуклеазному домену мономера TAL-эффекторной нуклеазы эндонуклеазного домена IIS типа, особенно ДНК-расщепляющему домену эндонуклеазы Fokl. Аминокислотная последовательность для подходящего расщепляющего домена Fokl приведена в SEQ ID NO: 12. В расчет берется также другой расщепляющий домен эндонуклеазы II типа. Эндонуклеазы II типа известны специалистам, и подходящие расщепляющие домены могут быть определены при помощи рутинных исследований.
В особо предпочтительном варианте первый мономер TAL-эффекторной нуклеазы содержит аминокислотную последовательность, соответствующую SEQ ID NO: 3, а второй мономер TAL-эффекторной нуклеазы включает в себя аминокислотную последовательность, соответствующую SEQ ID NO: 4. В SEQ ID NO: 3 приведена левая TALEN (далее обозначаемая также CCR5-Uco-L или левое плечо CCR5-Uco), а в SEQ ID NO: 4 - правая TALEN (далее обозначаемая также CCR5-Uco-R или правое плечо CCR5-Uco) TALEN-пары, которые вместе вызывают двухцепочечный разрыв в ДНК-последовательности CCR5 внутри спейсера, расположенного между последовательностями-мишенями, соответствующими SEQ ID N0:1 и SEQ ID NO:2. Восстановление данного двухцепочечного разрыва происходит за счет клеточной репарационной системы (негомологичного соединения концов, НСК) с высокой вероятностью нарушения рамки считывания и, таким образом, к нокауту CCR5.
Во втором аспекте данное изобретение представляет также нуклеиновую кислоту, включающую в себя
а) первую нуклеиновую кислоту, которая кодирует первый мономер TAL-
эффекторной нуклеазы, где первый мономер TAL-эффекторной нуклеазы содержит
эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий
домен TAL-эффектора с множеством единиц повтора, каждая из которых имеет пару
вариабельных аминокислот (RVD), и при этом ДНК-связывающий домен TAL-эффектора
связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG (SEQ ID NO:
1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG HD HD NG HD NI NG HD HD NG NN , и
б) вторую нуклеиновую кислоту, которая кодирует второй мономер TAL-
эффекторной нуклеазы, где второй мономер TAL-эффекторной нуклеазы содержит
эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий
домен TAL-эффектора с множеством единиц повтора, каждая из которых имеет пару
вариабельных аминокислот (RVD), и при этом ДНК-связывающий домен TAL-эффектора
связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT (SEQ ID NO:
2) и/или содержит RVD-последовательность NI NN NI NG NN NG HD NI NH NG HD NI NG NH HD NG HD NG NG.
TALEN-мономеры, составляющие относящуюся к изобретению TALEN-napy, в данном аспекте изобретения кодируются вместе в общей нуклеиновой кислоте. На примере нуклеиновой кислоты, речь может идти о плазмиде или другом подходящем (переносчике генов) векторе. Подходящие векторы и способы их получения и применения хорошо известны на современном техническом уровне. При известных условиях нуклеиновая кислота наряду с TALEN-кодом может содержать и другие элементы, например, один или несколько промоторов, сигналы полиаденилирования и др.
TALEN-мономеры, составляющие относящуюся к изобретению TALEN-napy, могут также кодироваться в двух отдельных нуклеиновых кислотах. В третьем аспекте данное изобретение представляет комбинацию нуклеиновых кислот, включающую в себя
а) первую нуклеиновую кислоту, которая кодирует первый мономер TAL-
эффекторной нуклеазы, где первый мономер TAL-эффекторной нуклеазы содержит
эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий
домен TAL-эффектора с множеством единиц повтора, каждая из которых имеет пару
вариабельных аминокислот (RVD), и при этом ДНК-связывающий домен TAL-эффектора
связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG (SEQ ID NO:
1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG HD HD NG
HD NI NG HD HD NG NN , и
б) вторую нуклеиновую кислоту, которая кодирует второй мономер TAL-
эффекторной нуклеазы, где второй мономер TAL-эффекторной нуклеазы содержит
эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий домен TAL-эффектора с множеством единиц повтора, каждая из которых имеет пару вариабельных аминокислот (RVD), и при этом ДНК-связывающий домен TAL-эффектора связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT (SEQ ID NO: 2) и/или содержит RVD-последовательность N1 NN NI NG NN NG HD NI NH NG HD NI NG NH HD NG HD NG NG.
В случае и первой, и второй нуклеиновой кислоты, речь идет, предпочтительно о мРНК, особенно предпочтительно о консервированной мРНК (см. например, Kallen K.-J. et al., A novel, disruptive vaccination technology, Hum Vaccin Immunother. Oct 1, 2013; 9(10): 2263-2276, doi: 10.4161/hv.25181; Kallen K.-J. und TheB A., A development that may evolve into a revolution in medicine: mRNA as the basis for novel, nucleotide-based vaccines and drugs, Ther Adv Vaccines. Jan 2014; 2(1): 10-31, doi: 10.1177/2051013613508729). При известных условиях первая и вторая нуклеиновые кислоты наряду с TALEN-кодом могут содержать и другие элементы, например, один или несколько промоторов, сигналы полиаденилирования и др. мРНК, подходящие для левого и правого плеча, относящегося к изобретению TALEN, примерно указаны в SEQ ID NO: 17 и 18.
В случае мРНК, она транспортируется в клетку(и)-мишень(и), например, Т-лимфоциты, особое предпочтение отдается методу, описанному Berdien и др. (Berdien В et al., TALEN-mediated editing of endogenous T-cell receptors facilitates efficient reprogramming of T lymphocytes by lentiviral gene transfer, Gene Therapy, 2014, doi: 10.1038/gt.2014.26). Особое предпочтение отдается одновременному введению обоих плеч TALEN (правому и левому плечу) в клетку.
Введение относящихся к изобретению TALEN-nap при помощи мРНК имеет ряд несомненных преимуществ для клинического применения. Можно отказаться от использования вектора-переносчика генов на основе ДНК, что несомненно упростит изготовление и практическое использование. мРНК-опосредованная экспрессия TALEN настолько коротка, что мРНК очень быстро деградирует в клетке-мишени. Это дополнительно уменьшает риск возникновения нецелевых эффектов. Кроме того, клетки-мишени должны культивироваться весьма короткое время in vitro. Соответствующая технология легко приспосабливается к требованиям GMP. Ожидается, что, в противоположность к вирусным или плазмидным векторам, будут отсутствовать побочные эффекты, возникающие вследствие самого переноса генов (например, инсерционный мутагенез) или, возникшей в результате нежелательного внедрения вектора, длительной TALEN-экспрессии (нецелевые эффекты, активация TALEN-специфического иммунного ответа).
В дополнительных аспектах данное изобретение представляет вектор, в частности вектор-переносчик генов, включающий в себя относящуюся к изобретению нуклеиновую кислоту и изолированную клетку-хозяина, включающую в себя относящийся к
изобретению вектор, относящуюся к изобретению нуклеиновую кислоту или комбинацию нуклеиновых кислот, причем в отношении изолированных клеток-хозяев речь не идет о зародышевых клетках живого организма человека, в частности о зародышевых клетках человека или эмбриональных зародышевых клетках человека, а также и об эмбриональных стволовых клетках, при получении которых был или будет уничтожен человеческий эмбрион.
Еще в одном дополнительном аспекте данное изобретение представляет фармацевтическую композицию, включающую в себя нуклеиновую кислоту, комбинацию нуклеиновых кислот или вектор, которые соответствуют данному изобретению. Фармацевтический состав может содержать вспомогательные вещества, например, такие как растворители, усилители растворимости, растворы-ускорители, солеобразующие агенты, соли, буферы, вещества, влияющие на вязкость и консистенцию, гелеобразователи, эмульгаторы, солюбилизаторы, увлажнители, сепараторы, антиоксиданты, консерванты, наполнители, носители и т.д.
Еще в одном дополнительном аспекте данное изобретение представляет лекарственное средство, включающее в себя нуклеиновую кислоту, комбинацию нуклеиновых кислот или фармацевтическую композицию, которые соответствуют данному изобретению.
Далее приводятся пояснения к изобретению при помощи примеров выполнения и прилагаемых для большей наглядности рисунков.
Рис. 1. Схематическое изображение ДНК-связывающего домена относящейся к изобретению CCRS-специфической TALEN-пары ("CCR5-Uco") и ее последовательности-мишени в гене CCR5. Каждая нижняя строка указывает последовательность-мишень для а) левого и Ь) правого TALEN-плеча, каждая верхняя строка - RVD (repeat variable diresidues) соответствующих TALEN-мономеров в рамочке (аминокислоты указаны однолитерным кодом); с) отрезок (нуклеотиды 135-221 последовательности SEQ ID N0:11) ДНК CCR5 с комплементарной цепочкой. Последовательности-мишени левого (верхняя) и правого (нижняя, на комплементарной цепочке) плеч CCR5-Uco-TALEN выделены рамками.
Рис. 2. Сравнение эффективности между относящейся к изобретению CCR5-TALEN ("Uco") и контрольной CCR5-TALEN ("Мсо") из предшествующего уровня техники. Проводилось тестирование посредством трансфекции плазмид в CCRS-положительную клетку-репортер линии клеток 293Т. Для всех проверенных конструкций наблюдалась сравнимая эффективность трансфекции (на основе контртрансфекции eGFP). Нокаут CCR5 определялся на шестой день после трансфекции CCR5+ 293Т клетки клона при помощи специфических антител (анти-С0195-АРС-Су-7 антитела) (п=2). Для "тоск"-
контроля проводилась трансфекция клеток с иррелевантной контрольной плазмидой (pUC), которая не кодирует TALEN.
Рис. 3. CCR5 нокаут в первичных Т-лимфоцитах с CCR5-Uco после мРНК-трансфекции. После активации ex-vivo приблизительно половина первичных Т-лимфоцитов здорового пробанда экспрессировали CCR5 (= клетки справа от пунктирной линии, см. "нетрансфицированные"): а) После трансфекции CCRS-специфической TALEN (Uco) уменьшилась доля CCRS-положительных клеток с нарастающим количеством трансфицированных мРНК (обратно пропорционально). Ь) Контрольная трансфекция единичных TALEN-плеч, напротив, не приводит к уменьшению доли CCRS-положительных клеток. Нокаут CCR5 определялся на шестой день после мРНК-трансфекции при помощи специфических антител (anti-CD195-PerCP-Cy5.5 антитела), с) Анализ сайта-мишени CCR5-Uco-TALEN показал генетический нокаут в 9 из 17 (> 50%) проанализированных первичных Т-лимфоцитов.
Примеры
Была изготовлена и исследована относящаяся к изобретению CCR5-специфическая TALEN (далее "CCR5-Uco"). Относящаяся к изобретению TALEN отличается от описанной ранее TALEN в отношении последовательности-мишени, распознаваемой в гене CCR5 (см. рис.1).
По сравнению с кодон-оптимизированной CCR5-TALEN ("Мсо"; см. SEQ ID NO: 13, 14), основываясь на опубликованных работах лаборатории проф. Toni Cathomen (Фрайбург) (см. Mussolino С et al., A novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity, Nucleic Acids Res. 2011, 39: 9283-929), относящаяся к изобретению CCR5-Uco-TALEN показывает более высокий уровень индукции CCR5-HOKayTa после трансфекции плазмиды в линии клеток-репортеров (см. рис.2). Последовательность нуклеиновых кислот кодон-оптимизированных TALEN-элементов для использования в клетках человека основывается на публикациях группы ученых во главе с Feng Zhang (Zhang et al., Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription, Nature Biotechnology, 2011, 29, 149-153; Sanjana NE et al., A TAL Effector Toolbox for Genome Engineering, Nature Protocols, 2012, 7: 171-192).
Ниже приведены RVD-последовательности CCR5-Mco-TALEN в соответствии предшествующим техническим уровнем:
Левое плечо (L) = NN NG NN NN NN HD NI NI HD NI NG NN HD NG NN NN NG HD; Правое плечо (R) = HD NG NG HD NI NN HD HD NG NG NG NG NN HD NI NN NG NG.
Соответствующие последовательности распознавания на уровне ДНК: L на смысловой нити = GTGGGCAACATGCTGGTC (SEQ ID NO: 15);
R на антисмысловой нити = CTTCAGCCTTTTGCAGTT (SEQ ID NO: 16).
Длина спейсера составляет 15 нуклеотидов. Производство TALEN-плазмид также основывается на публикациях группы ученых во главе с Zhang F, или Sanjana NE и др. (см. выше).
При помощи мРНК-трансфекции (см. Berdien В et al., TALEN-mediated editing of endogenous T-cell receptors facilitates efficient reprogramming of T lymphocytes by lentiviral gene transfer, Gene Therapy, 2014, doi:10.1038/gt.2014.26) с относящейся к изобретению CCR5-Uco производится нокаут в первичных Т-лимфоцитах. (см. рис. 3). Последовательности нуклеиновых кислот используемых здесь мРНК указаны в SEQ ID NO. 17 и 18. В SEQ ID NO: 17 указана мРНК левого TALEN-плеча, в SEQ ID NO: 18 указана мРНК правого TALEN-плеча. Нуклеотиды 10-3225 мРНК в SEQ ID N0:17 и 18 кодируют каждое из TALEN-плеч (мономеры), аминокислотные последовательности которых указаны в SEQ ID NO: 3, 4.
Трансфецированная мРНК была создана при помощи Т7-промотора после Avrll-линеаризации вектора. Так как сайт расщепления Avrll 563bp находиться за стоп-кодоном, указанная последовательность больше чем открытая рамка считывания. После линеаризации соответствующие Uco-TALEN-ДНК используются в качестве матрицы для синтеза мРНК при помощи Т7 mScript(tm) Standard mRNA Production System от Cellscript (Madison, Wl 53713 USA). мРНК была оснащена 5'Cap-концом и Poly-A-концом в соответствии с руководством производителя. Трансфекция мРНК производится путем электропорации первичных Т-клеток в течение 10 мс при 300V. При помощи Mco-CCR5-TALEN, однако, не удалось реализовать CCR5-HOKayT в первичных Т-клетках или линиях Z-клеток (в то время как нокаут рецепторов Т-клеток был возможным, см. Berdien et al 2014, см. выше). Только с относящейся к изобретению CCR5-Uco-TALEN, при помощи мРНК-переноса, удалось выключить значительную часть > 50% CCR5-aллeлeй. Это позволяет предположить, что только достаточно активные TALEN способны выполнять свою функцию в первичных Т-клетках после мРНК-трансфекции. Таким образом, относящаяся к изобретению CCR5-TALEN особенно хорошо подходит для использования с помощью мРНК-трансфекции, что делает ее крайне привлекательной с точки зрения клинического применения.
Обзор последовательностей:
SEQ ID NO: Тип Описание
1 ДНК Последовательность-мишень TALEN CCR5-Uco L
2 ДНК Последовательность-мишень TALEN CCR5-Uco R
3 ПРТ TALEN CCR5-Uco L
4 ПРТ TALEN CCR5-Uco R
5 ПРТ Последовательность повтора (Консенсус)
6 ПРТ Последовательность повтора
7 ПРТ Последовательность повтора
8 ПРТ Последовательность повтора
9 ПРТ Последовательность повтора
10 ПРТ Последовательность повтора
11 ДНК hCCR5
12 ПРТ Fokl-домен расщепления
13 ПРТ TALEN CCR5-MCO L
14 ПРТ TALEN CCR5-MCO R
15 ДНК Последовательность-мишень TALEN CCR5-Mco L
16 ДНК Последовательность-мишень TALEN CCR5-Mco R
17 мРНК мРНК CCR5-Uco L
18 мРНК мРНК CCR5-UCO R
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ - ПРОИЗВОЛЬНЫЙ ТЕКСТ TALEN repeat = TALEN-единица повтора
Any amino acid, or E, Q, D or A = Любая аминокислота, или E, Q, D или A Any amino acid, or A or V = Любая аминокислота, или А или V Any amino acid, or A or D = Любая аминокислота, или А или D
Repeat variable diresidue (RVD) = Вариабельные последовательности из двух
аминокислотных остатков (RVD)
Fokl cleavage domain = Fokl - домен расщепления
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Общество с ограниченной ответственностью "ЭйДжиСиТи"
<12 0> TAL-ЭФФЕКТОРНАЯ НУКЛЕАЗА ДЛЯ ЦЕЛЕВОГО НОКАУТА ВИЧ-КОРЕЦЕПТОРА CCR5 <130> PAT 1473 PCT <150> DE102014106327.9
<151> 2014-05-07
<160> 18
<170> BiSSAP 1.3
<210> 1 <211> 19 <212> ДНК
<213> Homo sapiens
<400> 1
gctggtcatc ctcatcctg 19
<210> 2 <211> 19 <212> ДНК
<213> Homo sapiens
<400> 2
agatgtcagt catgctctt 19
<210> 3 <211> 1071 <212> ПРТ
<213> Искусственная последовательность
<220>
<223> CCR5-Uco-L <400> 3
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
240 Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
275 280 285
Ser Asn His Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
305 310 315 320
Leu
Leu
Pro
Val 340 Ala
Leu
Val
Ala
Ile 355
Leu
Ser
Gln
Arg 370 Val
Leu
Pro
Gln 385 Thr
Val
Ala
Ile
Val
Gln
Arg
Leu
405 Val
Pro
Glu
Gln
Val 420 Val
Leu
Glu
Thr 435 Pro
Gln
Leu
Thr 450 Ala
Glu
Gln
Gln 465 His
Leu
Glu
Thr
Gly
Leu
Thr
Pro 485
Gly
Lys
Gln
Ala 500 Gly
Leu
Gln
Ala
His 515 Gly
Leu
Asp
Gly 530
Lys
Gln
Leu
545 Ser
Cys
Gln
Ala
His
Asn
Gly
Gly
Gly 565 Gln
Pro
Val
Leu
Cys 580 His
Ile
Ala
Ser 595 Pro
Asp
Leu
Leu
610 Ala
Val
Leu
Val 625 Gln
Ile
Ala
Ser
Arg
Leu
Leu
Pro 645 Ile
Gln
Val
Val
Ala 660
Thr
Val
Gln 675
Arg
Leu
Ile Ala Ser Asn His Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val 345 350 Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
Asp
Gly
Gly 395 Gln
Lys
Gln
Leu
Cys 410
Ala
His
Ser 425
Asn
Ile
Gly
Gly
Pro
Val
Leu
Cys
Gln 445 Gly
Ile
Val
Ser
Asn 460 Val
Leu
Leu
Pro 475 Ile
Leu
Val
Ala 490
Ala
Ser
Gln 505 Gln
Arg
Leu
Leu
Pro
Val
Val
Ala
Ile 525
Leu
Thr
Val
Gln
Arg 540 Val
Pro
Glu
Gln 555 Thr
Val
Leu
Glu 570 Thr
Val
Gln
Leu
585 Gln
Pro
Glu
Gln
Ala
Leu
Glu
Thr 605 Pro
His
Gly
Leu
Thr 620 Ala
Gly
Lys
Gln 635 His
Leu
Gln
Ala 650 Gly
Gly
Leu
Gly 665
Gly
Lys
Gln
Leu
Cys
Gln
Ala
His 685
360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Glu
375 380
Ser His Asp Gly Gly Lys
390 395 400
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
415
Lys Gln
430
Pro Val Leu Cys Gln
440 Ala
455
Gln Arg
470 475 480
His Asp
495
Val Leu
510
Gln Val Val Ala Ile
520 Glu
535
Leu Thr
550 555 560
Arg Leu
575 Val Val 590
Gln Ala Leu Glu Thr
600 Ala
615
Ile Gly
630 635 640
Thr Pro
655
Ala Leu
670
Leu Cys Gln Ala His
680
690
Leu Glu Thr Val Gln Arg 705 710 Leu Thr Pro Glu Gln Val
725
Gln Ala Leu Glu Thr Val
740
His Gly Leu Thr Pro Glu 755
Gly Lys Gln Ala Leu Glu 770
Gln Ala His Gly Leu Thr 785 790 Asn Gly Gly Arg Pro Ala 805
Pro Asp Pro Ala Leu Ala 820
Ala Cys Leu Gly Gly Arg 835
Pro His Ala Pro Ala Leu 850
Arg Thr Ser His Arg Val 865 870 Glu Glu Lys Lys Ser Glu
885
Glu Tyr Ile Glu Leu Ile
900
Ile Leu Glu Met Lys Val 915
Arg Gly Lys His Leu Gly
930
Thr Val Gly Ser Pro Ile 945 950 Tyr Ser Gly Gly Tyr Asn 965
Arg Tyr Val Glu Glu Asn 980
Glu Trp Trp Lys Val Tyr 995
Phe Val Ser Gly His Phe 1010
Leu Asn His Ile Thr Asn 1025 1030 Leu Leu Ile Gly Gly Glu
1045 1050 1055
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
1060 1065 1070
<210> 4
<211> 1071 <212> PRT
<213> Искусственная последовательность
<220>
<223> CCR5-Uco-R
<400> 4
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
565 570 Pro Val Leu Cys Gln Ala His Gly Leu Thr
580 585 Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala 595 600
Leu Leu Pro Val Leu Cys Gln Ala His Gly
610 615
Val Ala Ile Ala Ser Asn His Gly Gly Lys
625 630
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
645 650 Gln Val Val Ala Ile Ala Ser His Asp Gly
660 665 Thr Val Gln Arg Leu Leu Pro Val Leu Cys
675 680 Pro Glu Gln Val Val Ala Ile Ala Ser Asn
690 695 Leu Glu Thr Val Gln Arg Leu Leu Pro Val 705 710 Leu Thr Pro Glu Gln Val Val Ala Ile Ala 725 730 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
740 745 His Gly Leu Thr Pro Glu Gln Val Val Ala
755 760 Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
770 775 780
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
785 790 795 800
Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg
805 810 815
Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu
820 825 830
Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu
835 840 845
Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu
850 855 860
Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu
865 870 875 880
Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His
885 890 895
Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg
900 905 910
Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr
915 920 925
Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr
930 935 940
Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala
945 950 955 960
Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln
965 970 975
Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn
980 985 990
Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu
995 1000 1005
Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg
1010 1015 1020
Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu
1025 1030 1035 1040
Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu
1045 1050 1055
Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
1060 1065 1070
<210> 5
<211> 34
<212> ПРТ
<213> Искусственная последовательность
<220>
<223> TALEN-единица повтора
<220>
<221> SITE <222> 4
<223> Xaa = Любая аминокислота, или E, Q, D или A
<220>
<221> SITE <222> 10
<223> Xaa = Любая аминокислота, или A или V
<220>
<221> SITE <222> 12..13
<223> Вариабельные последовательности из двух аминокислотных остатков (RVD)
<220>
<221> SITE <222> 32
<223> Xaa = Любая аминокислота, или A или D
<400> 5
Leu Thr Pro Xaa Gln Val Val Ala Ile Xaa Ser Xaa Xaa Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Xaa
20 25 30
His Gly
<210> 6 <211> 34 <212> ПРТ
<213> Искусственная последовательность
<220>
<223> TALEN-единица повтора
<220>
<221> SITE <222> 12..13
<223> Вариабельные последовательности из двух аминокислотных остатков (RVD)
<400> 6
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Xaa Xaa Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 7 <211> 34 <212> ПРТ
<213> Искусственная последовательность
<223> TALEN-единица повтора
<220>
<221> SITE <222> 12..13
<223> Вариабельные последовательности из двух аминокислотных остатков (RVD) <400> 7
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Xaa Xaa Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 8
<211> 34
<212> ПРТ
<213> Искусственная последовательность
<220>
<223> TALEN-единица повтора
<220>
<221> SITE <222> 12..13
<223> Вариабельные последовательности из двух аминокислотных остатков (RVD)
<400> 8
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Xaa Xaa Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 9
<211> 34 <212> ПРТ
<213> Искусственная последовательность
<220>
<223> TALEN-единица повтора
<220>
<221> SITE <222> 12..13
<223> Вариабельные последовательности из двух аминокислотных остатков (RVD)
<400> 9
Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Xaa Xaa Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 10 <211> 34 <212> ПРТ
<213> Искусственная последовательность
<220>
<223> TALEN-единица повтора
<220>
<221> SITE <222> 12..13
<223> Вариабельные последовательности из двух аминокислотных остатков (RVD)
<400> 10
Leu Thr Pro Glu Gln Val Val Ala Ile Val Ser Xaa Xaa Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 11 <211> 1059
<212> ДНК <213> Homo sapiens
<220>
<223> hCCR5 ДНК
<400> 11
atggattatc
aagtgtcaag
tccaatctat
gacatcaatt
attatacatc
ggagccctgc
caaaaaatca
atgtgaagca
aatcgcagcc
cgcctcctgc
ctccgctcta
ctcactggtg
120
ttcatctttg
gttttgtggg
caacatgctg
gtcatcctca
tcctgataaa
ctgcaaaagg
180
ctgaagagca
tgactgacat
ctacctgctc
aacctggcca
tctctgacct
gtttttcctt
240
cttactgtcc
ccttctgggc
tcactatgct
gccgcccagt
gggactttgg
aaatacaatg
300
tgtcaactct
tgacagggct
ctattttata
ggcttcttct
ctggaatctt
cttcatcatc
360
ctcctgacaa
tcgataggta
cctggctgtc
gtccatgctg
tgtttgcttt
aaaagccagg
420
acggtcacct
ttggggtggt
gacaagtgtg
atcacttggg
tggtggctgt
gtttgcgtct
480
ctcccaggaa
tcatctttac
cagatctcaa
aaagaaggtc
ttcattacac
ctgcagctct
540
cattttccat
acagtcagta
tcaattctgg
aagaatttcc
agacattaaa
gatagtcatc
600
ttggggctgg
tcctgccgct
gcttgtcatg
gtcatctgct
actcgggaat
cctaaaaact
660
ctgcttcggt
gtcgaaatga
gaagaagagg
cacagggctg
tgaggcttat
cttcaccatc
720
atgattgttt
attttctctt
ctgggctccc
tacaacattg
tccttctcct
gaacaccttc
780
caggaattct
ttggcctgaa
taattgcagt
agctctaaca
ggttggacca
agctatgcag
840
gtgacagaga
ctcttgggat
gacgcactgc
tgcatcaacc
ccatcatcta
tgcctttgtc
900
ggggagaagt
tcagaaacta
cctcttagtc
ttcttccaaa
agcacattgc
caaacgcttc
960
tgcaaatgct
gttctatttt
ccagcaagag
gctcccgagc
gagcaagctc
agtttacacc
1020
cgatccactg
gggagcagga
aatatctgtg
ggcttgtga
1059
<213> Planomicrobium okeanokoites
<223> FokI - домен расщепления
Leu
Glu
Glu
Lys
10 Ile
Lys
Ser
Glu
Leu
Arg
Ile
His
His
Glu
Tyr 25
Leu
Glu
Leu
Ile
Glu
Met
Ala
Arg
Ile
Arg
Glu
Met
Lys
Val
Gly
Glu
Phe
Tyr
Tyr
Gly
Lys
His
Leu
60 Pro
Gly
Ser
Arg
Thr
Val
Gly
Ser
Gly
Ile
Asp
Tyr
Gly
Ile
Ala
Tyr
Ser
Gly
Val
Tyr
Asn
Leu
Pro
Thr
Gln
Arg
Tyr 105
Trp
Glu
Glu
Asn
Gln 110 Pro
Arg
Asn
Glu 120
Phe
Trp
Lys
Val
Tyr 125 Phe
Ser
Ser
Leu
135 Arg
Val
Ser
Gly
His 140 Thr
Lys
Gly
Asn
Leu
Asn
His
Ile 155 Gly
Asn
Cys
Asn
Gly 160
Lys
Glu
Leu
Leu
Ile 170
Gly
Glu
Met
Ile 175
Glu
Glu
Val 185
Arg
Arg
Lys
Phe
Asn 190
Asn
Gly
<400> 12
Gln Leu Val Lys Ser Glu
1 5 Lys Leu Lys Tyr Val Pro
Arg Asn Ser Thr Gln Asp 35
Phe Met Lys Val Tyr Gly 50
Lys Pro Asp Gly Ala Ile 65 70 Val Ile Val Asp Thr Lys 85
Gly Gln Ala Asp Glu Met 100
Asn Lys His Ile Asn Pro
115
Val Thr Glu Phe Lys Phe 130
Tyr Lys Ala Gln Leu Thr 145 150 Ala Val Leu Ser Val Glu 165
Ala Gly Thr Leu Thr Leu 180
Glu Ile Asn Phe Arg Ser 195
<210> 13 <211> 1037
<212> ПРТ
<213> Искусственная последовательность
<220>
<223> CCR5-Mco-L <400> 13
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
His
Gly
Leu
Thr
Pro 315
Glu
Gln
Val
Val
Ala 320
Gly
Lys
Gln
Ala 330 Gly
Leu
Glu
Thr
Val
Gln 335 Gln
Arg
Gln
Ala
His 345 Gly
Leu
Thr
Pro
Glu 350 Glu
Val
Asp
Gly 360 Cys
Lys
Gln
Ala
Leu
365
Leu
Thr
Val
Leu
375
Gln
Ala
His
Gly 380
Thr
Pro
Glu
Ser
Asn
Ile
Gly
Gly 395 Gln
Lys
Gln
Ala
Leu
Glu 400 Thr
Pro
Val
Leu
Cys 410 Asn
Ala
His
Gly
Leu
415 Gln
Ile
Ala
Ser 425 Pro
Ile
Gly
Gly
Lys
430 Ala
Ala
Leu
Leu
440 Ala
Val
Leu
Cys
Gln 445 Asp
His
Gly
Val 455 Gln
Ile
Ala
Ser
His 460 Val
Gly
Gly
Lys
Arg
Leu
Leu
Pro 475 Ile
Leu
Cys
Gln
Ala 480 Gly
Gln
Val
Val
Ala 490 Arg
Ala
Ser
Asn
Ile 495
Leu
Thr
Val
Gln 505 Gln
Leu
Leu
Pro
Val 510 Ala
Cys
Pro
Glu 520 Glu
Val
Val
Ala
Ile 525
Leu
Ser
Asn
Leu
535
Thr
Val
Gln
Arg 540
Leu
Pro
Val
290
Pro Val Leu Cys Gln Ala 305 310 Ile Ala Ser Asn Asn Gly 325
Leu Leu Pro Val Leu Cys
340
Val Ala Ile Ala Ser His 355
Gln Arg Leu Leu Pro Val
370
Gln Val Val Ala Ile Ala 385 390 Thr Val Gln Arg Leu Leu 405
Pro Glu Gln Val Val Ala 420
Leu Glu Thr Val Gln Arg 435
Leu Thr Pro Glu Gln Val 450
Gln Ala Leu Glu Thr Val 465 470 His Gly Leu Thr Pro Glu 485
Gly Lys Gln Ala Leu Glu 500
Gln Ala His Gly Leu Thr 515
Pro
Glu
Gln 555 Thr
Val
Val
Leu
Glu 570 Thr
Val
Gln
Leu
585 Gln
Pro
Glu
Gln
Ala
Leu
Glu
Thr 605 Pro
His
Gly
Leu
Thr 620 Ala
Gly
Lys
Gln 635 His
Leu
Gln
Ala 650 Gly
Gly
Leu
Asn 665
Gly
Lys
Gln
Leu
Cys
Gln
Ala
His 685 Gly
Ser
Asn
Asn
Gly
Gly Gly Gly Lys Gln Ala 530
Leu Cys Gln Ala His Gly
545 550 555 560
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
565 570 575
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val 595 600
Leu Leu Pro Val Leu Cys Gln Ala
610 615 Val Ala Ile Ala Ser Asn Gly Gly
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly 675 680
700
Cys
Gln
Ala
His
Gly 720
Lys
Asn
Gly
Gly
Gly 735 Gln
Val
Leu
Cys 750 His
Ala
Ala
Ser 765 Ser
Asp
Gly
Leu
780 Val
Arg
Pro
Asp
Ala
Leu
Ala
Cys 800 His
Lys
Gly
Leu
Pro 815
Ile
Pro
Glu 830
Arg
Thr
Ser
Glu 845 Pro
Leu
Glu
Glu
Val 860 Gln
His
Glu
Tyr
Asp
Arg
Ile
Leu
880 Gly
Tyr
Gly
Tyr
Arg 895 Thr
Ala
Ile
Tyr 910 Ala
Val
Thr
Lys
925 Met
Tyr
Ser
Glu 940
Gln
Arg
Tyr
Asn
Pro
Asn
Glu
Trp 960 Val
Lys
Phe
Leu
Phe 975
Leu
Thr
Arg 990 Glu
Leu
Asn
Val
Glu 1005
Leu
Leu
Leu
Thr 102
Glu
Glu
Val
Arg
Ser
690 695
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
705 710 715
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
725 730 Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
740 745 His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
755 760 Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln
770 775
Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu
785 790 795
Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys
805 810 Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg
820 825 Ser His Arg Val Ala Gly Ser Gln Leu Val Lys 835 840
Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr
850 855
Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr
865 870 875
Glu Met Lys Val Met Glu Phe Phe Met Lys Val 885 890
Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
900 905 Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp
915 920 Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
930 935
Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
945 950 955
Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe
965 970 Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln
980 985 His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser
995 1000 Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu
1010 1015
Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1025 1030 1035
<210> 14 <211> 1037 <212> ПРТ
<213> Искусственная последовательность
<220>
<223> CCR5-Mco-R
<400> 14 Met Asp T 1
Lys
Tyr
Gln
Asp 100 Val
Met
Ile
Val
Gly 115 Thr
Gly
Leu
Leu
130 Gly
Val
Ala
Thr 145 Glu
Gln
Leu
Leu
Ala
Val
His
Ala 165 Gln
Leu
Thr
Pro
Glu 180 Glu
Gln
Ala
Leu
195
Thr
His
Gly 210
Leu
Thr
Pro
Gly 225 Gln
Lys
Gln
Ala
Leu
Ala
His
Gly
Leu
245 Gln
Gly
Gly
Gly
Lys
260 Ala
Leu
Cys
Gln 275
His
Ser
His 290 Val
Asp
Gly
Gly
Pro 305 Ile
Leu
Cys
Gln
Ala
Ser
Asn
Ile 325
Leu
Leu
Pro
Val 340 Ala
Leu
Val
Ala
Ile 355
Ser
Gln
Arg 370 Val
Leu
Leu
Pro
Gln 385 Thr
Val
Ala
Ile
Val
Gln
Arg
Leu
405 Val
Pro
Glu
Gln
Val 420 Val
Leu
Glu
Thr 435
Gln
Leu
Thr 450 Ala
Pro
Glu
Gln
Gln 465 His
Leu
Glu
Thr
Gly
Leu
Thr
Pro 485
Gly
Lys
Gln
Ala 500 Gly
Leu
Gln
Ala
His 515 Gly
Leu
Gly
Gly 530
Lys
Gln
Leu
545 Ser
Cys
Gln
Ala
His
Asn
Gly
Gly
Gly 565 Gln
Pro
Val
Leu
Cys 580
Ile
Ala
Ser
Asn
Asn
Ile
Ala
Ala
Leu
105 Ser
Pro
Lys
Gln
Trp 120
Gly
Gly
Glu 135 Ile
Leu
Arg
Gly
Lys
150 Trp
Ala
Lys
Arg
Arg
Asn
Ala
Leu
170 Ala
Val
Val
Ala
Ile 185
Leu
Val
Gln
Arg 200 Val
Leu
Glu
Gln 215 Thr
Val
Ala
Glu 230 Thr
Val
Gln
Arg
Pro
Glu
Gln
Val 250 Val
Ala
Leu
Glu
Thr 265 Pro
Gly
Leu
Thr 280 Ala
Glu
Lys
Gln 295 His
Leu
Glu
Ala 310 Gly
Gly
Leu
Thr
Gly
Lys
Gln
Ala 330 Gly
Cys
Gln
Ala
His 345 Gly
Asn
Asn
Gly 360
Lys
Val
Leu
375
Cys
Gln
Ala
Ala 390
Leu
Ser
His
Asp
Gly
Pro
Val
Leu
Cys 410 His
Ala
Ile
Ala
Ser 425 Pro
Arg
Leu
Leu
440 Ala
Val
Val
Val 455 Gln
Ile
Ala
Val 470 Glu
Arg
Leu
Leu
Gln
Val
Val
Ala 490
Glu
Thr
Val
Gln 505 Gln
Arg
Thr
Pro
Glu 520 Glu
Val
Ala
Leu
535
Thr
Val
Gly 550
Lys
Leu
Thr
Pro
Glu
Gln
Ala
Leu
Glu 570 Thr
Ala
His
Gly
Leu
585 Gln
Gly
Gly
Lys
Ala
Glu
Ala
Thr
His 110
Leu
95 Glu
Ala
Ala
Arg
Ala 125
Glu
Ala
Pro
Pro 140 Gly
Gly
Leu
Gln
Leu
Asp
Gly 155 Thr
Val Ala
Thr Pro
Ala
Leu
175 Gly
Val 160 Asn
Ser
His
Asp
Gly 190 Cys
Lys
Pro
Val
Leu
205
Gln
Ala
Ile
Ala 220
Ser
Asn
Gly
Gly
Leu
235 Val
Leu
Ala
Pro Ile
Val Ala
Leu
Ser 255
Cys 240 Asn
Gln
Arg
Leu
Leu
270 Ala
Pro
Val
Gln
Val
Val 285 Gln
Ile
Ala
Thr
Val 300 Glu
Glu
Arg
Leu
Leu
Pro 315
Leu
Gln Thr
Val Val
Val
Gln 335 Gln
Ala 320 Arg
Leu
Thr
Pro
Glu 350 Glu
Val
Gln
Ala
Leu
365
Thr
Val
His
Gly 380
Leu
Thr
Pro
Glu
Gly 395 Gln
Lys
Ala
Gln His
Ala Gly
Leu Leu
415 Gln
Glu 400 Thr
Asp
Gly
Gly
Lys
430 Ala
Ala
Leu
Cys
Gln 445 Gly
His
Gly
Ser
Asn 460 Val
Ala
Gly
Gly
Lys
Pro 475 Ile
Leu
Ser
Cys Asn
Gln
Gly 495
Ala 480 Gly
Leu
Leu
Pro
Val 510 Ala
Leu
Cys
Val
Ala
Ile 525
Ser
Asn
Gln
Arg 540 Val
Val
Leu
Leu
Pro
Val
Gln 555 Thr
Val Gln
Ala Arg
Ile
Leu
575 Val
Ala 560
Leu
Pro
Glu
Gln
Val 590 Val
Ala
Leu
Glu
Thr
Gln
Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
725 730 735
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
740 745 750
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
755 760 765
Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp
770 775 780
Lys
Gly
Leu
Pro 815
His
Ile
Pro
Glu 830
Leu
Arg
Thr
Ser
Glu 845
Glu
Glu
Val 860 Gln
Pro
His
Glu
Tyr
Asp
Arg
Ile
Leu
880 Gly
Tyr
Gly
Tyr
Arg 895 Thr
Ala
Ile
Tyr 910 Ala
Val
Thr
Lys
925
Tyr
Ser
Glu 940
Met
Gln
Arg
Tyr
Asn
Pro
Asn
Glu
Trp 960 Val
Lys
Phe
Leu
Phe 975
Leu
Thr
Arg 990 Glu
Leu
Asn
Val
Glu 100
Leu
Leu
Thr 1020
Leu
Glu
Glu
Val
Arg
Ser
Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys
785 790 795 800
Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys
805 810 Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg
820 825 Ser His Arg Val Ala Gly Ser Gln Leu Val Lys 835 840
Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr
850 855
Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr
865 870 875
Glu Met Lys Val Met Glu Phe Phe Met Lys Val 885 890
Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
900 905 Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp
915 920 Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
930 935
Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
945 950 955
Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe
965 970 Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln
980 985 His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser
995 1000 Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu
<210> 15
<211> 18
<212> ДНК <213> Homo sapiens
1010 1015
Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
1025 1030 1035
<400> 15
gtgggcaaca tgctggtc
<210> 16 <211> 18
<212> ПРТ
<213> Homo sapiens
<400> 16
Cys Thr Thr Cys Ala Gly Cys Cys Thr Thr Thr Thr Gly Cys Ala Gly
1 5 10 15
Thr Thr
<210> 17 <211> 3788 <212> ДНК
<213> Искусственная последовательность
<220>
<223> CCR5-Uco-L mRNA
<400> 17
ggggccacca uggacuauaa ggaccacgac ggagacuaca aggaucauga uauugauuac 60
aaagacgaug acgauaagau ggccccaaag aagaagcgga aggucgguau ccacggaguc 120
ccagcagccg uagauuugag aacuuuggga uauucacagc agcagcagga aaagaucaag 180
cccaaaguga ggucgacagu cgcgcagcau cacgaagcgc ugguggguca uggguuuaca 240
caugcccaca ucguagccuu gucgcagcac ccugcagccc uuggcacggu cgccgucaag 300
uaccaggaca ugauugcggc guugccggaa gccacacaug aggcgaucgu cggugugggg 360
aaacagugga gcggagcccg agcgcuugag gcccuguuga cggucgcggg agagcugaga 420
gggccucccc uucagcugga cacgggccag uugcugaaga ucgcgaagcg gggaggaguc 480
acggcggucg aggcggugca cgcguggcgc aaugcgcuca cgggagcacc ccucaaccug 540
accccagagc aggucguggc aauugcgagc aaccacgggg gaaagcaggc acucgaaacc 600
guccagaggu ugcugccugu gcugugccaa gcgcacggac uuacgccaga gcaggucgug 660
gcaauugcga gccaugacgg gggaaagcag gcacucgaaa ccguccagag guugcugccu 720
gugcugugcc aagcgcacgg acuaacccca gagcaggucg uggcaauugc gagcaacgga 780
gggggaaagc aggcacucga aaccguccag agguugcugc cugugcugug ccaagcgcac 840
ggguugaccc cagagcaggu cguggcaauu gcgagcaacc acgggggaaa gcaggcacuc 900
gaaaccgucc agagguugcu gccugugcug ugccaagcgc acggccugac cccagagcag 960
gucguggcaa uugcgagcaa ccacggggga aagcaggcac ucgaaaccgu ccagagguug 1020
cugccugugc ugugccaagc gcacggacug acaccagagc aggucguggc aauugcgagc 1080
aacggagggg gaaagcaggc acucgaaacc guccagaggu ugcugccugu gcugugccaa 1140
gcgcacggac uuacacccga acaagucgug gcaauugcga gccaugacgg gggaaagcag 1200
gcacucgaaa ccguccagag guugcugccu gugcugugcc aagcgcacgg acuuacgcca 1260
gagcaggucg uggcaauugc gagcaacauc gggggaaagc aggcacucga aaccguccag 1320
agguugcugc cugugcugug ccaagcgcac ggacuaaccc cagagcaggu cguggcaauu 1380
gugagcaacg gagggggaaa gcaggcacuc gaaaccgucc agagguugcu gccugugcug 1440
ugccaagcgc acggguugac cccagagcag gucguggcaa uugcgagcca ugacggggga 1500
aagcaggcac ucgaaaccgu ccagagguug cugccugugc ugugccaagc gcacggccug 1560
accccagagc aggucguggc aauugcgagc caugacgggg gaaagcaggc acucgaaacc 1620
guccagaggu ugcugccugu gcugugccaa gcgcacggac ugacaccaga gcaggucgug 1680
gcaauugcga gcaacggagg gggaaagcag gcacucgaaa ccguccagag guugcugccu 1740
gugcugugcc aagcgcacgg ccucacccca gagcaggucg uggcaauugc gagccaugac 1800
gggggaaagc aggcacucga aaccguccag agguugcugc cugugcugug ccaagcgcac 1860
ggacuuacgc cagagcaggu cguggcaauu gcgagcaaca ucgggggaaa gcaggcacuc 1920
gaaaccgucc agagguugcu gccugugcug ugccaagcgc acggacuaac cccagagcag 1980
gucguggcaa uugcgagcaa cggaggggga aagcaggcac ucgaaaccgu ccagagguug 2040
cugccugugc ugugccaagc gcacggguug accccagagc aggucguggc aauugcgagc 2100
caugacgggg gaaagcaggc acucgaaacc guccagaggu ugcugccugu gcugugccaa 2160
gcgcacggcc ugaccccaga gcaggucgug gcaauugcga gccaugacgg gggaaagcag 2220
gcacucgaaa ccguccagag guugcugccu gugcugugcc aagcgcacgg acugacacca 2280
gagcaggucg uggcaauugc gagcaacgga gggggaaagc aggcacucga aaccguccag 2340
agguugcugc cugugcugug ccaagcgcac ggacucacgc cugagcaggu aguggcuauu 2400
gcauccaaca acgggggcag acccgcacug gagucaaucg uggcccagcu uucgaggccg 2460
gaccccgcgc uggccgcacu cacuaaugau caucuuguag cgcuggccug ccucggcgga 2520
cgacccgccu uggaugcggu gaagaagggg cucccgcacg cgccugcauu gauuaagcgg 2580
accaacagaa ggauucccga gaggacauca caucgagugg cagguuccca acucgugaag 2640
agugaacuug aggagaaaaa gucggagcug cggcacaaau ugaaauacgu accgcaugaa 2700
uacaucgaac uuaucgaaau ugcuaggaac ucgacucaag acagaauccu ugagaugaag 2760
guaauggagu ucuuuaugaa gguuuaugga uaccgaggga agcaucucgg uggaucacga 2820
aaacccgacg gagcaaucua uacggugggg agcccgauug auuacggagu gaucgucgac 2880
acgaaagccu acagcggugg guacaaucuu cccaucgggc aggcagauga gaugcaacgu 2940
uaugucgaag aaaaucagac caggaacaaa cacaucaauc caaaugagug guggaaagug 3000
uauccuucau cagugaccga guuuaaguuu uuguuugucu cugggcauuu caaaggcaac 3060
uauaaggccc agcucacacg guugaaucac auuacgaacu gcaauggugc gguuuugucc 3120
guagaggaac ugcucauugg uggagaaaug aucaaagcgg gaacucugac acuggaagaa 3180
gucagacgca aguuuaacaa uggcgagauc aauuuccgcu cauaaaaaau cagccucgac 3240
ugugccuucu aguugccagc caucuguugu uugccccucc cccgugccuu ccuugacccu 3300
ggaaggugcc acucccacug uccuuuccua auaaaaugag gaaauugcau cacaacacuc 3360
aacccuaucu cggucuauuc uuuugauuua uaagggauuu ugccgauuuc ggccuauugg 3420
uuaaaaaaug agcugauuua acaaaaauuu aacgcgaauu aauucugugg aauguguguc 3480
aguuagggug uggaaagucc ccaggcuccc cagcaggcag aaguaugcaa agcaugcauc 3540
ucaauuaguc agcaaccagg uguggaaagu ccccaggcuc cccagcaggc agaaguaugc 3600
aaagcaugca ucucaauuag ucagcaacca uagucccgcc ccuaacuccg cccaucccgc 3660
cccuaacucc gcccaguucc gcccauucuc cgccccaugg cugacuaauu uuuuuuauuu 3720
augcagaggc cgaggccgcc ucugccucug agcuauucca gaaguaguga ggaggcuuuu 3780
uuggaggc 3788
<210> 18 <211> 3788 <212> ДНК
<213> Искусственная последовательность
<220>
<223> CCR5-Uco-R mRNA <400> 18
ggggccacca uggacuauaa ggaccacgac ggagacuaca aggaucauga uauugauuac 60
aaagacgaug acgauaagau ggccccaaag aagaagcgga aggucgguau ccacggaguc 120
ccagcagccg uagauuugag aacuuuggga uauucacagc agcagcagga aaagaucaag 180
cccaaaguga ggucgacagu cgcgcagcau cacgaagcgc ugguggguca uggguuuaca 240
caugcccaca ucguagccuu gucgcagcac ccugcagccc uuggcacggu cgccgucaag 300
uaccaggaca ugauugcggc guugccggaa gccacacaug aggcgaucgu cggugugggg 360
aaacagugga gcggagcccg agcgcuugag gcccuguuga cggucgcggg agagcugaga 420
gggccucccc uucagcugga cacgggccag uugcugaaga ucgcgaagcg gggaggaguc 480
acggcggucg aggcggugca cgcguggcgc aaugcgcuca cgggagcacc ccucaaccug 540
accccagagc aggucguggc aauugcgagc aacaucgggg gaaagcaggc acucgaaacc 600
guccagaggu ugcugccugu gcugugccaa gcgcacggac uuacgccaga gcaggucgug 660
gcaauugcga gcaacaacgg gggaaagcag gcacucgaaa ccguccagag guugcugccu 720
gugcugugcc aagcgcacgg acuaacccca gagcaggucg uggcaauugc gagcaacauc 780
gggggaaagc aggcacucga aaccguccag agguugcugc cugugcugug ccaagcgcac 840
ggguugaccc cagagcaggu cguggcaauu gcgagcaacg gagggggaaa gcaggcacuc 900
gaaaccgucc agagguugcu gccugugcug ugccaagcgc acggccugac cccagagcag 960
gucguggcaa uugcgagcaa caacggggga aagcaggcac ucgaaaccgu ccagagguug 1020
cugccugugc ugugccaagc gcacggacug acaccagagc aggucguggc aauugcgagc 1080
aacggagggg gaaagcaggc acucgaaacc guccagaggu ugcugccugu gcugugccaa 1140
gcgcacggac uuacacccga acaagucgug gcaauugcga gccaugacgg gggaaagcag 1200
gcacucgaaa ccguccagag guugcugccu gugcugugcc aagcgcacgg acuuacgcca 1260
gagcaggucg uggcaauugc gagcaacauc gggggaaagc aggcacucga aaccguccag 1320
agguugcugc cugugcugug ccaagcgcac ggacuaaccc cagagcaggu cguggcaauu 1380
gcgagcaacc acgggggaaa gcaggcacuc gaaaccgucc agagguugcu gccugugcug 1440
ugccaagcgc acggguugac cccagagcag gucguggcaa uugcgagcaa cggaggggga 1500
aagcaggcac ucgaaaccgu ccagagguug cugccugugc ugugccaagc gcacggccug 1560
accccagagc aggucguggc aauugcgagc caugacgggg gaaagcaggc acucgaaacc 1620
guccagaggu ugcugccugu gcugugccaa gcgcacggac ugacaccaga gcaggucgug 1680
gcaauugcga gcaacaucgg gggaaagcag gcacucgaaa ccguccagag guugcugccu 1740
gugcugugcc aagcgcacgg ccucacccca gagcaggucg uggcaauugc gagcaacgga 1800
gggggaaagc aggcacucga aaccguccag agguugcugc cugugcugug ccaagcgcac 1860
ggacuuacgc cagagcaggu cguggcaauu gcgagcaacc acgggggaaa gcaggcacuc 1920
gaaaccgucc agagguugcu gccugugcug ugccaagcgc acggacuaac cccagagcag 1980
gucguggcaa uugcgagcca ugacggggga aagcaggcac ucgaaaccgu ccagagguug 2040
cugccugugc ugugccaagc gcacggguug accccagagc aggucguggc aauugcgagc 2100
aacggagggg gaaagcaggc acucgaaacc guccagaggu ugcugccugu gcugugccaa 2160
gcgcacggcc ugaccccaga gcaggucgug gcaauugcga gccaugacgg gggaaagcag 2220
gcacucgaaa ccguccagag guugcugccu gugcugugcc aagcgcacgg acugacacca 2280
gagcaggucg uggcaauugc gagcaacgga gggggaaagc aggcacucga aaccguccag 2340
agguugcugc cugugcugug ccaagcgcac ggacucacgc cugagcaggu aguggcuauu 2400
gcauccaacg gagggggcag acccgcacug gagucaaucg uggcccagcu uucgaggccg 2460
gaccccgcgc uggccgcacu cacuaaugau caucuuguag cgcuggccug ccucggcgga 2520
cgacccgccu uggaugcggu gaagaagggg cucccgcacg cgccugcauu gauuaagcgg 2580
accaacagaa ggauucccga gaggacauca caucgagugg cagguuccca acucgugaag 2640
agugaacuug aggagaaaaa gucggagcug cggcacaaau ugaaauacgu accgcaugaa 2700
uacaucgaac uuaucgaaau ugcuaggaac ucgacucaag acagaauccu ugagaugaag 2760
guaauggagu ucuuuaugaa gguuuaugga uaccgaggga agcaucucgg uggaucacga 2820
aaacccgacg gagcaaucua uacggugggg agcccgauug auuacggagu gaucgucgac 2880
acgaaagccu acagcggugg guacaaucuu cccaucgggc aggcagauga gaugcaacgu 2940
uaugucgaag aaaaucagac caggaacaaa cacaucaauc caaaugagug guggaaagug 3000
uauccuucau cagugaccga guuuaaguuu uuguuugucu cugggcauuu caaaggcaac 3060
uauaaggccc agcucacacg guugaaucac auuacgaacu gcaauggugc gguuuugucc 3120
guagaggaac ugcucauugg uggagaaaug aucaaagcgg gaacucugac acuggaagaa 3180
gucagacgca aguuuaacaa uggcgagauc aauuuccgcu cauaaaaaau cagccucgac 3240
ugugccuucu aguugccagc caucuguugu uugccccucc cccgugccuu ccuugacccu 3300
ggaaggugcc acucccacug uccuuuccua auaaaaugag gaaauugcau cacaacacuc 3360
aacccuaucu cggucuauuc uuuugauuua uaagggauuu ugccgauuuc ggccuauugg 3420
uuaaaaaaug agcugauuua acaaaaauuu aacgcgaauu aauucugugg aauguguguc 3480
aguuagggug uggaaagucc ccaggcuccc cagcaggcag aaguaugcaa agcaugcauc 3540
ucaauuaguc agcaaccagg uguggaaagu ccccaggcuc cccagcaggc agaaguaugc 3600
aaagcaugca ucucaauuag ucagcaacca uagucccgcc ccuaacuccg cccaucccgc 3660
cccuaacucc gcccaguucc gcccauucuc cgccccaugg cugacuaauu uuuuuuauuu 3720
augcagaggc cgaggccgcc ucugccucug agcuauucca gaaguaguga ggaggcuuuu 3780
uuggaggc 3788
Формула изобретения
1. Пара TAL-эффекторных нуклеаз, включающая в себя первый и второй мономер TAL-эффекторной нуклеазы, причем каждый мономер TAL-эффекторной нуклеазы включает в себя эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий домен TAL-эффектора имеющий множество единиц повтора, каждая из которых имеет пару вариабельных аминокислот (Repeat Variable Diresidue, RVD), и при этом
а) ДНК-связывающий домен TAL-эффектора первого мономера TAL-эффекторной
нуклеазы связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG
(SEQ ID NO: 1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG
HD HD NG HD NI NG HD HD NG NN,
б) ДНК-связывающий домен TAL-эффектора второго мономера TAL-эффекторной
нуклеазы связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT
(SEQ ID NO: 2) и/или содержит RVD-последовательность NI NN NI NG NN NG HD NI NH
NG HD NI NG NH HD NG HD NG NG.
2. Пара TAL-эффекторных нуклеаз по п.1, в которой эдонуклеазный домен в каждом мономере TAL-эффекторной нуклеазы является С-концевым по отношению к ДНК-связывающему домену TAL-эффектора и каждый повтор, за исключением того, который примыкает непосредственно к эндонуклеазному домену, содержит от 33 до 35 аминокислот, предпочтительно 34 аминокислоты, в которых RVD находятся в положениях 12 и 13 в каждом повторе
3. Пара TAL-эффекторных нуклеаз по пп.1 или 2, в которой эндонуклеазный домен мономеров TAL-эффекторных нуклеаз является ДНК-расщепляющим доменом эндонуклеазы Fokl.
4. Пара TAL-эффекторных нуклеаз по пп.1-3, в которой первый мономер TAL-эффекторной нуклеазы содержит аминокислотную последовательность, соответствующую SEQ ID NO: 3, а второй мономер TAL-эффекторной нуклеазы содержит аминокислотную последовательность, соответствующую SEQ ID NO: 4.
5. Нуклеиновая кислота, включающая в себя:
а) первую нуклеиновую кислоту, которая кодирует первый мономер TAL-эффекторной нуклеазы, где первый мономер TAL-эффекторной нуклеазы содержит эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий
домен TAL-эффектора с множеством единиц повтора, каждая из которых имеет пару вариабельных аминокислот (RVD), и при этом ДНК-связывающий домен TAL-эффектора связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG (SEQ ID NO: 1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG HD HD NG HD NI NG HD HD NG NN , и
б) вторую нуклеиновую кислоту, которая кодирует второй мономер TAL-эффекторной нуклеазы, где второй мономер TAL-эффекторной нуклеазы содержит эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий домен TAL-эффектора с множеством единиц повтора, каждая из которых имеет вариабельные последовательности из двух аминокислотных остатков (RVD), и при этом ДНК-связывающий домен TAL-эффектора связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT (SEQ ID NO: 2) и/или содержит RVD-последовательность NI NN NI NG NN NG HD NI NH NG HD NI NG NH HD NG HD NG NG.
6. Вектор, включающий в себя нуклеиновую кислоту по п.5.
7. Комбинация нуклеиновых кислот, включающая в себя
а) первую нуклеиновую кислоту, которая кодирует первый мономер TAL-
эффекторной нуклеазы, где первый мономер TAL-эффекторной нуклеазы содержит
эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий
домен TAL-эффектора со множеством единиц повтора, каждая из которых имеет пару
вариабельных аминокислот (RVD), и при этом ДНК-связывающий домен TAL-эффектора
связывается с последовательностью-мишенью GCTGGTCATCCTCATCCTG (SEQ ID NO:
1) и/или содержит RVD-последовательность NH HD NG NH NH NG HD NI NG HD HD NG HD NI NG HD HD NG NN , и
б) вторую нуклеиновую кислоту, которая кодирует второй мономер TAL-
эффекторной нуклеазы, где второй мономер TAL-эффекторной нуклеазы содержит
эндонуклеазный домен со II типом эндонуклеазной активности и ДНК-связывающий
домен TAL-эффектора со множеством единиц повтора, каждая из которых имеет пару
вариабельных аминокислот (RVD), и при этом ДНК-связывающий домен TAL-эффектора
связывается с последовательностью-мишенью AGATGTCAGTCATGCTCTT (SEQ ID NO:
2) и/или содержит RVD-последовательность NI NN NI NG NN NG HD NI NH NG HD NI NG NH HD NG HD NG NG.
8. Комбинация нуклеиновых кислот по п.7, в которой первая нуклеиновая
кислота является первой мРНК и вторая нуклеиновая кислота является второй мРНК.
9. Комбинация нуклеиновых кислот по п.8, в которой первая нуклеиновая кислота включает последовательность, соответствующую SEQ ID NO: 17, а вторая нуклеиновая кислота включает последовательность, соответствующую SEQ ID N0:18.
10. Изолированная клетка-хозяин, включающая в себя нуклеиновую кислоту по п.5, комбинацию нуклеиновых кислот по пл.7-9 или вектор по п. 6, при условии, что клетка-хозяин не является зародышевой клеткой человека или эмбриональной зародышевой клеткой человека и не является эмбриональной стволовой клеткой, в процессе получения которых был или будет разрушен эмбрион человека
11. Фармацевтическая композиция, включающая в себя нуклеиновую кислоту по п.5, комбинацию нуклеиновых кислот по пп.7 - 9 или вектор по п.6.
12. Лекарственное средство, включающее в себя нуклеиновую кислоту по п. 5, комбинацию нуклеиновых кислот по любому из пп.7 - 9 или вектор по п.6 или фармацевтическую композицию п.11.
9.
GCTGGTCATCCTCATCCTG
AGATGTCAGTCATGCTCTT
5' TGTGimiQTlra^ 3'
пни
3' жссбташашА(жишс!йттасбта 5'
Рис. 1
ЮОп
х Ъ х
н го
сс и и
806040200
2x5|jg Плазмидной ДНК
771 2x10|jg Плазмидной ДНК
I 1 . Г/
mock (pUC) Mco-TALEN Uco-TALEN
Рис. 2
100 80
0 *
¦ю3
CCR5
Рис. За
CCR5
Рис. 3b
WT TTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCCTGATAAACTGCAAAAGGCTGAAGAGCATGACTGACATCTA^
II TTGGTTTTGTGGGCAACATGCTGGT^
|2 TTGGTTTTGTGGGCAACAT^^
13 TTGGTTTTGTGGGCAACATGCTGGT^
15 TTGGraGTGGGCAACATGCTGGTC^TCCTCATCCTGATAM
18 тто(тт(зт(ж^^
#10 TTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCCTAA- ---GGCTGAAGAGCATGACTGACATCTACCTGCT^^
III TTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCCTGATAAA- CTGAAGAGCATGACTGACATCTACCTGCT^
|12 TTGGTOTGTGGGCAACATGCTGGTCATCCTCATCC^Ti^-- GCATGACTGAOTTACCTGCTCMCCT^
113 ТТ66ТТта(ЖтШ6СТСАТССТСАТССТ6АТАА -АСТ(ШТСТАССТ(?^
114 TTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCCAGATG -ACTGACATCTACCTGCTCAACCTGGCCATCTCTGACCTG
115 ТШШШВЖКШШКШШт -АСТ(ШТСТАССТ(Г^
|1б TTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCCA- GATAAACT-GCCATCTCTGACCTG
#17 TTGGTTTTGTGGGCAACMCTGGTCGTCATCATG -ACTGACATCTACCTGCTCAACCTGGCCATCTCTGACCTG
(19)
<220>
<220>