EA201890611A1 20180831 Номер и дата охранного документа [PDF] EAPO2018\PDF/201890611 Полный текст описания [**] EA201890611 20160831 Регистрационный номер и дата заявки US62/212,999 20150901 Регистрационные номера и даты приоритетных заявок US2016/049745 Номер международной заявки (PCT) WO2017/040694 20170309 Номер публикации международной заявки (PCT) EAA1 Код вида документа [PDF] eaa21808 Номер бюллетеня [**] БИБЛИОТЕКИ МОДУЛЬНЫХ ПОЛИПЕПТИДОВ И СПОСОБЫ ИХ ПОЛУЧЕНИЯ И ПРИМЕНЕНИЯ Название документа [8] C40B 20/04, [8] C40B 30/04, [8] C40B 40/08, [8] C40B 50/06, [8] C12N 5/0783, [8] C12N 5/0784, [8] C12N 15/62, [8] C12N 15/63, [8] C07K 14/705 Индексы МПК [US] Лим Вендел А., [US] Койл Скотт М., [US] Гордли Рассел М., [US] Ройбал Коул Т. Сведения об авторах [US] ТЕ РИДЖЕНТС ОФ ТЕ ЮНИВЕРСИТИ ОФ КАЛИФОРНИЯ Сведения о заявителях
 

Патентная документация ЕАПВ

 
Запрос:  ea201890611a*\id

больше ...

Термины запроса в документе

Реферат

[RU]

В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследованиях в условиях in vitro и в условиях in vivo.


Полный текст патента

(57) Реферат / Формула:

В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследованиях в условиях in vitro и в условиях in vivo.


Евразийское (21) 201890611 (13) A1
патентное
ведомство
(12) ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ЕВРАЗИЙСКОЙ ЗАЯВКЕ
(43) Дата публикации заявки 2018.08.31
(22) Дата подачи заявки 2016.08.31
(51) Int. Cl.
C40B 20/04 (2006.01) C40B 30/04 (2006.01) C40B 40/08 (2006.01) C40B 50/06 (2006.01) C12N 5/0783 (2010.01) C12N 5/0784 (2010.01)
C12N 15/62 (2006.01) C12N 15/63 (2006.01)
C07K14/705 (2006.01)
(54) БИБЛИОТЕКИ МОДУЛЬНЫХ ПОЛИПЕПТИДОВ И СПОСОБЫ ИХ ПОЛУЧЕНИЯ И ПРИМЕНЕНИЯ
(31) 62/212,999
(32) 2015.09.01
(33) US
(86) PCT/US2016/049745
(87) WO 2017/040694 2017.03.09
(88) 2017.04.20
(71) Заявитель:
ТЕ РИДЖЕНТС ОФ ТЕ ЮНИВЕРСИТИ ОФ КАЛИФОРНИЯ
(US)
(72) Изобретатель:
Лим Вендел А., Койл Скотт М., Гордли Рассел М., Ройбал Коул Т. (US)
(74) Представитель:
Бадаева Т.Н., Фелицына С.Б. (RU)
(57) В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследованиях в условиях in vitro и в условиях in vivo.
1810182
БИБЛИОТЕКИ МОДУЛЬНЫХ ПОЛИПЕПТИДОВ И СПОСОБЫ ИХ ПОЛУЧЕНИЯ И ПРИМЕНЕНИЯ Перекрестная ссылка Настоящая заявка испрашивает приоритет согласно предварительной заявке на патент США №62/212999, поданной 1 сентября 2015 года, содержание которой полностью включено в настоящую заявку посредством ссылки.
Заявление об исследованиях, финансируемых из федерального бюджета Настоящее изобретение было выполнено при государственной поддержке в рамках грантов EY016546, Р50 GM081879, R01 СА196277, F32 GM006499 и R01 GM055040, присужденных Национальными институтами здравоохранения (США). Правительство США обладает определенными правами на настоящее изобретение.
Включение перечня последовательностей, предоставленного в виде текстового
файла, посредством ссылки Перечень последовательностей предоставлен в настоящей заявке в виде текстового файла "UCSF-518WO SeqList_ST25.txt", созданного 29 августа 2016 года и имеющего размер 145 килобайт. Содержимое текстового файла полностью включено в настоящую заявку посредством ссылки.
Введение
Многие эукариотические белки осуществляют свои функции с помощью модульных доменов или мотивов, которые контролируют или облегчают входные и выходные функции белка в целом. В настоящее время существуют способы перегруппировки и рекомбинации модульных доменов эукариотических белков, позволяющие создавать новые белки с измененными соотношениями входных/выходных функций и совершенно новыми общими функциями. Успешное конструирование отдельных модульных белков путем простой рекомбинации доменов, опосредующих входные и выходные функции, послужило доказательством принципа упомянутого модульного подхода к разработке новых белков.
Конструирование новых синтетических белков, например, для применения в терапевтических клетках, до настоящего времени осуществляли на основании подхода последовательного создания конструкций. Аналогичным образом, трансфекцию и скрининг таких синтетических белков также выполняли с использованием низкопроизводительного подхода, используя отдельные конструкции, которые подвергали скринингу на индивидуальной основе, или, в некоторых случаях, небольшое количество отдельных конструкций подвергали одновременному скринингу. Одновременный
скрининг, несмотря на то, что он является более эффективным, чем скрининг отдельных конструкций на индивидуальной основе, имеет ограниченную масштабируемость вследствие требования, заключающегося в том, что отдельные конструкции должны оставаться физически раздельными, чтобы облегчить окончательную идентификацию эффективных конструкций. Индивидуальный скрининг большого количества новых белков является обременительным при проведении количественного исследования в условиях in vitro, но становится еще более неприемлемо затруднительным и дорогостоящим при переходе испытаний к стадии количественных исследований, проводимых в моделях в условиях in vivo. Упомянутое индивидуальное получение и индивидуальный скрининг значительно ограничивают скорость разработки новых синтетических белков.
Краткое описание изобретения В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследования в условиях in vitro и в условиях in vivo.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает: а) введение в клетки-хозяева библиотеки, содержащей нуклеиновые кислоты-штрихкоды, с получением гетерогенной популяции генетически модифицированных клеток-хозяев, причем указанная библиотека нуклеиновых кислот-штрихкодов содержит множество элементов, при этом каждый из множества элементов содержит нуклеотидную последовательность, кодирующую отличающийся синтетический модульный полипептид; и Ь) идентификацию генетически модифицированной клетки-хозяина в гетерогенной популяции, которая проявляет выбранный фенотип в ответ на стимул.
В настоящем изобретении также предложен способ, в котором синтетический модульный полипептид представляет собой полипептид химерного антигенного рецептора (CAR) и в котором стимул представляет собой антигенпрезентирующую
клетку, которая экспрессирует на своей поверхности антиген, который связан с CAR.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный стимул вступает в контакт с костимулирующей молекулой.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный рецепторный полипептид.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный модульный рецепторный полипептид представляет собой химерный полипептид рецептора Notch.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный стимул представляет собой лиганд химерного полипептида рецептора Notch.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный каркасный белок.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный белок протеинкиназы или протеинфосфатазы.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный транскрипционный регуляторный белок.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный эпигенетический регуляторный белок.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный синтетический модульный полипептид представляет собой модульный белок рекомбиназы или нуклеазы.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный выбранный фенотип имеет отличительную черту фенотипа, включающую два или более фенотипов.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий секвенирование нуклеиновой последовательности-штрихкода из идентифицированной генетически модифицированной клетки-хозяина для идентификации синтетического модульного полипептида, связанного с фенотипом.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий количественное определение синтетического модульного полипептида, связанного с фенотипом.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, включающий количественное определение отдельного модуля синтетических модульных полипептидов из библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая связана с фенотипом.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем каждая нуклеотидная последовательность, кодирующая отличающийся синтетический модульный полипептид, содержит последовательность, кодирующую детектируемый репортер, который функционально соединен с нуклеотидной последовательностью, кодирующей синтетический модульный полипептид, причем указанный способ дополнительно включает разделение гетерогенной популяции генетически модифицированных клеток-хозяев на основании экспрессируемого детектируемого репортера.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем идентификацию выполняют в условиях in vitro или в условиях ex vivo.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный фенотип представляет собой один или более из: а) пролиферации; Ь) выработки цитокинов; с) экспрессии маркера клеточной поверхности; d) экспрессии репортерного белка.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит 100 или более уникальных элементов, и идентификация включает скрининг 100 или более уникальных элементов библиотеки для выбранного фенотипа.
В настоящем изобретении также предложен способ идентификации в клетке выбранного фенотипа, связанного с синтетическим модульным полипептидом, причем указанный способ включает библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержащую множество элементов, при этом каждый из множества элементов содержит нуклеотидную последовательность, кодирующую синтетический модульный полипептид, содержащий модульный домен, выбранный из группы, состоящей из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка БиМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.
В настоящем изобретении предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, причем указанная библиотека содержит: множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, при этом каждый уникальный полинуклеотид содержит: i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, ii) область нуклеиновой последовательности-штрихкода, содержащую первую нуклеиновую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая нуклеиновые последовательности
штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой указанная первая и вторая кодирующие последовательности непосредственно соединены без каких-либо промежуточных некодирующих нуклеотидов.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой множество уникальных полинуклеотидов содержит по меньшей мере 1000 уникальных полинуклеотидов.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой область нуклеиновой последовательности-штрихкода расположена в направлении 5'-конца относительно кодирующей области.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой кодирующая область расположена в направлении 5'-конца относительно области нуклеиновой последовательности-штрихкода.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанный уникальный синтетический модульный полипептид содержит костимулирующий домен.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, который содержит первый и второй модули, причем указанный первый и второй модули содержат различные костимулирующие домены.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая включает множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную
последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид дополнительно содержит промоторную последовательность, функционально соединенную с кодирующей областью и репортерной последовательностью, кодирующей детектируемый полипептид, причем указанный детектируемый полипептид представляет собой детектируемый оптическими способами полипептид, содержащий, например, детектируемый оптическими способами флуоресцентный полипептид.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, причем указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательности-штрихкода содержит третью нуклеиновую последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой полипептиды химерного антигенного рецептора (CAR).
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные рецепторные полипептиды.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих модульные рецепторные полипептиды, причем указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные каркасные белки.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки протеинкиназ или протеинфосфатаз.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные транскрипционные регуляторные белки.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные эпигенетические регуляторные белки.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную
последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки рекомбиназ или нуклеаз.
В настоящем изобретении также предложена библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которая содержит множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, содержат модульный домен, выбранный из группы состоящий из: антигенсвязывающего домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка БиМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.
В настоящем изобретении предложна клеточная библиотека, содержащая: множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид содержит: i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, ii) область нуклеиновой последовательности-штрихкода, содержащую первую нуклеиновую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и при этом секвенирование каждой области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый
уникальный синтетический модульный полипептид каждой клетки библиотеки.
В настоящем изобретении также предложена клеточная библиотека, в которой клетки представляют собой прокариотические клетки или эукариотические клетки. В настоящем изобретении также предложена клеточная библиотека, в которой эукариотические клетки представляют собой клетки человека. В настоящем изобретении также предложена клеточная библиотека, в которой клетки человека представляют собой Т-клетки человека.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, причем указанная первая и вторая кодирующие последовательности непосредственно соединены без каких-либо промежуточных некодирующих нуклеотидов.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль, причем указанная кодирующая область дополнительно содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью.
В настоящем изобретении также предложена клеточная библиотека, которая содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, причем указанный репортер представляет собой эпитопную метку.
В настоящем изобретении также предложена клеточная библиотека, которая содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, причем указанный репортер представляет собой флуоресцентный белок.
В настоящем изобретении также предложена клеточная библиотека, которая
содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанное множество клеток содержит по меньшей мере 1000 уникальных полинуклеотидов.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, которая содержит кодирующую область, кодирующую уникальный синтетический модульный полипептид, причем указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательности-штрихкода содержит третью последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой полипептиды химерного антигенного рецептора (CAR).
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные рецепторные полипептиды.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.
В настоящем изобретении также предложена клеточная библиотека, которая
содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные каркасные белки.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки протеинкиназ или протеинфосфатаз.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные транскрипционные регуляторные белки.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные эпигенетические регуляторные белки.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки рекомбиназ или нуклеаз.
В настоящем изобретении также предложена клеточная библиотека, которая содержит множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, содержат модульный домен, выбранный из группы, состоящей из: антигенсвязывающего
домена, специфичного связывающего домена или белка специфичного партнера по связыванию, костимулирующего домена, коингибирующего домена, внутриклеточного сигнального домена, трансмембранного домена, домена каркасного белка, домена белка протеинкиназы, домена белка протеинфосфатазы, домена белка рецепторной тирозинкиназы, домена белка липидкиназы, домена белка липидфосфатазы, домена белка убиквитинилазы, домена белка деубиквитинилазы, домена белка БиМОилазы, домена белка ацетилазы, домена белка деацетилазы, домена белка метилазы, домена белка деметилазы, домена белка нуклеазы, домена белка рекомбиназы, домена белка транскрипционного фактора и их комбинаций.
В настоящем изобретении предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ включает: приведение первого полинуклеотида, содержащего последовательность, кодирующую первый модуль, соединенную с первой нуклеиновой последовательностью-штрихкодом, в контакт со вторым полинуклеотидом, содержащим последовательность, кодирующую второй модуль, соединенную со второй нуклеиновой последовательностью-штрихкодом, в условиях, достаточных для введения первого полинуклеотида во второй полинуклеотид в месте соединения второй кодирующей последовательности со второй нуклеиновой последовательностью-штрихкодом с получением бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ дополнительно включает приведение первого и второго полинуклеотидов в контакт с третьим полинуклеотидом, содержащим третью модульную кодирующую последовательность, соединенную с третьей нуклеиновой последовательностью-штрихкодом, причем указанный третий полинуклеотид встраивается в первый полинуклеотид в месте соединения первой кодирующей последовательности и первой нуклеиновой последовательности-штрихкода с получением
трехмодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, при этом трехмодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с сохранением открытой рамки считывания с третьей модульной кодирующей последовательностью, соединенной с третьей нуклеиновой последовательностью-штрихкодом, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанная первая и вторая модульные кодирующие последовательности соединены с сохранением открытой рамки считывания без каких-либо промежуточных некодирующих нуклеотидов.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанная библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержит 1000 или более уникальных нуклеиновых кислот, каждая из которых кодирует уникальный синтетический модульный полипептид.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанные нуклеиновые последовательности-штрихкоды расположены в направлении 5'-конца относительно последовательностей, кодирующих модули, или в направлении 3'-конца относительно последовательностей, кодирующих модули.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем введение первого полинуклеотида во второй полинуклеотид в месте соединения второй кодирующей последовательности и второй нуклеиновой последовательности-штрихкода опосредовано активностью фермента рестрикции, который распознает сайт распознавания фермента рестрикции на втором полинуклеотиде и расщепляет второй полинуклеотид между второй кодирующей последовательностью и второй нуклеиновой
последовательностью-штрихкодом, включая случаи, когда используемый фермент рестрикции представляет собой фермент рестрикции типа II, включая случаи, когда используемый фермент рестрикции представляет собой фермент рестрикции типа IIS.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный первый полинуклеотид также содержит сайт распознавания фермента рестрикции, который присутствует на втором полинуклеотид е.
В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ дополнительно включает приведение бимодульных полинуклеотидов, содержащих нуклеиновые последовательности-штрихкоды, в контакт с полинуклеотидом, кодирующим репортер, в условиях, достаточных для введения полинуклеотида, кодирующего репортер, в бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, в месте соединения первой модульной кодирующей последовательности и первой нуклеиновой последовательности-штрихкода с получением связанного с репортером бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный связанный с репортером бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую модульную кодирующую последовательность, соединенную с сохранением открытой рамки считывания с первой модульной кодирующей последовательностью, соединенной с сохранением открытой рамки считывания с последовательностью, кодирующей репортер, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом. В настоящем изобретении также предложен способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, в которой последовательность, кодирующая репортер, кодирует эпитопную метку или флуоресцентный репортер.
В настоящем изобретении предложен химерный антигенный рецептор (CAR), идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR содержит по меньшей мере один комодулирующий домен, перечисленный в таблице 3 или таблице 4.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные
полипептиды CAR, причем указанный CAR содержит С019-специфичный антигенсвязывающий домен.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR содержит первичный сигнальный домен CD3-дзета.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR стимулирует активность Т-клеток и содержит по меньшей мере один костимулирующий домен, перечисленный в таблице 3.
В настоящем изобретении также предложен CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR ингибирует активность Т-клеток и содержит по меньшей мере один коингибирующий домен, перечисленный в таблице 4.
В настоящем изобретении также предложена нуклеиновая кислота, кодирующая CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, включая, например, любой из CAR, описанных в настоящем документе.
Краткое описание чертежей
На Фиг. 1 представлена модульная последовательность, содержащая нуклеиновую последовательность-штрихкод, субклонированная для сборки библиотеки согласно одному варианту реализации настоящего изобретения.
На Фиг. 2 представлена модульная последовательность, содержащая нуклеиновую последовательность-штрихкод, показанная на Фиг. 1, после расщепления ферментом рестрикции типа IIS при подготовке к сборке библиотеки.
На Фиг. 3 представлен примерный фрагмент последовательности в соответствии с Фиг. 1 (перед расщеплением ферментом рестрикции типа IIS (RE), SEQ ID NO: 16) и Фиг. 2 (после расщепления ферментом рестрикции IIS, SEQ ID NO: 17), содержащий последовательность, кодирующую костимулирующий домен CD28 (трансляция фрагмента после расщепления ферментом рестрикции IIS, SEQ ID NO: 18).
На Фиг. 4 представлена таблица 1. Идентификационные номера последовательностей для последовательностей, представленных в таблице 1, были следующими: индекс 1 - SEQ ID NO: 19; индекс 2 - SEQ ID NO: 20; индекс 3 - SEQ ID NO: 21; индекс 4 - SEQ ID NO: 22; индекс 5 - SEQ ID NO: 23; индекс 6 - SEQ ID NO: 24; индекс 7 - SEQ ID NO: 25; индекс 8 - SEQ ID NO: 26; индекс 9 - SEQ ID NO: 27; индекс
10 - SEQ ID NO: 28; индекс 11 - SEQ ID NO: 29; индекс 12 - SEQID NO: 30; индекс 13 -SEQ ID NO: 31; индекс 14 - SEQ ID NO: 32; индекс 15 - SEQ ID NO: 33; индекс 16 - SEQ ID NO: 34; индекс 17 - SEQ ID NO: 35; индекс 18 - SEQ ID NO: 36; индекс 19 - SEQ ID NO: 37; индекс 20 - SEQ ID NO: 38; индекс 21 - SEQ ID NO: 39; индекс 22 - SEQ ID NO: 40; индекс 23 - SEQ ID NO: 41; индекс 24 - SEQ ID NO: 42; индекс 25 - SEQ ID NO: 43;
индекс
- SEQ
NO:
44;
индекс
27 -
SEQ
NO:
45;
индекс
28 -
SEQ ID
NO:
46;
индекс
- SEQ
NO:
47;
индекс
30 -
SEQ
NO:
48;
индекс
31 -
SEQ ID
NO:
49;
индекс
- SEQ
NO:
50;
индекс
33 -
SEQ
NO:
51;
индекс
34 -
SEQ ID
NO:
52;
индекс
- SEQ
NO:
53;
индекс
36 -
SEQ
NO:
54;
индекс
37 -
SEQ ID
NO:
55;
индекс
- SEQ
NO:
56;
индекс
39 -
SEQ
NO:
57;
индекс
40 -
SEQ ID
NO:
58;
индекс
- SEQ
NO:
59;
индекс
42 -
SEQ
NO:
60;
индекс
43 -
SEQ ID
NO:
61;
индекс
- SEQ
NO:
62;
индекс
45 -
SEQ
NO:
63;
индекс
46 -
SEQ ID
NO:
64;
индекс
- SEQ
NO:
65;
индекс
48 -
SEQ
NO:
66;
индекс
49 -
SEQ ID
NO:
67;
индекс
- SEQ
NO:
68;
индекс
51 -
SEQ
NO:
69;
индекс
52 -
SEQ ID
NO:
70;
индекс
- SEQ
NO:
71;
индекс
54 -
SEQ
NO:
72;
индекс
55 -
SEQ ID
NO:
73;
индекс
- SEQ
NO:
74;
индекс
57 -
SEQ
NO:
75;
индекс
58 -
SEQ ID
NO:
76;
индекс
- SEQ
NO:
77;
индекс
60 -
SEQ
NO:
26;
индекс
61 -
SEQ ID
NO:
26;
индекс 62 - SEQ ID NO: 26.
На Фиг. 5 представлена общая схема ступенчатой сборки двумерной библиотеки комодулирующих модулей, содержащей нуклеиновые последовательности-штрихкоды, в соответствии с одним вариантом реализации настоящего изобретения.
На Фиг. 6 представлена общая схема получения двумерной библиотеки из 62x62 комодулирующих модулей согласно одному варианту реализации настоящего изобретения.
На Фиг. 7 представлена общая конфигурация элементов одномерной библиотеки химерных антигенных рецепторов (CAR) в соответствии с одним вариантом реализации настоящего изобретения.
На Фиг. 8 представлены результаты функциональной сортировки (т.е. бининга) стимулированных CAR-экспрессирующих Т-клеток на основании конечного уровня активации.
На Фиг. 9 представлены результаты количественной оценки относительного влияния каждого комодулирующего домена библиотеки на активность Т-клеток, которую осуществляли с помощью количественного секвенирования специфичных для модуля последовательностей-штрихкодов.
На Фиг. 10 представлены характеристики зависимости ответа от дозы для шести
комодулирующих доменов при трех повышающихся уровнях вносимого антигена, полученные с использованием 62-элементной одномерной библиотеки.
На Фиг. 11 представлен неограничивающий пример библиотеки CAR, который свидетельствует о том, что различные домены CAR могут варьироваться в библиотеке в
соответствии с одним вариантом реализации настоящего изобретения.
На Фиг. 12 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 13 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 14 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 15 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 16 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 17 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 18 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 19 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 20 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 21 представлена схема стратегии сборки кодирующих модули
последовательностей, содержащих нуклеиновые последовательности-штрихкоды,
описанных в настоящем документе.
На Фиг. 22 представлена схема стратегии комбинаторной вложенной сборки библиотеки модульных химерных антигенных рецепторов (CAR) в соответствии с вариантом реализации настоящего изобретения.
На Фиг. 23 представлена схема получения объединенной клеточной модульной библиотеки CAR в соответствии с вариантом реализации настоящего изобретения.
На Фиг. 24 представлен схематичный пример интегрированного способа детектирования фенотипа и идентификации модульного полипептида для применения в условиях in vitro и/или в условиях in vivo в соответствии с вариантом реализации настоящего изобретения.
На Фиг. 25 представлена таблица 2.
На Фиг. 26 исчерпывающе представлен каждый элемент двумерной библиотеки из 61x61 элемента, согласно результатам определения путем глубокого секвенирования собранной библиотеки.
На Фиг. 27 представлены результаты количественной оценки элементов предварительно нормированной комбинаторной библиотеки нуклеиновых кислот, описанной в настоящем документе.
На Фиг. 28 представлено линейное уравнение, использованное при расчете корректировок для нормирования, относящихся к элементам библиотеки, количественно определенным, как показано на Фиг. 27.
На Фиг. 29 представлены результаты, подтверждающие предсказуемость корректировок для нормирования, выполненных в соответствии с описанным в настоящем документе способом.
ОПРЕДЕЛЕНИЯ
В настоящей заявке термины "полинуклеотид" и "нуклеиновая кислота" используются взаимозаменяемо и относятся к полимерной форме нуклеотидов любой длины, как рибонуклеотидов, так и дезоксирибонуклеотидов. Следовательно, данный термин включает, но не ограничивается ими, одно-, двух- или многоцепочечную ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, содержащий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания.
В настоящей заявке термины "полипептид", "пептид" и "белок" используются взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать генетически кодируемые и не кодируемые генетически аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты и полипептиды, имеющие модифицированные пептидные остовы. Термин
включает гибридные белки, включая, но не ограничиваясь ими, гибридные белки с гетерологичной аминокислотной последовательностью, гибриды с гетерологичными и гомологичными лидерными последовательностями, с N-концевыми остатками метионина или без указанных остатков; иммунологически меченые белки; и т.п.
В настоящей заявке термины "домен" и "мотив" используются взаимозаменяемо и относятся к структурированным доменам, имеющим одну или более конкретных функций, и неструктурированным сегментам полипептида, которые, несмотря на отсутствие структурированности, сохраняют одну или более конкретных функций. Например, структурированный домен может включать, но не ограничивается ими, непрерывное или дискретное множество аминокислот, или их частей, в свернутом полипептиде, который имеет трехмерную структуру, которая вносит вклад в определенную функцию полипептида. В других случаях домен может включать неструктурированный сегмент полипептида, содержащий множество из двух или более аминокислот, или их частей, который поддерживает определенную функцию полипептида, развернутого или неупорядоченного. Данное определение также включает домены, которые могут быть неупорядоченными или неструктурированными, но становятся структурированными или упорядоченными при связывании с мишенью или партнером по связыванию. Неограничивающие примеры исходно неструктурированных доменов и доменов исходно неструктурированных белков описаны, например, в Dyson & Wright. Nature Reviews Molecular Cell Biology 6:197-208.
В настоящей заявке термин "модуль" относится к непрерывной полипептидной последовательности или ее фрагменту, который связан с той или иной функцией, в частности с биологической функцией.
В настоящей заявке термины "химерный антигенный рецептор" и "CAR" используются взаимозаменяемо и относятся к искусственным многомодульным молекулам, способным инициировать или ингибировать активацию иммунной клетки, которые обычно, но не исключительно, содержат внеклеточный домен (например, домен, связывающий лиганд/антиген), трансмембранный домен и один или более внутриклеточных сигнальных доменов. Термин CAR не ограничивается конкретными молекулами CAR, а также включает варианты CAR. Варианты CAR включают разделенные CAR, в которых внеклеточная часть (например, участок связывания лиганда) и внутриклеточная часть (например, внутриклеточная сигнальная часть) CAR присутствуют на двух отдельных молекулах. Варианты CAR также включают CAR-включатели и CAR-выключатели, которые представляют собой активируемые/подавляемые при определенных условиях CAR, например, указанные
варианты включают расщепленный CAR, в котором условная гетеродимеризация двух частей расщепленного CAR контролируется фармакологически. Варианты CAR также включают биспецифичные CAR, которые содержат домен связывания дополнительного CAR, который может усиливать или ингибировать активность основного CAR. Варианты CAR также включают ингибиторные химерные антигенные рецепторы (iCAR), которые можно применять, например, в качестве компонента биспецифичной системы CAR, когда связывание домена связывания с дополнительным CAR приводит к ингибированию активации основного CAR. Молекулы CAR и их производные (т.е. варианты CAR) описаны, например, в заявке РСТ US2014/016527; Fedorov et al. Sci Transl Med (2013) ;5(215):215ral72; Glienke et al. Front Pharmacol (2015) 6:21; Kakarla & Gottschalk 52 Cancer J (2014) 20(2): 151-5; Riddell et al. Cancer J (2014) 20(2): 141-4; Pegram et al. Cancer J (2014) 20(2): 127-33; Cheadle et al. Immunol Rev (2014) 257(1):91-106; Barrett et al. Annu Rev Med (2014) 65:333-47; Sadelain et al. Cancer Discov (2013) 3(4):388-98; Cartellieri et al., J Biomed Biotechnol (2010) 956304, содержание которых полностью включено в настоящую заявку посредством ссылки.
Термин "ген" относится к определенной единице наследственности, присутствующей в определенном локусе в генетическом компоненте организма. Ген может представлять собой последовательность нуклеиновой кислоты, например, последовательность ДНК или РНК, присутствующую в геноме нуклеиновых кислот, геноме ДНК или РНК, организма, и, в некоторых случаях, может присутствовать на хромосоме. Ген может представлять собой последовательность ДНК, кодирующую мРНК, которая кодирует белок. Ген может состоять из одного экзона и может не иметь интронов или может содержать несколько экзонов и один или более интронов. Одна из двух или более идентичных или альтернативных форм гена, присутствующих в определенном локусе, называется "аллель", и, например, диплоидный организм обычно будет иметь два аллеля определенного гена. Новые аллели определенного гена могут возникнуть природным или искусственным путем посредством природной или индуцированной мутации и могут распространяться путем размножения или клонирования. Ген или аллель может быть выделен из генома организма и реплицирован и/или подвергнут манипуляциям, или ген или аллель может быть модифицирован в условиях in situ методами генной терапии. Локус гена или аллель может иметь связанные регуляторные элементы, и генная терапия, в некоторых случаях, может включать модификацию регуляторных элементов гена или аллеля, оставляя кодирующие последовательности гена или аллеля немодифицированными.
Термин "функционально соединенный" относится к сопоставлению, при котором
описанные компоненты взаимосвязаны, что позволяет им функционировать предполагаемым способом. Например, промотор функционально соединен с кодирующей последовательностью, если промотор влияет на ее транскрипцию или экспрессию.
"Вектор" или "вектор экспрессии" представляет собой репликон, такой как плазмида, фаг, вирус или космида, к которому может быть присоединен другой сегмент ДНК, т.е. "вставка", чтобы вызвать репликацию присоединенного сегмента в клетке.
В настоящей заявке термин "гетерологичный" означает нуклеотидную или полипептидную последовательность, которая не встречается в нативной (например, природной) нуклеиновой кислоте или белке, соответственно.
Термины "антитела" и "иммуноглобулин" включают антитела или иммуноглобулины любого изотипа, фрагменты антител, которые сохраняют специфичное связывание с антигеном, включая, но не ограничиваясь ими, фрагменты Fab, Fv, scFv и Fd, химерные антитела, гуманизированные антитела, одноцепочечные антитела и гибридные белки, содержащие антигенсвязывающую часть антитела и белка, не относящегося к антителам.
"Фрагменты антитела" содержат часть интактного антитела, например, антигенсвязывающую или вариабельную область интактного антитела. Примеры фрагментов антител включают фрагменты Fab, Fab', F(ab')2 и Fv; диатела; линейные антитела (Zapata et al, Protein Eng. 8(10): 1057-1062 (1995)); молекулы одноцепочечных антител; и полиспецифичные антитела, образованные из фрагментов антител. Расщепление антител папаином позволяет получить два идентичных антигенсвязывающих фрагмента, называемых фрагментами Fab, каждый из которых содержит один антигенсвязывающий сайт, и остаточный фрагмент "Fc", обозначение, которое отражает способность фрагмента легко кристаллизоваться. Обработка пепсином позволяет получить фрагмент F(ab')2, который содержит два антигенсвязывающих сайта и по-прежнему способен к сшиванию антигена.
"Одноцепочечные Fv" или "sFv" фрагменты антитела содержат домены VH И VL антитела, причем указанные домены присутствуют в одной полипептидной цепи. Согласно некоторым вариантам реализации настоящего изобретения полипептид Fv дополнительно содержит полипептидный линкер между доменами VH И VL, который позволяет sFv формировать желаемую структуру для связывания антигена. Для обзора sFv см. Pluckthun in The Pharmacology of Monoclonal Antibodies, vol. 113, Rosenburg and Moore eds., Springer-Verlag, New York, pp. 269-315 (1994).
В настоящей заявке термин "аффинность" относится к константе равновесия для обратимого связывания двух агентов и выражается как константа диссоциации (Kd).
Аффинность может быть по меньшей мере в 1 раз больше, по меньшей мере в 2 раза больше, по меньшей мере в 3 раза больше, по меньшей мере в 4 раза больше, по меньшей мере в 5 раз больше, по меньшей мере в 6 раз больше, по меньшей мере в 7 раз больше, по меньшей мере в 8 раз больше, по меньшей мере в 9 раз больше, по меньшей мере в 10 раз больше, по меньшей мере в 20 раз больше, по меньшей мере в 30 раз больше, по меньшей мере в 40 раз больше, по меньшей мере в 50 раз больше, по меньшей мере в 60 раз больше, по меньшей мере в 70 раз больше, по меньшей мере в 80 раз больше, по меньшей мере в 90 раз больше, по меньшей мере в 100 раз больше или по меньшей мере в 1000 раз больше или более, чем аффинность антитела в отношении нецелевых аминокислотных последовательностей. Аффинность антитела в отношении целевого белка может быть, например, от приблизительно 100 наномоль (нМ) до приблизительно 0,1 нМ, от приблизительно 100 нМ до приблизительно 1 пикомоль (пМ) или от приблизительно 100 нМ до приблизительно 1 фемтомоль (фМ) или более.
Термин "связывание" относится к непосредственной связи двух молекул посредством, например, ковалентных, электростатических, гидрофобных и ионных и/или водородных связей, включая такие взаимодействия как солевые мостики и водные мостики. Неспецифичное связывание относится к связыванию с величиной аффинности менее приблизительно 10"7 М, например, к связыванию с аффинностью 10"6 М, 10"5 М, 10"4 М и т.д.
В настоящей заявке термин "иммунные клетки" обычно включает белые клетки крови (лейкоциты), которые получены из гемопоэтических стволовых клеток (HSC), вырабатываемых в костном мозге. "Иммунные клетки" включают, например, лимфоциты (Т-клетки, В-клетки, природные клетки-киллеры (NK)) и клетки миелоидного происхождения (нейтрофилы, эозинофилы, базофилы, моноциты, макрофаги и дендритные клетки).
Термин "Т-клетка" включает все типы иммунных клеток, экспрессирующих CD3, включая хелперные Т-клетки (CD4+ клетки), цитотоксические Т-клетки (CD8+ клетки), регуляторные Т-клетки (Treg) и гамма-дельта Т-клетки.
Термин "цитотоксическая клетка" включает CD8+ Т-клетки, природные клетки-киллеры (NK) и нейтрофилы, которые способны опосредовать цитотоксические ответы.
В настоящей заявке термин "стволовая клетка" обычно включает плюрипотентные или мультипотентные стволовые клетки. "Стволовые клетки" включают, например, эмбриональные стволовые клетки (ES); мезенхимальные стволовые клетки (MSC); индуцированные плюрипотентные стволовые клетки (iPS); и коммитированные клетки-предшественники (гемопоэтические стволовые клетки (HSC), клетки, полученные из
костного мозга, и т.д.).
В настоящей заявке термин "лечение", "лечащий" и т.п. относятся к получению желательного фармакологического и/или физиологического действия. Действие может быть профилактическим с точки зрения полного или частичного предотвращения заболевания или его симптома и/или может быть терапевтическим с точки зрения частичного или полного излечения заболевания и/или нежелательного явления, связанного с заболеванием. В настоящей заявке термин "лечение" охватывает любой способ лечения заболевания у млекопитающего, например, у человека, и включает: (а) предотвращение возникновения заболевания у субъекта, который может быть предрасположен к заболеванию, но у которого данное заболевание еще не было диагностировано; (Ь) ингибирование заболевания, т.е. прекращение его развития; и (с) облегчение заболевания, т.е. индукцию регресса заболевания.
В настоящей заявке термины "индивидуум", "субъект", "хозяин" и "пациент" используются взаимозаменяемо и относятся к млекопитающему, включая, но не ограничиваясь ими, мышевидных грызунов (например, крыс, мышей), зайцеобразных (например, кроликов), приматов, отличных от человека, человека, собачьих, кошачьих, копытных (например, лошадей, крупный рогатый скот, овец, свиней, коз) и т.д.
"Терапевтически эффективное количество" или "эффективное количество" относится к количеству агента, или комбинированным количествам двух агентов, которое, при введении млекопитающему или другому субъекту для лечения заболевания, является достаточным для осуществления указанного лечения заболевания. "Терапевтически эффективное количество" будет варьироваться в зависимости от агента(ов), заболевания и степени его тяжести, а также от возраста, массы и т.д., субъекта, подлежащего лечению.
Термины "контроль", "контрольная реакция", "контрольное количественное исследование" и т.п. относятся к реакции, тесту или другой части экспериментальной или диагностической процедуры или дизайна эксперимента, для которых ожидаемый результат известен с высокой степенью достоверности, например, для того чтобы указать, являются ли результаты, полученные из соответствующих экспериментальных образцов надежными, указать с какой степенью достоверности соответствующие экспериментальные результаты указывают на истинный результат и/или чтобы обеспечить калибровку экспериментальных результатов. Например, в некоторых случаях, контроль может представлять собой "отрицательный контроль" так, что существенный компонент количественного исследования исключается из реакции отрицательного контроля так, что экспериментатор может иметь высокую степень уверенности в том, что реакция отрицательного контроля не приведет к положительному результату. В
некоторых случаях контроль может представлять собой "положительный контроль" так, что все компоненты конкретного количественного исследования охарактеризованы и известны, при их объединении, для получения конкретного результата в количественном исследовании, выполняемом экспериментатором, который может иметь высокую степень уверенности в том, что реакция положительного контроля не приведет к отсутствию положительного результата.
В настоящей заявке термин "праймер" или "олигонуклеотидный праймер" относится к олигонуклеотиду, который инициирует синтез комплементарной цепи нуклеиновой кислоты в условиях, когда индуцируется синтез продукта удлинения праймера, например, в присутствии нуклеотидов и агента, индуцирующего полимеризацию, такого как ДНК- или РНК-полимераза, и при подходящей температуре, рН, концентрации металлов и концентрации соли. Праймеры обычно имеют длину, совместимую с их использованием при синтезе продуктов удлинения праймера, и могут иметь длину, которая находиться в диапазоне от 8 до 100 нуклеотидов, например, от 10 до 75, от 15 до 60, от 15 до 40, от 18 до 30, от 20 до 40, от 21 до 50, от 22 до 45, от 25 до 40 и т.д., включая диапазон 18-40, 20-35, 21-30 нуклеотидов и любую длину в пределах указанных диапазонов. В некоторых случаях длина праймеров может находиться в пределах диапазона от 10 до 50 нуклеотидов, например, 15-45, 18-40, 20-30, 21-25 и т.д., и праймер может иметь любую длину в пределах указанных диапазонов. Согласно некоторым вариантам реализации настоящего изобретения праймеры обычно содержат не более 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65 или 70 нуклеотидов.
Термины "гибридизоваться" и "гибридизация" относятся к образованию комплексов между нуклеотидными последовательностями, которые достаточно комплементарны, чтобы образовывать комплексы посредством спаривания оснований по Уотсону-Крику. Например, при "гибридизации" праймера с мишенью (матрицей) такие комплексы (или гибриды) достаточно стабильны, чтобы обеспечивать прайминг, необходимый, например, для инициирования синтеза ДНК ДНК-полимеразой.
Термин "биологический образец" включает множество типов образцов, полученных от индивидуума или популяции индивидуумов, и может быть использован в диагностическом, контрольном или скрининговом количественном исследовании. Определение включает кровь и другие жидкие образцы биологического происхождения, образцы плотных тканей, такие как образец биопсии или культур тканей или полученные из них клетки и их потомство. Определение также включает образцы, которые были обработаны каким-либо образом после их получения, например, путем смешивания или
объединения отдельных образцов, обработки реагентами, солюбилизации или обогащения определенными компонентами, такие как клетки, полинуклеотиды, полипептиды и т.д. Термин "биологический образец" включает клинический образец, а также включает клетки в культуре, клеточные супернатанты, клеточные лизаты, сыворотку, плазму, биологическую жидкость и образцы тканей. Термин "биологический образец" включает мочу, слюну, спинномозговую жидкость, интерстициальную жидкость, глазную жидкость, синовиальную жидкость, фракции крови, такие как плазма крови и сыворотка крови, и т.п. Термин "биологический образец" также включает образцы плотных тканей, образцы культур тканей и клеточные образцы.
Термин "оценка" включает любую форму измерения и включает определение присутствия или отсутствия элемента. Термины "определение", "измерение", "исследование", "оценка" и "количественное исследование" используются взаимозаменяемо и включают количественные и качественные определения. Оценка может быть относительной или абсолютной. "Оценка присутствия" включает определение количества присутствующего объекта и/или определение его присутствия или отсутствия. В настоящей заявке термины "определение", "измерение" и "оценка" и "количественное исследование" используются взаимозаменяемо и включают количественные и качественные определения.
Настоящее изобретение будет дополнительно описано ниже, однако следует понимать, что настоящее изобретение не ограничено конкретными описанными вариантами реализации, поскольку очевидно, что они могу варьироваться. Также следует понимать, что терминология, используемая в настоящем документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения, поскольку объем настоящего изобретения будет ограничен только прилагаемой формулой изобретения.
В тех случаях, когда представлен диапазон значений, следует понимать, что каждое промежуточное значение, до десятой части единицы нижнего предела, если из контекста явно не следует иное, между верхним и нижним пределом указанного диапазона и любым другим заявленным или промежуточным значением в указанном диапазоне, включено в область настоящего изобретения. Верхний и нижний пределы указанных меньших диапазонов могут быть независимо включены в меньшие диапазоны и также включены в область настоящего изобретения, с учетом любого конкретно исключенного предела в указанном диапазоне. В тех случаях, когда указанный диапазон включает один или оба предела, в область настоящего изобретения также включены диапазоны, исключающие один или оба из указанных включенных пределов.
Если не указано иное, в настоящей заявке все технические и научные термины имеют то же значение, которое обычно понятно специалисту в данной области техники, к которой относится настоящее изобретение. Несмотря на то, что любые способы и материалы, аналогичные или эквивалентные тем, которые описаны в настоящем документе, также могут быть использованы при реализации настоящего изобретения или при испытаниях настоящего изобретения, в настоящем документе описаны предпочтительные способы и материалы. Все публикации, упомянутые в настоящем документе, включены в настоящую заявку посредством ссылки для раскрытия и описания способов и/или материалов, в связи с которыми цитируются публикации.
Следует отметить, что в настоящей заявке и в прилагаемой формуле изобретения формы единственного числа "а", "ап" и "the" включают множественные формы референтов, если из контекста явно не следует иное. Например, ссылка на "полипептид" включает множество таких полипептидов, и ссылка на "антиген" включает ссылку на один или более антигенов и их эквивалентов, известных специалистам в данной области техники, и т.д. Также следует отметить, что формула настоящего изобретения может быть составлена для исключения любого необязательного элемента. Следовательно, данное заявление предназначено для применения в качестве предшествующей основы для использования такой исключающей терминологии как "исключительно", "только" и т.п. в отношении описания элементов формулы настоящего изобретения или использования "отрицательного" ограничения.
Следует понимать, что некоторые признаки настоящего изобретения, которые для ясности описаны применительно к отдельным вариантам реализации, также могут быть представлены в комбинации в одном варианте реализации. И наоборот, различные признаки изобретения, которые для краткости описаны применительно к одному варианту реализации, также могут быть представлены по отдельности или в любой подходящей дополнительной комбинации. Все комбинации вариантов реализации, относящихся к настоящему изобретению, конкретно охватываются настоящим изобретением и раскрыты в настоящем документе точно так же, как если бы каждая комбинация была индивидуально и явно раскрыта. Помимо этого все дополнительные комбинации различных вариантов реализации и их элементов также конкретно включены в область настоящего изобретения и раскрыты в настоящем документе точно так же, как если бы каждая такая дополнительная комбинация была индивидуально и явно раскрыта в настоящем документе.
Публикации, обсуждаемые в настоящем документе, представлены исключительно для их раскрытия до даты подачи настоящей заявки. Ничто из содержащегося в
настоящем документе не должно быть истолковано как допущение того, что изобретение не имеет права предшествовать такому раскрытию на основании предшествующего изобретения. Помимо этого даты представленных публикаций могут отличаться от фактических дат публикаций, которые, возможно, необходимо будет подтвердить самостоятельно.
Подробное описание изобретения
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие указанные библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы получения библиотек синтетических модульных полипептидов и нуклеиновых кислот, кодирующих библиотеки синтетических модульных полипептидов. В настоящем изобретении также предложены способы скрининга библиотеки синтетических модульных полипептидов для идентификации выбранного фенотипа, связанного с элементом библиотеки синтетических модульных полипептидов, причем указанные способы можно применять в количественных исследованиях в условиях in vitro и в условиях in vivo.
Библиотеки
Аспекты настоящего изобретения относятся к библиотекам нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которые кодируют множество синтетических модульных полипептидов. Аспекты настоящего изобретения также включают клеточные библиотеки, в которых каждая клетка экспрессирует отдельную нуклеиновую кислоту, содержащую нуклеиновую последовательность-штрихкод, кодирующую уникальный синтетический модульный полипептид, или множество указанных индивидуальных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды. Как описано более подробно ниже, аспекты настоящего изобретения также включают способы получения указанных библиотек и способы скрининга указанных библиотек для детектирования конкретных фенотипов.
Библиотеки нуклеиновых кислот согласно настоящему изобретению обычно комбинаторно собраны из модульных компонентов и включают многозвенную последовательность-штрихкод, которую можно секвенировать, чтобы определить идентичность и конфигурацию модульных компонентов каждого элемента библиотеки. Следовательно, каждый отдельный элемент библиотеки нуклеиновых кислот будет содержать по меньшей мере кодирующую область и область нуклеиновой последовательности-штрихкода. В настоящей заявке термин "кодирующая область", поскольку он относится к отдельным элементам библиотеки нуклеиновых кислот,
относится к области каждой нуклеиновой кислоты, которая кодирует синтетический полипептид, представляющий интерес, например, синтетический полипептид, содержащий один или более полипептидных модулей, которые могут быть подвергнуты скринингу для определения их влияния на конкретный желательный или нежелательный фенотип. В некоторых случаях кодирующая область может дополнительно содержать последовательности, кодирующие репортерную молекулу, например, молекулу, которая используется для детектирования и/или измерения экспрессии представляющего интерес синтетического полипептида.
Кодирующая область обычно кодирует один модульный полипептид, более подробно описанный ниже; однако настоящее описание не исключает библиотеки, в которых кодирующая область каждого элемента библиотеки кодирует два или более отдельных модульных полипептидов. Такие элементы библиотеки могут включать одну кодирующую область, которая является полицистронной (например, бицистронной, полицистронной и т.д.), например, путем включения разделимого линкера (например, участка внутренней посадки рибосомы (IRES), рибосомальной шунтирующей последовательности, нуклеиновой кислоты, кодирующей саморасщепляющийся пептид, и т.д.) между последовательностями, кодирующими разделяемые модульные полипептиды. Кодирующая область, содержащая последовательность, кодирующую два или более отдельных модульных полипептидов, будет непрерывной и будет собрана и подвергнута скринингу в соответствии со способами, описанными в настоящем документе для одномодульных полипептидных конструкций.
Кодирующая область будет содержать вариабельные модули и невариабельные модули, причем предполагаемый способ применения библиотеки будет определять, является ли конкретная часть синтетического модульного полипептида вариабельной или невариабельной. Вариабельные модули кодирующей области обычно представляют собой те модули, которые подвергают скринингу, индивидуально или комбинаторно, для определения функционального свойства и/или влияния на представляющий интерес фенотип. В целом, вариабельные модули будут связаны с последовательностью-штрихкодом, идентифицирующей модуль, тогда как невариабельные модули не будут связаны с последовательностью-штрихкодом. Любой модуль может служить вариабельным или невариабельным модулем в зависимости от конструкции конкретной библиотеки и/или способа скрининга, с которым связана библиотека.
В качестве неограничивающего примера в некоторых вариантах реализации, в которых кодирующая область кодирует химерный антигенный рецептор (CAR), любой модуль CAR может служить в качестве вариабельного модуля в зависимости от
активности CAR, которую подвергают скринингу, включая, помимо прочего, внеклеточный домен, корегуляторный домен или первичный сигнальный домен. Например, на Фиг. 11 представлен один элемент библиотеки CAR, в которой каждый член библиотеки содержит внеклеточный домен, корегуляторный домен и первичный сигнальный домен и предоставляет неограничивающие примеры случаев, когда каждый домен может служить в качестве вариабельного модуля.
В некоторых случаях внеклеточный домен может быть вариабельным модулем, например, в тех случаях, когда интерес представляет нацеленное воздействие на антиген, в тех случаях, когда интерес представляет сила взаимодействия между антигеном и внеклеточным доменом и т.д. В некоторых случаях корегуляторный домен может быть вариабельным модулем, например, в тех случаях, когда индивидуальный корегуляторный домен или комбинации корегуляторных доменов должны быть подвергнуты скринингу для оценки совместной модуляции функциональной активности. В некоторых случаях первичный сигнальный домен может быть вариабельным модулем, например, в тех случаях, когда различные внутриклеточные пути передачи сигналов должны быть подвергнуты скринингу.
В качестве неограничивающего примера, в некоторых случаях, кодируемый синтетический модульный полипептид может представлять собой химерный полипептид рецептора Notch, содержащий внеклеточный связывающий домен, расщепляемый домен полипептида рецептора Notch (включая индуцируемый связыванием сайт расщепления) и внутриклеточный домен. Подходящие химерные полипептиды рецептора Notch и их домены включают, но не ограничиваются ими, например, те, которые описаны в заявке на патент США РСТ US0201/019188; содержание которой полностью включено в настоящую заявку посредством ссылки. В некоторых случаях один или более доменов химерного полипептида рецептора Notch служат в качестве вариабельного домена, включая, но не ограничиваясь ими, например, внеклеточный связывающий домен, домен полипептида рецептора Notch, внутриклеточный домен, внеклеточный связывающий домен и домен полипептида рецептора Notch, внеклеточный связывающий домен и внутриклеточный домен или домен полипептида рецептора Notch и внутриклеточный домен.
Невариабельные модули, включенные в кодирующую область, будут выбраны, если это необходимо, так, чтобы все элементы библиотеки имели функцию невариабельного модуля, т.е. когда функция, которая обеспечивается невариабельным модулем, поддерживается постоянной во всех элементах библиотеки. В качестве неограничивающих примеров, в некоторых случаях, внеклеточный домен, корегуляторный домен или первичный сигнальный домен, описанные выше, могут
служить в качестве невариабельных модулей, если это необходимо, или если для проведения количественного исследования необходимо, чтобы все элементы библиотеки имели функцию внеклеточного домена, корегуляторного домена или первичного сигнального домена. В качестве неограничивающих примеров, в некоторых случаях, внеклеточный связывающий домен, расщепляемый домен полипептида рецептора Notch или внутриклеточный домен, описанные выше, могут представлять собой невариабельные модули, если это необходимо, или если для проведения количественного исследования необходимо, чтобы все элементы библиотеки имели функцию внеклеточного связывающего домена, расщепляемого домена полипептида рецептора Notch или внутриклеточного домена.
В зависимости от конкретных применяемых модулей и скринингового количественного исследования, для которых используется библиотека согласно настоящему изобретению, кодирующая область каждого элемента библиотеки может кодировать любую комбинацию вариабельных и невариабельных модулей, при этом простейшая кодирующая область кодирует только вариабельный модуль. В некоторых случаях каждый отдельный элемент библиотеки, например, каждый вектор, в который вставлен вариабельный модуль, может содержать, перед вставкой вариабельного модуля, одну или более кодирующих последовательностей так, что при вставке вариабельного модуля кодирующая область будет содержать вариабельный модуль и ранее существовавшие кодирующие последовательности, которые могут содержать невариабельный модуль и/или немодульную кодирующую последовательность или не содержать их. В некоторых случаях такая ранее существовавшая кодирующая последовательность, которая присутствует во всех элементах библиотеки, может упоминаться как "константный домен".
В некоторых случаях кодирующая область может кодировать два или более вариабельных модулей, включая, но не ограничиваясь ими, например, три или более вариабельных модулей, четыре или более вариабельных модулей, пять или более вариабельных модулей, шесть или более вариабельных модулей, семь или более вариабельных модулей, восемь или более вариабельных модулей и т.д. В некоторых случаях кодирующая область может кодировать два или более невариабельных модулей, включая, но не ограничиваясь ими, например, три или более невариабельных модулей, четыре или более невариабельных модулей, пять или более невариабельных модулей, шесть или более невариабельных модулей, семь или более невариабельных модулей, восемь или более невариабельных модулей и т.д. Количество вариабельных и невариабельных модулей в кодирующей области может быть лимитировано
практическими ограничениями способа клонирования кодирующей последовательности и конструирования библиотеки.
Количество уникальных элементов библиотеки, кодирующей уникальные синтетические модульные полипептиды, будет зависеть от количества вариабельных модулей, используемых при конструировании библиотеки и общей предполагаемой сложности библиотеки. Согласно некоторым вариантам реализации настоящего изобретения сложность библиотеки может быть описана применительно к размерности библиотеки, причем размерность библиотеки коррелирует с количеством последовательностей, кодирующих вариабельные модули, которые присутствуют в кодирующей области элементов библиотеки. Следовательно, одномерная библиотека содержит одну последовательность, кодирующую вариабельный модуль, в каждой кодирующей области каждого элемента библиотеки, двумерная библиотека содержит две последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки, трехмерная библиотека содержит три последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки, четырехмерная библиотека содержит четыре последовательности, кодирующие вариабельные модули, в каждой кодирующей области каждого элемента библиотеки и так далее.
Размерность библиотеки не обязательно должна быть однородной во всей библиотеке, и, следовательно, в некоторых случаях, библиотека может иметь смешанную размерность. Под "смешанной размерностью" подразумевается, что библиотека содержит элементы библиотеки, отличные от одномерных, описанных выше. Например, библиотека может быть частично одномерной, частично двумерной, частично трехмерной и т.д. Указанные библиотеки со смешанной размерностью могут представлять собой смешанные одно- и двумерные библиотеки, двух- и трехмерные библиотеки, одно, двух- и трехмерные библиотеки и т.д. Представленные описания библиотек со смешанной размерностью не являются ограничивающими, и специалист в данной области техники легко поймет, что разнообразие библиотек со смешанной размерностью, включенных в область настоящего изобретения, выходит далеко за рамки явно описанных.
Следовательно, количество уникальных элементов библиотеки, кодирующих уникальные синтетические модульные полипептиды, будет различаться и будет являться результатом размерности библиотеки и количества модулей, использованных при конструировании библиотеки. Например, одномерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20 уникальных элементов библиотеки. Двумерная библиотека, сконструированная из 20 уникальных вариабельных
модулей, будет содержать 20x20 (т.е. 400) уникальных элементов библиотеки. Трехмерная библиотека, сконструированная из 20 уникальных вариабельных модулей, будет содержать 20x20x20 (т.е. 8000) уникальных элементов библиотеки. В некоторых случаях уникальный элемент библиотеки из многомерной библиотеки может содержать две или более последовательностей, кодирующих один и тот же вариабельный модуль.
В некоторых случаях, когда каждый элемент библиотеки содержит два или более вариабельных модулей, указанные модули могут иметь конкретное положение, это означает, что подмножество вариабельных модулей может быть помещено только в определенном месте в пределах синтетического модульного полипептида по отношению к другим вариабельным модулям. Например, синтетический модульный полипептид, содержащий два вариабельных модуля, может содержать первый набор и второй набор вариабельных модулей, причем модули первого набора всегда находятся в определенном положении относительно модулей второго набора. Следовательно, двумерная библиотека, сконструированная с учетом специфичного положения модулей, состоящая из 30 уникальных вариабельных модулей, включая первый набор из 10 уникальных вариабельных модулей и второй набор из 20 уникальных вариабельных модулей, может содержать 10x20 (т.е. 200) уникальных элементов библиотеки.
Специалист в данной области техники легко поймет значительную изменчивость конфигураций библиотек, учитывая описанную выше вариабельную размерность и вариабельные количества модулей, которые могут быть объединены, с использованием специфичных положений или без них, при конструировании библиотек согласно настоящему изобретению. Следовательно, общее количество уникальных элементов библиотеки будет сильно варьироваться и может находиться в пределах диапазона от менее чем 20 до 50000 и более, включая, но не ограничиваясь ими, например, 20 или более, 30 или более, 40 или более, 50 или более, 60 или более 70 или более, 80 или более, 90 или более, 100 или более, 150 или более, 200 или более, 250 или более, 300 или более, 350 или более, 400 или более, 450 или более, 500 или более, 550 или более, 600 или более, 650 или более, 700 или более, 750 или более, 800 или более, 850 или более, 900 или более, 950 или более, 1000 или более, 1500 или более, 2000 или более, 2500 или более, 3000 или более, 3500 или более, 4000 или более, 4500 или более, 5000 или более, 5500 или более, 6000 или более, 6500 или более, 7000 или более, 7500 или более, 8000 или более, 8500 или более, 9000 или более, 9500 или более, 10000 или более, 20000 или более, 30000 и более, 40000 или более, 50000 и более и т.д.
В тех случаях, когда многомерные библиотеки сконструированы путем объединения, общее количество уникальных элементов библиотеки в пуле может
значительно варьироваться и может находиться в пределах диапазона от менее чем 20 до 50000 или более, как описано выше, и может иметь более высокую степень разнообразия, включая, но не ограничиваясь указанными, например, 105 или более, 106 или более, 107 или более, 108 или более, или 109 или более.
Уникальные элементы библиотек, описанные в настоящем документе, не обязательно должны быть физически упорядочены для целей конструирования библиотеки или скрининга. Как описано более подробно ниже, комбинаторная сборка компонентов нуклеиновых кислот, кодирующих каждый синтетический модульный полипептид, и совместная сборка многозвенных последовательностей-штрихкодов с помощью способа, который характеризует идентичность и ориентацию собранных модулей, обеспечивает однореакторный синтез и общий скрининг библиотек, описанных в настоящем документе. Следовательно, библиотека, и множество уникальных элементов библиотеки, может присутствовать в одном подходящем растворе и/или присутствовать в одном подходящем контейнере.
Синтетические модульные полипептиды
В настоящем изобретении предложены библиотеки синтетических модульных полипептидов и нуклеиновые кислоты, кодирующие синтетические модульные полипептиды. Под "модульным полипептидом" подразумевают функциональный белок, содержащий два или более функционально связанных модульных компонентов, так, что модули физически соединены и совместно функционируют в одной молекуле полипептида. Модули модульного полипептида могут иметь связанные или несвязанные функции или виды активности. Во многих вариантах реализации по меньшей мере два из модульных компонентов синтетических модульных полипептидов получены из отдельных белков. Модули, полученные из "отдельных белков", могут быть получены из различных белков, которые функционально не связаны или функционально связаны, и могут быть получены из разных молекул организма, из одной и той же молекулы организма, разных ортологичных белков, различных паралогичных белков и т.д.
Согласно некоторым вариантам реализации настоящего изобретения отдельные элементы библиотеки синтетических модульных полипептидов, описанной в настоящем документе, будут включать, как минимум, модуль, который является членом специфичной связывающейся пары (например, связывающейся пары антиген-антитело, связывающейся пары лиганд-рецептор и т.д.), и функциональный или сигнальный модуль, который участвует в индукции клеточного ответа. В некоторых случаях элемент конкретной связывающейся пары может быть упомянут в настоящем документе как внеклеточный домен или внеклеточный распознаваемый домен. В некоторых случаях элемент
конкретной связывающейся пары может относиться к белку, участвующему в сигнальном взаимодействии белок-белок, или к белку, участвующему во взаимодействии белок-липид.
Во многих вариантах реализации элемент конкретной связывающейся пары, который можно применять в отдельных элементах библиотеки, может включать антигенсвязывающий домен. Антигенсвязывающий домен, подходящий для применения в элементах библиотеки согласно настоящему изобретению, может представлять собой любой антигенсвязывающий полипептид, широкий спектр которых известен в данной области техники. В некоторых случаях антигенсвязывающий домен представляет собой одноцепочечный фрагмент Fv (scFv). Для применения подходят другие домены распознавания на основе антител (cAb VFffl (вариабельные домены антител верблюдовых) и гуманизированные варианты, IgNAR VH (вариабельные домены антител акул) и гуманизированные варианты, sdAb VH (вариабельные домены однодоменных антител) и вариабельные домены антител, содержащих фрагменты антител верблюдовых. В некоторых случаях для применения также подходят домены распознавания на основе Т-клеточных рецепторов (TCR), таких как одноцепочечный TCR (scTv, одноцепочечный двухдоменный TCR, содержащий VaVP).
Антигенсвязывающий домен, подходящий для применения в элементах библиотек согласно настоящему изобретению, может иметь множество видов антигенсвязывающей специфичности. В некоторых случаях антигенсвязывающий домен специфичен в отношении эпитопа, присутствующего в антигене, который экспрессируется (синтезируется) раковой клеткой, т.е. в антигене, связанном с раковой клеткой. Антиген, связанный с раковой клеткой, может представлять собой антиген, связанный, например, с клеткой рака молочной железы, В-клеточной лимфомой, клеткой лимфомы Ходжкина, клеткой рака яичников, клеткой рака предстательной железы, мезотелиомой, клеткой рака легких (например, клеткой мелкоклеточного рака легких), клеткой неходжкинской В-клеточной лимфомы (B-NHL), клеткой рака яичников, клеткой рака предстательной железы, клеткой мезотелиомы, клеткой рака легких (например, клеткой мелкоклеточного рака легких), клеткой меланомы, клеткой хронического лимфоцитарного лейкоза, клеткой острого лимфоцитарного лейкоза, клеткой нейробластомы, глиомой, глиобластомой, медуллобластомой, клеткой колоректального рака и т.д. Антиген, связанный с раковой клеткой, также может быть экспрессирован нераковой клеткой.
Неограничивающие примеры антигенов, с которыми может связываться антигенсвязывающий домен библиотеки согласно настоящему изобретению, включают, например, CD19, CD20, CD38, CD30, Her2/neu, ERBB2, СА125, MUC-1, специфичный для
предстательной железы мембранный антиген (PSMA), молекулу адгезии CD44, мезотелин, онкоэмбриональный антиген (СЕА), рецептор эпидермального фактора роста (EGFR), EGFRvIII, рецептор фактора роста эндотелия сосудов 2 (VEGFR2), высокомолекулярный антиген, связанный с меланомой (HMW-MAA), MAGE-A1, IL-13R-a2, GD2 и т.п.
В некоторых случаях элемент конкретной связывающейся пары, подходящий для применения в элементах библиотек согласно настоящему изобретению, представляет собой лиганд для рецептора. Лиганды включают, но не ограничиваются ими, цитокины (например, ИЛ-13 и т.д.); факторы роста (например, херегулин, фактор роста эндотелия сосудов (VEGF) и т.п.); пептид, связывающий интегрин (например, пептид, содержащий последовательность Arg-Gly-Asp); лиганды Notch (например, Delta, Serrate, Delta-like, X-Delta, Jagged и т.д., а также их гомологи и ортологи) и т.п.
В случае если элемент конкретной связывающейся пары в элементах библиотек согласно настоящему изобретению является лигандом, то конкретный элемент библиотеки может быть активирован в присутствии второго члена конкретной связывающейся пары, причем второй элемент конкретной связывающейся пары представляет собой рецептор для лиганда. Например, если лиганд представляет собой VEGF, второй элемент специфичной связывающейся пары может представлять собой рецептор VEGF, включая растворимый рецептор VEGF. В другом примере, если лиганд является лигандом Notch, то второй член специфичной связывающейся пары может представлять собой рецептор Notch или его лигандсвязывающий участок. В качестве другого примера, если лиганд представляет собой херегулин, то второй член специфичной связывающейся пары может представлять собой Нег2.
В некоторых случаях член специфичной связывающейся пары, который включен в элементы библиотеки согласно настоящему изобретению, представляет собой рецептор, например, рецептор для лиганда, корецептор и т.д. Рецептор может представлять собой лигандсвязывающий фрагмент рецептора. Подходящие рецепторы включают, но не ограничиваются ими, рецептор фактора роста (например, рецептор VEGF); полипептид члена 1 подсемейства лектиноподобных рецепторов клеток-киллеров К (NKG2D) (рецептор для MICA, MICB и ULB6); рецептор цитокинов (например, рецептор ИЛ-13, рецептор ИЛ-2 и т.д.); Her2; CD27; полипептид рецептора естественной цитотоксичности (NCR) (например, NKP30 (NCR3/CD337) (рецептор для HLA-B-ассоциированного транскрипта 3 (ВАТЗ) и В7-Н6) и т.д.); рецептор Notch (например, NOTCH1 человека, NOTCH2 человека, NOTCH3 человека, NOTCH4 человека и т.д.) и т.п.
Специфичные партнеры по связыванию также включают димерные пары. Отдельные члены димерных пар подходят для применения в качестве элемента библиотек
согласно настоящему изобретению и включают, но не ограничиваются ими, связывающиеся с димеризатором пары. Связывающиеся с димеризатором пары связываются с различными участками одной и той же молекулы (называемой в настоящем документе "димеризатор"). В присутствии димеризатора оба члена связывающейся с димеризатором пары связываются с различными участками димеризатора и, следовательно, сближаются друг с другом. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является обратимым. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является необратимым. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является нековалентным. Согласно некоторым вариантам реализации настоящего изобретения связывание с димеризатором является ковалентным.
Другие димерные пары, подходящие для применения, включают связывающиеся с димеризатором пары, которые димеризуются при связывании первого члена димерной пары с димеризирующим агентом, причем димеризующий агент индуцирует конформационное изменение в первом члене димерной пары, и при этом конформационное изменение позволяет первому члену димерной пары связываться (ковалентно или нековалентно) со вторым членом димерной пары. Другие димерные пары, подходящие для применения, включают димерные пары, в которых воздействие света (например, синего света) индуцирует димеризацию димерной пары.
В некоторых случаях член специфичной связывающейся пары может включать белок, участвующий в сигнальном взаимодействии белок-белок или сигнальном взаимодействии белок-липид, и в этой связи синтетические модульные полипептиды, описанные в настоящем документе, могут включать один или более доменов взаимодействия белок-белок или доменов взаимодействия белок-липид. Подходящие домены взаимодействия белок-белок или домены взаимодействия белок-липид включают, но не ограничиваются ими, например, домен 14-3-3 (например, тот, который присутствует в структуре 2В05 PDB (база данных белковых структур RCSB, доступная на веб-сайте www.rcsb.org)), домен фактора деполимеризации актина (ADF) (например, присутствующий в структуре 1CFY PDB), домен ANK (например, присутствующий в структуре 1SW6 PDB), домен ANTH (N-концевой гомологии АР 180) (например, присутствующий в структуре 5AHV PDB), домен Armadillo (ARM) (например, присутствующий в структуре 1ВК6 PDB), домен BAR (Bin/Amphiphysin/Rvs) (например, присутствующая в структуре 1I4D PDB), домен BEACH ("beige and CHS") (например, присутствующий в структуре 1MI1 PDB), домены ВН (гомологии Bcl-2) (ВН1, ВН2, ВНЗ
и ВН4) (например, присутствующие в структуре 1BXL PDB), домен повтора бакуловируса IAP (BIR) (например, присутствующий в структуре 1G73 PDB), домен BRCT (BRCA1 С-конец) (например, присутствующий в структуре 1Т29 PDB), бромдомен (например, присутствующий в структуре 1E6I PDB), домен ВТВ (BR-C, ttk и bab) (например, присутствующий в структуре 1R2B PDB), домен С1 (например, присутствующий в структуре 1PTQ PDB), домен С2 (например, присутствующий в структуре 1А25 PDB), домены привлечения каспазы (CARD) (например, присутствующие в структуре 1CWW PDB), суперспиральный домен (СС) (например, присутствующий в структуре 1QEY PDB), домен CALM (Clathrin Assembly Lymphoid Myeloid) (например, присутствующий в структуре 1HFA PDB), домен гомологичности калопонина (СН) (например, присутствующий в структуре 1BKR PDB), домен, модифицирующий организацию хроматина (Chromo) (например, присутствующий в структуре 1KNA PDB), домен CUE (например, присутствующий в структуре 10TR PDB), домены гибели (DD) (например, присутствующие в структуре 1FAD PDB), домен гибели-эффектора (DED) (например, присутствующий в структуре 1A1W PDB), домен Discheveled, EGL-10 и плекстрин (DEP) (например, присутствующий в структуре 1FSH PDB), домен гомологии Dbl (DH) (например, присутствующий в структуре 1FOE PDB), домен EF-руки (EFh) (например, присутствующий в структуре 2PMY PDB), домен EpslS-гомологии (ЕН) (например, присутствующий в структуре 1ЕН2 PDB), домен №Г2-концевой гомологии эпсина (ENTH) (например, присутствующий в структуре 1EDU PDB), домен гомологии Ena/Vasp 1 (EVH1) (например, присутствующий в структуре 1QC6 PDB), домен F-box (например, присутствующий в структуре 1FS1 PDB), домен FERM (полоса 4.1, эзрин, радиксин, моэзин) (например, присутствующий в структуре 1GC6 PDB), домен FF (например, присутствующий в структуре 1UZC PDB), домен гомологии формина-2 (FH2) (например, присутствующий в структуре 1UX4 PDB), домен, ассоциированный с Forkhead (FHA) (например, присутствующий в структуре 1G6G PDB), домен FYVE (Fab-1, YGL023, Vps27 и ЕЕА1) (например, присутствующий в структуре 1VFY PDB), домен GAT (GGA и Toml) (например, присутствующий в структуре ЮЗХ PDB), домен гомологии гелсолина (GEL) (например, присутствующий в структуре 1H1V PDB), домен GLUE (GRAM-подобный убиквитин-связывающий домен в ЕАР45) (например, присутствующий в структуре 2CAY PDB), домен GRAM (из глюкозилтрансфераз, Rab-подобные активаторы ГТФаз и миотубуларины) (например, присутствующий в структуре 1LW3 PDB), домен GRIP (например, присутствующий в структуре 1UPT PDB), домен глицин-тирозин-фенилаланин (GYF) (например, присутствующий в структуре 1GYF PDB), домен HEAT (хантингтон, фактор удлинения 3, PR65/A, TOR) (например, присутствующий в структуре 1IBR PDB),
домен, гомологичный С-концевому домену Е6-АР (НЕСТ) (например, присутствующий в структуре 1C4Z PDB), домен IQ (например, присутствующий в структуре 1N2D PDB), домен LIM (Lin-1, Isl-1 и Мес-3) (например, присутствующий в структуре 1QLI PDB), домен обогащенных лейцином повторов (LRR) (например, присутствующий в структуре 1YRG PDB), домен злокачественной опухоли головного мозга (МВТ) (например, присутствующий в структуре 10YX PDB), домен МН1 (гомологии Mad 1) (например, присутствующий в структуре 10ZJ PDB), домен МН2 (гомологии Mad 2) (например, присутствующий в структуре 1DEV PDB), домен МШ (взаимодействующий с убиквитином мотив) (например, присутствующий в структуре 2С7М PDB), домен NZF (цинковый палец Npl4) (например, присутствующий в структуре 1Q5W PDB), домен PAS (Per-ARNT-Sim) (например, присутствующий в структуре 1Р97 PDB), домен Phox и Beml (РВ1) (например, присутствующий в структуре 1IPG PDB), домен PDZ (постсинаптическая плотность 95, PSD-85, discs large, Dig, zonula occludens-1, ZO-1) (например, присутствующей в структуре 1ВЕ9 PDB), домен гомологичности плекстрина (РН) (например, присутствующий в структуре 1MAI PDB), домен Polo-Box (например, присутствующий в структуре 1Q4K PDB), домен связывания фосфотирозина (РТВ) (например, присутствующего в структуре 1SHC PDB), домен Pumilio/Puf (PUF) (например, присутствующий в структуре 1M8W PDB), домен PWWP (например, присутствующий в структуре 1КНС PDB), домен гомологии Phox (РХ) (например, присутствующий в структуре 1Н6Н PDB), домен RGS (регулятор опосредованной G-белком передачи сигналов) (например, присутствующий в структуре 1AGR PDB), домен RING (например, присутствующий в структуре 1FBV PDB), домен SAM (стерильный альфа-мотив) (например, присутствующий в структуре 1В0Х PDB), домен Shadow Chromo (SC) (например, присутствующий в структуре lEOB PDB), домен Src-гомологии 2 (SH2) (например, присутствующий в структуре 1SHB PDB), домен Src-гомологии 3 (SH3) (например, присутствующий в структуре 3SEM PDB), домен SOCS (супрессоры передачи сигналов с участием цитокинов) (например, присутствующий в структуре 1VCB PDB), домен SPRY (например, присутствующий в структуре 2AFJ PDB), родственный стероидогенному острому регуляторному белку (StAR) домен переноса липидов (START) (например, присутствующий в структуре 1ЕМ2 PDB), домен SWIRM (например, присутствующий в структуре 2AQF PDB), домен рецептора Toll/11-1 (TIR) (например, присутствующий в структуре 1FYV PDB), домен тетратрикопептидного повтора (TPR) (например, присутствующий в структуре 1ELW PDB), домен TRAF (факторы, связанные с рецептором фактора некроза опухолей (ФНО)) (например, присутствующий в структуре 1F3V PDB), домен tSNARE (домен SNARE (растворимый чувствительный к N
этилмалеимиду рецептор, обеспечивающий прикрепление белков (SNAP)) (например, присутствующий в структуре 1SFC PDB), домен Tubby (например, присутствующий в структуре 1I7E PDB), домен TUDOR (например, присутствующий в структуре 2GFA PDB), связанный с убиквитином (UBA) домен (например, присутствующий в структуре 1IFY PDB), домен UEV (вариант убиквитина Е2) (например, присутствующий в структуре 1S1Q PDB), домен мотива, взаимодействующего с убиквитином (UIM) (например, присутствующий в структуре 1Q0W PDB), домен VHL (например, присутствующий в структуре 1LM8 PDB), домен VHS (Vps27p, Hrs и STAM) (например, присутствующий в структуре 1ELK PDB), домен WD40 (например, присутствующий в структуре 1NEX PDB), домен WW (например, присутствующий в структуре 1I6C PDB) и т.п.
Отдельные элементы библиотеки согласно настоящему изобретению, описанной в настоящем документе, могут содержать модулирующий домен. Модулирующие домены включают домены со стимулирующими и ингибирующими функциями и домены, которые модулируют активирующие и/или ингибирующие функции других "сигнальных доменов", реакции с участием которых протекают раньше, чем реакции с участием модулирующих доменов. В некоторых случаях модулирующие домены включают костимулирующие домены. В некоторых случаях модулирующие домены включают коингибирующие домены.
Модулирующий домен, пригодный для включения в элементы библиотеки согласно настоящему изобретению, может представлять собой любую функциональную единицу полипептида, длина которой равна длине аминокислотного мотива из 3 аминокислот, и длина которой равна длине полноразмерного белка, причем размер модулирующего домена ограничен только тем, что домен должен быть достаточно большим, чтобы сохранить свою функцию, и достаточно маленьким, чтобы быть совместимым с желательным способом сборки. Соответственно, модулирующий домен может иметь размер в диапазоне от 3 аминокислот до 1000 аминокислот или более, и, в некоторых случаях, может иметь в длину от приблизительно 30 аминокислот до приблизительно 70 аминокислот (а.к.), например, модулирующий домен может иметь в длину от приблизительно 30 а.к. до приблизительно 35 а.к., от приблизительно 35 а.к. до приблизительно 40 а.к., от приблизительно 40 а.к. до приблизительно 45 а.к., от приблизительно 45 а.к. до приблизительно 50 а.к., от приблизительно 50 а.к. до приблизительно 55 а.к., от приблизительно 55 а.к. до приблизительно 60 а.к., от приблизительно 60 а.к. до приблизительно 65 а.к. или от приблизительно 65 а.к. до приблизительно 70 а.к. В других случаях модулирующий домен может иметь в длину от приблизительно 70 а.к. до приблизительно 100 а.к., от приблизительно 100 а.к. до
приблизительно 200 а.к. или более 200 а.к.
В некоторых случаях "костимулирующие домены" можно применять в отдельных элементах библиотек согласно настоящему изобретению. Совместная стимуляция обычно относится к вторичному неспецифичному механизму активации, посредством которого распространяется первичная специфичная стимуляция. Примеры совместной стимуляции включают неспецифичную для антигена Т-клеточную стимуляцию после антигенспецифичной передачи сигналов через рецептор Т-клеток и неспецифичную для антигена В-клеточную совместную стимуляцию после передачи сигналов через рецептор В-клеток. Совместная стимуляция, например, совместная Т-клеточная стимуляция и связанные с ней факторы были описаны в работе Chen & Flies. Nat Rev Immunol (2013) 13 (4):227-42, содержание которой полностью включено в настоящую заявку посредством ссылки. Костимулирующие домены обычно представляют собой полипептиды, полученные из рецепторов. Согласно некоторым вариантам реализации настоящего изобретения костимулирующие домены гомодимеризуются. Костимулирующий домен согласно настоящему изобретению может представлять собой внутриклеточную часть трансмембранного белка (т.е., костимулирующий домен может быть получен из трансмембранного белка). Неограничивающие примеры подходящих костимулирующих полипептидов включают, но не ограничиваются ими, 4-1ВВ (CD137), CD28, ICOS, ОХ-40, BTLA, CD27, CD30, GITR и HVEM. В некоторых случаях костимулирующий домен, например, используемый в элементе библиотеки согласно настоящему изобретению, может включать костимулирующий домен, перечисленный в таблице 1. В некоторых случаях костимулирующий домен отдельного элемента библиотеки содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотной последовательности костимулирующего домена, описанного в настоящем документе.
В некоторых случаях "коингибирующие домены" можно применять в отдельных элементах библиотек согласно настоящему изобретению. Подходящие коингибирующие домены обычно представляют собой полипептиды, полученные из рецепторов. Совместное ингибирование обычно относится к вторичному ингибированию первичных антигенспецифичных механизмов активации, которое предотвращает совместную стимуляцию. Совместное ингибирование, например, совместное ингибирование Т-клеток и связанные с ним факторы были описаны в работах Chen & Flies. Nat Rev Immunol (2013) 13(4):227-42 и Thaventhiran et al. J Clin Cell Immunol (2012) S12, содержание которых
полностью включено в настоящую заявку посредством ссылки. Согласно некоторым вариантам реализации настоящего изобретения коингибирующие домены гомодимеризуются. Коингибирующий домен согласно настоящему изобретению может быть внутриклеточной частью трансмембранного белка (т.е. коингибирующий домен может быть получен из трансмембранного белка). Неограничивающие примеры подходящих коингибирующих полипептидов включают, но не ограничиваются ими, CTLA-4 и PD-1. В некоторых случаях коингибирующий домен, например, используемый в элементе библиотеки согласно настоящему изобретению, может включать коингибирующий домен, перечисленный в таблице 1. В некоторых случаях костимулирующий домен отдельного элемента библиотеки содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотной последовательности костимулирующего домена, описанного в настоящем документе.
В некоторых случаях отдельные элементы библиотеки из библиотеки синтетических модульных полипептидов могут включать модуль внутриклеточного сигнального домена. Внутриклеточные сигнальные домены, подходящие для применения в качестве модулей библиотеки согласно настоящему изобретению, включают любой желательный сигнальный домен, который обеспечивает различимый и детектируемый сигнал (например, увеличение выработки одного или более цитокинов клеткой; изменение транскрипции гена-мишени; изменение активности белка; изменение поведения клеток, например, гибель клеток, пролиферацию клеток, дифференцировку клеток, выживаемость клеток; модуляцию клеточных сигнальных реакций и т.д.) в ответ на активацию отдельного элемента библиотеки. Домен внутриклеточной сигнализации может быть ковалентно присоединен к отдельным элементам библиотеки или может не иметь такой связи, например, в тех случаях, когда все элементы библиотеки используют общий внутриклеточный сигнальный домен, внутриклеточный сигнальный домен может быть не связан с элементами библиотеки, например, может диффундировать в цитоплазме.
В некоторых случаях отдельные элементы библиотеки согласно настоящему изобретению будут включать трансмембранный домен для введения в мембрану эукариотических клеток. Трансмембранный домен может присутствовать в любом удобном месте в пределах элементов библиотек, например, на N-конце для модульных компонентов библиотеки, на С-конце для модульных компонентов библиотеки, может быть расположен между по меньшей мере двумя модульными компонентами библиотеки
(например, между антигенсвязывающим доменом и костимулирующим доменом элементов модульной библиотеки CAR) и т.д.
Любой трансмембранный (ТМ) домен, который обеспечивает введение полипептида в мембрану эукариотических клеток (например, млекопитающего), подходит для применения. В качестве одного неограничивающего примера, подходящей для использования является ТМ-последовательность IYIWAPLAGTCGVLLLSLVITLYC (SEQ ID NO: 1). Дополнительные неограничивающие примеры подходящих ТМ-последовательностей включают:
a) последовательности, полученные из CD8-6eTa:
LGLLVAGVLVLLVSLGVAIHLCC (SEQ ID N0: 2);
b) последовательности, полученные из CD4: ALIVLGGVAGLLLFIGLGIFFCVRC (SEQ ID N0: 3);
c) последовательности, полученные из CD3-дзета: LCYLLDGILFIYGVILTALFLRV (SEQ ID N0: 4);
d) последовательности, полученные из CD28:
WVLVVVGGVLACYSLLVTVAFIIFWV (SEQ ID N0: 5);
e) последовательности, полученные из CD 134 (ОХ40):
VAAILGLGLVLGLLGPLAILLALYLL (SEQ ID NO: 6); и
f) последовательности, полученные из CD7: ALPAALAVISFLLGLGLGVACVLA
(SEQ ID NO: 7).
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более дополнительных модульных элементов. Например, в тех случаях, когда библиотека представляет собой библиотеку химерных антигенных рецепторов (CAR), отдельные элементы библиотеки могут быть сконфигурированы так, чтобы содержать один или более дополнительных компонентов, как описано, например, в РСТ публикации заявки на патент WO2014/127261, содержание которой полностью включено в настоящую заявку посредством ссылки.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей многодоменного каркасного белка. В настоящей заявке термин "каркасные белки" включает якорные белки и адаптерные белки. Указанные белки содержат несколько связывающих доменов, каждый из которых привлекает или закрепляет определенные элементы сигнального пути, например, закрепляет их в комплексах, локализует их в клетке или модулирует процесс передачи сигналов (например,
контролирует положительную и/или отрицательную обратную связь, стабилизирует активированные сигнальные компоненты от инактивации и т.д.). Следовательно, домены многодоменных каркасных белков, многодоменных якорных белков и многодоменных адаптерных белков обычно включают связывающие домены членов пути передачи сигналов.
Неограничивающие примеры каркасных белков и путей передачи сигналов, в которых они функционируют, включают, например, каркасный белок Ste5 пути с участием митоген-активируемой протеинкиназы (МАРК); якорные белки А-киназы (АКАР) пути передачи сигналов с участием протеинкиназы А (РКА); супрессор киназы Ras 1 (KSR) пути передачи сигналов с участием МАРК; белок В-клеточной лимфомы 10 (BCL-10) пути передачи сигналов с участием N-концевой киназы JUN (JNK) и пути передачи сигналов с участием МАРК; киназу киназы митоген-активируемой протеинкиназы 1 (МЕКК1) пути передачи сигналов с участием JNK и пути передачи сигналов с участием МАРК; AHNAK-1 кальций-зависимого пути передачи сигналов; HOMER кальций-зависимого пути передачи сигналов; белки Pellino пути передачи сигналов врожденной иммунной системы; семейство NLR, содержащие пириновые домены (NLRP) белки пути передачи сигналов врожденной иммунной системы; гомолог Disks large 1 (DLG1) пути передачи сигналов с участием рецептора Т-клеток; спинофилин пути передачи сигналов дендритных клеток; и т.п. Каркасные белки также включают, но не ограничиваются ими, например, те, которые описаны в работе Buday & Tompa. FEBS Journal (2010) 277:4348-4355; содержание которой полностью включено в настоящую заявку посредством ссылки. В некоторых случаях каркасный белок может представлять собой белок, связанный с терминами генной онтологии (GO) "каркасный белковый комплекс" (GO: 0032947) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей протеинкиназ. Протеинкиназы представляют собой белки, которые функционируют путем добавления фосфатных групп к белкам-субстратам для управления активностью белка-субстрата, ассоциацией с другими белками и/или локализацией. Протеинкиназы могут включать белки, которые связаны с терминами GO "фосфорилирование белка" (GO: 0006468), "активность протеинкиназы" (GO: 0004672), "активность сериновой/треониновой протеинкиназы" (GO: 0004674), "активность киназы" (GO: 0016301) и синонимичными терминами, которые могут быть использованы
для получения информации, относящейся к протеинкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. Протеинкиназы содержат один или более доменов киназы, которые осуществляют каталитическую функцию протеинкиназы. Домены протеинкиназы связаны с идентификатором Pfam PF00069, который может быть использован для получения информации о протеинкиназных доменах тех белков, которые содержат протеинкиназные домены, включая последовательности и структуры, представленные, например, на вебсайте pfam.xfam.org.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей протеинфосфатаз. Протеинфосфатазы представляют собой белки, которые функционируют путем удаления фосфатной группы из фосфорилированного остатка аминокислоты своего белка-субстрата, что приводит к дефосфорилированию для управления активностью белка-субстрата, и выполняют функции, обратные таковым протеинкиназ. Протеинфосфатазы сгруппированы в три класса: фосфопротеиновые фосфатазы (например, РРР1СА, РРР1СВ, РРР1СС, РРР2СА, РРР2СВ, РРРЗСА, РРРЗСВ, РРРЗСС, РРР4С, РРР5С, РРР6С и т.д.), протеинтирозинфосфатазы (например, CDC14A, CDC14B, CDC14C, CDKN3, PTEN, SSH1, SSH2, SSH3 и т.д.) и протеинфосфатазы с двойной специфичностью (например, DUSP1, DUSP2, DUSP3, DUSP4, DUSP5, DUSP6, DUSP7, DUSP8, DUSP9, DUSP10, DUSP11, DUSP12, DUSP13, DUSP14, DUSP15, DUSP16, DUSP18, DUSP19, DUSP21, DUSP22, DUSP23, DUSP26, DUSP27, DUSP28 и т.д.); однако некоторые протеинфосфатазы остаются неклассифицированными. Протеинфосфатазы могут включать белки, которые связаны с термином GO "активность фосфатазы" (GO: 0016791) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к протеинфосфатазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. Протеинфосфатазы содержат один или более фосфатазных доменов, которые осуществляют функцию дефосфорилирования протеинфосфатазы. Домены протеинфосфатаз связаны с идентификатором Pfam PF15698, который может быть использован для получения информации о протеинфосфатазных доменах тех белков, которые содержат протеинфосфатазные домены, включая последовательности, например, представленные на веб-сайте pfam.xfam.org.
В некоторых случаях отдельные элементы библиотеки синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка рецепторной тирозинкиназы, также называемых рецепторными тирозинкиназами (RTK). RTK представляют собой связанные с мембраной рецепторы
клеточной поверхности. Существует подкласс тирозинкиназ, RTK, которые функционируют посредством связывания внеклеточного лиганда и последующего фосфорилирования цитоплазматической части белка. RTK можно разделить на семейства, включающие, например, семейство рецепторов эпидермального фактора роста, семейство рецепторов фактора роста фибробластов (FGFR), семейство рецепторов фактора роста эндотелия сосудов (VEGFR), семейство рецепторов RET и семейство рецепторов с дискоидиновым доменом (DDR). RTK могут включать белки, которые связаны с терминами GO "активность трансмембранной рецепторной тирозинкиназы" (GO: 0004714), "путь передачи сигналов с участием трансмембранной рецепторной тирозинкиназы" (GO: 0007169) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к RTK, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO. RTK содержат один или более тирозинкиназных доменов, которые осуществляют киназную функцию RTK. Киназные домены RTK связаны с идентификатором Pfam PF07714, который может быть использован для получения информации о киназных доменах RTK и белках, содержащих киназные домены RTK, включая последовательности и структуры, например, представленные на веб-сайте pfam.xfam.org.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка липидкиназы. Белки липидкиназы фосфорилируют клеточные липиды, что приводит к модуляции реактивности липида, передаче сигнала и/или локализации липидов. Липидкиназы можно разделить на семейства, включая, например, фосфатидилинозитолкиназы и сфингозинкиназы. Липидкиназы могут включать белки, которые связаны с терминами GO "активность липидкиназы" (GO: 0001727), "фосфорилирование липидов" (GO: 0046834) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к липидкиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка липидфосфатазы. Белки липидфосфатаз дефосфорилируют клеточные липиды и их активность противоположна активности липидкиназ, которая приводит к модуляции реактивности липида, передаче сигнала и/или локализации липидов. Липидфосфатазы могут включать белки, которые связаны с терминами GO "активность липидфосфатазы" (GO: 0042577), "дефосфорилирование фосфолипидов" (GO: 0046839) и
синонимичными терминами, которые могут быть использованы для получения информации, относящейся к липидфосфатазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка убиквитинилазы. Белки убиквитинилазы представляют собой белки, которые опосредуют посттрансляционную модификацию убиквитинирования, присоединение убиквитина к белку-субстрату. Убиквитинирование белка-субстрата может привести к деградации белка-субстрата, перемещению белка-субстрата, модуляции активности белка-субстрата, модуляции белок-белкового взаимодействия белка-субстрата и т.д. Убиквитинилазы могут включать белки, связанные с терминами GO "убиквитинирование белка" (GO: 0016567), "активность убиквитин-протеинтрансферазы" (GO: 0004842) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к убиквитинилазам, включая последовательности, представленные, например, на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деубиквитинилазы. Белки деубиквитинилазы представляют собой белки, которые опосредуют обращение убиквитинирования, удаление убиквитина из белка-субстрата. Деубиквитинирование белка-субстрата может обратить действие убиквитинилаз и предотвратить деградацию белка-субстрата, обратить связанное с убиквитином перемещение белка-субстрата, обратить связанную с убиквитином модуляцию активности белка-субстрата, обратить связанную с убиквитином модуляцию белок-белкового взаимодействия белка-субстрата и т.д. Деубиквитинилазы могут включать белки, которые связаны с термином GO "деубиквитинирование белка" (GO: 0016579) и синонимичными терминами, которые можно использовать для получения информации, относящейся к деубиквитинилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка БиМОилазы. Белки БЦМОилазы представляют собой белки, которые опосредуют посттрансляционную модификацию БиМОилирования, добавление небольшого убиквитинподобного модифицирующего белка (SUMO) к белку-субстрату. БиМОилирование может модулировать различные функции белка, включая стабильность белка, ядерно-цитозольный транспорт, регуляцию транскрипции и т.д. БиМОилазы могут
включать белки, связанные с термином GO "БиМОилирование белка" (GO: 0016925), и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к БиМОилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных
полипептидов могут быть сконфигурированы так, чтобы содержать один или более
модулей белка ацетилазы, также называемых ацетилтрансферазами. Ацетилтрансферазы
представляют собой ферменты-трансферазы, которые катализируют перенос ацетильной
группы на белок-субстрат и участвуют в эпигенетической и транскрипционной
модуляции. Ацетилтрансферазы могут быть классифицированы на группы, включающие,
например, гистонацетилтрансферазы, холинацетилтрансферазы,
хлорамфениколацетилтрансферазы, серотонин-ГчГ-ацетилтрансферазы, NatA-
ацетилтрансферазы, NatB-ацетилтрансферазы. Ацетилтрансферазы могут включать белки, которые связаны с термином GO "активность ацетилтрансферазы" (GO: 0016407) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к ацетилтрансферазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деацетилазы. Белки деацетилазы обращают действие ацетилтрансфераз и удаляют ацетильные группы, перенесенные на белок-субстрат, и, следовательно, также участвуют в эпигенетической и транскрипционной модуляции. Деацетилазы включают, например, гистондеацетилазы и сиртуины. Деацетилазы могут включать белки, которые связаны с термином GO "активность деацетилазы" (GO: 0019213) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к деацетилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка метилазы, также называемых метилтрансферазами. Метилтрансферазы алкилируют субстраты (включая такие субстраты как белки и нуклеиновые кислоты) путем переноса метильной группы на субстрат и участвуют в эпигенетической и транскрипционной модуляции. Метилтрансферазы можно разделить на классы на основании их структуры, включая, например, класс I, класс II, класс III, и можно сгруппировать в соответствии с их субстратами или способом метилирования, включая,
например, протеинметилтрансферазы, ДНК-метилтрансферазы, метилтрансферазы природного продукта и SAM-независимые метилтрансферазы. Метилтрансферазы могут включать белки, которые связаны с терминами GO "активность ДНК-метилтрансферазы" (GO: 0009008), "активность гистонметилтрансферазы" (GO: 0042054) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к метилтрансферазам, включая последовательности, например, представленные на вебсайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка деметилазы. Деметилазы обращают действие метилтрансфераз и катализируют удаление метальных групп с субстратов (включая такие субстраты как белки и нуклеиновые кислоты) и, следовательно, также участвуют в эпигенетической и транскрипционной модуляции. Деметилазы могут включать белки, которые связаны с терминами GO "активность деметилазы" (GO: 0032451), "активность ДНК-деметилазы" (GO: 0035514), "активность гистондеметилазы" (GO: 0032452) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к деметилазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка нуклеазы. Нуклеазы катализируют расщепление фосфодиэфирных связей между нуклеотидными субъединицами нуклеиновых кислот-субстратов. Нуклеазы можно подразделить на не взаимоисключающие категории, такие как эндонуклеазы и экзонуклеазы. Нуклеазы могут включать белки, которые связаны с терминами GO "активность нуклеазы" (GO: 0004518), "активность дезоксирибонуклеазы I" (GO: 0004530), "активность рибонуклеазы в отношении гибрида РНК-ДНК" (GO: 0004523), "гидролиз фосфодиэфирной связи нуклеиновых кислот" (GO: 0090305), "активность эндонуклеазы" (GO: 0004519), "активность экзонуклеазы" (GO: 0004527) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к нуклеазам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка рекомбиназы. Рекомбиназы катализируют чувствительные к направлению реакции обмена нуклеиновых кислот между последовательностями участков-мишеней,
специфичных для каждой рекомбиназы, что приводит к вырезанию/вставке, инверсии, транслокации и обмену фрагментов нуклеиновых кислот. Примеры рекомбиназ включают, но не ограничиваются ими, рекомбиназу Сге, рекомбиназу Hin, рекомбиназу Тге, рекомбиназу FLP и т.п. Рекомбиназы могут включать белки, которые связаны с терминами GO "активность рекомбиназы" (GO: 0000150), "рекомбинация ДНК" (GO: 0006310) и синонимичными терминами, которые могут быть использованы для получения информации, относящейся к рекомбиназам, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей белка фактора транскрипции. Факторы транскрипции представляют собой белки, которые связываются с определенными последовательностями ДНК и контролируют транскрипцию. Факторы транскрипции могут являться активаторами, которые усиливают транскрипцию, или репрессорами, которые подавляют транскрипцию. Факторы транскрипции могут быть классифицированы на суперклассы на основании структуры их ДНК-связывающих доменов, включая, например, содержащие основной домен факторы транскрипции, факторы транскрипции, содержащие цинк-координирующий ДНК-связывающий домен, факторы транскрипции спираль-поворот-спираль, факторы транскрипции, содержащие бета-каркасные факторы, и те факторы транскрипции, которые не включены ни в один из вышеуказанных суперклассов (см., например, Stegmaier et al. Genome Inform (2004) 15(2):276-86). Факторы транскрипции содержат один или более ДНК-связывающих доменов. ДНК-связывающие домены факторов транскрипции могут представлять собой один или более ДНК-связывающих доменов, связанных с идентификаторами Pfam PF00010, PF00170, PF00172, PF00046, PF00319, PF08279, PF00096, PF00105 и т.п., которые могут быть использованы для получения информации о последовательностях и структуре доменов, например, на веб-сайте pfam.xfam.org. Факторы транскрипции также могут содержать один или более транс-активирующих доменов, один или более доменов, воспринимающих сигналы. Факторы транскрипции могут включать белки, связанные с термином GO "комплекс факторов транскрипции" (GO: 0005667), и синонимичными и родственными терминами, которые могут быть использованы для получения информации, относящейся к факторам транскрипции, включая последовательности, например, представленные на веб-сайте www.ebi.ac.uk/QuickGO.
Другие ДНК-связывающие домены, например, ДНК-связывающие домены, полученные не из факторов транскрипции, или ДНК-связывающие домены, не
принадлежащие факторам транскрипции, также можно применять в некоторых случаях в одном или более модулях отдельных элементов библиотек синтетических модульных полипептидов, описанных в настоящем документе. Подходящие ДНК-связывающие домены, полученные не из факторов транскрипции, включают природные и синтетические полипептидные домены, которые неспецифично связываются с ДНК или связываются со специфичными последовательностями ДНК. ДНК-связывающие домены, полученные не из факторов транскрипции, могут включать, но не ограничиваются ими, например, природный или модифицированный ДНК-связывающий домен из полипептида эндонуклеазы, содержащей цинковый палец, природный или модифицированный ДНК-связывающий домен из полипептида эффекторной нуклеазы, подобной активаторам транскрипции (TALEN), природный или модифицированный ДНК-связывающий домен полипептида Cas9 (включая, например, Cas9 с полной инактивацией нуклеазной активности (dCas9) и тому подобное) и т.д.
В некоторых случаях отдельные элементы библиотек синтетических модульных полипептидов могут быть сконфигурированы так, чтобы содержать один или более модулей, описанных в РСТ заявке US2004/019778, содержание которой полностью включено в настоящую заявку посредством ссылки.
Компоновка модулей в синтетические модульные полипептиды, описанные в настоящем документе, позволит получить библиотеку, содержащую множество отдельных модульных функциональных белков, которые могут, но необязательно, обладать общей функцией. Например, отдельные элементы библиотеки могут содержать или могут состоять из синтетических модульных полипептидов, которые представляют собой модульные каркасные белки, синтетических модульных полипептидов, которые представляют собой модульные рецепторные белки, синтетических модульных полипептидов, которые представляют собой модульные белки протеинкиназ или протеинфосфатаз, синтетических модульных полипептидов, которые представляют собой модульные транскрипционные регуляторные белки, синтетических модульных полипептидов, которые представляют собой модульные эпигенетические регуляторные белки, синтетических модульных полипептидов, которые представляют собой модульные белки рекомбиназ или нуклеаз и т.д. Подходящие библиотеки можно подвергать скринингу для определения желательного фенотипа в соответствии со способами, описанными в настоящем документе.
Репортеры
Библиотеки, описанные в настоящем документе, включают детектируемые сигнальные белки, экспрессия которых кодируется последовательностями нуклеиновых
кислот библиотек. Конкретные детектируемые сигнальные белки, используемые в системах библиотек, описанных в настоящем документе, будут варьироваться и частично зависеть от предпочтительного способа детектирования полученного сигнала. Например, если сигнал детектируется оптическими способами, например, с использованием флуоресцентной микроскопии или проточной цитометрии (включая флуоресцентно-активированную сортировку клеток (FACS)), то используется флуоресцентный репортер.
Подходящие детектируемые сигнальные белки включают, например, флуоресцентные белки; ферменты, которые катализируют реакцию, которая приводит к получению детектируемого сигнала в качестве продукта; эпитопные метки, поверхностные маркеры и т.п. Детектируемые сигнальные белки могут быть обнаружены непосредственно или косвенно. Например, если используется флуоресцентный репортер, то флуоресценцию репортера можно детектировать непосредственно. В некоторых случаях, если используется эпитопная метка или поверхностный маркер, то эпитопную метку или поверхностный маркер можно детектировать косвенно, например, с помощью детектируемого связывающего агента, который специфично связывается с эпитопной меткой или поверхностным маркером, например, с помощью флуоресцентномеченого антитела, которое специфично связывается с эпитопной меткой или поверхностным маркером. В некоторых случаях репортер, который обычно детектируют косвенно, например, эпитопную метку или поверхностный маркер, можно детектировать непосредственно, или репортер, который обычно детектируют непосредственно, можно детектировать косвенно, например, посредством использования детектируемого антитела, которое специфично связывается с флуоресцентным репортером.
Подходящие флуоресцентные белки включают, но не ограничиваются ими, зеленый флуоресцентный белок (GFP) или его варианты, синий флуоресцентный вариант GFP (BFP), голубой флуоресцентный вариант GFP (CFP), желтый флуоресцентный вариант GFP (YFP), улучшенный GFP (EGFP), улучшенный CFP (ECFP), улучшенный YFP (EYFP), GFPS65T, Изумруд, Топаз (TYFP), Venus, Citrine, mCitrine, GFPuv, дестабилизированный EGFP (dEGFP), дестабилизированный ECFP (dECFP), дестабилизированный EYFP (dEYFP), mCFPm, Cerulean, T-Sapphire, CyPet, YPet, mKO, HcRed, t-HcRed, DsRed, DsRed2, мономерный DsRed, J-Red, dimer2, t-dimer2(12), mRFPl, поциллопорин, Renilla GFP, Monster GFP, paGFP, белок Kaede и фотоактивируемый белок, фикобилипротеины и конъюгаты фикобилипротеинов, включая В-фикоэритрин, R-фикоэритрин и аллофикоцианин. Другие примеры флуоресцентных белков включают mHoneydew, mBanana, mOrange, dTomato, tdTomato, mTangerine, mStrawberry, mCherry, mGrapel, mRaspberry, mGrape2, mPlum (Shaner et al. (2005) Nat. Methods 2:905-909) и т.п.
Любой из множества флуоресцентных и окрашенных белков из видов Anthozoa, описанных, например, Matz et al. (1999) Nature Biotechnol. 17:969-973, подходит для применения.
Подходящие ферменты включают, но не ограничиваются ими, пероксидазу хрена (HRP), щелочную фосфатазу (АР), бета-галактозидазу (GAL), глюкозо-6-фосфатдегидрогеназу, бета-М-ацетилглюкозаминидазу, Р-глюкуронидазу, инвертазу, ксантиноксидазу, люциферазу светлячков, глюкозооксидазу (GO) и т.п.
Линкеры и соединения
Соединения между модульными компонентами, кодирующими один полипептид, внутри отдельных элементов библиотеки обычно сохраняют "рамку считывания", т.е. открытая рамка считывания кодонов многомодульной кодирующей последовательности поддерживается от одного модуля до следующего. Указанные соединения могут быть упомянуты в настоящем документе как соединения с сохранением открытой рамки считывания и/или связи с сохранением открытой рамки считывания. Линкеры между модульными компонентами многомодульных полипептидов обычно будут гибкими и/или не будут содержать остатков аминокислот, которые нарушают функцию модульных доменов.
Подходящие соединения с сохранением открытой рамки считывания могут быть достигнуты, как описано более подробно ниже, с помощью любого удобного способа компоновки кодирующей последовательности и вложенной сборки модульных компонентов для включения линкера с сохранением открытой рамки считывания.
Подходящие линкеры могут быть легко выбраны и могут иметь любую подходящую длину, например, от 1 аминокислоты (например, Gly) до 20 аминокислот, от 2 аминокислот до 15 аминокислот, от 3 аминокислот до 12 аминокислот, включая от 4 аминокислот до 10 аминокислот, от 5 аминокислот до 9 аминокислот, от 6 аминокислот до 8 аминокислот или от 7 аминокислот до 8 аминокислот и могут содержать 1, 2, 3, 4, 5, 6, или 7 аминокислот.
Типичные линкеры включают полимеры глицина (G)n, полимеры глицин-серин (включая, например, (GS)", (GSGGS)" (SEQ Ш NO: 8) и (GGGS)"(SEQ ID NO: 9), где n представляет собой целое число, по меньшей мере один), полимеры глицин-аланин, полимеры аланин-серин и другие гибкие линкеры, известные в данной области техники. Подходящими для использования являются полимеры глицина и полимеры глицин-серин; Gly и Ser относительно неструктурированы и поэтому могут служить нейтральным линкером между компонентами. Подходящими для использования являются полимеры глицина; глицин получает значительно больше конформационного пространства (р-\|/,
даже по сравнению с аланином, и гораздо менее ограничен, чем остатки с более длинными боковыми цепями (см. Scheraga, Rev. Computational Chem. 11173-142 (1992)). Типичные линкеры могут содержать аминокислотные последовательности, включая, но не ограничиваясь ими, GGSG (SEQ ID NO: 10), GGSGG (SEQ ID NO: 11), GSGSG (SEQ ID NO: 12), GSGGG (SEQ ID NO: 13), GGGSG (SEQ ID NO: 14), GSSSG (SEQ ID NO: 15) и т.п.
В некоторых случаях линкер содержит последовательность сайта распознавания фермента рестрикции BamHI для целей клонирования и как часть линкера, поскольку сайт BamHI кодирует GS.
В некоторых случаях линкерные последовательности могут быть устранены с помощью одной или более стадий клонирования (например, с использованием рестрикционных эндонуклеаз типа IIS или гомологичной рекомбинации) или путем прямого расщепления (например, расщепления ферментом рестрикции BamHI).
В некоторых случаях соединение с сохранением открытой рамки считывания достигается за счет отсутствия линкера в месте соединения двух модульных компонентов. Следовательно, соединение с сохранением открытой рамки считывания может, в некотором смысле, не содержать промежуточной нуклеиновой кислоты, кодирующей аминокислоты, между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может содержать две или менее пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может содержать одну или более пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями. В некоторых случаях соединение с сохранением открытой рамки считывания может не содержать пар промежуточных нуклеиновых оснований между модульными кодирующими последовательностями.
Нуклеиновые последовательности-штрихкоды
Нуклеиновые последовательности-штрихкоды представляют собой специфичные уникальные последовательности нуклеиновых кислот, которые могут быть идентифицированы любым подходящим способом идентификации последовательности нуклеиновой кислоты, включая, но не ограничиваясь ими, например, идентификацию на основе гибридизации (т.е. гибридизацию в условиях in situ), идентификацию на основе амплификации (т.е., идентификацию на основе ПНР) и секвенирование нуклеиновой кислоты. Нуклеиновые последовательности-штрихкоды согласно настоящему изобретению могут представлять собой нуклеиновые последовательности-штрихкоды,
специфичные для модуля, это означает, что каждый уникальный модуль многомодульной библиотеки коррелирован с конкретной уникальной нуклеиновой последовательностью-штрихкодом так, что идентификация конкретной последовательности-штрихкода эквивалентна положительной идентификации соответствующей последовательности, кодирующей модуль.
Специфичная для модуля нуклеиновая последовательность-штрихкод, описанная в настоящем документе, будет ограничена используемым способом сборки библиотеки. Например, если вложенную сборку многомодульных конструкций осуществляют с помощью способа на основе фермента рестрикции, нуклеиновые последовательности-штрихкоды будут исключать любую последовательность, которая представляет собой сайт распознавания фермента рестрикции для ферментов рестрикции, используемых при сборке. Следовательно, в некоторых случаях последовательности-штрихкоды не будут содержать последовательностей, распознаваемых рестриктазами. В некоторых случаях последовательности-штрихкоды не будут содержать последовательностей, распознаваемых рестриктазой типа IIS.
В тех случаях, когда идентификацию нуклеиновой последовательности-штрихкода и/или количественную оценку выполняют путем секвенирования, включая, например, методы секвенирования следующего поколения, будут применены стандартные критерии для нуклеиновых последовательностей-штрихкодов, детектируемых путем секвенирования. В некоторых случаях коммерчески доступные нуклеиновые последовательности-штрихкоды и/или наборы, содержащие нуклеиновые последовательности-штрихкоды и/или адаптеры нуклеиновых последовательностей-штрихкодов, могут быть использованы или модифицированы для применения в способах, описанных в настоящем документе, включая, например, нуклеиновые последовательности-штрихкоды и/или наборы адаптеров нуклеиновых последовательностей-штрихкодов коммерчески доступные от таких поставщиков как, но не ограничиваясь ими, например, New England Biolabs (Ипсвич, Массачусетс, США), Illumina, Inc. (Хейвард, Калифорния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США), Bioo Scientific Corporation (Остин, Техас, США) и т.п., или могут быть изготовлены на заказ, например, как доступно, например, в Integrated DNA Technologies, Inc. (Коралвилл, Айова, США).
Длина нуклеиновой последовательности-штрихкода будет варьироваться и будет зависеть от сложности библиотеки и используемого метода детектирования последовательности-штрихкода. Поскольку нуклеиновые последовательности-штрихкоды (например, последовательности-штрихкоды ДНК) хорошо известны, то дизайн, синтез и
использование нуклеиновых последовательностей-штрихкодов находится в пределах компетенции специалиста в данной области техники.
В некоторых случаях длина используемых нуклеиновых последовательностей-штрихкодов также будет зависеть от вероятности того, что отдельная нуклеиновая последовательность-штрихкод случайно появится в каком-либо другом компоненте библиотеки, включая, но не ограничиваясь ими, например, кодирующую модуль последовательность, вектор, компонент вектора и т.д., или на стыке двух звеньев нуклеиновых последовательностей-штрихкодов. Например, в некоторых случаях, если существует значительная вероятность того, что последовательность, не относящаяся к нуклеиновой последовательности-штрихкоду, может быть случайно детектирована в виде последовательности-штрихкода, например, как это имеет место в очень сложных библиотеках, могут быть использованы звенья нуклеиновых последовательностей-штрихкодов большей длины. В некоторых случаях метод детектирования нуклеиновой последовательности-штрихкода может быть принят во внимание при определении необходимой длины последовательности-штрихкода, например, в тех случаях, когда нуклеиновую последовательность-штрихкод детектируют путем гибридизации, могут быть использованы более длинные нуклеиновые последовательности-штрихкоды, по сравнению с тем случаем, когда применяют секвенирование с использованием определенных праймеров для секвенирования.
В настоящей заявке термин "область нуклеиновой последовательности-штрихкода", поскольку он применяется по отношению к отдельным элементам библиотеки нуклеиновых кислот, относится к области каждой нуклеиновой кислоты, которая содержит последовательность нуклеиновой кислоты, специфичную для вариабельной модульной части синтетического полипептида. В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для специфичной идентификации вариабельного модуля или модулей, присутствующих в кодирующей области конкретного элемента библиотеки. В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для специфичной идентификации вариабельного модуля(ей) и идентификации порядка вариабельных модулей, присутствующих в кодирующей области конкретного элемента библиотеки (т.е. архитектуры). В некоторых случаях область нуклеиновой последовательности-штрихкода можно использовать для количественной оценки, например, полуколичественной оценки, частоты конкретного элемента библиотеки или частоты конкретного модуля в популяции, содержащей множество элементов библиотеки.
В пределах синтетического модульного полипептида, содержащего нуклеиновую
последовательность-штрихкод, библиотеки, описанной в настоящем документе, звенья нуклеиновых последовательностей-штрихкодов в области последовательностей-штрихкодов будут иметь обратную ориентацию по отношению к последовательностям, кодирующим модули. Помимо этого звенья нуклеиновых последовательностей-штрихкодов в области последовательностей-штрихкодов будут расположены в обратном порядке по отношению к соответствующей им последовательности, кодирующей модуль. Однако по отношению к кодируемому полипептиду область нуклеиновых последовательностей-штрихкодов может быть расположена в направлении "N-конца" или "С-конца" относительно последовательности нуклеиновой кислоты, кодирующей синтетический модульный полипептид.
Специфичные для вектора элементы
Под "специфичными для вектора элементами" понимают элементы, которые используют при получении, конструировании, распространении, поддержании и/или количественном исследовании вектора до, во время или после его конструирования. Подходящие специфичные для вектора элементы включают, но не ограничиваются ими, например, элементы вектора, необходимые для распространения, клонирования и выбора вектора во время его использования, и могут включать, но не ограничиваются ими, например, сайт инициации репликации, сайт множественного клонирования, прокариотический промотор, фаговый промотор, селективный маркер (например, ген устойчивости к антибиотикам, кодируемый ферментный белок, кодируемый флуоресцентный или хромогенный белок и т.д.) и т.п. В векторах, описанных в настоящем документе, можно использовать любые подходящие специфичные для вектора элементы, если это необходимо.
Подходящие промоторные и энхансерные элементы, используемые в качестве специфичных для вектора элементов, известны в данной области техники. Промоторы, подходящие для экспрессии в бактериальной клетке включают, но не ограничиваются ими, lad, lacZ, ТЗ, Т7, gpt, lambda Р и их. Промоторы, подходящие для экспрессии в эукариотической клетке, включают, но не ограничиваются ими, промоторные и энхансерные элементы гена легкой и/или тяжелой цепей иммуноглобулина; немедленный ранний промотор цитомегаловируса; промотор тимидинкиназы вируса простого герпеса; ранние и поздние промоторы SV40; промотор, присутствующий в длинных концевых повторах ретровируса; промотор металлотионеина-1 мыши; и различные тканеспецифичные промоторы, известные в данной области техники.
Подходящие обратимые промоторы, включая обратимые индуцибельные промоторы, известны в данной области техники. Подходящие обратимые промоторы
могут быть выделены и получены из многих организмов, например, эукариотов и прокариотов. Модификация обратимых промоторов, полученных из первого организма для применения во втором организме, например, первый организм является прокариотом, и второй организм является эукариотом, первый организм является эукариотом, и второй организм является прокариотом и т.д., хорошо известна в данной области техники. Подходящие обратимые промоторы и системы, основанные на подходящих обратимых промоторах, при этом также содержащие дополнительные контрольные белки, включают, но не ограничиваются ими, промоторы, регулируемые спиртом (например, промотор гена алкогольдегидрогеназы I (alcA), промоторы, реагирующие на белки, трансактивируемые спиртом (AlcR) и т.д.), регулируемые тетрациклином промоторы (например, промоторные системы, включая TetActivators, TetON, TetOFF и т.д.), регулируемые стероидами промоторы (например, промоторные системы рецептора глюкокортикоидов крысы, промоторные системы рецептора эстрогенов человека, регулируемые ретиноидами промоторные системы, системы промоторов щитовидной железы, регулируемые экдизоном промоторные системы, регулируемые мифепристоном промоторные системы и т.д.), регулируемые металлом промоторы (например, промоторные системы металлотионеина и т.д.), регулируемые патогенезом промоторы (например, промоторы, регулируемые салициловой кислотой, промоторы, регулируемые этиленом, промоторы, регулируемые бензотиадиазолом и т.д.), регулируемые температурой промоторы (например, индуцируемые тепловым шоком промоторы (например, HSP-70, HSP-90, промотор белка теплового шока сои и т.д.), регулируемые светом промоторы, синтетические индуцибельные промоторы и т.п.
В некоторых случаях локус или конструкцию или трансген, содержащий подходящий промотор, необратимо переключают посредством индукции индуцируемой системы. Подходящие системы для индукции необратимого переключения хорошо известны в данной области техники, например, индукция необратимого переключения может быть основана на использовании рекомбинации, опосредованной Сге-lox (см., например, работу Fuhrmann-Benzakein, et al, PNAS (2000) 28:e99, содержание которой полностью включено в настоящую заявку посредством ссылки). Любая подходящая комбинация рекомбиназы, эндонуклеазы, лигазы, сайтов рекомбинации и т.д., известная в данной области техники, может быть использована для создания промотора с необратимым переключением. Способы, механизмы и требования к выполнению сайтспецифичной рекомбинации, описанные в другом месте в настоящем документе, могут быть использованы для получения промоторов с необратимым переключением и хорошо известны в данной области техники, см., например, Grindley et al. (2006) Annual
Review of Biochemistry, 567-605 и Tropp (2012) Molecular Biology (Jones & Bartlett Publishers, Sudbury, MA), содержание которой включено в настоящую заявку посредством ссылки.
Способы получения библиотек
В настоящем изобретении предложены способы получения библиотек нуклеиновых кислот, кодирующих синтетические модульные полипептиды, причем каждая нуклеиновая кислота библиотеки содержит многозвенную нуклеиновую последовательность-штрихкод, которая идентифицирует вариабельный модуль (модули) модульного полипептида и, если присутствуют несколько вариабельных модулей, ориентацию модулей друг относительно друга. В многочисленных вариантах реализации настоящего изобретения предложены способы поэтапной комбинаторной сборки синтетических модульных полипептидов из кодирующих модули нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, так, что каждая из полученных нуклеиновых кислот, кодирующих синтетические модульные полипептиды, содержит область, кодирующую модули, встроенную с сохранением открытой рамки считывания, и многозвенную нуклеиновую последовательность-штрихкод, при этом расположение звеньев нуклеиновой последовательности-штрихкода соответствует расположению модулей, встроенных с сохранением открытой рамки считывания. В целом, в тех случаях, когда в каждый элемент библиотеки включено несколько вариабельных модулей, совместно собранная многозвенная нуклеиновая последовательность-штрихкод обеспечивает характеристику сборки вариабельных модулей каждого элемента библиотеки.
Не желая быть связанными соответствием какой-либо теории, авторы настоящего изобретения полагают, что поэтапная комбинаторная сборка синтетических модульных полипептидов, представленных в настоящем документе, обеспечивает конструирование более крупных и более сложных библиотек, чем было бы возможно или осуществимо с использованием стандартных способов конструирования на основе индивидуальных (т.е. "по одному") полипептидов. Авторы настоящего изобретения выявили, что стандартные способы конструирования синтетических модульных полипептидов представляют собой значительное техническое препятствие для высокопроизводительного скрининга синтетических модульных полипептидов. Скоординированная сборка каждого многомодульного синтетического полипептида и соответствующей многозвенной нуклеиновой последовательности-штрихкода, предложенная в настоящем документе, позволяет преодолеть указанное препятствие и обеспечивает "сборку в одном реакторе" из множества уникальных нуклеиновых кислот, кодирующих синтетические модульные
полипептиды, подходящие для скрининга. Упомянутая высокопроизводительная сборка в одном реакторе не может быть выполнена с использованием стандартных способов конструирования полипептидов.
Авторы настоящего изобретения также выявили, что стандартные, сгруппированные физически, синтетические полипептидные библиотеки также представляют собой серьезные технические препятствия для высокопроизводительного скрининга. В частности, при скрининге больших библиотек число физически разделенных реакционных камер и изменчивость условий количественного исследования между каждой камерой представляют значительные технические препятствия при попытке скрининга всей сложной большой библиотеки и анализа полученных данных. Авторы настоящего изобретения выявили, что скрининг объединенной библиотеки может решить указанную проблему, однако имеет другие значительные препятствия, такие как трудность или нецелесообразность идентификации и/или количественного определения отдельных полипептидов, обеспечивающих желательный фенотип при скрининге из сложного смешанного пула уникальных модульных полипептидов. Использование короткой многозвенной нуклеиновой последовательности-штрихкода устраняет эту проблему, обеспечивая апостериорную эффективную положительную идентификацию и/или количественную оценку отдельных уникальных синтетических модульных полипептидов, которые обеспечивают желательный фенотип в сложном пуле, путем секвенирования только многозвенной нуклеиновой последовательности-штрихкода.
Стратегии клонирования
В целом, в настоящем изобретении предложен способ получения библиотек, описанных в настоящем документе, путем вложенной сборки кодирующих полипептидные модули нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды. Например, как показано на Фиг. 12, вектор нуклеиновой кислоты (100), содержащий последовательность, кодирующую полипептидный модуль (101), соединенную со специфичной для модуля нуклеиновой последовательностью-штрихкодом (Ю2), линеаризуют (ЮЗ) путем расщепления связи между последовательностью, кодирующей полипептидный модуль, и специфичной для модуля нуклеиновой последовательностью-штрихкодом. После линеаризации вектора, содержащего первую кодирующую модуль последовательность и первую специфичную для модуля нуклеиновую последовательность-штрихкод, нуклеиновую кислоту, содержащую вторую кодирующую модуль последовательность (104) и вторую нуклеиновую последовательность-штрихкод (105), специфичную для второго модуля, вставляют (т.е. встраивают) между первой кодирующей модуль последовательностью и
первой нуклеиновой последовательностью-штрихкодом (106). Собранная нуклеиновая кислота содержит кодирующую область, кодирующую синтетический модульный полипептид и область нуклеиновой последовательности-штрихкода, которая содержит многозвенную нуклеиновую последовательность-штрихкод (т.е. "нуклеиновые последовательности-штрихкоды" (ВС)). В некоторых случаях последовательности, кодирующие модули, собирают так, чтобы они соединялись с помощью последовательности, кодирующей желательный линкер, описанный в настоящем документе. В некоторых случаях последовательности, кодирующие модули, собирают так, чтобы они соединялись без использования линкерной последовательности, например, без линкерной последовательности, кодирующей одну или более линкерных аминокислот, без каких-либо промежуточных некодирующих нуклеотидов между первой и второй последовательностями, кодирующими модули, и т.д. Следовательно, обозначение "желательная линкерная последовательность" или "линкер", в частности, использованное в чертежах, включает полное отсутствие любого линкера или линкерной последовательности и прямое соединение полипептидных модулей и последовательностей, кодирующих модули.
Линеаризация векторной последовательности путем расщепления участка между первой кодирующей модуль последовательностью и первой специфичной для модуля нуклеиновой последовательностью-штрихкодом может быть достигнута с помощью любого удобного и подходящего средства. Например, полинуклеотид, содержащий кодирующую модуль последовательность и нуклеиновую последовательность-штрихкод, может быть сконфигурирован так, чтобы содержать сайт расщепления фермента рестрикции (т.е. рестрикционной эндонуклеазы) между кодирующей модуль последовательностью и нуклеиновой последовательностью-штрихкодом. Сайт расщепления может представлять собой сайт расщепления фермента рестрикции типа II и, более конкретно, может представлять собой сайт расщепления, который содержится в последовательности, распознаваемой используемым ферментом рестрикции типа П. Любой удобный фермент рестрикции типа II, который осуществляет расщепление в пределах своей последовательности распознавания, можно применять для описанной цели, включая ферменты рестрикции типа II, которые осуществляют расщепление в пределах своих последовательностей распознавания, которые известны в данной области техники. В некоторых случаях сайт расщепления может представлять собой сайт расщепления BamHI, который имеет последовательность распознавания 5'-GGATCC-3' и расщепляет нити после первого G последовательности распознавания на обеих нитях, оставляя липкий конец 5'-GATC-3'. Другие ферменты рестрикции, которые могут быть
использованы для указанной цели, включают, но не ограничиваются ими, например.
В некоторых случаях вложенную сборку осуществляют путем использования сайтов двух ферментов рестрикции (RE1 и RE2), расположенных между первой кодирующей модуль последовательностью и первой специфичной для модуля нуклеиновой последовательностью-штрихкодом, и фланкирующих вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (Фиг. 13). В случае стратегии сборки, основанной на использовании двух ферментов рестрикции, расщепление в двух сайтах RE1 и RE2 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй последовательностями, кодирующими модули, и первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.
В некоторых случаях вложенную сборку осуществляют путем использования сайтов четырех ферментов рестрикции (RE1, RE2, RE3 и RE4), причем RE1 и RE2 расположены между обеими кодирующими модули последовательностями и соответствующими им нуклеиновыми последовательностями-штрихкодами, тогда как RE3 и RE4 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (Фиг. 14). В случае стратегии сборки с использованием четырех ферментов рестрикции раздельное расщепление первого вектора в сайтах RE1 и RE2 и второго вектора в сайтах RE3 и RE4 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй последовательностями, кодирующими модули, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.
В некоторых случаях ферменты рестрикции намеренно выбирают так, что после лигирования соединения между первой и второй кодирующими модули последовательностями и первой и второй нуклеиновыми последовательностями-штрихкодами не содержат последовательностей распознавания ферментов рестрикции RE1, RE2, RE3 или RE4. В целом, в соответствии с указанной стратегией использованные
сайты RE1, RE2, RE3 и RE4 инактивированы после лигирования так, что полученный в результате вектор содержит только активные сайты RE1 и RE2 между второй кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Следовательно, данная стратегия обеспечивает последовательную вложенную сборку не только двумерной конструкции путем повторной линеаризации полученного вектора с помощью расщепления ферментами рестрикции RE1 и RE2 кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод, которая была вставлена в последнюю очередь.
В случае способа сборки с использованием четырех ферментов рестрикции RE1 выбирают так, чтобы после расщепления полученный конец линеаризованного вектора был совместимым (т.е. был способен к лигированию) с концом высвобожденного фрагмента, полученного с помощью расщепления ферментом рестрикции RE3. RE2 выбирают так, чтобы после расщепления полученный конец линеаризованного вектора был совместимым (т.е. мог быть лигирован и/или был способен к полной или по меньшей мере частичной гибридизации) с концом высвобожденного фрагмента, полученного при расщеплении с помощью фермента рестрикции RE4. В некоторых случаях один или более концов, полученных в результате расщепления с помощью RE1, RE2, RE3 или RE4, могут быть модифицированы, например, путем добавления или удаления одного или более нуклеотидов или другой химической модификации для получения концов, совместимых между RE1 и RE3 или RE2 и RE4. Любой удобный способ концевой модификации можно применять для получения совместимых концов, включая способы концевой модификации, которые хорошо известны в данной области техники, включая, но не ограничиваясь ими, например, создание тупых концов, фосфорилирование, дефосфорилирование и т.д.
В некоторых случаях вложенную сборку осуществляют путем использования последовательности распознавания фермента рестрикции типа IIS (RE1), причем два сайта RE1 присутствуют между первой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом, и два сайта RE1 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (Фиг. 15). В случае указанной стратегии, опосредованной ферментом рестрикции типа IIS, расщепление в сайтах, смежных с сайтами распознавания RE1, приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. Сайты расщепления, смежные с сайтами распознавания RE1, сконфигурированы так, что после расщепления 3'-конец вектора совместим с 5'-концом фрагмента, и 5'-конец вектора совместим с 3'-концом фрагмента. В
некоторых случаях указанные совместимые концы могут называться совместимыми "липкими концами". Следовательно, при лигировании линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй кодирующими модули последовательностями, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.
Любой удобный фермент рестрикции типа IIS можно применять в стратегиях сборки с использованием указанных ферментов, описанных в настоящем документе, включая, но не ограничиваясь ими, например, АсеШ, Acul, Alwl, Aarl, Bbsl, Bbvl, BbvII, Bed, Bce83I, BceAI, Bcefl, BciVI, BfuAI, Bmrl, Bmul, Bpml, BpuEI, Bsal, Bsbl, BseRI, Bsgl, BslFI, BsmAI, BsmFI, BsoMAI, BspCNI, BspGI, BspMI, BspNCI, BspQI, BsrDI, Bst71I, BtgZI, BtsCI, BtsI, Bvel, Drdll, Earl, Ecil, FaqI, FinI, Fokl, Hgal, Hin4II, HphI, HpyAV, Lgul, MboII, Mmel, Mnll, NmeAIII, Plel, Sapl, SfaNI, Sgel и т.п.
В некоторых случаях фермент рестрикции, использованный, например, при линеаризации вектора и/или высвобождении фрагмента, содержащего второй модуль, представляет собой фермент рестрикции, который расщепляет цепи по обе стороны от своего сайта распознавания. Любой удобный фермент рестрикции, обладающий указанной активностью, можно применять в способах сборки, описанных в настоящем документе, включая, но не ограничиваясь им, например, Bcgl.
В некоторых случаях вложенную сборку осуществляют путем использования нескольких последовательностей распознавания ферментов рестрикции типа IIS, например, двух последовательностей распознавания ферментов рестрикции типа IIS (RE1 и RE2), причем два сайта RE1 присутствуют между кодирующими модули последовательностями и соответствующими им нуклеиновыми последовательностями-штрихкодами, и два сайта RE2 фланкируют вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод (Фиг. 16). В случае стратегии сборки с использованием двух ферментов рестрикции типа IIS раздельное расщепление первого вектора в сайтах RE1 и второго вектора в сайтах RE2 приводит к линеаризации вектора и высвобождению фрагмента, содержащего вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. После лигирования линеаризованного вектора и высвобожденного фрагмента желательная линкерная последовательность присутствует между первой и второй кодирующими модули последовательностями, тогда как первая и вторая нуклеиновые последовательности-штрихкоды имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям.
В целом, в соответствии с данной стратегией сайты RE1 и RE2, использованные в первом раунде линеаризации и высвобождения фрагментов, не сохраняются в векторе и встраиваются так, что полученный вектор содержит только активные сайты RE1 между второй кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Следовательно, данная стратегия обеспечивает последовательную вложенную сборку не только двумерной конструкции путем повторной линеаризации полученного вектора с помощью расщепления ферментами рестрикции сайтов распознавания RE1 в кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод, которая была вставлена в последнюю очередь.
В данном способе сборки с использованием фермента рестрикции типа IIS сайты расщепления, смежные с последовательностями распознавания RE1 и RE2, сконфигурированы так, что после расщепления полученные концы линеаризованного вектора являются совместимыми (т.е. способны к лигированию) с концами высвобожденного фрагмента. В некоторых случаях один или более концов, полученных при расщеплении RE1 и/или RE2, могут быть модифицированы, например, путем добавления или удаления одного или более нуклеотидов или другой химической модификации для получения совместимых концов. Любой удобный способ модификации концов можно применять для получения совместимых концов, включая способы модификации концов, которые хорошо известны в данной области техники, включая, но не ограничиваясь ими, например, получение тупых концов, фосфорилирование, дефосфорилирование и т.д.
В некоторых случаях совместимые концы могут быть получены с помощью фермента с экзонуклеазной активностью, например, экзонуклеазы. Например, в некоторых вариантах реализации первый вектор и второй вектор или фрагмент нуклеиновой кислоты сконфигурированы так, что при расщеплении первого вектора первым ферментом рестрикции (RE1) и второго вектора или нуклеиновой кислоты вторым ферментом рестрикции (RE2) полученные новые концы совместимы для лигирования после использования фермента с экзонуклеазной активностью. Способы получения совместимых концов с использованием фермента с экзонуклеазной активностью хорошо известны в данной области техники и включают, но не ограничиваются ими, например, клонирование с помощью системы In-Fusion(r), сборку по Гибсону и т.п.
В некоторых случаях сборку первого вектора, расщепленного ферментом рестрикции, и второй нуклеиновой кислоты, например, второго вектора, содержащего фрагмент нуклеиновой кислоты, осуществляют с помощью реакции In-Fusion(r), и, в таких
случаях, совместимые концы, полученные в результате использования фермента с экзонуклеазной активностью, могут быть упомянуты как липкие концы In-Fusion(r) (липкие концы IF) (Фиг. 17). Соединение двух липких концов IF может быть сконфигурировано так, чтобы получить желательные линкеры и/или желательные линкерные последовательности между двумя соединенными концами нуклеиновой кислоты. Например, соединенные липкие концы IF между первой кодирующей модуль последовательностью и второй кодирующей модуль последовательностью могут быть сконфигурированы так, что первый и второй модули расположены с сохранением открытой рамки считывания. Как описано более подробно в настоящем документе, кодирующие модули последовательности, которые расположены с сохранением открытой рамки считывания, могут быть разделены последовательностью, кодирующей одну или более линкерных аминокислот, или могут не иметь такой последовательности. Например, как показано на Фиг. 17, расщепление первого вектора в сайте распознавания (RE1) первого фермента рестрикции приводит к получению концов, которые могут быть совмещены посредством реакции In-Fusion(r) с концами, полученными при расщеплении второго вектора или фрагмента нуклеиновой кислоты ферментом рестрикции типа IIS в сайтах расщепления, определенных сайтами распознавания (RE2), присутствующими на втором векторе или фрагменте нуклеиновой кислоты. Совместимые концы лигируют посредством реакции In-Fusion(r), что приводит к получению желательной линкерной последовательности между первой и второй кодирующими модули последовательностями и многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первое звено и второе звено нуклеиновых последовательностей-штрихкодов, которые имеют обратную ориентацию по отношению к первой и второй кодирующим модули последовательностям. В некоторых случаях после сборки In-Fusion(r) первой и второй кодирующих модули последовательностей и многозвенной нуклеиновой последовательности-штрихкода сайт фермента рестрикции присутствует между кодирующей областью и областью последовательности-штрихкода, чтобы обеспечить возможность введения дополнительных последовательностей, кодирующих модули, и звеньев нуклеиновых последовательностей-штрихкодов.
В некоторых случаях после лигирования нуклеиновой кислоты, содержащей первую кодирующую модуль последовательность, со второй нуклеиновой кислотой, содержащей вторую кодирующую модуль последовательность, первая и вторая кодирующие модули последовательности соединены так, что между первой и второй кодирующими модули последовательностями отсутствует линкер и промежуточные некодирующие нуклеотиды. В одном неограничивающем примере первый вектор,
содержащий первую кодирующую модуль последовательность и соответствующую ей нуклеиновую последовательность-штрихкод, соединен без линкера или промежуточных некодирующих нуклеотидов со вторым вектором или фрагментом нуклеиновой кислоты, содержащим вторую кодирующую модуль последовательность и соответствующую ей нуклеиновую последовательность-штрихкод, с помощью расщепления ферментом рестрикции (Фиг. 18). Первый вектор и второй вектор или фрагмент нуклеиновой кислоты расщепляют с использованием двух разных ферментов рестрикции типа IIS, имеющих два разных сайта распознавания (RE1 и RE2), причем первый фермент рестрикции расщепляет обе нити нуклеиновой кислоты в одном и том же положении на некотором расстоянии от своего сайта распознавания (RE1), оставляя "тупой конец", тогда как второй фермент рестрикции расщепляет обе нити нуклеиновой кислоты в разных положениях на некотором расстоянии от своего сайта распознавания (RE2), оставляя выступающий конец или "липкий конец". Исходные нуклеиновые кислоты сконфигурированы так, что после расщепления первого вектора и второго вектора вторым ферментом рестрикции образующиеся липкие концы являются совместимыми для лигирования. Следовательно, после лигирования полученных тупых концов и липких концов полученный вектор содержит первую кодирующую модуль последовательность, гибридизованную непосредственно, без линкера или промежуточных некодирующих нуклеиновых кислот, со второй кодирующей модуль последовательностью и многозвенной нуклеиновой последовательностью-штрихкодом, содержащей нуклеиновую последовательность-штрихкод первой кодирующей модуль последовательности и нуклеиновую последовательность-штрихкод второй кодирующей модуль последовательности в обратной ориентации по отношению к первой и второй кодирующим модули последовательностям.
Любой удобный фермент рестрикции типа IIS, который приводит к получению тупых концов после расщепления, можно применять в способах, описанных в настоящем документе, с использованием лигирования тупых концов, включая ферменты, которые хорошо известны в данной области техники, включая, но не ограничиваются ими, например, Slyl, Mlyl и т.д. Помимо этого при необходимости можно использовать способы получения тупых концов после расщепления с помощью рестрикционной эндонуклеазы, которая не образует тупые концы, т.е. может быть использовано "затупление", при необходимости, включая, но не ограничиваясь перечисленным, "заполнение конца" ДНК-полимеразой, такой как, например, большой фрагмент ДНК-полимеразы I (например, фрагмент Кленова), ДНК-полимеразой Т4, нуклеазой золотистой фасоли и т.д., или концевые неспаренные нуклеотиды могут быть удалены ферментом с
экзонуклеазной активностью.
В некоторых случаях, когда последовательность, совместимая с ферментом рестрикции, не относящимся к типу IIS, присутствует на конце кодирующей модуль последовательности, расщепление может быть выполнено с помощью фермента рестрикции, не относящегося к типу IIS, например, фермента рестрикции типа II, который расщепляет нити внутри своей последовательность распознавания. В таких случаях может быть использован фермент рестрикции, который образует тупой конец на конце кодирующей модуль последовательности, если кодирующая модуль последовательность содержит всю или часть последовательности распознавания фермента рестрикции на своем 3'-конце или 5'-конце. В некоторых случаях, когда кодирующая модуль последовательность содержит всю или часть последовательности распознавания фермента рестрикции, который разрезает нити внутри своей последовательности распознавания и не образует тупой конец, может быть использован фермент рестрикции, не образующий тупых концов, и полученные липкие концы могут быть затуплены, например, любым удобным способом, включая, но не ограничиваясь ими, например, способы, описанные в настоящем документе.
Поскольку последовательности на концах кодирующих модули последовательностей будут ограничены концевыми аминокислотами модуля, то случаи, когда подходящие последовательности распознавания фермента рестрикции присутствуют в удобном положении, или могут быть модифицированы для этого, на одном или нескольких концах кодирующей модуль последовательности, чтобы обеспечить надлежащее расщепление и/или образование тупого конца, могут быть редкими в зависимости от конкретного используемого модуля. Следовательно, во многих случаях эффективное получение большой или многомерной библиотеки синтетических модульных полипептидов будет зависеть от сайтов распознавания ферментов, которые присутствуют за пределами кодирующей модуль последовательности. Следовательно, в некоторых случаях одна или более, включая все, из последовательностей распознавания ферментов рестрикции, используемых при сборке библиотеки, будут присутствовать за пределами кодирующей модуль последовательности. Во многих случаях одна или более, включая все, из последовательностей распознавания ферментов рестрикции, используемых при сборке библиотеки, будут присутствовать за пределами нуклеиновой последовательности-штрихкода.
В некоторых случаях получают синтетический модульный полипептид, в котором кодирующие модули последовательности легко соединяются с концами линкерного домена так, что между кодирующими модули последовательностями и соответствующими
им соединениями с линкерным доменом отсутствует промежуточная последовательность. В одном неограничивающем примере указанное непрерывное соединение кодирующих модули последовательностей с линкерным доменом облегчается вектором или фрагментом нуклеиновой кислоты, сконфигурированным так, чтобы содержать часть желательной линкерной последовательности, легко присоединяемой к любому концу кодирующей модуль последовательности. Например, первый вектор, сконфигурированный так, чтобы содержать первую кодирующую модуль последовательность, легко присоединенную к первой части линкерного домена, лигируют со вторым вектором или фрагментом нуклеиновой кислоты, сконфигурированным так, чтобы содержать вторую часть линкерного домена, последовательно присоединенную ко второй кодирующей модуль последовательности (Фиг. 19). Первый вектор может быть сконфигурирован так, чтобы содержать два сайта распознавания первого фермента рестрикции типа IIS (RE1) между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Второй вектор, или фрагмент нуклеиновой кислоты, может быть сконфигурирован так, чтобы содержать два сайта распознавания второго фермента рестрикции типа IIS (RE2), фланкирующие вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод. Может быть использован третий вектор или фрагмент нуклеиновой кислоты, содержащий оставшуюся, например, "среднюю" часть линкерного домена, которая фланкирована двумя сайтами распознавания второго фермента рестрикции типа IIS (RE2). Последовательность предварительно расщепленных векторов и/или фрагментов нуклеиновых кислот конфигурируют так, чтобы после расщепления получить совместимые концы между первой частью линкерного домена и средней частью линкерного домена, второй частью линкерного домена и средней частью линкерного домена и двумя нуклеиновыми последовательностями-штрихкодами. После расщепления и лигирования полученный вектор содержит первую кодирующую модуль последовательность, последовательно соединенную с линкерным доменом, последовательно соединенным со второй кодирующей модуль последовательностью, соединенной с областью нуклеиновой последовательности-штрихкода, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к первой и второй кодирующим модули последовательностям (Фиг. 19). Последовательная сборка, например, между модулями и линкерными доменами, может быть достигнута с использованием опосредованной экзонуклеазами сборки (например, клонирование с помощью системы In-Fusion(r), сборка по Гибсону и т.д.) или без нее.
Вышеописанные стратегии сборки на основе расщепления, в некоторых случаях,
можно комбинировать, полностью или частично, любым удобным и подходящим путем, чтобы обеспечить способ, пригодный для получения библиотеки синтетических модульных полипептидов, описанной в настоящем документе. Помимо этого, в тех случаях, когда альтернативные способы сборки на основе расщепления известны в данной области техники и будут совместимы с описанными в настоящем документе способами, подходящие альтернативные способы можно применять при сборке библиотеки синтетических модульных полипептидов, описанной в настоящем документе. В некоторых случаях описанные стратегии на основе расщепления можно комбинировать, полностью или частично, со способами, не связанными с расщеплением, для сборки нуклеиновых кислот.
Сборка нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов, описанную в настоящем документе, не ограничена стратегиями сборки на основе расщепления, т.е. сборки на основе ферментов рестрикции. В некоторых случаях способы, не связанные с расщеплением, можно применять при сборке библиотеки, описанной в настоящем документе, включая, но не ограничиваясь ими, например, стратегии на основе амплификации, стратегии на основе рекомбинации и т.д. Подходящими для применения являются способы, не связанные с расщеплением, вместо стратегий на основе расщепления, т.е. вся стратегия сборки в целом не связана с расщеплением ферментами рестрикции или может быть использована в комбинации со стратегиями на основе расщепления, т.е., так, что стратегия сборки в целом включает как способы, основанные на использовании ферментов рестрикции, так и способы, не связанные с расщеплением ферментами рестрикции.
В некоторых случаях библиотека синтетических модульных полипептидов, описанная в настоящем документе, может быть собрана полностью или частично с использованием способа сборки на основе амплификации, включая, но не ограничиваясь ими, например, клонирование ПЦР, клонирование ТА, удлинение концов методом ПЦР и т.п. Подходящие стратегии на основе амплификации будут варьироваться, но обычно будут основаны на использовании множества сайтов связывания праймеров в исходных векторах и/или фрагментах нуклеиновых кислот. Подходящие сайты связывания праймеров, в зависимости от желательного конечного продукта, могут быть специально добавлены к векторам и/или фрагментам нуклеиновых кислот, или ранее существовавшая последовательность, присутствующая в векторе или фрагменте нуклеиновой кислоты, может быть использована в качестве сайта связывания праймера в соответствии с различными стратегиями сборки, основанными на амплификации. Сайты связывания праймеров могут быть расположены в любой удобной конфигурации и/или ориентации,
достаточной для получения желательного клонированного продукта, включая, но не ограничиваясь ими: расположение между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом в направлении от 5'-конца к 3'-концу относительно последовательности, кодирующей модуль; расположение между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом в направлении от 5'-конца к 3'-концу относительно последовательности-штрихкода; расположение перед (т.е. в направлении 5'-конца) кодирующей модуль последовательностью в направлении от 5'-конца к 3'-концу относительно кодирующей модуль последовательности; расположение после (т.е. в направлении 3'-конца) кодирующей модуль последовательности в направлении от 5'-конца к 3'-концу относительно кодирующей модуль последовательности, содержащей нуклеиновую последовательность-штрихкод; и т.п. Последовательности сайтов связывания праймеров могут быть сконфигурированы так, что после клонирования на основе амплификации, в том числе после одного раунда клонирования на основе амплификации, одна или более желательных линкерных последовательностей присутствуют между собранными элементами, включая, например, собранные последовательности, кодирующие модули, собранные нуклеиновые последовательности-штрихкоды и т.д.
В качестве неограничивающего примера стратегий сборки на основе амплификации может быть использована стратегия амплификации липких концов методом ПЦР (Фиг. 20), при которой первый вектор содержит первый сайт связывания праймера (PBS1) и второй сайт связывания праймера (PBS2), расположенный, в ориентации, противоположной ориентации от 5'-конца к 3'-концу, между кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом. Может быть использован второй вектор или фрагмент нуклеиновой кислоты, содержащий вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, фланкированную первым и вторым сайтами связывания праймеров (PBS1 и PBS2). После удлинения и амплификации с помощью удлинения липких концов методом ПЦР с использованием праймеров, которые специфично гибридизуются с сайтами PBS1 и PBS2, синтезируется собранный продукт, в котором первая кодирующая модуль последовательность соединена с помощью желательного линкера со второй кодирующей модуль последовательностью, которая соединена с многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к соответствующим им кодирующим модули последовательностям (Фиг. 20).
Ввиду вышеописанных стратегий сборки специалист в данной области техники легко поймет, как любая из вышеописанных стратегий может быть комбинирована, полностью или частично, чтобы привести к желаемому результату и/или обеспечить наибольшие преимущества и/или свести к минимуму недостатки конкретных методик клонирования в соответствии со сборкой с использованием желательной библиотеки и/или компонента библиотеки. В качестве неограничивающего примера, стратегии на основе амплификации можно комбинировать со стратегиями на основе расщепления, когда комбинирование указанных стратегий приводит к сборке желательной библиотеки и/или компонентов библиотеки. Например, как показано на Фиг. 21, расщепление ферментом рестрикции первого вектора в соответствии с сайтом распознавания фермента рестрикции (RE1), расположенным между первой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом, можно комбинировать с амплификацией на основе ПЦР с использованием сайтов связывания праймеров, фланкирующих вторую кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, содержащуюся в пределах второго вектора или фрагмента нуклеиновой кислоты, чтобы обеспечить вложенную сборку. После сборки с применением описанной гибридной стратегии сборки может быть получен собранный продукт, в котором первая кодирующая модуль последовательность соединена с помощью желательного линкера со второй кодирующей модуль последовательностью, которая соединена с многозвенной нуклеиновой последовательностью-штрихкодом, содержащей первую и вторую нуклеиновые последовательности-штрихкоды в обратной ориентации по отношению к соответствующим им кодирующим модули последовательностям (Фиг. 21).
Гибридные стратегии не ограничиваются комбинированием стратегий, основанных на расщеплении и амплификации, и могут включать другие способы клонирования и/или синтетической биологии, полностью или частично, включая, но не ограничиваясь ими, например, стратегии клонирования на основе рекомбинации (включая, но не ограничиваясь ими, например, стратегии клонирования на основе технологии Gateway, клонирования на основе рекомбиназы Cre/Flp (включая, стратегии, при которых сайт инактивирован при рекомбинации) и т.д.), сборку последовательности de novo, синтез нуклеиновой кислоты de novo и т.п. В некоторых случаях стратегии клонирования на основе рекомбинации, сборки последовательности de novo, синтеза нуклеиновой кислоты de novo и т.п. могут быть использованы независимо, т.е. по отдельности в качестве независимой стратегии клонирования, а не как часть гибридной стратегии клонирования.
В некоторых случаях, когда используемая конкретная стратегия клонирования
приводит к присутствию нежелательной промежуточной последовательности между двумя клонированными элементами, также известной как шрамы или швы клонирования, такие шрамы клонирования могут быть уменьшены и/или удалены путем мономолекулярного расщепления и повторного лигирования вектора, содержащего шрам. Мономолекулярное расщепление и повторное лигирование можно осуществлять любым удобным способом, включая, но не ограничиваясь ими, например, мономолекулярное расщепление, опосредованное ферментами рестрикции, и повторное лигирование, такое как, например, мономолекулярное расщепление ферментами рестрикции типа IIS и повторное лигирование. Например, в некоторых случаях, шов, который содержит полный сайт рекомбинации или его часть, в результате сборки на основе рекомбинации, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования. В некоторых случаях шрам после расщепления, который содержит весь сайт распознавания фермента рестрикции или его часть в результате стратегии на основе расщепления, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования. В некоторых случаях шов, который содержит весь сайт связывания праймера или его часть в результате сборки на основе амплификации, может быть частично или полностью удален путем мономолекулярного расщепления и повторного лигирования.
В одном неограничивающем варианте реализации комбинаторная библиотека получена путем итеративного клонирования компонентов библиотеки каждого типа размерности посредством клонирования на основе расщепления и клонирования с помощью системы In-Fusion(r). Например, как показано на Фиг. 22, на первом этапе исходную нуклеиновую кислоту (например, вектор), содержащую кодирующую scFv последовательность и смежный линкер Gly/Ser, расщепляют в сайте BamHI в пределах или рядом с линкером Gly/Ser. На втором этапе фрагмент нуклеиновой кислоты, содержащий первую кодирующую модуль последовательность, соединенную со вторым линкером Gly/Ser, гибридизованным с первой специфичной для модуля нуклеиновой последовательностью-штрихкодом, клонируют в расщепленный сайт BamHI путем клонирования с помощью системы In-Fusion(r). После лигирования путем клонирования с помощью системы In-Fusion(r) линкер Gly/Ser между scFv и первой кодирующей модуль последовательностью сохраняется. На третьем этапе нуклеиновую кислоту, собранную на этапе 2, расщепляют в сайте BamHI, импортированном в пределах или рядом с линкером Gly/Ser фрагмента первой кодирующей модуль нуклеиновой кислоты, и повторяют клонирование с помощью системы In-Fusion(r) со вторым фрагментом нуклеиновой кислоты, содержащим вторую кодирующую модуль последовательность, соединенную с
третьим линкером Gly/Ser, гибридизованным со второй нуклеиновой последовательностью-штрихкодом, специфичной для модуля. Как и на этапе 2, после лигирования путем клонирования с помощью системы In-Fusion(r) линкер Gly/Ser между первой и второй кодирующими модули последовательностями сохраняется. Если необходимы элементы библиотеки большей размерности, этап 3 можно повторять итеративно. На четвертом этапе расщепление в сайте BamHI, импортированном в пределах или рядом с линкером Gly/Ser, кодирующей модуль последовательности, содержащей нуклеиновую кислоту, которая была добавлена в последнюю очередь, позволяет осуществлять клонирование In-Fusion(r) концевой репортерной последовательности (например, последовательности, кодирующей GFP, которая также содержит последовательность сигнала "стоп" (например, стоп-кодон)) между готовой кодирующей модуль последовательностью и нуклеиновой последовательностью-штрихкодом, расположенной после нее. В этом варианте реализации каждый готовый элемент библиотеки содержит комбинаторный CAR, встроенный с сохранением открытой рамки считывания, и комбинаторную нуклеиновую последовательность-штрихкод, описывающую архитектуру комбинаторного CAR, встроенного с сохранением открытой рамки считывания.
Объединенные библиотеки
В настоящем изобретении предложены способы получения объединенных библиотек синтетических модульных полипептидов, содержащих нуклеиновые последовательности-штрихкоды. Подразумевают, что в объединенной библиотеке элементы библиотеки присутствуют в общем контейнере и/или общем растворе, и отдельные элементы библиотеки не должны быть физически разделены в пространстве, например, отдельные элементы библиотеки могут быть объединены во время конструирования библиотеки (например, как при "сборке в одном реакторе") или после создания отдельных элементов библиотеки. Например, в случае объединенной библиотеки синтетических модульных полипептидов, сконструированной путем комбинаторной вложенной сборки, компоненты библиотеки могут быть объединены во время сборки элементов библиотеки, до завершения сборки элементов библиотеки и/или после завершения сборки элементов библиотеки и т.д. В настоящей заявке объединенные библиотеки не ограничены библиотеками только синтетических модульных полипептидов, но также включают объединенные библиотеки клеток, экспрессирующих синтетические модульные полипептиды, объединенные библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды, и т.п.
Соответственно, в некоторых случаях, отдельные компоненты нуклеиновых
кислот, используемые для сборки элементов библиотеки, можно комбинировать до сборки и они могут оставаться объединенными во время сборки элементов библиотеки. В других случаях собранные элементы библиотеки могут быть смешаны после сборки, чтобы получить объединенную библиотеку.
Поскольку библиотеки и способы сборки библиотек, описанные в настоящем документе, включают получение элементов библиотеки, которые могут быть идентифицированы путем секвенирования соответствующей области нуклеиновой последовательности-штрихкода, отдельные нуклеиновые кислоты могут быть объединены в любой момент до, во время или после сборки, при этом сохраняется возможность последующей идентификации и количественного определения отдельных элементов библиотеки в количественных исследованиях. В некоторых случаях конечную размерность библиотеки может контролировать путем объединения компонентов библиотеки в определенные моменты во время сборки. Например, библиотека смешанной размерности может быть получена путем раздельной сборки частичных библиотек разной размерности и последующего объединения частичных библиотек (например, с использованием сборки "разделить-и-объединить"). В некоторых случаях, например, после объединения частичных библиотек различной размерности, может быть выполнена последующая сборка, включая добавление дополнительных вариабельных доменов.
В одном неограничивающем варианте реализации, как показано на Фиг. 23, объединенную библиотеку нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, трансформируют в общую популяцию первичных Т-клеток человека для получения первичных Т-клеток человека, экспрессирующих синтетический модульный полипептид CAR. Необязательно, если кодируемые элементы библиотеки синтетических модульных полипептидов CAR содержат один или более репортерных модулей, трансформированные Т-клетки могут быть отсортированы на основании экспрессии ими репортерного модуля (который указывает на экспрессию синтетического модульного полипептида CAR), чтобы выделить трансформированные клетки с одинаковыми уровнями экспрессии элементов библиотеки синтетических модульных полипептидов CAR. Указанные отсортированные трансформированные Т-клетки с одинаковыми уровнями экспрессии представляют собой объединенную библиотеку Т-клеток, экспрессирующих синтетические модульные полипептиды CAR.
В некоторых случаях модулируют трансформационную эффективность нуклеиновых кислот и/или первичных Т-клеток человека, экспрессирующих синтетические модульные полипептиды CAR. Такая модуляция может быть выполнена по различным практическим причинам, например, для контроля вероятности экспрессии
каждого элемента библиотеки и/или для контроля вероятности экспрессии каждой клеткой не более чем одного элемента библиотеки. Указанная модуляция может быть достигнута любым удобным способом, включая, но не ограничиваясь ими, например, модулирование исходного количества нуклеиновой кислоты, кодирующей синтетический модульный полипептид, присутствующей во время трансформации, контроль исходного количества первичных Т-клеток, присутствующих во время трансформации, контроль соотношения кодирующей нуклеиновой кислоты и первичных Т-клеток во время трансформации и т.п. Следовательно, в некоторых случаях, эффективность трансформации модулируют так, что по существу каждая трансдуцированная Т-клетка экспрессирует один уникальный синтетический модульный полипептид CAR. В некоторых случаях готовые объединенные библиотеки клеток, экспрессирующих уникальные синтетические модульные полипептиды CAR, можно культивировать, размножать, сохранять и т.д. в соответствии с требованиями последующих количественных исследований.
Подходящие объединенные библиотеки, независимо от того, содержат они объединенные нуклеиновые кислоты, объединенные модульные полипептиды, объединенные трансдуцированные клетки и т.д., не ограничены нуклеиновыми кислотами, кодирующими синтетические модульные полипептиды CAR, синтетическими модульными полипептидами CAR или клетками (например, Т-клетками), экспрессирующими синтетические модульные полипептиды CAR. Любая библиотека нуклеиновых кислот, кодирующих модульные полипептиды, модульные полипептиды и/или соответствующие трансдуцированные клетки, экспрессирующие модульные полипептиды, полученные в соответствии со способами, описанными в настоящем документе, могут быть объединены аналогичным способом, чтобы получить объединенную библиотеку, которую можно применять, например, при скрининговых исследованиях.
Отдельные элементы объединенных библиотек, описанных в настоящем документе, могут быть положительно идентифицированы благодаря специфичной многозвенной нуклеиновой последовательности-штрихкоду, связанной с каждым членом библиотеки. Благодаря специфичной комбинаторной вложенной сборке, которая приводит к предсказуемой позиционной взаимосвязи между каждой кодирующей модуль последовательностью и соответствующей ей нуклеиновой последовательностью-штрихкодом, идентичность и архитектура каждого синтетического модульного полипептида может быть установлена путем простого секвенирования соответствующей многозвенной нуклеиновой последовательности-штрихкода. Следовательно, в некоторых
случаях, идентичность и/или архитектура отдельных элементов библиотеки синтетических модульных полипептидов может быть определена на основании данных о последовательности, связанной с областями нуклеиновых последовательностей-штрихкодов элементов библиотеки. Например, в некоторых случаях, все элементы и/или каждый отдельный элемент объединенной библиотеки, описанной в настоящем документе, могут быть определены, например, после конструирования библиотеки, после использования библиотеки в конкретном количественном исследовании и т.д. Компартментализованные компоненты библиотеки
Отдельные нуклеиновые кислоты-элементы, содержащие кодирующую область и область нуклеиновой последовательности-штрихкода, в некоторых случаях могут быть компартментализованы. Объединенные библиотеки и библиотеки с компартментализованными компонентами не обязательно должны быть взаимоисключающими, и, например, в некоторых случаях библиотека может быть объединена и может содержать компартментализованные компоненты в разные моменты времени, например, библиотека может быть сконструирована, например, элементы библиотеки могут быть собраны, в виде пула, например, как при сборке в одном реакторе, и затем может быть впоследствии компартментализована, например, путем трансфекции элементов библиотеки нуклеиновых кислот в отдельные клетки или неклеточные компартменты. В других случаях элементы библиотеки могут быть компартментализованы в ходе их сборки и затем объединены для последующих способов, включая, но не ограничиваясь ими, например, дальнейшую сборку или скрининг. В целом, нуклеиновые кислоты, кодирующие синтетические полипептиды, содержащие нуклеиновые последовательности-штрихкоды, собранные в соответствии со способами вложенной сборки и стратегиями клонирования, описанными в настоящем документе, собирают в виде пула и впоследствии могут подвергать компартментализации или могут оставить без изменений.
Компартментализация собранных нуклеиновых кислот, кодирующих синтетические полипептиды, содержащих нуклеиновые последовательности-штрихкоды, может быть достигнута любым подходящим способом, обеспечивающим транскрипцию и трансляцию отдельных элементов библиотек нуклеиновых кислот так, что каждый элемент библиотеки нуклеиновых кислот остается связанным с продуктом, который он кодирует. В некоторых случаях, как описано более подробно ниже, компартментализация может быть достигнута путем создания клеточных библиотек, в которых отдельные клетки служат в качестве "компартмента" и обеспечивают трансляцию и транскрипцию элементов библиотек нуклеиновых кислот.
В некоторых случаях компартментализация может быть достигнута посредством создания неклеточных библиотек, например, библиотек на основе инкапсуляции. Бесклеточные библиотеки на основе инкапсуляции обычно содержат эмульсию двух или более несмешивающихся жидкостей, причем элементы библиотеки нуклеиновых кислот растворимы в первой жидкости, например, в водной жидкости, такой как вода или водный буфер, и нерастворимы во второй жидкости, например, в масле или другом органическом растворителе, так, что первая жидкость образует компартменты, например, капли, содержащие отдельные элементы библиотеки. Эмульсия, содержащая библиотеку, может быть сконфигурирована так, что каждый компартмент содержит любое количество отдельных элементов библиотеки, включая, но не ограничиваясь этим, не более одного элемента в компартменте. Нуклеиновые кислоты-элементы из инкапсулированных библиотек могут быть транскрибированы (например, в условиях in vitro) и транслированы (например, в условиях in vitro) в условиях, в которых продукты транскрипции и трансляции остаются связанными, т.е. остаются в пределах компартмента, с отдельным элементом библиотеки нуклеиновых кислот, кодировавшим их. Любой удобный и подходящий способ получения инкапсулированной библиотеки полипептидов, кодируемых нуклеиновыми кислотами, может быть использован в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, например, способы, описанные в Bernath et al. Anal Biochem. (2004) 325(1): 151-7; содержание которой полностью включено в настоящую заявку посредством ссылки.
После получения кодируемого продукта элемента библиотеки внутри компартмента, элемент библиотеки нуклеиновых кислот и кодируемый синтетический модульный полипептид могут быть, но необязательно, физически соединены. Например, в некоторых случаях, элемент библиотеки нуклеиновых кислот и кодируемый продукт могут быть соединены, например, с помощью любого удобного и подходящего способа, включая химическую связь или конъюгацию (т.е., путем получения ковалентной связи между элементом библиотеки нуклеиновых кислот и кодируемым синтетическим модульным полипептидом) или посредством молекулярного связывания (например, путем прямого связывания элемента библиотеки с кодируемым синтетическим модульным полипептидом или посредством непрямого связывания элемента библиотеки с кодируемым продуктом, которое опосредовано одним или более связывающими промежуточными продуктами (например, партнерами по связыванию, субстратами и т.д.). Любой удобный и подходящий способ соединения компартментализованных кодируемых полипептидов с элементами библиотеки нуклеиновых кислот можно применять в способах, описанных в настоящем документе, включая, но не ограничиваясь ими,
использование, например, субстрата, содержащего присоединенный связывающий агент для эпитопной метки, который специфично связывается с эпитопной меткой, кодируемой элементом библиотеки нуклеиновых кислот, например, как описано в Griffiths & Tawfik. EMBO J (20030 22(l):24-35, содержание которой полностью включено в настоящую заявку посредством ссылки. В некоторых случаях после связывания элементы библиотек нуклеиновых кислот могут быть компартментализованы, например, объединены, и затем количественно исследованы как объединенная библиотека.
В некоторых случаях элемент библиотеки нуклеиновых кислот и кодируемый продукт остаются связанными в достаточной степени, не будучи физически соединенными, например, путем компартментализации внутри компартмента, включая клеточные и неклеточные компартменты.
Компартментализация, как клеточная, так и неклеточная, обычно позволяет идентифицировать синтетический модульный полипептид или его часть, который коррелирует с детектированным фенотипом посредством секвенирования области нуклеиновой последовательности-штрихкода отдельного элемента библиотеки нуклеиновых кислот, кодирующего синтетический модульный полипептид, который остается связанным с синтетическим модульным полипептидом на основании их компартментализации или в результате физической связи, образующейся во время их компартментализации.
Клеточные библиотеки
Как описано более подробно выше, в настоящей заявке библиотеки включают клеточные библиотеки, в которых клетки библиотеки экспрессируют синтетические модульные полипептиды. Трансформация нуклеиновых кислот, кодирующих синтетические модульные полипептиды, может быть осуществлена любым удобным способом, включая, но не ограничиваясь ими, например, вирусную трансфекцию, электропорацию, липофекцию, бомбардировку, химическую трансформацию, использование подходящего для трансдукции носителя (например, подходящего для трансдукции белка-носителя) и т.п. В некоторых случаях клетка, в которую трансформируют нуклеиновую кислоту, кодирующую синтетический модульный полипептид, упоминается в настоящем документе как клетка-хозяин.
Клетки-хозяева могут экспрессировать одну отдельную нуклеиновую кислоту, содержащую нуклеиновую последовательность-штрихкод, кодирующую уникальный синтетический модульный полипептид, или могут экспрессировать множество, включая две или более, отдельных нуклеиновых кислот, содержащих нуклеиновую последовательность-штрихкод, кодирующих уникальные синтетические модульные
полипептиды. Следует понимать, что количество отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которое экспрессирует клетка-хозяин, можно контролировать, например, путем контроля частоты или вероятности доставки рассматриваемых нуклеиновых кислот в клетку-хозяина, например, путем модуляции параметров способа доставки. В некоторых случаях конечное количество отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, которые кодируют уникальные синтетические модульные полипептиды, присутствующих в клетке-хозяине, может быть упомянуто как множественность инфекции (MOI) и может быть определено как соотношение нуклеиновых кислот и клеток-хозяев до или после доставки. Стандартные способы модуляции MOI, например, путем увеличения или уменьшения соотношения нуклеиновых кислот и клеток-хозяев до доставки, могут быть использованы для получения желательного конечного количества отдельных нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих уникальные синтетические модульные полипептиды, на клетку-хозяина после доставки.
Нуклеиновые кислоты, кодирующие синтетические модульные полипептиды, могут быть трансформированы в любую подходящую клетку-хозяина или клеточную линию, включая, например, прокариотические и эукариотические клетки. Выбор типа клетки-хозяина будет зависеть от ряда факторов, включая тип библиотеки синтетических модульных полипептидов, подлежащей скринингу, и конкретное скрининговое количественное исследование. В некоторых случаях клетка-хозяин может представлять собой прокариотическую клетку, включая, но не ограничиваясь ими, Acidobacteria, Actinobacteria, Aquificae, Bacteroidetes, Caldiserica, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Elusimicrobia, Fibrobacteres, Firmicutes, Fusobacteria, Gemmatimonadetes, Lentisphaerae, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Synergistetes, Tenericutes, Thermodesulfobacteria, Thermotogae и Verrucomicrobia. Согласно некоторым вариантам реализации настоящего изобретения клетка-хозяин может представлять собой бактериальную клетку, например, Е. coli. В некоторых случаях может быть использован стандартный бактериальный штамм, включая, но не ограничиваясь ими, например, коммерчески доступные штаммы от таких поставщиков как Американская коллекция типовых культур (АТСС) (Манассас, Виргиния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США) и т.п.
Подходящие эукариотические клетки включают первичные клетки и культивируемые клетки, первоначально полученные из животного-хозяина, включая, но
не ограничиваясь ими, например, млекопитающих (включая, например, человека, приматов, человекообразных обезьян, копытных, собачьих, кошачьих, кроликов, грызунов и т.д.), рептилий, земноводных (например, шпорцевых лягушек, саламандру, тритона и т.д.), рыб (например, данио и т.д.), птиц (например, курицу и т.д.), беспозвоночных (например, насекомых (например, плодовую муху и т.д.)), червей (например, нематод и т.д.), морских беспозвоночных (например, морского ежа и т.д.) и т.д.), дрожжи и т.п. Согласно некоторым вариантам реализации настоящего изобретения клетки могут представлять собой первичные клетки грызунов или культивированные клетки грызунов, полученные от мыши или крысы. В других вариантах реализации клетки могут представлять собой первичные клетки человека или культивированные клетки человека. Любая подходящая эукариотическая клетка может быть использована в качестве клетки-хозяина в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного скринингового количественного исследования, однако в некоторых случаях могут быть использованы подходящие линии эукариотических клеток, включая, но не ограничиваясь ими, например, коммерчески доступные от таких поставщиков как Американская коллекция типовых культур (АТСС) (Манассас, Виргиния, США), Life Technologies, Inc. (Гранд-Айленд, Нью-Йорк, США) и т.п.
В некоторых случаях клетки клеточной библиотеки представляют собой первичные клетки (например, первичные моноциты, первичные лимфоциты (например, первичные Т-клетки, первичные В-клетки, первичные NK-клетки и т.д.), первичные дендритные клетки и т.д.), первичные эндотелиальные клетки, первичные эпителиальные клетки, первичные фибробласты, первичные гемопоэтические стволовые клетки, первичные кератиноциты, первичные меланоциты, первичные мезенхимальные стволовые клетки, первичные преадипоциты, первичные мышечные клетки (например, первичные клетки гладкой мускулатуры, первичные клетки скелетной мускулатуры и т.д.) и т.д. В некоторых случаях клетки клеточной библиотеки представляют собой известные клеточные линии (например, клетки Jurkat и т.д.). В некоторых случаях клетки клеточной библиотеки представляют собой специфичные для пациента клетки (специфичные для пациента иммунные клетки (например, первичные Т-клетки и т.д.), специфичные для пациента стволовые клетки (например, гемопоэтические стволовые клетки, мезенхимальные стволовые клетки, стволовые клетки, полученные из жировой ткани и т.д.), специфичные для пациента раковые клетки (например, опухолевые клетки, клетки рака крови и т.д.).
Подходящие клетки млекопитающих включают первичные клетки и иммортализованные клеточные линии. Подходящие линии клеток млекопитающих включают линии клеток человека, линии клеток приматов, отличных от человека, линии
клеток грызунов (например, мыши, крысы) и т.п. Подходящие линии клеток млекопитающих включают, но не ограничиваются ими, клетки HeLa (например, Американская коллекция типовых культур (АТСС) № CCL-2), клетки СНО (например, АТСС №№CRL9618, CCL61, CRL9096), клетки НЕК293 (например, АТСС №CRL-1573), клетки Vero, клетки NIH ЗТЗ (например, АТСС №CRL-1658), клетки Huh-7, клетки ВНК (например, АТСС №ССЫ0), клетки РС12 (АТСС №CRL1721), клетки COS, клетки COS-7 (АТСС №CRL1651), клетки RATI, L-клетки мыши (АТСС №ССЫ.З), клетки мезонефроса человека (НЕК) (АТСС №CRL1573), линии клеток HLHepG2, Hut-78, Jurkat, HL-60, NK (например, NKL, NK92 и YTS) и т.п.
В некоторых случаях клетка не является клеткой иммортализованной клеточной линии, а, напротив, представляет собой клетку (например, первичную клетку), полученную от индивидуума. Например, в некоторых случаях, клетка представляет собой иммунную клетку, полученную от индивидуума. В качестве примера клетка представляет собой Т-лимфоцит, полученный от индивидуума. В качестве другого примера клетка представляет собой цитотоксическую клетку, полученную от индивидуума. В качестве другого примера клетка представляет собой стволовую клетку или клетку-предшественника, полученную от индивидуума.
После трансформации множества нуклеиновых кислот, кодирующих синтетические модульные полипептиды библиотеки, трансформированные клетки-хозяева могут быть отсортированы на основании экспрессии ими синтетических модульных полипептидов, например, для удаления клеток, которые не экспрессируют синтетические модульные полипептиды, из библиотеки, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды на уровнях, превышающих определенный порог экспрессии, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды на уровнях, ниже определенного порога экспрессии, чтобы выделить только те клетки, которые экспрессируют синтетические модульные полипептиды в определенном диапазоне уровней экспрессии, и т.д. В некоторых случаях сортировка трансформированных клеток на основании уровня экспрессии может быть выполнена, чтобы выделить только те клетки в библиотеке, которые имеют одинаковый уровень экспрессии, причем одинаковый уровень экспрессии может варьироваться в зависимости от конкретных способов применения и в некоторых случаях может быть определен как уровень экспрессии в пределах определенного диапазона, который выше и ниже среднего уровня экспрессии популяции.
Согласно некоторым вариантам реализации настоящего изобретения сортировка трансформированных клеток на основании уровня экспрессии ими элементов библиотеки,
например, сортировка клеток, экспрессирующих или имеющих приблизительно равный уровень экспрессии элементов библиотеки, позволяет улучшить оценку влияния элемента библиотеки и/или модулей, входящих в ее состав. Например, при выделении только тех клеток, которые экспрессируют элементы библиотеки в определенном диапазоне уровней, идентификация элементов библиотеки, влияющих на конкретный фенотип, будет основана на фактической функции элементов библиотеки и тех модулей, которые входят в ее состав, а не на эффективности экспрессии конкретного элемента библиотеки. Согласно некоторым вариантам реализации настоящего изобретения, например, при выполнении полуколичественного исследования частоты экспрессии отдельных элементов библиотеки и/или ее модулей, сортировка клеток, экспрессирующих элементы библиотеки в пределах заранее определенного диапазона уровней, обеспечивает более точное количественное исследование и количественное определение элементов библиотеки и/или модулей на основании их влияния на определенный фенотип, а не на основании характерного для них относительного уровня экспрессии.
Помимо этого сортировка позволяет идентифицировать элементы библиотеки и ее модули, функционирование которых создает или влияет на конкретный фенотип при экспрессии в пределах определенного диапазона уровней экспрессии или выше или ниже определенного порога, включая, например, низкий уровень экспрессии или высокий уровень экспрессии.
Нормирование библиотеки
Библиотеки согласно настоящему изобретению могут быть нормированы или могут не быть нормированы в зависимости от ситуации, в которой создается библиотека, и/или предполагаемого окончательного способа применения библиотеки. В настоящей заявке под термином "нормированный", применительно к описанным библиотекам, подразумевают, что относительные количества каждого элемента библиотеки корректируют, чтобы по меньшей мере уравнять их количества, по сравнению с относительными количествами каждого элемента библиотеки до корректировки. В некоторых случаях нормирование библиотеки приводит к тому, что библиотека имеет меньший диапазон между количеством наиболее представленных элементов библиотеки и количеством наименее представленных элементов библиотеки. В некоторых случаях нормирование приводит к увеличению количества наименее представленного элемента(ов) библиотеки. В некоторых случаях нормирование приводит к уменьшению количества наиболее представленного элемента(ов) библиотеки.
В некоторых случаях нормирование библиотеки может включать количественную оценку всех или большинства или репрезентативной выборки (или всей или большей
части репрезентативной выборки) элементов библиотеки для определения относительного количества каждого элемента библиотеки в библиотеке. После количественной оценки корректировку проводят на основании количественной оценки, чтобы уравнять относительное присутствие каждого элемента библиотеки в библиотеке. В зависимости от ситуации указанная корректировка может быть выполнена непосредственно в уже полученной библиотеке так, что библиотека подвергается непосредственному нормированию. В другом варианте корректировка может быть выполнена как часть способа получения библиотеки так, что следующая полученная библиотека будет нормирована.
Любая библиотека согласно настоящему изобретению может быть нормирована, включая, но не ограничиваясь ими, например, библиотеки нуклеиновых кислот, библиотеки полипептидов, неклеточные инкапсулированные библиотеки, клеточные библиотеки и т.д., и в зависимости от библиотеки, которую нормируют, могут быть использованы различные способы. Например, в зависимости от типа библиотеки, которую нормируют, могут быть использованы различные способы количественной оценки относительных количеств элементов библиотеки. Различные способы количественного определения элементов библиотеки нуклеиновых кислот, которые могут быть использованы, включают, но не ограничиваются ими, например, количественное секвенирование (например, секвенирование следующего поколения), количественную ПЦР, количественную гибридизацию (например, микрочип) и т.п. Могут быть использованы различные способы количественного определения элементов полипептидной библиотеки, включая, но не ограничиваясь ими, например, количественную масс-спектрометрию, ИФА и т.п. Могут быть использованы различные способы количественного определения элементов клеточной библиотеки, включая, но не ограничиваясь ими, проточную цитометрию, иммуногистохимическое исследование, количественное секвенирование (например, секвенирование следующего поколения), количественную ПЦР, количественную гибридизацию (например, микрочип) и т.п.
В некоторых случаях, когда элементы библиотеки количественно определены, может быть рассчитана корректировка(и), необходимая для нормирования. Любой удобный и подходящий способ расчета нормирования может быть использован в зависимости от типа библиотеки и/или размера библиотеки. В некоторых случаях может быть использовано линейное уравнение, включая, но не ограничиваясь им, линейное уравнение, представленное на Фиг. 28.
В некоторых случаях, когда нормирование рассчитано для каждого элемента библиотеки, библиотека может быть скорректирована. Могут быть использованы
различные способы непосредственной корректировки библиотеки. Например, в некоторых случаях, клеточная библиотека может быть нормирована с использованием FACS для сортировки равного количества клеток, представляющих каждый элемент библиотеки, в пул или в индивидуально доступные компартменты. В некоторых случаях, когда библиотека уже компартментализована, библиотека может быть нормирована путем корректировки объема каждого компартмента, включая, например, те случаи, когда различные концентрации элементов библиотеки в каждом компартменте нормируют путем добавления определенного объема жидкости в каждый компартмент, достаточного для выравнивания концентраций.
В некоторых случаях может быть выполнено нормирование объединенной библиотеки нуклеиновых кислот. Объединенные библиотеки нуклеиновых кислот могут быть нормированы по разным причинам. В одном варианте реализации объединенная библиотека нуклеиновых кислот может быть нормирована для компенсации избыточной или недостаточной представленности отдельных элементов библиотеки в библиотеке, например, вследствие более или менее эффективного включения отдельных модулей нуклеиновых кислот в элементы библиотеки во время комбинаторной сборки.
В некоторых случаях элементы библиотеки нуклеиновых кислот и/или модули нуклеиновых кислот, составляющие элементы библиотеки, могут быть количественно определены (например, путем количественного секвенирования). После такой количественной оценки рассчитывается корректировка каждого элемента, необходимая для нормирования. В одном варианте реализации рассчитанная корректировка может быть применена к следующей комбинаторной сборке библиотеки, например, количество каждого модуля нуклеиновой кислоты, используемое для сборки библиотеки нуклеиновых кислот, может быть скорректировано на основании относительной представленности этого модуля в количественно оцененной библиотеке. Следовательно, готовая комбинаторная библиотека будет нормирована путем корректировки начального количества модулей нуклеиновых кислот перед следующей сборкой библиотеки. Соответственно, в некоторых случаях нормирование библиотеки, описанной в настоящем документе, может включать сборку библиотеки с последующей количественной оценкой собранной библиотеки и повторной сборкой нормированного варианта библиотеки, который основан на количественной оценке.
Способы скрининга
В настоящем изобретении предложены способы скрининга библиотек синтетических модульных полипептидов, включая, но не ограничиваясь ими, например, способы скрининга в условиях in vitro и способы скрининга в условиях in vivo. Под
"скринингом in vivo" обычно подразумевают, что библиотеку, содержащую множество уникальных синтетических модульных полипептидов, количественно исследуют в биологической среде живого организма. Живые организмы, которые можно количественно исследовать в условиях in vivo в соответствии со способами, описанными в настоящем документе, включают одноклеточные и многоклеточные организмы.
Скрининг одноклеточного организма в условиях in vivo обычно включает приведение одноклеточного организма в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование фенотипа в одноклеточном организме. В других случаях скрининг одноклеточного организма в условиях in vivo может включать приведение одноклеточного организма или множества одноклеточных организмов в контакт с библиотекой нуклеиновых кислот, кодирующих синтетические модульные полипептиды, в условиях, достаточных для экспрессии кодируемых синтетических модульных полипептидов одноклеточными организмами.
Скрининг многоклеточного организма в условиях in vivo обычно включает приведение многоклеточного организма в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование фенотипа в многоклеточном организме. В других случаях скрининг многоклеточного организма в условиях in vivo может включать приведение многоклеточного организма или множества многоклеточных организмов в контакт с библиотекой нуклеиновых кислот, кодирующих синтетические модульные полипептиды, в условиях, достаточных для экспрессии кодируемых синтетических модульных полипептидов многоклеточным организмом(ами). Любой подходящий многоклеточный организм может быть использован при скрининге в условиях in vivo библиотеки, описанной в настоящем документе, в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного используемого количественного исследования в условиях in vivo, причем конкретные многоклеточные организмы включают, но не ограничиваются ими, например, млекопитающих (например, мышей, крыс и т.д.).
Под термином "скрининг в условиях in vitro" обычно подразумевают, что библиотеку, содержащую множество уникальных синтетических модульных полипептидов, количественно исследуют вне нормальной биологической среды,
например, полипептидных модулей библиотеки, биологического материала, используемого при скрининге, или фенотипа, который подвергают скринингу. Например, в некоторых случаях, скрининг в условиях in vitro может быть выполнен с использованием искусственной или синтетической экспериментальной среды, включая, но не ограничиваясь ими, например, выделенный образец, выделенную клетку, культуру клеток, выделенную или иссеченную ткань, определенный образец, определенную среду, искусственную ткань, искусственный орган, клеточный экстракт, тканевой экстракт, множество образцов и т.д. Скрининг в условиях in vitro может быть выполнен в любом удобном и подходящем сосуде, включая, но не ограничиваясь ими, например, реакционный сосуд, реакционную камеру, пробирку, флакон, планшет, колбу, чашку, предметное стекло и т.п.
Скрининг образца в условиях in vitro, включая клеточный образец или неклеточный образец, обычно включает приведение образца в контакт с библиотекой синтетических модульных полипептидов, причем указанная библиотека синтетических модульных полипептидов может представлять собой библиотеку полипептидов или библиотеку клеток, экспрессирующих синтетические модульные полипептиды, и детектирование клеточного фенотипа или другой реакции или молекулярного фенотипа. Любой подходящий образец может быть использован при скрининге библиотеки, описанной в настоящем документе, в условиях in vitro в зависимости от конкретной библиотеки, подлежащей скринингу, и конкретного используемого количественного исследования в условиях in vitro, причем конкретные образцы включают, но не ограничиваются ими, например, биологические образцы, клеточные образцы, образцы полипептидов, образцы нуклеиновых кислот, химические образцы и т.п.
В некоторых случаях бесклеточные библиотеки синтетических модульных полипептидов могут быть подвергнуты скринингу в условиях in vitro. Например, компартментализованную библиотеку синтетических модульных полипептидов можно подвергнуть скринингу для определения фенотипа путем приведения компартментализованной библиотеки синтетических модульных полипептидов в контакт с одним или более агентами, с которыми, согласно прогнозам, реагируют отдельные элементы библиотеки. Любые подходящие способы скрининга бесклеточных библиотек полипептидов, как инкапсулированных, так и объединенных, можно применять в способах, описанных в настоящем документе, включая, но не ограничиваясь ими, например, детектирование методом проточной цитометрии или детектирование фенотипа методом флуоресцентно-активированной сортировки клеток в бесклеточных количественных исследованиях, основанных на инкапсуляции, например, описанных в
Griffiths & Tawfik. EMBO J (2003) 22(l):24-35 и Bernath et al. Anal Biochem (2004) 325(1): 151-7; содержание которых полностью включено в настоящую заявку посредством ссылки.
Фенотипы и способы идентификации
Способы скрининга, в условиях in vivo или в условиях in vitro, обычно включают детектирование фенотипа и идентификацию одного или более элементов библиотеки, связанных с фенотипом. В настоящей заявке термин "фенотип" обычно относится к характеристике молекулы, клетки, ткани, органа или организма, которую детектируют в конкретном количественном исследовании, и, следовательно, может включать, но не ограничивается ими, например, молекулярные фенотипы, клеточные фенотипы, фенотипы организма, фенотипы тканей, фенотипы органов, фенотипы организма и т.д. Фенотип, детектируемый в конкретном количественном исследовании, может представлять собой заранее определенный фенотип, например, известный или ожидаемый фенотип (например, включая известный или ожидаемый уровень определенной характеристики, присутствие или отсутствие известной или ожидаемой характеристики уровня и т.д.) или может быть идентифицирован во время количественного исследования, например, впервые детектируемый или ранее неопределенный фенотип (например, включая впервые детектируемый или ранее неопределенный уровень конкретной характеристики, присутствие или отсутствие впервые детектируемой или ранее неопределенной характеристики и т.д.). Любой подходящий количественный способ исследования для детектирования фенотипа, относящегося к библиотеке синтетических модульных полипептидов, описанной в настоящем документе, можно применять при скрининге указанных библиотек.
Скрининг библиотеки синтетических модульных полипептидов или нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов, позволяет идентифицировать полипептиды и/или их модули, которые эффективно обеспечивают желательный фенотип. Соответственно, в область настоящего изобретения в целом включены полипептиды, идентифицированные путем скрининга описанных в настоящем документе библиотек.
В некоторых случаях клеточный фенотип детектируют после приведения популяции клеток в контакт с библиотекой, описанной в настоящем документе. Клеточные фенотипы могут включать, но не ограничиваются ими, например, поведение клеток (включая, но не ограничиваясь ими, жизнеспособность клеток, пролиферацию клеток, активацию клеток, морфологию клеток, миграцию клеток, адгезию клеток, дифференцировку клеток, плюрипотентность клеток и т.д.), клеточную экспрессию
(включая, но не ограничиваясь ими, экспрессию гена, экспрессию белка, экспрессию некодирующей РНК, активацию гена, репрессию гена и т.д.), экспрессию репортера (включая, но не ограничиваясь ими, например, экспрессию трансгенного репортера, экспрессию маркера) и т.п.
В некоторых случаях фенотип ткани, органа или организма детектируют после приведения ткани, органа или организма в контакт с библиотекой, описанной в настоящем документе. Фенотипы ткани включают, но не ограничиваются ими, например, жизнеспособность ткани, морфологию ткани, физические характеристики ткани (включая, но не ограничиваясь ими, защитную функцию, механическую прочность, эластичность и т.д.), экспрессию в ткани (включая, но не ограничиваясь ими, например, экспрессию тканевого гена, экспрессию тканевого белка и т.д.), экспрессию репортера в ткани (включая, но не ограничиваясь ими, например, экспрессию трансгенного репортера, экспрессию маркера) и т.п. Фенотипы органа включают, но не ограничиваются ими, например, внешний вид органа, жизнеспособность органа, морфологию органа, функцию органа (включая, но не ограничиваясь ими, производство биомолекулы (например, фермента, метаболита, белка и т.д.), фильтрацию, механическую функцию и т.д.). Фенотипы организма включают, но не ограничиваются ими, например, внешний вид организма, жизнеспособность организма (например, продолжительность жизни), физиологию организма, фертильность организма/плодовитость, поведение организма и т.д.
В некоторых случаях фенотип может быть количественно исследован в отношении патологического состояния, причем указанное патологическое состояние может представлять собой моделируемое патологическое состояние (например, клетку, ткань или организм, который был изменен или обработан, чтобы проявлять характеристики конкретного заболевания) или может представлять собой клиническое патологическое состояние (например, организм, проявляющий характеристики заболевания или у которого диагностировано заболевание, или клетки или ткани, полученные из него). Фенотипы, связанные с заболеванием, могут быть количественно исследованы на любом удобном уровне, включая, но не ограничиваясь ими, например, клеточный уровень, тканевой уровень, органный уровень, уровень организма. В некоторых случаях количественно исследованные фенотипы заболевания могут представлять собой фенотипы самого возбудителя заболевания, включая, но не ограничиваясь ими, например, фенотипы опухолей, фенотипы раковых клеток, фенотипы аутоиммунных клеток, фенотипы инфекционных агентов (бактериальных, вирусных и т.д.) и т.д. В других случаях количественно исследованные фенотипы заболевания могут представлять собой
фенотипы клетки, ткани или организма, пораженного указанным заболеванием, или связанные с моделируемым заболеванием, которые обеспечивают информацию о присутствии и/или прогрессировании заболевания, включая, но не ограничиваясь ими, например, активацию клеток (например, активацию иммунных клеток), ответ на заболевание (например, иммунный ответ), биомаркеры, количество клеток, физиологические реакции организма, клинические исходы и т.д.
В некоторых случаях оценка фенотипа может быть проведена на уровне популяции, например, может быть проведена оценка популяции клеток, оценка популяции организмов и т.д. В некоторых случаях при популяционной оценке фенотипа действие конкретного элемента библиотеки на присутствие или отсутствие популяционного фенотипа может быть измерено. Например, можно оценить действие конкретного элемента библиотеки на клеточный фенотип популяции клеток. В других случаях можно оценить действие конкретного элемента библиотеки на фенотип организмов в популяции организмов.
Согласно некоторым вариантам реализации настоящего изобретения фенотип оценивают в ответ на применяемый стимул, причем применение стимула включает, но не ограничивается перечисленными, например, приведение клеток в контакт со стимулом, приведение ткани в контакт со стимулом, приведение органа в контакт со стимулом, приведение организма в контакт со стимулом и т.д. По существу исследуемый образец или исследуемый субъект может быть приведен в контакт со стимулом в условиях in vitro или in vivo в зависимости от используемого количественного способа исследования, в зависимости от стимула и в зависимости от конкретной библиотеки, которую подвергают скринингу. Различные стимулы могут быть использованы по отдельности или в комбинации. Стимул может представлять собой свободный стимул (например, растворимый стимул, свободный лиганд и т.д.), связанный стимул (например, связанный с твердым носителем), экспрессируемый клетками стимул (например, экспрессированная костимулирующая молекула, экспрессированный антиген, экспрессированный клеточный лиганд и т.д.) и т.п.
Согласно некоторым вариантам реализации настоящего изобретения популяцию Т-клеток, экспрессирующую библиотеку синтетических модульных CAR, приводят в контакт со стимулом в условиях in vitro и детектируют полученный в результате фенотип. Стимулы в условиях in vitro, пригодные для скрининга клеточной библиотеки, экспрессирующей синтетические модульные CAR, обычно будут включать антигены, включая, например, свободный антиген, связанный антиген, экспрессируемый клетками антиген (например, экспрессируемый на антигенпрезентирующей клетке,
экспрессируемый на клетке-мишени и т.д.) и т.д. Подходящие антигены будут варьироваться в зависимости от конкретной библиотеки CAR, подлежащей скринингу, и желательного результата скрининга. Неограничивающие примеры антигенов включают, но не ограничиваются ими, например, растворимый антиген, антиген, связанный с твердой подложкой (например, связанный с планшетами антиген, связанный с гранулами антиген, связанный с предметным стеклом антиген и т.д.), экспрессируемый антиген (например, трансгенная клетка, экспрессирующая антиген, клетка, экспрессирующая антиген в природных условиях (например, клетка, экспрессирующая нативный антиген, раковая клетка, экспрессирующая раковый антиген и т.д.). Клетки, экспрессирующие нативный антиген, которые можно применять для скрининга библиотеки в условиях in vitro, будут варьироваться и могут включать, но не ограничиваются ими, например, наивные опухолевые клетки (например, полученные при биопсии опухоли).
Согласно некоторым вариантам реализации настоящего изобретения популяцию Т-клеток, экспрессирующую библиотеку синтетических модульных CAR, приводят в контакт со стимулом в условиях in vivo и детектируют полученный в результате фенотип. Ситуации скрининга библиотеки синтетических модульных CAR в условиях in vivo будут сильно различаться и могут включать, но не ограничивается ими, животные модели. В некоторых случаях скрининг в условиях in vivo может быть выполнен у небольших модельных животных, таких как, например, моделирование на грызунах, включая, но не ограничиваясь ими, например, мышиные модели, крысиные модели и т.д. В некоторых случаях скрининг в условиях in vivo выполняют на мышиных моделях опухолей, включая трансгенные и нетрансгенные мышиные модели опухолей.
В некоторых случаях используемая модель может представлять собой ксенотрансплантатную модель. Например, используемая модель может представлять собой "гуманизированную" модель, причем указанные гуманизированные модели определяют как имеющие один или более компонентов человеческого происхождения, например, гуманизированная иммунная система, гуманизированные Т-клетки, экспрессирующие белок человека, несущие раковые клетки человека и т.д. В этой связи гуманизированные модели могут быть полностью или частично гуманизированы. В других случаях модель может быть не полностью или частично гуманизированной, но вместо этого может быть просто введена с клетками человека или тканью человека посредством инъекции или трансплантации. Например, в некоторых случаях, раковые клетки человека или клетки из клеточных линий рака человека вводят в животную модель. Любые удобные опухолевые клетки человека или линия опухолевых клеток человека может быть использована в указанных моделях, включая, но не ограничиваясь
ими, например, клетки К562, клетки лимфомы Дауди и т.д.
Животные модели и/или клетки или ткани, введенные в животные модели, могут быть трансгенными или нетрансгенными, например, могут быть модифицированы для экспрессии одного или более трансгенов. Например, в некоторых случаях, животная модель может быть трансгенно модифицирована для экспрессии гетерологичного гена, например, репортерного гена (например, для идентификации клеток животного-хозяина), гена-мишени (например, гена, кодирующего генный продукт, который должен быть мишенью при скрининге в условиях in vivo). В некоторых случаях клетка, введенная в животную модель, может быть трансгенно модифицирована для экспрессии гетерологичного гена, например, репортерного гена (например, для идентификации введенной клетки), гена-мишени (например, гена, кодирующего генный продукт, который должен быть мишенью при скрининге в условиях in vivo). В качестве неограничивающего примера мышиная модель опухоли может быть подвергнута скринингу в соответствии со способами, описанными в настоящем документе, при этом мыши вводят опухолевые клетки человека, экспрессирующие раковый трансген-мишень (например, CD 19, мезотелин и т.д.).
Элементы библиотеки, внедренные в системы in vivo, могут быть подвергнуты скринингу для определения любого подходящего фенотипа, причем указанный фенотип может зависеть от конкретной библиотеки, которую подвергают скринингу, конкретной ситуации в условиях in vivo (например, животной модели) и т.д. В некоторых случаях, например, если система в условиях in vivo представляет собой животную модель опухоли, библиотека может быть подвергнута скринингу для определения фенотипов, связанных с селективностью элементов библиотеки в отношении опухолей, например, путем введения библиотеки в животную модель, содержащую две разные опухоли, путем введения библиотеки в животную модель или несколько животных моделей, содержащих опухоли, экспрессирующие различные уровни опухолевого антигена и т.д. Любой удобный способ количественного исследования фенотипа, включая описанные в настоящем документе клеточные и биохимические/молекулярные способы, можно применять при оценке систем in vivo, причем такие оценки обычно включают получение биологического образца из животной модели. В некоторых случаях биологический образец, пригодный для оценки модели в условиях in vivo, может включать образец ткани (например, крови, опухоли и т.д.) или образец органа (например, селезенки).
В некоторых случаях библиотека может быть подвергнута скринингу в условиях in vitro или в условиях in vivo в соответствии с фенотипом Т-клеток. Фенотипы Т-клеток будут варьироваться и будут включать стимулированные фенотипы Т-клеток, т.е. ответ на
антиген. Неограничивающие примеры фенотипов Т-клеток включают, но не ограничиваются ими, например, пролиферацию Т-клеток, выработку цитокинов (например, ИЛ-2, ИФН-у, ФНО, ЛТ-а, ИЛ-4, ИЛ-5, ИЛ-6, ИЛ-13, ИЛ-9, ИЛ-10, ИЛ-17А, ИЛ-nF, ИЛ-21, ИЛ-22, ИЛ-26, CCL20, ИЛ-21, ФРО-р и т.д.), экспрессию поверхностных маркеров Т-клеток (например, CD3, CD4, CD8 и т.д.), маркеры активации Т-клеток (например, CD69 и т.д.), маркеры внутриклеточной сигнализации (например, фосфорилированную форму ERK1/2, фосфорилированную форму р38МАРК и т.д.) и т.п.
Фенотипы Т-клеток могут быть количественно исследованы в условиях in vitro и в условиях in vivo и могут быть детектированы любым удобным способом. В некоторых случаях устройство для подсчета клеток или проточный цитометр можно использовать для количественного исследования фенотипа Т-клеток, включая, например, пролиферацию Т-клеток и/или количественную оценку Т-клеток. Например, пролиферация Т-клеток может быть количественно исследована с помощью метода проточной цитометрии путем разбавления красителя для мечения клеток. В некоторых случаях экспрессия маркеров клеточной поверхности также может быть количественно исследована с помощью проточной цитометрии. Экспрессия внутриклеточных маркеров может быть определена клеточными способами (например, с помощью проточной цитометрии, проточной цитометрии с использованием фосфо-специфичных антител, проточной цитометрии внутриклеточных маркеров, иммунофлуориметрии, гибридизации in situ, флуоресцентной гибридизации in situ и т.д.) или может быть количественно исследована с помощью молекулярных и/или биохимических способов (например, ИФА, захвата цитокинов, способов на основе амплификации (например, количественной ПНР), способов, основанных на секвенировании (например, с помощью количественного секвенирования), количественной масс-спектрометрии и т.д.).
В некоторых случаях Т-клетки могут быть количественно исследованы для определения фенотипа активации "природных киллеров". Любой подходящий способ оценки активации природных киллеров можно применять в указанных количественных исследованиях. Например, Т-клетки могут быть количественно исследованы для определения экспрессии CD107a/b, например, методом проточной цитометрии.
В некоторых случаях Т-клетки могут быть количественно исследованы для определения одного или более фенотипов дифференцировки. Любой подходящий способ оценки дифференцировки Т-клеток можно применять в указанных количественных исследованиях. Например, дифференцировку в Т-клетку памяти можно определить, например, путем количественного исследования маркеров Т-клеток памяти (например, Thl, Th2, ТЫ7, Treg и т.д.) с использованием любого подходящего клеточного или
молекулярно-биохимического способа. В некоторых случаях может быть проведена оценка экспрессии одного или более факторов внутриклеточной транскрипции, указывающих на дифференцировку в Т-клетки памяти (например, Gata3, Tbet, RORyt, FoxP3, Bcl-6, CCR7, CD45RO, CD45RA, CD69 и т.д.).
Скрининг библиотеки синтетических модульных полипептидов CAR или нуклеиновых кислот, кодирующих библиотеку синтетических модульных полипептидов CAR, позволяет идентифицировать CAR и/или их части (например, антигенсвязывающие домены, первичные сигнальные домены, комодулирующие домены и т.д.), которые эффективно приводят к возникновению желательного фенотипа Т-клеток. Соответственно, в область настоящего изобретения включены CAR, идентифицированные путем скрининга библиотек, описанных в настоящем документе, а также нуклеиновых кислот, кодирующих указанные CAR. В область настоящего изобретения также включены CAR, содержащие подходящие модули CAR (например, антигенсвязывающие домены, первичные сигнальные домены, комодулирующие домены и т.д.), идентифицированные путем скрининга библиотек, описанных в настоящем документе, а также нуклеиновых кислот, кодирующих указанные CAR.
В некоторых случаях CAR согласно настоящему изобретению может содержать один или более комодулирующих доменов, идентифицированных как стимулирующие Т-клетки или ингибирующие Т-клетки домены при скрининге библиотеки синтетических модульных полипептидов CAR или нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, описанных в настоящем документе. Соответственно, общий Т-клеточный фенотип CAR может заключаться в имитации активности Т-клеток или ингибировании активности Т-клеток. Виды активности Т-клеток, которые могут быть подвергнуты стимулированию или ингибированию, включают, но не ограничиваются ими, например, виды активности Т-клеток, описанные в настоящем документе.
В некоторых случаях CAR, идентифицированный путем скрининга библиотеки, может содержать по меньшей мере один комодулирующий домен, перечисленный в таблице 3 или таблице 4, включая, но не ограничиваясь ими, например, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR, идентифицированный путем скрининга библиотеки, может содержать два или более комодулирующих доменов, перечисленных в таблице 3 и таблице 4, включая, но не
ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR согласно настоящему изобретению может содержать комодулирующий домен, идентифицированный при скрининге, описанном в настоящем документе, в качестве костимулирующего домена, включая, но не ограничиваясь ими, например, те, которые перечислены в таблице 3, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR согласно настоящему изобретению может содержать комодулирующий домен, идентифицированный при скрининге, описанном в настоящем документе, в качестве коингибирующего домена, включая, но не ограничиваясь ими, например, те, которые перечислены в таблице 4, включая, но не ограничиваясь ими, комодулирующие домены, содержащие аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% идентична перечисленной последовательности домена. В некоторых случаях CAR, который содержит один или более коингибирующих доменов, может представлять собой iCAR.
В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может содержать два костимулирующих домена, включая, но не ограничиваясь ими, например, два или более костимулирующих доменов, перечисленных в таблице 3. В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может содержать два коингибирующих домена, включая, но не ограничиваясь ими, например, два или более коингибирующих доменов, перечисленных в таблице 4. В некоторых случаях CAR, содержащий два или более комодулирующих доменов, может включать смесь костимулирующих и коингибирующих доменов, включая, но не ограничиваясь ими, по меньшей мере один костимулирующий домен, перечисленный в таблице 3, и по меньшей мере один коингибирующий домен, перечисленный в таблице 4.
Таблица 3: Комодулирующие домены, обладающие стимулирующей функцией
модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические полипептиды CAR, может содержать любой подходящий антигенсвязывающий домен, включая, но не ограничиваясь ими, те, которые используются в клинических условиях в различных конструкциях CAR, включая, например, ВСМА-специфичный антигенсвязывающий домен, CD 123-специфичный антигенсвязывающий домен, СО!38-специфичный антигенсвязывающий домен, CD171
специфичный антигенсвязывающий домен, С019-специфичный антигенсвязывающий домен, С022-специфичный антигенсвязывающий домен, СО30-специфичный антигенсвязывающий домен, CD33-специфичный антигенсвязывающий домен, CD7-специфичный антигенсвязывающий домен, СО70-специфичный антигенсвязывающий домен, СЕА-специфичный антигенсвязывающий домен, EGFRvIII-специфичный антигенсвязывающий домен, ЕРСАМ-специфичный антигенсвязывающий домен, EphA2-специфичный антигенсвязывающий домен, ErbB-специфичный антигенсвязывающий домен, FAP-специфичный антигенсвязывающий домен, С02-специфичный антигенсвязывающий домен, GPC3-специфичный антигенсвязывающий домен, HER2-специфичный антигенсвязывающий домен, ILlRAP-специфичный антигенсвязывающий домен, каппа-специфичный антигенсвязывающий домен, LeY-специфичный антигенсвязывающий домен, Meso-специфичный антигенсвязывающий домен, MG7-специфичный антигенсвязывающий домен, MUC1 -специфичный антигенсвязывающий домен, Тч(К02В-специфичный антигенсвязывающий домен, PSCA-специфичный антигенсвязывающий домен, ROR1-специфичный антигенсвязывающий домен и т.п.
CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, может содержать любой подходящий первичный сигнальный домен (также называемый в настоящем документе внутриклеточным сигнальным доменом), включая, но не ограничиваясь ими, например, те, которые содержат один или более иммунорецепторных тирозиновых активирующих мотивов (ITAM).
Подходящий внутриклеточный сигнальный домен может быть частью, содержащей мотив ITAM, которая получена из полипептида, который содержит мотив ITAM. Например, подходящий внутриклеточный сигнальный домен может представлять собой домен, содержащий мотив ITAM, из любого содержащего мотив ITAM белка. Следовательно, подходящий внутриклеточный сигнальный домен необязательно содержит полную последовательность всего белка, из которого он получен. Примеры подходящих полипептидов, содержащих мотив ITAM, включают, но не ограничиваются ими: DAP12; FCER1G (гамма-цепь рецептора Fes I); CD3D (СБЗ-дельта); CD3E (CD3-эпсилон); CD3G (CD3-гамма); CD3Z (CD3-дзета); и CD79A (альфа-цепь белка, связанного с антигенраспознающим рецепторным комплексом).
В некоторых случаях внутриклеточный сигнальный домен получен из DAP 12 (также известного как TYROBP; белок, связывающий тирозинкиназу TYRO, KARAP; PLOSL; DNAX-активирующий белок 12; связанный с KAR белок; связывающий
тирозинкиназу TYRO белок; активирующий киллеры ассоциированный с рецептором белок; активирующий киллеры рецептор-ассоциированный белок и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей (4 изоформы):
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLTVLIAL AVYFLGRLVPRGRGAAEAATRKORITETESPYOELOGQRSDVYSDLNTORPYYK. (SEQ ID NO: 107);
MGGLEPCSRLLLLPLLLAVSGLRPVQAQAQSDCSCSTVSPGVLAGIVMGDLVLT VLIALAVYFLGRLVPRGRGAAEATRKORITETESPYOELOGORSDVYSDLNTORPYYK (SEQ ID NO: 108);
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGR LVPRGRGAAEAATRKORITETESPYOELQGORSDVYSDLNTQRPYYK (SEQ ID NO: 109); или
MGGLEPCSRLLLLPLLLAVSDCSCSTVSPGVLAGIVMGDLVLTVLIALAVYFLGR LVPRGRGAAEATRKORITETESPYOELQGQRSDVYSDLNTQRPYYK (SEQ ID NO: 110),
в которых мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности DAP 12. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
ESPYQELQGQRSDVYSDLNTO (SEQ ID N0:111),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из FCER1G (также известного как FCRG; гамма-цепь рецептора Fes I; гамма-цепь рецептора Fc; Fc-эпсилон RI-гамма; FcR-гамма; FcsRI гамма; высокоаффинная гамма-субъединица
эпсилон-рецептора иммуноглобулина; рецептор иммуноглобулина Е; высокоаффинная гамма-цепь и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MIPAVVLLLLLLVEQAAALGEPQLCYILDAILFLYGIVLTLLYCRLKIQVRKAAITSYEKS DGVYTGLSTRNQETYETLKHEKPPQ (SEQ ID NO: 112),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности FCER1G. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
DGVYTGLSTRNOETYETLKHE (SEQ ID NO: 113),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из дельта-цепи поверхностного гликопротеина CD3 Т-клеток (также известного как CD3D; CD3-DELTA; T3D; антиген CD3; дельта-субъединица; CD3-дельта; СОЗё-антиген; дельта-полипептид (комплекс TiT3); ОКТЗ; дельта-цепь; дельта-цепь Т-клеточного рецептора ТЗ; дельта-цепь поверхностного гликопротеина CD3 Т-клеток и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до
приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 170 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG KRILDPRGIYRCNGTDIYKDKESTVQVHYRMCQSCVELDPATVAGIIVTDVIATLLLALG VFCFAGHETGRLSGAADTQALLRNDQVYOPLRDRDDAQYSHLGGNWARNK (SEQ ID NO: 114) или
MEHSTFLSGLVLATLLSQVSPFKIPIEELEDRVFVNCNTSITWVEGTVGTLLSDITRLDLG KRILDPRGIYRCNGTDIYKDKESTVOVHYRTADTOALLRNDOVYOPLRDRDDAQYSHL GGNWARNK (SEQ ID NO: 115),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3-дельта. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
DQVYQPLRDRDDAQYSHLGGN (SEQ ID NO: 116),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из эпсилон-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3s; эпсилон-цепь поверхностного антигена T3/Leu-4 Т-клеток; эпсилон-цепь поверхностного гликопротеина CD3 Т-клеток; AI504783; CD3; СОЗ-эпсилон; T3s и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно
115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 205 а.к. следующей аминокислотной последовательности:
MQSGTHWRVLGLCLLSVGVWGQDGNEEMGGITQTPYKVSISGTTVILTCPQYPGSEILW QHNDKNIGGDEDDKNIGSDEDHLSLKEFSELEQSGYYVCYPRGSKPEDANFYLYLRARV CENCMEMDVMSVATIVIVDICITGGLLLLVYYWSKNRKAKAKPVTRGAGAGGRQRGQ NKERPPPVPNPDYEPIRKGQRDLYSGLNORRI (SEQ ID NO: 117),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3 эпсилон. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
NPDYEPIRKGQRDLYSGLNQR (SEQ ID NO: 118),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из гамма-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3G; гамма-цепь Т-клеточного рецептора ТЗ; СОЗ-гамма; T3G; гамма-полипептид (комплекс TiT3) и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 180 а.к. следующей аминокислотной последовательности:
MEQGKGLAVLILAIILLQGTLAQSIKGNHLVKVYDYQEDGSVLLTCDAEAKNITWFKDG KMIGFLTEDKKKWNLGSNAKDPRGMYQCKGSQNKSKPLQVYYRMCQNCIELNAATIS GFLFAEIVSIFVLAVGVYFIAGODGVRQSRASDKQTLLPNDOLYQPLKDREDDOYSHLQ GNQLRRN (SEQ ID NO: 119),
в которой ITAM мотивы выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3-гамма. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
DQLYQPLKDREDDQYSHLQGN (SEQ ID NO: 120),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из дзета-цепи поверхностного гликопротеина CD3 Т-клеток (также известной как CD3Z; дзета-цепь Т-клеточного рецептора ТЗ; CD247; СОЗ-дзета; CD3H; CD3Q; T3Z; TCRZ и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к. или от приблизительно 150 а.к. до приблизительно 160 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):
MKWKALFTAAILQAQLP1TEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA PAYQQGQNQLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPQEGLYNELQKDK MAEAYSEIGMKGERRRGKGHDGLYOGLSTATKDTYDALHMOALPPR (SEQ ID NO: 121)или
MKWKALFTAAILQAQLPITEAQSFGLLDPKLCYLLDGILFIYGVILTALFLRVKFSRSADA PAYQOGONQLYNELNLGRREEYDVLDKRRGRDPEMGGKPQRRKNPOEGLYNELQKD KMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR (SEQ ID NO: в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD3-дзета. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей:
RVKFSRSADAPAYOOGONOLYNELNLGRREEYDVLDKRRGRDPEMGGKPRRKNPOEG LYNELQKDKMAEAYSEIGMKGERRRGKGHDGLYQGLSTATKDTYDALHMQALPPR
(SEQ ID NO: 123);
NQLYNELNLGRREEYDVLDKR (SEQ ID NO: 124); EGLYNELQKDKMAEAYSEIGMK (SEQ ID NO: 125); или DGLYQGLSTATKDTYDALHMO (SEQ ID NO: 126),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты.
В некоторых случаях внутриклеточный сигнальный домен получен из CD79A (также известной как альфа-цепь белка, связанного с антигенным рецептором В-клеток; антиген CD79a (ассоциированная с иммуноглобулином альфа-цепь); мембранный глико протеин МВ-1; ig-альфа; связанный с мембраной ассоциированный с иммуноглобулином белок; поверхностный IgM-ассоциированный белок и т.д.). Например, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно
115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 200 а.к. или от приблизительно 200 а.к. до приблизительно 220 а.к. любой из следующих аминокислотных последовательностей (2 изоформы):
MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNGTL1IQNVNKSHGGIYVCRVQEGNESYQ QSCGTYLRVRQPPPRPFLDMGEGTKNR1ITAEGIILLFCAVVPGTLLLFRKRWQNEKLGL DAGDEYEDENLYEGLNLDDCSMYEDISRGLOGTYQDVGSLNIGDVQLEKP (SEQ ID NO: 127); или
MPGGPGVLQALPATIFLLFLLSAVYLGPGCQALWMHKVPASLMVSLGEDAHFQCPHNS SNNANVTWWRVLHGNYTWPPEFLGPGEDPNEPPPRPFLDMGEGTKNRIITAEGIILLFCA VVPGTLLLFRKRWQNEKLGLDAGDEYEDENLYEGLNLDDCSMYEDISRGLQGTYQDV GSLNIGDVQLEKP (SEQ ID NO: 128),
в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты. Аналогичным образом, подходящий полипептид внутриклеточного сигнального домена может содержать часть, содержащую мотив ITAM, из полноразмерной аминокислотной последовательности CD79A. Следовательно, подходящий полипептид внутриклеточного сигнального домена может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности: ENLYEGLNLDDCSMYEDISRG (SEQ ID NO: 129), в которой мотивы ITAM выделены жирным шрифтом и подчеркнуты. Внутриклеточные сигнальные домены, подходящие для применения в CAR согласно настоящему изобретению, содержат сигнальную цепь типа DAP10/CD28.
Примером сигнальной цепи DAP 10 является аминокислотная последовательность: RPRRSPAODGKVYINMPGRG (SEQ ID NO: 130).
Согласно некоторым вариантам реализации настоящего изобретения подходящий внутриклеточный сигнальный домен содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или по меньшей мере приблизительно на 99% идентична по всей длине аминокислотной
последовательности RPRRSPAQDGKVYINMPGRG (SEQ ID NO: 130).
Примером сигнальной цепи CD28 является аминокислотная последовательность:
FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYA
PPRDFAAYRS (SEQ ID NO: 131).
Согласно некоторым вариантам реализации настоящего изобретения подходящий внутриклеточный сигнальный домен содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или по меньшей мере приблизительно на 99% идентична по всей длине аминокислотной последовательности
FWVLVVVGGVLACYSLLVTVAFIIFWVRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYA PPRDFAAYRS (SEQ ID NO: 131).
Внутриклеточные сигнальные домены, пригодные для применения в CAR согласно настоящему изобретению, включают полипептид ZAP70, например, полипептид, содержащий аминокислотную последовательность, которая по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98%, по меньшей мере приблизительно на 99% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 300 аминокислот до приблизительно 400 аминокислот, от приблизительно 400 аминокислот до приблизительно 500 аминокислот или от приблизительно 500 аминокислот до 619 аминокислот следующей аминокислотной последовательности:
MPDPAAHLPFFYGSISRAEAEEHLKLAGMADGLFLLRQCLRSLGGYVLSLVHDVRFHHF
PIERQLNGTYAIAGGKAHCGPAELCEFYSRDPDGLPCNLRKPCNRPSGLEPQPGVFDCLR
DAMVRDYVRQTWKLEGEALEQAIISQAPQVEKLIATTAHERMP WYHSSLTREEAERKL
YSGAQTDGKFLLRPRKEQGTYALSLIYGKTVYHYLISQDKAGKYCIPEGTKFDTLWQLV
EYLKLKADGLIYCLKEACPNSSASNASGAAAPTLPAHPSTLTHPQRRIDTLNSDGYTPEP
ARITSPDKPRPMPMDTSVYESPYSDPEELKDKKLFLKRDNLLIADIELGCGNFGSVRQGV
YRMRKKQIDVAIKVLKQGTEKADTEEMMREAQIMHQLDNPYIVRLIGVCQAEALMLV
MEMAGGGPLHKFLVGKREEIPVSNVAELLHQVSMGMKYLEEKNFVHRDLAARNVLLV
NRHYAKISDFGLSKALGADDSYYTARSAGKWPLKWYAPECINFRKFSSRSDVWSYGVT
MWEALSYGQKPYKKMKGPEVMAFIEQGKRMECPPECPPELYALMSDCWIYKWEDRPD
FLTVEQRMRACYYSLASKVEGPPGSTQKAEAACA (SEQ ID NO: 132).
В некоторых случаях CAR, идентифицированный путем скрининга библиотеки синтетических модульных полипептидов CAR или библиотеки нуклеиновых кислот,
кодирующих синтетические модульные полипептиды CAR, включая CAR, содержащий по меньшей мере один или два или более комодулирующих доменов, перечисленных в таблице 3 и таблице 4, может быть разделен на две полипептидные цепи, способные соединяться, в присутствии димеризатора, посредством домена димеризации, присутствующего в каждой цепи. Указанные расщепленные CAR являются условно активными и фармакологически индуцируемыми/подавляемыми, например, как те, которые описаны в РСТ публикации патентной заявки WO2014/127261, содержание которой полностью включено в настоящую заявку посредством ссылки.
Соответственно, в некоторых случаях, каждый полипептид расщепленного варианта CAR из CAR, идентифицированного путем скрининга библиотеки, описанной в настоящем документе, может содержать одну половину пары димеризации (также называемой парой, связывающей димеризатор). Неограничивающие примеры подходящих димеров (например, пар, связывающих димеризатор) включают, но не ограничиваются ими: а) РТС506-связывающий белок (FKBP) и FKBP; b) FKBP и каталитическая субъединица кальцинейрина А (СпА); с) FKBP и циклофилин; d) FKBP и FKBP-рапамицин-ассоциированный белок (FRB); е) гираза В (GyrB) и GyrB; f) дигидрофолатредуктаза (DHFR) и DHFR; g) DmrB и DmrB; h) PYL и ABI; i) Cry2 и CIB1; и j) GAI и GID1.
В некоторых случаях элемент димера (например, пары, связывающей димеризатор)
рассматриваемого CAR получен из FKBP. Например, подходящий элемент пары,
связывающий димеризатор, может содержать аминокислотную последовательность,
которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на
80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%,
по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или
100% идентична следующей аминокислотной последовательности:
MGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIR GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 78).
В некоторых случаях элемент пары, связывающей димеризатор, рассматриваемого CAR получен из каталитической субъединицы А кальцинейрина (также известной как РРРЗСА; CALN; CALNA; CALNA1; CCN1; CNA1; РРР2В; каталитическая субъединица CAM-PRP; кальцинейрин А альфа; кальмодулин-зависимая изоформа альфа-субъединицы кальцинейрина А; протеинфосфатаза 2В; каталитическая субъединица, альфа-изоформа и т.д.). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%,
по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности (домен РР2Ас):
LEESVALRIITEGASILRQEKNLLDIDAPVTVCGDIHGQFFDLMKLFEVGGSPANTRYLFL GDYVDRGYFSIECVLYLWALKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYSERVY DACMDAFDCLPLAALMNQQFLCVHGGLSPErNTLDDIRKLDRFKEPPAYGPMCDILWSD PLEDFGNEKTQEOTTHNTWGCSYFYSYPAVCEFLQHNNLLSILRAHEAQDAGYRMYR KSQTTGFPSLITIFSAPNYLDVYM4KAAVLKYENNVMNIRQFNCSPFIPYWLPNFM (SEQ ID NO: 79).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из циклофилина (также известного как циклофилин A; PPIA; CYPA; CYPH; РР1аза А и т.д.). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MVNPTVFFDIAVDGEPLGRVSFELFADKVPKTAENFRALSTGEKGFGYKGSCFHRIIPGF MCQGGDFTRHNGTGGKSIYGEKFEDENFILKHTGPGILSMANAGPNTNGSQFFICTAKTE WLDGKHVVFGKVKEGMNIVEAMERFGSRNGKTSKKITIADCGQLE (SEQ ID NO: 80).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из MTOR (также известного как с FKBP-рапамицин-ассоциированный белок; РК506-связывающий белок 12-рапамицин-ассоциированный белок 1; FK506-связывающий белок 12-рапамицин-ассоциированный белок 2; РК506-связывающий белок 12-ассоциированный с рапамициновым комплексом белок 1; FRAP; FRAP1; FRAP2; RAFT1; и RAPT1). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности (также известной как "Frb": Fbbp-рапамицин-связывающий домен):
MILWHEMWHEGLEEASRLYFGERNVKGMFEVLEPLHAMMERGPQTLKETSFNQAYGR DLMEAQEWCRKYMKSGNVKDLLQAWDLYYHVFRRISK (SEQ ID NO: 81).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из GyrB (также известного как субъединица В ДНК-гиразы). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 200 аминокислот (а.к.), от приблизительно 200 а.к. до приблизительно 300 а.к., от приблизительно 300 а.к. до приблизительно 400 а.к., от приблизительно 400 а.к. до приблизительно 500 а.к., от приблизительно 500 а.к. до приблизительно 600 а.к., от приблизительно 600 а.к. до приблизительно 700 а.к. или от приблизительно 700 а.к. до приблизительно 800 а.к. следующей аминокислотной последовательности GyrB из Escherichia coli (или последовательности субъединицы В ДНК-гиразы из любого организма):
MSNSYDSSSIKVLKGLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKE IIVTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGV GVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPSLETFT NVTEFEYEILAKM.RELSFLNSGVSIRLRDKM)GKIiDHFHYEGGIKAFVEYLNKNKTPIH PNIFWSTEKDGIGVEVALQWNDGFQENIYCFTNNIPQRDGGTHLAGFRAAMTRTLNAY MDKEGYSKKAKVSATGDDAREGLIAVVSVKVPDPKFSSQTKDKLVSSEVKSAVEQQM NELLAEYLLENPTDAKIVVGKIIDAARAREAARRAREMTRRKGALDLAGLPGKLADCQ ERDP AL SEL YL VEGD S AGGS AKQGRNRKNQ AILPLKGKILNVEK ARFDKML S S QE V ATL ITALGCGIGRDEYNPDKLRYHSIIIMTDADVDGSHIRTLLLTFFYRQMPEIVERGHVYIAQ PPLYKVKKGKQEQYIKDDEAMDQYQISIALDGATLHTNASAPALAGEALEKLVSEYNA TQKMINRMEPvRYPKAMLKIiLIYQPTLTEADLSDEQTVTRWWALVSELNDKEQHGSQ WKFDVHTNAEQNLFEPIVRVRTHGVDTDYPLDHEFITGGEYRRICTLGEKLRGLLEEDA FIERGERRQPVASFEQALDWLVKESRRGLSIQRYKGLGEMNPEQLWETTMDPESRRML RVTVKDAIAADQLFTTLMGDAVEPRRAFIEENALKAANIDI (SEQ ID NO: 82). В некоторых случаях элемент пары, связывающей димеризатор, содержит аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична аминокислотам 1-220 из вышеуказанной аминокислотной последовательности GyrB из Escherichia coli.
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из DHFR (также известного как дигидрофолатредуктаза, DHFRP1 и DYR). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKT WFSIPEKNRPLKGRTNLVLSRELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIV GGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLEKYKLLPEYPGVLSDVQEEKGI KYKFEVYEKND (SEQ ID NO: 83).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из DmrB-связывающего домена (т.е. домена гомодимеризации DmrB). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична следующей аминокислотной последовательности:
MASRGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKVDSSRDRNKPFKFMLGKQ EVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE (SEQ ID NO: 84).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка PYL (также известного как рецептор абсцизовой кислоты и RCAR). Например, элемент рассматриваемой пары, связывающей димеризатор, может быть получен из белков, например, белков Arabidopsis thaliana: PYR1, RCAR1(PYL9), PYL1, PYL2, PYL3, PYL4, PYL5, PYL6, PYL7, PYL8 (RCAR3), PYL10, PYL11, PYL 12, PYL13. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична любой из следующих аминокислотных последовательностей:
PYL10:
MNGDETKKVE SE У1КЮШ1ЛНЕЬ VE S QC S S TL VTfflIK APLHL VWSIVRRFDEPQK YKPFIS RCVVQGKKLEVGSVREVDLKSGLPATKSTEVLEILDDNEHILGIRIVGGDHRLKNYSSTI SLHSETIDGKTGTLAIESFVVDVPEGNTKEETCFFVEALIQCNLNSLADVTERLQAESME KKI (SEQ ID NO: 85). PYL11:
METSQKYHTCGSTLVQTIDAPLSLVWSILRRFDNPQAYKQFVKTCNLSSGDGGEGSVRE VTVVSGLPAEFSPvERLDELDDESHVMMISIIGGDHRLWYRSKTMAFVAADTEEKTVVV ESYVVDVPEGNSEEETTSFADTIVGFNLKSLAKLSERVAHLKL (SEQ ID NO: 86). PYL12:
MKTSQEQHVCGSTVVQTINAPLPLVWSILRRFDNPKTFKHFVKTCKLRSGDGGE GSVREVTVVSDLPASFSLEPvLDELDDESHVMVISIIGGDHRLVNYQSKTTVFVAAEEEKT VVVESYVVDVPEGNTEEETTLFADTIVGCNLRSLAKLSEKMMELT (SEQ ID NO: 87).
PYL13:
MES SKQKRCRS S VVETIEAPLPLVWSILRSFDKPQ AYQRF VKSCTMRSGGGGGK GGEGKGSVRDVTLVSGFPADFSTEPXEELDDESHVMVVSIIGGNHRLVNYKSKTKVVAS PEDMAKKTVVVESYVVDVPEGTSEEDTIFFVDNIIRYNLTSLAKLTKKMMK (SEQ ID NO: 88).
PYL1:
MANSESSSSPVNEEENSQRISTLHHQTMPSDLTQDEFTQLSQSIAEFHTYQLGNGR CSSLLAQRIHAPPETVWSVVRRFDRPQIYKHFIKSCNVSEDFEMRVGCTRDVNVISGLPA NTSRERLDLLDDDRRVTGFSITGGEHRLRNYKSVTTVHRFEKEEEEERIWTVVLESYVV DVPEGNSEEDTRLFADTVIRLNLQKLASITEAMNRNNNNNNSSQVR (SEQ ID NO: 89).
PYL2:
MSSSPAVKGLTDEEQKTLEPVIKTYHQFEPDPTTCTSLITQRIHAPASVVWPLIRRF DNPERYKHF VKRCRLIS GDGD VGS VRE VT VIS GLP AS T S TERLEF VDDDHRVL SFRV VG GEHRLKNYKSVTSVNEFLNQDSGKVYTVVLESYTVDIPEGNTEEDTKMFVDTVVKLNL QKLGV A AT S APMHDDE (SEQ ID NO: 90).
PYL3:
MM.APIHDPSSSSTTTTSSSTPYGLTKDEFSTLDSIIRTHHTFPRSPNTCTSLIAHRV DAPAHAIWRFVRDFANPNKYKHFIKSCTIRVNGNGIKEIKVGTIREVSVVSGLPASTSVEI LEVLDEEKmLSFRVLGGEHRLNNYRSVTSVNEFVVLEKDKKKRVYSVVLESYIVDIPQG NTEEDTRMFVDTVVKSNLQNLAVISTASPT (SEQ ID NO: 91).
PYL4:
MLAVHRPSSAVSDGDSVQIPMMIASFQKRFPSLSRDSTAARFHTHEVGPNQCCSA VIQEISAPISTVWSVVRRFDNPQAYKHFLKSCSVIGGDGDNVGSLRQVHVVSGLPAASST
ERLDILDDERHVISFSVVGGDHRLSNYRSVTTLHPSPISGTVVVESWVDWP CDFVDVIVRCNLQSLAKIAENTAAESKKKMSL (SEQ ID NO: 92). PYL5:
MRSPVQLQHGSDATNGFHTLQPHDQTDGPIKRVCLTRGMHWEHVAMHHTHD VGPDQCCSSVVQMIHAPPESWALVRRFDNPKVYKNFIRQCRIVQGDGLHVGDLREVM VVSGLPAVSSTERLEILDEERHVISFSVVGGDHRLKNYRSVTTLHASDDEGTVVVESYIV DVPPGNTEEETLSFVDTIVRCNLQSLARSTNRQ (SEQ ID NO: 93).
PYL6:
MPTSIQFQRSSTAAEAANATVRNYPHHHQKQVQKVSLTRGMADVPEHVELSHT HVVGPSQCFSVVVQDVEAPVSTVWSILSRFEHPQAYKHFVKSCHVVIGDGREVGSVREV RVVSGLPAAFSLERLEIMDDDRHVISFSVVGGDHRLMNYKSVTTVHESEEDSDGKKRTR VVESYVVDVPAGNDKEETCSFADTIVRCNLQSLAKLAENTSKFS (SEQ ID NO: 94).
PYL7:
MEMIGGDDTDTEMYGAL VT AQ SLRERHLHHCRENQCT S VL VKYIQ AP VHL VWS LVRRFDQPQKYKPFISRCTVNGDPEIGCLREVNVKSGLPATTSTERLEQLDDEEHILGINII GGDHRLKNYSSILTVHPEMIDGRSGTMVMESFVVDVPQGNTKDDTCYFVESLIKCNLKS LACVSERLAAQDITNSIATFCNASNGYREKNHTETNL (SEQ ID NO: 95).
PYL8:
MEANGIENLTNPNQEREFIRRHHKHELVDNQCSSTLVKHINAPVHIVWSLVRRFD QPQKYKPFISRCVVKGNMEIGTVREVDVKSGLPATRSTERLELLDDNEHILSIRIVGGDH RLKNYSSIISLHPETIEGRIGTLVIESFVVDVPEGNTKDETCYFVEALIKCNLKSLADISERL AVQDTTESRV (SEQ ID NO: 96).
PYL9:
MMDGVEGGTAMYGGLETVQYVRTHHQHLCRENQCTSALVKHIKAPLHLVWSL VRRFDQPQKYKPFVSRCTVIGDPEIGSLREVNVKSGLPATTSTERLELLDDEEHILGIKIIG GDHRLKNYSSILTVHPEIIEGRAGTMVIESFVVDVPQGNTKDETCYFVEALIRCNLKSLA DVSERLASQDITQ (SEQ ID NO: 97).
PYRl:
MPSELTPEERSELKNSIAEFHTYQLDPGSCSSLHAQRIHAPPELVWSIVRRFDKPQ TYKHFIKSCSVEQNFEMRVGCTRDVIVISGLPANTSTERLDILDDERRVTGFSIIGGEHRL TNYKSVTTVHRFEKENMWTVVLESYVVDMPEGNSEDDTRMFADTVVKLNLQKLATV AEAMARNSGDGSGSQVT (SEQ ID NO: 98).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка ABI (также известного как нечувствительный к абсцизовой кислоте белок). Например, элемент рассматриваемой пары, связывающей димеризатор, может
быть получен из белков, таких как белки Arabidopsis thaliana: АВП (также известный как нечувствительный к абсцизовой кислоте белок 1, протеинфосфатаза 2С 56, AtPP2C56, Р2С56 и РР2С АВП) и/или ABI2 (также известный как Р2С77, протеинфосфатаза 2С 77, AtPP2C77, нечувствительный к абсцизовой кислоте белок 2, протеинфосфатаза 2С ABI2 и РР2С ABI2). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей: АВП:
MEEVSPAIAGPFRPFSETQMDFTGIRLGKGYCNNQYSNQDSENGDLMVSLPETSSCSVSG SHGSE SRKVLI SRWSPNLNMKE S A AADIV V VDIS AGDEINGSDIT SEKKMISRTE SRSLFE FKSVPLYGFTSICGRRPEMEDAVSTIPRFLQSSSGSMLDGRFDPQSAAHFFGVYDGHGGS QVANYCRERMHLALAEEIAKEKPMLCDGDTWLEKWKKALFNSFLRVDSEIESVAPETV GST S VVAVVFP SHIF VANCGD SRAVLCRGKT ALPL S VDHKPDREDE AARIE AAGGKVIQ WNGARVFGVLAMSRSIGDRYLKPSIIPDPEVTAVKRVKEDDCLILASDGVWDVMTDEE ACEMARKWLLWHKKNAVAGDASLLADERRKEGKDPAAMSAAEYLSKLAIQRGSKDN ISVVVVDLKPRRKLKSKPLN (SEQ ID NO: 99). ABi2:
MDE VSP AV AVPFRPFTDPH AGLRGYCNGE SRVTLPE S S С S GDGAMKD S SFEINTRQD SL
T S S S S AMAGVDIS AGDEINGSDEFDPRSMNQ SEKKVL SRTESRSLFEFKC VPL YGVT SICG
RRPEMEDS VSTIPRFLQ VS S S SLLDGRVTNGFNPHLS AHFFGVYDGHGGSQ VANYCRER
MHLALTEEIVKEKPEFCDGDTWQEKWKKALFNSFMRVDSEIETVAHAPETVGSTSVVA
VVFPTHIFVANCGDSRAVLCRGKTPLALSVDHKPDRDDEAARIEAAGGKVIRWNGARV
FGVLAMSRSIGDRYLKPSVIPDPEVTSVPvRVKEDDCLILASDGLWDVMTNEEVCDLARK
MLLWHKKNAMAGEALLPAEKRGEGKDPAAMSAAEYLSKMALQKGSKDNISVVVVDL
KGIRKFKSKSLN (SEQ ID NO: 100).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка Сгу2 (также известного как криптохром 2). Например, элемент рассматриваемого димера (например, пары, связывающей димеризатор) может быть получен из белков Сгу2 из любого организма (например, растения), такого как, но не ограничиваясь ими, Arabidopsis thaliana. Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:
Cry2 (Arabidopsis thaliana) MKMDKKTIVWFRRDLRIEDNPALAAAAHEGSVFPVFIWCPEEEGQFYPGRASRWWMK Q SL AHL S Q SLK ALGSDLTLIKTHNTIS AILD CIRVTGATK V VFNHL YDP VSL VRDHT VICE KLVERGISVQSYNGDLLYEPWEIYCEKGKPFTSFNSYWKKCLDMSIESVMLPPPWRLMP IT AAAEAIWACSIEELGLENEAEKPSNALLTRAWSPGWSNADKLLNEFIEKQLID YARNS KKVVGNSTSLLSPYLHFGEISVRHVFQCARMKQIIWARDKNSEGEESADLFLRGIGLREY SRYICFNFPFTHEQSLLSHLRFFPWDADVDKFKAWRQGRTGYPLVDAGMRELWATGW MHNRIRVIVSSFAVKFLLLPWKWGMKYFWDTLLDADLECDILGWQYISGSIPDGHELDR LDNPALQGAKYDPEGEYIRQWLPELARLPTEWIHHPWDAPLTVLKASGVELGTNYAKPI VDIDTARELLAKAISRTREAQIMIGAAPDEIVADSFEALGANTIKEPGLCPSVSSNDQQVP SAVRYNGSKRVKPEEEEERDMKKSRGFDERELFSTAESSSSSSVFFVSQSCSLASEGKNL EGIQDSSDQITTSLGKNGCK (SEQ ID NO: 101)
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка CIB1 Arabidopsis thaliana (также известного как транскрипционный фактор ЬНЬНбЗ). Например, подходящий элемент димера (например, пары, связывающий
димеризатор) может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. следующей аминокислотной последовательности: MNGAIGGDLLLNFPDMSVLERQRAHLKYLNPTFDSPLAGFFADSSMITGGEMDSYLSTA GLNLPMMYGETTVEGDSPXSISPETTLGTGNFKKRKFDTETKDCNEKKKKMTMNRDDL VEEGEEEKSKITEQNNGSTKSIKKMKHKAKKEENNFSNDSSKVTKELEKTDYIHVRARR GQATDSHSIAERVRREKISERMKFLQDLVPGCDKITGKAGMLDEirNYVQSLQRQIEFLS MKLAIVNPP^DFDMDDIFAKIiVASTPMTVWSPEMVLSGYSHEMVHSGYSSEMVNSGY LHVNPMQQVNTSSDPLSCFNNGEAPSMWDSHVQNLYGNLGV (SEQ ID NO: 102).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка GAI Arabidopsis thaliana (также известного как нечувствительный к гибберелловой кислоте белок и белок GAI семейства DELL А). Например, подходящий элемент пары, связывающий димеризатор, может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к.
следующей аминокислотной последовательности:
MKRDHHHHHHQDKKTMMMNEEDDGNGMDELLAVLGYKWSSEMADVAQKLEQL^
MMSNVQEDDLSQLATETVHYNPAELYTWLDSMLTDLNPPSSNAEYDLKAIPGDAILNQ
FAIDSASSSNQGGGGDTYTTNKRLKCSNGVVETTTATAESTRHVVLVDSQENGVRLVH
ALLACAEAVQKENLTVAEALVKQIGFLAVSQIGAMRKVATYFAEALARWYRLSPSQSPI
DHSLSDTLQMHFYETCPYLKFAHFTANQAILEAFQGKKRVHVIDFSMSQGLQWPALMQ
ALALRPGGPPWRETGIGPPAPDNFDYLHEVGCKLAHLAEAIHVEFEYRGFVANTLADL
DASMLELRPSEIESVAWSVFELHKLLGRPGAIDKVLGVVNQIKPEIFTVVEQESNHNSPI
FLDRFTE SLH Y YS TLFD SLEGVP S GQDK VMSE V YLGKQICN V V ACD GPDRVERFFETL S Q
WRNPvFGSAGFAAAHIGSNAFKQASMLLALFNGGEGYRVEESDGCLMLGWHTRPLIATS
AWKLSTN (SEQ ID NO: 103).
В некоторых случаях элемент димера (например, пары, связывающей димеризатор) получен из белка GID1 Arabidopsis thaliana (также известного как рецептор гибберелловой кислоты GID1). Например, подходящий элемент димера может содержать аминокислотную последовательность, которая по меньшей мере приблизительно на 75%, по меньшей мере приблизительно на 80%, по меньшей мере приблизительно на 85%, по меньшей мере приблизительно на 90%, по меньшей мере приблизительно на 95%, по меньшей мере приблизительно на 98% или 100% идентична непрерывному участку аминокислотной последовательности от приблизительно 100 аминокислот до приблизительно 110 аминокислот (а.к.), от приблизительно 110 а.к. до приблизительно 115 а.к., от приблизительно 115 а.к. до приблизительно 120 а.к., от приблизительно 120 а.к. до приблизительно 130 а.к., от приблизительно 130 а.к. до приблизительно 140 а.к., от приблизительно 140 а.к. до приблизительно 150 а.к., от приблизительно 150 а.к. до приблизительно 160 а.к., от приблизительно 160 а.к. до приблизительно 170 а.к., от приблизительно 170 а.к. до приблизительно 180 а.к., от приблизительно 180 а.к. до приблизительно 190 а.к. или от приблизительно 190 а.к. до приблизительно 200 а.к. любой из следующих аминокислотных последовательностей:
GID1A:
MAASDEVNLIESRTVVPLNTWVLISNFKVAYNILRRPDGTFNRHLAEYLDRKVTANANP VDGWSFDVLIDPvRINLLSRVYRPAYADQEQPPSILDLEKPVDGDIVPVILFFHGGSFAHS SANSAIYDTLCRRLVGLCKCVVVSVNYRRAPENPYPCAYDDGWIALNWVNSRSWLKS KKD SKVHIFL AGD S S GGNIAHN V ALR AGE S GID VLGNILLNPMF GGNERTE SEKSLDGK YFVTVRDRDWYWKAFLPEGEDREHPACNPFSPRGKSLEGVSFPKSLVVVAGLDLIRDW QLAYAEGLKKAGQEVKLMHLEKATVGFYLLPNNNHFHNVMDEISAFVNAEC (SEQ ID NO: 104).
GID1B:
MAGGNEVNLNECKRIVPLNTWVLISNFKLAYKVLRRPDGSFNRDLAEFLDRKVPANSFP LDGVFSFDHVDSTTNLLTRIYQPASLLHQTRHGTLELTKPLSTTEIVPVLIFFHGGSFTHSS ANSAIYDTFCREEVTICGVVVVSVDYRRSPEHRYPCAYDDGWNALNWVKSRVWLQSG KD SNVYVYL AGD S SGGNIAHNV AVRATNEGVKVLGNILLHPMFGGQERTQ SEKTLDGK YFVTIQDRDWYWRAYLPEGEDRDHPACNPFGPRGQSLKGVNFPKSLVVVAGLDLVQD WQLAYVDGLKKTGLEVNLLYLKQATIGFYFLPNNDHFHCLMEELNKFVHSIEDSQSKSS PVLLTP (SEQ ID NO: 105). GID1C:
MAGSEEVNLIESKTVWLNTWVLISNFKLAYmLRRPDGTFNPvHLAEFLDRKVPANANP
VNGVFSFDVIIDRQTNLLSRVYRPADAGTSPSITDLQNPVDGEIVPVIVFFHGGSFAHSSA
NS AIYDTLCRRL VGLCGAVVVS VNYRRAPENRYPC AYDDGW AVLKWVNS S SWLRSKK
DSKVWFLAGDSSGGNIVmVAVRAVESRIDVLGNILLNPMFGGTERTESEKRLDGKYFV
TVRDRDWYWRAFLPEGEDREHPACSPFGPRSKSLEGLSFPKSLVVVAGLDLIQDWQLK
YAEGLKKAGQEVKLLYLEQATIGFYLLPNNNHFHTVMDEIAAFVNAECQ (SEQ ID NO:
106).
Как легко понять, CAR, идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, или библиотеки синтетических модульных полипептидов CAR, может быть модифицирован, например, путем добавления одного или более доменов (например, комодулирующих доменов), путем удаления одного или более доменов (например, путем удаления флуоресцентного репортера, используемого в процессе скрининга), путем разделения CAR на два полипептида (и добавления доменов димеризации), путем перегруппировки доменов и т.д.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, связанного с клеточным ответом на конкретную клеточную среду. В этой связи клеточный фенотип может быть определен по ответу клетки (например, на основании активации или ингибирования) на воздействие определенной среды. Например, ответ Т-клеток можно оценить в ответ на воздействие конкретной клеточной среды. Согласно некоторым вариантам реализации настоящего изобретения ингибирование Т-клеток можно оценить в ответ на воздействие микроокружения опухоли.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, связанного с локализацией клеток, например, под влиянием хоуминга или нацеливания на клетку. Следовательно, может быть проведен скрининг, чтобы определить влияние элементов библиотеки на нацеливание на клетку. Например,
клеточная библиотека может быть введена в организм-хозяина, и клетки библиотеки могут быть выделены из целевого положения организма-хозяина через некоторое время, чтобы оценить, какие клетки были успешно направлены к целевому положению. В некоторых случаях Т-клетки могут быть количественно исследованы, чтобы определить их нацеливание на опухоль в условиях in vivo.
В некоторых случаях библиотека может быть подвергнута скринингу для определения фенотипа, специфичного для состояния пациента. Специфичные для пациента состояния, подвергнутые скринингу указанным способом, будут сильно различаться и могут включать состояния, связанные с конкретным патологическим состоянием пациента, и могут включать скрининг библиотеки для идентификации конкретного элемента(ов) библиотеки, проявляющего усиленный или оптимальный фенотип, специфичный для состояния пациента. В некоторых случаях локализация элементов клеточной библиотеки может быть оценена после контакта с эксплантом или ксенотрансплантатом, полученным от пациента. Например, локализация Т-клеток клеточной библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В некоторых случаях пролиферация элементов клеточной библиотеки может быть оценена после контакта с эксплантом или ксенотрансплантатом, полученным от пациента. Например, пролиферация Т-клеток клеточной библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В некоторых случаях специфичный для пациента эксплантат или ксенотрансплантат может быть количественно исследован для определения увеличения или уменьшения жизнеспособности после контакта с клеточной библиотекой или конкретными элементами клеточной библиотеки. Например, гибель Т-клеток библиотеки Т-клеток, экспрессирующих CAR, может быть оценена после контакта с ксенотрансплантатом опухоли, специфичной для пациента. В этой связи библиотека может быть подвергнута скринингу для идентификации оптимального элемента(ов) библиотеки для лечения конкретного пациента.
В некоторых случаях фенотипы могут быть количественно исследованы в условиях in vitro с помощью динамической иммунизации антигеном. Под динамической иммунизацией антигеном подразумевают, что фенотип оценивают не только для определения присутствия или отсутствия антигена, и, следовательно, антиген может динамически варьироваться, например, динамически варьироваться в диапазоне концентраций, динамически варьироваться в течение определенного периода времени и т.д. Например, уровни антигена могут быть протитрованы (например, с использованием
различных концентраций), чтобы оценить фенотип, который подвергают скринингу, при различных дозах, т.е. для оценки ответа в зависимости от дозы. Антиген может быть представлен в разных концентрациях любым удобным способом. В качестве неограничивающего примера различные количества антигена могут быть представлены с использованием клеток, экспрессирующих антиген на разных уровнях, включая диапазон уровней. В некоторых случаях время применения антигена можно динамически варьировать, например, чтобы оценить фенотип в количественном исследовании в зависимости от времени или оценить кинетику фенотипа, который подвергают скринингу.
В некоторых случаях библиотека может быть подвергнута скринингу для определения отличительной черты фенотипа. В настоящей заявке термин "отличительная черта фенотипа" обычно относится к комбинации отдельных фенотипов. Например, в некоторых случаях клетка может иметь отличительную черту фенотипа, которая включает определенную морфологию в сочетании с экспрессией конкретного маркера. Отличительная черта фенотипа может сочетать фенотипы с аналогичными или различными фенотипическими категориями, например, отличительная черта фенотипа может включать экспрессию двух связанных, но разных маркеров клеточной поверхности, или отличительная черта фенотипа может включать экспрессию маркера клеточной поверхности и маркера клеточной пролиферации, или отличительная черта фенотипа может включать экспрессию маркера клеточной поверхности и конкретного секретируемого маркера (например, цитокина), или отличительная черта фенотипа может включать экспрессию двух разных цитокинов и т.д. Любой подходящий фенотип, включая тот, который описан в настоящем документе, можно применять в качестве компонента отличительной черты фенотипа.
Идентификация синтетических модульных полипептидов, связанных с фенотипом В настоящем изобретении предложены способы идентификации элементов библиотеки, которые связаны с определенным детектируемым фенотипом. Не желая быть связанными соответствием какой-либо теории, авторы настоящего изобретения полагают, что скоординированная сборка каждого мультимодульного синтетического полипептида наряду с каждой соответствующей многозвенной нуклеиновой последовательностью-штрихкодом обеспечивает сборку и последующую идентификацию каждого уникального синтетического модульного полипептида. Как описано выше, область нуклеиновой последовательности-штрихкода каждой нуклеиновой кислоты, кодирующей синтетический модульный полипептид, обеспечивает не только идентичность отдельных модулей, которые составляют каждый синтетический модульный полипептид, но также специфичное расположение (именуемое в настоящем документе как архитектура)
модулей. Следовательно, идентичность и архитектура каждого элемента библиотеки могут быть определены путем секвенирования области нуклеиновой последовательности-штрихкода.
Соответственно, скрининг библиотеки не обязательно должен быть выполнен с использованием физически разделенных элементов библиотеки, и элементы библиотеки можно объединять и подвергать скринингу одновременно. Объединение элементов библиотеки может быть выполнено в условиях in vitro, например, в пробирке или в образце клеток, выделенных из соответствующего организма, или в условиях in vivo, у животного или в ткани. После одновременного скрининга элементы библиотеки и/или их модули, связанные с фенотипом, могут быть идентифицированы путем идентификации и/или количественной оценки связанной области нуклеиновой последовательности-штрихкода. В некоторых случаях объединенный скрининг позволяет проводить скрининг большого количества уникальных элементов библиотеки, что нецелесообразно с помощью стандартного последовательного или параллельного скрининга. Количество уникальных элементов библиотеки, которые могут быть подвергнуты скринингу для определения фенотипа, будет зависеть от размера и сложности библиотеки и, следовательно, может варьироваться в диапазоне от 96 или менее до миллионов и более, включая, но не ограничиваясь перечисленными, например, 100 или более, 200 или более, 300 или более, 400 или более, 500 или более, 1000 или более, 2000 или более, 3000 или более, 4000 или более, 5000 или более, 6000 или более, 7000 или более, 8000 или более, 9000 или более, 10000 или более, 20000 или более, 30000 и более, 40000 и более, 50000 и более, 60000 и более, 70000 и более, 80000 или более, 90000 и более, 100000 и более и т.д.
В некоторых случаях количество или частота конкретной нуклеиновой последовательности-штрихкода может быть измерена для идентификации наиболее представленного модуля. Например, частота каждой нуклеиновой последовательности-штрихкода может быть количественно определена в объединенном образце, содержащем элементы библиотеки и связанные с ней нуклеиновые кислоты, кодирующие элементы библиотеки, так, что нуклеиновые последовательности-штрихкоды с наибольшей частотой обеспечат идентификацию тех модулей, которые наиболее представлены в образце. Согласно некоторым вариантам реализации настоящего изобретения такие образцы могут представлять собой клеточные образцы.
В некоторых случаях количество или частота конкретной многозвенной нуклеиновой последовательности-штрихкода (например, области последовательности-штрихкода) может быть измерена для идентификации наиболее представленного модульного полипептида. Например, частота каждой многозвенной нуклеиновой
последовательности-штрихкода может быть количественно определена в объединенном образце, содержащем элементы библиотеки и связанные с ней нуклеиновые кислоты, кодирующие элементы библиотеки, так, что многозвенные нуклеиновые последовательности-штрихкоды с наибольшей частотой обеспечивают идентификацию указанных модульных полипептидов, наиболее представленных в образце. Согласно некоторым вариантам реализации настоящего изобретения указанные образцы могут представлять собой клеточные образцы.
В некоторых случаях детектирование фенотипа и идентификация элементов библиотеки и их компонентов могут быть выполнены как часть интегрированного способа. Например, в некоторых случаях, фенотип можно детектировать методом проточной цитометрии, и элементы библиотеки могут быть идентифицированы с помощью секвенирования. Указанные интегрированные способы могут быть выполнены в комбинации с количественными исследованиями в условиях in vitro и/или in vivo, например, как показано на Фиг. 24, где FLOW-Seq используется как неограничивающий пример интегрированного способа.
В настоящей заявке термин "FLOW-seq" обычно относится к комбинации способов сортировки с помощью проточной цитометрии (например, FACS) с методами секвенирования (например, секвенирования следующего поколения) в одном связанном рабочем процессе. Любой удобный и подходящий способ сортировки с помощью проточной цитометрии и любой удобный и подходящий способ секвенирования можно применять в указанном методе FLOW-Seq. Например, в некоторых случаях, клеточная библиотека, экспрессирующая синтетические модульные полипептиды, содержащие нуклеиновые последовательности-штрихкоды, описанная в настоящем документе, может быть количественно исследована для определения фенотипа методом проточной цитометрии, и те клетки, которые имеют конкретный фенотип, могут быть отсортированы, и их нуклеиновые последовательности-штрихкоды впоследствии секвенированы для идентификации конкретных элементов библиотеки и/или для количественного определения частоты отдельных элементов библиотеки и/или их модулей, экспрессируемых в отсортированных клетках. Сортировка может быть выполнена любым удобным и подходящим способом, включая, например, сортировку в одну или более групп на основании фенотипа, детектированного с помощью проточной цитометрии. После сортировки секвенирование может быть выполнено непосредственно на отсортированном образце и/или отсортированной клетке, или отсортированный образец и/или отсортированная клетка может быть размножена и/или культивирована перед сортировкой, например, для увеличения количества копий нуклеиновых кислот,
кодирующих элементы библиотеки. Способы FLOW-seq были использованы, например, для фенотипического измерения уровней белка и идентификации родственных генетических элементов в бактериях (см., например, Kosuri et al. Proc Natl Acad Sci USA (2013) 110(34): 14024-9 и Goodman et al. Science (2013) 342(6157):475-479), помимо этого секвенирование комбинировали с проточной цитометрией для корреляции Т-клеток, отсортированных на основании их функции, с соответствующими им секвенированными генами рецепторов Т-клеток (см., например, Han et al. Nature Biotechnology (2014) 32:684692).
В некоторых случаях идентификация синтетического модульного полипептида, связанного с конкретным фенотипом, может включать хирургическое выделение ткани или органа из модели in vivo, в которую была введена библиотека. Например, в некоторых случаях, после периода времени, достаточного для проведения количественного исследования, орган или ткань могут быть выделены из животного-хозяина, и нуклеиновые кислоты, присутствующие в органе или ткани, могут быть секвенированы для идентификации отдельных элементов библиотеки, присутствующих в органе или ткани. В других случаях нуклеиновая кислота, выделенная из органа или ткани или животного-хозяина, может быть количественно определена, включая полуколичественную оценку, секвенирована для количественного определения относительной частоты или присутствия конкретного элемента библиотеки в органе или ткани. В других случаях нуклеиновая кислота, выделенная из органа или ткани или животного-хозяина, может быть количественно определена, включая полуколичественную оценку, секвенирована для количественного определения относительной частоты или присутствия конкретного модуля в органе или ткани.
В некоторых случаях, например, когда конкретный модуль высоко представлен после полуколичественной оценки или отдельный модуль идентифицирован как способствующий желательному фенотипу, может быть выполнен следующий раунд сборки новой библиотеки, в котором идентифицированный модуль включен во все вновь созданные элементы библиотеки (т.е. идентифицированный вариабельный модуль используется впоследствии как невариабельный модуль), и вновь созданную библиотеку подвергают скринингу для идентификации дополнительных модулей, которые влияют на фенотип совместно с первоначально идентифицированным модулем. Специалист в данной области техники легко поймет, в каких случаях итеративная сборка и скрининг библиотеки могут быть выполнены для развития библиотек и отдельных элементов библиотеки с желательными фенотипами.
122 ПРИМЕРЫ
Следующие примеры приведены, чтобы предоставить специалистам в данной области техники полное описание настоящего изобретения, а также описание способов получения и применения настоящего изобретения, и не предназначены для ограничения объема настоящего изобретения согласно мнению авторов настоящего изобретения, также авторы настоящего изобретения не подразумевают, что эксперименты, приведенные ниже, представляют собой все или единственные эксперименты, которые были выполнены. Были предприняты усилия для обеспечения точности в отношении используемых чисел (например, количеств, температуры и т.д.), однако следует учитывать некоторые экспериментальные ошибки и отклонения. Если не указано иное, части представляют собой части по массе, молекулярная масса представляет среднюю молекулярную массу, температура представлена в градусах Цельсия и давление соответствует или приблизительно равно атмосферному давлению. Могут быть использованы стандартные аббревиатуры, например, п.о., пара (пары) оснований; тыс.п.о., тысяча (тысячи) пар оснований; пл, пиколитр (пиколитры); с или сек., секунда (секунды); мин, минута (минуты); ч или час, часы; а.к., аминокислота (аминокислоты); тыс.п.о., тысяча (тысячи) пар оснований; п.о., пара (пары) оснований; нук., нуклеотид (нуклеотиды); в/м, внутримышечный (внутримышечно); в/б, внутрибрюшинный (внутрибрюшинно); п/к, подкожный (подкожно); и т.п.
Пример 1: Конструирование и скрининг модульных библиотек комодулирующих доменов
Для получения фрагментов нуклеиновых кислот, кодирующих модули, содержащих нуклеиновые последовательности-штрихкоды, которые содержат необходимые элементы для конструирования библиотеки, нуклеиновые кислоты, кодирующие полипептидные модули (т.е. комодулирующие домены (т.е. костимулирующие или коингибирующие домены)), субклонировали в вектор для клонирования, подходящий для секвенирования и расщепления ферментами рестрикции типа IIS. После субклонирования вектор содержал: последовательность, кодирующую модуль, оптимальные линкерные последовательности Gly/Ser, фланкирующие последовательность, кодирующую модуль, специфичную для модуля нуклеиновую последовательность-штрихкод, подходящие для клонирования 3'-концевые гомологичные плечи, фланкирующие специфичную для модуля последовательность-штрихкод, сайт рестрикции BamHI между кодирующей модуль последовательностью и специфичной для модуля последовательностью-штрихкодом и сайты ферментов рестрикции типа IIS на 5'-конце кодирующей модуль последовательности и на 3'-конце последовательности
штрихкода, специфичной для модуля (Фиг. 1). Субклонированные векторные вставки секвенировали для подтверждения идентичности вставленных комодулирующих доменов. Комодулирующие домены, используемые в данной комбинаторной библиотеке, и соответствующие им последовательности белка представлены в таблице 1.
Векторы для клонирования, содержащие кодирующую модуль последовательность, содержащую нуклеиновую последовательность-штрихкод, расщепляли с использованием фермента рестрикции типа IIS для высвобождения нуклеиновых кислот "с оптимальной последовательностью", кодирующих каждый полипептидный модуль (Фиг. 2). Представлен пример части вектора для клонирования, содержащей описанные элементы и последовательность, кодирующую костимулирующий домен CD28, до и после расщепления ферментом рестрикции типа IIS (Фиг. 3), который представляет общую конфигурацию каждой модульной плазмиды/фрагмента, использованных при конструировании библиотеки.
Вектор экспрессии (т.е. лентивирусный упаковочный вектор pHR (также называемый вектор-реципиент)) получали путем расщепления 3'-конца промотора вируса некроза селезенки (pSFFV) ферментом рестрикции в сайте BamHI Конструкции элементов библиотеки собирали поэтапно (Фиг. 5). Клонирование In-Fusion(r) сначала использовали для вставки в вектор экспрессии последовательности, кодирующей одноцепочечный вариабельный фрагмент (scFv) и трансмембранные (ТМ) домены (scFV-ТМ), общие для всех элементов библиотеки. Реакционную смесь In-Fusion(r) трансформировали в компетентные клетки Е. coli. Трансформированные клетки высаживали. Колонии отбирали и получали минипрепараты для экстракции ДНК, чтобы выделить сконструированную плазмиду. После успешного конструирования плазмиды для экспрессии, содержащей scFV-TM, каждый последовательный компонент многомодульного полипептида, включая репортер EGFP, вставляли в направлении 3'-конца относительно предыдущего компонента на отдельных стадиях в соответствии с Фиг. 5. Каждая стадия включала расщепление с помощью BamHI и сборку In-Fusion(r) с последующей трансфекцией реакционной смеси In-Fusion(r), отбор колонии и очистку плазмиды.
Как показано на Фиг. 5, каждый готовый элемент библиотеки заключительной реакции In-Fusion(r) содержал общий scFV-TM, соединенный со специфичной для элемента комбинацией двух комодулирующих доменов, соединенных с общим репортером (CD3z-EGFP), и пару специфичных для модуля нуклеиновых последовательностей-штрихкодов в обратной ориентации относительно комодулирующих доменов. Нуклеиновые последовательности-штрихкоды фланкировали сайтами связывания праймеров,
обеспечивающими амплификацию и/или секвенирование конкретной комбинации нуклеиновых последовательностей-штрихкодов, соответствующей комбинации комодулирующих доменов, специфичных для элементов библиотеки.
После завершения конструирования последней плазмиды для библиотеки отдельные элементы библиотеки трансфицировали в клетки НЕК-293, и лентивирусные частицы получали стандартными способами. Полученный лентивирус использовали для инфицирования Т-клеток, чтобы получить модифицированные иммунные клетки, экспрессирующие многомодульные полипептиды.
Модифицированные иммунные клетки сортировали методом проточной цитометрии на основании экспрессии репортера EGFP. Сортировку проводили для выделения популяции модифицированных клеток с одинаковыми уровнями экспрессии. Сортированные клетки с одинаковыми уровнями экспрессии многомодульных полипептидов использовали для последующих этапов функционального скрининга.
Данную общую стратегию использовали для создания четырех отдельных библиотек. Конструировали одномерные библиотеки (т.е. каждый элемент библиотеки содержал один комодулирующий домен) и двумерные библиотеки (т.е. каждый элемент библиотеки содержал два комодулирующих домена). Элементы двумерных библиотек собирали в соответствии с общей схемой, представленной на Фиг. 6. Четыре библиотеки и соответствующие им этапы скрининга были следующими:
1) Конструировали одномерную библиотеку из 20 элементов и использовали для проверки возможности количественного исследования функции Т-клеток с помощью FLOWseq. Каждый элемент библиотеки конфигурировали так, чтобы он содержал домен CD8, гибридизованный с модулем комодулирующего домена, гибридизованным с доменом CD3Z. Модифицированные Т-клетки распределяли на группы в соответствии с экспрессией ими репортера с помощью проточной цитометрии, и библиотеку подвергали скринингу для измерения дозозависимого ответа активации Т-клеток (CD69) на связанные с планшетом антигены.
2) Конструировали одномерную С019-специфичную библиотеку из 62 элементов и подвергали скринингу в мышиной модели опухоли в условиях in vivo. Каждый элемент библиотеки конфигурировали так, чтобы он содержал С019-специфичный домен, гибридизованный с модулем комодулирующего домена, гибридизованного с доменом CD3Z, который был гибридизован с репортером EGFP.
3) Конструировали двумерную библиотеку, состоящую из 62x62 элементов. Каждый элемент библиотеки содержал С019-специфичный домен, гибридизованный с первым модулем комодулирующего домена, гибридизованным со вторым модулем
1)
комодулирующего домена, гибридизованным с доменом CD3Z, гибридизованным с репортером EGFP.
4) Конструировали одномерную мезотелин-специфичную библиотеку из 62 элементов. Каждый элемент библиотеки содержал мезотелин-специфичный домен, гибридизованный с доменом комодулирующего модуля, гибридизованным с доменом CD3Z, гибридизованным с репортером EGFP.
Объединенную одномерную СХ)19-специфичную библиотеку из 62 элементов подвергали функциональному скринингу для идентификации альтернативных комодулирующих последовательностей в химерных антигенных рецепторах (CAR). Каждый элемент библиотеки содержал С019-специфичный scFv, который указывает на целевой антиген раковых клеток, один из модулей комодулирующих доменов, перечисленных в таблице 1, и первичный сигнальный домен CD3Z (Фиг. 7).
После антигенной стимуляции (при концентрации антигена 32 нг/мл, 125 нг/мл и 1000 нг/мл) модифицированных Т-клеток объединенной библиотеки, Т-клетки функционально сортировали методом проточной цитометрии на группы "высокой" или "низкой" стимуляции на основании экспрессии CD69 (Фиг. 8). Относительное обогащение специфичных последовательностей-штрихкодов, соответствующих индивидуальным комодулирующим доменам, определяли количественно в клетках с высокой и низкой стимуляцией путем секвенирования (при концентрации антигена 1000 нг/мл) (Фиг. 9). Данный подход позволил сравнить стимулирующий и ингибирующий эффект каждого комодулирующего домена в CD19-CDЗZ-cпeцифичныx CAR и в отношении конкретной использованной антигенной стимуляции. Например, результаты скрининга дополнительно анализировали при разных уровнях вносимого антигена, что позволило быстро оценить зависимый от дозы ответ отдельных комодулирующих доменов (Фиг. 10).
Пример 2: Подтверждение полной сборки двумерной библиотеки из 61x61 элементов
Шестьдесят один вариабельный модуль CAR (таблица 2, представленная на Фиг. 25) собирали в библиотеку нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, кодирующих двумерные (2D) синтетические модульные полипептиды CAR, с помощью вложенной сборки. Библиотеку глубоко секвенировали с помощью метода секвенирования посредством синтеза (SBS) с использованием системы MiSeq (Illumina Inc., Хейворд, Калифорния, США) и определяли количество считываний каждого элемента собранной библиотеки (Фиг. 26).
Из всего 3721 возможного элемента библиотеки (т.е. вариантов CAR) все
возможные элементы библиотеки детектировали путем секвенирования с максимальной частотой 1216 считываний и минимальной частотой 2 считывания. Среднее количество считываний по всей библиотеке составило 333 с медианой 311 считываний и стандартным отклонением 140. 90% элементов библиотеки были представлены считываниями, количество которых находилось в пределах двукратного значения медианы, и 98% элементов библиотеки были представлены считываниями, количество которых находилось в пределах трехкратного значения медианы.
Следовательно, результаты секвенирования подтвердили, что способ вложенной сборки способен обеспечить 2В-библиотеку, содержащую элементы библиотеки, которые представляют все возможные комбинации вариабельных модулей.
Пример 3: Нормирование частей библиотеки
Был разработан способ повышения распределения клонов в комбинаторной библиотеке с использованием нормирования частей библиотеки.
В любой реакции комбинаторной сборки некоторые части (например, модули) интегрированы в собранные продукты более эффективно, чем другие. Как следствие, собранные продукты (например, варианты белка), которые содержат части, которые интегрируются относительно неэффективно, представлены в недостаточном количестве или отсутствуют в готовой комбинаторной библиотеке. По аналогичным причинам другие собранные продукты (например, те варианты белка, которые содержат части, которые эффективно интегрируются) чрезмерно представлены и, следовательно, определяются с избыточной частотой во всех последующих количественных исследованиях.
Для решения этой проблемы был разработан способ улучшения сборки библиотек. Указанный способ включает проведение начальной сборки с использованием одинаковых объемов каждой части (вставки ДНК). Для этой цели создавали общую реакционную смесь, содержащую 1 мкл каждой части. После завершения комбинаторной сборки смесь продуктов определяли с помощью подходящего способа количественного исследования. Например, в данном примере использовали секвенирование следующего поколения (см. Фиг. 27), и рассчитывали долю каждой части в общей библиотеке (обозначенную как ei, в2... в линейном уравнении, представленном на Фиг. 28). Линейную алгебру использовали для одновременного вычисления нового оптимизированного объема для каждой части (в общей реакционной смеси), и затем библиотеку повторно синтезировали, чтобы достичь более равномерного распределения вариантов.
Указанный подход подтверждали путем синтеза комбинаторной библиотеки CAR, в которой каждый CAR содержит два из 61 различного костимулирующого домена, соединенных в виде тандема (612 для 3721 варианта белка). Воспользовавшись
преимуществом простой, линейной взаимосвязи между эффективностью, концентрацией и представленностью в собранной комбинаторной библиотеке, было продемонстрировано, что указанный способ можно применять для количественного контроля относительной частоты отдельных частей. Как показано на Фиг. 29, согласно прогнозам (черные столбики), 10-кратное изменение относительной концентрации набора частей в основной реакционной смеси для сборки приведет к 10-кратному изменению представленности частей в готовой композиции комбинаторной библиотеки. При измерении средней частоты 5 частей в собранной комбинаторной библиотеке (белые столбики) действительно наблюдали предсказанное влияние 10-кратного изменения. Полученная в результате нормированная большая комбинаторная библиотека (как показано на Фиг. 26) имела значительно улучшенное распределение вариантов в библиотеке (например, по сравнению с распределением варианта в библиотеке до нормирования (Фиг. 27).
Несмотря на то, что настоящее изобретение было описано со ссылкой на конкретные варианты реализации, специалисты в данной области техники поймут, что могут быть осуществлены различные изменения, и эквиваленты могут быть заменены, не отступая от истинной сущности и объема настоящего изобретения. Помимо этого множество модификаций может быть выполнено для адаптации конкретной ситуации, материала, состава вещества, способа, этапа или этапов способа, чтобы достичь цели, сущности и объема настоящего изобретения. Подразумевается, что все указанные модификации включены в прилагаемую формулу изобретения.
Перечень последовательностей
<110> Lim, Wendell
Coyle, Scott M. Gordley, Russell M. Roybal, Kole T.
<120> Библиотеки модульных полипептидов и способы их получения и применения
<130> UCSF-518WO
<150> US 62/212,999 <151> 2015-09-01
<160> 132
<170> PatentIn версии 3.5
<210> 1
<211> 24
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 1
Ile Tyr Ile Trp Ala Pro Leu Ala Gly Thr Cys Gly Val Leu Leu Leu
1 5 10 15
Ser Leu Val Ile Thr Leu Tyr Cys 20
<210> 2
<211> 23
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 2
Leu Gly Leu Leu Val Ala Gly Val Leu Val Leu Leu Val Ser Leu Gly
1 5 10 15
Val Ala Ile His Leu Cys Cys 20
<210> 3
<211> 25
<212> PRT
<213> Искусственная последовательность
<220>
Ala Leu Ile Val Leu Gly Gly Val Ala Gly Leu Leu Leu Phe Ile Gly
1 5 10 15
Leu Gly Ile Phe Phe Cys Val Arg Cys 20 25
<210> <211>
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 4
Leu Cys Tyr Leu Leu Asp Gly Ile Leu Phe Ile Tyr Gly Val Ile Leu
1 5 10 15
Thr Ala Leu Phe Leu Arg Val
<210> <211>
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 5
Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu Leu
1 5 10 15
Val Thr Val Ala Phe Ile Ile Phe Trp Val 20 25
<210> <211>
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 6
Val Ala Ala Ile Leu Gly Leu Gly Leu Val Leu Gly Leu Leu Gly Pro
1 5 10 15
Leu Ala Ile Leu Leu Ala Leu Tyr Leu Leu
20 25
<210> 7 <211> 24
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 7
Ala Leu Pro Ala Ala Leu Ala Val Ile Ser Phe Leu Leu Gly Leu Gly
1 5 10 15
Leu Gly Val Ala Cys Val Leu Ala 20
<210> 8
<211> 5
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<220>
<221> MISC_FEATURE
<222> (1)..(5)
<223> Данный участок остатков может быть повторен.
<400> 8
Gly Ser Gly Gly Ser
1 5
<210> 9
<211> 4
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<220>
<221> MISC_FEATURE
<222> (1)..(4)
<223> Данный участок остатков может быть повторен.
<400> 9
Gly Gly Gly Ser 1
<210> 10
<211> 4
<212> PRT
<213> Искусственная последовательность
<220>
<400> 10
Gly Gly Ser Gly
<210> 11
<211> 5
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 11
Gly Gly Ser Gly Gly
<210> 12
<211> 5
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 12
Gly Ser Gly Ser Gly
<210> 13
<211> 5
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 13
Gly Ser Gly Gly Gly
<210> 14
<211> 5
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 14
Gly Gly Gly Ser Gly
1 5
<210> 15 <211> 5
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 15
Gly Ser Ser Ser Gly
<210> 16
<211> 228
<212> ДНК
<213> Искусственная последовательность
<220>
<223> Синтетическая последовательность нуклеиновой кислоты.
<400> 16
acctgcaaca ctccggatca ggatctggtt cgtgggtgcg cagcaagaga agcagactgc 60
tgcacagcga ctacatgaac atgaccccca gacggcctgg ccccaccaga aagcactacc 120
agccttcgcc cctcccagag acttcgccgc ctacagatct ggctccggat caggatccgg 180
cagtggtaac acatatgtct gcagatccgg cagtggtaca aggcaggt 228
<210> <211> <212> <213>
208 ДНК
Искусственная последовательность
<220>
<223> Синтетическая последовательность нуклеиновой кислоты.
<400> 17
ctccggatca ggatctggtt cgtgggtgcg cagcaagaga agcagactgc tgcacagcga 60
ctacatgaac atgaccccca gacggcctgg ccccaccaga aagcactacc agccttacgc 120
ccctccagag acttcgccgc ctacagatct ggctccggat caggatccgg cagtggtaac 180
acatatgtct gcagatccgg cagtggta 208
<210> 18
<211> 58
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 18
Ser Gly Ser Gly Ser Gly Ser Trp Val Arg Ser Lys Arg Ser Arg Leu
1 5 10 15
Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro Gly Pro Thr
20 25 30
Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe Ala Ala Tyr
35 40 45
Arg Ser Gly Ser Gly Ser Gly Ser Gly Ser 50 55
<210> <211>
19 19
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 19
Arg Cys Arg Glu Arg Arg Arg Asn Glu Arg Leu Arg Arg Glu Ser Val
1 5 10 15
Arg Pro Val
<210> 20
<211> 29
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 20
Arg Lys Gly Arg Met Met Asp Val Lys Lys Cys Gly Ile Gln Asp Thr
1 5 10 15
Asn Ser Lys Lys Gln Ser Asp Thr His Leu Glu Glu Thr 20 25
<210> 21
<211> 32
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 21
Lys Lys Arg His Met Ala Ser Tyr Ser Met Cys Ser Asp Pro Ser Thr
1 5 10 15
Arg Asp Pro Pro Gly Arg Pro Glu Pro Tyr Val Glu Val Tyr Leu Ile
20 25 30
<210> 22
<211> 35
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 22
Thr Lys Lys Lys Tyr Ser Ser Ser Val His Asp Pro Asn Gly Glu Tyr
1 5 10 15
Met Phe Met Arg Ala Val Asn Thr Ala Lys Lys Ser Arg Leu Thr Asp
20 25 30
Val Thr Leu 35
<210> 23
<211> 35
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 23
Met Glu Glu Ser Val Val Arg Pro Ser Val Phe Val Val Asp Gly Gln
1 5 10 15
Thr Asp Ile Pro Phe Thr Arg Leu Gly Arg Ser His Arg Arg Gln Ser
20 25 30
Cys Ser Val 35
<210> 24
<211> 39
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 24
Ser Leu Ser Lys Met Leu Lys Lys Arg Ser Pro Leu Thr Thr Gly Val
1 5 10 15
Tyr Val Lys Met Pro Pro Thr Glu Pro Glu Cys Glu Lys Gln Phe Gln
20 25 30
Pro Tyr Phe Ile Pro Ile Asn 35
<210> 25
<211> 40
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 25
Ala Arg Thr Gln Ile Lys Lys Leu Cys Ser Trp Arg Asp Lys Asn Ser
1 5 10 15
Ala Ala Cys Val Val Tyr Glu Asp Met Ser His Ser Arg Cys Asn Thr
20 25 30
Leu Ser Ser Pro Asn Gln Tyr Gln 35 40
<210> 26
<211> 42
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 26
Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe Lys Gln Pro Phe Met
1 5 10 15
Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly Cys Ser Cys Arg Phe
20 25 30
Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu 35 40
<210> 27
<211> 43
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 27
Trp Val Arg Ser Lys Arg Ser Arg Leu Leu His Ser Asp Tyr Met Asn
1 5 10 15
Met Thr Pro Arg Arg Pro Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr
20 25 30
Ala Pro Pro Arg Asp Phe Ala Ala Tyr Arg Ser 35 40
<210> 28
<211> 49
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 28
His Gln Arg Arg Lys Tyr Arg Ser Asn Lys Gly Glu Ser Pro Val Glu
1 5 10 15
Pro Ala Glu Pro Cys His Tyr Ser Cys Pro Arg Glu Glu Glu Gly Ser
20 25 30
Thr Ile Pro Ile Gln Glu Asp Tyr Arg Lys Pro Glu Pro Ala Cys Ser
35 40 45
Pro
<210> 29
<211> 51
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 29
Arg Arg Gln Trp Arg Pro Arg Arg Phe Ser Ala Leu Glu Gln Gly Ile
1 5 10 15
His Pro Pro Gln Ala Gln Ser Lys Ile Glu Glu Leu Glu Gln Glu Pro
20 25 30
Glu Pro Glu Pro Glu Pro Glu Pro Glu Pro Glu Pro Glu Pro Glu Pro
35 40 45
Glu Gln Leu 50
<210> 30
<211> 54
<212> PRT
<213> Искусственная последовательность
<220>
<400> 30
His Ile Trp Gln Leu Arg Ser Gln Cys Met Trp Pro Arg Glu Thr Gln
1 5 10 15
Leu Leu Leu Glu Val Pro Pro Ser Thr Glu Asp Ala Arg Ser Cys Gln
20 25 30
Phe Pro Glu Glu Glu Arg Gly Glu Arg Ser Ala Glu Glu Lys Gly Arg
35 40 45
Leu Gly Asp Leu Trp Val
<210> 31
<211> 61
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 31
Asn Arg Arg Arg Arg Arg Glu Arg Arg Asp Leu Phe Thr Glu Ser Trp
1 5 10 15
Asp Thr Gln Lys Ala Pro Asn Asn Tyr Arg Ser Pro Ile Ser Thr Ser
20 25 30
Gln Pro Thr Asn Gln Ser Met Asp Asp Thr Arg Glu Asp Ile Tyr Val
35 40 45
Asn Tyr Pro Thr Phe Ser Arg Arg Pro Lys Thr Arg Val
50 55 60
<210> 32
<211> 62
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 32
Lys Lys Val Ala Lys Lys Pro Thr Asn Lys Ala Pro His Pro Lys Gln
1 5 10 15
Glu Pro Gln Glu Ile Asn Phe Pro Asp Asp Leu Pro Gly Ser Asn Thr
20 25 30
Ala Ala Pro Val Gln Glu Thr Leu His Gly Cys Gln Pro Val Thr Gln
35 40 45
Glu Asp Gly Lys Glu Ser Arg Ile Ser Val Gln Glu Arg Gln
50 55 60
<210> 33
<211> 77
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 33
Lys Trp Tyr Ser His Ser Lys Glu Lys Ile Gln Asn Leu Ser Leu Ile
1 5 10 15
Ser Leu Ala Asn Leu Pro Pro Ser Gly Leu Ala Asn Ala Val Ala Glu
20 25 30
Gly Ile Arg Ser Glu Glu Asn Ile Tyr Thr Ile Glu Glu Asn Val Tyr
35 40 45
Glu Val Glu Glu Pro Asn Glu Tyr Tyr Cys Tyr Val Ser Ser Arg Gln
50 55 60
Gln Pro Ser Gln Pro Leu Gly Cys Arg Phe Ala Met Pro
65 70 75
<210> 34
<211> 80
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 34
Arg Lys Lys Lys Ala Leu Arg Ile His Ser Val Glu Gly Asp Leu Arg
1 5 10 15
Arg Lys Ser Ala Gly Gln Glu Glu Trp Ser Pro Ser Ala Pro Ser Pro
20 25 30
Pro Gly Ser Cys Val Gln Ala Glu Ala Ala Pro Ala Gly Leu Cys Gly
35 40 45
Glu Gln Arg Gly Glu Asp Cys Ala Glu Leu His Asp Tyr Phe Asn Val
50 55 60
Leu Ser Tyr Arg Ser Leu Gly Asn Cys Ser Phe Phe Thr Glu Thr Gly
65 70 75 80
<210> 35
<211> 83
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 35
Lys Leu Arg Lys Ala His Val Ile Trp Lys Lys Glu Asn Glu Val Ser
1 5 10 15
Glu His Thr Leu Glu Ser Tyr Arg Ser Arg Ser Asn Asn Glu Glu Thr
20 25 30
Ser Ser Glu Glu Lys Asn Gly Gln Ser Ser His Pro Met Arg Cys Met
35 40 45
Asn Tyr Ile Thr Lys Leu Tyr Ser Glu Ala Lys Thr Lys Arg Lys Glu
50 55 60
Asn Val Gln His Ser Lys Leu Glu Glu Lys His Ile Gln Val Pro Glu
65 70 75 80
Ser Ile Val
<210> 36
<211> 98
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 36
Ile Cys Ser Arg Ala Ala Arg Gly Thr Ile Gly Ala Arg Arg Thr Gly
1 5 10 15
Gln Pro Leu Lys Glu Asp Pro Ser Ala Val Pro Val Phe Ser Val Asp
20 25 30
Tyr Gly Glu Leu Asp Phe Gln Trp Arg Glu Lys Thr Pro Glu Pro Pro
35 40 45
Val Pro Cys Val Pro Glu Gln Thr Glu Tyr Ala Thr Ile Val Phe Pro
50 55 60
Ser Gly Met Gly Thr Ser Ser Pro Ala Arg Arg Gly Ser Ala Asp Gly
65 70 75 80
Pro Arg Ser Ala Gln Pro Leu Arg Pro Glu Asp Gly His Cys Ser Trp
85 90 95
Pro Leu
<210> 37
<211> 101
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 37
His Arg Gln Asn Gln Ile Lys Gln Gly Pro Pro Arg Ser Lys Asp Glu
1 5 10 15
Glu Gln Lys Pro Gln Gln Arg Pro Asp Leu Ala Val Asp Val Leu Glu
20 25 30
Arg Thr Ala Asp Lys Ala Thr Val Asn Gly Leu Pro Glu Lys Asp Arg
35 40 45
Glu Thr Asp Thr Ser Ala Leu Ala Ala Gly Ser Ser Gln Glu Val Thr
50 55 60
Tyr Ala Gln Leu Asp His Trp Ala Leu Thr Gln Arg Thr Ala Arg Ala
65 70 75 80
Val Ser Pro Gln Ser Thr Lys Pro Met Ala Glu Ser Ile Thr Tyr Ala
85 90 95
Ala Val Ala Arg His 100
<210> 38
<211> 107
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 38
Cys Cys Arg Lys Lys Arg Arg Glu Glu Lys Tyr Glu Lys Glu Val His
1 5 10 15
His Asp Ile Arg Glu Asp Val Pro Pro Pro Lys Ser Arg Thr Ser Thr
20 25 30
Ala Arg Ser Tyr Ile Gly Ser Asn His Ser Ser Leu Gly Ser Met Ser
35 40 45
Pro Ser Asn Met Glu Gly Tyr Ser Lys Thr Gln Tyr Asn Gln Val Pro
50 55 60
Ser Glu Asp Phe Glu Arg Thr Pro Gln Ser Pro Thr Leu Pro Pro Ala
65 70 75 80
Lys Val Ala Ala Pro Asn Leu Ser Arg Met Gly Ala Ile Pro Val Met
85 90 95
Ile Pro Ala Gln Ser Lys Asp Gly Ser Ile Val 100 105
<210> 39
<211> 114
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 39
Cys Cys Leu Arg Arg His Gln Gly Lys Gln Asn Glu Leu Ser Asp Thr
1 5 10 15
Ala Gly Arg Glu Ile Asn Leu Val Asp Ala His Leu Lys Ser Glu Gln
20 25 30
Thr Glu Ala Ser Thr Arg Gln Asn Ser Gln Val Leu Leu Ser Glu Thr
35 40 45
Gly Ile Tyr Asp Asn Asp Pro Asp Leu Cys Phe Arg Met Gln Glu Gly
50 55 60
Ser Glu Val Tyr Ser Asn Pro Cys Leu Glu Glu Asn Lys Pro Gly Ile
65 70 75 80
Val Tyr Ala Ser Leu Asn His Ser Val Ile Gly Pro Asn Ser Arg Leu
85 90 95
Ala Arg Asn Val Lys Glu Ala Pro Thr Glu Tyr Ala Ser Ile Cys Val
100 105 110
<210> 40
<211> 117
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 40
Thr Lys Arg Lys Lys Gln Arg Ser Arg Arg Asn Asp Glu Glu Leu Glu
1 5 10 15
Thr Arg Ala His Arg Val Ala Thr Glu Glu Arg Gly Arg Lys Pro His
20 25 30
Gln Ile Pro Ala Ser Thr Pro Gln Asn Pro Ala Thr Ser Gln His Pro
35 40 45
Pro Pro Pro Pro Gly His Arg Ser Gln Ala Pro Ser His Arg Pro Pro
50 55 60
Pro Pro Gly His Arg Val Gln His Gln Pro Gln Lys Arg Pro Pro Ala
65 70 75 80
Pro Ser Gly Thr Gln Val His Gln Gln Lys Gly Pro Pro Leu Pro Arg
85 90 95
Pro Arg Val Gln Pro Lys Pro Pro His Gly Ala Ala Glu Asn Ser Leu
100 105 110
Ser Pro Ser Ser Asn
115
<210> 41
<211> 120
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 41
Trp Arg Arg Lys Arg Lys Glu Lys Gln Ser Glu Thr Ser Pro Lys Glu
1 5 10 15
Phe Leu Thr Ile Tyr Glu Asp Val Lys Asp Leu Lys Thr Arg Arg Asn
20 25 30
His Glu Gln Glu Gln Thr Phe Pro Gly Gly Gly Ser Thr Ile Tyr Ser
35 40 45
Met Ile Gln Ser Gln Ser Ser Ala Pro Thr Ser Gln Glu Pro Ala Tyr
50 55 60
Thr Leu Tyr Ser Leu Ile Gln Pro Ser Arg Lys Ser Gly Ser Arg Lys
65 70 75 80
Arg Asn His Ser Pro Ser Phe Asn Ser Thr Ile Tyr Glu Val Ile Gly
85 90 95
Lys Ser Gln Pro Lys Ala Gln Asn Pro Ala Arg Leu Ser Arg Lys Glu
100 105 110
Leu Glu Asn Phe Asp Val Tyr Ser 115 120
<210> 42
<211> 187
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 42
Arg Arg Ala Cys Arg Lys Arg Ile Arg Gln Lys Leu His Leu Cys Tyr
1 5 10 15
Pro Val Gln Thr Ser Gln Pro Lys Leu Glu Leu Val Asp Ser Arg Pro
20 25 30
Arg Arg Ser Ser Thr Gln Leu Arg Ser Gly Ala Ser Val Thr Glu Pro
35 40 45
Val Ala Glu Glu Arg Gly Leu Met Ser Gln Pro Leu Met Glu Thr Cys
50 55 60
His Ser Val Gly Ala Ala Tyr Leu Glu Ser Leu Pro Leu Gln Asp Ala
65 70 75 80
Ser Pro Ala Gly Gly Pro Ser Ser Pro Arg Asp Leu Pro Glu Pro Arg
85 90 95
Val Ser Thr Glu His Thr Asn Asn Lys Ile Glu Lys Ile Tyr Ile Met
100 105 110
Lys Ala Asp Thr Val Ile Val Gly Thr Val Lys Ala Glu Leu Pro Glu
115 120 125
Gly Arg Gly Leu Ala Gly Pro Ala Glu Pro Glu Leu Glu Glu Glu Leu
130 135 140
Glu Ala Asp His Thr Pro His Tyr Pro Glu Gln Glu Thr Glu Pro Pro
145 150 155 160
Leu Gly Ser Cys Ser Asp Val Met Leu Ser Val Glu Glu Glu Gly Lys
165 170 175
Glu Asp Pro Leu Pro Thr Ala Ala Ser Gly Lys 180 185
<210> 43
<211> 108
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 43
Thr Tyr Arg His Cys Trp Pro His Lys Pro Leu Val Thr Ala Asp Glu
1 5 10 15
Ala Gly Met Glu Ala Leu Thr Pro Pro Pro Ala Thr His Leu Ser Pro
20 25 30
Leu Asp Ser Ala His Thr Leu Leu Ala Pro Pro Asp Ser Ser Glu Lys
35 40 45
Ile Cys Thr Val Gln Leu Val Gly Asn Ser Trp Thr Pro Gly Tyr Pro
50 55 60
Glu Thr Gln Glu Ala Leu Cys Pro Gln Val Thr Trp Ser Trp Asp Gln
65 70 75 80
Leu Pro Ser Arg Ala Leu Gly Pro Ala Ala Ala Pro Thr Leu Ser Pro
85 90 95
Glu Ser Pro Ala Gly Ser Pro Ala Met Met Leu Gln 100 105
<210> 44
<211> 42
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 44
Ala Leu Tyr Leu Leu Arg Arg Asp Gln Arg Leu Pro Pro Asp Ala His
1 5 10 15
Lys Pro Pro Gly Gly Gly Ser Phe Arg Thr Pro Ile Gln Glu Glu Gln
20 25 30
Ala Asp Ala His Ser Thr Leu Ala Lys Ile 35 40
<210> 45
<211> 51
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 45
Met Gly Trp Ile Arg Gly Arg Arg Ser Arg His Ser Trp Glu Met Ser
1 5 10 15
Glu Phe His Asn Tyr Asn Leu Asp Leu Lys Lys Ser Asp Phe Ser Thr
20 25 30
Arg Trp Gln Lys Gln Arg Cys Pro Val Val Lys Ser Lys Cys Arg Glu
35 40 45
Asn Ala Ser 50
<210> 46
<211> 48
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 46
Lys Lys Tyr Phe Phe Lys Lys Glu Val Gln Gln Leu Ser Val Ser Phe
1 5 10 15
Ser Ser Leu Gln Ile Lys Ala Leu Gln Asn Ala Val Glu Lys Glu Val
20 25 30
Gln Ala Glu Asp Asn Ile Tyr Ile Glu Asn Ser Leu Tyr Ala Thr Asp
35 40 45
<210> 47
<211> 22
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 47
Ser Gly Phe Leu Gln Glu Lys Val Trp Val Met Leu Val Thr Ser Leu
1 5 10 15
Val Ala Leu Gln Ala Leu 20
<210> 48
<211> 85
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 48
Ser Trp Arg Arg Arg Gln Arg Arg Leu Arg Gly Ala Ser Ser Ala Glu
1 5 10 15
Ala Pro Asp Gly Asp Lys Asp Ala Pro Glu Pro Leu Asp Lys Val Ile
20 25 30
Ile Leu Ser Pro Gly Ile Ser Asp Ala Thr Ala Pro Ala Trp Pro Pro
35 40 45
Pro Gly Glu Asp Pro Gly Thr Thr Pro Pro Gly His Ser Val Pro Val
50 55 60
Pro Ala Thr Glu Leu Gly Ser Thr Glu Leu Val Thr Thr Lys Thr Ala
65 70 75 80
Gly Pro Glu Gln Gln 85
<210> 49
<211> 111
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 49
Ala Cys Phe Leu Lys Lys Arg Gly Asp Pro Cys Ser Cys Gln Pro Arg
1 5 10 15
Ser Arg Pro Arg Gln Ser Pro Ala Lys Ser Ser Gln Asp His Ala Met
20 25 30
Glu Ala Gly Ser Pro Val Ser Thr Ser Pro Glu Pro Val Glu Thr Cys
35 40 45
Ser Phe Cys Phe Pro Glu Cys Arg Ala Pro Thr Gln Glu Ser Ala Val
50 55 60
Thr Pro Gly Thr Pro Asp Pro Thr Cys Ala Gly Arg Trp Gly Cys His
65 70 75 80
Thr Arg Thr Thr Val Leu Gln Pro Cys Pro His Ile Pro Asp Ser Gly
85 90 95
Leu Gly Ile Val Cys Val Pro Ala Gln Glu Gly Gly Pro Gly Ala
100 105 110
<210> 50
<211> 95
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 50
Met Ala Glu Ala Ile Thr Tyr Ala Asp Leu Arg Phe Val Lys Ala Pro
1 5 10 15
Leu Lys Lys Ser Ile Ser Ser Arg Leu Gly Gln Asp Pro Gly Ala Asp
20 25 30
Asp Asp Gly Glu Ile Thr Tyr Glu Asn Val Gln Val Pro Ala Val Leu
35 40 45
Gly Val Pro Ser Ser Leu Ala Ser Ser Val Leu Gly Asp Lys Ala Ala
50 55 60
Val Lys Ser Glu Gln Pro Thr Ala Ser Trp Arg Ala Val Thr Ser Pro
65 70 75 80
Ala Val Gly Arg Ile Leu Pro Cys Arg Thr Thr Cys Leu Arg Tyr
85 90 95
<210> 51
<211> 141
<212> PRT
<213> Искусственная последовательность
<220>
Lys Leu Gln Arg Arg Trp Lys Arg Thr Gln Ser Gln Gln Gly Leu Gln
1 5 10 15
Glu Asn Ser Ser Gly Gln Ser Phe Phe Val Arg Asn Lys Lys Val Arg
20 25 30
Arg Ala Pro Leu Ser Glu Gly Pro His Ser Leu Gly Cys Tyr Asn Pro
35 40 45
Met Met Glu Asp Gly Ile Ser Tyr Thr Thr Leu Arg Phe Pro Glu Met
50 55 60
Asn Ile Pro Arg Thr Gly Asp Ala Glu Ser Ser Glu Met Gln Arg Pro
65 70 75 80
Pro Pro Asp Cys Asp Asp Thr Val Thr Tyr Ser Ala Leu His Lys Arg
85 90 95
Gln Val Gly Asp Tyr Glu Asn Val Ile Pro Asp Phe Pro Glu Asp Glu
100 105 110
Gly Ile His Tyr Ser Glu Leu Ile Gln Phe Gly Val Gly Glu Arg Pro
115 120 125
Gln Ala Gln Glu Asn Val Asp Tyr Val Ile Leu Lys His
130 135 140
<210> 52
<211> 45
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 52
Arg Lys Trp Cys Gln Tyr Gln Lys Glu Ile Met Glu Arg Pro Pro Pro
1 5 10 15
Phe Lys Pro Pro Pro Pro Pro Ile Lys Tyr Thr Cys Ile Gln Glu Pro
20 25 30
Asn Glu Ser Asp Leu Pro Tyr His Glu Met Glu Thr Leu
35 40 45
<210> 53
<211> 84
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 53
Leu Arg Lys Arg Arg Asp Ser Leu Ser Leu Ser Thr Gln Arg Thr Gln
1 5 10 15
Gly Pro Ala Glu Ser Ala Arg Asn Leu Glu Tyr Val Ser Val Ser Pro
20 25 30
Thr Asn Asn Thr Val Tyr Ala Ser Val Thr His Ser Asn Arg Glu Thr
35 40 45
Glu Ile Trp Thr Pro Arg Glu Asn Asp Thr Ile Thr Ile Tyr Ser Thr
50 55 60
Ile Asn His Ser Lys Glu Ser Lys Pro Thr Phe Ser Arg Ala Thr Ala
65 70 75 80
Leu Asp Asn Val
<210> 54
<211> 88
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 54
Trp Phe Leu Lys Arg Glu Arg Gln Glu Glu Tyr Ile Glu Glu Lys Lys
1 5 10 15
Arg Val Asp Ile Cys Arg Glu Thr Pro Asn Ile Cys Pro His Ser Gly
20 25 30
Glu Asn Thr Glu Tyr Asp Thr Ile Pro His Thr Asn Arg Thr Ile Leu
35 40 45
Lys Glu Asp Pro Ala Asn Thr Val Tyr Ser Thr Val Glu Ile Pro Lys
50 55 60
Lys Met Glu Asn Pro His Ser Leu Leu Thr Met Pro Asp Thr Pro Arg
65 70 75 80
Leu Phe Ala Tyr Glu Asn Val Ile 85
<210> 55 <211> 82
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 55
Lys Thr His Arg Arg Lys Ala Ala Arg Thr Ala Val Gly Arg Asn Asp
1 5 10 15
Thr His Pro Thr Thr Gly Ser Ala Ser Pro Lys His Gln Lys Lys Ser
20 25 30
Lys Leu His Gly Pro Thr Glu Thr Ser Ser Cys Ser Gly Ala Ala Pro
35 40 45
Thr Val Glu Met Asp Glu Glu Leu His Tyr Ala Ser Leu Asn Phe His
50 55 60
Gly Met Asn Pro Ser Lys Asp Thr Ser Thr Glu Tyr Ser Glu Val Arg
65 70 75 80
Thr Gln
<210> 56
<211> 38
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 56
Met Thr Asp Ser Val Ile Tyr Ser Met Leu Glu Leu Pro Thr Ala Thr
1 5 10 15
Gln Ala Gln Asn Asp Tyr Gly Pro Gln Gln Lys Ser Ser Ser Ser Arg
20 25 30
Pro Ser Cys Ser Cys Leu
<210> 57
<211> 45
<212> PRT
<213> Искусственная последовательность
<220>
Met Asp Gln Gln Ala Ile Tyr Ala Glu Leu Asn Leu Pro Thr Asp Ser
1 5 10 15
Gly Pro Glu Ser Ser Ser Pro Ser Ser Leu Pro Arg Asp Val Cys Gln
20 25 30
Gly Ser Pro Trp His Gln Phe Ala Leu Lys Leu Ser Cys
35 40 45
<210> 58
<211> 168
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 58
Leu Arg His Arg Arg Gln Gly Lys His Trp Thr Ser Thr Gln Arg Lys
1 5 10 15
Ala Asp Phe Gln His Pro Ala Gly Ala Val Gly Pro Glu Pro Thr Asp
20 25 30
Arg Gly Leu Gln Trp Arg Ser Ser Pro Ala Ala Asp Ala Gln Glu Glu
35 40 45
Asn Leu Tyr Ala Ala Val Lys His Thr Gln Pro Glu Asp Gly Val Glu
50 55 60
Met Asp Thr Arg Ser Pro His Asp Glu Asp Pro Gln Ala Val Thr Tyr
65 70 75 80
Ala Glu Val Lys His Ser Arg Pro Arg Arg Glu Met Ala Ser Pro Pro
85 90 95
Ser Pro Leu Ser Gly Glu Phe Leu Asp Thr Lys Asp Arg Gln Ala Glu
100 105 110
Glu Asp Arg Gln Met Asp Thr Glu Ala Ala Ala Ser Glu Ala Pro Gln
115 120 125
Asp Val Thr Tyr Ala Gln Leu His Ser Leu Thr Leu Arg Arg Glu Ala
130 135 140
Thr Glu Pro Pro Pro Ser Gln Glu Gly Pro Ser Pro Ala Val Pro Ser
145 150 155 160
Ile Tyr Ala Thr Leu Ala Ile His 165
<210> 59
<211> 83
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 59
Arg Trp Cys Ser Asn Lys Lys Asn Ala Ala Val Met Asp Gln Glu Ser
1 5 10 15
Ala Gly Asn Arg Thr Ala Asn Ser Glu Asp Ser Asp Glu Gln Asp Pro
20 25 30
Gln Glu Val Thr Tyr Thr Gln Leu Asn His Cys Val Phe Thr Gln Arg
35 40 45
Lys Ile Thr Arg Pro Ser Gln Arg Pro Lys Thr Pro Pro Thr Asp Ile
50 55 60
Ile Val Tyr Thr Glu Leu Pro Asn Ala Glu Ser Arg Ser Lys Val Val
65 70 75 80
Ser Cys Pro
<210> 60
<211> 84
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 60
His Leu Trp Cys Ser Asn Lys Lys Asn Ala Ala Val Met Asp Gln Glu
1 5 10 15
Pro Ala Gly Asn Arg Thr Ala Asn Ser Glu Asp Ser Asp Glu Gln Asp
20 25 30
Pro Glu Glu Val Thr Tyr Ala Gln Leu Asp His Cys Val Phe Thr Gln
35 40 45
Arg Lys Ile Thr Arg Pro Ser Gln Arg Pro Lys Thr Pro Pro Thr Asp
50 55 60
Thr Ile Leu Tyr Thr Glu Leu Pro Asn Ala Lys Pro Arg Ser Lys Val
65 70 75 80
Val Ser Cys Pro
<210> 61
<211> 10
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 61
Met Ala Val Phe Lys Thr Thr Leu Trp Arg
1 5 10
<210> 62
<211> 29
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 62
Lys Gly Ser Gln Arg Val Pro Glu Glu Pro Gly Glu Gln Pro Ile Tyr
1 5 10 15
Met Asn Phe Ser Glu Pro Leu Thr Lys Asp Met Ala Thr 20 25
<210> 63
<211> 11
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 63
Val Asn Arg Pro Gln Trp Ala Pro Pro Gly Arg
1 5 10
<210> 64
<211> 8
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 64
Val Thr Leu Arg Ser Phe Val Pro 1 5
<210> 65
<211> 35
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 65
Ala Ala Trp His Gly Gln Lys Pro Gly Thr His Pro Pro Ser Glu Leu
1 5 10 15
Asp Cys Gly His Asp Pro Gly Tyr Gln Leu Gln Thr Leu Pro Gly Leu
20 25 30
Arg Asp Thr 35
<210> 66
<211> 32
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 66
Gln His Ser Gln Arg Ser Pro Pro Arg Cys Ser Gln Glu Ala Asn Ser
1 5 10 15
Arg Lys Asp Asn Ala Pro Phe Arg Val Val Glu Pro Trp Glu Gln Ile
20 25 30
<210> 67
<211> 168
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 67
Gln His Trp Arg Gln Gly Lys His Arg Thr Leu Ala Gln Arg Gln Ala
1 5 10 15
Asp Phe Gln Arg Pro Pro Gly Ala Ala Glu Pro Glu Pro Lys Asp Gly
20 25 30
Gly Leu Gln Arg Arg Ser Ser Pro Ala Ala Asp Val Gln Gly Glu Asn
35 40 45
Phe Cys Ala Ala Val Lys Asn Thr Gln Pro Glu Asp Gly Val Glu Met
50 55 60
Asp Thr Arg Gln Ser Pro His Asp Glu Asp Pro Gln Ala Val Thr Tyr
65 70 75 80
Ala Lys Val Lys His Ser Arg Pro Arg Arg Glu Met Ala Ser Pro Pro
85 90 95
Ser Pro Leu Ser Gly Glu Phe Leu Asp Thr Lys Asp Arg Gln Ala Glu
100 105 110
Glu Asp Arg Gln Met Asp Thr Glu Ala Ala Ala Ser Glu Ala Pro Gln
115 120 125
Asp Val Thr Tyr Ala Gln Leu His Ser Phe Thr Leu Arg Gln Lys Ala
130 135 140
Thr Glu Pro Pro Pro Ser Gln Glu Gly Ala Ser Pro Ala Glu Pro Ser
145 150 155 160
Val Tyr Ala Thr Leu Ala Ile His 165
<210> 68
<211> 116
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 68
Leu Arg His Arg Arg Gln Gly Lys His Trp Thr Ser Thr Gln Arg Lys
1 5 10 15
Ala Asp Phe Gln His Pro Ala Gly Ala Val Gly Pro Glu Pro Thr Asp
20 25 30
Arg Gly Leu Gln Trp Arg Ser Ser Pro Ala Ala Asp Ala Gln Glu Glu
35 40 45
Asn Leu Tyr Ala Ala Val Lys Asp Thr Gln Pro Glu Asp Gly Val Glu
50 55 60
Met Asp Thr Arg Ala Ala Ala Ser Glu Ala Pro Gln Asp Val Thr Tyr
65 70 75 80
Ala Gln Leu His Ser Leu Thr Leu Arg Arg Lys Ala Thr Glu Pro Pro
85 90 95
Pro Ser Gln Glu Arg Glu Pro Pro Ala Glu Pro Ser Ile Tyr Ala Thr
100 105 110
Leu Ala Ile His
115
<210> 69
<211> 128
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 69
Met Ala Lys Arg Lys Gln Gly Asn Arg Leu Gly Val Cys Gly Arg Phe
1 5 10 15
Leu Ser Ser Arg Val Ser Gly Met Asn Pro Ser Ser Val Val His His
20 25 30
Val Ser Asp Ser Gly Pro Ala Ala Glu Leu Pro Leu Asp Val Pro His
35 40 45
Ile Arg Leu Asp Ser Pro Pro Ser Phe Asp Asn Thr Thr Tyr Thr Ser
50 55 60
Leu Pro Leu Asp Ser Pro Ser Gly Lys Pro Ser Leu Pro Ala Pro Ser
65 70 75 80
Ser Leu Pro Pro Leu Pro Pro Lys Val Leu Val Cys Ser Lys Pro Val
85 90 95
Thr Tyr Ala Thr Val Ile Phe Pro Gly Gly Asn Lys Gly Gly Gly Thr
100 105 110
Ser Cys Gly Pro Ala Gln Asn Pro Pro Asn Asn Gln Thr Pro Ser Ser
115 120 125
<210> 70
<211> 61
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 70
Lys Val Asn Gly Cys Arg Lys Tyr Lys Leu Asn Lys Thr Glu Ser Thr
1 5 10 15
Pro Val Val Glu Glu Asp Glu Met Gln Pro Tyr Ala Ser Tyr Thr Glu
20 25 30
Lys Asn Asn Pro Leu Tyr Asp Thr Thr Asn Lys Val Lys Ala Ser Glu
35 40 45
Ala Leu Gln Ser Glu Val Asp Thr Asp Leu His Thr Leu
50 55 60
<210> 71
<211> 98
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 71
Arg Met Phe Gln Lys Trp Ile Lys Ala Gly Asp His Ser Glu Leu Ser
1 5 10 15
Gln Asn Pro Lys Gln Ala Ala Thr Gln Ser Glu Leu His Tyr Ala Asn
20 25 30
Leu Glu Leu Leu Met Trp Pro Leu Gln Glu Lys Pro Ala Pro Pro Arg
35 40 45
Glu Val Glu Val Glu Tyr Ser Thr Val Ala Ser Pro Arg Glu Glu Leu
50 55 60
His Tyr Ala Ser Val Val Phe Asp Ser Asn Thr Asn Arg Ile Ala Ala
65 70 75 80
Gln Arg Pro Arg Glu Glu Glu Pro Asp Ser Asp Tyr Ser Val Ile Arg
85 90 95
Lys Thr
<210> 72
<211> 113
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 72
Trp Arg Met Met Lys Tyr Gln Gln Lys Ala Ala Gly Met Ser Pro Glu
1 5 10 15
Gln Val Leu Gln Pro Leu Glu Gly Asp Leu Cys Tyr Ala Asp Leu Thr
20 25 30
Leu Gln Leu Ala Gly Thr Ser Pro Gln Lys Ala Thr Thr Lys Leu Ser
35 40 45
Ser Ala Gln Val Asp Gln Val Glu Val Glu Tyr Val Thr Met Ala Ser
50 55 60
Leu Pro Lys Glu Asp Ile Ser Tyr Ala Ser Leu Thr Leu Gly Ala Glu
65 70 75 80
Asp Gln Glu Pro Thr Tyr Cys Asn Met Gly His Leu Ser Ser His Leu
85 90 95
Pro Gly Arg Gly Pro Glu Glu Pro Thr Glu Tyr Ser Thr Ile Ser Arg
100 105 110
Pro
<210> 73
<211> 37
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 73
Met Ser Asp Ser Lys Glu Pro Arg Leu Gln Gln Leu Gly Leu Leu Glu
1 5 10 15
Glu Glu Gln Leu Arg Gly Leu Gly Phe Arg Gln Thr Arg Gly Tyr Lys
20 25 30
Ser Leu Ala Gly Cys 35
<210> 74
<211> 29
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 74
Arg Lys Ser Ser Gly Gly Lys Gly Gly Ser Tyr Ser Gln Ala Ala Cys
1 5 10 15
Ser Asp Ser Ala Gln Gly Ser Asp Val Ser Leu Thr Ala 20 25
<210> 75
<211> 95
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 75
Leu Pro Lys Tyr Lys Thr Arg Lys Ala Met Arg Asn Asn Val Pro Arg
1 5 10 15
Asp Arg Gly Asp Thr Ala Met Glu Val Gly Ile Tyr Ala Asn Ile Leu
20 25 30
Glu Lys Gln Ala Lys Glu Glu Ser Val Pro Glu Val Gly Ser Arg Pro
35 40 45
Cys Val Ser Thr Ala Gln Asp Glu Ala Lys His Ser Gln Glu Leu Gln
50 55 60
Tyr Ala Thr Pro Val Phe Gln Glu Val Ala Pro Arg Glu Gln Glu Ala
65 70 75 80
Cys Asp Ser Tyr Lys Ser Gly Tyr Val Tyr Ser Glu Leu Asn Phe
85 90 95
<210> 76
<211> 178
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 76
Arg Arg Arg His Arg Gly Lys Phe Arg Lys Asp Val Gln Lys Glu Lys
1 5 10 15
Asp Leu Gln Leu Ser Ser Gly Ala Glu Glu Pro Ile Thr Arg Lys Gly
20 25 30
Glu Leu Gln Lys Arg Pro Asn Pro Ala Ala Ala Thr Gln Glu Glu Ser
35 40 45
Leu Tyr Ala Ser Val Glu Asp Met Gln Thr Glu Asp Gly Val Glu Leu
50 55 60
Asn Ser Trp Thr Pro Pro Glu Glu Asp Pro Gln Gly Glu Thr Tyr Ala
65 70 75 80
Gln Val Lys Pro Ser Arg Leu Arg Lys Ala Gly His Val Ser Pro Ser
85 90 95
Val Met Ser Arg Glu Gln Leu Asn Thr Glu Tyr Glu Gln Ala Glu Glu
100 105 110
Gly Gln Gly Ala Asn Asn Gln Ala Ala Glu Ser Gly Glu Ser Gln Asp
115 120 125
Val Thr Tyr Ala Gln Leu Cys Ser Arg Thr Leu Arg Gln Gly Ala Ala
130 135 140
Ala Ser Pro Leu Ser Gln Ala Gly Glu Ala Pro Glu Glu Pro Ser Val
145 150 155 160
Tyr Ala Thr Leu Ala Ala Ala Arg Pro Glu Ala Val Pro Lys Asp Met
165 170 175
Glu Gln
<210> 77
<211> 42
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетическая полипептидная последовательность.
<400> 77
Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser
1 5 10 15
Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly Ser Ala
20 25 30
Gly Ser Ala Gly Ser Ala Gly Ser Ala Gly 35 40
<210> 78
<211> 108
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 78
Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe
1 5 10 15
Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu
20 25 30
Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys
35 40 45
Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val
50 55 60
Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp
65 70 75 80
Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala
85 90 95
Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 79
<211> 292
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 79
Leu Glu Glu Ser Val Ala Leu Arg Ile Ile Thr Glu Gly Ala Ser Ile
1 5 10 15
Leu Arg Gln Glu Lys Asn Leu Leu Asp Ile Asp Ala Pro Val Thr Val
20 25 30
Cys Gly Asp Ile His Gly Gln Phe Phe Asp Leu Met Lys Leu Phe Glu
35 40 45
Val Gly Gly Ser Pro Ala Asn Thr Arg Tyr Leu Phe Leu Gly Asp Tyr
50 55 60
Val Asp Arg Gly Tyr Phe Ser Ile Glu Cys Val Leu Tyr Leu Trp Ala
65 70 75 80
Leu Lys Ile Leu Tyr Pro Lys Thr Leu Phe Leu Leu Arg Gly Asn His
85 90 95
Glu Cys Arg His Leu Thr Glu Tyr Phe Thr Phe Lys Gln Glu Cys Lys
100 105 110
Ile Lys Tyr Ser Glu Arg Val Tyr Asp Ala Cys Met Asp Ala Phe Asp
115 120 125
Cys Leu Pro Leu Ala Ala Leu Met Asn Gln Gln Phe Leu Cys Val His
130 135 140
Gly Gly Leu Ser Pro Glu Ile Asn Thr Leu Asp Asp Ile Arg Lys Leu
145 150 155 160
Asp Arg Phe Lys Glu Pro Pro Ala Tyr Gly Pro Met Cys Asp Ile Leu
165 170 175
Trp Ser Asp Pro Leu Glu Asp Phe Gly Asn Glu Lys Thr Gln Glu His
180 185 190
Phe Thr His Asn Thr Val Arg Gly Cys Ser Tyr Phe Tyr Ser Tyr Pro
195 200 205
Ala Val Cys Glu Phe Leu Gln His Asn Asn Leu Leu Ser Ile Leu Arg
210 215 220
Ala His Glu Ala Gln Asp Ala Gly Tyr Arg Met Tyr Arg Lys Ser Gln
225 230 235 240
Thr Thr Gly Phe Pro Ser Leu Ile Thr Ile Phe Ser Ala Pro Asn Tyr
245 250 255
Leu Asp Val Tyr Asn Asn Lys Ala Ala Val Leu Lys Tyr Glu Asn Asn
260 265 270
Val Met Asn Ile Arg Gln Phe Asn Cys Ser Pro His Pro Tyr Trp Leu
275 280 285
Pro Asn Phe Met 290
<210> 80
<211> 165
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 80
Met Val Asn Pro Thr Val Phe Phe Asp Ile Ala Val Asp Gly Glu Pro
1 5 10 15
Leu Gly Arg Val Ser Phe Glu Leu 20
Ala Glu Asn Phe Arg Ala Leu Ser 35 40
Lys Gly Ser Cys Phe His Arg Ile 50 55
Gly Asp Phe Thr Arg His Asn Gly 65 70
Glu Lys Phe Glu Asp Glu Asn Phe 85
Ile Leu Ser Met Ala Asn Ala Gly 100
Phe Ile Cys Thr Ala Lys Thr Glu 115 120
Phe Gly Lys Val Lys Glu Gly Met 130 135
Phe Gly Ser Arg Asn Gly Lys Thr 145 150
Cys Gly Gln Leu Glu 165
<210> <211> <212> <213>
<220>
<223> Синтетический полипептид
<400> 81
Phe Ala Asp Lys Val Pro Lys Thr 25 30
Thr Gly Glu Lys Gly Phe Gly Tyr 45
Ile Pro Gly Phe Met Cys Gln Gly 60
Thr Gly Gly Lys Ser Ile Tyr Gly 75 80
Ile Leu Lys His Thr Gly Pro Gly 90 95
Pro Asn Thr Asn Gly Ser Gln Phe 105 110
Trp Leu Asp Gly Lys His Val Val 125
Asn Ile Val Glu Ala Met Glu Arg 140
Ser Lys Lys Ile Thr Ile Ala Asp 155 160
Met Ile Leu Trp His Glu Met Trp His Glu Gly Leu Glu Glu Ala Ser
1 5 10 15
Arg Leu Tyr Phe Gly Glu Arg Asn Val Lys Gly Met Phe Glu Val Leu
20 25 30
Glu Pro Leu His Ala Met Met Glu Arg Gly Pro Gln Thr Leu Lys Glu
35 40 45
Thr Ser Phe Asn Gln Ala Tyr Gly Arg Asp Leu Met Glu Ala Gln Glu
50 55 60
Trp Cys Arg Lys Tyr Met Lys Ser Gly Asn Val Lys Asp Leu Leu Gln
65 70 75 80
Ala Trp Asp Leu Tyr Tyr His Val Phe Arg Arg Ile Ser Lys 85 90
<210> 82
<211> 804
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 82
Met Ser Asn Ser Tyr Asp Ser Ser Ser Ile Lys Val Leu Lys Gly Leu
1 5 10 15
Asp Ala Val Arg Lys Arg Pro Gly Met Tyr Ile Gly Asp Thr Asp Asp
20 25 30
Gly Thr Gly Leu His His Met Val Phe Glu Val Val Asp Asn Ala Ile
35 40 45
Asp Glu Ala Leu Ala Gly His Cys Lys Glu Ile Ile Val Thr Ile His
50 55 60
Ala Asp Asn Ser Val Ser Val Gln Asp Asp Gly Arg Gly Ile Pro Thr
65 70 75 80
Gly Ile His Pro Glu Glu Gly Val Ser Ala Ala Glu Val Ile Met Thr
85 90 95
Val Leu His Ala Gly Gly Lys Phe Asp Asp Asn Ser Tyr Lys Val Ser
100 105 110
Gly Gly Leu His Gly Val Gly Val Ser Val Val Asn Ala Leu Ser Gln
115 120 125
Lys Leu Glu Leu Val Ile Gln Arg Glu Gly Lys Ile His Arg Gln Ile
130 135 140
Tyr Glu His Gly Val Pro Gln Ala Pro Leu Ala Val Thr Gly Glu Thr
145 150 155 160
Glu Lys Thr Gly Thr Met Val Arg Phe Trp Pro Ser Leu Glu Thr Phe
165 170 175
Thr Asn Val Thr Glu Phe Glu Tyr Glu Ile Leu Ala Lys Arg Leu Arg
180 185 190
Glu Leu Ser Phe Leu Asn Ser Gly Val Ser Ile Arg Leu Arg Asp Lys
195 200 205
Arg Asp Gly Lys Glu Asp His Phe His Tyr Glu Gly Gly Ile Lys Ala
210 215 220
Phe Val Glu Tyr Leu Asn Lys Asn Lys Thr Pro Ile His Pro Asn Ile
225 230 235 240
Phe Tyr Phe Ser Thr Glu Lys Asp Gly Ile Gly Val Glu Val Ala Leu
245 250 255
Gln Trp Asn Asp Gly Phe Gln Glu Asn Ile Tyr Cys Phe Thr Asn Asn
260 265 270
Ile Pro Gln Arg Asp Gly Gly Thr His Leu Ala Gly Phe Arg Ala Ala
275 280 285
Met Thr Arg Thr Leu Asn Ala Tyr Met Asp Lys Glu Gly Tyr Ser Lys
290 295 300
Lys Ala Lys Val Ser Ala Thr Gly Asp Asp Ala Arg Glu Gly Leu Ile
305 310 315 320
Ala Val Val Ser Val Lys Val Pro Asp Pro Lys Phe Ser Ser Gln Thr
325 330 335
Lys Asp Lys Leu Val Ser Ser Glu Val Lys Ser Ala Val Glu Gln Gln
340 345 350
Met Asn Glu Leu Leu Ala Glu Tyr Leu Leu Glu Asn Pro Thr Asp Ala
355 360 365
Lys Ile Val Val Gly Lys Ile Ile Asp Ala Ala Arg Ala Arg Glu Ala
370 375 380
Ala Arg Arg Ala Arg Glu Met Thr Arg Arg Lys Gly Ala Leu Asp Leu
385 390 395 400
Ala Gly Leu Pro Gly Lys Leu Ala Asp Cys Gln Glu Arg Asp Pro Ala
405 410 415
Leu Ser Glu Leu Tyr Leu Val Glu Gly Asp Ser Ala Gly Gly Ser Ala
420 425 430
Lys Gln Gly Arg Asn Arg Lys Asn Gln Ala Ile Leu Pro Leu Lys Gly
435 440 445
Lys Ile Leu Asn Val Glu Lys Ala Arg Phe Asp Lys Met Leu Ser Ser
450 455 460
Gln Glu Val Ala Thr Leu Ile Thr Ala Leu Gly Cys Gly Ile Gly Arg
465 470 475 480
Asp Glu Tyr Asn Pro Asp Lys Leu Arg Tyr His Ser Ile Ile Ile Met
485 490 495
Thr Asp Ala Asp Val Asp Gly Ser His Ile Arg Thr Leu Leu Leu Thr
500 505 510
Phe Phe Tyr Arg Gln Met Pro Glu Ile Val Glu Arg Gly His Val Tyr
515 520 525
Ile Ala Gln Pro Pro Leu Tyr Lys Val Lys Lys Gly Lys Gln Glu Gln
530 535 540
Tyr Ile Lys Asp Asp Glu Ala Met Asp Gln Tyr Gln Ile Ser Ile Ala
545 550 555 560
Leu Asp Gly Ala Thr Leu His Thr Asn Ala Ser Ala Pro Ala Leu Ala
565 570 575
Gly Glu Ala Leu Glu Lys Leu Val Ser Glu Tyr Asn Ala Thr Gln Lys
580 585 590
Met Ile Asn Arg Met Glu Arg Arg Tyr Pro Lys Ala Met Leu Lys Glu
595 600 605
Leu Ile Tyr Gln Pro Thr Leu Thr Glu Ala Asp Leu Ser Asp Glu Gln
610 615 620
Thr Val Thr Arg Trp Val Asn Ala Leu Val Ser Glu Leu Asn Asp Lys
625 630 635 640
Glu Gln His Gly Ser Gln Trp Lys Phe Asp Val His Thr Asn Ala Glu
645 650 655
Gln Asn Leu Phe Glu Pro Ile Val Arg Val Arg Thr His Gly Val Asp
660 665 670
Thr Asp Tyr Pro Leu Asp His Glu Phe Ile Thr Gly Gly Glu Tyr Arg
675 680 685
Arg Ile Cys Thr Leu Gly Glu Lys Leu Arg Gly Leu Leu Glu Glu Asp
690 695 700
Ala Phe Ile Glu Arg Gly Glu Arg Arg Gln Pro Val Ala Ser Phe Glu
705 710 715 720
Gln Ala Leu Asp Trp Leu Val Lys Glu Ser Arg Arg Gly Leu Ser Ile
725 730 735
Gln Arg Tyr Lys Gly Leu Gly Glu Met Asn Pro Glu Gln Leu Trp Glu
740 745 750
Thr Thr Met Asp Pro Glu Ser Arg Arg Met Leu Arg Val Thr Val Lys
755 760 765
Asp Ala Ile Ala Ala Asp Gln Leu Phe Thr Thr Leu Met Gly Asp Ala
770 775 780
Val Glu Pro Arg Arg Ala Phe Ile Glu Glu Asn Ala Leu Lys Ala Ala
785 790 795 800
Asn Ile Asp Ile
<210> 83
<211> 187
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 83
Met Val Gly Ser Leu Asn Cys Ile Val Ala Val Ser Gln Asn Met Gly
1 5 10 15
Ile Gly Lys Asn Gly Asp Leu Pro Trp Pro Pro Leu Arg Asn Glu Phe
20 25 30
Arg Tyr Phe Gln Arg Met Thr Thr Thr Ser Ser Val Glu Gly Lys Gln
35 40 45
Asn Leu Val Ile Met Gly Lys Lys Thr Trp Phe Ser Ile Pro Glu Lys
50 55 60
Asn Arg Pro Leu Lys Gly Arg Ile Asn Leu Val Leu Ser Arg Glu Leu
65 70 75 80
Lys Glu Pro Pro Gln Gly Ala His Phe Leu Ser Arg Ser Leu Asp Asp
85 90 95
Ala Leu Lys Leu Thr Glu Gln Pro Glu Leu Ala Asn Lys Val Asp Met
100 105 110
Val Trp Ile Val Gly Gly Ser Ser Val Tyr Lys Glu Ala Met Asn His
115 120 125
Pro Gly His Leu Lys Leu Phe Val Thr Arg Ile Met Gln Asp Phe Glu
130 135 140
Ser Asp Thr Phe Phe Pro Glu Ile Asp Leu Glu Lys Tyr Lys Leu Leu
145 150 155 160
Pro Glu Tyr Pro Gly Val Leu Ser Asp Val Gln Glu Glu Lys Gly Ile
165 170 175
Lys Tyr Lys Phe Glu Val Tyr Glu Lys Asn Asp 180 185
<210> 84
<211> 111
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 84
Met Ala Ser Arg Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly
1 5 10 15
Arg Thr Phe Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly
20 25 30
Met Leu Glu Asp Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys
35 40 45
Pro Phe Lys Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu
50 55 60
Glu Gly Val Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile
65 70 75 80
Ser Pro Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro
85 90 95
Pro His Ala Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105 110
<210> 85
<211> 183
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 85
Met Asn Gly Asp Glu Thr Lys Lys Val Glu Ser Glu Tyr Ile Lys Lys
1 5 10 15
His His Arg His Glu Leu Val Glu Ser Gln Cys Ser Ser Thr Leu Val
20 25 30
Lys His Ile Lys Ala Pro Leu His Leu Val Trp Ser Ile Val Arg Arg
35 40 45
Phe Asp Glu Pro Gln Lys Tyr Lys Pro Phe Ile Ser Arg Cys Val Val
50 55 60
Gln Gly Lys Lys Leu Glu Val Gly Ser Val Arg Glu Val Asp Leu Lys
65 70 75 80
Ser Gly Leu Pro Ala Thr Lys Ser Thr Glu Val Leu Glu Ile Leu Asp
85 90 95
Asp Asn Glu His Ile Leu Gly Ile Arg Ile Val Gly Gly Asp His Arg
100 105 110
Leu Lys Asn Tyr Ser Ser Thr Ile Ser Leu His Ser Glu Thr Ile Asp
115 120 125
Gly Lys Thr Gly Thr Leu Ala Ile Glu Ser Phe Val Val Asp Val Pro
130 135 140
Glu Gly Asn Thr Lys Glu Glu Thr Cys Phe Phe Val Glu Ala Leu Ile
145 150 155 160
Gln Cys Asn Leu Asn Ser Leu Ala Asp Val Thr Glu Arg Leu Gln Ala
165 170 175
Glu Ser Met Glu Lys Lys Ile 180
<210> 86
<211> 161
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 86
Met Glu Thr Ser Gln Lys Tyr His Thr Cys Gly Ser Thr Leu Val Gln
1 5 10 15
Thr Ile Asp Ala Pro Leu Ser Leu Val Trp Ser Ile Leu Arg Arg Phe
20 25 30
Asp Asn Pro Gln Ala Tyr Lys Gln Phe Val Lys Thr Cys Asn Leu Ser
35 40 45
Ser Gly Asp Gly Gly Glu Gly Ser Val Arg Glu Val Thr Val Val Ser
50 55 60
Gly Leu Pro Ala Glu Phe Ser Arg Glu Arg Leu Asp Glu Leu Asp Asp
65 70 75 80
Glu Ser His Val Met Met Ile Ser Ile Ile Gly Gly Asp His Arg Leu
85 90 95
Val Asn Tyr Arg Ser Lys Thr Met Ala Phe Val Ala Ala Asp Thr Glu
100 105 110
Glu Lys Thr Val Val Val Glu Ser Tyr Val Val Asp Val Pro Glu Gly
115 120 125
Asn Ser Glu Glu Glu Thr Thr Ser Phe Ala Asp Thr Ile Val Gly Phe
130 135 140
Asn Leu Lys Ser Leu Ala Lys Leu Ser Glu Arg Val Ala His Leu Lys
145 150 155 160
Leu
<210> 87
<211> 159
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 87
Met Lys Thr Ser Gln Glu Gln His Val Cys Gly Ser Thr Val Val Gln
1 5 10 15
Thr Ile Asn Ala Pro Leu Pro Leu Val Trp Ser Ile Leu Arg Arg Phe
20 25 30
Asp Asn Pro Lys Thr Phe Lys His Phe Val Lys Thr Cys Lys Leu Arg
35 40 45
Ser Gly Asp Gly Gly Glu Gly Ser Val Arg Glu Val Thr Val Val Ser
50 55 60
Asp Leu Pro Ala Ser Phe Ser Leu Glu Arg Leu Asp Glu Leu Asp Asp
65 70 75 80
Glu Ser His Val Met Val Ile Ser Ile Ile Gly Gly Asp His Arg Leu
85 90 95
Val Asn Tyr Gln Ser Lys Thr Thr Val Phe Val Ala Ala Glu Glu Glu
100 105 110
Lys Thr Val Val Val Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn
115 120 125
Thr Glu Glu Glu Thr Thr Leu Phe Ala Asp Thr Ile Val Gly Cys Asn
130 135 140
Leu Arg Ser Leu Ala Lys Leu Ser Glu Lys Met Met Glu Leu Thr
145 150 155
<210> 88
<211> 164
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 88
Met Glu Ser Ser Lys Gln Lys Arg Cys Arg Ser Ser Val Val Glu Thr
1 5 10 15
Ile Glu Ala Pro Leu Pro Leu Val Trp Ser Ile Leu Arg Ser Phe Asp
20 25 30
Lys Pro Gln Ala Tyr Gln Arg Phe Val Lys Ser Cys Thr Met Arg Ser
35 40 45
Gly Gly Gly Gly Gly Lys Gly Gly Glu Gly Lys Gly Ser Val Arg Asp
50 55 60
Val Thr Leu Val Ser Gly Phe Pro Ala Asp Phe Ser Thr Glu Arg Leu
65 70 75 80
Glu Glu Leu Asp Asp Glu Ser His Val Met Val Val Ser Ile Ile Gly
85 90 95
Gly Asn His Arg Leu Val Asn Tyr Lys Ser Lys Thr Lys Val Val Ala
100 105 110
Ser Pro Glu Asp Met Ala Lys Lys Thr Val Val Val Glu Ser Tyr Val
115 120 125
Val Asp Val Pro Glu Gly Thr Ser Glu Glu Asp Thr Ile Phe Phe Val
130 135 140
Asp Asn Ile Ile Arg Tyr Asn Leu Thr Ser Leu Ala Lys Leu Thr Lys
145 150 155 160
Lys Met Met Lys
<210> 89
<211> 221
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 89
Met Ala Asn Ser Glu Ser Ser Ser Ser Pro Val Asn Glu Glu Glu Asn
1 5 10 15
Ser Gln Arg Ile Ser Thr Leu His His Gln Thr Met Pro Ser Asp Leu
20 25 30
Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln Ser Ile Ala Glu Phe His
35 40 45
Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser Ser Leu Leu Ala Gln Arg
50 55 60
Ile His Ala Pro Pro Glu Thr Val Trp Ser Val Val Arg Arg Phe Asp
65 70 75 80
Arg Pro Gln Ile Tyr Lys His Phe Ile Lys Ser Cys Asn Val Ser Glu
85 90 95
Asp Phe Glu Met Arg Val Gly Cys Thr Arg Asp Val Asn Val Ile Ser
100 105 110
Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg Leu Asp Leu Leu Asp Asp
115 120 125
Asp Arg Arg Val Thr Gly Phe Ser Ile Thr Gly Gly Glu His Arg Leu
130 135 140
Arg Asn Tyr Lys Ser Val Thr Thr Val His Arg Phe Glu Lys Glu Glu
145 150 155 160
Glu Glu Glu Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val Val Asp
165 170 175
Val Pro Glu Gly Asn Ser Glu Glu Asp Thr Arg Leu Phe Ala Asp Thr
180 185 190
Val Ile Arg Leu Asn Leu Gln Lys Leu Ala Ser Ile Thr Glu Ala Met
195 200 205
Asn Arg Asn Asn Asn Asn Asn Asn Ser Ser Gln Val Arg
210 215 220
<210> 90
<211> 190
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 90
Met Ser Ser Ser Pro Ala Val Lys Gly Leu Thr Asp Glu Glu Gln Lys
1 5 10 15
Thr Leu Glu Pro Val Ile Lys Thr Tyr His Gln Phe Glu Pro Asp Pro
20 25 30
Thr Thr Cys Thr Ser Leu Ile Thr Gln Arg Ile His Ala Pro Ala Ser
35 40 45
Val Val Trp Pro Leu Ile Arg Arg Phe Asp Asn Pro Glu Arg Tyr Lys
50 55 60
His Phe Val Lys Arg Cys Arg Leu Ile Ser Gly Asp Gly Asp Val Gly
65 70 75 80
Ser Val Arg Glu Val Thr Val Ile Ser Gly Leu Pro Ala Ser Thr Ser
85 90 95
Thr Glu Arg Leu Glu Phe Val Asp Asp Asp His Arg Val Leu Ser Phe
100 105 110
Arg Val Val Gly Gly Glu His Arg Leu Lys Asn Tyr Lys Ser Val Thr
115 120 125
Ser Val Asn Glu Phe Leu Asn Gln Asp Ser Gly Lys Val Tyr Thr Val
130 135 140
Val Leu Glu Ser Tyr Thr Val Asp Ile Pro Glu Gly Asn Thr Glu Glu
145 150 155 160
Asp Thr Lys Met Phe Val Asp Thr Val Val Lys Leu Asn Leu Gln Lys
165 170 175
Leu Gly Val Ala Ala Thr Ser Ala Pro Met His Asp Asp Glu
180 185 190
<210> 91
<211> 209
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 91
Met Asn Leu Ala Pro Ile His Asp Pro Ser Ser Ser Ser Thr Thr Thr
1 5 10 15
Thr Ser Ser Ser Thr Pro Tyr Gly Leu Thr Lys Asp Glu Phe Ser Thr
20 25 30
Leu Asp Ser Ile Ile Arg Thr His His Thr Phe Pro Arg Ser Pro Asn
35 40 45
Thr Cys Thr Ser Leu Ile Ala His Arg Val Asp Ala Pro Ala His Ala
50 55 60
Ile Trp Arg Phe Val Arg Asp Phe Ala Asn Pro Asn Lys Tyr Lys His
65 70 75 80
Phe Ile Lys Ser Cys Thr Ile Arg Val Asn Gly Asn Gly Ile Lys Glu
85 90 95
Ile Lys Val Gly Thr Ile Arg Glu Val Ser Val Val Ser Gly Leu Pro
100 105 110
Ala Ser Thr Ser Val Glu Ile Leu Glu Val Leu Asp Glu Glu Lys Arg
115 120 125
Ile Leu Ser Phe Arg Val Leu Gly Gly Glu His Arg Leu Asn Asn Tyr
130 135 140
Arg Ser Val Thr Ser Val Asn Glu Phe Val Val Leu Glu Lys Asp Lys
145 150 155 160
Lys Lys Arg Val Tyr Ser Val Val Leu Glu Ser Tyr Ile Val Asp Ile
165 170 175
Pro Gln Gly Asn Thr Glu Glu Asp Thr Arg Met Phe Val Asp Thr Val
180 185 190
Val Lys Ser Asn Leu Gln Asn Leu Ala Val Ile Ser Thr Ala Ser Pro
195 200 205
Thr
<210> 92
<211> 207
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 92
Met Leu Ala Val His Arg Pro Ser Ser Ala Val Ser Asp Gly Asp Ser
1 5 10 15
Val Gln Ile Pro Met Met Ile Ala Ser Phe Gln Lys Arg Phe Pro Ser
20 25 30
Leu Ser Arg Asp Ser Thr Ala Ala Arg Phe His Thr His Glu Val Gly
35 40 45
Pro Asn Gln Cys Cys Ser Ala Val Ile Gln Glu Ile Ser Ala Pro Ile
50 55 60
Ser Thr Val Trp Ser Val Val Arg Arg Phe Asp Asn Pro Gln Ala Tyr
65 70 75 80
Lys His Phe Leu Lys Ser Cys Ser Val Ile Gly Gly Asp Gly Asp Asn
85 90 95
Val Gly Ser Leu Arg Gln Val His Val Val Ser Gly Leu Pro Ala Ala
100 105 110
Ser Ser Thr Glu Arg Leu Asp Ile Leu Asp Asp Glu Arg His Val Ile
115 120 125
Ser Phe Ser Val Val Gly Gly Asp His Arg Leu Ser Asn Tyr Arg Ser
130 135 140
Val Thr Thr Leu His Pro Ser Pro Ile Ser Gly Thr Val Val Val Glu
145 150 155 160
Ser Tyr Val Val Asp Val Pro Pro Gly Asn Thr Lys Glu Glu Thr Cys
165 170 175
Asp Phe Val Asp Val Ile Val Arg Cys Asn Leu Gln Ser Leu Ala Lys
180 185 190
Ile Ala Glu Asn Thr Ala Ala Glu Ser Lys Lys Lys Met Ser Leu
195 200 205
<210> 93
<211> 203
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 93
Met Arg Ser Pro Val Gln Leu Gln His Gly Ser Asp Ala Thr Asn Gly
1 5 10 15
Phe His Thr Leu Gln Pro His Asp Gln Thr Asp Gly Pro Ile Lys Arg
20 25 30
Val Cys Leu Thr Arg Gly Met His Val Pro Glu His Val Ala Met His
35 40 45
His Thr His Asp Val Gly Pro Asp Gln Cys Cys Ser Ser Val Val Gln
50 55 60
Met Ile His Ala Pro Pro Glu Ser Val Trp Ala Leu Val Arg Arg Phe
65 70 75 80
Asp Asn Pro Lys Val Tyr Lys Asn Phe Ile Arg Gln Cys Arg Ile Val
85 90 95
Gln Gly Asp Gly Leu His Val Gly Asp Leu Arg Glu Val Met Val Val
100 105 110
Ser Gly Leu Pro Ala Val Ser Ser Thr Glu Arg Leu Glu Ile Leu Asp
115 120 125
Glu Glu Arg His Val Ile Ser Phe Ser Val Val Gly Gly Asp His Arg
130 135 140
Leu Lys Asn Tyr Arg Ser Val Thr Thr Leu His Ala Ser Asp Asp Glu
145 150 155 160
Gly Thr Val Val Val Glu Ser Tyr Ile Val Asp Val Pro Pro Gly Asn
165 170 175
Thr Glu Glu Glu Thr Leu Ser Phe Val Asp Thr Ile Val Arg Cys Asn
180 185 190
Leu Gln Ser Leu Ala Arg Ser Thr Asn Arg Gln 195 200
<210> 94
<211> 215
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 94
Met Pro Thr Ser Ile Gln Phe Gln Arg Ser Ser Thr Ala Ala Glu Ala
1 5 10 15
Ala Asn Ala Thr Val Arg Asn Tyr Pro His His His Gln Lys Gln Val
20 25 30
Gln Lys Val Ser Leu Thr Arg Gly Met Ala Asp Val Pro Glu His Val
35 40 45
Glu Leu Ser His Thr His Val Val Gly Pro Ser Gln Cys Phe Ser Val
50 55 60
Val Val Gln Asp Val Glu Ala Pro Val Ser Thr Val Trp Ser Ile Leu
65 70 75 80
Ser Arg Phe Glu His Pro Gln Ala Tyr Lys His Phe Val Lys Ser Cys
85 90 95
His Val Val Ile Gly Asp Gly Arg Glu Val Gly Ser Val Arg Glu Val
100 105 110
Arg Val Val Ser Gly Leu Pro Ala Ala Phe Ser Leu Glu Arg Leu Glu
115 120 125
Ile Met Asp Asp Asp Arg His Val Ile Ser Phe Ser Val Val Gly Gly
130 135 140
Asp His Arg Leu Met Asn Tyr Lys Ser Val Thr Thr Val His Glu Ser
145 150 155 160
Glu Glu Asp Ser Asp Gly Lys Lys Arg Thr Arg Val Val Glu Ser Tyr
165 170 175
Val Val Asp Val Pro Ala Gly Asn Asp Lys Glu Glu Thr Cys Ser Phe
180 185 190
Ala Asp Thr Ile Val Arg Cys Asn Leu Gln Ser Leu Ala Lys Leu Ala
195 200 205
Glu Asn Thr Ser Lys Phe Ser 210 215
<210> 95
<211> 211
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 95
Met Glu Met Ile Gly Gly Asp Asp Thr Asp Thr Glu Met Tyr Gly Ala
1 5 10 15
Leu Val Thr Ala Gln Ser Leu Arg Leu Arg His Leu His His Cys Arg
20 25 30
Glu Asn Gln Cys Thr Ser Val Leu Val Lys Tyr Ile Gln Ala Pro Val
35 40 45
His Leu Val Trp Ser Leu Val Arg Arg Phe Asp Gln Pro Gln Lys Tyr
50 55 60
Lys Pro Phe Ile Ser Arg Cys Thr Val Asn Gly Asp Pro Glu Ile Gly
65 70 75 80
Cys Leu Arg Glu Val Asn Val Lys Ser Gly Leu Pro Ala Thr Thr Ser
85 90 95
Thr Glu Arg Leu Glu Gln Leu Asp Asp Glu Glu His Ile Leu Gly Ile
100 105 110
Asn Ile Ile Gly Gly Asp His Arg Leu Lys Asn Tyr Ser Ser Ile Leu
115 120 125
Thr Val His Pro Glu Met Ile Asp 130 135
Glu Ser Phe Val Val Asp Val Pro
145 150
Cys Tyr Phe Val Glu Ser Leu Ile 165
Cys Val Ser Glu Arg Leu Ala Ala 180
Thr Phe Cys Asn Ala Ser Asn Gly 195 200
Thr Asn Leu
210
<210> <211> <212> <213>
<220>
<223> Синтетический полипептид
<400> 96
Gly Arg Ser Gly Thr Met Val Met 140
Gln Gly Asn Thr Lys Asp Asp Thr 155 160
Lys Cys Asn Leu Lys Ser Leu Ala 170 175
Gln Asp Ile Thr Asn Ser Ile Ala 185 190
Tyr Arg Glu Lys Asn His Thr Glu 205
Met Glu Ala Asn Gly Ile Glu Asn Leu Thr Asn Pro Asn Gln Glu Arg
1 5 10 15
Glu Phe Ile Arg Arg His His Lys His Glu Leu Val Asp Asn Gln Cys
20 25 30
Ser Ser Thr Leu Val Lys His Ile Asn Ala Pro Val His Ile Val Trp
35 40 45
Ser Leu Val Arg Arg Phe Asp Gln Pro Gln Lys Tyr Lys Pro Phe Ile
50 55 60
Ser Arg Cys Val Val Lys Gly Asn Met Glu Ile Gly Thr Val Arg Glu
65 70 75 80
Val Asp Val Lys Ser Gly Leu Pro Ala Thr Arg Ser Thr Glu Arg Leu
85 90 95
Glu Leu Leu Asp Asp Asn Glu His Ile Leu Ser Ile Arg Ile Val Gly
100 105 110
Gly Asp His Arg Leu Lys Asn Tyr Ser Ser Ile Ile Ser Leu His Pro
115 120 125
Glu Thr Ile Glu Gly Arg Ile Gly Thr Leu Val Ile Glu Ser Phe Val
130 135 140
Val Asp Val Pro Glu Gly Asn Thr Lys Asp Glu Thr Cys Tyr Phe Val
145 150 155 160
Glu Ala Leu Ile Lys Cys Asn Leu Lys Ser Leu Ala Asp Ile Ser Glu
165 170 175
Arg Leu Ala Val Gln Asp Thr Thr Glu Ser Arg Val 180 185
<210> 97
<211> 187
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 97
Met Met Asp Gly Val Glu Gly Gly Thr Ala Met Tyr Gly Gly Leu Glu
1 5 10 15
Thr Val Gln Tyr Val Arg Thr His His Gln His Leu Cys Arg Glu Asn
20 25 30
Gln Cys Thr Ser Ala Leu Val Lys His Ile Lys Ala Pro Leu His Leu
35 40 45
Val Trp Ser Leu Val Arg Arg Phe Asp Gln Pro Gln Lys Tyr Lys Pro
50 55 60
Phe Val Ser Arg Cys Thr Val Ile Gly Asp Pro Glu Ile Gly Ser Leu
65 70 75 80
Arg Glu Val Asn Val Lys Ser Gly Leu Pro Ala Thr Thr Ser Thr Glu
85 90 95
Arg Leu Glu Leu Leu Asp Asp Glu Glu His Ile Leu Gly Ile Lys Ile
100 105 110
Ile Gly Gly Asp His Arg Leu Lys Asn Tyr Ser Ser Ile Leu Thr Val
115 120 125
His Pro Glu Ile Ile Glu Gly Arg Ala Gly Thr Met Val Ile Glu Ser
130 135 140
Phe Val Val Asp Val Pro Gln Gly Asn Thr Lys Asp Glu Thr Cys Tyr
145 150 155 160
Phe Val Glu Ala Leu Ile Arg Cys Asn Leu Lys Ser Leu Ala Asp Val
165 170 175
Ser Glu Arg Leu Ala Ser Gln Asp Ile Thr Gln 180 185
<210> 98
<211> 191
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 98
Met Pro Ser Glu Leu Thr Pro Glu Glu Arg Ser Glu Leu Lys Asn Ser
1 5 10 15
Ile Ala Glu Phe His Thr Tyr Gln Leu Asp Pro Gly Ser Cys Ser Ser
20 25 30
Leu His Ala Gln Arg Ile His Ala Pro Pro Glu Leu Val Trp Ser Ile
35 40 45
Val Arg Arg Phe Asp Lys Pro Gln Thr Tyr Lys His Phe Ile Lys Ser
50 55 60
Cys Ser Val Glu Gln Asn Phe Glu Met Arg Val Gly Cys Thr Arg Asp
65 70 75 80
Val Ile Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Thr Glu Arg Leu
85 90 95
Asp Ile Leu Asp Asp Glu Arg Arg Val Thr Gly Phe Ser Ile Ile Gly
100 105 110
Gly Glu His Arg Leu Thr Asn Tyr Lys Ser Val Thr Thr Val His Arg
115 120 125
Phe Glu Lys Glu Asn Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val
130 135 140
Val Asp Met Pro Glu Gly Asn Ser Glu Asp Asp Thr Arg Met Phe Ala
145 150 155 160
Asp Thr Val Val Lys Leu Asn Leu Gln Lys Leu Ala Thr Val Ala Glu
165 170 175
Ala Met Ala Arg Asn Ser Gly Asp Gly Ser Gly Ser Gln Val Thr
180 185 190
<210> 99
<211> 434
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 99
Met Glu Glu Val Ser Pro Ala Ile Ala Gly Pro Phe Arg Pro Phe Ser
1 5 10 15
Glu Thr Gln Met Asp Phe Thr Gly Ile Arg Leu Gly Lys Gly Tyr Cys
20 25 30
Asn Asn Gln Tyr Ser Asn Gln Asp Ser Glu Asn Gly Asp Leu Met Val
35 40 45
Ser Leu Pro Glu Thr Ser Ser Cys Ser Val Ser Gly Ser His Gly Ser
50 55 60
Glu Ser Arg Lys Val Leu Ile Ser Arg Ile Asn Ser Pro Asn Leu Asn
65 70 75 80
Met Lys Glu Ser Ala Ala Ala Asp Ile Val Val Val Asp Ile Ser Ala
85 90 95
Gly Asp Glu Ile Asn Gly Ser Asp Ile Thr Ser Glu Lys Lys Met Ile
100 105 110
Ser Arg Thr Glu Ser Arg Ser Leu Phe Glu Phe Lys Ser Val Pro Leu
115 120 125
Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Asp Ala
130 135 140
Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met Leu
145 150 155 160
Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val Tyr
165 170 175
Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg Met
180 185 190
His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu Cys
195 200 205
Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn Ser
210 215 220
Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr Val
225 230 235 240
Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe Val
245 250 255
Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr Ala
260 265 270
Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala Ala
275 280 285
Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala Arg
290 295 300
Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr Leu
305 310 315 320
Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg Val
325 330 335
Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp Val
340 345 350
Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu Leu
355 360 365
Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala Asp
370 375 380
Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala Glu
385 390 395 400
Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile Ser
405 410 415
Val Val Val Val Asp Leu Lys Pro Arg Arg Lys Leu Lys Ser Lys Pro
420 425 430
<210> 100
<211> 423
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 100
Met Asp Glu Val Ser Pro Ala Val Ala Val Pro Phe Arg Pro Phe Thr
1 5 10 15
Asp Pro His Ala Gly Leu Arg Gly Tyr Cys Asn Gly Glu Ser Arg Val
20 25 30
Thr Leu Pro Glu Ser Ser Cys Ser Gly Asp Gly Ala Met Lys Asp Ser
35 40 45
Ser Phe Glu Ile Asn Thr Arg Gln Asp Ser Leu Thr Ser Ser Ser Ser
50 55 60
Ala Met Ala Gly Val Asp Ile Ser Ala Gly Asp Glu Ile Asn Gly Ser
65 70 75 80
Asp Glu Phe Asp Pro Arg Ser Met Asn Gln Ser Glu Lys Lys Val Leu
85 90 95
Ser Arg Thr Glu Ser Arg Ser Leu Phe Glu Phe Lys Cys Val Pro Leu
100 105 110
Tyr Gly Val Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Asp Ser
115 120 125
Val Ser Thr Ile Pro Arg Phe Leu Gln Val Ser Ser Ser Ser Leu Leu
130 135 140
Asp Gly Arg Val Thr Asn Gly Phe Asn Pro His Leu Ser Ala His Phe
145 150 155 160
Phe Gly Val Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys
165 170 175
Arg Glu Arg Met His Leu Ala Leu Thr Glu Glu Ile Val Lys Glu Lys
180 185 190
Pro Glu Phe Cys Asp Gly Asp Thr Trp Gln Glu Lys Trp Lys Lys Ala
195 200 205
Leu Phe Asn Ser Phe Met Arg Val Asp Ser Glu Ile Glu Thr Val Ala
210 215 220
His Ala Pro Glu Thr Val Gly Ser Thr Ser Val Val Ala Val Val Phe
225 230 235 240
Pro Thr His Ile Phe Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu
245 250 255
Cys Arg Gly Lys Thr Pro Leu Ala Leu Ser Val Asp His Lys Pro Asp
260 265 270
Arg Asp Asp Glu Ala Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile
275 280 285
Arg Trp Asn Gly Ala Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser
290 295 300
Ile Gly Asp Arg Tyr Leu Lys Pro Ser Val Ile Pro Asp Pro Glu Val
305 310 315 320
Thr Ser Val Arg Arg Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser
325 330 335
Asp Gly Leu Trp Asp Val Met Thr Asn Glu Glu Val Cys Asp Leu Ala
340 345 350
Arg Lys Arg Ile Leu Leu Trp His Lys Lys Asn Ala Met Ala Gly Glu
355 360 365
Ala Leu Leu Pro Ala Glu Lys Arg Gly Glu Gly Lys Asp Pro Ala Ala
370 375 380
Met Ser Ala Ala Glu Tyr Leu Ser Lys Met Ala Leu Gln Lys Gly Ser
385 390 395 400
Lys Asp Asn Ile Ser Val Val Val Val Asp Leu Lys Gly Ile Arg Lys
405 410 415
Phe Lys Ser Lys Ser Leu Asn
420
<210> 101
<211> 612
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
Met Lys Met Asp Lys Lys Thr Ile Val Trp Phe Arg Arg Asp Leu Arg
1 5 10 15
Ile Glu Asp Asn Pro Ala Leu Ala Ala Ala Ala His Glu Gly Ser Val
20 25 30
Phe Pro Val Phe Ile Trp Cys Pro Glu Glu Glu Gly Gln Phe Tyr Pro
35 40 45
Gly Arg Ala Ser Arg Trp Trp Met Lys Gln Ser Leu Ala His Leu Ser
50 55 60
Gln Ser Leu Lys Ala Leu Gly Ser Asp Leu Thr Leu Ile Lys Thr His
65 70 75 80
Asn Thr Ile Ser Ala Ile Leu Asp Cys Ile Arg Val Thr Gly Ala Thr
85 90 95
Lys Val Val Phe Asn His Leu Tyr Asp Pro Val Ser Leu Val Arg Asp
100 105 110
His Thr Val Lys Glu Lys Leu Val Glu Arg Gly Ile Ser Val Gln Ser
115 120 125
Tyr Asn Gly Asp Leu Leu Tyr Glu Pro Trp Glu Ile Tyr Cys Glu Lys
130 135 140
Gly Lys Pro Phe Thr Ser Phe Asn Ser Tyr Trp Lys Lys Cys Leu Asp
145 150 155 160
Met Ser Ile Glu Ser Val Met Leu Pro Pro Pro Trp Arg Leu Met Pro
165 170 175
Ile Thr Ala Ala Ala Glu Ala Ile Trp Ala Cys Ser Ile Glu Glu Leu
180 185 190
Gly Leu Glu Asn Glu Ala Glu Lys Pro Ser Asn Ala Leu Leu Thr Arg
195 200 205
Ala Trp Ser Pro Gly Trp Ser Asn Ala Asp Lys Leu Leu Asn Glu Phe
210 215 220
Ile Glu Lys Gln Leu Ile Asp Tyr Ala Lys Asn Ser Lys Lys Val Val
225 230 235 240
Gly Asn Ser Thr Ser Leu Leu Ser Pro Tyr Leu His Phe Gly Glu Ile
245 250 255
Ser Val Arg His Val Phe Gln Cys Ala Arg Met Lys Gln Ile Ile Trp
260 265 270
Ala Arg Asp Lys Asn Ser Glu Gly Glu Glu Ser Ala Asp Leu Phe Leu
275 280 285
Arg Gly Ile Gly Leu Arg Glu Tyr Ser Arg Tyr Ile Cys Phe Asn Phe
290 295 300
Pro Phe Thr His Glu Gln Ser Leu Leu Ser His Leu Arg Phe Phe Pro
305 310 315 320
Trp Asp Ala Asp Val Asp Lys Phe Lys Ala Trp Arg Gln Gly Arg Thr
325 330 335
Gly Tyr Pro Leu Val Asp Ala Gly Met Arg Glu Leu Trp Ala Thr Gly
340 345 350
Trp Met His Asn Arg Ile Arg Val Ile Val Ser Ser Phe Ala Val Lys
355 360 365
Phe Leu Leu Leu Pro Trp Lys Trp Gly Met Lys Tyr Phe Trp Asp Thr
370 375 380
Leu Leu Asp Ala Asp Leu Glu Cys Asp Ile Leu Gly Trp Gln Tyr Ile
385 390 395 400
Ser Gly Ser Ile Pro Asp Gly His Glu Leu Asp Arg Leu Asp Asn Pro
405 410 415
Ala Leu Gln Gly Ala Lys Tyr Asp Pro Glu Gly Glu Tyr Ile Arg Gln
420 425 430
Trp Leu Pro Glu Leu Ala Arg Leu Pro Thr Glu Trp Ile His His Pro
435 440 445
Trp Asp Ala Pro Leu Thr Val Leu Lys Ala Ser Gly Val Glu Leu Gly
450 455 460
Thr Asn Tyr Ala Lys Pro Ile Val Asp Ile Asp Thr Ala Arg Glu Leu
465 470 475 480
Leu Ala Lys Ala Ile Ser Arg Thr Arg Glu Ala Gln Ile Met Ile Gly
485 490 495
Ala Ala Pro Asp Glu Ile Val Ala Asp Ser Phe Glu Ala Leu Gly Ala
500 505 510
Asn Thr Ile Lys Glu Pro Gly Leu Cys Pro Ser Val Ser Ser Asn Asp
515 520 525
Gln Gln Val Pro Ser Ala Val Arg Tyr Asn Gly Ser Lys Arg Val Lys
530 535 540
Pro Glu Glu Glu Glu Glu Arg Asp Met Lys Lys Ser Arg Gly Phe Asp
545 550 555 560
Glu Arg Glu Leu Phe Ser Thr Ala Glu Ser Ser Ser Ser Ser Ser Val
565 570 575
Phe Phe Val Ser Gln Ser Cys Ser Leu Ala Ser Glu Gly Lys Asn Leu
580 585 590
Glu Gly Ile Gln Asp Ser Ser Asp Gln Ile Thr Thr Ser Leu Gly Lys
595 600 605
Asn Gly Cys Lys
610
<210> 102
<211> 335
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 102
Met Asn Gly Ala Ile Gly Gly Asp Leu Leu Leu Asn Phe Pro Asp Met
1 5 10 15
Ser Val Leu Glu Arg Gln Arg Ala His Leu Lys Tyr Leu Asn Pro Thr
20 25 30
Phe Asp Ser Pro Leu Ala Gly Phe Phe Ala Asp Ser Ser Met Ile Thr
35 40 45
Gly Gly Glu Met Asp Ser Tyr Leu Ser Thr Ala Gly Leu Asn Leu Pro
50 55 60
Met Met Tyr Gly Glu Thr Thr Val Glu Gly Asp Ser Arg Leu Ser Ile
65 70 75 80
Ser Pro Glu Thr Thr Leu Gly Thr Gly Asn Phe Lys Lys Arg Lys Phe
85 90 95
Asp Thr Glu Thr Lys Asp Cys Asn Glu Lys Lys Lys Lys Met Thr Met
100 105 110
Asn Arg Asp Asp Leu Val Glu Glu Gly Glu Glu Glu Lys Ser Lys Ile
115 120 125
Thr Glu Gln Asn Asn Gly Ser Thr Lys Ser Ile Lys Lys Met Lys His
130 135 140
Lys Ala Lys Lys Glu Glu Asn Asn Phe Ser Asn Asp Ser Ser Lys Val
145 150 155 160
Thr Lys Glu Leu Glu Lys Thr Asp Tyr Ile His Val Arg Ala Arg Arg
165 170 175
Gly Gln Ala Thr Asp Ser His Ser Ile Ala Glu Arg Val Arg Arg Glu
180 185 190
Lys Ile Ser Glu Arg Met Lys Phe Leu Gln Asp Leu Val Pro Gly Cys
195 200 205
Asp Lys Ile Thr Gly Lys Ala Gly Met Leu Asp Glu Ile Ile Asn Tyr
210 215 220
Val Gln Ser Leu Gln Arg Gln Ile Glu Phe Leu Ser Met Lys Leu Ala
225 230 235 240
Ile Val Asn Pro Arg Pro Asp Phe Asp Met Asp Asp Ile Phe Ala Lys
245 250 255
Glu Val Ala Ser Thr Pro Met Thr Val Val Pro Ser Pro Glu Met Val
260 265 270
Leu Ser Gly Tyr Ser His Glu Met Val His Ser Gly Tyr Ser Ser Glu
275 280 285
Met Val Asn Ser Gly Tyr Leu His Val Asn Pro Met Gln Gln Val Asn
290 295 300
Thr Ser Ser Asp Pro Leu Ser Cys Phe Asn Asn Gly Glu Ala Pro Ser
305 310 315 320
Met Trp Asp Ser His Val Gln Asn Leu Tyr Gly Asn Leu Gly Val
325 330 335
<210> 103
<211> 533
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 103
Met Lys Arg Asp His His His His His His Gln Asp Lys Lys Thr Met
1 5 10 15
Met Met Asn Glu Glu Asp Asp Gly Asn Gly Met Asp Glu Leu Leu Ala
20 25 30
Val Leu Gly Tyr Lys Val Arg Ser Ser Glu Met Ala Asp Val Ala Gln
35 40 45
Lys Leu Glu Gln Leu Glu Val Met Met Ser Asn Val Gln Glu Asp Asp
50 55 60
Leu Ser Gln Leu Ala Thr Glu Thr Val His Tyr Asn Pro Ala Glu Leu
65 70 75 80
Tyr Thr Trp Leu Asp Ser Met Leu Thr Asp Leu Asn Pro Pro Ser Ser
85 90 95
Asn Ala Glu Tyr Asp Leu Lys Ala Ile Pro Gly Asp Ala Ile Leu Asn
100 105 110
Gln Phe Ala Ile Asp Ser Ala Ser Ser Ser Asn Gln Gly Gly Gly Gly
115 120 125
Asp Thr Tyr Thr Thr Asn Lys Arg Leu Lys Cys Ser Asn Gly Val Val
130 135 140
Glu Thr Thr Thr Ala Thr Ala Glu Ser Thr Arg His Val Val Leu Val
145 150 155 160
Asp Ser Gln Glu Asn Gly Val Arg Leu Val His Ala Leu Leu Ala Cys
165 170 175
Ala Glu Ala Val Gln Lys Glu Asn Leu Thr Val Ala Glu Ala Leu Val
180 185 190
Lys Gln Ile Gly Phe Leu Ala Val Ser Gln Ile Gly Ala Met Arg Lys
195 200 205
Val Ala Thr Tyr Phe Ala Glu Ala Leu Ala Arg Arg Ile Tyr Arg Leu
210 215 220
Ser Pro Ser Gln Ser Pro Ile Asp His Ser Leu Ser Asp Thr Leu Gln
225 230 235 240
Met His Phe Tyr Glu Thr Cys Pro Tyr Leu Lys Phe Ala His Phe Thr
245 250 255
Ala Asn Gln Ala Ile Leu Glu Ala Phe Gln Gly Lys Lys Arg Val His
260 265 270
Val Ile Asp Phe Ser Met Ser Gln Gly Leu Gln Trp Pro Ala Leu Met
275 280 285
Gln Ala Leu Ala Leu Arg Pro Gly Gly Pro Pro Val Phe Arg Leu Thr
290 295 300
Gly Ile Gly Pro Pro Ala Pro Asp Asn Phe Asp Tyr Leu His Glu Val
305 310 315 320
Gly Cys Lys Leu Ala His Leu Ala Glu Ala Ile His Val Glu Phe Glu
325 330 335
Tyr Arg Gly Phe Val Ala Asn Thr Leu Ala Asp Leu Asp Ala Ser Met
340 345 350
Leu Glu Leu Arg Pro Ser Glu Ile Glu Ser Val Ala Val Asn Ser Val
355 360 365
Phe Glu Leu His Lys Leu Leu Gly Arg Pro Gly Ala Ile Asp Lys Val
370 375 380
Leu Gly Val Val Asn Gln Ile Lys Pro Glu Ile Phe Thr Val Val Glu
385 390 395 400
Gln Glu Ser Asn His Asn Ser Pro Ile Phe Leu Asp Arg Phe Thr Glu
405 410 415
Ser Leu His Tyr Tyr Ser Thr Leu Phe Asp Ser Leu Glu Gly Val Pro
420 425 430
Ser Gly Gln Asp Lys Val Met Ser Glu Val Tyr Leu Gly Lys Gln Ile
435 440 445
Cys Asn Val Val Ala Cys Asp Gly Pro Asp Arg Val Glu Arg His Glu
450 455 460
Thr Leu Ser Gln Trp Arg Asn Arg Phe Gly Ser Ala Gly Phe Ala Ala
465 470 475 480
Ala His Ile Gly Ser Asn Ala Phe Lys Gln Ala Ser Met Leu Leu Ala
485 490 495
Leu Phe Asn Gly Gly Glu Gly Tyr Arg Val Glu Glu Ser Asp Gly Cys
500 505 510
Leu Met Leu Gly Trp His Thr Arg Pro Leu Ile Ala Thr Ser Ala Trp
515 520 525
Lys Leu Ser Thr Asn
530
<210> 104
<211> 345
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 104
Met Ala Ala Ser Asp Glu Val Asn Leu Ile Glu Ser Arg Thr Val Val
1 5 10 15
Pro Leu Asn Thr Trp Val Leu Ile Ser Asn Phe Lys Val Ala Tyr Asn
20 25 30
Ile Leu Arg Arg Pro Asp Gly Thr Phe Asn Arg His Leu Ala Glu Tyr
35 40 45
Leu Asp Arg Lys Val Thr Ala Asn Ala Asn Pro Val Asp Gly Val Phe
50 55 60
Ser Phe Asp Val Leu Ile Asp Arg Arg Ile Asn Leu Leu Ser Arg Val
65 70 75 80
Tyr Arg Pro Ala Tyr Ala Asp Gln Glu Gln Pro Pro Ser Ile Leu Asp
85 90 95
Leu Glu Lys Pro Val Asp Gly Asp Ile Val Pro Val Ile Leu Phe Phe
100 105 110
His Gly Gly Ser Phe Ala His Ser Ser Ala Asn Ser Ala Ile Tyr Asp
115 120 125
Thr Leu Cys Arg Arg Leu Val Gly Leu Cys Lys Cys Val Val Val Ser
130 135 140
Val Asn Tyr Arg Arg Ala Pro Glu Asn Pro Tyr Pro Cys Ala Tyr Asp
145 150 155 160
Asp Gly Trp Ile Ala Leu Asn Trp Val Asn Ser Arg Ser Trp Leu Lys
165 170 175
Ser Lys Lys Asp Ser Lys Val His Ile Phe Leu Ala Gly Asp Ser Ser
180 185 190
Gly Gly Asn Ile Ala His Asn Val Ala Leu Arg Ala Gly Glu Ser Gly
195 200 205
Ile Asp Val Leu Gly Asn Ile Leu Leu Asn Pro Met Phe Gly Gly Asn
210 215 220
Glu Arg Thr Glu Ser Glu Lys Ser Leu Asp Gly Lys Tyr Phe Val Thr
225 230 235 240
Val Arg Asp Arg Asp Trp Tyr Trp Lys Ala Phe Leu Pro Glu Gly Glu
245 250 255
Asp Arg Glu His Pro Ala Cys Asn Pro Phe Ser Pro Arg Gly Lys Ser
260 265 270
Leu Glu Gly Val Ser Phe Pro Lys Ser Leu Val Val Val Ala Gly Leu
275 280 285
Asp Leu Ile Arg Asp Trp Gln Leu Ala Tyr Ala Glu Gly Leu Lys Lys
290 295 300
Ala Gly Gln Glu Val Lys Leu Met His Leu Glu Lys Ala Thr Val Gly
305 310 315 320
Phe Tyr Leu Leu Pro Asn Asn Asn His Phe His Asn Val Met Asp Glu
325 330 335
Ile Ser Ala Phe Val Asn Ala Glu Cys 340 345
<210> 105
<211> 358
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 105
Met Ala Gly Gly Asn Glu Val Asn Leu Asn Glu Cys Lys Arg Ile Val
1 5 10 15
Pro Leu Asn Thr Trp Val Leu Ile Ser Asn Phe Lys Leu Ala Tyr Lys
20 25 30
Val Leu Arg Arg Pro Asp Gly Ser Phe Asn Arg Asp Leu Ala Glu Phe
35 40 45
Leu Asp Arg Lys Val Pro Ala Asn Ser Phe Pro Leu Asp Gly Val Phe
50 55 60
Ser Phe Asp His Val Asp Ser Thr Thr Asn Leu Leu Thr Arg Ile Tyr
65 70 75 80
Gln Pro Ala Ser Leu Leu His Gln Thr Arg His Gly Thr Leu Glu Leu
85 90 95
Thr Lys Pro Leu Ser Thr Thr Glu Ile Val Pro Val Leu Ile Phe Phe
100 105 110
His Gly Gly Ser Phe Thr His Ser Ser Ala Asn Ser Ala Ile Tyr Asp
115 120 125
Thr Phe Cys Arg Arg Leu Val Thr Ile Cys Gly Val Val Val Val Ser
130 135 140
Val Asp Tyr Arg Arg Ser Pro Glu His Arg Tyr Pro Cys Ala Tyr Asp
145 150 155 160
Asp Gly Trp Asn Ala Leu Asn Trp Val Lys Ser Arg Val Trp Leu Gln
165 170 175
Ser Gly Lys Asp Ser Asn Val Tyr Val Tyr Leu Ala Gly Asp Ser Ser
180 185 190
Gly Gly Asn Ile Ala His Asn Val Ala Val Arg Ala Thr Asn Glu Gly
195 200 205
Val Lys Val Leu Gly Asn Ile Leu Leu His Pro Met Phe Gly Gly Gln
210 215 220
Glu Arg Thr Gln Ser Glu Lys Thr Leu Asp Gly Lys Tyr Phe Val Thr
225 230 235 240
Ile Gln Asp Arg Asp Trp Tyr Trp Arg Ala Tyr Leu Pro Glu Gly Glu
245 250 255
Asp Arg Asp His Pro Ala Cys Asn Pro Phe Gly Pro Arg Gly Gln Ser
260 265 270
Leu Lys Gly Val Asn Phe Pro Lys Ser Leu Val Val Val Ala Gly Leu
275 280 285
Asp Leu Val Gln Asp Trp Gln Leu Ala Tyr Val Asp Gly Leu Lys Lys
290 295 300
Thr Gly Leu Glu Val Asn Leu Leu Tyr Leu Lys Gln Ala Thr Ile Gly
305 310 315 320
Phe Tyr Phe Leu Pro Asn Asn Asp His Phe His Cys Leu Met Glu Glu
325 330 335
Leu Asn Lys Phe Val His Ser Ile Glu Asp Ser Gln Ser Lys Ser Ser
340 345 350
Pro Val Leu Leu Thr Pro
355
<210> 106
<211> 344
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 106
Met Ala Gly Ser Glu Glu Val Asn Leu Ile Glu Ser Lys Thr Val Val
1 5 10 15
Pro Leu Asn Thr Trp Val Leu Ile Ser Asn Phe Lys Leu Ala Tyr Asn
20 25 30
Leu Leu Arg Arg Pro Asp Gly Thr Phe Asn Arg His Leu Ala Glu Phe
35 40 45
Leu Asp Arg Lys Val Pro Ala Asn Ala Asn Pro Val Asn Gly Val Phe
50 55 60
Ser Phe Asp Val Ile Ile Asp Arg Gln Thr Asn Leu Leu Ser Arg Val
65 70 75 80
Tyr Arg Pro Ala Asp Ala Gly Thr Ser Pro Ser Ile Thr Asp Leu Gln
85 90 95
Asn Pro Val Asp Gly Glu Ile Val Pro Val Ile Val Phe Phe His Gly
100 105 110
Gly Ser Phe Ala His Ser Ser Ala Asn Ser Ala Ile Tyr Asp Thr Leu
115 120 125
Cys Arg Arg Leu Val Gly Leu Cys Gly Ala Val Val Val Ser Val Asn
130 135 140
Tyr Arg Arg Ala Pro Glu Asn Arg Tyr Pro Cys Ala Tyr Asp Asp Gly
145 150 155 160
Trp Ala Val Leu Lys Trp Val Asn Ser Ser Ser Trp Leu Arg Ser Lys
165 170 175
Lys Asp Ser Lys Val Arg Ile Phe Leu Ala Gly Asp Ser Ser Gly Gly
180 185 190
Asn Ile Val His Asn Val Ala Val Arg Ala Val Glu Ser Arg Ile Asp
195 200 205
Val Leu Gly Asn Ile Leu Leu Asn Pro Met Phe Gly Gly Thr Glu Arg
210 215 220
Thr Glu Ser Glu Lys Arg Leu Asp Gly Lys Tyr Phe Val Thr Val Arg
225 230 235 240
Asp Arg Asp Trp Tyr Trp Arg Ala Phe Leu Pro Glu Gly Glu Asp Arg
245 250 255
Glu His Pro Ala Cys Ser Pro Phe Gly Pro Arg Ser Lys Ser Leu Glu
260 265 270
Gly Leu Ser Phe Pro Lys Ser Leu Val Val Val Ala Gly Leu Asp Leu
275 280 285
Ile Gln Asp Trp Gln Leu Lys Tyr Ala Glu Gly Leu Lys Lys Ala Gly
290 295 300
Gln Glu Val Lys Leu Leu Tyr Leu Glu Gln Ala Thr Ile Gly Phe Tyr
305 310 315 320
Leu Leu Pro Asn Asn Asn His Phe His Thr Val Met Asp Glu Ile Ala
325 330 335
Ala Phe Val Asn Ala Glu Cys Gln 340
<210> 107
<211> 113
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
Met Gly Gly Leu Glu Pro Cys Ser Arg Leu Leu Leu Leu Pro Leu Leu
1 5 10 15
Leu Ala Val Ser Gly Leu Arg Pro Val Gln Ala Gln Ala Gln Ser Asp
20 25 30
Cys Ser Cys Ser Thr Val Ser Pro Gly Val Leu Ala Gly Ile Val Met
35 40 45
Gly Asp Leu Val Leu Thr Val Leu Ile Ala Leu Ala Val Tyr Phe Leu
50 55 60
Gly Arg Leu Val Pro Arg Gly Arg Gly Ala Ala Glu Ala Ala Thr Arg
65 70 75 80
Lys Gln Arg Ile Thr Glu Thr Glu Ser Pro Tyr Gln Glu Leu Gln Gly
85 90 95
Gln Arg Ser Asp Val Tyr Ser Asp Leu Asn Thr Gln Arg Pro Tyr Tyr
100 105 110
Lys
<210> 108
<211> 112
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 108
Met Gly Gly Leu Glu Pro Cys Ser Arg Leu Leu Leu Leu Pro Leu Leu
1 5 10 15
Leu Ala Val Ser Gly Leu Arg Pro Val Gln Ala Gln Ala Gln Ser Asp
20 25 30
Cys Ser Cys Ser Thr Val Ser Pro Gly Val Leu Ala Gly Ile Val Met
35 40 45
Gly Asp Leu Val Leu Thr Val Leu Ile Ala Leu Ala Val Tyr Phe Leu
50 55 60
Gly Arg Leu Val Pro Arg Gly Arg Gly Ala Ala Glu Ala Thr Arg Lys
65 70 75 80
Gln Arg Ile Thr Glu Thr Glu Ser Pro Tyr Gln Glu Leu Gln Gly Gln
85 90 95
Arg Ser Asp Val Tyr Ser Asp Leu Asn Thr Gln Arg Pro Tyr Tyr Lys
100 105 110
<210> 109
<211> 102
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 109
Met Gly Gly Leu Glu Pro Cys Ser Arg Leu Leu Leu Leu Pro Leu Leu
1 5 10 15
Leu Ala Val Ser Asp Cys Ser Cys Ser Thr Val Ser Pro Gly Val Leu
20 25 30
Ala Gly Ile Val Met Gly Asp Leu Val Leu Thr Val Leu Ile Ala Leu
35 40 45
Ala Val Tyr Phe Leu Gly Arg Leu Val Pro Arg Gly Arg Gly Ala Ala
50 55 60
Glu Ala Ala Thr Arg Lys Gln Arg Ile Thr Glu Thr Glu Ser Pro Tyr
65 70 75 80
Gln Glu Leu Gln Gly Gln Arg Ser Asp Val Tyr Ser Asp Leu Asn Thr
85 90 95
Gln Arg Pro Tyr Tyr Lys
100
<210> 110
<211> 101
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 110
Met Gly Gly Leu Glu Pro Cys Ser Arg Leu Leu Leu Leu Pro Leu Leu
1 5 10 15
Leu Ala Val Ser Asp Cys Ser Cys Ser Thr Val Ser Pro Gly Val Leu
20 25 30
Ala Gly Ile Val Met Gly Asp Leu Val Leu Thr Val Leu Ile Ala Leu
35 40 45
Ala Val Tyr Phe Leu Gly Arg Leu Val Pro Arg Gly Arg Gly Ala Ala
50 55 60
Glu Ala Thr Arg Lys Gln Arg Ile Thr Glu Thr Glu Ser Pro Tyr Gln
65 70 75 80
Glu Leu Gln Gly Gln Arg Ser Asp Val Tyr Ser Asp Leu Asn Thr Gln
85 90 95
Arg Pro Tyr Tyr Lys 100
<210> 111
<211> 21 <212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид <400> 111
Glu Ser Pro Tyr Gln Glu Leu Gln Gly Gln Arg Ser Asp Val Tyr Ser
1 5 10 15
Asp Leu Asn Thr Gln 20
<210> 112
<211> 86
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 112
Met Ile Pro Ala Val Val Leu Leu Leu Leu Leu Leu Val Glu Gln Ala
1 5 10 15
Ala Ala Leu Gly Glu Pro Gln Leu Cys Tyr Ile Leu Asp Ala Ile Leu
20 25 30
Phe Leu Tyr Gly Ile Val Leu Thr Leu Leu Tyr Cys Arg Leu Lys Ile
35 40 45
Gln Val Arg Lys Ala Ala Ile Thr Ser Tyr Glu Lys Ser Asp Gly Val
50 55 60
Tyr Thr Gly Leu Ser Thr Arg Asn Gln Glu Thr Tyr Glu Thr Leu Lys
65 70 75 80
His Glu Lys Pro Pro Gln 85
<210> 113
<211> 21
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 113
Asp Gly Val Tyr Thr Gly Leu Ser Thr Arg Asn Gln Glu Thr Tyr Glu
1 5 10 15
Thr Leu Lys His Glu 20
<210> 114
<211> 171
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 114
Met Glu His Ser Thr Phe Leu Ser Gly Leu Val Leu Ala Thr Leu Leu
1 5 10 15
Ser Gln Val Ser Pro Phe Lys Ile Pro Ile Glu Glu Leu Glu Asp Arg
20 25 30
Val Phe Val Asn Cys Asn Thr Ser Ile Thr Trp Val Glu Gly Thr Val
35 40 45
Gly Thr Leu Leu Ser Asp Ile Thr Arg Leu Asp Leu Gly Lys Arg Ile
50 55 60
Leu Asp Pro Arg Gly Ile Tyr Arg Cys Asn Gly Thr Asp Ile Tyr Lys
65 70 75 80
Asp Lys Glu Ser Thr Val Gln Val His Tyr Arg Met Cys Gln Ser Cys
85 90 95
Val Glu Leu Asp Pro Ala Thr Val Ala Gly Ile Ile Val Thr Asp Val
100 105 110
Ile Ala Thr Leu Leu Leu Ala Leu Gly Val Phe Cys Phe Ala Gly His
115 120 125
Glu Thr Gly Arg Leu Ser Gly Ala Ala Asp Thr Gln Ala Leu Leu Arg
130 135 140
Asn Asp Gln Val Tyr Gln Pro Leu Arg Asp Arg Asp Asp Ala Gln Tyr
145 150 155 160
Ser His Leu Gly Gly Asn Trp Ala Arg Asn Lys 165 170
<210> 115
<211> 127
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 115
Met Glu His Ser Thr Phe Leu Ser Gly Leu Val Leu Ala Thr Leu Leu
1 5 10 15
Ser Gln Val Ser Pro Phe Lys Ile Pro Ile Glu Glu Leu Glu Asp Arg
20 25 30
Val Phe Val Asn Cys Asn Thr Ser Ile Thr Trp Val Glu Gly Thr Val
35 40 45
Gly Thr Leu Leu Ser Asp Ile Thr Arg Leu Asp Leu Gly Lys Arg Ile
50 55 60
Leu Asp Pro Arg Gly Ile Tyr Arg Cys Asn Gly Thr Asp Ile Tyr Lys
65 70 75 80
Asp Lys Glu Ser Thr Val Gln Val His Tyr Arg Thr Ala Asp Thr Gln
85 90 95
Ala Leu Leu Arg Asn Asp Gln Val Tyr Gln Pro Leu Arg Asp Arg Asp
100 105 110
Asp Ala Gln Tyr Ser His Leu Gly Gly Asn Trp Ala Arg Asn Lys
115 120 125
<210> 116
<211> 21
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 116
Asp Gln Val Tyr Gln Pro Leu Arg Asp Arg Asp Asp Ala Gln Tyr Ser
1 5 10 15
His Leu Gly Gly Asn 20
<210> 117
<211> 207
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 117
Met Gln Ser Gly Thr His Trp Arg Val Leu Gly Leu Cys Leu Leu Ser
1 5 10 15
Val Gly Val Trp Gly Gln Asp Gly Asn Glu Glu Met Gly Gly Ile Thr
20 25 30
Gln Thr Pro Tyr Lys Val Ser Ile Ser Gly Thr Thr Val Ile Leu Thr
35 40 45
Cys Pro Gln Tyr Pro Gly Ser Glu Ile Leu Trp Gln His Asn Asp Lys
50 55 60
Asn Ile Gly Gly Asp Glu Asp Asp Lys Asn Ile Gly Ser Asp Glu Asp
65 70 75 80
His Leu Ser Leu Lys Glu Phe Ser Glu Leu Glu Gln Ser Gly Tyr Tyr
85 90 95
Val Cys Tyr Pro Arg Gly Ser Lys Pro Glu Asp Ala Asn Phe Tyr Leu
100 105 110
Tyr Leu Arg Ala Arg Val Cys Glu Asn Cys Met Glu Met Asp Val Met
115 120 125
Ser Val Ala Thr Ile Val Ile Val Asp Ile Cys Ile Thr Gly Gly Leu
130 135 140
Leu Leu Leu Val Tyr Tyr Trp Ser Lys Asn Arg Lys Ala Lys Ala Lys
145 150 155 160
Pro Val Thr Arg Gly Ala Gly Ala Gly Gly Arg Gln Arg Gly Gln Asn
165 170 175
Lys Glu Arg Pro Pro Pro Val Pro Asn Pro Asp Tyr Glu Pro Ile Arg
180 185 190
Lys Gly Gln Arg Asp Leu Tyr Ser Gly Leu Asn Gln Arg Arg Ile
195 200 205
<210> 118
<211> 21
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 118
Asn Pro Asp Tyr Glu Pro Ile Arg Lys Gly Gln Arg Asp Leu Tyr Ser
1 5 10 15
Gly Leu Asn Gln Arg 20
<210> 119
<211> 182
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 119
Met Glu Gln Gly Lys Gly Leu Ala Val Leu Ile Leu Ala Ile Ile Leu
1 5 10 15
Leu Gln Gly Thr Leu Ala Gln Ser Ile Lys Gly Asn His Leu Val Lys
20 25 30
Val Tyr Asp Tyr Gln Glu Asp Gly Ser Val Leu Leu Thr Cys Asp Ala
35 40 45
Glu Ala Lys Asn Ile Thr Trp Phe Lys Asp Gly Lys Met Ile Gly Phe
50 55 60
Leu Thr Glu Asp Lys Lys Lys Trp Asn Leu Gly Ser Asn Ala Lys Asp
65 70 75 80
Pro Arg Gly Met Tyr Gln Cys Lys Gly Ser Gln Asn Lys Ser Lys Pro
85 90 95
Leu Gln Val Tyr Tyr Arg Met Cys Gln Asn Cys Ile Glu Leu Asn Ala
100 105 110
Ala Thr Ile Ser Gly Phe Leu Phe Ala Glu Ile Val Ser Ile Phe Val
115 120 125
Leu Ala Val Gly Val Tyr Phe Ile Ala Gly Gln Asp Gly Val Arg Gln
130 135 140
Ser Arg Ala Ser Asp Lys Gln Thr Leu Leu Pro Asn Asp Gln Leu Tyr
145 150 155 160
Gln Pro Leu Lys Asp Arg Glu Asp Asp Gln Tyr Ser His Leu Gln Gly
165 170 175
Asn Gln Leu Arg Arg Asn
180
<210> 120
<211> 21
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 120
Asp Gln Leu Tyr Gln Pro Leu Lys Asp Arg Glu Asp Asp Gln Tyr Ser
1 5 10 15
His Leu Gln Gly Asn 20
<210> 121
<211> 163
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 121
Met Lys Trp Lys Ala Leu Phe Thr Ala Ala Ile Leu Gln Ala Gln Leu
1 5 10 15
Pro Ile Thr Glu Ala Gln Ser Phe Gly Leu Leu Asp Pro Lys Leu Cys
20 25 30
Tyr Leu Leu Asp Gly Ile Leu Phe Ile Tyr Gly Val Ile Leu Thr Ala
35 40 45
Leu Phe Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr
50 55 60
Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg
65 70 75 80
Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met
85 90 95
Gly Gly Lys Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu
100 105 110
Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys
115 120 125
Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu
130 135 140
Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu
145 150 155 160
Pro Pro Arg
<210> 122
<211> 164
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 122
Met Lys Trp Lys Ala Leu Phe Thr Ala Ala Ile Leu Gln Ala Gln Leu
1 5 10 15
Pro Ile Thr Glu Ala Gln Ser Phe Gly Leu Leu Asp Pro Lys Leu Cys
20 25 30
Tyr Leu Leu Asp Gly Ile Leu Phe Ile Tyr Gly Val Ile Leu Thr Ala
35 40 45
Leu Phe Leu Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr
50 55 60
Gln Gln Gly Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg
65 70 75 80
Glu Glu Tyr Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met
85 90 95
Gly Gly Lys Pro Gln Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn
100 105 110
Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met
115 120 125
Lys Gly Glu Arg Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly
130 135 140
Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala
145 150 155 160
Leu Pro Pro Arg
<210> 123
<211> 112
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 123
Arg Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Gln Gln Gly
1 5 10 15
Gln Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr
20 25 30
Asp Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys
35 40 45
Pro Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys
50 55 60
Asp Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg
65 70 75 80
Arg Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala
85 90 95
Thr Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg
100 105 110
<210> 124
<211> 21
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 124
Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp
1 5 10 15
Val Leu Asp Lys Arg
<210> 125
<211> 22
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 125
Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp Lys Met Ala Glu Ala Tyr
1 5 10 15
Ser Glu Ile Gly Met Lys 20
<210> 126
<211> 21
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 126
Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr Lys Asp Thr Tyr Asp
1 5 10 15
Ala Leu His Met Gln
<210> 127
<211> 226
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 127
Met Pro Gly Gly Pro Gly Val Leu Gln Ala Leu Pro Ala Thr Ile Phe
1 5 10 15
Leu Leu Phe Leu Leu Ser Ala Val Tyr Leu Gly Pro Gly Cys Gln Ala
20 25 30
Leu Trp Met His Lys Val Pro Ala Ser Leu Met Val Ser Leu Gly Glu
35 40 45
Asp Ala His Phe Gln Cys Pro His Asn Ser Ser Asn Asn Ala Asn Val
50 55 60
Thr Trp Trp Arg Val Leu His Gly Asn Tyr Thr Trp Pro Pro Glu Phe
65 70 75 80
Leu Gly Pro Gly Glu Asp Pro Asn Gly Thr Leu Ile Ile Gln Asn Val
85 90 95
Asn Lys Ser His Gly Gly Ile Tyr Val Cys Arg Val Gln Glu Gly Asn
100 105 110
Glu Ser Tyr Gln Gln Ser Cys Gly Thr Tyr Leu Arg Val Arg Gln Pro
115 120 125
Pro Pro Arg Pro Phe Leu Asp Met Gly Glu Gly Thr Lys Asn Arg Ile
130 135 140
Ile Thr Ala Glu Gly Ile Ile Leu Leu Phe Cys Ala Val Val Pro Gly
145 150 155 160
Thr Leu Leu Leu Phe Arg Lys Arg Trp Gln Asn Glu Lys Leu Gly Leu
165 170 175
Asp Ala Gly Asp Glu Tyr Glu Asp Glu Asn Leu Tyr Glu Gly Leu Asn
180 185 190
Leu Asp Asp Cys Ser Met Tyr Glu Asp Ile Ser Arg Gly Leu Gln Gly
195 200 205
Thr Tyr Gln Asp Val Gly Ser Leu Asn Ile Gly Asp Val Gln Leu Glu
210 215 220
Lys Pro
225
<210> 128
<211> 188
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 128
Met Pro Gly Gly Pro Gly Val Leu Gln Ala Leu Pro Ala Thr Ile Phe
1 5 10 15
Leu Leu Phe Leu Leu Ser Ala Val Tyr Leu Gly Pro Gly Cys Gln Ala
20 25 30
Leu Trp Met His Lys Val Pro Ala Ser Leu Met Val Ser Leu Gly Glu
35 40 45
Asp Ala His Phe Gln Cys Pro His Asn Ser Ser Asn Asn Ala Asn Val
50 55 60
Thr Trp Trp Arg Val Leu His Gly Asn Tyr Thr Trp Pro Pro Glu Phe
65 70 75 80
Leu Gly Pro Gly Glu Asp Pro Asn Glu Pro Pro Pro Arg Pro Phe Leu
85 90 95
Asp Met Gly Glu Gly Thr Lys Asn Arg Ile Ile Thr Ala Glu Gly Ile
100 105 110
Ile Leu Leu Phe Cys Ala Val Val Pro Gly Thr Leu Leu Leu Phe Arg
115 120 125
Lys Arg Trp Gln Asn Glu Lys Leu Gly Leu Asp Ala Gly Asp Glu Tyr
130 135 140
Glu Asp Glu Asn Leu Tyr Glu Gly Leu Asn Leu Asp Asp Cys Ser Met
145 150 155 160
Tyr Glu Asp Ile Ser Arg Gly Leu Gln Gly Thr Tyr Gln Asp Val Gly
165 170 175
Ser Leu Asn Ile Gly Asp Val Gln Leu Glu Lys Pro
180 185
<210> 129
<211> 21
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 129
Glu Asn Leu Tyr Glu Gly Leu Asn Leu Asp Asp Cys Ser Met Tyr Glu
1 5 10 15
Asp Ile Ser Arg Gly 20
<210> 130
<211> 20
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 130
Arg Pro Arg Arg Ser Pro Ala Gln Asp Gly Lys Val Tyr Ile Asn Met
1 5 10 15
Pro Gly Arg Gly 20
<210> 131
<211> 68
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 131
Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser Leu
1 5 10 15
Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg Ser
20 25 30
Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro Gly
35 40 45
Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe Ala
50 55 60
Ala Tyr Arg Ser 65
<210> 132
<211> 619
<212> PRT
<213> Искусственная последовательность
<220>
<223> Синтетический полипептид
<400> 132
Met Pro Asp Pro Ala Ala His Leu Pro Phe Phe Tyr Gly Ser Ile Ser
1 5 10 15
Arg Ala Glu Ala Glu Glu His Leu Lys Leu Ala Gly Met Ala Asp Gly
20 25 30
Leu Phe Leu Leu Arg Gln Cys Leu Arg Ser Leu Gly Gly Tyr Val Leu
35 40 45
Ser Leu Val His Asp Val Arg Phe His His Phe Pro Ile Glu Arg Gln
50 55 60
Leu Asn Gly Thr Tyr Ala Ile Ala Gly Gly Lys Ala His Cys Gly Pro
65 70 75 80
Ala Glu Leu Cys Glu Phe Tyr Ser Arg Asp Pro Asp Gly Leu Pro Cys
85 90 95
Asn Leu Arg Lys Pro Cys Asn Arg Pro Ser Gly Leu Glu Pro Gln Pro
100 105 110
Gly Val Phe Asp Cys Leu Arg Asp Ala Met Val Arg Asp Tyr Val Arg
115 120 125
Gln Thr Trp Lys Leu Glu Gly Glu Ala Leu Glu Gln Ala Ile Ile Ser
130 135 140
Gln Ala Pro Gln Val Glu Lys Leu Ile Ala Thr Thr Ala His Glu Arg
145 150 155 160
Met Pro Trp Tyr His Ser Ser Leu Thr Arg Glu Glu Ala Glu Arg Lys
165 170 175
Leu Tyr Ser Gly Ala Gln Thr Asp Gly Lys Phe Leu Leu Arg Pro Arg
180 185 190
Lys Glu Gln Gly Thr Tyr Ala Leu Ser Leu Ile Tyr Gly Lys Thr Val
195 200 205
Tyr His Tyr Leu Ile Ser Gln Asp Lys Ala Gly Lys Tyr Cys Ile Pro
210 215 220
Glu Gly Thr Lys Phe Asp Thr Leu Trp Gln Leu Val Glu Tyr Leu Lys
225 230 235 240
Leu Lys Ala Asp Gly Leu Ile Tyr Cys Leu Lys Glu Ala Cys Pro Asn
245 250 255
Ser Ser Ala Ser Asn Ala Ser Gly Ala Ala Ala Pro Thr Leu Pro Ala
260 265 270
His Pro Ser Thr Leu Thr His Pro Gln Arg Arg Ile Asp Thr Leu Asn
275 280 285
Ser Asp Gly Tyr Thr Pro Glu Pro Ala Arg Ile Thr Ser Pro Asp Lys
290 295 300
Pro Arg Pro Met Pro Met Asp Thr Ser Val Tyr Glu Ser Pro Tyr Ser
305 310 315 320
Asp Pro Glu Glu Leu Lys Asp Lys Lys Leu Phe Leu Lys Arg Asp Asn
325 330 335
Leu Leu Ile Ala Asp Ile Glu Leu Gly Cys Gly Asn Phe Gly Ser Val
340 345 350
Arg Gln Gly Val Tyr Arg Met Arg Lys Lys Gln Ile Asp Val Ala Ile
355 360 365
Lys Val Leu Lys Gln Gly Thr Glu Lys Ala Asp Thr Glu Glu Met Met
370 375 380
Arg Glu Ala Gln Ile Met His Gln Leu Asp Asn Pro Tyr Ile Val Arg
385 390 395 400
Leu Ile Gly Val Cys Gln Ala Glu Ala Leu Met Leu Val Met Glu Met
405 410 415
Ala Gly Gly Gly Pro Leu His Lys Phe Leu Val Gly Lys Arg Glu Glu
420 425 430
Ile Pro Val Ser Asn Val Ala Glu Leu Leu His Gln Val Ser Met Gly
435 440 445
Met Lys Tyr Leu Glu Glu Lys Asn Phe Val His Arg Asp Leu Ala Ala
450 455 460
Arg Asn Val Leu Leu Val Asn Arg His Tyr Ala Lys Ile Ser Asp Phe
465 470 475 480
Gly Leu Ser Lys Ala Leu Gly Ala Asp Asp Ser Tyr Tyr Thr Ala Arg
485 490 495
Ser Ala Gly Lys Trp Pro Leu Lys Trp Tyr Ala Pro Glu Cys Ile Asn
500 505 510
Phe Arg Lys Phe Ser Ser Arg Ser Asp Val Trp Ser Tyr Gly Val Thr
515 520 525
Met Trp Glu Ala Leu Ser Tyr Gly Gln Lys Pro Tyr Lys Lys Met Lys
530 535 540
Gly Pro Glu Val Met Ala Phe Ile Glu Gln Gly Lys Arg Met Glu Cys
545 550 555 560
Pro Pro Glu Cys Pro Pro Glu Leu Tyr Ala Leu Met Ser Asp Cys Trp
565 570 575
Ile Tyr Lys Trp Glu Asp Arg Pro Asp Phe Leu Thr Val Glu Gln Arg
580 585 590
Met Arg Ala Cys Tyr Tyr Ser Leu Ala Ser Lys Val Glu Gly Pro Pro
595 600 605
Gly Ser Thr Gln Lys Ala Glu Ala Ala Cys Ala 610 615
ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ идентификации в клетке выбранного фенотипа, связанного с
синтетическим модульным полипептидом, включающий:
a) введение библиотеки нуклеиновых кислот, содержащих нуклеиновые
последовательности-штрихкоды, в клетки-хозяева с получением гетерогенной популяции
генетически модифицированных клеток-хозяев, причем указанная библиотека
нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды,
содержит множество элементов, каждый из которых содержит нуклеотидную
последовательность, кодирующую отличающийся синтетический модульный полипептид;
b) идентификацию генетически модифицированной клетки-хозяина в указанной
гетерогенной популяции, которая экспрессирует выбранный фенотип в ответ на стимул.
2. Способ по п. 1, отличающийся тем, что указанный синтетический модульный полипептид представляет собой полипептид химерного антигенного рецептора (CAR).
3. Способ по п. 2, отличающийся тем, что указанный стимул представляет собой антигенпрезентирующую клетку, которая экспрессирует на своей поверхности антиген, который связан с CAR.
4. Способ по любому из пп. 1-3, отличающийся тем, что указанный стимул приведен в контакт с костимулирующей молекулой.
5. Способ по п. 1, отличающийся тем, что указанный синтетический модульный полипептид представляет собой модульный рецепторный полипептид.
6. Способ по п. 5, отличающийся тем, что указанный модульный рецепторный полипептид представляет собой химерный полипептид рецептора Notch.
7. Способ по п. 6, отличающийся тем, что указанный стимул представляет собой лиганд для химерного полипептида рецептора Notch.
8. Способ по п. 1, отличающийся тем, что указанный синтетический модульный полипептид представляет собой модульный каркасный белок.
9. Способ по п. 1, отличающийся тем, что указанный синтетический модульный полипептид представляет собой модульный белок протеинкиназы или протеинфосфатазы.
10. Способ по п. 1, отличающийся тем, что указанный синтетический модульный полипептид представляет собой модульный транскрипционный регуляторный белок.
11. Способ по п. 1, отличающийся тем, что указанный синтетический модульный полипептид представляет собой модульный эпигенетический регуляторный белок.
12. Способ по п. 1, отличающийся тем, что указанный синтетический модульный полипептид представляет собой модульный белок рекомбиназы или нуклеазы.
2.
13. Способ по п. 1, отличающийся тем, что указанный выбранный фенотип включает отличительную черту фенотипа, включающую два или более фенотипов.
14. Способ по любому из пп. 1-13, дополнительно включающий секвенирование указанной нуклеиновой последовательности-штрихкода идентифицированной генетически модифицированной клетки-хозяина для идентификации синтетического модульного полипептида, связанного с фенотипом.
15. Способ по любому из пп. 1-14, дополнительно включающий количественное определение указанного синтетического модульного полипептида, связанного с фенотипом.
16. Способ по любому из пп. 1-15, дополнительно включающий количественное определение отдельного модуля синтетических модульных полипептидов из библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, который связан с фенотипом.
17. Способ по любому из пп. 1-16, отличающийся тем, что указанная нуклеотидная последовательность дополнительно содержит последовательность, кодирующую детектируемый репортер, функционально соединенную с нуклеотидной последовательностью, кодирующей синтетический модульный полипептид, причем указанный способ дополнительно включает разделение гетерогенной популяции генетически модифицированных клеток-хозяев на основании экспрессируемого детектируемого репортера.
18. Способ по любому из пп. 1-17, отличающийся тем, что указанную идентификацию выполняют в условиях in vitro.
19. Способ по любому из пп. 1-17, дополнительно включающий приведение животного-хозяина в контакт с указанной гетерогенной популяцией генетически модифицированных клеток-хозяев, при этом указанную идентификацию выполняют в условиях ex vivo.
20. Способ по любому из пп. 1-19, отличающийся тем, что указанный фенотип представляет собой один или более из следующих:
a) пролиферацию;
b) выработку цитокина;
c) экспрессию маркера клеточной поверхности;
d) экспрессию репортерного белка.
21. Способ по любому из пп. 1-20, отличающийся тем, что указанная библиотека нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, содержит 100 или более уникальных элементов, и указанная идентификация включает
21.
скрининг 100 или более уникальных элементов библиотеки для выбранного фенотипа.
22. Способ по любому из пп. 1-21, отличающийся тем, что указанное множество
элементов содержит нуклеотидную последовательность, кодирующую синтетический
модульный полипептид, содержащий модульный домен, выбранный из группы,
включающей: антигенсвязывающий домен, специфичный связывающий домен или белок
специфичного партнера по связыванию, костимулирующий домен, коингибирующий
домен, внутриклеточный сигнальный домен, трансмембранный домен, домен каркасного
белка, домен белка протеинкиназы, домен белка протеинфосфатазы, домен белка
рецепторной тирозинкиназы, домен белка липидкиназы, домен белка липидфосфатазы,
домен белка убиквитинилазы, домен белка деубиквитинилазы, домен белка БЦМОилазы,
домен белка ацетилазы, домен белка дезацетилазы, домен белка метилазы, домен белка
деметилазы, домен белка нуклеазы, домен белка рекомбиназы, домен белка
транскрипционного фактора и их комбинации.
23. Библиотека нуклеиновых кислот, содержащая нуклеиновые
последовательности-штрихкоды, содержащая:
множество уникальных полинуклеотидов, каждый из которых содержит нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид содержит:
i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащий первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль,
ii) область нуклеиновой последовательности-штрихкода, содержащую первую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и
при этом секвенирование каждой области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид.
24. Библиотека по п. 23, отличающаяся тем, что указанная первая и вторая
кодирующие последовательности соединены непосредственно без каких-либо
промежуточных некодирующих нуклеотидов.
25. Библиотека по п. 23 или 24, отличающаяся тем, что указанное множество уникальных полинуклеотидов содержит по меньшей мере 1000 уникальных полинуклеотидов.
26. Библиотека по любому из пп. 23-25, отличающаяся тем, что указанная область нуклеиновой последовательности-штрихкода расположена на 5'-конце кодирующей области.
27. Библиотека по любому из пп. 23-25, отличающаяся тем, что указанная кодирующая область расположена на 5'-конце области нуклеиновой последовательности-штрихкода.
28. Библиотека по любому из пп. 23-27, отличающаяся тем, что указанный уникальный синтетический модульный полипептид содержит костимулирующий домен.
29. Библиотека по п. 28, отличающаяся тем, что указанный первый и второй модули содержат различные костимулирующие домены.
30. Библиотека по п. 23-29, отличающаяся тем, что каждый уникальный полинуклеотид дополнительно содержит промоторную последовательность, функционально соединенную как с кодирующей областью, так и с репортерной последовательностью, кодирующей детектируемый полипептид.
31. Библиотека по п. 30, отличающаяся тем, что указанный детектируемый полипептид является полипептидом, детектируемым оптическим способом.
32. Библиотека по п. 31, отличающаяся тем, что указанный полипептид, детектируемый оптическим способом, представляет собой флуоресцентный полипептид.
33. Библиотека по любому из пп. 23-32, отличающаяся тем, что указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и область нуклеиновой последовательности-штрихкода содержит третью нуклеиновую последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.
34. Библиотека по любому из пп. 23-33, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой полипептиды химерного антигенного рецептора (CAR).
25.
35. Библиотека по любому из пп. 23-33, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные рецепторные полипептиды.
36. Библиотека по п. 35, отличающаяся тем, что указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.
37. Библиотека по любому из пп. 23-33, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные каркасные белки.
38. Библиотека по любому из пп. 23-33, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки протеинкиназ или протеинфосфатаз.
39. Библиотека по любому из пп. 23-33, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные транскрипционные регуляторные белки.
40. Библиотека по любому из пп. 23-33, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом множества, представляют собой модульные эпигенетические регуляторные белки.
41. Библиотека по любому из пп. 23-33, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, представляют собой модульные белки рекомбиназ или нуклеаз.
42. Библиотека по любому из пп. 23-41, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества, содержат модульный домен, выбранный из группы, включающей: антигенсвязывающий домен, специфичный связывающий домен или белок специфичного партнера по связыванию, костимулирующий домен, коингибирующий домен, внутриклеточный сигнальный домен, трансмембранный домен, домен каркасного белка, домен белка протеинкиназы, домен белка протеинфосфатазы, домен белка рецепторной тирозинкиназы, домен белка липидкиназы, домен белка липидфосфатазы, домен белка убиквитинилазы, домен белка деубиквитинилазы, домен белка БЦМОилазы, домен белка ацетилазы, домен белка дезацетилазы, домен белка метилазы, домен белка
25.
деметилазы, домен белка нуклеазы, домен белка рекомбиназы, домен белка транскрипционного фактора и их комбинации.
43. Клеточная библиотека, содержащая:
множество клеток, каждая из которых содержит уникальный полинуклеотид, содержащий нуклеотидную последовательность, кодирующую уникальный синтетический модульный полипептид, причем каждый уникальный полинуклеотид содержит:
i) кодирующую область, кодирующую уникальный синтетический модульный полипептид, содержащую первую кодирующую последовательность, кодирующую первый модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, кодирующей второй модуль,
ii) область нуклеиновой последовательности-штрихкода, содержащую первую последовательность-штрихкод, специфичную для первой кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, специфичной для второй кодирующей последовательности, причем указанная первая и вторая нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой и второй кодирующим последовательностям; и
при этом секвенирование каждой области нуклеиновой последовательности-штрихкода позволяет идентифицировать каждый уникальный синтетический модульный полипептид каждой клетки из библиотеки.
44. Библиотека по п. 43, отличающаяся тем, что указанные клетки представляют собой прокариотические клетки.
45. Библиотека по п. 43, отличающаяся тем, что указанные клетки представляют собой эукариотические клетки.
46. Библиотека по п. 45, отличающаяся тем, что указанные эукариотические клетки представляют собой клетки человека.
47. Библиотека по п. 46, отличающаяся тем, что указанные клетки человека представляют собой Т-клетки человека.
48. Библиотека по любому из пп. 43-47, отличающаяся тем, что указанная первая и вторая кодирующие последовательности соединены непосредственно без каких-либо промежуточных некодирующих нуклеотидов.
49. Библиотека по любому из пп. 43-48, отличающаяся тем, что указанная кодирующая область дополнительно содержит последовательность, кодирующую репортер, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью.
44.
50. Библиотека по п. 49, отличающаяся тем, что указанный репортер представляет собой эпитопную метку.
51. Библиотека по п. 49, отличающаяся тем, что указанный репортер представляет собой флуоресцентный белок.
52. Библиотека по любому из пп. 43-51, отличающаяся тем, что указанное множество клеток содержит по меньшей мере 1000 уникальных полинуклеотидов.
53. Библиотека по любому из пп. 43-52, отличающаяся тем, что указанная кодирующая область дополнительно содержит третью кодирующую последовательность, кодирующую третий модуль, соединенную с сохранением открытой рамки считывания со второй кодирующей последовательностью, и указанная область нуклеиновой последовательности-штрихкода содержит третью нуклеиновую последовательность-штрихкод, специфичную для третьей кодирующей последовательности, соединенную со второй нуклеиновой последовательностью-штрихкодом, причем указанная первая, вторая и третья нуклеиновые последовательности-штрихкоды расположены в обратном порядке от 5'-конца к 3'-концу по отношению к первой, второй и третьей кодирующим последовательностям.
54. Библиотека по любому из пп. 43-53, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой полипептиды химерных антигенных рецепторов (CAR).
55. Библиотека по любому из пп. 43-53, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные рецепторные полипептиды.
56. Библиотека по п. 55, отличающаяся тем, что указанные модульные рецепторные полипептиды представляют собой химерные полипептиды рецептора Notch.
57. Библиотека по любому из пп. 43-53, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные каркасные белки.
58. Библиотека по любому из пп. 43-53, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки протеинкиназ или протеинфосфатаз.
59. Библиотека по любому из пп. 43-53, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным
44.
полинуклеотидом из множества клеток, представляют собой модульные транскрипционные регуляторные белки.
60. Библиотека по любому из пп. 43-53, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные эпигенетические регуляторные белки.
61. Библиотека по любому из пп. 43-53, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, представляют собой модульные белки рекомбиназ или нуклеаз.
62. Библиотека по любому из пп. 43-61, отличающаяся тем, что указанные уникальные синтетические модульные полипептиды, кодируемые каждым уникальным полинуклеотидом из множества клеток, содержат модульный домен, выбранный из группы, включающей: антигенсвязывающий домен, специфичный связывающий домен или белок специфичного партнера по связыванию, костимулирующий домен, коингибирующий домен, внутриклеточный сигнальный домен, трансмембранный домен, домен каркасного белка, домен белка протеинкиназы, домен белка протеинфосфатазы, домен белка рецепторной тирозинкиназы, домен белка липидкиназы, домен белка липидфосфатазы, домен белка убиквитинилазы, домен белка деубиквитинилазы, домен белка БиМОилазы, домен белка ацетилазы, домен белка дезацетилазы, домен белка метилазы, домен белка деметилазы, домен белка нуклеазы, домен белка рекомбиназы, домен белка транскрипционного фактора и их комбинации.
63. Способ получения библиотеки нуклеиновых кислот, содержащих нуклеиновые последовательности-штрихкоды, каждая из которых кодирует уникальный синтетический модульный полипептид, причем указанный способ включает:
приведение первого полинуклеотида, содержащего первую кодирующую модуль последовательность, соединенную с первой нуклеиновой последовательностью-штрихкодом, в контакт со вторым полинуклеотидом, содержащим вторую кодирующую модуль последовательность, соединенную со второй нуклеиновой последовательностью-штрихкодом, в условиях, достаточных для введения первого полинуклеотида во второй полинуклеотид на стыке между второй кодирующей последовательностью и второй нуклеиновой последовательностью-штрихкодом с получением бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды,
причем указанный бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую кодирующую модуль
последовательность, соединенную с сохранением открытой рамки считывания с первой кодирующей модуль последовательностью, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.
64. Способ по п. 63, отличающийся тем, что указанный способ дополнительно включает приведение указанного первого и второго полинуклеотидов в контакт с третьим полинуклеотидом, содержащим третью кодирующую модуль последовательность, соединенную с третьей нуклеиновой последовательностью-штрихкодом, причем указанный третий полинуклеотид встраивается в первый полинуклеотид на стыке между первой кодирующей последовательностью и первой нуклеиновой последовательностью-штрихкодом с получением трехмодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды,
при этом указанный трехмодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую кодирующую модуль последовательность, соединенную с сохранением открытой рамки считывания с первой кодирующей модуль последовательностью, соединенной с сохранением открытой рамки считывания с третьей кодирующей модуль последовательностью, соединенной с сохранением открытой рамки считывания с третьей нуклеиновой последовательностью-штрихкодом, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.
65. Способ по п. 63 или 64, отличающийся тем, что указанная первая и вторая последовательности, кодирующие модули, соединены с сохранением открытой рамки считывания без каких-либо промежуточных некодирующих нуклеотидов.
66. Способ по любому из пп. 63-65, отличающийся тем, что указанная библиотека, содержащая нуклеиновые последовательности-штрихкоды, содержит 1000 или более уникальных нуклеиновых кислот, каждая из которых кодирует уникальный синтетический модульный полипептид.
67. Способ по любому из пп. 63-66, отличающийся тем, что указанные нуклеиновые последовательности-штрихкоды расположены на 5'-конце относительно последовательностей, кодирующих модули.
68. Способ по любому из пп. 63-66, отличающийся тем, что указанные нуклеиновые последовательности-штрихкоды расположены на 3'-конце относительно последовательностей, кодирующих модули.
69. Способ по любому из пп. 63-68, отличающийся тем, что указанное введение опосредовано активностью фермента рестрикции, который распознает сайт распознавания
65.
фермента рестрикции на втором полинуклеотиде и расщепляет второй полинуклеотид между второй кодирующей последовательностью и второй нуклеиновой последовательностью-штрихкодом.
70. Способ по п. 69, отличающийся тем, что указанный фермент рестрикции представляет собой фермент рестрикции типа П.
71. Способ по п. 70, отличающийся тем, что указанный фермент рестрикции представляет собой фермент рестрикции типа IIS.
72. Способ по любому из пп. 69-71, отличающийся тем, что указанный первый полинуклеотид также содержит сайт распознавания фермента рестрикции.
73. Способ по любому из пп. 63-72, отличающийся тем, что указанный способ дополнительно включает приведение бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, в контакт с полинуклеотидом, кодирующим репортер, в условиях, достаточных для введения полинуклеотида, кодирующего репортер, в бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, на стыке между первой кодирующей модуль последовательностью и первой нуклеиновой последовательностью-штрихкодом с получением соединенного с репортером бимодульного полинуклеотида, содержащего нуклеиновые последовательности-штрихкоды, причем указанный соединенный с репортером бимодульный полинуклеотид, содержащий нуклеиновые последовательности-штрихкоды, содержит вторую кодирующую модуль последовательность, соединенную с сохранением открытой рамки считывания с первой кодирующей модуль последовательностью, соединенной с сохранением открытой рамки считывания с последовательностью, кодирующей репортер, соединенной с первой нуклеиновой последовательностью-штрихкодом, соединенной со второй нуклеиновой последовательностью-штрихкодом.
74. Способ по п. 73, отличающийся тем, что указанная последовательность, кодирующая репортер, кодирует эпитопную метку.
75. Способ по п. 73, отличающийся тем, что указанная последовательность, кодирующая репортер, кодирует флуоресцентный репортер.
76. Химерный антигенный рецептор (CAR), идентифицированный путем скрининга библиотеки нуклеиновых кислот, кодирующих синтетические модульные полипептиды CAR, причем указанный CAR содержит по меньшей мере один комодулирующий домен, перечисленный в таблице 3 или таблице 4.
77. CAR по п. 76, отличающийся тем, что указанный CAR содержит анти-СВ19-антигенсвязывающий домен.
70.
78. CAR по п. 76 или 77, отличающийся тем, что указанный CAR содержит первичный сигнальный домен CD3-дзета.
79. CAR по любому из пп. 76-78, отличающийся тем, что указанный CAR стимулирует активность Т-клеток и содержит по меньшей мере один костимулирующий домен, перечисленный в таблице 3.
80. CAR по любому из пп. 76-78, отличающийся тем, что указанный CAR ингибирует активность Т-клеток и содержит по меньшей мере один коингибирующий домен, перечисленный в таблице 4.
81. Нуклеиновая кислота, кодирующая CAR по любому из пп. 76-80.
70.
~~? 7 7 7 Т
Сайт
рестрикции типа lis
Оптимальная линкерная последовательность Gly/Ser д(tm)
функциональных гибридных Специфичная для модуля 3' гомологичное плечо для
белков последовательность клонирования
-пприхкод V
~у у т~
Сайт
Ш^аит
рестрикции типа lis
-* 1 * , ^
Фигура 2
Сайт 4 рестрикции типа lis
Сайт
\рестрикции типа lis
До расщепления ферментом рестрикции типа IIS (ФР)
acctgcaacaCTCCGGATCAGGATGtGGTTCGTGGGTGCGCAGCAAGAGAAGCAGACTGCT-GCACAGCGACTACATGAACATGACCCCCAGACGGCCTGGCCCCACCAGAAAGCAQACCAGCCnACGCC CCTCCCAGAGACITCGCCGCCrACAGATOggCTCCGGATCAggatecgSC/IGr^fiRiACACATATGTCTGCa бАГССССИСТССМсзадзад
После расщепления ФР IIS CTCCGGATCAGGATCtGGTTCGTGGGTGCGCAGCAAGAGAAGCAGACTGCTGCACAGCGAG ТАС ATG A AC ATG ACC CCCAG ACGG CCTGGCCCCACC AG A A AGC ACTACCAG CCTTAC GCCCCTCCCAG A G A CTTCGCCGCCTACAGATCTggCTCCGGATCAggatccGGCAGTGGTAACACATATGTCTGCaG^rCCGGCAGT' GGTA
Трансляция фрагмента, расщепленного ФР IIS
SGSGSGSWVRSKRSRLLHSDYMNMTPRRPGPTRKHY-QPYAPPRDFAAYRSGSGSGSGS...
Подпись
Курсивный шрифт: костимулирующий домен CD28 Жирный подчеркнутый шрифт: sdfsa: специфичный для модуля домен Подчеркнутыйшрифт: сайт ф ер м е нта р е стр икции типа IIS Двойное подчеркивание: сайт BamHI Жирный шрифт: линкерная последовательность Gly/Ser Жирный курсивный шрифт: 3'гомологичное плечо для клонирования
Фигура 4
Индекс
Рецептор
Последовательность белка
CD3Q
RCRERRRNERLRRESVRPV
PD1L
RKGRM М D VKKCGtGQTN S К KQ SDTHLEET
TRML2 человека (TLT2)"'
KKRH MAS YSM CSD Р STRD Р PGR РЕ? Y VE VY L!
ICOS человека
TKKKYSSSVHDPNGEYMFMRAVNTAKKSRLTDVTL
TNF14 человека (HVEM)
MEESWRPSVFWDGQTDiPFTRLGRSHRRQSCSV
CTLA4 человека
SLS К М L KKRSPLTTGVYVKM PPTE PEC EKQ FQ PY F! PIN
CD7 человека
artqikftlcswrdNnsaacwyedfflshercntisspriqvq
TNR9 человека (CD137.41BB)
KRGRKKLLYtFKQPFMRPVGTTQEEDGCSCRFPEEEEGGCEL
CD28
YWRSKRSRLLHSDYMNMTPRRPGPTRKHYQPYAPPRDFAAYRS
CD27 человека
HQRRKYRSNKGESPVEPAEPCHYSCPREEEGSTIPtQEDYRKPEPAGS P
1АС5_человека
RRQWRPRRFSALEQGiHPPQAQSKIEElEQEPEPEPEPEPEPEPEPEP EQL
TNR18 человека (GITR)
HiWQLRSQCMWPRETQLLLEVPPSTEDARSCQFPEEERGERSAEEKG RLGDLWV
CD226 человека (DNAM-1)
NRRRRRERRDLFTESWDTQKAPNNYRSPISTSQPTNQSMDDTREDIY VNYPTFSRRPKTRV
TNR5_человека (CD40)
KK VAKKPTN KA PH P KQEPG E iN F P D DLPGS N TAAP VQETLH GCQ P VTQ EOGKESRISVQERQ
HAVR(T!M-3)
KWYSHSKEKIQNLSLiSLANLPPSGLANAVAEGIRSEENIYTIEENVYEV EEPNEYYCYVSSRQQPSQPLGCRFAMP
TIGIT_ человека
RKKKALRiHSV'EGDLRRKSAGQEEWSPSAPSPPGSCVQAEAAPAGLC GE ORG ED GAEL HD YFN V LS YRS LGNC S FFTE TG
CRTAM человека
KLRKAHViWKKENEVSEHTLESYRSRSNNEETSSEEKNGQSSHPMRC MNYITKLYSEAKTKRKENVQHSKLEEKHIQVPESIV
PDCD1 human (PD-1)
ICSRAARG T! GAR RTGQPLKED PS AVP VPS VD Y GELDFQWRE KTP EPP VPCVPEQTEYATIVFPSGMGTSSPARRGSADGPRSAQPLRPEDGHCS WPL
LAIR1 человека
101
HRQMQiKQGPPRSKOEEQKPQQRPDLAVDVLERTADKATVMGLPEKD RETDTS ALAAGSSQEVTYAQLD HWALTQ RTARAVS PQSTK PM AESfTY AAVARH
CXAR человека (CAR)"
107
CCRKKRREEKYEKEVHHDiREDVPPPKSRTSTARSYiGSNHSSLGSMS
PSNMEGYSKTQYNQVPSECFERTPQSPTLPPAKVAAPNLSRMGAIPV
MIPAQSKDGSiV
BTLA_человека
114
CCLRRHQGKQNEL.SDTAGPEiNi.VDAHLKSEQTEASTRQNSQVLL.SET GlYDNDFDLCFRMQEGSEVYSNPCLEENKPGiVYASLNHSVIGPNSRLA RNVKEAPTEYA3ICVRS
CD2
117
TKRKKQRSRRNDEELETRAHRVATEERGRKPHQIPASTPQNPATSQH
PPPPPGHRSQAPSHRPPPPGHRVQHQPQKRPPAPSGTQVHQQKGPP
LPRPRVQPKPPHGAAENSLSPSSN
С0244_человека (2В4) ~
120
WRRKRKEKGSETSPKEFLTIYEDVKDLKTRRNHEQEQTFPGGGSTiYS MIQSQSSAPTSQEPAYTLYSLIQPSRKSGSRKRNHSFSFNSTtYEVIGK SQPKAQNPARLSRKELENFDVYS
Фигура 4 (Cont.)
Индекс
Рецептор
Последовательность белка
TNR8 человека (CD30)
187
RRACRKRIRQKLHLCYPVQTSQPKLELVDSRPRRSSTQLRSGASVTEP VAEERGLM3QPLMETCHSVGAAYLESLPLQDASPAGGPSSPRDLPEP RVSTEHTNNKIEKIYIMKADTViVGTVKAELPEGRGLAGPAEPELEEELE A D ^ T P H YP EQ E7E PPLG SC S D VM LS VE EE G KЈ D P LPT AASG К
TNR25"4eHOBeKa (OR3)
108
TYRHCWPHKPLVTADEAGMEALTPPPATHLSPLDSAHTLLAPPOSSEK ICTVQLVGNSWTPGYPETQEALCPQVTWSWDQLPSRALGPAAAPTLS P ESPAG SP АШ LQ
ОХ40
ALYLLRRDQRLPPDAHKPPGGGSFRTPiQEEQADAHSTLAKI
NKG2D
MGWIRGRRSRHSWEMSEFHNYNLDLKKSDFSTRWQKQRCPWKSKC RENAS
TiM-1
KKYFFKKEVQQLSVSFSSLQIKALQtsAVEKEVQAEDNIYIENSLYATD
GDI GO
SGFLQEKVWVMLVTSLVALQAL
BAFF-R
SWRRRQRRLRGA-SSAEAPDGOKDAPEPLDKViiLSPGISDATAPAWPP PGEQPGTTPPGMSVPVPATELGSTELVTTKTAGPEGQ
TACI
111
ACFLKKRGDPCSCQPRSRPRQSPAKSSQDHAMEAGSPVSTSPEPVET
CSFCFPECRAPTQESAVTPGTPOPTCAGRWGCHTRTTVLQPCPHIPD SGLGIVCVPAQEGGPGA
CD7Z
MAEAITYADLRFVKAPLKKSiSSRLGQDPGADDOGEITYENVQVPAVLG VPSSLASSVLGDKAAVKSEQPTASWRAVTSPAVGRILPCRTTCLRY
CD22
141
KLQRRWKRTQSGQGLGENSSGQSFFVRNKKVRRAPLSEGPHSLGCY NPMMEDGtSYTTLRFPEMNIPRTGDAESSEMQRPPPOCDDTVTYSALH К R G VG DYE N V f P D FP ED E G !H YSELiQ FG VG E R P QAQEN VDYV! LKH
CD96
RKWCQYQKEIMERPPPFKPPPPPIKYTCiQEPNESOLPYHEMETL
NTE-A
LRKRRDSLSLSTQRTQGPAESARNLEYVSVSPTNNTVYASVTHSNRET EiWTPRENDTITiYSTiNHSKESKPTFSRATALDNV
CRACC
WFLKRERQEEYIEEKKRVDICRETPNICPHSGEWTEYDTIPHTNRTILKE DPANTVYSTVElPKKMENPHSLLTMPDTPRLFAYENVt
Sigiec-3,7.9
KTHRRKAARTAVGRMDTHPTTGSASPKHQKKSKLHGPTETSSCSGAA PTVEMDEELHYASLNFHGMNPSKDTSTEYSEVRTQ
KLRG1
MTDS v! Y S M LE LPTATQ АОКЮ YG PQQ KS SSS R P SC S С L
NKR-P1A
M DQ OA! YAE LN L P ID SG P ESSSP SS LP R D VCQG3P WH QF A LK LSC
ILT2
tea
LRHRRQGKHWTSTQRKADFQHPAGAVGPEPTDRGLQWRSSPAAOA Q E E N!_ YAAV'K HTQPEDGVEMDTRSFHDED PQA VTY АЁ VKHSRPRRE M ASP? Ё P LS G E F LDTK D R QAE E D ROM QTE AAASEAPQD VTY AQ LHSL TLRREATEPPPSCJEGFSPAVPSIYATLAIH
KIR2DL1
RWCSNKKNAAVMDQESAGNRTANSEDSDEQDPQEVTYTQLNHCVFT QRKITRPSQRPKTPPTDiiVYTELPNAESRSKWSCP
KIR3DL1
H L WCS N К К N AAVM DQ E P AG N RTANS ED S D EQ DPE E VTYAGLDhСVF TQRKITRPSQRPKTPPTDTiLYTELPNAKPRSKWSCP
CD94-NKG2A
MAVFKTTLWR
CD300U
KGSQRVPEEPGEQPIYMNrSEPLTKDMAT
CD300e
VNRPQWAPPGR
TREM1
VTLRSFVP
Фигура 4 (СОН!.)
Индекс
Рецептор
Последовательность белка
TREM2
AAWHGQKPGTHPPSELDCGHDPGYQLQTLPGLRDT
ILT7
QHSQRSPPRCSQEANSRKDNAPF-RVVEPWEQI
ILT3
168
QHWRQGKHRTLAQRQADFQRPPGMEPEPKDGGLQRRSSPAADVQ GENFCAAVKNTQPEDGVEMDTRQSPHDEDPOAVTYAKVKHSRPRRE MASPPSPLSGEFLDTKDRQALEDRQMDTEAAASEAPQDVTYAQLHSF TLRQKATEPP PSQ EGAS РАЕ PSVYAT LAI H
ILT4
116
LRHRRQGKHWTSTQRKADFQhiPAGAyGPEPTDRGLQWRSSPAADA QEENLYAAVKDTQPEDGVEMDTRAAASEAPQD\TYAQLHSLTLRRKA TEPPPSQEREPPAEPSIYATLAfH
TLT-1
128
MAKRKQGNRLGVCGRFLSSRVSGMNPSSWHHVSDSGPAAELPLDV PHIRLDSPPSFDNrTYTSLPLDSPSGKPSLPAPSSLPPLPFK'AVCSKP VTYATVIFPGGNKGGGTSCGPAQNPPNNQTPSS
CD200R
KVNGCRKYKLNKTESTPVVEEDEMQPYASYTEKNNPLYDTTNKVKASE ALQSEVDTDLHTL
СЭЗООа
RMFQKW'IKAGDHSELSQNPKQAATQSiiLHYANLELLMWPLCJEKPAPP REVEVEYSTVASPREELHYASWFDSNTNRIAAQRPREEEPDSDYSVIR
CO300f
113
WRMMKYQQKAAGMSPEQVLaPLEGDLCYADLTLQLAGTSPQKATTKL SSAQVDQVEVEYVTMASLPKEDISYASLTLGAEDQEPTYCNMGHLSSH LPGRGPEEPTEYSTISRP
DC-SIGN
MS DS KEPR LQQ LGLLE EEQLRGLGFRQ TRGYKSLAGC
87-2
RKSSGGKGGSYSQAACSDSAQGSDVSLTA
Aftergin-1
LPKYKTRKAMRNNVPRDRGDTAMEVGIYANILEKQAKEESVPEVGSRP CVSTAQDEAKHSQELQYATPVFQEVAPREQEACDSYKSGYWSELNF
Fir-Б
173
RRRHRGKFRKDVQKEKDLQLSSGAEEPiTRKGELQKRPNPAAATGEE SLYASVEDMQTEDG VEINS WTPPEEDPQGETYAQVKPSRLRKAGHVS PSVMSREQLNTEYEGAEEGQGANNQMESGESQDVTYAGICSRTIR QGAAASPLSQAGEAPEEPSVYATLAAARPEAVPKDMEQ
NC-14xSAG
SAGSAGSAG SAGSAGSAG SAGSAGSAG SAG SAG SAGSAG SAG
TNR9_2
KRGRKKLLYIFKQPFMRPVGTTQEEDGCSCRFPEEEEGGCEL
TNR9 3
KRGRKKLLYiFKQPFMR PVQTTQF.F.DGCSCRFPF.FEEGGCEL
TNR9 4
KRGRKKLLYIFKQPFMR P VQTTQ EEDGCSCRFPEEEEGGCEL
pSFFV Промотор
Лентивирусный вектор-рецшшент pHR
BamHI
1 ' ~
scFV-TM
scFV-TM -
Состимули
рующии #-|
томен
scFV-TM - рующии #1 _ рующии #2 _ CD32-EGFP
3'-концевой сайт связывания
¦¦-" Последовательности праймера
^- ^iTfrp^KO ды ^
5'-концевой сайт связывания праймера
g-блоки
2D промежуточный продукт
ЗбООх
CD3zeta -EGFP
Расщепление Очистка In Fusion
ЗбООх
СВ19-специфичный scFV: определяет антиген-мишень на раковых клетках
Фигура 7
Костимуляторный домен: модулирует функциональные возможности, улучшает эффективность вторичного сигнального домена
CD3z:
активирует иммунный ответ; первичный сигнальный домен
70-i
6050403020 10-1 0-
П Коингибирующие мотивы Ш\ Костимулирующие мотивы
Наиболее стимулирующие
тшИИ
/л VA
-10-20-30-40-50-60 -70-
т-1-I-I
Наиболее ингибирующие
т-I-I-I-i-I-I-i-I-I-i-I-I-г
Фигура 10
6040200-
Т2Г
1 t
-20-40-60-
Вносимый антиген
^пгйЗ ^ 1^5.
^*тм j CAR
Библиотека
Вариабельные модули в CAR
' Диверсифицирует внеклеточный домен:
• ScFv, нанотело, альтернативные каркасные белки
• Антиген-мишень
¦ Сила взаимодействия
Диверсифицируеткорегуляторный домен :
• > 60 возможных корегуляторных последовательностей
• Возможны различные комбинации видов корегуляции
Диверсифицирует первичный сигнальный домен : , Множество альтернативных доменов, содержащих ITAM, могут быть получены из врожденной и адаптивной иммунной системы
RE1..RE2
Figure 13
RE1 RE2
RE1
RE2
Фигура 14
RE1MRE2
I 1
RE3
Ш Ш
RE1**
Фигура 17
г I
Тупой конец Липкий конец Тупой коней Липкий конец
Фигура 19
ВС1 0" RE1 RE2 Линкерный
KcijiKc/ I | домен |
г^шш-| н_^ш#-| гшша
PBS1 PBS2 < |[ >
PBS1 PBS2
PBS1
PBS2
Желательная линкерная последовательность
RF1 PBS1 PBS2
М-I НЖШ-I
PBS1
PBS2
Фигура 22
Желательная линкерная последовательность
2. Идеальный фрагмент модуля, полученный с помощью системы клонирования In Fusion(r) разрушающий сайг BamHI при сохранении оптимального линкера Gly/Ser ' ' J 'Ж
ScR/
3. Расщепление и повтор для введения дополнительных модулей
ScFV Ц Moгунь 1л1о."У''ьЖ> {/?1 j : i .'О
4. Вставка концевой части с модулем GFP для отслеживэкспрессии и STOP-кодона создает комбинаторный полипептид и соответствующую комбинаторную последовательность-штрихкод
ЩйРД стоп-кодон
ScFV ^Модуль ^Модуль'
Комбинаторный модуль САК., А Комбинаторная последовательность-штрихкод, встроенный с сохранением рамки считывания описывающая архитектуру CAR
ScFV Щм:одуль ЩмодульЩррстоп-кодон! | [ [
Фигура 23
Общая трансдукция библиотеки CAE. в первичные Т-клетки человека
Сортировка для отбора одинакового уровня экспрессии CAR
Уровень экспрессии CAE.
Размножение популяции для последующих количественных исследований
Популяция первичных Т-клеток человека, каждая из которых экспрессирует уникальный CAR
Объединенная библиотека
Анализ FLOW-seq позволяет определить микроскопические и макроскопические фенотипы, связанные с каждым членом библиотеки CAR к специфичному антигену или с опухолевой провокацией
Популяция Т-клеток, экспрессирующая библиотеку CAR
Объединенная библиотека
Сортировка популяции в группы на основании специфичной для маркера активации
НизШеЗвысс
Экспрессия маркера активации Скрининг
Выделение Т-клеток из общей и специфичной опухолевой среды
ПЦР-амплификация и секвенирование следующего поколения последовательностей-штрихкодоЕ позволяют определить исходный фенотип каждого варианта библиотеки CAR
Идентификация
Фигура 25
Номер
Модуль
Номер
Модуль
Номер
Модуль
Номер
Модуль
CDS0
CRT AM
C096
ILT4
PD1L
PDC01
NTS-A
TLT-1
TRML2
LAIR1
CRACC
CD200R
ICOS
CXAR
Siglec-3.7.9
CD300a
TNF14
BTLA
KLRG1
CD300f
CTLA4
CD2
NKR-P1A
DC-SiGM
CD7
CD244
ILT2
B7-2
TNR9
TNR8
KIR2DL1
Allergin-l
CD2S
TNR25
KIR3DL1
Pir-B
С027
OX40
CD94-NKG2A
NC-14xSAG
LAG3
(4KG2D
CD300b
TNRS_2
TNR18
TIM-1
CD300e
TNR9_3
CD226
CD1S0
TREW1
TNR9_4
TMRS
BAFF R
TREM2
HAVR
TACi
ILT7
TiGIT
CD22
ILT3
Фигура 26
1400-j
-j? 1200--- ----
w Ю00
Идентификационный номер варианта CAR
6^ ?
L J
0 0 1
F - F\G
Для исходных объемов все равны 1,
F * N = оптимизированные объемы вставки
I-I
I = Средняя частота 5 частей в собранной комбинаторной библиотеке = Прогнозируемая концентрация выбранных 5 частей
(19)
(19)
(19)
109
112
112
121
124
124
<223> Синтетическая полипептидная последовательность.
<400>
<223> Синтетическая полипептидная последовательность.
<400>
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
<223> Синтетическая полипептидная последовательность.
Arg Ser
<223> Синтетическая полипептидная последовательность.
<400> 51
<223> Синтетическая полипептидная последовательность.
<400> 57
Leu Asn
<400> 101
<400> 101
107
<400>
128
128
Фигура 1
Фигура 1
2/19
Фигура 3
2/19
Фигура 3
3/19
3/19
5/19
Фигура 5
5/19
Фигура 5
5/19
Фигура 5
5/19
Фигура 5
5/19
Фигура 5
5/19
Фигура 5
5/19
Фигура 5
7/19
Фигура 5
7/19
Фигура 5
8/19
8/19
8/19
8/19
9/19
Фигура 9
9/19
Фигура 9
9/19
Фигура 9
9/19
Фигура 9
9/19
Фигура 9
9/19
Фигура 9
Фигура 11
Фигура 11
Фигура 11
Фигура 11
11/19
12/19
Фигура 15
11/19
12/19
Фигура 15
11/19
12/19
Фигура 15
13/19
12/19
Фигура 15
13/19
12/19
Фигура 15
13/19
12/19
Фигура 15
13/19
12/19
Фигура 15
13/19
12/19
Фигура 15
14/19
Фигура 21
14/19
Фигура 21
14/19
Фигура 21
14/19
Фигура 21
14/19
Фигура 21
14/19
Фигура 21
14/19
Фигура 21
14/19
Фигура 21
15/19
Фигура 24
15/19
Фигура 24
15/19
Фигура 24
17/19
Фигура 24
18/19
18/19
18/19
18/19
18/19
18/19
19/19
Фигура 29
19/19
Фигура 29