EA201892762A1 20190430 Номер и дата охранного документа [PDF] EAPO2019\PDF/201892762 Полный текст описания [**] EA201892762 20151015 Регистрационный номер и дата заявки US62/064,989 20141016 Регистрационные номера и даты приоритетных заявок EAA1 Код вида документа [PDF] eaa21904 Номер бюллетеня [**] НОВЫЕ ХИМЕРНЫЕ ИНСЕКТИЦИДНЫЕ БЕЛКИ, ТОКСИЧНЫЕ ИЛИ ИНГИБИТОРНЫЕ В ОТНОШЕНИИ ЧЕШУЕКРЫЛЫХ-ВРЕДИТЕЛЕЙ Название документа [8] C07K 14/325, [8] C12N 15/82 Индексы МПК [US] Баум Джеймс А., [US] Черрути Томас А., [US] Дарт Кристал Л., [US] Инглиш Ли Х., [US] Фу Сяожань, [US] Гузов Виктор М., [US] Хау Эрлин Р., [US] Моргенстерн Джей П., [US] Робертс Джеймс К., [US] Сальвадор Сара А., [US] Ван Цзиньлин, [US] Фласинский Станислав Сведения об авторах [US] МОНСАНТО ТЕКНОЛОДЖИ ЛЛС Сведения о заявителях
 

Патентная документация ЕАПВ

 
Запрос:  ea201892762a*\id

больше ...

Термины запроса в документе

Реферат

[RU]

Раскрыты нуклеотидные последовательности, которые кодируют новые химерные инсектицидные белки, проявляющие ингибирующую активность в отношении чешуекрылых. Конкретные варианты реализации изобретения обеспечивают композиции и трансформированные растения, части растений и семена, содержащие рекомбинантные молекулы нуклеиновой кислоты, кодирующие один или более химерных инсектицидных белков.


Полный текст патента

(57) Реферат / Формула:

Раскрыты нуклеотидные последовательности, которые кодируют новые химерные инсектицидные белки, проявляющие ингибирующую активность в отношении чешуекрылых. Конкретные варианты реализации изобретения обеспечивают композиции и трансформированные растения, части растений и семена, содержащие рекомбинантные молекулы нуклеиновой кислоты, кодирующие один или более химерных инсектицидных белков.


Евразийское (21) 201892762 (13) Al
патентное
ведомство
(12) ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ЕВРАЗИЙСКОЙ ЗАЯВКЕ
(43) Дата публикации заявки (51) Int. Cl. C07K14/325 (2006.01)
2019.04.30 C12N15/82 (2006.01)
(22) Дата подачи заявки 2015.10.15
(54) НОВЫЕ ХИМЕРНЫЕ ИНСЕКТИЦИДНЫЕ БЕЛКИ, ТОКСИЧНЫЕ ИЛИ ИНГИБИТОРНЫЕ В ОТНОШЕНИИ ЧЕШУЕКРЫЛЫХ-ВРЕДИТЕЛЕЙ
(31) 62/064,989
(32) 2014.10.16
(33) US
(62) 201790843; 2015.10.15
(71) Заявитель:
МОНСАНТО ТЕКНОЛОДЖИ ЛЛС
(US)
(72) Изобретатель:
Баум Джеймс А., Черрути Томас А., Дарт Кристал Л., Инглиш Ли Х., Фу Сяожань, Гузов Виктор М., Хау Эрлин Р., Моргенстерн Джей П., Робертс Джеймс К., Сальвадор Сара А., Ван Цзиньлин, Фласинский Станислав
(US)
(57) Раскрыты нуклеотидные последовательности, которые кодируют новые химерные инсектицидные белки, проявляющие ингибирующую активность в отношении чешуекрылых. Конкретные варианты реализации изобретения обеспечивают композиции и трансформированные растения, части растений и семена, содержащие рекомбинант-ные молекулы нуклеиновой кислоты, кодирующие один или более химерных инсектицидных белков.
(74)
Представитель: Медведев В.Н. (RU)
2420-554439ЕА/011
НОВЫЕ ХИМЕРНЫЕ ИНСЕКТИЦИДНЫЕ БЕЛКИ, ТОКСИЧНЫЕ ИЛИ ИНГИБИТОРНЫЕ В
ОТНОШЕНИИ ЧЕШУЕКРЫЛЫХ-ВРЕДИТЕЛЕЙ
ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУ
[001] В настоящей заявке заявляется приоритет по предварительной заявке на патент США № 62/064989, поданной 16 октября 2014 года, содержание которой в полном объеме включено в настоящий документ посредством ссылки.
ВКЛЮЧЕНИЕ ПЕРЕЧНЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
[002] Перечень последовательностей в машиночитаемой форме подан с этим заявлением в электронном формате и включен в настоящую заявку посредством ссылки в полном объеме. Перечень последовательностей содержится в файле, созданном 23 августа, 2016 года, с именем файла P34230WO00_Seq_PCT_Art34.txt, и размером 898,229 байт (как измерено в операционной системе MS-Windows(r)) .
ОБЛАСТЬ ТЕХНИКИ
[003] Настоящее изобретение в целом относится к области белков, обладающих ингибиторной активностью в отношении насекомых. В настоящей заявке описан новый класс химерных инсектицидных белков, обладающих ингибиторной активностью против сельскохозяйственных вредителей культурных растений и семян. В частности, раскрытый класс белков обладает инсектицидной активностью в отношении чешуекрылых насекомых-вредителей. Предлагаются растения, части растений и семена, содержащие молекулу рекомбинантной нуклеиновой кислоты, кодирующую один или более описанных токсичных белков.
УРОВЕНЬ ТЕХНИКИ
[004] Все большее значение приобретает повышение урожайности сельскохозяйственных культур, в том числе кукурузы, сои, сахарного тростника, риса, пшеницы, овощей и хлопчатника. По прогнозам, в дополнение к растущей потребности в сельскохозяйственной продукции для обеспечения пищей, одеждой и обеспечения энергией растущего населения, климатическим последствиям и давления со стороны растущего населения на
использование земли, отличной от сельскохозяйственной,
уменьшается количество доступных пахотных земель для ведения
сельского хозяйства. Данные факторы привели к неоптимистичным
прогнозам в отношении продовольственной безопасности, особенно в
условиях отсутствия значительных улучшений в области
биотехнологии растений и агрономических приемов. В свете данных
факторов, экологически устойчивые усовершенствования в области
технологий, агротехники и борьбы с вредителями являются жизненно
важными инструментами для расширения производства
сельскохозяйственных культур на ограниченном количестве пахотных земель, доступных для ведения сельского хозяйства.
[005] Насекомые, особенно насекомые в пределах отряда чешуекрылых, считаются основной причиной повреждения полевых культур, тем самым снижая урожайность культур в зараженных районах. Виды чешуекрылых вредителей, которые имеют негативное влияние на сельское хозяйство, включают, без ограничений, кукурузную листовую совку (Spodoptera frugiperda) , совку малую
{Spodoptera exigua), совку латуковую {Mamestra configurata), совку-ипсилон (Agrotis ipsilon), совку капустную (Trichoplusia ni), соевую совку (Chrysodeixis includens) , совку бархатных бобов (Anticarsia gemmatalis), совку клеверную (Нурепа scabra), табачную листовертку (Heliothis virescens) , совку хлопковую
{Agrotis subterranea), совку луговую {Pseudaletia unipuncta), совку прямоугольную {Agrotis orthogonia) г мотылька стеблевого кукурузного {Ostrinia nubilalis), бабочку-огневку {Amyelois transitella) , кукурузную огневку {Crambus caliginosellus) , лугового мотылька {Herpetogramma licarsisalis) , огневку подсолнечниковую {Homoeosoma electellum), точильщика зернового кукурузного {Elasmopalpus lignosellus), плодожорку яблонную
{Cydia pomonella), листовертку виноградную {Endopiza viteana) , листовертку восточную персиковую {Grapholita molests) , листовертку подсолнечника {Suleima helianthana), капустную моль
(Plutella xylostella) , розовый коробочный червь {Pectinophora gossypiella) , розовый сверлильщик {Sesamia inferens) , шелкопряда непарного {Lymantria dispar), совку хлопковую американскую
{Alabama argillacea) г листовертку плодовых деревьев {Archips
argyrospila), листовертку резанную золотистую (Archips rosana) r огневку азиатскую стеблевую, или желтую рисовую огневку (Chilo suppressalis)г листовертку рисовую (Cnaphalocrocis medinalis) r кукурузную огневку (Crambus caliginosellus) r мотылька травяного
(Crambus teterrellus), огневку кукурузную юго-западную (Diatraea grandiosella)) , огневку сахарного тростника {Diatraea saccharalis), совку хлопковую египетскую (Earias insulana)r совку пятнистую {Earias vittella) г совку американскую
(Helicoverpa armigera) r американскую кукурузную совку, соевую совку или совку хлопковую {Helicoverpa zea) г лугового мотылька
{Herpetogramma licarsisalis) г гроздевую листовертку {Lobesia botrana) r цитрусовую минирующую моль {Phyllocnistis citrella) r белянку капустную {Pieris brassicae), репницу или белянку репную
{Pieris rapae) г азиатскую хлопчатниковую совку или азиатскую хлопковую совку {Spodoptera litura) г и пасленовый минер {Tuta absoluta).
[006] Исторически сложилось так, что синтетические химические инсектициды интенсивно применяли в качестве средства борьбы с вредителями в сельском хозяйстве. Озабоченность по поводу окружающей среды и здоровья человека, помимо возникающих проблем с устойчивостью, стимулировала исследования и разработку биологических пестицидов. Данное исследование привело к прогрессивному открытию и применению различных энтомопатогенных видов микроорганизмов, включая бактерии.
[007] Парадигма биологических методов борьбы изменилась, когда был открыт потенциал энтомопатогенных бактерий, особенно бактерий, относящихся к роду Bacillus, и применен в разработке агентов для биологической борьбы с вредителями. Штаммы бактерии Bacillus thuringiensis (Bt) использовали в качестве источника инсектицидных белков, так как было обнаружено, что штаммы Bt проявляют высокую токсичность против конкретных насекомых. Известно, что штаммы Bt продуцируют дельта-эндотоксины, которые локализованы в параспоральном кристаллическом тельце включения в начале споруляции и во время фазы стационарного роста (например, белки Cry) и также известно, что они продуцирует секретируемый инсектицидный белок. При проглатывании восприимчивым насекомым,
дельта-эндотоксины, а также секретируемые токсины оказывают свое действие на поверхность эпителия средней кишки, разрушают клеточную мембрану, приводя к разрушению и гибели клеток. Гены, кодирующие инсектицидные белки, также были идентифицированы у бактериальных видов, отличных от Bt, включая другие Bacillus и множество других видов бактерий, таких как Brevibacillus laterosporus, Lysinibacillus sphaericus ("is" ранее известный как Bacillus sphaericus) и Paenibacillus popilliae.
[008] Кристаллические и секретируемые растворимые инсектицидные белковые токсины являются высокоспецифичными для их хозяев и получили мировое признание как альтернативы химическим инсектицидам. Например, инсектицидные токсичные белки применяют в различных сельскохозяйственных целях для защиты хозяйственно-ценных растений от заражения насекомыми, уменьшения потребности в применении химических пестицидов и повышения урожайности. Инсектицидные токсичные белки применяют для борьбы с сельскохозяйственными вредителями культурных растений механизированными способами, такими как распыление дисперсных микробных препаратов, содержащих различные штаммы бактерий, на поверхности растений, и с использованием способов генетической трансформации для получения трансгенных растений и семян, экспрессирующих инсектицидный токсичный белок.
[009] Применение трансгенных растений, экспрессирующих инсектицидные белки, признано в мировом масштабе. Например, в 2012 году 26,1 миллиона гектаров были засажены трансгенными культурами, экспрессирующими Bt-токсины (James, С, Global Status of Commercialized Biotech/GM Crops: 2012. Краткое содержание отчета ISAAA (Международная служба по сбору сведений о применении биотехнологий в сельском хозяйстве) № 44) . Глобальное применение трансгенных культур, защищенных от насекомых, и ограниченное количество инсектицидных белков, применяемых для этих культур, создало давление отбора для существующих аллелей насекомых, которые придают устойчивость к применяемым в настоящее время инсектицидным белкам.
разработке новых форм инсектицидных белков, которые полезны для
контроля над повышением резистентности насекомых к трансгенным
культурам, экспрессирующим инсектицидные белки. Новые
инсектицидные белки с повышенной эффективностью, и которые
контролируют более широкий спектр восприимчивых видов насекомых,
уменьшают число выживших насекомых, которые могут развить
резистентные аллели. Кроме того, применение в одном растении
двух или более трансгенных инсектицидных белков, токсичных для
одного и того же насекомого-вредителя и демонстрирующих
различные способы воздействия, снижает вероятность
резистентности у любых отдельных целевых видов насекомых.
[011] Следовательно, существует настоятельная необходимость идентифицировать дополнительные инсектицидные белки с улучшенными инсектицидными свойствами, такими как повышенная эффективность против более широкого спектра целевых видов насекомых-вредителей и различные механизмы действия по сравнению с токсинами, применяемыми в настоящее время в агрономических приемах. Для удовлетворения данной потребности настоящее изобретение описывает новые химерные инсектицидные белки Cryl, которые проявляют активность против многочисленных целевых видов чешуекрылых вредителей.
[012] Члены семейства кристаллических белков Cryl, известные в данной области техники, проявляют биологическую активность против чешуекрылых-вредителей. Форма предшественника кристаллических белков Cry 1 состоит из двух сегментов примерно равных размеров. Карбоксиконцевая часть белка-предшественника, известная как сегмент протоксина, стабилизирует образование кристаллов и не проявляет инсектицидной активности. Аминоконцевая половина белка-предшественника содержит сегмент токсина белка Cryl и, основываясь на выравнивании консервативных или по существу консервативных последовательностей в пределах членов семейства Cryl, может быть дополнительно разделена на три структурных домена: домен I, домен II и домен III. Домен I содержит около первой трети активного сегмента токсина и, как было показано, является существенным для формирования канала. Домены II и III вовлечены в связывание рецепторов и специфичны к
видам насекомых, в зависимости от исследуемого насекомого и инсектицида.
[013] Вероятность произвольного создания химерного белка с улучшенными свойствами из ассортимента доменных структур многочисленных нативных инсектицидных белков, известных в данной области техники, является незначительной. Это является результатом сложного характера структуры белка, олигомеризации и активации (включая соответствующий протеолитический процессинг химерного предшественника, если он экспрессирован в такой форме), необходимой для высвобождения сегмента инсектицидного белка. Только путем тщательного отбора протоксинов и конкретных мишеней в каждом исходном белке для создания химерной структуры могут быть созданы функциональные химерные инсектицидные токсины, которые проявляют улучшенную инсектицидную активность по сравнению с исходными белками, из которых получены химеры. В данной области техники известно, что повторная сборка протоксина и токсиновых доменов I, II и III любых двух или более токсинов, которые отличаются друг от друга, часто приводит к получению белков, которые проявляют дефектное образование кристаллов или у которых полностью отсутствует какая-либо детектируемая инсектицидная активность, направленная на предпочтительный вид насекомых-вредителей. Только метод проб и ошибок являются эффективными в получении инсектицидных химер, и даже в таком случае квалифицированный специалист не уверен, в конечном итоге, в химере, которая проявляет инсектицидную активность, которая эквивалентна или улучшена по сравнению с любым единственным исходным токсичным белком, из которого получены домены протоксинов или токсинов химеры. Например, в литературе приводятся многочисленные примеры конструирования или сборки химерных белков из двух или более предшественников кристаллического белка. См., например, Jacqueline S. Knight, et al. "A Strategy for Shuffling Numerous Bacillus thuringiensis Crystal Protein Domains." J. Economic Entomology, 97 (6) (2004): 1805-1813; Bosch, et al. (патент США № 6204246); Malvar and Gilmer (патент США 6017534) . В каждом из этих примеров многие из
полученных химер не проявляли инсектицидных или кристаллообразующих свойств, которые были эквивалентны или улучшены по сравнению с белками-предшественниками, из которых были получены компоненты химер. СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[014] Предложены молекулы рекомбинантной нуклеиновой кислоты, которые кодируют химерные инсектицидные белки, токсичные в отношении видов чешуекрылых-вредителей растений. Каждый из химерных инсектицидных белков может применяться по отдельности или в комбинации друг с другом и с другими инсектицидными белками и агентами, обладающими ингибиторной активностью в отношении насекомых, в препаратах и в условиях in planta (в растении); таким образом, обеспечивая альтернативы инсектицидным белкам и химикатам-инсектицидам, применяемым в настоящее время в сельскохозяйственных системах.
[015] В некоторых вариантах реализации изобретения в данном
документе описан химерный инсектицидный белок,
содержащий
аминокислотную последовательность, указанную
любой из
последовательностей SEQ ID N0: 21, 10, 28, 7, 4,
13,
16, 19, 23,
25, 30, 33, 36, 39, 41, 43, 45, 47, 50, 53, 55,
57,
59, 61, 63,
65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87,
89,
91, 93, 95,
97, 99, 101, 103, 105, 107, 109 или 111. Данный химерный инсектицидный белок проявляет ингибирующую активность против видов насекомых отряда Lepidoptera, таких как, без ограничений, Anticarsia gemmatalis, Diatraea saccharalis, Elasmopalpus lignosellus, Helicoverpa zea, Heliothis virescens, Chrysodeixis includens, Spodoptera cosmioides, Spodoptera eridania, Spodoptera frugiperda, Spodoptera exigua, Helicoverpa armigera, Spodoptera litura, Pectinophora gossypiella, Diatraea grandiosella, Earias vitella, Helicoverpa gelotopeon, и Rachiplusia nu.
[016] В другом варианте реализации изобретения полинуклеотид, кодирующий химерный инсектицидный белок, причем полинуклеотид функционально связан с гетерологичным промотором, и химерный инсектицидный белок содержит аминокислотную последовательность, указанную в любой из последовательностей SEQ
ID NO: 21, 10, 28, 7, 4, 13, 16, 19, 23, 25, 30, 33, 36, 39, 41, 43, 45, 47, 50, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109 или 111. Также рассматривается полинуклеотид, кодирующий химерный инсектицидный белок, причем полинуклеотид содержит нуклеотидную последовательность, которая необязательно гибридизуется в строгих условиях с обратным комплементом полинуклеотидной последовательности, указанной в любой из SEQ ID NO: 1, 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 22, 24, 26, 27, 29, 31, 32, 34, 35, 37, 38, 40, 42, 44, 46, 48, 49, 51, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 или 13 0; или кодирует химерный инсектицидный белок, содержащий аминокислотную последовательность, указанную в любой из SEQ ID NO: 21, 10, 28, 7, 4, 13, 16, 19, 23, 25, 30, 33, 36, 39, 41, 43, 45, 47, 50, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99,
101, 103, 105, 107, 109 или 111.
[017] В других вариантах реализации изобретения в данном документе описана клетка-хозяин, содержащая полинуклеотид, указанный в любой из SEQ ID NO: 1, 2, 3, 5, б, 8, 9, 11, 12, 14, 15, 17, 18, 20, 22, 24, 26, 27, 29, 31, 32, 34, 35, 37, 38, 40, 42, 44, 46, 48, 49, 51, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100,
102, 104, 106, 108, 110, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 или 130, причем клетка-хозяин выбрана из группы, состоящей из бактериальной клетки-хозяина или растительной клетки-хозяина. Рассматриваемые бактериальные клетки-хозяева включает Agrobacteriumr Rhizobium, Bacillus, Brevibacillus, Escherichia, Pseudomonas, Klebsiella, и Erwinia; и причем виды Bacillus представляют собой Bacillus cereus или Bacillus thuringiensis, указанный Brevibacillus представляет собой Brevibacillus laterosperous, и указанная Escherichia представляет собой Escherichia coli. Кроме того, предполагаемые растительные клетки-хозяева включают однодольные
102,
[018] Другие варианты реализации изобретения в данном
документе описаны композиции, обладающие ингибирующей
активностью в отношении насекомых, содержащие химерный
инсектицидный белок, содержащий аминокислотную
последовательность, указанную в любой из SEQ ID N0: 21, 10, 28, 7, 4, 13, 16, 19, 23, 25, 30, 33, 36, 39, 41, 43, 45, 47, 50, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109 или 111. В некоторых вариантах реализации изобретения композиция, обладающая ингибирующей активностью в отношении насекомых, может дополнительно содержать по меньшей мере один агент, обладающий ингибирующей активностью в отношении насекомых, отличный от химерного инсектицидного белка. Рассматриваемые агенты, обладающие ингибирующей активностью в отношении насекомых, отличные от химерного инсектицидного белка, включают белок, обладающий ингибирующей активностью в отношении насекомых, молекулу дцРНК, обладающую ингибирующей активностью в отношении насекомых, и химический состав, обладающий ингибирующей активностью в отношении насекомых. Данные агенты, обладающие ингибирующей активностью в отношении насекомых, отличные от химерного инсектицидного белка, могут проявлять активность в отношении одного или более видов вредителей из отрядов Lepidoptera, Coleoptera, Hemiptera, Homoptera, или Thysanoptera.
[019] В еще одном варианте реализации изобретения в данном документе описано семя, содержащее ингибирующе эффективное в отношении насекомых количество химерного инсектицидного белка, содержащего аминокислотную последовательность, указанную в любой из последовательностей SEQ ID NO: 21, 10, 28, 7, 4, 13, 16, 19, 23, 25, 30, 33, 36, 39, 41, 43, 45, 47, 50, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109 или 111; или полинуклеотид, указанный в любой из SEQ ID NO: 1, 2, 3, 5, б, 8, 9, 11, 12, 14, 15, 17, 18, 20, 22, 24, 26, 27, 29, 31, 32, 34, 35, 37, 38, 40, 42, 44, 46, 48, 49, 51, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100,
102, 104, 106, 108, 110, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 или 130.
[020] Рассматриваются также способы борьбы с чешуекрылыми вредителями, включающие стадию, в которой чешуекрылого вредителя приводят в контакт с ингибирующим количеством химерного инсектицидного белка согласно настоящему изобретению.
[021] В другом варианте реализации изобретения в данном документе описана трансгенная растительная клетка, растение или часть растения, содержащая химерный инсектицидный белок, причем химерный инсектицидный белок содержит любую аминокислотную последовательность, указанную в любой из SEQ ID NO: 21, 10, 28, 7, 4, 13, 16, 19, 23, 25, 30, 33, 36, 39, 41, 43, 45, 47, 50, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109 или 111; или химерный инсектицидный белок содержит белок, имеющий по меньшей мере 94% идентичности с SEQ ID NO: 21, 10; по меньшей мере 93% идентичности с SEQ ID NO: 28, по меньшей мере 87% идентичности с SEQ ID NO: 7; по меньшей мере 90% идентичности с SEQ ID NO: 4; по меньшей мере 91% идентичности с SEQ ID NO: 13; по меньшей мере 64% идентичности с SEQ ID NO: 16; по меньшей мере 66% идентичности с SEQ ID NO: 19; по меньшей мере 86% идентичности с SEQ ID NO: 23; по меньшей мере 91% идентичности с SEQ ID NO: 25; по меньшей мере 94% идентичности с SEQ ID NO: 30; по меньшей мере 91% идентичности с SEQ ID NO: 33; по меньшей мере 64% идентичности с SEQ ID NO: 36; по меньшей мере 66% идентичности с SEQ ID NO: 39; по меньшей мере 94% идентичности с SEQ ID N0: 41; по меньшей мере 8 4% идентичности с SEQ ID N0: 43; по меньшей мере с 93% идентичности с SEQ ID NO: 45; по меньшей мере 94% идентичности с SEQ ID NO: 47; по меньшей мере 91% идентичности с SEQ ID NO: 50; или по меньшей мере 93% идентичности с SEQ ID NO: 53; или по меньшей мере 87% идентичности с SEQ ID NO: 85, 93, 105; или по меньшей мере 85% идентичности с SEQ ID NO: 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79; или по меньшей мере 8 8% идентичности с SEQ ID NO: 91, 87, 89; или по меньшей мере 89% идентичности с SEQ ID NO: 107, 111; или по меньшей мере 90% идентичности с SEQ ID NO:
97; по меньшей мере 91% идентичности с SEQ ID N0: 109; или по меньшей мере 93% идентичности с SEQ ID N0: 83; или по меньшей мере 94% идентичности с SEQ ID N0: 91 или 103; или по меньшей мере 95% идентичности с SEQ ID N0: 95, 101; или по меньшей мере 98% идентичности с SEQ ID N0: 99. Также рассматриваются способы борьбы с чешуекрылыми-вредителями, включающие стадию в которой осуществляют воздействие вредителя на эту трансгенную растительную клетку, растение или часть растения, причем указанная растительная клетка, растение или часть растения экспрессирует ингибирующее в отношении чешуекрылых количество химерного инсектицидного белка.
[022] В других вариантах реализации изобретения в данном документе предложены товарные продукты, полученные из растительной клетки, растения или части растения, причем продукт содержит обнаруживаемое количество химерного инсектицидного белка. Рассматриваемые товарные продукты включают растительную биомассу, масло, муку, корм для животных, муку, хлопья, отруби, пух, кожуры и обработанные семена.
[023] Еще один способ, раскрытый в данном документе, представляет собой способ получения семени, содержащего химерный инсектицидный белок, включающий стадии, на которых: высаживают по меньшей мере одно семя, содержащее химерный инсектицидный белок; выращивают растения из указанного семени; и собирают семя от растений, причем собранное семя содержит инсектицидный белок.
[024] Рекомбинантные полинуклеотидные молекулы, кодирующие химерный инсектицидный белок, содержащий нуклеотидную последовательность, выбранную из группы, состоящей из SEQ ID N0: 1, 2, 3, 5, б, 8, 9, 11, 12, 14, 15, 17, 18, 20, 22, 24, 26, 27, 29, 31, 32, 34, 35, 37, 38, 40, 42, 44, 46, 48, 49, 51, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 или 130; и необязательно полинуклеотидную последовательность, кодирующую агент, обладающий ингибиторной активностью в отношении насекомых, отличный от химерного инсектицидного белка.
[025] Другая рассматриваемая в данном документе молекула
рекомбинантной нуклеиновой кислоты содержит гетерологичный
промотор, функционально связанный с полинуклеотидным сегментом,
кодирующим химерные инсектицидные белки, причем химерный
инсектицидный белок содержит любую аминокислотную
последовательность, указанную в любой из SEQ ID N0: 21, 10, 28, 7, 4, 13, 16, 19, 23, 25, 30, 33, 36, 39, 41, 43, 45, 47, 50, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109 или 111; или химерный инсектицидный белок содержит белок, имеющий: по меньшей мере 94% идентичности с SEQ ID NO: 21, 10; по меньшей мере 93% идентичности с SEQ ID NO: 28; по меньшей мере 87% идентичности с SEQ ID NO: 7; по меньшей мере 90% идентичности с SEQ ID NO: 4; по меньшей мере 91% идентичности с SEQ ID NO: 13; по меньшей мере 64% идентичности с SEQ ID NO: 16; по меньшей мере 66% идентичности с SEQ ID NO: 19; по меньшей мере 86% идентичности с SEQ ID NO: 23; по меньшей мере 91% идентичности с SEQ ID NO: 25; по меньшей мере 94% идентичности с SEQ ID NO: 30; по меньшей мере 91% идентичности с SEQ ID NO: 33; по меньшей мере 64% идентичности с SEQ ID NO: 36; по меньшей мере 66% идентичности с SEQ ID NO: 39; по меньшей мере 94% идентичности с SEQ ID N0: 41; по меньшей мере 8 4% идентичности с SEQ ID N0: 43; по меньшей мере 93% идентичности с SEQ ID NO: 45; по меньшей мере 94% идентичности с SEQ ID NO: 47; по меньшей мере 91% идентичности с SEQ ID NO: 50; или по меньшей мере 93% идентичности с SEQ ID NO: 53; или по меньшей мере 87% идентичности с SEQ ID NO: 85, 93, 105; или по меньшей мере 85% идентичности с SEQ ID NO: 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79; или по меньшей мере 8 8% идентичности с SEQ ID NO: 91, 87, 89; или по меньшей мере 89% идентичности с SEQ ID NO: 107, 111; или по меньшей мере 90% идентичности с SEQ ID NO: 97; или по меньшей мере 91% идентичности с SEQ ID NO: 109; или по меньшей мере 93% идентичности с SEQ ID N0:83; или по меньшей мере 94% идентичности с SEQ ID NO: 91, 103; или по меньшей мере 95% идентичности с SEQ ID NO: 95, 101; или по меньшей мере 98% идентичности с SEQ ID NO: 99; или полинуклеотидный сегмент
гибридизуется с полинуклеотидом, имеющим нуклеотидную последовательность, указанную в любой из SEQ ID N0: 1, 2, 3, 5, 6, 8, 9, 11, 12, 14, 15, 17, 18, 20, 22, 24, 26, 27, 29, 31, 32, 34, 35, 37, 38, 40, 42, 44, 46, 48, 49, 51, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 или 130.
[026] Другие варианты реализации, особенности и преимущества настоящего изобретения будут очевидны из следующего подробного описания, примеров и формулы изобретения.
КРАТКОЕ ОПИСАНИЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
[027] SEQ ID NO: 1 представляет собой последовательность рекомбинантной ДНК, кодирующую TIC1100, используемую для экспрессии в бактериальной клетке.
[028] SEQ ID NO: 2 представляет собой синтетическую последовательность ДНК, кодирующую TIC1100, для экспрессии в растительной клетке.
[029] SEQ ID NO: 3 представляет собой синтетическую последовательность ДНК, кодирующую TIC1100, для экспрессии в растительной клетке.
[030] SEQ ID NO: 4 представляет собой аминокислотную последовательность TIC1100.
[031] SEQ ID NO: 5 представляет собой последовательность рекомбинантной ДНК, кодирующую TIC8 60, используемую для экспрессии в бактериальной клетке.
[032] SEQ ID NO: б представляет собой синтетическую последовательность ДНК, кодирующую TIC8 60, для экспрессии в растительной клетке.
[033] SEQ ID NO: 7 представляет собой аминокислотную последовательность TIC860.
[034] SEQ ID NO: 8 представляет собой последовательность рекомбинантной ДНК, кодирующую TIC8 67, используемую для экспрессии в бактериальной клетке.
[036] SEQ ID NO: 10 представляет собой аминокислотную последовательность TIC867.
[037] SEQ ID NO: 11 представляет собой последовательность рекомбинантной ДНК, кодирующую Т1С8 67_2 0, используемую для экспрессии в бактериальной клетке.
[038] SEQ ID NO: 12 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 67_2 0 для экспрессии в растительной клетке.
[039] SEQ ID N0: 13 представляет собой аминокислотную последовательность Т1С867_20.
[040] SEQ ID N0: 14 представляет собой последовательность рекомбинантной ДНК, кодирующую Т1С8 67_21, используемую для экспрессии в бактериальной клетке.
[041] SEQ ID N0: 15 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 67_21, для экспрессии в растительной клетке.
[042] SEQ ID N0: 16 представляет собой аминокислотную последовательность Т1С867_21.
[043] SEQ ID N0: 17 представляет собой последовательность рекомбинантной ДНК, кодирующую Т1С8 67_22, используемую для экспрессии в бактериальной клетке.
[044] SEQ ID N0: 18 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 67_22, для экспрессии в растительной клетке.
[045] SEQ ID N0: 19 представляет собой аминокислотную последовательность Т1С867_22.
[046] SEQ ID N0: 20 представляет собой синтетическую последовательность ДНК, кодирующую Т1С867_23, для экспрессии в растительной клетке.
[047] SEQ ID N0: 21 представляет собой аминокислотную последовательность Т1С867_23.
[048] SEQ ID N0: 22 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 67_24, для экспрессии в растительной клетке.
последовательность TIC867_24.
[050] SEQ ID NO: 24 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 67_24, для экспрессии в растительной клетке.
[051] SEQ ID N0: 25 представляет собой аминокислотную последовательность Т1С867_25.
[052] SEQ ID N0: 26 представляет собой последовательность рекомбинантной ДНК, кодирующую TIC8 68, используемую для экспрессии в бактериальной клетке.
[053] SEQ ID N0: 27 представляет собой синтетическую последовательность ДНК, кодирующую TIC8 68 для экспрессии в растительной клетке.
[054] SEQ ID N0: 28 представляет собой аминокислотную последовательность TIC868.
[055] SEQ ID N0: 29 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 68_9, для экспрессии в растительной клетке.
[056] SEQ ID N0: 30 представляет собой аминокислотную последовательность Т1С868_9.
[057] SEQ ID N0: 31 представляет собой последовательность рекомбинантной ДНК, кодирующую Т1С8 68_10, используемую для экспрессии в бактериальной клетке.
[058] SEQ ID N0: 32 представляет собой синтетическую последовательность ДНК, кодирующую вариант TIC868, Т1С868_10, для экспрессии в растительной клетке,.
[059] SEQ ID N0: 33 представляет собой аминокислотную последовательность Т1С868_10.
[060] SEQ ID N0: 34 представляет собой последовательность рекомбинантной ДНК, кодирующую Т1С8 68_11, используемую для экспрессии в бактериальной клетке.
[061] SEQ ID N0: 35 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 68_11, для экспрессии в растительной клетке.
[062] SEQ ID N0: 36 представляет собой аминокислотную последовательность Т1С868_11.
рекомбинантной ДНК, кодирующую Т1С8 68_12, используемую для экспрессии в бактериальной клетке.
[064] SEQ ID N0: 38 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 68_12, для экспрессии в растительной клетке.
[065] SEQ ID N0: 39 представляет собой аминокислотную последовательность Т1С868_12.
[066] SEQ ID N0: 40 представляет собой синтетическую последовательность ДНК, кодирующую Т1С868_13, для экспрессии в растительной клетке.
[067] SEQ ID N0: 41 представляет собой аминокислотную последовательность Т1С868_13.
[068] SEQ ID N0: 42 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 68_14, для экспрессии в растительной клетке.
[069] SEQ ID N0: 43 представляет собой аминокислотную последовательность Т1С868_14.
[070] SEQ ID N0: 44 представляет собой синтетическую последовательность ДНК, кодирующую Т1С8 68_15, для экспрессии в растительной клетке.
[071] SEQ ID N0: 45 представляет собой аминокислотную последовательность Т1С868_15.
[072] SEQ ID N0: 4 6 представляет собой синтетическую последовательность ДНК, кодирующую Т1С868_29, для экспрессии в растительной клетке.
[073] SEQ ID N0: 47 представляет собой аминокислотную последовательность Т1С868_29.
[074] SEQ ID N0: 48 представляет собой последовательность рекомбинантной ДНК, кодирующую TIC8 69, используемую для экспрессии в бактериальной клетке.
[075] SEQ ID N0: 49 представляет собой синтетическую последовательность ДНК, кодирующую TIC8 69, для экспрессии в растительной клетке.
[076] SEQ ID N0: 50 представляет собой аминокислотную последовательность TIC869.
рекомбинантной ДНК, кодирующую TIC83 6, используемую для экспрессии в бактериальной клетке.
[078] SEQ ID N0: 52 представляет собой синтетическую последовательность ДНК, кодирующую TIC836, для экспрессии в растительной клетке.
[079] SEQ ID N0: 53 представляет собой аминокислотную последовательность TIC836.
[080] SEQ ID N0: 54 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC713 .
[081] SEQ ID N0: 55 представляет собой аминокислотную последовательность TIC713, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 54.
[082] SEQ ID N0: 56 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC843 .
[083] SEQ ID N0: 57 представляет собой аминокислотную последовательность TIC843, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 56.
[084] SEQ ID N0: 58 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC862.
[085] SEQ ID N0: 59 представляет собой аминокислотную последовательность TIC8 62, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 58.
[086] SEQ ID N0: 60 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099.
[087] SEQ ID N0: 61 представляет собой аминокислотную последовательность TIC1099, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 60.
[088] SEQ ID N0: 62 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099-T507E.
[090] SEQ ID NO: 64 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099-R522K.
[091] SEQ ID N0: 65 представляет собой аминокислотную последовательность TIC1099-R522K, транслированную из открытой рамки считывания, представленной в SEQ ID N0: 64.
[092] SEQ ID N0: 66 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099-K490S.
[093] SEQ ID N0: 67 представляет собой аминокислотную последовательность TIC1099-K490S, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 66.
[094] SEQ ID N0: 68 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099-T562R.
[095] SEQ ID N0: 69 представляет собой аминокислотную последовательность TIC1099-T562R, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 68.
[096] SEQ ID N0: 70 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099-S553R.
[097] SEQ ID N0: 71 представляет собой аминокислотную последовательность TIC1099-S553R, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 70.
[098] SEQ ID N0: 72 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099-G498D.
[099] SEQ ID N0: 73 представляет собой аминокислотную последовательность TIC1099-G498D, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 72.
[0100] SEQ ID N0: 74 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099-K490A.
[0102] SEQ ID NO: 76 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1099-E564A.
[0103] SEQ ID N0: 77 представляет собой аминокислотную последовательность TIC1099-E564A, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 76.
[0104] SEQ ID NO: 78 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1103.
[0105] SEQ ID N0: 79 представляет собой аминокислотную последовательность TIC1103, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 78.
[0106] SEQ ID NO: 80 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC1101.
[0107] SEQ ID N0: 81 представляет собой аминокислотную последовательность TIC1101, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 80.
[0108] SEQ ID NO: 82 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC845.
[0109] SEQ ID N0: 83 представляет собой аминокислотную последовательность TIC845, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 82.
[ОНО] SEQ ID N0: 84 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC846.
[0111] SEQ ID N0: 85 представляет собой аминокислотную последовательность TIC84 6, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 84.
[0112] SEQ ID NO: 86 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC858 .
[0114] SEQ ID NO: 88 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC865.
[0115] SEQ ID NO: 89 представляет собой аминокислотную последовательность TIC8 65, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 88.
[0116] SEQ ID NO: 90 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC866.
[0117] SEQ ID NO: 91 представляет собой аминокислотную последовательность TIC8 66, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 90.
[0118] SEQ ID NO: 92 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC838.
[0119] SEQ ID NO: 93 представляет собой аминокислотную последовательность TIC838, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 92.
[0120] SEQ ID NO: 94 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC839.
[0121] SEQ ID NO: 95 представляет собой аминокислотную последовательность TIC839, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 94.
[0122] SEQ ID NO: 96 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC841.
[0123] SEQ ID NO: 97 представляет собой аминокислотную последовательность TIC841, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 96.
[0124] SEQ ID NO: 98 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC842 .
[0126] SEQ ID NO: 100 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC850.
[0127] SEQ ID NO: 101 представляет собой аминокислотную последовательность TIC850, транслированную из открытой рамки считывания, указанной в SEQ ID N0: 100.
[0128] SEQ ID NO: 102 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC859.
[0129] SEQ ID NO: 103 представляет собой аминокислотную последовательность TIC859, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 102.
[0130] SEQ ID NO: 104 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC861.
[0131] SEQ ID NO: 105 представляет собой аминокислотную последовательность TIC8 61, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 104.
[0132] SEQ ID NO: 106 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC848 .
[0133] SEQ ID NO: 107 представляет собой аминокислотную последовательность TIC848, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 106.
[0134] SEQ ID NO: 108 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC849.
[0135] SEQ ID NO: 109 представляет собой аминокислотную последовательность TIC849, транслированную из открытой рамки считывания, указанной в SEQ ID NO: 108.
[0136] SEQ ID NO: 110 представляет собой последовательность ДНК, кодирующую химерную аминокислотную последовательность TIC847 .
[0138] SEQ ID N0 последовательность кодирующей TIC713.
[0139] SEQ ID N0: последовательность ДНК кодирующей TIC713.
[0140] SEQ ID N0: последовательность ДНК кодирующей ТIС 8 4 3.
[0141] SEQ ID N0: последовательность ДНК кодирующей TIC8 62.
[0142] SEQ ID N0: последовательность ДНК кодирующей TIC10 99.
[0143] SEQ ID N0: последовательность ДНК кодирующей TIC1103.
[0144] SEQ ID N0: последовательность ДНК кодирующей TIC845.
[0145] SEQ ID N0: последовательность ДНК кодирующей TIC84 6.
[0146] SEQ ID N0: последовательность ДНК кодирующей ТIС 8 5 8 .
[0147] SEQ ID N0: последовательность ДНК кодирующей TIC8 66.
[0148] SEQ ID N0: последовательность ДНК кодирующей ТIС 8 3 8 .
113 представляет собой синтетическую
для экспрессии в клетке растения,
114 представляет собой синтетическую
для экспрессии в клетке растения,
115 представляет собой синтетическую
для экспрессии в клетке растения,
116 представляет собой синтетическую
для экспрессии в клетке растения,
117 представляет собой синтетическую
для экспрессии в клетке растения,
118 представляет собой синтетическую
для экспрессии в клетке растения,
119 представляет собой синтетическую
для экспрессии в клетке растения,
12 0 представляет собой синтетическую
для экспрессии в клетке растения,
121 представляет собой синтетическую
для экспрессии в клетке растения,
122 представляет собой синтетическую
для экспрессии в клетке растения,
121
[0150] SEQ ID NO: 124 представляет собой синтетическую последовательность ДНК для экспрессии в клетке растения, кодирующей ТIС 8 4 2.
[0151] SEQ ID N0: 125 представляет собой синтетическую последовательность ДНК для экспрессии в клетке растения, кодирующей ТIС 8 5 0.
[0152] SEQ ID N0: 12 6 представляет собой синтетическую последовательность ДНК для экспрессии в клетке растения, кодирующей TIC8 59.
[0153] SEQ ID N0: 127 представляет собой синтетическую последовательность ДНК для экспрессии в клетке растения, кодирующей TIC8 61.
[0154] SEQ ID N0: 128 представляет собой синтетическую последовательность ДНК для экспрессии в клетке растения, кодирующей ТIС 8 4 8.
[0155] SEQ ID N0: 129 представляет собой синтетическую последовательность ДНК для экспрессии в клетке растения, кодирующей TIC84 9.
[0156] SEQ ID N0: 130 представляет собой синтетическую последовательность ДНК для экспрессии в клетке растения, кодирующей ТIС 8 4 7.
ПОДРОБНОЕ ОПИСАНИЕ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯ
[0157] Проблема в области борьбы с сельскохозяйственными вредителями может быть охарактеризована как потребность в новых инсектицидных белках, которые эффективны против целевых вредителей, проявляют токсичность широкого спектра по отношению к целевым видам вредителей, способны экспрессироваться в растениях, не вызывая нежелательных агрономических проблем, и обеспечивают альтернативный способ воздействия по сравнению с существующими на сегодняшний день токсинами, которые используют в растениях в коммерческих целях. В данном документе описаны новые химерные инсектицидные белки и рассмотрена каждая из этих потребностей, в частности, в отношении широкого спектра чешуекрылых насекомых-вредителей.
используемым в настоящее время инсектицидным белкам, устраняя их недостатки, необходимы новые инсектицидные белки с различными механизмами действия (МД), а также с широким спектром действия и эффективностью для борьбы с Lepidoptera. Одним из путей решения этой проблемы является обнаружение новых инсектицидных белков из различных биологических источников, предпочтительно из бактерий, грибов или растений. Другим подходом является перестановка сегментов между различными Bt-белками, которые демонстрируют структурное сходство для создания новых химерных Bt-белков, обладающих ингибирующими свойствами в отношении насекомых. Вероятность создания химерного белка с улучшенными свойствами рекомбинацией доменных структур многочисленных нативных инсектицидных кристаллических белков, известных в данной области техники, незначительна. См., например, Jacqueline S. Knight, et al. "A Strategy for Shuffling Numerous Bacillus thuringiensis Crystal Protein Domains." J. Economic Entomology, 97 (6) (2004): 1805-1813.
[0159] В данном документе описаны последовательности молекул рекомбинантной нуклеиновой кислоты, которые кодируют новые химерные инсектицидные белки. Данные инсектицидные белки учитывают текущую потребность в данной области технике в разработке дополнительных токсичных инсектицидных белков с улучшенными инсектицидными свойствами, такими как повышенная эффективность против более широкого спектра целевых видов насекомых-вредителей и различных механизмов действия. Члены данной группы белков, включая приведенные в данном документе иллюстративные белки, проявляют инсектицидную активность в отношении видов чешуекрылых насекомых-вредителей.
[0160] Термин "сегмент" или "фрагмент" используется в настоящей заявке для описания непрерывных последовательностей аминокислот или нуклеиновых кислот, которые короче, чем полная аминокислотная или нуклеотидная последовательность, описывающая раскрытый химерный инсектицидный белок. Сегмент или фрагмент, проявляющий ингибирующую активность в отношении насекомых, также раскрыт в настоящей заявке, если выравнивание такого сегмента
или фрагмента с соответствующим участком химерного инсектицидного белка приводит к идентичности аминокислотной последовательности любого процента фракции от около 65 до около 100 процентов между сегментом или фрагментом и соответствующим участком химерного инсектицидного белка.
[0161] В контексте настоящей заявки термины "активная" или "активность", "пестицидная активность" или "пестицидная" или "инсектицидная активность", "ингибитор в отношении насекомых" или "инсектицидная" относятся к эффективности токсического агента, такого как инсектицидный белок, в ингибировании
(ингибирование роста, питания, плодовитости или
жизнеспособности), подавлении (подавление роста, кормления,
плодовитости или жизнеспособности), контроле (контроль заражения
насекомыми-вредителями, контроль интенсивности питания
насекомых-вредителей на определенной культуре, содержащей эффективное количество инсектицидного белка), или уничтожении
(вызывающие заболеваемость, смертность или снижение
плодовитости) вредителя. Данные термины охватывают результат обеспечения пестицидно эффективного количества инсектицидного белка вредителю, причем воздействие инсектицидного белка на вредителя приводит к заболеваемости, смертности, снижению плодовитости или задержке роста. Данные термины также включают отпугивание вредителя от растения, ткани растения, части растения, семян, растительных клеток или от конкретного географического местоположения, причем растение может расти, в результате обеспечения пестицидно эффективного количества инсектицидного белка в или на растении. В общем, пестицидная активность относится к способности токсичного агента быть эффективным в ингибировании роста, развития, жизнеспособности, кормового поведения, брачного поведения, плодовитости или любого измеримого снижения, вызванного неблагоприятными эффектами, в связи с предоставлением в рацион насекомого данного белка, фрагмента белка, сегмента белка или полинуклеотида, конкретному целевому вредителю, включая, но не ограничиваясь ими, насекомых отряда Lepidoptera.. Инсектицидный белок может быть получен растением или может быть применен к растению или к окружающей
среде в том месте, где находится растение. Термины "биоактивность", "эффективный", "эффективный" или их вариации также являются терминами, взаимозаменяемо используемыми в настоящей заявке, для описания воздействия химерных инсектицидных белков согласно настоящему изобретению на целевых насекомых-вредителей.
[0162] Пестицидно эффективное количество токсического агента, обеспеченное в рационе целевого вредителя, проявляет пестицидную активность при контакте токсического агента с вредителем. Токсичным агентом может быть инсектицидный белок, или один или более химических агентов, известных в данной области техники. Инсектицидные химические агенты и инсектицидные белковые агенты можно применять по отдельности или в комбинации друг с другом. Химические агенты включают, без ограничений, молекулы дцРНК, нацеленные на специфические гены для подавления в целевом вредителе, органохлориды, органофосфаты, карбаматы, пиретроиды, неоникотиноиды и рианоиды. Инсектицидные белковые агенты включают химерные инсектицидные белки, представленные в настоящей заявке, а также другие белковые токсичные агенты, в том числе такие, которые нацелены на виды чешуекрылых-вредителей, а также белковые токсины, которые используются для борьбы с другими вредителями растений, такие как Сгу-белки, доступные в данной области техники для применения в борьбе с видами Coleoptera, Thysanoptera, Hemiptera и Homoptera.
[0163] Предполагается, что ссылка на вредителя, особенно вредителя сельскохозяйственного растения, означает вредителей культурных растений, особенно тех чешуекрылых-вредителей, которые контролируются описанными химерными инсектицидными белками. Однако ссылка на насекомого-вредителя может также включать насекомых-вредителей Coleoptera, Hemiptera и Homoptera, а также нематоды и грибы при тех условиях, когда токсичные агенты, нацеленные на этих вредителей, совместно локализуются или присутствуют вместе с химерным инсектицидным белком или белком, который имеет от около 65 до около 100% идентичности с химерным инсектицидным белком.
документе, демонстрируют инсектицидную активность по отношению к насекомым-вредителям из видов чешуекрылых насекомых, включая взрослых особей, куколок, личинок и новорожденных, а также представителей отряда Hemiptera, включая взрослых особей и нимф. Насекомые отряда Lepidoptera, включают, без ограничений, совок луговых, совок, листоверток, и совок из семейства Noctuidae, например, кукурузную листовую совку {Spodoptera frugiperda), совку малую {Spodoptera exigua), совку латуковую {Mamestra configurata), совку-ипсилон {Agrotis ipsilon), совку капустную
{Trichoplusia ni) , соевую совку {Pseudoplusia includens) , совку бархатных бобов {Anticarsia gemmatalis), совку клеверную {Нурепа scabra), табачную листовертку {Heliothis virescens), совку хлопковую {Agrotis subterranea), совку луговую {Pseudaletia unipuncta), совку прямоугольную {Agrotis orthogonia); точильщиков, чехлоносок, бабочек, дымчатых листоверток, гусениц бабочки капустницы и пироморфид из семейства Pyralidae, например, мотылька стеблевого кукурузного {Ostrinia nubilalis), бабочку-огневку {Amyelois transitella) , кукурузную огневку
{Crambus caliginosellus) , лугового мотылька {Herpetogramma licarsisalis) , огневку подсолнечниковую {Homoeosoma electellum) , точильщика зернового кукурузного {Elasmopalpus lignosellus) ; листоверток, огневок Шишковых, плодожорок, и плодовых листоверток из семейства Tortricidae, например, плодожорку яблонную {Cydia pomonella), листовертку виноградную {Endopiza viteana), листовертку восточную персиковую {Grapholita molests) , листовертку подсолнечника {Suleima helianthana) ; и многих других экономически важных представителей отряда Lepidoptera, например, капустную моль (Plutella xylostella) , розового коробочного червя
{Pectinophora gossypiella) и шелкопряда непарного {Lymantria dispar) . Другие насекомые-вредители отряда Lepidoptera включает, например, Alabama argillacea (совка хлопковая американская) , Archips argyrospila (листовертка плодовых деревьев), Archips rosana (листовертая резанная золотистая) и другие виды Archips, Chilo suppressalis (огневка азиатская стеблевая или желтая рисовая огневка), Cnaphalocrocis medinalis (листовертка рисовая), Crambus caliginosellus (кукурузная огневка), Crambus
teterrellus (мотылек травяной), Diatraea grandiosella (огневка кукурузная юго-западная) , Diatraea saccharalis (огневка сахарного тростника), Earias insulana (совка хлопковая египетская), Earias vittella (совка пятнистая), Helicoverpa armigera (совка американская) , Helicoverpa zea (совка хлопковая или американская кукурузная совка), Heliothis virescens (табачная листовертка) , Herpetogramma licarsisalis (луговой мотылек), Lobesia botrana (гроздевая листовертка) , Phyllocnistis citrella (цитрусовая минурующая моль), Pieris brassicae (белянка капустная), Pieris гарае (репница или белянка репная), Plutella xylostella (капустная моль), Spodoptera exigua (совка малая), Spodoptera litura (азиатская хлопчатниковая совка, азиатская хлопковая совка) и Tuta absoluta (пасленовый минер).
[0165] В контексте настоящей заявки термин "изолированная молекула ДНК" или эквивалентный термин или фраза означает, что молекула ДНК представляет собой молекулу ДНК, которая присутствует отдельно или в комбинации с другими композициями, но не в ее естественной среде. Например, элементы нуклеиновой кислоты, такие как кодирующая последовательность, интронная последовательность, нетранслируемая лидерная последовательность, промоторная последовательность, терминирующая последовательность транскрипции и т.п., которые, естественно, находятся в ДНК генома организма, не считаются "выделенными" до тех пор, пока элемент находится в геноме организма и в том месте генома, в котором он встречается в природе. Тем не менее, каждый из этих элементов и их части были бы "выделены" в рамках настоящего раскрытия при условии, если элемент находится внутри генома организма и в том месте в геноме, в котором он естественным образом находится. Точно так же нуклеотидная последовательность, кодирующая инсектицидный белок или любой встречающийся в природе инсектицидный вариант этого белка, будет представлять собой выделенную нуклеотидную последовательность, если нуклеотидная последовательность не находится в ДНК бактерии, в которой естественным образом находится последовательность, кодирующая белок. Синтетическая нуклеотидная последовательность, кодирующая аминокислотную последовательность природного инсектицидного
белка, будет считаться выделенной для целей настоящего
раскрытия. Для целей настоящего раскрытия любая трансгенная
нуклеотидная последовательность, т.е. нуклеотидная
последовательность ДНК, вставленная в геном клеток растения или бактерии или присутствующая во внехромосомном векторе, считается выделенной нуклеотидной последовательностью независимо от того, присутствует ли она внутри плазмиды или подобной структуры, используемой для трансформации клеток, в геноме растения или бактерии или присутствует в обнаруживаемых количествах в тканях, потомстве, биологических образцах или товарных продуктах, полученных из растения или бактерии.
[0166] Как описано далее в примерах, при помощи химерогенеза из доменов протоксина и токсина известных инсектицидных токсинов (называемые в данном документе "исходные белки") сконструировали около восьмисот сорок четыре (844) нуклеотидных последовательностей, которые кодируют химерные инсектицидные белки, и экспрессировали и проводили испытание в биотесте на активность в отношении чешуекрылых. Небольшое количество сконструированных химерных инсектицидных белков продемонстрировало повышенную активность в отношении чешуекрылых или усиленный спектр в отношении чешуекрылых по сравнению с исходными белками, из которых были получены его токсиновые компоненты.
[0167] Данные новые химерные инсектицидные белки с повышенной активностью в отношении чешуекрылых или усиленным спектром в отношении чешуекрылых были сконструированы из следующих протоксиновых и токсиновых доменов исходных инсектицидных белков: CrylAh (домен I), CrylBbl (домены I и II), Сгу1Ве2 (домены I и II), CrylJal (домены I и II), CrylFal
(домены I и II), CrylAc (домен II и протоксин), CrylCa (домен III и протоксин), CrylKa (домен III и протоксин), CrylJx (домен III), CrylAb (домен III ), Сгу1АЬЗ (протоксин), CrylDal
(протоксин), Сгу4 (протоксин), Сгу9 (протоксин), CrylBe
(протоксин) и CrylKa (протоксин).
отношении чешуекрылых или усиленным спектром чешуекрылых включают следующие комбинации протоксинов и доменов: TIC1100/SEQ ID NO: 4 (домен I-CrylAh, домен II-CrylAc, домен III-CrylCa, протоксин-CrylAc), TIC860/SEQ ID NO: 7 (домен I-CrylBbl, домен II-CrylBBl, домен III-CrylCa, протоксин-CrylAc), TIC867/SEQ ID NO: 10 (домен I-CrylBe2, домен II-CrylBe2, домен III-CrylKa, протоксин-Сгу1АЬЗ), TIC868/SEQ ID NO: 28 (домен I-CrylBe2, домен II-CrylBe2 и домен III-CrylCa, протоксин-Сгу1АЬЗ), TIC869/SEQ ID NO: 50 (домен I -CrylJal, домен II-CrylJal, домен III-CrylJx, протоксин-Сгу1АЬЗ) и TIC836/SEQ ID NO: 53 (домен I-CrylFal, домен II-CrylFal, домен III-CrylAb, протоксин-CrylAc).
[0169] Варианты, в которые вводили аминокислотные замены или альтернативные протоксиновые домены, также были конструированы для химерных инсектицидных белков TIC8 67 и TIC8 68. В частности, данные варианты TIC8 67 и TIC8 68 включают следующие аминокислотные замены или альтернативные протоксиновые домены: TIC867_20/SEQ ID NO: 13 (альтернативный протоксиновый домен CrylDal), TIC867_21/SEQ ID NO: 16 (альтернативный протоксиновый домен Cry4), TIC867_22/SEQ ID NO: 19
(альтернативный протоксиновый домен Cry9), TIC867_23/SEQ ID NO: 21 (альтернативный протоксиновый домен CrylBe), TIC867_24/SEQ ID NO: 23 (альтернативный протоксиновый домен CrylKa), TIC867_25/SEQ ID NO: 25 (альтернативный протоксиновый домен CrylKa), TIC868_9/SEQ ID NO: 30 (аминокислотная модификация N240S_Y343Q_N349T), TIC868_10/SEQ ID NO: 33 (альтернативный протоксиновый домен CrylDal), TIC868_11/SEQ ID NO: 36
(альтернативный протоксиновый домен Cry4), TIC868_12/SEQ ID NO: 39 (альтернативный домен протоксина Cry 9), TIC868_13/SEQ ID NO: 41 (альтернативный протоксиновый домен CrylBe), TIC868_14/SEQ ID NO: 43 (альтернативный протоксиновый домен CrylKa), TIC868_15/SEQ ID NO: 45 (альтернативный протоксиновый домен CrylCa) и TIC868_29/SEQ ID NO: 47 (модификация аминокислоты Q13 6Y_Y34 3Q_N34 9T).
[0170] Как продемонстрировано в примерах, у каждого из этих вариантов TIC8 67 и TIC8 68 изменена активность в отношении чешуекрылых и/или снижен спектр активности исходного химерного
инсектицидного белка в отношении чешуекрылых, указывая, таким образом, на то, что альтернативный протоксиновый домен и аминокислотные замены имели прямое влияние на инсектицидную активность и спектр химерных инсектицидных белков TIC8 67 и TIC868.
[0171] Многие из химерных инсектицидных белков
демонстрируют инсектицидную активность в отношении
многочисленных видов чешуекрылых насекомых-вредителей. В частности, новые химерные инсектицидные белки, раскрытые в настоящей заявке, проявляют активность в отношении одного или более из следующих чешуекрылых насекомых-вредителей: совки бархатных бобов (VBC, Anticarsia gemmatalis), огневки сахарного тростника (SCB, Diatraea saccharalis), точильщика зернового кукурузного (LSCB, Elasmopalpus lignosellus) , американской кукурузной совки (CEW, Helicoverpa zea), соевой совки (SPW, Helicoverpa zea) , совки хлопковой CBW, Helicoverpa zea), табачной листовертки (TBW, Heliothis virescens) , соевой совки (SBL, Chrysodeixis includens) , черной совки (BLAW, Spodoptera cosmioides) , южной совки (SAW, Spodoptera eridania) , кукурузной листовой совки (FAW, Spodoptera frugiperda) , совки малой (BAW, Spodoptera exigua), совки американской (OBW, Helicoverpa armigera) , азиатской хлопковой совки (OLW, Spodoptera litura), розового коробочного червя (PBW, Pectinophora gossypiella) , огневки кукурузной юго-западной (SWCB, Diatraea grandiosella) , шиповатого северного коробочного червя (SBW, Earias vitella), южноамериканской совки (SABW, Helicoverpa gelotopeon) , и пяденицы подсолнечниковой (SFL, Rachiplusia пи) . Таким образом, иллюстративные белки, описанные в настоящей заявке, связаны общей функцией и проявляют инсектицидную активность в отношении видов насекомых-вредителей из отряда Lepidoptera, включая взрослых особей, личинок и куколок.
[0172] Белки, которые напоминают химерные инсектицидные белки, могут быть идентифицированы путем сравнения друг с другом с использованием различных компьютерных алгоритмов, известных в данной области техники. Например, идентичность аминокислотных последовательностей белков, связанных с химерными инсектицидными
белками, может быть проанализирована с использованием выравнивания Clustal W с использованием этих параметров по умолчанию: матрица сравнения: весы, штраф на внесение делеции в выравнивание: 10,0, штраф на продолжение делеции: 0,05, гидрофильные делеции: вкл, гидрофильные остатки: GPSNDQERK, штраф на остаткоспецифические делеции: вкл (Thompson, et al (1994) Nucleic Acids Research, 22:4673-4680). Процент идентичности аминокислот далее рассчитывают в виде выражения: 100% умноженные на (идентичность аминокислот/длина заявленного белка). Другие алгоритмы выравнивания, также доступные в данной области техники, обеспечивают результаты, аналогичные результатам, полученным с использованием выравнивания Clustal W, и рассмотрены в настоящей заявке.
[0173] Предполагается, что искомый белок, проявляющий ингибирующую активность в отношении насекомых, раскрыт в настоящей заявке, если выравнивание такого искомого белка с исследуемыми химерными инсектицидными белками, указанными в SEQ
NO: 4, 7
, 10
, 13, 16, 19, 21, 23
, 25, 28, 30,
33, 36, 39,
41,
43,
45, 47,
50,
53, 55, 57, 59, 61,
63, 65, 67,
69, 71, 73,
75,
77,
79, 81,
83,
85, 87, 89, 91, 93
, 95, 97, 99,
101, 103,
105,
107
, 109 и
111
дает в результате по
меньшей мере
около 64%,
65%,
66%
, 67%, 6
8 %,
69%, 70%, 71%, 72%,
73%, 74%, 75%,
76%, 77%,
78%,
79%
, 80%, 8
1 91 о ,
82%, 83%, 84%, 85%,
86%, 87%, 88%,
89%, 90%,
91%,
92%
, 93%,
94%
95%, 96%, 97%,
98%, 99% или около
100%
идентичности аминокислотной последовательности (или любой процент в данном диапазоне) между искомым и исследуемым белком.
[0174] Как описано далее в примерах настоящей заявки, синтетические или искусственные последовательности, кодирующие химерные инсектицидные белки, были сконструированы для применения в растениях. Иллюстративные синтетические нуклеотидные последовательности, которые были сконструированы для применения в растениях, указаны в SEQ ID NO: 2 и 3 (TIC1100), SEQ ID NO: 6 (TIC860), SEQ ID NO: 9 (TIC867), SEQ ID NO: 12 (TIC867_20), SEQ ID NO: 15 (TIC867_21), SEQ ID NO: 18 (TIC867_22), SEQ ID NO: 20 (TIC867_23), SEQ ID NO: 22 (TIC867 24), SEQ ID NO: 24 (TIC867 25), SEQ ID N0:27 (TIC868),
SEQ ID NO: 29 (TIC868_9), SEQ ID NO: 32 (TIC868_10), SEQ ID NO: 35 (TIC868_11), SEQ ID NO: 38 (TIC868_12), SEQ ID NO: 40
(TIC868_13), SEQ ID NO: 42 (TIC868_14), SEQ ID NO: 44
(TIC868_15), SEQ ID NO: 46 (TIC868_29), SEQ ID NO: 49 (TIC869) и SEQ ID NO: 52 (TIC836), SEQ ID NO: 112 и 113 (TIC713), SEQ ID NO: 114 (TIC843), SEQ ID NO: 115 (TIC862), SEQ ID NO: 116
(TIC1099) , SEQ ID NO: 117 (TIC1103), SEQ ID NO: 118 (TIC845), SEQ ID NO: 119 (TIC846), SEQ ID NO: 120 (TIC858), SEQ ID NO: 121
(TIC866), SEQ ID NO: 122 (TIC838), SEQ ID NO: 123 (TIC841), SEQ ID NO: 124 (TIC842), SEQ ID NO: 125 (TIC850), SEQ ID NO: 126
(TIC859) , SEQ ID NO: 127 (TIC861), SEQ ID NO: 128 (TIC848), SEQ ID NO: 129 (TIC849), и SEQ ID NO: 130 (TIC847).
[0175] Для экспрессии в растительных клетках химерные
инсектицидные белки могут экспрессироваться так, чтобы они
находились в цитозоле или были нацелены на различные органеллы
растительной клетки. Например, нацеливание белка на хлоропласт
может приводить к увеличению уровней экспрессированного белка в
трансгенном растении, предотвращая появление признаков иных
фенотипов. Нацеливание может также приводить к повышению
резистентности к вредителям у трансгенного объекта. Целевой
пептид или транзитный пептид представляет собой короткую
пептидную цепь (длиной 3-7 0 аминокислот) , которая направляет
перенос белка в определенную область клетки, включая ядро,
митохондрии, эндоплазматический ретикулум (ЭР), хлоропласт,
апопласт, пероксисому и плазматическую мембрану. Некоторые
сигнальные пептиды отщепляются от белка под действием сигнальной
пептидазы после транспортирования белков. Для нацеливания на
хлоропласт, белки содержат транзитные пептиды, которые содержат
около 4 0-50 аминокислот. Для описания применения хлоропластных
транзитных пептидов, см. патенты США №№ 5188642 и 5728925.
Многие локализованные на хлоропласте белки экспрессируются из
ядерных генов как предшественники и нацелены на хлоропласт
транзитным пептидом хлоропласта (ТПХ). Примеры таких выделенных
хлоропластных белков включают, без ограничений, такие, которые
связаны с малой субъединицей (МСУ) рибулозо-1,5,-
бисфосфаткарбоксилазы, ферредоксином, ферредоксин-
оксидоредуктазой, белком I и белком II светособирающего комплекса, тиоредоксином F, енолпируват шикимат фосфатсинтазой
(ЕПШФС) и транзитными пептидами, описанными в патенте США № 7193133. В условиях in vivo и in vitro было продемонстрировано, что нехлоропластные белки могут быть нацелены на хлоропласт с использованием белковых гибридов с гетерологичным ТПХ и что наличия ТПХ достаточно для нацеливания белка на хлоропласт. Включение подходящего хлоропластного транзитного пептида, такого как ЕПШФС ТПХ Arabidopsis thaliana (ТПХ2) (см. Klee et al., Mol. Gen. Genet. 210:437-442, 1987) или ЕПШФС ТПХ Petunia hybrida
(ТПХ4) (см., della-Cioppa et al. , Proc. Natl. Acad. Sci. USA83: 6873-6877, 1986) было показано, что они нацеливают гетерологичные последовательности белка ЕПШФС на хлоропласты в трансгенных растениях (см., патенты США №№ 5627061, 5633435 и 5312910 и ЕР 0218571, ЕР 189707, ЕР 508909 и ЕР 924299) . Для нацеливания химерных инсектицидных белков на хлоропласт, последовательность, кодирующая транзитный пептид хлоропласта, расположена 5' в функциональной связи и в рамке к синтетической кодирующей последовательности, кодирующей химерный инсектицидный белок, который был сконструирован для оптимальной экспрессии в растительных клетках.
[0176] Экспрессионные кассеты и векторы, содержащие данные синтетические или искусственные нуклеотидные последовательности, конструировали и вводили в клетки растений кукурузы, хлопка и сои в соответствии со способами и методиками трансформации, которые известны в данной области техники. Трансформированные клетки регенерировали в трансформированные растения, которые, как было обнаружено, экспрессировали химерный инсектицидный белок. Для проверки пестицидной активности, биотестирование проводили в присутствии личинок чешуекрылых-вредителей с использованием дисков листьев растений, полученных из трансформированных растений. Рассматриваются композиции молекул рекомбинантной нуклеиновой кислоты, которые кодируют химерные инсектицидные белки. Например, химерные инсектицидные белки могут быть экспрессированы конструктами рекомбинантной ДНК, в которых молекула полинуклеотида с ORF, кодирующим химерный
инсектицидный белок, функционально связана с генетическими экспрессионными элементами, такими как промотор и любым другим регуляторным элементом, необходимым для экспрессии в системе, для которых предназначен конструкт. Неограничивающие примеры включают растительный функциональный промотор функционально связанный с синтетическим химерным инсектицидным белком, кодирующим последовательности, для экспрессии химерного инсектицидного белка в растениях, или Bt-функциональный промотор функционально связанный с последовательностью, кодирующей химерный инсектицидный белок, для экспрессии белка в Bt -бактерии или в другом Bacillus. Другие элементы могут быть функционально связаны с последовательностями, кодирующими химерные инсектицидные белки, включая, без ограничений, энхансеры, интроны, нетранслируемые лидеры, кодированные белковые иммобилизационные метки (гистидиновая метка), транслокационные пептиды (т.е., пластидные транзитные пептиды, сигнальные пептиды), полипептидные последовательности для посттрансляционных модифицирующих ферментов, сайты связывания рибосом и сайты-мишени РНКи.
[0177] Приведенные в данном документе примеры рекомбинантных полинуклеотидных молекул включают, без ограничений, гетерологичный промотор, функционально связанный с полинуклеотидом, таким как SEQ ID N0: 1, 2, 3, 5, б, 8, 9, 11, 12, 14, 15, 17, 18, 20, 22, 24, 26, 27, 29, 31, 32, 34, 35, 37, 38, 40, 42, 44, 46, 48, 49, 51, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 и 130, который кодирует полипептид или белок, содержащий аминокислотную последовательность, указанную в SEQ ID NO: 4 (TIC1100), 7 (TIC860), 10 (TIC867), 13 (TIC867_20), 16 (TIC867_21), 19 (TIC867_22), 21 (TIC867_23), 23 (TIC867_24), 25 (TIC867_25), 28 (TIC868), 30 (TIC868_9), 33 (TIC868_10), 36 (TIC868_11), 39 (TIC867_12), 41 (TIC867_13), 43 (TIC867_14), 45 (TIC867_15), 47 (TIC867_29), 50 (TIC869), 53 (TIC836), 55 (TIC713), 57 (TIC843), 59 (TIC862), 61 (TIC1099), 63 (TIC1099-T507E), 65 (TIC1099-
R522K), 67 (TIC1099-K490S), 69 (TIC1099-T562R), 71 (TIC1099-S533R), 73 (TIC1099-G498D), 75 (TIC1099-K490A), 77 (TIC1099-Е564А), 79 (TIC1103), 81 (TIC1101), 83 (TIC845), 85 (TIC846), 87 (TIC858), 89 (TIC865), 91 (TIC866), 93 (TIC838), 95 (TIC839), 97 (TIC841), 99 (TIC842), 101 (TIC850), 103 (TIC859), 105 (TIC861), 107 (TIC848), 109 (TIC849) и 111 (TIC847). Гетерологичный промотор также может быть функционально связан с синтетическими кодирующими последовательностями ДНК, кодирующими химерный инсектицидный белок, нацеленный на пластиду, и ненацеленный химерный инсектицидный белок. Предполагается, что кодоны молекулы рекомбинантной нуклеиновой кислоты, кодирующие химерный инсектицидный белок, описанный в данном документе, могут быть заменены синонимичными кодонами (известны в данной области техники как молчащие замены).
[0178] Молекула рекомбинантной ДНК или конструкт, содержащий последовательность, кодирующую химерный инсектицидный белок, может дополнительно содержать область ДНК, которая кодирует один или более токсичных агентов, которые могут быть сконструированы для одновременной экспрессии или совместной экспрессии с последовательностью ДНК, кодирующей химерный инсектицидный белок, отличный от химерного инсектицидного белка, молекулу дцРНК, обладающую ингибирующей активностью в отношении насекомых, или вспомогательный белок. Вспомогательные белки включают, без исключений, кофакторы, ферменты, партнеры по связыванию или другие агенты, которые способствуют повышению эффективности агента, обладающего ингибирующей активностью в отношении насекомых, например, способствуя его экспрессии, влияя на его стабильность в растениях, оптимизируя свободную энергию для олигомеризации, увеличивая его токсичность и увеличивая спектр его активности. Вспомогательный белок может облегчать захват одного или более агентов, обладающих ингибирующих активностью в отношении насекомых, например, или усиливать токсическое действие токсического агента.
[0179] Молекулу или конструкт рекомбинантной ДНК можно собирать так, чтобы все белки или молекулы дцРНК экспрессировали из одного промотора, или каждый белок или молекулу дцРНК
экспрессировали под контролем отдельного промотора, или в определенной их комбинации. Белки согласно настоящему изобретению могут быть экспрессированы из мультигенной экспрессирующей системы, в которой химерный инсектицидный белок экспрессируется из общего нуклеотидного сегмента, который также содержит другие открытые рамки считывания и промоторы, в зависимости от выбранного типа экспрессирующей системы. Например, бактериальная мультигенная экспрессирующая система может использовать единственный промотор для управления экспрессией множественных/тандемных открытых рамок считывания из одного оперона (то есть, полицистронная экспрессия). В другом примере растительная мультигенная экспрессирующая система может использовать многократнонесвязанные экспрессионные кассеты, каждая из которых экспрессирует другой белок или другой токсичный агент, такой как одна или более молекул дцРНК.
[0180] Рекомбинантные молекулы нуклеиновой кислоты или
конструкции рекомбинантной ДНК, содержащие последовательность,
кодирующую химерный инсектицидный белок, могут быть доставлены в
клетки-хозяева векторами, например, плазмидой, бакуловирусом,
синтетической хромосомой, вирионом, космидой, фагемидой, фагом
или вирусным вектор. Такие векторы могут быть использованы для
достижения стабильной или транзиентной экспрессии
последовательности, кодирующей химерный инсектицидный белок, в
клетке-хозяине, или более поздней экспрессии кодируемого
полипептида. Экзогенный рекомбинантный полинуклеотид или
конструкт рекомбинантного ДНК, которая содержит
последовательность, кодирующую химерный инсектицидный белок, и которая вводится в клетку-хозяина, упоминаемая в данном документе как "трансген".
[0181] В данном документе предложены трансгенные бактерии, трансгенные растительные клетки, трансгенные растения и части трансгенных растений, которые содержат полинуклеотид, который кодирует любой один или более химерных инсектицидных белков. Термин "бактериальная клетка" или "бактерия" может включать, без ограничений, клетку Agrobacterium, Bacillus, Escherichia, Salmonella, Pseudomonas или Rhizobium. Термин "растительная
клетка" или "растение" может включать, без ограничений, клетку
двудольного растения или клетку однодольного растения.
Рассматриваемые растения и растительные клетки включают, без
ограничений, клетку или растение люцерны, банана, ячменя, бобов,
брокколи, капусты, моркови, маниока, клещевины, цветной капусты,
сельдерей, нута, китайской капусты, цитрусовых, кокосовой
пальмы, клевера, хлопчатника, тыквы, огурца, ели Дугласа,
баклажана, эвкалипта, льна, чеснока, винограда, хмеля, лука-
порея, салата, сосны Лоблолли, просо, дыни, грецкого ореха,
овса, гороха, арахиса, перца, голубиного гороха, сосны,
картофеля, тополя, тыквы, сосны лучистой, редиса, рапса, риса,
злака, ржи, американского шафрана, кустарник, сорго, южной
сосны, сои, шпината, кабачка, клубники, сахарной свеклы,
сахарного тростника, подсолнечника, сладкой кукурузы, амбрового
дерева, сладкого картофеля, просо, чая, табака, томата,
тритикале, дерновой травы, арбуза, пшеницы. В некоторых
вариантах реализации изобретения представлены трансгенные
растения и части трансгенных растений, которые регенерировали из
трансгенной растительной клетки. В некоторых вариантах
реализации изобретения трансгенные растения могут быть получены
из трансгенного семени путем разрезания, срывания, измельчения
или иного отделения части от растения. В определенных вариантах
реализации изобретения часть растения может быть семенем,
коробочкой, листом, цветком, стеблем, корнем или любой его
частью или невосстанавливаемой частью трансгенной части
растения. Как используется в данном контексте,
"нерегенерируемая" часть трансгенной части растения представляет собой часть, которая не может быть индуцирована для образования целого растения или которая не может быть индуцирована для образования целого растения, способного к половому и/или бесполому размножению. В некоторых вариантах реализации изобретения нерегенерируемая часть отбираемой части растения представляет собой часть трансгенного семени, коробочки, листа, цветка, стебля или корня.
количество химерных инсектицидных белков. Такие растения могут быть получены путем введения полинуклеотида, который кодирует химерные инсектицидные белки, предусмотренные в этой заявке, в растительную клетку и выбирает растение, полученное из указанной растительной клетки, которое экспрессирует ингибирующее в отношении насекомых или Lepidoptera количество инсектицидного вещества. Растения могут быть получены из растительных клеток путем регенерации семян, пыльцы или меристемы, полученных способами трансформации. Способы трансформации растений известны в данной области техники. Например, трансформация, опосредованная Agrobacterium, описана в публикациях патентной заявки США 2009/0138985А1 (соя) , 2008/0280361А1 (соя) , 2009/0142837А1 (кукуруза) , 2008/0282432 (хлопчатник) и 2008/0256667 (хлопчатник).
[0183] Растения, экспрессирующие химерные инсектицидные
белки, можно скрещивать путем селекции с трансгенными объектами,
экспрессирующими другие инсектицидные белки и/или
экспрессирующими другие трансгенные признаки, такие как другие признаки для борьбы с насекомыми, гены устойчивости к гербицидам, гены, повышающие урожайность или устойчивость к стрессу, и т.п. или признаки могут быть объединены в один вектор, так что все признаки будут связаны между собой.
[0184] Обработанные растительные продукты, причем процессированный продукт содержит обнаруживаемое количество химерного инсектицидного белка, сегменты и фрагменты, обладающие ингибиторной активностью в отношении насекомых, или его фрагмент или любую его отличительную часть, также раскрыты в настоящей заявке. В некоторых вариантах реализации изобретения обработанный продукт выбирают из группы, состоящей из частей растения, биомассы растений, масла, муки, сахара, корма для животных, муки, хлопьев, отрубей, волокна, шелухи обработанных семян и семян. В определенных вариантах реализации изобретения обработанный продукт является нерегенерируемым. Растительный продукт может включать товарные или другие коммерческие продукты, полученные из трансгенного растения или части трансгенных растений, причем товарные или другие продукты можно
отследить путем обнаружения нуклеотидных сегментов или экспрессированных РНК или белков, которые кодируют или содержат отличные части химерного инсектицидного белка.
[0185] Также в настоящей заявке раскрыты способы борьбы с насекомыми, в частности, заражениями культурных растений чешуекрылыми насекомыми с использованием химерных инсектицидных белков. Такие способы могут включать выращивание растения, содержащего ингибирующее в отношении насекомых Lepidoptera количество химерного инсектицидного белка. В некоторых вариантах реализации изобретения такие способы могут дополнительно включать любое одно или более из: (I) нанесения любой композиции, содержащей или кодирующей химерный инсектицидный белок, на растение или семя, которое дает начало растению; и (II) трансформацию растения или растительной клетки, которые дают начало растению с полинуклеотидом, кодирующим химерный инсектицидный белок. В общем, предполагается, что химерный инсектицидный белок может быть обеспечен в композиции, имеющейся в микроорганизме, или имеющейся в трансгенном растении, чтобы обеспечить ингибирующую активность против чешуекрылых насекомых.
[0186] В некоторых вариантах реализации изобретения химерный инсектицидный белок является инсектицидно активным ингредиентом композиции, обладающей ингибирующей активностью в отношении насекомых, полученной культивированием рекомбинантного Bacillus или любой другой рекомбинантной бактериальной клетки, трансформированной для экспрессии химерного инсектицидного белка в условиях, подходящих для экспрессии. Такая композиция может быть получена путем высушивания, лиофилизации, гомогенизации, экстракции, фильтрации, центрифугирования, седиментации или концентрирования культуры таких рекомбинантных клеток, экспрессирующих/продуцирующих химерный инсектицидный белок. Такой процесс может приводить к образованию клеточного экстракта, клеточной суспензии, клеточного гомогената, клеточного лизата, клеточного супернатанта, клеточного фильтрата или клеточного осадка из Bacillus или других энтомопатогенных бактерий. Получив сконструированный инсектицидный белок, таким образом, создают, композицию, которая содержит сконструированный
инсектицидном белок, может содержать бактериальные клетки,
бактериальные споры, а также параспоральные тельца и может
поставляться для различных применений, включая продукты-спреи,
обладающие ингибирующей активностью в отношении
сельскохозяйственные насекомых или препараты кормовой биомассы, обладающие ингибирующей активностью в отношении насекомых в кормовых биотестах.
[0187] Вышеупомянутое соединение или препарат может дополнительно содержать сельскохозяйственно приемлемый носитель, такой как приманка, порошок, пыль, таблетки, гранулы, спреи, эмульсия, коллоидная суспензия, водный раствор, споры Bacillus или кристаллические препараты или обработанные семена. Соединение или препарат также могут дополнительно содержать рекомбинантную растительную клетку, растительную ткань, семена или растение, трансформированные для экспрессии одного или более белков; или бактерии, трансформированные для экспрессии одного или более белков. В зависимости от уровня ингибирования в отношении насекомых или инсектицидного ингибирования, присущего рекомбинантному полипептиду, и уровня соединения или препарата, который должен применяться в анализе растений или рациона, соединение или препарат могут содержать различные массовые количества рекомбинантного полипептида, например, от 0,0001% до 0,001%, до 0,01%, до 1%, до 99% от массы рекомбинантного полипептида.
[0188] В варианте реализации изобретения для снижения вероятности развития резистентности, композиция, обладающая ингибирующей активностью в отношении насекомых, или трансгенное растение, содержащее химерный инсектицидный белок, может дополнительно содержать по меньшей мере один дополнительный токсический агент, который проявляет ингибирующую активность против тех же видов чешуекрылых насекомых, но который отличается от химерного инсектицидного белка. Возможные дополнительные токсичные агенты для такой композиции содержат белок, обладающий ингибирующей активностью против насекомых, и молекулу дцРНК, обладающую ингибирующей активностью против насекомых. Один пример использования таких рибонуклеотидных последовательностей
для борьбы с насекомыми-вредителями описан в Baum, et al. (публикация патента США 2006/0021087 А1) . Такой дополнительный полипептид(ы) для борьбы с чешуекрылыми-вредителями может быть выбран из группы, состоящей из белка, обладающего ингибирующей активностью в отношении насекомых, такого как, без ограничений, CrylA (патент США № 5880275), CrylAb, CrylAc, CrylA.105, CrylAe, CrylB (публикация патента США 10/525,318), CrylC (патент США № 6033874), химеры CrylD, CrylE, CrylF и CrylA/F (патенты США 7070982, 6962705 и 6713063), CrylG, CrylH, Cryll, CrylJ, CrylK, CrylL, Cry2A, Cry2Ab (патент США № 7064249), Cry2Ae, Cry4B, Сгуб, Cry7, Cry8, Cry9, Cryl5, Cry43A, Cry43B, Cry51Aal, ЕТ66, TIC400, TIC800, TIC834, TIC1415, Vip3A, VIP3Ab, VIP3B, AXMI-001, AXMI-002, AXMI-030, AXMI-035 и AXMI-045 (публикация патента США
2013- 0117884 Al), AXMI-52, AXMI-58, AXMI-88, AXMI-97, AXMI-102, AXMI-112, AXMI-117, AXMI-100 (публикация патента США 20130310543 Al), AXMI-115, AXMI-113, AXMI-005 (публикация патента США 2013-0104259 Al) , AXMI-134 (публикация патента США 20130167264 Al), AXMI-150 (публикация патента США 2010-0160231 Al), AXMI-184 (публикация патента США 2010-0004176 Al) , AXMI-196, AXMI-204, AXMI-207, AXMI-209 (публикация патента США 20110030096 Al), AXMI-218, AXMI-220 (публикация патента США 20140245491 Al ), AXMI-221z, AXMI-222z, AXMI-223z, AXMI-224z, AXMI-225z (публикация патента США 2014-0196175 Al) , AXMI-238 (публикация патента США 2014-0033363 Al) , AXMI-270 (публикация патента США 2014-0223598 Al) , AXMI-345 (публикация патента США
2014- 0373195 Al) , DIG-3 (публикация патента США 2013-0219570 Al), DIG-5 (публикация патента США 2010-0317569 Al) , DIG-11
(публикация патента США 2010-0319093 Al), AfIP-lA и его производные (публикация патентной заявки США 2014-0033361 А1 ) , AfIP-lB и его производные (публикация патента США 2014-0033361 Al), PIP-1APIP-1B (публикация патента США 2014-0007292 А1), PSEEN317 4 (публикация патента США 2014-0007292 Al) , AECFG-592740
(публикация патента 2014-0007292 Al), Pput_1063 (публикация патента США 2014-0007292 Al) , Pput_1064 (публикация патента США 2014-0007292 Al) , GS-135 и его производные (публикация патента США 2012-0233726 Al), GS153 и его производные (публикация
патента США 2012-0192310 Al) , GS154 и его производные (публикация патента США 2012-0192310 Al) , GS155 и его производные (публикация патента 2012-0192310 Al), SEQ ID NO: 2 и ее производные, как описано в публикации патента США 20120167259 Al, SEQ ID NO: 2 и ее производные, как описано в публикации патента США 2012-0047606 Al, SEQ ID NO: 2 и ее производные, как описано в публикации патента США 2011-0154536 Al, SEQ ID NO: 2 и ее производные, как описано в публикации патента США 2011-0112013 Al, SEQ ID NO: 2 и 4, и ее производные, как описано в публикации патента США 2010-0192256 Al, SEQ ID NO: 2 и ее производные, как описано в публикации патента США 2 0100077507 Al, SEQ ID NO: 2 и ее производные, как описано в публикации патента США 2010-0077508 Al, SEQ ID NO: 2 и ее производные, как описано в публикации патента США 2009-0313721 Al, SEQ ID NO: 2 или 4, и их производных, как описано в публикации патента США 2010-0269221 Al, SEQ ID NO: 2 и ее производные, как описано в патенте США № 7772465 ( В2), CF161_0085 и его производные, как описано в WO 2014/008054 А2, токсичные белки к чешуекрылым насекомым и их производные, как описано в патенте США US2008-0172762 Al, US2011-10055968 А1 и US2012-0117690 Al; SEQ ID NO: 2 и ее производные, как описано в US7510878 (В2), SEQ ID NO: 2 и ее производные, как описано в патенте США № 7812129 (В1); и тому подобное.
[0189] В других вариантах реализации изобретения композиция или трансгенное растение, обладающее ингибирующей активностью в отношении насекомых, может дополнительно содержать по меньшей мере один дополнительный токсический агент, который проявляет ингибирующую активность в отношении насекомых-вредителей, которые не ингибируются химерными инсектицидными белками согласно настоящему изобретению (такие насекомые-вредители как жесткокрылые, полужесткокрылые и равнокрылые) с тем, чтобы расширить спектр ингибирующей активности в отношении насекомых.
[0190] Такой дополнительный токсичный агент для борьбы с жесткокрылыми насекомыми-вредителями может быть выбран из группы, состоящей из белка, обладающего ингибирующей активностью в отношении насекомых, такого как, без ограничений, СгуЗВЬ
(патент США № 6501009), варианты CrylC, варианты СгуЗА, СгуЗ, СгуЗВ, Сгу34/35, 5307, AXMI134 (публикация патента США 20130167264 Al) AXMI-184 (публикация патента США 2010-0004176 А1) , AXMI-205 (публикация патента США 2014-0298538 Al), axmi207 (публикация патента США 2013-0303440 Al) , AXMI-218, AXMI-220 (публикация патента США 20140245491А1), AXMI-221z, AXMI-223z (публикация патента США 2014-0196175 Al) , AXMI-279 (публикация патента США 2014-0223599 Al), AXMI-R1 и их варианты (публикация патента США 2010-0197592 Al, TIC407, TIC417, TIC431, TIC807, TIC853, TIC901, TIC1201, TIC3131, DIG-10 (публикация патента США 2010-0319092 Al) , eHIPs (публикация патентной заявки США 2010/0017914) IP3 и его варианты (публикация патента США 20120210462 А1) и то -гексатоксин-Hvla (публикация патентной заявки US2014-0366227 А1).
[0191] Такой дополнительный токсичный агент для борьбы с полужесткокрылыми-вредителями может быть выбран из группы, состоящей из белков, активных в отношении полужесткокрылых, таких как, без ограничений, TIC1415 (публикация патента США 2013-0097735 Al) , TIC807 (патент США № 8609936), TIC834 (публикация патента США 2013-0269060 Al) , AXMI-036 (публикация патента США 2010-0137216 А1) и AXMI-171 (публикация патента США 2013-0055469 А1) . Дополнительные полипептиды для борьбы с жесткокрылыми, чешуекрылыми и равнокрылыми насекомыми-вредителями можно найти на сайте номенклатуры токсинов Bacillus thuringiensis, находящемся в ведении Нилом Крикмором (во всемирной паутине по адресу btnomenclature.infо).
[0192] Последовательности, кодирующие химерные
инсектицидные белки, и последовательности, имеющие значительную процентную идентичность с химерными инсектицидными белками, можно идентифицировать с использованием способов, известных специалистам в данной области техники, таких как полимеразная цепная реакция (ПЦР), термическая амплификация и гибридизация. Например, химерные инсектицидные белки могут быть использованы для получения антител, которые специфически связываются с белками, и могут быть использованы для скрининга и поиска других
[0193] Кроме того, нуклеотидные последовательности,
кодирующие химерные инсектицидные белки, могут быть использованы
в качестве зондов и праймеров для скрининга и идентификации
других членов класса с использованием способов термоциклической
или изотермической амплификации и гибридизации. Например,
олигонуклеотиды, полученные из последовательностей, указанных в
SEQ ID N0: 2, могут быть использованы для определения
присутствия или отсутствия химерного инсектицидного трансгена в
образце дезоксирибонуклеиновой кислоты, полученной из товарного
продукта. Учитывая чувствительность определенных способов
обнаружения нуклеиновых кислот, которые используют
олигонуклеотиды, предполагается, что олигонуклеотиды, полученные из последовательностей, указанных в любой из SEQ ID N0: 2, могут быть использованы для обнаружения соответствующего химерного инсектицидного белка в товарных продуктах, полученных из объединенных источников, где только часть товарного продукта получена из трансгенного растения, содержащего любую из SEQ ID N0: 2 .
ПРИМЕРЫ
[0194] Ввиду вышеизложенного специалистам в данной области техники будет понятно, что следующие раскрытые варианты реализации являются исключительно репрезентативными для настоящего изобретения, которые могут быть реализованы в различных формах. Таким образом, конкретные структурные и функциональные детали, раскрытые в данном документе, не должны интерпретироваться как ограничивающие.
ПРИМЕР 1
Создание и клонирование последовательностей, кодирующих новые химерные инсектицидные белки, активные в отношении чешуекрылых
[0195] Данный Пример иллюстрирует создание новых химерных инсектицидных белков и клонирование, и экспрессию химерных инсектицидных белков.
получения полинуклеотидных последовательностей, кодирующих новые химерные инсектицидные белки. Полученные полинуклеотидные последовательности клонировали в плазмидный экспрессионный вектор Bacillus thuringiensis {Bt) . После подтверждения полинуклеотидной последовательности экспрессионную плазмиду трансформировали в Bt и экспрессировали. Препараты новых химерных белков анализировали на активность против различных чешуекрылых-вредителей.
[0197] Многие полинуклеотидные последовательности,
кодирующие химерные инсектицидные белки, были получены и
испытаны в биотесте. Не все химерные инсектицидные белки
демонстрировали активность. Только несколько из химерных
инсектицидных белков были отобраны на основании их активности в
отношении конкретных чешуекрылых, продемонстрированной в
биотесте. Варианты аминокислот, в которые были введены
аминокислотные замены или альтернативные протоксиновые домены,
также были получены на основе исходных химерных инсектицидных
белков TIC867 и TIC868. Компоненты химерных инсектицидных белков
(домены I, II и III и протоксин) согласно настоящему изобретению
представлены в Таблице 1. Также представлены аминокислотные
замены в вариантах TIC8 68 относительно исходной
последовательности белка TIC868.
Таблица 1. Новые химерные пестицидные белки и их компоненты.
Токсин
ПРТ SEQ ID NO:
Doml
Dom2
Dom3
Протоксин
Аминокислотные модификации *
TIC1100
CrylAh
CrylAc
CrylCa
CrylAc
TIC860
CrylBbl
CrylBbl
CrylCa
CrylAc
TIC867
CrylBe2
CrylBe2
CrylKa
CrylAb3
TIC867 20
CrylBe2
CrylBe2
CrylKa
CrylDal
TIC867 21
CrylBe2
CrylBe2
CrylKa
Cry4
TIC867 22
CrylBe2
CrylBe2
CrylKa
Cry9
TIC867 23
CrylBe2
CrylBe2
CrylKa
CrylBe
TIC867 24
CrylBe2
CrylBe2
CrylKa
CrylKa
TIC867 25
CrylBe2
CrylBe2
CrylKa
CrylCa
TIC868
CrylBe2
CrylBe2
CrylCa
CrylAb3
TIC868 9
CrylBe2
CrylBe2
CrylCa
CrylAb3
N240S Y343Q N3
стандартного кода аминокислот ИЮПАК. См. Объединенная комиссия по биохимической номенклатуре ИЮПАК-IUB по биохимической номенклатуре. Номенклатура и система обозначений аминокислот и пептидов. Eur. J. Biochem. 138:9-37(1984) . Первое сокращение первой аминокислотной последовательности обозначает исходную аминокислоту в данном каркасном белке, число представляет положение аминокислоты, а второе сокращение аминокислотной последовательности обозначает аминокислоту, помещенную в данное положение в улучшенном варианте белка. ПРИМЕР 2
Новые химерные инсектицидные белки демонстрируют активность против чешуекрылых-вредителей
[0198] Данный Пример иллюстрирует тестирование химерных инсектицидных белков, описанных в Примере 1, и активность в отношении чешуекрылых, наблюдаемую для химерных инсектицидных белков.
[0199] Полинуклеотидные последовательности, кодирующие химерные инсектицидные белки, экспрессировали в Bt. Экспрессированные химерные инсектицидные белки затем анализировали против множества чешуекрылых, известных как вредители кукурузы, сахарного тростника, сои и хлопчатника, а также других культурных растений. В частности, инсектицидные белки анализировали на активность против совки бархатных бобов
(VBC, Anticarsia gemmatalis) , огневки сахарного тростника (SCB, Diatraea saccharalis), точильщика зернового кукурузного (LSCB, Elasmopalpus lignosellus), хлопковой совки (CEW, Helicoverpa zea) , табачной листовертки (TBW, Heliothis virescens), соевой совки (SBL, Chrysodeixis includens), черной совки (BLAW, Spodoptera cosmioides), южной совки (SAW, Spodoptera eridania), кукурузной листовой совки (FAW, Spodoptera frugiperda), совки малой (BAW, Spodoptera exigua), совки американской (OBW, Helicoverpa armigera) , азиатской хлопковой совки (OLW, Spodoptera litura), розового коробочного червя ((PBW, Pectinophora gossypiella) , совки-ипсилон (BCW, Agrotis ipsilon), огневки кукурузной юго-западной (SWCB, Diatraea grandiosella) , шиповатого северного коробочного червя (SBW, Earias vitella) , и мотылька стеблевого кукурузного (ЕСВ, Ostrinia nubilalis) . Американская кукурузная совка (CEW, Helicoverpa zea) также называется как коробочный червь (SPW) и совка хлопковая (CBW). Активность определяли при помощи комбинации показателей смертности и задержки роста, а также оценки МИК50 (минимальная ингибирующая концентрация для 50%). МИК50 относится к концентрации ингибирующей линьку, причем как мертвые личинки, так и личинки L1 (личинки, которые лишены линьки до вторых возрастов) учитываются в оценке. В Таблице 2 показана активность
каждого химерного инсектицидного белка. Знак '+' указывает на активность, наблюдаемую у конкретного насекомого-вредителя.
[0200] Как можно видеть из Таблицы 2 выше, большинство химерных инсектицидных белков проявляли активность против одного или более видов чешуекрылых-вредителей.
ПРИМЕР 3
Синтез генов, кодирующих химерные инсектицидные белки, для экспрессии в растениях
[0201] Данный Пример иллюстрирует синтез полинуклеотидов, кодирующих химерные инсектицидные белки, для экспрессии в растениях.
[0202] Синтетические кодирующие последовательности были
сконструированы для применения в экспрессии химерных
инсектицидных белков в растениях. Синтетические
последовательности были сконструированы и синтезированы в
соответствии со способами, как правило, описанными в патенте США
5500365, избегая некоторых неподходящих проблемных
последовательностей, таких как последовательности
полиаденилирования растений, обогащенные АТТТА и А/Т, при
сохранении аминокислотной последовательности химерного
инсектицидного белка. Нуклеотидные последовательности для этих генов, кодирующих химерные инсектицидные белки для экспрессии в растениях, перечислены в Таблице 3.
Таблица 3. Полинуклеотидные последовательности, кодирующие химерные инсектицидные белки, предназначенные для применения в растениях.
Инсектицидный белок
ДНК SEQ ID NO:
ПРТ SEQ ID NO:
TIC1100
TIC1100
TIC860
TIC867
TIC867 20
TIC867 21
TIC867 22
TIC867 23
TIC867 24
TIC867 25
TIC868
Инсектицидный белок
ДНК SEQ ID NO:
ПРТ SEQ ID NO:
TIC868 9
TIC868 10
TIC868 11
TIC868 12
TIC868 13
TIC868 14
TIC868 15
TIC868 29
TIC869
TIC836
ПРИМЕР 4
Экспрессионные кассеты для экспрессии химерных инсектицидных белков в растениях
[0203] Данный Пример иллюстрирует конструкцию
экспрессионных кассет, содержащих предназначенные для применения в растениях полинуклеотидные последовательности, которые кодируют химерные инсектицидные белки.
[0204] Разнообразные экспрессионные кассеты растений были
сконструированы с применением полинуклеотидных
последовательностей, кодирующих химерные инсектицидные белки, предложенные в Таблице 3 и предназначенные для экспрессии в растениях. Такие экспрессионные кассеты полезны для транзиентной экспрессии в протопластах растений или трансформации растительных клеток. Типичные экспрессионные кассеты были разработаны с учетом возможного размещения белка внутри клетки. Один набор экспрессионных кассет был сконструирован таким образом, чтобы белок был транслирован и хранился в цитозоле. Другой набор экспрессионных кассет был сконструирован так, чтобы содержать транзитный пептид, смежный с белком токсина, для обеспечения нацеливания на органеллы клетки, такие как хлоропласт или пластиду. Все экспрессионные кассеты были сконструированы, чтобы начаться на 5'-конце с промотора, который может состоять из нескольких промоторных элементов, энхансерных элементов или других экспрессионных элементов, известных специалистам в данной области техники, функционально связанных,
для повышения экспрессии трансгена. За промоторной
последовательностью, как правило непрерывно следует одна или
более лидерная последовательность на З'-конце промотора.
Интронная последовательность, как правило, расположена на З'-
конце лидерной последовательности, для улучшения экспрессии
трансгена. Последовательность, кодирующая токсин или транзитный
пептид, и последовательность, кодирующая токсин, как правило,
расположена на З'-конце функционально связанного промотора,
лидера и интрона. Последовательность З'-НТО, как правило,
расположена, на З'-конце кодирующей последовательности для
облегчения терминации транскрипции и обеспечения
последовательности, важной для полиаденилирования получаемого транскрипта. Все элементы, описанные выше, были функционально связаны между собой и расположены последовательно, часто с дополнительными последовательностями, используемыми для конструирования экспрессионной кассеты. ПРИМЕР 5
Активность в отношении чешуекрылых химерного инсектицидного белка в стабильно трансформированной кукурузе
[0205] Данный Пример иллюстрирует ингибиторную активность, проявляемую химерными инсектицидными белками в отношении чешуекрылых-вредителей, экспрессированными растениями кукурузы и предложенными в виде корма для соответствующих насекомых-вредителей кукурузы.
[0206] Сорт кукурузы LH2 4 4 трансформировали в бинарные
векторы для трансформации, описанные в Примере 4, с применением
способа трансформации, опосредованной Agrobacterium.
Трансформированные клетки индуцировали для образования растений при помощи способов, известных в данной области техники. Биотестирование с использованием листовых дисков растения выполняли по аналогии с теми, которые описаны в патенте США № 8344207. Ткань, полученную из нетрансформированных растений сорта LH244, использовали в качестве отрицательного контроля. Множество объектов трансформации для каждого бинарного вектора оценивали против американской кукурузной совки (CEW, Helicoverpa
zea), кукурузной листовой совки (FAW, Spodoptera frugiperda) , совки-ипсилон (BCW, Agrotis ipsilon) и огневки кукурузной юго-западной (SWCB, Diatraea grandiosella) .
[0207] Биотестирование с использованием листовых дисков выполняли на трансгенных растениях Ro и Fi поколений. Кроме того, степень повреждения листьев оценивали для целых трансгенных Fi растений, экспрессирующих определенные химерные инсектицидные белки, зараженных чешуекрылыми насекомыми-вредителями. Fi трансгенные объекты, экспрессирующие TIC8 60 и TIC8 68, также оценивали по активности в поле против FAW, CEW, и SWCB. Результаты анализа приведены в Таблице 4. Знак '+' указывает на активность, наблюдаемую у конкретного насекомого-вредителя. Как видно из Таблицы 4, большинство химерных инсектицидных белков и многие из вариантов химерных инсектицидных белков демонстрировали активность в отношении одного или более видов чешуекрылых-вредителей.
Таблица 4. Биотестирование активности химерного
инсектицидного белка из стабильно трансформированной ткани листа кукурузы.
Насекомое
Токсин
ПРТ SEQ ID NO:
VBC
SCB
LSCB
CEWSPWCBW
BLAW
TBW
SBL
SAW
FAW
BAW
OBW
OLW
PBW
BCW
SWCB
ECB
SBW
TIC1100
TIC860
TIC867
TIC86720
TIC86721
TIC86722
TIC868
TIC86810
TIC86811
TIC86812
TIC869
TIC836
ПРИМЕР 6
Активность в отношении чешуекрылых химерного инсектицидного белка в стабильно трансформированной сое
[0208] Данный Пример иллюстрирует ингибиторную активность, проявляемую химерным инсектицидным белком в отношении чешуекрылых-вредителей, экспрессированным растениями сои и предложенным в виде корма для соответствующих насекомых-вредителей .
[0209] Кодирующие последовательности для выбранного химерного инсектицидного белка изменяли для экспрессии в растениях, клонировали в бинарный вектор для трансформации растений, и применяли для трансформации клеток растения сои. Векторы для трансформации растений содержали первую трансгенную кассету для экспрессии химерного инсектицидного белка, как описано в Примере 4 и вторую трансгенную кассету для селекции трансформированных растительных клеток, с применением спектиномициновой селекции. В некоторых случаях, например, в случае TIC1100, TIC860 и TIC836, последовательность, кодирующая хлоропластный транзитный пептид, была функционально связана с последовательностью, кодирующей химерный инсектицидный белок. Анализы выполняли с использованием TIC1100, TIC860 и TIC836, нацеленными и ненацеленными на пластиду. В Таблице 5 ниже показан химерный инсектицидный белок и вариант TIC8 67 химерного инсектицидного белка и связанные кодирующие последовательности, применяемые для экспрессии в стабильно трансформированной сое.
[0210] Клетки растения сои трансформировали в бинарные векторы для трансформации, описанные выше, с применением способа трансформации, опосредованной Agrobacterium. В результате трансформированные растительные клетки индуцировали для формирования растений сои. Ткани листьев собирали и использовали в биотестировании, как описано в Примере 5, или альтернативно, лиофилизированные ткани использовали в виде корма насекомых для биотестирования. Биотестирование выполняли против FAW, южной совки (SAW, Spodoptera eridania), соевой совки (SBL, Chrysodeixis includens), коробочного червя (SPW, Helicoverpa zea) , совки бархатных бобов (VBC, Anticarsia gemmatalis),
табачной листовертки (TBW, Heliothis virescens), черной совки (BLAW, Spodoptera cosmioides), точильщика зернового кукурузного (LSCB, Elasmopalpus lignosellus) и совки американской (OBW, Helicoverpa armigera) .
[0211] В Таблице 5 показана активность в отношении отдельных видов чешуекрылых для каждого инсектицидного белка в растениях поколения Ro, причем '+' указывает на активность. Как видно из Таблицы 5, каждый из химерных инсектицидных белков, экспрессируемых в стабильно трансформированной сое, демонстрировал активность против нескольких видов чешуекрылых. Стоит отдельно отметить, что вариант TIC867, Т1С867_23 продемонстрировал активность в отношении SPW.
Таблица 5. Биотестирование активности химерного
инсектицидного белка из ткани листа стабильно трансформированной Ro сои.
Инсектицидный белок
FAW
SAW
SBL
SPW
VBC
TBW
BLAW
LSCB
OBW
TIC1100
TIC860
TIC867
TIC867 20
TIC867 21
TIC867 22
TIC867 23
TIC867 24
TIC867 25
TIC868
TIC869
TIC836
[0212] Выбранным трансформированным объектам обеспечили самоопыление и полученное зерно выращивали. Ткани листа собирали с растений поколения Ri и использовали в кормовом биотесте. Ri растения, экспрессирующие TIC1100, TIC860, TIC867, TIC868, TIC869 и TIC836, исследовали на активность против SAW, SBL, SPW и VBC. В Таблице б показана наблюдаемая в этих тестах активность. Знак '+' указывает на активность, наблюдаемую у конкретного насекомого-вредителя. Как показано в Таблице б,
наиболее экспрессируемый химерный инсектицидный белок из растений Ri поколения проявил активность в отношении одного или более видов чешуекрылых.
Таблица 6. Биотестирование активности химерного
инсектицидного белка из ткани листа стабильно трансформированной Ri сои.
Токсин
SAW
SBL
SPW
VBC
TIC1100
TIC860
TIC867
TIC868
TIC869
TIC836
[0213] В Таблице 7 представлены результаты полевых испытаний, проведенных в теплице с использованием стабильно трансформированных растений сои поколения Ri, экспрессирующих TIC1100, TIC860, и TIC836. Виды, используемые для заражения растений в теплице, включают SAW, SBL и SPW. Резистентность определяли как дефолиацию в растениях сои, которая составляет менее чем или равную пятнадцати процентов. Резистентность, наблюдаемая в экспериментальной клетке, соответствует резистентности, наблюдаемой у ткани листьев Ri поколения растений сои, анализа, представленного в Таблице б. Знак '+' указывает на активность, наблюдаемую у конкретного насекомого-вредителя.
Таблица 7. Профиль активности TIC1100, TIC860 и TIC836, экспрессированных в сое поколения Ri, исследуемый в полевых испытаниях в теплице.
Токсин
SAW
SBL
SPW
TIC1100
TIC860
TIC836
[0214] Полевые испытания в теплицах с использованием стабильно трансформированных растений сои поколения Ri, экспрессирующих TIC8 67 и TIC8 69, также проводили в двух разных местах в Аргентине, в Асеведо и Фонтесуэле. Виды, используемые для заражения растений в теплицах, включают южноамериканскую совку (SABW, Helicoverpa gelotopeon), VBC, BLAW, и пяденицу
подсолнечниковую (SFL, Rachiplusia пи) . Резистентность
определяли как дефолиацию в растениях сои, которая составляет
менее чем или равная пятнадцати процентов. В Таблице 8 ниже
показана наблюдаемая резистентность. Знак '+' указывает на
активность, наблюдаемую у конкретного насекомого-вредителя. Как
показано в Таблице 8, трансгенные растения сои, экспрессирующие
TIC8 67, продемонстрировали резистентность к BLAW и VBC.
Трансгенные растения сои, экспрессирующие TIC8 69,
продемонстрировали резистентность к SABW, SFL, BLAW, и VBC.
Таблица 8. Профиль активности TIC867 и TIC869, экспрессируемых в сое поколения Ri, тестировали в полевых испытаниях в теплице.
Асеведо
Фонтесуэла
Токсин
SABW
SFL
VBC
SABW
BLAW
VBC
TIC867
TIC869
ПРИМЕР 7
Активность в отношении чешуекрылых химерного инсектицидного белка в стабильно трансформированном хлопчатнике
[0215] В данном Примере показана ингибиторная активность, проявляемая химерным инсектицидным белком против чешуекрылых насекомых-вредителей, при экспрессии в растениях хлопчатника, и предложены в качестве диеты для соответствующих насекомых-вредителей .
[0216] Кодирующие последовательности для выбранного химерного инсектицидного белка, измененные для экспрессии в растениях, клонировали в бинарный вектор для трансформации растений, и применяли для трансформации растительных клеток хлопчатника. Полученные бинарные векторы были похожи на те, что описаны в Примере 4, и их использовали, чтобы экспрессировать TIC860, нацеленные и ненацеленные на пластиды, (кодирующая последовательность: SEQ ID N0: б; последовательность белка: SEQ ID N0: 7), TIC867 (кодирующая последовательность: SEQ ID N0: 9; последовательность белка: SEQ ID N0: 10), TIC868 (кодирующая последовательность: SEQ ID N0: 27; последовательность белка: SEQ
ID NO: 28) и TIC867_23 (кодирующая последовательность: SEQ ID NO: 20; последовательность белка: SEQ ID NO: 23).
[0217] Растительные клетки хлопчатника трансформировали при помощи способа трансформации, опосредованного Agrobacterium. Трансформированные клетки хлопчатника индуцировали для образования целых растений. Ткань листьев хлопчатника использовали в биотестировании, как описано в Примере 5, против совки хлопковой (CBW, Helicoverpa zea), FAW, TBW и SBL. В Таблице 9 показана активность, наблюдаемая в отношении данных видов чешуекрылых для TIC860, TIC867, и TIC868 в стабильно трансформированном хлопчатнике поколения Ro, причем '+' указывает на активность. Как видно из Таблицы 9, TIC860, TIC867, и TIC868 продемонстрировали активность в отношении двух или более видов чешуекрылых насекомых-вредителей в стабильно трансформированном хлопчатнике поколения Ro.
Таблица 9. Биотестирование активности TIC860, TIC867 и TIC868 из листовой ткани стабильно трансформированного хлопчатника поколения Ro.
Токсин
CBW
FAW
TBW
SBL
TIC860
TIC867
TIC868
[0218] Выбранные трансформированные объекты использовали
для того чтобы получить Ri семена. Ri растения, экспрессирующие
TIC860, TIC867, и TIC868, исследовали на резистентность к CBW,
FAW, TBW, и SBL. Ткани листа, бутона и коробочки использовали в
анализе. В Таблице 10 показана наблюдаемая в этих тестах
активность. Знак '+' указывает на активность, наблюдаемую у
конкретного насекомого-вредителя. Как показано в Таблице 10,
TIC8 60 продемонстрировал активность против FAW в ткани листьев.
Кроме того, химерный инсектицидный белок TIC8 67
продемонстрировал активность против CBW и FAW в ткани листа, бутона и коробочки, а также TBW и SBL в листе. Химерный инсектицидный белок TIC8 68 продемонстрировал активность против FAW в тканях листа, бутона и коробочки, а также TBW и SBL в листе.
Клонирование последовательностей, кодирующих новые химерные инсектицидные белки, активные в отношении чешуекрылых
[0219] Последовательности рекомбинантных нуклеиновых кислот были сконструированы из известных генов Cry-белка для получения кодирующих последовательностей, кодирующих новые химерные инсектицидные белки. Полученные кодирующие последовательности клонировали в плазмидный экспрессионный вектор Bacillus thuringiensis (Bt). После подтверждения клонированной последовательности экспрессионную плазмиду трансформировали в Bt и экспрессировали. Препараты новых химерных Сгу-белков исследовали активность против различных чешуекрылых вредителей. Многие кодирующие последовательности, кодирующие химерные инсектицидные белки, были получены и испытаны в биоанализе. Не все химерные инсектицидные белки демонстрировали активность. Только несколько из химерных инсектицидных белков были отобраны на основании их активности в отношении конкретных чешуекрылых и представлены в Таблице 11 ниже.
Новые химерные инсектицидные белки демонстрируют активность против чешуекрылых вредителей
[0220] Кодирующие последовательности, кодирующие химерные
инсектицидные белки, экспрессировали в Bt. Затем
экспрессированные белки анализировали в отношении различных Lepidoptera, известных как вредители кукурузы, сахарного тростника, сои и хлопчатника, а также других культурных растений. Инсектицидные белки анализировали на активность против совки бархатных бобов (VBC, Anticarsia gemmatalis) , огневки сахарного тростника (SCB, Diatraea saccharalis) , точильщика зернового кукурузного (LSCB, Elasmopalpus lignosellus) , коробочного червя (CEW, Helicoverpa zea), табачной листовертки
(TBW, Heliothis virescens), соевой совки (SBL, Chrysodeixis includens), черной совки (BLAW, Spodoptera cosmioides), южной совки (SAW, Spodoptera eridania), кукурузной листовой совки
(FAW, Spodoptera frugiperda), совки малой (BAW, Spodoptera exigua), совки американской (OBW, Helicoverpa armigera),
азиатской хлопковой совки (OLW, Spodoptera litura), розового коробочного червя (PBW, Pectinophora gossypiella), совки-ипсилон (BCW, Agrotis ipsilon), огневки кукурузной юго-западной (SWCB, Diatraea grandiosella) и мотылька стеблевого кукурузного (ЕСВ, Ostrinia nubilalis) . Американская кукурузная совка (CEW, Helicoverpa zea) также называется как коробочный червь (SPW) и совка хлопковая (CBW). Активность определяли при помощи комбинации показателей смертности и задержки роста, а также оценки МИК50. МИК50 относится к концентрации ингибирующей линьку, причем как мертвые личинки, так и личинки L1 (личинки, которые лишены линьки до вторых возрастов), учитываются в оценке. В Таблице 12 ниже показана активность каждого химерного инсектицидного белка. Знак '+' указывает на активность, наблюдаемую у конкретного насекомого-вредителя.
[0221] Как можно видеть из Таблицы 12 выше, все химерные инсектицидные белки проявляют активность против нескольких видов чешуекрылых насекомых.
ПРИМЕР 10
Варианты аминокислот TIC1099 демонстрируют активность в отношении чешуекрылых
[0222] Кодирующую последовательность для TIC1099 (SEQ ID N0: 60) модифицировали известными в данной области техники способами для изменения конкретных аминокислот из исходной белковой последовательности TIC1099 (SEQ ID N0: 61). Полученные варианты исследовали на активность против выбранных Lepidoptera. В Таблице 13 ниже показаны варианты TIC1099 и соответствующие ДНК и белковые SEQ ID N0.
[0223] Для каждого варианта исследовали смертность и замедление роста кукурузной листовой совки (FAW, Spodoptera frugiperda), американской кукурузной совки (CEW, Helicoverpa zea) , совки-ипсилон (BCW, Agrotis ipsilon), соевой совки (SBL, Chrysodeixis includens) и огневки кукурузной юго-западной (SWCB, Diatraea grandiosella). В Таблице 14 ниже показана активность в отношении каждого чешуекрылого вредителя. Активность оценивали от "+" до "++++" в зависимости от процента смертности.
Таблица 14. Активность вариантов TIC1099 в отношении Lepidoptera.
Вариант TIC1099
ПРТ SEQ ID NO:
FAW
CEW
BCW
SBL
SWCB
TIC1099
+ + + +
+ + +
+++ +
+ + + +
+++
TIC1099-T507E
+ + + +
+ + + +
+++ +
+ + + +
+++ +
TIC1099-R522K
+ + + +
+ + + +
+++ +
+ + +
+++ +
TIC1099-K490S
+ + + +
+ + +
+++ +
+ +
TIC1099-T562R
+ + + +
+ + + +
+++ +
+ + + +
+++ +
TIC1099-S553R
+ + + +
+ + + +
+++ +
+ + + +
+++ +
TIC1099-G498D
+ + + +
+ + + +
+++ +
+ + + +
+++ +
TIC1099-K490A
+ + + +
+ + + +
+++ +
+ + +
+++
TIC1099-E564A
+ + +
+ +
+++
[0224] Все варианты TIC1099 продемонстрировали активность
против пяти тестируемых видов Lepidoptera. Несколько вариантов продемонстрировали более низкую активность по сравнению с другими для конкретных вредителей. ПРИМЕР 11
Химерные инсектицидные белки, экспрессированные в стабильно трансформированной кукурузе, демонстрируют активность в отношении чешуекрылых-вредителей.
[0225] Синтетические кодирующие последовательности конструировали для экспрессии кодируемого белка в растениях, клонировали в бинарный растительный вектор для трансформации, и использовали для трансформации клеток растения кукурузы. Векторы для трансформации растений содержат первую трансгенную кассету для экспрессии химерного инсектицидного белка, который содержит конститутивный промотор, функционально связанный 5' с лидером, функционально связанным 5' с интроном, функционально связанным 5' с последовательностью, кодирующей химерный инсектицидный белок, которая в свою очередь функционально связана 5' с 3'-НТО и; вторую трансгенную кассету для селекции трансформированных клеток растений с применением глифосатной селекции. Ниже в Таблице 15 показаны последовательности, кодирующие химерные инсектицидные белки, применяемые для экспрессии в кукурузе и соответствующие SEQ ID N0.
Инсектицидный белок
ДНК SEQ ID NO:
ПРТ SEQ ID NO:
TIC713
112
TIC713
113
TIC843
114
TIC862
115
TIC1099
116
TIC1103
117
TIC845
118
TIC846
119
TIC858
120
TIC866
121
TIC838
122
TIC841
123
TIC842
124
TIC850
125
101
TIC859
126
103
TIC861
127
105
TIC848
128
107
TIC849
129
109
TIC847
130
111
[0226] Сорт кукурузы LH2 4 4 трансформировали с помощью бинарных векторов для трансформации, описанных выше, с применением способа трансформации, опосредованной Agrobacterium. Трансформированные клетки индуцировали для образования растений при помощи способов, известных в данной области техники. Биотестирование с использованием листовых дисков растения выполняли по аналогии с теми, которые описаны в патенте США № 8344207. Ткань, полученную из нетрансформированных растений сорта LH244, использовали в качестве отрицательного контроля. Множество объектов трансформации для каждого бинарного вектора оценивали против американской кукурузной совки (CEW, Helicoverpa zea), кукурузной листовой совки (FAW, Spodoptera frugiperda) , совки-ипсилон (BCW, Agrotis ipsilon) и огневки кукурузной юго-западной (SWCB, Diatraea grandiosella) . Результаты анализа показаны в Таблице 16, где "+" обозначает активность.
Инсектицидный белок
CEW
FAW
BCW
SWCB
TIC713
TIC843
TIC862
TIC1099
TIC1103
TIC845
TIC846
TIC858
TIC866
TIC838
TIC841
TIC842
TIC850
TIC859
TIC861
TIC848
TIC849
TIC847
[0227] Как можно видеть в Таблице 16 выше, все химерные инсектицидные белки продемонстрировали активность против двух или более видов чешуекрылых-насекомых.
ПРИМЕР 12
Химерные инсектицидные белки, экспрессированные в стабильно трансформированной сое, демонстрируют активность в отношении чешуекрылых-вредителей.
[0228] Кодирующие последовательности для выбранного
химерного инсектицидного белка изменяли для экспрессии в
растениях, клонировали в бинарный вектор для трансформации
растений, и применяли для трансформации клеток растения сои.
Векторы для трансформации растений содержат первую трансгенную
кассету для экспрессии химерного инсектицидного белка, который
содержит конститутивный промотор, функционально связанный 5' с
лидером, функционально связанным 5' с кодирующей
последовательностью химерного инсектицидного белка, которая, в свою очередь, функционально связана 5' с 3'- НТО и; вторую
трансгенную кассету для селекции трансформированных растительных клеток с использованием спектиномициновой селекции. В Таблице 17 ниже показаны последовательности, кодирующие химерные инсектицидные белки, применяемые для экспрессии в сое, и соответствующие SEQ ID N0.
[0229] Клетки растения сои трансформировали с помощью бинарных векторов для трансформации, описанных выше, с применением способа трансформации, опосредованной Agrobacterium. В результате трансформированные растительные клетки индуцировали для формирования растений сои. Ткани листьев собирали и использовали в биотестировании, как описано в Примере 11, или альтернативно, лиофилизированные ткани использовали в виде корма насекомых для биотестирования. Биотестирование выполняли против кукурузной листовой совки (FAW, Spodoptera frugiperda), южной совки (SAW, Spodoptera eridania), соевой совки (SBL, Chrysodeixis includens) , коробочного червя (SPW, Helicoverpa zea) , совки бархатных бобов (VBC, Anticarsia gemmatalis), соевой совки (SBL, Chrysodeixis includens), табачной листовертки (TBW, Heliothis virescens) , черной совки (BLAW, Spodoptera cosmioides) , южной совки (SAW, Spodoptera eridania) , точильщика зернового кукурузного (LSCB, Elasmopalpus lignosellus) и совки американской (OBW, Helicoverpa armigera). Ниже в Таблице 18 показана активность в отношении выбранных видов Lepidoptera для каждого инсектицидного белка в растениях поколения R0.
TIC1103
TIC866
TIC842
TIC849
[0230] Как видно из Таблицы 18, каждый из химерных
инсектицидных белков, экспрессированный в стабильно
трансформированной сое, демонстрировал активность против нескольких видов чешуекрылых.
[0231] Выбранным трансформированным объектам обеспечили самоопыление и полученное зерно выращивали. Ткани листа собирали с растений поколения R1 и использовали в биотестировании корма. В Таблице 19 показана активность инсектицидных белков, экспрессированных в ткани листьев соевого листа R1, наблюдаемая в отношении некоторых видов чешуекрылых.
[0231] Как можно видеть из вышеприведенной Таблицы 19, экспрессированные химерные инсектицидные белки из растений поколения R1 продемонстрировали активность в отношении двух или более видов чешуекрылых.
[0232] Все композиции, раскрытые и заявленные в данном документе, могут быть сделаны и выполнены без излишнего экспериментирования в свете настоящего раскрытия. Хотя композиции настоящего изобретения были описаны с точки зрения вышеизложенных иллюстративных вариантов реализации, специалистам в данной области техники будет понятно, что варианты, изменения, модификации и перестройки могут быть применены к композиции, описанной в данном документе, без отступления от концепции, сущности и объема настоящего изобретения. Более конкретно, будет очевидно, что определенные агенты, которые схожи и химически, и
физиологически, могут быть использованы вместо агентов, описанных в данном документе, достигая тех же самых или подобных результатов. Все таковые аналогичные замены и модификации, очевидные специалистам в данной области техники, считаются не выходящими за пределы сущности, объема и концепции настоящего изобретения, как определено в прилагаемой формуле изобретения.
[0233] Все публикации и опубликованные патентные документы, цитируемые в настоящей спецификации, включены в данный документ посредством ссылки в той же степени, как если бы каждая индивидуальная публикация или патентная заявка были конкретно и индивидуально указаны для включения посредством ссылки.
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
<110> Monsanto Technology LLC Baum, James A Cerruti, Thomas A Dart, Crystal L English, Leigh H Fu, Xiaoran Guzov, Victor M Howe, Arlene R Morgenstern, Jay P Roberts, James K Salvador, Sara A Wang, Jinling
<120> НОВЫЕ ХИМЕРНЫЕ ИНСЕКТИЦИДНЫЕ БЕЛКИ ТОКСИЧНЫЕ ИЛИ ИНГИБИТОРНЫЕ В ОТНОШЕНИИ ЧЕШУЕКРЫЛЫХ ВРЕДИТЕЛЕЙ
<130> P34230WO00/0022270.00098
<150> US 62/064989 <151> 2014-10-16
<160> 53
<170> PatentIn версии 3.5
<210> 1 <211> 3570 <212> ДНК
<213> Искусственная
<220>
<223> Рекомбинантные нуклеотидные последовательности, кодирующие TIC1100, используемые для экспрессии в бактериальной клетке.
<400> 1
atggagatag tgaataatca gaatcaatgc gtgccttata attgtttgaa taatcccgaa 60
atcgaaatat tagaaggcgg aagaatatca gttggtaata ccccaattga tatttctctt 120
tcgcttactc agtttctttt gagtgaattt gtcccaggtg cggggtttgt attaggatta 180
attgatttaa tatggggatt tgtaggtcct tcccaatggg acgcatttct tgctcaagtg 240
gaacagttaa ttaaccaaag aatagcagaa gctgtaagaa atacagcaat tcaggaatta 300
gagggaatgg cacgggttta tagaacctat gctactgctt ttgctgagtg ggaaaaagct 360
cctgatgacc cagagctaag agaagcacta cgtacacaat ttacagcaac tgagacttat 420
ataagtggaa gaatatccgt tttaaaaatt caaacttttg aagtacagct gttatcagtg 480
tttgcccaag ctgcaaattt acatttatct ttattaagag acgttgtgtt ttttgggcaa 540
agatggggtt tttcaacgac aaccgtaaat aattactaca atgatttaac agaagggatt 600
agtacctata cagattatgc tgtacgctgg tacaatacgg gattagaacg tgtatgggga 660
ccggattcta gagattgggt aaggtataat caatttagaa gagaattaac actaactgta 720
ttagatatcg ttgctctgtt cccgaattat gatagtagaa gatatccaat tcgaacagtt 780
tcccaattaa caagagaaat ttatacaaac ccagtattag aaaattttga tggtagtttt 840
cgaggctcgg ctcagggcat agaaagaagt attaggagtc cacatttgat ggatatactt 900
aacagtataa ccatctatac ggatgctcat aggggttatt attattggtc agggcatcaa 960
ataatggctt ctcctgtcgg tttttcgggg ccagaattca cgtttccgct atatggaacc 1020
atgggaaatg cagctccaca acaacgtatt gttgctcaac taggtcaggg cgtgtataga 1080
acattatcgt ccactttata tagaagacct tttaatatag ggataaataa tcaacaacta 1140
tctgttcttg acgggacaga atttgcttat ggaacctcct caaatttgcc atccgctgta 1200
tacagaaaaa gcggaacggt agattcgctg gatgaaatac cgccacagaa taacaacgtg 1260
ccacctaggc aaggatttag tcatcgatta agccatgttt caatgtttcg ttcaggcttt 1320
agtaatagta gtgtaagtat aataagagct cctatgttct cttggataca tcgtagtgct 1380
gaatttaata atataattgc atcggatagt attaatcaaa tacctttagt gaaaggattt 1440
agagtttggg ggggcacctc tgtcattaca ggaccaggat ttacaggagg ggatatcctt 1500
cgaagaaata cctttggtga ttttgtatct ctacaagtca atattaattc accaattacc 1560
caaagatacc gtttaagatt tcgttacgct tccagtaggg atgcacgagt tatagtatta 1620
acaggagcgg catccacagg agtgggaggc caagttagtg taaatatgcc tcttcagaaa 1680
actatggaaa taggggagaa cttaacatct agaacattta gatataccga ttttagtaat 1740
cctttttcat ttagagctaa tccagatata attgggataa gtgaacaacc tctatttggt 1800
gcaggttcta ttagtagcgg tgaactttat atagataaaa ttgaaattat tctagcagat 1860
gcaacatttg aagcagaatc tgatttagaa agagcgcaga aggcggtgaa tgcgctgttt 1920
acgtctacaa accaactagg gctaaaaaca aatgtaacgg attatcatat tgatcaagtg 1980
tccaatttag ttacgtattt atcggatgaa ttttgtctgg atgaaaagcg agaattgtcc 2040
gagaaagtca aacatgcgaa gcgactcagt gatgaacgca atttactcca agattcaaat 2100
ttcaaagaca ttaataggca accagaacgt gggtggggcg gaagtacagg gattaccatc 2160
caaggagggg atgacgtatt taaagaaaat tacgtcacac tatcaggtac ctttgatgag 2220
tgctatccaa catatttgta tcaaaaaatc gatgaatcaa aattaaaagc ctttacccgt 2280
tatcaattaa gagggtatat cgaagatagt caagacttag aaatctattt aattcgctac 2340
aatgcaaaac atgaaacagt aaatgtgcca ggtacgggtt ccttatggcc gctttcagcc 2400
caaagtccaa tcggaaagtg tggagagccg aatcgatgcg cgccacacct tgaatggaat 2460
cctgacttag attgttcgtg tagggatgga gaaaagtgtg cccatcattc gcatcatttc 2520
tccttagaca ttgatgtagg atgtacagac ttaaatgagg acctaggtgt atgggtgatc 2580
tttaagatta agacgcaaga tgggcacgca agactaggga atctagagtt tctcgaagag 2640
aaaccattag taggagaagc gctagctcgt gtgaaaagag cggagaaaaa atggagagac 2700
aaacgtgaaa aattggaatg ggaaacaaat atcgtttata aagaggcaaa agaatctgta 2760
gatgctttat ttgtaaactc tcaatatgat caattacaag cggatacgaa tattgccatg 2820
attcatgcgg cagataaacg tgttcatagc attcgagaag cttatctgcc tgagctgtct 2880
gtgattccgg gtgtcaatgc ggctattttt gaagaattag aagggcgtat tttcactgca 2940
ttctccctat atgatgcgag aaatgtcatt aaaaatggtg attttaataa tggcttatcc 3000
tgctggaacg tgaaagggca tgtagatgta gaagaacaaa acaaccaacg ttcggtcctt 3060
gttgttccgg aatgggaagc agaagtgtca caagaagttc gtgtctgtcc gggtcgtggc 3120
tatatccttc gtgtcacagc gtacaaggag ggatatggag aaggttgcgt aaccattcat 3180
gagatcgaga acaatacaga cgaactgaag tttagcaact gcgtagaaga ggaaatctat 3240
ccaaataaca cggtaacgtg taatgattat actgtaaatc aagaagaata cggaggtgcg 3300
tacacttctc gtaatcgagg atataacgaa gctccttccg taccagctga ttatgcgtca 3360
gtctatgaag aaaaatcgta tacagatgga cgaagagaga atccttgtga atttaacaga 3420
gggtataggg attacacgcc actaccagtt ggttatgtga caaaagaatt agaatacttc 3480
ccagaaaccg ataaggtatg gattgagatt ggagaaacgg aaggaacatt tatcgtggac 3540
agcgtggaat tactccttat ggaggaatga 3570
<210> 2 <211> 3570 <212> ДНК
т/г ^ т"т
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC1100, сконструированная для экспрессии в растительной клетке
<400> 2
atggagattg tgaacaacca gaaccagtgc gttccttaca actgcttgaa caaccctgag 60
attgagattc ttgagggtgg tagaatttct gttggcaaca ctcctattga catctctttg 120
agtttgactc aattcttgtt gagtgagttc gttcctggtg ctggtttcgt cttgggtttg 180
attgatttga tttggggttt cgttggtcct agtcaatggg atgctttctt ggctcaagtt 240
gagcaattga ttaaccagag gatcgctgag gctgtgagga acactgctat tcaagagttg 300
gagggtatgg ctagagttta cagaacttac gctactgctt tcgctgagtg ggagaaggct 360
cctgatgacc ctgagttgag ggaggctttg agaactcaat tcactgctac tgagacttac 420
atcagtggta gaatcagtgt cttgaagatt caaactttcg aggttcaatt gctttctgtg 480
ttcgctcaag ctgcaaactt gcacttgtct ttgcttagag atgttgtgtt ctttggtcaa 540
agatggggtt tctccactac taccgtgaac aattactaca acgatttgac tgagggtatt 600
tctacttaca ctgattacgc tgttagatgg tacaacactg gtttggagag agtttggggt 660
ccagattcca gagattgggt cagatacaac cagttcagaa gggagttgac tttgactgtc 720
ttggacattg ttgctctctt ccctaactac gatagtcgtc gttaccctat tagaactgtt 780
tctcaactta ctagggaaat ctacactaac cctgttcttg agaacttcga tggtagtttc 840
cgtggtagtg ctcaagggat tgagcgttct attcgttctc ctcatcttat ggacattctt 900
aactctatta ctatctacac tgatgctcat cgtggttact attactggtc tggtcatcaa 960
attatggcta gtcctgttgg tttcagtggt cctgagttca ctttccctct ttacggtact 1020
atgggcaacg ctgcacctca acagaggatc gttgctcaac ttggtcaagg tgtttacagg 1080
actctttctt caacccttta caggcgtcct ttcaacattg ggatcaacaa ccagcagctt 1140
tctgttcttg atggaaccga gttcgcttac ggaacctctt caaaccttcc tagtgctgtt 1200
tacaggaagt ctggaaccgt tgacagtctt gatgagattc caccgcagaa caataacgtt 1260
ccacccaggc aaggcttcag tcataggctt tctcatgttt ctatgttccg ctctggattc 1320
agcaactctt cagtttctat tatcagggct ccaatgttct cgtggattca taggtctgcc 1380
gagttcaaca acattatcgc ttccgatagc attaaccaga ttccacttgt taagggattc 1440
cgtgtttggg gaggcacctc tgttattacc ggaccaggct tcaccggagg cgacattctt 1500
cgtcgtaaca ccttcggaga tttcgtttca cttcaagtga acattaactc accaatcacc 1560
cagcgctaca ggcttcgctt ccgctacgca tcatccaggg atgcaagggt gatcgtgctt 1620
accggagcag cctcaaccgg agtgggaggc caagtgagcg tgaacatgcc acttcagaag 1680
acgatggaga tcggcgagaa ccttacctca agaacctttc gttacaccga tttcagcaac 1740
ccattcagct ttcgtgcaaa cccagacatc atagggatct cagagcagcc actgtttgga 1800
gctggatcaa tctcatccgg agagctttac atcgacaaga tcgagatcat actcgcagat 1860
gcaaccttcg aggctgagag cgatctggag cgtgcacaga aggcagtgaa cgcactcttt 1920
acctctacca accagctcgg actcaagacc aacgtgaccg attaccacat cgaccaagtg 1980
agcaacctcg tgacctacct ctcagatgag ttctgcttgg atgagaaacg cgaactcagc 2040
gagaaggtga agcacgcaaa gcgtctctca gatgagcgta acctcctcca ggatagcaat 2100
ttcaaggaca tcaatcgtca gccagagcgt ggatggggag gctcaaccgg aatcaccatc 2160
cagggaggcg atgatgtgtt taaggagaat tacgtgacac tctccggaac attcgatgag 2220
tgctacccaa catacctcta tcagaagatc gacgagtcca agctcaaggc gttcacccgt 2280
tatcagctcc gtggctacat cgaggatagt caagacctgg aaatctacct catccgctac 2340
aatgcaaagc acgagacagt gaatgtgcca ggaacaggct ccctctggcc actctccgca 2400
cagtctccaa tcggcaagtg cggcgagcca aatcgctgcg cgccacacct ggagtggaat 2460
cccgacctgg actgctcctg ccgcgacggc gagaagtgcg cccaccactc ccaccacttt 2520
agcctggaca tcgacgtggg ctgtacagac ctgaatgagg atctgggcgt gtgggtgatc 2580
tttaagatca agacacagga cggccacgcc cgcctgggca atctggagtt tctggaggag 2640
aagcctctgg tgggcgaagc cctggcccgc gtgaagcgcg ccgagaagaa atggcgcgac 2700
aaacgcgaga aactggaatg ggaaacaaac atcgtgtaca aagaagccaa agaatccgtg 2760
gacgccctat ttgtgaactc ccagtatgac cagctacagg ccgacacaaa catcgcgatg 2820
atccacgctg cggacaagcg cgtgcactcc atacgcgaag cctatctacc cgaactatcc 2880
gtgatacccg gcgtcaatgc cgcgatcttt gaagaattgg aaggccgcat cttcacagcc 2940
tttagcctct atgacgcccg aaatgtcatc aagaatggcg actttaacaa tgggctatcc 3000
tgttggaatg tcaaagggca cgtggacgtc gaagagcaga acaatcagcg atccgtctta 3060
gtcgtacccg aatgggaagc cgaagtctcc caggaagtcc gagtctgtcc tggtagaggt 3120
tacatcttga gagtgactgc ttacaaggag ggttacggtg agggatgcgt gactattcac 3180
gagattgaga acaacactga tgagttgaag ttcagtaact gcgtggagga ggaaatctac 3240
cccaacaaca ctgtgacttg taacgattac accgtgaacc aggaggaata cggaggcgct 3300
tacacctcca gaaaccgtgg atacaatgag gctccctcgg tccccgctga ttatgcctcc 3360
gtctatgagg agaagtccta caccgatgga aggcgcgaga atccctgcga gttcaatcgc 3420
ggctatcgag actacactcc gctacccgtt ggctatgtca caaaggaact ggaatacttc 3480
ccggaaacag acaaagtctg gatcgaaatc ggcgaaacag aagggacgtt catagtcgat 3540
agcgtagaac ttctccttat ggaagaatga 3570
<210> 3 <211> 3570 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC1100, сконструированная для экспрессии в растительной клетке
<400> 3
atggagattg tgaacaacca gaaccagtgc gttccttaca actgcttgaa caaccctgag 60
attgagattc ttgagggtgg tagaatttct gttggcaaca ctcctattga catctctttg 120
agtttgactc aattcttgtt gagtgagttc gttcctggtg ctggtttcgt cttgggtttg 180
attgatttga tttggggttt cgttggtcct agtcaatggg atgctttctt ggctcaagtt 240
gagcaattga ttaaccagag gatcgctgag gctgtgagga acactgctat tcaagagttg 300
gagggtatgg ctagagttta cagaacttac gctactgctt tcgctgagtg ggagaaggct 360
cctgatgacc ctgagttgag ggaggctttg agaactcaat tcactgctac tgagacttac 420
atcagtggta gaatcagtgt cttgaagatt caaactttcg aggttcaatt gctttctgtg 480
ttcgctcaag ctgcaaactt gcacttgtct ttgcttagag atgttgtgtt ctttggtcaa 540
agatggggtt tctccactac taccgtgaac aattactaca acgatttgac tgagggtatt 600
tctacttaca ctgattacgc tgttagatgg tacaacactg gtttggagag agtttggggt 660
ccagattcca gagattgggt cagatacaac cagttcagaa gggagttgac tttgactgtc 720
ttggacattg ttgctctctt ccctaactac gatagtcgtc gttaccctat tagaactgtt 780
tctcaactta ctagggaaat ctacactaac cctgttcttg agaacttcga tggtagtttc 840
cgtggtagtg ctcaagggat tgagcgttct attcgttctc ctcatcttat ggacattctt 900
aactctatta ctatctacac tgatgctcat cgtggttact attactggtc tggtcatcaa 960
attatggcta gtcctgttgg tttcagtggt cctgagttca ctttccctct ttacggtact 1020
atgggcaacg ctgcacctca acagaggatc gttgctcaac ttggtcaagg tgtttacagg 1080
actctttctt caacccttta caggcgtcct ttcaacattg ggatcaacaa ccagcagctt 1140
tctgttcttg atggaaccga gttcgcttac ggaacctctt caaaccttcc tagtgctgtt 1200
tacaggaagt ctggaaccgt tgacagtctt gatgagattc caccgcagaa caataacgtt 1260
ccacccaggc aaggcttcag tcataggctt tctcatgttt ctatgttccg ctctggattc 1320
agcaactctt cagtttctat tatcagggct ccaatgttct cgtggattca taggtctgcc 1380
gagttcaaca acattatcgc ttccgatagc attaaccaga ttccacttgt taagggattc 1440
cgtgtttggg gaggcacctc tgttattacc ggaccaggct tcaccggagg cgacattctt 1500
cgtcgtaaca ccttcggaga tttcgtttca cttcaagtga acattaactc accaatcacc 1560
cagcgctaca ggcttcgctt ccgctacgca tcatccaggg atgcaagggt gatcgtgctt 1620
accggagcag cctcaaccgg agtgggaggc caagtgagcg tgaacatgcc acttcagaag 1680
acgatggaga tcggcgagaa ccttacctca agaacctttc gttacaccga tttcagcaac 1740
ccattcagct ttcgtgcaaa cccagacatc atagggatct cagagcagcc actgtttgga 1800
gctggatcaa tctcatccgg agagctttac atcgacaaga tcgagatcat actcgcagat 1860
gcaaccttcg aggctgagag cgatctggag cgtgcacaga aggcagtgaa cgcactcttt 1920
acctctacca accagctcgg actcaagacc aacgtgaccg attaccacat cgaccaagtg 1980
agcaacctcg tgacctacct ctcagatgag ttctgcttgg atgagaaacg cgaactcagc 2040
gagaaggtga agcacgcaaa gcgtctctca gatgagcgta acctcctcca ggatagcaat 2100
ttcaaggaca tcaatcgtca gccagagcgt ggatggggag gctcaaccgg aatcaccatc 2160
cagggaggcg atgatgtgtt taaggagaat tacgtgacac tctccggaac attcgatgag 2220
tgctacccaa catacctcta tcagaagatc gacgagtcca agctcaaggc gttcacccgt 2280
tatcagctcc gtggctacat cgaggatagt caagacctgg aaatctacct catccgctac 2340
aatgcaaagc acgagacagt gaatgtacca ggaacaggct ccctctggcc actctccgca 2400
cagtctccaa tcggcaagtg cggcgagcca aatcgctgcg cgccacacct ggagtggaat 2460
cccgacctgg actgctcctg ccgcgacggc gagaagtgcg cccaccactc ccaccacttt 2520
agcctggaca tcgacgtggg ctgtacagac ctgaatgagg atctgggcgt gtgggtgatc 2580
tttaagatca agacacagga cggccacgcc cgcctgggca atctggagtt tctggaggag 2640
aagcctctgg tgggcgaagc cctggcccgc gtgaagcgcg ccgagaagaa atggcgcgac 2700
aaacgcgaga aactggaatg ggaaacaaac atcgtgtaca aagaagccaa agaatccgtg 2760
gacgccctat ttgtgaactc ccagtatgac cagctacagg ccgacacaaa catcgcgatg 2820
atccacgctg cggacaagcg cgtgcactcc atacgcgaag cctatctacc cgaactatcc 2880
gtgatacccg gcgtcaatgc cgcgatcttt gaagaattgg aaggccgcat cttcacagcc 2940
tttagcctct atgacgcccg aaatgtcatc aagaatggcg actttaacaa tgggctatcc 3000
tgttggaatg tcaaagggca cgtggacgtc gaagagcaga acaatcagcg atccgtctta 3060
gtcgtacccg aatgggaagc cgaagtctcc caggaagtcc gagtctgtcc tggtagaggt 3120
tacatcttga gagtgactgc ttacaaggag ggttacggtg agggatgcgt gactattcac 3180
gagattgaga acaacactga tgagttgaag ttcagtaact gcgtggagga ggaaatctac 3240
cccaacaaca ctgtgacttg taacgattac accgtgaacc aggaggaata cggaggcgct 3300
tacacctcca gaaaccgtgg atacaatgag gctccctcgg tccccgctga ttatgcctcc 3360
gtctatgagg agaagtccta caccgatgga aggcgcgaga atccctgcga gttcaatcgc 3420
ggctatcgag actacactcc gctacccgtt ggctatgtca caaaggaact ggaatacttc 3480
ccggaaacag acaaagtctg gatcgaaatc ggcgaaacag aagggacgtt catagtcgat 3540
agcgtagaac ttctccttat ggaagaatga 3570
<210> 4 <211> 1189
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность химерного белка TIC1100.
<400> 4
Met Glu Ile Val Asn Asn Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu
1 5 10 15
Asn Asn Pro Glu Ile Glu Ile Leu Glu Gly Gly Arg Ile Ser Val Gly
20 25 30
Asn Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45
Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Ile Asp Leu Ile
50 55 60
Trp Gly Phe Val Gly Pro Ser Gln Trp Asp Ala Phe Leu Ala Gln Val
65 70 75 80
Glu Gln Leu Ile Asn Gln Arg Ile Ala Glu Ala Val Arg Asn Thr Ala
85 90 95
Ile Gln Glu Leu Glu Gly Met Ala Arg Val Tyr Arg Thr Tyr Ala Thr
100 105 110
Ala Phe Ala Glu Trp Glu Lys Ala Pro Asp Asp Pro Glu Leu Arg Glu
115 120 125
Ala Leu Arg Thr Gln Phe Thr Ala Thr Glu Thr Tyr Ile Ser Gly Arg
130 135 140
Ile Ser Val Leu Lys Ile Gln Thr Phe Glu Val Gln Leu Leu Ser Val
145 150 155 160
Phe Ala Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Val Val
165 170 175
Phe Phe Gly Gln Arg Trp Gly Phe Ser Thr Thr Thr Val Asn Asn Tyr
180 185 190
Tyr Asn Asp Leu Thr Glu Gly Ile Ser Thr Tyr Thr Asp Tyr Ala Val
195 200 205
Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220
Asp Trp Val Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val
225 230 235 240
Leu Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Arg Tyr Pro
245 250 255
Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270
Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285
Arg Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300
Ile Tyr Thr Asp Ala His Arg Gly Tyr Tyr Tyr Trp Ser Gly His Gln
305 310 315 320
Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335
Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350
Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365
Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380
Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val
385 390 395 400
Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415
Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430
Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445
Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Glu Phe Asn Asn
450 455 460
Ile Ile Ala Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
465 470 475 480
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
545 550 555 560
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620
Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe
625 630 635 640
Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asn Val Thr Asp Tyr His
645 650 655
Ile Asp Gln Val Ser Asn Leu Val Thr Tyr Leu Ser Asp Glu Phe Cys
660 665 670
Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
675 680 685
Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Ser Asn Phe Lys Asp Ile
690 695 700
Asn Arg Gln Pro Glu Arg Gly Trp Gly Gly Ser Thr Gly Ile Thr Ile
705 710 715 720
Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Ser Gly
725 730 735
Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
740 745 750
Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
755 760 765
Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
770 775 780
Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala
785 790 795 800
Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His
805 810 815
Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys
820 825 830
Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys
835 840 845
Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
850 855 860
Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu
865 870 875 880
Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
885 890 895
Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val
900 905 910
Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
915 920 925
Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala
930 935 940
Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser
945 950 955 960
Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg
965 970 975
Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
980 985 990
Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val
995 1000 1005
Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val Leu Val Val Pro
1010 1015 1020
Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly
1025 1030 1035
Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly
1040 1045 1050
Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu
1055 1060 1065
Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn
1070 1075 1080
Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly
1085 1090 1095
Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser
1100 1105 1110
Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr
1115 1120 1125
Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg
1130 1135 1140
Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Glu Leu Glu
1145 1150 1155
Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr
1160 1165 1170
Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu
1175 1180 1185
Glu
ДНК
т/г ^ т"-
<210> 5 <211> 3672 <212>
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC860, используемая для экспрессии в бактериальной клетке.
<400> 5
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccaacggta 60
tcgaatcctt ccacgcaaat gaatctatca ccagatgctc gtattgaaga tagcttgtgt 120
gtagccgagg tgaacaatat tgatccattt gttagcgcat caacagtcca aacgggtata 180
aacatagctg gtagaatatt gggcgtatta ggtgtgccgt ttgctggaca actagctagt 240
ttttatagtt ttcttgttgg ggaattatgg cctagtggca gagatccatg ggaaattttc 300
ctggaacatg tagaacaact tataagacaa caagtaacag aaaatactag gaatacggct 360
attgctcgat tagaaggtct aggaagaggc tatagatctt accagcaggc tcttgaaact 420
tggttagata accgaaatga tgcaagatca agaagcatta ttcttgagcg ctatgttgct 480
ttagaacttg acattactac tgctataccg cttttcagaa tacgaaatga agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agacgcatcc 600
ctttttggta gtgaatgggg gatggcatct tccgatgtta accaatatta ccaagaacaa 660
atcagatata cagaggaata ttctaaccat tgcgtacaat ggtataatac agggctaaat 720
aacttaagag ggacaaatgc tgaaagttgg ttgcggtata atcaattccg tagagaccta 780
acgttagggg tattagattt agtagcccta ttcccaagct atgatactcg cacttatcca 840
atcaatacga gtgctcagtt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccattttcag gcctccgcat ctacttgatt ttccagaaca acttacaatt 1020
tacagtgcat caagccgttg gagtagcact caacatatga attattgggt gggacatagg 1080
cttaacttcc gcccaatagg agggacatta aatacctcaa cacaaggact tactaataat 1140
acttcaatta atcctgtaac attacagttt acgtctcgag acgtttatag aacagaatca 1200
aatgcaggga caaatatact atttactact cctgtgaatg gagtaccttg ggctagattt 1260
aattttataa accctcagaa tatttatgaa agaggcgcca ctacctacag tcaaccgtat 1320
cagggagttg ggattcaatt atttgattca gaaactgaat taccaccaga aacaacagaa 1380
cgaccaaatt atgaatcata tagtcataga ttatctcata taggactaat cataggaaac 1440
actttgagag caccagtcta ttcttggacg catcgtagtg cagatcgtac gaatacgatt 1500
ggaccaaata gaattaatca aataccttta gtgaaaggat ttagagtttg ggggggcacc 1560
tctgtcatta caggaccagg atttacagga ggggatatcc ttcgaagaaa tacctttggt 1620
gattttgtat ctctacaagt caatattaat tcaccaatta cccaaagata ccgtttaaga 1680
tttcgttacg cttccagtag ggatgcacga gttatagtat taacaggagc ggcatccaca 1740
ggagtgggag gccaagttag tgtaaatatg cctcttcaga aaactatgga aataggggag 1800
aacttaacat ctagaacatt tagatatacc gattttagta atcctttttc atttagagct 1860
aatccagata taattgggat aagtgaacaa cctctatttg gtgcaggttc tattagtagc 1920
ggtgaacttt atatagataa aattgaaatt attctagcag atgcaacatt tgaagcagaa 1980
tctgatttag aaagagcgca gaaggcggtg aatgcgctgt ttacgtctac aaaccaacta 2040
gggctaaaaa caaatgtaac ggattatcat attgatcaag tgtccaattt agttacgtat 2100
ttatcggatg aattttgtct ggatgaaaag cgagaattgt ccgagaaagt caaacatgcg 2160
aagcgactca gtgatgaacg caatttactc caagattcaa atttcaaaga cattaatagg 2220
caaccagaac gtgggtgggg cggaagtaca gggattacca tccaaggagg ggatgacgta 2280
tttaaagaaa attacgtcac actatcaggt acctttgatg agtgctatcc aacatatttg 2340
tatcaaaaaa tcgatgaatc aaaattaaaa gcctttaccc gttatcaatt aagagggtat 2400
atcgaagata gtcaagactt agaaatctat ttaattcgct acaatgcaaa acatgaaaca 2460
gtaaatgtgc caggtacggg ttccttatgg ccgctttcag cccaaagtcc aatcggaaag 2520
tgtggagagc cgaatcgatg cgcgccacac cttgaatgga atcctgactt agattgttcg 2580
tgtagggatg gagaaaagtg tgcccatcat tcgcatcatt tctccttaga cattgatgta 2640
ggatgtacag acttaaatga ggacctaggt gtatgggtga tctttaagat taagacgcaa 2700
gatgggcacg caagactagg gaatctagag tttctcgaag agaaaccatt agtaggagaa 2760
gcgctagctc gtgtgaaaag agcggagaaa aaatggagag acaaacgtga aaaattggaa 2820
tgggaaacaa atatcgttta taaagaggca aaagaatctg tagatgcttt atttgtaaac 2880
tctcaatatg atcaattaca agcggatacg aatattgcca tgattcatgc ggcagataaa 2940
cgtgttcata gcattcgaga agcttatctg cctgagctgt ctgtgattcc gggtgtcaat 3000
gcggctattt ttgaagaatt agaagggcgt attttcactg cattctccct atatgatgcg 3060
agaaatgtca ttaaaaatgg tgattttaat aatggcttat cctgctggaa cgtgaaaggg 3120
catgtagatg tagaagaaca aaacaaccaa cgttcggtcc ttgttgttcc ggaatgggaa 3180
gcagaagtgt cacaagaagt tcgtgtctgt ccgggtcgtg gctatatcct tcgtgtcaca 3240
gcgtacaagg agggatatgg agaaggttgc gtaaccattc atgagatcga gaacaataca 3300
gacgaactga agtttagcaa ctgcgtagaa gaggaaatct atccaaataa cacggtaacg 3360
tgtaatgatt atactgtaaa tcaagaagaa tacggaggtg cgtacacttc tcgtaatcga 3420
ggatataacg aagctccttc cgtaccagct gattatgcgt cagtctatga agaaaaatcg 3480
tatacagatg gacgaagaga gaatccttgt gaatttaaca gagggtatag ggattacacg 3540
ccactaccag ttggttatgt gacaaaagaa ttagaatact tcccagaaac cgataaggta 3600
tggattgaga ttggagaaac ggaaggaaca tttatcgtgg acagcgtgga attactcctt 3660
atggaggaat ag 3672
<210> 6 <211> 3672 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC860, сконструированная для экспрессии в растительной клетке.
<400> 6
atgaccagca accggaagaa cgagaacgag atcatcaacg ccctgagcat cccgaccgtg 60
agcaacccta gcacccagat gaacctgagc cctgacgctc gcatcgagga ctccctctgc 120
gtggctgagg tgaacaacat cgacccgttc gtgtccgcct ccaccgtgca gaccggcatc 180
aacatcgcgg gccgcatcct cggcgtgctc ggcgtgccct ttgcgggcca gctcgcctcc 240
ttctactcct tcctcgtggg agagctgtgg ccctccggcc gcgacccgtg ggagatcttc 300
ctggagcacg tggagcagct catccgccag caagtcaccg agaacacccg caacaccgcc 360
atcgcccgcc tggagggcct gggccgtggc taccgctcct accagcaagc cctggagacc 420
tggctcgaca accgcaacga cgcccgctcc cgctccatca tcctggagcg ctacgtcgcc 480
ctggaactgg acatcaccac tgccatccca ctcttccgca tcaggaacga ggaggtgcct 540
ctgctgatgg tgtacgccca ggctgcgaac ctgcacctgc tgctgctgcg cgacgcaagc 600
ctgtttggct ccgagtgggg tatggcaagc tccgacgtca accagtacta ccaggagcag 660
atccgctaca ccgaggagta cagcaaccac tgcgtccagt ggtacaacac cggtctgaac 720
aatctcagag ggaccaacgc tgagagctgg ctgcgctaca accagttccg gcgggatctg 780
accctaggtg tcctggatct ggtcgctctg ttcccgagct acgataccag gacgtaccct 840
atcaacacct ctgctcagct taccagggag atctacactg atcctatcgg taggactaac 900
gctcctagtg gtttcgccag cactaactgg ttcaacaaca acgcgcctag tttctctgcc 960
atcgaggcgg cgatcttccg gcctcctcac ctcctcgact tcccggagca gcttactatc 1020
tactctgcgt cttcgcggtg gtcttcgact cagcacatga actactgggt tggtcaccgg 1080
cttaacttcc gcccgattgg aggaactctt aacaccagta cgcaaggtct tacgaacaac 1140
acttccatca acccggttac gttgcagttc acgtctcggg acgtttaccg gacggagtcg 1200
aatgctggga cgaacatcct gttcacgaca ccggtgaatg gtgttccgtg ggcacgtttc 1260
aacttcatca acccgcagaa catctacgag cgtggagcaa cgacatactc gcaaccatac 1320
caaggcgttg gcatccaact gtttgactcg gagacggaac tgccaccaga gacgacagaa 1380
cgtccgaatt acgagtcata ctcacacaga ctatcacaca ttggactcat tatcggaaac 1440
acactgagag caccagtgta ctcatggaca catcggtcag cagatcgtac gaacaccatc 1500
ggacccaatc ggatcaacca gatcccgctc gtgaagggct tccgcgtgtg gggcggcacc 1560
tccgtcatca ccggtccggg cttcaccggc ggcgacatcc tccgccgcaa caccttcggc 1620
gacttcgtgt cactccaagt gaacatcaac agcccgatca cccagcgcta tcgcctccgc 1680
ttccgctacg cctcctcccg cgacgctaga gtgatcgtgc tcaccggagc ggcgtccaca 1740
ggcgtaggcg gccaagtgtc tgtgaacatg ccgctccaga agactatgga gattggtgag 1800
aacctcacct ctcgcacctt ccgctacacc gacttctcca atccgttctc cttcagagcc 1860
aacccagaca tcatcggcat ctccgagcag cctctctttg gcgctggctc catctcctcc 1920
ggcgagctgt acatcgacaa gattgagatc atccttgccg acgccacctt cgaagctgag 1980
tccgatctcg agcgcgccca gaaggccgtg aacgccctct tcactagcac taaccagctc 2040
ggcctcaaga ctaacgtgac cgactaccac attgaccaag tgagcaacct agtgacctac 2100
cttagcgacg agttctgcct tgacgagaag cgtgagctga gcgagaaggt gaagcacgcc 2160
aagcgcctct ccgacgagcg caacctcctc caggactcca acttcaagga catcaaccgc 2220
cagcccgagc gcggctgggg cggtagcacc ggcatcacca tccagggcgg tgacgatgtg 2280
ttcaaggaga actacgtgac cctctccggc accttcgacg agtgctaccc gacctacctc 2340
taccagaaga tcgacgagtc caagctcaag gcgttcaccc gctaccagct tcgcggctac 2400
atcgaggact cccaggatct ggagatctac ctcatccgct acaacgccaa gcacgagacc 2460
gtgaacgtgc ccggcaccgg ctccctctgg ccgctctccg cccagagccc tatcggcaag 2520
tgcggcgagc ccaaccgctg cgcgcctcac ctggagtgga accctgacct cgactgctcc 2580
tgccgcgacg gcgagaagtg cgcccaccat agccaccact tctctctcga catcgacgtg 2640
ggctgcaccg acctcaacga ggatctgggc gtgtgggtga tcttcaagat caagacccag 2700
gacggccacg ccaggctggg caacctggag ttcctggagg agaagcctct ggtgggtgag 2760
gccctggcca gggtcaagag ggctgagaag aaatggaggg acaagaggga gaagctggag 2820
tgggagacca acatcgtgta caaggaggct aaggagtccg tggacgctct gttcgtcaac 2880
tctcagtacg atcagctcca ggctgacacc aacatcgcta tgatccacgc tgcggataag 2940
agggtccact ctatcaggga ggcttacctg cctgagcttt ctgtcatccc tggtgtcaac 3000
gcggcaatct tcgaggaact tgagggccgc atcttcactg cgttctcgct ttacgatgcg 3060
cggaacgtca ttaagaacgg tgacttcaac aatggtcttt cgtgctggaa cgtcaagggt 3120
catgtcgatg tcgaggaaca gaacaaccag cggtcggtcc ttgtcgttcc cgagtgggag 3180
gccgaggtct cgcaagaggt ccgggtctgc cctgggcgcg ggtacattct tcgtgtcact 3240
gcgtacaagg agggctacgg cgagggctgc gttactattc atgagattga gaacaatacg 3300
gatgagctta agtttagtaa ctgtgttgag gaggagatct acccgaacaa tacggttacg 3360
tgcaatgatt acacggtgaa ccaggaggaa tacggcggag catacacctc acgtaataga 3420
gggtacaatg aggcaccgtc agttccggca gattatgcct cagtttatga ggagaagtcc 3480
tacacggatg gaagacgcga gaatccatgt gagtttaata gaggataccg agactacaca 3540
ccactcccag ttggatacgt tacaaaggag ttggaatact tcccagaaac agataaagtt 3600
tggatagaga tcggagaaac agaaggaacc ttcatcgtgg acagtgtaga actgctgctg 3660
atggaagaat ga 3672
<210> 7 <211> 1223
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность химерного белка TIC860.
<400> 7
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Thr Val Ser Asn Pro Ser Thr Gln Met Asn Leu Ser Pro Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Val Ala Glu Val Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Leu Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Ser Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asn Thr Ala Ile Ala Arg Leu Glu Gly Leu Gly
115 120 125
Arg Gly Tyr Arg Ser Tyr Gln Gln Ala Leu Glu Thr Trp Leu Asp Asn
130 135 140
Arg Asn Asp Ala Arg Ser Arg Ser Ile Ile Leu Glu Arg Tyr Val Ala
145 150 155 160
Leu Glu Leu Asp Ile Thr Thr Ala Ile Pro Leu Phe Arg Ile Arg Asn
165 170 175
Glu Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Trp Gly Met
195 200 205
Ala Ser Ser Asp Val Asn Gln Tyr Tyr Gln Glu Gln Ile Arg Tyr Thr
210 215 220
Glu Glu Tyr Ser Asn His Cys Val Gln Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Ile Phe Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Tyr Ser Ala Ser Ser Arg Trp Ser Ser Thr Gln His
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Asn Phe Arg Pro Ile Gly Gly
355 360 365
Thr Leu Asn Thr Ser Thr Gln Gly Leu Thr Asn Asn Thr Ser Ile Asn
370 375 380
Pro Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser
385 390 395 400
Asn Ala Gly Thr Asn Ile Leu Phe Thr Thr Pro Val Asn Gly Val Pro
405 410 415
Trp Ala Arg Phe Asn Phe Ile Asn Pro Gln Asn Ile Tyr Glu Arg Gly
420 425 430
Ala Thr Thr Tyr Ser Gln Pro Tyr Gln Gly Val Gly Ile Gln Leu Phe
435 440 445
Asp Ser Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr
450 455 460
Glu Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ile Gly Asn
465 470 475 480
Thr Leu Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg
485 490 495
Thr Asn Thr Ile Gly Pro Asn Arg Ile Asn Gln Ile Pro Leu Val Lys
500 505 510
Gly Phe Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe
515 520 525
Thr Gly Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser
530 535 540
Leu Gln Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg
545 550 555 560
Phe Arg Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly
565 570 575
Ala Ala Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu
580 585 590
Gln Lys Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg
595 600 605
Tyr Thr Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile
610 615 620
Ile Gly Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser
625 630 635 640
Gly Glu Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr
645 650 655
Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala
660 665 670
Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asn Val Thr Asp
675 680 685
Tyr His Ile Asp Gln Val Ser Asn Leu Val Thr Tyr Leu Ser Asp Glu
690 695 700
Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala
705 710 715 720
Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Ser Asn Phe Lys
725 730 735
Asp Ile Asn Arg Gln Pro Glu Arg Gly Trp Gly Gly Ser Thr Gly Ile
740 745 750
Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu
755 760 765
Ser Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile
770 775 780
Asp Glu Ser Lys Leu Lys Ala Phe Thr Arg Tyr Gln Leu Arg Gly Tyr
785 790 795 800
Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala
805 810 815
Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu
820 825 830
Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala
835 840 845
Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly
850 855 860
Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val
865 870 875 880
Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys
885 890 895
Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu
900 905 910
Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala
915 920 925
Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn
930 935 940
Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn
945 950 955 960
Ser Gln Tyr Asp Gln Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His
965 970 975
Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu
980 985 990
Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu
995 1000 1005
Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val
1010 1015 1020
Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val
1025 1030 1035
Lys Gly His Val Asp Val Glu Glu Gln Asn Asn Gln Arg Ser Val
1040 1045 1050
Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg
1055 1060 1065
Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1070 1075 1080
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn
1085 1090 1095
Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Ile
1100 1105 1110
Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Val Asn Gln
1115 1120 1125
Glu Glu Tyr Gly Gly Ala Tyr Thr Ser Arg Asn Arg Gly Tyr Asn
1130 1135 1140
Glu Ala Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr Glu Glu
1145 1150 1155
Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Phe Asn
1160 1165 1170
Arg Gly Tyr Arg Asp Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr
1175 1180 1185
Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu
1190 1195 1200
Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu
1205 1210 1215
Leu Leu Met Glu Glu 1220
<210> 8 <211> 3564
<212> ДНК
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC867, используемая для экспрессии в бактериальной клетке.
<400> 8
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccagctgta 60
tcgaatcatt ccgcacaaat gaatctatca accgatgctc gtattgagga tagcttgtgt 120
atagccgagg ggaacaatat cgatccattt gttagcgcat caacagtcca aacgggtatt 180
aacatagctg gtagaatact aggtgtatta ggcgtaccgt ttgctggaca aatagctagt
240
ttttatagtt ttcttgttgg tgaattatgg ccccgcggca gagatccttg ggaaattttc 300
ctagaacatg tcgaacaact tataagacaa caagtaacag aaaatactag ggatacggct 360
cttgctcgat tacaaggttt aggaaattcc tttagagcct atcaacagtc acttgaagat 420
tggctagaaa accgtgatga tgcaagaacg agaagtgttc tttataccca atatatagcc 480
ttagaacttg attttcttaa tgcgatgccg cttttcgcaa ttagaaacca agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agatgcctct 600
ctttttggta gtgaatttgg gcttacatcc caagaaattc aacgttatta tgagcgccaa 660
gtggaaaaaa cgagagaata ttctgattat tgcgcaagat ggtataatac gggtttaaat 720
aatttgagag ggacaaatgc tgaaagttgg ttgcgatata atcaattccg tagagactta 780
acgctaggag tattagatct agtggcacta ttcccaagct atgacacgcg tgtttatcca 840
atgaatacca gtgctcaatt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccgttattag gcctccgcat ctacttgatt ttccagaaca gcttacaatt 1020
ttcagcgtat taagtcgatg gagtaatact caatatatga attactgggt gggacataga 1080
cttgaatcgc gaacaataag ggggtcatta agtacctcga cacacggaaa taccaatact 1140
tctattaatc ctgtaacatt acagttcaca tctcgagacg tttatagaac agaatcattt 1200
gcagggataa atatacttct aactactcct gtgaatggag taccttgggc tagatttaat 1260
tggagaaatc ccctgaattc tcttagaggt agccttctct atactatagg gtatactgga 1320
gtggggacac aactatttga ttcagaaact gaattaccac cagaaacaac agaacgacca 1380
aattatgaat cttacagtca tagattatct aatataagac taatatcagg aaacactttg 1440
agagcaccag tatattcttg gacgcaccgt agtgcagatc gtacaaatac cattagttca 1500
gatagcatta cacaaatacc attggtaaag gcgcataccc tccaatcggg taccactgta 1560
gtaaaagggc cagggtttac aggaggggat atcctccgtc gaacaagtgg aggaccattt 1620
gcttttagta atgttaatct agattttaac ttgtcacaaa ggtatcgtgc tagaattcgt 1680
tatgcctcta ctactaacct aagaatttac gtaacggttg caggtgaacg aatttttgct 1740
ggtcaatttg acaaaactat ggatgctggt gccccattaa cattccaatc ttttagttac 1800
gcaactatta atacagcttt tacattccca gaaagatcga gcagcttgac tgtaggtgcc 1860
gatacgttta gttcaggtaa tgaagtttat gtagatagat ttgaattaat cccagttact 1920
gcaaccttcg aggcagaatc tgatttagaa agagcacaaa aggcggtgaa tgagctgttt 1980
acttcttcca atcaaatcgg gttaaaaaca gatgtgacgg attatcatat tgatcaagta 2040
tccaatttag ttgagtgttt atctgatgaa ttttgtctgg atgaaaaaaa agaattgtcc 2100
gagaaagtca aacatgcgaa gcgacttagt gatgagcgga atttacttca agatccaaac 2160
tttagaggga tcaatagaca actagaccgt ggctggagag gaagtacgga tattaccatc 2220
caaggaggcg atgacgtatt caaagagaat tacgttacgc tattgggtac ctttgatgag 2280
tgctatccaa cgtatttata tcaaaaaata gatgagtcga aattaaaagc ctatacccgt 2340
taccaattaa gagggtatat cgaagatagt caagacttag aaatctattt aattcgctac 2400
aatgccaaac acgaaacagt aaatgtgcca ggtacgggtt ccttatggcc gctttcagcc 2460
ccaagtccaa tcggaaaatg tgcccatcat tcccatcatt tctccttgga cattgatgtt 2520
ggatgtacag acttaaatga ggacttaggt gtatgggtga tattcaagat taagacgcaa 2580
gatggccatg caagactagg aaatctagaa tttctcgaag agaaaccatt agtaggagaa 2640
gcactagctc gtgtgaaaag agcggagaaa aaatggagag acaaacgtga aaaattggaa 2700
tgggaaacaa atattgttta taaagaggca aaagaatctg tagatgcttt atttgtaaac 2760
tctcaatatg atagattaca agcggatacc aacatcgcga tgattcatgc ggcagataaa 2820
cgcgttcata gcattcgaga agcttatctg cctgagctgt ctgtgattcc gggtgtcaat 2880
gcggctattt ttgaagaatt agaagggcgt attttcactg cattctccct atatgatgcg 2940
agaaatgtca ttaaaaatgg tgattttaat aatggcttat cctgctggaa cgtgaaaggg 3000
catgtagatg tagaagaaca aaacaaccac cgttcggtcc ttgttgttcc ggaatgggaa 3060
gcagaagtgt cacaagaagt tcgtgtctgt ccgggtcgtg gctatatcct tcgtgtcaca 3120
gcgtacaagg agggatatgg agaaggttgc gtaaccattc atgagatcga gaacaataca 3180
gacgaactga agtttagcaa ctgtgtagaa gaggaagtat atccaaacaa cacggtaacg 3240
tgtaatgatt atactgcgac tcaagaagaa tatgagggta cgtacacttc tcgtaatcga 3300
ggatatgacg gagcctatga aagcaattct tctgtaccag ctgattatgc atcagcctat 3360
gaagaaaaag catatacaga tggacgaaga gacaatcctt gtgaatctaa cagaggatat 3420
ggggattaca caccactacc agctggctat gtgacaaaag aattagagta cttcccagaa 3480
accgataagg tatggattga gatcggagaa acggaaggaa cattcatcgt ggacagcgtg 3540
gaattacttc ttatggagga atag 3564
<210> 9 <211> 3564 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC867, сконструированная для экспрессии в растительной клетке.
<400> 9
atgaccagca accgaaagaa cgagaacgag atcatcaacg ccctgtccat accggccgtg 60
tcaaaccact ccgcccagat gaacctctcc accgacgcga ggatcgagga ctccctctgc 120
atcgccgagg gcaacaacat cgacccgttc gtgtctgcaa gcacggtcca gaccggcatc 180
aacatcgcgg gccgcatcct gggcgtgctc ggcgtgccct tcgcgggtca aatcgcctct 240
ttctactcat tcctcgtggg cgagctgtgg ccgcgcggac gtgacccgtg ggaaatcttc 300
ctggagcacg ttgagcagct catccggcag caagtgaccg agaacaccag ggacaccgca 360
ctggcacggc tccagggcct tggcaacagc ttccgcgcct accagcagtc gctggaggac 420
tggctggaga accgagacga cgccagaacc cgctcagttc tgtacacaca gtacatcgcc 480
ctagagctgg acttcctcaa cgctatgccg ctcttcgcca tccgtaacca ggaagtaccg 540
cttctgatgg tgtacgcaca agcagcgaac ctccatctgc tcctgctgcg agacgcatct 600
ctgttcggca gtgagttcgg gctgacgagc caggagatcc agcgctacta cgagcgccaa 660
gtggagaaga ctcgtgagta cagcgactac tgcgcgcgct ggtacaacac gggcttgaac 720
aaccttcgcg ggacaaacgc cgaatcctgg cttcgctaca accagttccg ccgcgacctc 780
acgctgggtg tgctggacct ggtcgcgctc ttcccgtcct acgacacacg ggtgtaccca 840
atgaacacga gcgcacagct cacccgtgag atctacacag atcccatcgg ccgcaccaac 900
gctcccagtg gcttcgcaag cacgaattgg ttcaacaata acgctccttc tttctctgcc 960
atcgaggccg ctgtcatcag accgccgcac ttactcgatt tcccggagca gctcactatc 1020
ttctctgtgt tgtcccggtg gtcgaacacg cagtacatga actactgggt gggccacagg 1080
ctagagagcc ggaccatccg tggcagtctc tcaacctcga cccacggcaa cacgaacacg 1140
agcatcaacc ctgtcactct ccagtttaca tctagggacg tttacaggac agagtcgttc 1200
gctggcatta acattctgtt gaccactccg gtgaacggcg tcccttgggc ccgcttcaac 1260
tggaggaatc ctctgaactc actgcgcggc agccttctct acactatcgg ctacaccggc 1320
gttgggacgc aactcttcga ctcggagacc gagctgccgc ccgagaccac cgagcggcct 1380
aactacgaga gttattcaca caggctctcc aacatccgct tgatttctgg gaacaccttg 1440
cgggctccgg tgtactcctg gacgcaccgc agcgccgaca gaactaatac catcagctcc 1500
gactcgatca cccagatccc gctggtgaag gctcacacgc ttcagtcggg caccacagtc 1560
gtcaagggcc ctggcttcac cggcggcgac atcctgcgtc gcacatctgg cggacccttc 1620
gccttcagca acgtgaactt ggacttcaat ttgtcacagc ggtatcgtgc cagaatccgg 1680
tacgccagca ctacgaacct gcgaatctat gttactgtgg cgggcgagcg gatcttcgcc 1740
gggcaattcg acaagacgat ggacgcggga gcacctctga cattccagtc attctcttac 1800
gccacgatca acacggcatt cacgtttccg gagcgttcca gtagcctgac cgtgggcgct 1860
gataccttca gtagcgggaa cgaggtgtac gttgaccgtt tcgagctgat cccggtcacc 1920
gccaccttcg aagctgagtc ggacctggag cgtgcacaga aggcagtcaa cgagctgttc 1980
acctctagca accagatcgg cctcaagacc gacgtcacag actaccacat cgaccaagtg 2040
tccaacctgg tcgagtgcct tagcgacgag ttctgcctag acgagaagaa ggagctgtcg 2100
gagaaggtca aacacgccaa gcgtctgagc gatgagcgca acctgctcca agaccctaac 2160
ttccgtggca tcaacaggca gcttgaccgt ggctggcgcg gctcgacgga catcacgatc 2220
cagggtggcg acgacgtatt caaggagaat tacgtgacct tgcttgggac gtttgacgag 2280
tgctatccca cctacctcta ccagaagatt gatgaatcga aattgaaggc gtacacgaga 2340
taccagctcc gtggctacat cgaggacagc caggacttgg agatctacct catacgctac 2400
aacgctaaac atgagaccgt gaacgtccct gggacgggca gtctgtggcc actctctgct 2460
cctagcccta tcggcaagtg cgctcaccac tcgcaccact tcagccttga catcgacgtg 2520
ggatgtactg acctcaacga agacctgggc gtctgggtta tcttcaagat caagacccag 2580
gacggccacg cccgactcgg caacctggag ttcctggagg agaaaccact ggtgggcgag 2640
gcgctcgccc gcgtgaagcg tgccgagaag aagtggcggg acaagaggga gaagctagaa 2700
tgggagacga acatcgtgta caaggaggcc aaggaaagcg tcgatgccct gttcgtgaac 27 60
tcacagtacg accgtctcca ggcggacacg aacatcgcca tgatccacgc ggctgacaag 2820
cgcgtccact ccatccgcga ggcgtactta ccggagctgt cggtgatccc aggcgtaaac 2880
gcggcgatct tcgaggagct agagggacgc atcttcacag cgttcagcct gtacgacgca 2940
cgcaacgtca tcaagaacgg cgatttcaac aacggactgt cctgctggaa cgtgaagggc 3000
cacgtcgatg tcgaggaaca gaacaaccac cgctctgtcc tggtggtccc agagtgggag 3060
gccgaggtct cccaggaggt ccgcgtgtgc cctgggcgtg gctacatcct ccgtgtgaca 3120
gcctacaagg agggctacgg tgagggctgc gtcaccattc acgagatcga gaacaacact 3180
gacgaactca agttctcgaa ttgcgtggag gaggaggtgt acccgaacaa tacggtgacg 3240
tgcaacgact acacggcaac ccaagaggag tacgagggca cctacaccag taggaaccgt 3300
ggctacgacg gtgcctacga gtcgaactcc agcgtccctg cggactacgc cagcgcgtac 3360
gaggagaagg cttacaccga cggacgccgg gacaacccat gcgagagcaa ccgtggctac 3420
ggcgactaca ctcctctccc ggccggatac gtcacaaagg agctggagta tttcccagag 3480
acggacaagg tgtggatcga aatcggagag acagagggaa ccttcatcgt ggacagcgtg 3540
gagctgctcc tcatggagga gtga 3564
<210> 10 <211> 1187
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность химерного белка TIC867.
<400> 10
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His
500 505 510
Thr Leu Gln Ser Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn
530 535 540
Val Asn Leu Asp Phe Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
565 570 575
Arg Ile Phe Ala Gly Gln Phe Asp Lys Thr Met Asp Ala Gly Ala Pro
580 585 590
Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
595 600 605
Phe Pro Glu Arg Ser Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr
625 630 635 640
Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val
645 650 655
Asn Glu Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val
660 665 670
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser
675 680 685
Asp Glu Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys
690 695 700
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
705 710 715 720
Phe Arg Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr
725 730 735
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
740 745 750
Thr Leu Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
755 760 765
Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg
770 775 780
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
785 790 795 800
Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp
805 810 815
Pro Leu Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala His His Ser His
820 825 830
His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp
835 840 845
Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala
850 855 860
Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly Glu
865 870 875 880
Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg
885 890 895
Glu Lys Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu
900 905 910
Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala
915 920 925
Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His Ser
930 935 940
Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn
945 950 955 960
Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser
965 970 975
Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly
980 985 990
Leu Ser Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn
995 1000 1005
Asn His Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val
1010 1015 1020
Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg
1025 1030 1035
Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile
1040 1045 1050
His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys
1055 1060 1065
Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp
1070 1075 1080
Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg
1085 1090 1095
Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro
1100 1105 1110
Ala Asp Tyr Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly
1115 1120 1125
Arg Arg Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr
1130 1135 1140
Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe
1145 1150 1155
Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly
1160 1165 1170
Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1175 1180 1185
<210> 11 <211> 3642
<212> ДНК
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC867_20, используемая для экспрессии в бактериальной клетке.
<400> 11
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccagctgta 60
tcgaatcatt ccgcacaaat gaatctatca accgatgctc gtattgagga tagcttgtgt 120
atagccgagg ggaacaatat cgatccattt gttagcgcat caacagtcca aacgggtatt 180
aacatagctg gtagaatact aggtgtatta ggcgtaccgt ttgctggaca aatagctagt 240
ttttatagtt ttcttgttgg tgaattatgg ccccgcggca gagatccttg ggaaattttc 300
ctagaacatg tcgaacaact tataagacaa caagtaacag aaaatactag ggatacggct
360
cttgctcgat tacaaggttt aggaaattcc tttagagcct atcaacagtc acttgaagat 420
tggctagaaa accgtgatga tgcaagaacg agaagtgttc tttataccca atatatagcc 480
ttagaacttg attttcttaa tgcgatgccg cttttcgcaa ttagaaacca agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agatgcctct 600
ctttttggta gtgaatttgg gcttacatcc caagaaattc aacgttatta tgagcgccaa 660
gtggaaaaaa cgagagaata ttctgattat tgcgcaagat ggtataatac gggtttaaat 720
aatttgagag ggacaaatgc tgaaagttgg ttgcgatata atcaattccg tagagactta 780
acgctaggag tattagatct agtggcacta ttcccaagct atgacacgcg tgtttatcca 840
atgaatacca gtgctcaatt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccgttattag gcctccgcat ctacttgatt ttccagaaca gcttacaatt 1020
ttcagcgtat taagtcgatg gagtaatact caatatatga attactgggt gggacataga 1080
cttgaatcgc gaacaataag ggggtcatta agtacctcga cacacggaaa taccaatact 1140
tctattaatc ctgtaacatt acagttcaca tctcgagacg tttatagaac agaatcattt 1200
gcagggataa atatacttct aactactcct gtgaatggag taccttgggc tagatttaat 1260
tggagaaatc ccctgaattc tcttagaggt agccttctct atactatagg gtatactgga 1320
gtggggacac aactatttga ttcagaaact gaattaccac cagaaacaac agaacgacca 1380
aattatgaat cttacagtca tagattatct aatataagac taatatcagg aaacactttg 1440
agagcaccag tatattcttg gacgcaccgt agtgcagatc gtacaaatac cattagttca 1500
gatagcatta cacaaatacc attggtaaag gcgcataccc tccaatcggg taccactgta 1560
gtaaaagggc cagggtttac aggaggggat atcctccgtc gaacaagtgg aggaccattt 1620
gcttttagta atgttaatct agattttaac ttgtcacaaa ggtatcgtgc tagaattcgt 1680
tatgcctcta ctactaacct aagaatttac gtaacggttg caggtgaacg aatttttgct 1740
ggtcaatttg acaaaactat ggatgctggt gccccattaa cattccaatc ttttagttac 1800
gcaactatta atacagcttt tacattccca gaaagatcga gcagcttgac tgtaggtgcc 1860
gatacgttta gttcaggtaa tgaagtttat gtagatagat ttgaattaat cccagttact 1920
gcaacctttg aggcagaata tgatttagaa agagcgcaaa aggtggtgaa tgccctgttt 1980
acgtctacaa accaactagg gctaaaaaca gatgtgacgg attatcatat tgatcaggta 2040
tccaatctag ttgcgtgttt atcggatgaa ttttgtctgg atgaaaagag agaattgtcc 2100
gagaaagtta aacatgcaaa gcgactcagt gatgagcgga atttacttca agatccaaac 2160
ttcagaggga tcaataggca accagaccgt ggctggagag gaagtacgga tattactatc 2220
caaggaggag atgacgtatt caaagagaat tacgttacgc taccgggtac ctttgatgag 2280
tgctatccaa cgtatttata tcaaaaaata gatgagtcga aattaaaagc ctatacccgt 2340
tatcaattaa gagggtatat cgaagatagt caagacttag aaatctattt aattcgttac 2400
aatgcaaaac acgaaatagt aaatgtacca ggtacaggaa gtttatggcc tctttctgta 2460
gaaaatcaaa ttggaccttg tggagaaccg aatcgatgcg cgccacacct tgaatggaat 2 52 0
cctgatttac actgttcctg cagagacggg gaaaaatgtg cacatcattc tcatcatttc 2580
tctttggaca ttgatgttgg atgtacagac ttaaatgagg acttaggtgt atgggtgata 2640
ttcaagatta agacgcaaga tggccacgca cgactaggga atctagagtt tctcgaagag 2700
aaaccattat taggagaagc actagctcgt gtgaaaagag cggagaaaaa atggagagac 27 60
aaacgcgaaa cattacaatt ggaaacaact atcgtttata aagaggcaaa agaatctgta 2820
gatgctttat ttgtaaactc tcaatatgat agattacaag cggatacgaa catcgcgatg 2880
attcatgcgg cagataaacg cgttcataga attcgagaag cgtatctgcc ggagctgtct 2940
gtgattccgg gtgtcaatgc ggctattttt gaagaattag aagagcgtat tttcactgca 3000
ttttccctat atgatgcgag aaatattatt aaaaatggcg atttcaataa tggcttatta 3060
tgctggaacg tgaaagggca tgtagaggta gaagaacaaa acaatcaccg ttcagtcctg 3120
gttatcccag aatgggaggc agaagtgtca caagaggttc gtgtctgtcc aggtcgtggc 3180
tatatccttc gtgttacagc gtacaaagag ggatatggag aaggttgcgt aacgatccat 3240
gagatcgaga acaatacaga cgaactgaaa ttcaacaact gtgtagaaga ggaagtatat 3300
ccaaacaaca cggtaacgtg tattaattat actgcgactc aagaagaata tgagggtacg 3360
tacacttctc gtaatcgagg atatgacgaa gcctatggta ataacccttc cgtaccagct 3420
gattatgcgt cagtctatga agaaaaatcg tatacagata gacgaagaga gaatccttgt 3480
gaatctaaca gaggatatgg agattacaca ccactaccag ctggttatgt aacaaaggaa 3540
ttagagtact tcccagagac cgataaggta tggattgaga ttggagaaac agaaggaaca 3600
ttcatcgtgg acagcgtgga attactcctt atggaggaat ag 3642
<210> 12 <211> 3642 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC867_20, сконструированная для экспрессии в растительной клетке.
<400> 12
atgaccagca accgaaagaa cgagaacgag atcatcaacg ccctgtccat accggccgtg 60
tcaaaccact ccgcccagat gaacctctcc accgacgcga ggatcgagga ctccctctgc 120
atcgccgagg gcaacaacat cgacccgttc gtgtctgcaa gcacggtcca gaccggcatc 180
aacatcgcgg gccgcatcct gggcgtgctc ggcgtgccct tcgcgggtca aatcgcctct 240
ttctactcat tcctcgtggg cgagctgtgg ccgcgcggac gtgacccgtg ggaaatcttc 300
ctggagcacg ttgagcagct catccggcag caagtgaccg agaacaccag ggacaccgca 360
ctggcacggc tccagggcct tggcaacagc ttccgcgcct accagcagtc gctggaggac 420
tggctggaga accgagacga cgccagaacc cgctcagttc tgtacacaca gtacatcgcc 480
ctagagctgg acttcctcaa cgctatgccg ctcttcgcca tccgtaacca ggaagtaccg 540
cttctgatgg tgtacgcaca agcagcgaac ctccatctgc tcctgctgcg agacgcatct 600
ctgttcggca gtgagttcgg gctgacgagc caggagatcc agcgctacta cgagcgccaa 660
gtggagaaga ctcgtgagta cagcgactac tgcgcgcgct ggtacaacac gggcttgaac 720
aaccttcgcg ggacaaacgc cgaatcctgg cttcgctaca accagttccg ccgcgacctc 780
acgctgggtg tgctggacct ggtcgcgctc ttcccgtcct acgacacacg ggtgtaccca 840
atgaacacga gcgcacagct cacccgtgag atctacacag atcccatcgg ccgcaccaac 900
gctcccagtg gcttcgcaag cacgaattgg ttcaacaata acgctccttc tttctctgcc 960
atcgaggccg ctgtcatcag accgccgcac ttactcgatt tcccggagca gctcactatc 1020
ttctctgtgt tgtcccggtg gtcgaacacg cagtacatga actactgggt gggccacagg 1080
ctagagagcc ggaccatccg tggcagtctc tcaacctcga cccacggcaa cacgaacacg 1140
agcatcaacc ctgtcactct ccagtttaca tctagggacg tttacaggac agagtcgttc 1200
gctggcatta acattctgtt gaccactccg gtgaacggcg tcccttgggc ccgcttcaac 1260
tggaggaatc ctctgaactc actgcgcggc agccttctct acactatcgg ctacaccggc 1320
gttgggacgc aactcttcga ctcggagacc gagctgccgc ccgagaccac cgagcggcct 1380
aactacgaga gttattcaca caggctctcc aacatccgct tgatttctgg gaacaccttg 1440
cgggctccgg tgtactcctg gacgcaccgc agcgccgaca gaactaatac catcagctcc 1500
gactcgatca cccagatccc gctggtgaag gctcacacgc ttcagtcggg caccacagtc 1560
gtcaagggcc ctggcttcac cggcggcgac atcctgcgtc gcacatctgg cggacccttc 1620
gccttcagca acgtgaactt ggacttcaat ttgtcacagc ggtatcgtgc cagaatccgg 1680
tacgccagca ctacgaacct gcgaatctat gttactgtgg cgggcgagcg gatcttcgcc 1740
gggcaattcg acaagacgat ggacgcggga gcacctctga cattccagtc attctcttac 1800
gccacgatca acacggcatt cacgtttccg gagcgttcca gtagcctgac cgtgggcgct 1860
gataccttca gtagcgggaa cgaggtgtac gttgaccgtt tcgagctgat cccggtcacc 1920
gccaccttcg aggccgagta cgaccttgag cgcgcccaga aggtggtgaa cgccctcttc 1980
actagcacta accagctagg cctgaagact gacgtgaccg actaccacat cgaccaagtg 2040
agcaacctag tggcctgcct ctccgacgag ttctgcctcg acgagaagcg cgagctgtcc 2100
gagaaggtga agcacgccaa gcgcctctcc gacgagcgca acctgctcca ggaccccaac 2160
ttcaggggca tcaacaggca gcccgaccgc ggctggcgcg gctccaccga catcaccatc 2220
cagggcggtg acgacgtatt caaggagaac tacgttaccc tccccggcac cttcgacgag 2280
tgttacccca cctacctcta ccagaagatc gacgagtcca agctgaaggc ctacacccgc 2340
taccagctcc gcggctacat cgaggactcc caggacctgg aaatctacct catccgctac 2400
aacgccaagc acgagatcgt gaacgtgcct ggcaccggca gcctctggcc tctcagcgtg 2460
gagaaccaga tcggcccttg cggcgagcct aaccgctgcg cccctcacct cgagtggaac 2520
cctgacctcc actgctcgtg cagggacggc gagaagtgcg cccaccatag ccaccacttc 2580
tctctggaca tcgacgtggg ctgcaccgac ctgaacgagg acctgggcgt gtgggttatc 2640
ttcaagatca agacccagga cggtcacgcc aggctgggta acctggagtt ccttgaggaa 2700
aagcctctgc tgggtgaggc cctggccagg gtcaagaggg ctgagaagaa atggagggat 2760
aagagggaga ccctgcagct ggagaccact atcgtctaca aggaggctaa ggagtctgtc 2820
gatgctctgt tcgtcaactc tcagtacgat agactgcaag ctgataccaa catcgctatg 2880
atccacgctg cggataagcg ggtccaccgg atccgggagg cttaccttcc ggagctttct 2940
gtcatcccgg gtgtcaacgc tgcgatcttc gaggaacttg aggaacggat cttcactgcg 3000
tttagtcttt acgatgcgcg gaacatcatc aagaacgggg acttcaacaa tggtctgctg 3060
tgctggaacg tcaagggtca tgtcgaggtc gaggaacaaa acaatcatcg tagtgtcctt 3120
gtcattcctg agtgggaggc ggaggtctct caagaggtcc gtgtttgccc ggggcgtggg 3180
tacattcttc gtgttactgc gtacaaggag gggtacgggg aggggtgcgt tactattcat 3240
gagattgaga acaatactga tgagcttaag ttcaacaatt gtgttgagga ggaggtttac 3300
ccgaacaata ctgttacgtg catcaactac acggcaacgc aagaggaata cgaggggacg 3360
tacacctcgc gtaatagagg gtatgatgag gcgtacggaa acaacccgtc ggttccagca 3420
gattatgcct cggtttatga ggagaagtcg tacacggata gacgacgcga gaatccatgt 3480
gagtcaaatc gaggatacgg agattacaca ccattaccag caggatacgt tacaaaggag 3540
ttggaatact tcccggaaac agataaagtt tggattgaaa tcggagaaac agaaggaaca 3600
ttcatcgtcg actcagtaga attgttgttg atggaagaat ga 3642
<210> 13 <211> 1213
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC867_20.
<400> 13
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His
500 505 510
Thr Leu Gln Ser Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn
530 535 540
Val Asn Leu Asp Phe Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
565 570 575
Arg Ile Phe Ala Gly Gln Phe Asp Lys Thr Met Asp Ala Gly Ala Pro
580 585 590
Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
595 600 605
Phe Pro Glu Arg Ser Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr
625 630 635 640
Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Val Val
645 650 655
Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asp Val
660 665 670
Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Ala Cys Leu Ser
675 680 685
Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys
690 695 700
His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn
705 710 715 720
Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr
725 730 735
Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val
740 745 750
Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln
755 760 765
Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg
770 775 780
Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr
785 790 795 800
Asn Ala Lys His Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp
805 810 815
Pro Leu Ser Val Glu Asn Gln Ile Gly Pro Cys Gly Glu Pro Asn Arg
820 825 830
Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg
835 840 845
Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile
850 855 860
Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile
865 870 875 880
Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu
885 890 895
Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys
900 905 910
Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Thr Leu Gln Leu Glu
915 920 925
Thr Thr Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe
930 935 940
Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met
945 950 955 960
Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu
965 970 975
Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu
980 985 990
Leu Glu Glu Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn
995 1000 1005
Ile Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn
1010 1015 1020
Val Lys Gly His Val Glu Val Glu Glu Gln Asn Asn His Arg Ser
1025 1030 1035
Val Leu Val Ile Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val
1040 1045 1050
Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr
1055 1060 1065
Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu
1070 1075 1080
Asn Asn Thr Asp Glu Leu Lys Phe Asn Asn Cys Val Glu Glu Glu
1085 1090 1095
Val Tyr Pro Asn Asn Thr Val Thr Cys Ile Asn Tyr Thr Ala Thr
1100 1105 1110
Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr
1115 1120 1125
Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala
1130 1135 1140
Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Arg Arg Arg Glu Asn
1145 1150 1155
Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro
1160 1165 1170
Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
1175 1180 1185
Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val
1190 1195 1200
Asp Ser Val Glu Leu Leu Leu Met Glu Glu 1205 1210
<210> 14 <211> 3690
<212> ДНК
т/г ^ т"т
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC867_21,
используемая для экспрессии в бактериальной клетке.
<400> 14
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccagctgta 60
tcgaatcatt ccgcacaaat gaatctatca accgatgctc gtattgagga tagcttgtgt 120
atagccgagg ggaacaatat cgatccattt gttagcgcat caacagtcca aacgggtatt 180
aacatagctg gtagaatact aggtgtatta ggcgtaccgt ttgctggaca aatagctagt 240
ttttatagtt ttcttgttgg tgaattatgg ccccgcggca gagatccttg ggaaattttc 300
ctagaacatg tcgaacaact tataagacaa caagtaacag aaaatactag ggatacggct 360
cttgctcgat tacaaggttt aggaaattcc tttagagcct atcaacagtc acttgaagat 420
tggctagaaa accgtgatga tgcaagaacg agaagtgttc tttataccca atatatagcc 480
ttagaacttg attttcttaa tgcgatgccg cttttcgcaa ttagaaacca agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agatgcctct 600
ctttttggta gtgaatttgg gcttacatcc caagaaattc aacgttatta tgagcgccaa 660
gtggaaaaaa cgagagaata ttctgattat tgcgcaagat ggtataatac gggtttaaat 720
aatttgagag ggacaaatgc tgaaagttgg ttgcgatata atcaattccg tagagactta 780
acgctaggag tattagatct agtggcacta ttcccaagct atgacacgcg tgtttatcca 840
atgaatacca gtgctcaatt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccgttattag gcctccgcat ctacttgatt ttccagaaca gcttacaatt 1020
ttcagcgtat taagtcgatg gagtaatact caatatatga attactgggt gggacataga 1080
cttgaatcgc gaacaataag ggggtcatta agtacctcga cacacggaaa taccaatact 1140
tctattaatc ctgtaacatt acagttcaca tctcgagacg tttatagaac agaatcattt 1200
gcagggataa atatacttct aactactcct gtgaatggag taccttgggc tagatttaat 1260
tggagaaatc ccctgaattc tcttagaggt agccttctct atactatagg gtatactgga 1320
gtggggacac aactatttga ttcagaaact gaattaccac cagaaacaac agaacgacca 1380
aattatgaat cttacagtca tagattatct aatataagac taatatcagg aaacactttg 1440
agagcaccag tatattcttg gacgcaccgt agtgcagatc gtacaaatac cattagttca 1500
gatagcatta cacaaatacc attggtaaag gcgcataccc tccaatcggg taccactgta 1560
gtaaaagggc cagggtttac aggaggggat atcctccgtc gaacaagtgg aggaccattt 1620
gcttttagta atgttaatct agattttaac ttgtcacaaa ggtatcgtgc tagaattcgt 1680
tatgcctcta ctactaacct aagaatttac gtaacggttg caggtgaacg aatttttgct 1740
ggtcaatttg acaaaactat ggatgctggt gccccattaa cattccaatc ttttagttac 1800
gcaactatta atacagcttt tacattccca gaaagatcga gcagcttgac tgtaggtgcc 1860
gatacgttta gttcaggtaa tgaagtttat gtagatagat ttgaattaat cccagttact 1920
gcaaccggaa cgacaaccta tgagtatgaa gagaagcaga atctagaaaa agcgcagaaa 1980
gcgttgaacg ctttgtttac ggatggcacg aatggctatc tacaaatgga tgccactgat 2040
tatgatatca atcaaactgc aaacttaata gaatgtgtat cagatgaatt gtatgcaaaa 2100
gaaaagatag ttttattaga tgaagtcaaa tatgcgaagc ggcttagcat atcacgtaac 2160
ctacttttga acgatgattt agaattttca gatggatttg gagaaaacgg atggacgaca 2220
agtgataata tttcaatcca ggcggataat ccccttttta aggggaatta tttaaaaatg 2280
tttggggcaa gagatattga tggaacccta tttccaactt atctctatca aaaaatagat 2340
gagtccaggt taaaaccata tacacgttat cgagtaagag ggtttgtggg aagtagtaaa 2400
aatctaaaat tagtggtaac acgctatgag aaagaaattg atgccattat gaatgttcca 2460
aatgatttgg cacatatgca gcttaaccct tcatgtggag attatcgctg tgaatcatcg 2520
tcccagtttt tggtgaacca agtgcatcct acaccaacag ctggatatgc tcttgatatg 2580
tatgcatgcc cgtcaagttc agataaaaaa catattatgt gtcacgatcg tcatccattt 2640
gattttcata ttgacaccgg agaattaaat ccaaacacaa acctgggtat tgatgtcttg 2700
tttaaaattt ctaatccaaa tggatacgct acattaggga atctagaagt cattgaagaa 2760
ggaccactaa cagatgaagc attggtacat gtaaaacaaa aggaaaagaa atggcgtcag 2820
cacatggaga aaaaacgaat ggaaacacaa caagcctatg atccagcaaa acaagctgta 2880
gatgcattat ttacaaatga acaagagtta gactatcata ctactttaga tcatattcag 2940
aacgccgatc agctggtaca ggcgattccc tatgtacacc atgcttggtt accggatgct 3000
ccaggtatga actatgatgt atatcaaggg ttaaacgcac gtatcatgca ggcgtacaat 3060
ttatatgatg cacgaaatgt cataataaat ggtgacttta cacaaggact acaaggatgg 3120
cacgcaacag gaaaagcagc ggtacaacaa atagatggag cttcagtatt agttctatca 3180
aactggagtg ccgaggtatc tcagaatctg catgcccaag atcatcatgg atatatgtta 3240
cgtgtgattg ccaaaaaaga aggtcctgga aaagggtatg taatgatgat ggattttaat 3300
ggaaagcagg aaacacttac gttcacttct tgtgaagaag gatatataac aaaaacaata 3360
gaggtattcc cggaaagtga tcgaatacga attgaaatgg gagaaacaga gggtacgttt 3420
tatgtagata gcatcgagtt gctttgtatg caaggatatg ctagcgataa taacccgcac 3480
acgggtaata tgtatgagca aagttataat ggaaattata atcaaaatac tagcgatgtg 3540
tatcaccaag gatatataaa caactataac caaaattcta gtagtatgta taatcaaaat 3600
tatattaaca atgatgacct gcattccggt tgcacatgta accaagggca taactctggc 3660
tgtacatgta atcaaggata taaccgttag 3690
<210> 15 <211> 3690 <212> ДНК
<213> Искусственная
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC867_21, сконструированная для экспрессии в растительной клетке.
<400> 15
atgaccagca accgaaagaa cgagaacgag atcatcaacg ccctgtccat accggccgtg 60
tcaaaccact ccgcccagat gaacctctcc accgacgcga ggatcgagga ctccctctgc 120
atcgccgagg gcaacaacat cgacccgttc gtgtctgcaa gcacggtcca gaccggcatc 180
aacatcgcgg gccgcatcct gggcgtgctc ggcgtgccct tcgcgggtca aatcgcctct 240
ttctactcat tcctcgtggg cgagctgtgg ccgcgcggac gtgacccgtg ggaaatcttc 300
ctggagcacg ttgagcagct catccggcag caagtgaccg agaacaccag ggacaccgca 360
ctggcacggc tccagggcct tggcaacagc ttccgcgcct accagcagtc gctggaggac 420
tggctggaga accgagacga cgccagaacc cgctcagttc tgtacacaca gtacatcgcc 480
ctagagctgg acttcctcaa cgctatgccg ctcttcgcca tccgtaacca ggaagtaccg 540
cttctgatgg tgtacgcaca agcagcgaac ctccatctgc tcctgctgcg agacgcatct 600
ctgttcggca gtgagttcgg gctgacgagc caggagatcc agcgctacta cgagcgccaa 660
gtggagaaga ctcgtgagta cagcgactac tgcgcgcgct ggtacaacac gggcttgaac 720
aaccttcgcg ggacaaacgc cgaatcctgg cttcgctaca accagttccg ccgcgacctc 780
acgctgggtg tgctggacct ggtcgcgctc ttcccgtcct acgacacacg ggtgtaccca 840
atgaacacga gcgcacagct cacccgtgag atctacacag atcccatcgg ccgcaccaac 900
gctcccagtg gcttcgcaag cacgaattgg ttcaacaata acgctccttc tttctctgcc 960
atcgaggccg ctgtcatcag accgccgcac ttactcgatt tcccggagca gctcactatc 1020
ttctctgtgt tgtcccggtg gtcgaacacg cagtacatga actactgggt gggccacagg 1080
ctagagagcc ggaccatccg tggcagtctc tcaacctcga cccacggcaa cacgaacacg 1140
agcatcaacc ctgtcactct ccagtttaca tctagggacg tttacaggac agagtcgttc 1200
gctggcatta acattctgtt gaccactccg gtgaacggcg tcccttgggc ccgcttcaac 1260
tggaggaatc ctctgaactc actgcgcggc agccttctct acactatcgg ctacaccggc 1320
gttgggacgc aactcttcga ctcggagacc gagctgccgc ccgagaccac cgagcggcct 1380
aactacgaga gttattcaca caggctctcc aacatccgct tgatttctgg gaacaccttg 1440
cgggctccgg tgtactcctg gacgcaccgc agcgccgaca gaactaatac catcagctcc 1500
gactcgatca cccagatccc gctggtgaag gctcacacgc ttcagtcggg caccacagtc 1560
gtcaagggcc ctggcttcac cggcggcgac atcctgcgtc gcacatctgg cggacccttc 1620
gccttcagca acgtgaactt ggacttcaat ttgtcacagc ggtatcgtgc cagaatccgg 1680
tacgccagca ctacgaacct gcgaatctat gttactgtgg cgggcgagcg gatcttcgcc 1740
gggcaattcg acaagacgat ggacgcggga gcacctctga cattccagtc attctcttac 1800
gccacgatca acacggcatt cacgtttccg gagcgttcca gtagcctgac cgtgggcgct 1860
gataccttca gtagcgggaa cgaggtgtac gttgaccgtt tcgagctgat cccggtcacc 1920
gccaccggga ctaccaccta cgagtacgag gagaagcaga atctcgagaa ggctcagaag 1980
gctctgaacg ctctgttcac tgacgggacc aacggctacc tccagatgga cgccactgac 2040
tacgacatca accagacagc taacctgatt gagtgtgtga gtgacgaact gtacgctaag 2100
gagaagatcg tactcctgga cgaggtgaag tacgctaagc gcctgagcat tagccgtaac 2160
ctgctgctga acgacgatct ggagttcagc gacggctttg gcgagaacgg ctggaccacc 2220
agcgacaaca tctccatcca ggccgacaat ccactcttca aaggcaacta cctcaagatg 2280
ttcggagcca gggacatcga cggcaccctc tttccgacct acctctacca gaagatcgac 2340
gagtcccgcc tcaaacccta cacccgctac agggtgcgcg gcttcgtggg cagcagcaag 2400
aacctcaagc tcgtggtcac acggtatgag aaggagatcg acgccatcat gaacgtgccc 2460
aacgatctcg cccacatgca gctcaatcca tcctgcggcg actaccggtg cgagtccagc 2520
tcccagttcc tcgtgaacca ggtgcaccct actccgaccg ctggctatgc cctggacatg 2580
tacgcctgcc ctagttcctc cgacaagaag cacatcatgt gccacgaccg tcatccgttc 2640
gacttccaca tcgacaccgg cgaactgaac ccgaacacca acctgggcat cgacgtactg 2700
ttcaagattt ccaacccgaa cgggtacgcc accttgggca acctggaggt catcgaagaa 2760
ggcccgctga ccgacgaggc cctggtccac gtcaaacaga aggagaagaa gtggcggcag 2820
cacatggaga agaagcggat ggagactcaa caagcctacg acccggccaa gcaagctgtg 2880
gacgctctgt tcaccaacga gcaagagctt gactaccaca ctactcttga ccacatccag 2940
aatgctgacc agcttgtcca ggctattccg tacgtccacc acgcttggct accggacgct 3000
ccagggatga actacgatgt gtaccagggt ctgaacgcgc ggatcatgca agcgtacaac 3060
ctgtacgacg cgcgtaacgt catcatcaac ggtgacttca ctcagggtct tcaaggttgg 3120
cacgcgactg gcaaagcggc agtccagcag attgatggtg cgtctgttct tgtgttgagc 3180
aactggtctg cggaggtttc tcagaacctg cacgcacagg atcaccacgg ctacatgctg 3240
agggtgattg ctaagaagga gggccctggc aaaggctacg tcatgatgat ggacttcaac 3300
ggaaagcaag aaaccctgac cttcactagc tgtgaggagg gctacatcac taagaccatt 3360
gaggtctttc cggagtctga ccgcatccgg atcgagatgg gcgagaccga aggcacgttc 3420
tacgtggact ccatcgaact cctctgcatg caaggctacg cctccgacaa caacccacac 3480
acgggcaaca tgtacgagca gtcctacaac gggaactaca accagaacac ctccgatgtg 3540
taccatcagg gctacatcaa caactacaac cagaacagca gcagcatgta caaccagaac 3600
tacatcaaca acgatgactt gcactcgggt tgcacctgca accagggtca caacagtggg 3660
tgcacgtgca accagggata caaccgttga 3690
<210> 16 <211> 1229 <212>
ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC867_21.
<400> 16
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465
470
475
480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His
500 505 510
Thr Leu Gln Ser Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn
530 535 540
Val Asn Leu Asp Phe Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
565 570 575
Arg Ile Phe Ala Gly Gln Phe Asp Lys Thr Met Asp Ala Gly Ala Pro
580 585 590
Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
595 600 605
Phe Pro Glu Arg Ser Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr
625 630 635 640
Ala Thr Gly Thr Thr Thr Tyr Glu Tyr Glu Glu Lys Gln Asn Leu Glu
645 650 655
Lys Ala Gln Lys Ala Leu Asn Ala Leu Phe Thr Asp Gly Thr Asn Gly
660 665 670
Tyr Leu Gln Met Asp Ala Thr Asp Tyr Asp Ile Asn Gln Thr Ala Asn
675 680 685
Leu Ile Glu Cys Val Ser Asp Glu Leu Tyr Ala Lys Glu Lys Ile Val
690 695 700
Leu Leu Asp Glu Val Lys Tyr Ala Lys Arg Leu Ser Ile Ser Arg Asn
705 710 715 720
Leu Leu Leu Asn Asp Asp Leu Glu Phe Ser Asp Gly Phe Gly Glu Asn
725 730 735
Gly Trp Thr Thr Ser Asp Asn Ile Ser Ile Gln Ala Asp Asn Pro Leu
740 745 750
Phe Lys Gly Asn Tyr Leu Lys Met Phe Gly Ala Arg Asp Ile Asp Gly
755 760 765
Thr Leu Phe Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Arg Leu
770 775 780
Lys Pro Tyr Thr Arg Tyr Arg Val Arg Gly Phe Val Gly Ser Ser Lys
785 790 795 800
Asn Leu Lys Leu Val Val Thr Arg Tyr Glu Lys Glu Ile Asp Ala Ile
805 810 815
Met Asn Val Pro Asn Asp Leu Ala His Met Gln Leu Asn Pro Ser Cys
820 825 830
Gly Asp Tyr Arg Cys Glu Ser Ser Ser Gln Phe Leu Val Asn Gln Val
835 840 845
His Pro Thr Pro Thr Ala Gly Tyr Ala Leu Asp Met Tyr Ala Cys Pro
850 855 860
Ser Ser Ser Asp Lys Lys His Ile Met Cys His Asp Arg His Pro Phe
865 870 875 880
Asp Phe His Ile Asp Thr Gly Glu Leu Asn Pro Asn Thr Asn Leu Gly
885 890 895
Ile Asp Val Leu Phe Lys Ile Ser Asn Pro Asn Gly Tyr Ala Thr Leu
900 905 910
Gly Asn Leu Glu Val Ile Glu Glu Gly Pro Leu Thr Asp Glu Ala Leu
915 920 925
Val His Val Lys Gln Lys Glu Lys Lys Trp Arg Gln His Met Glu Lys
930 935 940
Lys Arg Met Glu Thr Gln Gln Ala Tyr Asp Pro Ala Lys Gln Ala Val
945 950 955 960
Asp Ala Leu Phe Thr Asn Glu Gln Glu Leu Asp Tyr His Thr Thr Leu
965 970 975
Asp His Ile Gln Asn Ala Asp Gln Leu Val Gln Ala Ile Pro Tyr Val
980
985
990
His His Ala Trp Leu Pro Asp Ala Pro Gly Met Asn Tyr Asp Val Tyr
995 1000 1005
Gln Gly Leu Asn Ala Arg Ile Met Gln Ala Tyr Asn Leu Tyr Asp
1010 1015 1020
Ala Arg Asn Val Ile Ile Asn Gly Asp Phe Thr Gln Gly Leu Gln
1025 1030 1035
Gly Trp His Ala Thr Gly Lys Ala Ala Val Gln Gln Ile Asp Gly
1040 1045 1050
Ala Ser Val Leu Val Leu Ser Asn Trp Ser Ala Glu Val Ser Gln
1055 1060 1065
Asn Leu His Ala Gln Asp His His Gly Tyr Met Leu Arg Val Ile
1070 1075 1080
Ala Lys Lys Glu Gly Pro Gly Lys Gly Tyr Val Met Met Met Asp
1085 1090 1095
Phe Asn Gly Lys Gln Glu Thr Leu Thr Phe Thr Ser Cys Glu Glu
1100 1105 1110
Gly Tyr Ile Thr Lys Thr Ile Glu Val Phe Pro Glu Ser Asp Arg
1115 1120 1125
Ile Arg Ile Glu Met Gly Glu Thr Glu Gly Thr Phe Tyr Val Asp
1130 1135 1140
Ser Ile Glu Leu Leu Cys Met Gln Gly Tyr Ala Ser Asp Asn Asn
1145 1150 1155
Pro His Thr Gly Asn Met Tyr Glu Gln Ser Tyr Asn Gly Asn Tyr
1160 1165 1170
Asn Gln Asn Thr Ser Asp Val Tyr His Gln Gly Tyr Ile Asn Asn
1175 1180 1185
Tyr Asn Gln Asn Ser Ser Ser Met Tyr Asn Gln Asn Tyr Ile Asn
1190 1195 1200
Asn Asp Asp Leu His Ser Gly Cys Thr Cys Asn Gln Gly His Asn
1205 1210 1215
Ser Gly Cys Thr Cys Asn Gln Gly Tyr Asn Arg
1220 1225
<210> 17 <211> 3432
<212> ДНК
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC867_22, используемая для экспрессии в бактериальной клетке.
<400> 17
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccagctgta 60
tcgaatcatt ccgcacaaat gaatctatca accgatgctc gtattgagga tagcttgtgt 120
atagccgagg ggaacaatat cgatccattt gttagcgcat caacagtcca aacgggtatt 180
aacatagctg gtagaatact aggtgtatta ggcgtaccgt ttgctggaca aatagctagt 240
ttttatagtt ttcttgttgg tgaattatgg ccccgcggca gagatccttg ggaaattttc 300
ctagaacatg tcgaacaact tataagacaa caagtaacag aaaatactag ggatacggct 360
cttgctcgat tacaaggttt aggaaattcc tttagagcct atcaacagtc acttgaagat 420
tggctagaaa accgtgatga tgcaagaacg agaagtgttc tttataccca atatatagcc 480
ttagaacttg attttcttaa tgcgatgccg cttttcgcaa ttagaaacca agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agatgcctct 600
ctttttggta gtgaatttgg gcttacatcc caagaaattc aacgttatta tgagcgccaa 660
gtggaaaaaa cgagagaata ttctgattat tgcgcaagat ggtataatac gggtttaaat 720
aatttgagag ggacaaatgc tgaaagttgg ttgcgatata atcaattccg tagagactta 780
acgctaggag tattagatct agtggcacta ttcccaagct atgacacgcg tgtttatcca 840
atgaatacca gtgctcaatt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccgttattag gcctccgcat ctacttgatt ttccagaaca gcttacaatt 1020
ttcagcgtat taagtcgatg gagtaatact caatatatga attactgggt gggacataga 1080
cttgaatcgc gaacaataag ggggtcatta agtacctcga cacacggaaa taccaatact 1140
tctattaatc ctgtaacatt acagttcaca tctcgagacg tttatagaac agaatcattt 1200
gcagggataa atatacttct aactactcct gtgaatggag taccttgggc tagatttaat 1260
tggagaaatc ccctgaattc tcttagaggt agccttctct atactatagg gtatactgga 1320
gtggggacac aactatttga ttcagaaact gaattaccac cagaaacaac agaacgacca 1380
aattatgaat cttacagtca tagattatct aatataagac taatatcagg aaacactttg 1440
agagcaccag tatattcttg gacgcaccgt agtgcagatc gtacaaatac cattagttca 1500
gatagcatta cacaaatacc attggtaaag gcgcataccc tccaatcggg taccactgta 1560
gtaaaagggc cagggtttac aggaggggat atcctccgtc gaacaagtgg aggaccattt 1620
gcttttagta atgttaatct agattttaac ttgtcacaaa ggtatcgtgc tagaattcgt 1680
tatgcctcta ctactaacct aagaatttac gtaacggttg caggtgaacg aatttttgct 1740
ggtcaatttg acaaaactat ggatgctggt gccccattaa cattccaatc ttttagttac 1800
gcaactatta atacagcttt tacattccca gaaagatcga gcagcttgac tgtaggtgcc 1860
gatacgttta gttcaggtaa tgaagtttat gtagatagat ttgaattaat cccagttact 1920
gcaaccaatc cgacgcgaga ggcggaagag gatctagaag cagcgaagaa agcggtggcg 1980
agcttgttta cacgtacaag ggacggatta caagtaaatg tgacagatta tcaagtcgat 2040
caagcggcaa atttagtgtc atgcttatca gatgaacaat atgggcatga caaaaagatg 2100
ttattggaag cggtaagagc ggcaaaacgc ctcagccgag aacgcaactt acttcaggat 2160
ccagatttta atacaatcaa tagtacagaa gaaaatggat ggaaagcaag taacggcgtt 2220
actattagcg agggcggtcc attctataaa ggccgtgcgc ttcagctagc aagcgcaaga 2280
gaaaattacc caacatacat ttatcaaaaa gtaaatgcat cagagttaaa gccgtataca 2340
cgttatagac tggatgggtt cgtgaagagt agtcaagatt tagaaattga tctcattcac 2400
catcataaag tccatctcgt gaaaaatgta ccagataatt tagtatccga tacttactcg 2460
gatggttctt gcagtggaat gaatcgatgt gaggaacaac agatggtaaa tgcgcaactg 2520
gaaacagaac atcatcatcc gatggattgc tgtgaagcgg ctcaaacaca tgagttttct 2580
tcctatatta atacaggcga tctaaattca agtgtagatc aaggcatttg ggttgtattg 2640
aaagttcgaa caaccgatgg ttatgcgacg ctaggaaatc ttgaattggt agaggtcgga 2700
ccgttatcgg gtgaatctct agaacgtgaa caaagggata atgcgaaatg gagtgcagag 2760
ctaggaagaa agcgtgcaga aacagatcgc gtgtatcaag atgccaaaca atccatcaat 2820
catttatttg tggattatca agatcaacaa ttaaatccag aaatagggat ggcagatatt 2880
attgacgctc aaaatcttgt cgcatcaatt tcagatgtgt atagcgatgc agtactgcaa 2940
atccctggaa ttaactatga gatttacaca gagctatcca atcgcttaca acaagcatcg 3000
tatctgtata cgtctcgaaa tgcggtgcaa aatggggact ttaacagcgg tctagatagt 3060
tggaatgcaa cagggggggc tacggtacaa caggatggca atacgcattt cttagttctt 3120
tctcattggg atgcacaagt ttctcaacaa tttagagtgc agccgaattg taaatatgta 3180
ttacgtgtaa cagcagagaa agtaggcggc ggagacggat acgtgacaat ccgggatggt 3240
gctcatcata cagaaaagct tacatttaat gcatgtgatt atgatataaa tggcacgtac 3300
gtgactgata atacgtatct aacaaaagaa gtggtattct attcacatac agaacacatg 3360
tgggtagagg taagtgaaac agaaggtgca tttcatatag atagtattga attcgttgaa 3420
acagaaaagt ag 3432
<210> 18 <211> 3432 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC867_22, сконструированная для экспрессии в растительной клетке.
<400> 18
atgaccagca accgaaagaa cgagaacgag atcatcaacg ccctgtccat accggccgtg 60
tcaaaccact ccgcccagat gaacctctcc accgacgcga ggatcgagga ctccctctgc 120
atcgccgagg gcaacaacat cgacccgttc gtgtctgcaa gcacggtcca gaccggcatc 180
aacatcgcgg gccgcatcct gggcgtgctc ggcgtgccct tcgcgggtca aatcgcctct 240
ttctactcat tcctcgtggg cgagctgtgg ccgcgcggac gtgacccgtg ggaaatcttc 300
ctggagcacg ttgagcagct catccggcag caagtgaccg agaacaccag ggacaccgca 360
ctggcacggc tccagggcct tggcaacagc ttccgcgcct accagcagtc gctggaggac 420
tggctggaga accgagacga cgccagaacc cgctcagttc tgtacacaca gtacatcgcc 480
ctagagctgg acttcctcaa cgctatgccg ctcttcgcca tccgtaacca ggaagtaccg 540
cttctgatgg tgtacgcaca agcagcgaac ctccatctgc tcctgctgcg agacgcatct 600
ctgttcggca gtgagttcgg gctgacgagc caggagatcc agcgctacta cgagcgccaa 660
gtggagaaga ctcgtgagta cagcgactac tgcgcgcgct ggtacaacac gggcttgaac 720
aaccttcgcg ggacaaacgc cgaatcctgg cttcgctaca accagttccg ccgcgacctc 780
acgctgggtg tgctggacct ggtcgcgctc ttcccgtcct acgacacacg ggtgtaccca 840
atgaacacga gcgcacagct cacccgtgag atctacacag atcccatcgg ccgcaccaac 900
gctcccagtg gcttcgcaag cacgaattgg ttcaacaata acgctccttc tttctctgcc 960
atcgaggccg ctgtcatcag accgccgcac ttactcgatt tcccggagca gctcactatc 1020
ttctctgtgt tgtcccggtg gtcgaacacg cagtacatga actactgggt gggccacagg 1080
ctagagagcc ggaccatccg tggcagtctc tcaacctcga cccacggcaa cacgaacacg 1140
agcatcaacc ctgtcactct ccagtttaca tctagggacg tttacaggac agagtcgttc 1200
gctggcatta acattctgtt gaccactccg gtgaacggcg tcccttgggc ccgcttcaac 1260
tggaggaatc ctctgaactc actgcgcggc agccttctct acactatcgg ctacaccggc 1320
gttgggacgc aactcttcga ctcggagacc gagctgccgc ccgagaccac cgagcggcct 1380
aactacgaga gttattcaca caggctctcc aacatccgct tgatttctgg gaacaccttg 1440
cgggctccgg tgtactcctg gacgcaccgc agcgccgaca gaactaatac catcagctcc 1500
gactcgatca cccagatccc gctggtgaag gctcacacgc ttcagtcggg caccacagtc 1560
gtcaagggcc ctggcttcac cggcggcgac atcctgcgtc gcacatctgg cggacccttc 1620
gccttcagca acgtgaactt ggacttcaat ttgtcacagc ggtatcgtgc cagaatccgg 1680
tacgccagca ctacgaacct gcgaatctat gttactgtgg cgggcgagcg gatcttcgcc 1740
gggcaattcg acaagacgat ggacgcggga gcacctctga cattccagtc attctcttac 1800
gccacgatca acacggcatt cacgtttccg gagcgttcca gtagcctgac cgtgggcgct 1860
gataccttca gtagcgggaa cgaggtgtac gttgaccgtt tcgagctgat cccggtcacc 1920
gccaccaacc cgacgcggga agctgaggaa gacttggaag ccgccaagaa agcggtcgcc 1980
agcctgttta ctcggacgcg ggacgggctc caagtgaatg tgacggacta tcaagtggat 2040
caggccgcta acctcgtgtc atgcctgagc gacgagcagt acggtcacga caagaaaatg 2100
ctgctggagg ccgtccgggc cgccaagcgg ctgtccaggg agcgtaacct gctacaagat 2160
cccgacttta acacgatcaa cagcacagag gagaatggct ggaaggccag caacggagtt 2220
acgataagcg agggcggtcc gttctacaag ggtcgtgccc tccagctcgc ctctgcaagg 2280
gagaactatc caacctacat ctatcagaag gtgaacgcat ccgagcttaa gccctacaca 2340
cgctaccgcc tggacgggtt cgttaagtcc agtcaagacc tagagataga cctcatccac 2400
caccacaaag tgcatctggt caagaacgtt cccgataatc tcgtgagcga tacctactca 2460
gacggctcat gctctggcat gaacagatgt gaggagcaac agatggttaa tgctcaactc 2520
gaaaccgagc atcatcatcc tatggattgc tgcgaggccg cgcagaccca tgagttcagc 2580
tcttacatca acaccggaga cctcaacagt agcgtggatc agggaatttg ggtggtgctt 2640
aaagtgcgta caaccgacgg ctacgccacc ctcggcaacc ttgagcttgt cgaggtcgga 2700
ccacttagcg gcgagtccct ggaacgtgag cagcgggaca acgccaaatg gagcgcagag 2760
ctagggcgca aacgcgcgga gacggaccgg gtttatcagg acgcgaagca gtccatcaat 2820
cacctcttcg tggattatca ggaccagcag cttaatccag agatcggcat ggccgacatc 2880
atcgacgccc agaacctagt agcgtcgatt tccgatgtct attccgacgc cgtgcttcaa 2940
atacctggca tcaactacga gatctacaca gagttgtcca acaggctcca gcaagcgtca 3000
tacctctaca ccagccgcaa cgccgtccag aatggcgact tcaattccgg actagactcc 3060
tggaacgcca cgggcggagc tacggtgcaa caagacggca acacccactt cctcgtactt 3120
agccactggg acgctcaagt gagtcagcaa ttccgggttc agccgaactg caagtacgtc 3180
ctgcgcgtaa cggccgagaa ggttggaggc ggagacggct acgttaccat ccgcgacggc 3240
gctcaccaca ccgagaaact gacgttcaac gcttgtgact acgacatcaa cggcacttac 3300
gtgacggaca acacctacct gacgaaggag gtggtgttct attctcacac cgagcacatg 3360
tgggttgagg tcagcgagac cgagggagcc ttccacattg acagcatcga gttcgtggag 3420
actgagaagt ga 3432
<210> 19 <211> 1143
<212>
ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC867_22.
<400> 19
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465
470
475
480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His
500 505 510
Thr Leu Gln Ser Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn
530 535 540
Val Asn Leu Asp Phe Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
565 570 575
Arg Ile Phe Ala Gly Gln Phe Asp Lys Thr Met Asp Ala Gly Ala Pro
580 585 590
Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
595 600 605
Phe Pro Glu Arg Ser Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr
625 630 635 640
Ala Thr Asn Pro Thr Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys
645 650 655
Lys Ala Val Ala Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val
660 665 670
Asn Val Thr Asp Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys
675 680 685
Leu Ser Asp Glu Gln Tyr Gly His Asp Lys Lys Met Leu Leu Glu Ala
690 695 700
Val Arg Ala Ala Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp
705 710 715 720
Pro Asp Phe Asn Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala
725 730 735
Ser Asn Gly Val Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg
740 745 750
Ala Leu Gln Leu Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr
755 760 765
Gln Lys Val Asn Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu
770 775 780
Asp Gly Phe Val Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His
785 790 795 800
His His Lys Val His Leu Val Lys Asn Val Pro Asp Asn Leu Val Ser
805 810 815
Asp Thr Tyr Ser Asp Gly Ser Cys Ser Gly Met Asn Arg Cys Glu Glu
820 825 830
Gln Gln Met Val Asn Ala Gln Leu Glu Thr Glu His His His Pro Met
835 840 845
Asp Cys Cys Glu Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn
850 855 860
Thr Gly Asp Leu Asn Ser Ser Val Asp Gln Gly Ile Trp Val Val Leu
865 870 875 880
Lys Val Arg Thr Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu
885 890 895
Val Glu Val Gly Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg
900 905 910
Asp Asn Ala Lys Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr
915 920 925
Asp Arg Val Tyr Gln Asp Ala Lys Gln Ser Ile Asn His Leu Phe Val
930 935 940
Asp Tyr Gln Asp Gln Gln Leu Asn Pro Glu Ile Gly Met Ala Asp Ile
945 950 955 960
Ile Asp Ala Gln Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp
965 970 975
Ala Val Leu Gln Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu
980
985
990
Ser Asn Arg Leu Gln Gln Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala
995 1000 1005
Val Gln Asn Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala
1010 1015 1020
Thr Gly Gly Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu
1025 1030 1035
Val Leu Ser His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val
1040 1045 1050
Gln Pro Asn Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val
1055 1060 1065
Gly Gly Gly Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His
1070 1075 1080
Thr Glu Lys Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly
1085 1090 1095
Thr Tyr Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe
1100 1105 1110
Tyr Ser His Thr Glu His Met Trp Val Glu Val Ser Glu Thr Glu
1115 1120 1125
Gly Ala Phe His Ile Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
1130 1135 1140
<210> 20 <211> 3696
<212> ДНК <213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC867_23, сконструированная для экспрессии в растительной клетке.
<400> 20
atgaccagca accgaaagaa cgagaacgag atcatcaacg ccctgtccat accggccgtg 60
tcaaaccact ccgcccagat gaacctctcc accgacgcga ggatcgagga ctccctctgc 120
atcgccgagg gcaacaacat cgacccgttc gtgtctgcaa gcacggtcca gaccggcatc 180
aacatcgcgg gccgcatcct gggcgtgctc ggcgtgccct tcgcgggtca aatcgcctct 240
ttctactcat tcctcgtggg cgagctgtgg ccgcgcggac gtgacccgtg ggaaatcttc 300
ctggagcacg ttgagcagct catccggcag caagtgaccg agaacaccag ggacaccgca
360
ctggcacggc tccagggcct tggcaacagc ttccgcgcct accagcagtc gctggaggac 420
tggctggaga accgagacga cgccagaacc cgctcagttc tgtacacaca gtacatcgcc 480
ctagagctgg acttcctcaa cgctatgccg ctcttcgcca tccgtaacca ggaagtaccg 540
cttctgatgg tgtacgcaca agcagcgaac ctccatctgc tcctgctgcg agacgcatct 600
ctgttcggca gtgagttcgg gctgacgagc caggagatcc agcgctacta cgagcgccaa 660
gtggagaaga ctcgtgagta cagcgactac tgcgcgcgct ggtacaacac gggcttgaac 720
aaccttcgcg ggacaaacgc cgaatcctgg cttcgctaca accagttccg ccgcgacctc 780
acgctgggtg tgctggacct ggtcgcgctc ttcccgtcct acgacacacg ggtgtaccca 840
atgaacacga gcgcacagct cacccgtgag atctacacag atcccatcgg ccgcaccaac 900
gctcccagtg gcttcgcaag cacgaattgg ttcaacaata acgctccttc tttctctgcc 960
atcgaggccg ctgtcatcag accgccgcac ttactcgatt tcccggagca gctcactatc 1020
ttctctgtgt tgtcccggtg gtcgaacacg cagtacatga actactgggt gggccacagg 1080
ctagagagcc ggaccatccg tggcagtctc tcaacctcga cccacggcaa cacgaacacg 1140
agcatcaacc ctgtcactct ccagtttaca tctagggacg tttacaggac agagtcgttc 1200
gctggcatta acattctgtt gaccactccg gtgaacggcg tcccttgggc ccgcttcaac 1260
tggaggaatc ctctgaactc actgcgcggc agccttctct acactatcgg ctacaccggc 1320
gttgggacgc aactcttcga ctcggagacc gagctgccgc ccgagaccac cgagcggcct 1380
aactacgaga gttattcaca caggctctcc aacatccgct tgatttctgg gaacaccttg 1440
cgggctccgg tgtactcctg gacgcaccgc agcgccgaca gaactaatac catcagctcc 1500
gactcgatca cccagatccc gctggtgaag gctcacacgc ttcagtcggg caccacagtc 1560
gtcaagggcc ctggcttcac cggcggcgac atcctgcgtc gcacatctgg cggacccttc 1620
gccttcagca acgtgaactt ggacttcaat ttgtcacagc ggtatcgtgc cagaatccgg 1680
tacgccagca ctacgaacct gcgaatctat gttactgtgg cgggcgagcg gatcttcgcc 1740
gggcaattcg acaagacgat ggacgcggga gcacctctga cattccagtc attctcttac 1800
gccacgatca acacggcatt cacgtttccg gagcgttcca gtagcctgac cgtgggcgct 1860
gataccttca gtagcgggaa cgaggtgtac gttgaccgtt tcgagctgat cccggtcacc 1920
gccaccacgg cgaccttcga ggcggagtat gacttggagc gggctcagga ggccgtcaac 1980
gcgctgttca caaacaccaa tcctcgccgc ctcaagacgg gtgtgactga ttaccacatt 2040
gacgaggtct ccaacttggt cgcgtgtctg tccgatgagt tctgcctgga cgagaagcgg 2100
gaactgctgg agaaggtcaa gtacgccaag cgcctctccg acgaaaggaa cctcctccaa 2160
gatcccaact ttacttccat taacaagcag ccggacttca tctccaccaa cgagcagtcc 2220
aacttcacct caatccacga gcagtcggag cacgggtggt ggggcagcga gaacatcacc 2280
atccaagagg gcaacgacgt cttcaaggag aactacgtga tcctgcccgg caccttcaac 2340
gagtgttacc cgacctatct ctaccagaag attggcgaag cggaactcaa ggcttacacc 2400
cgttaccaac tgagtggcta cattgaggac tcacaagacc tggaaatcta cctgatccgc 2460
tacaacgcca agcacgagac cctcgacgtg cctggcacgg agtccgtctg gcccttgagc 2520
gtggagtctc ctatcggtcg ttgcggcgag cccaatcgct gcgctccgca ctttgagtgg 2580
aatcctgatt tggattgctc ctgccgagac ggtgagaaat gcgcccacca ctcgcaccac 2640
ttcagcctag acatcgacgt gggctgcatc gacctgcacg agaacttggg cgtctgggtc 2700
gtgttcaaga tcaagacaca ggagggccat gctcggcttg ggaacctgga gttcatcgag 2760
gagaagccac tgctgggtga agccttgtca cgggtgaaac gcgccgagaa gaagtggcgg 2820
gacaaacggg agaagctcca gttggagaca aagcgtgtgt acacagaggc caaggaggcc 2880
gtggatgcct tgttcgtgga cagtcagtac gacaggctgc aagcggacac caacatcggg 2940
atgatccacg cggctgataa gcttgttcac agaatccgcg aggcgtacct gtcagagctt 3000
agcgtgatcc caggcgtcaa cgccgaaatc ttcgaggaac tggagggccg cattatcacg 3060
gcaatctcac tttatgacgc gaggaatgtg gtcaagaacg gtgacttcaa caacggcttg 3120
gcgtgttgga acgttaaagg gcacgtggat gtacaacagt cacaccacag aagtgtcttg 3180
gtcatcccgg agtgggaggc ggaagtgagc caggccgtcc gggtctgccc tgggcgcggt 3240
tacatcctcc gcgtgacagc gtacaaggag ggctacggtg agggctgcgt gacgatccac 3300
gagattgaga acaacacgga cgagcttaag ttcaagaact gcgaggagga ggaagtgtac 3360
ccgacagaca ccggcacctg caacgactac accgcccacc aagggaccgc cgcctgcaac 3420
agccgcaacg cgggctatga agatgcgtac gaggttgata ccaccgcctc agtgaactac 3480
aaaccgactt atgaggagga gacatacacg gacgtcaggc gcgacaacca ttgtgagtac 3540
gaccgtggct acgtgaacta tccgccggtg ccagcgggct acatgacgaa ggagctagaa 3600
tacttccctg agacggacaa ggtgtggatt gaaatcggcg agaccgaggg caagtttatc 3660
gtggattctg tcgagctgct gctaatggag gagtag 3696
<210> 21 <211> 1231 <212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC867_23.
<400> 21
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His
500 505 510
Thr Leu Gln Ser Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn
530 535 540
Val Asn Leu Asp Phe Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
565 570 575
Arg Ile Phe Ala Gly Gln Phe Asp Lys Thr Met Asp Ala Gly Ala Pro
580 585 590
Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
595 600 605
Phe Pro Glu Arg Ser Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr
625 630 635 640
Ala Thr Thr Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln
645 650 655
Glu Ala Val Asn Ala Leu Phe Thr Asn Thr Asn Pro Arg Arg Leu Lys
660 665 670
Thr Gly Val Thr Asp Tyr His Ile Asp Glu Val Ser Asn Leu Val Ala
675 680 685
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Leu Glu
690 695 700
Lys Val Lys Tyr Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln
705 710 715 720
Asp Pro Asn Phe Thr Ser Ile Asn Lys Gln Pro Asp Phe Ile Ser Thr
725 730 735
Asn Glu Gln Ser Asn Phe Thr Ser Ile His Glu Gln Ser Glu His Gly
740 745 750
Trp Trp Gly Ser Glu Asn Ile Thr Ile Gln Glu Gly Asn Asp Val Phe
755 760 765
Lys Glu Asn Tyr Val Ile Leu Pro Gly Thr Phe Asn Glu Cys Tyr Pro
770 775 780
Thr Tyr Leu Tyr Gln Lys Ile Gly Glu Ala Glu Leu Lys Ala Tyr Thr
785 790 795 800
Arg Tyr Gln Leu Ser Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile
805 810 815
Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Leu Asp Val Pro Gly
820 825 830
Thr Glu Ser Val Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys
835 840 845
Gly Glu Pro Asn Arg Cys Ala Pro His Phe Glu Trp Asn Pro Asp Leu
850 855 860
Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His
865 870 875 880
Phe Ser Leu Asp Ile Asp Val Gly Cys Ile Asp Leu His Glu Asn Leu
885 890 895
Gly Val Trp Val Val Phe Lys Ile Lys Thr Gln Glu Gly His Ala Arg
900 905 910
Leu Gly Asn Leu Glu Phe Ile Glu Glu Lys Pro Leu Leu Gly Glu Ala
915 920 925
Leu Ser Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu
930 935 940
Lys Leu Gln Leu Glu Thr Lys Arg Val Tyr Thr Glu Ala Lys Glu Ala
945 950 955 960
Val Asp Ala Leu Phe Val Asp Ser Gln Tyr Asp Arg Leu Gln Ala Asp
965 970 975
Thr Asn Ile Gly Met Ile His Ala Ala Asp Lys Leu Val His Arg Ile
980 985 990
Arg Glu Ala Tyr Leu Ser Glu Leu Ser Val Ile Pro Gly Val Asn Ala
995 1000 1005
Glu Ile Phe Glu Glu Leu Glu Gly Arg Ile Ile Thr Ala Ile Ser
1010 1015 1020
Leu Tyr Asp Ala Arg Asn Val Val Lys Asn Gly Asp Phe Asn Asn
1025 1030 1035
Gly Leu Ala Cys Trp Asn Val Lys Gly His Val Asp Val Gln Gln
1040 1045 1050
Ser His His Arg Ser Val Leu Val Ile Pro Glu Trp Glu Ala Glu
1055 1060 1065
Val Ser Gln Ala Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu
1070 1075 1080
Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr
1085 1090 1095
Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Lys Asn
1100 1105 1110
Cys Glu Glu Glu Glu Val Tyr Pro Thr Asp Thr Gly Thr Cys Asn
1115 1120 1125
Asp Tyr Thr Ala His Gln Gly Thr Ala Ala Cys Asn Ser Arg Asn
1130 1135 1140
Ala Gly Tyr Glu Asp Ala Tyr Glu Val Asp Thr Thr Ala Ser Val
1145 1150 1155
Asn Tyr Lys Pro Thr Tyr Glu Glu Glu Thr Tyr Thr Asp Val Arg
1160 1165 1170
Arg Asp Asn His Cys Glu Tyr Asp Arg Gly Tyr Val Asn Tyr Pro
1175 1180 1185
Pro Val Pro Ala Gly Tyr Met Thr Lys Glu Leu Glu Tyr Phe Pro
1190 1195 1200
Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Lys
1205 1210 1215
Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1220 1225 1230
<210> 22
<211> 3666
<212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC867_24,
сконструированная для экспрессии в растительной клетке.
<400> 22
atgaccagca accgaaagaa cgagaacgag atcatcaacg ccctgtccat accggccgtg
tcaaaccact ccgcccagat gaacctctcc accgacgcga ggatcgagga ctccctctgc 120
atcgccgagg gcaacaacat cgacccgttc gtgtctgcaa gcacggtcca gaccggcatc 180
aacatcgcgg gccgcatcct gggcgtgctc ggcgtgccct tcgcgggtca aatcgcctct 240
ttctactcat tcctcgtggg cgagctgtgg ccgcgcggac gtgacccgtg ggaaatcttc 300
ctggagcacg ttgagcagct catccggcag caagtgaccg agaacaccag ggacaccgca 360
ctggcacggc tccagggcct tggcaacagc ttccgcgcct accagcagtc gctggaggac 420
tggctggaga accgagacga cgccagaacc cgctcagttc tgtacacaca gtacatcgcc 480
ctagagctgg acttcctcaa cgctatgccg ctcttcgcca tccgtaacca ggaagtaccg 540
cttctgatgg tgtacgcaca agcagcgaac ctccatctgc tcctgctgcg agacgcatct 600
ctgttcggca gtgagttcgg gctgacgagc caggagatcc agcgctacta cgagcgccaa 660
gtggagaaga ctcgtgagta cagcgactac tgcgcgcgct ggtacaacac gggcttgaac 720
aaccttcgcg ggacaaacgc cgaatcctgg cttcgctaca accagttccg ccgcgacctc 780
acgctgggtg tgctggacct ggtcgcgctc ttcccgtcct acgacacacg ggtgtaccca 840
atgaacacga gcgcacagct cacccgtgag atctacacag atcccatcgg ccgcaccaac 900
gctcccagtg gcttcgcaag cacgaattgg ttcaacaata acgctccttc tttctctgcc 960
atcgaggccg ctgtcatcag accgccgcac ttactcgatt tcccggagca gctcactatc 1020
ttctctgtgt tgtcccggtg gtcgaacacg cagtacatga actactgggt gggccacagg 1080
ctagagagcc ggaccatccg tggcagtctc tcaacctcga cccacggcaa cacgaacacg 1140
agcatcaacc ctgtcactct ccagtttaca tctagggacg tttacaggac agagtcgttc 1200
gctggcatta acattctgtt gaccactccg gtgaacggcg tcccttgggc ccgcttcaac 1260
tggaggaatc ctctgaactc actgcgcggc agccttctct acactatcgg ctacaccggc 1320
gttgggacgc aactcttcga ctcggagacc gagctgccgc ccgagaccac cgagcggcct 1380
aactacgaga gttattcaca caggctctcc aacatccgct tgatttctgg gaacaccttg 1440
cgggctccgg tgtactcctg gacgcaccgc agcgccgaca gaactaatac catcagctcc 1500
gactcgatca cccagatccc gctggtgaag gctcacacgc ttcagtcggg caccacagtc 1560
gtcaagggcc ctggcttcac cggcggcgac atcctgcgtc gcacatctgg cggacccttc 1620
gccttcagca acgtgaactt ggacttcaat ttgtcacagc ggtatcgtgc cagaatccgg 1680
tacgccagca ctacgaacct gcgaatctat gttactgtgg cgggcgagcg gatcttcgcc 1740
gggcaattcg acaagacgat ggacgcggga gcacctctga cattccagtc attctcttac 1800
gccacgatca acacggcatt cacgtttccg gagcgttcca gtagcctgac cgtgggcgct 1860
gataccttca gtagcgggaa cgaggtgtac gttgaccgtt tcgagctgat cccggtcacc 1920
gccaccaccg cgacgtttga agctgaatcc gacctcgagc gtgcgcgcaa ggcggtgaac 1980
gctctgttca cgagcaccaa ccctcgtggc ttgaagacgg atgtgacgga ctaccacatc 2040
gaccaagtct cgaacctcgt ggagtgcctg agcgacgagt tctgtcttga caagaagcgc 2100
gagctgctgg aggaggtgaa gtacgccaag cgcctctccg atgagcgcaa cctgctccaa 2160
gatcctacct tcacgtcgat ttccggccaa accgaccgtg gatggatcgg ctcgactggc 2220
atctccatcc agggcggcga cgacatcttc aaggagaact atgttcggct gccgggcacg 2280
gtggacgagt gttacccgac gtacctctac cagaagatag acgagagtca actcaagtcc 2340
tacacgcggt atcagttacg tggctacatt gaagactccc aggacttgga aatctatctc 2400
atacggtaca acgccaagca cgagacctta agcgtgccgg gaacggagtc gccctggcca 2460
agctctggcg tgtacccttc cggtaggtgc ggcgagccca accgctgtgc acctcgaatc 2520
gaatggaacc cggaccttga ctgctcttgc cggtacggcg agaagtgcgt ccatcattct 2580
caccacttca gcttggacat tgacgtcggc tgcaccgacc tcaatgaaga cctcggagtg 2640
tgggtcatct tcaagatcaa gacacaggac gggcacgcga aactaggaaa cctggagttc 2700
atcgaggaga agccactcct cggcaaggca ctttccaggg tcaagcgggc cgagaagaaa 2760
tggagggaca agtacgagaa actccagctc gaaacaaagc gggtgtacac ggaggcaaag 2820
gaatccgtgg acgccctgtt cgtggactct cagtacgaca agctccaggc gaacacaaac 2880
attggcatca tccacggtgc ggacaagcaa gtgcacagga tacgggagcc ttacctctcg 2940
gagctgccgg tgattccctc gatcaacgcg gcgatcttcg aggaactgga gggccacatc 3000
ttcaaggcgt attctctgta cgacgcgcgt aacgtcatca agaacggcga cttcaacaat 3060
gggctgtcct gctggaacgt taaaggccac gtcgatgtcc agcagaacca ccataggtca 3120
gtcctggtgc tgagcgagtg ggaggcggag gtgtcccaga aggtgcgcgt gtgcccggat 3180
cgcggctaca tcttgagggt gacagcctac aaggagggct acggcgaggg ctgtgtcacg 3240
atccatgagt tcgaggacaa cacggatgtc ctgaaattcc gtaacttcgt cgaggaggag 3300
gtctatccca acaacaccgt gacctgcaac gactacacga ccaatcagtc ggctgagggc 3360
agtaccgatg cctgcaacag ctacaaccgt ggttacgaag atggatacga gaaccgctac 3420
gagcccaatc cttcggctcc cgtgaattac actcccacgt acgaggaggg catgtacact 3480
gacactcagg gctacaacca ttgcgtcagc gaccgtggct accgcaacca cacgccgctc 3540
ccagcgggct acgtgacgct ggagctggaa tactttcccg agacagaaca agtgtggata 3600
gagatcggcg agaccgaggg cacattcatc gtgggctctg tggaattgct cctcatggag 3660
gagtaa 3666
<210> 23 <211> 1221
<212> ПРТ
<213> Искусственная
<223> Аминокислотная последовательность варианта химерного белка TIC867_24. <400> 23
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His
500 505 510
Thr Leu Gln Ser Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn
530 535 540
Val Asn Leu Asp Phe Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
565 570 575
Arg Ile Phe Ala Gly Gln Phe Asp Lys Thr Met Asp Ala Gly Ala Pro
580 585 590
Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
595 600 605
Phe Pro Glu Arg Ser Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr
625 630 635 640
Ala Thr Thr Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Arg
645 650 655
Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Pro Arg Gly Leu Lys
660 665 670
Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu
675 680 685
Cys Leu Ser Asp Glu Phe Cys Leu Asp Lys Lys Arg Glu Leu Leu Glu
690 695 700
Glu Val Lys Tyr Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln
705 710 715 720
Asp Pro Thr Phe Thr Ser Ile Ser Gly Gln Thr Asp Arg Gly Trp Ile
725 730 735
Gly Ser Thr Gly Ile Ser Ile Gln Gly Gly Asp Asp Ile Phe Lys Glu
740 745 750
Asn Tyr Val Arg Leu Pro Gly Thr Val Asp Glu Cys Tyr Pro Thr Tyr
755 760 765
Leu Tyr Gln Lys Ile Asp Glu Ser Gln Leu Lys Ser Tyr Thr Arg Tyr
770 775 780
Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu
785 790 795 800
Ile Arg Tyr Asn Ala Lys His Glu Thr Leu Ser Val Pro Gly Thr Glu
805 810 815
Ser Pro Trp Pro Ser Ser Gly Val Tyr Pro Ser Gly Arg Cys Gly Glu
820 825 830
Pro Asn Arg Cys Ala Pro Arg Ile Glu Trp Asn Pro Asp Leu Asp Cys
835 840 845
Ser Cys Arg Tyr Gly Glu Lys Cys Val His His Ser His His Phe Ser
850 855 860
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
865 870 875 880
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Lys Leu Gly
885 890 895
Asn Leu Glu Phe Ile Glu Glu Lys Pro Leu Leu Gly Lys Ala Leu Ser
900 905 910
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Tyr Glu Lys Leu
915 920 925
Gln Leu Glu Thr Lys Arg Val Tyr Thr Glu Ala Lys Glu Ser Val Asp
930 935 940
Ala Leu Phe Val Asp Ser Gln Tyr Asp Lys Leu Gln Ala Asn Thr Asn
945 950 955 960
Ile Gly Ile Ile His Gly Ala Asp Lys Gln Val His Arg Ile Arg Glu
965 970 975
Pro Tyr Leu Ser Glu Leu Pro Val Ile Pro Ser Ile Asn Ala Ala Ile
980 985 990
Phe Glu Glu Leu Glu Gly His Ile Phe Lys Ala Tyr Ser Leu Tyr Asp
995 1000 1005
Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser
1010 1015 1020
Cys Trp Asn Val Lys Gly His Val Asp Val Gln Gln Asn His His
1025 1030 1035
Arg Ser Val Leu Val Leu Ser Glu Trp Glu Ala Glu Val Ser Gln
1040 1045 1050
Lys Val Arg Val Cys Pro Asp Arg Gly Tyr Ile Leu Arg Val Thr
1055 1060 1065
Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu
1070 1075 1080
Phe Glu Asp Asn Thr Asp Val Leu Lys Phe Arg Asn Phe Val Glu
1085 1090 1095
Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr
1100 1105 1110
Thr Asn Gln Ser Ala Glu Gly Ser Thr Asp Ala Cys Asn Ser Tyr
1115 1120 1125
Asn Arg Gly Tyr Glu Asp Gly Tyr Glu Asn Arg Tyr Glu Pro Asn
1130 1135 1140
Pro Ser Ala Pro Val Asn Tyr Thr Pro Thr Tyr Glu Glu Gly Met
1145 1150 1155
Tyr Thr Asp Thr Gln Gly Tyr Asn His Cys Val Ser Asp Arg Gly
1160 1165 1170
Tyr Arg Asn His Thr Pro Leu Pro Ala Gly Tyr Val Thr Leu Glu
1175 1180 1185
Leu Glu Tyr Phe Pro Glu Thr Glu Gln Val Trp Ile Glu Ile Gly
1190 1195 1200
Glu Thr Glu Gly Thr Phe Ile Val Gly Ser Val Glu Leu Leu Leu
1205 1210 1215
Met Glu Glu 1220
<210> <211> <212> 24
3651 ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC867_25, сконструированная для экспрессии в растительной клетке.
<400> 24
atgaccagca accgaaagaa cgagaacgag atcatcaacg ccctgtccat accggccgtg 60
tcaaaccact ccgcccagat gaacctctcc accgacgcga ggatcgagga ctccctctgc 120
atcgccgagg gcaacaacat cgacccgttc gtgtctgcaa gcacggtcca gaccggcatc 180
aacatcgcgg gccgcatcct gggcgtgctc ggcgtgccct tcgcgggtca aatcgcctct 240
ttctactcat tcctcgtggg cgagctgtgg ccgcgcggac gtgacccgtg ggaaatcttc 300
ctggagcacg ttgagcagct catccggcag caagtgaccg agaacaccag ggacaccgca 360
ctggcacggc tccagggcct tggcaacagc ttccgcgcct accagcagtc gctggaggac 420
tggctggaga accgagacga cgccagaacc cgctcagttc tgtacacaca gtacatcgcc 480
ctagagctgg acttcctcaa cgctatgccg ctcttcgcca tccgtaacca ggaagtaccg 540
cttctgatgg tgtacgcaca agcagcgaac ctccatctgc tcctgctgcg agacgcatct 600
ctgttcggca gtgagttcgg gctgacgagc caggagatcc agcgctacta cgagcgccaa 660
gtggagaaga ctcgtgagta cagcgactac tgcgcgcgct ggtacaacac gggcttgaac 720
aaccttcgcg ggacaaacgc cgaatcctgg cttcgctaca accagttccg ccgcgacctc 780
acgctgggtg tgctggacct ggtcgcgctc ttcccgtcct acgacacacg ggtgtaccca 840
atgaacacga gcgcacagct cacccgtgag atctacacag atcccatcgg ccgcaccaac 900
gctcccagtg gcttcgcaag cacgaattgg ttcaacaata acgctccttc tttctctgcc 960
atcgaggccg ctgtcatcag accgccgcac ttactcgatt tcccggagca gctcactatc 1020
ttctctgtgt tgtcccggtg gtcgaacacg cagtacatga actactgggt gggccacagg 1080
ctagagagcc ggaccatccg tggcagtctc tcaacctcga cccacggcaa cacgaacacg 1140
agcatcaacc ctgtcactct ccagtttaca tctagggacg tttacaggac agagtcgttc 1200
gctggcatta acattctgtt gaccactccg gtgaacggcg tcccttgggc ccgcttcaac 1260
tggaggaatc ctctgaactc actgcgcggc agccttctct acactatcgg ctacaccggc 1320
gttgggacgc aactcttcga ctcggagacc gagctgccgc ccgagaccac cgagcggcct 1380
aactacgaga gttattcaca caggctctcc aacatccgct tgatttctgg gaacaccttg 1440
cgggctccgg tgtactcctg gacgcaccgc agcgccgaca gaactaatac catcagctcc 1500
gactcgatca cccagatccc gctggtgaag gctcacacgc ttcagtcggg caccacagtc 1560
gtcaagggcc ctggcttcac cggcggcgac atcctgcgtc gcacatctgg cggacccttc 1620
gccttcagca acgtgaactt ggacttcaat ttgtcacagc ggtatcgtgc cagaatccgg 1680
tacgccagca ctacgaacct gcgaatctat gttactgtgg cgggcgagcg gatcttcgcc 1740
gggcaattcg acaagacgat ggacgcggga gcacctctga cattccagtc attctcttac 1800
gccacgatca acacggcatt cacgtttccg gagcgttcca gtagcctgac cgtgggcgct 1860
gataccttca gtagcgggaa cgaggtgtac gttgaccgtt tcgagctgat cccggtcacc 1920
gccaccgatg ctacctttga agcagagtcc gacttggaac gtgcacagaa ggcagtgaac 1980
gcactcttca cctcaagcaa ccagatcgga ttgaagacag atgtgacaga ttaccacatc 2040
gaccaagtga gcaacttggt ggattgcttg tcagatgagt tctgcttgga tgagaagcgt 2100
gaactctccg agaaggtgaa gcacgcaaag cgtctctcag atgaacgtaa tctccttcaa 2160
gaccctaact ttcgtggtat caatcgtcag ccagatcgtg gatggcgtgg atcaacagac 2220
atcaccatcc agggaggcga tgatgtgttc aaggagaact acgtgaccct cccaggaacc 2280
gtggatgaat gctacccaac ctacctctac cagaagatcg acgagtcaaa gctcaaggct 2340
tacacccgtt atgaactccg tggctacatc gaagatagcc aggatctcga aatctatctc 2400
atccgttaca atgctaagca cgaaatcgtg aatgtgccag gaaccggctc actctggcca 2460
ctctcagcac agtcaccaat cggcaagtgc ggcgaaccca atcgctgcgc tcctcatctc 2520
gaatggaatc ccgatctcga ctgctcctgc cgagacggcg agaagtgtgc acatcactca 2580
caccacttca ccctcgacat cgacgtgggc tgcaccgacc tcaatgaaga cctgggcgtg 2640
tgggtgatct tcaagatcaa gacccaggac ggccacgcac gactgggcaa tctggagttt 2700
ctggaggaga agccactgct tggcgaggca ctggcacgag tgaaacgagc cgagaagaaa 2760
tggcgagaca aacgtgagaa gctgcaactg gagaccaaca tcgtgtacaa agaggccaaa 2820
gagtcagttg acgccctgtt tgtcaatagc cagtatgacc gactgcaagt tgacaccaac 2880
atcgccatga tccacgctgc ggacaagcgc gtccaccgca tccgcgaggc ttatctgccc 2940
gagctgagcg tcattcccgg cgtcaatgcc gcgatcttcg aggagttaga gggccgcatc 3000
ttcaccgcct acagcctcta tgacgcccgc aatgtcatta agaatggcga cttcaacaat 3060
ggcttactat gctggaatgt caaagggcac gttgacgtcg aggagcagaa caatcaccgc 3120
agcgtcttag tcatacccga gtgggaggcc gaagtcagcc aggaagtccg cgtctgtcca 3180
gggcgcgggt acatcctgcg ggtcaccgcc tacaaagagg gatacggcga gggttgtgtc 3240
accatacacg agatagagga caataccgac gaactcaagt tcagcaattg tgtcgaggag 3300
gaagtctatc ccaacaatac cgtaacctgc aacaactaca ccggaaccca ggaggagtat 3360
gaagggacgt acacctcgcg gaaccagggc tatgacgaag cctatgggaa caacccgtcg 3420
gtgcctgctg actatgcgtc ggtctatgag gagaaatcgt acacggacgg gcggcgggag 3480
aatccgtgtg agtcgaatcg cgggtatggt gactacacgc cgctaccggc gggctatgta 3540
acgaaagacc tggaatactt cccggagacg gacaaagtat ggatagagat aggcgagacg 3600
gagggaacgt tcatcgtgga ctcggtagag ctgctgctca tggaggagtg a 3651
<210> 25
<211> 1216
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC867_25.
<400> 25
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ala His
500 505 510
Thr Leu Gln Ser Gly Thr Thr Val Val Lys Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Thr Ser Gly Gly Pro Phe Ala Phe Ser Asn
530 535 540
Val Asn Leu Asp Phe Asn Leu Ser Gln Arg Tyr Arg Ala Arg Ile Arg
545 550 555 560
Tyr Ala Ser Thr Thr Asn Leu Arg Ile Tyr Val Thr Val Ala Gly Glu
565 570 575
Arg Ile Phe Ala Gly Gln Phe Asp Lys Thr Met Asp Ala Gly Ala Pro
580 585 590
Leu Thr Phe Gln Ser Phe Ser Tyr Ala Thr Ile Asn Thr Ala Phe Thr
595 600 605
Phe Pro Glu Arg Ser Ser Ser Leu Thr Val Gly Ala Asp Thr Phe Ser
610 615 620
Ser Gly Asn Glu Val Tyr Val Asp Arg Phe Glu Leu Ile Pro Val Thr
625 630 635 640
Ala Thr Asp Ala Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln
645 650 655
Lys Ala Val Asn Ala Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys
660 665 670
Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp
675 680 685
Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu
690 695 700
Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln
705 710 715 720
Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg
725 730 735
Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu
740 745 750
Asn Tyr Val Thr Leu Pro Gly Thr Val Asp Glu Cys Tyr Pro Thr Tyr
755 760 765
Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr
770 775 780
Glu Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu
785 790 795 800
Ile Arg Tyr Asn Ala Lys His Glu Ile Val Asn Val Pro Gly Thr Gly
805 810 815
Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu
820 825 830
Pro Asn Arg Cys Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys
835 840 845
Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Thr
850 855 860
Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val
865 870 875 880
Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly
885 890 895
Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala
900 905 910
Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu
915 920 925
Gln Leu Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp
930 935 940
Ala Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Val Asp Thr Asn
945 950 955 960
Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu
965 970 975
Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile
980 985 990
Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Tyr Ser Leu Tyr Asp
995 1000 1005
Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu
1010 1015 1020
Cys Trp Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn
1025 1030 1035
His Arg Ser Val Leu Val Ile Pro Glu Trp Glu Ala Glu Val Ser
1040 1045 1050
Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val
1055 1060 1065
Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His
1070 1075 1080
Glu Ile Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val
1085 1090 1095
Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr
1100 1105 1110
Thr Gly Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn
1115 1120 1125
Gln Gly Tyr Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala
1130 1135 1140
Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg
1145 1150 1155
Arg Glu Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr
1160 1165 1170
Pro Leu Pro Ala Gly Tyr Val Thr Lys Asp Leu Glu Tyr Phe Pro
1175 1180 1185
Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr
1190 1195 1200
Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1205 1210 1215
<210> 26
<211> 3600
<212> ДНК
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC868, используемая для экспрессии в бактериальной клетке.
<400> 26
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccagctgta 60
tcgaatcatt ccgcacaaat gaatctatca accgatgctc gtattgagga tagcttgtgt 120
atagccgagg ggaacaatat cgatccattt gttagcgcat caacagtcca aacgggtatt 180
aacatagctg gtagaatact aggtgtatta ggcgtaccgt ttgctggaca aatagctagt 240
ttttatagtt ttcttgttgg tgaattatgg ccccgcggca gagatccttg ggaaattttc 300
ctagaacatg tcgaacaact tataagacaa caagtaacag aaaatactag ggatacggct 360
cttgctcgat tacaaggttt aggaaattcc tttagagcct atcaacagtc acttgaagat 420
tggctagaaa accgtgatga tgcaagaacg agaagtgttc tttataccca atatatagcc 480
ttagaacttg attttcttaa tgcgatgccg cttttcgcaa ttagaaacca agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agatgcctct 600
ctttttggta gtgaatttgg gcttacatcc caagaaattc aacgttatta tgagcgccaa 660
gtggaaaaaa cgagagaata ttctgattat tgcgcaagat ggtataatac gggtttaaat 720
aatttgagag ggacaaatgc tgaaagttgg ttgcgatata atcaattccg tagagactta 780
acgctaggag tattagatct agtggcacta ttcccaagct atgacacgcg tgtttatcca 840
atgaatacca gtgctcaatt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccgttattag gcctccgcat ctacttgatt ttccagaaca gcttacaatt 1020
ttcagcgtat taagtcgatg gagtaatact caatatatga attactgggt gggacataga 1080
cttgaatcgc gaacaataag ggggtcatta agtacctcga cacacggaaa taccaatact 1140
tctattaatc ctgtaacatt acagttcaca tctcgagacg tttatagaac agaatcattt 1200
gcagggataa atatacttct aactactcct gtgaatggag taccttgggc tagatttaat 1260
tggagaaatc ccctgaattc tcttagaggt agccttctct atactatagg gtatactgga 1320
gtggggacac aactatttga ttcagaaact gaattaccac cagaaacaac agaacgacca 1380
aattatgaat cttacagtca tagattatct aatataagac taatatcagg aaacactttg 1440
agagcaccag tatattcttg gacgcaccgt agtgcagatc gtacaaatac cattagttca 1500
gatagcatta atcaaatacc tttagtgaaa ggatttagag tttggggggg cacctctgtc 1560
attacaggac caggatttac aggaggggat atccttcgaa gaaatacctt tggtgatttt 1620
gtatctctac aagtcaatat taattcacca attacccaaa gataccgttt aagatttcgt 1680
tacgcttcca gtagggatgc acgagttata gtattaacag gagcggcatc cacaggagtg 1740
ggaggccaag ttagtgtaaa tatgcctctt cagaaaacta tggaaatagg ggagaactta 1800
acatctagaa catttagata taccgatttt agtaatcctt tttcatttag agctaatcca 1860
gatataattg ggataagtga acaacctcta tttggtgcag gttctattag tagcggtgaa 1920
ctttatatag ataaaattga aattattcta gcagatgcaa catttgaagc agaatctgat 1980
ttagaaagag cacaaaaggc ggtgaatgag ctgtttactt cttccaatca aatcgggtta 2040
aaaacagatg tgacggatta tcatattgat caagtatcca atttagttga gtgtttatct 2100
gatgaatttt gtctggatga aaaaaaagaa ttgtccgaga aagtcaaaca tgcgaagcga 2160
cttagtgatg agcggaattt acttcaagat ccaaacttta gagggatcaa tagacaacta 2220
gaccgtggct ggagaggaag tacggatatt accatccaag gaggcgatga cgtattcaaa 2280
gagaattacg ttacgctatt gggtaccttt gatgagtgct atccaacgta tttatatcaa 2340
aaaatagatg agtcgaaatt aaaagcctat acccgttacc aattaagagg gtatatcgaa 2400
gatagtcaag acttagaaat ctatttaatt cgctacaatg ccaaacacga aacagtaaat 2460
gtgccaggta cgggttcctt atggccgctt tcagccccaa gtccaatcgg aaaatgtgcc 2520
catcattccc atcatttctc cttggacatt gatgttggat gtacagactt aaatgaggac 2580
ttaggtgtat gggtgatatt caagattaag acgcaagatg gccatgcaag actaggaaat 2640
ctagaatttc tcgaagagaa accattagta ggagaagcac tagctcgtgt gaaaagagcg 2700
gagaaaaaat ggagagacaa acgtgaaaaa ttggaatggg aaacaaatat tgtttataaa 2760
gaggcaaaag aatctgtaga tgctttattt gtaaactctc aatatgatag attacaagcg 2820
gataccaaca tcgcgatgat tcatgcggca gataaacgcg ttcatagcat tcgagaagct 2880
tatctgcctg agctgtctgt gattccgggt gtcaatgcgg ctatttttga agaattagaa 2940
gggcgtattt tcactgcatt ctccctatat gatgcgagaa atgtcattaa aaatggtgat 3000
tttaataatg gcttatcctg ctggaacgtg aaagggcatg tagatgtaga agaacaaaac 3060
aaccaccgtt cggtccttgt tgttccggaa tgggaagcag aagtgtcaca agaagttcgt 3120
gtctgtccgg gtcgtggcta tatccttcgt gtcacagcgt acaaggaggg atatggagaa 3180
ggttgcgtaa ccattcatga gatcgagaac aatacagacg aactgaagtt tagcaactgt 3240
gtagaagagg aagtatatcc aaacaacacg gtaacgtgta atgattatac tgcgactcaa 3300
gaagaatatg agggtacgta cacttctcgt aatcgaggat atgacggagc ctatgaaagc 3360
aattcttctg taccagctga ttatgcatca gcctatgaag aaaaagcata tacagatgga 3420
cgaagagaca atccttgtga atctaacaga ggatatgggg attacacacc actaccagct 3480
ggctatgtga caaaagaatt agagtacttc ccagaaaccg ataaggtatg gattgagatc 3540
ggagaaacgg aaggaacatt catcgtggac agcgtggaat tacttcttat ggaggaatag 3600
<210> 27
<211> 3600 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868, сконструированная для экспрессии в растительной клетке.
<400> 27
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct 360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagcagtc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
aacctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctccgtgc tctcacgctg gtccaacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgttc 1200
gcgggcatta acatccttct gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgttgaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cgttcgaggc cgagtctgac 1980
ctggagcggg ctcagaaggc tgtcaacgaa ctgttcacca gcagcaacca gattgggctc 2040
aagaccgacg tcacggacta tcacattgac caagtgtcca accttgtgga gtgcctgtcc 2100
gacgagttct gcctcgacga gaagaaggag ctgtccgaga aggtcaaaca cgcgaagcgt 2160
ctgagtgacg agcggaattt gctccaggac ccgaacttcc gtggcatcaa ccgccagctc 2220
gaccgtggtt ggcgcgggag tacagacatc accatccagg gaggcgacga tgtgttcaag 2280
gagaactatg tgacgctgct cgggactttc gacgaatgct acccgacgta tctctaccag 2340
aagatagacg agagtaaatt gaaggcgtac acccgctacc agcttcgcgg gtacatcgag 2400
gatagtcagg acctggaaat ctacctgatc cgatacaacg ccaagcacga gacagtgaac 2460
gtgccaggca cgggctcact ttggccattg agcgctccct ctccaatcgg aaagtgcgct 2520
caccactcgc accacttctc tctggacatc gacgtgggct gcaccgacct caacgaggac 2580
ctgggtgtct gggttatctt caagattaag acccaggacg gacatgcccg cctcggcaac 2640
ctggagttcc ttgaggagaa gcctctcgtg ggcgaggccc tcgctcgtgt gaagcgcgcc 2700
gagaagaaat ggcgagacaa gcgggagaag ctggagtggg agaccaacat cgtgtacaag 2760
gaggccaagg agtcagtgga cgcactcttc gtcaacagcc agtacgaccg cctccaggct 2820
gacaccaaca tcgccatgat ccacgcggct gacaagcggg tccacagcat ccgtgaggcg 2880
tacctgcccg agctgtcagt gatccctggt gtgaacgcgg cgatcttcga ggaactggag 2940
ggccgcatct tcacagcatt cagcctgtac gatgccagga atgttattaa gaacggtgac 3000
ttcaacaacg ggctgagttg ctggaacgtc aagggccatg tggacgtcga ggagcagaac 3060
aaccaccggt ccgtgctggt cgtgccggag tgggaggcag aggtgagcca ggaggtccgc 3120
gtctgccctg gtcgcggcta catcctccgt gtgactgcgt acaaggaagg ctacggtgaa 3180
ggctgcgtga ctatccacga gatcgagaac aacaccgacg agctcaagtt ctcgaactgt 3240
gtggaggagg aggtgtaccc gaacaacacc gttacttgca acgactacac tgccacgcaa 3300
gaggagtacg agggcactta cacttcccgg aatcgcggct atgatggcgc gtacgagtcc 3360
aacagcagcg tgcctgcgga ttatgcgtcc gcttacgagg agaaggcgta caccgacgga 3420
cggagggaca acccttgcga gtccaaccgt ggctacggtg actacactcc gctgcccgcc 3480
gggtacgtca ccaaggagct ggagtacttc ccggagaccg acaaagtctg gatcgagatc 3540
ggcgagacgg agggcacttt catcgtggac tcggtcgagc tgctactgat ggaggagtga 3600
<210> 28 <211> 1199
ПРТ
<212>
<213> Искусственная
<220>
<223> Аминокислотная последовательность химерного белка TIC868.
<400> 28
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545 550 555 560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
645 650 655
Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Glu Leu Phe
660 665 670
Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
675 680 685
Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys
690 695 700
Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
705 710 715 720
Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
725 730 735
Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile
740 745 750
Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly
755 760 765
Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
770 775 780
Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
785 790 795 800
Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
805 810 815
Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala
820 825 830
Pro Ser Pro Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu
835 840 845
Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp
850 855 860
Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn
865 870 875 880
Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg
885 890 895
Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu
900 905 910
Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala
915 920 925
Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile
930 935 940
Ala Met Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala
945 950 955 960
Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe
965 970 975
Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala
980 985 990
Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp
995 1000 1005
Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg
1010 1015 1020
Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu
1025 1030 1035
Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala
1040 1045 1050
Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile
1055 1060 1065
Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu
1070 1075 1080
Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala
1085 1090 1095
Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly
1100 1105 1110
Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr
1115 1120 1125
Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp
1130 1135 1140
Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1145 1150 1155
Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr
1160 1165 1170
Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile
1175 1180 1185
Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu 1190 1195
<210> 29
<211> 3600
<212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868_9, сконструированная для экспрессии в растительной клетке.
<400> 29
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct 360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagcagtc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
agcctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctccgtgc tctcacgctg gtccaacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgcag 1200
gcgggcatta acatccttat gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgaagaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cgttcgaggc cgagtctgac 1980
ctggagcggg ctcagaaggc tgtcaacgaa ctgttcacca gcagcaacca gattgggctc 2040
aagaccgacg tcacggacta tcacattgac caagtgtcca accttgtgga gtgcctgtcc 2100
gacgagttct gcctcgacga gaagaaggag ctgtccgaga aggtcaaaca cgcgaagcgt 2160
ctgagtgacg agcggaattt gctccaggac ccgaacttcc gtggcatcaa ccgccagctc 2220
gaccgtggtt ggcgcgggag tacagacatc accatccagg gaggcgacga tgtgttcaag 2280
gagaactatg tgacgctgct cgggactttc gacgaatgct acccgacgta tctctaccag 2340
aagatagacg agagtaaatt gaaggcgtac acccgctacc agcttcgcgg gtacatcgag 2400
gatagtcagg acctggaaat ctacctgatc cgatacaacg ccaagcacga gacagtgaac 2460
gtgccaggca cgggctcact ttggccattg agcgctccct ctccaatcgg aaagtgcgct 2520
caccactcgc accacttctc tctggacatc gacgtgggct gcaccgacct caacgaggac 2580
ctgggtgtct gggttatctt caagattaag acccaggacg gacatgcccg cctcggcaac 2640
ctggagttcc ttgaggagaa gcctctcgtg ggcgaggccc tcgctcgtgt gaagcgcgcc 2700
gagaagaaat ggcgagacaa gcgggagaag ctggagtggg agaccaacat cgtgtacaag 2760
gaggccaagg agtcagtgga cgcactcttc gtcaacagcc agtacgaccg cctccaggct 2820
gacaccaaca tcgccatgat ccacgcggct gacaagcggg tccacagcat ccgtgaggcg 2880
tacctgcccg agctgtcagt gatccctggt gtgaacgcgg cgatcttcga ggaactggag 2940
ggccgcatct tcacagcatt cagcctgtac gatgccagga atgttattaa gaacggtgac 3000
ttcaacaacg ggctgagttg ctggaacgtc aagggccatg tggacgtcga ggagcagaac 3060
aaccaccggt ccgtgctggt cgtgccggag tgggaggcag aggtgagcca ggaggtccgc 3120
gtctgccctg gtcgcggcta catcctccgt gtgactgcgt acaaggaagg ctacggtgaa 3180
ggctgcgtga ctatccacga gatcgagaac aacaccgacg agctcaagtt ctcgaactgt 3240
gtggaggagg aggtgtaccc gaacaacacc gttacttgca acgactacac tgccacgcaa 3300
gaggagtacg agggcactta cacttcccgg aatcgcggct atgatggcgc gtacgagtcc 3360
aacagcagcg tgcctgcgga ttatgcgtcc gcttacgagg agaaggcgta caccgacgga 3420
cggagggaca acccttgcga gtccaaccgt ggctacggtg actacactcc gctgcccgcc 3480
gggtacgtca ccaaggagct ggagtacttc ccggagaccg acaaagtctg gatcgagatc 3540
ggcgagacgg agggcacttt catcgtggac tcggtcgagc tgctactgat ggaggagtga 3600
<210> 30
<211> 1199
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC868_9.
<400> 30
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Ser Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Gln
385 390 395 400
Ala Gly Ile Asn Ile Leu Met Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Lys Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545 550 555 560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
645 650 655
Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Glu Leu Phe
660 665 670
Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
675 680 685
Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys
690 695 700
Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
705 710 715 720
Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
725 730 735
Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile
740 745 750
Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly
755 760 765
Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
770 775 780
Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
785 790 795 800
Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
805 810 815
Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala
820 825 830
Pro Ser Pro Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu
835 840 845
Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp
850 855 860
Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn
865 870 875 880
Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg
885 890 895
Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu
900 905 910
Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala
915 920 925
Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile
930 935 940
Ala Met Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala
945 950 955 960
Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe
965 970 975
Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala
980 985 990
Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp
995 1000 1005
Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg
1010 1015 1020
Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu
1025 1030 1035
Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala
1040 1045 1050
Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile
1055 1060 1065
Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu
1070 1075 1080
Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala
1085 1090 1095
Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly
1100 1105 1110
Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr
1115 1120 1125
Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp
1130 1135 1140
Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1145 1150 1155
Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr
1160 1165 1170
Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile
1175 1180 1185
Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu 1190 1195
<210> <211> <212> 31
3678 ДНК
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC868_10, используемая для экспрессии в бактериальной клетке.
<400> 31
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccagctgta 60 tcgaatcatt ccgcacaaat gaatctatca accgatgctc gtattgagga tagcttgtgt 120 atagccgagg ggaacaatat cgatccattt gttagcgcat caacagtcca aacgggtatt 180 aacatagctg gtagaatact aggtgtatta ggcgtaccgt ttgctggaca aatagctagt 240 ttttatagtt ttcttgttgg tgaattatgg ccccgcggca gagatccttg ggaaattttc 300 ctagaacatg tcgaacaact tataagacaa caagtaacag aaaatactag ggatacggct 360 cttgctcgat tacaaggttt aggaaattcc tttagagcct atcaacagtc acttgaagat 420 tggctagaaa accgtgatga tgcaagaacg agaagtgttc tttataccca atatatagcc 480 ttagaacttg attttcttaa tgcgatgccg cttttcgcaa ttagaaacca agaagttcca 540 ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agatgcctct 600 ctttttggta gtgaatttgg gcttacatcc caagaaattc aacgttatta tgagcgccaa 660 gtggaaaaaa cgagagaata ttctgattat tgcgcaagat ggtataatac gggtttaaat 720 aatttgagag ggacaaatgc tgaaagttgg ttgcgatata atcaattccg tagagactta 780 acgctaggag tattagatct agtggcacta ttcccaagct atgacacgcg tgtttatcca 840 atgaatacca gtgctcaatt aacaagagaa atttatacag atccaattgg gagaacaaat 900 gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccgttattag gcctccgcat ctacttgatt ttccagaaca gcttacaatt 1020
ttcagcgtat taagtcgatg gagtaatact caatatatga attactgggt gggacataga 1080
cttgaatcgc gaacaataag ggggtcatta agtacctcga cacacggaaa taccaatact 1140
tctattaatc ctgtaacatt acagttcaca tctcgagacg tttatagaac agaatcattt 1200
gcagggataa atatacttct aactactcct gtgaatggag taccttgggc tagatttaat 1260
tggagaaatc ccctgaattc tcttagaggt agccttctct atactatagg gtatactgga 1320
gtggggacac aactatttga ttcagaaact gaattaccac cagaaacaac agaacgacca 1380
aattatgaat cttacagtca tagattatct aatataagac taatatcagg aaacactttg 1440
agagcaccag tatattcttg gacgcaccgt agtgcagatc gtacaaatac cattagttca 1500
gatagcatta atcaaatacc tttagtgaaa ggatttagag tttggggggg cacctctgtc 1560
attacaggac caggatttac aggaggggat atccttcgaa gaaatacctt tggtgatttt 1620
gtatctctac aagtcaatat taattcacca attacccaaa gataccgttt aagatttcgt 1680
tacgcttcca gtagggatgc acgagttata gtattaacag gagcggcatc cacaggagtg 1740
ggaggccaag ttagtgtaaa tatgcctctt cagaaaacta tggaaatagg ggagaactta 1800
acatctagaa catttagata taccgatttt agtaatcctt tttcatttag agctaatcca 1860
gatataattg ggataagtga acaacctcta tttggtgcag gttctattag tagcggtgaa 1920
ctttatatag ataaaattga aattattcta gcagatgcaa catttgaggc agaatatgat 1980
ttagaaagag cgcaaaaggt ggtgaatgcc ctgtttacgt ctacaaacca actagggcta 2040
aaaacagatg tgacggatta tcatattgat caggtatcca atctagttgc gtgtttatcg 2100
gatgaatttt gtctggatga aaagagagaa ttgtccgaga aagttaaaca tgcaaagcga 2160
ctcagtgatg agcggaattt acttcaagat ccaaacttca gagggatcaa taggcaacca 2220
gaccgtggct ggagaggaag tacggatatt actatccaag gaggagatga cgtattcaaa 2280
gagaattacg ttacgctacc gggtaccttt gatgagtgct atccaacgta tttatatcaa 2340
aaaatagatg agtcgaaatt aaaagcctat acccgttatc aattaagagg gtatatcgaa 2400
gatagtcaag acttagaaat ctatttaatt cgttacaatg caaaacacga aatagtaaat 2460
gtaccaggta caggaagttt atggcctctt tctgtagaaa atcaaattgg accttgtgga 2520
gaaccgaatc gatgcgcgcc acaccttgaa tggaatcctg atttacactg ttcctgcaga 2580
gacggggaaa aatgtgcaca tcattctcat catttctctt tggacattga tgttggatgt 2640
acagacttaa atgaggactt aggtgtatgg gtgatattca agattaagac gcaagatggc 2700
cacgcacgac tagggaatct agagtttctc gaagagaaac cattattagg agaagcacta 2760
gctcgtgtga aaagagcgga gaaaaaatgg agagacaaac gcgaaacatt acaattggaa 2820
acaactatcg tttataaaga ggcaaaagaa tctgtagatg ctttatttgt aaactctcaa 2880
tatgatagat tacaagcgga tacgaacatc gcgatgattc atgcggcaga taaacgcgtt 2940
catagaattc gagaagcgta tctgccggag ctgtctgtga ttccgggtgt caatgcggct 3000
atttttgaag aattagaaga gcgtattttc actgcatttt ccctatatga tgcgagaaat 3060
attattaaaa atggcgattt caataatggc ttattatgct ggaacgtgaa agggcatgta 3120
gaggtagaag aacaaaacaa tcaccgttca gtcctggtta tcccagaatg ggaggcagaa 3180
gtgtcacaag aggttcgtgt ctgtccaggt cgtggctata tccttcgtgt tacagcgtac 3240
aaagagggat atggagaagg ttgcgtaacg atccatgaga tcgagaacaa tacagacgaa 3300
ctgaaattca acaactgtgt agaagaggaa gtatatccaa acaacacggt aacgtgtatt 3360
aattatactg cgactcaaga agaatatgag ggtacgtaca cttctcgtaa tcgaggatat 3420
gacgaagcct atggtaataa cccttccgta ccagctgatt atgcgtcagt ctatgaagaa 3480
aaatcgtata cagatagacg aagagagaat ccttgtgaat ctaacagagg atatggagat 3540
tacacaccac taccagctgg ttatgtaaca aaggaattag agtacttccc agagaccgat 3600
aaggtatgga ttgagattgg agaaacagaa ggaacattca tcgtggacag cgtggaatta 3660
ctccttatgg aggaatag 3678
<210> 32 <211> 3678
<212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868_10, сконструированная для экспрессии в растительной клетке.
<400> 32
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct 360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagcagtc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
aacctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctccgtgc tctcacgctg gtccaacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgttc 1200
gcgggcatta acatccttct gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgttgaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cgttcgaggc cgagtacgac 1980
cttgagcgcg cccagaaggt ggtgaacgcc ctcttcacta gcactaacca gctaggcctg 2040
aagactgacg tgaccgacta ccacatcgac caagtgagca acctagtggc ctgcctctcc 2100
gacgagttct gcctcgacga gaagcgcgag ctgtccgaga aggtgaagca cgccaagcgc 2160
ctctccgacg agcgcaacct gctccaggac cccaacttca ggggcatcaa caggcagccc 2220
gaccgcggct ggcgcggctc caccgacatc accatccagg gcggtgacga cgtattcaag 2280
gagaactacg ttaccctccc cggcaccttc gacgagtgtt accccaccta cctctaccag 2340
aagatcgacg agtccaagct gaaggcctac acccgctacc agctccgcgg ctacatcgag 2400
gactcccagg acctggaaat ctacctcatc cgctacaacg ccaagcacga gatcgtgaac 2460
gtgcctggca ccggcagcct ctggcctctc agcgtggaga accagatcgg cccttgcggc 2520
gagcctaacc gctgcgcccc tcacctcgag tggaaccctg acctccactg ctcgtgcagg 2580
gacggcgaga agtgcgccca ccatagccac cacttctctc tggacatcga cgtgggctgc 2640
accgacctga acgaggacct gggcgtgtgg gttatcttca agatcaagac ccaggacggt 2700
cacgccaggc tgggtaacct ggagttcctt gaggaaaagc ctctgctggg tgaggccctg 2760
gccagggtca agagggctga gaagaaatgg agggataaga gggagaccct gcagctggag 2820
accactatcg tctacaagga ggctaaggag tctgtcgatg ctctgttcgt caactctcag 2880
tacgatagac tgcaagctga taccaacatc gctatgatcc acgctgcgga taagcgggtc 2940
caccggatcc gggaggctta ccttccggag ctttctgtca tcccgggtgt caacgctgcg 3000
atcttcgagg aacttgagga acggatcttc actgcgttta gtctttacga tgcgcggaac 3060
atcatcaaga acggggactt caacaatggt ctgctgtgct ggaacgtcaa gggtcatgtc 3120
gaggtcgagg aacaaaacaa tcatcgtagt gtccttgtca ttcctgagtg ggaggcggag 3180
gtctctcaag aggtccgtgt ttgcccgggg cgtgggtaca ttcttcgtgt tactgcgtac 3240
aaggaggggt acggggaggg gtgcgttact attcatgaga ttgagaacaa tactgatgag 3300
cttaagttca acaattgtgt tgaggaggag gtttacccga acaatactgt tacgtgcatc 3360
aactacacgg caacgcaaga ggaatacgag gggacgtaca cctcgcgtaa tagagggtat 3420
gatgaggcgt acggaaacaa cccgtcggtt ccagcagatt atgcctcggt ttatgaggag
3480
aagtcgtaca cggatagacg acgcgagaat ccatgtgagt caaatcgagg atacggagat 3540
tacacaccat taccagcagg atacgttaca aaggagttgg aatacttccc ggaaacagat 3600
aaagtttgga ttgaaatcgg agaaacagaa ggaacattca tcgtcgactc agtagaattg 3660
ttgttgatgg aagaatga 3678
<210> 33 <211> 1225
ПРТ
<212>
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC868_10.
<400> 33
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545 550 555 560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
645 650 655
Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Val Val Asn Ala Leu Phe
660 665 670
Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asp Val Thr Asp Tyr His
675 680 685
Ile Asp Gln Val Ser Asn Leu Val Ala Cys Leu Ser Asp Glu Phe Cys
690 695 700
Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
705 710 715 720
Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
725 730 735
Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile
740 745 750
Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly
755 760 765
Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
770 775 780
Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
785 790 795 800
Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
805 810 815
Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Val
820 825 830
Glu Asn Gln Ile Gly Pro Cys Gly Glu Pro Asn Arg Cys Ala Pro His
835 840 845
Leu Glu Trp Asn Pro Asp Leu His Cys Ser Cys Arg Asp Gly Glu Lys
850 855 860
Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys
865 870 875 880
Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
885 890 895
Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu
900 905 910
Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
915 920 925
Lys Trp Arg Asp Lys Arg Glu Thr Leu Gln Leu Glu Thr Thr Ile Val
930 935 940
Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
945 950 955 960
Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala
965 970 975
Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser
980 985 990
Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Glu Arg
995 1000 1005
Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Ile Ile Lys
1010 1015 1020
Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly
1025 1030 1035
His Val Glu Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val
1040 1045 1050
Ile Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys
1055 1060 1065
Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly
1070 1075 1080
Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr
1085 1090 1095
Asp Glu Leu Lys Phe Asn Asn Cys Val Glu Glu Glu Val Tyr Pro
1100 1105 1110
Asn Asn Thr Val Thr Cys Ile Asn Tyr Thr Ala Thr Gln Glu Glu
1115 1120 1125
Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Glu Ala
1130 1135 1140
Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala Ser Val Tyr
1145 1150 1155
Glu Glu Lys Ser Tyr Thr Asp Arg Arg Arg Glu Asn Pro Cys Glu
1160 1165 1170
Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro Ala Gly Tyr
1175 1180 1185
Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp
1190 1195 1200
Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val
1205 1210 1215
Glu Leu Leu Leu Met Glu Glu 1220 1225
<210> 34 <211> 3726
<212> ДНК <213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC868_11, используемая для экспрессии в бактериальной клетке.
<400> 34
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccagctgta 60
tcgaatcatt ccgcacaaat gaatctatca accgatgctc gtattgagga tagcttgtgt 120
atagccgagg ggaacaatat cgatccattt gttagcgcat caacagtcca aacgggtatt 180
aacatagctg gtagaatact aggtgtatta ggcgtaccgt ttgctggaca aatagctagt 240
ttttatagtt ttcttgttgg tgaattatgg ccccgcggca gagatccttg ggaaattttc 300
ctagaacatg tcgaacaact tataagacaa caagtaacag aaaatactag ggatacggct 360
cttgctcgat tacaaggttt aggaaattcc tttagagcct atcaacagtc acttgaagat 420
tggctagaaa accgtgatga tgcaagaacg agaagtgttc tttataccca atatatagcc 480
ttagaacttg attttcttaa tgcgatgccg cttttcgcaa ttagaaacca agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agatgcctct 600
ctttttggta gtgaatttgg gcttacatcc caagaaattc aacgttatta tgagcgccaa 660
gtggaaaaaa cgagagaata ttctgattat tgcgcaagat ggtataatac gggtttaaat 720
aatttgagag ggacaaatgc tgaaagttgg ttgcgatata atcaattccg tagagactta 780
acgctaggag tattagatct agtggcacta ttcccaagct atgacacgcg tgtttatcca 840
atgaatacca gtgctcaatt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccgttattag gcctccgcat ctacttgatt ttccagaaca gcttacaatt 1020
ttcagcgtat taagtcgatg gagtaatact caatatatga attactgggt gggacataga 1080
cttgaatcgc gaacaataag ggggtcatta agtacctcga cacacggaaa taccaatact 1140
tctattaatc ctgtaacatt acagttcaca tctcgagacg tttatagaac agaatcattt 1200
gcagggataa atatacttct aactactcct gtgaatggag taccttgggc tagatttaat 1260
tggagaaatc ccctgaattc tcttagaggt agccttctct atactatagg gtatactgga 1320
gtggggacac aactatttga ttcagaaact gaattaccac cagaaacaac agaacgacca 1380
aattatgaat cttacagtca tagattatct aatataagac taatatcagg aaacactttg 1440
agagcaccag tatattcttg gacgcaccgt agtgcagatc gtacaaatac cattagttca 1500
gatagcatta atcaaatacc tttagtgaaa ggatttagag tttggggggg cacctctgtc 1560
attacaggac caggatttac aggaggggat atccttcgaa gaaatacctt tggtgatttt 1620
gtatctctac aagtcaatat taattcacca attacccaaa gataccgttt aagatttcgt 1680
tacgcttcca gtagggatgc acgagttata gtattaacag gagcggcatc cacaggagtg 1740
ggaggccaag ttagtgtaaa tatgcctctt cagaaaacta tggaaatagg ggagaactta 1800
acatctagaa catttagata taccgatttt agtaatcctt tttcatttag agctaatcca 1860
gatataattg ggataagtga acaacctcta tttggtgcag gttctattag tagcggtgaa 1920
ctttatatag ataaaattga aattattcta gcagatgcaa caggaacgac aacctatgag 1980
tatgaagaga agcagaatct agaaaaagcg cagaaagcgt tgaacgcttt gtttacggat 2040
ggcacgaatg gctatctaca aatggatgcc actgattatg atatcaatca aactgcaaac 2100
ttaatagaat gtgtatcaga tgaattgtat gcaaaagaaa agatagtttt attagatgaa 2160
gtcaaatatg cgaagcggct tagcatatca cgtaacctac ttttgaacga tgatttagaa 2220
ttttcagatg gatttggaga aaacggatgg acgacaagtg ataatatttc aatccaggcg 2280
gataatcccc tttttaaggg gaattattta aaaatgtttg gggcaagaga tattgatgga 2340
accctatttc caacttatct ctatcaaaaa atagatgagt ccaggttaaa accatataca 2400
cgttatcgag taagagggtt tgtgggaagt agtaaaaatc taaaattagt ggtaacacgc 2460
tatgagaaag aaattgatgc cattatgaat gttccaaatg atttggcaca tatgcagctt 2520
aacccttcat gtggagatta tcgctgtgaa tcatcgtccc agtttttggt gaaccaagtg 2580
catcctacac caacagctgg atatgctctt gatatgtatg catgcccgtc aagttcagat 2640
aaaaaacata ttatgtgtca cgatcgtcat ccatttgatt ttcatattga caccggagaa 2700
ttaaatccaa acacaaacct gggtattgat gtcttgttta aaatttctaa tccaaatgga 2760
tacgctacat tagggaatct agaagtcatt gaagaaggac cactaacaga tgaagcattg 2820
gtacatgtaa aacaaaagga aaagaaatgg cgtcagcaca tggagaaaaa acgaatggaa 2880
acacaacaag cctatgatcc agcaaaacaa gctgtagatg cattatttac aaatgaacaa 2940
gagttagact atcatactac tttagatcat attcagaacg ccgatcagct ggtacaggcg 3000
attccctatg tacaccatgc ttggttaccg gatgctccag gtatgaacta tgatgtatat 3060
caagggttaa acgcacgtat catgcaggcg tacaatttat atgatgcacg aaatgtcata 3120
ataaatggtg actttacaca aggactacaa ggatggcacg caacaggaaa agcagcggta 3180
caacaaatag atggagcttc agtattagtt ctatcaaact ggagtgccga ggtatctcag 3240
aatctgcatg cccaagatca tcatggatat atgttacgtg tgattgccaa aaaagaaggt 3300
cctggaaaag ggtatgtaat gatgatggat tttaatggaa agcaggaaac acttacgttc 3360
acttcttgtg aagaaggata tataacaaaa acaatagagg tattcccgga aagtgatcga 3420
atacgaattg aaatgggaga aacagagggt acgttttatg tagatagcat cgagttgctt 3480
tgtatgcaag gatatgctag cgataataac ccgcacacgg gtaatatgta tgagcaaagt 3540
tataatggaa attataatca aaatactagc gatgtgtatc accaaggata tataaacaac 3600
tataaccaaa attctagtag tatgtataat caaaattata ttaacaatga tgacctgcat 3660
tccggttgca catgtaacca agggcataac tctggctgta catgtaatca aggatataac 3720
cgttag 3726
<210> 35 <211> 3726 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868_11, сконструированная для экспрессии в растительной клетке.
<400> 35
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct 360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagcagtc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
aacctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctccgtgc tctcacgctg gtccaacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgttc 1200
gcgggcatta acatccttct gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgttgaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cggggactac cacctacgag 1980
tacgaggaga agcagaatct cgagaaggct cagaaggctc tgaacgctct gttcactgac 2040
gggaccaacg gctacctcca gatggacgcc actgactacg acatcaacca gacagctaac 2100
ctgattgagt gtgtgagtga cgaactgtac gctaaggaga agatcgtact cctggacgag 2160
gtgaagtacg ctaagcgcct gagcattagc cgtaacctgc tgctgaacga cgatctggag 2220
ttcagcgacg gctttggcga gaacggctgg accaccagcg acaacatctc catccaggcc 2280
gacaatccac tcttcaaagg caactacctc aagatgttcg gagccaggga catcgacggc 2340
accctctttc cgacctacct ctaccagaag atcgacgagt cccgcctcaa accctacacc 2400
cgctacaggg tgcgcggctt cgtgggcagc agcaagaacc tcaagctcgt ggtcacacgg 2460
tatgagaagg agatcgacgc catcatgaac gtgcccaacg atctcgccca catgcagctc 2520
aatccatcct gcggcgacta ccggtgcgag tccagctccc agttcctcgt gaaccaggtg 2580
caccctactc cgaccgctgg ctatgccctg gacatgtacg cctgccctag ttcctccgac 2640
aagaagcaca tcatgtgcca cgaccgtcat ccgttcgact tccacatcga caccggcgaa 2700
ctgaacccga acaccaacct gggcatcgac gtactgttca agatttccaa cccgaacggg 2760
tacgccacct tgggcaacct ggaggtcatc gaagaaggcc cgctgaccga cgaggccctg 2820
gtccacgtca aacagaagga gaagaagtgg cggcagcaca tggagaagaa gcggatggag 2880
actcaacaag gagcttgact attccgtacg cagggtctga atcaacggtg cagcagattg aacctgcacg cctggcaaag actagctgtg atccggatcg tgcatgcaag tacaacggga tacaaccaga tcgggttgca cgttga cctacgaccc accacactac tccaccacgc acgcgcggat acttcactca atggtgcgtc cacaggatca gctacgtcat aggagggcta agatgggcga gctacgcctc actacaacca acagcagcag cctgcaacca ggccaagcaa tcttgaccac ttggctaccg catgcaagcg gggtcttcaa tgttcttgtg ccacggctac gatgatggac catcactaag gaccgaaggc cgacaacaac gaacacctcc catgtacaac gggtcacaac gctgtggacg atccagaatg gacgctccag tacaacctgt ggttggcacg ttgagcaact atgctgaggg ttcaacggaa accattgagg acgttctacg ccacacacgg gatgtgtacc cagaactaca agtgggtgca ctctgttcac ctgaccagct ggatgaacta acgacgcgcg cgactggcaa ggtctgcgga tgattgctaa agcaagaaac tctttccgga tggactccat gcaacatgta atcagggcta tcaacaacga cgtgcaacca caacgagcaa tgtccaggct cgatgtgtac taacgtcatc agcggcagtc ggtttctcag gaaggagggc cctgaccttc gtctgaccgc cgaactcctc cgagcagtcc catcaacaac tgacttgcac gggatacaac
2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3726
<210> 36
<211> 1241
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC868_11.
<400> 36
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545 550 555 560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Gly Thr
645 650 655
Thr Thr Tyr Glu Tyr Glu Glu Lys Gln Asn Leu Glu Lys Ala Gln Lys
660 665 670
Ala Leu Asn Ala Leu Phe Thr Asp Gly Thr Asn Gly Tyr Leu Gln Met
675 680 685
Asp Ala Thr Asp Tyr Asp Ile Asn Gln Thr Ala Asn Leu Ile Glu Cys
690 695 700
Val Ser Asp Glu Leu Tyr Ala Lys Glu Lys Ile Val Leu Leu Asp Glu
705 710 715 720
Val Lys Tyr Ala Lys Arg Leu Ser Ile Ser Arg Asn Leu Leu Leu Asn
725 730 735
Asp Asp Leu Glu Phe Ser Asp Gly Phe Gly Glu Asn Gly Trp Thr Thr
740 745 750
Ser Asp Asn Ile Ser Ile Gln Ala Asp Asn Pro Leu Phe Lys Gly Asn
755 760 765
Tyr Leu Lys Met Phe Gly Ala Arg Asp Ile Asp Gly Thr Leu Phe Pro
770 775 780
Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Arg Leu Lys Pro Tyr Thr
785 790 795 800
Arg Tyr Arg Val Arg Gly Phe Val Gly Ser Ser Lys Asn Leu Lys Leu
805 810 815
Val Val Thr Arg Tyr Glu Lys Glu Ile Asp Ala Ile Met Asn Val Pro
820 825 830
Asn Asp Leu Ala His Met Gln Leu Asn Pro Ser Cys Gly Asp Tyr Arg
835 840 845
Cys Glu Ser Ser Ser Gln Phe Leu Val Asn Gln Val His Pro Thr Pro
850 855 860
Thr Ala Gly Tyr Ala Leu Asp Met Tyr Ala Cys Pro Ser Ser Ser Asp
865 870 875 880
Lys Lys His Ile Met Cys His Asp Arg His Pro Phe Asp Phe His Ile
885 890 895
Asp Thr Gly Glu Leu Asn Pro Asn Thr Asn Leu Gly Ile Asp Val Leu
900 905 910
Phe Lys Ile Ser Asn Pro Asn Gly Tyr Ala Thr Leu Gly Asn Leu Glu
915 920 925
Val Ile Glu Glu Gly Pro Leu Thr Asp Glu Ala Leu Val His Val Lys
930 935 940
Gln Lys Glu Lys Lys Trp Arg Gln His Met Glu Lys Lys Arg Met Glu
945 950 955 960
Thr Gln Gln Ala Tyr Asp Pro Ala Lys Gln Ala Val Asp Ala Leu Phe
965 970 975
Thr Asn Glu Gln Glu Leu Asp Tyr His Thr Thr Leu Asp His Ile Gln
980 985 990
Asn Ala Asp Gln Leu Val Gln Ala Ile Pro Tyr Val His His Ala Trp
995 1000 1005
Leu Pro Asp Ala Pro Gly Met Asn Tyr Asp Val Tyr Gln Gly Leu
1010 1015 1020
Asn Ala Arg Ile Met Gln Ala Tyr Asn Leu Tyr Asp Ala Arg Asn
1025 1030 1035
Val Ile Ile Asn Gly Asp Phe Thr Gln Gly Leu Gln Gly Trp His
1040 1045 1050
Ala Thr Gly Lys Ala Ala Val Gln Gln Ile Asp Gly Ala Ser Val
1055 1060 1065
Leu Val Leu Ser Asn Trp Ser Ala Glu Val Ser Gln Asn Leu His
1070 1075 1080
Ala Gln Asp His His Gly Tyr Met Leu Arg Val Ile Ala Lys Lys
1085 1090 1095
Glu Gly Pro Gly Lys Gly Tyr Val Met Met Met Asp Phe Asn Gly
1100 1105 1110
Lys Gln Glu Thr Leu Thr Phe Thr Ser Cys Glu Glu Gly Tyr Ile
1115 1120 1125
Thr Lys Thr Ile Glu Val Phe Pro Glu Ser Asp Arg Ile Arg Ile
1130 1135 1140
Glu Met Gly Glu Thr Glu Gly Thr Phe Tyr Val Asp Ser Ile Glu
1145 1150 1155
Leu Leu Cys Met Gln Gly Tyr Ala Ser Asp Asn Asn Pro His Thr
1160 1165 1170
Gly Asn Met Tyr Glu Gln Ser Tyr Asn Gly Asn Tyr Asn Gln Asn
1175 1180 1185
Thr Ser Asp Val Tyr His Gln Gly Tyr Ile Asn Asn Tyr Asn Gln
1190 1195 1200
Asn Ser Ser Ser Met Tyr Asn Gln Asn Tyr Ile Asn Asn Asp Asp
1205 1210 1215
Leu His Ser Gly Cys Thr Cys Asn Gln Gly His Asn Ser Gly Cys
1220 1225 1230
Thr Cys Asn Gln Gly Tyr Asn Arg 1235 1240
<210> 37 <211> 3468
<212> ДНК
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC868_12, используемая для экспресии в бактериальной клетке.
<400> 37
atgacttcaa ataggaaaaa tgagaatgaa attataaatg ctttatcgat tccagctgta 60
tcgaatcatt ccgcacaaat gaatctatca accgatgctc gtattgagga tagcttgtgt 120
atagccgagg ggaacaatat cgatccattt gttagcgcat caacagtcca aacgggtatt 180
aacatagctg gtagaatact aggtgtatta ggcgtaccgt ttgctggaca aatagctagt 240
ttttatagtt ttcttgttgg tgaattatgg ccccgcggca gagatccttg ggaaattttc 300
ctagaacatg tcgaacaact tataagacaa caagtaacag aaaatactag ggatacggct 360
cttgctcgat tacaaggttt aggaaattcc tttagagcct atcaacagtc acttgaagat 420
tggctagaaa accgtgatga tgcaagaacg agaagtgttc tttataccca atatatagcc 480
ttagaacttg attttcttaa tgcgatgccg cttttcgcaa ttagaaacca agaagttcca 540
ttattaatgg tatatgctca agctgcaaat ttacacctat tattattgag agatgcctct 600
ctttttggta gtgaatttgg gcttacatcc caagaaattc aacgttatta tgagcgccaa 660
gtggaaaaaa cgagagaata ttctgattat tgcgcaagat ggtataatac gggtttaaat 720
aatttgagag ggacaaatgc tgaaagttgg ttgcgatata atcaattccg tagagactta 780
acgctaggag tattagatct agtggcacta ttcccaagct atgacacgcg tgtttatcca 840
atgaatacca gtgctcaatt aacaagagaa atttatacag atccaattgg gagaacaaat 900
gcaccttcag gatttgcaag tacgaattgg tttaataata atgcaccatc gttttctgcc 960
atagaggctg ccgttattag gcctccgcat ctacttgatt ttccagaaca gcttacaatt 1020
ttcagcgtat taagtcgatg gagtaatact caatatatga attactgggt gggacataga 1080
cttgaatcgc gaacaataag ggggtcatta agtacctcga cacacggaaa taccaatact 1140
tctattaatc ctgtaacatt acagttcaca tctcgagacg tttatagaac agaatcattt 1200
gcagggataa atatacttct aactactcct gtgaatggag taccttgggc tagatttaat 1260
tggagaaatc ccctgaattc tcttagaggt agccttctct atactatagg gtatactgga 1320
gtggggacac aactatttga ttcagaaact gaattaccac cagaaacaac agaacgacca 1380
aattatgaat cttacagtca tagattatct aatataagac taatatcagg aaacactttg 1440
agagcaccag tatattcttg gacgcaccgt agtgcagatc gtacaaatac cattagttca 1500
gatagcatta atcaaatacc tttagtgaaa ggatttagag tttggggggg cacctctgtc 1560
attacaggac caggatttac aggaggggat atccttcgaa gaaatacctt tggtgatttt 1620
gtatctctac aagtcaatat taattcacca attacccaaa gataccgttt aagatttcgt 1680
tacgcttcca gtagggatgc acgagttata gtattaacag gagcggcatc cacaggagtg 1740
ggaggccaag ttagtgtaaa tatgcctctt cagaaaacta tggaaatagg ggagaactta 1800
acatctagaa catttagata taccgatttt agtaatcctt tttcatttag agctaatcca 1860
gatataattg ggataagtga acaacctcta tttggtgcag gttctattag tagcggtgaa 1920
ctttatatag ataaaattga aattattcta gcagatgcaa caaatccgac gcgagaggcg 1980
gaagaggatc tagaagcagc gaagaaagcg gtggcgagct tgtttacacg tacaagggac 2040
ggattacaag taaatgtgac agattatcaa gtcgatcaag cggcaaattt agtgtcatgc 2100
ttatcagatg aacaatatgg gcatgacaaa aagatgttat tggaagcggt aagagcggca 2160
aaacgcctca gccgagaacg caacttactt caggatccag attttaatac aatcaatagt 2220
acagaagaaa atggatggaa agcaagtaac ggcgttacta ttagcgaggg cggtccattc 2280
tataaaggcc gtgcgcttca gctagcaagc gcaagagaaa attacccaac atacatttat 2340
caaaaagtaa atgcatcaga gttaaagccg tatacacgtt atagactgga tgggttcgtg 2400
aagagtagtc aagatttaga aattgatctc attcaccatc ataaagtcca tctcgtgaaa 2460
aatgtaccag ataatttagt atccgatact tactcggatg gttcttgcag tggaatgaat 2520
cgatgtgagg aacaacagat ggtaaatgcg caactggaaa cagaacatca tcatccgatg 2580
gattgctgtg aagcggctca aacacatgag ttttcttcct atattaatac aggcgatcta 2640
aattcaagtg tagatcaagg catttgggtt gtattgaaag ttcgaacaac cgatggttat 2700
gcgacgctag gaaatcttga attggtagag gtcggaccgt tatcgggtga atctctagaa 2760
cgtgaacaaa gggataatgc gaaatggagt gcagagctag gaagaaagcg tgcagaaaca 2820
gatcgcgtgt atcaagatgc caaacaatcc atcaatcatt tatttgtgga ttatcaagat 2880
caacaattaa atccagaaat agggatggca gatattattg acgctcaaaa tcttgtcgca 2940
tcaatttcag atgtgtatag cgatgcagta ctgcaaatcc ctggaattaa ctatgagatt 3000
tacacagagc tatccaatcg cttacaacaa gcatcgtatc tgtatacgtc tcgaaatgcg 3060
gtgcaaaatg gggactttaa cagcggtcta gatagttgga atgcaacagg gggggctacg 3120
gtacaacagg atggcaatac gcatttctta gttctttctc attgggatgc acaagtttct 3180
caacaattta gagtgcagcc gaattgtaaa tatgtattac gtgtaacagc agagaaagta 3240
ggcggcggag acggatacgt gacaatccgg gatggtgctc atcatacaga aaagcttaca 3300
tttaatgcat gtgattatga tataaatggc acgtacgtga ctgataatac gtatctaaca 3360
aaagaagtgg tattctattc acatacagaa cacatgtggg tagaggtaag tgaaacagaa 3420
ggtgcatttc atatagatag tattgaattc gttgaaacag aaaagtag 3468
<210> 38 <211> 3468 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868_12, сконструированная для экспрессии в растительной клетке.
<400> 38
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct 360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagcagtc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
aacctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctccgtgc tctcacgctg gtccaacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgttc 1200
gcgggcatta acatccttct gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgttgaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cgaacccgac gcgggaagct 1980
gaggaagact tggaagccgc caagaaagcg gtcgccagcc tgtttactcg gacgcgggac 2040
gggctccaag tgaatgtgac ggactatcaa gtggatcagg ccgctaacct cgtgtcatgc 2100
ctgagcgacg agcagtacgg tcacgacaag aaaatgctgc tggaggccgt ccgggccgcc 2160
aagcggctgt ccagggagcg taacctgcta caagatcccg actttaacac gatcaacagc 2220
acagaggaga atggctggaa ggccagcaac ggagttacga taagcgaggg cggtccgttc 2280
tacaagggtc gtgccctcca gctcgcctct gcaagggaga actatccaac ctacatctat 2340
cagaaggtga acgcatccga gcttaagccc tacacacgct accgcctgga cgggttcgtt 2400
aagtccagtc aagacctaga gatagacctc atccaccacc acaaagtgca tctggtcaag 2460
aacgttcccg ataatctcgt gagcgatacc tactcagacg gctcatgctc tggcatgaac 2520
agatgtgagg agcaacagat ggttaatgct caactcgaaa ccgagcatca tcatcctatg 2580
gattgctgcg aggccgcgca gacccatgag ttcagctctt acatcaacac cggagacctc 2640
aacagtagcg tggatcaggg aatttgggtg gtgcttaaag tgcgtacaac cgacggctac 2700
gccaccctcg gcaaccttga gcttgtcgag gtcggaccac ttagcggcga gtccctggaa 2760
cgtgagcagc gggacaacgc caaatggagc gcagagctag ggcgcaaacg cgcggagacg 2820
gaccgggttt atcaggacgc gaagcagtcc atcaatcacc tcttcgtgga ttatcaggac 2880
cagcagctta atccagagat cggcatggcc gacatcatcg acgcccagaa cctagtagcg 2940
tcgatttccg atgtctattc cgacgccgtg cttcaaatac ctggcatcaa ctacgagatc 3000
tacacagagt tgtccaacag gctccagcaa gcgtcatacc tctacaccag ccgcaacgcc 3060
gtccagaatg gcgacttcaa ttccggacta gactcctgga acgccacggg cggagctacg 3120
gtgcaacaag acggcaacac ccacttcctc gtacttagcc actgggacgc tcaagtgagt 3180
cagcaattcc gggttcagcc gaactgcaag tacgtcctgc gcgtaacggc cgagaaggtt 3240
ggaggcggag acggctacgt taccatccgc gacggcgctc accacaccga gaaactgacg 3300
ttcaacgctt gtgactacga catcaacggc acttacgtga cggacaacac ctacctgacg 3360
aaggaggtgg tgttctattc tcacaccgag cacatgtggg ttgaggtcag cgagaccgag 3420
ggagccttcc acattgacag catcgagttc gtggagactg agaagtga 3468
<210> 39 <211> 1155
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC868_12.
<400> 39
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545 550 555 560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Asn Pro
645 650 655
Thr Arg Glu Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala
660 665 670
Ser Leu Phe Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp
675 680 685
Tyr Gln Val Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu
690 695 700
Gln Tyr Gly His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala
705 710 715 720
Lys Arg Leu Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn
725 730 735
Thr Ile Asn Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val
740 745 750
Thr Ile Ser Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu
755 760 765
Ala Ser Ala Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asn
770 775 780
Ala Ser Glu Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val
785 790 795 800
Lys Ser Ser Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val
805 810 815
His Leu Val Lys Asn Val Pro Asp Asn Leu Val Ser Asp Thr Tyr Ser
820 825 830
Asp Gly Ser Cys Ser Gly Met Asn Arg Cys Glu Glu Gln Gln Met Val
835 840 845
Asn Ala Gln Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu
850 855 860
Ala Ala Gln Thr His Glu Phe Ser Ser Tyr Ile Asn Thr Gly Asp Leu
865 870 875 880
Asn Ser Ser Val Asp Gln Gly Ile Trp Val Val Leu Lys Val Arg Thr
885 890 895
Thr Asp Gly Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly
900 905 910
Pro Leu Ser Gly Glu Ser Leu Glu Arg Glu Gln Arg Asp Asn Ala Lys
915 920 925
Trp Ser Ala Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr
930 935 940
Gln Asp Ala Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp
945 950 955 960
Gln Gln Leu Asn Pro Glu Ile Gly Met Ala Asp Ile Ile Asp Ala Gln
965 970 975
Asn Leu Val Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln
980 985 990
Ile Pro Gly Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu
995 1000 1005
Gln Gln Ala Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn
1010 1015 1020
Gly Asp Phe Asn Ser Gly Leu Asp Ser Trp Asn Ala Thr Gly Gly
1025 1030 1035
Ala Thr Val Gln Gln Asp Gly Asn Thr His Phe Leu Val Leu Ser
1040 1045 1050
His Trp Asp Ala Gln Val Ser Gln Gln Phe Arg Val Gln Pro Asn
1055 1060 1065
Cys Lys Tyr Val Leu Arg Val Thr Ala Glu Lys Val Gly Gly Gly
1070 1075 1080
Asp Gly Tyr Val Thr Ile Arg Asp Gly Ala His His Thr Glu Lys
1085 1090 1095
Leu Thr Phe Asn Ala Cys Asp Tyr Asp Ile Asn Gly Thr Tyr Val
1100 1105 1110
Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val Val Phe Tyr Ser His
1115 1120 1125
Thr Glu His Met Trp Val Glu Val Ser Glu Thr Glu Gly Ala Phe
1130 1135 1140
His Ile Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
1145 1150 1155
<210> 40 <211> 3732
<212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868_13, сконструированная для экспрессии в растительной клетке.
<400> 40
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct 360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagcagtc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
aacctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctccgtgc tctcacgctg gtccaacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgttc 1200
gcgggcatta acatccttct gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgttgaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cgacggcgac cttcgaggcg 1980
gagtatgact tggagcgggc tcaggaggcc gtcaacgcgc tgttcacaaa caccaatcct 2040
cgccgcctca agacgggtgt gactgattac cacattgacg aggtctccaa cttggtcgcg 2100
tgtctgtccg atgagttctg cctggacgag aagcgggaac tgctggagaa ggtcaagtac 2160
gccaagcgcc tctccgacga aaggaacctc ctccaagatc ccaactttac ttccattaac 2220
aagcagccgg acttcatctc caccaacgag cagtccaact tcacctcaat ccacgagcag 2280
tcggagcacg ggtggtgggg cagcgagaac atcaccatcc aagagggcaa cgacgtcttc 2340
aaggagaact acgtgatcct gcccggcacc ttcaacgagt gttacccgac ctatctctac 2400
cagaagattg gcgaagcgga actcaaggct tacacccgtt accaactgag tggctacatt 2460
gaggactcac aagacctgga aatctacctg atccgctaca acgccaagca cgagaccctc 2520
gacgtgcctg gcacggagtc cgtctggccc ttgagcgtgg agtctcctat cggtcgttgc 2580
ggcgagccca atcgctgcgc tccgcacttt gagtggaatc ctgatttgga ttgctcctgc 2640
cgagacggtg agaaatgcgc ccaccactcg caccacttca gcctagacat cgacgtgggc 2700
tgcatcgacc tgcacgagaa cttgggcgtc tgggtcgtgt tcaagatcaa gacacaggag 2760
ggccatgctc ggcttgggaa cctggagttc atcgaggaga agccactgct gggtgaagcc 2820
ttgtcacggg tgaaacgcgc cgagaagaag tggcgggaca aacgggagaa gctccagttg 2880
gagacaaagc gtgtgtacac agaggccaag gaggccgtgg atgccttgtt cgtggacagt 2940
cagtacgaca ggctgcaagc ggacaccaac atcgggatga tccacgcggc tgataagctt 3000
gttcacagaa tccgcgaggc gtacctgtca gagcttagcg tgatcccagg cgtcaacgcc 3060
gaaatcttcg aatgtggtca gtggatgtac gtgagccagg aaggagggct cttaagttca gactacaccg gcgtacgagg tacacggacg ccggtgccag tggattgaaa atggaggagt aggaactgga agaacggtga aacagtcaca ccgtccgggt acggtgaggg agaactgcga cccaccaagg ttgataccac tcaggcgcga cgggctacat tcggcgagac
ag gggccgcatt cttcaacaac ccacagaagt ctgccctggg ctgcgtgacg ggaggaggaa gaccgccgcc cgcctcagtg caaccattgt gacgaaggag cgagggcaag atcacggcaa ggcttggcgt gtcttggtca cgcggttaca atccacgaga gtgtacccga tgcaacagcc aactacaaac gagtacgacc ctagaatact tttatcgtgg tctcacttta gttggaacgt tcccggagtg tcctccgcgt ttgagaacaa cagacaccgg gcaacgcggg cgacttatga gtggctacgt tccctgagac attctgtcga tgacgcgagg taaagggcac ggaggcggaa gacagcgtac cacggacgag cacctgcaac ctatgaagat ggaggagaca gaactatccg ggacaaggtg gctgctgcta
3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3732
<210> 41
<211> 1243
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC868_13.
<400> 41
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile
Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545 550 555 560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Thr Ala
645 650 655
Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Glu Ala Val Asn
660 665 670
Ala Leu Phe Thr Asn Thr Asn Pro Arg Arg Leu Lys Thr Gly Val Thr
675 680 685
Asp Tyr His Ile Asp Glu Val Ser Asn Leu Val Ala Cys Leu Ser Asp
690 695 700
Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Leu Glu Lys Val Lys Tyr
705 710 715 720
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
725 730 735
Thr Ser Ile Asn Lys Gln Pro Asp Phe Ile Ser Thr Asn Glu Gln Ser
740 745 750
Asn Phe Thr Ser Ile His Glu Gln Ser Glu His Gly Trp Trp Gly Ser
755 760 765
Glu Asn Ile Thr Ile Gln Glu Gly Asn Asp Val Phe Lys Glu Asn Tyr
770 775 780
Val Ile Leu Pro Gly Thr Phe Asn Glu Cys Tyr Pro Thr Tyr Leu Tyr
785 790 795 800
Gln Lys Ile Gly Glu Ala Glu Leu Lys Ala Tyr Thr Arg Tyr Gln Leu
805 810 815
Ser Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg
820 825 830
Tyr Asn Ala Lys His Glu Thr Leu Asp Val Pro Gly Thr Glu Ser Val
835 840 845
Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu Pro Asn
850 855 860
Arg Cys Ala Pro His Phe Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys
865 870 875 880
Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp
885 890 895
Ile Asp Val Gly Cys Ile Asp Leu His Glu Asn Leu Gly Val Trp Val
900 905 910
Val Phe Lys Ile Lys Thr Gln Glu Gly His Ala Arg Leu Gly Asn Leu
915 920 925
Glu Phe Ile Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ser Arg Val
930 935 940
Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu
945 950 955 960
Glu Thr Lys Arg Val Tyr Thr Glu Ala Lys Glu Ala Val Asp Ala Leu
965 970 975
Phe Val Asp Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Gly
980 985 990
Met Ile His Ala Ala Asp Lys Leu Val His Arg Ile Arg Glu Ala Tyr
995 1000 1005
Leu Ser Glu Leu Ser Val Ile Pro Gly Val Asn Ala Glu Ile Phe
1010 1015 1020
Glu Glu Leu Glu Gly Arg Ile Ile Thr Ala Ile Ser Leu Tyr Asp
1025 1030 1035
Ala Arg Asn Val Val Lys Asn Gly Asp Phe Asn Asn Gly Leu Ala
1040 1045 1050
Cys Trp Asn Val Lys Gly His Val Asp Val Gln Gln Ser His His
1055 1060 1065
Arg Ser Val Leu Val Ile Pro Glu Trp Glu Ala Glu Val Ser Gln
1070 1075 1080
Ala Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr
1085 1090 1095
Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu
1100 1105 1110
Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Lys Asn Cys Glu Glu
1115 1120 1125
Glu Glu Val Tyr Pro Thr Asp Thr Gly Thr Cys Asn Asp Tyr Thr
1130 1135 1140
Ala His Gln Gly Thr Ala Ala Cys Asn Ser Arg Asn Ala Gly Tyr
1145 1150 1155
Glu Asp Ala Tyr Glu Val Asp Thr Thr Ala Ser Val Asn Tyr Lys
1160 1165 1170
Pro Thr Tyr Glu Glu Glu Thr Tyr Thr Asp Val Arg Arg Asp Asn
1175 1180 1185
His Cys Glu Tyr Asp Arg Gly Tyr Val Asn Tyr Pro Pro Val Pro
1190 1195 1200
Ala Gly Tyr Met Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
1205 1210 1215
Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Lys Phe Ile Val
1220 1225 1230
Asp Ser Val Glu Leu Leu Leu Met Glu Glu 1235 1240
<210> 42 <211> 3702
<212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868_14, сконструированная для экспрессии в растительной клетке.
<400> 42
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct 360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagcagtc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
aacctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctccgtgc tctcacgctg gtccaacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgttc 1200
gcgggcatta acatccttct gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgttgaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cgaccgcgac gtttgaagct 1980
gaatccgacc tcgagcgtgc gcgcaaggcg gtgaacgctc tgttcacgag caccaaccct 2040
cgtggcttga agacggatgt gacggactac cacatcgacc aagtctcgaa cctcgtggag 2100
tgcctgagcg acgagttctg tcttgacaag aagcgcgagc tgctggagga ggtgaagtac 2160
gccaagcgcc tctccgatga gcgcaacctg ctccaagatc ctaccttcac gtcgatttcc 2220
ggccaaaccg accgtggatg gatcggctcg actggcatct ccatccaggg cggcgacgac 2280
atcttcaagg agaactatgt tcggctgccg ggcacggtgg acgagtgtta cccgacgtac 2340
ctctaccaga agatagacga gagtcaactc aagtcctaca cgcggtatca gttacgtggc 2400
tacattgaag actcccagga cttggaaatc tatctcatac ggtacaacgc caagcacgag 2460
accttaagcg tgccgggaac ggagtcgccc tggccaagct ctggcgtgta cccttccggt 2520
aggtgcggcg agcccaaccg ctgtgcacct cgaatcgaat ggaacccgga ccttgactgc 2580
tcttgccggt acggcgagaa gtgcgtccat cattctcacc acttcagctt ggacattgac 2640
gtcggctgca ccgacctcaa tgaagacctc ggagtgtggg tcatcttcaa gatcaagaca 2700
caggacgggc acgcgaaact aggaaacctg gagttcatcg aggagaagcc actcctcggc 2760
aaggcacttt ccagggtcaa gcgggccgag aagaaatgga gggacaagta cgagaaactc 2820
cagctcgaaa caaagcgggt gtacacggag gcaaaggaat ccgtggacgc cctgttcgtg 2880
gactctcagt acgacaagct ccaggcgaac acaaacattg gcatcatcca cggtgcggac 2940
aagcaagtgc acaggatacg ggagccttac ctctcggagc tgccggtgat tccctcgatc 3000
aacgcggcga tcttcgagga actggagggc cacatcttca aggcgtattc tctgtacgac 3060
gcgcgtaacg tcatcaagaa cggcgacttc aacaatgggc tgtcctgctg gaacgttaaa 3120
ggccacgtcg atgtccagca gaaccaccat aggtcagtcc tggtgctgag cgagtgggag 3180
gcggaggtgt cccagaaggt gcgcgtgtgc ccggatcgcg gctacatctt gagggtgaca 3240
gcctacaagg agggctacgg cgagggctgt gtcacgatcc atgagttcga ggacaacacg 3300
gatgtcctga aattccgtaa cttcgtcgag gaggaggtct atcccaacaa caccgtgacc 3360
tgcaacgact acacgaccaa tcagtcggct gagggcagta ccgatgcctg caacagctac 3420
aaccgtggtt acgaagatgg atacgagaac cgctacgagc ccaatccttc ggctcccgtg 3480
aattacactc ccacgtacga ggagggcatg tacactgaca ctcagggcta caaccattgc 3540
gtcagcgacc gtggctaccg caaccacacg ccgctcccag cgggctacgt gacgctggag 3600
ctggaatact ttcccgagac agaacaagtg tggatagaga tcggcgagac cgagggcaca 3660
ttcatcgtgg gctctgtgga attgctcctc atggaggagt aa 3702
<210> 43 <211> 1200
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC868_14.
<400> 43
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545 550 555 560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Thr Ala
645 650 655
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Arg Lys Ala Val Asn
660 665 670
Ala Leu Phe Thr Ser Thr Asn Pro Arg Gly Leu Lys Thr Asp Val Thr
675 680 685
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp
690 695 700
Glu Phe Cys Leu Asp Lys Lys Arg Glu Leu Leu Glu Glu Val Lys Tyr
705 710 715 720
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Thr Phe
725 730 735
Thr Ser Ile Ser Gly Gln Thr Asp Arg Gly Trp Ile Gly Ser Thr Gly
740 745 750
Ile Ser Ile Gln Gly Gly Asp Asp Ile Phe Lys Glu Asn Tyr Val Arg
755 760 765
Leu Pro Gly Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
770 775 780
Ile Asp Glu Ser Gln Leu Lys Ser Tyr Thr Arg Tyr Gln Leu Arg Gly
785 790 795 800
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
805 810 815
Ala Lys His Glu Thr Leu Ser Val Pro Gly Thr Glu Ser Pro Trp Pro
820 825 830
Ser Ser Gly Val Tyr Pro Ser Gly Arg Cys Gly Glu Pro Asn Arg Cys
835 840 845
Ala Pro Arg Ile Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Tyr
850 855 860
Gly Glu Lys Cys Val His His Ser His His Phe Ser Leu Asp Ile Asp
865 870 875 880
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
885 890 895
Lys Ile Lys Thr Gln Asp Gly His Ala Lys Leu Gly Asn Leu Glu Phe
900 905 910
Ile Glu Glu Lys Pro Leu Leu Gly Lys Ala Leu Ser Arg Val Lys Arg
915 920 925
Ala Glu Lys Lys Trp Arg Asp Lys Tyr Glu Lys Leu Gln Leu Glu Thr
930 935 940
Lys Arg Val Tyr Thr Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
945 950 955 960
Asp Ser Gln Tyr Asp Lys Leu Gln Ala Asn Thr Asn Ile Gly Ile Ile
965 970 975
His Gly Ala Asp Lys Gln Val His Arg Ile Arg Glu Pro Tyr Leu Ser
980 985 990
Glu Leu Pro Val Ile Pro Ser Ile Asn Ala Ala Ile Phe Glu Glu Leu
995 1000 1005
Glu Gly His Ile Phe Lys Ala Tyr Ser Leu Tyr Asp Ala Arg Asn
1010 1015 1020
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn
1025 1030 1035
Val Lys Gly His Val Asp Val Gln Gln Asn His His Arg Ser Val
1040 1045 1050
Leu Val Leu Ser Glu Trp Glu Ala Glu Val Ser Gln Lys Val Arg
1055 1060 1065
Val Cys Pro Asp Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys
1070 1075 1080
Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Phe Glu Asp
1085 1090 1095
Asn Thr Asp Val Leu Lys Phe Arg Asn Phe Val Glu Glu Glu Val
1100 1105 1110
Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Thr Asn Gln
1115 1120 1125
Ser Ala Glu Gly Ser Thr Asp Ala Cys Asn Ser Tyr Asn Arg Gly
1130 1135 1140
Tyr Glu Asp Gly Tyr Glu Asn Arg Tyr Glu Pro Asn Pro Ser Ala
1145 1150 1155
Pro Val Asn Tyr Thr Pro Thr Tyr Glu Glu Gly Met Tyr Thr Asp
1160 1165 1170
Thr Gln Gly Tyr Asn His Cys Val Ser Asp Arg Gly Tyr Arg Asn
1175 1180 1185
His Thr Pro Leu Pro Ala Gly Tyr Val Thr Leu Glu
1190 1195 1200
<210> 44 <211> 3687
<212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868_15, сконструированная для экспрессии в растительной клетке.
<400> 44
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct 360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagcagtc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
aacctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctccgtgc tctcacgctg gtccaacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgttc 1200
gcgggcatta acatccttct gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgttgaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cggatgctac ctttgaagca 1980
gagtccgact tggaacgtgc acagaaggca gtgaacgcac tcttcacctc aagcaaccag 2040
atcggattga agacagatgt gacagattac cacatcgacc aagtgagcaa cttggtggat 2100
tgcttgtcag atgagttctg cttggatgag aagcgtgaac tctccgagaa ggtgaagcac 2160
gcaaagcgtc tctcagatga acgtaatctc cttcaagacc ctaactttcg tggtatcaat 2220
cgtcagccag atcgtggatg gcgtggatca acagacatca ccatccaggg aggcgatgat 2280
gtgttcaagg agaactacgt gaccctccca ggaaccgtgg atgaatgcta cccaacctac 2340
ctctaccaga agatcgacga gtcaaagctc aaggcttaca cccgttatga actccgtggc 2400
tacatcgaag atagccagga tctcgaaatc tatctcatcc gttacaatgc taagcacgaa 2460
atcgtgaatg tgccaggaac cggctcactc tggccactct cagcacagtc accaatcggc 2520
aagtgcggcg aacccaatcg ctgcgctcct catctcgaat ggaatcccga tctcgactgc 2580
tcctgccgag acggcgagaa gtgtgcacat cactcacacc acttcaccct cgacatcgac 2640
gtgggctgca ccgacctcaa tgaagacctg ggcgtgtggg tgatcttcaa gatcaagacc 2700
caggacggcc acgcacgact gggcaatctg gagtttctgg aggagaagcc actgcttggc 2760
gaggcactgg cacgagtgaa acgagccgag aagaaatggc gagacaaacg tgagaagctg 2820
caactggaga ccaacatcgt gtacaaagag gccaaagagt cagttgacgc cctgtttgtc 2880
aatagccagt atgaccgact gcaagttgac accaacatcg ccatgatcca cgctgcggac 2940
aagcgcgtcc accgcatccg cgaggcttat ctgcccgagc tgagcgtcat tcccggcgtc 3000
aatgccgcga tcttcgagga gttagagggc cgcatcttca ccgcctacag cctctatgac 3060
gcccgcaatg tcattaagaa tggcgacttc aacaatggct tactatgctg gaatgtcaaa 3120
gggcacgttg acgtcgagga gcagaacaat caccgcagcg tcttagtcat acccgagtgg 3180
gaggccgaag tcagccagga agtccgcgtc tgtccagggc gcgggtacat cctgcgggtc 3240
accgcctaca aagagggata cggcgagggt tgtgtcacca tacacgagat agaggacaat 3300
accgacgaac tcaagttcag caattgtgtc gaggaggaag tctatcccaa caataccgta 3360
acctgcaaca actacaccgg aacccaggag gagtatgaag ggacgtacac ctcgcggaac 3420
cagggctatg acgaagccta tgggaacaac ccgtcggtgc ctgctgacta tgcgtcggtc 3480
tatgaggaga aatcgtacac ggacgggcgg cgggagaatc cgtgtgagtc gaatcgcggg 3540
tatggtgact acacgccgct accggcgggc tatgtaacga aagacctgga atacttcccg 3600
gagacggaca aagtatggat agagataggc gagacggagg gaacgttcat cgtggactcg 3660
gtagagctgc tgctcatgga ggagtga 3687
<210> 45 <211> 1228
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC868_15.
<400> 45
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
35 40 45
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290 295 300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Val Leu Ser Arg Trp Ser Asn Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545 550 555 560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Asp Ala
645 650 655
Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn
660 665 670
Ala Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr
675 680 685
Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp
690 695 700
Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His
705 710 715 720
Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe
725 730 735
Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp
740 745 750
Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr
755 760 765
Leu Pro Gly Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys
770 775 780
Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly
785 790 795 800
Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn
805 810 815
Ala Lys His Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro
820 825 830
Leu Ser Ala Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys
835 840 845
Ala Pro His Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp
850 855 860
Gly Glu Lys Cys Ala His His Ser His His Phe Thr Leu Asp Ile Asp
865 870 875 880
Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe
885 890 895
Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe
900 905 910
Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg
915 920 925
Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr
930 935 940
Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val
945 950 955 960
Asn Ser Gln Tyr Asp Arg Leu Gln Val Asp Thr Asn Ile Ala Met Ile
965 970 975
His Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro
980 985 990
Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu
995 1000 1005
Glu Gly Arg Ile Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn
1010 1015 1020
Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn
1025 1030 1035
Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser
1040 1045 1050
Val Leu Val Ile Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val
1055 1060 1065
Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr
1070 1075 1080
Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu
1085 1090 1095
Asp Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu Glu
1100 1105 1110
Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asn Tyr Thr Gly Thr
1115 1120 1125
Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Gln Gly Tyr
1130 1135 1140
Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala Asp Tyr Ala
1145 1150 1155
Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg Glu Asn
1160 1165 1170
Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu Pro
1175 1180 1185
Ala Gly Tyr Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp
1190 1195 1200
Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val
1205 1210 1215
Asp Ser Val Glu Leu Leu Leu Met Glu Glu 1220 1225
<210> 46 <211> 3600
<212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC868_29, сконструированная для экспрессии в растительной клетке.
<400> 46
atgacgagca accggaagaa cgagaacgag atcatcaacg ccctctcgat ccctgctgtt 60
tcaaaccact ccgcgcagat gaacctgtcc accgacgcgc gcatcgagga ctccctctgc 120
atagccgagg gcaacaacat cgacccattc gtgtcggcca gcacggttca gaccggcatc 180
aacatcgcgg gccgtatcct cggcgtcctc ggtgtcccat tcgccggtca gatcgcgtcc 240
ttctactcgt tccttgtggg cgagctgtgg cctcgcggtc gtgacccgtg ggagatcttc 300
ctggagcatg tggagcagtt gatccggcag caagtcacgg agaacacccg cgatactgct
360
ctggccaggc tacagggcct gggaaactcc tttcgggcat accagtactc actggaggac 420
tggttggaga acagggatga cgcgcgaaca cgctcggtac tctacaccca gtacatcgct 480
ctcgaactcg acttcctgaa cgctatgccg ctgttcgcca tcaggaacca ggaagttcca 540
ctccttatgg tgtacgccca ggccgccaac ttacatctgc tcctgctgcg ggacgccagc 600
ctgttcggct ccgagttcgg actcacatct caagaaatcc agcgttacta cgagcgccaa 660
gtggagaaga cccgtgagta cagtgactac tgcgctcgat ggtacaacac agggctcaac 720
aacctgcgcg gcaccaacgc tgagtcatgg ctccgttaca accagttccg ccgcgacttg 780
actttgggtg tcctagacct ggtggcgcta ttcccgtctt acgacacacg ggtgtaccca 840
atgaacacta gcgcgcaact cacgcgggag atctacacag acccaatcgg ccggacgaac 900
gcaccctccg gtttcgcatc cacgaattgg ttcaacaaca acgcaccctc cttctcggca 960
atcgaggccg ccgtcatccg ccctcctcac ctgctcgact ttcccgagca gctcacgatc 1020
ttctcccagc tctcacgctg gtcccacaca cagtacatga actactgggt cgggcaccga 1080
ttggagagta ggacgatccg tggcagcttg agcaccagta cccacggcaa caccaacacc 1140
tccatcaacc cagttacgct acagttcacg agccgcgacg tttaccggac tgagtcgttc 1200
gcgggcatta acatccttct gacaacgccc gtcaacggcg tcccgtgggc ccggttcaac 1260
tggcgtaacc cgttgaactc cctgcgcggg tcattgctct acaccatcgg gtacacgggc 1320
gtcggcaccc agctcttcga cagtgaaact gagctgccgc ccgagaccac ggaacgcccg 1380
aactacgagt cctacagcca ccgcctgtcc aacatccggc tcatctctgg caacacgctg 1440
cgtgcgccgg tgtactcctg gacacaccgc agcgccgacc ggaccaacac gatctcttcc 1500
gactccatta accagatccc gctcgtgaag ggcttccgtg tgtggggtgg cacgagcgtc 1560
atcaccggtc cgggcttcac cggtggagac atactgcggc gcaacacttt cggcgacttc 1620
gtttcgttgc aagtgaacat caactcgccg atcacccagc gttaccgtct gaggttccgc 1680
tacgcttcaa gccgcgacgc gagggtcatt gtcctgaccg gagccgcgtc cacaggcgtg 1740
ggaggccaag tctcagtcaa catgcctctc cagaagacga tggagatagg cgagaacttg 1800
actagccgaa ccttccggta cactgatttc tcgaaccctt tctcattcag agcgaaccct 1860
gacatcattg ggatctccga gcaaccgctg ttcggtgctg gctccatcag ctctggcgaa 1920
ctgtacatcg acaagattga gatcatcctg gcggatgcga cgttcgaggc cgagtctgac 1980
ctggagcggg ctcagaaggc tgtcaacgaa ctgttcacca gcagcaacca gattgggctc 2040
aagaccgacg tcacggacta tcacattgac caagtgtcca accttgtgga gtgcctgtcc 2100
gacgagttct gcctcgacga gaagaaggag ctgtccgaga aggtcaaaca cgcgaagcgt 2160
ctgagtgacg agcggaattt gctccaggac ccgaacttcc gtggcatcaa ccgccagctc 2220
gaccgtggtt ggcgcgggag tacagacatc accatccagg gaggcgacga tgtgttcaag 2280
gagaactatg tgacgctgct cgggactttc gacgaatgct acccgacgta tctctaccag 2340
aagatagacg agagtaaatt gaaggcgtac acccgctacc agcttcgcgg gtacatcgag 2400
gatagtcagg acctggaaat ctacctgatc cgatacaacg ccaagcacga gacagtgaac 2460
gtgccaggca cgggctcact ttggccattg agcgctccct ctccaatcgg aaagtgcgct 2520
caccactcgc accacttctc tctggacatc gacgtgggct gcaccgacct caacgaggac 2580
ctgggtgtct gggttatctt caagattaag acccaggacg gacatgcccg cctcggcaac 2640
ctggagttcc ttgaggagaa gcctctcgtg ggcgaggccc tcgctcgtgt gaagcgcgcc 2700
gagaagaaat ggcgagacaa gcgggagaag ctggagtggg agaccaacat cgtgtacaag 2760
gaggccaagg agtcagtgga cgcactcttc gtcaacagcc agtacgaccg cctccaggct 2820
gacaccaaca tcgccatgat ccacgcggct gacaagcggg tccacagcat ccgtgaggcg 2880
tacctgcccg agctgtcagt gatccctggt gtgaacgcgg cgatcttcga ggaactggag 2940
ggccgcatct tcacagcatt cagcctgtac gatgccagga atgttattaa gaacggtgac 3000
ttcaacaacg ggctgagttg ctggaacgtc aagggccatg tggacgtcga ggagcagaac 3060
aaccaccggt ccgtgctggt cgtgccggag tgggaggcag aggtgagcca ggaggtccgc 3120
gtctgccctg gtcgcggcta catcctccgt gtgactgcgt acaaggaagg ctacggtgaa 3180
ggctgcgtga ctatccacga gatcgagaac aacaccgacg agctcaagtt ctcgaactgt 3240
gtggaggagg aggtgtaccc gaacaacacc gttacttgca acgactacac tgccacgcaa 3300
gaggagtacg agggcactta cacttcccgg aatcgcggct atgatggcgc gtacgagtcc 3360
aacagcagcg tgcctgcgga ttatgcgtcc gcttacgagg agaaggcgta caccgacgga 3420
cggagggaca acccttgcga gtccaaccgt ggctacggtg actacactcc gctgcccgcc 3480
gggtacgtca ccaaggagct ggagtacttc ccggagaccg acaaagtctg gatcgagatc 3540
ggcgagacgg agggcacttt catcgtggac tcggtcgagc tgctactgat ggaggagtga 3600
<210> 47 <211> 1199
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность варианта химерного белка TIC868_29.
<400> 47
Met Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser
1 5 10 15
Ile Pro Ala Val Ser Asn His Ser Ala Gln Met Asn Leu Ser Thr Asp
20 25 30
Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asp
Pro Phe Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly
50 55 60
Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser
65 70 75 80
Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Pro
85 90 95
Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Arg Gln Gln Val
100 105 110
Thr Glu Asn Thr Arg Asp Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly
115 120 125
Asn Ser Phe Arg Ala Tyr Gln Tyr Ser Leu Glu Asp Trp Leu Glu Asn
130 135 140
Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala
145 150 155 160
Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn
165 170 175
Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190
Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu
195 200 205
Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Lys Thr
210 215 220
Arg Glu Tyr Ser Asp Tyr Cys Ala Arg Trp Tyr Asn Thr Gly Leu Asn
225 230 235 240
Asn Leu Arg Gly Thr Asn Ala Glu Ser Trp Leu Arg Tyr Asn Gln Phe
245 250 255
Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro
260 265 270
Ser Tyr Asp Thr Arg Val Tyr Pro Met Asn Thr Ser Ala Gln Leu Thr
275 280 285
Arg Glu Ile Tyr Thr Asp Pro Ile Gly Arg Thr Asn Ala Pro Ser Gly
290
295
300
Phe Ala Ser Thr Asn Trp Phe Asn Asn Asn Ala Pro Ser Phe Ser Ala
305 310 315 320
Ile Glu Ala Ala Val Ile Arg Pro Pro His Leu Leu Asp Phe Pro Glu
325 330 335
Gln Leu Thr Ile Phe Ser Gln Leu Ser Arg Trp Ser His Thr Gln Tyr
340 345 350
Met Asn Tyr Trp Val Gly His Arg Leu Glu Ser Arg Thr Ile Arg Gly
355 360 365
Ser Leu Ser Thr Ser Thr His Gly Asn Thr Asn Thr Ser Ile Asn Pro
370 375 380
Val Thr Leu Gln Phe Thr Ser Arg Asp Val Tyr Arg Thr Glu Ser Phe
385 390 395 400
Ala Gly Ile Asn Ile Leu Leu Thr Thr Pro Val Asn Gly Val Pro Trp
405 410 415
Ala Arg Phe Asn Trp Arg Asn Pro Leu Asn Ser Leu Arg Gly Ser Leu
420 425 430
Leu Tyr Thr Ile Gly Tyr Thr Gly Val Gly Thr Gln Leu Phe Asp Ser
435 440 445
Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu Ser
450 455 460
Tyr Ser His Arg Leu Ser Asn Ile Arg Leu Ile Ser Gly Asn Thr Leu
465 470 475 480
Arg Ala Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr Asn
485 490 495
Thr Ile Ser Ser Asp Ser Ile Asn Gln Ile Pro Leu Val Lys Gly Phe
500 505 510
Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
515 520 525
Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
530 535 540
Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
545
550
555
560
Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
565 570 575
Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys
580 585 590
Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
595 600 605
Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
610 615 620
Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
625 630 635 640
Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
645 650 655
Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Glu Leu Phe
660 665 670
Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
675 680 685
Ile Asp Gln Val Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys
690 695 700
Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
705 710 715 720
Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
725 730 735
Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile
740 745 750
Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Leu Gly
755 760 765
Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
770 775 780
Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
785 790 795 800
Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
805
810
815
Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala
820 825 830
Pro Ser Pro Ile Gly Lys Cys Ala His His Ser His His Phe Ser Leu
835 840 845
Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp
850 855 860
Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn
865 870 875 880
Leu Glu Phe Leu Glu Glu Lys Pro Leu Val Gly Glu Ala Leu Ala Arg
885 890 895
Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu
900 905 910
Trp Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala
915 920 925
Leu Phe Val Asn Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile
930 935 940
Ala Met Ile His Ala Ala Asp Lys Arg Val His Ser Ile Arg Glu Ala
945 950 955 960
Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala Ile Phe
965 970 975
Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala
980 985 990
Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp
995 1000 1005
Asn Val Lys Gly His Val Asp Val Glu Glu Gln Asn Asn His Arg
1010 1015 1020
Ser Val Leu Val Val Pro Glu Trp Glu Ala Glu Val Ser Gln Glu
1025 1030 1035
Val Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala
1040 1045 1050
Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile
1055 1060 1065
Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn Cys Val Glu Glu
1070 1075 1080
Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn Asp Tyr Thr Ala
1085 1090 1095
Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg Asn Arg Gly
1100 1105 1110
Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala Asp Tyr
1115 1120 1125
Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg Asp
1130 1135 1140
Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1145 1150 1155
Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr
1160 1165 1170
Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile
1175 1180 1185
Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu 1190 1195
<210> 48 <211> 3432
<212> ДНК
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC869, используемые для экспрессии в бактериальной клетке.
<400> 48
atggagataa ataatcagaa gcaatgcata ccatataatt gcttaagtaa tcctgaggaa 60
gtacttttgg atggggagag gatattacct gatatcgatc cactcgaagt ttctttgtcg 120
cttttgcaat ttcttttgaa taactttgtt ccagggggag gctttatttc aggattagtt 180
gataaaatat ggggggcttt gagaccatct gaatgggact tatttcttgc acagattgaa 240
cggttgattg atcaaagaat agaagcaaca gtaagagcaa aagcaatcac tgaattagaa 300
ggattaggga gaaattatca aatatacgct gaagcattta aagaatggga atcagatcct 360
gataacgaag cggctaaaag tagagtaatt gatcgctttc gtatacttga tggtctaatt 420
gaagcaaata tcccttcatt tcggataatt ggatttgaag tgccactttt atcggtttat
480
gttcaagcag ctaatctaca tctcgctcta ttgagagatt ctgttatttt tggagagaga 540
tggggattga cgacaaaaaa tgtcaatgat atctataata gacaaattag agaaattcat 600
gaatatagca atcattgcgt agatacgtat aacacagaac tagaacgtct agggtttaga 660
tctatagcgc agtggagaat atataatcag tttagaagag aactaacact aactgtatta 720
gatattgtcg ctcttttccc gaactatgac agtagactgt atccgatcca aactttttct 780
caattgacaa gagaaattgt tacatcccca gtaagcgaat tttattatgg tgttattaat 840
agtggtaata taattggtac tcttactgaa cagcagataa ggcgaccaca tcttatggac 900
ttctttaact ccatgatcat gtatacatca gataatagac gggaacatta ttggtcagga 960
cttgaaatga cggcttattt tacaggattt gcaggagctc aagtgtcatt ccctttagtc 1020
gggactagag gggagtcagc tccaccatta actgttagaa gtgttaatga tggaatttat 1080
agaatattat cggcaccgtt ttattcagcg ccttttctag gcaccattgt attgggaagt 1140
cgtggagaaa aatttgattt tgcgcttaat aatatttcac ctccgccatc tacaatatac 1200
agacatcctg gaacagtaga ttcactagtc agtataccgc cacaggataa tagcgtacca 1260
ccgcacaggg gatctagtca tcgattaagt catgttacaa tgcgcgcaag ttcccctata 1320
ttccattgga cgcatcgcag cgcaaccact acaaatacaa ttaatccaaa tgctattatc 1380
caaataccac tagtaaaagc atttaacctt cattcaggtg ccactgttgt tagaggacca 1440
gggtttacag gtggagatct cttacgaaga acgaatactg gtacatttgc agacataaga 1500
gtcaatgttc cttcatcact attttcccaa agatatcgcg taaggattcg ttatgcttct 1560
actaccgatt tacaattttt cacgagaatt aatggaactt ctgttaatca aggtaatttc 1620
tcaaaaacga tggatagagg ggataaactg aaatctgaaa actttagaac tgccggattt 1680
agtactcctt ttagattttc aaattttcaa agtacattca cgttgggtac tcaggctttt 1740
tcaaatcagg aagtttatat agatagaatt gaatttgtcc cggcagaagt aacattcgag 1800
gcagaatctg atttagaaag agcacaaaag gcggtgaatg agctgtttac ttcttccaat 1860
caaatcgggt taaaaacaga tgtgacggat tatcatattg atcaagtatc caatttagtt 1920
gagtgtttat ctgatgaatt ttgtctggat gaaaaaaaag aattgtccga gaaagtcaaa 1980
catgcgaagc gacttagtga tgagcggaat ttacttcaag atccaaactt tagagggatc 2040
aatagacaac tagaccgtgg ctggagagga agtacggata ttaccatcca aggaggcgat 2100
gacgtattca aagagaatta cgttacgcta ttgggtacct ttgatgagtg ctatccaacg 2160
tatttatatc aaaaaataga tgagtcgaaa ttaaaagcct atacccgtta ccaattaaga 2220
gggtatatcg aagatagtca agacttagaa atctatttaa ttcgctacaa tgccaaacac 2280
gaaacagtaa atgtgccagg tacgggttcc ttatggccgc tttcagcccc aagtccaatc 2340
ggaaaatgtg cccatcattc ccatcatttc tccttggaca ttgatgttgg atgtacagac 2400
ttaaatgagg acttaggtgt atgggtgata ttcaagatta agacgcaaga tggccatgca 2460
agactaggaa atctagaatt tctcgaagag aaaccattag taggagaagc actagctcgt 2520
gtgaaaagag cggagaaaaa atggagagac aaacgtgaaa aattggaatg ggaaacaaat 2580
attgtttata aagaggcaaa agaatctgta gatgctttat ttgtaaactc tcaatatgat 2640
agattacaag cggataccaa catcgcgatg attcatgcgg cagataaacg cgttcatagc 2700
attcgagaag cttatctgcc tgagctgtct gtgattccgg gtgtcaatgc ggctattttt 2760
gaagaattag aagggcgtat tttcactgca ttctccctat atgatgcgag aaatgtcatt 2820
aaaaatggtg attttaataa tggcttatcc tgctggaacg tgaaagggca tgtagatgta 2880
gaagaacaaa acaaccaccg ttcggtcctt gttgttccgg aatgggaagc agaagtgtca 2940
caagaagttc gtgtctgtcc gggtcgtggc tatatccttc gtgtcacagc gtacaaggag 3000
ggatatggag aaggttgcgt aaccattcat gagatcgaga acaatacaga cgaactgaag 3060
tttagcaact gtgtagaaga ggaagtatat ccaaacaaca cggtaacgtg taatgattat 3120
actgcgactc aagaagaata tgagggtacg tacacttctc gtaatcgagg atatgacgga 3180
gcctatgaaa gcaattcttc tgtaccagct gattatgcat cagcctatga agaaaaagca 3240
tatacagatg gacgaagaga caatccttgt gaatctaaca gaggatatgg ggattacaca 3300
ccactaccag ctggctatgt gacaaaagaa ttagagtact tcccagaaac cgataaggta 3360
tggattgaga tcggagaaac ggaaggaaca ttcatcgtgg acagcgtgga attacttctt 3420
atggaggaat ag 3432
<210> 49 <211> 3432 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC869, сконструированная для экспрессии в растительной клетке.
<400> 49
atggagataa acaaccagaa gcagtgcatt ccgtacaact gcctcagcaa cccggaggag 60
gtgctgctgg acggcgagcg tatcctccca gacatcgacc cactggaggt cagcctgagc 120
ctcctccagt tcctcctcaa taacttcgtg ccaggcggcg gcttcatctc cggcctggtg 180
gacaagatct ggggcgcact ccggccaagt gagtgggatc tgttcctggc ccaaatcgag 240
cgcctgatcg accagaggat cgaggcgacg gtccgcgcca aggcgataac cgagctggag 300
ggcctcggtc gcaactacca gatctacgca gaggcgttca aggagtggga gagcgacccg 360
gacaacgagg cggccaagtc tcgggtgatt gaccgcttcc gcatcctcga cggcctcatc 420
gaagccaaca tcccttcctt ccggatcata ggcttcgaag tcccgctcct cagcgtgtac 480
gtgcaagcgg ccaatctcca cctcgcgttg ctccgtgaca gcgtcatctt tggcgagaga 540
tggggcctga cgacgaagaa cgtgaacgac atctacaaca ggcagatccg agagattcac 600
gagtacagca accactgcgt ggacacatac aacacggagc tggagcggct cggcttccgc 660
tcaatcgctc agtggcggat ctacaaccag ttccgccgcg agctgaccct caccgtgctc 720
gacatcgtcg cattgtttcc caattacgac tcacgcctct acccaatcca gactttcagc 780
cagctcacac gcgagattgt gaccagcccg gtgtcagagt tctactacgg cgtcatcaac 840
tcaggcaaca tcatcgggac actgactgaa cagcagatca gacgtccgca cttgatggac 900
ttcttcaact ccatgattat gtacacatca gacaacagga gagagcacta ctggtccggg 960
ttggagatga ctgcttactt caccggcttc gccggtgccc aagtgagctt cccactggtc 1020
ggaactcgtg gcgagtcagc tcctccgcta actgtgcgat ctgtcaacga cgggatctac 1080
agaatactgt cggctccctt ctacagtgcg ccgttcctcg gcaccatcgt cctcggctca 1140
cgtggtgaga agttcgactt cgcactgaac aacattagcc cgccgcctag tacaatctac 1200
aggcaccctg gcaccgtgga ctcactggtt tcgatcccgc cacaagacaa cagtgtgccg 1260
ccacatcgtg gttctagcca caggctctcc catgtgacca tgcgcgcctc ttcaccgatc 1320
tttcactgga cccatcggtc cgctacaacc acaaacacca tcaaccctaa cgccatcatc 1380
caaatcccgc tggtgaaggc gtttaacctc cacagcggcg caactgtcgt gcgcggccct 1440
ggattcaccg gtggtgacct gctccgtcgg accaatactg gcacgttcgc agacatccga 1500
gtgaacgtcc cgtcctcgct gttcagtcag cgctaccgtg tccgcattcg gtacgcttcc 1560
accacggatc tccagttctt tactcgcatc aatgggacga gcgtcaacca gggcaacttc 1620
agcaagacga tggaccgtgg agataagctc aagtccgaga acttccgcac ggctggcttc 1680
tcgacaccgt tcagattcag caacttccag agcactttca cgctgggcac acaggcgttc 1740
tccaaccagg aggtgtacat cgaccgcatc gagttcgtgc ctgctgaggt taccttcgag 1800
gcggaaagcg acctcgaaag ggcccagaag gccgtcaacg agctgttcac ctccagcaac 1860
cagatcggtc tcaagaccga cgtcactgac tatcacattg accaagtcag caacctggtg 1920
gagtgcctca gtgatgagtt ctgcctggat gagaagaagg agcttagcga gaaggtcaag 1980
cacgcaaagc gcttgagcga cgagcgcaac cttctccagg acccgaattt ccgtggtatc 2040
aatagacagc ttgaccgtgg gtggcgcggt agtaccgaca taaccatcca gggtggcgac 2100
gatgtgttca aggagaatta tgttacgctg ctcggtacgt tcgacgagtg ctatcccacg 2160
tacttgtacc agaagattga cgagagcaag ctcaaggcgt acacccgtta ccagctccgt 2220
ggctacatcg aggacagcca ggatctggaa atctacctta tccgatacaa tgctaagcac 2280
gagacagtca acgtgcccgg aacagggtcg ctctggccgc tcagtgctcc gtcgcccatt 2340
ggcaagtgcg cgcaccattc gcatcacttc tcacttgaca ttgacgtggg ctgcaccgac 2400
ctgaacgagg atctgggtgt ctgggtcatc ttcaagatca agacccaaga cggccacgcg 2460
cgcctcggga acctggagtt cctggaggag aagcctttgg taggtgaagc cctggcccgc 2520
gtcaagcgcg cggagaagaa gtggcgcgac aagagggaga agctggaatg ggagaccaac 2580
atcgtgtaca aggaggcgaa ggagtcggtg gacgcactat tcgtgaactc ccagtacgac 2640
cgtctccagg ccgacaccaa catcgccatg atccacgccg ctgacaaacg agttcattcc 2700
attcgtgaag cctatcttcc cgagctgtct gtcataccgg gcgtcaacgc ggccatcttc 2760
gaggagttag agggtcggat ctttacagct ttctcactgt acgatgcccg caacgtcatc 2820
aagaacggcg acttcaacaa cggtctctcc tgttggaacg tgaagggcca cgtggatgtc 2880
gaggagcaga acaaccaccg ctctgtgctt gtggtgcccg agtgggaggc cgaggtgagc 2940
caggaggtcc gcgtctgtcc gggtcgcggc tacatcctgc gggtcaccgc ctacaaggag 3000
ggctacggcg aaggctgcgt tactattcac gagattgaga acaataccga cgaactcaag 3060
ttctccaact gtgtcgagga ggaggtgtac ccgaacaaca ccgtgacgtg caacgactac 3120
accgcgacac aggaggaata cgagggcacc tacaccagcc gcaaccgagg ctacgacgga 3180
gcgtacgaga gcaactcgtc cgtgcccgct gattacgcga gtgcgtacga ggagaaggct 3240
tacaccgacg gacggcgcga caatccctgc gagagtaacc gtggatacgg agattacacg 3300
ccgctacccg ctggctacgt cactaaggaa ctggagtact tcccagagac ggacaaggtg 3360
tggatcgaaa tcggcgagac agagggcacg ttcatcgtgg actccgtgga gctgctgctg 3420
atggaggagt ga 3432
<210> 50 <211> 1143
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность химерного белка TIC869.
<400> 50
Met Glu Ile Asn Asn Gln Lys Gln Cys Ile Pro Tyr Asn Cys Leu Ser
1 5 10 15
Asn Pro Glu Glu Val Leu Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile
20 25 30
Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn
35 40 45
Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Val Asp Lys Ile Trp
50 55 60
Gly Ala Leu Arg Pro Ser Glu Trp Asp Leu Phe Leu Ala Gln Ile Glu
Arg Leu Ile Asp Gln Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile
85 90 95
Thr Glu Leu Glu Gly Leu Gly Arg Asn Tyr Gln Ile Tyr Ala Glu Ala
100 105 110
Phe Lys Glu Trp Glu Ser Asp Pro Asp Asn Glu Ala Ala Lys Ser Arg
115 120 125
Val Ile Asp Arg Phe Arg Ile Leu Asp Gly Leu Ile Glu Ala Asn Ile
130 135 140
Pro Ser Phe Arg Ile Ile Gly Phe Glu Val Pro Leu Leu Ser Val Tyr
145 150 155 160
Val Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Ile
165 170 175
Phe Gly Glu Arg Trp Gly Leu Thr Thr Lys Asn Val Asn Asp Ile Tyr
180 185 190
Asn Arg Gln Ile Arg Glu Ile His Glu Tyr Ser Asn His Cys Val Asp
195 200 205
Thr Tyr Asn Thr Glu Leu Glu Arg Leu Gly Phe Arg Ser Ile Ala Gln
210 215 220
Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu
225 230 235 240
Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ser Arg Leu Tyr Pro Ile
245 250 255
Gln Thr Phe Ser Gln Leu Thr Arg Glu Ile Val Thr Ser Pro Val Ser
260 265 270
Glu Phe Tyr Tyr Gly Val Ile Asn Ser Gly Asn Ile Ile Gly Thr Leu
275 280 285
Thr Glu Gln Gln Ile Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser
290 295 300
Met Ile Met Tyr Thr Ser Asp Asn Arg Arg Glu His Tyr Trp Ser Gly
305 310 315 320
Leu Glu Met Thr Ala Tyr Phe Thr Gly Phe Ala Gly Ala Gln Val Ser
325 330 335
Phe Pro Leu Val Gly Thr Arg Gly Glu Ser Ala Pro Pro Leu Thr Val
340 345 350
Arg Ser Val Asn Asp Gly Ile Tyr Arg Ile Leu Ser Ala Pro Phe Tyr
355 360 365
Ser Ala Pro Phe Leu Gly Thr Ile Val Leu Gly Ser Arg Gly Glu Lys
370 375 380
Phe Asp Phe Ala Leu Asn Asn Ile Ser Pro Pro Pro Ser Thr Ile Tyr
385 390 395 400
Arg His Pro Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp
405 410 415
Asn Ser Val Pro Pro His Arg Gly Ser Ser His Arg Leu Ser His Val
420 425 430
Thr Met Arg Ala Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala
435 440 445
Thr Thr Thr Asn Thr Ile Asn Pro Asn Ala Ile Ile Gln Ile Pro Leu
450 455 460
Val Lys Ala Phe Asn Leu His Ser Gly Ala Thr Val Val Arg Gly Pro
465 470 475 480
Gly Phe Thr Gly Gly Asp Leu Leu Arg Arg Thr Asn Thr Gly Thr Phe
485 490 495
Ala Asp Ile Arg Val Asn Val Pro Ser Ser Leu Phe Ser Gln Arg Tyr
500 505 510
Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Gln Phe Phe Thr
515 520 525
Arg Ile Asn Gly Thr Ser Val Asn Gln Gly Asn Phe Ser Lys Thr Met
530 535 540
Asp Arg Gly Asp Lys Leu Lys Ser Glu Asn Phe Arg Thr Ala Gly Phe
545 550 555 560
Ser Thr Pro Phe Arg Phe Ser Asn Phe Gln Ser Thr Phe Thr Leu Gly
565 570 575
Thr Gln Ala Phe Ser Asn Gln Glu Val Tyr Ile Asp Arg Ile Glu Phe
580
585
590
Val Pro Ala Glu Val Thr Phe Glu Ala Glu Ser Asp Leu Glu Arg Ala
595 600 605
Gln Lys Ala Val Asn Glu Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu
610 615 620
Lys Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val
625 630 635 640
Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Lys Glu Leu Ser
645 650 655
Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu
660 665 670
Gln Asp Pro Asn Phe Arg Gly Ile Asn Arg Gln Leu Asp Arg Gly Trp
675 680 685
Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys
690 695 700
Glu Asn Tyr Val Thr Leu Leu Gly Thr Phe Asp Glu Cys Tyr Pro Thr
705 710 715 720
Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg
725 730 735
Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr
740 745 750
Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val Asn Val Pro Gly Thr
755 760 765
Gly Ser Leu Trp Pro Leu Ser Ala Pro Ser Pro Ile Gly Lys Cys Ala
770 775 780
His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp
785 790 795 800
Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln
805 810 815
Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro
820 825 830
Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp
835
840
845
Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys
850 855 860
Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp
865 870 875 880
Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys
885 890 895
Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile
900 905 910
Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe
915 920 925
Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp
930 935 940
Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Asp Val
945 950 955 960
Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu Trp Glu
965 970 975
Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile
980 985 990
Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val Thr
995 1000 1005
Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser Asn
1010 1015 1020
Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1025 1030 1035
Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser
1040 1045 1050
Arg Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val
1055 1060 1065
Pro Ala Asp Tyr Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp
1070 1075 1080
Gly Arg Arg Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp
1085 1090 1095
Tyr Thr Pro Leu Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr
1100 1105 1110
Phe Pro Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu
1115 1120 1125
Gly Thr Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1130 1135 1140
<210> 51 <211> 3513
<212> ДНК
<213> Искусственная
<220>
<223> Рекомбинантная нуклеотидная последовательность, кодирующая TIC836, используемая для экспрессии в бактериальной клетке.
<400> 51
atggagaata atattcaaaa tcaatgcgta ccttacaatt gtttaaataa tcctgaagta 60
gaaatattaa atgaagaaag aagtactggc agattaccgt tagatatatc cttatcgctt 120
acacgtttcc ttttgagtga atttgttcca ggtgtgggag ttgcgtttgg attatttgat 180
ttaatatggg gttttataac tccttctgat tggagcttat ttcttttaca gattgaacaa 240
ttgattgagc aaagaataga aacattggaa aggaaccggg caattactac attacgaggg 300
ttagcagata gctatgaaat ttatattgaa gcactaagag agtgggaagc aaatcctaat 360
aatgcacaat taagggaaga tgtgcgtatt cgatttgcta atacagacga cgctttaata 420
acagcaataa ataattttac acttacaagt tttgaaatcc ctcttttatc ggtctatgtt 480
caagcggcga atttacattt atcactatta agagacgctg tatcgtttgg gcagggttgg 540
ggactggata tagctactgt taataatcat tataatagat taataaatct tattcataga 600
tatacgaaac attgtttgga cacatacaat caaggattag aaaacttaag aggtactaat 660
actcgacaat gggcaagatt caatcagttt aggagagatt taacacttac tgtattagat 720
atcgttgctc tttttccgaa ctacgatgtt agaacatatc caattcaaac gtcatcccaa 780
ttaacaaggg aaatttatac aagttcagta attgaggatt ctccagtttc tgctaatata 840
cctaatggtt ttaatagggc ggaatttgga gttagaccgc cccatcttat ggactttatg 900
aattctttgt ttgtaactgc agagactgtt agaagtcaaa ctgtgtgggg aggacactta 960
gttagttcac gaaatacggc tggtaaccgt ataaatttcc ctagttacgg ggtcttcaat 1020
cctggtggcg ccatttggat tgcagatgag gatccacgtc ctttttatcg gacattatca 1080
gatcctgttt ttgtccgagg aggatttggg aatcctcatt atgtactggg gcttagggga 1140
gtagcatttc aacaaactgg tacgaaccac acccgaacat ttagaaatag tgggaccata 1200
gattctctag atgaaatccc acctcaggat aatagtgggg caccttggaa tgattatagt 1260
catgtattaa atcatgttac atttgtacga tggccaggtg agatttcagg aagtgattca 1320
tggagagctc caatgttttc ttggacgcac cgtagtgcaa cccctacaaa tacaattgat 1380
ccggagagga ttacacaaat acctttaaca aaatctacta atcttggctc tggaacttct 1440
gtcgttaaag gaccaggatt tacaggagga gatattcttc gaagaacttc acctggccag 1500
atttcaacct taagagtaaa tattactgca ccattatcac aaagatatcg ggtaagaatt 1560
cgctacgctt ctaccacaaa tttacaattc catacatcaa ttgacggaag acctattaat 1620
caggggaatt tttcagcaac tatgagtagt gggagtaatt tacagtccgg aagctttagg 1680
actgtaggtt ttactactcc gtttaacttt tcaaatggat caagtgtatt tacgttaagt 1740
gctcatgtct tcaattcagg caatgaagtt tatatagatc gaattgaatt tgttccggca 1800
gaagtaacct ttgaggcaga atatgattta gaaagagcgc agaaggcggt gaatgcgctg 1860
tttacgtcta caaaccaact agggctaaaa acaaatgtaa cggattatca tattgatcaa 1920
gtgtccaatt tagttacgta tttatcggat gaattttgtc tggatgaaaa gcgagaattg 1980
tccgagaaag tcaaacatgc gaagcgactc agtgatgaac gcaatttact ccaagattca 2040
aatttcaaag acattaatag gcaaccagaa cgtgggtggg gcggaagtac agggattacc 2100
atccaaggag gggatgacgt atttaaagaa aattacgtca cactatcagg tacctttgat 2160
gagtgctatc caacatattt gtatcaaaaa atcgatgaat caaaattaaa agcctttacc 2220
cgttatcaat taagagggta tatcgaagat agtcaagact tagaaatcta tttaattcgc 2280
tacaatgcaa aacatgaaac agtaaatgtg ccaggtacgg gttccttatg gccgctttca 2340
gcccaaagtc caatcggaaa gtgtggagag ccgaatcgat gcgcgccaca ccttgaatgg 2400
aatcctgact tagattgttc gtgtagggat ggagaaaagt gtgcccatca ttcgcatcat 2460
ttctccttag acattgatgt aggatgtaca gacttaaatg aggacctagg tgtatgggtg 2520
atctttaaga ttaagacgca agatgggcac gcaagactag ggaatctaga gtttctcgaa 2580
gaaaaaccat tagtaggaga agcgctagct cgtgtgaaaa gagcggagaa aaaatggaga 2640
gacaaacgtg aaaaattgga atgggaaaca aatatcgttt ataaagaggc aaaagaatct 2700
gtagatgctt tatttgtaaa ctctcaatat gatcaattac aagcggatac gaatattgcc 2760
atgattcatg cggcagataa acgtgttcat agcattcgag aagcttatct gcctgagctg 2820
tctgtgattc cgggtgtcaa tgcggctatt tttgaagaat tagaagggcg tattttcact 2880
gcattctccc tatatgatgc gagaaatgtc attaaaaatg gtgattttaa taatggctta 2940
tcctgctgga acgtgaaagg gcatgtagat gtagaagaac aaaacaacca acgttcggtc 3000
cttgttgttc cggaatggga agcagaagtg tcacaagaag ttcgtgtctg tccgggtcgt 3060
ggctatatcc ttcgtgtcac agcgtacaag gagggatatg gagaaggttg cgtaaccatt 3120
catgagatcg agaacaatac agacgaactg aagtttagca actgcgtaga ggaggaaatc 3180
tatccaaata acacggtaac gtgtaatgat tatactgtaa atcaagaaga atacggaggt 3240
gcgtacactt ctcgtaatcg aggatataac gaagctcctt ccgtaccagc tgattatgcg 3300
tcagtctatg aagaaaaatc gtatacagat ggacgtagag agaatccttg tgaatttaac 3360
agagggtata gggattacac gccactacca gttggttatg tgacaaaaga attagaatac 3420
ttcccagaaa ccgataaggt atggattgag attggagaaa cggaaggaac atttatcgtg 3480
gacagcgtgg aattactcct tatggaggaa taa 3513
<210> 52 <211> 3513 <212> ДНК
<213> Искусственная
<220>
<223> Синтетическая нуклеотидная последовательность, кодирующая TIC836, сконструированная для экспрессии в растительной клетке.
<400> 52
atggagaaca acatccagaa ccagtgcgtg ccctacaact gcctgaacaa ccctgaggtt 60
gagatcctga acgaggagcg tagcaccggt aggctcccgc tagacatctc cctgagcctg 120
acccgcttcc tccttagtga gttcgtgccc ggcgtgggcg tggccttcgg cctcttcgac 180
ctcatctggg gcttcatcac tccttccgac tggtccctct tcctccttca gattgagcaa 240
ctgatcgagc agcgcatcga gacccttgag cgcaaccgcg ccatcaccac tctcagaggt 300
ctcgccgact cctacgaaat ctacatcgag gcactccgtg agtgggaggc caacccgaac 360
aatgcccagc tccgcgagga cgtgaggatc agattcgcca acaccgacga tgccctcatc 420
accgccatca acaatttcac cctcacctcc ttcgagatcc ctcttctgtc tgtgtacgtt 480
caagctgcta accttcacct ttccctcctg cgcgacgccg tgagcttcgg ccagggctgg 540
ggcctcgaca tcgccaccgt gaacaatcac tacaaccgcc tcatcaacct catccaccgc 600
tacaccaagc actgccttga cacctacaac cagggccttg agaacctccg tggcaccaac 660
acccgccagt gggcccgctt caaccagttc cgcagagacc tcaccctcac cgtgctcgac 720
atcgtggcac tcttcccaaa ctacgacgtg cgtacctacc ctatccagac ctccagccag 780
ctcaccaggg aaatctacac ctccagcgtg atcgaggact ctcctgtgtc cgccaacatc 840
cctaacggct tcaaccgcgc cgagttcggc gtgcgccctc ctcacctcat ggacttcatg 900
aactccctct tcgtcactgc cgagaccgtg cgctcccaga ccgtgtgggg cggtcacctc 960
gtgtccagcc gtaacaccgc tggcaacagg atcaacttcc cgtcctacgg cgtgttcaac 1020
ccaggcggtg ccatctggat cgccgatgaa gaccctcgtc ctttctaccg taccctgtcc 1080
gaccctgtgt tcgtgcgtgg cggtttcggc aaccctcact acgtgctggg cctgcgtggc 1140
gtggccttcc agcaaaccgg caccaaccac accaggacgt tccgtaactc cggcaccatc 1200
gacagtcttg acgagatccc tccgcaagac aactccggtg caccttggaa cgactactcc 1260
cacgtgctga accacgtgac cttcgtgagg tggcctggcg aaatctccgg ctccgactcc 1320
tggagggctc ctatgttcag ttggacccac aggagcgcta cgcctaccaa caccatcgac 1380
cctgagcgta tcactcagat ccctctgact aagagcacta acctgggcag cggcactagc 1440
gtggtcaagg gccctggctt cactggcggt gacatcctga ggcggactag ccctggccag 1500
atcagcactc tgagggtgaa catcactgct ccgctgagcc agcgttacag ggtcagaatc 1560
cgttacgctt ctactactaa ccttcagttc cacactagca tcgacggccg tccgatcaac 1620
cagggcaact tctctgctac tatgagttct ggcagtaacc tccagtctgg tagtttccgg 1680
actgtcggtt tcactacgcc gttcaacttc tccaacggta gttctgtctt cactctgtct 1740
gctcacgtgt tcaactctgg caacgaggtg tacatcgacc ggatcgagtt cgtccctgct 1800
gaggtgacgt tcgaggccga gtacgacctg gagcgggctc agaaggctgt caacgctctg 1860
ttcacttcta ctaaccagct tggtttgaag actaacgtga ccgactacca cattgatcaa 1920
gtcagtaacc tggtcacgta cctgtctgac gagttctgtc ttgacgagaa gcgggagctg 1980
tctgagaagg tcaagcacgc taagcggctg tctgacgagc ggaacctgct tcaagacagt 2040
aacttcaagg acattaaccg ccagcctgag cgtggttggg gagggtccac gggtattacg 2100
attcaaggag gtgacgatgt ctttaaggag aactatgtga cgctttcggg tacgtttgat 2160
gagtgctatc caacgtacct ttaccagaag attgacgagt cgaagctgaa ggctttcact 2220
cgttaccagc ttcgtggtta cattgaggac tcgcaagacc tcgaaatcta cctcattcgt 2280
tacaacgcta agcacgagac tgtcaacgtc cctggtacgg gtagtctttg gccgctttct 2340
gctcagtcgc cgattggcaa gtgtggcgag ccgaaccgtt gcgctcctca cttggagtgg 2400
aacccggatc tcgattgctc gtgccgtgac ggtgagaagt gcgcgcacca tagtcatcac 2460
tttagccttg acattgatgt cggttgcacg gatcttaacg aggatcttgg agtctgggtg 2520
attttcaaga tcaaaactca ggatgggcac gcgcgtcttg ggaatcttga gttcctggag 2580
gagaagccac ttgtcggtga ggcgcttgcg cgtgtcaagc gtgcggagaa gaaatggcgt 2640
gataagcgtg agaagttgga gtgggagacg aacatcgtgt acaaggaggc gaaggagtcg 2700
gtcgatgcgt tgtttgtcaa tagtcaatac gatcaattgc aagcggatac gaacatcgca 2760
atgattcatg cggcagataa gcgtgtccat tcgattcgtg aggcgtactt gccagagttg 2820
tcggtcatcc caggagttaa tgcggcaatc tttgaggaat tggagggcag aatcttcacg 2880
gcgttctcgt tgtacgatgc aagaaatgtt attaagaatg gagatttcaa caatgggttg 2940
tcatgctgga atgttaaggg tcacgttgat gttgaagaac agaacaacca gagatcagtg 3000
ttggttgtac cagagtggga ggcagaggtt tcacaagagg tgagagtttg cccaggcaga 3060
ggctacatct tgagagttac agcatacaaa gagggatacg gcgagggatg tgttacaatc 312 0
cacgaaatcg agaacaatac cgatgagcta aagttctcaa attgtgttga ggaggagatc 3180
tacccgaaca acacggttac ttgtaatgat tacacagtga accaggagga gtatggtggt 3240
gcatacacat caagaaatag aggctacaat gaagcaccat cagttccagc agattatgcc 3300
tcagtttatg aggagaagtc atacacagat ggacgacgtg agaatccatg tgagttcaat 3360
cgaggatacc gagattacac accactacca gttggatacg ttacaaagga actagaatac 3420
ttcccagaaa cagataaagt atggatagag atcggagaaa cagaaggaac attcatcgtt 3480
gattcagtag aactactact tatggaagaa tga 3513
<210> 53
<211> 1170
<212> ПРТ
<213> Искусственная
<220>
<223> Аминокислотная последовательность химерного белка TIC836.
<400> 53
Met Glu Asn Asn Ile Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Asn
1 5 10 15
Asn Pro Glu Val Glu Ile Leu Asn Glu Glu Arg Ser Thr Gly Arg Leu
20 25 30
Pro Leu Asp Ile Ser Leu Ser Leu Thr Arg Phe Leu Leu Ser Glu Phe
35 40 45
Val Pro Gly Val Gly Val Ala Phe Gly Leu Phe Asp Leu Ile Trp Gly
50 55 60
Phe Ile Thr Pro Ser Asp Trp Ser Leu Phe Leu Leu Gln Ile Glu Gln
65 70 75 80
Leu Ile Glu Gln Arg Ile Glu Thr Leu Glu Arg Asn Arg Ala Ile Thr
85 90 95
Thr Leu Arg Gly Leu Ala Asp Ser Tyr Glu Ile Tyr Ile Glu Ala Leu
100 105 110
Arg Glu Trp Glu Ala Asn Pro Asn Asn Ala Gln Leu Arg Glu Asp Val
115 120 125
Arg Ile Arg Phe Ala Asn Thr Asp Asp Ala Leu Ile Thr Ala Ile Asn
130 135 140
Asn Phe Thr Leu Thr Ser Phe Glu Ile Pro Leu Leu Ser Val Tyr Val
145
150
155
160
Gln Ala Ala Asn Leu His Leu Ser Leu Leu Arg Asp Ala Val Ser Phe
165 170 175
Gly Gln Gly Trp Gly Leu Asp Ile Ala Thr Val Asn Asn His Tyr Asn
180 185 190
Arg Leu Ile Asn Leu Ile His Arg Tyr Thr Lys His Cys Leu Asp Thr
195 200 205
Tyr Asn Gln Gly Leu Glu Asn Leu Arg Gly Thr Asn Thr Arg Gln Trp
210 215 220
Ala Arg Phe Asn Gln Phe Arg Arg Asp Leu Thr Leu Thr Val Leu Asp
225 230 235 240
Ile Val Ala Leu Phe Pro Asn Tyr Asp Val Arg Thr Tyr Pro Ile Gln
245 250 255
Thr Ser Ser Gln Leu Thr Arg Glu Ile Tyr Thr Ser Ser Val Ile Glu
260 265 270
Asp Ser Pro Val Ser Ala Asn Ile Pro Asn Gly Phe Asn Arg Ala Glu
275 280 285
Phe Gly Val Arg Pro Pro His Leu Met Asp Phe Met Asn Ser Leu Phe
290 295 300
Val Thr Ala Glu Thr Val Arg Ser Gln Thr Val Trp Gly Gly His Leu
305 310 315 320
Val Ser Ser Arg Asn Thr Ala Gly Asn Arg Ile Asn Phe Pro Ser Tyr
325 330 335
Gly Val Phe Asn Pro Gly Gly Ala Ile Trp Ile Ala Asp Glu Asp Pro
340 345 350
Arg Pro Phe Tyr Arg Thr Leu Ser Asp Pro Val Phe Val Arg Gly Gly
355 360 365
Phe Gly Asn Pro His Tyr Val Leu Gly Leu Arg Gly Val Ala Phe Gln
370 375 380
Gln Thr Gly Thr Asn His Thr Arg Thr Phe Arg Asn Ser Gly Thr Ile
385 390 395 400
Asp Ser Leu Asp Glu Ile Pro Pro Gln Asp Asn Ser Gly Ala Pro Trp
405 410 415
Asn Asp Tyr Ser His Val Leu Asn His Val Thr Phe Val Arg Trp Pro
420 425 430
Gly Glu Ile Ser Gly Ser Asp Ser Trp Arg Ala Pro Met Phe Ser Trp
435 440 445
Thr His Arg Ser Ala Thr Pro Thr Asn Thr Ile Asp Pro Glu Arg Ile
450 455 460
Thr Gln Ile Pro Leu Thr Lys Ser Thr Asn Leu Gly Ser Gly Thr Ser
465 470 475 480
Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu Arg Arg Thr
485 490 495
Ser Pro Gly Gln Ile Ser Thr Leu Arg Val Asn Ile Thr Ala Pro Leu
500 505 510
Ser Gln Arg Tyr Arg Val Arg Ile Arg Tyr Ala Ser Thr Thr Asn Leu
515 520 525
Gln Phe His Thr Ser Ile Asp Gly Arg Pro Ile Asn Gln Gly Asn Phe
530 535 540
Ser Ala Thr Met Ser Ser Gly Ser Asn Leu Gln Ser Gly Ser Phe Arg
545 550 555 560
Thr Val Gly Phe Thr Thr Pro Phe Asn Phe Ser Asn Gly Ser Ser Val
565 570 575
Phe Thr Leu Ser Ala His Val Phe Asn Ser Gly Asn Glu Val Tyr Ile
580 585 590
Asp Arg Ile Glu Phe Val Pro Ala Glu Val Thr Phe Glu Ala Glu Tyr
595 600 605
Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr
610 615 620
Asn Gln Leu Gly Leu Lys Thr Asn Val Thr Asp Tyr His Ile Asp Gln
625 630 635 640
Val Ser Asn Leu Val Thr Tyr Leu Ser Asp Glu Phe Cys Leu Asp Glu
645 650 655
Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg Leu Ser Asp
660
665
670
Glu Arg Asn Leu Leu Gln Asp Ser Asn Phe Lys Asp Ile Asn Arg Gln
675 680 685
Pro Glu Arg Gly Trp Gly Gly Ser Thr Gly Ile Thr Ile Gln Gly Gly
690 695 700
Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Ser Gly Thr Phe Asp
705 710 715 720
Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu Ser Lys Leu
725 730 735
Lys Ala Phe Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln
740 745 750
Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His Glu Thr Val
755 760 765
Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala Gln Ser Pro
770 775 780
Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His Leu Glu Trp
785 790 795 800
Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His
805 810 815
His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu
820 825 830
Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys Thr Gln Asp
835 840 845
Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu
850 855 860
Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg
865 870 875 880
Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val Tyr Lys Glu
885 890 895
Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln Tyr Asp Gln
900 905 910
Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg
915
920
925
Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro
930 935 940
Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr
945 950 955 960
Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe
965 970 975
Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val Asp Val Glu
980 985 990
Glu Gln Asn Asn Gln Arg Ser Val Leu Val Val Pro Glu Trp Glu Ala
995 1000 1005
Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly Tyr Ile
1010 1015 1020
Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys Val
1025 1030 1035
Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser
1040 1045 1050
Asn Cys Val Glu Glu Glu Ile Tyr Pro Asn Asn Thr Val Thr Cys
1055 1060 1065
Asn Asp Tyr Thr Val Asn Gln Glu Glu Tyr Gly Gly Ala Tyr Thr
1070 1075 1080
Ser Arg Asn Arg Gly Tyr Asn Glu Ala Pro Ser Val Pro Ala Asp
1085 1090 1095
Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg
1100 1105 1110
Glu Asn Pro Cys Glu Phe Asn Arg Gly Tyr Arg Asp Tyr Thr Pro
1115 1120 1125
Leu Pro Val Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu
1130 1135 1140
Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe
1145 1150 1155
Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu
1160 1165 1170
ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Химерный инсектицидный белок, содержащий аминокислотную последовательность, представленную SEQ ID N0: 4, где химерный инсектицидный белок проявляет ингибиторную активность в отношении видов насекомых отряда Lepidoptera.
2. Химерный инсектицидный белок по п. 1, отличающийся тем, что вид насекомого выбран из группы, состоящей из: Anticarsia gemmatalis, Diatraea saccharalis, Elasmopalpus lignosellus, Helicoverpa zea, Heliothis virescens, Chrysodeixis includens, Spodoptera cosmioides, Spodoptera eridania, Spodoptera frugiperda, Spodoptera exigua, Spodoptera litura, Pectinophora gossypiella, Diatraea grandiosella, Earias vitella, Helicoverpa gelotopeon и Rachiplusia nu.
3. Полинуклеотид, кодирующий химерный инсектицидный белок, причем полинуклеотид функционально связан с гетерологичным промотором, а химерный инсектицидный белок содержит аминокислотную последовательность, представленную SEQ ID N0: 4.
4. Полинуклеотид, кодирующий химерный инсектицидный белок, причем полинуклеотид содержит нуклеотидную последовательность, которая кодирует химерный инсектицидный белок, содержащий аминокислотную последовательность, представленную SEQ ID N0: 4.
5. Клетка-хозяин, содержащая полинуклеотид, представленный SEQ ID N0: 3, причем клетка-хозяин выбрана из группы, состоящей из бактериальной клетки-хозяина и растительной клетки-хозяина.
6. Клетка-хозяин по п. 5, отличающаяся тем, что бактериальная клетка-хозяин выбрана из группы, состоящей из Agrobacterium, Rhizobium, Bacillus, Brevibacillus, Escherichia, Pseudomonas, Klebsiella, и Erwinia.
7. Клетка-хозяин по n. 5, отличающаяся тем, что растительная клетка-хозяин выбрана из группы, состоящей из однодольных и двудольных растений.
8. Композиция, обладающая ингибирующей активностью в отношении насекомых, содержащая химерный инсектицидный белок, содержащий аминокислотную последовательность, представленную SEQ ID N0: 4.
6.
9. Композиция, обладающая ингибирующей активностью в отношении насекомых, по п. 8, дополнительно содержащая по меньшей мере один агент, обладающий ингибирующей активностью в отношении насекомых, отличный от химерного инсектицидного белка, выбранный из группы, состоящей из белка, обладающего ингибирующей активностью в отношении насекомых, и молекулы дцРНК, обладающей ингибирующей активностью в отношении насекомых.
10. Композиция, обладающая ингибирующей активностью в отношении насекомых, по п. 9, отличающаяся тем, что по меньшей мере один другой пестицидный агент проявляет активность в отношении одного или более видов вредителей отрядов Lepidoptera, Coleoptera, Hemiptera, Homoptera или Thysanoptera.
11. Семя, содержащее ингибирующе эффективное в отношении насекомых количество:
a. химерного инсектицидного белка, содержащего
аминокислотную последовательность, представленную SEQ ID NO: 4;
или
b. полинуклеотида, представленного SEQ ID NO: 3.
12. Способ борьбы с чешуекрылым-вредителем, включающий приведение в контакт чешуекрылого-вредителя с ингибирующим количеством химерного инсектицидного белка по п. 1.
13. Трансгенное растение или часть растения, содержащие химерный инсектицидный белок, причем:
a. химерный инсектицидный белок включает аминокислотную последовательность, представленную SEQ ID NO: 4; или
b. химерный инсектицидный белок содержит белок, который по меньшей мере на 90% идентичен SEQ ID NO: 4.
14. Способ борьбы с чешуекрылым-вредителем, включающий воздействие трансгенной клеткой растения, растением или частью растения по п. 13 на вредителя, причем клетка растения, растение или часть растения экспрессирует ингибирующее в отношении чешуекрылых количество химерного инсектицидного белка.
14.
a. посадку по меньшей мере одного семени, содержащего химерный инсектицидный белок по п. 1;
b. выращивание растений из семян; и
c. сбор потомственного семени от растений, причем собранное потомственное семя содержит химерный инсектицидный белок по п. 1.
16. Молекула рекомбинантной нуклеиновой кислоты, содержащая гетерологичный промотор функционально связанный с полинуклеотидом, кодирующим химерным инсектицидный белок, причем:
a. химерный инсектицидный белок содержит аминокислотную последовательность, представленную SEQ ID N0: 4; или
b. химерный инсектицидный белок содержит белок, который по меньшей мере на 90% идентичен SEQ ID N0: 4;
c. полинуклеотид включает нуклеотидную последовательность, представленную SEQ ID N0: 3.
По доверенности
PATENT COOPERATION TREATY
PCT
INTERNATIONAL SEARCH REPORT
(PCT Article 18 and Rules 43 and 44)
Applicant's or agent's file reference P34230WO00
FOR FURTHER see FORM PCT/ISA/220
ACTION as we" as> wnere applicable, item 5 below.
International application No. PCT/US2015/055800
International filing date (day/month/year) 15 October 2015 (15-10-2015)
(Earliest) Priority Date (day/month/year) 16 October 2014 (16-10-2014)
Applicant
MONSANTO TECHNOLOGY LLC
This international search report has been prepared by this International Searching Authority and is transmitted to the applicant according to Article 18. A copy is being transmitted to the International Bureau.
This international search report consists of a total of _
sheets.
It is also accompanied by a copy of each prior art document cited in this report.
1. Basis of the report
a. With regard to the language, the international search was carried out on the basis of: | X | the international application in the language in which it was filed | | a translation of the international application into_
., which is the language
of a translation furnished for the purposes of international search (Rules 12.3(a) and 23.1 (b))
This international search report has been established taking into account the rectification of an obvious mistake authorized by or notified to this Authority under Rule 91 (Rule 43.6itws(a)).
With regard to any nucleotide and/or amino acid sequence disclosed in the international application, see Box No. I. Certain claims were found unsearchable (See Box No. II) Unity of invention is lacking (see Box No III)
4. With regard to the title,
| X | the text is approved as submitted by the applicant
| | the text has been established by this Authority to read as follows:
5. With regard to the abstract,
| X | the text is approved as submitted by the applicant
| | the text has been established, according to Rule 38.2, by this Authority as it appears in Box No. IV. The applicant
may, within one month from the date of mailing of this international search report, submit comments to this Authority
6. With regard to the drawings,
a. the figure of the drawings to be published with the abstract is Figure No.
| | as suggested by the applicant
| | as selected by this Authority, because the applicant failed to suggest a figure
| | as selected by this Authority, because this figure better characterizes the invention
b. | | none of the figures is to be published with the abstract
Form PCT/ISA/210 (first sheet) (January 2015)
International application No. PCT/US2015/055800
Box No. I Nucleotide and/or amino acid sequence(s) (Continuation of item 1 .c of the first sheet)
1. With regard to any nucleotide and/or amino acid sequence disclosed in the international application, the international search was carried out on the basis of a sequence listing:
a. j у j forming part of the international application as filed:
j у j in the form of an Annex C/ST.25 text file. j j on paper or in the form of an image file.
b. I I furnished together with the international application under PCT Rule 13fer1 (a) for the purposes of international search
I I only in the form of an Annex C/ST.25 text file.
c. j j furnished subsequent to the international filing date for the purposes of international search only:
| | in the form of an Annex C/ST.25 text file (Rule 13fer1(a)).
j j on paper or in the form of an image file (Rule 13fer1 (b) and Administrative Instructions, Section 713).
2. | | In addition, in the case that more than one version or copy of a sequence listing has been filed or furnished, the required
statements that the information in the subsequent or additional copies is identical to that forming part of the application as filed or does not go beyond the application as filed, as appropriate, were furnished.
3. Additional comments:
Form PCT/ISA/210 (continuation of first sheet (1)) (January 2015)
International application No.
PCT/US2015/055800
Box No. II Observations where certain claims were found unsearchable (Continuation of item 2 of first sheet)
This international search report has not been established in respect of certain claims under Article 17(2)(a) for the following reasons: 1. | | Claims Nos.:
because they relate to subject matter not required to be searched by this Authority, namely:
Claims Nos.:
because they relate to parts of the international application that do not comply with the prescribed requirements to such an extent that no meaningful international search can be carried out, specifically:
3. Claims Nos.:
because they are dependent claims and are not drafted in accordance with the second and third sentences of Rule 6.4(a).
Box No. Ill Observations where unity of invention is lacking (Continuation of item 3 of first sheet)
This International Searching Authority found multiple inventions in this international application, as follows:
see additional sheet
1. As all required additional search fees were timely paid by the applicant, this international search report covers all searchable
I 1 claims.
2. | | As all searchable claims could be searched without effort justifying an additional fees, this Authority did not invite payment of
additional fees.
I у I As only some of the required additional search fees were timely paid by the applicant, this international search report covers only those claims for which fees were paid, specifically claims Nos.:
l-21(partially)
| | No required additional search fees were timely paid by the applicant. Consequently, this international search report is restricted to the invention first mentioned in the claims; it is covered by claims Nos.:
Remark on Protest The additional search fees were accompanied by the applicant's protest and, where applicable, the
' ' payment of a protest fee.
The additional search fees were accompanied by the applicant's protest but the applicable protest
' ' fee was not paid within the time limit specified in the invitation.
| X | No protest accompanied the payment of additional search fees.
Form PCT/ISA/210 (continuation of first sheet (2)) (April 2005)
International application No
PCT/US2015/055800
A. CLASSIFICATION OF SUBJECT MATTER
INV. C07K14/325 C12N15/82 ADD.
According to International Patent Classification (IPC) or to both national classification and IPC
B. FIELDS SEARCHED
Minimum documentation searched (classification system followed by classification symbols)
C07K C12N
Documentation searched other than minimum documentation to the extent that such documents are included in the fields searched
Electronic data base consulted during the international search (name of data base and, where practicable, search terms used)
EPO-Internal, BIOSIS, EMBASE, WPI Data, Sequence Search
C. DOCUMENTS CONSIDERED TO BE RELEVANT
Category* Citation of document, with indication, where appropriate, of the relevant passages
Relevant to claim No.
WO 01/19859 A2 (MONSANTO CO [US]) 22 March 2001 (2001-03-22) sequence 63
1-21
DATABASE UniProt [Online]
5 October 2010 (2010-10-05), "SubName: Full=CrylBe2 {EC0:0000313 jEMBL:ACV96720.1};", XP002753212,
retrieved from EBI accession no. UNIPR0T:D9U3M0
Database accession no. D9U3M0 sequence
1-21
W0 02/14517 Al (MONSANTO TECHNOLOGY LLC [US]) 21 February 2002 (2002-02-21) figures 1,5
1-21
-/-
X Further documents are listed in the continuation of Box C.
See patent family annex.
* Special categories of cited documents :
"A" document defining the general state of the art which is not considered to be of particular relevance
"E" earlier application or patent but published on or after the international filing date
"L" documentwhich may throw doubts on priority claim(s) orwhich is cited to establish the publication date of another citation or other special reason (as specified)
"O" document referring to an oral disclosure, use, exhibition or other means
"T" later document published after the international filing date or priority date and not in conflict with the application but cited to understand the principle or theory underlying the invention
"X" document of particular relevance; the claimed invention cannot be considered novel or cannot be considered to involve an inventive step when the document is taken alone
"Y" document of particular relevance; the claimed invention cannot be considered to involve an inventive step when the document is combined with one or more other such documents, such combination being obvious to a person skilled in the art
Category*
Citation of document, with indication, where appropriate, of the relevant passages
Relevant to claim No.
DE MAAGD RUUD A ET AL: "Bacillus thuringiensis delta-endotoxin CrylC domain III can function as a specificity determinant for Spodoptera exigua in different, but not all, Cryl-CrylC hybrids",
APPLIED AND ENVIRONMENTAL MICROBIOLOGY,
AMERICAN SOCIETY FOR MICROBIOLOGY, US,
vol. 66, no. 4, 1 April 2000 (2000-04-01),
pages 1559-1563, XP002480230,
ISSN: 0099-2240, D0I:
10.1128/AEM.66.4.1559-1563.2000
abstract; figure 1
WAGNER LUCENA ET AL: "Molecular Approaches to Improve the Insecticidal Activity of Bacillus thuringiensis Cry Toxins", TOXINS,
vol. 6, no. 8, 13 August 2014 (2014-08-13) , pages 2393-2423, XP055238443, D0I: 10.3390/toxins6082393 abstract
1-21
1-21
BRAVO A ET AL: "Mode of action of
Bacillus thuringiensis Cry and Cyt toxins
and their potential for insect control",
T0XIC0N, ELMSF0RD, NY, US,
vol. 49, no. 4, 15 March 2007 (2007-03-15)
, pages 423-435, XP026863362,
ISSN: 0041-0101
[retrieved on 2007-03-06]
figure 2
1-21
LI LIANA PARD0-L0PEZ ET AL: "Bacillus thuringiensis insecticidal three-domain Cry toxins: mode of action, insect resistance and consequences for crop protection",
FEMS MICROBIOLOGY REVIEWS, vol. 37, no. 1,
11 January 2013 (2013-01-11), pages 3-22,
XP055174115,
ISSN: 0168-6445, D0I:
10.llll/j.1574-6976.2012.00341.x
figures 3,6
1-21
-/--
INTERNATIONAL SEARCH REPORT
International application No
PCT/US2015/055800
C(Continuation). DOCUMENTS CONSIDERED TO BE RELEVANT
Category*
Citation of document, with indication, where appropriate, of the relevant passages
Relevant to claim No.
BAIG D N ET AL: "cry Genes profiling and the toxicity of isolates of Bacillus thuringiensis from soil samples against American boll worm, Helicoverpa armigera", JOURNAL OF APPLIED MICROBIOLOGY, vol. 109, no. 6, December 2010 (2010-12), pages 1967-1978, XP55243000, ISSN: 1364-5072 tables 2,3
1-21
W0 99/24581 A2 (MYC0GEN CORP [US]) 20 May 1999 (1999-05-20) sequences 22,23
1-21
W0 2014/055881 Al (DOW AGR0SCIENCES LLC [US]) 10 April 2014 (2014-04-10) abstract; sequence 3
1-21
W0 2011/075588 Al (DOW AGR0SCIENCES LLC [US]; MEADE THOMAS [US]; NARVA KENNETH [US]; ST0R) 23 June 2011 (2011-06-23) sequences 1,3
1-21
W0 01/14562 Al (SYNGENTA PARTICIPATIONS AG [CH]; MAAGD RUDOLF A DE [NL]; BOSCH HENDRIK) 1 March 2001 (2001-03-01) sequences 4,5
1-21
W0 2004/020636 Al (MONSANTO TECHNOLOGY LLC [US]; BOGDANOVA NATALIA N [US]; ROMANO CHARLES) 11 March 2004 (2004-03-11) sequence 2
1-21
INTERNATIONAL SEARCH REPORT
Information on patent family members
PCT/US2015/055800
INTERNATIONAL SEARCH REPORT
Information on patent family members
International application No
PCT/US2015/055800
Patent document cited in search report
Publication date
Patent family member(s)
Publication date
WO 2011075588 Al
23-06-2011
0114562
-03
-2001
6702300
-03
-2001
0114562
-03
-2001
2004020636
-03
-2004
2003265637
-03
-2004
2006112447
-05
-2006
2004020636
-03
-2004
FURTHER INFORMATION CONTINUED FROM PCT/ISA/ 210
This International Searching Authority found multiple (groups of) inventions in this international application, as follows:
1. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 21, the corresponding nucleic acid sequence according to SEQ ID N0: 20, the corresponding host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
2. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 10, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
3. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 28, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
4. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 7, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
5. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 4, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
6. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 13, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods
FURTHER INFORMATION CONTINUED FROM PCT/ISA/ 210
for producing said seed.
7. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 16, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
8. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 19, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
9. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 23, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
10. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 25, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
11. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 30, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
12. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 33, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
FURTHER INFORMATION CONTINUED FROM PCT/ISA/ 210
13. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 36, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
14. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 39, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
15. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 41, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
16. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 43, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
17. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 45, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
18. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 47, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
FURTHER INFORMATION CONTINUED FROM PCT/ISA/ 210
19. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 50, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
20. claims: l-21(partially)
relate to a chimeric insecticidal protein according to SEQ ID N0: 53, the corresponding nucleic acid sequence, host cells, compositions, seeds, transgenic plants, uses, commodity products, recombinant polynucleotides and methods for producing said seed.
[010] Развитие резистентности у целевых вредителей к инсектицидным белкам создает постоянную потребность в открытии и
или двудольные растения.
[035] SEQ ID NO: 9 представляет собой синтетическую последовательность ДНК, кодирующую TIC8 67, для экспрессии в
[035] SEQ ID NO: 9 представляет собой синтетическую последовательность ДНК, кодирующую TIC8 67, для экспрессии в
растительной клетке.
растительной клетке.
[049] SEQ ID N0: 23 представляет собой аминокислотную
[049] SEQ ID N0: 23 представляет собой аминокислотную
[063] SEQ ID N0: 37 представляет собой последовательность
[063] SEQ ID N0: 37 представляет собой последовательность
[077] SEQ ID N0: 51 представляет собой последовательность
[077] SEQ ID N0: 51 представляет собой последовательность
[089] SEQ ID N0: 63 представляет собой аминокислотную последовательность TIC1099-T507E, транслированную из открытой
[089] SEQ ID N0: 63 представляет собой аминокислотную последовательность TIC1099-T507E, транслированную из открытой
рамки считывания, указанной в SEQ ID N0: 62.
рамки считывания, указанной в SEQ ID N0: 62.
[0101] SEQ ID N0: 75 представляет собой аминокислотную последовательность TIC1099-K490A, транслированную из открытой
[0101] SEQ ID N0: 75 представляет собой аминокислотную последовательность TIC1099-K490A, транслированную из открытой
рамки считывания, указанной в SEQ ID N0: 74.
рамки считывания, указанной в SEQ ID N0: 74.
[0113] SEQ ID N0: 87 представляет собой аминокислотную последовательность TIC858, транслированную из открытой рамки
[0113] SEQ ID N0: 87 представляет собой аминокислотную последовательность TIC858, транслированную из открытой рамки
считывания, указанной в SEQ ID NO: 86.
считывания, указанной в SEQ ID NO: 86.
[0125] SEQ ID NO: 99 представляет собой аминокислотную последовательность TIC842, транслированную из открытой рамки
[0125] SEQ ID NO: 99 представляет собой аминокислотную последовательность TIC842, транслированную из открытой рамки
считывания, указанной в SEQ ID N0: 98.
считывания, указанной в SEQ ID N0: 98.
[0137] SEQ ID NO: 111 представляет собой аминокислотную последовательность TIC847, транслированную из открытой рамки
[0137] SEQ ID NO: 111 представляет собой аминокислотную последовательность TIC847, транслированную из открытой рамки
SEQ ID N0: 110.
считывания, указанной в
SEQ ID N0: 110.
считывания, указанной в
[0149] SEQ ID N0: последовательность ДНК
123 представляет собой синтетическую
для экспрессии в клетке растения,
[0149] SEQ ID N0: последовательность ДНК
123 представляет собой синтетическую
для экспрессии в клетке растения,
кодирующей ТIС 8 41.
кодирующей ТIС 8 41.
[0158] Чтобы избежать развития резистентности насекомых к
[0158] Чтобы избежать развития резистентности насекомых к
[0164] Химерные инсектицидные белки, описанные в данном
[0168] В частности, новые химерные инсектицидные белки согласно настоящему изобретению с повышенной активностью в
[0182] Приведены способы получения трансгенных растений, которые содержат ингибирующее в отношении насекомых Lepidoptera
белков, которые тесно связаны.
[0196] Последовательности рекомбинантной нуклеиновой кислоты были сконструированы из известных генов Cry-белка для
Таблица 15. Последовательности, кодирующие инсектицидные
Таблица 15. Последовательности, кодирующие инсектицидные
белки, и соответствующие SEQ ID NO.
белки, и соответствующие SEQ ID NO.
Таблица 16. Биотестирование активности химерного инсектицидного белка из стабильно трансформированной ткани листа
Таблица 16. Биотестирование активности химерного инсектицидного белка из стабильно трансформированной ткани листа
кукурузы.
кукурузы.
<220>
<220>
<220>
15. Способ получения семени, содержащего химерный
инсектицидный белок по п. 1, включающий:
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
page 1 of 3
Form PCT/ISA/210 (second sheet) (April 2005)
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
Form PCT/ISA/210 (continuation of second sheet) (April 2005)
Form PCT/ISA/210 (continuation of second sheet) (April 2005)
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
Form PCT/ISA/210 (continuation of second sheet) (April 2005)
Form PCT/ISA/210 (continuation of second sheet) (April 2005)
INTERNATIONAL SEARCH REPORT
INTERNATIONAL SEARCH REPORT
Form PCT/ISA/210 (continuation of second sheet) (April 2005)
Form PCT/ISA/210 (continuation of second sheet) (April 2005)
page 3 of 3
Form PCT/ISA/210 (continuation of second sheet) (April 2005)
page 3 of 3
Form PCT/ISA/210 (continuation of second sheet) (April 2005)
page 1 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 1 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 1 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 1 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 2 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 2 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 2 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 2 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 2 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 2 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 2 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
page 2 of 2
Form PCT/ISA/210 (patent family annex) (April 2005)
International Application No. PCT/US2015/055800
International Application No. PCT/US2015/055800