EA201892288A1 20190430 Номер и дата охранного документа [PDF] EAPO2019\PDF/201892288 Полный текст описания [**] EA201892288 20170412 Регистрационный номер и дата заявки DE10 2016 106 656.7 20160412 Регистрационные номера и даты приоритетных заявок EP2017/058815 Номер международной заявки (PCT) WO2017/178541 20171019 Номер публикации международной заявки (PCT) EAA1 Код вида документа [PDF] eaa21904 Номер бюллетеня [**] ЯДЕРНО-КОДИРУЕМАЯ МУЖСКАЯ СТЕРИЛЬНОСТЬ КАК РЕЗУЛЬТАТ МУТАЦИИ ЦИТОХРОМ P450 ОКСИДАЗЫ Название документа [8] C12N 15/82, [8] C12N 9/02 Индексы МПК [DE] Борхардт Дитрих, [DE] Чарнецки Олаф, [DE] Мехелке Вольфганг Сведения об авторах [DE] КВС ЗААТ СЕ Сведения о заявителях
 

Патентная документация ЕАПВ

 
Запрос:  ea201892288a*\id

больше ...

Термины запроса в документе

Реферат

[RU]

Изобретение касается растений, имеющих рецессивный ядерно-кодируемый мужской стерильный фенотип, и коррелирующего с ним локуса гена (gst), включая ген, который ответственен за фертильный/стерильный фенотип и который мутирован в стерильном фенотипе. Изобретение также обеспечивает способы идентификации генотипа, коррелирующего с экспрессией признаков, указанных выше, и соответствующие генетические инструменты, такие как зонды для гибридизации и олигонуклеотиды. Описано также использование растений, получаемых по данному изобретению, в селекции гибридов и производстве продуктов из возобновляемых сырьевых материалов, таких как биоэтанол, биогаз и продукты на основе сахара.


Полный текст патента

(57) Реферат / Формула:

Изобретение касается растений, имеющих рецессивный ядерно-кодируемый мужской стерильный фенотип, и коррелирующего с ним локуса гена (gst), включая ген, который ответственен за фертильный/стерильный фенотип и который мутирован в стерильном фенотипе. Изобретение также обеспечивает способы идентификации генотипа, коррелирующего с экспрессией признаков, указанных выше, и соответствующие генетические инструменты, такие как зонды для гибридизации и олигонуклеотиды. Описано также использование растений, получаемых по данному изобретению, в селекции гибридов и производстве продуктов из возобновляемых сырьевых материалов, таких как биоэтанол, биогаз и продукты на основе сахара.


Евразийское (21) 201892288 (13) Al
патентное
ведомство
(12) ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ЕВРАЗИЙСКОЙ ЗАЯВКЕ
(43) Дата публикации заявки (51) Int. Cl. C12N15/82 (2006.01)
2019.04.30 C12N 9/02 (2006.01)
(22) Дата подачи заявки 2017.04.12
(54) ЯДЕРНО-КОДИРУЕМАЯ МУЖСКАЯ СТЕРИЛЬНОСТЬ КАК РЕЗУЛЬТАТ МУТАЦИИ ЦИТОХРОМ P450 ОКСИДАЗЫ
(31) 10 2016 106 656.7
(32) 2016.04.12
(33) DE
(86) PCT/EP2017/058815
(87) WO 2017/178541 2017.10.19
(71) Заявитель:
КВС ЗААТ СЕ (DE)
(72) Изобретатель:
Борхардт Дитрих, Чарнецки Олаф, Мехелке Вольфганг (DE)
(74) Представитель:
Вашук Т.В., Емельянова В.А., Королева С.В. (BY) (57) Изобретение касается растений, имеющих рецессивный ядерно-кодируемый мужской стерильный фенотип, и коррелирующего с ним локуса гена (gst), включая ген, который ответственен за фер-тильный/стерильный фенотип и который мутирован в стерильном фенотипе. Изобретение также обеспечивает способы идентификации генотипа, коррелирующего с экспрессией признаков, указанных выше, и соответствующие генетические инструменты, такие как зонды для гибридизации и олигонуклеотиды. Описано также использование растений, получаемых по данному изобретению, в селекции гибридов и производстве продуктов из возобновляемых сырьевых материалов, таких как биоэтанол, биогаз и продукты на основе сахара.
ЯДЕРНО-КОДИРУЕМАЯ МУЖСКАЯ СТЕРИЛЬНОСТЬ КАК РЕЗУЛЬТАТ МУТАЦИИ ЦИТОХРОМ Р450 ОКСИДАЗЫ
Область техники
Настоящее изобретение относится к области упрощения трудоемких селекционных программ с помощью методов молекулярной биологии, генной инженерии и маркерных технологий. В частности, изобретение обеспечивает растения, проявляющие гомозиготный ядерно-кодируемый мужски стерильный фенотип в результате спонтанной мутации участка гена в ядерном геноме, причем в отличие от ЦМС {цитоплазматической мужской стерильности) мутация достигается посредством экспрессии рецессивного признака, что исключает необходимость получения стерильных и фертильных генотипов в селекционной программе. В этой связи настоящее изобретение обеспечивает растения, в частности растения сахарной свеклы и картофеля, в которых мутация, являющаяся результатом вышеупомянутой экспрессии признака, детектируется в гене цитохром Р450 оксидазы (CYPgstf) при помощи маркерных технологий, а также соответствующий способ идентификации данной мутации. Кроме того, изобретение обеспечивает белок CYPgstf, молекулу ДНК, содержащую не мутировавший ген, обеспечивающий вышеупомянутую экспрессию признака, рекомбинантную молекулу ДНК, обеспечивающую получение гена дикого типа, промотор для специфических экспрессий такого гена или гетерологичный ген в цветках и/или плодах растений, и/или нуклеотидную последовательность, кодирующую ингибиторы гена CYPgst, а также соответствующие векторы и клетки-хозяева.
Настоящее изобретение также касается растений, модифицированных посредством генной инженерии, которые имеют рецессивный ядерно-кодируемый мужски стерильный фенотип в результате ингибирования экспрессии гена CYVgst, соответствующих ингибиторов, а также способов ингибирования гена и способов восстановления фертильности. Изобретение также касается использования таких растений в селекции гибридов, селекции на устойчивость и/или производстве семян. Также изобретение включает семена или потомков, органы, растительные части, ткани или клетки растений по данному изобретению, а также их применение.
Предпосылки создания изобретения
Для контролируемого получения изменения генетики растений сахарной свеклы {Beta vulgaris, подвид vulgaris), а также всех других культивируемых растений, осуществляется скрещивание. У еще закрытых цветков родительской формы вручную удаляются пыльники, несущие пыльцу. Опыление также проводится вручную путем нанесения пыльцы донора на рыльца родительской формы. Как альтернативный вариант, опыление может также осуществляться после удаления пыльников у цветков родительской формы путем помещения пыльцы донора в пространственной близости от родительской формы для цветения и доставки пыльцы. В любом случае это связано с процессом ведения трудоемких протоколов, который весьма предрасположен к ошибкам, так как если удаляется только часть пыльников цветка, то может иметь место самоопыление.
В настоящее время (коммерческие) гибридные семена часто получают путем скрещивания между компонентами родительской формы генотипов, проявляющих ЦМС {цитоплазматическую мужскую стерильность), и последующего возвратного скрещивания, чтобы увеличить генетическую часть компонентов родительской формы. Получаемые в результате мужски стерильные компоненты родительской формы можно затем выращивать в большом количестве, при этом опыление происходит вследствие того, что доноры пыльцы растут рядом {топкроссный метод). Поскольку доминантный ген ЦМС наследуется по материнской линии, то для использования линий с ЦМС одновременно должны обеспечиваться фертильные линии-закрепители стерильности (не являющиеся линиями О-типов из ЦМС), чтобы могло иметь место опыление ЦМС-линий. Это требует большого объема работ по планированию и значительных производственных усилий, а также сложной логистики. Например, для получения семян достаточно высокого качества коммерчески значимые сорта сахарной свеклы в настоящее время являются тройными гибридами. Создание гибридов в селекционных программах также является дорогостоящим и трудозатратным и пока связано с наличием преград на этом пути.
Отмечены линии или генотипы многочисленных растений, проявляющие естественно встречающуюся ядерно-кодируемую мужскую стерильность (мс: мужская стерильность). Она обычно вызывается спонтанной мутацией гена в ядерном геноме, которая происходит в результате экспрессии рецессивного признака. Использование генотипов, являющихся ядерно-кодируемыми мужски стерильными по фенотипу, подходит для упрощения процессов селекции и/или применения этих процессов для получения гибридных семян. Таким образом, фенотипы с мужской стерильностью обладают тем преимуществом, что их использование не требует ручного удаления пыльников, а также исключает необходимость одновременного получения фертильных и стерильных генотипов, поскольку в свою очередь гетерозиготные генотипы в каждом репродуктивном цикле расщепляются на фертильные и стерильные индивиды посредством самоопыления.
Исходя из вышеизложенного, целью настоящего изобретения является обеспечение средств и способов для использования ядерно-кодируемой мужской стерильности у культурных растений, в частности, у растений сахарной свеклы и картофеля. Данная цель достигается посредством вариантов осуществления изобретения, указанных в описании и формуле изобретения.
Краткое изложение сущности изобретения
Настоящее изобретение относится к области упрощения трудоемких селекционных программ, маркерной технологии и генной инженерии. Изобретение обеспечивает растения, проявляющие рецессивный ядерно-кодируемый мужски стерильный фенотип в результате мутации сегмента ДНК, содержащего цитохром Р450 оксидазы (CYVgst). Ген CYPgst и мутация идентифицируются путем использования маркерных технологий и методов молекулярной биологии. Поскольку мутация остается интактной вследствие экспрессии рецессивного признака, и гетерозиготные генотипы в результате самоопыления в ходе каждого репродуктивного цикла затем расщепляются на фертильные и стерильные генотипы, то не требуется одновременное получение фертильных линий-закрепителей стерильности. Полученные данные можно использовать для создания трансгенных растений, имеющих рецессивный ядерно-кодируемый мужски стерильный фенотип, а также для восстановления фертильности.
Таким образом, настоящее изобретение касается вариантов осуществления, представленных в следующих параграфах [1] - [36] и иллюстрируемых примерами.
[1] Растение, в частности культурное растение, проявляющее рецессивный ядерно-кодируемый мужски стерильный фенотип, при этом фенотип обусловливается мутацией гена эндогенной цитохром Р450 оксидазы (CYPgst) или отсутствием, пониженным содержанием или пониженной активностью функционального белка CYPgst, кодируемого геном дикого типа CYPgst, по сравнению с соответствующим (мужски фертильным) растением дикого типа, причем не мутировавший ген CYPgst представляет собой а) ген BvCYPgst Beta vulgaris, который предпочтительно содержит нуклеотидную последовательность SEQ Ш No. 1 или 2 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 3, либо его гомолог, аналог или ортолог, Ь) ген StCYPgst Solarium tuberosum, который предпочтительно содержит нуклеотидную последовательность SEQ Ш No. 12 или 13 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 14, либо его гомолог, аналог или ортолог, с) ген ZmCYPgst Zea mays, который предпочтительно содержит нуклеотидную последовательность SEQ Ш No. 9 или 10 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 11, либо его гомолог, аналог или ортолог.
[2] Растение согласно параграфу [1], являющееся гетерозиготным по мутации и мужски фертильным или гомозиготным по мутации и мужски стерильным, в котором развитие функциональной пыльцы супрессируется, предпочтительно супрессируется полностью, у стерильных растений.
[3] Растение согласно параграфу [1] или [2], в котором ген CYPgst экспрессируется по меньшей мере в закрытых цветках и плодах.
[4] Растение согласно любому из параграфов [1] - [3], в котором мутация предотвращает транскрипцию и/или трансляцию функционального белка, при этом предпочтительно мутация касается делеции, присоединения, инсерции или замещения в кодирующей нуклеотидной последовательности гена CYPgst, последовательности сигнала для сплайсинга или регуляторной последовательности, предпочтительно в последовательности промотора гена CYPgst. В предпочтительном варианте осуществления изобретения молекула нуклеиновой кислоты имеет мутацию, которую можно также встретить в нуклеотидной последовательности SEQ Ш No. 8, в отличие от гена дикого типа согласно SEQ Ш No. 1. В частности, мутация может представлять собой делецию между нуклеотидными позициями 1560 и 2095 SEQ Ш No. 1 или соответствующими позициями SEQ Ш No. 12 или 9. Делеция может содержать по меньшей мере 20, 30 или 50 последовательных пар оснований, предпочтительно по меньшей мере 100, 150, 200 или 250 последовательных пар оснований и наиболее предпочтительно по меньшей мере 300, 400 или 500 последовательных пар оснований. В наиболее предпочтительном варианте осуществления изобретения молекула нуклеиновой кислоты содержит нуклеотидную последовательность согласно SEQ Ш No. 8. В другом предпочтительном варианте осуществления изобретения молекула нуклеиновой кислоты имеет точечную мутацию в нуклеотидной последовательности SEQ Ш No. 1 (Таблица 1), предпочтительно между нуклеотидными позициями 1560 и 2095 SEQ Ш No. 1.
[5] Растение согласно параграфу [4], являющееся растением Beta vulgaris, предпочтительно растением Beta vulgaris, подвид vulgaris, в котором делецию можно детектировать посредством определения отсутствия одного или обоих маркерных локусов
sle5983dl4 (продукт амплификации праймера, имеющего последовательности SEQ Ш No. 4 и 5) и sle5983dl7 (продукт амплификации праймера, имеющего последовательности SEQ Ш No. 6 и 7), а также посредством определения присутствия убиквитарного маркера.
[6] Растение согласно любому из параграфов [1] - [5], в котором ген локализуется в Beta vulgaris, предпочтительно Beta vulgaris, подвид vulgaris, в сегменте хромосомы 1 между маркерными локусами sxn215s01 и sle3305s02, при этом последовательность маркера sxn215s01, показанная в SEQ Ш No. 24, и последовательность маркера sle3305s02, показанная в SEQ Ш No. 26, указывают на присутствие локуса gst, и последовательность маркера sxn215s01, показанная в SEQ Ш No. 25, и последовательность маркера sle3305s02, показанная в SEQ Ш No. 27, указывают на референсную последовательность.
[7] Растение согласно параграфу [6], в котором длина последовательности составляет приблизительно от 50 до 5000 kbp, от 100 до 1000 kbp, более предпочтительно от 100 до 500 kbp и наиболее предпочтительно от 200 до 250 kbp.
[8] Растение согласно любому из параграфов [1] - [7], в котором не мутировавший ген представляет собой функциональный ген BvCYPgst Beta vulgaris, предпочтительно Beta vulgaris, подвид vulgaris, или функциональный гомологичный, аналогичный или ортологичный ген другого культивируемого(СУР^^) или культурного растения.
[9] Растение согласно параграфу [8], в котором гомологичный, аналогичный или ортологичный ген представляет собой ген Zea mays, который предпочтительно содержит нуклеотидную последовательность SEQ Ш No. 9 или 10 или кодирует аминокислотную последовательность, представленную в SEQ ID No. 11, ген Solarium tuberosum, который предпочтительно содержит нуклеотидную последовательность SEQ Ш No. 12 или 13 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 14, ген Triticum aestivum, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 15, ген Helianthus annuus, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 16, ген Hordeum vulgare, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 17, ген Brassica napus, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 18, ген Brassica oleracea, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 19, ген Brassica гора, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 20, ген Glycine max, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 21, ген Gossypium, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 22, или ген Sorghum bicolor, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 23.
[10] Растение согласно любому из параграфов [1] - [9], в котором не мутировавший ген (ген дикого типа) имеет нуклеотидную последовательность, выбираемую из группы, состоящей из:
(а) нуклеотидной последовательности, представленной нуклеотидной последовательностью SEQ Ш NO: 1 или SEQ Ш NO: 2, либо ее функционального фрагмента (см. Рис. 4А и 4В);
(b) нуклеотидной последовательности, которая кодирует аминокислотную
последовательность, представленную в SEQ Ш N0: 3;
(c) нуклеотидной последовательности, способной гибридизоваться в жестких условиях с
нуклеотидной последовательностью, комплементарной нуклеотидной последовательности
согласно (а) или (Ь);
(d) нуклеотидной последовательности, которая кодирует аминокислотную
последовательность, имеющую различия с аминокислотной последовательностью SEQ Ш
N0: 3, проявляющиеся в форме аминокислотных делеций, замещений, присоединений и/или
инсерций в аминокислотной последовательности, и которая предпочтительно идентична по
меньшей мере на 60% аминокислотной последовательности по всей ее длине;
(e) нуклеотидной последовательности, которая кодирует белок, обладающий одной и той же
ферментативной активностью, что и белок, кодируемый нуклеотидной последовательностью
согласной любой из нуклеотидных последовательностей (а) - (d); и
((f) нуклеотидной последовательности, содержащей по меньшей мере 200 или 400, предпочтительно по меньшей мере 600 или 800, наиболее предпочтительно по меньшей мере 1000 последовательных нуклеотидов промотора последовательности нуклеиновой кислоты SEQ Ш No. 1 с нуклеотидными позициями от 1 до 1518, предпочтительно от 518 до 1518, наиболее предпочтительно от 1318 до 1518, или последовательности, которая гибридизуется в этом участке, причем нуклеотидная последовательность способна контролировать экспрессию гена, и гетерологичная молекула нуклеиновой кислоты оперативно связана с нуклеотидной последовательностью, особенно в закрытых цветках или плодах.
Нуклеотидная последовательность согласно (с), (d) или (е) представляет собой, например, нуклеотидную последовательность, которая имеет последовательность нуклеотидов, представленную в SEQ Ш No. 12 или SEQ Ш No. 13, или ее функциональный фрагмент, либо которая кодирует аминокислотную последовательность, представленную в SEQ Ш No. 14. Также нуклеотидная последовательность согласно (с), (d) или (е) представляет собой, например, нуклеотидную последовательность, которая имеет последовательность нуклеотидов, представленную в SEQ Ш No. 9 или SEQ Ш No. 10, или ее функциональный фрагмент, либо которая кодирует аминокислотную последовательность, представленную в SEQ Ш No. 11. Кроме того, нуклеотидная последовательность согласно (с), (d) или (е) представляет собой, например, нуклеотидную последовательность, которая кодирует аминокислотную последовательность, выбираемую из группы, состоящей из последовательностей SEQ Ш No. 15-23.
[11] Растение согласно любому из параграфов [1] - [10], характеризующееся тем, что оно является инбредным или гибридным растением.
[12] Растение согласно любому из параграфов [1] - [11], характеризующееся тем, что оно является растением рода Zea, Solarium, Triticum, Triticale, Helianthus, Secale, Hordeum, Brassica, Brachypodium, Glycine, Gossypium, Sorghum, Saccharum, Setaria, Aegilops, Oryza, Daucus, Eucalyptus, Erythranthe, Genlisea, Musa, Avena, Nicotiana, Coffea, Vitis, Cucumis, Morus, Crucihimalaya, Cardamine, Lepidium, Capsella, Olimarabidopsis, Arabis, Raphanus, Eruca, Citrus, Jatropha. Populus или Beta, предпочтительно растение вида Zea mays, Solanum tuberosum, Triticum aestivum, Triticum durum, Triticum spelta, Helianthus annuus, Secale cereal,
Hordeum vulgare, Hordeum bulbosum, Brassica napus, Brassica oleracia, Brassica rapa, Brassica juncacea, Brassica nigra, Glycine max, Gossypium sp., Sorghum bicolor,Triticale, Saccharum offwinarum, Setaria italica, Oryza sativa, Oryza minuta, Oryza australiensis, Oryza alta, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiantus, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Erythranthe guttate, Genlisea aurea, Musa sp., Avena sp., Nicotiana sylvestris, Nicotiana tabacum, Nicotiana tomentosiformis, Solanum lycopersicum, Coffea canephora, Vitis vinifera, Cucumis sativus, Morus notabilis, Arabidopsis thaliana, Arabidopsis lyrata, Arabidopsis arenosa, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa-pastoris, Olimarabidopsis pumila, Arabis hirsute, Raphanus sativus, Eruca vesicaria sativa, Citrus x sinensis, Jatropha curcas, Populus trichocarpa или Beta vulgaris.
[13] Молекула нуклеиновой кислоты или рекомбинантная молекула ДНК, содержащая нуклеотидную последовательность, представленную в параграфе [10].
[14] Рекомбинантная молекула ДНК согласно параграфу [13], содержащая (i) промотор, имеющий нуклеотидную последовательность, представленную в параграфе [10] (f), которая оперативно связана с гетерологичной молекулой нуклеиновой кислоты, либо (ii) кодирующую нуклеотидную последовательность, представленную в параграфе [10] (а) - (е), которая оперативно связана с гетерологичным промотором, и предпочтительно способная управлять экспрессией нуклеотидной последовательности, особенно в закрытых цветках или плодах.
[15] Рекомбинантная молекула ДНК, содержащая нуклеотидную последовательность,
кодирующую shPHK (малую РНК, образующую шпильки), siPHK (малую интерферирующую
РНК), отрицательно-полярную РНК, положительно-полярную РНК или двухцепочечную
РНК, которая приводит к ингибированию экспрессии функционального (не мутировавшего)
гена CYPgst после ее экспрессии в растительной клетке или после ее введения в
растительную клетку. В предпочтительном варианте осуществления изобретения
нуклеотидная последовательность состоит по меньшей мере из 15, 16, 17, 18, 19 или 20,
предпочтительно по меньшей мере из 21, 22, 23, 24 или 25, более предпочтительно по
меньшей мере из 30, 35, 40, 45 или 50, наиболее предпочтительно по меньшей мере из 100,
200, 300, 500 или 1000 последовательных нуклеотидов SEQ Ш No. 1, 2, 9, 10, 12 или
13 в положительно- или отрицательно-полярной ориентации, либо по меньшей мере одного экзона 1 SEQ Ш No. 1 из нуклеотидов в позиции 1762-2679 и экзона 2 SEQ Ш No. 1 из нуклеотидов в позиции 3507-4142. Экзон 1 SEQ Ш No. 12 простирается от нуклеотидной позиции 1762 до 2032, экзон 2 SEQ Ш No. 12 протирается от нуклеотидной позиции 2449 до 2161 и экзон 3 SEQ Ш No. 12 протирается от нуклеотидной позиции 4032 до 4694. Экзон 1 SEQ Ш No. 9 простирается от нуклеотидной позиции 2001 до 2927 и экзон 2 SEQ Ш No. 9 простирается от нуклеотидной позиции 3018 до 3683. В еще одном предпочтительном варианте осуществления изобретения нуклеотидная последовательность состоит по меньшей мере из 15, 16, 17, 18, 19 или 20, предпочтительно по меньшей мере из 21, 22, 23, 24 или 25, более предпочтительно по меньшей мере из 30, 35, 40, 45 или 50 и наиболее предпочтительно по меньшей мере из 100, 200, 300, 500 или 1000 последовательных нуклеотидов, которые способны гибридизоваться с нуклеотидной последовательностью, представленной в параграфе [10].
[16] Молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность, представленную в параграфе [10], с мутацией в форме делеции, присоединения, инсерции или замещения, в которой данная мутация не приводит к синтезу функциональных белков CYPgst. Предпочтительно мутация происходит в кодирующей нуклеотидной последовательности гена CYPgst, локализуемой в сигнале для сплайсинга, или в регуляторной последовательности гена CYPgst, предпочтительно в промоторе гена CYPgst. В предпочтительном варианте осуществления изобретения молекула нуклеиновой кислоты имеет мутацию, которая можно также обнаружить в нуклеотидной последовательности согласно SEQ Ш No. 8. В частности, мутация может представлять собой делецию между нуклеотидными позициями 1560 и 2095 SEQ Ш No. 1 или между соответствующими позициями в SEQ Ш No. 12 или 9. Делеция может иметь длину по меньшей мере в 20, 30 или 50 последовательных пар оснований, более предпочтительно по меньшей мере в 100, 150, 200 или 250 последовательных пар оснований и наиболее предпочтительно по меньшей мере в 300, 400 или 500 последовательных пар оснований. В особенно предпочтительном варианте осуществления изобретения молекула нуклеиновой кислоты содержит нуклеотидную последовательность согласно SEQ Ш No. 8. В еще одном предпочтительном варианте осуществления изобретения молекула нуклеиновой кислоты имеет точечную мутацию в нуклеотидной последовательности SEQ Ш No. 1 согласно Таблице 1, предпочтительно между нуклеотидными позициями 1560 и 2095 SEQ Ш No. 1.
[17] Молекула нуклеиновой кислоты, состоящая по меньшей мере из 15, 16, 17, 18, 19 или 20, предпочтительно по меньшей мере из 21, 22, 23, 24 или 25, более предпочтительно по меньшей мере из 30, 35, 40, 45 или 50, наиболее предпочтительно по меньшей мере из 100, 200, 300, 500 или 1000 последовательных нуклеотидов SEQ Ш No. 1, 2, 9, 10, 12 или 13 в положительно- и/или отрицательно-полярной ориентации, или по меньшей мере одного экзона последовательностей SEQ Ш No. 1, 9 или 12 в положительно- и/или отрицательно-полярной ориентации. Экзон 1 SEQ Ш No. 1 простирается от нуклеотидной позиции 1762 до 2679, экзон 2 SEQ Ш No. 1 простирается от нуклеотидной позиции 3507 до 4142. Экзон 1 SEQ Ш No. 12 простирается от нуклеотидной позиции 1762 до 2032, экзон 2 SEQ Ш No. 12 простирается от нуклеотидной позиции 2449 до 3161 и экзон 3 SEQ Ш No. 12 простирается от нуклеотидной позиции 4032 до 4694. Экзон 1 SEQ Ш No. 9 простирается от нуклеотидной позиции 2001 до 2927 и экзон 2 SEQ Ш No. 9 простирается от нуклеотидной позиции 3018до 3683. В специальном случае осуществления изобретения длина молекулы нуклеиновой кислоты превышает размер по меньшей мере одного интрона SEQ Ш No. 1, SEQ Ш No. 9 или SEQ Ш No. 12, т.е. молекула нуклеиновой кислоты содержит последовательно расположенные i) по меньшей мере один нуклеотид с 3'-конца экзона 1 SEQ Ш No. 1 (предпочтительно последний нуклеотид экзона 1 SEQ Ш No. 1 в направлении 5' - 3'; соответствующий нуклеотиду в позиции 583 SEQ Ш No. 2) и по меньшей мере один нуклеотид с 5'-конца экзона 2 SEQ Ш No. 1 (предпочтительно первый нуклеотид экзона 2 SEQ Ш No. 1 в направлении 5' - 3'; соответствующий нуклеотиду в позиции 584 SEQ Ш No. 2), ii) по меньшей мере один нуклеотид с З'-конца экзона 1 SEQ Ш No. 12 (предпочтительно последний нуклеотид экзона 1 SEQ Ш No. 12 в направлении 5' - 3'; соответствующий нуклеотиду в позиции 271 SEQ Ш No. 13) и по меньшей мере один нуклеотид с 5'-конца экзона 2 SEQ Ш No. 12 (предпочтительно первый нуклеотид экзона 2 SEQ Ш No. 12 в направлении 5' - 3'; соответствующий нуклеотиду в позиции 272 SEQ Ш No. 13), iii) по меньшей мере один нуклеотид с З'-конца экзона 2 SEQ Ш No. 12 (предпочтительно последний нуклеотид экзона 2 SEQ Ш No. 12 в направлении 5' - 3'; соответствующий
нуклеотиду в позиции 984 SEQ Ш No. 13) и по меньшей мере один нуклеотид экзона 3 SEQ Ш No. 12 в направлении 5' - 3'; соответствующий нуклеотиду в позиции 985 SEQ Ш No. 13), либо iv) по меньшей мере один нуклеотид с З'-конца экзона 1 SEQ Ш No. 9 (предпочтительно последний нуклеотид экзона 1 SEQ Ш No. 9 в направлении 5' - 3'; соответствующий нуклеотиду в позиции 987 SEQ Ш No. 10) и по меньшей мере один нуклеотид с 5'-конца экзона 2 SEQ Ш No. 9 (предпочтительно первый нуклеотид экзона 2 SEQ Ш No. 9 в направлении 5' - 3'; соответствующий нуклеотиду в позиции 928 SEQ Ш No. 10). В еще одном предпочтительном варианте осуществления изобретения нуклеотидная последовательность состоит по меньшей мере из 15, 16, 17, 18, 19 или 20, предпочтительно по меньшей мере из 21, 22, 23, 24 или 25, более предпочтительно по меньшей мере из 30, 35, 40, 45 или 50 и наиболее предпочтительно по меньшей мере из 100, 200, 300, 500 или 1000 последовательных нуклеотидов, и способна специфически гибридизоваться с нуклеотидной последовательностью, представленной в [10] или [16].
[18] Олигонуклеотид длиной предпочтительно не более 50 нуклеотидов, содержащий молекулу нуклеиновой кислоты согласно параграфу [17] или молекулу нуклеиновой кислоты, способную специфически гибридизоваться с нуклеотидной последовательностью согласно SEQ Ш No. 8, и/или предпочтительно имеющий одну из следующих нуклеотидных последовательностей:
i) SEQ Ш No. 4, 6 или их комплемент, либо
ii) SEQ Ш No. 5, 7 или их комплемент.
[19] Вектор, предпочтительно растительный вектор, содержащий молекулу ДНК или молекулу нуклеиновой кислоты согласно любому из параграфов [13]- [16] или молекулу нуклеиновой кислоты согласно параграфу [17].
[20] Вектор согласно параграфу [19], в котором молекула ДНК или молекула нуклеиновой кислоты в виде трансгена способна экспрессировать функциональный CYPgst и предпочтительно генетически связана с другим трансгеном, предотвращающим перенос молекулы ДНК или молекулы нуклеиновой кислоты через пыльцу, при этом предпочтительно вектор или трансген также содержит экспрессионную кассету, которая маркирует семена, предпочтительно флуоресцентными метками.
[21] Клетка-хозяин, предпочтительно растительная клетка, содержащая рекомбинантную молекулу ДНК или молекулу нуклеиновой кислоты согласно любому из параграфов [13] -[16], или вектор согласно параграфу [19] или [20].
[22] Белок CYPgst, кодируемый нуклеотидной последовательностью, представленной в параграфе [10], или его функциональный и/или иммунологически активный фрагмент. Белок CYPgst предпочтительно представляет собой а) аминокислотную последовательность, выбираемую из группы, состоящей из SEQ Ш No. 3, SEQ Ш No. 11 и SEQ Ш No. 14-23, или b) аминокислотную последовательность, которая по меньшей мере на 80%, 82%, 84%, 86% или 88%, предпочтительно по меньшей мере на 90%, 91%, 92%, 93%, 94% или 95%, наиболее предпочтительно по меньшей мере на 96%, 97%, 98%, 99% или 99,5% идентична аминокислотной последовательности SEQ Ш No. 3, предпочтительно по всей ее длине.
[23] Антитело, которое специфически связывается с белком CYPgst или его фрагментом согласно параграфу [22].
[24] Набор, содержащий молекулу ДНК или молекулу нуклеиновой кислоты согласно любому из параграфов [13] - [16], нуклеиновую кислоту согласно параграфу [17], олигонуклеотид согласно параграфу [18], вектор согласно параграфу [19] или [20], белок CYPgst или его фрагмент согласно параграфу [22] и/или антитело согласно параграфу [23], а также потенциально реагенты, предназначенные для процедур, основанных на детекции нуклеиновых кислот, или для иммунологической детекции.
[25] Способ получения растения, в частности культурного растения, проявляющего гомозиготный рецессивный ядерно-кодируемый мужски стерильный фенотип, при котором ингибируется экспрессия гена CYPgst.
[26] Способ согласно параграфу [25], характеризующийся тем тем, что он включает в себя этап введения рекомбинантной молекулы ДНК согласно параграфу [15], молекулы нуклеиновой кислоты согласно параграфу [16] или [17] или вектора согласно параграфу [19] или [20], например, посредством агробактериальной трансформации, Т-ДНК мечения, гомологичной рекомбинации, мутагенеза, такого как TILLING, и направленного мутагенеза, например, с использованием нуклеаз "цинковые пальцы", TALE-нуклеаз (эффекторные нуклеазы, подобные активаторам транскрипци) и системы CRISPR/Cas, приводящий к ингибированию экспрессии гена, например, посредством iPHK, косупрессии, либо вследствие введенной мутации.
[27] Способ восстановления фертильности растения согласно любому из параграфов [1] -[12] или растения, которое можно получать посредством способа согласно параграфу [25] или [26], включающий введение в растение функционального гена CYPgst.
[28] Способ согласно параграфу [27], при котором ген CYPgst вводится с помощью рекомбинантной ДНК согласно параграфу [13] или [14], вектора согласно параграфу [19] или [20], либо посредством скрещивания растения, несущего ген CYPgst дикого типа или функциональный ген CYPgst, предпочтительно в гомозиготном состоянии. Как вариант, отбор по присутствию гена CYPgst дикого типа или функционального гена CYPgst можно проводить в следующем поколении.
[29] Растение, содержащее растительные клетки согласно параграфу [21], и/или которое можно получать способом согласно любому из параграфов [25] - [28].
[30] Орган, растительная часть, ткань или клетка растения согласно любому из параграфов [1] - [12] или [19].
[31] Семена или потомки растения согласно любому из параграфов [1] - [12] или [29], характеризующиеся тем, что семена или потомки содержат мутацию, представленную в любом из параграфов [1] - [12], и/или рекомбинантную молекулу ДНК или молекулу нуклеиновой кислоты согласно любому из параграфов [13] - [16] или вектор согласно параграфу [19] или [20].
[32] Способ идентификации растения согласно любому из параграфов [1] - [12] или [29] путем детекции мутации гена CYPgst или маркера, связанного с мутацией.
[33] Использование молекулы ДНК или молекулы нуклеиновой кислоты согласно любому из параграфов [13] - [16], молекулы нуклеиновой кислоты согласно параграфу [17], олигонуклеотида согласно параграфу [18], вектора согласно параграфу [19] или [20], белка CYPgst или его фрагмента согласно параграфу [22], антитела согласно параграфу [23] и/или наборов согласно параграфу [24], предназначенных для получения растения согласно любому из параграфов [1] - [12] или [29], получения рецессивного ядерно-кодируемого мужски стерильного растения, растения с восстановленной фертильностью, гибридного растения, в селекционных программах на устойчивость или для производства семян.
[34] Использование молекулы ДНК согласно параграфу [14] или промотора, представленного в параграфе [14], для специфической экспрессии гетерологичных молекул нуклеиновой кислоты в цветках и/или плодах растений.
[35] Использование растения согласно любому из параграфов [1] - [12] или [29], органа, растительной части, ткани или клетки согласно параграфу [30], семян или потомков согласно параграфу [31] или растения, которое можно идентифицировать согласно параграфу [32] или получать посредством осуществления использования согласно параграфу [33] или [34] или тканей, клеток, потомков или семян для производства пищевых продуктов, активных веществ, лекарственных средств и их прекурсоров, диагностических продуктов, косметики, чистых химикатов, сахара, патоки, биоэтанола или биогаза.
[36] Пищевые продукты, корма или активные вещества, содержащиеся в растении согласно любому из параграфов [1] - [12] или [29], органе, растительной части, ткани или клетке согласно параграфу [30], семенах или потомках согласно параграфу [31] или в растении, которое идентифицируется при помощи способа согласно параграфу [32] или которое можно получать посредством осуществления использования согласно параграфу [33] или [34], либо его тканей, клеток, потомков или семен.
[37] Использование растения согласно любому из параграфов [1] - [12] или [29] для селекции или получения растения-потомка, при которых для рекуррентного отбора используется ядерно-кодируемый мужски стерильный фенотип.
Некоторые термины, использованные в настоящей заявке, обсуждаются ниже более подробно.
Выражения "сегмент хромосомы", "хромосомный сегмент", а также их вариации, используются взаимозаменяемо, если не указано иное, и означают конкретный хромосомный сегмент ДНК конкретной хромосомы, содержащий по меньшей мере один ген.
"Ген CYPgst" или "ген CYPgst дикого типа", кодируемый "белком CYPgst", играет роль в образовании жизнеспособной пыльцы, причем мутация CYPgst вызывает мужскую стерильность у растений вследствие супрессии образования функциональной пыльцы. Это было экспериментально показано на примере сахарной свеклы (Beta vulgaris, подвид vulgaris). Сравнение гомологий позволило установить сходство с геном CYP703 Arabidopsis thaliana, который, как следует из существующего уровня техники (Morant et al., The Plant Cell, 19 (2007), 1473-1487), выполняет основную функцию в синтезе спорополленина и предпочтительно катализирует преобразование среднецепочечных насыщенных жирных кислот в соответствующие простые гидроксилированные жирные кислоты, предпочтительно в процессе гидроксилирования лауриновой кислоты в позиции С-7. Элиминация гена
CYP703 в Arabidopsis thaliana приводит к частичной мужской стерильности. Количество
пыльцы действительно сокращалось, однако функциональная пыльца все еще могла
образовываться. В связи с этим ген Beta vulgaris, подвид vulgaris, по-видимому, выполняет
иную функцию, так как его элиминация приводит к мужской стерильности растения.
Безотносительно какой-либо теории, можно предположить, что ген CYPgst должен быть
отнесен к другой классификации генов CYP, либо что у культивируемых растений, в
частности у культурных растений, таких как сахарная свекла, он выполняет иную функцию
или имеет иное значение в отличие от низшего модельного растения Arabidopsis thaliana; см.
обсуждение в Примере 1. Специалист в данной области техники может получить
информацию о других белках CYPgst из баз данных, используя другие поисковые параметры
и компьютерные программы для скрининга гомологичных последовательностей или
сравнения последовательностей. Возможную оценку того, выполняет ли
идентифицированный ген ту же функцию, что и ген CYPgst Beta vulgaris, подвид vulgaris, можно проводить путем восстановления функции CYPgst в мужски стерильном растении сахарной свеклы посредством гетерологичной экспрессии идентифицированного гена, т.е. путем восстановления фертильности с помощью трансгена.
Безотносительно какой-либо теории, представляется также возможным, что ген CYPgst Beta vulgaris, подвид vulgaris, и ген CYP703 Arabidopsis thaliana относятся к одному и тому же семейству CYP и, таким образом, выполняют ту же или по меньшей мере сходную функцию в синтезе спорополленина, однако у культивируемых растений, которые годами направленной селекции и скрещивания оптимизировались относительно урожайности, устойчивости к вредителям и абиотическим стрессовым факторам и т.п., а также содержания растительных веществ, способность компенсировать потерю споролленина утрачена и поэтому в результате отсутствия споролленина образование пыльцы супрессируется, что делает растения мужски стерильными.
Согласно изобретению термин "локус gst" относится к геномной ДНК растения, в частности культурного растения, где мутация обусловливается рецессивно-наследуемой ядерно-кодируемой мужской стерильностью, причем мутация затрагивает ген цитохром Р450 оксидазы (CYPgst) и содержится в локусе gst растения, подвергшегося мутации. В частности, при возникновении мутации у гомозиготных растений содержание или активность функционального белка CYPgst оказывается ниже, чем у соответствующего (мужски фертильного) растения, содержащего локус дикого типа (растение дикого типа), либо он вообще отсутствует. Обычно мутация гена CYPgst предотвращает транскрипцию и/или трансляцию функционального белка CYPgst.
Термин "тесно сцепленный" следует понимать, как означающий, что расстояние между двумя фланкирующими локусами (например, двумя маркерами (маркерными локусами)) на генетической карте составляет менее 15 сМ, менее 12 сМ, менее 10 сМ, менее 8 сМ, менее 7 сМ, менее 6 сМ, менее 5 сМ, менее 4 сМ, менее 3 сМ, менее 2 сМ, менее 1 сМ, менее 0,5 сМ, менее 0,2 сМ, менее 0,1 сМ, менее 0,05 сМ.
Термин "гибридизировать" или "гибридизация" означает процесс, при котором одноцепочечная молекула нуклеиновой кислоты соединяется с насколько возможно комплементарной цепочкой нуклеиновой кислоты, т.е. при этом образуются пары оснований. Стандартные методы гибридизации описаны, например, Sambrook et al., Molecular Cloning; A Laboratory Manual 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001.
Предпочтительно это означает, что по меньшей мере 60%, более предпочтительно по меньшей мере 65%, 70%, 75%, 80% или 85%, наиболее предпочтительно 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% оснований молекулы нуклеиновой кислоты образуют пары оснований с насколько возможно комплементарной цепочкой нуклеиновой кислоты. Возможность такого соединения зависит от жесткости условий гибридизации. Термин "жесткость" относится к условиям гибридизации. Условия высокой жесткости означают условия, при которых образование пар оснований затруднено; условия низкой жесткости означают условия, при которых образование пар оснований проходит легче. Жесткость условий гибридизации зависит, например, от концентрации соли, ионной силы и температуры. Как правило, жесткость условий можно повышать путем повышения температуры и/или снижения содержания соли. Термин "жесткие условия гибридизации" означает условия, при которых гибридизация происходит только между гомологичными молекулами нуклеиновой кислоты и гомологичными генами. Термин "условия гибридизации", таким образом, относится не только к условиям, превалирующим непосредственно при соединении цепей нуклеиновых кислот, но также к условиям, превалирующим во время последующих этапов развития. Примерами жестких условий гибридизации являются условия, при которых, прежде всего, гибридизуются те молекулы нуклеиновой кислоты, которые обладают по меньшей мере 70%, предпочтительно по меньшей мере 75%, по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90% или по меньшей мере 95% идентичностью. К условиям жесткой гибридизации относится, например, гибридизация в 4 х SSC при 65°С и последующая многократная отмывка в 0,1 х SSC при 65°С приблизительно в течение 1 часа. Используемый здесь термин "условия жесткой гибридизации" может также означать гибридизацию при 68°С в 0,25 М фосфат натрия, рН 7,2, 7% SDS, 1 mM EDTA и 1% BSA в течение 16 часов и последующую двукратную отмывку в 2 х SSC и 0,1% SDS при 68°С. Предпочтительно, чтобы гибридизация осуществлялась в жестких условиях.
Термин "комплементарная" нуклеотидная последовательность применительно к нуклеиновой кислоте в форме двухцепочечной ДНК означает, что первая цепочка ДНК является комплементарной второй цепочке ДНК в отношении регулирования пар оснований нуклеотидов, соответствующих основаниям первой цепочки.
Термин "(молекулярный) маркер" означает нуклеотидную последовательность, которая служит в качестве референсной точки или точки ориентации. Маркер для детекции рекомбинации должен быть пригодным для мониторинга различий или полиморфизмов внутри растительной популяции. Что касается маркеров, эти различия встречаются на уровне ДНК и представляют собой различия в полинуклеотидных последовательностях, например, такие как SSR (простые повторяющиеся последовательности), RFLP (полиморфизмы длин рестрикционных фрагментов), FLP (полиморфизмы длины фрагмента) или SNP (простые нуклеотидные полиморфизмы). Маркеры могут происходить из геномных или экспрессированных нуклеиновых кислот, например, сплайсированной РНК, сДНК или EST-последовательностей, и могут также относиться к нуклеиновым кислотам, используемым в качестве зонда или пар праймеров, и, как таковые, быть пригодными для амплификации фрагмента последовательности с использованием методов на основе ПЦР. Маркеры, касающиеся генетических полиморфизмов между частями популяции, можно детектировать с помощью разработанных методов, известных из уровня техники (An Introduction to Genetic Analysis, 7th edition, Griffiths, Miller, Suzuki et al, 2000). Эти методы
включают, например, секвенирование ДНК, амплификацию специфических последовательностей на основе ПНР, детекцию RFLP, детекцию полинуклеотидных полиморфизмов с использованием аллель-специфической гибридизации (ASH) и детекцию SSR, SNP или RFLP. Помимо этого, известны методы детекции EST (экспрессирующиеся секвенированные последовательности) и RAPD (случайно амплифицированная полиморфная ДНК). В зависимости от контекста термин "маркер" может также означать специфическую позицию хромосомы в геноме вида, где может локализоваться специфический маркер (например, SNP). В настоящем изобретении маркеры также используются для детекции делеций.
Термин "культурное растение" охватывает как культивируемые, так и дикорастущие растения. Растения, называемые культурными растениями, используются, прямо или косвенно, в любой форме людьми, например, в качестве пищевых продуктов, стимуляторов или лекарственных средств, а также в качестве лесоматериалов или в качестве кормов для скота.
"Культивируемое растение" в отличие от дикорастущих растений представляет собой растение, которое люди, сажают, выращивают и защищают, и которое можно использовать в качестве культурного или декоративного растения. Генетической основой существования культивируемых растений являются точечные мутации, соматические мутации, хромосомные мутации и полиплоидизация. Эти мутации лежат в основе отбора. Они формируют природный или искусственно продленный (увеличение частоты мутаций, скрещивание, обработка колхицином, методы генной инженерии) начальный материал для эволюции, контролируемой человеком. Культивируемые растения включают пищевые растения, технические растения (например, прядильные растения), кормовые растения и декоративные растения. Важными признаками данных культивируемых растений являются увеличение размера растений и, в частности, используемых органов, потеря горечи, устойчивость к вредителям и/или более высокое содержание питательных веществ.
"Оперативно связанный" означает связанный в общей молекуле нуклеиновой кислоты таким образом, что связанные элементы расположены и ориентированы относительно друг друга так, что может происходить транскрипция молекулы нуклеиновой кислоты. ДНК, оперативно связанная с промотором, находится под транскрипционным контролем такого промотора.
"Растение" в контексте изобретения может быть растением любого вида, выбираемым из двудольных или однодольных растений. Предпочтительны растения, используемые в сельском хозяйстве, садоводстве и для получения биоэнергии (биоэтанола, биогаза и т.п.). Растения, используемые в настоящем изобретении, предпочтительно различаются своими запасающими органами, включающими клубни, корни, семена, зерна, плоды и т.п. К таким растениям относятся, например, вида Zea mays, Solarium tuberosum, Triticum aestivum, Triticum durum, Triticum spelta, Helianthus annuus, Secale cereal, Hordeum vulgare, Hordeum bulbosum, Brassica napus, Brassica oleracia, Brassica rapa, Brassica juncacea, Brassica nigra, Glycine max, Gossypium sp., Sorghum bicolor,Triticale, Saccharum offwinarum, Setaria italica, Oryza sativa, Oryza minuta, Oryza australiensis, Oryza alta, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiantus, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Erythranthe guttate, Genlisea aurea, Musa sp., Avena sp., Nicotiana sylvestris, Nicotiana tabacum, Nicotiana tomentosiformis, Solanum lycopersicum, Coffea
canephora, Vitis vinifera, Cucumis sativus, Morus notabilis, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa-pastoris, Olimarabidopsis pumila, Arabis hirsute, Raphanus sativus, Eruca vesicaria sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa или Beta vulgaris. Растение согласно изобретению предпочтительно является растением рода Beta, в частности, растением сахарная свекла (Beta vulgaris, подвида vulgaris).
Растительные "органы" означают, например, листья, растительные стебли, стволы, корни, вегетативные почки, меристемы, зародыши, пыльники, семязачатки, семена или плоды, в частности зерна. Термин "растительная часть" или "растительные части" включает, но не ограничивается этим, растительный стебель, листья, цветки, соцветия, корни, плоды и семена, а также пыльцу. Кроме того, растительные "части" также означают комбинацию нескольких органов, например, цветка и семени, либо часть органа, например, поперечный разрез стебля растения. Примерами растительных "тканей" являются каллусные ткани, запасающие ткани, меристематические ткани, ткани листьев, ткани побегов, ткани корней, ткани растительных центров или репродуктивные ткани, а также образовательные ткани, основные ткани (называемые паренхима), проводящие ткани, механические ткани и покровные ткани (называемые эпидермис). Этот перечень, однако, не является исчерпывающим. Термин растительные "клетки" следует понимать как означающий, например, выделенные клетки с наличием клеточной стенки, либо их агрегаты или протопласты.
В контексте настоящего изобретения термин "регуляторная последовательность" означает нуклеотидную последовательность, которая влияет на специфичность и/или уровень экспрессии, например, регуляторная последовательность может придавать специфическую тканеспецифичность. Такая регуляторная последовательность может локализоваться как вверх по течению от точки инициации транскрипции минимального промотора, так и вниз по течению от нее, например, как в лидерной последовательности, которая транскрибирована, но не транслирована, или внутри интрона.
"Промотор" - это нетранслируемый сегмент ДНК обычно вверх по течению от кодирующего участка, который содержит сайт связывания РНК-полимеразы и инициирует транскрипцию ДНК. Промотор также содержит другие элементы, которые функционируют в качестве регуляторов экспрессии генов (например, cis-регуляторные элементы). "Ядерный или минимальный промотор" - это промотор, который содержит по меньшей мере основные элементы, необходимые для инициации транскрипции (например, ТАТА-бокс или инициатор).
"Трансгенное ратение" означает растение, в геном которого нтегрирован по меньшей мере один полинуклеотид, предпочтительно гетерологичный полинуклеотид. Предпочтительно интеграция полинуклеотида является стабильной, что означает, что полинуклеотид остается стабильным в растении, экспрессируется и может также стабильно наследоваться потомками. Стабильное введение полинуклеотида в геном растения также включает его интеграцию в геноме растения предшествующего поколения, причем полинуклеотид может далее стабильно передоваться последующим поколениям. Термин "гетерологичный" означает, что введенный полинуклеотид происходит, например, от клетки или организма иного генетического фона того же вида или другого вида, либо является гомологичным по отношению к прокариотической или эукариотической клетке-хозяину, и в
таком случае локализуется в иной генетической среде и поэтому отличается от потенциально естественно встречающегося соответствующего полинуклеотида. Гетерологичный полинуклеотид может присутствовать в добавление к соответствующему эндогенному гену.
Настоящее изобретение далее иллюстрируется примерами вариантов его осуществления со ссылками на фигуры чертежей и последовательности:
Рис. 1 А, С) цветки фертильных растений сахарной свеклы (Beta vulgaris, подвид vulgaris) и В, D) цветки мужски стерильных растений сахарной свеклы, фенотипы которых происходят от Донора С311 [2043_К5]. А, В - закрытые цветки, чашелистики и лепестки которых удалены вручную. Четко видны жизнеспособные пыльники фертильного генотипа (А), обозначенные светлым (желтым) цветом. Пыльники стерильных генотипов четко обозначены темным (коричневым) цветом. Во время стадии цветения пыльники фертильных генотипов раскрываются и выделяется пыльца (С), а пыльники стерильных генотипов не продолжают развиваться и не содержат пыльцы.
Рис. 2:Модель гена, аннотированного в Reffieet 1.2, тип BvCYPgst (g6845.tl), в референсном генотипе KWS2320. Белок длиной 517 аминокислот кодируется экзонами, общая длина которых составляет 1554 bp. Генотипы, выраженные в мужски стерильном фенотипе, содержат делецию протяженностью 533 bp, часть, включающую 5'-UTR и первый экзон гена. В таком случае правильная транскрипция тРНК и трансляция функционального белка является невозможной.
Рис. 3: Выравнивание фрагмента геномной ДНК протяженностью 4721 bp, кодирующей модель гена сахарной свеклы BvCYPgst (g6845.tl) из стерильных и фертильных генотипов. Последовательность стерильных генотипов содержит делецию протяженностью 533 bp.
Рис. 4: Анализ последовательности фрагмента геномной ДНК протяженностью 4721 bp, кодирующей модель гена сахарной свеклы BvCYPgst (g6845.tl) из стерильных и фертильных генотипов. А) - последовательность геномной ДНК гена CYPgst Beta vulgaris, подвид vulgaris, включающая участок предполагаемого промотора, а также 5'-UTR и З'-UTR. Участок предполагаемого промотора отмечен "жирным", 5'-UTR и З'-UTR подчеркнуты, экзон 1 отмечен "жирным" и подчеркнут, экзон 2 обозначен курсивом и подчеркнут, и интрон обозначен курсивом. Представленная последовательность соответствует последовательности SEQ Ш No. 1. Функциональные участки гена располагаются следующим образом: предполагаемый промотор - 1...518; 5'-UTR - 1519... 1761; транскрибированный участок - 1519...4275; экзон - 1762...2679; интрон - 2680...3506; экзон - 3507...4142; З'-UTR - 4143...4275. В) - последовательность сДНК гена CYPgst Beta vulgaris, подвид vulgaris, включающая 5'-UTR и З'-UTR. 5'-UTR и З'-UTR подчеркнуты, экзон 1 отмечен "жирным" и подчеркнут, и экзон 2 обозначен курсивом и подчеркнут. Представленная последовательность соответствует последовательности SEQ Ш No. 2. Функциональные участки сДНК располагаются следующим образом: 5'-UTR - 1...243; экзон - 244... 1161; экзон - 1162... 1787; З'-UTR - 1798... 1930. С) - аминокислотная последовательность гена CYPgst Beta vulgaris, подвид vulgaris. Представленная последовательность соответствует последовательности SEQ Ш No. 3. D) последовательность геномной ДНК мутировавшего гена CYPgst Beta vulgaris, подвид vulgaris, включающая участок предполагаемого промотора и З'-UTR. Участок предполагаемого промотора отмечен "жирным", З'-UTR подчеркнут,
процессированный экзон 1 отмечен "жирным" и подчеркнут, экзон 2 обозначен курсивом и подчеркнут, и интрон обозначен курсивом. Представленная последовательность соответствует последовательности SEQ Ш No. 8. Функциональные участки мутировавшего гена CYPgst располагаются следующим образом: предполагаемый промотор - 1...1353; 5'-UTR - 1519...1761; транскрибированный участок - 1354...3542; процессированный экзон -1354... 1938; интрон - 1939...2755; экзон - 2756...3394; З'-UTR = 3395...3542.
Рис. 5: Анализ экспрессии гена BvCYPgst (GST, g6845.tl) при помощи ПЦР в реальном времени. РНК получена из различных тканей фертильных растений. Экспрессия гена GST установлена путем сравнения с экспрессией гена g4645.tl; n.d. означает, что экспрессия не была детектирована. В представленном эксперименте GST более сильно экспрессировался в закрытых цветках. При сравнении экспрессия гена GST не была детектирована в закрытых цветках стерильных генотипов.
Подробное описание изобретения
Настоящее изобретение обеспечивает получение растения в результате мутации в сегменте ДНК ядерного генома, содержащего ген цитохром Р450 оксидазы (CYPgst), которое проявляет ядерно-кодируемый мужски стерильный фенотип. Оно отличается тем, что мутация вызывается экспрессией рецессивного признака. Получаемое таким образом растение можно использовать для упрощения трудоемких селекционных программ. Для идентификации гена, отвечающего за данную экспрессию признака, используется сахарная свекла (Beta vulgaris, подвид vulgaris), как показано в Примерах 1 и 2 и на Рис. 1-5. Упомянутый ген классифицируется как член семейства цитохром Р450 оксидаз (CYP) по его структурным признакам, выявленным на основе анализа последовательности, и имеет суффикс "gst", характеризующий фенотип, наблюдаемый в его мутантах с ядерной мужской стерильностью. Поскольку ген идентифицируется в сахарной свекле, то также используется префикс "Bv" в тех случаях, когда в примерах дается ссылка на конкретный ген.
В общем, настоящее изобретение касается растения, в частности культивируемого или культурного растения, проявляющего рецессивный ядерно-кодируемый мужски стерильный фенотип, которое отличается тем, что фенотип обусловливается мутацией гена эндогенной цитохром Р450 оксидазы (CYPgst) или отсутствием, пониженным содержанием или пониженной активностью функционального белка CYPgst, кодируемого геном дикого типа CYPgst, по сравнению с соответствующим (мужски фертильным) растением дикого типа, при этом не мутировавший ген CYPgst представляет собой ген BvCYPgst Beta vulgaris, который предпочтительно содержит одну из нуклеотидных последовательностей SEQ Ш No. 1 или 2 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 3, либо его гомолог, аналог или ортолог. Как показано выше и объяснено на примерах, у растений можно идентифицировать другие белки CYPgst или кодирующие их гены, т.е. гомологи, аналоги и ортологи, посредством традиционных подходов биоинформатики (поиски по базам данных и компьютерные программы для скрининга гомологичных последовательностей), при этом можно предположить, что инициируется мутация того же фенотипа, что и у растений сахарной свеклы. Растение по данному изобретению также отличается тем, что не мутировавший ген CYPgst представляет собой ген StCYPgst Solarium tuberosum, который предпочтительно содержит нуклеотидную последовательность SEQ Ш
No. 12 или 13 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 14, или его гомолог, аналог или ортолог, и не мутировавший ген CYPgst представляет собой ген ZmCYPgst Zea mays, который предпочтительно содержит нуклеотидную последовательность SEQ Ш No. 9 или 10 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 11, или его гомолог, аналог или ортолог.
В контексте изобретения термин "гомолог(и)" означает, что релевантные гены (из двух различных видов растений) по существу выполняют ту же самую функцию и имеют общего предка, и что их нуклеиновые кислоты и кодирующие аминокислотные последовательности по существу идентичны. Имеется, однако, много генов, гомологичных друг другу, однако выравнивание последовательностей белков не приводит к получению полезного спаривания. Напротив, термин "аналогичные" гены или белки указывает на то, что они выполняют идентичные или сходные функции, но имеют различную структуру, т.е. не имеют общего предка. В таком случае их нуклеиновые кислоты или кодирующие аминокислотные последовательности не совсем идентичны друг другу, либо, в лучшем случае, идентичны только в определенных функциональных доменах.
В контексте секвенирования генома для аннотации термин "гомолог" определяется более конкретно. Термины "ортолог" и "паралог" также сюда относятся. Ортологи - это гены, которые возникают в результате видообразования. Паралоги - это гены, которые возникают в результате дупликации.
Согласно данному изобретению ген, как правило, представляет собой гомолог, аналог или ортолог, если он способен комплементировать мужски стерильный фенотип, который встречается в референсном гене CYPgst у растений сахарной свеклы (BvCYPgst) и/или обеспечивает инициацию направленной мутации в релевантном гене, либо вызывает изменения биологической активности генетических продуктов фенотипа у растения с мужской стерильностью, кодируемом гомологом или аналогом, от которого ген был получен. Соответственно, релевантный гомолог или аналог гена CYPgst по данному изобретению, показанный на этом примере, предпочтительно отличается тем, что он способен комплементировать мужски стерильный фенотип, наблюдаемый у мутантов CYPgst сахарной свеклы, т.е. он способен восстанавливать фертильность фенотипа. Дополнительно или как вариант, гомолог или аналог CYPgst предпочтительно отличается тем, что растение с мужски стерильным фенотипом получают путем ингибирования их экспрессии или биологической активности генетического продукта, кодируемого гомологом или аналогом. Мужски стерильный фенотип предпочтительно обладает признаками, характерными, например, для мутантов CYPgst у растений сахарной свеклы, в частности признаками, описанными в примерах; см. варианты осуществления изобретения выше.
Соответствующие методы и технологии комплементации в генетике известны специалисту в данной области; см., например, Napoli et al., и Plant Physiology 120 (1999), 615622, где описана мутация в инбредных штаммах петунии, которые также имеют мужски стерильный фенотип, который можно элиминировать посредством трансгенной комплементации с помощью функциональной халкон-синтазы А сДНК , что позволяет заключить, что ген А халкон-синтазы по существу ответственен за мужски стерильный фенотип или что фенотип с мужской стерильностью вызывается мутацией этого гена.
У Jeong et al., J. Exp. Bot. 65 (2014), 6693-6709, мужская стерильность у так называемых томатов-мутантов mslO35 комплементируется и элиминируется посредством комплементации и трансгенной экспрессии различных генов-кандидатов. Способы получения мужской стерильности у трансгенных растений путем ингибирования целевого гена, в данном случае CYPgst, также известны специалисту в данной области из предшествующего уровня техники, см., например, международную заявку WO 1996/017945 и следующие варианты осуществления изобретения.
Таким образом, согласно варианту осуществления настоящего изобретения растение, проявляющее рецессивный ядерно-кодируемый мужски стерильный фенотип, отличается тем, что данный фенотип обусловлен мутацией гена эндогенной цитохром Р450 оксидазы (CYPgst). Растение согласно изобретению также отличается отсутствием, пониженным содержанием или пониженной активностью функционального белка CYPgst, кодируемого геном дикого типа CYPgst, по сравнению с соответствующим мужски фертильным растением дикого типа. Геномная последовательность мутировавшего гена, которая больше не способна транслироваться, представлена в SEQ Ш No. 8, но является только примером, и настоящее изобретение не ограничивается этим. В частности, изобретение касается растения, относящегося к культивируемым и культурным растениям.
Инактивация гена CYP703 Arabidopsis thaliana (CYP703A2), чтобы уменьшить количество образуемой пыльцы и, таким образом, вызвать частичную мужскую стерильность известна из предшествующего уровня техники (Morant et al., The Plant Cell, 19 (2007), 14731487). Это можно объяснить тем, что спорополленин, являющийся основным компонентом внешних стенок пыльцы, отсутствует или структурно изменен. Хотя и представляется возможным, что ген CYPgst выполняет иную функцию, так как мутация вызывает рецессивную ядерно-кодируемую мужскую стерильность, и пыльца не образуется, вероятность того, что ген CYPgst и ген CYP703 Arabidopsis thaliana принадлежат к тому же самому семейству генов и, таким образом, выполняют ту же или по меньшей мере сходную функцию в синтезе спорополленина, нельзя исключать. Безотносительно какой-либо теории, можно предположить, что способность компенсировать потерю споролленина утрачена у культивируемых растений, которые годами направленной селекции и скрещивания оптимизировались относительно урожайности, устойчивости к вредителям, устойчивости к абиотическим стрессовым факторам, а также содержания растительных веществ, и, таким образом, отсутствие споролленина супресирует образование пыльцы, что делает растение мужски стерильным.
Поскольку Morant et al. (2007) показали, что ген CYP703A2 или соответствующие нокаут-линии Arabidopsis проявляют только частичную мужскую стерильность, и что такой фенотип не пригоден для гибридизации, то согласно варианту осуществления изобретения ген CYP703 А2 Arabidopsis thaliana и мутанты, описанные Morant et al., и соавт., особенно те, чьи последовательности представлены на Рис. 1, не являются предметом настоящего изобретения. Соответственно, согласно предпочтительному варианту осуществления изобретения культивируемые и/или культурные растения вида Arabidopsis thaliana предпочтительно исключены из объема настоящего изобретения.
Растения обладают двумя или более копиями генетической информации в каждой клетке в форме эукариот. Каждый ген обычно представлен двумя аллелями, которые могут быть идентичными в гомозиготном состоянии и различными в гетерозиготном состоянии.
Фенотип растения по данному изобретению обусловливается мутацией в ядерном геноме, которая вызывается экспрессией рецессивного признака. Таким образом, согласно варианту осуществления изобретения растение является мужски фертильным, если мутация проявляется в гетерозиготном состоянии, и мужски стерильным, если мутация проявляется в гомозиготном состоянии.
Образование функциональной пыльцы супрессируется, предпочтительно полностью супрессируется у стерильного растения. В контексте настоящего изобретения термин "супрессированный" означает, что у растения, являющегося гомозиготным по мутации гена CYPgst и мужски стерильным, 95%, предпочтительно 96%, более предпочтительно 97% и наиболее предпочтительно 98% или 99% пыльцы не образуется, термин "полностью супрессированный" означает, что образование пыльцы супрессируется на более 99%, предпочтительно 100%. В данном контексте "супрессированный" предпочтительно означает, что в опытах по скрещиванию такого растения, служащего в качестве мужского родителя, с соответствующим растением дикого типа по существу не образуются семена и/или растения-потомки.
Это четко видно на Рис. 1 в отношении Beta vulgaris, подвид vulgaris. У закрытых цветков, у которых чашелистики и лепестки удалены вручную, наблюдаются жизнеспособные пыльники фертильного генотипа (А), имеющие светлую (желтую) окраску. Наоборот, пыльники стерильных генотипов имеют темную (коричневую) окраску (В). Во время цветения пыльники фертильных генотипов раскрываются и выделяется пыльца (С), а пыльники стерильных генотипов не созревают и пыльца не выделяется (D).
У Arabidopsis thaliana белок CYP703 катализирует преобразование среднецепочечных насыщенных жирных кислот в простые гидроксилированные жирные кислоты предпочтительно в процессе гидроксилирования лауриновой кислоты в позиции С-7. Безотносительно какой-либо теории, представляется возможным, что белок CYPgst не выполняет ту же самую функцию, что и белок CYP703 Arabidopsis thaliana, но сходную функцию, потому что инактивация обоих генов влияет на образование пыльцы. Таким образом, можно констатировать, что CYPgst выполняет функцию синтеза спорополленина -основного компонента внешних стенок жизнеспособной пыльцы.
Согласно варианту осуществления изобретения белок CYPgst участвует в синтезе спорополленина и катализирует преобразование среднецепочечных насыщенных жирных кислот с образованием простых гидроксилированных жирных кислот предпочтительно в процессе гидроксилирования лауриновой кислоты в позиции С7.
Транскрипционный анализ (Пример 2) фертильных генотипов Beta vulgaris, подвид vulgaris, показывает, что ген CYPgst экпрессируется в закрытых цветках и плодах, но не экспрессируется в корнях и листьях (Рис. 5). Таким образом, согласно варианту осуществления изобретения растение по изобретению представляет собой растение, описанное выше, отличающееся тем, что ген CYPgst экпрессируется по меньшей мере в закрытых цветках и плодах, предпочтительно специфически в закрытых цветках и плодах.
Согласно варианту осуществления изобретения мутация предотвращает транскрипцию и/или трансляцию функционального белка у растения по данному изобретению, при этом мутация предпочтительно представляет собой делецию, присоединение, инсерцию или замещение в кодирующей нуклеотидной последовательности
гена CYPgst, последовательности сигнала для сплайсинга или регуляторной последовательности, предпочтительно в последовательности промотора гена CYPgst.
Согласно предпочтительному варианту осуществления изобретения делеция представляет собой удаление по меньшей мере 500-600 bp из кодирующего участка или промоторного участка гена CYPgst. Делеция может также иметь длину по меньшей мере в 20, 30 или 50 последовательных пар оснований, по меньшей мере в 100, 150, 200 или 250 последовательных пара оснований и предпочтительно по меньшей мере в 300, 400 или 500 последовательных пар оснований. Присоединение предпочтительно представляет собой добавление нуклеотида или нескольких нуклеотидов в геномную последовательность, предпочтительно в кодирующую последовательность гена, приводящее к сдвигу рамки считывания. Замещение предпочтительно представляет собой точечную мутацию в геномной последовательности, предпочтительно в кодирующей последовательности, в результате которой образуются стоп-кодоны или происходят ошибки сплайсинга.
Сравнительное секвенирование фрагментов геномной ДНК, содержащих ген CYPgst и предполагаемый участок промотора из мужски стерильных и мужски фертильных растений Beta vulgaris, подвид vulgaris, показало, что делеция 533 bp ответственна за мужски стерильный фенотип (см. Пример 2 и Рис. 3), и что участок делеции находится между нуклеотидными позициями 1560 и 2095 SEQ Ш No. 1.
Согласно еще одному предпочтительному варианту осуществления изобретения делеция представляет собой удаление 533 bp и содержит части 5'-UTR и первый экзон гена CYPgst Beta vulgaris, подвид vulgaris; см. Рис. 3. Функциональный ген BvCYPgst содержит два экзона общей длиной 1554 bp. Модель гена, аннотированная в RefBeet 1.2, показана на Рис. 2, и последовательность геномной ДНК CYPgst с делецией, приводящей к образованию усеченного экзона 1, представлена в SEQ Ш No. 8. Возможные точечные мутации, в результате которых может происходить преждевременное прекращение транскрипции гена CYPgst Beta vulgaris, подвид vulgaris, либо которые могут вызывать нарушение сплайсинга, перечислены в Таблице 1 и предпочтительно находятся между нуклеотидными позициями 1560 и 2095 SEQ ID No. 1.
Как показано на Примере 1 настоящего изобретения, тонкое картирование позволяет идентифицировать тесно сцепленные фланкирующие маркеры гена CYPgst и, таким образом, определить позицию гена CYPgst в геноме Beta vulgaris, подвид vulgaris. В свою очередь это создает основу для разработки маркеров мужского родителя, с помощью которых можно детектировать делецию гена CYPgst.
Согласно варианту осуществления настоящего изобретения растение отличается тем, что делецию у ратений сахарной свеклы (Beta vulgaris, подвид vulgaris) можно детектировать посредством определения отсутствия одного или обоих маркерных локусов sle5983dl4 (продукт амплификации праймера, имеющего последовательности SEQ ID No. 4 и 5) и sle5983dl7 (продукт амплификации праймера, имеющего последовательности SEQ ГО No. 6 и 7) и присутствия убиквиторного маркера. Убиквиторный маркер подтверждает удовлетворительную экстракцию ДНК.
Согласно еще одному варианту осуществления изобретения ген Beta vulgaris, подвид vulgaris (сахарная свекла), локализуется в сегменте хромосомы 1 между маркерными локусами sxn215s01 и sle3305s02. В предпочтительном варианте осуществления изобретения
указанные маркерные локусы находятся на расстоянии 33,42 или 35, 15 сМ в хромосоме 1 (основана на генетической карте ZR INT 1202) и основываются на физической карте генома (Physmapv2). Этот участок имеет физический размер 215,4 kbp и располагается между позициями 3185718 bp и 3401120 bp. Были разработаны KASP-маркеры (KASP(tm) -технология SNP генотипирования от LGC Limited), при помощи которых можно идентифицировать SNP или соответствующую референсную последовательность, подлежащую детекции. Последовательность маркера sxn215s01, представленная в SEQ Ш No. 24, и последовательность маркера sle3305s02, представленная в SEQ ID No. 26, указывают на присутствие локуса gst; последовательность маркера sxn2151s01, представленная в SEQ ГО No. 25, и последовательность маркера sle3305s02, представленная в SEQ ГО No. 27, указывают на присутствие референсной последовательности, причем последовательности каждого из маркеров отличаются друг от друга в нуклеотидной позиции 21, и в генотипе, несущем локус gst, в этой позиции присутствует "G", а в референсном генотипе KWS2320 в этой позиции присутствует "А".
Согласно предпочтительному варианту осуществления изобретения длина сегмента составляет приблизительно от 50 до 5000 kbp, предпочтительно от 100 до 1000 kbp, более предпочтительно от 100 до 500 kbp и наиболее предпочтительно от 200 до 250 kbp, при этом сегмент содержит другие гены, кодирующие белки, предпочтительно 21 ген.
Согласно варианту осуществления настоящего изобретения не мутировавший ген представляет собой функциональный ген BvCYPgst Beta vulgaris, предпочтительно Beta vulgaris, подвид vulgaris, либо функциональный гомологичный, аналогичный или ортологичный ген другого культурного или культивируемого растения.
Специалист в данной области техники может получать информацию о других белках CYPgst из соответствующих публикаций, а также из баз данных, используя подходящие параметры поиска и компьютерные программы для скрининга гомологичных последовательностей или сравнения последовательностей. Кроме того, специалист в данной области техники может определить другие последовательности ДНК, кодирующие белок CYPgst, при помощи традиционных технологий молекулярной биологии и применять их в рамках настоящего изобретения. Таким образом из последовательности гена CYPgst могут быть получены, например, подходящие зонды для гибридизации и использованы для скрининга баз данных геномных ДНК и/или сДНК для поиска желаемого организма. Специалист в данной области техники может, например, получить сведения о стандартных методах гибридизации, клонирования и секвенирования из публикации Sambrook et al., Molecular Cloning; A Laboratory Manual 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001. Специалист в данной области техники может также синтезировать и использовать олигонуклеотиды (праймеры) для амплификации последовательностей CYPgst на основе известных последовательностей.
В частности, согласно предпочтительному варианту осуществления изобретения гомологичный, аналогичный или ортологичный ген представляет собой ген Zea mays, который предпочтительно содержит нуклеотидную последовательность SEQ ГО No. 9 или 10 или кодирует аминокислотную последовательность, представленную в SEQ ГО No. 11, ген Solarium tuberosum, который предпочтительно содержит одну из нуклеотидных последовательностей SEQ ГО No. 12 или 13 или кодирует аминокислотную последовательность, представленную в SEQ ГО No. 14, ген Triticum aestivum, который
предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 15, ген Helianthus annuus, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 16, ген Hordeum vulgarе, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 17, ген Brassica napus, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 18, ген Brassica oleracea, который предпочтительно кодирует аминокислотную последовательность представленную в SEQ Ш No. 19, ген Brassica гора, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 20, ген Glycine max, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 21, ген Gossypium, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ ID No. 22, а также ген Sorghum bicolor, который предпочтительно кодирует аминокислотную последовательность, представленную в SEQ Ш No. 23. Указанные растения можно классифицировать как культурные растения и предпочтительно как культивируемые растения.
Согласно варианту осуществления растение по данному изобретению является растением, описанным выше, которое отличается тем, что не мутировавший ген (ген дикого типа) имеет одну из нуклеотидных последовательностей, выбираемых из группы, состоящей из нуклеотидных последовательностей, представленных в SEQ ID No. 1, 2, 9, 10, 12 и 13.
Согласно варианту осуществления изобретения не мутировавший ген (ген дикого типа) имеет нуклеотидную последовательность, которая кодирует аминокислотную последовательность, представленную в SEQ Ш No. 3, 11 или 14.
Нуклеотидную последовательность можно вводить в ген, используя традиционные методы, известные из предшествующего уровня техники, например, посредством сайт-направленного мутагенеза, ПЦР-индуцированного мутагенеза, транспозонного мутагенеза, геномного редактирования и т.п., замещений, делеций, инсерций, присоединений и/или любой иной модификации, как в отдельности, так и в любой их комбинации, которые модифицируют нуклеотидную последовательность с сохранением той же функции стартовой последовательности.
Изобретение также охватывает растение, описанное выш, отличающееся тем, что нуклеотидная последовательность может содержать функциональный фрагмент нуклеотидных последовательностей SEQ Ш No. 1, 2, 9, 10, 12 и 13. Термин "фрагмент" включает гены, нуклеотидная последовательность которых в значительной степени сходная с вышеупомянутой нуклеотидной последовательностью. Термин "в значительной степени сходный" означает, что последовательность первого нуклеотида или первой аминокислоты содержит достаточное или минимальное количество нуклеотидов или аминокислотных остатков, идентичных или эквивалентных последовательности второго нуклеотида или второй аминокислоты. Что касается аминокислотных последовательностей, то после модификации с помощью одного из вышеуказанных методов они также имеют общую доменную структуру и/или общую функциональную активность. В значительной степени сходными являются нуклеотидные последовательности или аминокислотные последовательности, которые обладают по меньшей мере около 45%, по меньшей мере около 50%, по меньшей мере около 55%, по меньшей мере около 60%, по меньшей мере около 65%, по меньшей мере около 70%, по меньшей мере около 75%, по меньшей мере около
80%, по меньшей мере около 85%, по меньшей мере около 90%, по меньшей мере около 95%, по меньшей мере около 96%, по меньшей мере около 97%, по меньшей мере около 98%, по меньшей мере около 99% или по меньшей мере около 100% идентичностью. Функциональные фрагменты предпочтительно являются в значительной степени сходными, если они обладают теми же общими свойствами, что и вышеупомянутые нуклеотидные или аминокислотные последовательности по данному изобретению.
Согласно варианту осуществления изобретения не мутировавший ген (ген дикого типа), содержащийся в растении, имеет нуклеотидную последовательность, способную гибридизоваться в жестких условиях с нуклеотидной последовательностью, которая комплементарна одной из нуклеотидных последовательностей SEQ Ш No. 1, 2, 9, 10, 12 и 13, либо которая кодирует аминокислотную последовательность, представленную в SEQ Ш No. 3, 11 или 14. Согласно другому варианту осуществления изобретения не мутировавший ген (ген дикого типа) содержит нуклеотидную последовательность, которая кодирует аминокислотную последовательность, имеющую различия по сравнению с аминокислотной последовательностью, представленной в SEQ Ш No. 3, 11 или 14, в форме аминокислотных делеций, замещений, присоединений и/или инсерций в аминокислотной последовательности, предпочтительно не превышающие 20%, 15%, 10%, 5%, 4%, 3%, 2% или 1% относительно всей длины аминокислотной последовательности.
Согласно еще одному или дополнительному варианту осуществления изобретения нуклеотидная последовательность не мутировавшего гена (гена дикого типа) кодирует белок, обладающий той же ферментативной активностью, что и белок, кодируемый ДНК по предыдущему варианту осуществления.
Согласно еще одному варианту осуществления изобретения не мутировавший ген (ген дикого типа), содержащийся в растении, имеет ДНК, содержащую по меньшей мере 200 или 400, предпочтительно по меньшей мере 600 или 800, наиболее предпочтительно по меньшей мере 1000 последовательных нуклеотидов из промотора нуклеотидной последовательности SEQ Ш No. 1 с нуклеотидными позициями от 1 до 1518, предпочтительно от 518 до 1518, наиболее предпочтительно от 1318 до 1518, либо последовательности, являющейся гибридной в данном участке, причем нуклеотидная последовательность способна контролировать экспрессию гена или гетерологичной молекулы нуклеиновой кислоты, оперативно связанной с ДНК, особенно в закрытых цветках и/или плодах.
Согласно варианту осуществления изобретения растение может быть инбредным или гибридным растением. Инбредное растение можно использовать в качестве родительского растения для получения гибридов. Преимуществом использования рецессивного ядерно-кодируемого мужски стерильного гетерозиготного инбредного растения в отношении признака является то, что оно расщепляется на фертильные и стерильные индивиды на каждом репродуктивном этапе. Индивид с мужской стерильностью можно использовать для получения гибридов, при этом исключается ручное удаление пыльников и не требуется иметь линию-закрепитель стерильности.
Согласно варианту осуществления изобретения растение по данному изобретению является растением рода Zea, Solarium, Triticum, Triticale, Helianthus, Secale, Hordeum, Brassica, Brachypodium, Glycine, Gossypium, Sorghum, Saccharum, Setaria, Aegilops, Oryza, Daucus, Eucalyptus, Erythranthe, Genlisea, Musa, Avena, Nicotiana, Coffea, Vitis, Cucumis,
Morus, Crucihimalaya, Cardamine, Lepidium, Capsella, Olimarabidopsis, Arabis, Raphanus, Eruca, Citrus, Jatropha. Populus или Beta, предпочтительно растение вида Zea mays, Solarium tuberosum, Triticum aestivum, Triticum durum, Triticum spelta, Helianthus annuus, Secale cereal, Hordeum vulgare, Hordeum bulbosum, Brassica napus, Brassica oleracia, Brassica rapa, Brassica juncacea, Brassica nigra, Glycine max, Gossypium sp., Sorghum bicolor,Triticale, Saccharum offwinarum, Setaria italica, Oryza sativa, Oryza minuta, Oryza australiensis, Oryza alta, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiantus, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Erythranthe guttate, Genlisea aurea, Musa sp., Avena sp., Nicotiana sylvestris, Nicotiana tabacum, Nicotiana tomentosiformis, Solanum lycopersicum, Coffea canephora, Vitis vinifera, Cucumis sativus, Morus notabilis, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa-pastoris, Olimarabidopsis pumila, Arabis hirsute, Raphanus sativus, Eruca vesicaria sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa или Beta vulgaris. Эти растения относятся к культурным растениям, в частности культивируемым растениям.
Согласно еще одному варианту осуществления настоящее изобретение касается не только растение по данному изобретению, имеющему мутацию в гене CYPgst, но также молекулы ДНК, содержащей нуклеотидную последовательность, как показано выше, имеющую мутацию в форме делеции, присоединения, инсерции или замещения, при этом мутация не приводит к синтезу функционального белка CYPgst.
Согласно предпочтительному варианту осуществления изобретения мутация в кодирующей нуклеотидной последовательности гена CYPgst представляет собой мутацию в последовательности сигнала для сплайсинга или регуляторной последовательности гена CYPgst, предпочтительно находящуюся в промоторе гена CYPgst. Мутация может быть делецией между нуклеотидными позициями 1560 и 2095 SEQ Ш No. 1 или между соответствующими позициями в SEQ Ш No. 12 или 9. Делеция может иметь длину по меньшей мере в 20, 30 или 50 последовательных пар оснований, предпочтительно по меньшей мере в 100, 150, 200 или 250 последовательных пар оснований и наиболее предпочтительно по меньшей мере в 300, 400 или 500 последовательных пар оснований. Согласно наиболее предпочтительному варианту осуществления изобретения молекула нуклеиновой кислоты содержит нуклеотидную последовательность, соответствующую последовательности, представленной в SEQ Ш No. 8. Согласно еще одному предпочтительному варианту осуществления изобретения молекула нуклеиновой кислоты содержит точечную мутацию в нуклеотидной последовательности SEQ Ш No. 1 согласно Таблице 1, предпочтительно между нуклеотидными позициями 1560 и 2095 SEQ Ш No. 1.
Как показано выше, зонды для гибридизации ДНК, получаемые из последовательности гена CYPgst, можно использовать для скрининга баз данных геномных и/или сДНК для поиска других организмов с целью идентификации гомологичных генов. Для осуществления специфической гибридизации такие зонды должны быть специфическими и иметь по меньшей мере 15 нуклеотидов в длину, предпочтительно по меньшей мере 20 нуклеотидов. Зонды можно использовать для амплификации идентифицированных гомологичных генов посредством процесса, известного как полимеразная цепная реакция (ПЦР). Кроме того, данные зонды можно также использовать для детекции мутаций в гене CYPgst. Подробные инструкции по гибридизации нуклеиновых кислот можно найти у Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology -Hybridization with Nucleic Acid Probes, part 1, Chapter 2, "Overview of Principles of
Hybridization and the Strategy of Nucleic Acid Probe Assays," Elsevier, New York (1993); и в Protocols in Molecular Biology, Chapter 2, Ausubel et al., eds., Greene Publishing and Wiley Interscience, New York (1995).
Таким образом, предметом настоящего изобретения является молекула нуклеиновой кислоты, состоящая по меньшей мере из 15, 16, 17, 18, 19 или 20, предпочтительно по меньшей мере из 21, 22, 23, 24 или 25, более предпочтительно по меньшей мере из 30, 35, 40, 45 или 50 и наиболее предпочтительно по меньшей мере из 100, 200, 300, 500 или 1000 нуклеотидов, при этом данная молекула нуклеиновой кислоты специфически гибридизуется с нуклеотидной последовательностью, описанной выше, которая содержит не мутировавший ген CYPgst дикого типа, либо с молекулой ДНК, описанной выше, которая содержит мутацию в форме делеции, присоединения, инсерции или замещения, в результате которой не образуется функциональный белок CYP703. Молекула нуклеиновой кислоты предпочтительно соответствует варианту осуществления изобретения, представленному в параграфе [17].
Позицию гена CYPgst в геноме Beta vulgaris, подвид vulgaris, можно определять при помощи тонкого картирования, описанного выше. В свою очередь это дает основу для разработки генетических маркеров, посредством которых можно детектировать делецию гена CYPgst.
Таким образом, помимо растений, описанных выше, настоящее изобретение также касается маркеров в форме олигонуклеотидов, в частности олигонуклеотидных праймеров. Они содержат молекулу нуклеиновой кислоты размером по меньшей мере 15 нуклеотидов, специфически гибридизированную с нуклеотидной последовательностью, как описано выше, либо с молекулой ДНК, описанной выше, имеющую мутацию в форме делеции, присоединения, инсерции или замещения, в результате которой не образуется функциональный белок CYPgst. Указанные олигонуклеотиды предпочтительно имеют не более 50 нуклеотидов в длину. Более предпочтительны олигонуклеотиды, которые являются даже более короткими и имеют от 15 до 25 нуклеотидов в длину. Как показано в Примере 2 настоящего изобретения, олигонуклеотиды предпочтительно имеют одну из следующих нуклеотидных последовательностей: (i) SEQ Ш No. 4, 6 или их комплемент, либо (ii) SEQ Ш No. 5, 7 или их комплемент.
Предметом настоящего изобретения также является белок CYPgst, способный кодироваться нуклеотидной последовательностью, описанной выше, и его функциональный и/или иммунологически активный фрагмент, а также антитело, которое специфически связывается с описываемым здесь белком или его фрагментом. Получение рекомбинантных белков и фрагментов известно специалисту в данной области техники; см., например, Sambrook et al., Molecular Cloning; A Laboratory Manual, 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001, или Wingfield, P.T. 2008, Production of Recombinant Proteins, Current Protocols in Protein Science, 52:5.0:a5.0.1-5.0.5. Поликлональные или моноклональные антитела к белку по данному изобретению могут быть получены специалистом в данной области техники согласно методам, известным у Е. Harlow et al., Antobodies: A Laboratory Manual (1988). Моноклональные антитела и фрагменты Fab и F(ab')2, которые можно также использовать для детекции белка, можно получать с помощью различных традиционных методов, таких как у Goding, Monoclonal Antibodies: Principles and Practice, pp. 98-118, New York; Academic Press (1983). Антитела можно затем использовать
для иммунологического скрининга экспрессионных библиотек сДНК с целью идентификации идентичных, гомологичных или гетерологичных генов (Sambrook et al., Molecular Cloning; A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001, или Ausubel et al, 1994, "Current Protocols in Molecular Biology", John Wiley & Sons).
Согласно предпочтительному варианту осуществления изобретения белок CYPgst отноится к аминокислотным последовательностям, представленным в SEQ Ш No. 3, Пили 14-23, либо аминокислотной последовательности, которая по меньшей мере на 80%, 82%, 84%, 86% или 88%, предпочтительно на 90%, 91%, 92%, 93%, 94% или 95%, наиболее предпочтительно на 96%, 97%, 98%, 99% или 99,5% идентична аминокислотной последовательности, представленной в SEQ Ш No. 3, предпочтительно по всей ее длине.
Изобретение также касается рекомбинантной молекулы ДНК, которая содержит не мутировавший ген CYPgst (ген дикого типа) и обладает вышеуказанными свойствами нуклеотидной последовательности, содержащейся в растении по данному изобретению. Рекомбинантная молекула ДНК предпочтительно содержит промотор и/или иной элемент управления транскрипцией или трансляцией, либо связана с ним. Используемые промоторы являются, в основном, промоторами со специфической активностью в клетках, обеспечивающими транскрипцию ДНК только в заранее определенных клетках. Кроме промоторов, имеются, но не ограничиваются ими, другие элементы управления транскрипцией, например, энхансеры, операторы, репрессоры, а также сигналы терминации транскрипции, которые функционально связаны с ДНК для обеспечения направленной клеточноспецифической транскрипции. Промоторы и другие элементы регуляции транкрипции в общем известны и доступны специалисту в данной области техники; см., например, WO 00/75359, строчки 5-17, стр. 24. Данную рекомбинантную молекулу ДНК можно использовать для восстановления фертильности у растений, являющихся рецессивными ядерно-кодируемыми мужскую стерильными по фенотипу.
Поскольку, как показано выше, ген CYPgst экспрессируется в закрытых цветках и плодах и не экспрессируется в корнях или листьях, то в предпочтительном варианте осуществления изобретения рекомбинантная молекула ДНК содержит промотор, который имеет нуклеотидную последовательность, описанную выше, и оперативно связан с гетерологичной нуклеотидной последовательностью, или кодирующую нуклеотидную последовательность, как описано выше, которая содержит ген CYPgst дикого типа и оперативно связана с гетерологичным промотором. Данный промотор предпочтительно способен контролировать экспрессию нуклеотидной последовательности, особенно в закрытых цветках и/или плодах. Рекомбинантная молекула ДНК более предпочтительно содержит естественный промотор не мутировавшего гена CYPgst Beta vulgaris, подвид vulgaris (SEQ Ш No. 1).
Соответственно, настоящее изобретение также касается использования описанных здесь молекулы ДНК или промотора для специфической экспрессии гетерологичных молекул нуклеиновой кислоты в цветках и/или плодах растения. Для этого требуется, чтобы гетерологичная молекула нуклеиновой кислоты была оперативно связана с соответствующим промотором, и чтобы такая рекомбинантная молекула ДНК была введена в целевую клетку, предпочтительно растительную клетку. Методы гетерологичной экспрессии рекомбинантных молекул ДНК будут рассмотрены более подробно ниже.
Еще одним предметом настоящего изобретения является рекомбинантная молекула ДНК, имеющая нуклеотидную последовательность по данному изобретению, которая кодирует shPHK (малую РНК, образующую шпильки), siPHK (малую интерферирующую РНК), отрицательно-полярную РНК, положительно-полярную РНК или двухцепочечную РНК. Они ингибируют трансляцию тРНК гена CYPgst или разрушают тРНК гена CYPgst в клетках посредством пар оснований. Соответственно, введение и/или экспрессия рекомбинантной молекулы ДНК в растении приводит к ингибированию экспрессии функционального (не мутировавшего) гена CYPgst. В предпочтительном варианте осуществления изобретения нуклеотидная последовательность проявляет свойства, подробно описанные в параграфе [15].
Еще одним предметом настоящего изобретения являются векторы, содержащие рекомбинантные молекулы ДНК, последовательности нуклеиновой кислоты или молекулы нуклеиновой кислоты по данному изобретению. Вектор по данному изобретению может содержать не мутировавший ген CYPgst (ген дикого типа) с вышеупомянутыми свойствами нуклеотидной последовательности и предпочтительно один из описанных выше промоторов. Другой вектор может содержать рекомбинантную молекулу ДНК, которая содержит не мутировавший ген CYPgst дикого типа, связанный с гетерологичной молекулой нуклеиновой кислоты, или рекомбинантную молекулу ДНК, которая содержит опианную выше нуклеотидную последовательность, оперативно связанную с гетерологичным промотором, причем в любом случае промотор предпочтительно способен специфически контролировать экспрессию нуклеотидной последовательности в закрытых цветках и/или плодах. Помимо этого, вектор может содержать рекомбинантную молекулу ДНК, имеющую нуклеотидную последовательность, которая кодирует shPHK, siPHK, отрицательно-полярную РНК, положительно-полярную РНК или двухцепочечную РНК, что приводит к ингибированию экспрессии гена CYPgst после экспрессии в растительной клетке.
Более того, вектор может содержать молекулу ДНК, имеющую одну из описанных выше мутаций или описанную выше молекулу нуклеиновой кислоты, которая специфически связывается с нуклеотидной последовательностью не мутировавшего гена CYPgst (дикого типа) или с нуклеотидной последовательностью мутировавшего гена CYPgst.
Описанный вектор может представлять собой плазмиду, космиду, фаг или экспрессионный вектор, трансформационный вектор, челночный вектор или клонирующий вектор; он может быть одно- или двухцепочечным, линейным или кольцевым, и он способен трансформировать прокариотического или эукариотического хозяина посредством интеграции в его геном или экстрахромосомно. Молекула ДНК или молекула нуклеиновой по данному изобретению оперативно связана с одной или несколькими регуляторными последовательностями в экспресионном векторе, которые обеспечивают транскрипцию и, как вариант, экспрессию в прокариотической или эукариотической клетке-хозяине; см., например, Sambrook et al., Molecular Cloning: A Laboratory Manual, 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY 2001 и международную патентную заявку WO 00/75359, стр. 21, строчка 20, стр. 22, строчка 32. Данные регуляторные последовательности предпочтительно представляют собой промоторы или терминаторы, в частности относительно стартовой точки для инициации транскрипции, сайт связывания рибосомы, сигнал процессинга РНК, сайт терминации транскрипции и/или сигнал к полиаденилированию. Как правило, векторы также содержат индикаторные/репортерные гены или гены устойчивости для детекции переноса желаемого вектора, а также молекулы
ДНК/молекулы нуклеиновой кислоты для отбора содержащих их индивидов, поскольку прямая детекция посредством экпрессии гена обычно весьма затруднена. Примерами индикаторных/репортерных генов являются ген люциферазы и ген, кодирующий зеленый флуоресцентный белок (GFP). Они также позволяют тестировать активность и/или регуляцию промотора гена. Примерами генов устойчивости, особенно для трансформации растений, являются ген неомицин-фосфотрансферазы, ген гигромицин-фосфотрансферазы или ген, который кодирует фосфинотрицин ацетилтрансферазу. Это не исключает другие индикаторные/репортерные гены или гены устойчивости, известные специалисту в данной области техники. В предпочтительном варианте осуществления изобретения вектор является растительным вектором.
Еще одним объектом изобретения является описанный выше вектор, отличающийся тем, что молекула ДНК в качестве трансгена способна экспрессировать функциональный ген CYPgst и предпочтительно генетически связана с другим трансгеном, который предотвращает перенос молекулы ДНК через пыльцу. Фертильность можно восстановливать путем введения данного вектора в мутант, являющийся мужски стерильным вследствие мутации в гене CYPgst. Поскольку перенос трансгенного функционального CYPgst через пыльцу невозможен, то образуются только гемизиготные семена путем самоопыления трансгенной линии.
Вектор или трансген, соответственно, предпочтительно также содержит экспрессионную кассету, маркирующую семена, предпочтительно при помощи флуоресцентных меток. Используя данный метод, можно легко дифференцировать трансгенные и нетрансгенные семена. Эта система использования ядерно-кодируемой мужской стерильности была разработана компанией Pioneer. Система под названием SEED PRODUCTION TECHNOLOGY (SPT) (US 2006288440 Al), разработанная для кукурузы, основывается на том факте, что стерильный мутант, имеющий мутацию в известном ядерно-кодируемом гене, может быть восстановлен путем введения трансгена. Трансген содержит не мутировавший аллель гена стерильности, благодаря чему трансген выполняет функцию аллеля дикого типа. Трансген восстановления фертильности генетически связан с другим трансгеном, который предотвращает перенос трансгена через пыльцу (убийца пыльцы). В результате образуются только гемизиготные семена путем самоопыления трансгенной линии, что играет основную роль в обеспечении эффективности системы.
Трансген также содержит экспрессионную кассету, маркирующую семена с использованием красного флуоресцентного красителя. В результате можно легко дифференцировать трансгенные и нетрансгенные семена. Поскольку трансгенные семена являются фертильными, растения автоматически разделяются на фертильные и стерильные растения. Материнские формы растений, необходимые для создания гибридов, получают путем высевания нетрансгенных семян, а трансгенные семена можно использовать в качестве отцовской линии для последующей репродукции материнской линии (линии-закрепителя), а также репродуцировать путем простого самовоспроизводства (см. Рис. 5). Теоретически, систему SPT можно использовать в отношении всех видов растений. Для этого требуются наличие линии с генетической мужской стерильностью и сведения о гене, который ответственен за фенотип с генетической мужской стерильностью. В результате, теоретически, систему SPT можно также использовать для разработки системы гибридизации в отношении каждого вида культивируемого растения, например, такого как сахарная свекла или картофель.
Настоящее изобретение также касается клеток-хозяев, содержащих описанные векторы, рекомбинантные молекулы ДНК и/или молекулы нуклеиновой кислоты. Клетка-хозяин по данному изобретению может быть прокариотической (например, бактериальной) или эукариотической клеткой (например, растительной клеткой или дрожжевой клеткой). Предпочтительно клетка-хозяин представляет собой агробактерию или растительную клетку. Настоящее изобретение предпочтительно относится к трансгенной растительной клетке, содержащей молекулу нуклеиновой кислоты по данному изобретению в качестве трансгена или вектор по данному изобретению. Такая трансгенная растительная клетка представляет собой, например, растительную клетку, тарнсформированную, предпочтительно стабильно трансформированную, молекулой нуклеиновой кислоты по данному изобретению. В предпочтительным варианте трансгенной растительной клетки молекула нуклеиновой кислоты оперативно связана с одной или несколькими регуляторными последовательностями, которые обеспечивают транскрипцию и, как вариант, экспрессию в растительной клетке. Общая структура, включающая молекулу нуклеиновой кислоты и регуляторные последовательности, представляет собой, таким образом, трансген. Как пример, такие регуляторные последовательности могут содержать промотор или терминатор. Специалисту в данной области техники известны многочисленные функциональные промоторы и терминаторы, которые могут использоваься в растениях.
Изобретение также относится к идентификации гена CYPgst, ответственного за экспрессию признака рецессивной ядерно-кодируемой мужской стерильности, для получения трансгенных растений с такой экспрессией признака и, таким образом, восстановления фертильности.
Согласно варианту осуществления изобретения обеспечивается набор, содержащий описанные выше рекомбинантные молекулы ДНК или молекулы нуклеиновой кислоты и векторы, соответственно, которые необходимы для получения растений с рецессивной ядерно-кодируемой мужской стерильностью, а также для восстановления фертильности растений, имеющих этот фенотип. Данный набор также содержит рекомбинантную молекулу ДНК, содержащую промотор с заранее определенной нуклеотидной последовательностью или гетерологичный промотор, при этом первый связан с гетерологичной молекулой нуклеиновой кислоты, а второй связан с заранее определенной нуклеотидной последовательностью, кодирующей не мутировавший (дикого типа) ген CYPgst. Кроме того, набор может содержать вектор, причем молекула ДНК в качестве трансгена способна экспрессировать функциональный ген CYPgst и предпочтительно связана с другим трансгеном, который предотвращает перенос молекулы ДНК через пыльцу, а также экспрессионную кассету, маркирующую семена. Набор может содержать заранее определенную молекулу нуклеиновой кислоты для идентификации мутации в гене CYPgst, которая гибридизуется с заранее определенной нуклеотидной последовательностью, содержащей не мутировавший (дикого типа) ген CYPgst, или с соответствующим геном с заранее определенной мутацией, либо описанный выше олигонуклеотид. Набор может также содержать описанный выше ген CYPgst или его фрагмент, а также описанные выше антитела. Предпочтительно, чтобы набор также содержал реагенты предназначенные для процедур, основанных на детекции нуклеиновых кислот, или для иммунологической детекции.
Трансгенное растение является, например, растением, которое содержит растительные клетки, трансформированные молекулой ДНК/молекулой нуклеиновой кислоты по данному
изобретению или вектором по данному изобретению. В предпочтительном варианте трансгенного растения молекула ДНК/молекула нуклеиновой кислоты оперативно связана с одной или несколькими регуляторными последовательностями, обеспечивающими транскрипцию и, как вариант, экспрессию в растении. Общая структура, включающая молекулу нуклеиновой кислоты по данному изобретению и регуляторные последовательности представляет собой, таким образом, трансген. Термин "трансген" также означает рекомбинантную последовательность нуклеиновой кислоты, кодирующую полипептид.
Олигонуклеотиды, нуклеиновые кислоты, молекулы ДНК и векторы, которые были описаны выше, можно также использовать для получения трансгенного растения. Таким образом, настоящее изобретение также касается использования данных олигонуклеотидов, нуклеиновых кислот, молекул ДНК и векторов для получения трансгенного растения, проявляющего гомозиготный рецессивный ядерно-кодируемый мужски стерильный фенотип, отличающегося тем, что во время получения растения с восстановленной фертильностью по данному изобретению или трансгенной клетки-хозяина, предпочтительно растительной клетки, экспрессия гена CYPgst ингибируется. Кроме того, описанные выше олигонуклеотиды, нуклеиновые кислоты, молекулы ДНК и векторы можно также использовать в соответствующих способах получения таких трансгенных растений или растительных клеток. Трансгенное растение предпочтительно представляет собой культурное растение или более предпочтительно культивируемое растение.
Из предшествующего уровня техники известны различные способы получения, идентификации или отбора трансгенных растений, при которых супрессируется транскрипция/трансляция белка или вводится признак восстановления. Специалисту в данной области техники известны способы получения трансгенных культивируемых растений и их идентификации с использованием методов молекулярной биологии; относительно трансгенных растений сахарной свеклы, устойчивых к глифосату, см., например, международные патентные заявки WO 99/023232 и WO2004/074492, или относительно общей трансформации растений - WO2000/018939 и WO2013/138309.
Соответственно, согласно варианту осуществления изобретения обеспечен способ получения растения, проявляющего гомозиготный рецессивный ядерно-кодируемый мужски стерильный фенотип, отличающийся тем, что экспрессия гена CYPgst ингибируется, причем данное растение предпочтительно является культурным растением и более предпочтительно культивируемым растением. Рекомбинантная молекула ДНК, экспрессирующая полинуклеотид, вводится в растительную клетку путем трансформации, например, с использованием вектора, в результате чего экспрессия полинуклеотида приводит к ингибированию белка CYPgst.
Как пример, описанная выше мутация, приводящая к ингибированию экспрессии CYPgst, может вызываться посредством генетической рекомбинации в процессе скрещивания растений между собой, при этом одно из растений несет мутировавший аллель CYPgst.
Помимо использования традиционных селекционных программ для генерирования генетической рекомбинации, современная биотехнология предоставляет специалисту в данной области техники много других инструментов точной генетической инженерии. Как
пример, Т-ДНК мечение можно использовать для разрушения гена CYPgst посредством инсерционного мутагенеза. Кроме того, весь ген CYPgst или его часть можно делетировать посредством генетической мутации с использованием TALE-нуклеаз (TALEN) или нуклеаз "цинковые пальцы" (ZFN) и систем CRISPR/Cas, которые описаны в WO2014/144155 А1 (Engineering Plant Genomes Using CRISPR/Cas Systems) и у Osakabe & Osakabe, Plant Cell Physiol., 56 (2015), 389-400, так, что предотвращается экспрессия гена CYPgst Это может также достигаться путем использования метода, называемого TILLING (целенаправленные индуцированные локальные нарушения в геномах), при котором в гене дикого типа вызывается точечная мутация, как показано в немецкой патентной заявке DE 10 2013 101 617, и затем отбираются растения, проявляющие подходящий, т.е. обеспечивающий устойчивость, ген, например, ячмень, который, проявляет устойчивость к вирусу желтой мозаики; см., например, DE 10 2013 101 617, стр. 4, 8 и 12 в параграфах [0014], [0026] и [0038]. Метод TILLING также подробно рассматривается в публикации Henikoff et al. (Henikoff et al., Plant Physiol., 135, 2004, 630-636). Точечные мутации в гене CYPgst Beta vulgaris, подвид vulgaris, способные приводить к стоп-кодонам или ошибкам сплайсинга, приводятся в Таблице 1.
Ингибирование экспрессии также возможно с помощью подходов iPHK и косупрессии. Они заключаются во введении рекомбинантной молекулы ДНК или молекулы нуклеиновой кислоты, описанных выше, или соответствующего вектора в растение, при этом в результате экспрессия кодируемых молекул shPHK, отрицательно-полярной РНК или положительно-полярной РНК приводит к ингибированию экспрессии гена CYPgst. Такие методы, основанные на iPHK и косупрессии, являются стандартными методами для ингибирования экспрессии генов и известны специалисту в данной области техники. Подход положительной полярности, включающий использование молекулы мишень-специфической неполиаденилированной РНК, может приводить к ингибированию экспрессии гена CYPgst. Данный метод описывается, как пример, в международной патентной заявке WO2001/012824.
Согласно еще одному варианту осуществления изобретение касается способа восстановления фертильности растения по данному изобретению, включающего введение в растение функционального гена CYPgst. Ген CYPgst можно вводить путем использования методов генетической инженерии, с помощью рекомбинантной ДНК по данному изобретению, предпочтительно содержащей элементы контроля транскрипции, предпочтительно промотор для специфической экспрессии гена в закрытых цветках и/или плодах, либо посредством векторов по данному изобретению. Ген CYPgst можно также вводить путем скрещивания с растением, несущим ген CYPgst дикого типа или функциональный ген CYPgst, предпочтительно в гомозиготном состоянии. Как вариант, отбор по признаку присутствия гена CYPgst дикого типа или функционального гена CYPgst можно проводить в поколениях после скрещивания.
Объектом настоящего изобретения является растение, которое содержит заранее определенную растительную клетку и/или которое получают описанным выше способом. Это означает растение, имеющее рецессивный ядерно-кодируемый мужски стерильный фенотип, а также растение с восстановленной фертильностью, полученное либо посредством генетической рекомбинации с использованием традиционных селекционных методов, либо являющееся трансгенным растением, в котором экспрессия гена CYPgst ингибируется вследствие различных методов, упомянутых выше, в результате которых получается
растение с рецессивным ядерно-кодируемым мужски стерильным фенотипом или восстанавливается фертильность растения посредством введения рекомбинантных молекул ДНК. Такое растение предпочтительно является культивируемым растением, наиболее предпочтительно культурным растением, предпочтительно имеющим запасающие органы, которые потенциально могут функционировать как репродуктивные органы, такие как корни или клубни растений сахарной свеклы или картофеля, зерно тритикале, овса, проса и кукурузы, плоды, например, томаты и т.п. Согласно варианту осуществления изобретения низшие растения и резушка Таля Arabidopsis thaliana непосредственно не являются предметом настоящего изобретения.
Помимо растений, проявляющих рецессивный ядерно-кодируемый мужски стерильный фенотип в результате спонтанной мутации в гене CYPgst, растений, которым данный фенотип придается путем генетической рекомбинации с использованием традиционных селекционных методов, или растений, которым данный фенотип был придан посредством генной инженерии с использованием современной биотехнологии, а также растений, у которых фертильность восстановлена посредством соответствующих методов, изобретение также касается органов, растительных частей, тканей, клеток, а также семян или потомков таких растений. Согласно варианту осуществления изобретения семена или потомки имеют одну или несколько описанных выше мутаций, которые приводят к ингибированию экспрессии гена CYPgst, и/или семена или потомки проявляют рекомбинантную молекулу ДНК, молекулу нуклеиновой кислоты или вектор, описанные выше.
Согласно варианту осуществления изобретения обеспечен способ идентификации растения по данному изобретению. Данный способ идентификации можно использовать в отношении растения, имеющего рецессивный ядерно-кодируемый мужски стерильный фенотип в результате спонтанной мутации в гене CYPgst, а также растения, которому данный фенотип был придан путем генетической рекомбинации с использованием традиционных селекционных методов, или растения, которому данный фенотип был придан путем генной инженерии с использованием современной биотехнологии. Кроме того, при помощи данного способа можно идентифицировать растение, у которого посредством соответствующего метода была восстановлена фертильность. Для идентификации растения по данному изобретению в качестве зонда для гибридизации можно использовать ранее определенную молекулу нуклеиновой кислоты, которая имеет минимальную длину 15 нуклеотидов и специфически связывается с ранее определенной нуклеотидной последовательностью, содержащей не мутировавший (дикого типа) ген CYPgst и ген CYPgst с ранее определенной мутацией, приводящей к ингибированию экспрессии гена. Более того, для идентификации можно использовать вышеописанные олигонуклеотид, белок CYPgst или его фрагмент, а также антитела и компоненты набора, описанные выше.
Настоящее изобретение также касается использования рекомбинантных молекул ДНК или молекул нуклеиновой кислоты, векторов по данному изобретению и компонентов набора по данному изобретению для получения рецессивного ядерно-кодируемого мужски стерильного растения, растения с восстановленной фертильностью, гибридного растения в программах селекции на устойчивость или для производства семян.
Способ получения обратимой мужской стерильности у растения, в котором можно использовать ген CYPgst, описан, как пример, в международной патентной заявке WO96017945 и состоит из этапов:
(a) введения первой рекомбинантной молекулы ДНК в геном пыльцы для получения растения, которое может быть генетически трансформировано, причем первая рекомбинантная молекула ДНК содержит:
(i) нуклеотидную последовательность, кодирующую генетический продукт, который ингибирует образование или функцию пыльцы, в зависимости от экспрессии в растении, в данном случае гена CYPgst по данному изобретению, или генетического продукта, например, посредством экспрессии последовательности iPHK;
(ii) оператор, контролирующий экспрессию нуклеотидной последовательности; и
(iii) промотор со специфической активностью в клетках, критически важных для
образования пыльцы или ее функционирования, при этом промотор функционально связан с
нуклеотидной последовательностью, кодирующей генетический продукт;
(b) как вариант, селекции растения, полученного на этапе (а), в условиях, обусловливающих возникновение мужской стерильности в результате экспрессии нуклеотидной последовательности;
(c) скрещивания мужски стерильных растений, полученных на этапах (а) или (Ь), с пыльцой мужски фертильной лини для получения гибридного растения, являющегося мужски фертильным , при этом пыльца другой рекомбинантной молекулы ДНК содержит: нуклеотидную последовательность, которая кодирует ДНК-связывающий белок и подавляет транскрипцию, и промотор, который контролирует экспрессию нуклеотидной последовательности, причем ДНК-связывающий белок способен связываться с оператором рекомбинантной ДНК мужски стерильного растения и подавлять транскрипцию.
Еще одна система получения растений со стерильной пыльцой, где в ядерный геном вводится чужеродная ДНК, которую можно использовать по данному изобретению, описана в европейской патентной заявке ЕР 0 344 029.
Настоящее изобретение также касается использования растений по данному изобретению для селекции или получения потомков, отличающегося тем, что для рекуррентной селекции используется ядерно-кодируемый мужски-стерильный фенотип. Кроме того, помимо растения по данному изобретению, предметом настоящего изобретения также являются семена или потомки, органы, растительные части, ткани или их клетки, используемые для производства продуктов, обычно изготовляемых из возобновляемых сырьевых материалов, таких как пищевые продукты и корма, предпочтительно сахар или патока (меласса), причем меласса также применяется в промышленном производстве, например, для ферментации спирта или как питательное вещество для производства продуктов биотехнологии, при производстве сырьевых материалов или субстанций для химической промышленности, например, тонких химикатов, лекарственных средств или их ингредиентов, диагностических продуктов, косметики, биоэтанола или биогаза. Пример использования растений сахарной свеклы в качестве биогенетического сырьевого материала для получения биогаза описан в патентной заявке DE 10 2012 022 178 А1, см. параграф 10.
Настоящее изобретение также относится к продуктам, получаемым из растений, органов, растительных частей, тканей, клеток, семян и потомков по данному изобретению, таким как пищевые продукты, корма и сырьевые материалы, содержащиеся в растении, семенах, потомках, органах, растительных частях, тканях или клетках, а также их компонентах.
Следующие примеры осуществления изобретения приводятся только с целью его иллюстрации и не должны рассматриваться как ограничивающие его объем. Если не установлено иное, то применялись стандартные микробиологические методы, см., например (Sambrook et al., Molecular Cloning: A Laboratory Manual, 3rd ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001); Fritsch et al., Cold Spring Harbor Laboratory Press, 1989; Mayer et al., Immunochemical Methods In Cell And Molecular Biology, eds. Academic Press, London, 1987) и Weir et al., Handbook of Experimental Immunology, Volumes I-IV, Blackwell, eds., 1986).
Примеры
1. Идентификация локуса, вызывающего ядерно-кодируемую мужскую стерильность
Для идентификации локуса (рабочее название gst), вызывающего ядерно-кодируемую мужскую стерильность у растений сахарной свеклы, в качестве исходного растения, проявляющего ядерно-кодируемый рецессивный мужски стерильный фенотип, использовали донор с внутренней меткой С311 [2043 К5]. Провести заранее (т.е. до цветения) основное определение присутствия и степени зиготности локуса gst, связанного с экспрессией признака в данном доноре, однако, оказалось невозможным в тестируемом материале. Вместо этого большое количество растений с предполагаемой стерильностью доводилось до стадии цветения в поле или блоке самоопыления (S-блок). Цветущие растения затем вручную проверялись на фертильность и стерильность, соответственно (Рис. 1). Фертильные индивидуумы удалялись, и собирались семена стерильных индивидуумов.
Для генетического и физического ограничения локуса gst, вызывающего ядерно-кодируемую мужскую стерильность, в отношении данного признака создавали раздельные карты популяции сахарной свеклы. Целевой участок на хромосоме 1 был уже известен из предварительной информации широко геномного картирования. Индивидуумы с мужской стерильностью gst донора С311[2043_К5] скрещивали с однолетней линией, и полученные в результате индивидуумы F1 размножали путем самоопыления. Потомков поколения S1 затем фенотипировали для целей картирования и помечали маркером класса KASP-DNA (технология KASP(tm) для генотипирования компании LGC Limited). Были разработаны два маркера класса KASP-DNA, sxn2151s01 и sle3305s02, при помощи которых из референсного генотипа KWS2320 идентификацией SNP выделяли генотип, несущий gst. Последовательность маркера sxn2151s01, представленная в SEQ Ш No. 24, и последовательность маркера sle3305s02, представленная в SEQ Ш No. 26, указывают на присутствие локуса gst; последовательность маркера sxn2151 s01, представленная в SEQ Ш No. 25, и последовательность маркера sle3305s02, представленная в SEQ Ш No. 27, указывают на референсную последовательность, причем каждая из маркерных последовательностей отличается друг от друга в позиции 2, и в генотипе, несущем локус gst, в этом месте присутствует "G", а в референсном генотипе KWS2320 в этом месте присутствует "А". В результате такого тонкого картирования участок на хромосоме 1
сахарной свеклы, фланкируемый маркерами класса KASP-DNA sxn2151s01 на расстоянии 33,42 сМ и sle3305s02 на расстоянии 35,15 сМ (на основании генетической карты ZR INT 1202) и несущий локус gst, четко выделялся. Исходя из физической карты генома (Physmapv2), данный участок имел физический размер 215.4 kbp и находился между позициями 3185718 bp и 3401120 bp. С учетом идентифицированной позиции и общедоступного представления генома RefBeet 1.2 (http://bvseq.molgene.mpg.de/) в этом сегменте генома был идентифицирован 21 ген, кодирующий белок.
Гомологичные гены у модельных растений (например, Arabidopsis thaliana и Oryza sativa) для всех 21 моделей генов изучали с использованием биоинформатических походов. Широкий анализ и оценку проводили на основании идентифицированных гомологичных генов у модельных растений. Ген, кодируемый в локусе gst, идентифицировали как член семейства цитохром Р450-завсимых монооксигеназ (CYP) на основании широкого анализа последовательностей и предсказанных структур. Несмотря на значительное разнообразие последовательностей в цитохром Р450-зависимых монооксигеназах, все CYP имеют общие структурные признаки, которые высоко сохранялись на участке активного центра (см., например, Fischer et al., Bioinformatics 23 (2007), 2015-2017), и также обнаруживались в отношении предполагаемого гена gst. В связи с этим ген получил название CYPgst.
Путем более специфической характеристики этого гена был идентифицирован ген CYP Arabidopsis thaliana, т.е. CYP703A2, имеющий более высокую идентичность последовательности с этим геном из локуса gst. Мутант Arabidopsis thaliana, в котором этот ген инактивировался посредством инсерции Т-ДНК, проявлял фенотип с частичной мужской стерильностью (Morant et al., Plant Cell 19 (2007), 1473-1487). Возможно это объясняется механическими причинами, как результат функции CYP703A2 в синтезе спорополленина, являющегося основным компонентом внешних стенок жизнеспособной пыльцы. Отсутствие внешней стенки препятствует созреванию пыльцы, либо подвергает ее воздействию окружающей среды. Между фенотипом gst фенотипа сахарной свеклы и фенотипом мутанта Arabidopsis thaliana имеется, однако, существенное различие:
(i) в отличие от Arabidopsis нокаут гена из растений сахарной свеклы приводит к полной
мужской стерильности,
(ii) в то время как стерильная пыльца в основном образуется у мутантов Arabidopsis, и
пыльца не образуется у gst растений сахарной свеклы, как следует з анализа текущего
состояния.
Таким образом, нельзя исключать вероятность того, что они принадлежат к разным членам семейства CYP, и/или что функции обоих белков разные у Arabidopsis и растений сахарной свеклы. Известно, что Arabidopsis - это дикорастущее травянистое растение семейства крестоцветных, имеющее небольшой компактный геном, в то время как сахарная свекла является культивируемым растением, т.е. растением, высаживаемым, возделываемым и размножаемым человеком и используемым как культурное растение. Таким образом, исследования на основе Arabidopsis и их результаты не могут быть непосредственно применены к культивируемым растениям. Более того, для культурных растений характерны важные агропроцессы, которые никогда не имеют места в отношении Arabidopsis. Это включает, например, в отличие от Arabidopsis, образование корней свеклы, клубней и зерна,
которые функционируют как запасающие органы и как вегетативные и репродуктивные органы, а также их связь с симбиотическими микоризными грибами или патогенами.
2. Характеристика гена CYPgst
После идентификации потенциального гена, приводящего к фенотипу gst, проводили сравнительное секвенирование фрагмента геномной ДНК размером приблизительно 5 kbp. Были секвенированы фертильный референсный генотип KWS2320 сахарной свеклы, стерильный gst донор С311, три индивидуума вышеупомянутой популяции тонкого картирования, классифицированные согласно фенотипам и маркерным данным как стерильные, и три их индивидуума, классифицированные согласно фенотипам и маркерным данным как фертильные гомозиготные. Секвенированный участок генома содержит модель гена BvCYPgst (GST, g6845.tl), показанный на Рис. 2, и приблизительно 1,5 kbp участка предполагаемого промотора. Сравнительное секвенирование показало, помимо серии одиночных нуклеотидных полиморфизмов (SNP) между стерильными и фертильными индивидуумами, делецию размером 533 bp у стерильных генотипов, содержащую 5'-UTR и первый экзон модели гена (Рис. 2 и Рис. 3).
Анализ всех идентифицированных полиморфизмов показал, что некоторые из делеций повлияли на кодируемый белок, а все остальные мутации либо находились в нетранслируемых областях, либо генерировали синонимичные кодоны. Наоборот, эти мутации препятствовали конкретной транскрипции тРНК, и трансляция функционального белка была поэтому невозможной. Последующие анализы транскрипции подтвердили эти данные (Рис. 5). BvCYPgst (GST, g6845.tl) весьма специфически экспрессировался в закрытых цветках и плодах у фертильных генотипов. Его экспрессия не детектировалась в корнях и листьях. В противоположность этому ген GST не детектировался в закрытых цветках у стерильных генотипов. Это позволяет сделать вывод о том, что ген стерильных генотипов полностью инактивируется.
Были разработаны ДНК-маркеры, позволяющие проводить различие между стерильными и фертильными генотипами. Для этого разрабатывали KASP-маркеры, имеющие фертильный аллель (инсерция) в качестве доминантного признака (sle5983dl4, sle5983dl7).
Маркер
Прямой праймер
Обратный праймер
sle5983dl 4
SEQ ID NO: 4:
ACCAAAATTTTATACCAATGGCTCA AG
SEQ ID NO: 5:
GGCCGGGAGGGAGTTTGTATGTT
sle5983dl 7
SEQ ID NO: 6:
AGAAATCATACGTGAGATCTTAGTT CG
SEQ ID NO: 7:
GGTATGTGGACGAGACGCAAATAC AT
В результате, что касается данной гомозиготной делеции, можно сделать косвенный вывод, что оба маркера (sle5983dl4, sle5983dl7) проявляют нулевой аллель, а третий убиквитарный маркер подтверждает экстракцию достаточного количества ДНК. Потенциальные точечные мутации в гене BvCYPgst, приводящие к преждевременному прекращению транскрипции гена CYPgst, или вызывающие разрушение сплайсинга, которые
можно тестировать, используя традиционные методы для детекции точечных мутаций ДНК (SNP-анализ), приводятся в Таблице 1.
1906 С Т стоп-кодон
1940 С АилиО стоп-кодон
1947 Т А стоп-кодон
1948 G Т стоп-кодон
1951 А Т стоп-кодон
1956 Т АилиО стоп-кодон
1964 Т АилиО стоп-кодон
1971 С АилиО стоп-кодон
2014 G Т стоп-кодон
2026 G Т стоп-кодон
2033 Т А или G стоп-кодон
2038 С Т стоп-кодон
2041 С Т стоп-кодон
2075 Т А или G стоп-кодон
2090 Т А стоп-кодон
2097 С А или G стоп-кодон
2117 Т А стоп-кодон
2128 G Т стоп-кодон
2138 G А стоп-кодон
2139 G А стоп-кодон
2140 А Т стоп-кодон
2143 А Т стоп-кодон
2149 А Т стоп-кодон
2160 С А стоп-кодон
2164 G Т стоп-кодон
2171 Т А стоп-кодон
2182 А Т стоп-кодон
2185 С Т стоп-кодон
2191 G Т стоп-кодон
2218 G T стоп-кодон
2224 С Т стоп-кодон
2231 Т А стоп-кодон
2236 С Т стоп-кодон
2246 Т А или G стоп-кодон
2260 А Т стоп-кодон
2266 А Т стоп-кодон
2279 Т А стоп-кодон
2284 G Т стоп-кодон
2291 Т АилиО стоп-кодон
2320 А Т стоп-кодон
2327 Т А стоп-кодон
2335 А Т стоп-кодон
2338 С Т стоп-кодон
2343 С А или G стоп-кодон
2368 С Т стоп-кодон
2380 G Т стоп-кодон
2401 G Т стоп-кодон
2405 Т А стоп-кодон
2411 G А стоп-кодон
2412 G А стоп-кодон
2414 Т АилиО стоп-кодон
2423 Т А стоп-кодон
2430 С А или G стоп-кодон
2432 Т А стоп-кодон
2442 Т А или G стоп-кодон
2444 Т А стоп-кодон
2453 G А стоп-кодон
2454 G А стоп-кодон
2453
2455 G А стоп-кодон
2456 G А стоп-кодон
2472 T А или G стоп-кодон
2473 G T стоп-кодон
2478 T А стоп-кодон
2479 G T стоп-кодон
2482 A T стоп-кодон
2485 A T стоп-кодон
2494 G T стоп-кодон
2500 G T стоп-кодон
2503 A T стоп-кодон
2527 A T стоп-кодон
2536 G T стоп-кодон
2539 G T стоп-кодон
2548 A T стоп-кодон
2551 G T стоп-кодон
2554 A T стоп-кодон
2557 A T стоп-кодон
2563 A T стоп-кодон
2566 G T стоп-кодон
2569 G T стоп-кодон
2575 G T стоп-кодон
2584 G T стоп-кодон
2590 G T стоп-кодон
2612 T А стоп-кодон
2615 T А стоп-кодон
2621 T А стоп-кодон
2629 G T стоп-кодон
2635 G T стоп-кодон
2641 G T
2665 A T
2677 С Т
2679 G А
2680 G А
2681 Т А
3505 А С или G или Т
3506 G А или С или Т
3535 С АилиО
3549 G Т
3553 G А
3554 G А
3564 G Т
3573 А Т
3594 А Т
3600 С Т
3603 С Т
3606 G Т
3624 G Т
3633 С Т
3645 G Т
3649 С А или G
3671 С АилиО
3680 Т А
3690 G Т
3699 С Т
3724 Т А или G
3735 G Т
3739 С А или G
стоп-кодон стоп-кодон стоп-кодон расщепление мутации расщепление мутации расщепление мутации расщепление мутации расщепление мутации стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон стоп-кодон
3767 Т А или G стоп-кодон
3811 Т АилиО стоп-кодон
3813 G Т стоп-кодон
3825 А Т стоп-кодон
3832 G А стоп-кодон
3833 G А стоп-кодон
3843 G Т стоп-кодон
3854 С АилиО стоп-кодон
3858 G Т стоп-кодон
3861 А Т стоп-кодон
3868 G А стоп-кодон
3869 G А стоп-кодон
3874 Т А стоп-кодон
3879 G Т стоп-кодон
3885 А Т стоп-кодон
3891 G Т стоп-кодон
3903 G Т стоп-кодон
3915 А Т стоп-кодон
3922 Т А или G стоп-кодон
3939 А Т стоп-кодон
3942 А Т стоп-кодон
3945 А Т стоп-кодон
3950 Т А стоп-кодон
3982 Т А стоп-кодон
3987 G Т стоп-кодон
3991 Т А стоп-кодон
4018 G А стоп-кодон
4019 G А стоп-кодон
4021 Т АилиО стоп-кодон
4032
стоп-кодон
4038
стоп-кодон
4044
стоп-кодон
4047
стоп-кодон
4059
стоп-кодон
4062
стоп-кодон
4070
А или G
стоп-кодон
4086
стоп-кодон
4092
стоп-кодон
4099
А или G
стоп-кодон
4108
стоп-кодон
4113
стоп-кодон
4132
А или G
стоп-кодон
4136
А или G
стоп-кодон
3. Использование гена или локуса CYPgst в селекции гибридов
Как было показано ранее, мужски стерильный фенотип, обусловливающий локус gst, используется в селекционных программах на устойчивость для простого скрещивания на базе рекуррентного отбора. До начала клонирования гена в рамках настоящего изобретения и связанного с этим создания геномных маркеров требовалось вырастить и убрать в четыре раза больше растений, чем было необходимо, по причине их ожидаемого расщепления 3:1 по фенотипу. Эти растения оценивали на стерильность сразу после цветения, фертильные индивидуумы удаляли, чтобы предотвратить самоопыление. При ежегодном выращивании нескольких тысяч растений такой ручной отбор требует больших трудовых затрат и подвержен ошибкам. Теперь обеспечены геномные маркеры по данному изобретению (см. Пример 2 и Рис. 2), позволяющие тестировать 30000 растений и отбирать 75000 мужски стерильных растений для последующего выращивания.
Ведется постоянная работа по упрощению селекционных программ и производства семян растений сахарной свеклы и, таким образом, снижению затрат. В результате коммерческие сорта сахарной свеклы, которые производятся в настоящее время, являются тройными гибридами, что позволяет получать достаточное количество семян. Производство гибридов по селекционным программам, которые не являются коммерческими, также является трудоемким и дорогостоящим и связано с преодолением многих преград. Теперь возможно, используя фенотип с gst по данному изобретению и связанные с этим ДНК
маркеры, после инсерции локуса gst или после мутации/ингибирования гена CYPgst в селекционной программе селекции отбирать мужски стерильные растения до посадки при помощи ДНК-маркеров и, таким образом, упрощать производственный процесс. Параллельно создается большое число многозародышевых форм генотипов-тестеров (MUS-тестеры). В перспективе возможно, что на смену современным ЦМС-технологиям придет альтернативная система, позволяющая делать мужски стерильными родительские компоненты семян, например, при помощи SPT-системы, указанной выше и показанной на Рис. 5. Соответственно, разумно предположить, что системы CYPgst по данному изобретению можно использовать и для других культивируемых растений, в частности культурных растений, как в случае коммерческого производства двойных гибридов, таких как кукуруза. Что касается кукурузы (Zea mays), важную роль в разработке альтернативных систем получения ее гибридных семян играют ms-геиы. Анализ последовательностей свидетельствует о предполагаемом существовании BvCYPgst(GBMZM5g &30329) гомолога кукурузы. В кукурузе также имеется много да^-мутантов, из которых только часть была клонирована, да^-мутанты, да^-мутация которых обусловлена мутацией или ингибированием BvCYPgst гомолога кукурузы, теперь можно отбирать при помощи настоящего изобретения и использовать для целенаправленного производства семян. Настоящее изобретение можно также применять для создания гибридного картофеля, например, для введения направленных мутаций в ген-гомолог BvCYPgst картофеля и использовать полученную таким образом мужскую стерильноть картофеля для создания диплоидного гибридного картофеля, как показано в SPT-системе.
Специфическая экспрессия гена BvCYPgst в цветках и тапетуме способствует биотехнологическому использованию промотора, например, для экспрессии положительно-полярной/отрицательно-полярной РНК или рибозима для ингибирования гена BvCYPgst или экспрессии функционального белка CYPgst, либо предполагаемого гомолога, аналога или ортолога гена BvCYPgst для улучшения мутации и восстановления мужски фертильного фенотипа. Предполагается, что обеспечение локуса гена и нуклеиновых и аминокислотных последовательностей гена BvCYPgst, в добавление к генетическим маркерам и обусловленным этим вариантам осуществления изобретения, сделает селекционные программы более простыми и менее дорогостоящими, так как, помимо прочего, это способствует раннему отбору стерильных индивидумов. Это также упрощает организацию материального обеспечения и расширение селекционных программ.
SEQUENCE LISTING
<110> KWS SAAT SE
<120> Kernkodierte mnnliche Sterilitt durch Mutation in Cytochrom P450
Oxidase
<130> KWS0231PCT
<150> DE 10 2016 106 656.7
<151> 2016-04-12
<160> 27
<170> PatentIn version 3.5
<210> 1
<211> 4328
<212> DNA
<213> Beta vulgaris
<220>
<221> Promotor
<222> (1)..(1518)
<223> putativer Promotor
<220>
<221> Gen
<222> (1519)..(4275)
<220>
<221> 5'UTR <222> (1519)..(1761)
<220>
<221> exon
<222> (1762)..(2679) <223> Exon 1
<220>
<221> Intron
<222> (2680)..(3506)
<220>
<221> exon
<222> (3507)..(4142) <223> Exon 2
<220>
<221> 3'UTR
<222> (4143)..(4275)
<400> 1
ttattaaacc tgattggaac ttattgaacc ttattagacc tgattggaac ttattgcacc tgattggaac ttattggaac ttattagacc ttattggaac ttattgcact tattagacct tattgcaact tatctgaact tatctgaaca aatctgaact tattggacct gaaacttaat tttttaagtt gaacagaacg cacccttagt atatcgttgc cacatgtgcg ttgaattttt
60 120 180 240
ccttttccta tcctttccac tccatattct cctcaaaagt gtgtaaaaat ccgacacacg 300
agtagaatgg gattgaagtg ggtcaagatc tgaaaccaat gggtcaatgc cacaaaataa 3 60
ggtaaggttt ctcgcagtag caaaaaaata aagttaagtt gagagaaaaa ttatgaatag 420
ttgtttctcg tgaagagttg tatacaaaaa aagtctaatt tgatacattt tcttttacat 480
ttataaagga ttgaccaatc atccaaatta ccaaatattt aggatataaa tctttcagat 540
tacaacccat atatgataca ctaaatttta catgaggcaa tggaggattt gcatgaatat 600
cgaggagaga aaaaattagt tacaaaactt gcataattta tccaaaccaa atcaagtcaa 660
gaaacaacga acaatattat cattagtact ataagtatat attataggct tagagcaaag 720
ccctaactac cacactgcac acaaatgata actagtaaga gaggaaaata caaatttaag 780
attcaacata gcaaattatt catgattcat gattcatgat tcatgattca tgattcacga 840
acatcaagaa tggtatagct gataaaggac aatttaaaca taagtgtaaa gctcgcacat 900
catcaattat attcgcatac tactagacca atctttactt agtacatgtg ttagtacatg 960
tgttacttca tatcagatgt attgattgtt gccaatgaca tatcatgttc acttaatctt 1020
agggccattt aattataaca tggagaataa tacaacttaa aattatgtgg tggctatcat 1080
ctcattttct agataattaa acctttattt tgtatacata tatattgtct ttacatagca 1140
aaacaatatt gaaggtataa caacctttcc cttttctttt actacatgtt tatgttagag 1200
tttttcgatt tacgattgtg gtaaattaat tgtaattgat cggttgtctt gtagtcaaga 1260
aatgacgtat gaatcaattt agggcatgtt ctcttcggca taaaacagct gaactgaatt 1320
gaactgaact gaaatgaata gtgatatgtg agagtaaaag tattgtcaag agctgaactg 1380
agctgaactg aacggatctg aactgaactg atctaatctg aactaatctg aactgaactg 1440
aactgaattg aactgaaaat aagctaggga aaacagaccc ttactactat tatataacct 1500
cgtttaaata ttaggaaatt aaaaaaataa ttatatttct ttatacttta ttaacctatt 1560
gaggttttta tattgactcc caaatactat tttatagatc atgccatgtt aatgagcaaa 1620
ctactttctc acatctttat aggagaaaaa gtagatcact cactagcata tcatgaccag 1680
cgaaaccaac caacgctaat agttttattg cttccattag agataagagt taactaataa 1740
taccatcttt gtgaaatttt g atg gat ttt gga act tta gca ata tat tta 1791
Met Asp Phe Gly Thr Leu Ala Ile Tyr Leu
1 5 10
ctg tgt gca ctt ttt gct acc aaa att tta tac caa tgg ctc aag tcc 1839
Leu Cys Ala Leu Phe Ala Thr Lys Ile Leu Tyr Gln Trp Leu Lys Ser
15 20 25
tac tta tac aca aca tac aaa ctc cct ccc ggc cca cca agg tgg ccc 1887
Tyr Leu Tyr Thr Thr Tyr Lys Leu Pro Pro Gly Pro Pro Arg Trp Pro
30 35 40
tta ttt gga aac ctc ctt caa cta ggg cca ctt ccc cac cgc gat ttc 1935
Leu Phe Gly Asn Leu Leu Gln Leu Gly Pro Leu Pro His Arg Asp Phe
45 50 55
gcc tca ttt tgt gaa aaa tat ggg cct tta gtc tac ata agg ctt ggt 1983
Ala Ser Phe Cys Glu Lys Tyr Gly Pro Leu Val Tyr Ile Arg Leu Gly
60 65 70
aat gtg gat gcc ata acc act aat gat cca gaa atc ata cgt gag atc 2031
Asn Val Asp Ala Ile Thr Thr Asn Asp Pro Glu Ile Ile Arg Glu Ile
75 80 85 90
tta gtt cga caa gat gat gta ttt gcg tct cgt cca cat acc tta gcc 2079
Leu Val Arg Gln Asp Asp Val Phe Ala Ser Arg Pro His Thr Leu Ala
95 100 105
gca acc cac ttg gct tac aat agt ggt gat gtg gcc ttg gct cca atg 2127
Ala Thr His Leu Ala Tyr Asn Ser Gly Asp Val Ala Leu Ala Pro Met
110 115 120
gga cca aaa tgg aaa aga atg aga agg ata tgc atg gag cac ttg ctc 2175
Gly Pro Lys Trp Lys Arg Met Arg Arg Ile Cys Met Glu His Leu Leu
125 130 135
aca act aga cga ctt gaa cta ttt gtg agt cat agg gct gat gag gca 2223
Thr Thr Arg Arg Leu Glu Leu Phe Val Ser His Arg Ala Asp Glu Ala
140 145 150
cga cat ttg gtc caa gac gta tta act cgt tcc cac aaa gat aaa gtt 2271 Arg His Leu Val Gln Asp Val Leu Thr Arg Ser His Lys Asp Lys Val
155 160 165 170
gtt aat ttg agg gaa gtg tta ggt gca ttt tct atg aat aac gtg act 2319
Val Asn Leu Arg Glu Val Leu Gly Ala Phe Ser Met Asn Asn Val Thr
175 180 185
aga atg ttg cta ggg aag caa tac ttt ggg gcc ggg acg gcg ggc cca 2367
Arg Met Leu Leu Gly Lys Gln Tyr Phe Gly Ala Gly Thr Ala Gly Pro
190 195 200
caa gag gct cta gag ttt atg cat ata aca cat gag ttg ttt tgg tta 2415
Gln Glu Ala Leu Glu Phe Met His Ile Thr His Glu Leu Phe Trp Leu
205 210 215
cta ggc ttg att tac ttg ggt gat tat ttg cct ttt tgg agg tgg gtt 2463
Leu Gly Leu Ile Tyr Leu Gly Asp Tyr Leu Pro Phe Trp Arg Trp Val
220 225 230
gat cca tat gga tgt gaa aag aaa atg agg gaa gtt gaa aaa agg gta 2511
Asp Pro Tyr Gly Cys Glu Lys Lys Met Arg Glu Val Glu Lys Arg Val
235 240 245 250
gat gat ttc cat cgc aaa att ata gag gaa cat agg aag gag aag aaa 2559 Asp Asp Phe His Arg Lys Ile Ile Glu Glu His Arg Lys Glu Lys Lys
255 260 265
agg aaa gaa gaa atg gga gtg aat gag ggt gaa atg gat ttt gta gat 2607
Arg Lys Glu Glu Met Gly Val Asn Glu Gly Glu Met Asp Phe Val Asp
270 275 280
att ttg ttg gct ttg cct ggt gaa aat gga aat gag cat atg gat gat 2655
Ile Leu Leu Ala Leu Pro Gly Glu Asn Gly Asn Glu His Met Asp Asp
285 290 295
gca gat att aaa gct cta att cag gtaattcatg tataatttga atgtgatcga 2709 Ala Asp Ile Lys Ala Leu Ile Gln 300 305
tacaaagttt gatagaaaac atatttgcat aaatatatgg ttgccctact agacccaata 2769
aaatacataa ttattgcctt actagttgaa agttgaaaca acctagctac cattttgttg 2829
tgattatcat tagccaacca aaattatttc ttgcatccat atattaatgt tgagatcaga 2889
gtcggcatat ttacaattac ttgtaacatt ttaagcaaac aaattaaaat attttttggc 2949
aagtccattt tattgaataa tacctatatc ttaaaatgaa ttcttggtca tgtacacttg 3009
cctttcaagg taccaatatt tgaccatatg taattactat taacaaattt gataaaatct 3069
aataatatgt aaatatacat tcacgcacat attagaaaca aagatcacaa atgataatgc 3129
aaaataactt atttgaacta atgttgtgaa gttaaatttg gaacaaaagg tatatttgta 3189
ttgccgaatt ttaatttata aattacttat aacaacaact caatatgtaa aactgttaag 3249
atggagtgtg gatagaatga gatgagtata cttttactag ttaccactcg aaaatgcatt 3309
tcctcctttg tttatagttg ttctaacttc tattatcata aataattttt tggacttatt 3369
tcaatgtata tttacaacgc taattgttta attttttaaa aatacataat gtaaacaagg 3429
atttcatggt caattataca cattataaat attatcttaa aaaacttatt aatgctcaat 3489
tagtatccat aatatag gat atg ata gca gca gca aca gac aca tca gct 3539
Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ala 310 315
gta acc aac gaa tgg gcc atg gca gaa gta ata aaa cac cca cgt gtc 3587
Val Thr Asn Glu Trp Ala Met Ala Glu Val Ile Lys His Pro Arg Val
320 325 330
ctc cac aag atc caa caa gag ctt aac aca ata gta gga ccc aat cga 3635
Leu His Lys Ile Gln Gln Glu Leu Asn Thr Ile Val Gly Pro Asn Arg
335 340 345
atg gta aca gaa tca gat ctt ccc cac ctt aac tac cta cgt tgt gtc 3683
Met Val Thr Glu Ser Asp Leu Pro His Leu Asn Tyr Leu Arg Cys Val
350 355 360 365
gta cgt gaa acg ttc cga atg cat cca gca gga ccc ttt tta atc cca 3731
Val Arg Glu Thr Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro
370 375 380
cat gaa tca cta cgc cat aca aca atc aac ggc tat gat atc cca tct 3779
His Glu Ser Leu Arg His Thr Thr Ile Asn Gly Tyr Asp Ile Pro Ser
385 390 395
ggg aca cgt gtc ttc atc aac aca cat ggg tta gga cgt aac ctt aaa 3827
Gly Thr Arg Val Phe Ile Asn Thr His Gly Leu Gly Arg Asn Leu Lys
400 405 410
gtg tgg gac aac ata gag gat ttt tac cct gaa aga cat tgg ccg ttg 3875
Val Trp Asp Asn Ile Glu Asp Phe Tyr Pro Glu Arg His Trp Pro Leu
415 420 425
gat gga agt aga gtt gag att agc cat gga tct gat ttt aaa ata tta 3923
Asp Gly Ser Arg Val Glu Ile Ser His Gly Ser Asp Phe Lys Ile Leu
430 435 440 445
cca ttt agt gct ggg aag aga aga tgt cct ggg gcc cca ctt ggg gtg Pro Phe Ser Ala Gly Lys Arg Arg Cys Pro Gly Ala Pro Leu Gly Val
3971
450
455
460
gtg ttt gtg ttg atg gga ttg gct aca ctt ttt cat gca ttt gat tgg
Val Phe Val Leu Met Gly Leu Ala Thr Leu Phe His Ala Phe Asp Trp
465 470 475
4019
tta cca cct gat gga atg aag gca gaa gaa att gat act aag gaa gtt
Leu Pro Pro Asp Gly Met Lys Ala Glu Glu Ile Asp Thr Lys Glu Val
480 485 490
4067
tat ggg atg act atg cct aaa gct caa cct tta atg gct ttg gct aaa
Tyr Gly Met Thr Met Pro Lys Ala Gln Pro Leu Met Ala Leu Ala Lys
495 500 505
4115
cct agg ctt gct cat tta tat ctt tga tacatgttca tattgtggtg Pro Arg Leu Ala His Leu Tyr Leu
510 515
4162
cacttataag cacaatagac aaatacaagt ttgtatcgac tctaacatgt tgtttagtat
4222
tagtatactg caactctaca agtatgtaat ttctataaac tataaacaca agtcataacg
4282
cattttgttt tgaaaaaaaa gaggttacat tgtcttacac cataaa
4328
<210> 2
<211> 1930
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA-CYPgst gene (Beta vulgaris)
<220>
<221> 5'UTR
<222> (1)..(243)
<220>
<221> exon
<222> (244)..(1161) <223> Exon 1
<220>
<221> exon
<222> (1162)..(1797) <223> Exon 2
<220>
<221> 3'UTR
<222> (1798)..(1930)
<400> 2
ttaaaaaaat aattatattt ctttatactt tattaaccta ttgaggtttt tatattgact 60
cccaaatact attttataga tcatgccatg ttaatgagca aactactttc tcacatcttt 120
ataggagaaa aagtagatca ctcactagca tatcatgacc agcgaaacca accaacgcta 180
atagttttat tgcttccatt agagataaga gttaactaat aataccatct ttgtgaaatt 240
ttg atg gat ttt gga act tta gca ata tat tta ctg tgt gca ctt ttt
Met Asp Phe Gly Thr Leu Ala Ile Tyr Leu Leu Cys Ala Leu Phe
1 5 10 15
gct acc aaa att tta tac caa tgg ctc aag tcc tac tta tac aca aca 336
Ala Thr Lys Ile Leu Tyr Gln Trp Leu Lys Ser Tyr Leu Tyr Thr Thr
20 25 30
tac aaa ctc cct ccc ggc cca cca agg tgg ccc tta ttt gga aac ctc 384 Tyr Lys Leu Pro Pro Gly Pro Pro Arg Trp Pro Leu Phe Gly Asn Leu
35 40 45
ctt caa cta ggg cca ctt ccc cac cgc gat ttc gcc tca ttt tgt gaa 432
Leu Gln Leu Gly Pro Leu Pro His Arg Asp Phe Ala Ser Phe Cys Glu
50 55 60
aaa tat ggg cct tta gtc tac ata agg ctt ggt aat gtg gat gcc ata 480
Lys Tyr Gly Pro Leu Val Tyr Ile Arg Leu Gly Asn Val Asp Ala Ile
65 70 75
acc act aat gat cca gaa atc ata cgt gag atc tta gtt cga caa gat 528
Thr Thr Asn Asp Pro Glu Ile Ile Arg Glu Ile Leu Val Arg Gln Asp
80 85 90 95
gat gta ttt gcg tct cgt cca cat acc tta gcc gca acc cac ttg gct 576
Asp Val Phe Ala Ser Arg Pro His Thr Leu Ala Ala Thr His Leu Ala
100 105 110
tac aat agt ggt gat gtg gcc ttg gct cca atg gga cca aaa tgg aaa 624
Tyr Asn Ser Gly Asp Val Ala Leu Ala Pro Met Gly Pro Lys Trp Lys
115 120 125
aga atg aga agg ata tgc atg gag cac ttg ctc aca act aga cga ctt 672
Arg Met Arg Arg Ile Cys Met Glu His Leu Leu Thr Thr Arg Arg Leu
130 135 140
gaa cta ttt gtg agt cat agg gct gat gag gca cga cat ttg gtc caa 720
Glu Leu Phe Val Ser His Arg Ala Asp Glu Ala Arg His Leu Val Gln
145 150 155
gac gta tta act cgt tcc cac aaa gat aaa gtt gtt aat ttg agg gaa 768
Asp Val Leu Thr Arg Ser His Lys Asp Lys Val Val Asn Leu Arg Glu
160 165 170 175
gtg tta ggt gca ttt tct atg aat aac gtg act aga atg ttg cta ggg 816
Val Leu Gly Ala Phe Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly
180 185 190
aag caa tac ttt ggg gcc ggg acg gcg ggc cca caa gag gct cta gag 864
Lys Gln Tyr Phe Gly Ala Gly Thr Ala Gly Pro Gln Glu Ala Leu Glu
195 200 205
ttt atg cat ata aca cat gag ttg ttt tgg tta cta ggc ttg att tac 912
Phe Met His Ile Thr His Glu Leu Phe Trp Leu Leu Gly Leu Ile Tyr
210 215 220
ttg ggt gat tat ttg cct ttt tgg agg tgg gtt gat cca tat gga tgt 960
Leu Gly Asp Tyr Leu Pro Phe Trp Arg Trp Val Asp Pro Tyr Gly Cys
225 230 235
gaa aag aaa atg agg gaa gtt gaa aaa agg gta gat gat ttc cat cgc 1008
Glu Lys Lys Met Arg Glu Val Glu Lys Arg Val Asp Asp Phe His Arg
240 245 250 255
aaa att ata gag gaa cat agg aag gag aag aaa agg aaa gaa gaa atg 1056
Lys Ile Ile Glu Glu His Arg Lys Glu Lys Lys Arg Lys Glu Glu Met
260 265 270
gga gtg aat gag ggt gaa atg gat ttt gta gat att ttg ttg gct ttg 1104
Gly Val Asn Glu Gly Glu Met Asp Phe Val Asp Ile Leu Leu Ala Leu
275 280 285
cct ggt gaa aat gga aat gag cat atg gat gat gca gat att aaa gct 1152
Pro Gly Glu Asn Gly Asn Glu His Met Asp Asp Ala Asp Ile Lys Ala
290 295 300
cta att cag gat atg ata gca gca gca aca gac aca tca gct gta acc 1200
Leu Ile Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ala Val Thr
305 310 315
aac gaa tgg gcc atg gca gaa gta ata aaa cac cca cgt gtc ctc cac 1248
Asn Glu Trp Ala Met Ala Glu Val Ile Lys His Pro Arg Val Leu His
320 325 330 335
aag atc caa caa gag ctt aac aca ata gta gga ccc aat cga atg gta 1296
Lys Ile Gln Gln Glu Leu Asn Thr Ile Val Gly Pro Asn Arg Met Val
340 345 350
aca gaa tca gat ctt ccc cac ctt aac tac cta cgt tgt gtc gta cgt 1344 Thr Glu Ser Asp Leu Pro His Leu Asn Tyr Leu Arg Cys Val Val Arg
355 360 365
gaa acg ttc cga atg cat cca gca gga ccc ttt tta atc cca cat gaa 1392
Glu Thr Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro His Glu
370 375 380
tca cta cgc cat aca aca atc aac ggc tat gat atc cca tct ggg aca 1440
Ser Leu Arg His Thr Thr Ile Asn Gly Tyr Asp Ile Pro Ser Gly Thr
385 390 395
cgt gtc ttc atc aac aca cat ggg tta gga cgt aac ctt aaa gtg tgg 1488
Arg Val Phe Ile Asn Thr His Gly Leu Gly Arg Asn Leu Lys Val Trp
400 405 410 415
gac aac ata gag gat ttt tac cct gaa aga cat tgg ccg ttg gat gga 1536
Asp Asn Ile Glu Asp Phe Tyr Pro Glu Arg His Trp Pro Leu Asp Gly
420 425 430
agt aga gtt gag att agc cat gga tct gat ttt aaa ata tta cca ttt 1584
Ser Arg Val Glu Ile Ser His Gly Ser Asp Phe Lys Ile Leu Pro Phe
435 440 445
agt gct ggg aag aga aga tgt cct ggg gcc cca ctt ggg gtg gtg ttt 1632
Ser Ala Gly Lys Arg Arg Cys Pro Gly Ala Pro Leu Gly Val Val Phe
450 455 460
gtg ttg atg gga ttg gct aca ctt ttt cat gca ttt gat tgg tta cca 1680
Val Leu Met Gly Leu Ala Thr Leu Phe His Ala Phe Asp Trp Leu Pro
465 470 475
cct gat gga atg aag gca gaa gaa att gat act aag gaa gtt tat ggg 1728
Pro Asp Gly Met Lys Ala Glu Glu Ile Asp Thr Lys Glu Val Tyr Gly
480 485 490 495
atg act atg cct aaa gct caa cct tta atg gct ttg gct aaa cct agg 1776
Met Thr Met Pro Lys Ala Gln Pro Leu Met Ala Leu Ala Lys Pro Arg
500 505 510
ctt gct cat tta tat ctt tga tacatgttca tattgtggtg cacttataag 1827 Leu Ala His Leu Tyr Leu
515
cacaatagac aaatacaagt ttgtatcgac tctaacatgt tgtttagtat tagtatactg 1887
caactctaca agtatgtaat ttctataaac tataaacaca agt 1930
<210> 3 <211> 517 <212> PRT
<213> Beta vulgaris
<220>
<221> PEPTIDE
<222> (1)..(517)
<223> protein CYPgst (Beta vulgaris)
<400> 3
Met Asp Phe Gly Thr Leu Ala Ile Tyr Leu Leu Cys Ala Leu Phe Ala
1 5 10 15
Thr Lys Ile Leu Tyr Gln Trp Leu Lys Ser Tyr Leu Tyr Thr Thr Tyr
20 25 30
Lys Leu Pro Pro Gly Pro Pro Arg Trp Pro Leu Phe Gly Asn Leu Leu
35 40 45
Gln Leu Gly Pro Leu Pro His Arg Asp Phe Ala Ser Phe Cys Glu Lys
50 55 60
Tyr Gly Pro Leu Val Tyr Ile Arg Leu Gly Asn Val Asp Ala Ile Thr
65 70 75 80
Thr Asn Asp Pro Glu Ile Ile Arg Glu Ile Leu Val Arg Gln Asp Asp
85 90 95
Val Phe Ala Ser Arg Pro His Thr Leu Ala Ala Thr His Leu Ala Tyr
100 105 110
Asn Ser Gly Asp Val Ala Leu Ala Pro Met Gly Pro Lys Trp Lys Arg
115 120 125
Met Arg Arg Ile Cys Met Glu His Leu Leu Thr Thr Arg Arg Leu Glu
130 135 140
Leu Phe Val Ser His Arg Ala Asp Glu Ala Arg His Leu Val Gln Asp
145 150 155 160
Val Leu Thr Arg Ser His Lys Asp Lys Val Val Asn Leu Arg Glu Val
165 170 175
Leu Gly Ala Phe Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly Lys
180
185
190
Gln Tyr Phe Gly Ala Gly Thr Ala Gly Pro Gln Glu Ala Leu Glu Phe
195 200 205
Met His Ile Thr His Glu Leu Phe Trp Leu Leu Gly Leu Ile Tyr Leu
210 215 220
Gly Asp Tyr Leu Pro Phe Trp Arg Trp Val Asp Pro Tyr Gly Cys Glu
225 230 235 240
Lys Lys Met Arg Glu Val Glu Lys Arg Val Asp Asp Phe His Arg Lys
245 250 255
Ile Ile Glu Glu His Arg Lys Glu Lys Lys Arg Lys Glu Glu Met Gly
260 265 270
Val Asn Glu Gly Glu Met Asp Phe Val Asp Ile Leu Leu Ala Leu Pro
275 280 285
Gly Glu Asn Gly Asn Glu His Met Asp Asp Ala Asp Ile Lys Ala Leu
290 295 300
Ile Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ala Val Thr Asn
305 310 315 320
Glu Trp Ala Met Ala Glu Val Ile Lys His Pro Arg Val Leu His Lys
325 330 335
Ile Gln Gln Glu Leu Asn Thr Ile Val Gly Pro Asn Arg Met Val Thr
340 345 350
Glu Ser Asp Leu Pro His Leu Asn Tyr Leu Arg Cys Val Val Arg Glu
355 360 365
Thr Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro His Glu Ser
370 375 380
Leu Arg His Thr Thr Ile Asn Gly Tyr Asp Ile Pro Ser Gly Thr Arg
385 390 395 400
Val Phe Ile Asn Thr His Gly Leu Gly Arg Asn Leu Lys Val Trp Asp
405 410 415
Asn Ile Glu Asp Phe Tyr Pro Glu Arg His Trp Pro Leu Asp Gly Ser
420 425 430
Arg Val Glu Ile Ser His Gly Ser Asp Phe Lys Ile Leu Pro Phe Ser
435
440
445
Ala Gly Lys Arg Arg Cys Pro Gly Ala Pro Leu Gly Val Val Phe Val
450 455 460
Leu Met Gly Leu Ala Thr Leu Phe His Ala Phe Asp Trp Leu Pro Pro
465 470 475 480
Asp Gly Met Lys Ala Glu Glu Ile Asp Thr Lys Glu Val Tyr Gly Met
485 490 495
Thr Met Pro Lys Ala Gln Pro Leu Met Ala Leu Ala Lys Pro Arg Leu
500 505 510
Ala His Leu Tyr Leu
515
<210> 4
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> s1e5983d14 Forward (Fw) Primer (5' -3')
<400> 4
accaaaattt tataccaatg gctcaag 27
<210> 5
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> s1e5983d14 Reverse (Rv) Primer (5' -3')
<400> 5
ggccgggagg gagtttgtat gtt 23
<210> 6
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> s1e5983d17 Forward (Fw) Primer (5' -3')
<400> 6
agaaatcata cgtgagatct tagttcg 27
<210> 7
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> s1e5983d17 Reverse (Rv) Primer (5' -3') <400> 7
ggtatgtgga cgagacgcaa atacat 26
<210> 8
<211> 4220
<212> DNA
<213> Beta vulgaris
<220>
<221> Promotor
<222> (1)..(1353)
<223> putativer Promotor
<220>
<221> Gen
<222> (1354)..(3542)
<220>
<221> exon
<222> (1354)..(1938)
<223> verkrztes Exon 1
<220>
<221> Intron <222> (1939)..(2755)
<220>
<221> exon
<222> (2756)..(3394)
<223> Exon 2
<220>
<221> 3'UTR <222> (3395)..(3542)
<400> 8
gtatatcgtt gccacatgtg cgttgaattt ctcctcaaaa gtgtgtaaaa atccgacaca tctgaaacca atgggtcaat gccacaaaat taaagttaag ttgagagaaa aattatgaat aaaagtctaa tttgatacat tttcttttac taccaaatat ttaggatata aatctttcag tacatgaggc aatggaggat ttgcatgaat ttgcataatt tatccaaacc aaatcaagtc ctataagtat atattatagg cttagagcaa taactagtaa gagaggaaaa tacaaattta atgattcatg attcatgatt catgattcac
ttccttttcc cgagtagaat aaggtaaggt agttgtttct atttataaag attacaaccc atcgaggaga aagaaacaac agccctaact agattcaaca gaacatcaag tatcctttcc gggattgaag ttctcgcagt cgtgaagagt gattgaccaa atatatgata gaaaaaatta gaacaatatt accacactgc tagcaaatta aatggtatag actccatatt tgggtcaaga agcaaaaaaa tgtatacaaa tcatccaaat cactaaattt gttacaaaac atcattagta acacaaatga ttcatgattc ctgataaagg
60 120 180 240 300 360 420 480 540 600 660
acaatttaaa cataagtgta aagctcgcac atcatcaatt atattcgcat actactagac 720
caatctttac ttagtacatg tgttagtaca tgtgttactt catatcagat gtattgattg 780
ttgccaatga catatcatgt tcacttaatc ttagggccat ttaattataa catggagaat 840
aatacaactt aaaattatgt ggtggctatc atctcatttt ctagataatt aaacctttat 900
tttgtataca tatatattgt ctttacatag caaaacaata ttgaaggtat aacaaccttt 960
cccttttctt ttactacatg tttatgttag agtttttcga tttacgattg tggtaaatta 1020
attgtaattg atcggttgtc ttgtagtcaa gaaatgacgt atgaatcaat ttagggcatg 1080
ttctcttcgg cataaaacag ctgaactgaa ttgaactgaa ctgaaatgaa tagtgatatg 1140
tgagagtaaa agtattgtca agagctgaac tgagctgaac tgaacggatc tgaactgaac 1200
tgatctaatc tgaactaatc tgaactgaac tgaactgaat tgaactgaaa ataagctagg 1260
gaaaacagac ccttactact attatataac ctcgtttaaa tattaggaaa ttaaaaaaat 1320
aattatattt ctttatactt tattaaccta tta tac aat agt ggt gat gtg gcc 1374
Tyr Asn Ser Gly Asp Val Ala 1 5
ttg gct cca atg gga cca aaa tgg aaa aga atg aga agg ata tgc atg 1422
Leu Ala Pro Met Gly Pro Lys Trp Lys Arg Met Arg Arg Ile Cys Met
10 15 20
gag cac ttg ctc aca act aga cga ctt gaa cta ttt gtg agt cat agg 1470
Glu His Leu Leu Thr Thr Arg Arg Leu Glu Leu Phe Val Ser His Arg
25 30 35
gct gat gag gca cga cat ttg gtc caa gac gta tta act cgt tcc cac 1518
Ala Asp Glu Ala Arg His Leu Val Gln Asp Val Leu Thr Arg Ser His
40 45 50 55
aaa gat aaa gtt gtt aat ttg agg gaa gtg tta ggt gca ttt tct atg 1566
Lys Asp Lys Val Val Asn Leu Arg Glu Val Leu Gly Ala Phe Ser Met
60 65 70
aat aac gtg act aga atg ttg cta ggg aag caa tac ttt ggg gcc ggg 1614
Asn Asn Val Thr Arg Met Leu Leu Gly Lys Gln Tyr Phe Gly Ala Gly
75 80 85
acg gcg ggc cca caa gag gct cta gag ttt atg cat ata aca cat gag 1662
Thr Ala Gly Pro Gln Glu Ala Leu Glu Phe Met His Ile Thr His Glu
90 95 100
ttg ttt tgg tta cta ggc ttg att tac ttg ggt gat tat ttg cct ttt 1710 Leu Phe Trp Leu Leu Gly Leu Ile Tyr Leu Gly Asp Tyr Leu Pro Phe
105 110 115
tgg agg tgg gtt gat cca tat gga tgt gaa aag aaa atg agg gaa gtt 1758
Trp Arg Trp Val Asp Pro Tyr Gly Cys Glu Lys Lys Met Arg Glu Val
120 125 130 135
gaa aaa agg gta gat gat ttc cat cgc aaa att ata gag gaa cat agg 1806
Glu Lys Arg Val Asp Asp Phe His Arg Lys Ile Ile Glu Glu His Arg
140 145 150
aag gag aag aaa agg aaa gaa gaa atg gga gtg aat gag ggt gaa atg 1854
Lys Glu Lys Lys Arg Lys Glu Glu Met Gly Val Asn Glu Gly Glu Met
155 160 165
gat ttt gta gat att ttg ttg gct ttg cct ggt gaa aat gga aat gag 1902
Asp Phe Val Asp Ile Leu Leu Ala Leu Pro Gly Glu Asn Gly Asn Glu
170 175 180
cat atg gat gat gca gat att aaa gct cta att cag gtaattcatg 1948
His Met Asp Asp Ala Asp Ile Lys Ala Leu Ile Gln
185 190 195
tataatttga atgtgataca aagtttgata gaaaacatat ttgcataaat acatggttac 2008
cctactagac ccaataaaat acataattat tgccttgcta gttgaaagtt gaaacaacct 2068
agctaccatt ttgttgtgat tatcattagc caaccaaaac tatttcttgc atccatatat 2128
taatgttgag agtcgccata tttacaatta cttgtaacat tttgagcaaa caaattaaaa 2188
tattttttgg caagtccatt ttattgaatg atacctatat cttaaaatga atccttggtt 2248
atgtacactt gcctttcaag gtaccaatat ttgaccatat gtaattacta ttaacaaatt 2308
tgataaaatc taataatatg taaatatacg ttcacgcaca tattagaaac aaagatcaca 2368
aatgataatg caaaataact tatttgaact aatgttgtga agttaaattt ggaacaaaag 2428
gtatatttgt attgccgaat tttaatttat aaattactta taacaacaac tcaatatgta 2488
aaactgttaa gatggagtgt ggatagaatg agatgagtat acttttacta gttaccactc 2548
gaaattgcat ttcctccttt gtttatagtt gttctaactt ctattatcat aaataatttt 2608
tggacttatt tcaatgtata tttacaacgt taattgttta attttttaaa aatacataat 2668
gtaaacaagg atttcatggt caattataca cattatagat attatcttaa aaaacttact 2728
aatgctcaat tagtgtccat aatatag gat atg ata gca gca gca aca gac aca 2782
Asp Met Ile Ala Ala Ala Thr Asp Thr 200
tca gct gta acc aac gaa tgg gcc atg gca gaa gta ata aaa cac cca 2830
Ser Ala Val Thr Asn Glu Trp Ala Met Ala Glu Val Ile Lys His Pro
205 210 215 220
cgt gtc ctc cac aag atc caa caa gag ctt aac aca ata gta gga ccc 2878
Arg Val Leu His Lys Ile Gln Gln Glu Leu Asn Thr Ile Val Gly Pro
225 230 235
aat cga atg gta aca gaa tca gat ctt ccc cac ctt aac tac cta cgt 2926
Asn Arg Met Val Thr Glu Ser Asp Leu Pro His Leu Asn Tyr Leu Arg
240 245 250
tgt gtc gta cgc gaa acg ttt cgg atg cat cca gca gga ccc ttt tta 2974
Cys Val Val Arg Glu Thr Phe Arg Met His Pro Ala Gly Pro Phe Leu
255 260 265
atc cca cat gaa tca cta cgc cat aca aca atc aac ggc tat gat atc 3022
Ile Pro His Glu Ser Leu Arg His Thr Thr Ile Asn Gly Tyr Asp Ile
270 275 280
cca tct ggg aca cgt gtc ttc atc aac aca cat ggg tta gga cgt aac 3070
Pro Ser Gly Thr Arg Val Phe Ile Asn Thr His Gly Leu Gly Arg Asn
285 290 295 300
ctt aaa gtg tgg gac aac ata gag gat ttt tac cct gaa aga cat tgg
3118
Leu Lys Val Trp Asp Asn Ile Glu Asp Phe Tyr Pro Glu Arg His Trp
305 310 315
ccg ttg gat gga agt aga gtt gag att agc cat gga tct gat ttt aaa 3166
Pro Leu Asp Gly Ser Arg Val Glu Ile Ser His Gly Ser Asp Phe Lys
320 325 330
ata tta cca ttt agt gct ggg aag aga aga tgt cct ggg gcc cca ctt 3214
Ile Leu Pro Phe Ser Ala Gly Lys Arg Arg Cys Pro Gly Ala Pro Leu
335 340 345
ggg gtg gtg ttt gtg ttg atg gga ttg gct aca ctt ttt cat gca ttt 3262
Gly Val Val Phe Val Leu Met Gly Leu Ala Thr Leu Phe His Ala Phe
350 355 360
gat tgg tta cca cct gat gga atg aag gca gaa gaa att gat act aag 3310
Asp Trp Leu Pro Pro Asp Gly Met Lys Ala Glu Glu Ile Asp Thr Lys
365 370 375 380
gaa gtt tat ggg atg act atg cct aaa gct caa cct tta atg gct ttg 3358
Glu Val Tyr Gly Met Thr Met Pro Lys Ala Gln Pro Leu Met Ala Leu
385 390 395
gct aaa cct agg ctt gct cct cat tta tat ctt tga tacatgttca 3404 Ala Lys Pro Arg Leu Ala Pro His Leu Tyr Leu
400 405
tattgtggtg cacttataag cacactagct caaatagaca aatacaagct tgtattgact 3464
ctaacatgtt atttaatatt agcatactgc aactctacaa ctacaagtat gtaatctcta 3524
taaattataa acataagtca taacgcatct tgttttgaaa aaaaaagcta cactttctta 3584
caccataaac tgttccgtta ctaaattctt cttggcttat tttagaatta atttttcaat 3644
tttcctattt acttataaca caagataaga aaatcgacta acaatatttc acaacattat 3704
atcttgatag ttcgttgaaa ttaataattt tcaataattt caaaacgcaa aaagcttctt 3764
tgttcggata aattcacgtc attttcaata aaatcgcaaa atcttccctt gccatcaagg 3824
aacaaatttt tcacatcaaa actcttcttc caaaaagtat acttctccat tgattatgta 3884
aaagagtttg catgttctaa tccattagta tgtatttttc ggataagaag ttgtattaca 3944
agcttaaata aagatataaa cttagttaaa tatcgaccaa tccacaatat gtatcttcat 4004
atgtgtccat cagcgcctaa ccttgagatg tagatcatct aaagcacatt aacatggcgt 4064
actcctcctg ttcaaatcag ggttgtttga aaccaaactt ctccaaaata cttcctcagt 4124
aatgaagaga aaaactcaca ttctgaaaaa catcaacatc atggttctat ggtctagtgg 4184
ttatgacact ggactctgaa tccagtaacc cgagtt 4220
<210> 9
<211> 4068
<212> DNA
<213> Zea mays
<220>
<221> exon
<222> (2001)..(2927) <223> Exon 1
<220>
<221> Intron
<222> (2928)..(3017)
<223> Intron
<220>
<221> exon
<222> (3018)..(3683) <223> Exon 2
<400> 9
gagtgtggtg cgttggtttt gtcagatgtc acaggaagga tgcagaccta ataccgctgc 60
ttttagttgt ttgctgagtg ctttggctag cctggctatg ctgaatcagg gattgcaagc 120
tcatgcttat gcagtcaaca tgggatggat atttgactca gctgtccatg cttctttggt 180
gacaatgtat gcaaaatgtg gtaggttggc tgaggctcat cgtgttttct catgcattag 240
aaatccaagc cttgttgcca ttaattctat gatttcagca tttgcacaac atggcttggc 300
tgaagatgca ctcaaacttt ttaacagaat gcaatatgat ggccaaaggc ctaatcatgt 360
gacattcttg ggaatactga ctgcatgtgc tcgagctggt ttggttcaac aaggctataa 420
ctactttgaa tctatgagat cagtctatgg cattcaacca aaccctgacc actacacatg 480
tatggttaat cttttaggcc atgcaggctt ccttgatgaa gcattggaaa tgattaattc 540
gatgccccag aaagattatc ctgatgcatg ggcagctttg cttagctcta gtagcctcca 600
ttctaatctt gatttagcaa aactagcagc acagaggctt cttgagatag atccttatga 660
cacaacagct tacagggtcc tgacaaacat gttctcctca gcagggttga agggagatga 720
agagatggta aaagttgcac aattgtccaa catggctagt aagaggcctg ggtatagcct 780
catcatacag gataagacta cagaaaataa ctagcccaaa atgagcactt ccatttacag 840
ataactggca tgtcataact cataagacag ggatattggg ttcacagaaa acaattctag 900
cgccaagatg agatatcaat ttgttgatgt atgctagtgc agagtcagtt ttagtactta 960
agaactgaga atgaggaata tctgataagg tgactagtga tttgaagaat aaagagccag 1020
gtggtctgga tcaaattttg gttagtcttg cctcttatat cactgtttcc aggatagaat 1080
tttcagtact gcaactgatg ttgtatttga ataatggaaa atattttttc tccctgtaaa 1140
caatagtttt gtcagatgta aatcttatcc acagtagaat atgatgccat ataatgctgt 1200
tcagattcat tacaatcgtg aagtttattg cgcctttttc agagactgga gagttgatga 1260
cacttctgca aataattcat ctgctactgt tgttgaacaa caagaaaatc attggttgct 1320
gcatgctttc aagaatattt tgctgcgtga tctatctatt ctcctcatca attgatagag 1380
aagagtcgct gagagaggta atctttatgc ttattcattc atttcgatga gacaaccata 1440
ccaaggtgaa ttgggtgatc cctaggtcta ggcttttctt ttagcaatag aagcttccaa 1500
gtaattcatg gaggtctaag gatgttctcc tcaagaaaaa tagggattgt ctgtgtcttt 1560
gttatagatg tggcaggtgg agtaggacta tggtaaacaa gggttttctc ttatttttgg 1620
ctgagaaatt gtagattagt ggggaaacta tcctaattat ggcaacataa tgtcagcttg 1680
ctttttgatt aatagtcatg tttcatgacc tttttttgtt ctagtcctct tctttttttt 1740
tccttggcat tttcccagtg atctacagtt tacattgcgc aagtcatgtc aagatcatga 1800
cagtttttat atacatggtg gtagttgaga tgcttaacca tacacatcaa cacaaaaacc 1860
atgaccaatc taatactgta accaatttgc ttcaacctca gtggctcaat ttacttagta 1920
cttaagcgaa gaagcttgag acgtcccata aataggccag catttgcaat ccaactttag 1980
ctgccatctg tttctgaacc atg gat cca ttt gtt ctc tcc atc ctc tta tgc 2033
Met Asp Pro Phe Val Leu Ser Ile Leu Leu Cys
1 5 10
tca tcg atc ttt gtt gta gtg tac tgg aga agg ctg aac agc atg agg 2081
Ser Ser Ile Phe Val Val Val Tyr Trp Arg Arg Leu Asn Ser Met Arg
15 20 25
cta aga ctt cca ccg gga cct cca aca tgg cca att ttc ggc aat ctt 2129 Leu Arg Leu Pro Pro Gly Pro Pro Thr Trp Pro Ile Phe Gly Asn Leu
30 35 40
ctc cag ttg agc cct ctt ccc cac aaa gac ttt gcc caa ttt tgc acc 2177
Leu Gln Leu Ser Pro Leu Pro His Lys Asp Phe Ala Gln Phe Cys Thr
45 50 55
aaa tat ggc cct ctc gtc tat ctt cgc ctg gga acc atc gat gcc atc 2225
Lys Tyr Gly Pro Leu Val Tyr Leu Arg Leu Gly Thr Ile Asp Ala Ile
60 65 70 75
acc act gat gac ccc gaa gtg atc cgt gaa ata ctc atc cgg caa gat 2273
Thr Thr Asp Asp Pro Glu Val Ile Arg Glu Ile Leu Ile Arg Gln Asp
80 85 90
gag gtc ttt gct tcg cgg cct cgg aca ctg gct gcc gtc cat ctc gcc 2321
Glu Val Phe Ala Ser Arg Pro Arg Thr Leu Ala Ala Val His Leu Ala
95 100 105
tat ggg tgt ggt gat gtg gct cta gct cca ctg gga ccc aac tgg aaa 2369
Tyr Gly Cys Gly Asp Val Ala Leu Ala Pro Leu Gly Pro Asn Trp Lys
110 115 120
agg atg agg aga gtt tgc atg gag cac ttg ctg acg acc agg cgg ctc 2417
Arg Met Arg Arg Val Cys Met Glu His Leu Leu Thr Thr Arg Arg Leu
125 130 135
gag tct ttc gct gct cac cga gct cag gag gcc gag cac ctc tgc cag 2465
Glu Ser Phe Ala Ala His Arg Ala Gln Glu Ala Glu His Leu Cys Gln
140 145 150 155
ttt gtg tgg gct aaa tct cag tcc ggg aag ccc gtg aac ctc aga gag 2513
Phe Val Trp Ala Lys Ser Gln Ser Gly Lys Pro Val Asn Leu Arg Glu
160 165 170
gtt ctc ggt gcc ttc tcg atg aac aac gtc acg cgg atg ctg ctg ggg 2561
Val Leu Gly Ala Phe Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly
175 180 185
aag cag tac ttt ggg atc cag tcg gca ggc ccc ggc gag gca atg gag 2609
Lys Gln Tyr Phe Gly Ile Gln Ser Ala Gly Pro Gly Glu Ala Met Glu
190 195 200
ttc atg cac atc acc cac gag ctg ttc ttc ctg ctg ggc ctg atc tat 2657
Phe Met His Ile Thr His Glu Leu Phe Phe Leu Leu Gly Leu Ile Tyr
205 210 215
ctc ggg gac tac ttg ccg gct tgg agg tgg gtc gac ccg tac ggg tgt 2705
Leu Gly Asp Tyr Leu Pro Ala Trp Arg Trp Val Asp Pro Tyr Gly Cys
220 225 230 235
gag aag agg atg agg gag gtg gag aag aag gtg gac gac ttc cac cag 2753
Glu Lys Arg Met Arg Glu Val Glu Lys Lys Val Asp Asp Phe His Gln
240 245 250
aag atc att gat gag cac agg aga gct agg gag gcc agg aag agt cgt 2801
Lys Ile Ile Asp Glu His Arg Arg Ala Arg Glu Ala Arg Lys Ser Arg
255 260 265
tcc tcc gtt gag gaa gat ggc ggc aac ggc aaa gat gag atg gac ttc 2849
Ser Ser Val Glu Glu Asp Gly Gly Asn Gly Lys Asp Glu Met Asp Phe
270 275 280
gtc gat gtg ctg tta tct ttg cct ggt gag aac ggg aag gag cac atg 2897
Val Asp Val Leu Leu Ser Leu Pro Gly Glu Asn Gly Lys Glu His Met
285 290 295
gac gac atg gag atc aaa gcg ttg atg cag gtgtgtgtat gtgtatgctt 2947 Asp Asp Met Glu Ile Lys Ala Leu Met Gln 300 305
tgctattgca taccctggaa ttcaattcat tttgttgaag ctagttatta tgagtaatac 3007
ttcttggcag gac atg atc gct gct gct act gat act tca tcg gtg acg 3056
Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ser Val Thr
310 315 320
aac gag tgg gtg atg gcg gag gta atc aag aac ccg cgc gtg ctc cgg 3104
Asn Glu Trp Val Met Ala Glu Val Ile Lys Asn Pro Arg Val Leu Arg
325 330 335
cgc gtc cag gag gag ctg gac gcg gtg gtg ggg cgc gac cgg atg gtg 3152
Arg Val Gln Glu Glu Leu Asp Ala Val Val Gly Arg Asp Arg Met Val
340 345 350
gcg gag tcg gac ctg gcc cac ctc ccc tac ctc cgg tgc gtg gtg cgc 3200
Ala Glu Ser Asp Leu Ala His Leu Pro Tyr Leu Arg Cys Val Val Arg
355 360 365 370
gag tca ttc cgg atg cac ccg gcg ggg ccg ttc ctt atc ccg cac gag 3248
Glu Ser Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro His Glu
375 380 385
tcg ctg aag gcg acg acc atc atg ggg tac cac gtg ccg gcg cgc acg 3296
Ser Leu Lys Ala Thr Thr Ile Met Gly Tyr His Val Pro Ala Arg Thr
390 395 400
cgc gtg ttc atc aac acg cac gcg ctg ggg cgg aac ccg cgc gtg tgg 3344
Arg Val Phe Ile Asn Thr His Ala Leu Gly Arg Asn Pro Arg Val Trp
405 410 415
gac tcc gtg ggc gag ttc cgg ccg gag cgg cac ctg ccg gcg gag gag
Asp Ser Val Gly Glu Phe Arg Pro Glu Arg His Leu Pro Ala Glu Glu
3392
420 425 430
ggg gcg cgg gtg gag atc agc cac ctg ccg gac ttc aag atc ctg ccg 3440
Gly Ala Arg Val Glu Ile Ser His Leu Pro Asp Phe Lys Ile Leu Pro
435 440 445 450
ttc agc gcc ggg aag cgc aag tgc ccc ggc gcg ccg ctg ggc gtg gcg 3488
Phe Ser Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu Gly Val Ala
455 460 465
ctg gtg ctc atg gcg ctc gcc agg ctc ttc cac tgc ttc gac tgg tcc 3536
Leu Val Leu Met Ala Leu Ala Arg Leu Phe His Cys Phe Asp Trp Ser
470 475 480
ccg ccc gac ggc ctc cgc ccc gag gac gtg gac acc cgg gag gtg tac 3584
Pro Pro Asp Gly Leu Arg Pro Glu Asp Val Asp Thr Arg Glu Val Tyr
485 490 495
ggc atg acc atg ccc aag gcc acg ccc ctc gtc gcc gtc gcc act ccg 3632
Gly Met Thr Met Pro Lys Ala Thr Pro Leu Val Ala Val Ala Thr Pro
500 505 510
cgc ctg ccg ccg cac ttg tac ggc ggc ggc ggc ggc agc tcg gct cct 3680
Arg Leu Pro Pro His Leu Tyr Gly Gly Gly Gly Gly Ser Ser Ala Pro
515 520 525 530
tag ttcgatgaca ctttgacgca cgtgcgctgc actgccagtc tcattagtca 3733
ttatacgcat gatgtacttc cctccatata caatacaccg cataaaccaa acgatgaatg 3793
aaatgtagtc gttctatggt ttcaatatga gaagatataa ttgatggtta acatcatttc 3853
cctccgttta gtgataagcc atatactcta ggtatgtagt agtgtaacaa tgcgatccca 3913
gcccaggtaa cgaggtagca gagaggtgag ctagctgtag ctggcgacga agcgaagcat 3973
taaacggttg caacggcagc tagccgtggc gttcatgcac ggtatggcca aaaaaaaggg 4033
accctatcca tctgccagtt ttggcgtacc aatgc 4068
<210> 10
<211> 1593
<212> DNA
<213> Artificial Sequence
<220>
<223> c-DNA CYPgst gene (Zea mays)
<400> 10
atggatccat ttgttctctc catcctctta tgctcatcga tctttgttgt agtgtactgg 60
agaaggctga acagcatgag gctaagactt ccaccgggac ctccaacatg gccaattttc 120
ggcaatcttc tccagttgag ccctcttccc cacaaagact ttgcccaatt ttgcaccaaa 180
tatggccctc tcgtctatct tcgcctggga accatcgatg ccatcaccac tgatgacccc 240
gaagtgatcc gtgaaatact catccggcaa gatgaggtct ttgcttcgcg gcctcggaca 300
ctggctgccg tccatctcgc ctatgggtgt ggtgatgtgg ctctagctcc actgggaccc 360
aactggaaaa ggatgaggag agtttgcatg gagcacttgc tgacgaccag gcggctcgag
420
tctttcgctg ctcaccgagc tcaggaggcc gagcacctct gccagtttgt gtgggctaaa 480
tctcagtccg ggaagcccgt gaacctcaga gaggttctcg gtgccttctc gatgaacaac 540
gtcacgcgga tgctgctggg gaagcagtac tttgggatcc agtcggcagg ccccggcgag 600
gcaatggagt tcatgcacat cacccacgag ctgttcttcc tgctgggcct gatctatctc 660
ggggactact tgccggcttg gaggtgggtc gacccgtacg ggtgtgagaa gaggatgagg 720
gaggtggaga agaaggtgga cgacttccac cagaagatca ttgatgagca caggagagct 780
agggaggcca ggaagagtcg ttcctccgtt gaggaagatg gcggcaacgg caaagatgag 840
atggacttcg tcgatgtgct gttatctttg cctggtgaga acgggaagga gcacatggac 900
gacatggaga tcaaagcgtt gatgcaggac atgatcgctg ctgctactga tacttcatcg 960
gtgacgaacg agtgggtgat ggcggaggta atcaagaacc cgcgcgtgct ccggcgcgtc 1020
caggaggagc tggacgcggt ggtggggcgc gaccggatgg tggcggagtc ggacctggcc 1080
cacctcccct acctccggtg cgtggtgcgc gagtcattcc ggatgcaccc ggcggggccg 1140
ttccttatcc cgcacgagtc gctgaaggcg acgaccatca tggggtacca cgtgccggcg 1200
cgcacgcgcg tgttcatcaa cacgcacgcg ctggggcgga acccgcgcgt gtgggactcc 1260
gtgggcgagt tccggccgga gcggcacctg ccggcggagg agggggcgcg ggtggagatc 1320
agccacctgc cggacttcaa gatcctgccg ttcagcgccg ggaagcgcaa gtgccccggc 1380
gcgccgctgg gcgtggcgct ggtgctcatg gcgctcgcca ggctcttcca ctgcttcgac 1440
tggtccccgc ccgacggcct ccgccccgag gacgtggaca cccgggaggt gtacggcatg 1500
accatgccca aggccacgcc cctcgtcgcc gtcgccactc cgcgcctgcc gccgcacttg 1560
tacggcggcg gcggcggcag ctcggctcct tag 1593
<210> 11 <211> 530 <212> PRT
<213> Zea mays
<220>
<221> PEPTIDE
<222> (1)..(530)
<223> protein CYPgst (Zea mays)
<400> 11
Met Asp Pro Phe Val Leu Ser Ile Leu Leu Cys Ser Ser Ile Phe Val
1 5 10 15
Val Val Tyr Trp Arg Arg Leu Asn Ser Met Arg Leu Arg Leu Pro Pro
20 25 30
Gly Pro Pro Thr Trp Pro Ile Phe Gly Asn Leu Leu Gln Leu Ser Pro
35 40 45
Leu Pro His Lys Asp Phe Ala Gln Phe Cys Thr Lys Tyr Gly Pro Leu
50 55 60
Val Tyr Leu Arg Leu Gly Thr Ile Asp Ala Ile Thr Thr Asp Asp Pro
65 70 75 80
Glu Val Ile Arg Glu Ile Leu Ile Arg Gln Asp Glu Val Phe Ala Ser
85 90 95
Arg Pro Arg Thr Leu Ala Ala Val His Leu Ala Tyr Gly Cys Gly Asp
100 105 110
Val Ala Leu Ala Pro Leu Gly Pro Asn Trp Lys Arg Met Arg Arg Val
115 120 125
Cys Met Glu His Leu Leu Thr Thr Arg Arg Leu Glu Ser Phe Ala Ala
130 135 140
His Arg Ala Gln Glu Ala Glu His Leu Cys Gln Phe Val Trp Ala Lys
145 150 155 160
Ser Gln Ser Gly Lys Pro Val Asn Leu Arg Glu Val Leu Gly Ala Phe
165 170 175
Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly Lys Gln Tyr Phe Gly
180 185 190
Ile Gln Ser Ala Gly Pro Gly Glu Ala Met Glu Phe Met His Ile Thr
195 200 205
His Glu Leu Phe Phe Leu Leu Gly Leu Ile Tyr Leu Gly Asp Tyr Leu
210 215 220
Pro Ala Trp Arg Trp Val Asp Pro Tyr Gly Cys Glu Lys Arg Met Arg
225 230 235 240
Glu Val Glu Lys Lys Val Asp Asp Phe His Gln Lys Ile Ile Asp Glu
245 250 255
His Arg Arg Ala Arg Glu Ala Arg Lys Ser Arg Ser Ser Val Glu Glu
260 265 270
Asp Gly Gly Asn Gly Lys Asp Glu Met Asp Phe Val Asp Val Leu Leu
275 280 285
Ser Leu Pro Gly Glu Asn Gly Lys Glu His Met Asp Asp Met Glu Ile
290 295 300
Lys Ala Leu Met Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ser
305 310 315 320
Val Thr Asn Glu Trp Val Met Ala Glu Val Ile Lys Asn Pro Arg Val
325 330 335
Leu Arg Arg Val Gln Glu Glu Leu Asp Ala Val Val Gly Arg Asp Arg
340 345 350
Met Val Ala Glu Ser Asp Leu Ala His Leu Pro Tyr Leu Arg Cys Val
355 360 365
Val Arg Glu Ser Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro
370 375 380
His Glu Ser Leu Lys Ala Thr Thr Ile Met Gly Tyr His Val Pro Ala
385 390 395 400
Arg Thr Arg Val Phe Ile Asn Thr His Ala Leu Gly Arg Asn Pro Arg
405 410 415
Val Trp Asp Ser Val Gly Glu Phe Arg Pro Glu Arg His Leu Pro Ala
420 425 430
Glu Glu Gly Ala Arg Val Glu Ile Ser His Leu Pro Asp Phe Lys Ile
435 440 445
Leu Pro Phe Ser Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu Gly
450 455 460
Val Ala Leu Val Leu Met Ala Leu Ala Arg Leu Phe His Cys Phe Asp
465 470 475 480
Trp Ser Pro Pro Asp Gly Leu Arg Pro Glu Asp Val Asp Thr Arg Glu
485 490 495
Val Tyr Gly Met Thr Met Pro Lys Ala Thr Pro Leu Val Ala Val Ala
500 505 510
Thr Pro Arg Leu Pro Pro His Leu Tyr Gly Gly Gly Gly Gly Ser Ser
515 520 525
Ala Pro 530
<210> 12 <211> 4880
<212> <213>
DNA
Solanum tuberosum
<220>
<221> exon
<222> (1762)..(2032) <223> Exon 1
<220>
<221> Intron
<222> (2033)..(2448)
<223> Intron 1
<220>
<221> exon
<222> (2449)..(3161)
<223> Exon 2
<220>
<221> Intron
<222> (3162)..(4031)
<223> Intron 2
<220>
<221> exon
<222> (4032)..(4694) <223> Exon 3
<400> 12
ataataaata ttttttttaa aaaaagagag ggttgttagt tgcaagggta taagtgagca 60
aaaaggtgga tggaaggata attttagacc aaaaagatga gtagaagggt atttttagac 120
caaaagatgg atgaaggata tttttagacc atttcctgta tttcagaggt atttttggcc 180
cttttccgta tgaaaatttg aggttgtatt taagttcaat tggtcaaatt aataagtatt 240
tttaagactg tcaaaaattt agaaataaaa ctaataattc acatcaattc tacaaatatt 300
tctttttaat atatagacat tcggttcaag taaaatattt taagttttta tttaatttct 360
tgtttgtttg attatggatt gccttggatt ctatttgcgt aatggaaatg gcagctcttt 420
tcagtgtagg attggacaag ttagcttgga ttttttttca cctactctac aaaaagtgat 480
ggggcgtcca ccaaccatac gtcaacaact ttgtccattc tttgtacaca ctaccatcac 540
aatctatcaa aagatttgtt ctttagtctc gtttaacata ttctttcgtt ttcattttaa 600
tttatttgtc ttattttttt ttataaaata aaataaatat tttttgatat aatacataaa 660
tatattcttt aatttcattt catttaacat ctctatactt taacttggga gtcgagtgat 720
tgggttggaa gtcaggtcgt gattagaggt taggagttag gtcccaactc ggaattgaga 780
ttagaggtcc agattagatc tcaggttaga gtcgggagtt gggtcttaag ttgtggtcag 840
gatttgggtc ctagttgagg tcacaagtca ggtccccgct cgagatcgaa aattaggtcc 900
cgagttgaga tagaaagttt tttgatcaag attgaggtcg tagtcaagag tcgagttctg 960
agtcgggatt gtaatcggga gtgggtcctt acaggttagg gcgggggtcg aaagtcgggt 1020
ctcaagttag gactcgtttg agggtggtga ggtttaagta ggggtgtgca tcgatcggtt 1080
cggtttatcg attttcagtt tttaaatatg ctaaattaat aaccaaatca aaaggttttt 1140
tttatcgatt ttggtcatta atgactcgat tttctattta accaattaga aaatgctcat 1200
aaaacaaata gatgacttct ctaacaaaat ttgaccgaca agacaagaca ataatgtgat 12 60
tattatttta ggttttgacg ttttgtataa tgtgaagtgt gaattgaagg tttaagggca 1320
aagacagtaa ctagtaatat attgagatta atatttatgt aataagtaaa agaagtaaat 1380
tactggagta taatcttatt gagttattgt tttacccaat aacacaatat taaaaatcaa 1440
tatcgaatcg ataacccgat atttttttta aaaaaaaatt gttaacccaa ttgatgcatt 1500
tttttatata ttcgtaaaat gcgtaaattg cattaaatta ttcccataaa taaaaaagaa 1560
acttgttcat aaattcaaac ttattgtgca aattgaggaa gcaaaaaagt gtgatttcaa 1620
gattaatact tatagttgaa acatgtcaag atgatgggct tcctaatcgc tccaaaaaaa 1680
gattataaat tagaattaaa catatttcct tattaagcct ttgtaaacta cttctttctt 1740
ttttttgaca aataattaaa g atg att gac ttg act agt ttt gtt att gtc 1791
Met Ile Asp Leu Thr Ser Phe Val Ile Val
1 5 10
ctt ctt tgc acg tat ctt ctt aat ttg atc aat tat agt ata gtc ctt 1839
Leu Leu Cys Thr Tyr Leu Leu Asn Leu Ile Asn Tyr Ser Ile Val Leu
15 20 25
ttt ggc gca tat ctt att tcc aag cta ctt cat ttt tca ttc gtc gat 1887
Phe Gly Ala Tyr Leu Ile Ser Lys Leu Leu His Phe Ser Phe Val Asp
30 35 40
aag tcg aat cga gaa atc aat caa ctc cct cct ggt cca aaa caa tgg 1935
Lys Ser Asn Arg Glu Ile Asn Gln Leu Pro Pro Gly Pro Lys Gln Trp
45 50 55
cct att gta ggc aac ctt ttt cag tta ggg caa tta cct cat cga gac 1983
Pro Ile Val Gly Asn Leu Phe Gln Leu Gly Gln Leu Pro His Arg Asp
60 65 70
atg gcg tct ttc tgc gaa aaa tat ggc cca ttg gtc tat ctc cga cta g 2032
Met Ala Ser Phe Cys Glu Lys Tyr Gly Pro Leu Val Tyr Leu Arg Leu
75 80 85 90
gtaatgttga tacaataaat tcacaaatga ccacaattta gtccttgtaa ttaataaata 2092
gtcattgttt tcgagtttca aatttataag ggaaacttca agtacacttg acttggagat 2152
tcacttatgg atgttgcaac tcgatgaaca attactattt tacaaaaaaa tgatcgaaaa 2212
gtgataagtg ataagtgata agtgaacgtt atttctcata taaagttcaa tgctatacag 2272
attcggtcaa actcagtaaa ttttacctaa gtactttatc catgttaaga aaaaatcatt 2332
atatatgtac acacattaaa ttttaaaccg agttattagc actagaattt atcgttctaa 2392
cattttgaac ccataaagtt gatatcgtga ctccaccttt tgttttctct taaaag gt 2450
Gly
aat gtt gat gct atc acc acc aat gat cca gaa atc ata aga gaa ata 2498
Asn Val Asp Ala Ile Thr Thr Asn Asp Pro Glu Ile Ile Arg Glu Ile
95 100 105
ctt gta caa caa gat gat gtt ttt gca tct agg cca aga act ctt gct 2546
Leu Val Gln Gln Asp Asp Val Phe Ala Ser Arg Pro Arg Thr Leu Ala
110 115 120
gcc att cat cta gct tat ggt tgt ggg gat gtg gca ttg gct cct tta 2594
Ala Ile His Leu Ala Tyr Gly Cys Gly Asp Val Ala Leu Ala Pro Leu
125 130 135
ggt cca aaa tgg aaa aga atg aga aga ata tgt atg gaa cat tta ttg 2642
Gly Pro Lys Trp Lys Arg Met Arg Arg Ile Cys Met Glu His Leu Leu
140 145 150 155
aca act aaa aga ctt gaa tca ttt gca aaa cat agg gca gat gaa gcc 2690
Thr Thr Lys Arg Leu Glu Ser Phe Ala Lys His Arg Ala Asp Glu Ala
160 165 170
caa agt cta gtt aaa gat att tgg acc aaa gcc caa aaa gga caa ata 2738
Gln Ser Leu Val Lys Asp Ile Trp Thr Lys Ala Gln Lys Gly Gln Ile
175 180 185
gtg aat ttg agg gaa gtt ttg ggt gga ttt tca atg aat aat gtg act 2786
Val Asn Leu Arg Glu Val Leu Gly Gly Phe Ser Met Asn Asn Val Thr
190 195 200
aga atg ttg tta ggt aaa caa tat ttt ggg gca gaa tca gca ggt cca 2834
Arg Met Leu Leu Gly Lys Gln Tyr Phe Gly Ala Glu Ser Ala Gly Pro
205 210 215
caa gaa gca atg gaa ttt atg cat gta aca cat gag tta ttt tgg tta 2882
Gln Glu Ala Met Glu Phe Met His Val Thr His Glu Leu Phe Trp Leu
220 225 230 235
ctt gga gtg ata tat tta ggt gat tat tta cct ttt tgg agg tgg att 2930
Leu Gly Val Ile Tyr Leu Gly Asp Tyr Leu Pro Phe Trp Arg Trp Ile
240 245 250
gat cct tat ggt tgt gag aaa aaa atg agg gat gtt gaa aaa agg att 2978
Asp Pro Tyr Gly Cys Glu Lys Lys Met Arg Asp Val Glu Lys Arg Ile
255 260 265
gat gat ttt cat atg aga ata att gaa gaa cat aga aag aag aaa ggt 3026
Asp Asp Phe His Met Arg Ile Ile Glu Glu His Arg Lys Lys Lys Gly
270 275 280
aat aaa aat aat aat aat att gat gat gat gaa atg gac ttt gtg gat 3074 Asn Lys Asn Asn Asn Asn Ile Asp Asp Asp Glu Met Asp Phe Val Asp
285 290 295
gtt tta ttg tct cta cca gga gaa gat gaa gga gat ggt aat gga aaa 3122
Val Leu Leu Ser Leu Pro Gly Glu Asp Glu Gly Asp Gly Asn Gly Lys
300 305 310 315
caa aat atg gat gat gta gag att aaa gct cta att cag gtctaatttt 3171 Gln Asn Met Asp Asp Val Glu Ile Lys Ala Leu Ile Gln 320 325
ttttatatat accaactttc tacctattta atatgtcaat gcatttatct caaactactt 3231
atatatatat ccaatatata tgcatttggt gagcaacaac taccacccat gggatttcta 3291
agcttgatta acagaggttg tggtgaagtg ataagtactt cttcatccct aactagaggt 3351
cttgggttcg agtcttgctg gatacaaagt cgtctttgtt aaagagtgtt accccataat 3411
gtgagacttt ccggcacgaa tcaaaatttt gttggaatct aatggggtat cgaacaccag 3471
ttgagaaaag aaagagaaga agaaattcct acaatgtggg actttcggga gcgaacccaa 3531
attttgttgg actctaatga gggtatggga cacccgtaga aaaaaaaaga aataaattca 3591
caagtttgat tgatacttaa aacataaaat ttaagttata tatactgata gagtaaaaca 3651
aattacatta ttagtccaat ttaatcggta ctaccatgtt attactctat taaattatta 3711
tatgagactt aatatagaga gttacatgtc aacttgatag tgtagacatt tttagactat 3771
tcatgcacaa aaacttaact ctaatacaat caatttcctt gcaactttta tattagagaa 3831
tatatatata tatatatata tatatatata tatagtacag tatattttaa catgtataaa 3891
caagatgcct attttatttt cagcttatta ctaatcacaa tatatatttg ctacatcaat 3951
agtataaaaa aaagctaaat atggttcttt tttctgctgt gacttatttc ttttctttaa 4011
ttaaattata ggatatgata gct gca gcc aca gac act tct gct gtg acc aac 4064
Ala Ala Ala Thr Asp Thr Ser Ala Val Thr Asn 330 335
gaa tgg gca atg gct gag gta atc aga cat cca cat gtc ctc aaa aag 4112
Glu Trp Ala Met Ala Glu Val Ile Arg His Pro His Val Leu Lys Lys
340 345 350 355
atc caa gaa gaa ctc gat ata gtt gtc ggg tcg ggt cgg atg gta acc 4160
Ile Gln Glu Glu Leu Asp Ile Val Val Gly Ser Gly Arg Met Val Thr
360 365 370
gaa tcc gac ttg atc cat ctc aag tac ctc cgt tgt gta gta cgt gaa 4208 Glu Ser Asp Leu Ile His Leu Lys Tyr Leu Arg Cys Val Val Arg Glu
375 380 385
aca ttc cga atg cac cct gcg ggt cca ttc cta atc cca cat gaa tca 4256
Thr Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro His Glu Ser
390 395 400
att cgc gat act atg atc aac ggc tat tac atc ccg gcc aag aca cgc 4304
Ile Arg Asp Thr Met Ile Asn Gly Tyr Tyr Ile Pro Ala Lys Thr Arg
405 410 415
gtg ttc atc aac aca cat ggt ctt ggc cgg aac aca aag att tgg gac 4352
Val Phe Ile Asn Thr His Gly Leu Gly Arg Asn Thr Lys Ile Trp Asp
420 425 430 435
aac ata gat gag ttt agg cca gag aga cat tta cca cca aat gat gat 4400 Asn Ile Asp Glu Phe Arg Pro Glu Arg His Leu Pro Pro Asn Asp Asp
440 445 450
gaa aaa aac atg atc atg act act agt agt agt aga gtt gag att agt 4448
Glu Lys Asn Met Ile Met Thr Thr Ser Ser Ser Arg Val Glu Ile Ser
455 460 465
cat ggt cca gat ttc aag att ttg cca ttt agt gct gga aaa agg aag 4496 His Gly Pro Asp Phe Lys Ile Leu Pro Phe Ser Ala Gly Lys Arg Lys
470 475 480
tgt cct ggt gca cca ttg ggt gtg aaa ttg gtg ctt atg gca ttg gct 4544
Cys Pro Gly Ala Pro Leu Gly Val Lys Leu Val Leu Met Ala Leu Ala
485 490 495
agg ttg ttt cat tgc tat gat tgg agt cca cca aat gga gta aag cat 4592 Arg Leu Phe His Cys Tyr Asp Trp Ser Pro Pro Asn Gly Val Lys His
500 505 510 515
caa gat att gac aca aat gaa gtt tat gga atg act atg cct aaa gct 4640
Gln Asp Ile Asp Thr Asn Glu Val Tyr Gly Met Thr Met Pro Lys Ala
520 525 530
aag cca ttg atg gct att gct aaa cct aga ctg cct gct cac ttg tac 4688 Lys Pro Leu Met Ala Ile Ala Lys Pro Arg Leu Pro Ala His Leu Tyr
535 540 545
caa taa ttagttacta gtactcaaat caaagggaat tggtctttaa tggctttcgt 4744
Gln
aacgaatcaa ataaagagaa atttctattt gtacctcgta aaaaaaagct ctcgcctcct 4804 gtaatagtat acttcaacat ttttctcacc tgtggcaatc cacacagcag acttaagtct 4864 gtctgattac atagta 4880
<210> 13
<211> 1656
<212> DNA
<213> Artificial Sequence
<220>
<223> cDNA CYPgst gene (Solanum tuberosum)
<400> 13
atgattgact tgactagttt tgttattgtc cttctttgca cgtatcttct taatttgatc 60
aattatagta tagtcctttt tggcgcatat cttatttcca agctacttca tttttcattc 120
gtcgataagt cgaatcgaga aatcaatcaa ctccctcctg gtccaaaaca atggcctatt 180
gtaggcaacc tttttcagtt agggcaatta cctcatcgag acatggcgtc tttctgcgaa 240
aaatatggcc cattggtcta tctccgacta ggtaatgttg atgctatcac caccaatgat 300
ccagaaatca taagagaaat acttgtacaa caagatgatg tttttgcatc taggccaaga 360
actcttgctg ccattcatct agcttatggt tgtggggatg tggcattggc tcctttaggt 420
ccaaaatgga aaagaatgag aagaatatgt atggaacatt tattgacaac taaaagactt 480
gaatcatttg caaaacatag ggcagatgaa gcccaaagtc tagttaaaga tatttggacc 540
aaagcccaaa aaggacaaat agtgaatttg agggaagttt tgggtggatt ttcaatgaat 600
aatgtgacta gaatgttgtt aggtaaacaa tattttgggg cagaatcagc aggtccacaa 660
gaagcaatgg aatttatgca tgtaacacat gagttatttt ggttacttgg agtgatatat 720
ttaggtgatt atttaccttt ttggaggtgg attgatcctt atggttgtga gaaaaaaatg 780
agggatgttg aaaaaaggat tgatgatttt catatgagaa taattgaaga acatagaaag
840
aagaaaggta ataaaaataa taataatatt gatgatgatg aaatggactt tgtggatgtt 900
ttattgtctc taccaggaga agatgaagga gatggtaatg gaaaacaaaa tatggatgat 960
gtagagatta aagctctaat tcaggatatg atagctgcag ccacagacac ttctgctgtg 1020
accaacgaat gggcaatggc tgaggtaatc agacatccac atgtcctcaa aaagatccaa 1080
gaagaactcg atatagttgt cgggtcgggt cggatggtaa ccgaatccga cttgatccat 1140
ctcaagtacc tccgttgtgt agtacgtgaa acattccgaa tgcaccctgc gggtccattc 1200
ctaatcccac atgaatcaat tcgcgatact atgatcaacg gctattacat cccggccaag 1260
acacgcgtgt tcatcaacac acatggtctt ggccggaaca caaagatttg ggacaacata 1320
gatgagttta ggccagagag acatttacca ccaaatgatg atgaaaaaaa catgatcatg 1380
actactagta gtagtagagt tgagattagt catggtccag atttcaagat tttgccattt 1440
agtgctggaa aaaggaagtg tcctggtgca ccattgggtg tgaaattggt gcttatggca 1500
ttggctaggt tgtttcattg ctatgattgg agtccaccaa atggagtaaa gcatcaagat 1560
attgacacaa atgaagttta tggaatgact atgcctaaag ctaagccatt gatggctatt 1620
gctaaaccta gactgcctgc tcacttgtac caataa 1656
<210> 14 <211> 551
<212> PRT
<213> Solanum tuberosum
<220>
<221> PEPTID
<222> (1)..(551)
<223> protein CYPgst (Solanum tuberosum)
<400> 14
Met Ile Asp Leu Thr Ser Phe Val Ile Val Leu Leu Cys Thr Tyr Leu
1 5 10 15
Leu Asn Leu Ile Asn Tyr Ser Ile Val Leu Phe Gly Ala Tyr Leu Ile
20 25 30
Ser Lys Leu Leu His Phe Ser Phe Val Asp Lys Ser Asn Arg Glu Ile
35 40 45
Asn Gln Leu Pro Pro Gly Pro Lys Gln Trp Pro Ile Val Gly Asn Leu
50 55 60
Phe Gln Leu Gly Gln Leu Pro His Arg Asp Met Ala Ser Phe Cys Glu
65 70 75 80
Lys Tyr Gly Pro Leu Val Tyr Leu Arg Leu Gly Asn Val Asp Ala Ile
85 90 95
Thr Thr Asn Asp Pro Glu Ile Ile Arg Glu Ile Leu Val Gln Gln Asp
100 105 110
Asp Val Phe Ala Ser Arg Pro Arg Thr Leu Ala Ala Ile His Leu Ala
115 120 125
Tyr Gly Cys Gly Asp Val Ala Leu Ala Pro Leu Gly Pro Lys Trp Lys
130 135 140
Arg Met Arg Arg Ile Cys Met Glu His Leu Leu Thr Thr Lys Arg Leu
145 150 155 160
Glu Ser Phe Ala Lys His Arg Ala Asp Glu Ala Gln Ser Leu Val Lys
165 170 175
Asp Ile Trp Thr Lys Ala Gln Lys Gly Gln Ile Val Asn Leu Arg Glu
180 185 190
Val Leu Gly Gly Phe Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly
195 200 205
Lys Gln Tyr Phe Gly Ala Glu Ser Ala Gly Pro Gln Glu Ala Met Glu
210 215 220
Phe Met His Val Thr His Glu Leu Phe Trp Leu Leu Gly Val Ile Tyr
225 230 235 240
Leu Gly Asp Tyr Leu Pro Phe Trp Arg Trp Ile Asp Pro Tyr Gly Cys
245 250 255
Glu Lys Lys Met Arg Asp Val Glu Lys Arg Ile Asp Asp Phe His Met
260 265 270
Arg Ile Ile Glu Glu His Arg Lys Lys Lys Gly Asn Lys Asn Asn Asn
275 280 285
Asn Ile Asp Asp Asp Glu Met Asp Phe Val Asp Val Leu Leu Ser Leu
290 295 300
Pro Gly Glu Asp Glu Gly Asp Gly Asn Gly Lys Gln Asn Met Asp Asp
305 310 315 320
Val Glu Ile Lys Ala Leu Ile Gln Asp Met Ile Ala Ala Ala Thr Asp
325 330 335
Thr Ser Ala Val Thr Asn Glu Trp Ala Met Ala Glu Val Ile Arg His
340 345 350
Pro His Val Leu Lys Lys Ile Gln Glu Glu Leu Asp Ile Val Val Gly
355 360 365
Ser Gly Arg Met Val Thr Glu Ser Asp Leu Ile His Leu Lys Tyr Leu
370 375 380
Arg Cys Val Val Arg Glu Thr Phe Arg Met His Pro Ala Gly Pro Phe
385 390 395 400
Leu Ile Pro His Glu Ser Ile Arg Asp Thr Met Ile Asn Gly Tyr Tyr
405 410 415
Ile Pro Ala Lys Thr Arg Val Phe Ile Asn Thr His Gly Leu Gly Arg
420 425 430
Asn Thr Lys Ile Trp Asp Asn Ile Asp Glu Phe Arg Pro Glu Arg His
435 440 445
Leu Pro Pro Asn Asp Asp Glu Lys Asn Met Ile Met Thr Thr Ser Ser
450 455 460
Ser Arg Val Glu Ile Ser His Gly Pro Asp Phe Lys Ile Leu Pro Phe
465 470 475 480
Ser Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu Gly Val Lys Leu
485 490 495
Val Leu Met Ala Leu Ala Arg Leu Phe His Cys Tyr Asp Trp Ser Pro
500 505 510
Pro Asn Gly Val Lys His Gln Asp Ile Asp Thr Asn Glu Val Tyr Gly
515 520 525
Met Thr Met Pro Lys Ala Lys Pro Leu Met Ala Ile Ala Lys Pro Arg
530 535 540
Leu Pro Ala His Leu Tyr Gln 545 550
<210> 15
<211> 525
<212> PRT
<213> Triticum aestivum
<220>
<221> PEPTID
<222> (1)..(525)
<223> protein CYPgst (Trticum aestivum)
<400> 15
Met Asp Pro Phe Leu Leu Ser Ile Ile Leu Cys Ser Cys Ile Phe Ala
1 5 10 15
Ala Val Ser Trp Lys Lys Leu Asn Gly Met Arg Leu Arg Leu Pro Pro
20 25 30
Gly Pro Pro Arg Trp Pro Ile Phe Gly Asn Leu Leu Gln Leu Ser Pro
35 40 45
Leu Pro His Lys Asp Phe Ala Arg Phe Cys Thr Lys Tyr Gly Pro Leu
50 55 60
Val Tyr Leu Arg Leu Gly Thr Ile Asp Ala Ile Thr Thr Asp Asp Pro
65 70 75 80
Glu Val Ile Arg Glu Ile Leu Ile Arg Gln Asp Glu Val Phe Ala Ser
85 90 95
Arg Pro Arg Thr Leu Ala Ala Val His Leu Ala Tyr Gly Cys Gly Asp
100 105 110
Val Ala Leu Ala Pro Leu Gly Pro Asn Trp Lys Arg Met Arg Arg Val
115 120 125
Cys Met Glu His Leu Leu Thr Thr Arg Arg Leu Glu Ser Phe Ala Ala
130 135 140
His Arg Ala Glu Glu Ala Glu His Leu Cys Glu Phe Val Trp Ala Lys
145 150 155 160
Ser Gln Ser Gly Lys Pro Val Asn Leu Arg Glu Val Leu Gly Ala Phe
165 170 175
Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly Lys Gln Tyr Phe Gly
180 185 190
Leu Gln Ser Ala Gly Pro Gly Glu Ala Met Glu Phe Met His Ile Thr
195 200 205
His Glu Leu Phe Phe Leu Leu Gly Leu Ile Tyr Leu Gly Asp Tyr Leu
210 215 220
Pro Ala Trp Arg Trp Leu Asp Pro Tyr Gly Cys Glu Lys Lys Met Arg
225 230 235 240
Glu Val Glu Lys Lys Val Asp Asp Phe His Gln Lys Ile Ile Asp Glu
245 250 255
His Arg Lys Ala Arg Asp Val Arg Lys Ser Gly Ala Ser Leu Asp Asp
260 265 270
Asp Gly Asp Asp Ser Lys Glu Gly Met Asp Phe Val Asp Val Leu Leu
275 280 285
Ser Leu Pro Gly Glu Asn Gly Asn Glu His Met Asp Asp Val Glu Ile
290 295 300
Lys Ala Leu Met Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ser
305 310 315 320
Val Thr Asn Glu Trp Val Met Ala Glu Val Ile Lys Asn Pro Arg Val
325 330 335
Leu Arg Lys Ile Gln Glu Glu Leu Asp Ala Val Val Gly Thr Ser Arg
340 345 350
Pro His Gly Gly Gly Gly Gly Pro Pro Pro Pro Asp Val Pro Pro Leu
355 360 365
Arg Arg Pro Gly Val Leu Pro Asp Ala Pro Gly Gly Ala Ile Pro Asp
370 375 380
Pro Ala Arg Val Thr Gln Gly Asp Asp His His Gly Leu Arg His Pro
385 390 395 400
Gly Ala Asp Glu Asp Leu His Gln His Pro Arg Ala Gly Pro Glu Pro
405 410 415
Ala His Leu Gly Arg Arg Arg Arg Val Pro Pro Arg Glu Ala Pro Pro
420 425 430
Gly Gly Arg Arg Ala Arg Gly Asp Gln Pro Pro Ala Gly Leu Gln Asp
435 440 445
Pro Ala Leu Gln Arg Arg Gln Ala Gln Val Pro Arg Gly Ala Ala Gly
450 455 460
Arg Asp Pro Gly Ala His Gly Ala Arg Gln Ala Leu Pro Leu Leu Arg
465 470 475 480
Leu Val Pro Ala Arg Arg Pro Pro Pro Arg Gly His Arg His Arg Arg
485 490 495
Gly Leu Arg Asp Asp His Ala Gln Gly Gln Ala Ala His Arg Arg Arg
500
505
510
Ser Thr Ala Pro Ala Ala Ala Asp Val Arg Leu Leu Ser
515 520 525
<210> 16 <211> 518 <212> PRT
<213> Helianthus annuus
<220>
<221> PEPTID
<222> (1)..(518)
<223> protein CYPgst (Helianthus annuus)
<400> 16
Met Asp Leu Gln Ser Phe Ile Ser Val Leu Ala Phe Ile Val Ala Ser
1 5 10 15
Arg Ile Ile Leu Leu Trp Tyr Val Lys Gln Arg Val Thr Gln Asn Thr
20 25 30
Thr His Arg Leu Pro Pro Gly Pro Pro Arg Trp Pro Ile Val Gly Asn
35 40 45
Leu Leu Gln Leu Gly Pro Leu Pro His Arg Asp Leu Ala Ser Phe Cys
50 55 60
Glu Arg Tyr Gly Pro Leu Val Tyr Leu Arg Leu Gly Lys Val Asp Ala
65 70 75 80
Ile Thr Thr Asn Asp Pro Asn Ile Ile Arg Glu Ile Leu Val Lys Gln
85 90 95
Asp Asp Val Phe Ala Ser Arg Pro Gln Thr Leu Ala Ala Val His Leu
100 105 110
Ala Tyr Asn Cys Gly Asp Val Ala Leu Ala Pro Phe Gly Pro Arg Trp
115 120 125
Lys Trp Met Arg Arg Ile Cys Met Glu Gln Leu Leu Thr Thr Lys Arg
130 135 140
Leu Glu Ser Phe Ala Lys Gln Arg Ala Ser Glu Ala Gln His Leu Val
145 150 155 160
Gln Asp Val Trp Ala Leu Ser Gln Ala Asn Gly Pro Ile Asn Leu Arg
165 170 175
Glu Val Leu Gly Gly Phe Ser Met Asn Asn Val Thr Arg Met Leu Leu
180 185 190
Gly Lys Gln Tyr Phe Gly Ser Gly Ser Ala Gly Pro Lys Glu Ala Thr
195 200 205
Glu Phe Met His Ile Thr His Glu Leu Phe Trp Leu Leu Gly Leu Ile
210 215 220
Tyr Leu Gly Asp Tyr Leu Pro Phe Trp Arg Trp Ile Asp Pro Tyr Gly
225 230 235 240
Cys Glu Lys Lys Met Arg Glu Val Glu Lys Arg Val Asp Asp Phe His
245 250 255
Met Lys Ile Ile Glu Glu His Arg Gln Arg Arg Lys Asn Gly Glu Gln
260 265 270
Lys Asp Glu Gly Ile Met Asp Phe Val Asp Val Leu Leu Ser Leu Pro
275 280 285
Gly Glu Asp Gly Lys Asp His Met Asp Asp Arg Gln Ile Lys Ala Leu
290 295 300
Val Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ala Val Thr Asn
305 310 315 320
Glu Trp Ala Met Ala Glu Val Ile Lys His Pro His Val Leu Arg Lys
325 330 335
Ile Gln Glu Glu Leu Asp Asn Val Val Gly Pro Asp Arg Met Val Ser
340 345 350
Glu Ser Asp Leu Ser Asn Leu Asn Tyr Leu Arg Cys Val Val Arg Glu
355 360 365
Thr Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro His Glu Ser
370 375 380
Leu Arg Ala Thr Glu Ile Asn Gly Tyr Tyr Ile Pro Ala Lys Thr Arg
385 390 395 400
Val Phe Ile Asn Thr His Gly Leu Gly Arg Asn Thr Val Leu Trp Asp
405 410 415
Asp Ile Asn Val Phe Arg Pro Glu Arg His Leu Thr Ser Asp Gly Ser
420 425 430
Arg Val Glu Ile Ser His Gly Asp Asp Phe Lys Ile Leu Pro Phe Ser
435 440 445
Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu Gly Val Thr Leu Val
450 455 460
Leu Met Ala Leu Ala Arg Leu Phe His Cys Phe Asp Trp Ser Pro Pro
465 470 475 480
Asp Gly Leu Lys Cys Glu Asp Ile Asp Thr Gln Glu Ile Tyr Gly Met
485 490 495
Thr Met Pro Lys Ala Lys Pro Leu Met Ala Val Ala Lys Pro Arg Leu
500 505 510
Ala Ser Tyr Met Tyr Gln 515
<210> 17 <211> 530
<212> PRT
<213> Hordeum vulgare
<220>
<221> PEPTID
<222> (1)..(530)
<223> protein CYPgst (Hordeum vulgare)
<400> 17
Met Asp Leu Phe Leu Phe Ser Ile Ile Leu Cys Ser Cys Ile Phe Ala
1 5 10 15
Ala Val Ser Trp Arg Lys Leu Ser Arg Leu Arg Leu Arg Leu Pro Pro
20 25 30
Gly Pro Pro Arg Trp Pro Ile Phe Gly Asn Leu Leu Gln Leu Ser Pro
35 40 45
Leu Pro His Lys Asp Phe Ala Arg Phe Cys Thr Lys Tyr Gly Pro Leu
50 55 60
Val Tyr Leu Arg Leu Gly Thr Ile Asp Ala Ile Thr Thr Asp Asp Pro
65 70 75 80
Glu Val Ile Arg Glu Ile Leu Val Arg Gln Asp Glu Val Phe Ala Ser
85 90 95
Arg Pro Arg Thr Leu Ala Ala Val His Leu Ala Tyr Gly Cys Gly Asp
100 105 110
Val Ala Leu Ala Pro Leu Gly Pro Asn Trp Lys Arg Met Arg Arg Val
115 120 125
Cys Met Glu His Leu Leu Thr Thr Lys Arg Leu Glu Ser Phe Ala Ala
130 135 140
His Arg Ala Gln Glu Ala Glu His Leu Cys Glu Phe Val Trp Ala Lys
145 150 155 160
Ser Gln Ser Gly Lys Pro Val Asn Leu Arg Glu Val Leu Gly Ala Phe
165 170 175
Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly Lys Gln Tyr Phe Gly
180 185 190
Leu Gln Ser Ala Gly Pro Gly Glu Ala Met Glu Phe Met His Ile Thr
195 200 205
His Glu Leu Phe Phe Leu Leu Gly Leu Ile Tyr Leu Gly Asp Tyr Leu
210 215 220
Pro Ala Trp Arg Trp Val Asp Pro Tyr Gly Cys Glu Lys Lys Met Arg
225 230 235 240
Glu Val Glu Lys Lys Val Asp Asp Phe His Gln Lys Ile Ile Asp Glu
245 250 255
His Arg Lys Ala Arg Asp Ala Arg Lys Ser Ala Ala Ser Leu Asp Asp
260 265 270
Gly Asp Asp Ser Lys Glu Asp Met Asp Phe Val Asp Val Leu Leu Ser
275 280 285
Leu Pro Gly Glu Asn Gly Asn Glu His Met Asp Asp Val Glu Ile Lys
290 295 300
Ala Leu Met Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ser Val
305 310 315 320
Thr Asn Glu Trp Val Met Ala Glu Val Ile Lys Asn Pro Cys Val Leu
325 330 335
Arg Lys Ile Gln Glu Glu Leu Asp Ala Val Val Gly Arg Ser Arg Met
340 345 350
Val Val Glu Ser Asp Leu Pro His Leu Thr Tyr Leu Arg Cys Val Val
355 360 365
Arg Glu Ser Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro His
370 375 380
Glu Ser Leu Lys Ala Thr Thr Ile Met Gly Tyr Asp Ile Pro Ala Gln
385 390 395 400
Thr Arg Ile Phe Ile Asn Thr His Ala Leu Gly Arg Asn Pro Arg Ile
405 410 415
Trp Asp Asp Val Gly Glu Phe His Pro Glu Arg His Leu Pro Ala Asp
420 425 430
Gly Gly Arg Val Glu Ile Ser His Leu Pro Asp Phe Lys Ile Leu Pro
435 440 445
Phe Ser Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu Gly Val Ile
450 455 460
Leu Val Leu Met Ala Leu Ala Arg Leu Phe His Cys Phe Asp Trp Ser
465 470 475 480
Pro Pro Asp Gly Leu Arg Pro Glu Asp Ile Asp Thr Asp Glu Val Tyr
485 490 495
Gly Met Thr Met Pro Lys Ala Lys Pro Leu Ile Ala Ala Val Gln Pro
500 505 510
Arg Leu Pro Pro Gln Met Tyr Gly Ser Cys Pro Ser His Gly Met Gln
515 520 525
Met Gln 530
<210> 18 <211> 466 <212> PRT
<213> Brassica napus
<220>
<221> PEPTID
<222> (1)..(466)
<223> protein CYPgst (Brassica napus)
<400> 18
Met Ala Ala Leu Cys Ser Lys Tyr Gly Pro Leu Val Tyr Leu Arg Leu
1 5 10 15
Gly Asn Ile Asp Ala Ile Thr Thr Asn Asp Pro Glu Thr Ile Arg Glu
20 25 30
Ile Leu Phe Arg Gln Asp Asp Val Phe Ala Ser Arg Pro Lys Thr Leu
35 40 45
Ala Ala Val His Leu Ala Tyr Gly Cys Gly Asp Val Ala Leu Ala Pro
50 55 60
Met Gly Pro His Trp Lys Arg Met Arg Arg Ile Cys Met Glu His Leu
65 70 75 80
Leu Thr Thr Lys Arg Leu Glu Ser Phe Thr Ser Gln Arg Ala Glu Glu
85 90 95
Ala Gln Tyr Leu Ile Gln Asp Val Cys Lys Arg Ala Glu Cys Gly Lys
100 105 110
Pro Ile Asn Leu Arg Glu Val Leu Gly Ala Phe Ser Met Asn Asn Val
115 120 125
Thr Arg Met Leu Leu Gly Lys Gln Phe Phe Gly Pro Gly Ser Val Val
130 135 140
Gly Ala Lys Glu Ala Gln Glu Phe Met His Ile Thr His Lys Leu Phe
145 150 155 160
Arg Leu Leu Gly Val Ile Tyr Leu Gly Asp Tyr Leu Pro Phe Trp Arg
165 170 175
Trp Val Asp Pro Tyr Gly Cys Glu Lys Glu Met Arg Asp Val Glu Lys
180 185 190
Arg Val Asp Lys Phe His Thr Lys Ile Ile Glu Glu His Arg Arg Ala
195 200 205
Lys Arg Glu Lys Glu Asp Lys Asn Ile Glu Gly Asp Met Asp Phe Val
210 215 220
Asp Val Leu Leu Ser Leu Pro Gly Glu Asn Gly Lys Glu His Met Asp
225 230 235 240
Asp Val Glu Ile Lys Ala Leu Ile Gln Asp Met Ile Ala Ala Ala Thr
245 250 255
Asp Thr Ser Ala Val Thr Asn Glu Trp Ala Met Ala Glu Val Ile Lys
260 265 270
Gln Pro Arg Val Met Arg Lys Ile Gln Glu Glu Leu Asp Asn Val Val
275 280 285
Gly Ser Asn Arg Met Val Asn Glu Thr Asp Leu Val His Leu Asn Tyr
290 295 300
Leu Arg Cys Val Val Arg Glu Thr Phe Arg Met His Pro Ala Gly Pro
305 310 315 320
Phe Leu Ile Pro His Glu Ser Val Arg Pro Thr Thr Ile Asn Gly Tyr
325 330 335
Tyr Ile Pro Ala Lys Thr Arg Val Phe Ile Asn Thr His Gly Leu Gly
340 345 350
Arg Asn Thr Ser Val Trp Thr Thr Asp Ile Glu Glu Phe Arg Pro Glu
355 360 365
Arg His Trp Pro Val Asp Gly Ser Gly Arg Val Glu Ile Ser His Gly
370 375 380
Pro Asp Tyr Lys Ile Leu Pro Phe Ser Ala Gly Lys Arg Lys Cys Pro
385 390 395 400
Gly Ala Pro Leu Gly Val Thr Met Val Leu Met Ala Leu Ala Arg Leu
405 410 415
Phe His Cys Phe Asp Trp Thr Thr Pro Glu Asp Ile Asp Thr Val Glu
420 425 430
Val Tyr Gly Met Thr Met Pro Lys Ala Lys Pro Leu Trp Ala Leu Ala
435 440 445
Lys Pro Arg Leu Ala Ala His Leu Tyr Thr Ile Thr His Asp Thr Ile
450 455 460
Gly His 465
<210> 19
<211> 530
<212> PRT
<213> Brassica oleracea
<220>
<221> PEPTID
<222> (1)..(530)
<223> protein CYPgst (Brassica oleracea)
<400> 19
Met Asp Leu Phe Leu Leu Ser Ile Ile Leu Cys Ser Trp Ile Phe Val
Ala Val Tyr Trp Lys Lys Leu Asn Arg Thr Lys Leu Arg Leu Pro Pro
20 25 30
Gly Pro Pro Arg Trp Pro Ile Phe Gly Asn Leu Leu Gln Leu Ser Pro
35 40 45
Leu Pro His Lys Asp Phe Ala Arg Phe Cys Thr Lys Tyr Gly Pro Leu
50 55 60
Val Tyr Leu Arg Leu Gly Thr Ile Asp Ala Ile Thr Thr Asp Asp Pro
65 70 75 80
Glu Val Ile Arg Glu Ile Leu Ile Arg Gln Asp Glu Val Phe Ala Ser
85 90 95
Arg Pro Arg Thr Leu Ala Ala Val His Leu Ala Tyr Gly Cys Gly Asp
100 105 110
Val Ala Leu Ala Pro Leu Gly Pro Asn Trp Lys Arg Met Arg Arg Val
115 120 125
Cys Met Glu His Leu Leu Thr Thr Lys Arg Leu Glu Ser Phe Ala Ala
130 135 140
His Arg Ala Gln Glu Ala Glu His Leu Cys Gln Phe Val Trp Ala Lys
145 150 155 160
Ser Gln Ser Glu Lys Pro Val Asn Leu Arg Glu Val Leu Gly Ala Phe
165 170 175
Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly Lys Gln Tyr Phe Gly
180 185 190
Leu Gln Ser Ala Gly Pro Gly Glu Ala Met Glu Phe Met His Ile Thr
195 200 205
His Glu Leu Phe Tyr Leu Leu Gly Leu Ile Tyr Leu Gly Asp Tyr Leu
210 215 220
Pro Ala Trp Arg Trp Val Asp Pro Tyr Gly Cys Glu Lys Lys Met Arg
225 230 235 240
Glu Val Glu Lys Lys Val Asp Asp Phe His Gln Lys Ile Ile Asp Glu
245 250 255
His Arg Lys Ala Arg Glu Ala Arg Lys Ser Ala Ser Ser Leu Asp Asp
260
265
270
Gly Asp Asp Ser Lys Glu Glu Met Asp Phe Val Asp Val Leu Leu Ser
275 280 285
Leu Pro Gly Glu Asn Gly Lys Glu His Met Asp Asp Val Glu Ile Lys
290 295 300
Ala Leu Met Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ser Val
305 310 315 320
Thr Asn Glu Trp Val Met Ala Glu Val Ile Lys His Pro Arg Val Leu
325 330 335
Arg Lys Ile Gln Glu Glu Leu Asp Ala Val Val Gly Arg Ala Arg Met
340 345 350
Val Ser Glu Ser Asp Leu Pro His Leu Pro Tyr Leu Arg Cys Val Val
355 360 365
Arg Glu Ser Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro His
370 375 380
Glu Ser Leu Lys Pro Thr Thr Ile Met Gly Tyr Asp Ile Pro Ala Arg
385 390 395 400
Thr Arg Ile Phe Ile Asn Thr His Ala Leu Gly Arg Asn Pro Arg Val
405 410 415
Trp Asp Asp Val Gly Gln Phe Arg Pro Glu Arg His Met Pro Ala Asp
420 425 430
Gly Gly Ala Arg Val Glu Ile Ser His Leu Pro Asp Phe Lys Ile Leu
435 440 445
Pro Phe Ser Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu Gly Val
450 455 460
Ile Leu Val Leu Met Ala Leu Ala Arg Leu Phe His Cys Phe Asp Trp
465 470 475 480
Ser Pro Pro Asp Gly Glu Glu Ile Asp Thr Asp Glu Val Tyr Gly Met
485 490 495
Thr Met Pro Lys Ala Leu Pro Leu Phe Ala Ala Ala Arg Pro Arg Leu
500 505 510
Pro Pro Glu Met Tyr His Gly Ser Ser Cys Pro Ser His Gly Lys Gln
515
520
525
Thr Met
530
<210> 20 <211> 466
<212> PRT
<213> Brassica rapa
<220>
<221> PEPTID
<222> (1)..(466)
<223> protein CYPgst (Brassica rapa)
<400> 20
Met Ala Ala Leu Cys Ser Lys Tyr Gly Pro Leu Val Tyr Leu Arg Leu
1 5 10 15
Gly Asn Ile Asp Ala Ile Thr Thr Asn Asp Pro Glu Thr Ile Arg Glu
20 25 30
Ile Leu Phe Arg Gln Asp Asp Val Phe Ala Ser Arg Pro Lys Thr Leu
35 40 45
Ala Ala Val His Leu Ala Tyr Gly Cys Gly Asp Val Ala Leu Ala Pro
50 55 60
Met Gly Pro His Trp Lys Arg Met Arg Arg Ile Cys Met Glu His Leu
65 70 75 80
Leu Thr Thr Lys Arg Leu Glu Ser Phe Thr Ser Gln Arg Ala Glu Glu
85 90 95
Ala Gln Tyr Leu Ile Gln Asp Val Cys Lys Arg Ala Glu Cys Gly Lys
100 105 110
Pro Ile Asn Leu Arg Glu Val Leu Gly Ala Phe Ser Met Asn Asn Val
115 120 125
Thr Arg Met Leu Leu Gly Lys Gln Phe Phe Gly Pro Gly Ser Val Val
130 135 140
Gly Ala Lys Glu Ala Gln Glu Phe Met His Ile Thr His Lys Leu Phe
145 150 155 160
Arg Leu Leu Gly Val Ile Tyr Leu Gly Asp Tyr Leu Pro Phe Trp Arg
165 170 175
Trp Val Asp Pro Tyr Gly Cys Glu Lys Glu Met Arg Asp Val Glu Lys
180 185 190
Arg Val Asp Lys Phe His Thr Lys Ile Ile Glu Glu His Arg Arg Ala
195 200 205
Lys Arg Glu Lys Glu Asp Lys Asn Ile Glu Gly Asp Met Asp Phe Val
210 215 220
Asp Val Leu Leu Ser Leu Pro Gly Glu Asn Gly Lys Glu His Met Asp
225 230 235 240
Asp Val Glu Ile Lys Ala Leu Ile Gln Asp Met Ile Ala Ala Ala Thr
245 250 255
Asp Thr Ser Ala Val Thr Asn Glu Trp Ala Met Ala Glu Val Ile Lys
260 265 270
Gln Pro Arg Val Met Arg Lys Ile Gln Glu Glu Leu Asp Asn Val Val
275 280 285
Gly Ser Asn Arg Met Val Asn Glu Thr Asp Leu Val His Leu Asn Tyr
290 295 300
Leu Arg Cys Val Val Arg Glu Thr Phe Arg Met His Pro Ala Gly Pro
305 310 315 320
Phe Leu Ile Pro His Glu Ser Val Arg Pro Thr Thr Ile Asn Gly Tyr
325 330 335
Tyr Ile Pro Ala Lys Thr Arg Val Phe Ile Asn Thr His Gly Leu Gly
340 345 350
Arg Asn Thr Ser Val Trp Thr Thr Asp Ile Glu Glu Phe Arg Pro Glu
355 360 365
Arg His Trp Pro Val Asp Gly Ser Gly Arg Val Glu Ile Ser His Gly
370 375 380
Pro Asp Tyr Lys Ile Leu Pro Phe Ser Ala Gly Lys Arg Lys Cys Pro
385 390 395 400
Gly Ala Pro Leu Gly Val Thr Met Val Leu Met Ala Leu Ala Arg Leu
405 410 415
Phe His Cys Phe Asp Trp Thr Thr Pro Glu Asp Ile Asp Thr Val Glu
420 425 430
Val Tyr Gly Met Thr Met Pro Lys Ala Lys Pro Leu Trp Ala Leu Ala
435 440 445
Lys Pro Arg Leu Ala Ala His Leu Tyr Thr Ile Thr His Asp Thr Ile
450 455 460
Gly His 465
<210> 21
<211> 523
<212> PRT
<213> Glycine max
<220>
<221> PEPTID
<222> (1)..(523)
<223> protein CYPgst (Glycine max)
<400> 21
Met Asp Leu Thr Thr Phe Ile Ser Thr Leu Phe Leu Gly Thr Leu Ala
1 5 10 15
Ser Arg Ile Ile Arg His Trp Leu Ile Gly Arg Ser Leu Ser Ser His
20 25 30
Lys Asn Lys Leu Pro Pro Gly Pro Pro Arg Trp Pro Ile Val Gly Asn
35 40 45
Leu Leu Gln Leu Gly Gln Leu Pro His Arg Asp Leu Ala Ser Leu Cys
50 55 60
Asp Lys Tyr Gly Pro Leu Val Tyr Leu Lys Leu Gly Lys Ile Asp Ala
65 70 75 80
Ile Thr Thr Asn Asp Pro Asp Ile Ile Arg Glu Ile Leu Leu Ser Gln
85 90 95
Asp Asp Val Phe Ala Ser Arg Pro His Thr Phe Ala Ala Val His Leu
100 105 110
Ala Tyr Gly Cys Gly Asp Val Ala Leu Ala Pro Leu Gly Pro His Trp
115 120 125
Lys Arg Met Arg Arg Ile Cys Met Glu His Leu Leu Thr Thr Lys Arg
130 135 140
Leu Glu Ser Phe Ser Asn His Arg Leu Asp Glu Ala Gln His Leu Val
145 150 155 160
Lys Asp Val Met Ala Trp Ala Gln Asp Lys Lys Pro Ile Asn Leu Arg
165 170 175
Glu Val Leu Gly Ala Phe Ser Met Asn Asn Val Thr Arg Met Leu Leu
180 185 190
Gly Lys Gln Tyr Phe Gly Ser Glu Ser Ser Gly Pro Gln Glu Ala Met
195 200 205
Glu Phe Met His Ile Thr His Glu Leu Phe Trp Leu Leu Gly Val Ile
210 215 220
Tyr Leu Gly Asp Tyr Leu Pro Ile Trp Arg Trp Val Asp Pro Tyr Gly
225 230 235 240
Cys Glu Lys Lys Met Arg Glu Val Glu Lys Arg Val Asp Asp Phe His
245 250 255
Ser Asn Ile Ile Glu Glu His Arg Lys Ala Arg Lys Asp Arg Lys Gly
260 265 270
Lys Arg Lys Glu Gly Asp Gly Asp Met Asp Phe Val Asp Val Leu Leu
275 280 285
Ser Leu Pro Gly Glu Asp Gly Lys Glu His Met Asp Asp Val Glu Ile
290 295 300
Lys Ala Leu Ile Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ala
305 310 315 320
Val Thr Asn Glu Trp Ala Met Ala Glu Val Met Lys His Pro His Val
325 330 335
Leu His Lys Ile Gln Glu Glu Leu Asp Thr Ile Val Gly Pro Asn Arg
340 345 350
Met Val Leu Glu Ser Asp Leu Pro His Leu Asn Tyr Leu Arg Cys Val
355 360 365
Val Arg Glu Thr Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro
370 375 380
His Glu Ser Leu Arg Ala Thr Thr Ile Asn Gly Tyr His Ile Pro Ala
385 390 395 400
Lys Thr Arg Val Phe Ile Asn Thr His Gly Leu Gly Arg Asn Thr Lys
405 410 415
Ile Trp Asp Asn Val Asp Glu Phe Arg Pro Glu Arg His Trp Pro Ser
420 425 430
Asn Gly Asn Gly Thr Arg Val Glu Ile Ser His Gly Val Asp Phe Lys
435 440 445
Ile Leu Pro Phe Ser Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu
450 455 460
Gly Val Thr Leu Val Leu Met Ala Leu Ala Arg Leu Phe His Cys Phe
465 470 475 480
Asp Trp Glu Pro Pro Lys Gly Leu Ser Cys Gly Asp Val Asp Thr Arg
485 490 495
Glu Val Tyr Gly Met Thr Met Pro Lys Ala Glu Pro Leu Ile Ala Ile
500 505 510
Ala Lys Pro Arg Leu Ala Lys His Leu Tyr Asp
515 520
<210> 22 <211> 537 <212> PRT
<213> Gossypium raimondii
<220>
<221> PEPTID
<222> (1)..(537)
<223> protein CYPgst (Gossypium raimondii)
<400> 22
Met Ile Pro Tyr Lys Pro Ile Phe Phe Pro Leu Asp Asn Met Glu Leu
1 5 10 15
Phe Thr Phe Ala Leu Ala Leu Leu Val Gly Ala Leu Val Val Asn Ala
20 25 30
Leu Trp Arg Trp Arg Leu Asp Trp Lys Ser Leu Phe Lys Thr Arg Lys
35 40 45
Leu Pro Pro Gly Pro Pro Arg Trp Pro Ile Val Gly Asn Leu Leu Gln
50 55 60
Leu Ser Ser Leu Pro His Arg Asp Leu Ala Ser Leu Cys Asp Lys Tyr
65 70 75 80
Gly Pro Leu Val Tyr Leu Arg Leu Gly Lys Val Asp Ala Ile Thr Thr
85 90 95
Asn Asp Pro Asp Ile Ile Arg Glu Ile Leu Leu Arg Gln Asp Glu Val
100 105 110
Phe Ala Ser Arg Pro Arg Thr Leu Ala Ala Val His Leu Ala Tyr Gly
115 120 125
Cys Gly Asp Val Ala Leu Ala Pro Leu Gly Pro His Trp Lys Arg Met
130 135 140
Arg Arg Ile Cys Met Glu His Leu Leu Thr Thr Lys Arg Leu Glu Ser
145 150 155 160
Phe Ala Lys His Arg Ala Asp Glu Ala Gln His Leu Val Arg Asp Val
165 170 175
Ser Ala Arg Ala Glu Asn Gly Gln Leu Val Asn Leu Arg Glu Val Leu
180 185 190
Gly Ala Phe Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly Arg Gln
195 200 205
Tyr Phe Gly Ala Val Ser Ala Gly Pro Ser Glu Ala Met Glu Phe Met
210 215 220
His Ile Thr His Glu Leu Phe Trp Leu Leu Gly Val Ile Tyr Leu Gly
225 230 235 240
Asp Tyr Leu Pro Ile Trp Arg Trp Val Asp Pro Tyr Gly Cys Glu Lys
245 250 255
Arg Met Arg Glu Val Glu Lys Arg Val Asp Asp Phe His Glu Arg Ile
260 265 270
Ile Glu Glu His Arg Arg Ala Arg Glu Leu Lys Asn Lys Gly Tyr Gly
275 280 285
Lys Asp Asp Asp Tyr Gly Glu Glu Met Asp Phe Val Asp Val Leu Leu
290 295 300
Ser Leu Pro Gly Glu Asp Gly Asn Pro His Met Asp Asp Thr Asp Ile
305 310 315 320
Lys Ala Leu Ile Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ala
325 330 335
Val Thr Asn Glu Trp Thr Met Ala Glu Val Ile Lys His Pro Arg Val
340 345 350
Leu Arg Lys Ile Gln Asp Glu Leu Asp Ser Val Val Gly Pro Asn Arg
355 360 365
Met Val Asn Glu Ser Asp Leu Pro His Leu Asn Tyr Leu Arg Cys Val
370 375 380
Val Arg Glu Thr Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro
385 390 395 400
His Glu Ser Leu Arg Ala Thr Thr Ile Asn Gly Phe Tyr Ile Pro Ala
405 410 415
Lys Thr Arg Val Phe Ile Asn Thr His Gly Leu Gly Arg Asn Thr Lys
420 425 430
Leu Trp Asp Asp Val Glu Ser Phe Arg Pro Glu Arg His Trp Leu Ala
435 440 445
Asp Gly Ala Arg Val Glu Ile Ser His Gly Ala Asp Phe Lys Ile Leu
450 455 460
Pro Phe Ser Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu Gly Val
465 470 475 480
Thr Leu Val Leu Met Ala Leu Ala Arg Leu Phe His Cys Phe Asp Trp
485 490 495
Ala Pro Gln Asn Gly Met Arg Pro Glu Asp Ile Asn Thr Met Glu Val
500 505 510
Tyr Gly Met Thr Met Pro Lys Ala Glu Pro Leu Met Ala Met Ala Lys
515 520 525
Pro Arg Leu Ala Asp His Val Met Phe 530 535
<210> 23 <211> 526 <212> PRT
<213> Sorghum bicolor
<220>
<221> PEPTID
<222> (1)..(526)
<223> protein CYPgst (Sorghum bicolor)
<400> 23
Met Asp Pro Phe Val Leu Ser Ile Leu Ile Cys Ser Trp Ile Phe Val
Val Val Tyr Trp Arg Arg Leu Asn Ser Met Arg Leu Arg Leu Pro Pro
20 25 30
Gly Pro Pro Thr Trp Pro Ile Phe Gly Asn Leu Leu Gln Leu Ser Pro
35 40 45
Leu Pro His Lys Asp Phe Ala Arg Phe Cys Thr Lys Tyr Gly Pro Leu
50 55 60
Val Tyr Leu Arg Leu Gly Thr Ile Asp Ala Ile Thr Thr Asp Asp Pro
65 70 75 80
Glu Val Ile Arg Glu Ile Leu Ile Arg Gln Asp Glu Val Phe Ala Ser
85 90 95
Arg Pro Arg Thr Leu Ala Ala Val His Leu Ala Tyr Gly Cys Gly Asp
100 105 110
Val Ala Leu Ala Pro Leu Gly Pro Asn Trp Lys Arg Met Arg Arg Val
115 120 125
Cys Met Glu His Leu Leu Thr Thr Lys Arg Leu Glu Ser Phe Ala Ala
130 135 140
His Arg Ala Gln Glu Ala Glu His Leu Cys Gln Phe Val Trp Ala Lys
145 150 155 160
Ser His Ser Gly Lys Pro Val Asn Leu Arg Glu Val Leu Gly Ala Phe
165 170 175
Ser Met Asn Asn Val Thr Arg Met Leu Leu Gly Lys Gln Tyr Phe Gly
180 185 190
Ile Gln Ser Ala Gly Pro Gly Glu Ala Met Glu Phe Met His Ile Thr
195 200 205
His Glu Leu Phe Phe Leu Leu Gly Leu Ile Tyr Leu Gly Asp Tyr Leu
210 215 220
Pro Ala Trp Arg Trp Val Asp Pro Tyr Gly Cys Glu Lys Lys Met Arg
225 230 235 240
Asp Val Glu Lys Lys Val Asp Asp Phe His Gln Lys Ile Ile Asp Glu
245 250 255
His Arg Arg Ala Arg Glu Ala Lys Lys Thr Arg Arg Ser Ser Leu Asp
260
265
270
Asp Asp Asp Gly Lys Glu Asp Met Asp Phe Val Asp Val Leu Leu Ser
275 280 285
Leu Pro Gly Glu Asn Gly Lys Glu His Met Asp Asp Met Glu Ile Lys
290 295 300
Ala Leu Met Gln Asp Met Ile Ala Ala Ala Thr Asp Thr Ser Ser Val
305 310 315 320
Thr Asn Glu Trp Val Met Ala Glu Val Ile Lys Asn Pro Arg Val Leu
325 330 335
Arg Arg Val Gln Glu Glu Leu Asp Ala Val Ile Gly Arg Asp Arg Met
340 345 350
Val Ala Glu Ser Asp Leu Thr His Leu Pro Tyr Leu Arg Cys Val Val
355 360 365
Arg Glu Ser Phe Arg Met His Pro Ala Gly Pro Phe Leu Ile Pro His
370 375 380
Glu Ser Leu Lys Pro Thr Thr Ile Met Gly Tyr His Val Pro Ala Arg
385 390 395 400
Thr Arg Val Phe Ile Asn Thr His Ala Leu Gly Arg Asn Pro Arg Val
405 410 415
Trp Asp Asp Val Asp Ala Phe Arg Pro Glu Arg His Leu Pro Ala Glu
420 425 430
Glu Gly Ala Arg Val Glu Ile Ser His Leu Pro Asp Phe Lys Ile Leu
435 440 445
Pro Phe Ser Ala Gly Lys Arg Lys Cys Pro Gly Ala Pro Leu Gly Val
450 455 460
Ala Leu Val Leu Met Ala Leu Ala Arg Leu Phe His Cys Phe Asp Trp
465 470 475 480
Ser Pro Pro Asp Gly Leu Arg Pro Glu Asp Val Asp Thr Gln Glu Val
485 490 495
Tyr Gly Met Thr Met Pro Lys Ala Thr Pro Leu Val Ala Val Ala Thr
500 505 510
Pro Arg Leu Pro Pro His Leu Tyr Gly Gly Gly Ser Ala Ser
515
520
525
<210> 24
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> sxn2151s01-Markersequenz zum Anzeigen des gst-Locus in Beta
vulgaris
<400> 24
aacactcatg taataagatg ggtgagtgag tagcaaaaaa a
<210> 25
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> sxn2151s01-Markersequenz zum Anzeigen des KWS2320-
Referenzgenotyps
<400> 25
aacactcatg taataagatg agtgagtgag tagcaaaaaa a
<210> 26
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> sle3305s02-Markersequenz zum Anzeigen des gst-Locus in Beta
vulgaris
<400> 26
aaagtctaga gtaaattgag gttgcagtgg agtgggaagt c
<210> 27
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> sle3305s02-Markersequenz zum Anzeigen des KWS2320-Referenzgenotyps
<400> 27
aaagtctaga gtaaattgag attgcagtgg agtgggaagt c
Формула изобретения
1. Растение, в частности культурное растение, проявляющее рецессивный ядерно-кодируемый мужски стерильный фенотип, отличающееся тем, что по сравнению с соответствующим (мужски фертильным) растением дикого типа данный фенотип обусловливается мутацией гена эндогенной цитохром Р450 оксидазы (CYPgst) или отсутствием, низким содержанием или низкой активностью функционального белка CYPgst, кодируемого геном CYPgst дикого типа, при этом ген CYPgst представляет собой ген, выбираемый из:
(a) BvCYPgst Beta vulgaris, подвид vulgaris, который предпочтительно содержит одну
из нуклеотидных последовательностей SEQ Ш No. 1 или 2 или кодирует аминокислотную
последовательность, представленную в SEQ Ш No. 3, либо его гомолога, аналога или
ортолога;
(b) StCYPgst Solarium tuberosum, который предпочтительно содержит одну из нуклеотидных последовательностей SEQ Ш No. 12 или 13 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 14, либо его гомолога, аналога или ортолога;
(c) ZmCYPgst Zea mays, который предпочтительно содержит одну из нуклеотидных последовательностей SEQ Ш No. 9 или 10 или кодирует аминокислотную последовательность, представленную в SEQ Ш No. 11, либо его гомолога, аналога или ортолога.
2. Растение по п. 1, отличающееся тем, что оно является гетерозиготным по мутации и мужски фертильным или гомозиготным по мутации и мужски стерильным, при этом образование пыльцы супрессируется у стерильного растения.
3. Растение по пп. 1 или 2, отличающееся тем, что мутация предотвращает транскрипцию и/или трансляцию функционального белка, при этом мутация предпочтительно представляет собой делецию, присоединение, инсерцию или замещение в кодирующей последовательности нуклеиновой кислоты гена CYPgst, последовательности сигнала для сплайсинга или регуляторной последовательности, предпочтительно последовательности промотора гена CYPgst, делеция у Beta vulgaris предпочтительно детектируется путем определения отсутствия одного или обоих маркерных локусов sle5983dl4 (продукт амплификации праймера, имеющего последовательности SEQ Ш No. 4 и 5) и sle5983dl7 (продукт амплификации праймера, имеющего последовательности SEQ Ш No. 6 и 7) и присутствия убиквитарного маркера, ген локализуется в сегменте хромосомы 1 между маркерными локусами sxn215s01 и sle3305s02, последовательность маркера sxn215s01, представленная в SEQ Ш No. 24, и последовательность маркера sle3305s02, представленная в SEQ Ш No. 26, указывают на присутствие локуса gst, а последовательность маркера sxn2151s01, представленная в SEQ Ш No. 25, и последовательность маркера sle3305s02, представленная в SEQ Ш No. 27, указывают на присутствие референсной последовательности.
4. Растение по любому из пп. 1-3, отличающееся тем, что не мутировавший ген (ген дикого типа) имеет нуклеотидную последовательность, выбираемую из группы, состоящей из:
3.
(a) нуклеотидной последовательности, представленной в SEQ Ш N0: 2, или ее
функционального фрагмента;
(b) нуклеотидной последовательности, которая кодирует аминокислотную последовательность, представленную в SEQ Ш N0: 3;
(c) нуклеотидной последовательности, способной гибридизоваться в жестких условиях с нуклеотидной последовательностью, комплементарной нуклеотидной последовательности по пп. (а) или (Ь);
(d) нуклеотидной последовательности, которая кодирует аминокислотную последовательность, имеющую различия с аминокислотной последовательностью SEQ Ш N0: 3, проявляющиеся в форме аминокислотных делеций, замещений, присоединений и/или инсерций в аминокислотной последовательности, и которая предпочтительно идентична по меньшей мере на 60% аминокислотной последовательностью по всей ее длине;
(e) нуклеотидной последовательности, которая кодирует белок, обладающий одной и той же ферментативной активностью, что и белок, кодируемый нуклеотидной последовательностью согласно любой из нуклеотидных последовательностей (а) - (d);
(f) нуклеотидной последовательности, содержащей по меньшей мере 200 или 400, предпочтительно по меньшей мере 600 или 800, наиболее предпочтительно по меньшей мере 1000 последовательных нуклеотидов промотора последовательности нуклеиновой кислоты SEQ Ш No. 1 в позициях от 1 до 1518, предпочтительно от 518 до 1518, наиболее предпочтительно от 1318 до 1518, либо последовательности, которая гибридизуется в этом участке, причем нуклеотидная последовательность способна специфически контролировать экспрессию гена или гетерологичной молекулы нуклеиновой кислоты, оперативно связанной с нуклеотидной последовательностью, в цветках и/или плодах.
5. Растение по любому из пп. 1-4, отличающееся тем, что растение является инбредным или гибридным растением, предпочтительно растением рода Zea, Solarium, Triticum, Triticale, Helianthus, Secale, Hordeum, Brassica, Brachypodium, Glycine, Gossypium, Sorghum, Saccharum, Setaria, Aegilops, Oryza, Daucus, Eucalyptus, Erythranthe, Genlisea, Musa, Avena, Nicotiana, Coffea, Vitis, Cucumis, Morus, Crucihimalaya, Cardamine, Lepidium, Capsella, Olimarabidopsis, Arabis, Raphanus, Eruca, Citrus, Jatropha. Populus или Beta, предпочтительно растение вида Zea mays, Solanum tuberosum, Triticum aestivum, Triticum durum, Triticum spelta, Helianthus annuus, Secale cereal, Hordeum vulgare, Hordeum bulbosum, Brassica napus, Brassica oleracia, Brassica rapa, Brassica juncacea, Brassica nigra, Glycine max, Gossypium sp., Sorghum bicolor, Triticale, Saccharum offwinarum, Setaria italica, Oryza sativa, Oryza minuta, Oryza australiensis, Oryza alta, Brachypodium distachyon, Hordeum marinum, Aegilops tauschii, Daucus glochidiantus, Daucus pusillus, Daucus muricatus, Daucus carota, Eucalyptus grandis, Erythranthe guttate, Genlisea aurea, Musa sp., Avena sp., Nicotiana sylvestris, Nicotiana tabacum, Nicotiana tomentosiformis, Solanum lycopersicum, Coffea canephora, Vitis vinifera, Cucumis sativus, Morus notabilis, Crucihimalaya himalaica, Crucihimalaya wallichii, Cardamine flexuosa, Lepidium virginicum, Capsella bursa-pastoris, Olimarabidopsis pumila, Arabis hirsute, Raphanus sativus, Eruca vesicaria sativa, Citrus sinensis, Jatropha curcas, Populus trichocarpa или Beta vulgaris.
6. Молекула нуклеиновой кислоты или рекомбинантная молекула ДНК, имеющая нуклеотидную последовательность по п. 4, где рекомбинантная молекула ДНК предпочтительно содержит (i) промотор с нуклеотидной последовательностью по п. 4 (f), оперативно связанный с гетерологичной молекулой нуклеиновой кислоты или (ii) кодирующую нуклеотидную последовательность по п. 4 (а) - (е), оперативно связанную с гетерологичным промотором, и предпочтительно способная контролировать экспрессию нуклеотидной последовательности в закрытых цветках и/или плодах.
7. Рекомбинантная молекула ДНК, содержащая нуклеотидную последовательность, кодирующую shPHK (малую РНК, образующую шпильки), siPHK (малую интерферирующую РНК), отрицательно-полярную РНК, положительно-полярную РНК или двухцепочечную РНК, которая после ее экспрессии или введения в растительную клетку приводит к ингибированию экспрессии функционального (не мутировавшего) гена CYPgst.
8. Молекула нуклеиновой кислоты, содержащая нуклеотидную последовательность по п. 4, с мутацией в форме делеции, присоединения, инсерции, замещения, при этом данная мутация не приводит к синтезу функционального белка CYPgst.
9. Молекула нуклеиновой кислоты, состоящая по меньшей мере из 15, 16, 17, 18, 19 или 20, предпочтительно по меньшей мере из 21, 22, 23, 24 или 25, более предпочтительно по меньшей мере из 30, 35, 40, 45 или 50, наиболее предпочтительно по меньшей мере из 100, 200, 300, 500 или 1000 нуклеотидов, которая специфически гибридизуется с нуклеотидной последовательностью по пп. 4 или 8, предпочтительно в форме олигонуклеотида, предпочтительно длиной не более 50 нуклеотидов, предпочтительно имеющего одну из следующих нуклеотидных последовательностей:
i) SEQ Ш No. 4, 6 или их комплемент, либо
ii) SEQ Ш No. 5, 7 или их комплемент.
10. Вектор, предпочтительно растительный вектор, содержащий молекулу ДНК или
молекулу нуклеиновой кислоты по любому из пп. 6-8 или молекулу нуклеиновой кислоты по
п. 9, в котором молекула ДНК или молекула нуклеиновой кислоты предпочтительно
способна экспрессировать функциональный ген CYPgst в качестве трансгена и
предпочтительно генетически связана с другим трансгеном, предотвращающим перенос
молекулы ДНК или молекулы нуклеиновой кислоты через пыльцу, при этом
предпочтительно вектор или трансген также содержит экспрессионную кассету, которая
маркирует семена, предпочтительно флуоресцентными метками.
11. Клетка-хозяин, предпочтительно растительная клетка, содержащая рекомбинантную молекулу ДНК или молекулу нуклеиновой кислоты по любому из пп. 6-8 или вектор по п. 10.
12. Набор, содержащий молекулу ДНК или молекулу нуклеиновой кислоты по любому из пп. 6-8, молекулу нуклеиновой кислоты по п. 9, олигонуклеотид по п. 9, вектор по п. 10, белок CYPgst или его функциональный и/или иммунологически активный фрагмент, кодируемый последовательностью ДНК по п. 4, и/или антитело, которое специфически связывается с белком CYPgst или его фрагментом, а также потенциально реагенты,
11.
предназначенные для процедур, основанных на детекции нуклеиновых кислот, или для иммунологической детекции.
13. Способ получения растения, в частности культурного растения, проявляющего гомозиготный рецессивный ядерно-кодируемый мужски стерильный фенотип, в котором экспрессия гена CYPgst ингибируется, отличающийся тем, что он предпочтительно включает этап введения рекомбинантной молекулы ДНК по п. 7, молекулы нуклеиновой кислоты по пп. 8 или 9 или вектора по п. 10, например, посредством агробактериальной трансформации, Т-ДНК мечения, гомологичной рекомбинации, мутагенеза, такого как TILLING, и направленный мутагенез, например, с использованием нуклеаз "цинковые пальцы", TALE-нуклеаз (эффекторные нуклеазы, подобные активаторам транскрипции), а также системы CRISPR/Cas, который приводит к ингибированию экспрессии гена, например, посредством iPHK или косупрессии, либо вследствие введенной мутации.
14. Способ восстановления фертильности растения по любому из пп. 1-5 или растения, которое можно получать посредством способа по п. 13, включающий введение функционального гена CYPgst в растение, причем предпочтительно ген CYPgst вводится с помощью рекомбинантной ДНК по п. 6 или вектора по п. 10 или путем скрещивания с растением, несущим ген CYPgst дикого типа или функциональный ген CYPgst, предпочтительно в гомозиготном состоянии.
15. Растение, которое содержит растительные клетки по п. 11, и/или которое можно получать согласно способу по пп. 13 или 14.
16. Орган, растительная часть, ткань или клетка растения по любому из пп. 1-5 или 15, либо семена или потомки растения по любому из пп. 1-5 или 15, причем семена или потомки содержат мутацию по любому из пп. 1-5 и/или рекомбинантную молекулу ДНК или молекулу нуклеиновой кислоты по любому из пп. 6-8 или вектор по п. 10,
17. Способ идентификации растения по любому из пп. 1-5 или 15 посредством детекции мутации гена CYPgst или маркера, связанного с мутацией.
18. Использование молекулы ДНК или молекулы нуклеиновой кислоты по любому из пп. 6-8, молекулы нуклеиновой кислоты по п. 9, олигонуклеотида по п. 9, векторов по п. 10, белков CYPgst или их фрагментов, антител по п. 12 и/или наборов по п. 12, предназначенных для идентификации растения по любому из пп. 1-5 или 15, получения рецессивного ядерно-кодируемого мужски стерильного растения, растения с восстановленной фертильностью, гибридного растения, в селекционных программах на устойчивость или для производства семян, а также использование молекулы ДНК по п. 14 или промотора по п. 14 для специфической экспрессии гетерологичных молекул нуклеиновой кислоты в цветках и/или плодах растений.
13.
Фертильный Стерильный
о о.
ГО Q_
О Нг
1= о
ч: s
аз о
о. о.
Рис.2
;тт
ITT ' I I
гтте - Г: г I
WATT
I - .
:TC*.d
JT6TC
;тетв
!ГГ.*
ч r . > .
TGGOTC
JTAACG' iTAABG TT _T; II i¦
• [ , > .
т> ^: -
; т i
гттс
TAT AQAAA
T-T-: -
¦-¦ i i - -...
if.
TT~i,
I " п г " ! I =
T"TL Г"ТТ-
гв*ссл* T TCTTT e."
r "1 т r .
IT ATA T OA TV
гт :.'"Э "Т Ш
TI &G-.A
TTGCA
II, - I . - г -
тт;:> -т--т^-.z -т: -
iopspnsus вт
ГАТI MT.I ГАТТАТ) v... 1 ¦
;*.О*ААТС
'1 . ,ьТ
- T - "
"ТГ
-1 r-
A6AT1
ТГ -T ~
¦1С -_T"".
ATGATTCATC
-Ti-тт: - т:
¦¦ Т "Г --Г"С
"GATT CATG
° L ~ Г" г". .ТС
1С 630 1С ем
СТ6АГА CTSAT*
Г TAJ
г-.-тг-,-..
:Т" Т-ч.T-
АТЛТТС
-т тт|,СТ9,СТА <3 <
Г -1 I
- г - -¦ T - i T T
ГТАВТАСАТО те
T :-г,-TGTG1
ЧГ-Т.
"ТГ.--Т "
TTGATTC
• ¦ . . • .
I Г . .г --[.,-, т : - - г - - - -
> . т т T.i
i ¦ i
ГМСТ"Т(
reec?* те
к тете
> ,rcf с
IT 8в"
ST Ш
-гт
"TT
СССТТТ1СТ1
"> " "ТТТ-1 Т"
ТГ -I т-TT-i т •
- - -. -
VTG ТТТАТвТТА
%AT'f ft
. I I J
1МЙ ММ
CATAAAACl
:rr.-:
~ т - T , 1
IAAATG
- т - т; ATATO телслет
¦гт--т " .
Рис. 3
". . i- Г. i
TGATC1
I ¦ I . '
ХТЛЛ'
; t....
T '.^
"ЛСТА • - r I -
UTTATAT
¦ I i УХТ ¦
1 -1 .1 I
ГТАТЛТТТ 3 Г"TAT
1 " 1 .-
TAT T <
TATT*
- Д _[. 1 - - - - ¦-
.far- -I
if ATT
;TAT т
JTTCCt
n rcct
GTTGT1 > . I.I
Г • I
-T i r-.
fAOTTT5 FACTTTC
. , J T-j
r 1¦-1Г-Г
I I I
3TTGT
l IT
1 I
TT-TT"
11 II
TTTTGG.
ттт тес.
n in
ATA
AT ft
3 ) / " T.'
;TA"ATCATT ТСС
т- -i -IT Ti
ITCOCA *
ГТА1
a - i :. I . -i - , I ,
" h. ,i. I u , l - .i l - II I.I
ITGfil IITOCt
Рис. 3 (продолжение)
С "r,"i- i J
^ATGCA
,.i=i;,- ¦-'.г'.'.г,-
" Г о- -
ГATIАЛАС
IJ - I I .1 ,11
ЗТЛСАТА ТТТТСТТСС'
;Т''.я- т т - т л г - г.-.
gig
i ,-I
ТйАТАС
il, ОТ!
.11, --•ГГ.-
TT
' I ' II
, - -MI
r> irr-> тт.
STCATfATC* TTA
-TT-:--.. :TC'..> T. II . г -
ГАТТ"
пел?
i |T АГТТ
I т гее I тгвв
СДГ*"Г
UTTA
. . I .
ATTAATG ТТС
-II I . II
;АААТТ ТО*Т." :л"*тт ТС AT*
I > " 1 - I . ¦ I - , , I Т.---Т.Т-- .-г---,-Т"-
-Т. Тл-Т--т-т.
'I 1 . . I - - Т - I .
-т-т - . Ii ТАТАС
eaisus_SleflI
ц - ~ - I -
:¦- -т-
TGAACT
ТС-1 с т
-11. i.4-
}ттвтвл
I 1 I
-т -ТТ"
I Г' I
ТТ"- •
ТТТАЛ
ТТЛТ А.ААТ1 ГТАТ АААТ1 -т-т-т
т - г.. i ;таттлл
F _* 1 --
4 ; I
AGATGAGTAT
-11 -с i - - г "¦::""! тт _ г-> :т~-с:•;т' I - . Г I I, I ¦. I i - г ¦
"¦ Т- .ТТ '.Т-'.Г ,-|.г-
NII.li.-ГАТТАТСЛ
Т - - ' I • I ITAATTTT:
•-, i F 1
',. Т
- > i ¦ . г
-тт-тт-
4 1 i г -
Т <""
'ТТ1.Т .'
ir.tr..
Г" -г- ,Т i I.k.f-.IJl
'"-В '- -" ¦
' I
- j _K1
II3SDCA Г <
SAT !
г - - -
ТАКТАМ*
I .;-
iTCTTC . I . ' г
I - i ¦ . I :
т • т •
I II ' I . г-тт--т-
Рис. 3 (продолжение)
"п г 1*1
Jfll НА
31 .*
тотвес
CATAGAf
Г Ti'- -
I T
т т - iCATTi
д- т т ~т * <
* IT'Tt
. TI I
"СТ" ¦
I Т LL
ССОАС CGCAC
г".-тг~-"-
STTCATCCG ПМ
ЯТТТТСАТв
- т [ - 1 ^ 1,
Г !^.'Т> , "ТТЛ л ¦ <~ Г 3- "Hi, i ,
",МТвМ."
•Ti;.T-T
1 г
:тт
-TI.I,;",T i > , -ест т t j ,i z
¦ -T---1- г IT-;-- -
i ¦ АТОТТСАТАТ гетввтвс*
2ir~' TLIJ' ; <*IT .'i
ад*
fCTAf*.*
т: T-T
F -г
гтот *гвс"стг.г*
- 5 - - {j
' ТЛ-Д l Г • Т I j.. .*TW т I '7 1 •
S ¦ ' - ' i "fl - B- ¦ ¦
Г- ДтМ: J
TTTGAAAAAA AA TTTGAAAAAA AA
ATACTSCAAC 1СТ^€А^
CTTAC ACCf
стт*с лес"
I'!'
II-.
•i-c-tr--" . ' • -> i i ^ > -rirr,ir-i.t
"Ti,i i -1 t.-i.-'ir' с - А Т"*.тт ! .
ГТ CTTCCGAT*
•1 "1 -
ГТОАСОТСА
'ТСлСОТ "'
T"ii:i-!i.
::i
JW5
- В
:-ii,,ot-' -.•ri rut-.
• 1IJ4IF-I'l - T" TC ' -"T •l,-Ll(.t. -ly"1.!"!
"тлетА
кТТАбТА -tr--i:"
- I I • I I-u
Lcrr <-iL_ -i*v
11 _ r. ¦ .1 L if . t ¦ 1 j I .•• -
iTf 1 т 'r * - - - г - т -.
. I I..' t • Ii. *¦-[
"TTC-Ts T'.'iT-
- > -. - - T - i r
. T - I - . • ' 1 i
• • . - - . ¦ -
IQTCACAT
561.9
"ТСААСА "TC : :-i.|-cr -c-1
-г." -
Т "О- - CCl1 <Т"" -С 7-: ; --i • -л - lj- . г,.| . .
I - - г,-, -i, ¦
Рис. 3 (продолжение)
TTATTAAACCTGMT"31AACTTATTGIU^
AATCTGAACTTATrGGACCTGAAACTTAATTTrTTAAGreGAACAGAACGCACrc G TGCCT ГОАЛТ ГГТТССТТТТССТАТССГТТСС^ AGrAGAATGGGATTGAAGTG AGTW^AAAAAAArAAAGTTAAGrrGAGAGAAAAATTArGAArAGTTGTTTCTCET AACTCTAATlTGATACArTTTCTTTTACATTTATAAA^
АТАААТСТгаСА6АТТАС1ШХСЛтаТАГ^
CGAG№GAGAAAAAATTAGTTACAAAACTTGCATAATTTATCC^^
ATrATCATTAGTACTATAAGTATATATrATAGGCTTAGAGCAAAGCCCTAACTACCACACTaCACACAAATGATA ACTACTAAGAGASGAAAft^
ATTCATGATTCACGAACATCAAGAATGGrATAGCTGATAAAGGACAArTTAAACATAAGTGTAAAGC
CATCAArTATATTCGCAli^CTACrAGACGAATCTTTACTTAGTACATGTGTTAGTACATGTGTTACTTCATArCA GATOTATTGATTCTTOCCAATC^ATArCATG^
TACAAC ГГААААТТ АТСТОЛ GCCTATCATC TCAT7 AGATAATTAAACCTTTATTTTOTAT АСАГАТАГАТ
TGTCTTTACATAGCAAAftCAATATTGAAGGTATAA^
TrrTTCGArTTAraATTGTGGTAAATTAATTGTAATT^TCSGTre
AArTTAGGGCATGTTCTCTTCGGCATAAAACAGCTGAACTGAAT^^
AtMTAJUWGTftTTGTCftAGAGCTGftA^ ATCTGAACTt^CTGAACTGAATTCAACrGAAAATAAGCT
CGTTTAAATATTAGGAAAII.-.."ДАДЯ-ЧАТЯДГ7.-.ГА71Т ::ГГ1ЯГ.Ч^ТТГ.-.ГТ.-_1С^ТА: ГПАГПГГТТГ.-.ГАТГО .47;I Г" "¦'"7ДАД1Д7ТАГГГТАГАГ.ЯГ "7ДГГ7. "74771ГЛАТ "*.-.•-7АДА " ГЛ": Г Г Т Г. Г!ДЧ7Я1Г1ТТАГД 7ГАСА.АДДА CTACJ717Д7 .CJ.7 Г^
д г-АД г г л;-.- г: -¦ т ДА ТАГ ;AT'. т ? гпт г-ДА; . т т ? ?G АТВВАТТТТ66ААСТГТАВСААТАТАТТТАСТ
СТТТТТССТАССДАААТТТТАта CCAAGCTTSGCCCTCATTTGGAAACCT^
AAATATGGGCCTTTAGTCTAGATAAGGCTTGSIAATC
GAGATCr№5TTeGACAAGftT AGtGCTgWGTGGCeTTCGCTCtmTGSG"
АСААСТАСЖдАСТТСААС
ССТТЮСЛС
TTGCTAGGGAAXi^AATACTTTGGGGCCGGGACGGCCG^
GAGTTCCTTTGgTTACTAG^
TGrGAAAAGAAAAtGAGGCAACTTGAAAAAA^
GAGAAGAAAASGAA &GAAGA &AT^
Рис. 4
ggTGAAAA-ТЕИА^ ЯГАДГГГДГ7ГДГДД ГГГ 'ДД
•.ГГ-.ДТТАТАТ
777 '.'.'.7 .'77.'.
•TT:;
" 7 77-.T 7AA 7 ATT Г.ДГЛ T77777T.:-.7T 7'. 7*77.77' A7J77 77 С 7 T Г 7 7 7 ."777.7 71777.17.7G7,7 А.ДЛ77А
¦.TT7'
".ij ! i ¦
-7! 7> f:
CATCT1
ATGGATTTTGQAACTrTAGCAATATATTTACTGTGTGGACrTTTrGCTACCAAAATT
? rATAX:CAATG"7TCAAGTCCTACrTATAX:ACAA
GGLAAACCTCCTTCA^
TACA7AA3GCTrGGTAATGTGGATGCC*rAACCACTAATGATX;CAGAAATCATACGTGAGArCTTAOrTCGACAA
"етввсстга,
GCTGTTAATTTGAGGGAAGTGTTAGGTGCATTTr
TrTQGGGCCGG GOCTTGArTTACTTGGGTGATTAT
WCCATATGGATGTGAAAAGAAAATQASG
GAAGTTGAAAAAAGGGTAGATGATTTO^TCGCAAAATTAT
GAAMGCgA^^
A 77. Jf.vp
TGGCAGAl
.,77А7А.АД7 7Д.- 77:777^
XCTCCAC
ААЗАГ
~ Г7А- "л
-4Д7А
777.7:77 7-77Д7 1С
ЗААК36ТГ
"777" ' -AT. 7777.. 7 Г 77 7 7 7.
x'C.A "..•.•.•
ГА7ЛА
".. . 7 ~:
_> A . L 1 * "
ГГГГА
7А7.ЧА "AA 77
-"ЯЛ""./ Г 7
4 77A.
.-,...? i; 7.
тявш
v.-. I.;¦•"
:-J ,7... "i ,
J: 7s. ( " 7i 7
*,.' - :
¦ ."74 '-7
у Л " " " • "
-.¦•¦л:
'A . . i .4 '- ¦ -'
'А-, ч •¦.,..;,'
-.-.л Ч-.. -7 ."l ..7 V-i ". '"
". ч ' j . ,,-f-i-
.¦--"'-V i". .--.7 ¦ 'i ,* .":"
7." -.--7 7Г
, -.U7.7,' 4" ,777 •; ;r
¦ t i я.* Л , ¦( - -
-,L-Vi7
• '"7 • ;
¦:.Г|
-i..'-: .- .-.-.'I ¦
' !..-. , f; ..-> i
¦' '7' .НА '
. 1 -.,'.'
ATTAGTATACTGC.
й"АС TCTAC
AAGTATGTAAT ГГСТАГАА?
iCTATAAA
CACAA
- 1 - 1 - 1 .- Ь '- , .'! ,1 ' I- ----!, t .1, , J -111 - ц.р 1 !' , 1
L.W . L" . J LI.-'.. I L7 ' Г_.- E" L.-.-.t . I ' - ir I .Ll'.-l , .'F'.-.AJ: 17 L-P , _ " LCI .].•-1 i ¦ _ JJLI . L'J
, -[• , 7 i- - !¦ . I I, h ! - ¦,!-•!! ' I ¦ К I'- Л I :b. Ь,П , ¦!¦ [ i . '- ,- -i •¦• 'i I - i
:: д7:¦;::.:;.;• AT: T AV •I I ¦A1iAE"in::r,"Li::.i: ;'сы;т:--дс1 :ir TI'DLPIILJ.L: t'Z7rr..:i:A
'7:гд;г"1.1Г7тг7'"_7::: . _rr"TiL"7".i7F"i,7""":t,iziCi7ii 7 :::> д:"s: .:rj^:г: :i:r.'.о
i -, j. ' Д ¦ i I I I' л Л .i; - ¦ I I ¦ I ' 1 i - \ - 7- №- ¦ • ' • . I • •
Рис. 4 (продолжение)
TAAAAATCCGACACACGAGTAf^TGSMTCyiA^
AAGGTAAGGTTTCTCGCAGTAQCAAAAAM
AGAGT7GTA7ACAAAAAAAGTCTAATTTGA7ACAT7TTC7^
1 AC САААГАТ T TAGGATATAAATCTT TCAGAT ГАСЛА С CCA Г A TAT GAT AC ACT AAA T Г TT ACAT GAG GCAA Г GG
AQCMTTOCATGAMAtTCGACGAlM
ЛЛСАААСЛАССАЛСАЛТАХЧЛТСАТТЛСТАСТАГАЛЭТАТАта
ACTGCACACAAATGATAACTAGTAAGAGAGGAAft^
ATSATTCATGATTCXTGATTCATGATTCM
GrGTAAAGCTCGCACATCATCAArTATArrCGCATA^^
TGTGTTACTTCATATCAeAIGTArTGATT(3TTGCCAAtGACATATC^
TArAACATGGAGAATAArACAACTTAAAATTArGTGGTGGCTATCATCTCATTTTC
TTTGTATACATATftTATTGTCTTTACATAGCA
ACATCTrTATGrTAGAGTTTTTCGATTTACGArrGTGGTAAAtTAATTCTAATTGATCGGTTGrCTTCrAGTCAA GAAATGACGT ArGAATGAATTTAGGGCATGT TCTCT TCGGCArAAAACAGC TGAAC TGAAT TOAACTGAACTGAA ATGAATAGTGATATGTGAGAGTAAAASTATr^ Т(*АТСТААТЭТ6 &АСТААССТ(ЗДи2ТедАСТ(ЗД
CrArjTATrATATAACCrCGTTTAAATATrAGGAAATTAAAAAAATAATTATATTTCrTTATACrTTATTAACCrA
TrAtACAATfuGTGGTGAfGtaGCCTTGGeTC
gACTTGCTC^
СИЦТА^
ACTIAGAATGTTGCTAGCGAAGCAAT^ ATAACACATiaCTTGT
CCATATeGATG
CArAGGAAGGAGAAGAAAAGGAAAGAAGAAATGGGAGrGAATGACGGrGAAATGGArTrTGTAGATATTTTGrTG
•ЛА . -,".J.-, 4,-'' " 7-
-i"AV44A4 '4 7(tm) ' •' . 7- i A-.- .'- .' < -> .'
:АС: ¦"¦,,.ч7'..~.
77-..- АД
.-..-..AC.-.
.Л. JA
. ..
. .4
А А С A." A
".: ГАГГГ.ТГААГ.v.iТА
77i 7 ГЛ7.777 Г 77.17 '7 ГАС 7 7.7 Г Л Г Г ГЛАДА
ГГ7.. 7 7.. 77.7.
¦• -I -
ГГГ.7Л77
A.I 7 *.
- -г-.-'.-Л ¦ •', "..AAA
-.О 77 ¦. .'.-:. '. •;- ,'7'J. , .'.7А .', "i :,'/
' \А,-,-, 'Г.. 14 .
• _. ¦ '
,..'.-.f •
-AV77A".' \ Г ,' ' I.. 7. 7 ' д.;" с;'. -' ' , дм ' ."
A-.-?'-.
7.Д. "-.Л"..-..-"..". А. 7 ДАЛ",
А". ДА" Г.Г 7ДД . Д 7ДД .77. ГА j 77. Г Г Л 77.
Г. . 7 Л ".Л.".
ГАД
"Л ~. Л "А
¦', '.5 i ,
АС.АА CGTTAA ТТв Т Г ГА А Г
;'А -= • -.7.я; -s- -..; -.-А. А .
ДА" 'Л.'f '. - •."(' J. ¦ АД'. А, ,7 АЛ''
Ъ% ТА 7GA TAS
CAG
• 7' ,' , '
Д> -¦. . - . ."- < 1 , 7 1- '¦-•."
7* - 'А'
" - " . 7.
АСЛАНА
i'" • . i
ТТСШТ
сетжгшзл &йот TTTCGG
ATGCATCCAGCAGGACCCTITTTAATCCCA
ГА TGAA ТС АС
ГАС
СССДГАС
¦ 1 -- ., - - , ч-" -f , -: ,
Ч , Д.,- ,- ДА " ', Г - ¦ 1 1
. . .
"¦.ЧЛ--7; .'-Дл ¦;
; --f - А--Л4 ' ' i ,7-"7"-'.' ', <;-- .'7. ,-,
-1, ч ¦
TTAGCCA
A > " _ С
J. - * _ ^ - _ 7 _ A-.'... A
J - ..ii.A-AA; .'.f-AA;..-.i A.A:..-.-- j ; .¦!
." ¦...' _.-.(.. j _
ваг
7,.'. - ^ 7 7
IГ TCA TGCA11TGMIIGGI ТА CCA С С Тёй I
-1.1 ¦ ' < ' -
¦ .
AJ%iSJL4 Л Г
:АА:Г-АЛА: : :л ¦¦¦ - W-A ¦•-
-1 rt i' ' - - s - i ¦ ~.A' i A .' A - i-. -
.' ДА,- -:АЛ-.-
. .' А
¦-.д.
TTTAATATtAGCATACTGCAACTCTACAAC
!.-. го
.,-¦'
: г ¦: 1 -.¦ ¦
.-.A,-. _ ..-.
~.-.A.-.' AT."^1 > . -..ЛУ.^. . ¦
J. .. •.. 'l.I. _ <.!.(tm)..-..*-(tm)f-.i"..-..~i.1_*-J.! T.-J Л Г A 1
"ТТАГДТАГ
....
7Г.7Т17Г
CAIA77
А А А ГI Г T Г Г 7 Г 7 7 7 77А Г 7
ГГА:;Г.71 :.;.7Ti 7 г дддгггт. ГГАТТГА
7 TTiГ.* 7777. АС
А.1._
7-АД 7ДА
s : 1 j -.
71 -7.. -AVr-- ' Ai 7.77 V 77 "¦
г.' : л ".л :им 7.J '7 7- 'с; •> ¦ :¦: -А
'¦. 11 7" -7 V. ГА
¦'! 1
; i'.\:.•- .-г:
Рис. 4 (продолжение)
GCAAAAA
GCTTCrrTGlTCGGATAAATrCA
сет
САТТГТСА
ATAAAATCGCAAAA
T.IT'A' T_0
САГСАА
AC'A AAT1
ГТТСАСйТСААААСТСТТСТГСС
AAGTATAC
TTCTCCATTGATTA
TGTAAAAGAGT
rrecAi
CATIAAC
AlGGCGTACTCCTCCTGTTCAAiS
GGGTI'GXT
;> - -j- -ivnr TGAAftCCAAACtTC
йАГбТАбАГС.?
TCCAAAATAC1
TCCTCA
4АСАГСАТ
GCTTCTATGGTCTA
. i .. . i . ,¦
ACAGSA
Рис. 4 (продолжение)
о < <
X ф |_
о о ш
CL С
го л
о о
1600 1400
1200 10О0-
800 -600400 200 •
GST- Ампликон 1 I ЛЯ/ - Ампликон 2
n.d. n.d.
Корни Лист Стебель Пол Раскры- Плод Пол
цветочной тые цветочной почки
цветки почки
фертильный
стерильный
288
288
288