EA 018577B1 20130930 Номер и дата охранного документа EA201000255 20060113 Регистрационный номер и дата заявки US60/662,224 20050315 Регистрационные номера и даты приоритетных заявок EAB1 Код вида документа EAb21309 Номер бюллетеня [JPG] EAB1\00000018\577BS000#(53:28) Основной чертеж [RU] ЦЕЛЛЮЛАЗЫ, НУКЛЕИНОВЫЕ КИСЛОТЫ, КОДИРУЮЩИЕ ИХ, И СПОСОБЫ ИХ ПОЛУЧЕНИЯ И ПРИМЕНЕНИЯ Название документа [8] C12N 15/55, [8] C12N 9/42, [8] C12N 15/11, [8] C12N 15/63, [8] C12N 1/21, [8] C12N 1/15, [8] C12N 5/10, [8] C12P 21/00, [8] A23K 1/00, [8] A23L 1/00, [8] A23L 2/00, [8] C12P 7/10 Индексы МПК [US] Блум Дэвид, [US] Гемсч Джослин, [US] Дикайко Марк Сведения об авторах [US] ВЕРЕНИУМ КОРПОРЕЙШН (US) Сведения о патентообладателях [US] ВЕРЕНИУМ КОРПОРЕЙШН (US) Сведения о заявителях DATABASE, Gen Bank, AAB42155, 15.12.2003, [найдено 05.05.2010]. Найдено из Интернет: , в части SEQ: NO 162 DATABASE, Gen Bank, AAB61461, 27.01.2000, [найдено 05.05.2010]. Найдено из Интернет: , в части SEQ: NO 68, 80, 82 DATABASE, Gen Bank, BAA74515, 20.02.1999, [найдено 05.05.2010]. Найдено из Интернет: , в части SEQ: NO 112 WANG Wenyen et al.: "Nucleotide sequence of the celA gene encoding a cellodextrinase of Ruminococcus flavefaciens FD-1", Mol Gen Genet. 1990, 222 (2-3), p. 265-269, особенно с. 267, в части SEQ: NO 156, 158 WO 2001/070998 A1 RU 2127760 C1 WO 1999/057325 A2 Цитируемые документы
 

Патентная документация ЕАПВ

 
Запрос:  ea000018577b*\id

больше ...

Термины запроса в документе

Реферат

Изобретение относится к молекулярной и клеточной биологии и биохимии. В одном из аспектов настоящее изобретение относится к полипептидам, имеющим активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или β-глюкозидазы, полинуклеотидам, кодирующим эти полипептиды, и способам получения и применения этих полинуклеотидов и полипептидов. В одном из аспектов настоящее изобретение направлено на активность полипептидов в качестве целлюлаз, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или β-глюкозидазы, включая термостабильную и термотолерантную активность, и полинуклеотиды, кодирующие эти ферменты, и получение и использование этих полинуклеотидов и полипептидов. Полипептиды по настоящему изобретению могут использоваться в различных фармацевтических, сельскохозяйственных контекстах, контекстах переработки пищевых продуктов и кормов и в промышленных контекстах.


Формула

[0001] Выделенная или рекомбинантная нуклеиновая кислота, содержащая:

[0002] Выделенная и рекомбинантная нуклеиновая кислота по п.1, в которой последовательность нуклеиновой кислоты содержит последовательность, как приведено в SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:67, SEQ ID NO:71, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:111, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157 или SEQ ID NO:161.

[0003] Зонд на основе нуклеиновой кислоты для идентификации нуклеиновой кислоты, кодирующей полипептид с активностью целлюлазы, где зонд содержит по меньшей мере 20, 30, 40, 50, 60, 75, 100 или 150 либо более последовательных оснований последовательности по п.1, где зонд идентифицирует нуклеиновую кислоту посредством связывания или гибридизации; зонд необязательно содержит олигонуклеотид, содержащий по меньшей мере примерно 10-50, примерно 20-60, примерно 30-70, примерно 40-80, примерно 60-100 или примерно 50-150 последовательных оснований; зонд необязательно содержит последовательные основания последовательности, как приведено в SEQ ID NO:59, SEQ ID NO:63, SEQ ID NO:67, SEQ ID NO:71, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:111, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157 или SEQ ID NO:161.

[0004] Кассета экспрессии, вектор или носитель клонирования, содержащие нуклеиновую кислоту, содержащую последовательность по п.1, где носитель клонирования необязательно включает в себя вирусный вектор, плазмиду, фаг, фагемиду, космиду, фосмиду, бактериофаг или искусственную хромосому, и вирусный вектор необязательно включает в себя аденовирусный вектор, ретровирусный вектор или вектор аденоассоциированного вируса, и носитель клонирования необязательно включает в себя искусственную бактериальную хромосому (ВАС), плазмиду, вектор, полученный из бактериофага PI (РАС), искусственную хромосому дрожжей (YAC) или искусственную хромосому млекопитающего (MAC).

[0005] Трансформированная клетка, содержащая нуклеиновую кислоту, содержащую последовательность по п.1 или кассету экспрессии, вектор или носитель клонирования по п.4, где клетка необязательно представляет собой бактериальную клетку, клетку млекопитающего, клетку грибка, клетку дрожжей, клетку насекомого или клетку растения.

[0006] Выделенный или рекомбинантный полипептид:

[0007] Композиция, содержащая полипептид по п.6.

[0008] Способ получения рекомбинантного полипептида, включающий:

[0009] Способ генерирования варианта нуклеиновой кислоты, кодирующей полипептид с активностью целлюлазы, включающий:

[0010] Выделенная, или рекомбинантная сигнальная, или лидерная последовательность, состоящая из последовательности аминокислот, как приведено в аминоконцевых остатках 1-14, 1-15, 1-16, 1-17, 1-18, 1-19, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-26, 1-27, 1-28, 1-28, 1-30, 1-31, 1-32, 1-33, 1-34, 1-35, 1-36, 1-37, 1-38, 1-40, 1-41, 1-42, 1-43 или 1-44, из:

[0011] Способ гидролиза, разрушения или разрыва связей глюкан-, целлюлозо- и/или гемицеллюлозосодержащей композиции, включающий:

[0012] Способ получения пищи или корма, включающий приведение пищи, корма, пищевого продукта или кормового продукта в контакт по меньшей мере с одним полипептидом по п.6 или полипептидом, кодируемым нуклеиновой кислотой по п.1, в условиях, достаточных для нужного обращения с пищей, кормом, пищевым продуктом или кормовым продуктом.

[0013] Способ получения напитка, включающий введение по меньшей мере одного полипептида по п.6 или полипептида, кодируемого нуклеиновой кислотой по п.1, в напиток или предшественник напитка, в условиях, достаточных для уменьшения вязкости напитка, где напиток или предшественник напитка необязательно представляет собой сусло или пиво.

[0014] Способ получения топлива, включающий приведение композиции, содержащей глюкан, целлюлозу, гемицеллюлозу и/или ферментируемый сахар, в контакт с полипептидом по п.6 или полипептидом, кодируемым нуклеиновой кислотой по п.1, где композиция, содержащая глюкан, целлюлозу, гемицеллюлозу и/или ферментируемый сахар, необязательно включает в себя растение, продукт растения или производное растения и растение или продукт растения необязательно включают в себя растения или продукты растений сахарного тростника, свеклы или сахарной свеклы, пшеницы, кукурузы, сои, картофеля, риса или ячменя, и полипептид необязательно имеет активность, включающую в себя активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, и топливо необязательно включает в себя биоэтанол или смесь бензин-этанол.

[0015] Комбинация ферментов для деполимеризации глюкановых, целлюлозных и/или гемицеллюлозных полимеров до метаболизируемых углеродных остатков, содержащая полипептид по п.6 или полипептид, кодируемый нуклеиновой кислотой по п.1, где полипептид необязательно имеет активность, включающую в себя активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

[0016] Способ обработки материала биологической массы, включающий приведение материала биологической массы, содержащего глюкан, целлюлозу, гемицеллюлозу и/или ферментируемый сахар, в контакт с полипептидом по п.6 или полипептидом, кодируемым нуклеиновой кислотой по п.1, где материал биологической массы необязательно происходит из сельскохозяйственной культуры, представляет собой побочный продукт производства пищевых продуктов или кормов, представляет собой продукт лигноцеллюлозных отходов или представляет собой остаток растения, или использованную бумагу, или использованный бумажный продукт и полипептид необязательно имеет активность, включающую в себя активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, и остаток растения необязательно включает стебли, листья, кожуру, шелуху, кочерыжки, древесину, древесные стружки, древесную пульпу и опилки, и использованная бумага необязательно включает в себя испорченную или использованную фотобумагу, бумагу для компьютерных принтеров, бумагу блокнотов, писчую бумагу, бумагу для пишущих машинок, газеты, журналы, картон и упаковочные материалы на основе бумаги, и переработка материала биологической массы необязательно генерирует биоэтанол.


Полный текст патента

Правительственная поддержка

Настоящее изобретение осуществлено при поддержке правительства Соединенных Штатов Америки согласно контрактам № DE-FG03-02ER83395 и DE-FG02-03ER83865, заключенным Министерством энергетики США. Правительство имеет определенные права в настоящем изобретении.

Область техники, к которой относится изобретение

Настоящее изобретение относится к молекулярной и клеточной биологии и биохимии. В одном из аспектов настоящее изобретение относится к полипептидам, имеющим активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или β-глюкозидазы, полинуклеотидам, кодирующим эти полипептиды, и способам получения и применения этих полинуклеотидов и полипептидов. В одном из аспектов настоящее изобретение направлено на полипептиды, имеющие активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или β-глюкозидазы, включая термостабильную и термотолерантную активность, и на полинуклеотиды, кодирующие эти ферменты, и на получение и применение этих полинуклеотидов и полипептидов. Полипептиды по настоящему изобретению могут применяться в различных фармацевтических, сельскохозяйственных и промышленных контекстах.

Уровень техники

Целлюлоза является наиболее обильным возобновляемым ресурсом на земле. Она состоит из линейной цепи из 1-4 β-субъединиц глюкозы, при этом повторяющаяся единица представляет собой целлобиозу, которая представляет собой димер глюкозы, имеющий структуру, как показано на фиг. 5. Полимер деградирует под действием ряда ферментов, которые включают в себя эндоглюканазы (EG), которые случайным образом гидролизуют полимер целлюлозы, и целлобиогидролазы (СВН), которые удаляют конечные остатки целлобиозы с целлюлозы. Целлобиоза и целлоолигосахариды гидролизуются до глюкозы под действием β-глюкозидаз (BG). Все три этих фермента являются необходимыми для полного разрушения целлюлозы до глюкозы. Для каждого из этих трех ферментов существуют различные структурные варианты, которые осуществляют одну и ту же функцию. В дополнение к этому грибки и бактерии, как известно, производят множество форм одних и тех же структурных вариантов, в дополнение к различным структурным вариантам.

Дополнительно усложняющим эту систему является тот факт, что некоторые анаэробные бактерии и грибки, как известно, производят эти ферменты в мультиферментных комплексах, которые содержат множество ферментов, все они присоединены к ферментному скелету, с молекулярными массами более 2 млн дальтон. Почему такая сложная система ферментов является необходимой для такой простой молекулы? Некоторые исследователи предполагают, что эта сложность связана со сложной для переработки природой субстрата. Цепи целлюлозы образуют микрофибриллы, которые упаковываются в кристаллическую матрицу посредством водородных связей между соседними цепями. Эта структура является очень устойчивой к химической или ферментативной деградации.

СВН рассматриваются как ключевой фермент при деградации этой кристаллической целлюлозы, из-за природы их ферментативного воздействия на целлюлозы. EG в отличие от СВН имеют открытый карман, который воздействует на цепь целлюлозы под перпендикулярным углом. СВН воздействуют на цепь непосредственно с помощью туннеля, содержащего активный сайт. В настоящее время считается, что цепи целлюлозы поступают в туннель, и в это же время водородные связи между соседними цепями разрушаются. После того как целлобиогидролазы устанавливают эту "исходную позицию" на субстрате, затем могут поступать EG и воздействовать на субстрат с большей легкостью.

Главным недостатком известных СВН является их низкая каталитическая активность. Некоторые группы утверждают, что низкая активность проистекает из того факта, что энергия от гидролиза преобразуется в кинетическую энергию для разрушения водородных связей и для предоставления возможности ферменту перемещаться вдоль субстрата. СВН представляют собой экзоактивные ферменты, они обнаружены в 6 из 90 семейств гликозилгидролаз. Они включают в себя семейства 5, 6, 7, 9, 10 и 48. Семейство 5 включает в себя множество различных типов гликозилгидролаз, включая целлюлазы, маннаназы и ксиланазы. Хотя большинство целлюлаз в этом семействе представляют собой эндоглюканазы, имеются примеры целлобиогидролаз, наиболее заметные - CelO из Clostridium thermocellum. Семейство 6 включает в себя только эндоглюканазы или целлобиогидролазы, при большем количестве элементов целлобиогидролаз, чем эндоглюканаз. Ферменты имеют механизм преобразования, и кристаллографические исследования говорят, что фермент имеет искаженную структуру α/ β цилиндра, содержащую семь, а не восемь параллельных β-нитей. Семейство 7 ферментов также состоит как из эндоглюканаз, так и из целлобиогидролаз, с преобладанием целлобиогидролаз, и единственные известные элементы происходят от грибков. Фермент имеет механизм удерживания, и кристаллическая структура говорит о структуре β-рулета. Семейство 9 содержит эндоглюканазы, целлобиогидролазы и β-глюкозидазы с преобладанием эндоглюканаз. Однако Thermobifida fusca производит эндо/экзо-1,4-глюканазу, кристаллическая структура которой говорит об ( α/ α) 6 цилиндрической укладке. Фермент характеризуется как эндо-, так и экзоглюканазами СВН. Семейство 10 содержит только 2 элемента, описанных как целлобиогидролазы, при этом основная оставшаяся часть описывается как ксиланазы. Целлобиогидролазы и ксиланазы из семейства 10 имеют активность на метилумбеллиферилцеллобиозид. Семейство 48 содержит в основном бактериальные и анаэробные целлобиогидролазы и эндоглюканазы грибков. Структура представляет собой ( α/ α) 6 цилиндрическую укладку, подобную семейству 9.

Имеется необходимость в менее дорогостоящих и возобновляемых источниках топлива для транспортных средств. Новые источники топлива будут более привлекательными, если они производят не приносящие вреда конечные продукты после сгорания. Этанол предлагает привлекательную альтернативу топливу на основе нефти и может быть получен посредством ферментирования мономерных сахаров, полученных из крахмала или лигноцеллюлозы. Однако современная экономика не поддерживает широкого использования этанола из-за высокой стоимости его генерирования. Одной из областей исследований, направленных на понижение стоимости, является увеличение технической эффективности ферментов, которые могут использоваться для генерирования ферментируемых сахаров из лигноцеллюлозы. Разработка ферментов, которые более эффективно расщепляют исходные материалы, приведет к уменьшению стоимости производства этанола. Более эффективные способы понизят зависимость Соединенных Штатов от иностранной нефти и скачков цен, которые могут быть связаны с такой зависимостью. Использование более чистых топлив для транспорта, подобных биоэтанолу, также могут уменьшить общие выбросы СО 2 , которые, как предполагается, являются частично ответственными за глобальное потепление.

Сущность изобретения

Настоящее изобретение относится к целлюлазам, например эндоглюканазам, целлобиогидролазам и/или β-глюкозидазе (бета-глюкозидазы), и способам их получения и применения. В одном из аспектов ферменты по настоящему изобретению имеют увеличенную скорость катализа для улучшения способа гидролиза субстрата. Эта увеличенная эффективность скорости катализа приводит к увеличению эффективности при производстве сахаров, которые могут быть полезными в промышленных применениях, например сахара, полученные таким образом, могут использоваться микроорганизмами для производства этанола. В одном из аспектов настоящее изобретение относится к высокоактивным (например, имеющим увеличенную скорость катализа) целлобиогидролазам, эндоглюканазам и бета-глюкозидазе. Настоящее изобретение относится к промышленным применениям (например, получению этанола из биологической массы) с использованием ферментов по настоящему изобретению, имеющим пониженную стоимость фермента, например пониженную стоимость способа преобразования биологической массы в этанол. Таким образом, настоящее изобретение относится к эффективным способам производства биоэтанола и биоэтанолсодержащих композиций, включая топлива, содержащие биоэтанол, из любой биологической массы.

В одном из аспектов ферменты по настоящему изобретению имеют активность глюканазы, например активность эндоглюканазы, например, катализируя гидролиз внутренних эндо- β-1,4- и/или β-1,3-глюканазных связей. В одном из аспектов активность эндоглюканазы (например, активность эндо-1,4-бета-D-глюкан 4-глюканогидролазы) включает в себя гидролиз 1,4- и/или β-1,3-бета-D-гликозидных связей в целлюлозе, производных целлюлозы (например, карбоксиметилцеллюлозе и гидроксиэтилцеллюлозе), лихенине, бета-1,4 связей в смешанных бета-1,3 глюканах, таких как бета-D-глюканы из зерновых культур или ксилоглюканы, и в другом растительном материале, содержащем целлюлозные части.

В одном из аспектов ферменты по настоящему изобретению имеют активность эндоглюканазы (например, эндо-бета-1,4-глюканаз, ЕС 3.2.1.4; эндо-бета-1,3(1)-глюканаз, ЕС 3.2.1.6; эндо-бета-1,3-глюканаз, ЕС 3.2.1.39) и могут гидролизировать внутренние β-1,4- и/или β-1,3-глюкозидные связи в целлюлозе и глюкане, с получением глюкозы с меньшей молекулярной массой и олигомеров глюкозы. Настоящее изобретение относится к способам производства глюкозы с меньшей молекулярной массой и олигомеров глюкозы, с использованием этих ферментов по настоящему изобретению.

В одном из аспектов ферменты по настоящему изобретению используются для генерирования глюканов, например полисахаридов, образующихся из 1,4- β- и/или 1,3-глюкозидсвязанной D-глюкопиранозы. В одном из аспектов эндоглюканазы по настоящему изобретению используются в пищевой промышленности, например, для пекарных целей и переработки фруктов и овощей, разрушения сельскохозяйственных отходов, при производстве кормов для животных, при производстве пульпы и бумаги, в текстильной промышленности и в бытовых и промышленных чистящих агентах. В одном из аспектов ферменты, например эндоглюканазы, по настоящему изобретению производятся посредством микроорганизма, например посредством грибков и/или бактерий.

В одном из аспектов ферменты, например эндоглюканазы, по настоящему изобретению используются для гидролиза бета-глюканов ( β-глюканов), которые являются главными отличными от крахмала полисахаридами зерновых культур. Содержание глюкана для полисахарида может значительно изменяться в зависимости от различных условий и условий роста. Физико-химические свойства этого полисахарида являются такими, что он дает вязкие растворы или даже гели при окислительных условиях. В дополнение к этому глюканы имеют очень высокую емкость связывания воды. Все эти характеристики представляют собой проблемы для нескольких областей промышленности, включая пивоваренную, пекарную, производство кормов для животных. При применениях в пивоваренной промышленности присутствие глюкана приводит к проблемам с плохой фильтруемостью и к образованию взвеси. При применениях в пекарной промышленности (в особенности, для печенья и крекеров) глюканы могут образовывать липкое тесто, которое является сложным для машины и ограничивает размер лепешки. Таким образом, ферменты, например эндоглюканазы по настоящему изобретению, используются для уменьшения количества β-глюкана в β-глюкансодержащей композиции, например ферменты по настоящему изобретению используются в процессах для уменьшения вязкости растворов или гелей; для уменьшения емкости связывания воды композиции, например β-глюкансодержащей композиции; в пивоваренных процессах (например, для повышения низкой фильтруемости и уменьшения образования взвеси), для уменьшения липкости теста, например, такого, из которого делают печенье, хлеб, лепешки и т.п.

В дополнение к этому углеводы (например, β-глюкан) вовлечены в быстрое повторное гидратирование пекарных продуктов, что приводит к потери хруста и уменьшению времени хранения в упакованном состоянии. Таким образом, ферменты, например эндоглюканазы, по настоящему изобретению используются для сохранения хруста, увеличения хруста или уменьшения скорости потери хруста и для увеличения времени хранения в упакованном состоянии любого пищевого продукта, корма или напитка, содержащего углеводы, например пищевого продукта, корма или напитка, содержащего β-глюкан.

Ферменты, например эндоглюканазы, по настоящему изобретению используются для уменьшения вязкости содержимого кишечника (например, у животных, таких как жвачные животные, или у людей), например, с растительными диетами. Таким образом, в альтернативных аспектах ферменты, например эндоглюканазы, по настоящему изобретению используются для положительного воздействия на перевариваемость пищи или корма, на скорость роста животного (например, человека или домашнего животного) и в одном из аспектов используются для генерирования более высоких коэффициентов преобразования корма. При применениях для кормов для моногастрических животных с растительными диетами бета-глюкан представляет собой фактор, вносящий вклад в вязкость содержимого кишечника и по этой причине отрицательно влияет на переваривание корма и скорость роста животного. Для жвачных животных эти бета-глюканы представляют собой значительные компоненты потребления волокон, и более полное переваривание глюканов способствовало бы повышению коэффициентов преобразования корма. Соответственно настоящее изобретение относится к кормам для животных и пищевым продуктам, содержащим эндоглюканазы по настоящему изобретению, а в одном из аспектов эти ферменты являются активными в пищеварительном тракте животного, например в желудке и/или кишечнике.

Ферменты, например эндоглюканазы, по настоящему изобретению используются для расщепления целлюлозы или любого синтетического или природного материала, содержащего бета-1,4-связанный глюкан, включая те, которые находятся в любом растительном материале. Ферменты, например эндоглюканазы, по настоящему изобретению используются в качестве промышленных ферментов для расщепления целлюлозы, например, в переработке древесины, промышленности пульпы и/или бумаги, в текстильной промышленности и в бытовых и промышленных чистящих агентах, и/или при переработке отходов биологической массы.

В одном из аспектов настоящее изобретение относится к композициям (например, фармацевтическим композициям, пищевым продуктам, кормам, лекарственным средствам, пищевым добавкам), содержащим ферменты, полипептиды или полинуклеотиды по настоящему изобретению. Эти композиции могут приготавливаться в различных формах, например в виде таблеток, гелей, пилюль, имплантов, жидкостей, спреев, порошков, пищевых продуктов, гранулированных кормов или в виде любого типа инкапсулированной формы.

Настоящее изобретение относится к выделенным или рекомбинантным нуклеиновым кислотам, содержащим последовательность нуклеиновых кислот, имеющую по меньшей мере примерно 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более либо полную (100%) идентичность последовательности с нуклеиновой кислотой по настоящему изобретению, включая SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO.23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163 и SEQ ID NO:165; см. также табл. 1-3, примеры 1 и 4 ниже и список последовательностей, в области по меньшей мере из примерно 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 или более остатков; и в альтернативных аспектах эти нуклеиновые кислоты кодируют по меньшей мере один полипептид, имеющий активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или кодируют полипептид, способный к генерированию антитела, которое может специфично связываться с полипептидом по настоящему изобретению, или эти нуклеиновые кислоты могут использоваться в качестве зондов для идентификации или выделения нуклеиновых кислот, кодирующих целлюлазу, или для ингибирования экспрессии нуклеиновых кислот, экспрессирующих целлюлазу (все эти аспекты упоминаются как "нуклеиновые кислоты по настоящему изобретению"). В одном из аспектов идентичности последовательностей определяются посредством анализа с помощью алгоритма сравнения последовательности или посредством визуальной проверки.

Нуклеиновые кислоты по настоящему изобретению также включают в себя выделенные или рекомбинантные нуклеиновые кислоты, кодирующие примерный фермент по настоящему изобретению, включая полипептид, имеющий последовательность, как приведено в SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:143, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164 и SEQ ID NO:166, см. также табл. 1-3, примеры 1 и 4 ниже, и список последовательностей, и их субпоследовательности и их варианты. В одном из аспектов полипептид имеет активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

В одном из аспектов настоящее изобретение относится к кодирующим целлюлазам, например кодирующим эндоглюканазу, целлобиогидролазу и/или бета-глюкозидазу нуклеиновым кислотам, имеющим общую новизну в том, что они получены от смешанных культур. Настоящее изобретение относится к кодирующим ферментам, деградирующим целлюлозам, нуклеиновым кислотам, выделенным из смешанных культур, содержащих полинуклеотид по настоящему изобретению, например последовательность, имеющую по меньшей мере примерно 10, 15, 20, 25, 30, 35, 40, 45, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более либо полную (100%) идентичность последовательности с нуклеиновой кислотой по настоящему изобретению, например SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163 и SEQ ID NO:165, и см. табл. 1-3, примеры 1 и 4 ниже и список последовательностей в области по меньшей мере из примерно 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150 или более.

В одном из аспектов настоящее изобретение относится к нуклеиновым кислотам, кодирующим фермент целлюлазу, например фермент эндоглюканазу, фермент целлобиогидролазу и/или фермент бета-глюкозидазу, содержащим примерные последовательности полинуклеотидов по настоящему изобретению, см. также табл. 1-3, примеры 1 и 4 ниже и список последовательностей, и полипептиды, кодируемые ими, включая ферменты по настоящему изобретению, например полипептиды по настоящему изобретению, например SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:143, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164 или SEQ ID NO:166, см. также табл. 1 и список последовательностей, имеющие общую новизну в том, что их получают из общего источника, например источника из окружающей среды. В одном из аспектов настоящее изобретение также относится к нуклеиновым кислотам, кодирующим фермент целлюлазу, например фермент эндоглюканазу, фермент целлобиогидролазу и/или фермент бета-глюкозидазу, с той общей новизной, что их получают из источников из окружающей среды, например из смешанных источников из окружающей среды.

В одном из аспектов алгоритм сравнения последовательностей представляет собой алгоритм BLAST version 2.2.2, где настройки фильтра настраиваются как blastall -p blastp -d "nr pataa" -F F, и все остальные опции настраиваются по умолчанию.

Другой аспект настоящего изобретения представляет собой выделенную или рекомбинантную нуклеиновую кислоту, содержащую по меньшей мере 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2200, 2250, 2300, 2350, 2400, 2450, 2500 или более последовательных оснований последовательности нуклеиновых кислот по настоящему изобретению, последовательностей, по существу идентичных им, и последовательностей, комплементарных к ним.

В одном из аспектов выделенная или рекомбинантная нуклеиновая кислота кодирует полипептид, имеющий активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, которая является термостабильной. Полипептид может поддерживать активность целлюлазы в условиях, включающих в себя диапазон температур примерно от 37 примерно до 95 °С; примерно от 55 примерно до 85 °С, примерно от 70 примерно до 95 °С или примерно от 90 примерно до 95 °С. Полипептид может поддерживать активность целлюлазы при температурах в пределах примерно от 1 примерно до 5 °С, примерно от 5 примерно до 15 °С, от примерно 15 примерно до 25 °С, примерно от 25 примерно до 37 °С, примерно от 37 примерно до 95, 96, 97, 98 или 99 °С, примерно от 55 примерно до 85 °С, примерно от 70 примерно до 75 °С или примерно от 90 примерно до 99 °С или 95, 96, 97, 98, или 99 °С, или более.

В другом аспекте выделенная или рекомбинантная нуклеиновая кислота кодирует полипептид, имеющий активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, которая является термотолерантной. Полипептид может поддерживать активность целлюлазы после экспонирования для температуры в пределах от более чем 37 примерно до 95 °С или где-либо в пределах от более чем 55 примерно до 85 °С. Полипептид может поддерживать активность целлюлазы после экспонирования для температуры в пределах примерно от 1 примерно до 5 °С, примерно от 5 примерно до 15 °С, примерно от 15 примерно до 25 °С, примерно от 25 примерно до 37 °С, примерно от 37 примерно до 95, 96, 97, 98 или 99 °С, примерно от 55 примерно до 85 °С, примерно от 70 примерно до 75 °С или примерно от 90 примерно до 95 °С или более. В одном из аспектов полипептид поддерживает активность целлюлазы после экспонирования для температуры в пределах от более чем 90 примерно до 99 °С или 95, 96, 97, 98 или 99 °С, примерно при рН 4,5 или более.

Настоящее изобретение относится к выделенным или рекомбинантным нуклеиновым кислотам, содержащим последовательность, которая гибридизируется при строгих условиях с нуклеиновой кислотой по настоящему изобретению, включая примерную последовательность по настоящему изобретению, например последовательность, как приведено в SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163 или SEQ ID NO:165 (см. также табл. 1-3, примеры 1 и 4 ниже) или их фрагменты или субпоследовательности. В одном из аспектов нуклеиновая кислота кодирует полипептид, имеющий активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Нуклеиновая кислота может составлять по меньшей мере примерно 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200 или более остатков в длину, или полноразмерный ген, или транскрипт. В одном из аспектов строгие условия включают в себя стадию отмывки, включающую в себя отмывку в 0,2 × SSC при температуре примерно 65 °С в течение примерно 15 мин.

Настоящее изобретение относится к зонду нуклеиновой кислоты для идентификации или выделения нуклеиновой кислоты, кодирующей полипептид, имеющий активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где зонд содержит по меньшей мере примерно 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 или более последовательных оснований последовательности, составляющей последовательность по настоящему изобретению, или ее фрагментов или субпоследовательностей, где зонд идентифицирует нуклеиновую кислоту посредством связывания или гибридизации. Зонд может содержать олигонуклеотид, содержащий по меньшей мере примерно 10-50, примерно 20-60, примерно 30-70, примерно 40-80 или примерно 60-100 последовательных оснований последовательности, составляющей последовательность по настоящему изобретению, или ее фрагментов или субпоследовательностей.

Настоящее изобретение относится к зонду нуклеиновой кислоты для идентификации или выделения нуклеиновой кислоты, кодирующей полипептид, имеющий активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где зонд содержит нуклеиновую кислоту, содержащую последовательность по меньшей мере примерно из 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 или более остатков нуклеиновой кислоты по настоящему изобретению, например полинуклеотид, имеющий по меньшей мере примерно 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более либо полную (100%) идентичность последовательности с нуклеиновой кислотой по настоящему изобретению. В одном из аспектов идентичности последовательностей определяют посредством анализа с помощью алгоритма сравнения последовательностей или посредством визуальной проверки. В альтернативных аспектах зонд может содержать олигонуклеотид, содержащий по меньшей мере примерно 10-50, примерно 20-60, примерно 30-70, примерно 40-80 или примерно 60-100 последовательных оснований последовательности нуклеиновых кислот по настоящему изобретению или ее субпоследовательности.

Настоящее изобретение относится к паре праймеров амплификации для амплификации (например, с помощью PCR) нуклеиновой кислоты, кодирующей полипептид, имеющий активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где пара праймеров способна амплифицировать нуклеиновую кислоту, содержащую последовательность по настоящему изобретению, или ее фрагменты или субпоследовательности. Один из элементов или каждый из элементов пары последовательностей праймеров амплификации может содержать олигонуклеотид, содержащий по меньшей мере примерно 10-50 или более последовательных оснований последовательности или примерно 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 или более последовательных оснований последовательности. Настоящее изобретение относится к паре праймеров амплификации, где пара праймеров содержит первый элемент, имеющий последовательность, как отсчитывается от первого (5'), из 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 или более остатков нуклеиновой кислоты по настоящему изобретению, и второй элемент, имеющий последовательность, как отсчитывается от первого (5'), из 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36 или более остатков комплементарной нити первого элемента.

Настоящее изобретение относится к нуклеиновым кислотам, кодирующим целлюлазу, например кодирующим эндоглюканазу, целлобиогидролазу и/или бета-глюкозидазу, генерируемым посредством амплификации, например полимеразной цепной реакции (PCR), с использованием пары праймеров амплификации по настоящему изобретению. Настоящее изобретение относится к нуклеиновым кислотам, кодирующим целлюлазу, например кодирующие эндоглюканазу, целлобиогидролазу и/или бета-глюкозидазу, генерируемые посредством амплификации, например полимеразной цепной реакции (PCR), с использованием пары праймеров амплификации по настоящему изобретению. Настоящее изобретение относится к способам получения фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы посредством амплификации, например полимеразной цепной реакции (PCR), с использованием пары праймеров амплификации по настоящему изобретению. В одном из аспектов пара праймеров амплификации амплифицирует нуклеиновую кислоту из библиотеки, например генной библиотеки, такой как библиотека из окружающей среды.

Настоящее изобретение относится к способам амплификации нуклеиновой кислоты, кодирующей полипептид, имеющий активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающим амплификацию матричной нуклеиновой кислоты с помощью пары последовательностей праймеров амплификации, способных амплифицировать последовательность нуклеиновых кислот по настоящему изобретению, или ее фрагменты или субпоследовательности.

Настоящее изобретение относится к кассетам экспрессии, содержащим нуклеиновую кислоту по настоящему изобретению или ее субпоследовательность. В одном из аспектов кассета экспрессии может содержать нуклеиновую кислоту, которая функционально связана с промотором. Промотор может представлять собой вирусный, бактериальный промотор, промотор из млекопитающего или растения. В одном из аспектов растительный промотор может представлять собой промотор из картофеля, риса, кукурузы, пшеницы, табака или ячменя. Промотор может представлять собой конститутивный промотор. Конститутивный промотор может включать в себя CaMV35S. В другом аспекте промотор может представлять собой индуцируемый промотор. В одном из аспектов промотор может представлять собой ткане-специфичный промотор или регулируемый окружающей средой или регулируемый развитием промотор. Таким образом, промотор может представлять собой, например, семя-специфичный, лист-специфичный, корень-специфичный, ствол-специфичный или индуцируемый обрезкой промотор. В одном из аспектов кассета экспрессии может дополнительно содержать вектор экспрессии растения или вируса растения.

Настоящее изобретение относится к носителям клонирования, содержащим кассету экспрессии (например, вектор) по настоящему изобретению или нуклеиновую кислоту по настоящему изобретению. Носитель клонирования может представлять собой вирусный вектор, плазмиду, фаг, фагемиду, космиду, фосмиду, бактериофаг или искусственную хромосому. Вирусный вектор может включать в себя аденовирусный вектор, ретровирусный вектор или вектор аденоассоциированного вируса. Носитель клонирования может включать в себя бактериальную искусственную хромосому (ВАС), плазмиду, вектор, полученный из бактериофага Р1 (РАС), искусственную хромосому дрожжей (YAC) или искусственную хромосому млекопитающего (MAC).

Настоящее изобретение относится к трансформированной клетке, содержащей нуклеиновую кислоту по настоящему изобретению или кассету экспрессии (например, вектор) по настоящему изобретению, или носитель клонирования по настоящему изобретению. В одном из аспектов трансформированная клетка может представлять собой бактериальную клетку, клетку млекопитающего, клетку грибка, клетку дрожжей, клетку насекомого или клетку растения. В одном из аспектов клетка растения может представлять собой клетку сои, рапса, подсолнечника, томата, сахарного тростника, зерновой культуры, картофеля, пшеницы, риса, кукурузы, табака или ячменя.

Настоящее изобретение относится к трансгенным животным, не являющимся человеком, содержащим нуклеиновую кислоту по настоящему изобретению или кассету экспрессии (например, вектор) по настоящему изобретению. В одном из аспектов животное представляет собой мышь, крысу, свинью, козу или овцу.

Настоящее изобретение относится к трансгенным растениям, содержащим нуклеиновую кислоту по настоящему изобретению или кассету экспрессии (например, вектор) по настоящему изобретению. Трансгенное растение может представлять собой растение зерновой культуры, растение кукурузы, растение картофеля, растение томата, растение пшеницы, растение подсолнечника, растение рапса, растение сои, растение риса, растение ячменя или растение табака.

Настоящее изобретение относится к трансгенным семенам, содержащим нуклеиновую кислоту по настоящему изобретению или кассету экспрессии (например, вектор) по настоящему изобретению. Трансгенное семя может представлять собой семя зернового растения, семя кукурузы, ядро семени пшеницы, семя подсолнечника, семя рапса, семя сои, семя пальмового ореха, семя южного подсолнечника, кунжутное семя, семя арахиса или растение табака.

Настоящее изобретение относится к антисмысловому олигонуклеотиду, содержащему последовательность нуклеиновых кислот, комплементарную к нуклеиновой кислоте по настоящему изобретению или способную к гибридизации с ней при строгих условиях. Настоящее изобретение относится к способам ингибирования трансляции мессенджера фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы в клетке, включающим введение в клетку или экспрессирование в клетке антисмыслового олигонуклеотида, содержащего последовательность нуклеиновых кислот, комплементарную к нуклеиновой кислоте по настоящему изобретению или способную к гибридизации с ней при строгих условиях. В одном из аспектов антисмысловой олигонуклеотид имеет длину в пределах примерно 10-50, примерно 20-60, примерно 30-70, примерно 40-80 или примерно 60-100 оснований, например в длину 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 или более оснований. Настоящее изобретение относится к способам ингибирования трансляции мессенджера фермента целлюлазы, например фермента эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, в клетке, включающим введение в клетку или экспрессирование в клетке антисмыслового олигонуклеотида, содержащего последовательность нуклеиновых кислот, комплементарную к нуклеиновой кислоте по настоящему изобретению или способную к гибридизации с ней при строгих условиях.

Настоящее изобретение относится к молекулам двухцепочечной ингибиторной РНК (РНК-i, или РНК-интерференции) (включая малую интерферирующую РНК, или si-РНК, для ингибирования транскрипции, и микро-RNA, или mi-РНК, для ингибирования трансляции), содержащим субпоследовательность последовательности по настоящему изобретению. В одном из аспектов si-РНК имеет длину в пределах между примерно 21-24 остатками или по меньшей мере примерно 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 или более дуплексных нуклеотидов. Настоящее изобретение относится к способам ингибирования экспрессии фермента целлюлазы, например фермента эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы в клетке, включающим введение в клетку или экспрессирование в клетке двухцепочечной ингибиторной РНК (si-РНК или mi-РНК), где РНК содержит субпоследовательность последовательности по настоящему изобретению.

Настоящее изобретение относится к выделенным или рекомбинантным полипептидам, содержащим последовательность аминокислот, имеющую по меньшей мере примерно 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более либо полную (100%) идентичность последовательности с примерным полипептидом или пептидом по настоящему изобретению в области по меньшей мере примерно из 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350 или более остатков или по всей длине полипептида. В одном из аспектов идентичности последовательностей определяются посредством анализа с помощью алгоритма сравнения последовательностей или посредством визуальной проверки. Примерный полипептид или последовательность пептидов по настоящему изобретению включает в себя SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:143, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164 и SEQ ID NO:166 (см. также табл. 1-3, примеры 1 и 4 ниже и список последовательностей), и их субпоследовательности и их варианты. Примеры полипептидов также включают в себя фрагменты длиной по меньшей мере примерно из 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600 или более остатков, или полноразмерные ферменты. Полипептид или последовательности пептидов по настоящему изобретению включают в себя последовательность, кодируемую нуклеиновой кислотой по настоящему изобретению. Полипептид или последовательности пептидов по настоящему изобретению включают в себя полипептиды или пептиды, специфично связывающиеся с антителом по настоящему изобретению (например, эпитопы), или полипептиды или пептиды, которые могут генерировать антитело по настоящему изобретению (например, иммуноген).

В одном из аспектов полипептид по настоящему изобретению имеет активность по меньшей мере одного фермента целлюлазы, например фермента эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В альтернативных аспектах полинуклеотид по настоящему изобретению кодирует полипептид, который имеет активность по меньшей мере одного фермента целлюлазы, например фермента эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

В одном из аспектов активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, является термостабильной. Полипептид может поддерживать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы в условиях, включающих в себя температуры в пределах примерно от 1 примерно до 5 °С, примерно от 5 примерно до 15 °С, примерно от 15 примерно до 25 °С, примерно от 25 примерно до 37 °С, примерно от 37 примерно до 95 °С, примерно от 55 примерно до 85 °С, примерно от 70 примерно до 75 °С, или примерно от 90 примерно до 95 °С или более. В другом аспекте активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, может быть термотолерантной. Полипептид может поддерживать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, после экспонирования для температуры в пределах от более чем 37 примерно до 95 °С или в пределах от более чем 55 примерно до 85 °С. В одном из аспектов полипептид может поддерживать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, после экспонирования для температуры в пределах от более чем 90 примерно до 95 °С при рН 4,5.

Другой аспект настоящего изобретения относится к выделенному или рекомбинантному полипептиду или пептиду, содержащему по меньшей мере 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 125, 150 или более последовательных оснований последовательности полипептида или пептида по настоящему изобретению, последовательностей, по существу идентичных им, и последовательностей, комплементарных к ним. Пептид может представлять собой, например, иммуногенный фрагмент, мотив (например, сайт связывания), сигнальную последовательность, препропоследовательность или активный сайт.

Настоящее изобретение относится к выделенным или рекомбинантным нуклеиновым кислотам, содержащим последовательность, кодирующую полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, и сигнальную последовательность, где нуклеиновая кислота содержит последовательность по настоящему изобретению. Сигнальная последовательность может быть получена из другого фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или фермента не-целлюлазы, например фермента не-эндоглюканазы, не-целлобиогидролазы и/или не-бета-глюкозидазы (гетерологичного). Настоящее изобретение относится к выделенным или рекомбинантным нуклеиновым кислотам, содержащим последовательность, кодирующую полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где последовательность не содержит сигнальной последовательности, а нуклеиновая кислота содержит последовательность по настоящему изобретению. В одном из аспектов настоящее изобретение относится к выделенному или рекомбинантному полипептиду, включающему в себя полипептид по настоящему изобретению, в котором нет всей сигнальной последовательности или ее части. В одном из аспектов выделенный или рекомбинантный полипептид может включать в себя полипептид по настоящему изобретению, содержащий гетерологичную сигнальную последовательность, такую как сигнальная последовательность гетерологичного фермента целлюлазы, например сигнальную последовательность фермента эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или сигнальную последовательность фермента не-целлюлазы, например не-эндоглюканазы, не-целлобиогидролазы и/или не-бета-глюкозидазы.

В одном из аспектов настоящее изобретение относится к химерным белкам, содержащим первый домен, содержащий сигнальную последовательность по настоящему изобретению, и, по меньшей мере, второй домен. Белок может представлять собой белок слияния. Второй домен может содержать фермент. Фермент может представлять собой не-фермент.

Настоящее изобретение относится к химерным полипептидам, содержащим, по меньшей мере, первый домен, содержащий сигнальный пептид (SP), препропоследовательность и/или каталитический домен (CD) по настоящему изобретению, и, по меньшей мере, второй домен, содержащий гетерологичный полипептид или пептид, где гетерологичный полипептид или пептид не связывается в природе с сигнальным пептидом (SP), препропоследовательностью и/или каталитическим доменом (CD). В одном из аспектов гетерологичный полипептид или пептид не является ферментом целлюлазой, например эндоглюканазой, целлобиогидролазой, маннаназой и/или бета-глюкозидазой. Гетерологичный полипептид или пептид может находиться на аминоконце, карбоксиконце или на обоих концах сигнального пептида (SP), препропоследовательности и/или каталитического домена (CD).

Настоящее изобретение относится к выделенным или рекомбинантным нуклеиновым кислотам, кодирующим химерный полипептид, где химерный полипептид содержит, по меньшей мере, первый домен, содержащий сигнальный пептид (SP), препродомен и/или каталитический домен (CD) по настоящему изобретению, и, по меньшей мере, второй домен, содержащий гетерологичный полипептид или пептид, где гетерологичный полипептид или пептид не связан в природе с сигнальным пептидом (SP), препродоменом и/или каталитическим доменом (CD).

Настоящее изобретение относится к выделенным или рекомбинантным сигнальным последовательностям (например, сигнальным пептидам), состоящим из последовательности или содержащим их, как приведено в остатках 1-14, 1-15, 1-16, 1-17, 1-18, 1-19, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-26, 1-27, 1-28, 1-28, 1-30, 1-31, 1-32, 1-33, 1-34, 1-35, 1-36, 1-37, 1-38, 1-40, 1-41, 1-42, 1-43, 1-44, 1-45, 1-46 или 1-47 полипептида по настоящему изобретению, например SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:143, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164 или SEQ ID NO:166 (см. табл. 1-3, примеры 1 и 4 ниже и список последовательностей). В одном из аспектов настоящее изобретение относится к сигнальным последовательностям, содержащим первый 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 или более амино конечных остатков полипептида по настоящему изобретению.

В одном из аспектов активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включает в себя удельную активность примерно при 37 °С в пределах примерно от 1 примерно до 1200 единиц (ед.) на 1 мг белка или примерно от 100 примерно до 1000 ед. на 1 мг белка. В другом аспекте активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включает в себя удельную активность примерно от 100 примерно до 1000 ед. на 1 мг белка или примерно от 500 примерно до 750 ед. на 1 мг белка. Альтернативно, активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включает в себя удельную активность при 37 °С в пределах примерно от 1 примерно до 750 ед. на 1 мг белка или примерно от 500 примерно до 1200 ед. на 1 мг белка. В одном из аспектов активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включает в себя удельную активность при 37 °С в пределах примерно от 1 примерно до 500 ед. на 1 мг белка или примерно от 750 примерно до 1000 ед. на 1 мг белка. В другом аспекте активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включает в себя удельную активность при 37 °С в пределах примерно от 1 примерно до 250 ед. на 1 мг белка. Альтернативно, активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включает в себя удельную активность при 37 °С в пределах примерно от 1 примерно до 100 ед. на 1 мг белка.

В другом аспекте термотолерантность включает в себя удерживание по меньшей мере половины удельной активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, при 37 °С после нагрева до повышенной температуры. Альтернативно, термотолерантность может включать в себя удерживание удельной активности при 37 °С в пределах примерно от 1 примерно до 1200 ед. на 1 мг белка или примерно от 500 примерно до 1000 ед. на 1 мг белка после нагрева до повышенной температуры. В другом аспекте термотолерантность может включать в себя удерживание удельной активности при 37 °С в пределах примерно от 1 примерно до 500 ед. на 1 мг белка после нагрева до повышенной температуры.

Настоящее изобретение относится к выделенному или рекомбинантному полипептиду по настоящему изобретению, где полипептид содержит по меньшей мере один сайт гликозилирования. В одном из аспектов гликозилирование может представлять собой N-связанное гликозилирование. В одном из аспектов полипептид может быть гликозилирован после экспрессирования в P. pastoris или S. pombe.

В одном из аспектов полипептид может поддерживать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, в условиях, включающих в себя примерно рН 6,5; 6; 5,5; 5; 4,5 или 4 либо при более кислотных рН. В другом аспекте полипептид может поддерживать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, в условиях, включающих в себя примерно рН 7; 7,5; 8,0; 8,5; 9; 9,5; 10; 10,5 или 11 либо более основные рН. В одном из аспектов полипептид может поддерживать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, после экспонирования для условий, включающих в себя примерно рН 6,5; 6; 5,5; 5; 4,5 или 4 либо более кислотные рН. В другом аспекте полипептид может поддерживать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, после экспонирования для условий, включающих в себя примерно рН 7; 7,5; 8,0; 8,5; 9; 9,5; 10; 10,5 или 11 либо более основные рН.

В одном из аспектов фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению имеет активность при щелочных условиях, например при щелочных условиях кишечника, например тонкого кишечника. В одном из аспектов полипептид может поддерживать активность после экспонирования для кислотных рН желудка.

Настоящее изобретение относится к белковым препаратам, содержащим полипептид (включая пептиды) по настоящему изобретению, где белковый препарат включает в себя жидкость, твердый продукт или гель. Настоящее изобретение относится к гетеродимерам, содержащим полипептид по настоящему изобретению и второй белок или домен. Второй элемент гетеродимера может представлять собой другой фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, другой фермент или другой белок. В одном из аспектов второй домен может представлять собой полипептид, а гетеродимер может представлять собой белок слияния. В одном из аспектов второй домен может представлять собой эпитоп или таг. В одном из аспектов настоящее изобретение относится к гомодимерам, содержащим полипептид по настоящему изобретению.

Настоящее изобретение относится к иммобилизованным полипептидам (включая пептиды), имеющим активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где иммобилизованный полипептид включает в себя полипептид по настоящему изобретению, полипептид, кодируемый нуклеиновой кислотой по настоящему изобретению, или полипептид, содержащий полипептид по настоящему изобретению и второй домен. В одном из аспектов полипептид может иммобилизоваться на клетке, металле, смоле, полимере, керамике, стекле, микроэлектроде, графитовой частице, шарике, геле, пластинке, матрице или капиллярной трубке.

Настоящее изобретение также относится к матрицам, содержащим иммобилизованную нуклеиновую кислоту по настоящему изобретению, включая, например, зонды по настоящему изобретению. Настоящее изобретение также относится к матрицам, содержащим антитело по настоящему изобретению.

Настоящее изобретение относится к выделенным или рекомбинантным антителам, которые специфично связываются с полипептидом по настоящему изобретению или с полипептидом, кодируемым нуклеиновой кислотой по настоящему изобретению. Эти антитела по настоящему изобретению могут представлять собой моноклональное или поликлональное антитело. Настоящее изобретение относится к гибридомам, содержащим антитело по настоящему изобретению, например антитело, которое специфично связывается с полипептидом по настоящему изобретению или с полипептидом, кодируемым нуклеиновой кислотой по настоящему изобретению. Настоящее изобретение относится к нуклеиновым кислотам, кодирующим эти антитела.

Настоящее изобретение относится к способу выделения или идентификации полипептида, имеющего активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающему стадии: (а) получения антитела по настоящему изобретению; (b) получения образца, содержащего полипептиды; и (с) приведения в контакт образца из стадии (b) с антителом из стадии (а) в условиях, когда антитело может специфично связываться с полипептидом, при этом выделяя или идентифицируя полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

Настоящее изобретение относится к способам получения антитела к ферменту, антицеллюлазы, например антиэндоглюканазы, антицеллобиогидролазы и/или анти-бета-глюкозидазы, включающим в себя введение животному, не являющемуся человеком, нуклеиновой кислоты по настоящему изобретению или полипептида по настоящему изобретению, или его субпоследовательностей в количестве, достаточном для генерирования гуморального иммунного ответа, с получением антитела к ферменту, антицеллюлазу, например антиэндоглюканазу, антицеллобиогидролазу и/или анти-бета-глюкозидазу. Настоящее изобретение относится к способам получения иммунной реакции антицеллюлазы, например антиэндоглюканазы, антицеллобиогидролазы и/или анти-бета-глюкозидазы (клеточной или гуморальной), включающим введение животному, не являющемуся человеком, нуклеиновой кислоты по настоящему изобретению или полипептида по настоящему изобретению, или его субпоследовательностей в количестве, достаточном для генерирования иммунного ответа (клеточного или гуморального).

Настоящее изобретение относится к способам продуцирования рекомбинантного полипептида, включающим в себя стадии: (а) получения нуклеиновой кислоты по настоящему изобретению, функционально связанной с промотором; и (b) экспрессии нуклеиновой кислоты из стадии (а) в условиях, которые дает возможным экспрессирование полипептида, с получением рекомбинантного полипептида. В одном аспекте способ может дополнительно включать трансформацию клетки-хозяина с помощью нуклеиновой кислоты из стадии (а) с последующей экспрессией нуклеиновой кислоты из стадии (а), с получением рекомбинантного полипептида в трансформированной клетке.

Настоящее изобретение относится к способам идентификации полипептида, имеющего активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающим следующие стадии: (а) получения полипептида по настоящему изобретению или полипептида, кодируемого нуклеиновой кислотой по настоящему изобретению; (b) получения субстрата для фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы; (с) приведения в контакт полипептида или его фрагмента или варианта из стадии (а) с субстратом из стадии (b) и детекции уменьшения количества субстрата или увеличения количества продукта реакции, где уменьшение количества субстрата или увеличение количества продукта реакции детектирует полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов субстрат представляет собой соединение, содержащее целлюлозу.

Настоящее изобретение относится к способам идентификации субстрата для фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающим следующие стадии: (а) получения полипептида по настоящему изобретению; или полипептида, кодируемого нуклеиновой кислотой по настоящему изобретению; (b) получения исследуемого субстрата и (с) приведения в контакт полипептида из стадии (а) с исследуемым субстратом из стадии (b) и детекции уменьшения количества субстрата или увеличения количества продукта реакции, при этом уменьшение количества субстрата или увеличение количества продукта реакции идентифицирует исследуемый субстрат как субстрат для фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

Настоящее изобретение относится к способам определения того, связывается ли исследуемое соединение специфично с полипептидом, включающим в себя следующие стадии: (а) экспрессии нуклеиновой кислоты или вектора, содержащего нуклеиновую кислоту, в условиях, которые делают возможным трансляцию нуклеиновой кислоты в полипептид, где нуклеиновая кислота включает в себя нуклеиновую кислоту по настоящему изобретению, или получения полипептида по настоящему изобретению; (b) получения исследуемого соединения; (с) приведения в контакт полипептида с исследуемым соединением и (d) определения, связывается ли специфично исследуемое соединение из стадии (b) с полипептидом.

Настоящее изобретение относится к способам идентификации модулятора активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающим следующие стадии: (а) получения полипептида по настоящему изобретению или полипептида, кодируемого нуклеиновой кислотой по настоящему изобретению; (b) получения исследуемого соединения; (с) приведения в контакт полипептида из стадии (а) с исследуемым соединением из стадии (b) и измерения активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где изменение активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, измеренное в присутствии исследуемого соединения, по сравнению с активностью в отсутствие исследуемого соединения, дает определение того, что исследуемое соединение модулирует активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы может измеряться посредством получения субстрата для фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, и детекции уменьшения количества субстрата или увеличения количества продукта реакции или увеличения количества субстрата или уменьшения количества продукта реакции. Уменьшение количества субстрата или увеличение количества продукта реакции с помощью исследуемого соединения по сравнению с количеством субстрата или продукта реакции без исследуемого соединения идентифицирует исследуемое соединение как активатор активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Увеличение количества субстрата или уменьшение количества продукта реакции с помощью исследуемого соединения, по сравнению с количеством субстрата или продукта реакции без исследуемого соединения, идентифицирует исследуемое соединение как ингибитор активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

Настоящее изобретение относится к компьютерным системам, содержащим процессор и устройство для хранения данных, где указанное устройство для хранения данных содержит сохраняемую в нем последовательность полипептидов или последовательность нуклеиновых кислот по настоящему изобретению (например, полипептид или пептид, кодируемый нуклеиновой кислотой по настоящему изобретению). В одном из аспектов компьютерная система может дополнительно содержать алгоритм сравнения последовательностей, и устройство для хранения данных имеет по меньшей мере одну эталонную последовательность, сохраняемую в нем. В другом аспекте алгоритм сравнения последовательностей включает в себя компьютерную программу, которая показывает полиморфизмы. В одном из аспектов компьютерная система может дополнительно содержать идентификатор, который идентифицирует одну или несколько признаков в указанной последовательности. Настоящее изобретение относится к считываемым компьютером средам, имеющим сохраняемые на них последовательности полипептидов или последовательности нуклеиновых кислот по настоящему изобретению. Настоящее изобретение относится к способам идентификации признака в последовательности, включающим в себя стадии: (а) считывания последовательности с использованием компьютерной программы, которая идентифицирует одну или несколько признаков в последовательности, где последовательность включает в себя последовательность полипептидов или последовательность нуклеиновых кислот по настоящему изобретению; и (b) идентификации одной или нескольких признаков в последовательности с помощью компьютерной программы. Настоящее изобретение относится к способам сравнения первой последовательности со второй последовательностью, включающим в себя стадии: (а) считывания первой последовательности и второй последовательности посредством использования компьютерной программы, которая сравнивает последовательности, где первая последовательность включает в себя последовательность полипептидов или последовательность нуклеиновых кислот по настоящему изобретению; и (b) определения различий между первой последовательностью и второй последовательностью с помощью компьютерной программы. Стадия определения различий между первой последовательностью и второй последовательностью может дополнительно включать в себя стадию идентификации полиморфизмов. В одном из аспектов способ может дополнительно включать в себя идентификатор, который идентифицирует один или несколько признаков в последовательности. В другом аспекте способ может включать в себя считывание первой последовательности с использованием компьютерной программы и идентификацию одного или несколько признаков в последовательности.

Настоящее изобретение относится к способам выделения или извлечения нуклеиновой кислоты, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, из полученного из окружающей среды образца, включающим стадии: (а) получения пары праймеров последовательностей амплификации для амплификации нуклеиновой кислоты, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где пара праймеров способна амплифицировать нуклеиновую кислоту по настоящему изобретению; (b) выделения нуклеиновой кислоты из полученного из окружающей среды образца или обработку полученного из окружающей среды образца таким образом, что нуклеиновая кислота в образце является доступной для гибридизации с парой праймеров амплификации; и (с) объединения нуклеиновой кислоты из стадии (b) с парой праймеров амплификации из стадии (а) и амплификации нуклеиновой кислоты из полученного из окружающей среды образца, тем самым выделяя или извлекая нуклеиновую кислоту, кодирующую полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, из полученного из окружающей среды образца. Один элемент из пары последовательностей праймеров амплификации, или каждый из них, может содержать олигонуклеотид, содержащий пару последовательностей праймеров амплификации по настоящему изобретению, например имеющий по меньшей мере примерно 10-50 последовательных оснований последовательности по настоящему изобретению.

Настоящее изобретение относится к способам выделения или извлечения нуклеиновой кислоты, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, из полученного из окружающей среды образца, включающим стадии: (а) получения полинуклеотидного зонда, содержащего нуклеиновую кислоту по настоящему изобретению или ее субпоследовательность; (b) выделения нуклеиновой кислоты из полученного из окружающей среды образца или обработку полученного из окружающей среды образца таким образом, что нуклеиновая кислота в образце является доступной для гибридизации с полинуклеотидным зондом из стадии (а); (с) объединения выделенной нуклеиновой кислоты или обработанного полученного из окружающей среды образца из стадии (b) с полинуклеотидным зондом из стадии (а); (d) выделения нуклеиновой кислоты, которая специфично гибридизируется с полинуклеотидным зондом из стадии (а), с выделением или извлечением таким образом нуклеиновой кислоты, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, из полученного из окружающей среды образца. Полученный из окружающей среды образец может включать образец воды, образец жидкости, образец почвы, образец воздуха или биологический образец. В одном из аспектов биологический образец может быть получен из бактериальной клетки, клетки простейших, клетки насекомого, клетки дрожжей, клетки растения, клетки грибка или клетки млекопитающего.

Настоящее изобретение относится к способам генерирования варианта нуклеиновой кислоты, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающим стадии: (а) получения матричной нуклеиновой кислоты, содержащей нуклеиновую кислоту по настоящему изобретению; и (b) модификации, делеции или добавления одного или нескольких нуклеотидов в шаблонной последовательности, или их сочетание, с генерированием варианта матричной нуклеиновой кислоты. В одном из аспектов способ может дополнительно включать в себя экспрессию варианта нуклеиновой кислоты для генерации полипептида фермента варианта целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Модификации, добавления или делеции могут вводиться посредством способа, включающего в себя ошибочно направленную PCR, шаффлинг, олигонуклеотид-направленный мутагенез, сборку PCR, мутагенез посредством половой PCR, мутагенез in vivo, кассетный мутагенез, рекурсивный групповой мутагенез, экспоненциальный групповой мутагенез, сайт-специфичный мутагенез, перестановку генов, насыщающий мутагенез генных сайтов (GSSM), перестановку искусственным лигированием (SLR), хромосомальный насыщающий мутагенез (CSM) или их сочетание. В другом аспекте модификации, дополнения или делеции вводятся посредством способа, включающего в себя рекомбинацию, рекурсивную рекомбинацию последовательности, мутагенез фосфотиоат-модифицированной ДНК, мутагенез с урацилсодержащим шаблоном, мутагенез с дуплексными разрывами, точечный мутагенез с мисматч репарацией, мутагенез штамма хозяина с дефицитом репарационной способности, химический мутагенез, радиогенный мутагенез, делеционный мутагенез, рестрикционно-селекционный мутагенез, мутагенез с применением рестрикции и очистки, синтез искусственных генов, групповой мутагенез, создание мультимеров химерных нуклеиновых кислот и их сочетание.

В одном из аспектов способ может повторяться итеративно до тех пор, пока не будет получен фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, имеющий измененную или иную активность или измененную или иную стабильность, отличную от полипептида, кодируемого матричной нуклеиновой кислотой. В одном из аспектов вариант полипептида фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, является термотолерантным и поддерживает некоторую активность после экспонирования для повышенной температуры. В другом аспекте вариант фермента полипептида целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, имеет повышенное гликозилирование по сравнению с ферментом целлюлазой, например эндоглюканазой, целлобиогидролазой, маннаназой и/или бета-глюкозидазой, кодируемым матричной нуклеиновой кислотой. Альтернативно, вариант полипептида целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, имеет активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, при высокой температуре, где фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, кодируемый матричной нуклеиновой кислотой, является неактивным при высокой температуре. В одном из аспектов способ может итеративно повторяться до тех пор, пока не будет получена последовательность, кодирующая фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, имеющий измененное использование кодонов, иное, чем у матричной нуклеиновой кислоты. В другом аспекте способ может итеративно повторяться до тех пор, пока не будет получен ген фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, имеющий более высокий или более низкий уровень экспрессии мессенджера или стабильности, чем у матричной нуклеиновой кислоты.

Настоящее изобретение относится к способу модификации кодонов в нуклеиновой кислоте, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, для увеличения его экспрессии в клетке-хозяине, включающему следующие стадии: (а) получения нуклеиновой кислоты по настоящему изобретению, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы; и (b) идентификации непредпочтительного или менее предпочтительного кодона в нуклеиновой кислоте из стадии (а) и замены его предпочтительным или нейтрально используемым кодоном, кодирующим ту же аминокислоту, что и замененный кодон, где предпочтительный кодон представляет собой кодон, сверхпрезентируемый в кодирующих последовательностях, в генах в клетке-хозяине, а непредпочтительный или менее предпочтительный кодон представляет собой кодон, недопрезентируемый в кодирующих последовательностях в генах, в клетке-хозяине, с модификацией таким образом нуклеиновой кислоты для увеличения ее экспрессии в клетке-хозяине.

Настоящее изобретение относится к способам модификации кодонов в нуклеиновой кислоте, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы; способ включает следующие стадии: (а) получения нуклеиновой кислоты по настоящему изобретению и (b) идентификации кодона в нуклеиновой кислоте из стадии (а) и замены его другим кодоном, кодирующим ту же аминокислоту, что и замененный кодон, с модификацией кодонов в нуклеиновой кислоте, кодирующей фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу.

Настоящее изобретение относится к способам модификации кодонов в нуклеиновой кислоте, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, для увеличения его экспрессии в клетке-хозяине, включающим следующие стадии: (а) получения нуклеиновой кислоты по настоящему изобретению, кодирующей полипептид фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы; и (b) идентификации непредпочтительного или менее предпочтительного кодона в нуклеиновой кислоте из стадии (а) и замены его предпочтительным или нейтрально используемым кодоном, кодирующим ту же аминокислоту, что и замененный кодон, где предпочтительный кодон представляет собой кодон, сверхпрезентируемый в кодирующих последовательностях в генах в клетке-хозяине, а непредпочтительный или менее предпочтительный кодон представляет собой кодон, недопрезентируемый в кодирующих последовательностях в генах, в клетке-хозяине, с модификацией нуклеиновой кислоты, для увеличения его экспрессии в клетке-хозяине.

Настоящее изобретение относится к способам модификации кодонов в нуклеиновой кислоте, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, для уменьшения его экспрессии в клетке-хозяине, включающим следующие стадии: (а) получения нуклеиновой кислоты по настоящему изобретению и (b) идентификации по меньшей мере одного предпочтительного кодона в нуклеиновой кислоте из стадии (а) и замены ее непредпочтительным или менее предпочтительным кодоном, кодирующим ту же аминокислоту, что и замененный кодон, где предпочтительный кодон представляет собой кодон, сверхпрезентируемый в кодирующих последовательностях в генах, в клетке-хозяине, а непредпочтительный или менее предпочтительный кодон представляет собой кодон, недопрезентируемый в кодирующих последовательностях в генах, в клетке-хозяине, с модификацией, таким образом, нуклеиновой кислоты для уменьшения ее экспрессии в клетке-хозяине. В одном из аспектов клетка-хозяин может представлять собой бактериальную клетку, клетку грибков, клетку насекомых, клетку дрожжей, клетку растений или клетку млекопитающих.

Настоящее изобретение относится к способам создания библиотеки нуклеиновых кислот, кодирующих множество модифицированных активных сайтов фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или сайтов связывания с субстратом, где модифицированные активные сайты или сайты связывания с субстратом получают из первой нуклеиновой кислоты, содержащей последовательность, кодирующую первый активный сайт или первый сайт связывания с субстратом, причем способ включает следующие стадии: (а) получения первой нуклеиновой кислоты, кодирующей первый активный сайт или первый сайт связывания с субстратом, где первая последовательность нуклеиновых кислот содержит последовательность, которая гибридизируется в строгих условиях с нуклеиновой кислотой по настоящему изобретению, и нуклеиновая кислота кодирует активный сайт фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или сайт связывания с субстратом фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы; (b) получения набора мутагенных олигонуклеотидов, которые кодируют встречающиеся в природе варианты аминокислоты на множестве целевых кодонов в первой нуклеиновой кислоте; и (с) использования набора мутагенных олигонуклеотидов для генерирования набора вариантов нуклеиновых кислот, кодирующих активные сайты или кодирующих сайты связывания с субстратом, кодирующих набор вариантов аминокислот на каждом кодоне аминокислоты, который мутагенизируется, с получением, таким образом, библиотеки нуклеиновых кислот, кодирующих множество модифицированных активных сайтов или сайтов связывания с субстратом фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов способ включает в себя мутагенизацию первой нуклеиновой кислоты из стадии (а) посредством способа, включающего в себя оптимизированную направленную эволюцию системы, насыщающий мутагенез генных сайтов (GSSM), использование целлюлозы, набухшей в фосфорной кислоте (PASC) (SLR), ошибочно направленную PCR, шаффлинг, олигонуклеотид-направленный мутагенез, сборку PCR, мутагенез посредством половой PCR, мутагенез in vivo, кассетный мутагенез, рекурсивный групповой мутагенез, экспоненциальный групповой мутагенез, сайт-специфичный мутагенез, перестановку генов и их сочетание. В другом аспекте способ включает мутагенизацию первой нуклеиновой кислоты из стадии (а) или ее вариантов с помощью способа, включающего в себя рекомбинацию, рекурсивную рекомбинацию последовательностей, мутагенез фосфотиоат-модифицированной ДНК, мутагенез урацил-содержащего шаблона, мутагенез с дуплексными разрывами, мутагенез с мисматч репарацией, мутагенез с дуплексными разрывами, мутагенез штамма-хозяина с дефицитом репарационной способности, химический мутагенез, радиогенный мутагенез, мутагенез с делециями, рестрикционно-селекционный мутагенез, мутагенез с применением рестрикции и очистки, синтез искусственного гена, групповой мутагенез, создание мультимерных химерных нуклеиновых кислот и их сочетания.

Настоящее изобретение относится к способам получения малой молекулы, включающим следующие стадии: (а) получения множества биосинтетических ферментов, способных синтезировать или модифицировать малую молекулу, где один из ферментов включает в себя фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, кодируемый нуклеиновой кислотой по настоящему изобретению; (b) получения субстрата по меньшей мере для одного из ферментов из стадии (а) и (с) взаимодействия субстрата из стадии (b) с ферментами в условиях, которые облегчают множество биокаталитических реакций, с генерированием малой молекулы посредством ряда биокаталитических реакций. Настоящее изобретение относится к способам модификации малой молекулы, включающим следующие стадии: (а) получения фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где фермент включает в себя полипептид по настоящему изобретению или полипептид, кодируемый нуклеиновой кислотой по настоящему изобретению или ее субпоследовательностью; (b) получения малой молекулы и (с) взаимодействия фермента из стадии (а) с малой молекулой из стадии (b) в условиях, которые облегчают ферментативную реакцию, катализируемую ферментом целлюлазой, например эндоглюканазой, целлобиогидролазой, маннаназой и/или бета-глюкозидазой, с модификацией, таким образом, малой молекулы посредством ферментативной реакции целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов способ может включать множество низкомолекулярных субстратов для фермента из стадии (а), с генерацией библиотеки модифицированных малых молекул, полученных с помощью по меньшей мере одной ферментативной реакции, катализируемой ферментом целлюлазой, например эндоглюканазой, целлобиогидролазой, маннаназой и/или бета-глюкозидазой. В одном из аспектов способ может включать множество дополнительных ферментов в условиях, которые облегчают множество биокаталитических реакций посредством ферментов, с образованием библиотеки модифицированных малых молекул, получаемых с помощью множества ферментативных реакций. В другом аспекте способ может дополнительно включать стадию исследования библиотеки для определения того, присутствует ли конкретная модифицированная малая молекула, которая демонстрирует желаемую активность, в библиотеке. Стадия исследования библиотеки может дополнительно включать в себя стадии систематического устранения всех биокаталитических реакций, кроме одной, используемой для получения части множества модифицированных малых молекул в библиотеке, посредством исследования части модифицированной малой молекулы на присутствие или отсутствие конкретной модифицированной малой молекулы с желаемой активностью и идентификации по меньшей мере одной конкретной биокаталитической реакции, которая производит конкретную модифицированную малую молекулу с желаемой активностью.

Настоящее изобретение относится к способам определения функционального фрагмента фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающим стадии: (а) получения фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где фермент содержит полипептид по настоящему изобретению или полипептид, кодируемый нуклеиновой кислотой по настоящему изобретению, или его субпоследовательность; и (b) делеции множества остатков аминокислот из последовательности из стадии (а) и исследования оставшейся субпоследовательности на активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с определением функционального фрагмента фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, измеряется посредством получения субстрата фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, и детекции уменьшения количества субстрата или увеличения количества продукта реакции.

Настоящее изобретение относится к способам генной инженерии цельных клеток, новых или модифицированных фенотипов посредством использования анализа метаболических потоков в реальном времени, включающим следующие стадии: (а) получения модифицированной клетки посредством модификации генетической композиции клетки, где генетическая композиция модифицируется посредством добавления к клетке нуклеиновой кислоты по настоящему изобретению; (b) культивирования модифицированной клетки с генерированием множества модифицированных клеток; (с) измерения по меньшей мере одного метаболического параметра клетки посредством мониторинга культуры клеток из стадии (b) в реальном времени и (d) анализа данных из стадии (с) для определения того, отличается ли измеренный параметр от сравнимого измерения в немодифицированной клетке при сходных условиях с идентификацией, таким образом, полученного с помощью генной инженерии фенотипа клетки с использованием анализа метаболических потоков в реальном времени. В одном из аспектов генетическая композиция клетки может модифицироваться посредством способа, включающего делецию последовательности, или модификацию последовательности в клетке, или нокаутирование экспрессии гена. В одном из аспектов способ может дополнительно включать селекцию клетки, содержащей фенотип, вновь полученный с помощью генной инженерии. В другом аспекте способ может включать культивирование селектированной клетки, с генерацией, таким образом, нового штамма клетки, содержащего фенотип, вновь полученный с помощью генной инженерии.

Настоящее изобретение относится к способам увеличения термотолерантности или термостабильности полипептида фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающим гликозилирование полипептида фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где полипептид содержит по меньшей мере тридцать непрерывных аминокислот полипептида по настоящему изобретению; или полипептида, кодируемого последовательностью нуклеиновых кислот по настоящему изобретению, тем самым увеличивая термотолерантность или термостабильность полипептида целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов удельная активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, может быть термостабильной или термотолерантной при температуре в пределах от более примерно чем 37 примерно до 95 °С.

Настоящее изобретение относится к способам для суперэкспрессии в клетке рекомбинантного полипептида целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, включающие экпрессирование вектора, содержащего нуклеиновую кислоту, включающую нуклеиновую кислоту по настоящему изобретению или последовательность нуклеиновых кислот по настоящему изобретению, где идентичности последовательностей определяются посредством анализа с помощью алгоритма сравнения последовательностей или посредством визуальной проверки, где суперэкспрессия осуществляется посредством использования промотора с высокой активностью, дицистронного вектора или посредством генной амплификации вектора.

Настоящее изобретение относится к способам получения трансгенного растения, включающим следующие стадии: (а) введения гетерологичной последовательности нуклеиновых кислот в клетку, где гетерологичная последовательность нуклеиновых кислот включает в себя последовательность нуклеиновых кислот по настоящему изобретению, с получением, таким образом, трансформированной клетки растения; и (b) создания трансгенного растения из трансформированной клетки. В одном из аспектов стадия (а) может дополнительно включать введение гетерологичной последовательности нуклеиновых кислот посредством электропорообразования или микроинъекции протопластов клеток растений. В другом аспекте стадия (а) может дополнительно включать введение гетерологичной последовательности нуклеиновых кислот непосредственно в ткань растения посредством бомбардировки частицами ДНК. Альтернативно, стадия (а) может дополнительно включать введение гетерологичной последовательности нуклеиновых кислот в ДНК клетки растения, используя хозяина Agrobacterium tumefaciens. В одном из аспектов клетка растения может представлять собой клетку сахарного тростника, свеклы, сои, томата, картофеля, кукурузы, риса, пшеницы, табака или ячменя.

Настоящее изобретение относится к способам экспрессии гетерологичной последовательности нуклеиновых кислот в клетку растения, включающим следующие стадии: (а) трансформации клетки растения с помощью гетерологичной последовательности нуклеиновых кислот, функционально связанных с промотором, где гетерологичная последовательность нуклеиновых кислот включает нуклеиновую кислоту по настоящему изобретению; (b) выращивания растений в условиях, где гетерологичная последовательность нуклеиновых кислот экспрессируется в клетку растения. Настоящее изобретение относится к способам экспрессии гетерологичной последовательности нуклеиновых кислот в клетку растения, включающим следующие стадии: (а) трансформации клетки растения с помощью гетерологичной последовательности нуклеиновых кислот, функционально связанных с промотором, где гетерологичная последовательность нуклеиновых кислот включает последовательность по настоящему изобретению; (b) выращивания растения в условиях, где гетерологичная последовательность нуклеиновых кислот экспрессируется в клетки растения.

Настоящее изобретение относится к кормам или пищевым продуктам, содержащим полипептид по настоящему изобретению или полипептид, кодируемый нуклеиновой кислотой по настоящему изобретению. В одном из аспектов настоящее изобретение относится к пищевому продукту, корму, жидкости, например напитку (такому как фруктовый сок или пиво), хлебу или продукту из теста или хлебному продуту, или промежуточному продукту для напитка (например, суслу), содержащему полипептид по настоящему изобретению. Настоящее изобретение относится к пищевым или питательным добавкам для животного, содержащим полипептид по настоящему изобретению, например полипептид, кодируемый нуклеиновой кислотой по настоящему изобретению.

В одном из аспектов полипептид в пищевой или питательной добавке может быть гликозилированным. Настоящее изобретение относится к съедобным матрицам для доставки фермента, содержащим полипептид по настоящему изобретению, например полипептид, кодируемый нуклеиновой кислотой по настоящему изобретению. В одном из аспектов матрица для доставки включает в себя гранулы. В одном из аспектов полипептид может быть гликозилированным. В одном из аспектов активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, является термотолерантной. В другом аспекте активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, является термостабильной.

Настоящее изобретение относится к пищевому продукту, корму или пищевой добавке, содержащим полипептид по настоящему изобретению. Настоящее изобретение относится к способам применения фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, в качестве пищевой добавки к диете животного, включающим приготовление пищевой добавки, содержащий фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, содержащий по меньшей мере тридцать непрерывных аминокислоты полипептида по настоящему изобретению; и введение пищевой добавки животному. Животное может представлять собой человека, жвачное или моногастрическое животное. Фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, может быть получен посредством экспрессирования полинуклеотида, кодирующего фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, в организме, выбранном из группы, состоящей из бактерий, дрожжей, растений, насекомых, грибков и животных. Организм может выбираться из группы, состоящей из S. pombe, S. cerevisiae, Pichia pastoris, Е.coli, Streptomyces sp., Bacillus sp. и Lactobacillus sp.

Настоящее изобретение относится к съедобной матрице для доставки фермента, включающей термостабильный рекомбинантный фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, например полипептид по настоящему изобретению. Настоящее изобретение относится к способам доставки добавки с ферментом целлюлазой, например эндоглюканазой, целлобиогидролазой, маннаназой и/или бета-глюкозидазой, животному, включающим приготовление съедобной матрицы для доставки фермента в форме гранул, содержащих гранулированный съедобный носитель и термостабильный рекомбинантный фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, где гранулы легко диспергируют фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, содержащийся в них, в водных средах, и введение съедобной матрицы для доставки фермента животному. Рекомбинантный фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, может содержать полипептид по настоящему изобретению. Фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, может быть гликозилированным для получения термостабильности в условиях гранулирования. Матрица для добавки может формироваться посредством гранулирования смеси, содержащей зародыши зерновых культур и фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу. Условия гранулирования могут включать в себя применение пара. Условия гранулирования могут включать в себя применение температуры, превышающей примерно 80 °С, в течение примерно 5 мин, и при этом фермент поддерживает удельную активность по меньшей мере от 350 примерно до 900 ед. на 1 мг фермента.

В одном из аспектов настоящее изобретение относится к фармацевтической композиции, содержащей фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу по настоящему изобретению, или полипептид, кодируемый нуклеиновой кислотой по настоящему изобретению. В одном из аспектов фармацевтическая композиция действует в качестве средства, облегчающего переваривание.

В определенных аспектах соединение, содержащее целлюлозу, приводят в контакт с полипептидом по настоящему изобретению, имеющим активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, при рН в пределах примерно от рН 3,0 до 9,0, 10,0, 11,0 или более. В других аспектах соединение, содержащее целлюлозу, приводится в контакт с ферментом целлюлазой, например эндоглюканазой, целлобиогидролазой, маннаназой и/или бета-глюкозидазой, при температуре примерно 55, 60, 65, 70, 75, 80, 85, 90 °С или более.

Детали одного или нескольких аспектов настоящего изобретения приводятся в прилагаемых чертежах и в описании ниже. Другие признаки, цели и преимущества настоящего изобретения будут ясны из описания, чертежей и из формулы изобретения.

Все публикации, патенты, заявки на патенты, последовательности GenBank и депозиты АТСС, цитируемые здесь, включены в качестве ссылок для всех целей.

Краткое описание чертежей

Следующие далее чертежи представляют собой иллюстрацию аспектов настоящего изобретения и не предназначены для ограничения рамок настоящего изобретения, как охватывается формулой изобретения.

Фиг. 1 представляет собой блок-схему компьютерной системы.

Фиг. 2 представляет собой блок-схему, иллюстрирующую один из аспектов способа сравнения новой последовательности нуклеотидов или белков с базой данных последовательностей для определения уровней гомологии между новой последовательностью и последовательностями в базе данных.

Фиг. 3 представляет собой блок-схему, иллюстрирующую один из аспектов способа в компьютере для определения, являются ли две последовательности гомологичными.

Фиг. 4 представляет собой блок-схему, иллюстрирующую один из аспектов процесса идентификатора 300 для детекции присутствия признака в последовательности.

Фиг. 5 представляет собой иллюстрацию структуры целлобиозы.

Фиг. 6 и 7 иллюстрируют результаты анализа с помощью ТСХ продуктов реакции из целлогексаозы, как обсуждается подробно в примере 1 ниже.

Фиг. 8 иллюстрирует в форме графика данные, показывающие высвобождения целлобиозы из PASC с помощью примерного фермента 22/22а (СВН) по настоящему изобретению, как обсуждается подробно в примере 2 ниже.

Фиг. 9 иллюстрирует в форме графика данные, показывающие высвобождения целлобиозы из AVICEL ® МСС с помощью примерного фермента 22/22а (СВН) по настоящему изобретению, как обсуждается подробно в примере 2 ниже.

Фиг. 10 иллюстрирует в форме графика данные, показывающие типичное разрушение GIGAMATRIX ™, где активные клоны, экспрессирующие фермент, способный гидролизовать метилумбеллиферилцеллобиозид, идентифицируются, как обсуждается подробно в примере 4 ниже.

Фиг. 11 иллюстрирует в форме графика данные, показывающие активность выбранных ферментов против целлюлозы, набухшей в фосфорной кислоте (PASC), посредством анализа с помощью капиллярного электрофореза (СЕ), как обсуждается подробно в примере 4 ниже.

Фиг. 12 иллюстрирует в форме графика данные анализов примерного фермента по настоящему изобретению и вариантов субклонов на микрокристаллической целлюлозе AVICEL ® (МСС), где продукты реакции анализируют посредством анализа с использованием восстанавливающего сахара ВСА, как обсуждается подробно в пример 4 ниже.

Фиг. 13 иллюстрирует в форме графика данные анализов первичного скрининга GSSM, как обсуждается подробно в примере 4 ниже.

Фиг. 14 иллюстрирует в форме графика данные анализов вторичного скрининга GSSM, как обсуждается подробно в примере 4 ниже.

Фиг. 15 иллюстрирует в форме графика данные анализов скрининга смешанных или "смеси" GSSM, как обсуждается подробно в примере 4 ниже.

Схожие ссылочные символы на различных чертежах указывают на сходные элементы.

Подробное описание

Настоящее изобретение относится к полипептидам с активностью целлюлазы, например эндоглюканазам, целлобиогидролазам, маннаназам и/или бета-глюкозидазам, полинуклеотидам, кодирующим их, и способам получения и применения этих полинуклеотидов и полипептидов. Настоящее изобретение также относится к ферментам целлюлазы, например ферментам эндоглюканазе, целлобиогидролазе, маннаназе и/или бета-глюкозидазе, полинуклеотидам, кодирующим эти ферменты, применению таких полинуклеотидов и полипептидов.

В одном из аспектов настоящее изобретение относится к целлюлазе, например эндоглюканазе, целлобиогидролазе, маннаназе и/или бета-глюкозидазе, с увеличенной скоростью катализа, усовершенствующей процесс гидролиза субстрата. Это увеличенная эффективность скорости катализа приводит к увеличению эффективности при получении сахаров, которые впоследствии будут использования микроорганизмами для производства этанола. В одном из аспектов микроорганизмы, генерирующие фермент по настоящему изобретению, используются вместе с микроорганизмами, производящими этанол. Таким образом, настоящее изобретение относится к способам производства этанола и получения "чистого горючего" на основе этанола, например, для транспорта, использующего биоэтанол.

В одном из аспектов настоящее изобретение относится к композициям (например, препаратам ферментов, кормам, лекарственным средствам, пищевым добавкам), содержащим ферменты, полипептиды или полинуклеотиды по настоящему изобретению. Эти композиции могут приготавливаться в различных формах, например, как жидкости, гели, пилюли, таблетки, спреи, порошки, пищевые продукты, кормовые гранулы или инкапсулированные формы, включая наноинкапсулированные формы.

Анализ для измерения активности целлюлазы, например активности эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, например, для определения того, имеет ли полипептид активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, хорошо известны в данной области и находятся в рамках настоящего изобретения; см., например, Baker W.L., Panow A., Estimation of cellulase activity using a glucose-oxidase-Cu(II) reducing assay for glucose, J. Biochem Biophys Methods. 1991 Dec, 23 (4):265-73; Sharrock K.R., Cellulase assay methods: review, J. Biochem Biophys Methods. 1988 Oct, 17 (2):81-105; Carder J.H., Detection and quantification of cellulase Congo red staining of substrates in cup-plate diffusion assay, Anal Biochem. 1986 Feb 15, 153(1):75-9; Canevascini G., A cellulase assay coupled to cellobiose dehydrogenase, Anal Biochem. 1985 Jun, 147 (2):419-27; Huang J.S., Tang J., Sensitive assay for cellulase and dextranase. Anal Biochem. 1976 Jun, 73 (2):369-77.

pH реакционных условий, используемых в настоящем изобретении, представляет собой другой переменный параметр, который относится к настоящему изобретению. В определенных аспектах рН реакции находится в пределах примерно от 3,0 примерно до 9,0. В других аспектах рН составляет примерно 4,5, или примерно 7,5, или примерно 9. Условия реакции, которые представляют собой щелочные условия, также могут быть преимущественными, например, в некоторых промышленных или фармацевтических применениях ферментов по настоящему изобретению.

Настоящее изобретение относится к полипептидам целлюлазы, например эндоглюканазе, целлобиогидролазе, маннаназе и/или бета-глюкозидазе, по настоящему изобретению в различных формах и препаратах. В способах по настоящему изобретению полипептиды целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению используются в различных формах и препаратах. Например, очищенные полипептиды целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, могут использоваться в препаратах ферментов, используемых при производстве биоэтанола или в фармацевтических применениях, или в применениях, связанных с пищевыми добавками. Альтернативно, ферменты по настоящему изобретению могут использоваться непосредственно в способах производства биоэтанола, при получении чистого горючего, при переработке биологических отходов, при обработке пищевых продуктов, жидкости или кормов и т.п.

Альтернативно, полипептиды целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению могут экспрессироваться в микроорганизме с использованием процедур, известных в данной области. В других аспектах полипептиды целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению могут иммобилизоваться на твердой подложке перед использованием в способах по настоящему изобретению. Способы иммобилизации ферментов на твердых подложках повсеместно известны в данной области, например, J. Mol. Cat. В: Enzymatic 6 (1999), 29-39; Chivata et al. Biocatalysis: Immobilized cells and enzymes, J. Mol. Cat. 37 (1986), 1-24: Sharma et al., Immobilized Biomaterials Techniques and Applications, Angew. Chem. Int. Ed. Engl. 21 (1982), 837-54: Laskin (Ed.), Enzymes and Immobilized Cells in Biotechnology.

Нуклеиновые кислоты, зонды и ингибиторные молекулы.

Настоящее изобретение относится к выделенным и рекомбинантным нуклеиновым кислотам, например, см. табл. 1-3, примеры 1 и 4 ниже и список последовательностей; нуклеиновым кислотам, кодирующим полипептиды, включая примерные последовательности полинуклеотидов по настоящему изобретению, например, см. табл. 1 и список последовательностей; включая кассеты экспрессии, такие как векторы экспрессии и различные носители клонирования, содержащие нуклеиновые кислоты по настоящему изобретению. Настоящее изобретение также включает способы для обнаружения, идентификации или выделения новых последовательностей полипептидов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с использованием нуклеиновых кислот по настоящему изобретению. Настоящее изобретение также включает способы ингибирования экспрессии генов и транскриптов, кодирующих целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, с использованием нуклеиновых кислот по настоящему изобретению.

Также предусматриваются способы модификации нуклеиновых кислот по настоящему изобретению, включающие получение вариантов нуклеиновых кислот по настоящему изобретению, например, посредством перестановки искусственным лигированием, оптимизированной направленной эволюции системы и/или насыщающего мутагенеза, такого как насыщающий мутагенез генных сайтов (GSSM). Термин "насыщающий мутагенез", насыщающий мутагенез генных сайтов или "GSSM" включает способ, который использует вырожденные олигонуклеотидные праймеры для введения точечных мутаций в полинуклеотид, как описано подробно ниже. Термин "оптимизированная система направленной эволюции" или "оптимизированная направленная эволюции" включает способ перестановки фрагментов родственных последовательностей нуклеиновых кислот, например родственных генов, как описано подробно ниже. Термин "перестановка искусственным лигированием" или "SLR" включает способ лигирования фрагментов олигонуклеотидов неслучайным образом, как объясняется подробно ниже. Термин "вариант" относится к полинуклеотидам или полипептидам по настоящему изобретению, модифицированным на одной или нескольких парах оснований, кодонах, интронах, экзонах или остатках аминокислот (соответственно), при этом по-прежнему поддерживающих биологическую активность целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению. Варианты могут быть получены с помощью ряда средств, включая, например, такие способы, как ошибочно направленную PCR, шаффлинг, олигонуклеотид-направленный мутагенез, сборку PCR, мутагенез посредством половой PCR, мутагенез in vivo, кассетный мутагенез, рекурсивный групповой мутагенез, экспоненциальный групповой мутагенез, сайт-специфичный мутагенез, перестановку генов, GSSM и любое их сочетание.

Нуклеиновые кислоты по настоящему изобретению могут изготавливаться, выделяться и/или подвергаться манипуляциям, например, посредством клонирования и экспрессии библиотек цДНК, амплификации сигнальной или геномной ДНК посредством PCR и т.п. Например, примерные последовательности по настоящему изобретению изначально получают из источников из окружающей среды. Таким образом, в одном из аспектов настоящее изобретение относится к нуклеиновым кислотам, кодирующим ферменты целлюлазы, например эндоглюканазе, целлобиогидролазе, маннаназе и/или бета-глюкозидазе, и полипептидам, кодируемым ими, имеющим общую новизну в том, что они получены из общего источника, например источника из окружающей среды, смешанной культуры или бактериального источника.

При осуществлении способов по настоящему изобретению гомологичные гены могут модифицироваться посредством манипулирования с матричной нуклеиновой кислотой, как описано здесь. Настоящее изобретение может осуществляться в сочетании с любым способом или протоколом, или устройством, известным в данной области, которые хорошо описаны в научной и патентной литературе.

Фразы "нуклеиновая кислота" или "последовательность нуклеиновых кислот", как здесь используется, относится к олигонуклеотиду, нуклеотиду, полинуклеотиду или к фрагменту любого из них, к ДНК или РНК геномного или синтетического происхождения, которая может быть одноцепочечной или двухцепочечной и может представлять собой смысловую или антисмысловую (комплементарную) нить, к пептидно-нуклеиновой кислоте (ПНК) или к любому материалу, подобному ДНК или подобному РНК, природного или синтетического происхождения. Фразы "нуклеиновая кислота" или "последовательность нуклеиновых кислот" включают олигонуклеотид, нуклеотид, полинуклеотид или фрагмент любого из них, ДНК или РНК (например, m-РНК, r-РНК, t-РНК, i-РНК) геномного или синтетического происхождения, которые могут быть одноцепочечными или двухцепочечными и могут представлять собой смысловую или антисмысловую нить, пептидную нуклеиновую кислоту (ПНК), или любой подобный ДНК или подобный РНК материал природного или синтетического происхождения, включая, например, i-РНК, рибонуклеопротеины (например, двухцепочечные i-РНК, например iRNP). Термин охватывает нуклеиновые кислоты, т.е. олигонуклеотиды, содержащие известные аналоги природных нуклеотидов. Термин также охватывает структуры, подобные нуклеиновым кислотам с синтетическими основными цепями, см., например, Mata (1997), Toxicol. Appl. Pharmacol. 144:189-197; Strauss-Soukup (1997), Biochemistry 36:8692-8698; Samstag (1996), Antisense Nucleic Acid Drug Dev 6:153-156. "Олигонуклеотид" включает либо одноцепочечный полидеоксинуклеотид, либо две комплементарные нити полидеоксинуклеотидов, которые могут синтезироваться химически. Такие синтетические олигонуклеотиды не имеют 5' фосфата и, таким образом, не будут лигироваться с другим олигонуклеотидом без добавления фосфата с помощью АТФ в присутствии киназы. Синтетический олигонуклеотид может лигироваться с фрагментом, который не был дефосфорилирован.

"Кодирующая последовательность" или "последовательность нуклеотидов, кодирующая" конкретный полипептид или белок, представляет собой последовательность нуклеиновых кислот, которая подвергается транскрипции и трансляции в полипептид или белок, когда попадает под контроль соответствующих регуляторных последовательностей. Термин "ген" означает сегмент ДНК, вовлеченный в продуцирование полипептидной цепи; он включает области предшествующие и следующие после кодирующей области (лидерная и хвостовая), а также, где это применимо, промежуточные последовательности (интроны) между индивидуальными кодирующими сегментами (экзонами). Промоторная последовательность "функционально связывается с" кодирующей последовательностью, когда РНК полимераза, которая инициирует транскрипцию на промоторе, будет осуществлять транскрипцию кодирующей последовательность в m-РНК. "Функционально связанный", как здесь используется, относится к функциональной взаимосвязи между двумя или более сегментами нуклеиновой кислоты (например, ДНК). Он может относиться к функциональной взаимосвязи транскрипционной регуляторной последовательности с последовательностью, полученной при транскрипции. Например, промотор является функционально связанным с кодирующей последовательностью, такой как нуклеиновая кислота по настоящему изобретению, если он стимулирует или модулирует транскрипцию кодирующей последовательности в соответствующей клетке-хозяине или в другой системе экспрессии. Как правило, промоторные транскрипционные регуляторные последовательности, которые являются функционально связанными с последовательностью, полученной после транскрипции, являются физически непрерывными с последовательностью, полученной после транскрипции, т.е. они являются цис-действующими. Однако некоторые транскрипционные регуляторные последовательности, такие как энхансеры, не должны быть физически непрерывными или располагаться очень близко к кодирующим последовательностям, транскрипцию которых они усиливают.

Термин "кассета экспрессии", как здесь используется, относится к последовательности нуклеотидов, которая способна влиять на экспрессию структурного гена (т.е. последовательности, кодирующей белки, такие как фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению) в хозяине, совместимом с такими последовательностями. Кассеты экспрессии включают, по меньшей мере, промотор, функционально связанный с последовательностью, кодирующей полипептид; и, необязательно, с другими последовательностями, например, с сигналами завершения транскрипции. Могут также использоваться дополнительные факторы, необходимые или полезные при осуществлении экспрессии, например энхансеры, альфа-факторы. Таким образом, кассеты экспрессии включают также плазмиды, векторы экспрессии, рекомбинантные вирусы, любую форму вектора рекомбинантной "голой ДНК" и т.п. "Вектор" содержит нуклеиновую кислоту, которая может инфицировать, трансфицировать, нестационарно или стационарно трансформировать клетку. Будет видно, что вектор может представлять собой голую нуклеиновую кислоту или нуклеиновую кислоту в комплексе с белком или липидом. Вектор необязательно содержит вирусные или бактериальные нуклеиновые кислоты и/или белки, и/или мембраны (например, клеточную мембрану, липидную оболочку вируса и т.п.). Векторы включают в себя, но не ограничиваясь этим, репликоны (например, репликоны РНК, бактериофаги), к которым фрагменты ДНК могут прикрепляться и реплицироваться. Таким образом, векторы включают в себя, но не ограничиваясь этим, РНК, автономную самореплицирующуюся круговую или линейную ДНК или РНК (например, плазмиды, вирусы и т.п., см., например, патент США № 5217879), и включают как экспрессирующиеся, так и неэкспрессирующиеся плазмиды. Когда рекомбинантный микроорганизм или культура клеток описывается как хозяин "вектора экспрессии", это включает как экстрахромосомальную круговую, так и линейную ДНК и РНК, которая инкорпорируется в хромосому (хромосомы) хозяина. Когда вектор поддерживается клеткой-хозяином, вектор может либо стабильно реплицироваться клетками во время митоза, как автономная структура, либо инкорпорироваться в геном хозяина.

Как здесь используется, термин "рекомбинантный" охватывает нуклеиновые кислоты рядом с нуклеиновой кислотой "основной цепи", с которыми не является соседней в природной окружающей среде. В одном из аспектов, чтобы быть "обогащенными", нуклеиновые кислоты будут представлять собой примерно 5% или более от количества вставок нуклеиновых кислот в популяции молекул основной цепи нуклеиновых кислот. Молекулы основной цепи в соответствии с настоящим изобретением включают такие нуклеиновые кислоты, как векторы экспрессии, самореплицирующиеся нуклеиновые кислоты, вирусы, встраиваемые нуклеиновые кислоты и другие векторы или нуклеиновые кислоты, используемые для поддержания или манипуляций со вставкой нуклеиновой кислоты, представляющей интерес. В одном из аспектов обогащенные нуклеиновые кислоты представляют собой примерно 15% или более от количества вставок нуклеиновых кислота в популяции рекомбинантных молекул основной цепи. В одном из аспектов обогащенные нуклеиновые кислоты представляют собой примерно 50% или более от количества вставок нуклеиновых кислота в популяции рекомбинантных молекул основной цепи. В одном из аспектов обогащенные нуклеиновые кислоты представляют собой примерно 90% или более от количества вставок нуклеиновых кислота в популяции рекомбинантных молекул основной цепи.

Один из аспектов настоящего изобретения представляет собой выделенную или рекомбинантную нуклеиновую кислоту, содержащую одну из последовательностей по настоящему изобретению или фрагмент, содержащий по меньшей мере 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 или 500 либо более последовательных оснований нуклеиновой кислоты по настоящему изобретению. Выделенная и рекомбинантная нуклеиновые кислоты могут содержать ДНК, включая цДНК, геномную ДНК и синтетическую ДНК. ДНК может быть двухцепочечной или одноцепочечной, и если она одноцепочечная, может представлять кодирующую нить или некодирующую (антисмысловую) нить. Альтернативно, выделенные или рекомбинантные нуклеиновые кислоты содержат РНК.

Выделенная и рекомбинантная нуклеиновые кислоты по настоящему изобретению могут использоваться для получения одного из полипептидов по настоящему изобретению, или фрагментов, содержащих по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 либо более последовательных аминокислот одного из полипептидов по настоящему изобретению. Соответственно, другой аспект настоящего изобретения представляет собой выделенную или рекомбинантную нуклеиновую кислоту, которая кодирует один из полипептидов по настоящему изобретению, или фрагменты, содержащие по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 либо более последовательных аминокислот одного из полипептидов по настоящему изобретению. Кодирующие последовательности этих нуклеиновых кислот могут быть идентичными одной из кодирующих последовательностей одной из нуклеиновых кислот по настоящему изобретению или могут представлять собой иные кодирующие последовательности, которые кодируют одну из нуклеиновых кислот по настоящему изобретению, имеющую по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 либо более последовательных аминокислот одного из полипептидов по настоящему изобретению, в результате избыточности или дегенерации генетического кода. Генетический код хорошо известен специалистам в данной области и может быть получен, например, на с. 214, В. Lewin, Genes VI, Oxford University Press, 1997.

Нуклеиновые кислоты, кодирующие полипептиды по настоящему изобретению, включают в себя, но не ограничиваясь этим, кодирующую последовательность нуклеиновой кислоты по настоящему изобретению и дополнительные кодирующие последовательности, такие как лидерные последовательности или пробелковые последовательности и некодирующие последовательности, такие как интроны или некодирующие последовательности 5' и/или 3' кодирующей последовательности. Таким образом, как здесь используется, термин "полинуклеотид, кодирующий полипептид" охватывает полинуклеотид, который содержит кодирующую последовательность полипептида, а также полинуклеотид, который содержит дополнительную кодирующую и/или некодирующую последовательность.

В одном из аспектов последовательности нуклеиновых кислот по настоящему изобретению мутагенизируются с использованием обычных методик, таких как сайт-направленный мутагенез, или других методик, известных специалистам в данной области, для введения молчащих изменений в полинуклеотиды по настоящему изобретению. Как здесь используется, "молчащие изменения" включают в себя, например, изменения, которые не изменяют последовательность аминокислот, кодируемую полинуклеотидом. Такие изменения могут быть желательными для увеличения уровня полипептида, производимого клетками-хозяевами, содержащими вектор, кодирующий полипептид посредством введения кодонов или пар кодонов, которые часто встречаются в организме хозяина.

Настоящее изобретение также относится к полинуклеотидам, которые имеют изменения нуклеотидов, которые приводят к замещениям, добавлениям, делециям, слияниям и процессингу аминокислот в полипептидах по настоящему изобретению. Такие изменения нуклеотидов могут вводиться с использованием таких методик, как методика сайт-направленного мутагенеза, случайного химического мутагенеза, делеции экзонуклеазы III и других методик с рекомбинантной ДНК. Альтернативно, такие изменения нуклеотидов могут представлять собой встречающиеся в природе аллельные варианты, которые выделяются посредством идентификации нуклеиновых кислот, которые специфично гибридизируются с зондами, содержащими по меньшей мере 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 или 500 последовательных оснований одной из последовательностей по настоящему изобретению (или последовательностей, комплементарных к ним) в условиях высокой, умеренной или низкой строгости, как здесь предусматривается.

Общие методики.

Нуклеиновые кислоты, используемые для осуществления настоящего изобретения, представляют ли они собой РНК, si-РНК, mi-РНК, антисмысловую нуклеиновую кислоту, цДНК, геномную ДНК, векторы, вирусы или их гибриды, могут выделяться из различных источников, полученных с помощью генной инженерии, амплифицированных и/или экспрессированных/генерированных рекомбинантно. Рекомбинантные полипептиды (например, ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза), генерируемые из этих нуклеиновых кислот, могут индивидуально выделяться или клонироваться и исследоваться на желаемую активность. Может использоваться любая система рекомбинантной экспрессии, включая системы экспрессии клеток бактерий, млекопитающих, дрожжей, насекомых или растений.

Альтернативно, эти нуклеиновые кислоты могут синтезироваться in vitro с помощью хорошо известных методик химического синтеза, как описано, например, в Adams (1983), J. Am. Chem. Soc. 105:661; Belousov (1997), Nucleic Acids Res. 25:3440-3444; Frenkel (1995), Free Radic. Biol. Med. 19:373-380; Blommers (1994), Biochemistry 33:7886-7896; Narang (1979), Meth. Enzymol. 68:90; Brown (1979), Meth. Enzymol. 68:109; Beaucage (1981), Tetra. Lett. 22:1859; патент США № 4458066.

Методики для манипуляций с нуклеиновыми кислотами, такие, например, как субклонирование, меченые зонды (например, мечение случайным праймером с использованием полимеразы Кленова, ник-трансляция, амплификация), секвенирование, гибридизация и т.п., хорошо описаны в научной и патентной литературе, см., например, Sambrook, ed., MOLECULAR CLONING: A LABORATORY MANUAL (2ND ED.), Vol. 1-3, Cold Spring Harbor Laboratory, (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Ausubel, ed. John Wiley & Sons, Inc., New York (1997); LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY: HYBRIDIZATIION С NUCLEIC ACID PROBES, Part I. Theory and Nucleic Acid Preparation, Tijssen, ed. Elsevier, N.Y. (1993).

Другие пригодные для использования средства получения и манипулирования с нуклеиновыми кислотами, используемые для осуществления способов по настоящему изобретению, представляет собой клонирование из геномных образцов и, если это желательно, скрининг и повторное клонирование вставок, выделенных или амплифицированных, например, геномных клонов или клонов цДНК. Источники нуклеиновых кислот, используемые в способах по настоящему изобретению, включают библиотеки геномной или цДНК, содержащейся, например, в искусственных хромосомах млекопитающих (MAC), см., например, патенты США № 5721118; 6025155; в искусственных хромосомах человека, см., например, Rosenfeld (1997), Nat. Genet. 15:333-335; в искусственных хромосомах дрожжей (YAC); в бактериальных искусственных хромосомах (ВАС); искусственных хромосомах Р1, см., например, Woon (1998), Genomics 50:306-316; векторы, полученные с помощью Р1 (РАС), см., например, Kern (1997), Biotechniques 23:120-124; космиды, рекомбинантные вирусы, фаги или плазмиды.

В одном из аспектов нуклеиновая кислота, кодирующая полипептид по настоящему изобретению, собирается в соответствующей фазе с лидерной последовательностью, способной направлять секретирование полученного после трансляции полипептида или его фрагмента.

Настоящее изобретение относится к белкам слияния и нуклеиновым кислотам, кодирующим их. Полипептид по настоящему изобретению может сливаться с гетерологичным пептидом или полипептидом, таким как идентификационные пептиды N-окончания, которые придают желаемые характеристики, такие как увеличение стабильности или упрощение очистки. Пептиды и полипептиды по настоящему изобретению могут также синтезироваться и экспрессироваться как белки слияния с одним или несколькими дополнительными доменами, связанными с ним, например, для производства более иммуногенного пептида, для более легкого выделения рекомбинантно синтезированного пептида, для идентификации и выделения антител и В-клеток, экспрессирующих антител и т.п. Домены, облегчающие детекцию и очистку, включают в себя, например, пептиды, хелатирующие металлы, такие как полигистидиновые пути и модули гистидин-триптофан, которые делают возможным очистку на иммобилизованных металлах, домены белка А, которые делают возможной очистку на иммобилизованном иммуноглобулине, и домен, используемый в системе очистки на основе расширения FLAGS/афинности (Immunex Corp, Seattle WA). Включение расщепляемых линкерных последовательностей, таких как фактор Ха или энтерокиназа (Invitrogen, San Diego CA), между доменом очистки и пептидом или полипептидом, составляющим мотив, облегчает очистку. Например, вектор экспрессии может включать последовательность нуклеиновых кислот, кодирующую эпитоп, связанную с шестью гистидиновыми остатками, затем с тиоредоксином и сайтом энтерокиназного расщепления (см., например, Williams (1995), Biochemistry 34:1787-1797; Dobeli (1998), Protein Expr. Purif. 12:404-414). Гистидиновые остатки облегчают детекцию и очистку, в то время как сайт энтерокиназного расщепления обеспечивает средства для очистки эпитопа от остального белка слияния. Методики, относящиеся к векторам, кодирующим белки слияния, и к применениям белков слияния, хорошо описаны в научной и патентной литературе, см., например, Kroll (1993), DNA Cell. Biol., 12:441-53.

Контрольные последовательности транскрипции и трансляции.

Настоящее изобретение относится к последовательностям нуклеиновых кислот (например, ДНК) по настоящему изобретению, функционально связанным с контрольной последовательностью (последовательностями) экспрессии (например, транскрипции или трансляции), например с промоторами или энхансерами, для направления или модулирования синтеза/экспрессии РНК. Контрольная последовательность экспрессии может находиться в векторе экспрессии. Примерные бактериальные промоторы включают lacI, lacZ, Т3, Т7, gpt, лямбда PR, PL и trp. Примерные эукариотические промоторы включают непосредственный ранний CMV, тимидинкиназу HSV, ранний и поздний SV40, LTR от ретровируса и металлотионеин I мыши.

Как здесь используется, термин "промотор" включает все последовательности, способные приводить в действие транскрипцию кодирующей последовательности в клетке, например в клетке растения или животного. Таким образом, промоторы, используемые в конструктах по настоящему изобретению, включают цис-действующие контрольные элементы транскрипции и регуляторные последовательности, которые вовлечены в регуляцию или модулирование временного графика и/или скорости транскрипции гена. Например, промотор может представлять собой цис-действующий контрольный элемент транскрипции, содержащий энхансер, промотор, терминатор транскрипции, источник репликации, последовательность хромосомного встраивания, 5' и 3' нетранслируемые области, или интронную последовательность, которые вовлечены в регуляцию транскрипции. Эти цис-действующие последовательности могут взаимодействовать с белками или другими биологическими молекулами для осуществления (включения/выключения, регуляции, модулирования и т.п.) транскрипции. "Конститутивные" промоторы представляют собой такие, которые приводят в действие экспрессию непрерывно при большинстве условий окружающей среды и состояний развития или дифференциации клеток. "Индуцируемые" или "регулируемые" промоторы направляют экспрессию нуклеиновой кислоты по настоящему изобретению под влиянием условий окружающей среды или условий развития. Примеры условий окружающей среды, которые могут воздействовать на транскрипцию посредством индуцируемых промоторов, включают анаэробные условия, повышенную температуру, засуху или присутствие света.

"Ткань-специфичные" промоторы представляют собой контрольные элементы транскрипции, которые являются активными только в конкретных клетках, или тканях, или органах, например, в растениях или животных. Ткань-специфичная регуляция может достигаться посредством определенных внутренних факторов, которые обеспечивают то, что экспрессируются гены, кодирующие белки, специфичные к данной ткани. Такие факторы, как известно, существуют в млекопитающих и растениях, с тем, чтобы сделать возможным развитие конкретных тканей.

Промоторы, пригодные для экспрессирования полипептидов в бактериях, включают промоторы Е.coli lac или trp, промотор lacI, промотор lacZ, промотор Т3, промотор Т7, промотор gpt, промотор лямбда PR, промотор лямбда PL, промоторы из оперонов, кодирующих гликолитические ферменты, такие как 3-фосфоглицераткиназа (PGK) и промотор кислой фосфатазы. Эукариотические промоторы включают промежуточный ранний промотор CMV, промотор тимидинкиназы HSV, промоторы теплового шока, ранний и поздний промотор SV40, LTR из ретровирусов и промотор металлотионеин-I мыши. Также могут использоваться другие промоторы, известные в качестве контролирующих экспрессию генов в прокариотичесих или эукариотических клетках или в их вирусах. Промоторы, пригодные для экспрессирования полипептида или его фрагментов в бактериях, включают промоторы Е.coli lac или trp, промотор lacI, промотор lacZ, промотор Т3, промотор T1, промотор gpt, промотор лямбда P R , промотор лямбда P L , промоторы из оперонов, кодирующих гликолитические ферменты, такие как 3-фосфоглицерат киназы (PGK), и промотор кислую фосфатазу. Промоторы грибков включают промотор α-фактора. Эукариотические промоторы включают промежуточный ранний CMV промотор, промотор тимидинкиназы HSV, промоторы теплового шока, ранний и поздний промотор SV40, LTR из ретровирусов и промотор металлотионеин-I мыши. Также могут использоваться другие промоторы, которые, как известно, контролируют экспрессию генов в прокариотических или эукариотических клетках или в их вирусах.

Ткань-специфичные промоторы растений.

Настоящее изобретение относится к кассетам экспрессии, которые могут экспрессироваться ткань-специфичным образом, например которые могут экспрессировать фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению ткань-специфичным образом. Настоящее изобретение также относится к растениям или семенам, которые экспрессируют фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу по настоящему изобретению ткань-специфичным образом. Ткань-специфичность может быть специфичной к семенам, специфичной к стволу, специфичной к листьям, специфичной к корням, специфичной к плодам и т.п.

Термин "растения" включает цельные растения, части растений (например, листья, стволы, цветы, корни и т.п.), протопласты растений, семена и клетки растений и их потомство. Класс растений, которые могут использоваться в способе по настоящему изобретению, как правило, является таким же широким, как и класс высших растений, совместимых с методиками трансформации, включая покрытосеменные (однодольные и двудольные растения), а также голосеменные. Он включает растения с разнообразными уровнями плоидности, включая полиплоидные, диплоидные, гаплоидные и гемизиготные состояния. Как здесь используется, термин "трансгенное растение" включает растения или клетки растений, в которые может быть вставлена гетерологичная последовательность нуклеиновых кислот, например нуклеиновые кислоты и различные рекомбинантные конструкты (например, кассеты экспрессии) по настоящему изобретению.

В одном из аспектов конститутивный промотор, такой как промотор CaMV35S, может использоваться для экспрессии в конкретные части растения, или семя, или по всему растению. Например, для суперэкспрессии может использоваться фрагмент промотора растения, который будет использоваться для непосредственной экспрессии нуклеиновой кислоты в некоторые или во все ткани растения, например регенерированного растения. Такие промоторы упоминаются здесь как "конститутивные" промоторы и являются активными при большинстве условий окружающей среды и состояний развития или дифференциации клеток. Примеры конститутивных промоторов включают область инициирования транскрипции вирус мозаики цветной капусты (CaMV)35S, 1'- или 2'-промотор, полученный из Т-ДНК Agrobacterium tumefaciens, и другие области инициирования транскрипции из различных генов растений, известных специалистам в данной области. Такие гены включают в себя, например, АСТ11 из Arabidopsis (Huang (1996), Plants Mol Biol. 33:125-139); Cat3 из Arabidopsis (GenBank No. U43147, Zhong (1996), Mol. Gen. Genet. 251:196-203); ген, кодирующий стеароилацильный носитель протеиндесатуразу, из Brassica napus (Genbank No. X74782, Solocombe (1994), Plant Physiol. 104:1167-1176); Gpc1 из маиса (GenBank No. X15596; Martinez (1989), J. Mol. Biol 208:551-565); Gpc2 из маиса (GenBank No. U45855, Manjunath (1997), Plant Mol. Biol. 33:97-112); промоторы растений, описанные в патентах США № 4962028; 5633440.

Настоящее изобретение использует ткань-специфичные или конститутивные промоторы, полученные из вирусов, которые могут включать в себя, например, субгеномный промотор тобамовируса (Kumagai (1995), Proc. Natl. Acad. Sci. USA 92:1679-1683); тунгро-вирус продолговатого риса (RTBV), который реплицируется только в флоемных клетках в инфицированных растениях риса, с его промотором, который приводит в действие сильную экспрессию флоем-специфичного репортерного гена; промотор вируса мозаики жилок маниоки (CVMV), с самой высокой активностью в сосудистых элементах, в клетках мезофилла листьев и в кончиках корней (Verdaguer (1996), Plant Mol. Biol. 31:1129-1139).

В одном из аспектов промотор растения направляет экспрессию нуклеиновой кислоты, экспрессирующей фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, в конкретной ткани, органе или типе клеток (т.е. ткань-специфичные промоторы), или может находиться иным образом под более точным контролем со стороны окружающей среды или развития, или под контролем индуцируемого промотора. Примеры условий окружающей среды, которые могут влиять на транскрипцию, включают анаэробные условия, повышенную температуру, присутствие света или опыление химикалиями/гормонами. Например, настоящее изобретение включает индуцируемый засухой промотор маиса (Busk (1997), выше); индуцируемый холодом и засухой, и высокой концентрацией соли промотор из картофеля (Kirch (1997), Plant Mol. Biol. 33:897, 909).

В одном из аспектов ткань-специфичные промоторы промотируют транскрипцию только в определенных временных рамках стадии развития в этой ткани. См., например, Blazquez (1998), Plant Cell 10:791-800, характеризующую промотор гена LEAFY Arabidopsis. См. также Cardon (1997), Plant J. 12:367-77, описывающую фактор транскрипции SPL3, который распознает консервативный мотив последовательности в промоторной области гена API идентичности цветочное меристемы A. thaliana; и Mandel (1995), Plant Molecular Biology, Vol. 29, p. 995-1004, описывающую промотор меристемы eIF4. Могут использоваться ткань-специфичные промоторы, которые являются активными в течение всего жизненного цикла конкретной ткани. В одном из аспектов нуклеиновые кислоты по настоящему изобретению функционально связываются с промотором активным, прежде всего, только в клетках хлопковых волокон. В одном из аспектов нуклеиновые кислоты по настоящему изобретению функционально связываются с промотором, активным, прежде всего, на стадиях удлинения клеток волокон хлопка, например, как описано Rinehart (1996), выше. Нуклеиновые кислоты могут функционально связываться с промотором гена Fb12A, который должен преимущественно экспрессироваться в клетках волокон хлопка (Ibid). См. также John (1997), Proc. Natl. Acad. Sci. USA 89:5769-5773; John, et al., патенты США № 5608148 и 5602321, описывающие промоторы, специфичные к волокнам хлопка, и способы конструирования трансгенных растений хлопка. Специфичные к корням промоторы могут также использоваться для экпрессирования нуклеиновых кислот по настоящему изобретению. Примеры специфичных к корням промоторов включают промотор гена алкогольдегидрогеназы (DeLisle (1990), Int. Rev. Cytol. 123:39-60). Другие промоторы, которые могут использоваться для экпрессирования нуклеиновых кислоты по настоящему изобретению, включают в себя, например, овулярно-специфичные, эмбрио-специфичные, эндосперм-специфичные, специфичные к наружным покровам, специфичные к семенной оболочке промоторы, или некоторое их сочетание; специфичный к листьям промотор (см., например, Busk (1997), Plant J. 11:1285-1295, описывающую специфичный к листьям промотор в маисе); промотор ORF13 из Agrobacterium rhizogenes (который демонстрирует высокую активность в корнях, см., например, Hansen (1997), выше); специфичный к пыльце маиса промотор (см., например, Guerrero (1990), Mol. Gen. Genet. 224:161-168); может использоваться промотор томатов, активный во время созревания плодов, старения и опадения листьев, и, до меньшей степени, цветов, (см., например, Blume (1997), Plant J. 12:731-746); специфичный к пестику промотор гена SK2 картофеля (см., например, Ficker (1997), Plant Mol. Biol. 35:425-431); ген Blec4 из груши, который является активным в эпидермальной ткани вегетативных и в верхушках цветоножек в трансгенной люцерне, делая его полезным инструментом для нацеливания экспрессии посторонних генов в эпидермальном слое активно растущих всходов или волокон; овулярно-специфичный ген BEL1 (см., например, Reiser (1995), Cell 83:735-742, GenBank No. U39944); и/или промотор, Klee, патент США № 5589583, описывающем промоторную область растения, способные придавать высокие уровни транскрипции меристематической ткани и/или быстро делящимся клеткам.

В одном из аспектов промоторы растений, которые индуцируются при экспонировании для гормонов растений, таких как ауксины, используются для экпрессирования нуклеиновых кислот по настоящему изобретению. Например, настоящее изобретение может использовать чувствительные к ауксинам элементы фрагмента промотора E1 (AuxREs) в сое (Glicine max L.) (Liu (1997), Plant Physiol. 115:397-407); чувствительный к ауксинам промотор GST6 Arabidopsis (также чувствительный к салициловой кислоте и перекиси водорода) (Chen (1996), Plant J. 10:955-966); индуцируемый ауксинами промотор parC из табака (Sakai (1996), 37:906-913); чувствительный к биотину растений элемент (Streit (1997), Mol. Plant Microbe Interact. 10:933-937); и промотор, чувствительный к гормону стресса абсцизиновой кислоте (Sheen (1996), Science 274:1900-1902).

Нуклеиновые кислоты по настоящему изобретению могут также функционально связываться с промоторами растений, которые индуцируются при экспонировании для химических реагентов, которые могут наноситься на растения, таких как гербициды или антибиотики. Например, может использоваться промотор In2-2 маиса, активируемый гербицидными средствами защиты на основе бензолсульфонамида (De Veylder (1997), Plant Cell Physiol. 38:568-577); нанесение различных гербицидных средств защиты индуцирует различные паттерны экспрессии генов, включая экспрессию в корнях, гидатода и верхушечной меристеме всходов. Кодирующая последовательность может находиться под контролем, например, тетрациклин-индуцируемого промотора, например, как описано для трансгенных растений табака, содержащих ген аргининдекарбоксилазы Avena sativa L. (овса) (Masgrau (1997), Plant J. 11:465-473); или элемента, чувствительного к салициловой кислоте (Stange (1997), Plant J. 11:1315-1324). При использовании промоторов, индуцируемых химически (например, гормонами или пестицидами), т.е. промотора, чувствительного к химикалию, который может наноситься на трансгенное растение в поле, экспрессия полипептида по настоящему изобретению может индуцироваться на конкретной стадии развития растения. Таким образом, настоящее изобретение также относится к трансгенным растениям, содержащим индуцируемый ген, кодирующий полипептиды по настоящему изобретению, у которых набор хозяев ограничивается целевыми видами растений, таких как кукуруза, рис, ячмень, соя, томаты, пшеница, картофель или другие культуры, индуцируемыми на любой стадии развития культуры.

Специалист в данной области заметит, что ткань-специфичный промотор растения может приводить в действие экспрессию функционально связанных последовательностей в тканях, отличных от целевой ткани. Таким образом, в одном из аспектов ткань-специфичный промотор представляет собой такой, который приводит в действие экспрессию преимущественно в целевой ткани или типе клеток, но может также приводить к некоторой экспрессии также и в других тканях.

Нуклеиновые кислоты по настоящему изобретению могут также функционально связываться с промоторами растений, которые индуцируются при экспонировании для химических реагентов. Эти реагенты включают в себя, например, гербициды, синтетические ауксины, или антибиотики, которые могут наноситься, например распыляться, на трансгенные растения. Индуцируемая экспрессия нуклеиновых кислот, производящих фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению даст возможность растениеводу выбирать растения с оптимальной экспрессией фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, и/или активностью. Таким образом, может контролироваться развитие частей растения. Таким путем настоящее изобретение предусматривает средства для облегчения сбора урожая растений и частей растений. Например, в различных вариантах осуществления используется промотор маиса In2-2, активируемый гербицидными средствами защиты на основе бензолсульфонамида (De Veylder (1997), Plant Cell Physiol. 38:568-577); нанесение различных средств защиты индуцирует различные паттерны экспрессии генов, включая экспрессию в корнях, гидатодах и в верхушечной меристеме всходов. Кодирующие последовательности по настоящему изобретению находятся также под контролем промотора, индуцируемого тетрациклином, например, как описано для трансгенных растений табака, содержащих ген аргининдекарбоксилазы Avena sativa L. (овса) (Masgrau (1997), Plant J. 11:465-473); или элемента, чувствительного к салициловой кислоте (Stange (1997), Plant J. 11:1315-1324).

В некоторых аспектах соответствующая экспрессия полипептида может потребовать присутствия области полиаденилирования на 3'-окончании кодирующей области. Область полиаденилирования может быть получена из природного гена, из различных генов других растений (или животных или иного) или из генов Agrobacterial Т-ДНК.

Векторы экспрессии и носители клонирования.

Настоящее изобретение относится к векторам экспрессии и носителям клонирования, содержащим нуклеиновые кислоты по настоящему изобретению, например, последовательности, кодирующие ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению. Векторы экспрессии и носители клонирования по настоящему изобретению могут включать вирусные частицы, бакуловирус, фаг, плазмиды, фагемиды, космиды, фосмиды, бактериальные искусственные хромосомы, вирусную ДНК (например, вакцинии, аденовируса, вируса оспы птиц, ложного рабдовируса и производных SV40), искусственные хромосомы на основе Р1, плазмиды дрожжей, искусственные хромосомы дрожжей и любые другие векторы, специфичные к конкретным хозяевам, представляющим интерес (таким как bacillus Aspergillus и дрожжи). Векторы по настоящему изобретению могут включать последовательности хромосомальной, нехромосомальной и синтетической ДНК. Большие количества соответствующих векторов известны специалистам в данной области и являются коммерчески доступными. Примерные векторы включают в себя бактериальные векторы pQE ™ (Qiagen), плазмиды pBLUESCRIPT ™, векторы pNH (векторы лямбда-ZAP (Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); эукариотические: pXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia)). Однако может использоваться любая другая плазмида или другой вектор, постольку, поскольку они могут реплицироваться и являются жизнеспособными в хозяине. В настоящем изобретении могут использоваться векторы с малым количеством копирований или с высоким количеством копирований. "Плазмиды" могут быть коммерчески доступными, публично доступными на неограниченной основе или могут конструироваться из доступных плазмид в соответствии с опубликованными процедурами. Плазмиды, эквивалентные тем, которые описаны здесь, известны в данной области и будут очевидны специалисту в данной области.

Вектор экспрессии может содержать промотор, сайт связывания рибосомы для инициирования трансляции и терминатор транскрипции. Вектор может также включать соответствующие последовательности для экспрессии с амплификацией. Векторы экспрессии млекопитающих могут содержать источник репликации, любые необходимые сайты связывания рибосом, сайт полиаденилирования, донорные и акцепторные сайты сплайсирования, последовательности завершения транскрипции, и 5' фланкирующие нетранскрибируемые последовательности. В некоторых аспектах последовательности ДНК, полученные из сайтов сплайсирования и полиаденилирования SV40, могут использоваться для создания необходимых нетранскрибируемых генетических элементов.

В одном из аспектов векторы экспрессии содержат один или несколько селектируемых маркерных генов, чтобы сделать возможной селекцию клеток-хозяев, содержащих вектор. Такие селектируемые маркеры включают гены, кодирующие дигидрофолиатредуктазу, или гены, придающие стойкость к неомицину культуре эукариотических клеток, гены, придающие стойкость к тетрациклину или ампициллину Е.coli, и ген TRP1 S. cerevisiae. Промоторные области могут выбираться из любого желаемого гена, используя векторы хлорамфениколтрансферазы (CAT) или другие векторы с селектируемыми маркерами.

В одном из аспектов векторы для экспрессирования полипептида или его фрагмента в эукариотических клетках содержат энхансеры для увеличения уровней экспрессии. Энхансеры представляют собой цис-действующие элементы ДНК, которые могут составлять примерно от 10 примерно до 300 bp в длину. Они могут действовать на промотор с повышением его транскрипции. Примерные энхансеры включают энхансер SV40 на поздней стороне источника репликации, bp 100-270, энхансер раннего промотора цитомегаловируса, энхансер полиомы на поздней стороне источника репликации и энхансеры аденовируса.

Последовательность нуклеиновых кислот может вставляться в вектор посредством различных процедур. Как правило, последовательность лигируется в желаемом положении в векторе, после расщепления вставки и вектора с помощью соответствующих рестрикционных эндонуклеаз. Альтернативно, могут лигироваться тупые концы как во вставке, так и в векторе. В данной области известны различные методики клонирования, например, как описано в Ausubel и Sambrook. Такие и иные процедуры, как предполагается, находятся в рамках знаний специалиста в данной области.

Вектор может находиться в форме плазмиды, вирусной частицы или фага. Другие векторы включают хромосомальные, нехромосомальные и синтетические последовательности ДНК, производные SV40; бактериальные плазмиды, ДНК фага, бакуловирус, плазмиды дрожжей, векторы, полученные из сочетаний плазмид и ДНК фага, ДНК вирусов, таких как вакциния, аденовирус, вирус fowl pox, и ложный рабдовирус. Различные векторы клонирования и экспрессии для использования с прокариотическими и эукариотическими хозяевами описаны, например, Sambrook.

Конкретные бактериальные векторы, которые могут использоваться, включают коммерчески доступные плазмиды, содержащие генетические элементы хорошо известного вектора клонирования pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Sweden), GEM1 (Promega Biotec, Madison, WI, USA), pQE70, pQE60, pQE-9 (Qiagen), pD 10, psiX174 pBLUESCRIPT II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pKK233-3, DR540, pRIT5 (Pharmacia), pKK232-8 и рСМ7. Конкретные эукариотические векторы включают pSV2CAT, pOG44, pXT1, pSG (Stratagene) pSVK3, pBPV, pMSG и pSVL (Pharmacia). Однако может использоваться любой другой вектор, постольку-поскольку он может реплицироваться и является жизнеспособным в клетке-хозяине.

Нуклеиновые кислоты по настоящему изобретению могут экспрессироваться в кассетах, векторах или вирусах экспрессии и нестационарно или стабильно экспрессироваться в клетках и семенах растений. Одна из примерных систем нестационарной экспрессии использует эписомальные системы экспрессии, например, вирусную РНК вируса мозаики цветной капусты (CaMV), генерируемую в ядре посредством транскрипции эписомальной мини-хромосомы, содержащей суперспиральную ДНК, см., например, Covey (1990), Proc. Natl. Acad. Sci. USA 87:1633-1637. Альтернативно, кодирующие последовательности, т.е. цельные последовательности или их субфрагменты по настоящему изобретению, могут вставляться в геном клетки растения хозяина, становясь интегральной частью хромосомальной ДНК хозяина. Таким образом, могут экспрессироваться смысловые или антисмысловые транскрипты. Вектор, содержащий последовательности (например, промоторы или кодирующие области) из нуклеиновых кислот по настоящему изобретению, может содержать маркерный ген, который придает селектируемый фенотип клетке растения или семени. Например, маркер может кодировать стойкость к биоциду, например стойкость к антибиотику, такую как стойкость к канамицину, G418, блеомицину, гигромицину, или стойкость к гербициду, такую как стойкость к хлорсульфорону или Basta.

Векторы экспрессии, способные экспрессировать нуклеиновые кислоты и белки в растениях, хорошо известны в данной области и могут включать в себя, например, векторы из Agrobacterium sp., вируса картофеля X (см., например, Angell (1997), EMBO J. 16:3675-3684), вируса табачной мозаики (см., например, Casper (1996), Ген 173:69-73), вируса кустистой карликовости томатов (см., например, Hillman (1989), Virology 169:42-50), вируса гравировки табака (см., например, Dolja (1997), Virology 234:243-252), вируса золотой мозаики бобов (см., например, Morinaga (1993), Microbiol Immunol. 37:471-476), вируса мозаики цветной капусты (см., например, Cecchini (1997), Mol. Plant Microbe Interact. 10:1094-1101), транспонируемого элемента маиса Ac/Ds (см., например, Rubin (1997), Mol. Cell. Biol. 17:6294-6302; Kunze (1996), Curr. Top. Microbiol. Immunol. 204:161-194), и транспонируемого элемента суппрессора гена-мутатора (Spm) маиса (см., например, Schlappi (1996), Plant Mol. Biol. 32:717-725); и их производные.

В одном из аспектов вектор экспрессии может иметь две системы репликации, чтобы дать возможность для его поддержания в двух организмах, например в клетках млекопитающих или насекомых, для экспрессии, и в прокариотическом хозяине, для клонирования и амплификации. Кроме того, для встраиваемых векторов экспрессии вектор экспрессии может содержать по меньшей мере одну последовательность, гомологичную геному клетки-хозяина. Он может содержать две гомологичные последовательности, которые фланкируют конструкт экспрессии. Встраиваемый вектор может быть направлен на конкретный локус в клетке-хозяине посредством выбора соответствующей гомологичной последовательности для включения в вектор. Конструкты для встраиваемых векторов хорошо известны в данной области.

Векторы экспрессии по настоящему изобретению могут также содержать селектируемый маркерный ген для того, чтобы сделать возможной селекцию бактериальных штаммов, которые трансформируются, например генов, которые делают бактерии стойкими к лекарственным средствам, таким как ампициллин, хлорамфеникол, эритромицин, канамицин, неомицин и тетрациклин. Селектируемые маркеры могут также включать биосинтетические гены, такие как гены в путях биосинтеза гистидина, триптофана и лейцина.

Последовательность ДНК в векторе экспрессии функционально связывается с соответствующей контрольной последовательностью (последовательностями) (промотором) экспрессии для направления синтеза РНК. Конкретные наименования бактериальных промоторов включают lacI, lacZ, Т3, T7, gpt, лямбда P R , P L и trp. Эукариотические промоторы включают промежуточный ранний CMV, тимидинкиназу HSV, ранний и поздний SV40, LTR от ретровируса и металлотионеин-I мыши. Выбор соответствующего вектора и промотора хорошо известен специалистам в данной области. Вектор экспрессии также содержит сайт связывания рибосомы для инициирования трансляции и терминатор транскрипции. Вектор может также содержать соответствующие последовательности для экспрессии с амплификацией. Промоторные области могут выбираться из любого желаемого гена, используя векторы хлорамфениколтрансферазы (CAT) или другие векторы с селектируемыми маркерами. В дополнение к этому векторы экспрессии в одном из аспектов содержат один или несколько селектируемых маркерных генов для обеспечения фенотипического признака для селекции трансформированных клеток-хозяев, таких как стойкость культуры эукариотических клеток к дигидрофолиатредуктазе или неомицину, или таких как стойкость Е.coli к тетрациклину или ампициллину.

Векторы экспрессии млекопитающих могут также содержать источник репликации, любые необходимые сайты связывания рибосом, сайт полиаденилирования, донорные и акцепторные сайты сплайсирования, последовательности завершения транскрипции и 5' фланкирующие нетранскрибируемые последовательности. В некоторых аспектах последовательности ДНК, полученные из сайтов сплайсирования и полиаденилирования SV40, могут использоваться для получения необходимых нетранскрибируемых генетических элементов.

Векторы для экспрессирования полипептида или его фрагмента в эукариотических клетках могут также содержать энхансеры для увеличения уровней экспрессии. Энхансеры представляют собой цис-действующие элементы ДНК, обычно примерно от 10 примерно до 300 bp в длину, которые действуют на промотор, с увеличением его транскрипции. Примеры включают энхансер SV40 на поздней стороне источника репликации bp 100-270, энхансер раннего промотора цитомегаловируса, энхансер полиомы на поздней стороне источника репликации и энхансеры аденовируса.

В дополнение к этому векторы экспрессии могут содержать один или несколько селектируемых маркерных генов для того, чтобы сделать возможной селекцию клеток-хозяев, содержащих вектор. Такие селектируемые маркеры включают гены, кодирующие стойкость к дигидрофолиатредуктазе, или гены, придающие стойкость к неомицину культуре эукариотических клеток, гены, придающие стойкость к тетрациклину или ампициллину E.coli, и ген TRP1 S. cerevisiae.

В некоторых аспектах нуклеиновая кислота, кодирующая один из полипептидов по настоящему изобретению, или фрагменты, содержащие по меньшей мере примерно 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 либо более ее последовательных аминокислот, собирается в соответствующей фазе с лидерной последовательностью, способной направлять секретирование транслированного полипептида или его фрагмента. В одном из аспектов нуклеиновая кислота может кодировать полипептид слияния, в котором один из полипептидов по настоящему изобретению или фрагменты, содержащие по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 либо более его последовательных аминокислот, сливаются с гетерологичными пептидами или полипептидами, такими как идентификационные пептиды N-окончания, которые придают желаемые характеристики, такие как повышенная стабильность или упрощение очистки.

Соответствующая последовательность ДНК может вставляться в вектор с помощью различных процедур. Как правило, последовательность ДНК лигируется с желаемым положением в векторе после расщепления вставки и вектора с помощью соответствующих рестрикционных эндонуклеаз. Альтернативно, тупые концы как вставки, так и вектора могут лигироваться. Различные методики клонирования описываются в Ausubel et al. Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997 и Sambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989). Такие и иные процедуры, как предполагается, находятся в рамках знаний специалиста в данной области.

Вектор может находиться, например, в форме плазмиды, вирусной частицы или фага. Другие векторы включают последовательности хромосомальной, нехромосомальной и синтетической ДНК, производные SV40; бактериальные плазмиды, ДНК фага, бакуловирус, плазмиды дрожжей, векторы, полученные из сочетаний плазмид и ДНК фага, ДНК вирусов, таких как вакциния, аденовирус, вирус оспы птиц и ложный рабдовирус. Различные векторы клонирования и экспрессии для использования с прокариотическими и эукариотическими хозяевами описаны в Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor, N.Y. (1989).

Клетки-хозяева и трансформированные клетки.

Настоящее изобретение также относится к трансформированной клетке, содержащей последовательность нуклеиновых кислот по настоящему изобретению, например последовательность, кодирующую фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению или вектор по настоящему изобретению. Клетка-хозяин может представлять собой любую из клеток-хозяев, известных специалистам в данной области, включая прокариотические клетки, эукариотические клетки, такие как бактериальные клетки, клетки грибков, клетки дрожжей, клетки млекопитающих, клетки насекомых или клетки растений. Примерные бактериальные клетки включают любые виды из Streptomyces, Staphylococcus ox Bacillus, или примерные виды Е.coli, Bacillus subtilis, Bacillus cereus, Salmonella typhimurium. Примерные клетки насекомых включают любые виды из Spodoptera или Drosophila, включая Drosophila S2 и Spodoptera Sf9. Примерные клетки животных включают СНО, COS или меланому Bowes или любую линию клеток мыши или человека. Выбор соответствующего хозяина находится в пределах умений специалиста в данной области. Методики трансформирования различных видов высших растений хорошо известны и описаны в технической и научной литературе. См., например, Weising (1988), Ann. Rev. Genet. 22:421-477; патент США № 5750870.

Вектор может вводиться в клетки-хозяева с использованием любой из разнообразных методик, включая трансформирование, трансфицирование, трансдукцию, вирусную инфекцию, генные пушки или Ti-медиируемый перенос гена. Конкретные способы включают кальций фосфатное трансфицирование, DEAE-декстран-медиируемое трансфицирование, липофицирование, или электропорообразование (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology (1986)).

В одном из аспектов нуклеиновые кислоты или векторы по настоящему изобретению вводятся в клетки для скрининга, таким образом, нуклеиновые кислоты попадают в клетки способом, пригодным для последующего экспрессирования нуклеиновой кислоты. Способ введения диктуется по большей части целевым типом клетки. Примерные способы включают преципитацию с помощью CaPO 4 , липосомное слияние, липофицирование (например, LIPOFECTIN ™), электропорообразование, вирусную инфекцию и т.п. Кандидаты из нуклеиновых кислот могут стабильно встраиваться в геном клетки-хозяина (например, с помощью введения ретровируса) или могут существовать либо нестационарно, либо стабильно, в цитоплазме (т.е. посредством использования традиционных плазмид, используя стандартные регуляторные последовательности, маркеры селекции и т.п.). Поскольку многие фармацевтически важные виды скрининга требуют клеток мишеней человека или модельных млекопитающих, могут использоваться ретровирусные векторы, способные трансфицировать такие мишени.

Где это необходимо, полученные с помощью генной инженерии клетки-хозяева могут культивироваться в обычных питательных средах, модифицированных соответствующим образом для активирования промоторов, селекции трансформантов или амплифицирования генов по настоящему изобретению. После трансформирования соответствующего штамма хозяина и роста штамма хозяина до соответствующей плотности клеток выбранный промотор может индуцироваться с помощью соответствующих средств (например, сдвига температуры или химического индуцирования) и клетки могут культивироваться в течение дополнительного периода времени, чтобы дать им возможность для продуцирования желаемого полипептида или его фрагмента.

Клетки могут харвестироваться посредством центрифугирования, разрушаться с помощью физических или химических средств, и полученный сырой экстракт удерживается для дальнейшей очистки. Микробные клетки, используемые для экспрессирования белков, могут разрушаться с помощью любого удобного способа, включая циклы заморозки-оттаивания, сонификацию, механическое разрушение, или использование агентов, лизирующих клетки. Такие способы хорошо известны специалистам в данной области. Экспрессируемый полипептид или его фрагмент может извлекаться и очищаться от рекомбинантных культур клеток посредством способов, включающих преципитацию с помощью сульфата аммония или этанола, кислотную экстракцию, анионо- или катионообменную хроматографию, хроматографию на фосфоцеллюлозе, хроматографию гидрофобных взаимодействий, афинную хроматографию, хроматографию на гидроксилапатите и хроматографию на лектине. Стадии рефолдинга белков могут использоваться, по необходимости, при завершении конфигурирования полипептида. Если это желательно, высокоэффективная жидкостная хроматография (ВЭЖХ) может использоваться для конечных стадий очистки.

Конструкты в клетках-хозяевах могут использоваться обычным способом для получения генного продукта, кодируемого рекомбинантной последовательностью. В зависимости от хозяина, используемого в процедуре рекомбинантного продуцирования, полипептиды, производимые клетками-хозяевами, содержащими вектор, могут быть гликозилированными или могут быть негликозилированными. Полипептиды по настоящему изобретению могут также содержать или не содержать начальный метиониновый остаток аминокислоты.

Бесклеточные системы трансляции могут также использоваться для получения полипептида по настоящему изобретению. Безклеточные системы трансляции могут использовать m-РНК, полученные после транскрипции из конструкта ДНК, содержащего промотор, функционально связанный с нуклеиновой кислотой, кодирующей полипептид или его фрагмент. В некоторых аспектах конструкт ДНК может линеаризоваться перед осуществлением реакции транскрипции in vitro. Полученная путем транскрипции m-РНК затем инкубируется с помощью соответствующего безклеточного трансляционного экстракта, такого как экстракт ретикулоцитов кролика, для получения желаемого полипептида или его фрагментов.

Векторы экспрессии могут содержать один или несколько селектируемых маркерных генов для обеспечения фенотипической признака для селекции трансформированных клеток-хозяев, такой как стойкость к дигидрофолиатредуктазе или неомицину у культуры эукариотических клеток, или такую как стойкость к тетрациклину или ампициллину у Е.coli.

Клетки-хозяева, содержащие полинуклеотиды, представляющие интерес, например нуклеиновые кислоты по настоящему изобретению, могут культивироваться в обычных питательных средах, модифицированных соответствующим образом для активирования промоторов, селекции трансформантов или амплификации генов. Условия в культуре, такие как температура, рН и т.п., являются такими же, как использовались ранее для клетки-хозяина, выбранной для экспрессии, и будут очевидны специалисту в данной области. Клоны, которые идентифицируются как имеющие удельную активность фермента, могут затем секвенироваться для идентификации последовательности полинуклеотидов, кодирующей фермент, имеющий повышенную активность.

Настоящее изобретение относится к способу суперэкспрессирования рекомбинантного фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, в клетке, содержащей вектор экспрессии, содержащий нуклеиновую кислоту по настоящему изобретению, например нуклеиновую кислоту, содержащую последовательность нуклеиновых кислот по меньшей мере примерно с 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более идентичностью последовательности с примерной последовательностью по настоящему изобретению в области по меньшей мере примерно из 100 остатков, где идентичности последовательностей определяются посредством анализа с помощью алгоритма сравнения последовательностей или посредством визуальной проверки, или нуклеиновую кислоту, которая гибридизируется при строгих условиях с последовательностью нуклеиновых кислот по настоящему изобретению. Суперэкспрессия может осуществляться с помощью любых средств, например использования промотора с высокой активностью, дицистронного вектора или посредством генной амплификации вектора.

Нуклеиновые кислоты по настоящему изобретению могут экспрессироваться или суперэкспрессироваться в любой системе экспрессии in vitro или in vivo. Любые системы культур клеток могут использоваться для экпрессирования или суперэкспрессирования рекомбинантного белка, включая культуры бактерий, насекомых, дрожжей, грибков или млекопитающих. Суперэкспрессия может осуществляться посредством соответствующего выбора промоторов, энхансеров, векторов (например, использования векторов репликонов, дицистронных векторов (см., например, Gurtu (1996), Biochem. Biophys. Res. Commun. 229:295-8)), сред, систем культур и т.п. В одном из аспектов амплификация генов с использованием маркеров селекции, например глютаминсинтетазы (см., например, Sanders (1987), Dev. Biol. Stand. 66:55-63), в клеточных системах используется для суперэкспрессии полипептидов по настоящему изобретению. Клетка-хозяин может представлять собой любую из клеток-хозяев, известных специалистам в данной области, включая прокариотические клетки, эукариотические клетки, клетки млекопитающих, клетки насекомых или клетки растений. Выбор соответствующего хозяина находится в рамках знаний специалиста в данной области.

Вектор может вводиться в клетки-хозяева с использованием любой из множества методик, включая трансформирование, трансфицирование, трансдукцию, вирусную инфекцию, генные пушки или Ti-медиируемый перенос гена. Конкретные способы включают кальций фосфатное трансфицирование, DEAE-декстран-медиируемое трансфицирование, липофицирование или электропорообразование (Davis, L., Dibner, M., Battey, I., Basic Methods in Molecular Biology (1986)).

Где это необходимо, полученные с помощью генной инженерии клетки-хозяева могут культивироваться в обычных питательных средах, модифицированных соответствующим образом для активирования промоторов, селекции трансформантов или амплификации генов по настоящему изобретению. После трансформирования соответствующего штамма хозяина и роста штамма хозяина до соответствующей плотности клеток выбранный промотор может индуцироваться с помощью соответствующих средств (например, сдвига температуры или химического индуцирования), и клетки могут культивироваться в течение дополнительного периода времени, чтобы дать им возможность для продуцирования желаемого полипептида или его фрагмента.

Клетки могут харвестироваться посредством центрифугирования, разрушаться с помощью физических или химических средств, и полученный сырой экстракт удерживается для дальнейшей очистки. Микробные клетки, используемые для экспрессирования белков, могут разрушаться с помощью любого удобного способа, включая циклы заморозки-оттаивания, сонификацию, механическое разрушение или использование агентов, лизирующих клетки. Такие способы хорошо известны специалистам в данной области. Экспрессируемый полипептид или его фрагмент может извлекаться и очищаться от рекомбинантных культур клеток посредством способов, включающих преципитацию с помощью сульфата аммония или этанола, кислотную экстракцию, анионо- или катионообменную хроматографию, хроматографию на фосфоцеллюлозе, хроматографию гидрофобных взаимодействий, афинную хроматографию, хроматографию на гидроксилапатите и хроматографию на лектине. Стадии рефолдинга белков могут использоваться, по необходимости, при завершении конфигурирования полипептида. Если это желательно, высокоэффективная жидкостная хроматография (ВЭЖХ) может использоваться для конечных стадий очистки.

Различные системы культур клеток млекопитающих могут также использоваться для экпрессирования рекомбинантного белка. Примеры систем экспрессии млекопитающих включают линии COS-7 фибробластов почек обезьян (описывается Gluzman, Cell, 23:175, 1981) и другие линии клеток, способные экспрессировать белки из совместимого вектора, такие как линии клеток С127, 3Т3, СНО, HeLa и BHK.

Конструкты в клетках-хозяевах могут использоваться обычным способом для получения генного продукта, кодируемого рекомбинантной последовательностью. В зависимости от хозяина, используемого в процедуре рекомбинантного продуцирования, полипептиды, производимые клетками-хозяевами, содержащими вектор, могут быть гликозилированными или могут быть негликозилированными. Полипептиды по настоящему изобретению могут также содержать или не содержать начальный метиониновый остаток аминокислоты.

Альтернативно, полипептиды по настоящему изобретению или фрагменты, содержащие по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 либо более их последовательных аминокислот, могут производиться синтетически с помощью обычных пептидных синтезаторов, например, как обсуждается ниже. В других аспектах фрагменты или части полипептидов могут использоваться для получения соответствующего полноразмерного полипептида посредством пептидного синтеза; следовательно, фрагменты могут использоваться в качестве промежуточных продуктов для получения полноразмерных полипептидов.

Безклеточные системы трансляции также могут использоваться для получения одного из полипептидов по настоящему изобретению или фрагментов, содержащих по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 либо более их последовательных аминокислот, с использованием m-РНК, полученных после транскрипции из конструкта ДНК, содержащего промотор, функционально связанный с нуклеиновой кислотой, кодирующей полипептид или его фрагмент. В некоторых аспектах конструкт ДНК может линеаризоваться перед осуществлением реакции транскрипции in vitro. Полученная путем транскрипции m-РНК затем инкубируется с помощью соответствующего безклеточного трансляционного экстракта, такого как экстракт ретикулоцитов кролика, для получения желаемого полипептида или его фрагментов.

Амплификация нуклеиновых кислот.

При осуществлении настоящего изобретения нуклеиновые кислоты по настоящему изобретению и нуклеиновые кислоты, кодирующие ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу по настоящему изобретению, или модифицированные нуклеиновые кислоты по настоящему изобретению могут репродуцироваться посредством амплификации, например, PCR. Амплификация также может использоваться для клонирования или модификации нуклеиновых кислот по настоящему изобретению. Таким образом, настоящее изобретение предусматривает пары последовательностей праймеров амплификации для амплификации нуклеиновых кислот по настоящему изобретению. Специалист в данной области может сконструировать пары последовательностей праймеров амплификации для любой части или для полной длины этих последовательностей.

В одном из аспектов настоящее изобретение относится к нуклеиновой кислоте, амплифицируемой посредством пары праймеров амплификации по настоящему изобретению, например пары праймеров, как отсчитывается от первого (5'), 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 либо более остатков нуклеиновых кислот по настоящему изобретению, и, как отсчитывается от первого (5'), из 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 либо более остатков комплементарной нити. Настоящее изобретение предусматривает пары последовательностей праймеров амплификации для амплификации нуклеиновой кислоты, кодирующей полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, где пара праймеров способна амплифицировать нуклеиновую кислоту, содержащую последовательность по настоящему изобретению, или ее фрагменты или субпоследовательности. Один из элементов пары последовательностей праймеров амплификации или каждый из них может содержать олигонуклеотид, содержащий по меньшей мере примерно от 10 до 50 или более последовательных оснований последовательности, или примерно 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 либо более последовательных оснований последовательности. Настоящее изобретение предусматривает пары праймеров амплификации, где пара праймеров содержит первый элемент, имеющий последовательность, которая создается, как отсчитывается от первого (5'), из 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 либо более остатков нуклеиновых кислот по настоящему изобретению, и второй элемент, имеющий последовательность, как отсчитывается от первого (5'), из 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 или 25 либо более остатков комплементарной нити первого элемента.

Настоящее изобретение предусматривает ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, генерируемые посредством амплификации, например полимеразной цепной реакции (PCR), с использованием пары праймеров амплификации по настоящему изобретению. Настоящее изобретение относится к способам получения фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы посредством амплификации, например посредством PCR, с использованием пары праймеров амплификации по настоящему изобретению. В одном из аспектов пара праймеров амплификации амплифицирует нуклеиновую кислоту из библиотеки, например генной библиотеки, такой как библиотека из окружающей среды.

Реакции амплификации могут также использоваться для количественного определения количества нуклеиновой кислоты в образце (такого как количество мессенджера в образце клеток), для мечения нуклеиновой кислоты (например, для нанесения ее на матрицу или блот), детекции нуклеиновой кислоты, или количественного определения количества конкретной нуклеиновой кислоты в образце. В одном из аспектов по настоящему изобретению амплифицируется мессенджер, выделенный из клетки или библиотеки цДНК.

Специалист в данной области может выбрать и сконструировать соответствующие праймеры амплификации олигонуклеотидов. Способы амплификации также хорошо известны в данной области, и включают в себя, например, цепную реакцию полимеразы, PCR (см., например, PCR PROTOCOLS, A GUIDE TO METHODS AND APPLICATIONS, ed. Innis, Academic Press, N.Y. (1990), и PCR STRATEGIES (1995), ed. Innis, Academic Press, Inc., N.Y., цепную реакцию лигазы (LCR) (см., например, Wu (1989), Genomics 4:560; Landegren (1988), Science 241:1077; Barringer (1990), Gene 89:117); транскрипционную амплификацию (см., например, Kwoh (1989), Proc. Natl. Acad. Sci. USA 86:1173) и самоподдерживающуюся репликацию последовательностей (см., например, Guatelli (1990), Proc. Natl. Acad. Sci. USA 87:1874); амплификацию Q Beta репликазы (см., например, Smith (1997), J. Clin. Microbiol. 35:1477-1491), автоматизированный анализ амплификации Q-бета репликазы (см., например, Burg (1996), Mol. Cell. Probes 10:257-271) и другие методики, опосредуемые РНК полимеразой (например, NASBA, Cangene, Mississauga, Ontario); см. также Berger (1987), Methods Enzymol. 152:307-316; Sambrook; Ausubel; патенты США № 4683195 и 4683202; Sooknanan (1995), Biotechnology 13:563-564.

Определение идентичности последовательности в нуклеиновых кислотах и полипептидах.

Настоящее изобретение предусматривает нуклеиновые кислоты, содержащие последовательности, имеющие по меньшей мере примерно 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более либо полную (100%) идентичность последовательности (гомологию) с примерной нуклеиновой кислотой по настоящему изобретению (см. также табл. 1-3, примеры 1 и 4 ниже и список последовательностей) в области по меньшей мере примерно из 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550 или более остатков. Настоящее изобретение относится к полипептидам, содержащим последовательности, имеющие по меньшей мере примерно 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более либо полную (100%) идентичность последовательности с примерным полипептидом по настоящему изобретению (см. табл. 1-3, примеры 1 и 4 ниже и список последовательностей). Степень идентичности последовательности (гомологии) может определяться с использованием любой компьютерной программы и связанных с ней параметров, включая те, которые описаны здесь, такие как BLAST 2.2.2. или FAST Version 3.0t78, с параметрами по умолчанию.

Последовательности нуклеиновых кислот по настоящему изобретению могут содержать по меньшей мере 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 или 500 либо более последовательных нуклеотидов примерной последовательности по настоящему изобретению и последовательностей, по существу идентичных с ней. Гомологичные последовательности и фрагменты последовательностей нуклеиновых кислот по настоящему изобретению могут относиться к последовательности, имеющей по меньшей мере примерно 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более идентичность последовательности (гомологию) с этими последовательностями. Гомология (идентичность последовательностей) может определяться с использованием любой из компьютерных программ и параметров, описанных в них, включая FASTA Version 3.0t78 с параметрами по умолчанию. Гомологичные последовательности также включают последовательности РНК, в которых уридины заменяют тимины в последовательности нуклеиновых кислот по настоящему изобретению. Гомологичные последовательности могут быть получены с использованием любой из процедур, описанных здесь, или могут возникать при исправлении ошибки секвенирования. Будет понятно, что последовательности нуклеиновых кислот по настоящему изобретению могут быть представлены в традиционном однобуквенном формате (см. внутреннюю сторону задней обложки Stryer, Lubert. Biochemistry, 3rd Ed., W.H. Freeman & Co., New York.) или в любом другом формате, который регистрирует идентичность нуклеотидов в последовательности.

В различных аспектах программы сравнения последовательностей, идентифицируемые здесь, используются в этом аспекте настоящего изобретения, т.е. для определения, находится ли последовательность нуклеиновых кислот или полипептидов в рамках настоящего изобретения. Однако идентичности последовательностей (гомологии) белков и/или нуклеиновых кислот могут оцениваться с использованием любого алгоритма сравнения последовательностей или программы, известной в данной области. Такие алгоритмы и программы включают в себя, но, ни в коем случае, не ограничиваясь этим, TBLASTN, BLASTP, FASTA, TFASTA и CLUSTALW (см., например, Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, 1988; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Thompson Nucleic Acids Res. 22 (2):4673-4680, 1994; Higgins et al., Methods Enzymol. 266:383-402, 1996; Altschul et al., J. Mol. Biol. 215(3):403-410, 1990; Altschul et al., Nature Genetics 3:266-272, 1993).

В одном из аспектов гомологию или идентичность измеряют с использованием программного обеспечения для анализа последовательностей (например, Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705). Такое программное обеспечение сопоставляет сходные последовательности посредством присвоения степеней гомологии различным делециям, замещениям и другим модификациям. В одном из аспектов термины "гомология" и "идентичность" в контекстах двух или более последовательностей нуклеиновых кислот или полипептидов относятся к двум или более последовательностям или субпоследовательностям, которые являются одинаковыми или имеют указанный процент остатков аминокислот или нуклеотидов, которые являются одинаковыми, когда сравниваются и совмещаются для максимального совпадения в окне сравнения или в обозначенной области, как измеряют с использованием любого количества алгоритмов сравнения последовательностей или посредством совмещения вручную и визуальной проверки.

В одном из аспектов для сравнения последовательностей одна последовательность действует как эталонная последовательность, с которой сравниваются исследуемые последовательности. Когда используют алгоритм сравнения последовательностей, исследуемые и эталонные последовательности вводятся в компьютер, обозначаются координаты субпоследовательностей, если это необходимо, и обозначаются параметры программы алгоритма сравнения последовательностей. Могут использоваться параметры программы по умолчанию или могут обозначаться альтернативные параметры. Затем алгоритм сравнения последовательностей вычисляет процент идентичностей последовательности для исследуемых последовательностей по сравнению с эталонной последовательностью на основе параметров программы.

"Окно сравнения", как здесь используется, включает упоминание сегмента из любого количества непрерывных положений, выбранных из группы, состоящей из от 20 до 600, обычно примерно от 50 примерно до 200, чаще примерно от 100 примерно до 150, в котором последовательность может сравниваться с эталонной последовательностью из такого же количества непрерывных положений, после того как две последовательности совмещаются оптимальным образом. Способы совмещения последовательностей для сравнения хорошо известны в данной области. Оптимальное совмещение последовательностей для сравнения может осуществляться, например, посредством локального алгоритма гомологии Smith & Waterman, Adv. Appl. Math. 2:482, 1981, посредством алгоритма совмещения гомологии Needleman & Wunsch, J. Mol. Biol 48:443, 1970, посредством поиска по способу подобия Person & Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988, посредством компьютерных воплощений этих алгоритмов (GAP, BESTFIT, FASTA и TFASTA, Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI) или посредством совмещения вручную и визуальной проверки. Другие алгоритмы для определения гомологии или идентичности включают в себя, например, в дополнение к программе BLAST (Basic Local Alignment Search Tool at the National Center for Biological Information), ALIGN, AMAS (Analysis of Multiply Aligned Sequences), AMPS (Protein Multiple Sequence Alignment), ASSET (Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node), BLIMPS (BLocks MProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman algoritm, DARWIN, Las Vegas algoritm, FNAT (Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequence Analysis Package), GAP (Global Alignment Programm), GENAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison), LALIGN (Local Sequence Совмещения), LCP (Local Content Programm), MACAW (Multiple Alignment Construction & Analysis Workbench), MAP (Multiple Alignment Programm), MBLKP, MBLKN, PIMA (Pattern-Induced Multisequence Alignment), SAGA (Sequence Alignment by Genetic Algorithm) и WHAT-EF. Такие программы совмещения могут также использоваться для скрининга геномных баз данных, для идентификации последовательностей полинуклеотидов, имеющих по существу идентичные последовательности. Доступным является ряд геномных баз данных, например, значительная часть генома человека является доступной как часть Human Genome Sequencing Project (Gibbs, 1995). По меньшей мере двадцать один другой геном уже секвенирован, включая, например, М. genitalium (Fraser et al., 1995), M. jannaschii (Bult et al., 1996), H. influenzae (Fleischmann et al., 1995), E.coli (Blattner et al., 1997), дрожжи (S. cerevisiae) (Mewes et al., 1997) и D. melanogaster (Adams et al., 2000). Значительный прогресс также достигнут в секвенировании геномов модельных организмов, таких как мышь, С. elegans и Arabadopsis sp. Несколько баз данных, содержащих геномную информацию, аннотированную некоторой функциональной информацией, поддерживаются различными организациями и могут быть доступными в интернете.

В одном из аспектов используются алгоритмы BLAST и BLAST 2.0, которые описаны в Altschul et al., Nuc. Acids Res. 25:3389-3402, 1977 и Altschul et al., J. Mol. Biol. 215:403-410, 1990 соответственно. Программное обеспечение для осуществления анализов BLAST является публично доступным с помощью National Center for Biotechnology Information. Этот алгоритм включает в себя, сначала, идентификацию пар последовательностей с высокими оценками (HSP) посредством идентификации коротких слов длины W в изучаемой последовательности, которые либо совпадают, либо удовлетворяют некоторой пороговой оценке Т с положительным значением, когда совмещаются со словом той же длины в последовательности базы данных. Т упоминается как порог оценки соседствующего слова (Altschul et al., выше). Эти начальные совпадения соседствующих слов действуют как затравки для инициирования поисков с целью нахождения более длинных HSP, содержащих их. Совпадения слов расширяются в обоих направлениях вдоль каждой последовательности, настолько далеко, насколько может увеличиваться кумулятивная оценка совмещения. Кумулятивные оценки вычисляются с использованием для нуклеотидных последовательностей параметров М (обратная оценка для пары совпадающих остатков; всегда > 0). Для последовательности аминокислот матрица оценок используется для вычисления кумулятивной оценки. Расширение совпадений слов в каждом направлении прекращается, когда: кумулятивная оценка совмещения опускается ниже на значение X от ее максимального достигнутого значения; кумулятивная оценка опускается до нуля или ниже из-за аккумуляции одного или нескольких совмещений остатков с отрицательными оценками; или достигается конец любой из последовательностей.

Параметры алгоритма BLAST W, Т и X определяют чувствительность и скорость совмещения. Программа BLASTN (для последовательностей нуклеотидов) использует по умолчанию длину слова (W) 11, ожидание (Е) 10, М=5, N=-4 и сравнения обеих нитей. Для последовательностей аминокислот программа BLASTP использует по умолчанию длину слова 3 и ожидание (Е) 10 и совмещение (В) матрицы оценок BLOSUM62 (см. Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989) 50, ожидание (Е) 10, M=5, N=-4 и сравнение обеих нитей.

Алгоритм BLAST также осуществляет статистический анализ сходства между двумя последовательностями (см., например, Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993). Одна из мер сходства, предусматриваемых алгоритмом BLAST, представляет собой наименьшую вероятность суммы (P(N)), которая обеспечивает индикацию возможности, с которой может произойти случайное совпадение между двумя последовательностями нуклеотидов или аминокислот. Например, нуклеиновая кислота считается сходной с эталонной последовательностью, если наименьшая вероятность суммы при сравнении исследуемой нуклеиновой кислоты с эталонной нуклеиновой кислотой меньше чем примерно 0,2, более того, в одном из аспектов меньше чем примерно 0,01 и более всего в одном из аспектов меньше чем примерно 0,001.

В одном из аспектов гомологии последовательностей белков и нуклеиновых кислот оценивают с использованием Basic Local Alignment Search Tool ("BLAST"). В частности, пять конкретных программ BLAST используют для осуществления следующих задач:

(1) BLASTP и BLAST3 сравнивают исследуемую последовательность аминокислот с последовательностями белков из базы данных;

(2) BLASTN сравнивает исследуемую последовательность нуклеотидов с последовательностью нуклеотидов из базы данных;

(3) BLASTX сравнивает шестирамочные концептуальные продукты трансляции исследуемой последовательности нуклеотидов (обе нити) с базой данных последовательностей белков;

(4) TBLASTN сравнивает исследуемую последовательность белка с базой данных последовательностей нуклеотидов, транслируемой во всех шести рамках считывания (на обеих нитях); и

(5) TBLASTX сравнивает шестирамочные трансляции исследуемой последовательности нуклеотидов с шестирамочными трансляциями базы данных последовательностей нуклеотидов.

Программы BLAST идентифицируют гомологичные последовательности посредством идентификации сходных сегментов, которые упоминаются здесь как "пары сегментов с высокими оценками" между запрашиваемой последовательностью амино- или нуклеиновых кислот и исследуемой последовательностью, которая в одном из аспектов получается из базы данных последовательностей белков или нуклеиновых кислот. Пары сегментов с высокими оценками идентифицируются в одном из аспектов (т.е. совмещаются) посредством матрицы оценок, множество которых известно в данной области. В одном из аспектов используемая матрица оценок представляет собой матрицу BLOSUM62 (Gonnet (1992), Science 256:1443-1445; Henikoff and Henikoff (1993), Proteins 17:49-61). Менее того, в одном из аспектов могут также использоваться матрицы РАМ или РАМ250 (см., например, Schwartz and Dayhoff, eds., 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Программы BLAST доступны с помощью US National Library of Medicine.

Параметры, используемые вместе с указанными выше алгоритмами, могут адаптироваться в зависимости от длины последовательности и степени изучаемой гомологи. В некоторых аспектах параметры могут представлять собой параметры по умолчанию, используемые алгоритмами в отсутствие инструкций от пользователя.

Компьютерные системы и компьютерные программные продукты.

Настоящее изобретение предусматривает компьютеры, компьютерные системы, считываемые компьютером среды, компьютерные программные продукты и т.п., записанные или сохраняемые на них последовательности нуклеиновых кислот и полипептидов по настоящему изобретению. В дополнение к этому при осуществлении способов по настоящему изобретению, например, для определения и идентификации идентичностей последовательностей (чтобы определить, находится ли нуклеиновая кислота в рамках настоящего изобретения), структурных гомологий, мотивов и т.п., in silico, последовательность нуклеиновых кислот или полипептидов по настоящему изобретению может храниться, записываться и подвергаться манипуляциям на любой среде, которая может считываться компьютером и быть доступной для него.

Как здесь используется, слова "записанный" и "сохраняемый" относятся к способу хранения информации на компьютерной среде. Специалист в данной области может легко принять любые известные способы для записи информации на считываемой компьютером среде для получения изделий, содержащих одну или несколько последовательностей нуклеиновых кислота и/или полипептидов по настоящему изобретению. Как здесь используется, термины "компьютер", "компьютерная программа" и "процессор" используются в их самых широких общих контекстах и включают все такие устройства, как описано подробно ниже. "Последовательность, кодирующая" или "последовательность, которая кодирует" конкретный полипептид или белок, представляет собой последовательность нуклеиновых кислот, которая подвергается транскрипции и транслируется в полипептид или белок, когда попадает под контроль соответствующих регуляторных последовательностей.

Полипептиды по настоящему изобретению включают примерные последовательности по настоящему изобретению и последовательности, по существу идентичные им, и субпоследовательности (фрагменты) любой из предыдущих последовательностей. В одном из аспектов термин "по существу идентичные или гомологичные последовательности полипептидов" относится к последовательности полипептидов, имеющей по меньшей мере 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более либо полную (100%) идентичность последовательности (гомологию) с примерной последовательностью по настоящему изобретению.

Гомология (идентичность последовательностей) может определяться с использованием любой из компьютерных программ и параметров, описанных здесь. Последовательность нуклеиновых кислот или полипептидов по настоящему изобретению может храниться, записываться и подвергаться манипуляциям на любой среде, которая может считываться компьютером и быть доступной для него. Как здесь используется, слова "записанный" и "сохраняемый" относятся к способу хранения информации на компьютерной среде. Специалист в данной области может легко принять любой из известных в настоящее время способов для записи информации на считываемую компьютером среду, для получения изделий, содержащих одну или несколько последовательностей нуклеиновых кислот по настоящему изобретению, одну или несколько последовательностей полипептидов по настоящему изобретению. Другой аспект настоящего изобретения представляет собой считаемую компьютером среду, имеющую записанные на ней по меньшей мере 2, 5, 10, 15 или 20 либо более последовательностей нуклеиновых кислот или полипептидов по настоящему изобретению.

Другой аспект настоящего изобретения представляет собой считываемую компьютером среду, имеющую записанные на ней одну или несколько последовательностей нуклеиновых кислот по настоящему изобретению. Другой аспект настоящего изобретения представляет собой считываемую компьютером среду, имеющую записанные на ней одну или несколько последовательностей полипептидов по настоящему изобретению. Другой аспект настоящего изобретения представляет собой считываемую компьютером среду, имеющую записанные на ней по меньшей мере 2, 5, 10, 15 или 20 либо более последовательностей нуклеиновых кислот или полипептидов, как приведено выше.

Считываемые компьютером среды включают магнитные считываемые среды, оптические считываемые среды, электронные считываемые среды и магнитные/оптические среды. Например, считываемые компьютером среды могут представлять собой твердый диск, гибкий диск, магнитную ленту, CD-ROM, Digital Versatile Disk (DVD), оперативную память (RAM), или постоянное запоминающее устройство (ROM), а также другие типы других сред, известных специалистам в данной области.

Аспекты настоящего изобретения включают системы (например, системы на основе интернета), например компьютерные системы, которые хранят и осуществляют манипуляции с информацией о последовательностях, описанных здесь. Один из примеров компьютерной системы 100 иллюстрируется в форме блок-схемы на фиг. 1. Как здесь используется, "компьютерная система" относится к компонентам аппаратного обеспечения, компонентам программного обеспечения и компонентам хранения данных, используемым для анализа последовательности нуклеотидов последовательности нуклеиновых кислот по настоящему изобретению, или последовательности полипептидов по настоящему изобретению. В одном из аспектов компьютерная система 100 включает процессор для обработки, получения данных и осуществления манипуляций с данными о последовательностях. Процессор 105 может представлять собой любой хорошо известный тип узла центрального процессора, такого как, например, Pentium III от Intel Corporation, или подобный процессор от Sun, Motorola, Compaq, AMD или International Business Machines.

В одном из аспектов компьютерная система 100 представляет собой систему общего назначения, которая включает процессор 105 и один или несколько внутренних компонентов хранения данных 110 для хранения данных и одно или несколько устройств для получения данных, для получения данных, сохраняемых на компонентах для хранения данных. Специалист в данной области может легко понять, что любая из доступных в настоящее время компьютерных систем является пригодной для использования.

В одном из конкретных аспектов компьютерная система 100 включает процессор 105, соединенный с шиной, которая соединена с главной памятью 115 (в одном из аспектов осуществляемой как RAM) и с одним или несколькими внутренними устройствами для хранения данных 110, такими как твердый диск и/или другие считываемые компьютером среды, имеющие данные, записанные на них. В некоторых аспектах компьютерная система 100 дополнительно включает одно или несколько устройств для получения данных 118, для считывания данных, сохраняемых на внутренних устройствах для хранения данных 110.

Устройство для получения данных 118 может представлять собой, например, привод гибкого диска, привод для компакт-диска, привод для магнитной ленты или модем, способный к соединению с удаленной системой хранения данных (например, через интернет) и т.п. В некоторых аспектах внутреннее устройство для хранения данных 110 представляет собой съемную считываемую компьютером среду, такую как гибкий диск, компакт-диск, магнитная лента и т.п., содержащую управляющую логику и/или данные, записанные на ней. Компьютерная система 100 может преимущественно включать соответствующее программное обеспечение или программироваться с его помощью для считывания управляющей логики и/или данных с компонента для хранения данных, после того как он вставлен в устройство для получения данных.

Компьютерная система 100 включает дисплей 120, который используется для отображения выходных данных для пользователя компьютера. Необходимо также отметить, что компьютерная система 100 может быть связана с другими компьютерными системами 125а-с в сеть или широкомасштабную сеть для обеспечения централизованного доступа к компьютерной системе 100.

Программное обеспечение для получения и обработки последовательности нуклеотидов последовательности нуклеиновых кислот по настоящему изобретению или последовательности полипептидов по настоящему изобретению (такое как инструменты поиска, инструменты сравнения и инструменты моделирования и т.п.) могут находиться в главной памяти 115 во время исполнения.

В некоторых аспектах компьютерная система 100 может дополнительно включать алгоритм сравнения последовательностей для сравнения последовательности нуклеиновых кислот по настоящему изобретению или последовательности полипептидов по настоящему изобретению, сохраняемой в считываемой компьютером среде, с эталонной последовательностью (последовательностями) нуклеотидов или полипептидов, сохраняемой в считываемой компьютером среде. "Алгоритм сравнения последовательностей" относится к одной или нескольким программам, которые осуществляются (локально или с удаленным доступом) на компьютерной системе 100 для сравнения последовательности нуклеотидов с другими последовательностями нуклеотидов и/или соединениями, сохраняемыми в средствах для хранения данных. Например, алгоритм сравнения последовательностей может сравнивать последовательности нуклеотидов в последовательности нуклеиновых кислот по настоящему изобретению, или последовательности полипептидов по настоящему изобретению, сохраняемых на считываемой компьютером среде, с эталонными последовательностями, сохраняемыми на считываемой компьютером среде, для идентификации гомологии или структурных мотивов.

Фиг. 2 представляет собой блок-схему, иллюстрирующую один из аспектов способа 200 сравнения новой последовательности нуклеотидов или белков с базой данных последовательностей для определения уровней гомологии между новой последовательностью и последовательностями в базе данных. База данных последовательностей может представлять собой частную базу данных, сохраняемую в компьютерной системе 100, или публичную базу данных, такую как GENBANK, которая является доступной через Интернет.

Способ 200 начинается в исходном состоянии 201, а затем переходит в состояние 202, где новая последовательность, которая должна сравниваться, хранится в памяти компьютерной системы 100. Как обсуждается выше, память может представлять собой любой тип памяти, включая RAM или внутреннее устройство для хранения.

Способ 200 затем переходит в состояние 204, где база данных последовательностей открывается для анализа и сравнения. Затем способ 200 переходит в состояние 206, где первая последовательность, сохраняемая в базе данных, считываться в память компьютера. Затем осуществляют сравнение в состоянии 210 для определения того, является ли первая последовательность такой же, как и вторая последовательность. Важно отметить, что это стадия не ограничивается осуществлением точного сравнения между новой последовательностью и первой последовательностью в базе данных. Специалистам знакомы хорошо известные способы в данной области для сравнения двух последовательностей нуклеотидов или белков, даже, если они не являются идентичными. Например, в одну из последовательностей могут вводиться разрывы для повышения уровня гомологии между двумя исследуемыми последовательностями. Параметры, которые контролируют, вводятся ли разрывы или другие признаки в последовательность во время сравнения, обычно вводятся пользователем в компьютерную систему.

После осуществления сравнения двух последовательностей в состоянии 210 делается определение состояния решения 210, являются ли две последовательностями одинаковыми. Разумеется, термин "одинаковые" не ограничивается последовательностями, которые являются абсолютно идентичными. Последовательности, которые находятся в пределах параметров гомологии, введенных пользователем, будут отмечаться как "одинаковые" в способе 200.

Если делается определение, что две последовательности являются одинаковыми, способ 200 переходит в состояние 214, где наименование последовательности из базы данных отображается для пользователя. Это состояние сообщает пользователю, что последовательность с отображенным наименованием соответствует ограничениям гомологии, которые введены. После отображения наименования сохраняемой последовательности для пользователя способ 200 переходит в состояние решения 218, где делается определение, существуют ли еще последовательности в базе данных. Если в базе данных больше нет последовательностей, тогда способ 200 завершается в конечном состоянии 220. Однако, если в базе данных существуют еще последовательности, тогда способ 200 переходит в состояние 224, где указатель переходит на следующую последовательность в базе данных, так что она может сравниваться с новой последовательностью. Таким образом, новая последовательность совмещается и сравнивается с каждой последовательностью в базе данных.

Необходимо отметить, что, если в состоянии решения 212 делается определение, что последовательности не являются гомологичными, тогда способ 200 может переходить непосредственно в состояние решения 218, чтобы определить, являются ли какие-либо другие последовательности доступными в базе данных для сравнения.

Соответственно, один из аспектов настоящего изобретения представляет собой компьютерную систему, содержащую процессор, устройство для хранения данных, имеющее сохраняемую на нем последовательность нуклеиновых кислот по настоящему изобретению или последовательность полипептидов по настоящему изобретению, устройство для хранения данных имеет сохраняемые на нем с возможностью получения эталонные последовательности нуклеотидов или последовательности полипептидов, которые должны сравниваться с последовательностью нуклеиновых кислот по настоящему изобретению или последовательностью полипептидов по настоящему изобретению, и устройство для сравнения последовательностей, для осуществления сравнения. Устройство для сравнения последовательностей может показывать уровень гомологии между сравниваемыми последовательностями или идентифицировать структурные мотивы в описанной выше нуклеиновой кислоте, кодирующей последовательность нуклеиновых кислот по настоящему изобретению, или в последовательности полипептидов по настоящему изобретению, или оно может идентифицировать структурные мотивы в последовательностях, которые сравниваются с этими кодами нуклеиновых кислот и кодами полипептидов. В некоторых аспектах устройство для хранения данных может иметь сохраняемые на нем последовательности по меньшей мере из 2, 5, 10, 15, 20, 25, 30 или 40 либо более последовательностей нуклеиновых кислот по настоящему изобретению или последовательностей полипептидов по настоящему изобретению.

Другой аспект настоящего изобретения представляет собой способ для определения уровня гомологии между последовательностью нуклеиновых кислот по настоящему изобретению или последовательностью полипептидов по настоящему изобретению и эталонной последовательностью нуклеотидов. Способ включает считывание кода нуклеиновых кислот или кода полипептидов и эталонной последовательности нуклеотидов или полипептидов с помощью использования компьютерной программы, которая определяет уровни гомологии и определяет гомологию между кодом нуклеиновых кислот или кодом полипептидов и эталонной последовательностью нуклеотидов или полипептидов с помощью компьютерной программы. Компьютерная программа может представлять собой любую из ряда компьютерных программ для определения уровней гомологии, включая те, которые конкретно перечислены здесь (например, BLAST2N с параметрами по умолчанию или с любыми модифицированными параметрами). Способ может осуществляться с использованием компьютерных систем, описанных выше. Способ может также осуществляться посредством считывания по меньшей мере 2, 5, 10, 15, 20, 25, 30 или 40 либо более из описанных выше последовательностей нуклеиновых кислот по настоящему изобретению, или последовательностей полипептидов по настоящему изобретению посредством использования компьютерной программы и определения гомологии между кодами нуклеиновых кислот или кодами полипептидов и эталонными последовательностями нуклеотидов или последовательностями полипептидов.

Фиг. 3 представляет собой блок-схему, иллюстрирующую один из аспектов способа 250 в компьютере для определения того, являются ли две последовательности гомологичными. Способ 250 начинается в исходном состоянии 252, а затем переходит в состояние 254, где первая последовательность, которая должна сравниваться, хранится в памяти. Вторая последовательность, которая должна сравниваться, сохраняется, затем хранится в памяти в состоянии 256. Затем способ 250 переходит в состояние 260, где считывается первая буква в первой последовательности, а затем в состояние 262, где считывается первая буква второй последовательности. Необходимо понять, что, если последовательность представляет собой последовательность нуклеотидов, тогда буква будет обычно представлять собой либо А, Т, С, G, либо U. Если последовательность представляет собой последовательность белков, тогда она представляет собой в одном из аспектов однобуквенный код аминокислот, таким что первая и вторая последовательности могут легко сравниваться.

Затем делается определение в состоянии решения 264, являются ли две буквы одинаковыми. Если они являются одинаковыми, тогда способ 250 переходит в состояние 268, где считываются следующие буквы в первой и второй последовательностях. Затем делается определение, являются ли следующие далее буквы одинаковыми. Если они являются, тогда способ 250 продолжает этот цикл до тех пор, пока две буквы не будут одинаковыми. Если делается определение, что следующие две буквы не являются одинаковыми, способ 250 переходит в состояние решения 274 для определения того, имеются ли какие-либо еще буквы для считывания в любой из последовательностей.

Если нет больше никаких букв для считывания, тогда способ 250 переходит в состояние 276, где уровень гомологии между первой и второй последовательностями отображается для пользователя. Уровень гомологии определяется посредством вычисления доли букв между последовательностями, которые являются одинаковыми, из общего количества букв в первой последовательности. Таким образом, если каждая буква в первой последовательности из 100 нуклеотидов совпадает с каждой буквой во второй последовательности, гомология будет составлять 100%.

Альтернативно, компьютерная программа может представлять собой компьютерную программу, которая сравнивает последовательности нуклеотидов последовательности нуклеиновых кислот, как приведено в настоящем изобретении, с одной или несколькими эталонными последовательностями нуклеотидов для определения того, отличается ли код нуклеиновых кислот по настоящему изобретению от эталонной последовательности нуклеиновых кислот в одном или нескольких положениях. Необязательно, такая программа регистрирует длину и идентичность вставленных, устраненных или замещенных нуклеотидов по отношению к последовательности, либо эталонного полинуклеотида, либо последовательности нуклеиновых кислот по настоящему изобретению. В одном из аспектов компьютерная программа может представлять собой программу, которая определяет, содержит ли последовательность нуклеиновых кислот по настоящему изобретению, мононуклеотидный полиморфизм (SNP) по отношению к эталонной последовательности нуклеотидов.

Соответственно другой аспект настоящего изобретения представляет собой способ для определения того, отличается ли последовательность нуклеиновых кислот по настоящему изобретению на одном или нескольких нуклеотидах от эталонной последовательности нуклеотидов, включающий стадии считывания кода нуклеиновых кислот и эталонной последовательности нуклеотидов посредством использования компьютерной программы, которая идентифицирует различия между последовательностями нуклеиновых кислот, и идентификации различий между кодом нуклеиновых кислот и эталонной последовательностью нуклеотидов с помощью компьютерной программы. В некоторых аспектах компьютерная программа представляет собой программу, которая идентифицирует мононуклеотидные полиморфизмы. Способ может осуществляться с помощью компьютерных систем, описанных выше, и способа, иллюстрируемого на фиг. 3. Способ может также осуществляться посредством считывания по меньшей мере 2, 5, 10, 15, 20, 25, 30 или 40 либо более последовательностей нуклеиновых кислот по настоящему изобретению и эталонных последовательностей нуклеотидов посредством использования компьютерной программы и идентификации различий между кодами нуклеиновых кислот и эталонными последовательностями нуклеотидов с помощью компьютерной программы.

В других аспектах система на основе компьютера может дополнительно включать идентификатор для идентификации признаков в последовательности нуклеиновых кислот по настоящему изобретению или последовательности полипептидов по настоящему изобретению. "Идентификатор" относится к одной или нескольким программам, которые идентифицируют определенные признака в последовательности нуклеиновых кислот по настоящему изобретению или последовательности полипептидов по настоящему изобретению. В одном из аспектов идентификатор может включать программу, которая идентифицирует открытую рамку считывания в последовательности нуклеиновых кислот по настоящему изобретению.

Фиг. 4 представляет собой блок-схему, иллюстрирующую один из аспектов способа идентификатора 300 для детекции присутствия признака в последовательности. Способ 300 начинается в исходном состоянии 302, а затем переходит в состояние 304, где первая последовательность, которая должна проверяться на наличие признаков, хранится в памяти 115 компьютерной системы 100. Затем способ 300 переходит в состояние 306, где открывается база данных признаков последовательностей. Такая база данных включала бы список атрибутов каждого признака вместе с наименованием признака. Например, наименование признака могло бы представлять собой "Кодон инициирования", атрибут представлял бы собой "ATG". Другой пример представлял бы собой наименование признака "Бокс ТААТАА", а атрибут признака представлял бы собой "ТААТАА". Один из примеров такой базы данных производится University of Wisconsin Genetics Computer Group. Альтернативно, признаки могут представлять собой структурные мотивы полипептидов, такие как альфа-спирали, бета-складчатые листы, или функциональные мотивы полипептидов, такие как ферментативные активные сайты, мотивы спираль-петля-спираль или другие мотивы, известные специалистам в данной области.

После открытия базы данных признаков состояний 306 способ 300 переходит в состояние 308, где первый признак считывается из базы данных. Сравнение атрибута первого признака с первой последовательностью делается затем в состоянии 310. Затем делается определение в состоянии решения 316, обнаружен ли атрибут признака в первой последовательности. Если атрибут обнаруживается, тогда способ 300 переходит в состояние 318, где наименование найденного признака отображается для пользователя.

Затем способ 300 переходит в состояние решения 320, где делается определение, существуют ли еще признаки в базе данных. Если признаков больше нет, тогда способ 300 завершается в конечном состоянии 324. Однако если в базе данных существуют еще признаки, тогда способ 300 считывает следующий признак последовательности в состоянии 326 и переходит по циклу назад в состояние 310, где атрибут следующего признака сравнивается с первой последовательностью. Необходимо отметить, что, если атрибут признака не обнаруживается в первой последовательности в состоянии решения 316, способ 300 переходит непосредственно в состояние решения 320 для определения того, имеются ли еще признаки в базе данных.

Соответственно, другой аспект настоящего изобретения представляет собой способ идентификации признака в последовательности нуклеиновых кислот по настоящему изобретению или последовательности полипептидов по настоящему изобретению, включающий считывание кода (кодов) нуклеиновых кислот или кода (кодов) полипептидов посредством использования компьютерной программы, которая идентифицирует признаки в них, и идентификации признаков в коде (кодах) нуклеиновых кислот с помощью компьютерной программы. В одном из аспектов компьютерная программа включает компьютерную программу, которая идентифицирует открытые рамки считывания. Способ может осуществляться посредством считывания одной последовательности или по меньшей мере 2, 5, 10, 15, 20, 25, 30 или 40 либо более последовательностей нуклеиновых кислот по настоящему изобретению, или последовательностей полипептидов по настоящему изобретению, посредством использования компьютерной программы и идентификации признаков в кодах нуклеиновых кислот или в кодах полипептидов с помощью компьютерной программы.

Последовательность нуклеиновых кислот по настоящему изобретению или последовательность полипептидов по настоящему изобретению может храниться и подвергаться манипуляциям в различных программах обработки данных в различных форматах. Например, последовательность нуклеиновых кислот по настоящему изобретению или последовательность полипептидов по настоящему изобретению может храниться как текст в файле текстового процессора, такого как Microsoft WORD ™ или WORDPERFECT ™, или как файл ASCII в различных программах баз данных, известных специалистам в данной области, таких как DB2 ™, SYBASE ™ или ORACLE ™. В дополнение к этому множество компьютерных программ и баз данных могут использоваться в качестве алгоритмов сравнения последовательностей, идентификаторов или источников эталонных последовательностей нуклеотидов или последовательностей полипептидов, которые должны сравниваться с последовательностью нуклеиновых кислот по настоящему изобретению или с последовательностью полипептидов по настоящему изобретению. Следующий далее список не предназначен для ограничения настоящего изобретения, а предназначен для обеспечения информации о программах и базах данных, которые являются пригодными для использования вместе с последовательностями нуклеиновых кислот по настоящему изобретению или последовательностями полипептидов по настоящему изобретению.

Программы и базы данных, которые могут использоваться, включают в себя, но не ограничиваясь этим, MACPATTERN ™ (EMBL), DISCOVERYBASE ™ (Molecular Applications Group), GENEMINE ™ (Molecular Applications Group), LOOK ™ (Molecular Applications Group), MACLOOK ™ (Molecular Applications Group), BLAST and BLAST2 (NCBI), BLASTN and BLASTX (Altschul et al., J. Mol. Biol. 215:403, 1990), FASTA (Pearson и Lipman, Proc. Natl. Acad. Sci. USA, 85:2444, 1988), FASTDB (Brutlag et al. Comp. Арр. Biosci. 6:237-245, 1990), CATALYST ™ (Molecular Simulations Inc.), Catalyst/SHAPE ™ (Molecular Simulations Inc.), Cerius 2 .DBAccess ™ (Molecular Simulations Inc.), HYPOGEN ™ (Molecular Simulations Inc.), INSIGHT II ™ (Molecular Simulations Inc.), DISCOVER ™ (Molecular Simulations Inc.), CHARMm ™ (Molecular Simulations Inc.), FELIX ™ (Molecular Simulations Inc.), DELPHI ™ (Molecular Simulations Inc.), QuanteMM ™ (Molecular Simulations Inc.), гомолог (Molecular Simulations Inc.), MODELER ™ (Molecular Simulations Inc.), ISIS ™ (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), WebLab (Molecular Simulations Inc.), WebLab Diversity Explorer (Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulations Inc.), база данных MDL Available Chemicals Directory, база данных MDL Drug Data Report, база данных Comprehensive Medicinal Chemistry, база данных Derwents's World Drug Index, база данных BioByteMasterFile, базу данных Genbank и базу данных Genseqn. Множество других программ и баз данных будут очевидны специалисту в данной области вместе с настоящим описанием.

Мотивы, которые могут детектироваться с использованием указанных выше программ, включают последовательности, кодирующие лейциновые молнии, мотивы спираль-петля-спираль, сайты гликозилирования, сайты убихитирования, альфа-спирали и бета-скаладчатые листы, сигнальные последовательности, кодирующие сигнальные пептиды, которые направляют секретирование кодируемых белков, последовательности, вовлеченные в регуляцию транскрипции, такие как гомеобоксы, кислотные фрагменты сееквенирования, ферментативные активные сайты, сайты связывания с субстратом и сайты ферментативного расщепления.

Гибридизация нуклеиновых кислот.

Настоящее изобретение предусматривает выделенные или рекомбинантные нуклеиновые кислоты, которые гибридизируются при строгих условиях с примерной последовательностью по настоящему изобретению (например, SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:71, SEQ ID NO:73, SEQ ID NO:75, SEQ ID NO:77, SEQ ID NO:79, SEQ ID NO:81, SEQ ID NO:83, SEQ ID NO:85, SEQ ID NO:87, SEQ ID NO:89, SEQ ID NO:91, SEQ ID NO:93, SEQ ID NO:95, SEQ ID NO:97, SEQ ID NO:99, SEQ ID NO:101, SEQ ID NO:103, SEQ ID NO:105, SEQ ID NO:107, SEQ ID NO:109, SEQ ID NO:111, SEQ ID NO:113, SEQ ID NO:115, SEQ ID NO:117, SEQ ID NO:119, SEQ ID NO:121, SEQ ID NO:123, SEQ ID NO:125, SEQ ID NO:127, SEQ ID NO:129, SEQ ID NO:131, SEQ ID NO:133, SEQ ID NO:135, SEQ ID NO:137, SEQ ID NO:139, SEQ ID NO:141, SEQ ID NO:143, SEQ ID NO:145, SEQ ID NO:147, SEQ ID NO:149, SEQ ID NO:151, SEQ ID NO:153, SEQ ID NO:155, SEQ ID NO:157, SEQ ID NO:159, SEQ ID NO:161, SEQ ID NO:163 или SEQ ID NO:165 (см. также табл. 1-3, примеры 1 и 4 ниже и список последовательностей)). Строгие условия могут представлять собой очень строгие условия, средне строгие условия и/или мало строгие условия, включая условия высокой и пониженной строгости, описанные здесь. В одном из аспектов они представляют собой строгость условий отмывки, которые определяют условия, которые определяют, находится ли нуклеиновая кислота в рамках настоящего изобретения, как обсуждается ниже.

"Гибридизация" относится к способу, посредством которого нити нуклеиновой кислоты соединяются с комплементарными нитями во время спаривания оснований. Реакции гибридизации могут быть чувствительными и селективными, так что конкретная последовательность, представляющая интерес, может идентифицироваться даже в образцах, в которых она присутствует при низких концентрациях. Достаточно строгие условия могут определяться, например, концентрациями соли или формамида в растворах для предварительной гибридизации и гибридизации, или с помощью температуры гибридизации, и хорошо известны в данной области. В альтернативных аспектах строгость может быть увеличена посредством уменьшения концентрации соли, увеличения концентрации формамида или повышения температуры гибридизации. В альтернативных аспектах нуклеиновые кислоты по настоящему изобретению определяются по их способности к гибридизации в условиях различной строгости (например, высокой, средней и низкой), как приведено здесь.

В одном из аспектов гибридизация в условиях высокой строгости включает примерно 50% формамида примерно при 37-42 °С. В одном из аспектов условия гибридизации включают условия пониженной строгости примерно при 35-25% формамида примерно при 30-35 °С. В одном из аспектов условия гибридизации включают условия высокой строгости, например, при 42 °С в 50% формамиде, 5 × SSPE, 0,3% SDS и 200 н/мл подвергнутой сдвиговой обработке и денатурированной ДНК молок лосося. В одном из аспектов условия гибридизации включают эти условия пониженной строгости, но при 35% формамида, при пониженной температуре 35 °С. Диапазон температур, соответствующий конкретному уровню строгости, может быть дополнительно сужен посредством вычисления отношения пурина к пиримидину у нуклеиновой кислоты, представляющей интерес, и установления соответствующей температуры. Изменения в указанных выше диапазонах и условиях хорошо известны в данной области.

В альтернативных аспектах нуклеиновые кислоты по настоящему изобретению, как определяется их способностью к гибридизации при строгих условиях, могут находиться в пределах примерно от пяти остатков и до полной длины нуклеиновой кислоты по настоящему изобретению; например, они могут составлять по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 55, 60, 65, 70, 75, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000 или более остатков в длину. Нуклеиновые кислоты, более короткие, чем полная длина, также включаются. Эти нуклеиновые кислоты могут быть полезны, например, как зонды гибридизации, метящие зонды, олигонуклеотидные зонды для PCR, si-РНК или mi-РНК (одно или двухцепочечная), антисмысловая или смысловая последовательности, кодирующие пептиды, связывающиеся с антителами (эпитопы), мотивы, активные сайты и т.п.

В одном из аспектов нуклеиновые кислоты по настоящему изобретению определяются по их способности к гибридизации в условиях высокой строгости, включающих условия примерно 50% формамида примерно при 37-42 °С. В одном из аспектов нуклеиновые кислоты по настоящему изобретению определяются их способностью к гибридизации в условиях пониженной строгости, включая условия примерно при 35-25% формамида, примерно при 30-35 °С.

Альтернативно, нуклеиновые кислоты по настоящему изобретению определяются по их способности к гибридизации в условиях высокой строгости, включающих условия при 42 °С в 50% формамида, 5 × SSPE, 0,3% SDS и нуклеиновой кислоте, блокирующей повторяющуюся последовательность, такой как cot-1 или ДНК молок лосося (например, 200 н/мл подвергнутой сдвиговой обработке и денатурированной ДНК молок лосося). В одном из аспектов нуклеиновые кислоты по настоящему изобретению определяются по их способности к гибридизации в условиях пониженной строгости, включающих условия 35 или 40% формамида при пониженной температуре 35 или 42 °С.

В реакциях гибридизации нуклеиновых кислот условия, используемые для достижения конкретного уровня строгости, будут меняться, в зависимости от природы нуклеиновых кислот, которые гибридизируются. Например, длина, степень комплементарности, композиция последовательности нуклеотидов (например, содержание GC по сравнению с AT) и тип нуклеиновой кислоты (например, РНК по сравнению с ДНК) областей гибридизации нуклеиновых кислот должны рассматриваться при выборе условий гибридизации. Дополнительный фактор представляет собой то, является ли одна из нуклеиновых кислот иммобилизованной, например, на фильтре.

Гибридизация может осуществляться в условиях низкой строгости, умеренной строгости или высокой строгости. В качестве примера гибридизации нуклеиновых кислот, полимерная мембрана, содержащая иммобилизованные денатурированные нуклеиновые кислоты сначала предварительно гибридизируется в течение 30 мин при 45 °С в растворе, состоящем из 0,9 М NaCl, 50 мМ NaH 2 PO 4 , pH 7,0, 5,0 мМ Na 2 EDTA, 0,5% SDS, 10 × реактива Денхардта и 0,5 мг/мл полирибоадениловой кислоты. Приблизительно 2 ×10 7 импульсов в минуту (имп./мин) (удельная активность 4-9 ×10 8 имп./мин/мкг) олигонуклеотидного зонда, меченного на концах 32 Р, добавляют затем к раствору. После 12-16 ч инкубирования мембрану промывают в течение 30 мин при комнатной температуре в 1 × SET (150 мМ NaCl, 20 мМ Трис гидрохлорида, рН 7,8, 1 мМ Na 2 EDTA), содержащем 0,5% SDS, с последующей 30-минутной отмывкой в свежем 1 × SET при T m -10 °С для олигонуклеотидного зонда. Затем мембрану экспонируют для авторадиографической пленки, для детекции сигналов гибридизации. Все предшествующие гибридизации рассматривались бы как осуществляемые в условиях высокой строгости.

После гибридизации фильтр может промываться для удаления любого неспецифично связанного детектируемого зонда. Строгость, используемая для отмывки фильтров, также может изменяться в зависимости от природы нуклеиновых кислот, которые гибридизируются, длины нуклеиновых кислот, которые гибридизируются, степени комплементарности, композиции последовательности нуклеотидов (например, содержание GC по сравнению с AT) и типа нуклеиновых кислот (например, РНК по сравнению с ДНК). Примеры промывок с условиями последовательно увеличивающейся строгости являются следующими: 2 × SSC, 0,1% SDS при комнатной температуре в течение 15 мин (низкая строгость); 0,1 × SSC, 0,5% SDS при комнатной температуре в течение от 30 мин до 1 ч (умеренная строгость); 0,1 × SSC, 0,5% SDS в течение 15-30 мин от температуры гибридизации 68 °С (высокая строгость) и до 0,15 М NaCl в течение 15 мин при 72 °С (очень высокая строгость). Конечная отмывка с низкой строгостью может осуществляться при 0,1 × SSC, при комнатной температуре. Приведенные выше примеры являются только лишь иллюстрацией одного из наборов условий, которые могут использоваться для отмывки фильтров. Специалист в данной области должен знать, что имеются многочисленные рецепты для промывок с различной строгостью. Некоторые другие примеры приведены ниже.

В одном из аспектов условия гибридизации включают стадию отмывки, включающую отмывку в течение 30 мин при комнатной температуре в растворе, содержащем 1 × 150 мМ NaCl, 20 мМ Трис гидрохлорида, рН 7,8, 1 мМ Na 2 EDTA, 0,5% SDS, с последующей 30-минутной отмывкой в свежем растворе.

Нуклеиновые кислоты, которые гибридизируются с зондом, идентифицируются с помощью авторадиографии или других обычных методик.

Указанные выше процедуры могут модифицироваться для идентификации нуклеиновых кислот, имеющих понижающиеся уровни идентичности последовательностей (гомологии) с последовательностью зонда. Например, для получения нуклеиновых кислот с понижающейся идентичностью последовательностей (гомологией) с детектируемым зондом, могут использоваться менее строгие условия. Например, температура гибридизации может уменьшаться шагами по 5 °С от 68 до 42 °С в буфере для гибридизации, имеющем концентрацию Na + приблизительно 1М. После гибридизации фильтр может промываться с помощью 2 × SSC, 0,5% SDS при температуре гибридизации. Эти условия рассматриваются как "умеренные" условия выше 50 °С и "низкие" условия ниже 50 °С. Конкретный пример "умеренных" условий гибридизации - это когда указанная выше гибридизация осуществляется при 55 °С. Конкретный пример условий гибридизации "низкой строгости" - это когда указанная выше гибридизация осуществляется при 45 °С.

Альтернативно, гибридизация может осуществляться в буферах, таких как 6 × SSC, содержащий формамид, при температуре 42 °С. В этом случае концентрация формамида в буфере для гибридизации может понижаться шагами по 5% от 50 до 0% для идентификации клонов, имеющих понижающиеся уровни гомологии к зонду. После гибридизации фильтр может промываться 6 × SSC, 0,5% SDS при 50 °С. Эти условия рассматриваются как "умеренные" условия выше 25% формамида и "низкие" условия ниже 25% формамида. Конкретный пример "умеренных" условий гибридизации - это когда указанная выше гибридизация осуществляется при 30% формамида. Конкретный пример условий гибридизации "низкой строгости" - это когда указанная выше гибридизация осуществляется при 10% формамида.

Однако выбор формата гибридизации может не быть критичным - имеется строгость условий отмывки, которая задает условия, которые определяют, находится ли нуклеиновая кислота в рамках настоящего изобретения. Условия отмывки, используемые для идентификации нуклеиновых кислоты в рамках настоящего изобретения, включают в себя, например: концентрацию соли примерно 0,02 молярной доли при рН 7 и температуру по меньшей мере примерно от 50 °С или примерно 55 примерно до 60 °С; или концентрация соли примерно 0,15 М NaCl при 72 °С в течение примерно 15 мин; или концентрацию соли примерно 0,2 × SSC при температуре по меньшей мере примерно от 50 °С или примерно от 55 примерно до 60 °С в течение примерно от 15 примерно до 20 мин; или комплекс гибридизации промывают дважды раствором с концентрацией соли примерно 2 × SSC, содержащим 0,1% SDS, при комнатной температуре в течение 15 мин, а затем промывают дважды 0,1 × SSC, содержащим 0,1% SDS при 68 °С в течение 15 мин; или эквивалентные условия. См. Sambrook, Tijssen и Ausubel для описания буфера SSC и эквивалентных условий.

Эти способы могут использоваться для выделения или идентификации нуклеиновых кислот по настоящему изобретению. Например, предыдущие способы могут использоваться для выделения или идентификации нуклеиновых кислот, имеющих последовательность по меньшей мере примерно с 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более идентичностью последовательностей (гомологией) с последовательностью нуклеиновых кислот, выбранных из группы, состоящей из одной из последовательностей по настоящему изобретению, или фрагментов, содержащих по меньшей мере примерно 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 или 500 ее последовательных оснований, и последовательностей, комплементарных с ней. Идентичность последовательностей (гомология) может измеряться с использованием алгоритма совмещения. Например, гомологичные полинуклеотиды могут иметь кодирующую последовательность, которая представляет собой встречающийся в природе аллельный вариант одной из кодирующих последовательностей, описанных здесь. Такие аллельные варианты могут иметь замещения, делеции или добавления одного или нескольких нуклеотидов, по сравнению с нуклеиновыми кислотами по настоящему изобретению. В дополнение к этому указанные выше процедуры могут использоваться для выделения нуклеиновых кислот, которые кодируют полипептиды, имеющие по меньшей мере примерно 99, 95%, по меньшей мере 90%, по меньшей мере 85%, по меньшей мере 80%, по меньшей мере 75%, по меньшей мере 70%, по меньшей мере 65%, по меньшей мере 60%, по меньшей мере 55% или по меньшей мере 50% идентичность последовательностей (гомологию) с полипептидом по настоящему изобретению, или фрагментов, содержащих по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 ее последовательных аминокислот, как определяется с использованием алгоритма совмещения последовательностей (например, такого как алгоритм FAST Version 3.0t78 с параметрами по умолчанию).

Зонды олигонуклеотидов и способы их применения.

Настоящее изобретение также предусматривает зонды нуклеиновых кислот, которые могут использоваться, например, для идентификации, амплификации или выделения нуклеиновых кислот, кодирующих полипептид, имеющий активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или его фрагментов, или для идентификации генов фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов зонд содержит по меньшей мере примерно 10 последовательных оснований нуклеиновой кислоты по настоящему изобретению. Альтернативно, зонд по настоящему изобретению может составлять по меньшей мере примерно 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 110, 120, 130, 150 или примерно от 10 до 50, примерно от 20 до 60, примерно от 30 до 70 последовательных оснований последовательности, как приведено в нуклеиновой кислоте по настоящему изобретению. Зонды идентифицируют нуклеиновую кислоту по связыванию и/или гибридизации. Зонды могут использоваться в матрицах по настоящему изобретению, см. обсуждение ниже, включая, например, капиллярные матрицы. Зонды по настоящему изобретению могут также использоваться для выделения других нуклеиновых кислот или полипептидов.

Выделенная и рекомбинантная нуклеиновая кислота по настоящему изобретению, последовательности, комплементарные к ним, или фрагмент, содержащий по меньшей мере примерно 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 или 500 последовательных оснований одной из последовательностей по настоящему изобретению или последовательностей, комплементарных, к ним, также могут использоваться в качестве зондов для определения того, содержит ли биологический образец, такой как образец почвы, организм, имеющий последовательность нуклеиновых кислот по настоящему изобретению, или организм, из которого получается нуклеиновая кислота. В таких процедурах получают биологический образец, потенциально содержащий организм, из которого выделяют нуклеиновую кислоту, и получают нуклеиновые кислоты из образца. Нуклеиновые кислоты приводятся в контакт с зондом в условиях, которые делают возможной специфичную гибридизацию зонда с любыми комплементарными последовательностями из тех, которые там присутствуют.

Когда это необходимо, условия, которые делают возможной специфичную гибридизацию зонда с комплементарными последовательностями, могут определяться посредством помещения зонда в контакте с комплементарными последовательностями из образцов, о которых известно, что они содержат комплементарную последовательность, а также с контрольными последовательностями, которые не содержат комплементарной последовательности. Условия гибридизации, такие как концентрация соли в буфере для гибридизации, концентрация формамида в буфере для гибридизации или температура гибридизации, могут изменяться для идентификации условий, которые делают возможной специфичную гибридизацию зонда с комплементарными нуклеиновыми кислотами.

Если образец содержит организм, из которого выделена нуклеиновая кислота, тогда детектируется специфичная гибридизация зонда. Гибридизация может детектироваться посредством мечения зонда с помощью детектируемого агента, такого как радиоактивный изотоп, флуоресцентный краситель или фермент, способный катализировать образование детектируемого продукта.

Специалистам в данной области известно множество способов использования меченых зондов для детекции присутствия комплементарных нуклеиновых кислот в образце. Они включают Саузерн-блоттинг, Нозерн-блоттинг, процедуры гибридизации колоний и дотблоттинг. Протоколы каждой из этих процедур приводятся в Ausubel et al. Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. (1997) and Sambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed., Cold Spring Harbor Laboratory Press (1989).

Альтернативно, может использоваться более одного зонда (по меньшей мере, таких, которые способны к специфичной гибридизации с любыми комплементарными последовательностями, которые присутствуют в образце нуклеиновых кислот) в реакции амплификации, для определения того, содержит ли образец организм, содержащий последовательность нуклеиновых кислот по настоящему изобретению (например, организм, из которого выделена нуклеиновая кислота). В одном из аспектов зонды содержат олигонуклеотиды. В одном из аспектов реакция амплификации может включать реакцию PCR. Протоколы PCR описаны в Ausubel и Sambrook, выше. Альтернативно, амплификация может включать цепную реакцию лигазы, LSR, или реакцию замещения нити (см., Barany, F., "The Ligase Chain Reaction in PCR World", PCR Methods and Applications 1:5-16, 1991; E. Fahy et al., "Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR", PCR Methods and Applications 1:25-33, 1991; и Walker G.T. et al., "Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique", Nucleic Acid Research 20:1691-1696, 1992). В таких процедурах нуклеиновые кислоты в образце приводятся в контакт с зондами, осуществляется реакция амплификации и детектируется любой полученный продукт амплификации. Продукт амплификации может детектироваться посредством осуществления гель-электрофореза продуктов реакции и окрашивания геля интеркалирующим красителем, таким как этидий бромид. Альтернативно, один или несколько зондов могут метиться радиоактивным изотопом, и присутствие радиоактивного продукта амплификации может детектироваться посредством авторадиографии после гель-электрофореза.

Зонды, полученные от последовательностей вблизи концов последовательностей по настоящему изобретению, могут также использоваться в процедурах с блуждающей хромосомой для идентификации клонов, содержащих геномные последовательности, расположенные вблизи последовательностей по настоящему изобретению. Такие способы делают возможным выделение генов, которые кодируют дополнительные белки из организма хозяина.

В одном из аспектов выделенные или рекомбинантные нуклеиновые кислоты по настоящему изобретению, последовательности, комплементарные к ним, или фрагмент, содержащий по меньшей мере 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 или 500 либо более последовательных оснований одной из последовательностей по настоящему изобретению, или последовательностей, комплементарных к ним, используются в качестве зондов для идентификации и выделения родственных нуклеиновых кислот. В некоторых аспектах родственные нуклеиновые кислоты могут представлять собой цДНК или геномную ДНК из организмов, иных, чем организм, из которого выделяется нуклеиновая кислота. Например, другие организмы могут представлять собой родственные организмы. В таких процедурах образец нуклеиновой кислоты приводится в контакт с зондом в условиях, которые делают возможной специфичную гибридизацию зонда с родственными последовательностями. Гибридизация зонда с нуклеиновыми кислотами из родственного организма затем детектируется с использованием любого из способов, описанных выше.

Посредством изменения строгости условий гибридизации, используемых для идентификации нуклеиновых кислот, таких как цДНК или геномная ДНК, которые гибридизируются с детектируемым зондом, могут идентифицироваться и выделяться нуклеиновые кислоты, имеющие различные уровни гомологии к зонду. Строгость может изменяться посредством осуществления гибридизации при различных температурах, ниже температур плавления зондов. Температура плавления, T m , представляет собой температуру (при определенной ионной силе и рН), при которой 50% целевой последовательности гибридизируется с идеально комплементарным зондом. Очень строгие условия выбираются как температура, которая должна быть равна T m для конкретного зонда или примерно на 5 °С ниже, чем она. Температура плавления зонда может вычисляться с использованием следующих формул.

Для зондов в пределах между 14 и 70 нуклеотидами в длину температура плавления (T m ) вычисляется с использованием формулы: T m =81,5+16,6(log[Na + ])+0,41 (доля G+C)-(600/N), где N представляет собой длину зонда.

Если гибридизацию осуществляют в растворе, содержащем формамид, температура плавления может вычисляться с использованием уравнения: T m =81,5+16,6(log[Na + ])+0,41 (доля G+C)-(0,63% формамида)-(600/N), где N представляет собой длину зонда.

Предварительная гибридизация может осуществляться в 6 × SSC, 5 × реактива Денхардта, 0,5% SDS, 100 мкг денатурированной фрагментированной ДНК молок лосося или 6 × SSC, 5 × реагента Денхардта, 0,5% SDS, 100 мкг денатурированной фрагментированной ДНК молок лосося, 50% формамида. Формулы для растворов SSC и реактива Денхардта приведены в Sambrook et al. выше.

В одном из аспектов гибридизацию осуществляют посредством добавления детектируемого зонда в растворы для предварительной гибридизации, перечисленные выше. Когда зонд содержит двухцепочечную ДНК, она денатурируется перед добавлением к раствору для гибридизации. В одном из аспектов фильтр приводится в контакт с раствором для гибридизации в течение достаточного периода времени, чтобы дать возможность зонду для гибридизации с цДНК или геномными ДНК, содержащими последовательности, комплементарные к нему или гомологичные к нему. Для зондов более 200 нуклеотидов в длину, гибридизация может осуществляться при температуре на 15-25 °С ниже T m . Для более коротких зондов, таких как олигонуклеотидные зонды, гибридизация может осуществляться при температуре на 5-10 °С ниже T m . В одном из аспектов для гибридизации в 6 × SSC, гибридизацию осуществляют приблизительно при 68 °С. Обычно, для гибридизации в растворах, содержащих 50% формамида, гибридизацию осуществляют приблизительно при 42 °С.

Ингибирование экспрессии ферментов целлюлаз.

Настоящее изобретение предусматривает нуклеиновые кислоты, комплементарные (например, антисмысловые последовательности к ним) к нуклеиновым кислотам по настоящему изобретению, например к нуклеиновым кислотам, кодирующим фермент целлюлазу, например нуклеиновым кислотам, содержащим антисмысловую последовательность, si-РНК, mi-РНК, рибозимы. Нуклеиновые кислоты по настоящему изобретению, содержащие антисмысловые последовательности, могут быть способными к ингибированию переноса, сплайсинга или транскрипции генов, кодирующих фермент целлюлозу. Ингибирование может осуществляться посредством нацеливания геномной ДНК или мессенджерной РНК. Транскрипция или функционирование целевой нуклеиновой кислоты может ингибироваться, например, посредством гибридизации и/или расщепления. Один из примерных наборов ингибиторов, предусматриваемых по настоящему изобретению, включает олигонуклеотиды, которые способны связывать либо ген фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, либо мессенджер, в любом случае предотвращая или ингибируя продуцирование или функционирование фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Ассоциирование может происходить посредством специфичной гибридизации последовательностей. Другой полезный класс ингибиторов включает олигонуклеотиды, которые вызывают инактивирование или расщепление мессенджера фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Олигонуклеотид может иметь активность фермента, который вызывает такое расщепление, такого как рибозимы. Олигонуклеотид может химически модифицироваться или конъюгироваться с ферментом или композицией, способной к расщеплению комплементарной нуклеиновой кислоты. Пул из множества различных таких олигонуклеотидов может подвергаться скринингу на олигонуклеотиды с желаемой активностью. Таким образом, настоящее изобретение предусматривает различные композиции для ингибирования экспрессии фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, на уровне нуклеиновой кислоты и/или белка, например, антисмысловой последовательности, si-РНК, mi-РНК и рибозимов, содержащих последовательности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению, и антител антицеллюлаза, например антиэндоглюканаза, антицеллобиогидролаза и/или анти-бета-глюкозидаза по настоящему изобретению.

Ингибирование экспрессии ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, может иметь множество промышленных применений. Например, ингибирование экспрессии фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы может замедлить или предотвратить деградацию. В одном из аспектов композиции по настоящему изобретению, которые ингибируют экспрессию и/или активность ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, например, антител, антисмысловых олигонуклеотидов, рибозимов, si-РНК и mi-РНК, используются для замедления или предотвращения деградации. Таким образом, в одном из аспектов настоящее изобретение относится к способам и композициям, включающим нанесение на растение или продукт растения (например, зерновую культуру, зерно, плод, семя, корень, лист и т.п.) антител, антисмысловых олигонуклеотидов, рибозимов, si-РНК и mi-РНК по настоящему изобретению для замедления или предотвращения деградации. Эти композиции также могут экспрессироваться растением (например, трансгенным растением) или другим организмом (например, бактерией или другим микроорганизмом, трансформированным с помощью гена фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению).

Композиции по настоящему изобретению для ингибирования экспрессии фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы (например, антисмысловые последовательности, i-РНК, рибозимы, антитела), могут использоваться в фармацевтических композициях, например, в качестве антипатогенных агентов, или в других видах терапии, например, в виде антимикробных средств, например, против Salmonella.

Антисмыловые олигонуклеотиды.

Настоящее изобретение предусматривает антисмысловые олигонуклеотиды, способные к связыванию мессенджера фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, которые в одном из аспектов могут ингибировать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, посредством нацеливания m-РНК. Стратегии для конструирования антисмысловых олигонуклеотидов хорошо описаны в научной и патентной литературе, и специалист в данной области может сконструировать такие олигонуклеотиды ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с использованием новых реагентов по настоящему изобретению. Например, протоколы картирования блуждающего гена/РНК для скрининга эффективных антисмысловых олигонуклеотидов хорошо известны в данной области, см., например, Но (2000), Methods Enzymol. 314:168-183, описывающую анализ картирования РНК, которое основывается на стандартных молекулярных методиках, для создания простого и надежного способа для выбора сильнодействующей антисмысловой последовательности. См. также Smith (2000), Eur. J. Pharm. Sci. 11:191-198.

Встречающиеся в природе нуклеиновые кислоты используются в качестве антисмысловых олигонуклеотидов. Антисмысловые олигонуклеотиды могут быть любой длины; например, в альтернативных аспектах антисмысловые олигонуклеотиды находятся в пределах примерно между 5 и 100, примерно 10 и 80, примерно 15 и 60, примерно 18 и 40 пар оснований. Оптимальная длина может определяться посредством рутинного скрининга. Антисмысловые олигонуклеотиды могут присутствовать при любой концентрации. Оптимальная концентрация может определяться посредством рутинного скрининга. Известно большое разнообразие синтетических, не встречающихся в природе аналогов нуклеотидов и нуклеиновых кислот, которые могут решить эту потенциальную проблему. Например, могут использоваться пептидно-нуклеиновые кислоты (PNA), содержащие неионные основные цепи, такие как единицы N-(2-аминоэтил)глицина. Антисмысловые олигонуклеотиды, имеющие фосфоротиоатные связи, также могут использоваться, как описано в заявках на Международный патент WO 97/03211; WO 96/39154; Mata (1997), Toxicol Appl Pharmacol 144:189-197; Antisense Therapeutics, ed. Agrawal (Humana Press, Totowa, N.J., 1996). Антисмысловые олигонуклеотиды, имеющие синтетические аналоги основной цепи ДНК, предусматриваемые настоящим изобретением, могут также включать фосфородитиоатную, метилфосфонатную, фосфорамидатную, алкилфосфотриэфирную, сульфаматную, 3'-тиоацеталевую, метилен(метилимино), 3'-N-карбаматную и морфолинокарбаматную нуклеиновые кислоты, как описано выше.

Методика комбинаторной химии может использоваться для создания очень больших количеств олигонуклеотидов, которые могут подвергаться быстрому скринингу на конкретные олигонуклеотиды, которые имеют соответствующие аффинности и специфичности связывания по отношению к любой мишени, такой как смысловая и антисмысловая последовательности ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению (см., например, Gold (1995), J. of Biol. Chem. 270:13581-13584).

Ингибиторные рибозимы.

Настоящее изобретение предусматривает рибозимы, способные связывать мессенджер фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Эти рибозимы могут ингибировать активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, например, посредством нацеливания m-РНК. Стратегии для конструирования рибозимов и выбора антисмысловой последовательности, специфичной к ферменту целлюлазе, например эндоглюканазе, целлобиогидролазе, маннаназе и/или бета-глюкозидазе, для нацеливания хорошо описаны в научной и патентной литературе, и специалист в данной области может сконструировать такие рибозимы с использованием новых реагентов по настоящему изобретению. Рибозимы действуют, связываясь с целевой РНК посредством части связывания с целевой РНК рибозима, которая удерживается в тесной близости к ферментативной части РНК, которая расщепляет целевую РНК. Таким образом, рибозим распознает целевую РНК и связывается с ней посредством спаривания комплементарных оснований, и после связывания с правильным сайтом действует ферметативно, расщепляя и инактивируя целевую РНК. Расщепление целевой РНК, таким образом, будет разрушать ее способность к направлению синтеза кодируемого белка, если расщепление происходит в кодирующей последовательности. После того как рибозим связывает и расщепляет свою целевую РНК, он может высвобождаться с этой РНК, чтобы многократно связывать и расщеплять новые мишени.

В некоторых обстоятельствах ферментативная природа рибозима может быть преимущественной по сравнению с другими методиками, такими как антисмысловая методика (где молекула нуклеиновой кислоты просто связывается с мишенью нуклеиновой кислоты, с блокированием ее транскрипции, трансляции или ассоциации с другой молекулой), поскольку эффективная концентрация рибозима, необходимая для осуществления терапевтического лечения, может быть ниже, чем у антисмыслового олигонуклеотида. Это потенциальное преимущество отражает способность рибозима действовать ферметативно. Таким образом, одна молекула рибозима способна расщепить множество молекул целевой РНК. В одном из аспектов рибозим представляет собой высокоспецифичный ингибитор, со специфичностью ингибирования, зависящей не только от механизма спаривания связывающихся оснований, но также и механизма, посредством которого молекула ингибирует экспрессию РНК, с которой она связывается. То есть, ингибирование вызывается расщеплением целевой РНК, и поэтому специфичность определяется как отношение скорости расщепления целевой РНК к скорости расщепления нецелевой РНК. Этот механизм расщепления зависит от факторов, дополнительных к тем, которые вовлечены в спаривание оснований. Таким образом, специфичность действия рибозима может быть большей, чем у антисмыслового олигонуклеотида, связывающего тот же сайт РНК.

Рибозим по настоящему изобретению, например молекула ферментативного рибозима РНК, может иметь форму в виде головки молотка мотива, шпилечного мотива, мотив вируса гепатита дельта, мотив интрона группы I и/или РНКазыР-подобной РНК в ассоциации с руководящей последовательностью РНК. Примеры в виде головки молотка мотивов описываются, например, Rossi (1992), Aids Research and Human Retroviruses 8:183; шпилечные мотивы Hampel (1989), Biochemistry 28:4929, and Hampel (1990), Nuc. Acids Res. 18:299; мотив вируса гепатита дельта Perrotta (1992), Biochemistry 31:16; мотив РНКазыР Guerrier-Takada (1983), Cell 35:849; и интрона группы I Cech, патент США № 4987071. Перечисление этих конкретных мотивов не рассматривается как ограничивающее. Специалист в данной области заметит, что рибозим по настоящему изобретению, например, молекула ферментативной РНК по настоящему изобретению, может иметь сайт специфичного связывания с субстратом, комплементарный к одной или нескольким областям целевой генной РНК. Рибозим по настоящему изобретению может иметь последовательность нуклеотидов внутри этого сайта связывания с субстратом, или окружающую его, которая придает молекуле активность расщепления РНК.

Интерференция РНК (РНК-i).

В одном из аспектов настоящее изобретение предусматривает ингибиторную молекулу РНК, так называемую молекулу "РНК-i", содержащую последовательность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению. Молекула РНК-i может включать двухцепочечную молекулу РНК (ds-РНК), например si-РНК и/или mi-РНК. Молекула РНК-i, например si-РНК и/или mi-РНК, может ингибировать экспрессию гена фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов молекула РНК-i, например si-РНК и/или mi-РНК, имеет длину примерно 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 или более дуплексных нуклеотидов. Хотя настоящее изобретение не является ограниченным каким-либо конкретным механизмом действия, РНК-i может проникать в клетку и вызывать деградацию одноцепочечной РНК (ss-РНК), сходных или идентичных последовательностей, включая эндогенные m-РНК. Когда клетка экспонируется для двухцепочечных РНК (ds-РНК), m-РНК из гомологичного гена селективно деградируется посредством способа, называемого интерференция РНК (РНК-i). Возможный основной механизм, стоящий за РНК-i, представляет собой разрыв двухцепочечной РНК (ds-РНК), разделяющий конкретную генную последовательность на короткие куски, называемыми короткими интерферирующими РНК, которые запускают деградацию m-РНК, которая соответствует ее последовательности. В одном из аспектов РНК-i по настоящему изобретению используются в генной терапии молчащих генов, см., например, Shuey (2002), Drug Discov. Today 7:1040-1046. В одном из аспектов настоящее изобретение относится к способам селективной деградации РНК с использованием молекул РНК-i, например si-РНК и/или mi-РНК, по настоящему изобретению. Способ может осуществляться in vitro, ex vivo или in vivo. В одном из аспектов молекулы РНК-i по настоящему изобретению могут использоваться для генерирования мутации в клетке, органе или животном, вызывающей потерю функции. Способы получения и использования молекул РНК-i, например, si-РНК и/или mi-РНК, для селективной деградации РНК хорошо известны в данной области, см., например, патенты США № 6506559; 6511824; 6515109; 6489127.

Модификация нуклеиновых кислоты - получение вариантов ферментов по настоящему изобретению.

Настоящее изобретение относится к способам генерирования вариантов нуклеиновых кислот по настоящему изобретению, например нуклеиновых кислот, кодирующих фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу. Эти способы могут повторяться или использоваться в различных сочетаниях для генерирования ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, имеющих измененную или отличную активность, или измененную или отличную стабильность, по сравнению со свойствами фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, кодируемого матричной нуклеиновой кислотой. Эти способы также могут повторяться или использоваться в различных сочетаниях, например, для генерирования вариаций при экспрессии гена/мессенджера, при транслировании мессенджера или в стабильности мессенджера. В другом аспекте генетическая композиция клетки может изменяться посредством, например, модификации гомологичного гена ex vivo, с последующей его повторной вставкой в клетку.

Например, в одном из аспектов настоящее изобретение относится к выделенным или рекомбинантным нуклеиновым кислотам, имеющим последовательность, содержащую по меньшей мере одну модификацию остатка основания нуклеотида из SEQ ID NO:163, где модификация включает одно или несколько из следующих изменений: нуклеотид в любом из положений от 265 до 267 модифицируется как CGT, CGC, CGA, CGG, AGA или AGG; нуклеотид в любом из положений от 307 от 309 модифицируется как GGT, GGC, GGA или GGG; нуклеотид в любом из положений от 328 до 330 модифицируется как GGT, GGC, GGA или GGG; нуклеотид в любом из положений от 340 до 342 модифицируется как ТТА, TTG, СТТ, СТС, СТА или CTG; нуклеотид в любом из положений от 469 до 471 модифицируется как ТСТ, ТСС, ТСА, TCG, AGT или AGC; нуклеотид в любом из положений от 1441 до 1443 модифицируется как ТТТ или ТТС; нуклеотид в любом из положений от 1648 до 1650 модифицируется как ААТ или ААС; или нуклеотид в любом из положений от 1768 до 1770 модифицируется как CGT, CGC, CGA, CGG, AGA или AGG. В другом аспекте настоящее изобретение предусматривает выделенные или рекомбинантные полипептиды, имеющие последовательность, содержащую по меньшей мере одну модификацию остатка аминокислоты из SEQ ID NO:164, где модификация включает одно или несколько из следующих изменений: метионин в положении аминокислоты 89 модифицируется как аргинин; фенилаланин в положении аминокислоты 103 модифицируется как глицин; пролин в положении аминокислоты 110 модифицируется как глицин; тирозин в положении аминокислоты 114 модифицируется как лейцин; аланин в положении аминокислоты 157 модифицируется как серин; триптофан в положении аминокислоты 481 модифицируется как фенилаланин; пролин в положении аминокислоты 550 модифицируется как аспарагин или глицин в положении аминокислоты 590 модифицируется как аргинин.

В другом аспекте настоящее изобретение относится к выделенным или рекомбинантным нуклеиновым кислотам, имеющим последовательность, содержащую модификацию последовательности остатков нуклеотидов примерной последовательности по настоящему изобретению (например, SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11 и т.п.), где модификация включает одно или несколько из следующих изменений: нуклеотид в эквиваленте любого из положений 265-267 SEQ ID NO:163 изменяется на CGT, CGC, CGA, CGG, AGA или AGG; нуклеотид в эквиваленте любого из положений 307-309 SEQ ID NO:163 изменяется на GGT, GGC, GGA или GGG; нуклеотид в эквиваленте любого из положений 328-330 SEQ ID NO:163 изменяется на GGT, GGC, GGA или GGG; нуклеотид в эквиваленте любого из положений 340-342 SEQ ID NO:163 изменяется на ТТА, TTG, СТТ, СТС, СТА или CTG; нуклеотид в эквиваленте любого из положений 469-471 SEQ ID NO:163 изменяется на ТСТ, ТСС, ТСА, TCG, AGT или AGC; нуклеотид в эквиваленте положений 1441-1443 SEQ ID NO:163 изменяется на ТТТ или ТТС; нуклеотид в эквиваленте любого из положений 1648-1650 SEQ ID NO:163 изменяется на ААТ или ААС; или нуклеотид в эквиваленте любого из положений 1768-1770 SEQ ID NO:163 изменяется на CGT, CGC, CGA, CGG, AGA или AGG. В другом аспекте настоящее изобретение предусматривает выделенные или рекомбинантные нуклеиновые кислоты, имеющие последовательность, содержащую модификацию последовательности остатков нуклеотидов любой нуклеиновой кислоты по настоящему изобретению, где модификация включает одно или несколько из следующих изменений: нуклеотид в эквиваленте любого из положений 265-267 SEQ ID NO:163 изменяется на CGT, CGC, CGA, CGG, AGA или AGG; нуклеотид в эквиваленте любого из положений 307-309 SEQ ID NO:163 изменяется на GGT, GGC, GGA или GGG; нуклеотид в эквиваленте любого из положений 328-330 SEQ ID NO:163 изменяется на GGT, GGC, GGA или GGG; нуклеотид в эквиваленте любого из положений 340-342 SEQ ID NO:163 изменяется на ТТА, TTG, СТТ, СТС, СТА или CTG; нуклеотид в эквиваленте любого из положений 469-471 SEQ ID NO:163 изменяется на TCT, ТСС, ТСА, TCG, AGT или AGC; нуклеотид в эквиваленте положений 1441-1443 SEQ ID NO:163 изменяется на ТТТ или ТТС; нуклеотид в эквиваленте любого из положений 1648-1650 SEQ ID NO:163 изменяется на ААТ или ААС; или нуклеотид в эквиваленте любого из положений 1768-1770 SEQ ID NO:163 изменяется на CGT, CGC, CGA, CGG, AGA или AGG.

В другом аспекте настоящее изобретение относится к выделенным или рекомбинантным полипептидам, имеющим последовательность, содержащую модификацию остатка аминокислоты примерной последовательности по настоящему изобретению (например, SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10 и т.п.), где модификация включает одно или несколько из следующих изменений: аминокислота в эквиваленте метионина в положении аминокислоты 89 SEQ ID NO:164 изменяется на аргинин; аминокислота в эквиваленте фенилаланина в положении аминокислоты 103 SEQ ID NO:164 изменяется на глицин; аминокислота в эквиваленте пролина в положении аминокислоты 110 SEQ ID NO:164 изменяется на глицин; аминокислота в эквиваленте тирозина в положении аминокислоты 114 SEQ ID NO:164 изменяется на лейцин; аминокислота в эквиваленте аланина в положении аминокислоты 157 SEQ ID NO:164 изменяется на серин; аминокислота в эквиваленте триптофана в положении аминокислоты 481 SEQ ID NO:164 изменяется на фенилаланин; аминокислота в эквиваленте пролина в положении аминокислоты 550 SEQ ID NO:164 изменяется на аспарагин; или аминокислота в эквиваленте глицина в положении аминокислоты 590 SEQ ID NO:164 изменяется на аргинин.

В другом аспекте настоящее изобретение относится к выделенным или рекомбинантным полипептидам, имеющим последовательность, содержащую модификацию остатка аминокислоты любого полипептида по настоящему изобретению, где модификация включает одно или несколько из следующих изменений: аминокислота в эквиваленте метионина в положении аминокислоты 89 SEQ ID NO:164 изменяется на аргинин; аминокислота эквивалент фенилаланина в положении аминокислоты 103 SEQ ID NO:164 изменяется на глицин; аминокислота в эквиваленте пролина в положении аминокислоты 110 SEQ ID NO:164 изменяется на глицин; аминокислота в эквиваленте тирозина в положении аминокислоты 114 SEQ ID NO:164 изменяется на лейцин; аминокислота в эквиваленте аланина в положении аминокислоты 157 SEQ ID NO:164 изменяется на серин; аминокислота в эквиваленте триптофана в положении аминокислоты 481 SEQ ID NO:164 изменяется на фенилаланин; аминокислота в эквиваленте пролина в положении аминокислоты 550 SEQ ID NO:164 изменяется на аспарагин или аминокислота в эквиваленте глицина в положении аминокислоты 590 SEQ ID NO:164 изменяется на аргинин.

Нуклеиновая кислота по настоящему изобретению может изменяться с помощью любых средств, например, случайных или стохастических способов, или нестохастических способов, или способов "направленной эволюции", см., например, патент США № 6361974. Способы случайной мутации генов хорошо известны в данной области, см., например, патент США № 5830696. Например, мутагены могут использоваться для создания случайных мутаций гена. Мутагены включают в себя, например, ультрафиолетовый свет или гамма-излучение, или химический мутаген, например митомицин, азотистую кислоту, фотоактивируемые псоралены, по одному или в сочетании, для индуцирования разрывов ДНК, доступных для репарации посредством рекомбинации. Другие химические мутагены включают в себя, например, бисульфит натрия, азотистую кислоту, гидроксиламин, гидразин или муравьиную кислоту. Другие мутагены представляют собой аналоги предшественников нуклеотидов, например, нитрозогуанидин, 5-бромурацил, 2-аминопурин или акридин. Эти агенты могут добавляться в реакцию PCR вместо предшественника нуклеотида, тем самым вызывая мутацию в последовательности. Также могут использоваться интеркалирующие агенты, такие как профлавин, акрифлавин, хинакрин и т.п.

Может использоваться любая методика молекулярной биологии, например, случайный PCR мутагенез, см., например, Rice (1992), Proc. Natl. Acad. Sci. USA 89:5467-5471; или комбинаторный групповой кассетный мутагенез, см., например, Crameri (1995), Biotechniques 18:194-196. Альтернативно, нуклеиновые кислоты, например гены, могут повторно собираться вместе после случайного или "стохастического" фрагментирования, см., например, патенты США № 6291242; 6287862; 6287861; 5955358; 5830721; 5824514; 5811238; 5605793. В альтернативных аспектах модификации, добавления или делеции вводятся посредством ошибочно направленной PCR, шаффлинга, олигонуклеотид-направленного мутагенеза, PCR сборки, мутагенеза посредством половой PCR, мутагенеза in vivo, кассетного мутагенеза, рекурсивного группового мутагенеза, экспоненциального группового мутагенеза, сайт-специфичного мутагенеза, перестановки генов, насыщающего мутагенеза генных сайтов (GSSM), перестановки искусственным лигированием (SLR), рекомбинации, рекурсивной рекомбинации последовательностей, мутагенеза фосфотиоат-модифицированной ДНК, мутагенеза урацил-содержащего шаблона, дуплексного мутагенеза с разрывами, мутагенеза с репарацией точечных несовпадений, мутагенеза штамма хозяина с дефицитом репарационной способности, химического мутагенеза, радиогенного мутагенеза, делеционного мутагенеза, рестрикционно-селекционного мутагенеза, мутагенеза с применением рестрикции и очистки, синтеза искусственных генов, группового мутагенеза, создания мультимеров химерных нуклеиновых кислот, хромосомального насыщающего мутагенеза (CSM) и/или сочетания этих и других способов.

Следующие публикации описывают разнообразные процедуры и/или способы рекурсивной рекомбинации, которые могут быть включены в способы по настоящему изобретению: Stemmer (1999), "Molecular breeding of viruses for targeting and other clinical properties" Tumor Targeting 4:1-4; Ness (1999), Nature Biotechnology 17:893-896; Chang (1999), "Evolution of a cytokine using DNA family shuffling" Nature Biotechnology 17:793-797; Minshull (1999), "Protein evolution by molecular breeding" Current Opinion in Chemical Biology 3:284-290; Christians (1999), "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling" Nature Biotechnology 17:259-264; Crameri (1998), "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature 391:288-291; Crameri (1997), "Molecular evolution of an arsenate detoxification pathway by DNA shuffling", Nature Biotechnology 15:436-438; Zhang (1997), "Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening" Proc. Natl. Acad. Sci. USA 94:4504-4509; Patten et al. (1997), "Applications of DNA Shuffling to Pharmaceuticals and Vaccines" Current Opinion in Biotechnology 8:724-733; Crameri et al. (1996), "Construction and evolution of antibody-phage libraries by DNA shuffling" Nature Medicine 2:100-103; Gates et al. (1996), "Affinity selective isolation of ligands from peptide libraries through display on a lac repressor 'headpiece dimer" Journal of Molecular Biology 255:373-386; Stemmer (1996), "Sexual PCR and Assembly PCR" In: The Encyclopedia of Molecular Biology. VCH Publishers, New York, p. 447-457; Crameri and Stemmer (1995), "Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes" BioTechniques 18:194-195; Stemmer et al. (1995), "Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides" Gene, 164:49-53; Stemmer (1995), "The Evolution of Molecular Computation" Science 270:1510; Stemmer (1995), "Searching Sequence Space" Bio/Technology 13:549-553; Stemmer (1994), "Rapid evolution of a protein in vitro by DNA shuffling" Nature 370:389-391; and Stemmer (1994), "DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution". Proc. Natl. Acad. Sci. USA 91:10747-10751.

Мутационные способы генеририрования разнообразия включают в себя, например, сайт-направленный мутагенез (Ling et al. (1997), "Approaches to DNA mutagenesis: an overview" Anal Biochem. 254(2):157-178; Dale et al. (1996), "Oligonucleotide-directed random mutagenesis using the phosphorothioate method" Methods Mol. Biol. 57:369-374; Smith (1985), "In vitro mutagenesis" Ann. Rev. Genet. 19:423-462; Botstein & Shortle (1985), "Strategies and applications of in vitro mutagenesis" Science 229:1193-1201; Carter (1986), "Site-directed mutagenesis" Biochem. J. 237:1-7; and Kunkel (1987), "The efficiency of oligonucleotide directed mutagenesis" in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, D. M. J. eds., Springer Verlag, Berlin)); mutagenesis using uracil containing templates (Kunkel (1985), "Rapid and efficient site-specific mutagenesis without phenotypic selection" Proc. Natl. Acad. Sci. USA 82:488-492; Kunkel et al. (1987), "Rapid and efficient site-specific mutagenesis without phenotypic selection" Methods in Enzymol. 154, 367-382; and Bass et al. (1988), "Mutant Trp repressors with new DNA-binding specificities" Science 242:240-245); oligonucleotide-directed mutagenesis (Methods in Enzymol. 100:468-500 (1983); Methods in Enzymol. 154:329-350 (1987); Zoller (1982), "Oligonucleotide-directed mutagenesis using M13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment" Nucleic Acids Res. 10:6487-6500; Zoller & Smith (1983), "Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors" Methods in Enzymol. 100:468-500; and Zoller (1987), Oligonucleotide-directed mutagenesis: a simple method using two oligonucleotide primers and a single-stranded DNA template" Methods in Enzymol. 154:329-350); phosphorothioate-modified DNA mutagenesis (Taylor (1985), "The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA" Nucl. Acids Res. 13:8749-8764; Taylor (1985), "The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA" Nucl. Acids Res. 13:8765-8787 (1985); Nakamaye (1986), "Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis" Nucl. Acids Res. 14:9679-9698; Sayers (1988), "Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis" Nucl. Acids Res. 16:791-802; and Sayers et al. (1988), "Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide" Nucl. Acids Res. 16:803-814); mutagenesis using gapped duplex DNA (Kramer et al. (1984), "The gapped duplex DNA approach to oligonucleotide-directed mutation construction" Nucl. Acids Res. 12:9441-9456; Kramer & Fritz (1987), Methods in Enzymol. "Oligonucleotide-directed construction of mutations via gapped duplex DNA" 154:350-367; Kramer (1988), "Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations" Nucl. Acids Res. 16:7207; and Fritz (1988), "Oligonucleotide-directed construction of mutations: a gapped duplex DNA procedure without enzymatic reactions in vitro" Nucl. Acids Res. 16:6987-6999).

Дополнительные протоколы, которые могут использоваться для осуществления настоящего изобретения, включают в себя репарацию точечных несовпадений (Kramer (1984), "Point Mismatch Repair" Cell 38:879-887), мутагенез с использованием репарационно-дефицитных штаммов хозяев (Carter et al. (1985), "Improved oligonucleotide site-directed mutagenesis using M13 vectors" Nucl. Acids Res. 13:4431-4443; и Carter (1987), "Improved oligonucleotide-directed mutagenesis using M13 vectors" Methods in Enzymol. 154:382-403), делеционный мутагенез (Eghtedarzadeh (1986), "Use of oligonucleotides to generate large deletions" Nucl. Acids Res. "14:5115), рестрикцию-селекцию и рестрикцию-селекцию с рестрикцией-очисткой (Wells et al. (1986), "Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin" Phil. Trans. R. Soc. Lond. A 317:415-423), мутагенез посредством полного синтеза генов (Nambiar et al. (1984), "Total synthesis and cloning of a gene coding for the ribonuclease S protein" Science 223:1299-1301; Sakamar and Khorana (1988), "Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin)" Nucl. Acids Res. 14:6361-6372; Wells et al. (1985), "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites" Gene 34:315-323; and Grundstrom et al. (1985), "Oligonucleotide-directed mutagenesis by microscale "shot-gun' gene synthesis" Nucl. Acids Res. 13:3305-3316), double-strand break repair (Mandecki (1986); Arnold (1993), "Protein engineering for unusual environments" Current Opinion in Biotechnology 4:450-455. "Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli: a method for site-specific mutagenesis" Proc. Natl. Acad. Sci. USA, 83:7177-7181). Дополнительные детали относительно многих из указанных выше способов можно найти в Methods in Enzymology, Volume 154, которая также описывает полезные контроли для устранения проблем в различных способах мутагенеза.

Протоколы, которые могут использоваться для осуществления настоящего изобретения, описаны, например, в патенте США № 5605793 to Stemmer (Feb. 25, 1997), "Methods for In Vitro Recombination"; в патенте США № 5811238 to Stemmer et al. (Sep. 22, 1998) "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; в патенте США № 5830721 to Stemmer et al. (Nov. 3, 1998), "DNA Mutagenesis by Random Fragmentation and Reassembly"; в патенте США № 5834252 to Stemmer, et al. (Nov. 10, 1998) "End-Complementary Polymerase Reaction"; в патенте США № 5837458 to Minshull, et al. (Nov. 17, 1998), "Methods and Compositions for Cellular and Metabolic Engineering"; в заявке на Международный патент WO 95/22625, Stemmer and Crameri, "Mutagenesis by Random Fragmentation and Reassembly"; в заявке на Международный патент WO 96/33207 by Stemmer and Lipschutz "End Complementary Polymerase Chain Reaction"; в заявке на Международный патент WO 97/20078 by Stemmer and Crameri "Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination"; WO 97/35966 by Minshull and Stemmer, "Methods and Compositions for Cellular and Metabolic Engineering"; в заявке на Международный патент WO 99/41402 by Punnonen et al. "Targeting of Genetic Vaccine Vectors"; в заявке на Международный патент WO 99/41383 by Punnonen et al. "Antigen Library Immunization"; в заявке на Международный патент WO 99/41369 by Punnonen et al. "Genetic Vaccine Vector Engineering"; в заявке на Международный патент WO 99/41368 by Punnonen et al. "Optimization of Immunomodulatory Properties of Genetic Vaccines"; в Европейском патенте ЕР 752008 by Stemmer and Crameri, "DNA Mutagenesis by Random Fragmentation and Reassembly"; EP 0932670 by Stemmer "Evolving Cellular DNA Uptake by Recursive Sequence Recombination"; WO 99/23107 by Stemmer et al., "Modification of Virus Tropism and Host Range by Viral Genome Shuffling"; в заявке на Международный патент WO 99/21979 by Apt et al., "Human Papillomavirus Vectors"; в заявке на Международный патент WO 98/31837 by del Cardayre et al. "Evolution of Whole Cells and Organisms by Recursive Sequence Recombination"; в заявке на Международный патент WO 98/27230 by Patten and Stemmer, "Methods and Compositions for Polypeptide Engineering"; в заявке на Международный патент WO 98/27230 by Stemmer et al., "Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection", в заявке на Международный патент WO 00/00632, "Methods for Generating Highly Diverse Libraries", в заявке на Международный патент WO 00/09679, "Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks, and Resulting Sequences", в заявке на Международный патент WO 98/42832 by Arnold et al., "Recombination of Polynucleotide Sequences Using Random or Defined Primers", в заявке на Международный патент WO 99/29902 by Arnold et al., "Method for Creating Polynucleotide and Polypeptide Sequences", в заявке на Международный патент WO 98/41653 by Vind, "An in Vitro Method for Construction of a DNA Library", в заявке на Международный патент WO 98/41622 by Borchert et al., "Method for Constructing a Library Using DNA Shuffling, " и в заявке на Международный патент WO 98/42727 by Pati and Zarling, "Sequence Alterations using Homologous Recombination".

Протоколы, которые могут использоваться для осуществления настоящего изобретения (учитывая детали относительно различных способов генерирования разнообразия), описываются, например, в заявке на патент США серийный номер (USSN) 09/407800, "SHUFFLING OF CODON ALTERED GENES" by Patten et al. filed Sep. 28, 1999; "EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION" by del Cardayre et al., в патенте Соединенных Штатов № 6379964; "OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION" by Crameri et al., в патентах Соединенных Штатов № 6319714; 6368861; 6376246; 6423542; 6426224 и PCT/US00/01203; "USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING" by Welch et al., в патенте Соединенных Штатов № 6436675; "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" by Selifonov et al., filed Jan. 18, 2000 (PCT/US00/01202) и, например, "METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDES & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS" by Selifonov et al., filed Jul. 18, 2000 (заявка патент США серийный № 09/618579); "METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS" by Selifonov and Stemmer, filed Jan. 18, 2000 (PCT/US00/01138); и "SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION" by Affholter, filed Sep. 6, 2000 (заявка на патент США серийный № 09/656549); и патентах Соединенных Штатов № 6177263; 6153410.

Нестохастические способы или способы "направленной эволюции" включают в себя, например, насыщающий мутагенез, такой как насыщающий мутагенез генных сайтов (GSSM), перестановку искусственным лигированием (SLR) или их сочетания, и используются для модификации нуклеиновых кислот по настоящему изобретению для генерирования ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с новыми или измененными свойствами (например, с активностью при сильно кислотных или щелочных условиях, высоких или низких температурах и т.п.). Полипептиды, кодируемые модифицированными нуклеиновыми кислотами, могут подвергаться скринингу на активность перед исследованием на гидролиз глюканов или другую активность. Может использоваться любой режим или протокол исследования, например, с использованием платформы капиллярной матрицы. См., например, патенты США № 6361974; 6280926; 5939250.

Насыщающий мутагенез генных сайтов, или GSSM.

Настоящее изобретение также относится к способам получения фермента с использованием насыщающего мутагенеза генных сайтов или GSSM, как описывается здесь, а также в патентах США № 6171820 и 6579258. В одном из аспектов праймеры кодонов, содержащие вырожденную последовательность N,N,G/T, используются для введения точечных мутаций в полинуклеотид, например, фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, или антитела по настоящему изобретению, с тем, чтобы генерировать набор полипептидов потомства, в которых полный набор замещений отдельных аминокислот представлен в каждом положении аминокислоты, например, в остатке аминокислоты в активном сайте фермента или сайта связывания лиганда, предназначенном для модифицирования. Эти олигонуклеотиды могут содержать непрерывную первую гомологичную последовательность, вырожденную последовательность N,N,G/T и, необязательно, вторую гомологичную последовательность. Последующие потомство продуктов трансляции от использования таких олигонуклеотидов включают все возможные изменения аминокислот на каждом сайте аминокислоты вдоль полипептида, поскольку вырождение последовательности N,N,G/T включает кодоны для всех 20 аминокислот. В одном из аспектов один из таких вырожденных олигонуклеотидов (состоящий, например, из одной вырожденной кассеты N,N,G/T) используется для воздействия на каждый исходный кодон в шаблоне родительского полинуклеотида полного диапазона замещений кодона. В другом аспекте используются по меньшей мере две вырожденные кассеты - либо в одном и том же олигонуклеотиде, либо нет, для воздействия по меньшей мере на два исходных кодона в шаблоне родительского полинуклеотида полного диапазона замещений кодона. Например, больше одной последовательности N,N,G/T может содержаться в одном олигонуклеотиде для введения мутаций аминокислот на более чем одном сайте. Это множество последовательностей N,N,G/T может быть непосредственно непрерывным или разделяться одной или несколькими дополнительными последовательностями нуклеотидов. В другом аспекте олигонуклеотиды, пригодные для введения добавлений и делений, могут использоваться либо сами по себе, либо в сочетании с кодонами, содержащими последовательность N,N,G/T, для введения любого сочетания или пермутации добавлений, делеций и/или замещений аминокислот.

В одном из аспектов одновременный мутагенез двух или более непрерывных положений аминокислот осуществляют с использованием олигонуклеотида, который содержит непрерывные триплеты N,N,G/T, т.е. вырожденной последовательности (N,N,G/T) n . В другом аспекте используются вырожденные кассеты, имеющие меньшую вырождение, чем последовательность N,N,G/T. Например, в некоторых случаях может быть желательным использование (например, в олигонуклеотиде) вырожденной триплетной последовательности, состоящей только из одной N, где указанная N может находиться в первом, втором или третьем положении триплета. Любые другие основания, включая любые их сочетания и пермутации, могут использоваться в остальных двух положениях триплета. Альтернативно, в некоторых случаях может быть желательным использование (например, в олиго) вырожденной триплетной последовательности N,N,N.

В одном из аспектов использование вырожденных триплетов (например, триплетов N,N,G/T) делает возможным систематическое и простое генерирование всего диапазона возможных природных аминокислот (в целом, их 20 аминокислот) в каждом и во всех положениях аминокислот в полипептиде (в альтернативных аспектах способы также включают генерирование меньшего, чем вообще возможно, замещений для положения остатка аминокислоты или кодона). Например, для полипептида из 100 аминокислот могут генерироваться 2000 различных видов (т.е. 20 возможных аминокислот на одно положение ×100 положений аминокислот). Посредством использования олигонуклеотида или набора олигонуклеотидов, содержащих вырожденный триплет N,N,G/T, 32 индивидуальных последовательности могут кодировать все 20 возможных природных аминокислот. Таким образом, в реакционной емкости, в которой последовательность родительского полинуклеотида подвергается насыщающему мутагенезу с использованием по меньшей мере одного такого олигонуклеотида, генерируются 32 различных полинуклеотида потомства, кодирующих 20 различных полипептидов. В противоположность, использование невырожденного олигонуклеотида при сайт-направленном мутагенезе приводит к получению только одного продукта потомства полипептидов на реакционную емкость. Невырожденные олигонуклеотиды могут необязательно использоваться в сочетании с описанными вырожденными праймерами; например, невырожденные олигонуклеотиды могут использоваться для генерирования конкретных точечных мутаций в работающем полинуклеотиде. Это обеспечивает одно из средств для генерирования мутаций в конкретных молчащих точках, точечные мутации приводят к соответствующим изменениям аминокислот, и к точечным мутациям, которые вызывают генерирование стоп-кодонов и соответствующую экспрессию фрагментов полипептидов.

В одном из аспектов каждая реакционная емкость для насыщающего мутагенеза содержит полинуклеотиды, кодирующие по меньшей мере 20 молекул потомства полипептидов (например, ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу), так что все 20 природных аминокислот представлены в одном конкретном положении аминокислот, соответствующем положению кодона, мутагенизированного в родительском полинуклеотиде (другие аспекты используют меньшее количество, чем все 20 природных сочетаний). 32-кратно вырожденное потомство полипептидов, генерируемое из каждой реакционной емкости для насыщающего мутагенеза, может подвергаться клональной амплификации (например, клонироваться в соответствующем хозяине, например, хозяине Е.coli, с использованием, например, вектора экспрессии) и подвергаться скринингу на экспрессию. Когда индивидуальное потомство полипептидов идентифицируется посредством скрининга как демонстрирующее благоприятное изменение свойства (по сравнению с родительским полипептидом, такое как повышение активности при гидролизе глюканов при щелочных или кислотных условиях), оно может секвенироваться для идентификации соответствующего благоприятного замещения аминокислот, содержащегося в нем.

В одном из аспектов при мутагенизации каждого и любого положения аминокислоты в родительском полипептиде с использованием насыщающего мутагенеза, как описано здесь, благоприятные изменения аминокислот могут идентифицироваться в более чем одном положении аминокислоты. Могут генерироваться одна или несколько новых молекул потомства, которые содержат сочетание всех или части этих благоприятных замещений аминокислот. Например, если 2 конкретных благоприятных изменения аминокислот идентифицируются в каждом из 3 положений аминокислот в полипептиде, пермутации включают 3 возможности в каждом положении (нет изменений по сравнению с исходной аминокислотой, и каждое из двух благоприятных изменений) и 3 положения. Таким образом, имеются 3 ×3 ×3 или 27 возможностей в целом, включая 7, которые были изучены ранее - 6 отдельных точечных мутаций (т.е. 2 в каждом из трех положений) и отсутствие изменений в каждом положении.

Еще в одном аспекте сайт-насыщающий мутагенез может использоваться вместе со способами шаффлинга, химеризации, рекомбинации и другими способами мутагенизации, вместе со скринингом. Настоящее изобретение предусматривает использование любого способа (способов), включая насыщающий мутагенез, итеративным образом. В одном из воплощений, итеративное использование любого способа (способов) мутагенизации используется в сочетании со скринингом.

Настоящее изобретение также предусматривает использование соответствующих праймеров кодонов (содержащих вырожденную последовательность N,N,N) для введения точечных мутаций в полинуклеотид, с тем, чтобы генерировать набор полипептидов потомства, в которых полный диапазон замещений отдельной аминокислоты представлен в каждом положении аминокислоты (насыщающий мутагенез генных сайтов (GSSM)). Используемые олиго состоят непрерывным образом из первой гомологичной последовательности, вырожденной последовательности N,N,N, и в одном аспекте, но необязательно, второй гомологичной последовательности. Последующее потомство продуктов трансляции от использования таких олиго включает все возможные изменения аминокислот на каждом сайте аминокислоты вдоль полипептида, поскольку вырождение последовательности N,N,N содержит кодоны для всех 20 аминокислот.

В одном из аспектов один такой вырожденный олиго (состоящий из одной вырожденной кассеты N,N,N) используется для воздействия на каждый исходный кодон в шаблоне родительского полинуклеотида полного диапазона замещения кодонов. В другом аспекте используются по меньшей мере две вырожденных кассеты N,N,N - либо в одном и том же олиго, либо нет, для воздействия по меньшей мере на два исходных кодона в шаблоне родительского полинуклеотида полного диапазона замещений кодонов. Таким образом, может содержаться более одной последовательности N,N,N в одном олиго для введения мутаций аминокислот на более чем одном сайте. Это множество последовательностей N,N,N может быть непосредственно, непрерывным, или разделенным одной или несколькими дополнительными последовательностями нуклеотидов. В другом аспекте олиго, пригодные для введения добавлений и делеций, могут использоваться либо сами по себе, либо в сочетании с кодонами, содержащим последовательность N,N,N, для введения любого сочетания или пермутации добавления, делеций и/или замещения аминокислот.

В одном из аспектов является возможной одновременная мутагенизация двух или более непрерывных положений аминокислот с использованием олиго, который содержит непрерывные триплеты N,N,N, т.е. вырожденную последовательность (N,N,N) n . В другом аспекте настоящее изобретение предусматривает использование вырожденных кассет, имеющих меньшую вырождение, чем последовательность N,N,N. Например, может быть желательным в некоторых случаях использование (например, в олиго) вырожденной триплетной последовательности, состоящей только из одного N, где N может находиться в первом, втором или третьем положении триплета. Любые другие основания, включая любые их сочетания и пермутации, могут использоваться в остальных двух положениях триплета. Альтернативно, в некоторых случаях может быть желательным использование (например, в олиго) вырожденной триплетной последовательности N,N,N, N,N,G/T или триплетной последовательности N,N, G/C.

В одном из аспектов использование вырожденного триплета (такого как триплетная последовательность N,N,G/T или N,N, G/C) является преимущественным по нескольким причинам. В одном из аспектов настоящее изобретение предусматривает средства для систематического и достаточно легкого генерирования замещения полного диапазона возможных аминокислот (20 аминокислот в целом) в каждом и любом положении аминокислоты в полипептиде. Таким образом, для полипептида из 100 аминокислот, настоящее изобретение относится к способу для систематического и достаточно легкого генерирования 2000 различных видов (т.е. 20 возможных аминокислот на положение умножить на 100 положений аминокислот). Очевидно, что предусматривается, посредством использования олиго, содержащего вырожденную триплетную последовательность N,N,G/T или N,N, G/C, 32 индивидуальных последовательности, которые кодируют 20 возможных аминокислот. Таким образом, в реакционной емкости, в которой последовательность родительского полинуклеотида подвергается насыщающему мутагенезу с использованием одного такого олиго, генерируются 32 различных полинуклеотидов потомства, кодирующих 20 различных полипептидов. В противоположность этому, использование невырожденного олиго в сайт-направленном мутагенезе приводит только к одному продукту потомства полипептида на реакционную емкость.

Настоящее изобретение также предусматривает использование невырожденных олиго, которые необязательно могут использоваться в сочетании с описанными вырожденными праймерами. Очевидно, что в некоторых ситуациях является преимущественным использование невырожденных олиго для генерирования конкретных точечных мутаций в рабочем полинуклеотиде. Это обеспечивает средства для генерирования конкретных молчащих точечных мутаций, точечных мутаций, приводящих к соответствующим изменениям аминокислот, и точечных мутаций, которые вызывают генерирование стоп-кодонов и соответствующую экспрессию фрагментов полипептидов.

Таким образом, в одном из аспектов настоящего изобретения каждая реакционная емкость для насыщающего мутагенеза содержит полинуклеотиды, кодирующие по меньшей мере 20 молекул потомства полипептидов, так что все 20 аминокислот представлены в одном конкретном положении аминокислоты, соответствующем положению кодона, мутагенизированного в родительском полинуклеотиде. 32-кратно вырожденное потомство полипептидов, генерируемое из каждой реакционной емкости для насыщающего мутагенеза, может подвергаться клональной амплификации (например, клонироваться в соответствующего хозяина Е.coli с использованием вектора экспрессии) и подвергаться скринингу на экспрессию. Когда индивидуальные полипептиды потомства идентифицируются посредством скрининга как демонстрирующее благоприятное изменение свойства (по сравнению с родительским полипептидом), оно может секвенироваться для идентификации соответствующего благоприятного замещения аминокислоты, содержащейся в нем.

В одном из аспектов при мутагенизации каждого и любого положения аминокислоты в родительском полипептиде с использованием насыщающего мутагенеза, как описано здесь, благоприятные изменения аминокислот могут идентифицироваться в более чем одном положении аминокислоты. Могут генерироваться одно или несколько новых молекул потомства, которые содержат сочетание всех или части этих благоприятных замещений аминокислот. Например, если 2 конкретных благоприятных изменения аминокислот идентифицируются в каждом из 3 положений аминокислот в полипептиде, пермутации включают 3 возможности в каждом положении (нет изменений по сравнению с исходной аминокислотой, каждое из двух благоприятных изменений) и 3 положения. Таким образом, имеются 3 ×3 ×3 или 27 возможностей в целом, включая 7, которые были изучены ранее - 6 отдельных точечных мутаций (т.е. 2 в каждом из трех положений), и отсутствие изменений в каждом положении.

Настоящее изобретение предусматривает использование насыщающего мутагенеза в сочетании с дополнительными способами мутагенизации, такие как способ, где два или более родственных полинуклеотида вводятся в соответствующую клетку-хозяина, так что гибридный полинуклеотид генерируется посредством рекомбинации и редуктивной рекомбинации.

В дополнение к осуществлению мутагенеза вдоль всей последовательности гена, настоящее изобретение предусматривает, что мутагенез может использоваться для замены каждого из любого количества оснований в последовательности полинуклеотидов, где количество оснований, которые должны мутагенизироваться, равно, в одном из аспектов любому целому числу от 15 до 100000. Таким образом, вместо мутагенизации каждого положения вдоль молекулы, можно подвергнуть мутагенезу каждое основание или дискретное их число (в одном из аспектов множество, составляющее от 15 до 100000). В одном из аспектов отдельный нуклеотид используется для мутагенизации каждого положения или группы положений вдоль последовательности полинуклеотидов. Группа из 3 положений, которая должна мутагенизироваться, может представлять собой кодон. Мутации могут вводиться с использованием мутагенного праймера, содержащего гетерологичную кассету, также упоминаемую как мутагенная кассета. Примерные кассеты могут иметь от 1 до 500 оснований. Каждое положение нуклеотида в таких гетерологичных кассетах должно представлять собой N, А, С, G, Т, А/С, A/G, А/Т, C/G, С/Т, G/T, C/G/T, A/G/T, А/С/Т, A/C/G или Е, где Е представляет собой любое основание, которое не является А, С, G или Т (Е может упоминаться как дизайнерский олиго).

В одном из аспектов насыщающий мутагенез состоит из мутагенизации полного набора мутагенных кассет (где каждая кассета в одном из аспектов составляет примерно 1-500 оснований в длину) в определенной последовательности полинуклеотидов, которая должна мутагенизироваться (где последовательность, которая должна мутагенизироваться, составляет в одном из аспектов примерно от 15 до 100000 оснований в длину). Таким образом, группа мутаций (в пределах от 1 до 100 мутаций) вводится в каждую кассету, которая должна мутагенизироваться. Группировка мутаций, которые должны вводиться в одну кассету, может быть такой же как вторая группировка мутаций, которые должны вводиться во вторую кассету во время применения одного раунда насыщающего мутагенеза, или отличаться от нее. Такие группировки представлены делециями, добавлениями, группировками конкретных кодонов и группировками конкретных кассет нуклеотидов.

В одном из аспектов определенные последовательности, которые должны мутагенизироваться, включают цельный ген, путь, цДНК, цельную открытую рамку считывания (ORF) и цельный промотор, энхансер, репрессор/трансактиватор, источник репликации, интрон, оператор или любую функциональную группу полинуклеотидов. Как правило, "определенные последовательности" для этой цели могут представлять собой любой полинуклеотид, который имеет последовательность полинуклеотидов из 15 оснований, и последовательности полинуклеотидов с длиной в пределах между 15 основаниями и 15000 оснований (настоящее изобретение конкретно называет каждое целое число в этих пределах). Соображения при выборе группировок кодонов включают типы аминокислот, кодируемые вырожденной мутагенной кассетой.

В одном из аспектов для группировки мутаций, которая может вводиться в мутагенную кассету, настоящее изобретение конкретно предусматривает замещения вырожденных кодонов (с использованием вырожденных олиго), которые кодируют 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 и 20 аминокислот в каждом положении, при этом кодируется библиотека полипептидов.

Перестановка искусственным лигированием (SLR).

Настоящее изобретение предусматривает систему нестохастической модификации гена, называемую "перестановкой искусственным лигированием" или просто "SLR", "способом направленной эволюции" для генерирования полипептидов, например ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или антител по настоящему изобретению с новыми или измененными свойствами.

SLR представляет собой способ нестохастического лигирования вместе фрагментов олигонуклеотидов. Этот способ отличается от стохастического шаффлинга олигонуклеотидов тем, что структурные элементы нуклеиновых кислот не тасуются, стыкуются или химеризуются случайным образом, но скорее собираются нестохастически. См., например, патенты США № 6773900; 6740506; 6713282; 6635449; 6605449; 6537776. В одном из аспектов SLR включает следующие стадии: (а) создания шаблонного полинуклеотида, где шаблонный полинуклеотид содержит последовательность, кодирующую гомологичный ген; (b) создания множества структурных элементов полинуклеотидов, где структурные элементы полинуклеотидов конструируются для перекрестной перестановки вместе с шаблонным полинуклеотидом в заранее определенной последовательности, и структурный элемент полинуклеотида содержит последовательность, которая представляет собой вариант гомологичного гена, и последовательность, гомологичную шаблонному полинуклеотиду, фланкирующую вариант последовательности; (с) объединения структурного элемента полинуклеотида с шаблонным полинуклеотидом, так что структурный элемент полинуклеотида перекрестно повторно собирается вместе с шаблонным полинуклеотидом с генерированием полинуклеотидов, содержащих вариации последовательностей гомологичных генов.

SLR не зависит от присутствия высоких уровней гомологии между полинуклеотидами, которые должны перегруппировываться. Таким образом, этот способ может использоваться для нестохастического генерирования библиотек (или наборов) молекул потомства, состоящих из более чем 10 100 различных химер. SLR может использоваться для генерирования библиотек, состоящих из более чем 10 1000 различных химер потомства. Таким образом, аспекты настоящего изобретения включают нестохастические способы получения набора финализированных химерных молекулнуклеиновой кислоты, имеющих общий порядок сборки, который выбирается конструкцией. Это способ включает стадии генерирования посредством конструирования множества конкретных структурных элементов нуклеиновых кислот, имеющих пригодные для использования взаимно совместимые лигируемые концы, и сборки этих структурных элементов нуклеиновых кислот, так что достигается конструкционный порядок сборки в целом.

Взаимно совместимые лигируемые концы структурных элементов нуклеиновых кислот, которые должны собираться вместе, считаются "пригодными для использования" для этого типа упорядоченной сборки, если они дают возможность для связывания структурных элементов в заранее определенных порядках. Таким образом, общий порядок сборки, в котором могут связываться структурные элементы нуклеиновых кислот, определяется конструкцией лигируемых концов. Если должна использоваться более чем одна стадия сборки, тогда общий порядок сборки, в котором должны связываться структурные элементы нуклеиновых кислот, также задается последовательным порядком стадии (стадий) сборки. В одном из аспектов отожженые структурные куски обрабатывают ферментом, таким как лигаза (например, лигаза Т4 ДНК), для достижения ковалентного связывания структурных кусков.

В одном из аспектов конструкция структурных элементов олигонуклеотидов получается посредством анализа набора шаблонов-предшественников последовательностей нуклеиновых кислот, которые служат в качестве основы для получения набора финализированных химерных полинуклеотидов потомства. Эти шаблоны родительских олигонуклеотидов, таким образом, служат в качестве источника информации о последовательностях, которая помогает при конструировании структурных элементов нуклеиновых кислот, которые должны мутагенизироваться, например, химеризироваться или перетасовываться. В одном из аспектов этого способа последовательности множества шаблонов родительских нуклеиновых кислот совмещаются для выбора одной или нескольких демаркационных точек. Демаркационные точки могут располагаться в области гомологии и состоят из одного или нескольких нуклеотидов. Эти демаркационные точки в одном из аспектов являются общими по меньшей мере для двух из шаблонов-предшественников. По этой причине демаркационные точки могут использоваться для определения границ структурных элементов олигонуклеотидов, которые должны генерироваться для перегруппировки родительских полинуклеотидов. Демаркационные точки, идентифицированные и выбранные в молекулах-предшественниках, служат в качестве потенциальных точек химеризации при сборке конечных химерных молекул потомства. Демаркационная точка может представлять собой область гомологии (состоящую по меньшей мере из одного основания гомологичного нуклеотида), общую по меньшей мере для двух родительских последовательностей полинуклеотидов. Альтернативно, демаркационная точка может представлять собой область гомологии, которая является общей по меньшей мере для половины из родительских последовательностей полинуклеотидов, или она может представлять собой область гомологии, которая является общей по меньшей мере для двух третей родительских последовательностей полинуклеотидов. Более того, в одном из аспектов пригодная для использования демаркационная точка представляет собой область гомологии, которая является общей по меньшей мере для трех четвертей родительских последовательностей полинуклеотидов, или она может быть общей почти для всех родительских последовательностей полинуклеотидов. В одном из аспектов демаркационная точка представляет собой область гомологии, которая является общей для всех родительских последовательностей полинуклеотидов.

В одном из аспектов способ перестановки лигированием осуществляют избыточно для генерирования избыточной библиотеки потомства химерных полинуклеотидов. Другими словами, все возможные упорядоченные сочетания структурных элементов нуклеиновых кислот представлены в наборе финализированных химерных молекул нуклеиновых кислот. В то же время в другом аспекте порядок сборки (т.е. порядок сборки каждого структурного элемента в последовательности от 5' до 3 для каждой финализированной химерной нуклеиновой кислоты) в каждом сочетании определяется конструкцией (или является нестохастическим), как описано выше. Благодаря нестохастической природе настоящего изобретения, возможность получения нежелательных побочных продуктов сильно уменьшается.

В другом аспекте способ перестановки лигированием осуществляют систематически. Например, способ осуществляют для генерирования систематически разделенной библиотеки молекул потомства, при этом отделения могут подвергаться систематическому скринингу, например, по одному. Другими словами настоящее изобретение предусматривает, что посредством селективного и благоразумного использования конкретных структурных элементов нуклеиновых кислот, сочетание с селективным и благоразумным использованием последовательных стадий реакций сборки, может быть получена конструкция, где конкретные наборы продуктов потомства получаются в каждой из нескольких реакционной емкостей. Это делает возможным осуществление систематической процедуры проверки и скрининга. Таким образом, эти способы дают возможность для потенциальной систематической проверки очень большого количества молекул потомства в малых группах. Благодаря их способности к осуществлению химеризации способом, который является очень гибким, при этом также избыточным и систематическим, в особенности, когда имеется низкий уровень гомологии между молекулами-предшественниками, эти способы обеспечивают генерирование библиотеки (или набора), состоящего из большого количества молекул потомства. Благодаря нестохастической природе непосредственной перестановки лигированием по настоящему изобретению, молекулы потомства, генерируемые в одном из аспектов составляют библиотеку молекул финализированных химерных нуклеиновых кислот, имеющих общий порядок сборки, который выбирается при конструировании. Способы насыщающего мутагенеза и оптимизированной направленной эволюции также могут использоваться для генерирования различных видов молекул потомства. Очевидно, что настоящее изобретение обеспечивает свободу выбора и контроля относительно выбора демаркационных точек, размера и количества структурных элементов нуклеиновых кислот, и размера и дизайна соединяемых частей. Очевидно, кроме того, что требование межмолекулярной гомологии сильно ослабляется при работе настоящего изобретения. На самом деле, демаркационные точки могут выбираться даже в областях малой межмолекулярной гомологии или ее отсутствия. Например, благодаря колебаниям кодона, т.е. вырождению кодонов, замещения нуклеотидов могут вводиться в структурные элементы нуклеиновых кислот без изменения аминокислоты, изначально кодируемой в соответствующем шаблоне-предшественнике. Альтернативно, кодон может изменяться так, что изначально изменяется кодирование аминокислоты. Настоящее изобретение предусматривает, что такие замещения могут вводиться в структурный элемент нуклеиновой кислоты для повышения частоты встречаемости межмолекулярных гомологичных демаркационных точек и, таким образом, чтобы сделать возможным получение увеличенного количества связываний между структурными элементами, что, в свою очередь, сделает возможным генерирование большего количества потомство химерных молекул.

Перестановка синтетических генов.

В одном из аспектов настоящее изобретение предусматривает нестохастический способ, называемый перестановка синтетических генов, который является в некоторой степени родственным стохастическому шаффлингу, сохраняя то, что структурные элементы нуклеиновых кислот не перетасовываются или стыкуются, или химеризуются случайным образом, но скорее, собираются нестохастически. См., например, патент США № 6537776.

Способ перестановки синтетических генов не зависит от присутствия высокого уровня гомологии между полинуклеотидами, которые должны перетасовываются. Настоящее изобретение может использоваться для нестохастического генерирования библиотек (или наборов) молекул потомства, состоящих из более чем 10 100 различных химер. Подобным же образом, перестановка синтетических генов может использоваться даже для генерирования библиотек, состоящих из более чем 10 1000 различных химер потомства.

Таким образом, в одном из аспектов настоящее изобретение предусматривает нестохастический способ получения набора молекул финализированных химерных нуклеиновых кислот, имеющих общий порядок сборки, который выбирается согласно конструкции, этот способ состоит из стадий генерирования посредством конструирования множества конкретных структурных элементов нуклеиновых кислот, имеющих пригодные для использования взаимно совместимые лигируемые концы, и сборки этих структурных элементов нуклеиновых кислот таким образом, что достигается конструируемый общий порядок сборки.

Взаимно совместимые лигируемые концы структурных элементов нуклеиновых кислот, которые должны собираться вместе, считаются "пригодными для использования" для этого типа упорядоченной сборки, если они дают возможность для связывания структурных элементов в заранее определенных порядках. Таким образом, в одном из аспектов общий порядок сборки, в котором могут связываться структурные элементы нуклеиновых кислот, определяется конструкцией лигируемых концов, и если используется более чем одна стадия сборки, тогда общий порядок сборки, в котором должны связываться структурные элементы нуклеиновых кислот, также задается последовательным порядком стадии (стадий) сборки. В одном из аспектов отожженые структурные куски обрабатывают ферментом, таким как лигаза (например, лигаза Т4 ДНК), для достижения ковалентного связывания структурных кусков.

В другом аспекте конструкция структурных элементов нуклеиновых кислот получается при анализе набора шаблонов-предшественников последовательностей нуклеиновых кислот, которые служат в качестве основы для получения набора финализированных молекул потомства химерных нуклеиновых кислот. Эти шаблоны-предшественники нуклеиновых кислот, таким образом, служат в качестве источника информации о последовательности, которая помогает при конструировании структурных элементов нуклеиновых кислот, которые должны мутагенизироваться, т.е. химеризироваться или перетасовываться.

В одном из примеров настоящее изобретение предусматривает химеризацию семейства родственных генов и кодируемого ими семейства родственных продуктов. В конкретном примере кодируемые продукты представляют собой ферменты. Ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению, могут мутагенизироваться в соответствии со способами, описанными здесь.

Таким образом, в соответствии с одним из аспектов настоящего изобретения последовательности множества шаблонов-предшественников нуклеиновых кислот (например, полинуклеотидов по настоящему изобретению) совмещаются для выбора одной или нескольких демаркационных точек, эти демаркационные точки должны располагаться в области гомологии. Демаркационные точки могут использоваться для обозначения границ структурных элементов нуклеиновых кислот, которые должны генерироваться. Таким образом, демаркационные точки, идентифицированные и выбранные в молекулах-предшественниках, служат в качестве потенциальных точек химеризации при сборке молекул потомства.

В одном из аспектов пригодная для использования демаркационная точка может представлять собой область гомологии (состоящую по меньшей мере из одного гомологичного основания нуклеотида), общей по меньшей мере для двух шаблонов-предшественников, но демаркационная точка может представлять собой область гомологии, которая является общей по меньшей мере для половины шаблонов-предшественников по меньшей мере двух третей шаблонов-предшественников по меньшей мере трех четвертей шаблонов-предшественников, а в одном из аспектов почти для всех шаблонов-предшественников. Еще в одном из аспектов по-прежнему пригодная для использования демаркационная точка представляет собой область гомологии, которая является общей для всех шаблонов-предшественников.

В одном из аспектов способ перестановки генов осуществляют избыточно для генерирования избыточной библиотеки. Другими словами, все возможные упорядоченные сочетания структурных элементов нуклеиновых кислот представлены в наборе финализированных молекул химерных нуклеиновых кислот. В то же время, порядок сборки (т.е. порядок сборки каждого структурного элемента в последовательности от 5' до 3' для каждой финализированной химерной нуклеиновой кислоты) в каждом сочетании является конструкционным (или нестохастическим). Благодаря нестохастической природе способа сильно уменьшается возможность получения нежелательных побочных продуктов.

В другом аспекте способ предусматривает, что способ перестановки генов осуществляется систематически, например, для генерирования систематически разделенной библиотеки, где отделения могут подвергаться систематическому скринингу, например, по одному. Другими словами, настоящее изобретение предусматривает, что посредством селективного и благоразумного использования конкретных структурных элементов нуклеиновых кислот, в сочетании с селективным и благоразумным использованием последовательных стадий реакций сборки, может быть получена экспериментальная конструкция, где конкретные наборы продуктов потомства получаются в каждой из нескольких реакционных емкостей. Это делает возможным осуществление систематической процедуры проверки и скрининга. Таким образом, это дает возможность для систематической проверки потенциально очень большого количества молекул потомства более мелкими группами.

Благодаря его способности к осуществлению химеризации способом, который является гибким и при этом также избыточным и систематическим, в особенности тем, где имеется низкий уровень гомологии между молекулами-предшественниками, настоящее изобретение предусматривает генерирование библиотеки (или набора), состоящей из большого количества молекул потомства. Благодаря нестохастической природе перестановки генов по настоящему изобретению молекулы потомства, генерируемые в одном из аспектов, составляют библиотеку финализированных химерных молекул нуклеиновых кислот, имеющих общий порядок сборки, который выбирается конструкционно. В конкретном аспекте такая генерируемая библиотека состоит из более чем 10 3 - более чем 10 1000 различных видов молекул потомства.

В одном из аспектов набор финализированных химерных молекул нуклеиновых кислот, полученных, как описано, состоит из полинуклеотида, кодирующего полипептид. В соответствии с одним из аспектов это полинуклеотид представляет собой ген, который может представлять собой ген, созданный человеком. В соответствии с другим аспектом этот полинуклеотид представляет собой генный путь, который может быть представлять собой генный путь, созданный человеком. Настоящее изобретение предусматривает, что один или несколько генов, созданных человеком, генерируемых с помощью настоящего изобретения, могут включаться в генный путь, созданный человеком, такой как путь, функционирующий в эукариотическом организме (включая растение).

В другом примере синтетическая природа стадии, на которой генерируются структурные элементы, делает возможным конструирование и введение нуклеотидов (например, одного или нескольких нуклеотидов, которые могут представлять собой, например, кодоны или интроны, или регуляторные последовательности), которые позднее могут необязательно удаляться в способе in vitro (например, посредством мутагенеза) или в способе in vivo (например, посредством использования способности к сплайсингу генов организма-хозяина). Очевидно, что во многих случаях введение этих нуклеотидов может также быть желательным по множеству других причин, в дополнение к потенциальной выгоде создания пригодной для использования демаркационной точки.

Таким образом, в соответствии с другим аспектом настоящее изобретение предусматривает, что структурный элемент нуклеиновой кислоты может использоваться для введения интрона. Таким образом, настоящее изобретение предусматривает, что функциональные интроны могут вводиться в ген, созданный человеком, по настоящему изобретению. Настоящее изобретение также предусматривает, что функциональные интроны могут вводиться в генный путь, созданный человеком по настоящему изобретению. Соответственно, настоящее изобретение предусматривает генерирование химерного полинуклеотида, который представляет собой ген, созданный человеком, содержащий один (или более) искусственно введенный интрон (интроны).

Настоящее изобретение также предусматривает генерирование химерного полинуклеотида, который представляет собой генный путь, созданный человеком, содержащий один (или несколько) искусственно введенный интрон (интроны). В одном из аспектов искусственно введенный интрон (интроны) функционирует в одной или нескольких клетках-хозяевах для сплайсинга генов, гораздо более эффективно, чем встречающиеся в природе интроны, которые функционально служат при сплайсинге генов. Настоящее изобретение относится к способу создания искусственных интронсодержащих полинуклеотидов, которые должны вводиться в организмы-хозяева для рекомбинации и/или сплайсинга.

Созданный человеком ген, полученный с использованием настоящего изобретения, может также служить в качестве субстрата для рекомбинации с другой нуклеиновой кислотой. Подобным же образом, генный путь, созданный человеком, полученный с использованием настоящего изобретения, может также служить в качестве субстрата для рекомбинации с другой нуклеиновой кислотой. В одном из аспектов рекомбинация облегчается присутствием областей гомологии между искусственным интрон-содержащим геном и нуклеиновой кислотой, которая служит в качестве партнера по рекомбинации, или происходит в них. В одном из аспектов партнер по рекомбинации может также представлять собой нуклеиновую кислоту, генерируемую с помощью настоящего изобретения, включая ген, созданный человеком, или генный путь, созданный человеком. Рекомбинация может облегчаться посредством присутствия областей гомологии, которые существует на одном (или нескольких) искусственно введенном интроне (интронах) в гене, созданном человеком, или может происходить в них.

В одном из аспектов способ перестановки синтетических генов по настоящему изобретению использует множество структурных элементов нуклеиновых кислот, каждый из которых в одном из аспектов имеет два лигируемых конца. Два лигируемых конца на каждом структурном элементе нуклеиновых кислот могут представлять собой два тупых конца (т.е. каждый из них имеет липкие концы или нулевые нуклеотиды), или в одном из аспектов один тупой конец и один липкий конец, или еще в одном из аспектов два липких конца. В одном из аспектов пригодные для этой цели липкие концы могут представлять собой 3' липкие концы или 5' липкие концы. Таким образом, структурный элемент нуклеиновых кислот может иметь 3' липкие концы или, альтернативно, 5' липкие концы либо, альтернативно, два 3' липких конца или, альтернативно, два 5' липких конца. Общий порядок, в котором структурные элементы нуклеиновых кислот собираются с образованием финализированной химерной молекулы нуклеиновой кислоты, определяется целевой экспериментальной конструкцией и не является случайным.

В одном из аспектов структурный элемент нуклеиновой кислоты генерируется посредством химического синтеза двух одноцепочечных нуклеиновых кислот (также упоминаемых как одноцепочечные олиго) и приведения их в контакт таким образом, чтобы дать им возможность для отжига с образованием структурного элемента двухцепочечной нуклеиновой кислоты. Структурный элемент двухцепочечной нуклеиновой кислоты может иметь различные размеры. Размеры этих структурных элементов могут быть малыми или большими. Примерные размеры структурного элементы находятся в пределах от 1 пары оснований (не включая никаких липких концов) до 100000 пар оснований (не включая никаких липких концов). Предусматриваются также другие примерные диапазоны размеров, которые имеют нижние пределы от 1 bp до 10000 bp (включая каждое целое число в этих пределах) и верхние пределы от 2 bp до 100000 bp (включая каждое целое число в этих пределах).

Существует множество способов, посредством которых может генерироваться структурный элемент двухцепочечный нуклеиновой кислоты, который является пригодным для настоящего изобретения; и они известны в данной области и могут легко осуществляться специалистом в данной области. В соответствии с одним из аспектов структурный элемент двухцепочечной нуклеиновой кислоты генерируется посредством, сначала, генерирования двух одноцепочечных нуклеиновых кислот и предоставления им возможности для отжига, с формированием структурного элемента двухцепочечной нуклеиновой кислоты. Две нити структурного элемента двухцепочечной нуклеиновой кислоты могут быть комплементарными на каждом нуклеотиде, за исключением любого из тех, которые образуют липкие концы; таким образом, они не содержат несовпадений, за исключением любого из липких концов. В соответствии с другим аспектом две нити структурного элемента двухцепочечной нуклеиновой кислоты являются комплементарными на каждом нуклеотиде, за исключением нескольких, за исключением любых из тех, которые образуют липкие концы. Таким образом, в соответствии с этим аспектом, структурный элемент двухцепочечной нуклеиновой кислоты может использоваться для введения вырождения кодона. В одном из аспектов вырождение кодона вводится с использованием сайт-насыщающего мутагенеза, описанного здесь, с использованием одной или нескольких кассет N,N,G/T или, альтернативно, с использованием одной или нескольких кассет N,N,N.

Способ рекомбинации in vivo по настоящему изобретению может осуществляться вслепую на пуле неизвестных гибридов или аллелей конкретного полинуклеотида или последовательности. Однако не является необходимым знание реальной последовательности ДНК или РНК конкретного полинуклеотида. Подход с использованием рекомбинации в смешанной популяции генов может быть полезным для генерирования любых полезных белков, например, целлюлазы по настоящему изобретению или ее варианта. Этот подход может использоваться для генерирования белков, имеющих измененную специфичность или активность. Подход может также быть полезным для генерирования гибридных последовательностей нуклеиновых кислот, например, промоторных областей, интронов, экзонов, энхансерных последовательностей, 31 нетранслируемых областей или 51 нетранслируемых областей генов. Таким образом, этот подход может использоваться для генерирования генов, имеющих повышенные скорости экспрессии. Этот подход может также быть полезным при изучении повторяющихся последовательностей ДНК. Наконец, этот подход может быть полезным для получения рибозимов или аптомеров по настоящему изобретению.

В одном из аспектов настоящее изобретение, описанное здесь, направлено на использование повторяющихся циклов редуктивной рекомбинации, рекомбинации и селекции, которые делают возможной направленную молекулярную эволюцию очень сложных линейных последовательностей, таких как ДНК, РНК или белков посредством рекомбинации.

Оптимизированная система направленной эволюции.

Настоящее изобретение предусматривает систему нестохастической модификации генов, называемую "оптимизированная система направленной эволюции", для генерирования полипептидов, например, ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или антител по настоящему изобретению с новыми или измененными свойствами. В одном из аспектов оптимизированная направленная эволюция направлена на использование повторяющихся циклов редуктивной рекомбинации, рекомбинации и селекции, которые делают возможной направленную молекулярную эволюцию нуклеиновых кислот посредством рекомбинации.

Оптимизированная направленная эволюция делает возможным генерирование большой популяции относящихся к делу химерных последовательностей, где генерируемая популяция является значительно обогащенной последовательностями, которые имеют заранее определенные количества случаев кроссовера. Случай кроссовера представляет собой точку в химерной последовательности, где происходит сдвиг в последовательности от одного родительского варианта к другому родительскому варианту. Такая точка обычно находится на переходе, где олигонуклеотиды от двух родителей лигируются вместе с образованием одной последовательности. Этот способ делает возможным вычисление правильных концентраций последовательностей олигонуклеотидов для того, чтобы конечная химерная популяция последовательностей была обогащена выбранным количеством случаев кроссовера. Это обеспечивает больший контроль выбора химерных вариантов, имеющих заранее определенное количество случаев кроссовера.

В дополнение к этому этот способ предусматривает удобные средства для обнаружения гигантского объема пространства возможных вариантов белков, по сравнению с другими системами. Ранее, если генерировалось, например, 10 13 химерных молекул в течение реакции, было бы исключительно сложно исследовать такое большее количество химерных вариантов на конкретную активность. Кроме того, значительная часть популяции потомства имела бы очень большое количество случаев кроссовера, которые приводят к получению белков, которые с меньшей вероятностью имеют увеличенные уровни конкретной активности. Посредством использования этих способов популяция химерных молекул может обогащаться теми вариантами, которые имеют конкретное количество случаев кроссовера. Таким образом, хотя по-прежнему возможно генерирование 10 13 химерных молекул в течение реакции, каждая из молекул, выбранных для дальнейшего анализа, наиболее вероятно имеет, например, только три случая кроссовера. Поскольку полученная популяция потомства может деформироваться для получения заранее определенного количества случаев кроссовера, границы функционального разнообразия между химерными молекулами сужаются. Это дает более управляемое количество переменных, при вычислениях того, как олигонуклеотид из исходных родительских полинуклеотидов мог бы быть ответственным за осуществление конкретного признака.

Один из способов создания химерной последовательности потомства полинуклеотидов заключается в создании олигонуклеотидов, соответствующих фрагментам или частям каждой родительской последовательности. Каждый олигонуклеотид в одном из аспектов содержит уникальную область перекрывания, так что смешивание олигонуклеотидов вместе приводит к получению нового варианта, который имеет каждый фрагмент олигонуклеотида, собранный в правильном порядке. Альтернативные протоколы осуществления этих способов по настоящему изобретению можно найти в патентах США № 6773900; 6740506; 6713282; 6635449; 6605449; 6537776; 6361974.

Количество олигонуклеотидов, генерируемое для каждого родительского варианта, связано взаимоотношением с общим количеством полученных кроссоверов в химерной молекуле, которая создается в конечном счете. Например, могут предусматриваться три родительских варианта последовательностей нуклеотидов, которые должны подвергаться реакции лигирования, чтобы найти химерный вариант, имеющий, например, более высокую активность при высокой температуре. В качестве примера, может генерироваться набор из 50 последовательностей олигонуклеотидов, соответствующих каждой из частей каждого родительского варианта. Соответственно, в течение способа перестановки лигированием может происходить до 50 случаев кроссовера в каждой из химерных последовательностей. Вероятность того, что каждый из генерируемых химерных полинуклеотидов будет содержать олигонуклеотиды из каждого родительского варианта в измененном порядке, является очень низкой. Если каждый фрагмент олигонуклеотида присутствует в реакции лигирования при одинаковом молярном количестве, является вероятным, что в некоторых положениях олигонуклеотиды из одного и того же родительского полинуклеотида будут лигироваться друг за другом и, таким образом, не это приведет к случаю кроссовера. Если концентрация каждого олигонуклеотида от каждого родителя поддерживается постоянной в течение любой стадии лигирования в этом примере, имеется вероятность 1/3 (предполагая 3 родителей), что олигонуклеотид из такого же родительского варианта будет лигироваться внутри химерной последовательности и не будет давать кроссовера.

Соответственно, может определяться функция распределения вероятности (PDF) для предсказания популяции случаев кроссовера, которые, вероятно, будут осуществляться на каждой стадии реакции лигирования, для данного заданного количества родительских вариантов, количества олигонуклеотидов, соответствующих каждому варианту, и концентрации каждого варианта в течение каждой стадии при реакции лигирования. Статистика и математика, необходимые для определения PDF, описываются ниже. Посредством использования этих способов, можно вычислить такую функцию распределения вероятности и, таким образом, обогатить химерную популяцию потомства заранее определенным количеством случаев кроссовера, возникающих из конкретной реакции лигирования. Кроме того, целевое количество случаев кроссовера может быть заранее определено, а система затем может программироваться для вычисления исходных количеств каждого родительского олигонуклеотида в течение каждой стадии при реакции лигирования, чтобы получить в результате функцию распределения вероятности с максимумом на заранее определенном количестве случаев кроссовера. Эти способы направлены на использование повторяющихся циклов редуктивной рекомбинации, рекомбинации и селекции, которые делают возможной направленную молекулярную эволюцию нуклеиновой кислоты, кодирующей полипептид посредством рекомбинации. Это система делает возможным генерирование большой популяции соответствующих химерных последовательностей, где генерируемая популяция является значительно обогащенной последовательностями, которые имеют заранее определенное количество случаев кроссовера. Случай кроссовера представляет собой точку в химерной последовательности, где осуществляется сдвиг в последовательности от одного родительского варианта к другому родительскому варианту. Такая точка обычно располагается на переходе, где олигонуклеотиды от двух родителей лигируются вместе, с образованием одной последовательности. Способ делает возможным вычисление правильных концентраций последовательностей олигонуклеотидов, таким образом, что конечная химерная популяция последовательностей обогащается выбранным количеством случаев кроссовера. Это обеспечивает больший контроль выбора химерных вариантов, имеющих заранее определенное количество случаев кроссовера.

В дополнение к этому эти способы предусматривают удобные средства для обнаружения гигантского объема пространства возможных вариантов белков, по сравнению с другими системами. Посредством использования способов, описанных здесь, популяция химерных молекул может быть обогащена теми вариантами, которые имеют конкретное количество случаев кроссовера. Таким образом, хотя можно по-прежнему генерировать 10 13 химерных молекул в течение реакции, каждая из молекул, выбранных для дополнительного анализа, наиболее вероятно имеет, например, только три случая кроссовера. Поскольку полученная в результате популяция потомства может деформироваться для получения заранее определенного количества случаев кроссовера, границы функционального разнообразия между химерными молекулами сужаются. Это дает более управляемое количество переменных при вычислении того, какой олигонуклеотид из исходных родительских полинуклеотидов мог бы быть ответственным за осуществление конкретного признака.

В одном из аспектов создание химерной последовательности потомство полинуклеотидов заключается в создании олигонуклеотидов, соответствующих фрагментам или частям каждой родительской последовательности. Каждый олигонуклеотид в одном из аспектов содержит уникальную область перекрывания, так что смешивание олигонуклеотидов вместе приводит к получению нового варианта, который имеет каждый фрагмент олигонуклеотида, собранный в правильном порядке. См. также патенты США № 6773900; 6740506; 6713282; 6635449; 6605449; 6537776; 6361974.

Определение случаев кроссовера.

Аспекты настоящего изобретения включают систему и программное обеспечение, которые получают желаемую функцию распределения вероятности кроссовера (PDF), количества родительских генов, которые должны повторно собираться, и количества фрагментов при повторной сборке в качестве входных данных. Выходом этой программы является "фрагмент PDF", который может использоваться для определения рецепта для получения генов с помощью перестановки, и оцененная PDF кроссовера этих генов. Обработка, описанная здесь, в одном из аспектов осуществляется в MATLAB ™ (The Mathworks, Natick, Massachusetts), языке программирования и окружающей среде разработки для технических компьютерных вычислений.

Итеративные способы.

Любой способ по настоящему изобретению может повторяться итеративно, например, нуклеиновая кислота, кодирующая измененный или новый фенотип фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению, может идентифицироваться, повторно выделяться, опять модифицироваться, повторно исследоваться на активность. Этот способ может повторяться итеративно до тех пор, пока желаемый фенотип не будет получен с помощью генной инженерии. Например, весь биохимический анаболический или катаболический путь может быть получен с помощью генной инженерии в клетке, включая, например, активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

Подобным же образом, если определяется, что конкретный олигонуклеотид вообще не оказывает воздействия на желаемый признак (например, новый фенотип фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы), он может удаляться в качестве переменного посредством синтеза родительских олигонуклеотидов большего размера, которые содержат последовательность, которая должна удаляться. Поскольку введение последовательности в последовательность большего размера предотвращает любые случаи кроссовера, не будет больше никакого изменения этой последовательности в потомстве полинуклеотидов. Это итеративное осуществление определения того, какие олигонуклеотиды являются наиболее связанными с желаемым признаком, а какие не связаны, делает возможным более эффективное обнаружение всех возможных вариантов белков, которые могли бы обеспечить конкретный признак или активность.

Шаффлинг in vivo.

В различных аспектах, шаффлинг in vivo молекул используется в способах по настоящему изобретению для создания вариантов полипептидов по настоящему изобретению, например, антител по настоящему изобретению или ферментов целлюлаз по настоящему изобретению, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы и т.п. Шаффлинг in vivo может осуществляться с использованием природного свойства клеток объединять мультимеры. В то время как рекомбинация in vivo обеспечивает главный природный путь к молекулярному разнообразию, генетическая рекомбинация остается относительно сложным способом, который включает 1) распознавание гомологий; 2) стадии расщепления нити, инвазии нити и метаболические стадии, приводящие к продуцированию рекомбинантной хиазмы; и, наконец, 3) разрешение хиазмы в виде отдельных рекомбинированных молекул. Образование хиазмы требует распознавания гомологичных последовательностей.

В другом аспекте настоящее изобретение включает способ производства гибридного полинуклеотида, по меньшей мере, из первого полинуклеотида и второго полинуклеотида. Настоящее изобретение может использоваться для производства гибридного полинуклеотида посредством введения, по меньшей мере, первого полинуклеотида и второго полинуклеотида (например, один из них или оба они представляют собой примерную последовательность, кодирующую фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению), которые имеют по меньшей мере одну общую область частичной гомологии последовательности, в соответствующую клетку-хозяина. Области частичной гомологии последовательности облегчают процессы, которые приводят к реорганизации последовательности с получением гибридного полинуклеотида. Термин "гибридный полинуклеотид", как здесь используется, представляет собой любую последовательность нуклеотидов, которая получается из способа по настоящему изобретению и содержит последовательность по меньшей мере из двух исходных последовательностей полинуклеотидов. Такие гибридные полинуклеотиды могут возникать в результате случаев межмолекулярной рекомбинации, которые облегчают встраивание последовательностей, между молекулами ДНК. В дополнение к этому такие гибридные полинуклеотиды могут возникать в результате процессов внутримолекулярной редуктивной рекомбинации, которые используют повторяющиеся последовательности для изменения последовательности нуклеотидов в молекуле ДНК.

В одном из аспектов рекомбинация in vivo сосредотачивается на "межмолекулярных" процессах, упоминаемых коллективно как "рекомбинация"; которая в бактериях, как правило, рассматривается как "RecA-зависимое" явление. Настоящее изобретение может основываться на процессах рекомбинации клетки-хозяина для рекомбинации и пересортировке последовательности, или на способности клеток к медиированию редуктивных процессов, для уменьшения сложности квази-повторяющихся последовательностей в клетке посредством делеции.

Этот процесс "редуктивной рекомбинации" осуществляется посредством "внутримолекулярного", RecA-независимого процесса.

В другом аспекте настоящего изобретения новые полинуклеотиды могут генерироваться посредством способа редуктивной рекомбинации. Способ включает генерирование конструктов, содержащих последовательные последовательности (исходные кодирующие последовательности), их вставку в соответствующий вектор и их последующее введение в соответствующую клетку-хозяина. Рекомбинация индивидуальных молекулярных идентичностей осуществляется посредством комбинаторных процессов между последовательными последовательностями в конструкте, обладающими областями гомологии, или между квази-повторяющимися единицами. Способ рекомбинации рекомбинирует и/или понижает сложность и уровень повторяющихся последовательностей и приводит к продуцированию новых видов молекул. Для повышения скорости рекомбинации могут применяться различные виды обработки. Они могут включать обработку с помощью ультрафиолетового света или химикалиев, повреждающих ДНК, и/или использование линий клеток-хозяев, демонстрирующих повышенные уровни "генетической нестабильности". Таким образом, способ рекомбинации может включать гомологичную рекомбинацию или природное свойство квази-повторяющихся последовательностей направлять свою собственную эволюцию.

Повторяющиеся или "квази-повторяющиеся" последовательности играют некоторую роль в генетической нестабильности. В одном из аспектов "квази-повторения" представляют собой повторения, которые не ограничиваются структурой их исходной единицы. Квази-повторяющиеся единицы могут быть представлены в виде ряда последовательностей в конструкте; последовательных единиц в сходных последовательностях. После лигирования переходы между последовательными последовательностями становятся по существу невидимыми, и квази-повторяющаяся природа полученного конструкта является теперь непрерывной на молекулярном уровне. Процесс делеции в клетке работает, уменьшая сложность работы полученного конструкта между квази-повторяющимися последовательностями. Квази-повторяющиеся единицы обеспечивают практически неограниченный спектр шаблонов, на которых могут происходить случаи проскальзывания. В одном из аспектов конструкты, содержащие квази-повторения, обеспечивают, таким образом эффективно достаточную молекулярную эластичность для того, чтобы случаи делеции (и потенциально, инсерции) могли осуществляться где угодно в квази-повторяющихся единицах.

Когда квази-повторяющиеся последовательности все лигируются с одинаковой ориентацией, например, голова к хвосту или наоборот, клетка не может различать индивидуальные единицы. Как следствие, редуктивный способ может осуществляться в последовательностях. В противоположность этому, когда, например, единицы присутствуют голова к голове, вместо головы к хвосту, инверсия обозначает конечные точки соседней единицы, так что образование делеции будет благоприятствовать потере дискретных единиц. Таким образом, является предпочтительным, в настоящем способе, чтобы последовательности находились в одинаковой ориентации. Случайная ориентация квази-повторяющихся последовательностей будет приводить к потерям эффективности рекомбинации, в то время как согласованная ориентация последовательностей будет давать наивысшую эффективность. Однако, хотя и имея меньшее количество непрерывных последовательностей в одной ориентации, что уменьшает эффективность, по-прежнему можно обеспечить достаточную эластичность для эффективного извлечения новых молекул. Конструкты могут быть получены с квази-повторяющимися последовательностями в одинаковой ориентации, чтобы сделать возможной более высокую эффективность.

Последовательности могут собираться в ориентации от головы к хвосту с использованием различных способов, включая следующие.

a) Праймеры, которые содержат голову поли-А и хвост поли-Т, которые, когда делаются одноцепочечными, давали бы ориентацию, которая может быть использована. Это достигается посредством присутствия первых нескольких первых оснований праймеров, изготовленных из РНК и, следовательно, легко удаляемых посредством РНКазыН.

b) Могут использоваться праймеры, которые содержат уникальные сайты рестрикционного расщепления. Потребовалось бы множество сайтов, батарея уникальных последовательностей и повторяющиеся стадии синтеза и стадии лигирования.

c) Несколько внутренних оснований праймера могли бы тиолироваться, а экзонуклеаза использоваться для получения молекул с соответствующими хвостами.

В одном из аспектов извлечение пересортированных последовательностей основывается на идентификации векторов клонирования с пониженном индексом повторяемости (RI). Затем пересортированные кодирующие последовательности могут извлекаться посредством амплификации. Продукты повторно клонируются и экспрессируются. Извлечение векторов клонирования с пониженными RI может осуществляться посредством следующего.

1) Использование векторов, поддерживаемых стабильно только тогда, когда сложность конструкта понижается.

2) Физическое извлечение укороченных векторов с помощью физических процедур. В этом случае вектор клонирования извлекался бы с использованием стандартных процедур выделения плазмид и фракционировался по размерам либо на агарозном геле, либо на колонке с низкомолекулярным порогом, с использованием стандартных процедур.

3) Извлечение векторов, содержащих гены с разрывами, которые могут селектироваться, когда размер вставки уменьшается.

4) Использование методик прямой селекции с помощью вектора экспрессии и соответствующей селекции.

Кодирующие последовательности (например, гены) от родственных организмов могут демонстрировать высокую степень гомологии и кодировать совершенно различные продукты белков. Эти типы последовательностей являются особенно полезными в настоящем изобретении как квази-повторения.

Однако, хотя примеры, иллюстрируемые ниже, демонстрируют рекомбинацию почти идентичных исходных кодирующих последовательностей (квази-повторения), этот способ не ограничивается такими почти идентичными повторениями.

Следующий далее пример демонстрирует примерный способ по настоящему изобретению. Описываются кодирующие последовательности нуклеиновых кислот (квази-повторения), полученные от трех (3) уникальных видов. Каждая последовательность кодирует белок с различным набором свойств. Каждая из последовательностей отличается одной или несколькими парами оснований в уникальном положении в последовательности. Квази-повторяющиеся последовательности по-отдельности или коллективно амплифицируются и лигируются в случайные сборки, так что все возможные пермутации и сочетания являются доступными в популяции лигируемых молекул. Количество квази-повторяющихся единиц может контролироваться посредством условий сборки. Средние количества квази-повторяющихся единиц в конструкте определяется как индекс повторяемости (RI).

После формирования конструкты могут фракционироваться или не фракционироваться по размерам на агарозном геле в соответствии с опубликованными протоколами, вставляться в вектор клонирования и трансфицироваться в соответствующую клетку-хозяина. Затем клетки размножаются и осуществляется "редуктивная рекомбинация". Скорость процесса редуктивной рекомбинации может стимулироваться посредством введения повреждений ДНК, если это желательно. Медиируется ли уменьшение RI посредством образования делеций между повторяющимися последовательностями с помощью "внутримолекулярного" механизма, или оно медиируется посредством событий подобных рекомбинации, посредством "межмолекулярных" механизмов, не является важным. Конечный результат представляет собой рекомбинацию молекул во всех возможных сочетаниях.

Необязательно, способ включает дополнительную стадию скрининга элементов библиотеки перетасованного пула для идентификации индивидуальных элементов перетасованной библиотеки, имеющих способность к связыванию или взаимодействию другим образом, или к катализу конкретной реакции (например, таких как каталитический домен фермента), с заранее определенной макромолекулой, такой, например, как белковый рецептор, олигосахарид, вирион или другое заранее определенное соединение или структура.

Полипептиды, которые идентифицируются из таких библиотек, могут использоваться для терапевтических, диагностических, научных и родственных им целей (например, катализаторы, растворимые агенты для увеличения осмолярности водного раствора и т.п.) и/или могут подвергаться воздействию одного или нескольких дополнительных циклов шаффлинга и/или селекции.

В другом аспекте предполагается, что перед рекомбинацией или перетасовской или во время них, полинуклеотиды, генерируемые посредством способа по настоящему изобретению, могут подвергаться воздействию агентов или способов, которые облегчают введение мутаций в исходные полинуклеотиды. Введение таких мутаций увеличивало бы разнообразие полученных гибридных полинуклеотидов и полипептидов, кодируемых ими. Агенты или способы, которые облегчают мутагенез, могут включать в себя, но не ограничиваясь этим, (+)-СС-1065 или его синтетический аналог, такой как (+)-СС-1065-(N3-аденин) (см. Sun and Hurley (1992)); N-ацетилированный или деацетилированный аддукт 4'-фтор-4-аминобифенила, способный ингибировать синтез ДНК (см., например, van de Poll et al. (1992)); или N-ацетилированный или деацетилированный аддукт 4-аминобифенила, способный ингибировать синтез ДНК (см. также van de Poll et al. (1992), p. 751-758); трехвалентный хром, соль трехвалентного хрома, аддукт полициклического ароматического углеводорода (РАН) и ДНК, способный ингибировать репликацию ДНК, такой как 7-бромметил-бенз[а]антрацен ("ВМА"), трис-(2,3-дибромпропил)фосфат ("Tris-BP"), 1,2-дибром-3-хлорпропан ("DBCP"), 2-бромакролеин (2ВА), бензо[а]пирен-7,8-дигидродиол-9-10-эпоксид ("BPDE"), соль платины(II) и галогена, N-гидрокси-2-амино-3-метилимидазо[4,5-f]хинолин ("N-гидрокси-IQ") и N-гидрокси-2-амино-1-метил-6-фенилимидазо[4,5-f]пиридин ("N-гидрокси-PhIP"). Примерные средства замедления или приостановки амплификации PCR состоит из УФ-света (+)-СС-1065 и (+)-СС-1065-(N3-аденина). В частности, охватываемые средства представляют собой аддукты ДНК или полинуклеотиды, содержащие аддукты ДНК из полинуклеотидов или пула полинуклеотидов, которые могут высвобождаться или удаляться посредством способа, включающего нагрев раствора, содержащего полинуклеотиды, перед дополнительной обработкой.

В другом аспекте настоящее изобретение относится к способу продуцирования рекомбинантных белков, имеющих биологическую активность, посредством обработки образца, содержащего двухцепочечные шаблонные полинуклеотиды, кодирующие белок дикого типа, в условиях в соответствии с настоящим изобретением, которые обеспечивают получение гибридных или пересортированных полинуклеотидов.

Получение вариантов последовательностей.

Настоящее изобретение также относится к дополнительным способам получения вариантов последовательностей для последовательности нуклеиновых кислот (например, фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы) по настоящему изобретению. Настоящее изобретение также относится к дополнительным способам выделения ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с использованием нуклеиновых кислот и полипептидов по настоящему изобретению. В одном из аспектов настоящее изобретение относится к вариантам последовательности, кодирующей фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу (например, ген, цДНК или мессенджер), по настоящему изобретению, которые могут изменяться с помощью любых средств, включая, например, случайные или стохастические способы, или нестохастические способы, или способы "направленной эволюции", как описано выше.

Выделенные варианты могут встречаться в природе. Вариант может также создаваться in vitro. Варианты могут создаваться с использованием методик генной инженерии, таких как сайт-направленный мутагенеза, случайного химического мутагенеза, процедуры делеции экзонуклеазы III и методики стандартного клонирования. Альтернативно, такие варианты, фрагменты, аналоги, или производные могут создаваться с использованием процедур химического синтеза или модификации. Другие способы получения вариантов также известны специалистам в данной области. Они включают процедуры, в которых последовательности нуклеиновых кислот, полученные из природных изолятов, модифицируются с генерированием нуклеиновых кислот, которые кодируют полипептиды, имеющие характеристики, которые повышают их ценность в промышленных или лабораторных применениях. В таких процедурах генерируются и характеризуются большие количества вариантов последовательностей, имеющих одно или несколько отличий нуклеотидов, по сравнению с последовательностью, полученной из природного изолята. Эти различия нуклеотидов могут приводить к изменениям аминокислот, по сравнению с полипептидами, кодируемыми нуклеиновыми кислотами из природных изолятов.

Например, варианты могут создаваться с использованием ошибочно направленной PCR. В одном из аспектов ошибочно направленной PCR, PCR осуществляется в условиях, при которых точность копирования ДНК полимеразы является низкой, так что получается высокая доля точечных мутаций по всей длине продукта PCR. Ошибочно направленная PCR описывается, например, в Leung (1989), Technique 1:11-15 and Caldwell (1992), PCR Methods Applic. 2:28-33. Вкратце, при таких процедурах, нуклеиновые кислоты, которые должны мутагенизироваться, смешиваются с праймерами PCR, реакционным буфером, MgCl 2 , MnCl 2 , Taq полимеразой и соответствующей концентрацией dNTP, для получения высокой доли точечных мутаций по всей длине продукта PCR. Например, реакция может осуществляться с использованием 20 фмоль нуклеиновой кислоты, которая должна мутагенизироваться, 30 пмоль каждого праймера PCR, реакционного буфера, содержащего 50 мМ KCl, 10 мМ Tris HCl (pH 8,3) и 0,01% желатина, 7 мМ MgCl 2 , 0,5 мМ MnCl 2 , 5 ед. Taq полимеразы, 0,2 мМ dGTP, 0,2 мМ dATP, 1 мМ dCTP и 1 мМ dTTP. PCR может осуществляться в течение 30 циклов при 94 °С в течение 1 мин, при 45 °С в течение 1 мин и при 72 °С в течение 1 мин. Однако будет понятно, что эти параметры могут изменяться при необходимости. Мутагенизированные нуклеиновые кислоты клонируются в соответствующий вектор и оцениваются активности полипептидов, кодируемых мутагенизированными нуклеиновыми кислотами.

В одном из аспектов варианты создаются с использованием олигонуклеотид-направленного мутагенеза для генерирования сайт-специфичных мутаций в любой клонированной ДНК, представляющей интерес. Мутагенез олигонуклеотидов описывается, например, в Reidhaar-Olson (1988), Science 241:53-57. Вкратце, в таких процедурах множество двухцепочечных олигонуклеотидов, несущих одну или несколько мутаций, которые должны вноситься в клонированную ДНК, синтезируются и вставляются в клонированную ДНК, которая должна мутагенизироваться. В одном из аспектов клоны, содержащие мутагенизированную ДНК, извлекаются, экспрессируются, и оцениваются активности полипептида, кодируемого ими.

Другой способ генерирования вариантов представляет собой сборку PCR. Сборка PCR включает сборку продукта PCR из смеси малых фрагментов ДНК. Большое количество различных реакций PCR осуществляется параллельно в одном и том же флаконе, при этом продукты одной реакции праймируют продукты другой реакции. Сборка PCR описывается, например, в патенте США № 5965408.

В одном из аспектов мутагенез посредством половой PCR представляет собой примерный способ генерирования вариантов по настоящему изобретению. В одном из аспектов мутагенеза посредством половой PCR, осуществляется принудительная гомологичная рекомбинация in vitro между молекулами ДНК с различными, но близко родственными последовательностями ДНК, в результате случайного фрагментирования молекулы ДНК на основе гомологии последовательностей, с последующей фиксацией кроссовера посредством удлинения праймера в реакции PCR. Мутагенез посредством половой PCR описывается, например, в Stemmer (1994), Proc. Natl. Acad. Sci. USA 91:10747-10751. Вкратце, в таких процедурах множество нуклеиновых кислот, которые должны рекомбинировать, расщепляются с помощью ДНКазы, с генерированием фрагментов, имеющих средний размер 50-200 нуклеотидов. Фрагменты желаемого среднего размера очищаются и повторно суспендируются в смеси PCR. PCR осуществляют в условиях, которые облегчают рекомбинацию между фрагментами нуклеиновой кислоты. Например, PCR может осуществляться посредством повторного суспендирования очищенных фрагментов при концентрации 10-30 нг/мкл в растворе из 0,2 мМ, каждого, dNTP, 2,2 мМ MgCl 2 , 50 мМ KCl, 10 мМ Tris HCl, рН 9,0 и 0,1% Triton Х-100. Добавляют 2,5 ед. Taq полимеразы на реакционную смесь, 100:1, и осуществляют PCR с использованием следующего режима: при 94 °С в течение 60 с, при 94 °С в течение 30 с, при 50-55 °С в течение 30 с, при 72 °С в течение 30 с (30-45 раз) и при 72 °С в течение 5 мин. Однако будет понятно, что эти параметры могут изменяться при необходимости. В некоторых аспектах олигонуклеотиды могут включаться в реакции PCR. В других аспектах, фрагмент Кленова ДНК полимеразы I может использоваться в первом наборе реакций PCR, и Taq полимераза может использоваться в следующем наборе реакций PCR. Рекомбинантные последовательности выделяются и оцениваются активности полипептидов, которые они кодируют.

В одном из аспектов варианты создаются посредством мутагенеза in vivo. В некоторых аспектах случайные мутации в последовательности, представляющей интерес, генерируются посредством размножения последовательности, представляющей интерес, в бактериальном штамме, таком как штамм Е.coli, который несет мутации в одном или нескольких путях репарации ДНК. Такие "мутаторные" штаммы имеют более высокую долю случайных мутаций, чем родитель дикого типа. Размножение ДНК в одном из этих штаммов будет по возможности генерировать случайные мутации в ДНК. Мутаторные штаммы, пригодные для мутагенеза in vivo, описываются в публикации РСТ, № WO 91/16427, опубликованной 31 октября 1991 г., озаглавленной "Methods for Phenotype Creation from Multiple Gene Populations".

Варианты могут также генерироваться с использованием кассетного мутагенеза. При кассетном мутагенезе малая область молекулы двухцепочечной ДНК заменяется "кассетой" синтетического олигонуклеотида, которая отличается от нативной последовательности. Олигонуклеотид часто содержит полностью и/или частично рандомизированную нативную последовательность.

Рекурсивный групповой мутагенез также может использоваться для генерирования вариантов. Рекурсивный групповой мутагенез представляет собой алгоритм для генной инженерии белков (мутагенеза белков), разработанный для получения разнообразных популяций фенотипических родственных мутантов, элементы которых различаются по последовательности аминокислот. Этот способ использует механизм обратной связи для контроля последовательных раундов комбинаторного кассетного мутагенеза. Рекурсивный групповой мутагенез описывается, например, в Arkin (1992), Proc. Natl. Acad. Sci. USA 89:7811-7815.

В некоторых аспектах варианты создаются с использованием экспоненциального группового мутагенеза. Экспоненциальный групповой мутагенез представляет собой способ генерирования комбинаторных библиотек с большим процентом уникальных и функциональных мутантов, где малые группы остатков рандомизируются параллельно для идентификации, в каждом измененном положении, аминокислот, которые приводят к получению функциональных белков. Экспоненциальный групповой мутагенез описывается, например, в Delegrave (1993), Biotechnology Res. 11:1548-1552. Случайный и сайт-направленный мутагенез описываются, например, в Arnold (1993), Current Opinion in Biotechnology 4:450-455.

В некоторых аспектах варианты создаются с использованием процедур шаффлинга, где части множества нуклеиновых кислот, которые кодируют различные полипептиды, сливаются вместе для создания химерных последовательностей нуклеиновых кислот, которые кодируют химерные полипептиды, как описано в патенте США № 5965408, зарегистрированном 9 июля 1996 г., озаглавленном "Method of DNA Reassembly by Interrupting Synthesis", и патенте США № 5939250, зарегистрированном 22 мая 1996 г., озаглавленном "Production of Enzymes, Having Desired Activities by Mutagenezis".

Варианты полипептидов по настоящему изобретению могут представлять собой варианты, в которых один или несколько и остатков аминокислот полипептидов последовательностей по настоящему изобретению замещаются консервативным или неконсервативным остатком аминокислоты (в одном из аспектов консервативным остатком аминокислоты), и такой замещенный остаток аминокислоты может кодироваться или не кодироваться генетическим кодом.

В одном из аспектов консервативные замещения представляют собой такие, которые замещают данную аминокислоту в полипептиде другой аминокислотой со сходными характеристиками. В одном из аспектов консервативные замещения по настоящему изобретению включают следующие замены: замены алифатической аминокислоты, такой как аланин, валин, лейцин и изолейцин, другой алифатической аминокислотой; замену серина треонином или наоборот; замену кислотного остатка, такого как аспарагиновая кислота и глютаминовая кислота, другим кислотным остатком; замену остатка, несущего амидную группу, такого как аспарагин и глютамин, другим остатком, несущим амидную группу; обмен основного остатка, такого как лизин и аргинин на другой основной остаток; и замену ароматического остатка, такого как фенилаланин, тирозин, другим ароматическим остатком.

Другие варианты представляют собой такие, в которых один или несколько остатков аминокислот полипептида по настоящему изобретению содержат группу-заместитель. В одном из аспектов другие варианты представляют собой такие, в которых полипептид ассоциируется с другим соединением, таким как соединение для увеличения половинного времени жизни полипептида (например, полиэтиленгликоль). Дополнительные варианты представляют собой такие, в которых с полипептидом сливаются дополнительные аминокислоты, такие как лидерная последовательность, секреторная последовательность, пробелковая последовательность или последовательность, которая облегчает очистку, обогащение или стабилизацию полипептида.

В некоторых аспектах фрагменты, производные и аналоги поддерживают такую же биологическую функцию или активность, как и полипептиды по настоящему изобретению. В других аспектах, фрагмент, производное или аналог, который включает пробелок, такой, что фрагмент, производное или аналог, может активироваться посредством отщепления части пробелка с получением активного полипептида.

Оптимизация кодонов для получения высоких уровней экспрессии белка в клетках-хозяевах.

Настоящее изобретение относится к способам модификации нуклеиновых кислот, кодирующих фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, для модификации (например, оптимизации) использования кодонов. В одном из аспектов настоящее изобретение относится к способам модификации кодонов в нуклеиновой кислоте, кодирующей фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, для увеличения или уменьшения его экспрессии в клетке-хозяине. Настоящее изобретение также предусматривает нуклеиновые кислоты, кодирующие фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, модифицированные для увеличения его экспрессии в клетке-хозяине, фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, модифицированный таким образом, и способы получения модифицированных ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Способ включает идентификацию "непредпочтительного" или "менее предпочтительного" кодона в нуклеиновой кислоте, кодирующей фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, и замену одного или нескольких из этих непредпочтительных или менее предпочтительных кодонов "предпочтительным кодоном", кодирующим такую же аминокислоту, как замененный кодон, и по меньшей мере один непредпочтительный или менее предпочтительный кодон в нуклеиновой кислоте, заменяется предпочтительным кодоном, кодирующим такую же аминокислоту. Предпочтительный кодон представляет собой кодон, сверхпрезентированный в кодирующих последовательностях в генах в клетке-хозяине, а непредпочтительный или менее предпочтительный кодон представляет собой кодон недопрезентированный в кодирующих последовательностях, в генах, в клетке-хозяине.

Клетки-хозяева для экспрессии нуклеиновых кислот кассет экспрессии и векторов по настоящему изобретению включают клетки бактерий, дрожжей, грибков, клетки растений, клетки насекомых и клетки млекопитающих (см. обсуждение выше). Таким образом, настоящее изобретение относится к способам оптимизации использования кодона во всех этих клетках, нуклеиновые кислоты с измененными кодонами и полипептиды, полученные посредством нуклеиновых кислот с измененными кодонами. Примерные клетки-хозяева включают грамотрицательные бактерии, такие как Escherichia coli; грамположительные бактерии, такие как Streptomyces sp., Lactobacillus gasseri, Lactococcus lactis, Lactococcus cremoris, Bacillus subtilis, Bacillus cereus. Примерные клетки-хозяева также включают эукариотические организмы, например, различные дрожжи, такие как Saccharomyces sp., включая Saccharomyces cerevisiae, Schizosaccharomyces pombe, Pichia pastoris и Kluyveromyces lactis, Hansenula polymorpha, Aspergillus niger, и клетки линий клеток млекопитающих, и клетки и линии клеток насекомых. Таким образом, настоящее изобретение также включает нуклеиновые кислоты и полипептиды, оптимизированные для экспрессии в этих организмах и видах.

Например, кодоны нуклеиновой кислоты, кодирующей фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, выделенные из бактериальной клетки, модифицируются так, что нуклеиновая кислота оптимально экспрессируется в бактериальной клетке, отличной от бактерии, из которой получают фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, в дрожжах, грибках, клетке растения, клетке насекомого или клетке млекопитающего. Способы оптимизации кодонов хорошо известны в данной области, см., например, патент США № 5795737; Васа (2000), Int. J. Parasitol. 30:113-118; Hale (1998), Protein Expr. Purif. 12:185-188; Narum (2001), Infect. Immun. 69:7250-7253. См. также Narum (2001), Infect. Immun. 69:7250-7253, описывающую оптимизацию кодонов в системах мышей; Outchkourov (2002), Protein Expr. Purif. 24:18-24, описывающую оптимизацию кодонов в дрожжах; Feng (2000), Biochemistry 39:15399-15409, описывающую оптимизацию кодонов в Е.coli; Humphreys (2000), Protein Expr. Purif. 20:252-264, описывающую оптимизацию использования кодонов, которая влияет на секретирование в Е.coli.

Трансгенные животные, не являющиеся человеком.

Настоящее изобретение относится к трансгенным животным, не являющимся человеком, содержащим нуклеиновую кислоту, полипептид (например, фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу), кассету или вектор экспрессии или трансифицированную или трансформированную клетку по настоящему изобретению. Настоящее изобретение также относится к способам получения и использования этих трансгенных животных, не являющихся человеком.

Трансгенные животные, не являющиеся человеком, могут представлять собой, например, собак, коз, кроликов, овец, свиней (включая все виды свиней, домашних свиней и родственных животных), коров, крыс и мышей, содержащих нуклеиновые кислоты по настоящему изобретению. Эти животные могут использоваться, например, в качестве моделей in vivo для изучения активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или в качестве моделей для скрининга агентов, которые изменяют активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, in vivo. Кодирующие последовательности для полипептидов, которые должны экспрессироваться в трансгенных животных, не являющихся человеком, могут конструироваться, чтобы они были конститутивными или находились под контролем ткань-специфичных, специфичных к развитию или индуцируемых регуляторных факторов транскрипции.

Трансгенные животные, не являющиеся человеком, могут конструироваться и генерироваться с использованием любого способа, известного в данной области; см., например, патенты США № 6211428; 6187992; 6156952; 6118044; 6111166; 6107541; 5959171; 5922854; 5892070; 5880327; 5891698; 5639940; 5573933; 5387742; 5087571, описывающие получение и использование трансформированных клеток и яйцеклеток и трансгенных мышей, крыс, кроликов, овец, свиней и коров. См. также, например, Pollock (1999), J. Immunol. Methods 231:147-157, описывающую производство рекомбинантных белков в молоке трансгенных молочных животных; Baguisi (1999), Nat. Biotechnol. 17:456-461, демонстрирующую получение трансгенных коз. Патент США № 6211428 описывает получение и использование трансгенных млекопитающих, не являющихся человеком, которые экспрессируют в своем головном мозге конструкт нуклеиновой кислоты, содержащий последовательность ДНК. Патент США № 5387742 описывает инъекцию последовательностей клонированной рекомбинантной или синтетической ДНК в оплодотворенные яйцеклетки мышей, имплантирование инъецированных яйцеклеток псевдобеременным самкам и выращивание до срока трансгенных мышей. Патент США № 6187992 описывает получение и использование трансгенных мышей.

"Нокаутированные животные" также могут использоваться для осуществления способов по настоящему изобретению. Например, в одном из аспектов трансгенные или модифицированные животные по настоящему изобретению представляют собой "нокаутированных животных", например, "нокаутированную мышь", полученную с помощью генной инженерии, не экпрессирующую эндогенный ген, который заменяется геном, экспрессирующим фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению, или белок слияния, содержащий фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению.

Трансгенные растения и семена.

Настоящее изобретение предусматривает трансгенные растения и семена, содержащие нуклеиновую кислоту, полипептид (например, фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу), кассету или вектор экспрессии, или трансфицированную или трансформированную клетку по настоящему изобретению. Настоящее изобретение предусматривает также продукты растений, например, масла, семена, листья, экстракты и т.п., содержащие нуклеиновую кислоту и/или полипептид (например, фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу) по настоящему изобретению. Трансгенное растение может быть двудольные (dicot) или однодольные (monocot). Настоящее изобретение также относится к способам получения и использования этих трансгенных растений и семян. Трансгенное растение или клетка растения, экспрессирующая полипептид по настоящему изобретению, может конструироваться в соответствии с любым способом, известным в данной области. См., например, патент США № 6309872.

Нуклеиновые кислоты и конструкты экспрессии по настоящему изобретению могут вводиться в клетку растения с помощью любых средств. Например, нуклеиновые кислоты или конструкты экспрессии могут вводиться в геном желаемого растения хозяина, или нуклеиновые кислоты или конструкты экспрессии могут представлять собой эписомы. Введение в геном желаемого растения может быть таким, что производство в хозяине фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, регулируется эндогенными контрольными элементами для транскрипции или трансляции. Настоящее изобретение также предусматривает "нокаутированные растения", где вставка генной последовательности, например, посредством гомологичной рекомбинации, разрушает экспрессию эндогенного гена. Средства для генерирования "нокаутированных" растений хорошо известны в данной области, см., например, Strepp (1998), Proc Natl. Acad. Sci. USA 95:4368-4373; Miao (1995), Plant J. 7:359-365. См. обсуждение относительно трансгенных растений ниже.

Нуклеиновые кислоты по настоящему изобретению могут использоваться для придания желаемых признаков по существу любому растению, например, крахмал-продуцирующим растениям, таким как картофель, томаты, соя, свекла, кукуруза, пшеница, рис, ячмень и т.п. Нуклеиновые кислоты по настоящему изобретению могут использоваться для манипулирования метаболическими путями растения, для оптимизации или изменения экспрессии в хозяине фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Это может изменить активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, в растении. Альтернативно, фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению может использоваться при получении трансгенного растения для получения соединения, не производимого в природе этим растением. Это может понизить стоимость производства или создать новый продукт.

В одном из аспектов первая стадия при получении трансгенного растения включает получение конструкта экспрессии для экспрессии в клетке растения. Эти методики хорошо известны в данной области. Они могут включать селекцию и клонирование промотора, кодирующей последовательности для облегчения эффективного связывания рибосом с m-РНК и селекцию соответствующих терминаторных последовательностей гена. Один из примерных конститутивных промоторов представляет собой CaMV35S, из вируса мозаики цветной капусты, который, как правило, приводит к получению высокого уровня экспрессии в растениях. Другие промоторы являются более специфичными и реагируют на стимулы во внутренней или внешней окружающей среде растения. Пример светоиндуцируемого промотора представляет собой промотор из гена cab, кодирующего главный белок связывания хлорофилла а/b.

В одном из аспектов нуклеиновая кислота модифицируется для получения большей экспрессии в клетке растения. Например, последовательность по настоящему изобретению с большей вероятностью будет иметь более высокий процент А-Т пар нуклеотидов, по сравнению с тем, что видно у растений, некоторые из которых предпочитают G-C пары нуклеотидов. По этой причине, А-Т нуклеотиды в кодирующей последовательности могут замещаться G-C нуклеотидами без значительного изменения последовательности аминокислот, для повышения производства генного продукта в клетках растений.

Селектируемый маркерный ген может добавляться в генный конструкт для идентификации клеток растений или тканей, которые успешно интегрируют трансген. Это может быть необходимым, поскольку достижение инкорпорирования и экспрессии генов в клетках растений представляет собой редкое событие, происходящее едва ли в нескольких процентах целевых тканей или клеток. Селектируемые маркерные гены кодируют белки, которые обеспечивают стойкость к агентам, которые являются, как правило, токсичными для растений, таких как антибиотики или гербициды. Только клетки растений, которые имеют встроенный селектируемый маркерный ген, выживут, когда они выращиваются в среде, содержащей соответствующий антибиотик или гербицид. Что касается других вставленных генов, маркерные гены также требуют промоторных и терминаторных последовательностей для правильного функционирования.

В одном из аспектов получение трансгенных растений или семян включает введение последовательностей по настоящему изобретению и, необязательно, маркерных генов в целевой конструкт экспрессии (например, плазмиду), вместе с позиционированием промоторной и терминаторной последовательности. Это может включать перенос модифицированного гена в растение с помощью соответствующего способа. Например, конструкт может вводиться непосредственно в геномную ДНК клетки растения, с использованием таких методик, как электропорообразование и микроинъекция протопластов клетки растения, или конструкты могут вводиться непосредственно в ткань растения с использованием баллистических методов, таких как бомбардировка частицами ДНК. Например, см., например, Christou (1997), Plant Mol. Biol. 35:197-203; Pawlowski (1996), Mol. Biotechnol. 6:17-30; Klein (1987), Nature 327:70-73; Takumi (1997), Genes Genet. Syst. 72:63-69, описывающие использование бомбардировки частицами для введения трансгенов в пшеницу; и Adam (1997), выше, относительно использования бомбардировки частицами для введения YAC в клетки растений. Например, Rinehart (1997), выше, использовал бомбардировку частицами для генерирования трансгенных растений хлопка. Устройство для ускорения частиц описано в патенте США № 5015580; и имеется коммерчески доступный инструмент для ускорения частиц BioRad (Biolistics) PDS-2000; см. также, John, патент США № 5608148; и Ellis, патент США № 5681730, описывающие опосредованное частицами трансформирование голосеменных.

В одном из аспектов протопласты могут иммобилизироваться и подвергаться инъекции нуклеиновых кислот, например, конструкта экспрессии. Хотя регенерация растений из протопластов является не простой для зерновых культур, регенерация растений возможна у бобовых растений с использованием соматического эмбриогенеза из каллюса, полученного из протопластов. Организованные ткани могут трансформироваться с помощью голой ДНК с использованием методики генной пушки, где ДНК наносится в виде покрытия на вольфрамовые микроскопические бомбардирующие частицы, составляющие 1/100 размера клеток, которые несут ДНК глубоко в клетки и органеллы. Затем трансформированная ткань индуцируется для регенерации, обычно, посредством соматического эмбриогенеза. Эта методика оказалась успешной для нескольких видов зерновых культур, включая маис и рис.

Нуклеиновые кислоты, например конструкты экспрессии, могут также вводиться в клетки растений с использованием рекомбинантных вирусов. Клетки растений могут трансформироваться с использованием вирусных векторов, таких, например, как векторы, полученные из вируса табачной мозаики (Rouwendal (1997), Plant Mol. Biol. 33:989-999), см. Porta (1996), "Use of viral replicons for the expression of genes in plants", Mol. Biotechnol. 5:209-221.

Альтернативно, нуклеиновые кислоты, например конструкты экспрессии, могут объединяться с соответствующими фланкирующими областями Т-ДНК и вводиться в обычный вектор хозяина Agrobacterium tumefaciens. Функции вирулентности хозяина Agrobacterium tumefaciens будут направлять вставку конструкта и соседнего маркера в ДНК клетки растения, когда клетка инфицируется бактерией. Методики трансформирования, медиируемые Agrobacterium tumefaciens, включая нейтрализацию и использование бинарных векторов, хорошо описаны в научной литературе. См., например, Horsch (1984), Science 233:496-498; Fraley (1983), Proc. Natl. Acad. Sci. USA 80:4803 (1983); Gene Transfer to Plant, Potrykus, ed. (Springer-Verlag, Berlin 1995). ДНК в клетке A. tumefaciens содержится в бактериальной хромосоме, а также в другой структуре, известной как Ti (опухолеиндуцирующая) плазмида. Ti плазмида содержит фрагмент секвенирования ДНК, называемый Т-ДНК (длиной ~20 kb), который переносится в клетку растения в процессе инфицирования и в ряд генов vir (вирулентности), которые направляют процесс инфицирования. A. tumefaciens может инфицировать растения только через повреждения: когда корень или ствол растения повреждается, оно выделяет определенные химические сигналы, в ответ на которые гены vir A. tumefaciens активируются и направляют ряд событий, необходимых для переноса Т-ДНК из Ti плазмиды в хромосому растения. Затем Т-ДНК поступает в клетку растения через повреждения. Одно из предположений заключается в том, что Т-ДНК ждет, пока ДНК растения не будет подвергаться репликации или транскрипции, а затем вставляется сама в экспонируемую ДНК растения. Для использования A. tumefaciens в качестве трансгенного вектора, опухолеиндуцирующая секция Т-ДНК должна удаляться, удерживая при этом граничные области Т-ДНК и гены vir. Затем трансген вставляется между граничными областями Т-ДНК, где он переносится в клетку растения и встраивается в хромосомы растения.

Настоящее изобретение предусматривает трансформирование однодольных растений с использованием нуклеиновых кислот по настоящему изобретению, включая важные зерновые культуры, см. Hiei (1997), Plant Mol. Biol. 35:205-218. См. также, например, Horsch, Science (1984), 233:496; Fraley (1983), Proc. Natl. Acad. Sci USA 80:4803; Thykjaer (1997), выше; Park (1996), Plant Mol. Biol. 32:1135-1148, обсуждающую встраивание Т-ДНК в геномную ДНК. См. также D'Halluin, патент США № 5712135, описывающий способ стабильного встраивания ДНК, содержащей ген, который является функциональным, в клетку зернового растения или другого однодольного растения.

В одном из аспектов третья стадия включает селекцию и регенерацию цельных растений, способных переносить введенный целевой ген в следующее поколение. Такие методики регенерации могут использовать манипулирование определенными фитогормонами в среде роста для культуры ткани. В одном из аспектов способ использует биоцидный и/или гербицидный маркер, который вводится вместе с желаемыми последовательностями нуклеотидов. Регенерация растений из культивируемых протопластов описывается в Evans et al., Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, p. 124-176, MacMillilan Publishing Company, New York, 1983; и Binding, Regeneration of Plants, Plant Protoplasts, p. 21-73, CRC Press, Boca Raton, 1985. Регенерация также может быть получена из каллюса растения, его эксплантатов, органов или частей. Такие методики регенерации описаны в целом Klee (1987), Ann. Rev. of Plant Phys. 38:467-486. Для получения цельных растений из трансгенных тканей, таких как незрелые эмбрионы, они могут выращиваться в условиях контролируемой окружающей среды в ряде сред, содержащих питательные вещества и гормоны, способ известен как культура ткани. После генерирования растений и получения от них семян начинается оценка потомства.

В одном из аспектов после того как кассета экспрессии стабильно вводиться в трансгенное растение, оно может вводиться в другие растения посредством полового скрещивания. Может использоваться любая из ряда стандартных методик скрещивания, в зависимости от видов, которые должны скрещиваться. Поскольку трансгенная экспрессия нуклеиновых кислот по настоящему изобретению приводит к фенотипическим изменениям, растения, содержащие рекомбинантные нуклеиновые кислоты по настоящему изобретению, могут скрещиваться половым путем со вторым растением, с получением конечного продукта. Таким образом, семена по настоящему изобретению могут быть получены от скрещивания двух трансгенных растений по настоящему изобретению или скрещивания растения по настоящему изобретению и другого растения. Желаемые эффекты (например, экспрессия полипептидов по настоящему изобретению для получения растения, у которого изменяется поведение при цветении), могут быть усилены, когда оба родительских растения экспрессируют полипептиды (например, фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу) по настоящему изобретению. Желаемые эффекты могут переноситься на будущие поколения растений с помощью стандартных средств размножения.

В одном из аспектов нуклеиновые кислоты и полипептиды по настоящему изобретению экспрессируются или вставляются в любое растение или семя. Трансгенные растения по настоящему изобретению могут быть двудольными или однодольными. Примеры однодольных трансгенных растений по настоящему изобретению представляют собой травы, такие как луговая трава (мятлик болотный, Pod), фуражная трава, такая как овсяница, райграс, травы для умеренного климата, такие как Agrostis, и зерновые культуры, например пшеница, овес, рожь, ячмень, рис, сорго и маис (кукуруза). Примеры двудольных трансгенных растений по настоящему изобретению представляют собой табак, бобовые растения, такие как люпины, картофель, сахарная свекла, груша, бобы и соя, и крестоцветные растения (семейство Brassicaceae), такие как цветная капуста, рапс, и близко родственный модельный организм Arabidopsis thaliana. Таким образом, трансгенные растения и семена по настоящему изобретению включают широкий диапазон растений, включая, но не ограничиваясь этим, виды из родов Anacardium, Arachis, Asparagus, Atropa, Avena, Brassica, Citrus, Citridlus, Capsicum, Carthamus, Cocos, Coffea, Cucumis, Cucurbita, Daucus, Elaeis, Fragaria, Glicin, Gossypium, Helianthus, Heterocallis, Hordewn, Hyoscyamus, Lactuca, Linum, Lolium, Lupinus, Lycopersicon, Mains, Manihot, Majorana, Medicago, Nicotiana, Olea, Oryza, Panieum, Pannisetum, Persea, Phaseolus, Pistachia, Pisum, Pyrus, Primus, Raphanus, Ricinus, Secale, Senecio, Sinapis, Solanum, Sorghum, Theobromus, Trigonella, Triticum, Vicia, Vitis, Vigna и Zea.

В альтернативных вариантах осуществления нуклеиновые кислоты по настоящему изобретению экспрессируются в растения, которые содержат волокнистые клетки, включая, например, хлопок, хлопковое дерево (капок, Ceiba pentandra), иву пустынную, креозотовый куст, терескен шерстистый, бальзу, рами, гибискус коноплевый, коноплю, розель, джут, сизаль абака и лен. В альтернативных вариантах осуществления, трансгенные растения по настоящему изобретению могут быть членами рода Gossypium, включая члены из любых видов Gossypium, таких как G. arboreum;. G. herbaceum, G. barbadense и G. hirsutum.

Настоящее изобретение также предусматривает трансгенные растения, которые должны использоваться для производства большого количества полипептидов (например, фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или антитела) по настоящему изобретению. Например, см. Palmgren (1997), Trends Genet. 13:348; Chong (1997), Transgenic Res. 6:289-296 (производят белок бета-казеин молока человека в трансгенных растениях картофеля с использованием ауксин-индуцируемого, двустороннего промотора маннопинсинтазы (mas 1', 2') с помощью способов трансформирования донца листа, опосредуемого Agrobacterium tumefaciens).

С использованием известных процедур специалист в данной области может осуществить скрининг растений по настоящему изобретению посредством детекции увеличения или уменьшения уровня трансгенной m-РНК или белка в трансгенных растениях. Средства для детекции и количественного определения уровня m-РНК или белков хорошо известны в данной области.

Полипептиды и пептиды.

В одном из аспектов настоящее изобретение относится к выделенным или рекомбинантным полипептидам, имеющим идентичность последовательностей (например, по меньшей мере примерно 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более либо полную (100%) идентичность последовательности или гомологию) с примерной последовательностью по настоящему изобретению, например, с белками, имеющими последовательность, как приведено в SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:70, SEQ ID NO:72, SEQ ID NO:74, SEQ ID NO:76, SEQ ID NO:78, SEQ ID NO:80, SEQ ID NO:82, SEQ ID NO:84, SEQ ID NO:86, SEQ ID NO:88, SEQ ID NO:90, SEQ ID NO:92, SEQ ID NO:94, SEQ ID NO:96, SEQ ID NO:98, SEQ ID NO:100, SEQ ID NO:102, SEQ ID NO:104, SEQ ID NO:106, SEQ ID NO:108, SEQ ID NO:110, SEQ ID NO:112, SEQ ID NO:114, SEQ ID NO:116, SEQ ID NO:118, SEQ ID NO:120, SEQ ID NO:122, SEQ ID NO:124, SEQ ID NO:126, SEQ ID NO:128, SEQ ID NO:130, SEQ ID NO:132, SEQ ID NO:134, SEQ ID NO:136, SEQ ID NO:138, SEQ ID NO:140, SEQ ID NO:142, SEQ ID NO:143, SEQ ID NO:146, SEQ ID NO:148, SEQ ID NO:150, SEQ ID NO:152, SEQ ID NO:154, SEQ ID NO:156, SEQ ID NO:158, SEQ ID NO:160, SEQ ID NO:162, SEQ ID NO:164 или SEQ ID NO:166 (см. также табл. 1-3, примеры 1 и 4 ниже и список последовательностей)). Процент идентичности последовательности может осуществляться по всей длине полипептида, или идентичность осуществляться в области по меньшей мере примерно из 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 или более остатков.

Полипептиды по настоящему изобретению могут также быть короче, чем полная длина примерных полипептидов. В альтернативных аспектах настоящее изобретение относится к полипептидам (пептидам, фрагментам), находящимся в диапазоне размеров примерно от 5 остатков до полной длины полипептида, например фермента, такого как фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза; примерные размеры составляют примерно 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700 или более остатков, например, непрерывных остатков примерного фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению. Пептиды по настоящему изобретению (например, субпоследовательность примерного полипептида по настоящему изобретению) могут быть пригодны для использования в качестве, например, метящих зондов, антигенов (иммуногенов), толерагенов, мотивов, активных сайтов (например, "каталитических доменов") фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, сигнальных последовательностей и/или препродоменов.

В альтернативных аспектах полипептиды по настоящему изобретению, имеющие активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, являются членами рода полипептидов, имеющего общие конкретные структурные элементы, например, остатки аминокислот, которые коррелируют с активностью целлюлазы, например, с активностью эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Эти общие структурные элементы могут использоваться для рутинного генерирования вариантов целлюлозы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Эти общие структурные элементы ферментов целлюлоз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению могут использоваться в качестве направляющих для рутинного генерирования вариантов ферментов целлюлоз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы в рамках рода полипептидов по настоящему изобретению.

Как здесь используется, термины "целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза" охватывают любой полипептид или ферменты, способные катализировать полное или частичное разрушение и/или гидролиз целлюлозы (например, примерные полипептиды по настоящему изобретению, см. также табл. 1-3, примеры 1 и 4 ниже) или любой модификации целлюлозы, или лигноцеллюлозного материала, например материала биологической массы, содержащего лигноцеллюлозу.

В некоторых аспектах полипептид по настоящему изобретению может иметь альтернативную ферментативную активность, например, как приведено в табл. 3 ниже. Например, полипептид, имеющий последовательность, как приведено в SEQ ID NO:164, кодируемый, например, посредством SEQ ID NO:163, может иметь активность щелочной эндоглюканазы/целлюлазы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:110, кодируемый, например, посредством SEQ ID NO:109, может иметь активность ксиланазы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:12, кодируемый, например, посредством SEQ ID NO:11, может иметь активность NAD-связывающей оксидоредуктазы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:118, кодируемый, например, посредством SEQ ID NO:117, может иметь активность короткоцепочечной дегидрогеназы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:14, кодируемый, например, посредством SEQ ID NO:13, может иметь активность NADH-зависимой дегидрогеназы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:138, кодируемый, например, посредством SEQ ID NO:137, может иметь активность пептидазы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:162, кодируемый, например, посредством SEQ ID NO:161, может иметь активность щелочной эндоглюканазы, в дополнение к активности целлюлазы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:42, кодируемый, например, посредством SEQ ID NO:41, может иметь активность цистеинил t-РНК-синтетазы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:32, кодируемый, например, посредством SEQ ID NO:31, может иметь активность целлодекстринфосфорилазы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:50, кодируемый, например, посредством SEQ ID NO:49, может иметь активность fdhd/narq оксидоредуктазы; полипептид, имеющий последовательность, как приведено в SEQ ID NO:54, кодируемый, например, посредством SEQ ID NO:53, может иметь активность радикального S-аденозилметионина (SAM); полипептид, имеющий последовательность, как приведено в SEQ ID NO:58, кодируемый, например, посредством SEQ ID NO:57, может иметь активность субтилизин-подобной протеазы; и т.п., как приведено ниже.

Таблица 3

"Аминокислота" или "последовательность аминокислот", как здесь используется, относится к олигопептиду, пептиду, полипептиду или последовательности белков или к фрагменту, части или субъединице любого из них и к встречающимся в природе или синтетическим молекулам. "Аминокислота" или "последовательность аминокислот" включает олигопептид, пептид, полипептид или последовательность белков или фрагмент, часть или субъединицу любого из них и встречающиеся в природе или синтетические молекулы. Термин "полипептид", как здесь используется, относится к аминокислотам, соединенных друг с другом посредством пептидных связей или модифицированных пептидных связей, т.е. к изостерам пептидов, и они могут включать модифицированные аминокислоты, иные, чем 20 генно-кодируемых аминокислот. Полипептиды могут модифицироваться посредством либо природных процессов, таких как посттрансляционный процессинг, либо посредством методик химической модификации, которые хорошо известны в данной области. Модификации могут происходить в любом месте в полипептиде, включая пептидную основную цепь, боковые цепи аминокислот и амино или карбоксильное окончание. Будет понятно, что один и тот же тип модификации может присутствовать при одинаковом или при различных уровнях на нескольких сайтах в данном полипептиде. Также, данный полипептид может иметь множество типов модификаций. Модификации включают ацетилирование, ацилирование, ADP-рибозилирование, амидирование, ковалентное присоединение флавина, ковалентное присоединение остатка гема, ковалентное присоединение нуклеотида или производного нуклеотида, ковалентное присоединение липида или производного липида, ковалентное присоединение фосфатидилинозитола, циклизацию с поперечной сшивкой, образование дисульфидной связи, деметилирование, образование ковалентных поперечных сшивок, образование цистеина, образование пироглютамата, формилирование, гамма-карбоксилирование, гликозилирование, образование якоря GPI, гидроксилирование, йодинирование, метилирование, миристолирирование, окисление, пегилирование, обработку глюкангидролазой, фосфорилирование, пренилирование, рацемизацию, селеноилирование, сульфатирование и опосредованное транспортной РНК добавление аминокислот к белку, такое как аргинилирование. (см. Creighton, Т.Е., Proteins - Structure and Molecular Properties 2nd Ed., W.H. Freeman and Company, New York (1993); Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, p. 1-12 (1983)). Пептиды и полипептиды по настоящему изобретению также включают все "миметические" и "пептидомиметические" формы, как описано более подробно ниже.

Как здесь используется, термин "выделенный" означает, что материал (например, белок или нуклеиновая кислота по настоящему изобретению) удаляется из его исходной окружающей среды (например, природной окружающей среды, если он встречается в природе). Например, встречающийся в природе полинуклеотид или полипептид, присутствующий в живом животном не является выделенным, но тот же полинуклеотид или полипептид, выделенный из некоторых или всех сосуществующих материалов в природной системе, является выделенным. Такие полинуклеотиды могут представлять собой часть вектора и/или такие полинуклеотиды или полипептиды могут представлять собой часть композиции и по-прежнему быть выделенными, поскольку такой вектор или композиция не являются частью их природной окружающей среды. Как здесь используется, термин "очищенный" не требует абсолютной чистоты; скорее, он рассматривается как относительное определение. Индивидуальные нуклеиновые кислоты, полученные из библиотеки, обычно очищаются до электрофоретической гомогенности. Последовательности, полученные из этих клонов, не могут быть получены непосредственно либо из библиотеки, либо из полной ДНК человека. Очищенные нуклеиновые кислоты по настоящему изобретению очищаются от остальной геномной ДНК в организме по меньшей мере в 10 4 -10 6 раз. В одном из аспектов термин "очищенный" включает нуклеиновые кислоты, которые являются очищенными от остатка геномной ДНК или других последовательностей в библиотеке или в другой окружающей среде по меньшей мере на один порядок величины, например, в одном из аспектов на два или три порядка, или на четыре или пять порядков величины.

"Рекомбинантные" полипептиды или белки относятся к полипептидам или белкам, полученным с помощью методик рекомбинантной ДНК; т.е. полученным от клеток, трансформированных с помощью экзогенного конструкта ДНК, кодирующего желаемый полипептид или белок. "Синтетические" полипептиды или белок представляют собой такие молекулы, которые получают посредством химического синтеза. Способы твердофазного химического синтеза пептида также могут использоваться для синтеза полипептида или фрагментов по настоящему изобретению. Такие способы известны в данной области, начиная с ранних 1960 (Merrifield, R.В., J. Am. Chem. Soc, 85:2149-2154, 1963) (см. также Stewart, J.M. and Young, J.D., Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, 111, p. 11-12) и в последнее время используются в коммерчески доступных наборах для лабораторного конструирования и синтеза пептидов (Cambridge Research Biochemicals). Такие коммерчески доступные лабораторные наборы, как правило, используют концепции Н.М. Geysen et al., Proc. Natl. Acad. Set, USA, 81:3998 (1984) и дают синтезируемые пептиды на кончиках множества "стержней" или "шпилек", которые все присоединены к одной пластине.

Фраза "по существу идентичный" в контексте двух нуклеиновых кислот или полипептидов относится к двум или более последовательностям, которые имеют, например по меньшей мере примерно 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или более идентичность (последовательности) нуклеотидов или остатков аминокислот, когда сравниваются и совмещаются для максимального соответствия, при измерении с использованием одного из известных алгоритмов сравнения последовательностей или посредством визуальной проверки. В альтернативных аспектах по существу идентичность существует в области по меньшей мере примерно из 100 или более остатков, а чаще всего, последовательности являются по существу идентичными по меньшей мере примерно на 150-200 или более остатках. В некоторых аспектах последовательности являются по существу идентичными по всей длине кодирующих областей.

В дополнение к этому "по существу идентичная" последовательность аминокислот представляет собой последовательность, которая отличается от эталонной последовательности одним или несколькими консервативными или неконсервативными замещениями аминокислот, делециями или инсерциями. В одном из аспектов замещение осуществляется на сайте, который не является активным сайтом молекулы, или, альтернативно, замещение осуществляется на сайте, который представляет собой активный сайт молекулы, в условии, что полипептид по существу поддерживает свои функциональные (ферментативные) свойства. Консервативное замещение аминокислот, например, заменяет одной аминокислотой другую из того же класса (например, замещение одной гидрофобной аминокислотой, такой как изолейцин, валин, лейцин или метионин, другой, или замещение одной полярной аминокислотой другой, такой как замещение аргинином лизина, глютаминовой кислотой аспарагиновой кислоты или глютамином аспарагина). Одна или несколько аминокислот могут удаляться, например, из полипептида целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, приводя к модификации структуры полипептида, без значительного изменения его биологической активности. Например, могут удаляться амино- или карбоновые конечные аминокислоты, которые не требуются для биологической активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Модифицированные последовательности полипептидов по настоящему изобретению могут анализироваться на биологическую активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с помощью ряда способов, включающих приведение в контакт модифицированной последовательности полипептидов с субстратом и определения того, уменьшает ли модифицированный полипептид количество конкретного субстрата при анализе или увеличивает ли он количество биологических продуктов при ферментативной реакции функционального полипептида целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с субстратом.

"Фрагменты", как здесь используются, представляют собой часть встречающегося в природе белка, который может существовать по меньшей мере в двух различных конформациях. Фрагменты могут иметь такую же или по существу такую же последовательность аминокислот, как и встречающийся в природе белок. Фрагменты, которые имеют иные трехмерные структуры, чем встречающийся в природе белок, также включаются. Их примером является молекула "про-формы", такая как пробелок с низкой активностью, который может модифицироваться посредством расщепления, с получением зрелого фермента со значительно более высокой активностью.

В одном из аспектов настоящее изобретение предусматривает кристаллические (трехмерные) структуры белков и пептидов, например, целлюлаз, по настоящему изобретению; которые могут получаться и анализироваться с использованием рутинных протоколов, хорошо известных в данной области, например, как описано в MacKenzie (1998), Crystal structure of the family 7 endoglucanase I (Cel7B) from Humicola insolens at 2.2 A resolution and identification of the catalytic nucleophile by trapping of covalent glycosyl-enzyme intermediate, Biochem. J. 335:409-416; Sakon (1997), Structure and mechanism of endo/exocellulase E4 from Thennomonospora Jusca, Nat. Struct. Biol 4:810-818; Varrot (1999), Crystal structure of the catalytic core domain of the family 6 cellobiohydrolase II, Cel6A, from Humicola insolens, at 1.92 A resolution, Biochem. J. 337:297-304; иллюстрирующих и идентифицирующих конкретные структурные элементы в качестве инструкции для рутинного генерирования вариантов целлюлазы по настоящему изобретению, и в качестве инструкции для идентификации видов ферментов в рамках настоящего изобретения.

Полипептиды и пептиды по настоящему изобретению могут выделяться из природных источников, представлять собой синтетические или генерируемые рекомбинантно полипептиды. Пептиды и белки могут экспрессироваться рекомбинантно in vitro или in vivo. Пептиды и полипептиды по настоящему изобретению могут получаться и выделяться с использованием любого способа, известного в данной области. Полипептиды и пептиды по настоящему изобретению могут также синтезироваться, полностью или частично, с использованием химических способов, хорошо известных в данной области. См., например, Caruthers (1980), Nucleic Acids Res. Symp. Ser. 215-223; Horn (1980), Nucleic Acids Res. Symp. Ser. 225-232; Banga, A.K., Therapeutic Peptides and Proteins, Formulation, Processing and Delivery Systems (1995), Technomic Publishing Co., Lancaster, PA. Например, синтез пептидов может осуществляться с использованием различных твердофазных методик (см., например, Roberge (1995), Science 269:202; Merrifield (1997), Methods Enzymol. 289:3-13), а автоматизированный синтез может достигаться, например, с использованием Peptide Synthesizer AB1431A (Perkin Elmer) в соответствии с инструкциями, поставляемыми производителем.

Пептиды и полипептиды по настоящему изобретению могут также быть гликозилированными. Гликозилирование может добавляться посттрансляционно либо химически, либо посредством клеточных механизмов биосинтеза, где последнее включает использование известных мотивов гликозилирования, которые могут быть нативными для последовательности или могут добавляться как пептид, или добавляться в кодирующую последовательность нуклеиновых кислот. Гликозилирование может быть О-связанным или N-связанным.

Пептиды и полипептиды по настоящему изобретению, как определено выше, включают все "миметические" и "пептидомиметические" формы. Термины "миметический" и "пептидомиметический" относится к синтетическому химическому соединению, которое имеют по существу такие же структурные и/или функциональные характеристики как и полипептиды по настоящему изобретению. Миметик может либо полностью состоять из синтетических, неприродных аналогов аминокислот, либо представлять собой химерную молекулу, частично из природных аминокислот пептидов, а частично из неприродных аналогов аминокислот. Миметик может также содержать любое количество консервативных замещений природных аминокислот, постольку, поскольку такие замещения также не изменяют существенно структуру и/или активность миметика. Как и для полипептидов по настоящему изобретению, которые представляют собой консервативные варианты или члены рода полипептидов по настоящему изобретению (например, имеют примерно 50% или более идентичность последовательности с примерной последовательностью по настоящему изобретению), рутинным экспериментированием определяют, находится ли миметик в рамках настоящего изобретения, т.е. то, что его структура и/или функция существенно не изменяются. Таким образом, в одном из аспектов композиция миметика находится в рамках настоящего изобретения, если он имеет активность ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

Композиции миметиков полипептидов по настоящему изобретению могут содержать любое сочетание неприродных структурных компонентов. В альтернативном аспекте композиции миметиков по настоящему изобретению включают одну из следующих трех структурных групп или их все: а) связи между группами остатков, иные, чем связи с помощью природной амидной связи ("пептидная связь"); b) неприродные остатки на месте остатков аминокислот, встречающихся в природе; или с) остатки, которые индуцируют вторичную структурную мимикрию, т.е. индуцируют или стабилизируют вторичную структуру, например, бета-петлю, гамма-петлю, бета-складчатую структуру, конформацию альфа-спирали и т.п. Например, полипептид по настоящему изобретению может характеризоваться как миметик, когда все или некоторые из его остатков соединяются с помощью химических средств, иных, чем природные пептидные связи. Индивидуальные остатки пептидомиметика могут соединяться с помощью пептидных связей, других химических связей или средств связывания, таких, например, как глутаральдегид, сложные N-гидроксисукцинимидные эфиры, буфункциональные малеимиды, N,N'-дициклогексилкарбодиимид (DCC) или N,N'-диизопропилкарбодиимид (DIC). Связывающие группы, которые могут представлять собой альтернативу связыванию с помощью традиционных амидных связей ("пептидных связей"), включают в себя, например, кетометилен (например, -С(=O)-СН 2 - вместо -C(=O)-NH-), аминометилен (СН 2 -NH), этилен, олефин (СН=СН), простой эфир (СН 2 -O), простой тиоэфир (CH 2 -S), тетразол (CN 4 -), тиазол, ретроамид, тиоамид или сложный эфир (см., например, Spatola (1983) in Chemistry and Biochemistry of Amino Acids, Peptides and Proteins, Vol. 7, p. 267-357, "Peptide Backbone Modification", Marcell Dekker, NY).

Полипептид по настоящему изобретению может также характеризоваться как миметик, если он содержит все или некоторые неприродные остатки вместо встречающихся в природе остатков аминокислот. Неприродные остатки хорошо описаны в научной и патентной литературе; несколько примерных неприродных композиций, пригодных для использования как миметики природных остатков аминокислот, и инструкции описываются ниже. Миметики ароматических аминокислот могут генерироваться с помощью замены, например, посредством D- или L- нафилаланина; D- или L-фенилглицина; D- или L-2 тиенилаланина; D- или L-1, -2, 3- или 4-пиренеилаланина; D- или L-3 тиенеилаланина; D- или L-(2-пиридинил)аланина; D- или L-(3-пиридинил)аланина; D- или L-(2-пиразинил)аланина; D- или L-(4-изопропил)фенилглицина; D-(трифторметил)фенилглицина; D-(трифторметил)фенилаланина; D-p-фтор-фенилаланина; D- или L-p-бифенилфенилаланина; D- или L-p-метокси-бифенилфенилаланина; D- или L-2-индол(алкил)аланинов и D- или L-алкиламинов, где алкил может быть замещенным или незамещенным метилом, этилом, пропилом, гексилом, бутилом, пентилом, изопропилом, изобутилом, втор-изотилом, изопентилом, или не-кислотных аминокислот. Ароматические кольца неприродных аминокислот включают в себя, например, тиазолильное, тиофенильное, пиразолильное, бензимидазолильное, нафтильное, фуранильное, пирролильное и пиридильное ароматические кольца.

Миметики кислотных аминокислот могут генерироваться посредством замещения, например, некарбоксилатных аминокислот, в то же время, поддерживая отрицательный заряд; (фосфоно)аланина; сульфатированного треонина. Карбоксильные боковые группы (например, аспартильные или глютамильные) могут также селективно модифицироваться посредством взаимодействия с карбодиимидами (R'-N-C-N-R'), такими как, например, 1-циклогексил-3-(2-морфолинил-4-этил)карбодиимид или 1-этил-3-(4-азоний-4,4-диметолпентил)карбодиимид. Аспартил или глютамил также могут быть преобразованы в аспарагинильный и глютаминильный остатки посредством взаимодействия с ионами аммония. Миметики основных аминокислот могут генерироваться посредством замещения с помощью (в дополнение к лизину и аргинину), например, аминокислот орнитина, цитрулина или (гуанидино)уксусной кислоты, или (гуанидино)алкилуксусной кислоты, где алкил определен выше. Нитрильное производное (например, содержащее CN-остаток вместо СООН) может замещаться аспарагином или глютамином. Аспарагинильные и глютаминильные остатки могут деаминироваться до соответствующих аспартильных или глютамильных остатков. Миметики с аргининовыми остатками могут генерироваться посредством взаимодействия аргинила, например, с одним или несколькими обычными реагентами, включая, например, фенилглиоксаль, 2,3-бутандион, 1,2-цикло-гександион или нингидрин, в одном из аспектов при щелочных условиях. Миметики с тирозиновыми остатками могут генерироваться посредством взаимодействия тирозила, например, с соединениями ароматического диазония или тетранитрометаном. N-ацетилимидизол и тетранитрометан могут использоваться для образования O-ацетилтирозильных видов и 3-нитро производных соответственно. Миметики с цистеиновыми остатками могут генерироваться посредством взаимодействия цистеинильных остатков, например, с альфа-галогенацетатами, такими как 2-хлоруксусная кислота или хлорацетамид, и соответствующими аминами; с получением карбоксиметильных или карбоксиамидометильных производных. Миметики с цистеиновыми остатками могут также генерироваться посредством взаимодействия цистеинильных остатков, например, с бром-трифторацетоном, альфа-бром-бета-(5-имидозоил)пропионовой кислотой; хлорацетилфосфатом, N-алкилмалеимидами, 3-нитро-2-пиридил дисульфидом; метил 2-пиридил дисульфидом; п-хлормеркурибензоатом; 2-хлормеркури-4-нитрофенолом или хлор-7-нитробензо-окса-1,3-диазолом. Миметики с лизином могут генерироваться (и остатки амино окончаний могут изменяться) посредством взаимодействия лизинила, например, с ангидридами янтарной или других карбоновых кислот. Миметики с лизиновыми и другими альфа-амино-содержащими остатками могут также генерироваться посредством взаимодействия со сложными имидоэфирами, такими как метилпиколинимидат, пиридоксальфосфат, пиридоксаль, хлорборгидрид, тринитробензолсульфоновая кислота, О-метилизомочевина, 2,4-пентандион, и катализируемых трансамидазой реакций с глиоксилатом. Миметики метионина могут генерироваться посредством взаимодействия, например, с метионин сульфоксидом. Миметики пролина включают в себя, например, пипеколиновую кислоту, тиазолидинкарбоновую кислоту, 3- или 4-гидроксипролин, дегидропролин, 3- или 4-метилпролин или 3,3,-диметилпролин. Миметики гистидиновых остатков могут генерироваться посредством взаимодействия гистидила, например, с диэтилпрокарбонатом или пара-бромфенацилбромидом. Другие миметики включают в себя, например, те, которые генерируются посредством гидроксилирования пролина и лизина; фосфорилирования гидроксильных групп серильных или треонильных остатков; метилирования альфа-амино групп лизина, аргинина и гистидина; ацетилирования N-конечного амина; метилирования амидных остатков главной цепи или их замещения с помощью N-метил аминокислот; или амидирования С-конечных карбоксильных групп.

В одном из аспектов остаток, например, аминокислота полипептида по настоящему изобретению, может также заменяться аминокислотой (или пептидомиметическим остатком) противоположной хиральности. В одном из аспектов любая аминокислота, встречающаяся в природе в L-конфигурации (которая также может упоминаться как R или S, в зависимости от структуры химической сущности), может заменяться аминокислотой такого же химического структурного типа или пептидомиметиком, но противоположной хиральности, упоминаемым как D-аминокислота, но также может упоминаться как R- или S- форма.

Настоящее изобретение также относится к способам модификации полипептидов по настоящему изобретению с помощью либо природных способов, таких как посттрансляционный процессинг (например, фосфорилирование, ацилирование и т.п.), либо посредством методик химической модификации и получения модифицированных полипептидов. Модификации могут осуществляться где угодно в полипептиде, включая пептидную основную цепь, боковые цепи аминокислот и амино или карбоксильные окончания. Будет понятно, что один и тот же тип модификации может присутствовать при одинаковом или при различных уровнях на различных сайтах в данном полипептиде. Также, данный полипептид может иметь множество типов модификации. В одном из аспектов модификации включают ацетилирование, ацилирование, ADP-рибозилирование, амидирование, ковалентное присоединение флавина, ковалентное присоединение остатка гема, ковалентное присоединение производного нуклеотида или нуклеотида, ковалентное присоединение липида или производного липида, ковалентное присоединение фосфатидилинозитола, циклизацию с поперечной сшивкой, образование дисульфидных связей, деметилирование, образование ковалентных поперечных сшивок, образование цистеина, образование пироглютамата, формилирование, гамма-карбоксилирование, гликозилирование, образование GPI якоря, гидроксилирование, йодинирование, метилирование, миристоилирование, окисление, пегилирование, протеолитический процессинг, фосфорилирование, пренилирование, рацемизацию, селеноилирование, сульфатирование и опосредуемое транспортной РНК добавление аминокислот к белку, такое как аргинилирование. См., например, Creighton, Т.Е., Proteins - Structure and Molecular Properties 2nd Ed., W.H. Freeman and Company, New York (1993); Posttranslational Covalent Modification of Proteins, B.C. Johnson, Ed., Academic Press, New York, p. 1-12 (1983).

Способы твердофазного химического синтеза пептидов могут также использоваться для синтеза полипептида или фрагментов по настоящему изобретению. Такой способ известен в данной области с начала 1960 (Merrifield, R.В., J. Am. Chem. Soc, 85:2149-2154, 1963) (см. также Stewart, J.M. and Young, J. D., Solid Phase Peptide Synthesis, 2nd Ed., Pierce Chemical Co., Rockford, 111, p. 11, 12) и в последнее время используется в коммерчески доступных лабораторных наборах для конструирования и синтеза пептидов (Cambridge Research Biochemicals). Такие коммерчески доступные лабораторные наборы, как правило, используют концепцию Н.М. Geysen et al., Proc. Natl. Acad. Sci., USA, 81:3998 (1984) и обеспечивают синтез пептидов на кончиках множества "стержней" или "шпилек", которые все присоединены к одной пластине. Когда используется такая система, пластина со стержнями или шпильками переворачивается и вставляется во вторую пластину с соответствующими лунками или резервуарами, которые содержат растворы для прикрепления или фиксации соответствующей аминокислоты на кончиках шпилек или стержней. При повторении стадий такого процесса, т.е. переворачивания и вставки кончиков шпилек или стержней в соответствующие растворы, аминокислоты выстраиваются в желаемые пептиды. В дополнение к этому доступным является ряд систем FMOC для синтеза пептидов. Например, сборка полипептида или фрагмента может осуществляться на твердой подложке с использованием автоматизированного пептидного синтезатора Applied Biosystems, Inc. Model 431A ™. Такое оборудование обеспечивает легкий доступ к пептидам по настоящему изобретению, либо посредством прямого синтеза, либо посредством синтеза ряда фрагментов, которые могут связываться с использованием других известных методик.

Полипептиды по настоящему изобретению включают ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, в активной или неактивной форме. Например, полипептиды по настоящему изобретению включают пробелки перед "созреванием" или процессингом препропоследовательностей, например, с помощью фермента, осуществляющего процессинг про белков, такого как пропротеинконвертаза, с генерированием "активного" зрелого белка. Полипептиды по настоящему изобретению содержат ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, неактивные по другим причинам, например, до "активирования" посредством события посттрансляционного процессинга, например, действия эндо- или экзопептидазы или протеиназы, события фосфорилирования, амидирования, гликозилирования или сульфатирования, события димеризации и т.п. Полипептиды по настоящему изобретению включают все активные формы, включая активные субпоследовательности, например, каталитические домены или активные сайты фермента.

Настоящее изобретение включает иммобилизованные ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, антитела антицеллюлазы, например антиэндоглюканазу, антицеллобиогидролазу и/или анти-бета-глюкозидазу, и их фрагменты. Настоящее изобретение относится к способам ингибирования активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, например, с использованием доминантных отрицательных мутантов или антител антицеллюлаз, например антиэндоглюканазы, антицеллобиогидролазы и/или анти-бета-глюкозидазы, по настоящему изобретению. Настоящее изобретение включает гетерокомплексы, например, белки слияния, гетеродимеры и т.п., содержащие ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению.

Полипептиды по настоящему изобретению могут иметь активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, при различных условиях, например, при экстремальных значениях рН и/или температуры, в присутствии окисляющих агентов и т.п. Настоящее изобретение относится к способам, получения альтернативных препаратов фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с различными каталитическими эффективностями и стабильностями, например, по отношению к температуре, окисляющим агентам и изменяющимся условиям отмывки. В одном из аспектов варианты фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, могут быть получены с использованием методик сайт-направленного мутагенеза и/или случайного мутагенеза. В одном из аспектов направленная эволюция может использоваться для получения большого разнообразия вариантов фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с альтернативными специфичностями и стабильностью.

Белки по настоящему изобретению также являются пригодными для использования в качестве исследовательских реагентов для идентификации модуляторов ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназа и/или бета-глюкозидазы, например, активаторов или ингибиторов активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Вкратце, исследуемые образцы (соединения, бульоны, экстракты и т.п.) добавляют в анализы фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, для определения их способности к ингибированию расщепления субстрата. Ингибиторы, идентифицируемые таким образом, могут использоваться в промышленности и исследованиях для уменьшения или предотвращения нежелательного протеолиза. Относительно ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, ингибиторы могут объединяться для расширения спектра активности.

Ферменты по настоящему изобретению являются также пригодными в качестве исследовательских реагентов для расщепления белков или при секвенировании белков. Например, ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, могут использоваться для разделения полипептидов на более мелкие фрагменты для секвенирования, с использованием, например автоматизированного секвенатора.

Настоящее изобретение также относится к способам для обнаружения новых ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с использованием нуклеиновых кислот, полипептидов и антител по настоящему изобретению. В одном из аспектов библиотеки фагемид подвергаются скринингу для обнаружения на основе экспрессии ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В другом аспекте библиотеки лямбда фагов подвергаются скринингу для обнаружения на основе экспрессии ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Скрининг библиотек фагов или фагемид может сделать возможным детекцию токсичных клонов; улучшенный доступ к субстрату; уменьшение необходимости в генной инженерии хозяина, обход любого возможного смещения, возникающего в результате массового вырезания библиотеки; и более быстрый рост при низких плотностях клонов. Скрининг библиотек фагов или фагемид может осуществляться в жидкой фазе или в твердой фазе. В одном из аспектов настоящее изобретение предусматривает скрининг в жидкой фазе. Это дает большую гибкость при выборе условий анализа; дополнительную гибкость субстрата; более высокую чувствительность к слабым клонам и простоту автоматизации, по сравнению со скринингом в твердой фазе.

Настоящее изобретение относится к способам скрининга с использованием белков и нуклеиновых кислот по настоящему изобретению и роботизированную автоматизацию для получения возможности осуществления многих тысяч биокаталитических реакций и скрининговых анализов за короткий период времени, например, в день, а также обеспечение высокого уровня точности и воспроизводимости (см. обсуждение матриц ниже). В результате, библиотека производных соединений может быть получена в течение нескольких недель. Относительно дополнительных концепций по модификации молекул, включая малые молекулы, см. публикацию PCT/US94/09174; патент США № 6245547.

В одном из аспектов полипептиды или фрагменты по настоящему изобретению получают посредством биохимических процедур обогащения или очистки. Последовательность потенциально гомологичных полипептидов или фрагментов может определяться посредством анализов фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы (см., например, примеры 1, 2 и 3 далее), гель-электрофореза и/или микросеквенирования. Последовательность возможного полипептида или фрагмента по настоящему изобретению может сравниваться с примерным полипептидом по настоящему изобретению или с фрагментом, например, содержащим по меньшей мере примерно 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 либо более его последовательных аминокислот, с использованием любой из программ, описанных выше.

Другой аспект настоящего изобретения представляет собой анализ для идентификации фрагментов или вариантов по настоящему изобретению, которые поддерживают ферментативную функцию полипептидов по настоящему изобретению. Например, фрагменты или варианты указанных полипептидов могут использоваться для катализа биохимических реакций, которые показывают, что фрагмент или вариант поддерживает ферментативную активность полипептида по настоящему изобретению. Примерный анализ для определения того, поддерживают ли фрагменты вариантов ферментативную активность полипептидов по настоящему изобретению, включает стадии: приведения в контакт фрагмента или варианта полипептида с молекулой субстрата в условиях, которые делают возможным функционирование фрагмента или варианта полипептида, и детекции либо понижения уровня субстрата, либо увеличения уровня конкретного продукта реакции, для реакции между полипептидом и субстратом.

Настоящее изобретение обнаруживает уникальные каталитические свойства ферментов. Поскольку использование биологических катализаторов (т.е. очищенных или сырых ферментов, неживых или живых клеток) при химических преобразованиях обычно требует идентификации конкретного биологического катализатора, который взаимодействует с конкретным исходным соединением, настоящее изобретение использует выбранные биологические катализаторы и условия реакции, которые являются специфичными к функциональным группам, которые присутствуют во многих исходных соединениях, таких как малые молекулы. Каждый биологический катализатор является специфичным для одной функциональной группы или нескольких родственных функциональных групп и может взаимодействовать со многими исходными соединениями, содержащими эту функциональную группу.

В одном из аспектов биокаталитические реакции производят популяцию производных из одного исходного соединения. Эти производные могут подвергаться воздействию другого раунда биокаталитических реакций для получения второй популяции производных соединений. Тысячи вариаций исходной малой молекулы или соединения могут быть получены при каждой итерации биокаталитической дериватизации.

Ферменты взаимодействуют на специфичных сайтах исходного соединения, не действуя на остальную часть молекулы, это процесс, который очень трудно получить с использованием традиционных химических способов. Эта высокая степень биокаталитической специфичности дает средства для идентификации единственного активного соединения в библиотеке. Библиотека характеризуется рядом биокаталитических реакций, используемых для получения ее так называемой "биосинтетической истории". Скрининг библиотеки на биологическую активность и отслеживание биосинтетической истории идентифицирует конкретную последовательность реакций, производящих активное соединение. Последовательность реакций повторяют, и определяют структуру синтезируемого соединения. Этот способ идентификации, в отличие от других подходов к синтезу и скринингу, не требует технологии иммобилизации, и соединения могут синтезироваться и исследоваться свободно в растворе, с использованием по существу любого типа анализа для скрининга. Важно отметить, что высокая степень специфичности реакций ферментов на функциональных группах делает возможным "отслеживание" конкретных ферментативных реакций, которые образуют биокаталитически получаемую библиотеку.

В одном из аспектов процедурные стадии осуществляют с использованием роботизированной автоматизации, делающей возможным осуществления многих тысяч биокаталитических реакций и/или скрининговых анализов в день, а также обеспечение высокого уровня точности и воспроизводимости. Роботизированная автоматизация может также использоваться для скрининга активности целлюлазы, чтобы определить, находится ли полипептид в рамках настоящего изобретения. В результате, в одном из аспектов библиотека производных соединений может быть получена за несколько недель, что заняло бы годы, для ее получения, с использованием "традиционных" способов химического или ферментативного скрининга.

В конкретном аспекте настоящее изобретение относится к способу для модификации малых молекул, включающий приведение в контакт полипептида, кодируемого полинуклеотидом, описанным здесь, или его ферметативно активных фрагментов с малой молекулой, с получением модифицированной малой молекулы. Библиотека модифицированных малых молекул исследуется для определения того, присутствует ли в библиотеке модифицированная малая молекула, которая демонстрирует желаемую активность. Конкретная биокаталитическая реакция, которая производит модифицированную малую молекулу с желаемой активностью, идентифицируется посредством систематического устранения каждой из биокаталитических реакций, используемых для получения части библиотеки, а затем исследования малых молекул, получаемых в части библиотеки, на присутствие или отсутствие модифицированной малой молекулы с желаемой активностью. Конкретные биокаталитические реакции, которые производят модифицированную малую молекулу с желаемой активностью, необязательно повторяются. Биокаталитические реакции осуществляют с помощью группы биологических катализаторов, которые взаимодействуют с различными структурными остатками, обнаруженными в структуре малой молекулы, каждый биологический катализатор является специфичным к одному структурному остатку или к группе родственных структурных остатков/ и каждый биологический катализатор взаимодействует с множеством различных малых молекул, которые содержат отличающийся структурный остаток.

Сигнальные последовательности препро и каталитические домены фермента целлюлазы, например эндоглюканазы, целлобиогидролазы и/или бета-глюкозидазы.

Настоящее изобретение относится к сигнальным последовательностям фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы (например, сигнальные пептиды (SP)), препродомены и каталитические домены (CD). SP, препродомены и/или CD по настоящему изобретению могут представлять собой выделенные или рекомбинантные пептиды или могут представлять собой часть белка слияния, например, в виде гетерологичного домена в химерном белке. Настоящее изобретение относится к нуклеиновым кислотам, кодирующим эти каталитические домены (CD), препродомены и сигнальные последовательности (SP, например, пептид, имеющий последовательность, содержащую/состоящую из остатков амино окончаний полипептида по настоящему изобретению).

Настоящее изобретение относится к выделенным или рекомбинантным сигнальным последовательностям (например, сигнальным пептидам), содержащим последовательность, как приведено в остатках 1-14, 1-15, 1-16, 1-17, 1-18, 1-19, 1-20, 1- 21, 1-22, 1-23, 1-24, 1-25, 1-26, 1-27, 1-28, 1-28, 1-30, 1-31, 1-32, 1-33, 1-34, 1-35, 1-36, 1-37, 1-38, 1-40, 1-41, 1-42, 1-43, 1-44, 1-45, 1-46 или 1-47 или более, полипептида по настоящему изобретению, например примерные полипептиды по настоящему изобретению, см. также табл. 3, примеры 1 и 4 ниже и список последовательностей, или состоящие из них. Например, табл. 3 выше приводит примерные сигнальные (лидерные) последовательности по настоящему изобретению, например, как в полипептиде, имеющем последовательность, как приведено в SEQ ID NO:164, кодируемую, например, посредством SEQ ID NO:163, которые имеет сигнальную последовательность, содержащую (или состоящую из) 30 остатков амино окончаний, или MSCRTLMSRRVGWGLLLWGGLFLRTGSVTG. Дополнительные сигнальные последовательности подобным же образом приведены в табл. 3.

В одном из аспектов настоящее изобретение предусматривает сигнальные последовательности, содержащие первые 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70 или более остатков амино окончаний полипептида по настоящему изобретению.

Настоящее изобретение включает полипептиды с сигнальной последовательностью и/или препропоследовательностью, или без них. Настоящее изобретение включает полипептиды с гетерологичными сигнальными последовательностями и/или препропоследовательностями. Препро последовательность (включая последовательность по настоящему изобретению, используемую как гетерологичный препродомен) может располагаться на конце белка с амино окончанием или карбокси окончанием. Настоящее изобретение также включает выделенные или рекомбинантные сигнальные последовательности, препропоследовательности и каталитические домены (например, "активные сайты"), содержащие последовательности по настоящему изобретению. Полипептид, содержащий сигнальную последовательность по настоящему изобретению, может представлять собой фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению или другой фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, или другой фермент, или другой полипептид. Способы идентификации последовательностей "препро" домена и сигнальных последовательностей хорошо известны в данной области, см., например, Van de Ven (1993), Crit. Rev. Oncog. 4(2):115-136. Например, для идентификации препропоследовательности белок должен быть очищен из внеклеточного пространства, и последовательность белка N-окончания определяется и сравнивается с необработанной формой.

Сигнальные последовательности (SP) и/или препропоследовательности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению могут представлять собой выделенные или рекомбинантные пептиды или последовательности, соединенные с другим ферментом целлюлазой, например эндоглюканазой, целлобиогидролазой, маннаназой и/или бета-глюкозидазой, или с полипептидом не-целлюлазой, например, не-эндоглюканазой, не-целлобиогидролазой и/или не-бета-глюкозидазой, например, как белок слияния (химерный). В одном из аспектов настоящее изобретение относится к полипептидам, содержащим сигнальные последовательности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению. В одном из аспектов полипептиды, содержащие сигнальные последовательности SP и/или препро фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению, содержат последовательности, гетерологичные ферменту целлюлазе, например эндоглюканазе, целлобиогидролазе, маннаназе и/или бета-глюкозидазе, по настоящему изобретению (например, белок слияния, содержащий SP и/или препро по настоящему изобретению, и последовательности из другого фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или белка не-целлюлазы, например, не-эндоглюканазы, не-целлобиогидролазы и/или не-бета-глюкозидазы). В одном из аспектов настоящее изобретение предусматривает ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению, с гетерологичными SP и/или препропоследовательностями, например, последовательности с сигнальной последовательностью дрожжей. Фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению может содержать гетерологичный SP и/или препро в векторе, например, в векторе серии pPIC (Invitrogen, Carlsbad, CA).

В одном из аспектов последовательности SP и/или препро по настоящему изобретению идентифицируются после идентификации новых полипептидов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Пути, посредством которых белки сортируются и переносятся в соответствующие их положения в клетке, часто упоминаются как пути нацеливания белков. Одним из наиболее важных элементов во всех этих системах нацеливания является короткая последовательность аминокислот на амино окончании вновь синтезируемого полипептида, называемая сигнальной последовательностью. Эта сигнальная последовательность направляет белок в соответствующее его положение в клетке и удаляется во время переноса или когда белок достигает своего конечного положения. Большинство лизосомальных мембранных или секретируемых белков имеют сигнальную последовательность амино окончания, которая маркирует их для перемещения в просвете эндоплазматического ретикулума. Сигнальные последовательности могут изменяться в длину примерно от 10 до 65 или более остатков аминокислот. Различные способы распознавания сигнальных последовательностей известны специалистам в данной области. Например, в одном из аспектов новые сигнальные пептиды фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, идентифицируются с помощью способа, упоминаемого как SignalP. SignalP использует объединенную нейронную сеть, которая распознает как сигнальные пептиды, так и их сайты расщепления (Nielsen (1997), "Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites" Protein Engineering, 10:1-6).

В некоторых аспектах ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению не имеют SP и/или препропоследовательностей или "доменов". В одном из аспектов настоящее изобретение предусматривает ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению, в которых нет всего SP и/или препродомена или их части. В одном из аспектов настоящее изобретение предусматривает последовательность нуклеиновых кислот, кодирующую сигнальную последовательность (SP) и/или препро от одного фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, функционально связанную с последовательностью нуклеиновых кислот другого фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или, необязательно, может быть желательной сигнальная последовательность (SP) и/или препродомен от белка не-целлюлазы, например не-эндоглюканазы, не-целлобиогидролазы и/или не-бета-глюкозидазы.

Настоящее изобретение также предусматривает выделенные или рекомбинантные полипептиды, содержащие сигнальные последовательности (SP), препродомены и/или каталитические домены (CD) по настоящему изобретению и гетерологичные последовательности. Гетерологичные последовательности представляют собой последовательности, не ассоциирующиеся в природе (например, в ферменте) с SP, препродоменом и/или CD. Последовательность, с которой SP, препродомен и/или CD не ассоциируется в природе, может находиться на конце SP, препродомена и/или CD с амино окончанием, на конце с карбокси окончанием и/или на обоих концах SP и/или CD. В одном из аспектов настоящее изобретение предусматривает выделенный или рекомбинантный полипептид, содержащий (или состоящий из них) полипептид, содержащий сигнальную последовательность (SP), препродомен и/или каталитический домен (CD) по настоящему изобретению, в условии, что он не ассоциируется с любой последовательностью, с которой он ассоциируется в природе (например, с последовательностью фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы). Подобным же образом, в одном из аспектов настоящее изобретение предусматривает выделенные или рекомбинантные нуклеиновые кислоты, кодирующие эти полипептиды. Таким образом, в одном из аспектов выделенная или рекомбинантная нуклеиновая кислота по настоящему изобретению содержит кодирующую последовательность для сигнальной последовательности (SP), препродомена и/или каталитического домена (CD) по настоящему изобретению и гетерологичную последовательность (т.е. последовательность, не ассоциирующуюся в природе с сигнальной последовательностью (SP), препродоменом и/или каталитическим доменом (CD) по настоящему изобретению). Гетерологичная последовательность может находиться на конце с 3' окончанием, на конце с 5' окончанием и/или на обоих концах SP, препродомена и/или последовательности, кодирующей CD.

Гибридные (химерные) ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза и/или бета-глюкозидаза, и библиотеки пептидов.

В одном из аспектов настоящее изобретение предусматривает гибридные ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, и белки слияния, включая библиотеки пептидов, содержащие последовательности по настоящему изобретению. Библиотеки пептидов по настоящему изобретению могут использоваться для выделения модуляторов целевых пептидов (например, активаторов или ингибиторов), таких как субстраты, рецепторы, ферменты, ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Библиотеки пептидов по настоящему изобретению могут использоваться для идентификации формальных партнеров по связыванию для мишеней, таких как лиганды, например, цитокины, гормоны и т.п. В одном из аспектов настоящее изобретение предусматривает химерные белки, содержащие сигнальную последовательность (SP), препродомен и/или каталитический домен (CD) по настоящему изобретению или их сочетание и гетерологичную последовательность (см. выше).

В одном из аспектов белки слияния по настоящему изобретению (например, пептидный остаток) конформационно стабилизируются (по отношению к линейным пептидам), чтобы сделать возможным более высокое сродство связывания для мишеней. Настоящее изобретение предусматривает слияния ферментов целлюлоз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению и других пептидов, включая известные и случайные пептиды. Они могут сливаться таким образом, что структура ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, существенно не нарушается, и пептид является метаболически или структурно конформационно стабилизированным. Это делает возможным создание библиотеки пептидов, для которой легко можно осуществлять мониторинг, как относительно их присутствия в клетках, так и их количества.

Варианты последовательностей аминокислот по настоящему изобретению могут характеризоваться заранее определенной природой изменения, признаком, который выделяет их среди встречающихся в природе форм, например, аллельной или межвидовой вариацией последовательности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов варианты по настоящему изобретению демонстрируют такую же качественную биологическую активность, как и аналог, встречающийся в природе. Альтернативно, варианты могут выбираться как имеющие модифицированные характеристики. В одном из аспектов в то время как сайт или область для введения вариации последовательности аминокислот является заранее определенным, сама по себе мутация не должна быть заранее определенной. Например, чтобы оптимизировать рабочие характеристики мутации на данном сайте, может осуществляться случайный мутагенез на целевом кодоне или области и осуществляться скрининг экспрессируемых вариантов фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, на оптимальное сочетание желаемых активностей. Методики для получения замещающих мутаций на заранее определенных сайтах ДНК, имеющей известную последовательность, хорошо известны, как здесь обсуждается, например, мутагенез с праймером М13 и PCR мутагенез. Скрининг мутантов может осуществляться с использованием, например, анализов гидролиза глюканов. В альтернативных аспектах замещения аминокислот могут представлять собой отдельные остатки; инсерции могут составлять порядка примерно от 1 до 20 аминокислот, хотя могут осуществляться существенно большие инсерции. Делеции могут находиться в пределах примерно от 1 примерно до 20, 30, 40, 50, 60, 70 остатков или более. Для получения конечного производного с оптимальными свойствами могут использоваться замещения, делеции, инсерции или любое их сочетание. Как правило, эти изменения осуществляются на нескольких аминокислотах, чтобы свести к минимуму изменения в молекуле. Однако и большие изменения могут допускаться при определенных обстоятельствах.

Настоящее изобретение предусматривает ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, где может модифицироваться структура полипептидной основной цепи, вторичная или третичная структура, например, альфа-спиральная или бета-складчатая структура. В одном из аспектов модифицируется заряд или гидрофобность. В одном из аспектов модифицируется объем боковой цепи. Существенные изменения в функционировании или иммунологической идентичности осуществляются посредством выбора замещений, которые являются менее консервативными. Например, могут осуществляться замещения, которые более значительно влияют на: структуру полипептидной основной цепи в области изменения, например, альфа-спиральную или бета-складчатую структуру; на заряд или гидрофобный сайт молекулы, который может находиться на активном сайте; или на боковую цепь. Настоящее изобретение предусматривает замещения в полипептиде по настоящему изобретению, где (а) гидрофильные остатки, например, серил или треонил, замещают (или замещаются) гидрофобный остаток, например, лейцил, изолейцил, фенилаланил, валил или аланил; (b) цистеин или пролин замещает (или замещается им) любой другой остаток; (с) остаток, имеющий электроположительную боковую цепь, например, лизил, аргинил или гистидил, замещает (или замещается им) электроотрицательный остаток, например глютамил или аспартил; или (d) остаток, имеющий объемную боковую цепь, например, фенилаланин, замещает (или замещается им) остаток, не имеющий боковой цепи, например, глицин. Варианты могут демонстрировать такую же качественную биологическую активность (т.е. активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы), хотя могут выбираться варианты для модификации характеристик ферментов целлюлоз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы по необходимости.

В одном из аспектов ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза по настоящему изобретению, содержат эпитопы или таги очистки, сигнальные последовательности или другие последовательности слияния и т.п. В одном из аспектов ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению, могут сливаться со случайным пептидом, с образованием полипептида слияния. Под "слитым" или "функционально связанным" здесь подразумевается, что случайный пептид и фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, связываются вместе таким образом, чтобы свести к минимуму нарушение стабильности структуры фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, например, он поддерживает активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Полипептид слияния (или полинуклеотид слияния, кодирующий полипептид слияния) может также содержать дополнительные компоненты, включая множество пептидов и множество петель.

В одном из аспектов пептиды и нуклеиновые кислоты, кодирующие их, рандомизируются, либо полностью рандомизируются, либо они смещаются по своей рандомизации, например, по частоте нуклеотидов/остатков, в целом, или на одно положение. "Рандомизированный" означает, что каждая нуклеиновая кислота и пептид состоят по существу из случайных нуклеотидов и аминокислот соответственно. В одном из аспектов нуклеиновые кислоты, которые дают начало пептидам, могут синтезироваться химически, и таким образом могут включать любой нуклеотид в любом положении. Таким образом, когда нуклеиновые кислоты экспрессируются для образования пептидов, любой остаток аминокислоты может включаться в любом положении. Способ синтеза может конструироваться для генерирования рандомизированных нуклеиновых кислот, чтобы сделать возможным образование всех или большинства возможных сочетаний по длине нуклеиновой кислоты, формируя, таким образом, библиотеку рандомизированных нуклеиновых кислот. Библиотека может обеспечить достаточно разнообразную по структуре популяцию рандомизированных продуктов экспрессии, чтобы вызвать вероятностно достаточный диапазон клеточных реакций, для получения одной или нескольких клеток, проявляющих желаемую реакцию. Таким образом, настоящее изобретение предусматривает библиотеки взаимодействия, достаточно большую, так что по меньшей мере один из ее элементов будет иметь структуру, которая дает его сродство к некоторой молекуле, белку или другому фактору.

В одном из аспектов фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению представляет собой мультидоменный фермент, который содержит сигнальный пептид, модуль связывания углеводов, каталитический домен фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, линкер и/или другой каталитический домен.

Настоящее изобретение относится к способам и последовательности для генерирования химерных полипептидов, которые могут кодировать биологически активные гибридные полипептиды (например, гибридные ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозадазу). В одном из аспектов исходные полинуклеотиды (например, примерная нуклеиновая кислота по настоящему изобретению) кодируют биологически активные полипептиды. В одном из аспектов способ по настоящему изобретению дает новые гибридные полипептиды посредством использования клеточных процессов, которые встраивают последовательность исходных полинуклеотидов, так что полученный в результате гибридный полинуклеотид кодирует полипептид, демонстрирующий активности, полученные, но отличные от исходных биологически активных полипептидов (например, целлюлазы или антитела по настоящему изобретению). Например, исходные полинуклеотиды могут кодировать конкретный фермент (например, целлюлазу), получаемый из различных микроорганизмов или находящийся в них. Фермент, кодируемый первым полинуклеотидом из одного организма или варианта, может, например, функционировать эффективно при конкретных условиях окружающей среды, например, при высоком содержании соли. Фермент, кодируемый вторым полинуклеотидом от другого организма или варианта, может эффективно функционировать при других условиях окружающей среды, таких как исключительно высокие температуры. Гибридный полинуклеотид, содержащий последовательности от первого и второго исходных полинуклеотидов, может кодировать фермент, который демонстрирует характеристики обоих ферментов, кодируемых исходными полинуклеотидами. Таким образом, фермент, кодируемый гибридным полинуклеотидом по настоящему изобретению, может эффективно функционировать в условия окружающей среды, общих для каждого из ферментов, кодируемых первым и вторым полинуклеотидом, например, при высоком содержании соли и при экстремальных температурах.

В одном из аспектов гибридный полипептид, генерируемый с помощью способа по настоящему изобретению, может демонстрировать специализированную активность фермента, не проявляемую исходными ферментами. Например, после рекомбинации и/или редуктивной рекомбинации полинуклеотидов, кодирующих ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, полученный гибридный полипептид, кодируемый гибридным полинуклеотидом, может подвергаться скринингу на специализированные активности ферментов не-целлюлаз, например, не-эндоглюканазы, не-целлобиогидролазы и/или не-бета-глюкозидазы, например, на активности гидролазы, пептидазы, фосфорилазы и т.п., полученных из каждого из исходных ферментов. В одном из аспектов гибридный полипептид подвергается скринингу для определения тех химических функций, которые отличают гибридный полипептид от исходных родительских полипептидов, таких как температура, рН или концентрация соли, при которых функционирует гибридный полипептид.

В одном из аспектов настоящее изобретение относится к способу производства биологически активного гибридного полипептида и к скринингу такого полипептид на повышенную активность посредством:

1) введения, по меньшей мере, первого полинуклеотида в функциональной связи и второго полинуклеотида в функциональной связи, по меньшей мере, первый полинуклеотид и второй полинуклеотид имеют по меньшей мере одну общую область частичной гомологии последовательностей, в соответствующую клетку-хозяина;

2) выращивания клетки-хозяина в условиях, которые облегчают реорганизацию последовательности, приводящую к получению гибридного полинуклеотида в функциональной связи;

3) экспрессии гибридного полипептида, кодируемого гибридным полинуклеотидом;

4) скрининга гибридного полипептида, в условиях, которые облегчают идентификацию повышенной биологической активности; и

5) выделения полинуклеотида, кодирующего гибридный полипептид.

Выделение и обнаружение ферментов целлюлаз.

Настоящее изобретение относится к способам выделения и обнаружения ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, и нуклеиновых кислот, которые кодируют их. Полинуклеотиды или ферменты могут выделяться из индивидуальных организмов ("изоляты"), коллекций организмов, которые выращиваются в определенных средах ("обогащенные культуры"), или из некультивируемых организмов ("образцы из окружающей среды"). Организмы могут выделяться, например, посредством биопэннинга in vivo (см. обсуждение ниже). Использование независимого от культуры подхода к получению полинуклеотидов, кодирующие новые биологические активности, из образцов из окружающей среды, является наиболее предпочтительным, поскольку оно дает возможность доступа к неограниченным ресурсам биологического разнообразия. Полинуклеотиды или ферменты также могут выделяться из любого из многочисленных организмов, например, бактерий. В дополнение к цельным клеткам, полинуклеотиды или ферменты также могут выделяться из препаратов сырых ферментов, полученных из культур этих организмов, например бактерий.

"Библиотеки из окружающей среды" генерируются из образцов из окружающей среды и представляют собой коллективные геномы встречающихся в природе организмов, архивируемые в векторах клонирования, которые могут размножаться в соответствующих прокариотических хозяевах. Поскольку клонируемая ДНК изначально извлекается непосредственно из образцов из окружающей среды, библиотеки не ограничиваются малой долей прокариотов, которые могут выращиваться в чистой культуре. В дополнение к этому нормализация ДНК из окружающей среды, присутствующей в этих образцах, могла бы сделать возможным более равномерное представление ДНК от всех видов, присутствующих в исходном образце. Это может драматически увеличить эффективность обнаружения представляющих интерес генов из второстепенных составляющих образца, которые могут быть недопрезентированными на несколько порядков величины, по сравнению с доминантными видами.

В одном из аспектов библиотеки генов, генерируемые из одного или нескольких некультивируемых микроорганизмов, подвергаются скринингу на активность, представляющую интерес. Потенциальные пути кодирования биологически активных молекул, представляющих интерес, сначала захватываются в прокариотических клетках в форме библиотек экспрессии генов. В одном из аспектов полинуклеотиды, кодирующие активности, представляющие интерес, выделяются из таких библиотек и вводятся в клетку-хозяина. Клетка-хозяин выращивается в условиях, которые облегчают рекомбинацию и/или редуктивной рекомбинации, создавая потенциально активные биологические молекулы с новыми или повышенными активностями.

Биопэннинг in vivo может осуществляться с использованием машин на основе FACS и неоптических (например, магнитных) машин. В одном из аспектов комплексные библиотеки генов строятся с помощью векторов, которые содержат элементы, которые стабилизируют транскрибированную РНК. Например, включение последовательностей, которые приводят к появлению вторичных структур, таких как шпильки, которые конструируются для фланкирования подвергнутых транскрипции областей РНК, служило бы для повышения их стабильности, увеличивая, таким образом, ее половинное время жизни в клетке. Молекулы зонды, используемые в способе биопэннинг, состоят из олигонуклеотидов, меченых репортерными молекулами, которые флуоресцируют только при связывании зонда с целевой молекулой. Эти зонды вводятся в рекомбинантные клетки из библиотеки, с использованием одного из нескольких способов трансформирования. Молекулы зонды связываются с подвергнутой транскрипции целевой гаРНК, приводя к получению гетеродуплексных молекул ДНК/РНК. Связывание зонда с мишенью будет давать флуоресцентный сигнал, который детектируется и сортируется с помощью FACS-машины во время процесса скрининга.

В одном из аспектов осуществляется субклонирование для дополнительного выделения последовательностей, представляющих интерес. При субклонировании часть ДНК амплифицируется, расщепляется, как правило, посредством рестрикционных ферментов, с вырезанием желаемой последовательности, желаемая последовательность лигируется в векторе-реципиенте и амплифицирцется. На каждой стадии при субклонировании, часть исследуется на активность, представляющую интерес, чтобы быть уверенным, что ДНК, которая кодирует структурный белок, не исключается. Вставка может очищаться на любой стадии субклонирования, например, с помощью гель-электрофореза перед лигированием в векторе, или когда клетки, содержащие вектор-реципиент, и клетки, не содержащие вектора реципиента, помещаются в селективные среды, содержащие, например, антибиотик, который будет убивать клетки, не содержащие вектора-реципиента. Конкретные способы субклонирования вставок цДНК в векторы хорошо известны в данной области (Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989)). В другом аспекте ферменты по настоящему изобретению представляют собой субклоны. Такие субклоны могут отличаться от родительского клона, например, длиной, мутацией, тагом или меткой.

Микроорганизмы, в которых полинуклеотид может обнаруживаться, выделяться или приготавливаться, включают прокариотические микроорганизмы, такие как Eubacteria и Archaebacteria, и низшие эукариотические микроорганизмы, такие как грибки, некоторые водоросли и простейшие. Полинуклеотиды могут обнаруживаться, выделяться или приготавливаться в образцах из окружающей среды, в этом случае нуклеиновая кислота может извлекаться без культивирования организма или извлекаться из одного или нескольких культивируемых организмов. В одном из аспектов такие микроорганизмы могут представлять собой экстремофилы, такие как гипертермофилы, психрофилы, психротропы, галофилы, барофилы и ацидофилы. Могут использоваться полинуклеотиды, кодирующие ферменты, выделенные из экстремофильных микроорганизмов. Ферменты по настоящему изобретению могут функционировать при температурах выше 100 °С, например, как те, которые обнаружены в наземных горячих источниках и в глубоководных термальных течениях, или при температурах ниже 0 °С, например, как те, которые обнаружены в арктических водах, в окружающей среде, насыщенной солью, например, как те, которые обнаружены в Мертвом море, при значениях рН около 0, например, как те, которые обнаружены в угольных отложениях и в геотермальных источниках, обогащенных серой, или при значениях рН, больших, чем 11, например, как те, которые обнаружены в иле в отстойниках. В одном из аспектов ферменты по настоящему изобретению имеют высокую активность в широком диапазоне температур и рН.

Полинуклеотиды, выбранные и выделенные, как описано выше, вводятся в соответствующую клетку-хозяина. Соответствующая клетка-хозяин представляет собой любую клетку, которая способна облегчать рекомбинацию и/или редуктивную рекомбинацию. Выбранные полинуклеотиды в одном из аспектов находятся уже в векторе, который содержит соответствующие контрольные последовательности. Клетка-хозяин может представлять собой высшую эукариотическую клетку, такую как клетка млекопитающего, или низшую эукариотическую клетку, такую как клетка дрожжей, или в одном из аспектов клетка-хозяин может представлять собой прокариотическую клетку, такую как бактериальная клетка. Введение конструкта в клетку-хозяина может осуществляться посредством кальций-фосфатного трансфицирования, трансфицирования, опосредованного DEAE-декстраном, или электропорообразования.

Примерные хозяева включают бактериальные клетки, такие как Е.coli, Streptomyces, Salmonella typhimuriwn; клетки грибков, такие как дрожжи; клетки насекомых, такие как Drosophila S2 и Spodoptera Sf9; клетки животных, такие как СНО, COS или меланома Bowes; аденовирусы; и клетки растений; см. обсуждение выше. Выбор соответствующего хозяина, как подразумевается, находится в рамках умений специалиста в данной области по настоящей концепции.

Различные системы культур клеток млекопитающих могут использоваться для экспрессии рекомбинантного белка; примеры систем экспрессии млекопитающих включают линии COS-7 фибробластов почек обезьяны, описанные в "SV40-transformed simian cells support the replication of early SV40 mutants" (Gluzman, 1981), и другие линии клеток, способные экспрессировать совместимый вектор, например, линии клеток С127, 3Т3, СНО, HeLa и BHK. Векторы экспрессии млекопитающих могут содержать источник репликации, соответствующий промотор и энхансер, а также любые необходимые сайты связывания рибосом, сайт полиаденилирования, донорный и акцепторный сайты сплайсирования, последовательности завершения транскрипции и 5' фланкирующие нетранскрибируемые последовательности. Последовательности ДНК, полученные от сайтов сплайсирования и полиаденилирования SV40, могут использоваться для создания требуемых нетранскрибируемых генетических элементов.

В другом аспекте нуклеиновые кислоты, полипептиды и способы по настоящему изобретению используют в биохимических путях или для генерирования новых полинуклеотидов, кодирующих биохимические пути, из одного или нескольких оперонов или генных кластеров или их частей. Например, бактерии и многие эукариоты имеют координированный механизм для регуляции генов, продукты которых вовлечены в родственные процессы. Гены кластеризуются в структурах, упоминаемых как "генные кластеры", на одной хромосоме и подвергаются транскрипции вместе под контролем одной регуляторной последовательности, содержащей один промотор, который инициирует транскрипцию всего кластера. Таким образом, генный кластер представляет собой группу соседних генов, которые являются либо идентичными, либо родственными, обычно, по отношению к их функции (один из примеров биохимического пути, кодируемого генными кластерами, представляют собой поликетиды).

В одном из аспектов генный кластер ДНК выделяется из различных организмов и лигируется в векторы, например, векторы, содержащие регуляторные последовательности экспрессии, которые могут контролировать и регулировать продуцирование детектируемого белка или активность связанного с белками ряда из лигированных генных кластеров. Использование векторов, которые имеют исключительно большую способность введения экзогенной ДНК, может быть пригодным для использования вместе с такими генными кластерами и они описываются здесь в качестве примера, как включающие f-фактор (или фактор фертильности) Е.coli. Этот f-фактор Е.coli представляет собой плазмиду, которая осуществляет перенос самой себя с высокой частотой посредством конъюгирования и является идеалом для достижения, и стабильно размножает большие фрагменты ДНК, такие как генные кластеры, из смешанных микробных образцов. Один из аспектов представляет собой использование векторов клонирования, упоминаемых здесь как "фосмиды" или векторы бактериальных искусственных хромосом (ВАС). Они получаются из f-фактора Е.coli, который способен стабильно встраивать большие сегменты геномных ДНК. Когда они интегрируются с ДНК из смешанного некультивируемого образца из окружающей среды, это делает возможным получение больших геномных фрагментов в форме стабильной "библиотеки ДНК из окружающей среды". Другой тип вектора для использования в настоящем изобретении представляет собой вектор космиды. Векторы космид изначально сконструированы для клонирования и размножения больших сегментов геномной ДНК. Клонирование в векторы космид описано подробно в Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press (1989). После лигирования в соответствующий вектор два или более векторов, содержащих различные генные кластеры поликетидсинтазы, могут вводиться в соответствующую клетку-хозяина. Области частичной гомологии последовательностей, общие для этих генных кластеров, будут облегчать способы, которые приведут к реорганизации последовательности, в результате которой возникнет гибридный генный кластер. Затем новый гибридный генный кластер может подвергаться скринингу на повышенные активности, не обнаруженные в исходных генных кластерах.

Способы скрининга на различные активности ферментов известны специалистам в данной области и обсуждаются в настоящем описании, см., например, примеры 1, 2 и 3 ниже. Такие способы могут использоваться при выделении полипептидов и полинуклеотидов по настоящему изобретению.

В одном из аспектов настоящее изобретение относится к способам для обнаружения и выделения целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, или соединений, которые должны модифицировать активность этих ферментов, с использованием цельноклеточного подхода (см. обсуждение ниже). Могут подвергаться скринингу возможные клоны, кодирующие целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, из библиотеки геномной ДНК.

Методики скрининга и устройства мониторинга "on-line".

При осуществлении способов по настоящему изобретению различные устройства и методики могут использоваться в связи с полипептидами и нуклеиновыми кислотами по настоящему изобретению, например, для скрининга полипептидов на активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, для скрининга соединений в качестве потенциальных модуляторов, например, активаторов или ингибиторов, активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидаз, на антитела, которые связываются с полипептидом по настоящему изобретению, на нуклеиновые кислоты, которые гибридизируются с нуклеиновыми кислотами по настоящему изобретению, для скрининга клеток, экспрессирующих полипептид по настоящему изобретению и т.п. В дополнение к матричным форматам, описанным подробно ниже, для скрининга образцов, также могут использоваться альтернативные форматы для осуществления способов по настоящему изобретению. Такие форматы включают в себя, например, масс-спектрометры, хроматографы, например, для высокопроизводительной ВЭЖХ, и другие формы жидкостной хроматографии, и меньшие форматы, такие как 1536-луночные планшеты, 384-луночные планшеты и т.д. Высокопроизводительное устройство для скрининга может адаптироваться и использоваться для осуществления способов по настоящему изобретению, см., например, заявки на патент США № 20020001809; 20050272044.

Капиллярные матрицы.

Нуклеиновые кислоты или полипептиды по настоящему изобретению могут иммобилизоваться или наноситься на матрицу. Матрицы могут использоваться для скрининга или мониторинга библиотек композиций (например, малых молекул, антител, нуклеиновых кислот и т.п.) на их способность к связыванию или модулированию активности нуклеиновой кислоты или полипептида по настоящему изобретению. Капиллярные матрицы, такие как GIGAMATRIX ™, Diversa Corporation, San Diego, CA; и матрицы, описанные, например, в заявке на патент США № 20020080350 А1; заявках на Международный патент WO 0231203 А; WO 0244336 А, предусматривает альтернативное устройство для удерживания и скрининга образцов. В одном из аспектов капиллярная матрица включают множество капилляров, сформированных в виде матрицы из соседних капилляров, где каждый капилляр содержит по меньшей мере одну стенку, определяемую просветом для удерживания образца. Просвет может быть цилиндрическим, квадратным, гексагональным или иметь любую другую геометрическую форму, постольку, поскольку стенки образуют просвет для удерживания жидкости или образца. Капилляры капиллярной матрицы могут удерживаться вместе в тесной близости с образованием планарной структуры. Капилляры могут связываться вместе, будучи сплавлены (например, когда капилляры изготавливают из стекла), склеены, связаны или спрессованы стенка к стенке. В дополнение к этому капиллярная матрица может содержать промежуточный материал, расположенный между соседними капиллярами в матрице, при этом формируется твердое планарное устройство, содержащее множество сквозных отверстий.

Капиллярная матрица может формироваться из любого количества индивидуальных капилляров, например, в пределах от 100 до 4000000 капилляров. Кроме того, капиллярная матрица, имеющая примерно 100000 или более индивидуальных капилляров, может быть сформирована в стандартном размере и форме планшета Microtiter ® для присоединения к стандартному лабораторному оборудованию. Просветы заполняются вручную или автоматически с использованием либо капиллярного действия, либо микроинъекции, с использованием тонкой иглы. Образцы, представляющие интерес, могут впоследствии удаляться из индивидуальных капилляров, для дополнительного анализа или характеризации. Например, тонкий иглообразный зонд располагается в сообщении текучих сред с выбранным капилляром, чтобы либо добавлять, либо извлекать материал из просвета.

При скрининговом анализе в одной емкости компоненты анализа смешиваются с получением раствора, представляющего интерес, перед введением в капиллярную матрицу. Просвет заполняется под действием капиллярных сил, когда по меньшей мере часть матрицы погружается в раствор, представляющий интерес. Химические или биологические реакции и/или активность в каждом капилляре подвергаются мониторингу детектируемых событий. Детектируемые события часто упоминаются как "совпадение", которое обычно может отличаться от "несовпадения", производимого капиллярами при оптической детекции. Таким образом, капиллярные матрицы делают возможным массированную параллельную детекцию "совпадений".

При скрининговом анализе во множестве емкостей полипептид или нуклеиновая кислота, например лиганд, может вводиться в первый компонент, который вводится по меньшей мере в часть капилляра из капиллярной матрицы. Затем пузырек воздуха может вводиться в капилляр после первого компонента. Затем второй компонент может вводиться в капилляр, где второй компонент отделен от первого компонента с помощью пузырька воздуха. Затем первый и второй компоненты могут смешиваться посредством приложения гидростатического давления к обеим сторонам капиллярной матрицы для схлопывания пузырька. Затем осуществляется мониторинг капиллярной матрицы на детектируемое событие, происходящее в результате взаимодействия или не взаимодействия двух компонентов.

При скрининговом анализе связывания, образец, представляющий интерес, может вводиться в виде первой жидкости, меченой с помощью детектируемой частицы, в капилляр капиллярной матрицы, где просвет капилляра покрывается связывающим материалом для связывания детектируемой частицы с просветом. Затем первая жидкость может удаляться из капиллярной трубки, где связанная детектируемая частица удерживается внутри капилляра, и вторая жидкость может вводиться в капиллярную трубку. Затем может осуществляться мониторинг капилляра на детектируемое событие, возникающее в результате взаимодействия или невзаимодействия частицы со второй жидкостью.

Матрицы или "биочипы".

Нуклеиновые кислоты или полипептиды по настоящему изобретению могут иммобилизироваться или наноситься на матрицу. Матрицы могут использоваться для скрининга или мониторинга библиотек композиций (например, малых молекул, антител, нуклеиновых кислот и т.п.) на их способность к связыванию или модулированию активности нуклеиновой кислоты или полипептида по настоящему изобретению. Например, в одном из аспектов по настоящему изобретению, параметр мониторинга представляет собой экспрессию транскрипта гена фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Один или несколько, или все транскрипты клетки могут измеряться посредством гибридизации образца, содержащего транскрипты из клетки, или нуклеиновых кислот, репрезентативных или комплементарных к транскриптам клетки, посредством гибридизации с иммобилизованными нуклеиновыми кислотами на матрице или "биочипе". Посредством использования "матрицы" нуклеиновых кислот на микрочипе, некоторые или все транскрипты клетки могут количественно определяться одновременно. Альтернативно, матрицы, содержащие геномную нуклеиновую кислоту, также могут использоваться для определения генотипа вновь полученного с помощью генной инженерии штамма, полученного с помощью способов по настоящему изобретению. Полипептидные "матрицы" также могут использоваться для одновременного количественного определения множества белков. Настоящее изобретение может осуществляться с любой известной "матрицей", также упоминаемой как "микроматрица" или "матрица нуклеиновых кислот", или "полипептидная матрица", или "матрица антител", или "биочип", или их вариация. Матрицы в целом представляют собой множество "пятен" или "целевых элементов", каждый целевой элемент содержит определенное количество одной или нескольких биологических молекул, например, олигонуклеотидов, иммобилизованных на определенной площади поверхности подложки для специфичного связывания исследуемой молекулы, например, транскриптов m-РНК.

Термины "матрица" или "микроматрица" или "биочип" или "чип", как здесь используется, представляет собой множество целевых элементов, каждый целевой элемент содержит определенное количество одного или нескольких полипептидов (включая антитела) или нуклеиновых кислот, иммобилизованных на определенном участке поверхности подложки, как обсуждается более подробно ниже.

При осуществлении способов по настоящему изобретению, любая известная матрица и/или способ изготовления и использования матриц, или их вариации, могут включаться полностью или частично, как описано, например, в патентах США № 6277628; 6277489; 6261776; 6258606; 6054270; 6048695; 6045996; 6022963; 6013440; 5965452; 5959098; 5856174; 5830645; 5770456; 5632957; 5556752; 5143854; 5807522; 5800992; 5744305; 5700637; 5556752; 5434049; см. также, например, заявки на Международные патенты WO 99/51773; WO 99/09217; WO 97/46313; WO 96/17958; см. также, например, Johnston (1998), Curr. Biol. 8:R171-R174; Schummer (1997), Biotechniques 23:1087-1092; Kern (1997), Biotechniques 23:120-124; Solinas-Toldo (1997), Genes, Chromosomes & Cancer 20:399-407; Bowtell (1999), Nature Genetics Sup. 21:25-32. См. также опубликованные заявки на патенты США № 20010018642; 20010019827; 20010016322; 20010014449; 20010014448; 20010012537; 20010008765.

Антитела и способы скрининга на основе антител.

Настоящее изобретение предусматривает выделенные или рекомбинантные антитела, которые специфично связываются с ферментом целлюлазой, например эндоглюканазой, целлобиогидролазой, маннаназой и/или бета-глюкозидазой, по настоящему изобретению. Эти антитела могут использоваться для выделения, идентификации или количественного определения ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению, или родственных полипептидов. Эти антитела могут использоваться для выделения других полипептидов в рамках настоящего изобретения или других ферментов, родственных ферментам целлюлазам, например эндоглюканазе, целлобиогидролазе, маннаназе и/или бета-глюкозидазе. Антитела могут конструироваться для связывания с активным сайтом фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Таким образом, настоящее изобретение относится к способам ингибирования ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, с использованием антител по настоящему изобретению (см. обсуждение выше относительно применений композиций ферментов антицеллюлаз, например антиэндоглюканазы, антицеллобиогидролазы и/или анти-бета-глюкозидазы, по настоящему изобретению).

Термин "антитело" включает пептид или полипептид полученный из иммуноглобулина, смоделированный по образцу иммуноглобулина или кодируемый по существу геном иммуноглобулина или генами иммуноглобулинов, или их фрагментами, способный к специфичному связыванию антигена или эпитопа, см., например, Fundamental Immunology, Third Edition, W.E. Paul, ed., Raven Press, N.Y. (1993); Wilson (1994), J. Immunol. Methods 175:267-273; Yarmush (1992), J. Biochem. Biophys. Methods 25:85-97. Термин антитело включает части, связывающиеся с антигеном, т.е. "сайты связывания с антигеном", (например, фрагменты, субпоследовательности, области, определяющие комплементарность (CDR)), которые поддерживают способность к связыванию с антигеном, включая (i) фрагмент Fab, одновалентный фрагмент, состоящий из доменов VL, VH, CL и CH1; (ii) фрагмент F(ab')2, двухвалентный фрагмент, содержащий два фрагмента Fab, связанные дисульфидным мостиком в шарнирной области; (iii) фрагмент Fd, состоящий из доменов VH и CH1; (iv) фрагмент Fv, состоящий из доменов VL и VH одной руки антитела, (v) фрагмент dAb (Ward et al. (1989), Nature 341:544-546), который состоит из домена VH; и (vi) выделенную область, определяющую комплементарность (CDR). Одноцепочечные антитела также включаются для упоминания в термин "антитело".

Настоящее изобретение предусматривает фрагменты ферментов по настоящему изобретению (например, пептидов), содержащие иммуногенные фрагменты (например, субпоследовательности) полипептида по настоящему изобретению. Настоящее изобретение предусматривает композиции, содержащие полипептид или пептид по настоящему изобретению и адъюванты или носители и т.п.

Антитела могут использоваться при иммунопреципитации, окрашивании, в иммуноафинных колонках и т.п. Если это желательно, последовательности нуклеиновых кислот, кодирующие конкретные антигены, могут генерироваться посредством иммунизации с последующим выделением полипептида или нуклеиновой кислоты, амплификацией или клонированием и иммобилизацией полипептида на матрице по настоящему изобретению. Альтернативно, способы по настоящему изобретению могут использоваться для модификации структуры антитела, производимого клеткой, которая должна модифицироваться, например, сродство антитела может увеличиваться или уменьшаться. Кроме того, способность производства или модификации антител может быть получена с помощью генной инженерии фенотипа клетки посредством способов по настоящему изобретению.

Способы иммунизации, производства и выделения антител (поликлональных и моноклональных) известны специалистам в данной области и описываются в научной и патентной литературе, см., например, Coligan, CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY (1991); Stites (eds.) BASIC AND CLINICAL IMMUNOLOGY (7th ed.) Lange Medical Publications, Los Altos, CA ("Stites"); Goding, MONOCLONAL ANTIBODIES: PRINCIPLES AND PRACTICE (2d ed.) Academic Press, New York, NY (1986); Kohler (1975), Nature 256:495; Harlow (1988), ANTIBODIES, A LABORATORY MANUAL, Cold Spring Harbor Publications, New York. Антитела также могут генерироваться in vitro, например, с использованием сайта связывания рекомбинантного антитела, экспрессируемого библиотекой фаговых дисплеев, в дополнение к традиционным способам in vivo с использованием животных. См., например, Hoogenboom (1997), Trends Biotechnol. 15:62-70; Katz (1997), Annu. Rev. Biophys. Biomol. Struct. 26:27-45.

Полипептиды по настоящему изобретению или фрагменты, содержащие по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 их последовательных аминокислот, могут также использоваться для генерирования антител, которые специфично связываются с полипептидами или фрагментами. Полученные антитела могут использоваться в процедурах иммуноафинной хроматографии для выделения или очистки полипептида или для определения того, присутствует ли полипептид в биологическом образце. В таких процедурах препарат белка, такой как экстракт, или биологический образец приводится в контакт с антителом, способным к специфичному связыванию с одним из полипептидов по настоящему изобретению, или фрагментами, содержащими по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 их последовательных аминокислот.

При иммуноафинных процедурах, антитело присоединяется к твердому носителю, такому как шарики или другая набивка для колонки. Препарат белка помещается в контакте с антителом в условиях, при которых антитело специфично связывается с одним из полипептидов по настоящему изобретению, или его фрагментом. После отмывки для удаления неспецифично связанных белков элюируются специфично связанные полипептиды.

Способность белков в биологическом образце связываться с антителом может определяться с использованием любой из различных процедур, известных специалистам в данной области. Например, связывание может определяться посредством мечения антитела детектируемой меткой, такой как флуоресцентный агент, ферментативная метка или радиоактивный изотоп. Альтернативно, связывание антитела с образцом может детектироваться с использованием вторичного антитела, имеющего на себе такую детектируемую метку. Конкретные анализы включают анализы ELISA, сэндвич-анализы, радиоиммунологические анализы и Вестерн-блоттинг.

Поликлональные антитела, генерируемые против полипептидов по настоящему изобретению, или фрагменты, содержащие по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 их последовательных аминокислот, могут быть получены посредством прямой инъекции полипептидов животному или посредством введения полипептидов животному, например, не являющемуся человеком. Полученное таким образом антитело может связывать сам полипептид. Таким образом, даже последовательность, кодирующая только фрагмент полипептида, может использоваться для генерирования антител, которые могут связываться с нативным полипептидом в целом. Такие антитела затем могут использоваться для выделения полипептида из клеток, экспрессирующих этот полипептид.

Для получения моноклональных антител может использоваться любая технология, которая дает антитела, производимые непрерывными культурами линий клеток. Примеры включают методику гибридомы (Kohler и Milstein, Nature, 256:495-497, 1975), методику триомы, методику гибридомы В-лимфоцитов человека (Kozbor et al., Immunology Today 4:12, 1983) и методику EBV-гибридомы (Cole, et al., 1985, in Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, Inc., p. 77-96).

Методики, описанные для получения одноцепочечных антител (патент США № 4946778), могут быть адаптированы для получения одноцепочечных антител к полипептидам по настоящему изобретению, или к фрагментам, содержащим по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 их последовательных аминокислот. Альтернативно, трансгенные мыши могут использоваться для экпрессии гуманизированных антител к этим полипептидам или их фрагментам.

Антитела, генерируемые против полипептидов по настоящему изобретению, или их фрагментов, содержащих по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 или 150 их последовательных аминокислот, могут использоваться при скрининге сходных полипептидов из других организмов и образцов. В таких методиках, полипептиды из организма приводятся в контакт с антителом и детектируются те полипептиды, которые специфично связывают антитело. Любая из процедур, описанных выше, может использоваться для детекции связывания антитела. Один из таких скрининговых анализов описан в "Methods for Measuring Cellulase Activities", Methods in Enzymology, Vol 160, p. 87-116.

Наборы.

Настоящее изобретение предусматривает наборы, содержащие композиции, например, нуклеиновые кислоты, кассеты экспрессии, векторы, клетки, трансгенные семена или растения, или части растений, полипептиды (например, фермент целлюлазу) и/или антитела по настоящему изобретению. Наборы также могут содержать инструкционный материал, который учит методикам и промышленным, медицинским и диетическим применениям настоящего изобретения, как здесь описано.

Цельноклеточная генная инженерия и измерение метаболических параметров.

Способы по настоящему изобретению предусматривают эволюцию цельной клетки или цельноклеточную генную инженерию клетки для разработки нового клеточного штамма, имеющего новый фенотип, например, новую или модифицированную активность фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, посредством модификации генетической композиции клетки. См. заявку на патент США № 20040033975.

Генетическая композиция может модифицироваться посредством добавления к клетке нуклеиновой кислоты по настоящему изобретению, например, последовательности, кодирующей фермент по настоящему изобретению. См., например, заявки на Международный патент WO 0229032; WO 0196551.

Для детекции нового фенотипа по меньшей мере один метаболический параметр модифицированной клетке подвергается мониторингу в клетке во временной рамке "реального времени " или "on-line". В одном из аспектов множество клеток, такое как культура клеток, подвергается мониторингу в "реальном времени" или "on-line". В одном из аспектов множество метаболических параметров подвергается мониторингу в "реальном времени" или "on-line". Метаболические параметры могут подвергаться мониторингу с использованием ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению.

Анализ метаболических потоков (MFA) основывается на известном аппарате биохимии. Линейная независимая метаболическая матрица строится на основе закона сохранения массы и на гипотезе псевдостационарного состояния (PSSH) для внутриклеточных метаболитов. При осуществлении способов по настоящему изобретению, устанавливаются метаболические сети, включая

идентичность субстратов, продуктов и промежуточных продуктов метаболитов всех путей;

идентификацию всех химических реакций, преобразующих друг в друга метаболиты путей, стехиометрии реакций путей;

идентификацию всех ферментов, катализирующих реакции, кинетики реакции ферментов;

регуляторные взаимодействия между компонентами путей, например, аллостерические взаимодействия, взаимодействия фермент-фермент и т.п.;

внутриклеточную компартментализацию ферментов или любую другую супрамолекулярную организацию ферментов; и

присутствие любых градиентов концентраций метаболитов, ферментов или эффекторных молекул или диффузионных барьеров для их движения.

После построения метаболической сети для данного штамма может быть введено математическое представление посредством матричных обозначений для оценки внутриклеточных метаболических потоков, если доступны данные метаболома on-line. Метаболический фенотип основывается на изменениях всей метаболической сети внутри клетки. Метаболический фенотип основывается на изменении использования путей в связи с условиями окружающей среды, генетической регуляцией, состоянием развития и генотипом и т.п. В одном из аспектов способов по настоящему изобретению, после вычисления on-line MFA, динамическое поведение клеток, их фенотип и другие свойства анализируются посредством исследования использования путей. Например, если подача глюкозы увеличивается, а кислорода уменьшается во время ферментирования дрожжей, использование дыхательных путей будет уменьшаться и/или останавливаться, и будет доминировать использование ферментативных путей. Контроль физиологического состояния культур клеток станет возможным после анализа путей. Способы по настоящему изобретению могут помочь в определении того, как манипулировать ферментацией, посредством определения того, как изменять подачу субстрата, температуру, использовать индукторы и т.п., для контроля физиологического состояния клеток, чтобы двигаться в желаемом направлении. При осуществлении способов по настоящему изобретению, результаты MFA могут также сравниваться с данными транскриптома и протеома, для конструирования экспериментов и протоколов для метаболической генной инженерии или шаффлинга генов и т.п.

При осуществлении способов по настоящему изобретению, может придаваться и детектироваться любой модифицированный или новый фенотип, включая новые или улучшенные характеристики клетки. Может осуществляться мониторинг любого аспекта метаболизма или роста.

Мониторинг экспрессии транскрипта m-РНК.

В одном из аспектов по настоящему изобретению полученный с помощью генной инженерии фенотип включает увеличение или уменьшение экспрессии транскрипта m-РНК (например, мессенджера фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы) или генерирования новых транскриптов (например, фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы) в клетке. Это увеличение или уменьшение экспрессии может отслеживаться посредством исследования присутствия фермента целлюлозы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению или посредством анализов активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Транскрипты m-РНК или мессенджеры также могут детектироваться и количественно определяться посредством любого способа, известного в данной области, включая, например, Нозерн-блоттинг, количественные реакции амплификации, гибридизацию с матрицами и т.п. Количественные реакции амплификации включают в себя, например, количественную PCR, включая, например, количественную цепную реакцию полимеразы с обратной транскрипцией или RT-PCR; количественную RT-PCR в реальном времени или "кинетическую RT-PCR в реальном времени" (см., например, Kreuzer (2001), Br. J. Haematol. 114:313-318; Xia (2001), Transplantation 72:907-914).

В одном из аспектов по настоящему изобретению полученный с помощью генной инженерии фенотип генерируется посредством нокаутирования экспрессии гомологичного гена. Может нокаутироваться кодирующая последовательность гена или один или несколько элементов транскрипционного контроля, например, промоторы или энхансеры. Таким образом, экспрессия транскрипта может полностью исключаться или только уменьшаться.

В одном из аспектов по настоящему изобретению полученный с помощью генной инженерии фенотип включает увеличение экспрессии гомологичного гена. Это может осуществляться посредством нокаутирования элемента отрицательного контроля, включая транскрипционный регуляторный элемент, действующий в цис- или транс-, или мутагенизации элемента положительного контроля. Один или несколько, или все транскрипты клетки могут измеряться посредством гибридизации образца, содержащего транскрипты клетки или нуклеиновые кислоты, репрезентативные или комплементарные к транскриптам клетки, посредством гибридизации с иммобилизованными нуклеиновыми кислотами на матрице.

Мониторинг экспрессии полипептидов, пептидов и аминокислот.

В одном из аспектов по настоящему изобретению полученный с помощью генной инженерии фенотип включает увеличение или уменьшение экспрессии полипептида (например, фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы) или генерирования новых полипептидов в клетке. Эта увеличенная или уменьшенная экспрессия может отслеживаться посредством определения количества присутствующего фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы или посредством анализов активности фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Полипептиды, пептиды и аминокислоты также могут детектироваться и количественно определяться с помощью любого способа, известного в данной области, включая, например, ядерный магнитный резонанс (ЯМР), спектрофотометрию, радиографию (радиоактивное мечение белков), электрофорез, капиллярный электрофорез, высокоэффективную жидкостную хроматографию (ВЭЖХ), тонкослойную хроматографию (ТСХ), гипердиффузионную хроматографию, различные иммунологические методы, например иммунопреципитацию, иммунодиффузию, иммуноэлектрофорез, радиоиммунные анализы (RIA), иммуносорбентные анализы на связанных ферментах (ELISA), иммунофлуоресцентные анализы, гель-электрофорез (например, SDS-PAGE), окрашивание с помощью антител, клеточный сортер с активированной флуоресценцией клеток (FACS), пиролитическую масс-спектрометрию, инфракрасную спектрометрию с преобразованием Фурье, Рамановскую спектрометрию, ГХ-МС и ЖХ-электрораспыление и кап-тандемную ЖХ-масс-спектрометрию с электрораспылением и т.п. Скрининг новых биологических активностей также может осуществляться с использованием способов, описанных в патенте США № 6057103, или их вариантов. Кроме того, как подробно обсуждается ниже, один или несколько, или все полипептиды клетки могут измеряться с использованием белковой матрицы.

Промышленные, энергетические, фармацевтические и другие применения.

Полипептиды по настоящему изобретению (например, имеющие целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу) могут катализировать разрушение целлюлозы. Ферменты по настоящему изобретению могут представлять собой высокоселективные катализаторы. Настоящее изобретение относится к промышленным процессам с использованием ферментов по настоящему изобретению, например, в фармацевтической промышленности или в промышленности пищевых (диетических) добавок, в энергетической промышленности (например, для получения "чистых" биотоплив), в пищевой промышленности и в промышленности кормов, например, в способах получения пищевых продуктов и кормов, и добавок к пищевым продуктам и кормам. В одном из аспектов настоящее изобретение относится к способам использования ферментов по настоящему изобретению в медицинской промышленности, например, для получения фармацевтических препаратов или диетических средств или добавок, или пищевых средств и добавок. В дополнение к этому настоящее изобретение относится к способам использования ферментов по настоящему изобретению при производстве биоэтанола, включая "чистое" топливо.

Ферменты по настоящему изобретению могут катализировать реакции с исключительными стерео-, регио- и хемо-селективностями. Ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению, могут быть получены с помощью генной инженерии для функционирования в различных растворителях, для работы при экстремальных рН (например, при высоких рН и низких рН), при экстремальных температурах (например, при высоких температурах и низких температурах), при экстремальных уровнях содержания соли (например, при высоком содержании соли и низком содержании соли) и катализируют реакции с соединениями, которые являются структурно неродственными их природным, физиологическим субстратам.

Преобразование биологической массы и производство чистых биотоплив.

Настоящее изобретение предусматривает ферменты и способы преобразования биологической массы (например, лигноцеллюлозных материалов) в топлива (например, биоэтанол) и химикалии. Таким образом, композиции и способы по настоящему изобретению предусматривают эффективные и стабильные альтернативы для использования продуктов на основе нефти. Настоящее изобретение предусматривает организмы, экспрессирующие ферменты по настоящему изобретению, для участия в химических циклах, включающих преобразование природной биологической массы. В одном из аспектов ферменты и способы преобразования используются в ансамблях ферментов для эффективной деполимеризации целлюлозных и гемицеллюлозных полимеров до метаболизируемых углеродных остатков. Как обсуждается выше, настоящее изобретение относится к способам обнаружения и использования наиболее эффективных ферментов, чтобы сделать возможными эти важные новые промышленные процессы "преобразования биологической массы" и получения альтернативной энергии.

В одном из аспектов полипептиды по настоящему изобретению, например белки, имеющие активность целлюлазы, например активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, используются в способах преобразования лигноцеллюлозной биологической массы в этанол. Настоящее изобретение также относится к способам получение этанола ("биоэтанола") из композиций, содержащих лигноцеллюлозную биологическую массу. Материал лигноцеллюлозной биологической массы может быть получен из сельскохозяйственных культур, в качестве побочного продукта при производстве пищи или кормов или в виде продуктов лигноцеллюлозных отходов, таких как остатки растений и макулатуры. Примеры остатков растений, пригодных для обработки с помощью полипептидов по настоящему изобретению включают стволы, листья, шелуху, скорлупу, кочерыжки и т.п., а также древесину, древесные стружки, древесную пульпу и опилки. Примеры макулатуры, пригодной для обработки полипептидами по настоящему изобретению, включают использованную фотобумагу, бумагу для компьютерных принтеров, бумагу блокнотов, бумагу для записей, бумагу для пишущих машинок, и т.п., а также газеты, журналы, картон и упаковочные материалы на основе бумаги.

В одном из аспектов ферменты и способы по настоящему изобретению могут использоваться в сочетании с более "традиционными" средствами получения этанола из биологической массы, например, в виде способов, включающих гидролиз лигноцеллюлозных материалов посредством воздействия на высушенный лигноцеллюлозный материал в реакторе катализатора, состоящего из разбавленного раствора сильной кислоты и соли металла; это может понизить энергию активации или температуру гидролиза целлюлозы, с получением более высоких выходов сахаров; см., например, патенты США № 6660506; 6423145.

Другой примерный способ, который включает использование фермента по настоящему изобретению, включает гидролиз лигноцеллюлозного материала, содержащего гемицеллюлозу, целлюлозу и лигнин, посредством воздействия на материал первой стадии гидролиза в водной среде при температуре и давлении, выбранных для осуществления, прежде всего, деполимеризации гемицеллюлозы без главной деполимеризации целлюлозы до глюкозы. Эта стадия приводит к получению суспензии, в которой жидкая водная фаза содержит растворенные моносахариды, полученные в результате деполимеризации гемицеллюлозы, а твердая фаза содержит целлюлозу и лигнин. Вторая стадия гидролиза может содержать такие условия, что, по меньшей мере, главная часть целлюлозы деполимеризуется, такая стадия приводит к получению жидкой водной фазы, содержащей растворенные/растворимые продукты деполимеризации целлюлозы. См., например, патент США № 5536325. Ферменты по настоящему изобретению могут добавляться на любой стадии этого примерного способа.

Другой примерный способ, который включает использование ферментов по настоящему изобретению, включает обработку материала биологической массы, содержащего лигноцеллюлозу, с помощью одной или нескольких стадий гидролиза в разбавленной кислоте, с помощью кислоты крепостью примерно 0,4-2%; и обработку непрореагировавшего твердого лигноцеллюлозного компонента материала биологической массы после кислотного гидролиза посредством щелочной делигнификации, с получением предшественников биодеградируемых термопластиков и производных. См., например, патент США № 6409841. Ферменты по настоящему изобретению могут добавляться на любой стадии этого примерного способа.

Другой примерный способ, который включает использование ферментов по настоящему изобретению, включает предварительный гидролиз лигноцеллюлозного материала в реакторе для предварительного гидролиза; добавление кислотной жидкости к твердому лигноцеллюлозному материалу, с получением смеси; нагрев смеси до температуры реакции; поддержание температуры реакции в течение времени, достаточном для фракционирования лигноцеллюлозного материала, на солюбилизированную часть, содержащую по меньшей мере примерно 20% лигнина из лигноцеллюлозного материала, и твердую фракцию, содержащую целлюлозу; удаление солюбилизированной части с твердой фракции, в то же время, при температуре реакции или близой к нее, где целлюлоза в твердой фракции делается более пригодной для ферментативного расщепления; и извлечения солюбилизированной части. См., например, патент США № 5705369. Ферменты по настоящему изобретению могут добавляться на любой стадии этого примерного способа.

Настоящее изобретение относится к способам получения композиций моторных топлив (например, для двигателей искрового зажигания) на основе жидких углеводородов, смешанных со спиртом топливного качества, полученных посредством использования фермента или способа по настоящему изобретению. В одном из аспектов топлива, полученные посредством использования фермента по настоящему изобретению, включают в себя, например, смеси угольный газ - жидкость или природный газ - жидкость - этанол. В одном из аспектов сорастворитель представляет собой полученный из биологической массы 2-метилтетрагидрофуран (MTHF). См., например, патент США № 6712866.

Способы по настоящему изобретению для ферментативной деградации лигноцеллюлозы, например для производства этанола из лигноцеллюлозного материала, могут также включать использование ультразвуковой обработки материала биологической массы; см., например, патент США № 6333181.

Другой примерный способ получения биотоплива, содержащего этанол, с использованием ферментов по настоящему изобретению включает предварительную обработку исходного материала, содержащего лигноцеллюлозные исходные материалы, содержащие, по меньшей мере, гемицеллюлозу и целлюлозу. В одном из аспектов исходный материал включает картофель, сою (рапс), ячмень, рожь, кукурузу, овес, пшеницу, свеклу или сахарный тростник, или компонент отходов или побочного продукта производства пищи или кормов. Исходный материал ("исходные материалы") взаимодействует в условиях, которые разрушают структуру волокон растений, с осуществлением, по меньшей мере, частичного гидролиза гемицеллюлозы и целлюлозы. Условия разрушения могут включать в себя, например, воздействие на исходный материал средней температуры от 180 до 270 °С при рН 0,5-2,5 в течение периода времени примерно от 5 с до 60 мин; или температуры от 220 до 270 °С при рН 0,5-2,5 в течение периода от 5 до 120 с или их эквивалент. Это генерирует исходные материалы с повышенной доступностью для расщепления с помощью фермента, например фермента целлюлазы по настоящему изобретению; патент США № 6090595.

Примерные условия для целлюлазного гидролиза лигноцеллюлозного материала включают реакции при температурах примерно между 30 и 48 °С и/или рН примерно между 4,0 и 6,0.

Другие примерные условия включают температуру примерно между 30 и 60 °С и рН примерно между 4,0 и 8,0.

Корма для животных и добавки для пищевых продуктов или кормов.

В дополнение к получению диетических добавок или средств, или пищевых добавок и средств для использования человеком, настоящее изобретение также предусматривает композиции и способы для обработки кормов для животных и пищевых продуктов и добавок к пищевым продуктам или кормам с использованием полипептида по настоящему изобретению, например, белка, имеющего активность целлюлазы, например, ферментов зндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению, и/или антител по настоящему изобретению. Настоящее изобретение предусматривает корма для животных, пищевые продукты и добавки, содержащие ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу по настоящему изобретению и/или антитела по настоящему изобретению. Животное может представлять собой любое домашнее животное или любое животное.

Добавка к корму для животных по настоящему изобретению может представлять собой гранулированный продукт фермента, который может легко смешиваться с компонентами корма. Альтернативно, добавки к кормам по настоящему изобретению могут образовывать компонент премикса. Гранулированный продукт фермента по настоящему изобретению может иметь или не иметь покрытия. Размер частиц гранул фермента может быть сравнимым с компонентами корма и премикса. Это обеспечивает безопасные и удобные средства включения ферментов в корма. Альтернативно, добавка к корму для животного по настоящему изобретению может представлять собой стабилизированную жидкую композицию. Она может представлять собой водную или масляную суспензию. См., например, патент США № 6245546.

Ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению, при модифицировании корма для животных или пищевого продукта, могут обрабатывать пищевой продукт или корм либо in vitro (посредством модифицирования компонентов корма или пищевого продукта), либо in vivo. Полипептиды по настоящему изобретению могут добавляться к композициям кормов для животных или пищевых продуктов.

В одном из аспектов фермент по настоящему изобретению добавляют в сочетании с другим ферментом, например бета-галактозидазами, каталазами, лакказами, другими целлюлазами, эндогликозидазами, эндо-бета-1,4-лакказами, амилоглюкозидазами, другими глюкозидазами, глюкозаизомеразами, гликозилтрансферазами, липазами, фосфолипазами, липооксигеназами, бета-лакказами, эндо-бета-1,3(4)-лакказами, кутиназами, пероксидазами, амилазами, глюкоамилазами, пектиназами, редуктазами, оксидазами, декарбоксилазами, фенолоксидазами, лигниназами, пуллуланазами, арабинаназами, гемицеллюлазами, маннаназами, ксилолакказами, ксиланазами, пектинацетилэстеразами, рамногалактуронанацетилэстеразами, протеазами, пептидазами, протеиназами, полигалактуроназами, рамногалактуроназами, галактаназами, пектинлиазами, трансглютаминазами, пектинметилэстеразами, другими целлобиогидролазами и/или трансглютаминазами. Эти продукты ферментативного переваривания являются лучше перевариваемыми животными. Таким образом, ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению, могут вносить вклад в доступную энергию корма или пищевого продукта, или в перевариваемость пищевого продукта или корма, посредством разрушения целлюлозы.

В другом аспекте фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению может подаваться посредством экспрессирования ферментов непосредственно в трансгенные кормовые культуры (например, такие трансгенные растения, семена и т.п.), такие как злаки, зерновые культуры, кукуруза, соя, рапс, люпин и т.п. Как обсуждается выше, настоящее изобретение предусматривает трансгенные растения, части растений и клетки растений, содержащие последовательность нуклеиновых кислот, кодирующую полипептид по настоящему изобретению. В одном из аспектов нуклеиновая кислота экспрессируется так, что фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению производится в извлекаемых количествах. Фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, может извлекаться из любого растения или части растения. Альтернативно, растение или часть растения, содержащая рекомбинантный полипептид, может использоваться как таковая для улучшения качества пищевого продукта или корма, например, улучшая питательную ценность, вкусовые качества и т.п.

В одном из аспектов матрица для доставки фермента по настоящему изобретению находится в форме множества отдельных частиц, хлопьев или гранул. Под "гранулами" подразумеваются частицы, которые прессуются или компактируются, например, посредством гранулирования, экструзии или подобного компактирования, для удаления воды из матрицы. Такое прессование или компактирование частиц также облегчает внутричастичную когезию для частиц. Например, гранулы могут приготавливаться посредством гранулирования субстрата на основе зерен в грануляторе. Гранулы, полученные при этом, измельчаются или крошатся до размера гранул, пригодного для использования в качестве добавки в корме для животных. Поскольку сама матрица является одобренной для использования в корме для животных, она может использоваться в качестве разбавителя для доставки ферментов в корм для животных.

В одном из аспектов фермент целлюлаза, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, содержащийся в матрице для доставки фермента по настоящему изобретению и в способах по настоящему изобретению, представляет собой термостабильный фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, как описано здесь, с тем, чтобы противостоять инактивации фермента целлюлазы, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, во время производства, когда повышенные температуры и/или пар могут использоваться для получения гранулированной матрицы для доставки фермента. Во время переваривания корма, содержащего матрицу для доставки фермента по настоящему изобретению, водные переваривающие текучие среды будут вызывать высвобождение активного фермента. Другие типы термостабильных ферментов и пищевых добавок, которые являются термостабильными, могут также включаться в матрицу для доставки, для высвобождения при любом типе водных условий.

В одном из аспектов покрытие наносится на частицы матрицы для фермента для множества различных целей, таких как добавление ароматизатора или пищевой добавки в корм для животных, для замедления высвобождения добавок к корму для животных и ферментов в условиях желудка и т.п. В одном из аспектов покрытие наносится для достижения функциональной цели, например, когда является желательным замедление высвобождения фермента из частиц матрицы, или для контроля условий, при которых фермент будет высвобождаться. Композиция материала покрытия должна быть такой, чтобы он селективно разрушался под действием агента, к которому он является чувствительным (такого как тепло, кислота или основание, ферменты или другие химикалии). Альтернативно, два или более покрытий, чувствительных к таким различным разрушающим агентам, могут последовательно наноситься на частицы матрицы.

Настоящее изобретение также направлено на способ получения матрицы для высвобождения фермента. В соответствии с настоящим изобретением, способ включает создание множества отдельных частиц из субстрата на основе зерновых культур с размером частиц, пригодным для использования в качестве матрицы для высвобождения фермента, где частицы содержат фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, кодируемый последовательностью аминокислот по настоящему изобретению. В одном из аспектов способ включает компактирование или прессование частиц матрицы для высвобождения фермента в виде гранул, которое еще в одном из аспектов осуществляется посредством гранулирования. Ингибитор прилипания к форме и агент для придания когезивности, когда используются, могут добавляться в любое пригодное для этого время, и в одном из аспектов смешиваются с субстратом на основе зерновых культур в желаемых пропорциях перед гранулированием субстрата на основе зерновых культур. Содержание влажности в исходном материале для гранулятора в одном из аспектов находится в пределах, приведенных выше по отношению к содержанию влажности в законченном продукте, и в одном из аспектов равно примерно 14-15%. В одном из аспектов влажность добавляется в исходные материалы в форме водного препарата фермента, чтобы довести исходные материалы до этого содержания влажности. Температура в грануляторе в одном из аспектов доводится примерно до 82 °С с помощью пара. Гранулятор может работать при любых условиях, которые прикладывают достаточную работу к исходным материалам для создания гранул. Сам по себе способ гранулирования представляет собой экономически эффективный способ для удаления воды из композиции, содержащей фермент.

Композиции и способы по настоящему изобретению могут осуществляться в сочетании с введением пребиотиков, которые представляют собой высокомолекулярные сахара, например, фрукто-олигосахариды (FOS); галакто-олигосахариды (GOS), материал GRAS (определяемый в целом как безопасный). Эти пребиотики могут метаболизироваться посредством некоторых бактерий пробиотической молочной кислоты (LAB). Они являются неперевариваемыми большинством кишечных микробов.

Обработка пищевых продуктов и приготовление пищи.

Настоящее изобретение предусматривает пищевые продукты и корма, содержащие ферменты по настоящему изобретению, и способы использования ферментов по настоящему изобретению при приготовлении пищевых продуктов и кормов. Ферменты целлюлозы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению имеют многочисленные применения в пищевой промышленности. Настоящее изобретение относится к способам гидролиза целлюлозосодержащих композиций, включая, например, клетку растения, бактериальную клетку, клетку дрожжей, клетку насекомого или клетку животного, или любое растение или часть растения, или любой пищевой продукт или корм, продукт отходов и т.п.

Например, настоящее изобретение предусматривает корма или пищевые продукты, содержащие фермент целлюлазу, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению, например, в корме, жидкости, например в напитке (таком как фруктовый сок или пиво), в хлебе, или тесте, или в хлебопродукте, или в алкогольном напитке (например, в пиве), или в предшественнике напитка (например, в сусле).

Способы обработки пищевых продуктов по настоящему изобретению могут также включать использование любого сочетания других ферментов, таких как триптофаназы или тирозиндекарбоксилазы, лакказы, каталазы, лакказы, другие целлюлазы, зндогликозидазы, эндо-бета-1,4-лакказы, амилоглюкозидазы, другие глюкозидазы, глюкозаизомеразы, гликозилтрансферазы, липазы, фосфолипазы, липооксигеназы, бета-лакказы, эндо-бета-1,3(4)-лакказы, кутиназы, пероксидазы, амилазы, глюкоамилазы, пектиназы, редуктазы, оксидазы, декарбоксилазы, фенолоксидазы, лигниназы, пуллуланазы, арабинаназы, гемицеллюлазы, маннаназы, ксилолакказы, ксиланазы, пектинацетилэстеразы, рамногалактуронанацетилэстеразы, протеазы, пептидазы, протеиназы, полигалактуроназы, рамногалактуроназы, галактаназы, пектин лиазы, трансглютаминазы, пектинметилэстеразы, другие целлобиогидролазы и/или трансглютаминазы.

В одном из аспектов настоящее изобретение предусматривает ферменты и способы для гидролиза жидкого (разжиженного) и гранулярного крахмала. Такой крахмал может быть получен из любого источника, например свеклы, сахарного тростника, картофеля, кукурузы, пшеницы, различных видов сорго, ржи или булгура. Настоящее изобретение применяется к любому растительному источнику крахмала, например к зерновому источнику крахмала, который является пригодным при разжижении (например, при получении биоэтанола), включая любой другой зерновой или растительный источник, известный как производящий крахмал, пригодный для разжижения. Способы по настоящему изобретению включают разжижение крахмала (например, получение биоэтанола) из любого природного материала, такого как рис, пророщенный рис, кукуруза, ячмень, сорго, пшеница, бобовые растения, картофель, свекла, сахарный тростник и потаты. Способ разжижения может по существу гидролизовать крахмал, с получением сиропа. Диапазон температур разжижения может представлять собой любую температуру разжижения, которая известна, как являющаяся эффективной при разжижении крахмала. Например, температура крахмала может находиться в пределах примерно между 80 °С и примерно 115 °С, примерно между 100 °С и примерно 110 °С, и примерно 105 °С и примерно 108 °С. Биоэтанолы, полученные с использованием ферментов и способов по настоящему изобретению, могут использоваться в качестве топлив или в топливах (например, автомобильных топливах), например, как обсуждается ниже, в дополнение к их использованию в пищевых продуктах и кормах (или для их получения), включая алкогольные напитки.

Переработка отходов.

Настоящее изобретение предусматривает ферменты для использования при переработке отходов. Ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, по настоящему изобретению могут использоваться при различных видах переработки отходов или при связанных с нею промышленных применениях, например, при переработке отходов, связанной с преобразованием биологической массы для генерирования топлив. Например, в одном из аспектов настоящее изобретение относится к способу расщепления твердых и/или жидких отходов с использованием ферментов целлюлаз, например эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы, по настоящему изобретению. Способы могут включать уменьшение массы и объема по существу необработанных твердых отходов. Твердые отходы могут обрабатываться с помощью способа ферментативного расщепления в присутствии ферментативного раствора (содержащего ферменты целлюлазы, например эндоглюканазу, целлобиогидролазу, маннаназу и/или бета-глюкозидазу, по настоящему изобретению) при контролируемой температуре. Это приводит к взаимодействию без заметного бактериального ферментирования от добавленных микроорганизмов. Твердые отходы преобразуются в разжиженные отходы и любые остаточные твердые отходы. Полученные разжиженные отходы могут отделяться от указанных любых остаточных отвержденных отходов. См., например, патент США № 5709796.

В одном из аспектов композиции и способы по настоящему изобретению используются для удаления запаха, предотвращения запаха или уменьшения запаха, например, в отстойниках животных отходов, например на свинофермах, в других системах распределения животных отходов или в любом промышленном применении или в применении при обработке пищевых продуктов.

Ферменты и способы преобразования биологической массы (например, лигноцеллюлозных материалов) в топлива (например, биоэтанол) могут включать обработку/рециклирование материала муниципальных твердых отходов, включая отходы, полученные непосредственно от муниципальных источников, или муниципальные твердые отходы, которые сначала зарывают в землю, а впоследствии извлекают, или ил из отстойника, например в форме лепешки ила из отстойника, которая содержит достаточные количества целлюлозного материала. Поскольку лепешки ила из отстойника не будут обычно содержать достаточных количеств рециклируемых материалов (алюминия, стекла, пластика и т.п.), они могут непосредственно обрабатываться концентрированной серной кислотой (для понижения содержания тяжелых металлов целлюлозного компонента отходов) и обрабатываться в системе производства этанола. См., например, патенты США № 6267309; 5975439.

Другой примерный способ использования ферментов по настоящему изобретению для извлечения органического и неорганического вещества из материала отходов включает стерилизацию твердого органического вещества и его размягчение посредством воздействия тепла и давления. Этот примерный способ может осуществляться посредством, сначала, перемешивания материала отходов, а затем воздействия на него тепла и давления, которое стерилизует его и размягчает органическое вещество, содержащееся в нем. В одном из аспектов после нагрева под давлением, давление в перфорированной камере может быстро понижаться, заставляя размягченное органическое вещество выходить наружу через перфорацию в контейнере, таким образом, отделяя органическое вещество от твердого неорганического вещества. Размягченное стерилизованное органическое вещество затем ферментируется в ферментационной камере, например, с использованием ферментов по настоящему изобретению, например, с образованием пульпы. Пульпа может подвергаться дополнительной обработки посредством центрифуги, дистилляционной колонны и/или анаэробного дигестера для извлечения топлив, таких как этанол и метан, и добавок к кормам для животных. См., например, патент США № 6251643.

Ферменты по настоящему изобретению также могут использоваться в способах, например, предварительной обработки для уменьшения запаха промышленных отходов или отходов, генерируемых предприятиями по разведению животных и т.п. Например, ферменты по настоящему изобретению могут использоваться для обработки животных отходов и отходов предприятий по их содержанию для повышения эффективной деградации больших количеств органических веществ с уменьшением запаха. Способ может также включать инокуляцию сульфид-использующими бактериями и бактериями, переваривающими органику, и литическими ферментами (в дополнение к ферментам по настоящему изобретению). См., например, патент США № 5958758.

Ферменты по настоящему изобретению могут также использоваться в мобильных системах, например в реакторах загрузочного типа, для биологической переработки водных опасных отходов, например, как описано в патенте США № 5833857. Реакторы загрузочного типа могут представлять собой большие емкости, имеющие возможность циркуляции, где бактерии (например, экспрессирующие фермент по настоящему изобретению) поддерживаются в эффективном состоянии посредством питательных веществ, вводимых в реактор. Такие системы могут использоваться, когда эффлюент может доставляться в реактор, или реактор встраивается в систему обработки сточных вод. Ферменты по настоящему изобретению могут также использоваться в системах обработки для использования в небольших и временно удаленных пунктах, например, в переносных, имеющих большой объем обработки, высокоэффективных, подвижных системах обработки сточных вод.

Способы переработки отходов по настоящему изобретению могут включать использование любого сочетания других ферментов, таких как другие ферменты целлюлазы, например эндоглюканаза, целлобиогидролаза, маннаназа и/или бета-глюкозидаза, каталазы, лакказы, другие целлюлазы, эндогликозидазы, эндо-бета-1,4-лакказы, амилоглюкозидазы, другие глюкозидазы, глюкозаизомеразы, гликозилтрансферазы, липазы, фосфолипазы, липооксигеназы, бета-лакказы, эндо-бета-1,3(4)-лакказы, кутиназы, пероксидазы, амилазы, глюкоамилазы, пектиназы, редуктазы, оксидазы, декарбоксилазы, фенолоксидазы, лигниназы, пуллуланазы, фитазы, арабинаназы, гемицеллюлазы, маннаназы, ксилолакказы, ксиланазы, пектинацетилэстеразы, рамногалактуронанацетилэстеразы, протеазы, пептидазы, протеиназы, полигалактуроназы, рамногалактуроназы, галактаназы, пектинлиазы, трансглютаминазы, пектинметилэстеразы, другие целлобиогидролазы и/или трансглютаминазы.

Композиции моющих средств.

Настоящее изобретение предусматривает композиции моющих средств, содержащих один или несколько полипептидов по настоящему изобретению (например, ферментов, имеющих активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы), и способы получения и использования этих композиций. Настоящее изобретение включает все способы получения и использования композиций моющих средств, см., например, патент США № 6413928; 6399561; 6365561; 6380147. Композиции моющих средств могут представлять собой водную композицию в одной и двух частях, неводную жидкую композицию, литой твердый продукт, гранулярную форму, форму частиц, прессованную таблетку, форму геля и/или пасты и суспензии. Настоящее изобретение также относится к способам, способным к быстрому удалению больших загрязнений от пищевых продуктов, пленок из остатков пищевых продуктов и других остатков пищевых композиций с использованием этих композиций моющих средств. Ферменты по настоящему изобретению могут облегчать удаление крахмальных окрашенных пятен посредством каталитического гидролиза полисахарида крахмала. Ферменты по настоящему изобретению могут использоваться в моющих средствах для посудомоечных машин, в моющих средствах для стиральных машин.

Реальное содержание активного фермента зависит от способа получения композиции моющего средства и не является критичным при условии, что раствор моющего средства имеет желаемую ферментативную активность. В одном из аспектов количество глюкозидазы, присутствующее в конечном растворе, находится в пределах примерно от 0,001 до 0,5 мг на 1 г композиции моющего средства. Конкретный фермент, выбранный для использования в способе и в продуктах по настоящему изобретению, зависит от условий конечного использования, включая физическую форму продукта, используемый рН, используемую температуру и типы загрязнений, которые должны деградироваться или изменяться. Фермент может выбираться для обеспечения оптимальной активности и стабильности, для любого данного набора условий использования. В одном из аспектов полипептиды по настоящему изобретению являются активными при рН в диапазоне примерно от 4 примерно до 12 и при температуре в диапазоне примерно от 20 примерно до 95 °С. Моющие средства по настоящему изобретению могут содержать катионные, полуполярные неионные или цвиттерионные поверхностно-активные вещества или их смеси.

Ферменты по настоящему изобретению (например, ферменты, имеющие активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы) могут приготавливаться в виде порошкообразных и жидких моющих средств, имеющих рН в пределах между 4,0 и 12,0, при уровнях примерно от 0,01 примерно до 5 мас.% (предпочтительно 0,1-0,5%). Эти композиции моющих средств могут также включать другие ферменты, такие как известные протеазы, целлюлазы, липазы или эндогликозидазы, а также наполнители и стабилизаторы. Добавление ферментов по настоящему изобретению к обычным моющим композициям не создает никаких специальных ограничений для использования. Другими словами, любая температура и рН, пригодные для моющего средства, являются пригодными также для настоящих композиций, постольку, поскольку рН находится в указанных выше пределах и температура ниже описанной температуры денатурации фермента. В дополнение к этому полипептиды по настоящему изобретению могут использоваться в моющей композиции без моющих средств, опять же, либо сами по себе, либо в сочетании с наполнителями и стабилизаторами.

Настоящее изобретение относится к моющим композициям, включающим композиции моющих средств для очистки твердых поверхностей, композиции моющих средств для очистки тканей, посудомоечные композиции, композиции для очистки полости рта, композиции для чистки зубов и растворы для чистки контактных линз.

В одном из аспектов настоящее изобретение относится к способу для отмывки объекта, включающий приведение в контакт объекта с полипептидом по настоящему изобретению в условиях, достаточных для отмывки. Полипептид по настоящему изобретению может включаться как добавка в моющее средство. Композиция моющего средства по настоящему изобретению может, например, приготавливаться в виде композиции моющего средства для ручной или машинной стирки, содержащей полипептид по настоящему изобретению. Добавка для стирки, пригодная для предварительной обработки окрашенных тканей, может содержать полипептид по настоящему изобретению. Композиция умягчителя тканей может содержать полипептид по настоящему изобретению. Альтернативно, полипептид по настоящему изобретению может приготавливаться в виде композиции моющего средства для использования при общих операциях очистки домашних твердых поверхностей. В альтернативных аспектах добавки к моющим средствам и композициям моющих средств по настоящему изобретению могут содержать один или несколько других ферментов, таких как протеаза, липаза, кутиназа, другая глюкозидаза, карбогидраза, другая целлюлаза, пектиназа, маннаназа, арабиназа, галактаназа, ксиланаза, оксидаза, например лактаза и/или пероксидаза. Свойства фермента (ферментов) по настоящему изобретению выбираются так, чтобы они были совместимыми с выбранным моющим средством (например, рН-оптимум, совместимость с другими ферментативными и неферментативными ингредиентами и т.п.), и фермент (ферменты) присутствует в эффективных количествах. В одном из аспектов ферменты по настоящему изобретению используют для удаления материалов с неприятным запахом с тканей. Различные композиции моющих средств и способы их получения, которые могут использоваться при осуществлении настоящего изобретения, описываются, например, в патентах США № 6333301; 6329333; 6326341; 6297038; 6309871; 6204232; 6197070; 5856164.

Моющие средства и связанные с ними способы по настоящему изобретению могут также включать использование любого сочетания других ферментов, таких как триптофаназы или тирозиндекарбоксилазы, лакказы, каталазы, лакказы, друг целлюлазы, эндогликозидазы, эндо-бета-1,4-лакказы, амилоглюкозидазы, другие глюкозидазы, глюкозаизомеразы, гликозилтрансферазы, липазы, фосфолипазы, липооксигеназы, бета-лакказы, эндо-бета-1,3(4)-лакказы, кутиназы, пероксидазы, амилазы, глюкоамилазы, пектиназы, редуктазы, оксидазы, декарбоксилазы, фенолоксидазы, лигниназы, пуллуланазы, арабинаназы, гемицеллюлазы, маннаназы, ксилолакказы, ксиланазы, пектинацетилэстеразы, рамногалактуронанацетилэстеразы, протеазы, пептидазы, протеиназы, полигалактуроназы, рамногалактуроназы, галактаназы, пектинлиазы, трансглютаминазы, пектинметилэстеразы, другие целлобиогидролазы и/или трансглютаминазы.

Обработка тканей и текстильных изделий.

Настоящее изобретение относится к способам обработки тканей и текстильных изделий с использованием одного или нескольких полипептидов по настоящему изобретению, например, ферментов, имеющих активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. Полипептиды по настоящему изобретению могут использоваться при любом способе обработки ткани, которые хорошо известны в данной области, см., например, патент США № 6077316. Например, в одном из аспектов ощущение от ткани и ее внешний вид улучшаются с помощью способа, включающего приведения в контакт ткани с ферментом по настоящему изобретению, в растворе. В одном из аспектов ткань обрабатывают раствором под давлением.

В одном из аспектов ферменты по настоящему изобретению применяются во время тканья текстильных изделий или во время стадии расшлихтовки, или одной или нескольких дополнительных стадий обработки ткани, или после них. Во время тканья текстильных изделий нити экспонируются для значительной механической деформации. Перед тканьем на механических ткацких станках, скрученные нити часто покрывают аппретирующим крахмалом или производными крахмала для увеличения их прочности на разрыв и для предотвращения разрыва. Ферменты по настоящему изобретению могут применяться для удаления этого аппретирующего крахмала или производных крахмала. После того как текстильные изделия сотканы, ткань может проходить стадию расшлихтовки. За ней может следовать одна или несколько дополнительных стадий обработки ткани. Расшлихтовка представляет собой акт удаления аппрета с текстильных изделий. После тканья аппретирующее покрытие должно удаляться перед дальнейшей обработкой ткани для обеспечения гомогенного и стойкого при стирке результата. Настоящее изобретение относится к способу расшлихтовки, включающий ферментативный гидролиз аппрета под действием фермента по настоящему изобретению.

Ферменты по настоящему изобретению (например, ферменты, имеющие активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы) могут использоваться для расшихтовки тканей, включая ткани, содержащие хлопок, в качестве добавок для моющих средств, например, в водных композициях. Настоящее изобретение относится к способам для получения "вареного" вида джинсовой ткани, окрашенной индиго, и одежды из нее. Для производства одежды ткань разрезается и сшивается в виде платья или одежды, которая затем отделывается. В частности, для производства джинсов из джинсовой ткани разработаны различные способы ферментативной отделки.

Отделка джинсовой одежды, как правило, начинается со стадии ферментативной расшлихтовки, во время которой одежда подвергается действию амилолитических ферментов для обеспечения мягкости ткани и для того, чтобы сделать хлопок более доступным для последующей стадии ферментативной отделки. Настоящее изобретение относится к способам отделочной обработки джинсовой одежды (например, "способ биологической варки"), ферментативной расшлихтовки и обеспечения мягкости ткани с использованием ферментов по настоящему изобретению. Настоящее изобретение относится к способам для быстрого умягчения джинсовой одежды в способе расшлихтовки и/или отделочной обработки.

Настоящее изобретение также предусматривает дезинфицирующее средство, содержащие ферменты по настоящему изобретению (например, ферменты, имеющие активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы).

Способы обработки ткани или текстильного изделия по настоящему изобретению могут также включать использование любого сочетания других ферментов, таких как триптофаназы или тирозиндекарбоксилазы, лакказы, каталазы, лакказы, другие целлюлазы, эндогликозидазы, эндо-бета-1,4-лакказы, амилоглюкозидазы, другие глюкозидазы, глюкозаизомеразы, гликозилтрансферазы, липазы, фосфолипазы, липооксигеназы, бета-лакказы, эндо-бета-1,3(4)-лакказы, кутиназы, пероксидазы, амилазы, глюкоамилазы, пектиназы, редуктазы, оксидазы, декарбоксилазы, фенолоксидазы, лигниназы, пуллуланазы, арабинаназы, гемицеллюлазы, маннаназы, ксилолакказы, ксиланазы, пектинацетилэстеразы, рамногалактуронанацетилэстеразы, протеазы, пептидазы, протеиназы, полигалактуроназы, рамногалактуроназы, галактаназы, пектин лиазы, трансглютаминазы, пектин метилэстеразы, другие целлобиогидролазы и/или трансглютаминазы.

Обработка бумаги или пульпы.

Ферменты по настоящему изобретению (например, ферменты, имеющие активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы) могут присутствовать при обработке бумаги или пульпы или отмывания бумаги от краски. Например, в одном из аспектов настоящее изобретение относится к способу обработки бумаги с использованием ферментов по настоящему изобретению. В одном из аспектов ферменты по настоящему изобретению могут использоваться для модификации крахмала в бумаге, тем самым преобразуя его в разжиженную форму, в другом аспекте - для компонентов бумаг из рециклированной фотобумаги, бумаг во время химических и ферментативных способов отмывания от краски. В одном из аспектов ферменты по настоящему изобретению могут использоваться в сочетании с другими ферментами, включающими другие целлюлазы (включая другие эндоглюканазы, целлобиогидролазы и/или бета-глюкозидазы). Древесина, бумага, бумажные продукты или пульпа могут обрабатываться посредством следующих трех способов: 1) разрыхления в присутствии фермента по настоящему изобретению, 2) разрыхления с помощью отмывания от краски посредством химикалия и фермента по настоящему изобретению и/или 3) разрыхления после пропитки ферментом по настоящему изобретению. Рециклированная бумага, обработанная ферментом по настоящему изобретению, может иметь более высокую белизну, благодаря удалению частиц тонера, по сравнению с бумагой, обработанной только лишь целлюлазой. Хотя настоящее изобретение не является ограниченным каким-либо конкретным механизмом, воздействие фермента по настоящему изобретению может быть вызвано его поведением как поверхностно-активного агента в суспензии пульпы.

Настоящее изобретение относится к способам обработки бумаги и бумажной пульпы с использованием одного или нескольких полипептидов по настоящему изобретению. Полипептиды по настоящему изобретению могут использоваться в любом способе обработки бумаги или пульпы, которые хорошо известны в данной области, см., например, патент США № 6241849; 6066233; 5582681. Например, в одном из аспектов настоящее изобретение относится к способу отмывания от краски и обесцвечивания бумаги для печати, содержащей краситель, включая варку бумаги для печати, для получения суспензии пульпы, и удаления краски из суспензии пульпы в присутствии фермента по настоящему изобретению (другие ферменты могут также добавляться). В другом аспекте настоящее изобретение относится к способу для повышения садкости пульпы, например пульпы, полученной из вторичных волокон, посредством добавления ферментативной смеси, содержащей фермент по настоящему изобретению (она может также содержать другие ферменты, например ферменты пектиназы), в пульпу и обработку в условиях, которые должны вызвать реакцию, с получением ферметативно обработанной пульпы. Садкость ферметативно обработанной пульпы увеличивается, по сравнению с начальной садкостью пульпы из вторичных волокон, без потери белизны.

Способы обработки или рециклирования бумаги, древесины или пульпы по настоящему изобретению могут также включать использование любого сочетания других ферментов, таких как триптофаназы или тирозиндекарбоксилазы, лакказы, каталазы, лакказы, другие целлюлазы, эндогликозидазы, эндо-бета-1,4-лакказы, амилоглюкозидазы, другие глюкозидазы, глюкозаизомеразы, гликозилтрансферазы, липазы, фосфолипазы, липооксигеназы, бета-лакказы, эндо-бета-1,3(4)-лакказы, кутиназы, пероксидазы, амилазы, глюкоамилазы, пектиназы, редуктазы, оксидазы, декарбоксилазы, фенолоксидазы, лигниназы, пуллуланазы, арабинаназы, гемицеллюлазы, маннаназы, ксилолакказы, ксиланазы, пектинацетилэстеразы, рамногалактуронанацетилэстеразы, протеазы, пептидазы, протеиназы, полигалактуроназы, рамногалактуроназы, галактаназы, пектинлиазы, трансглютаминазы, пектин метилэстеразы, другие целлобиогидролазы и/или трансглютаминазы.

Репульпирование: обработка лигноцеллюлозных материалов.

Настоящее изобретение также относится к способу обработки лигноцеллюлозных волокон, где волокна обрабатывают полипептидом по настоящему изобретению (например, ферментами, имеющими активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы), в количестве, которое является эффективным для улучшения свойств волокон. Ферменты по настоящему изобретению могут также использоваться при производстве или рециклировании лигноцеллюлозных материалов, таких как пульпа, бумага и картон, из отходов армированной крахмалом бумаги и картона, в частности, где репульпирование или рециклирование осуществляется при рН выше 7 и где ферменты по настоящему изобретению могут облегчать разрушение отходов материала посредством деградации армирующего крахмала. Ферменты по настоящему изобретению могут быть пригодны для использования в способе производства бумажной пульпы из бумаги для печати, покрытой крахмалом. Способ может осуществляться, как описано, например, в заявке на Международный патент WO 95/14807. Примерный способ включает разрыхление бумаги для получения пульпы, обработку ферментом, деградирующим крахмал, до, во время или после разрыхления и отделение частиц краски от пульпы после разрыхления и обработки ферментом. См. также патент США № 6309871 и другие патенты США, цитируемые здесь. Таким образом, настоящее изобретение включает способ ферментативного отмывания от краски пульпы из рециклируемой бумаги, где полипептид применяется в количестве, которое является эффективным для эффективного отмывания от краски поверхности волокна.

Пивоварение и ферментирование.

Настоящее изобретение относится к способам варки (например, ферментирования) пива, содержащего фермент по настоящему изобретению, например ферменты, имеющие активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из примерных процессов, крахмалсодержащие исходные материалы разрушаются и обрабатываются, с образованием солода. Фермент по настоящему изобретению используется в любой точке способа ферментации. Например, ферменты по настоящему изобретению могут использоваться при обработке ячменного солода. Главный исходный материал при варке пива представляет собой ячменный солод. Это может быть трехстадийный способ. Во-первых, зерно ячменя может замачиваться для увеличения содержания воды, например, примерно до 40%. Во-вторых, зерно может проращиваться посредством инкубирования при 15-25 °С в течение 3-6 дней, когда стимулируется синтез ферментов под контролем гиббереллинов. В течение этого времени уровни ферментов значительно возрастают. В одном из аспектов ферменты по настоящему изобретению добавляют на этой (или на любой другой) стадии способа. Действие фермента приводит к увеличению содержания ферментируемых восстанавливающих сахаров. Это может выражаться как диастатическая активность, DP, которая может увеличиваться примерно от 80 до 190 после 5 дней при 12 °С.

Ферменты по настоящему изобретению могут использоваться в любых способах получения пива, как описано, например, в патентах США № 5762991; 5536650; 5405624; 5021246; 4788066.

Увеличение потока добываемых текучих сред из подземной формации.

Настоящее изобретение также включает способ использования фермента по настоящему изобретению (например, ферментов, имеющих активность целлюлазы, эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы), где способ увеличивает поток добываемых текучих сред из подземной формации посредством удаления вязких, содержащих крахмал, вызывающих повреждения текучих сред, образующихся во время операций добычи; эти текучие среды могут быть обнаружены в подземной формации, которая окружает законченную скважину. Таким образом, этот способ по настоящему изобретению приводит к получению добываемых текучих сред, способных к вытеканию из скважины. Этот способ по настоящему изобретению также решает проблемы вызывающих повреждения текучих сред, понижающих поток добываемых текучих сред из формации ниже ожидаемых скоростей потока. В одном из аспектов настоящее изобретение предусматривает приготовление препарата для обработки ферментом (с использованием фермента по настоящему изобретению) посредством смешивания вместе водной текучей среды и полипептида по настоящему изобретению; закачку ферментной обработки в желаемом положении внутри скважины; предоставление возможности ферментной обработке для деградации вязкой, содержащей крахмал, вызывающей повреждения текучей среды, при этом текучая среда может удаляться из подземной формации на поверхность скважины; и где ферментная обработка является эффективной при воздействии на альфа-глюкозидные связи в содержащей крахмал текучей среде.

Способы ферментной обработки подземной формации по настоящему изобретению может также включать использование любого сочетания других ферментов, таких как триптофаназы или тирозиндекарбоксилазы, лакказы, каталазы, лакказы, другие целлюлазы, эндогликозидазы, эндо-бета-1,4-лакказы, амилоглюкозидазы, другие глюкозидазы, глюкозаизомеразы, гликозилтрансферазы, липазы, фосфолипазы, липооксигеназы, бета-лакказы, эндо-бета-1,3(4)-лакказы, кутиназы, пероксидазы, амилазы, глюкоамилазы, пектиназы, редуктазы, оксидазы, декарбоксилазы, фенолоксидазы, лигниназы, пуллуланазы, арабинаназы, гемицеллюлазы, маннаназы, ксилолакказы, ксиланазы, пектинацетилэстеразы, рамногалактуронанацетилэстеразы, протеазы, пептидазы, протеиназы, полигалактуроназы, рамногалактуроназы, галактаназы, пектинлиазы, трансглютаминазы, пектинметилэстеразы, другие целлобиогидролазы и/или трансглютаминазы.

Фармацевтические композиции и диетические добавки.

Настоящее изобретение также предусматривает фармацевтические композиции и диетические добавки (например, диетические средства), содержащие целлюлазу по настоящему изобретению (например, ферменты, имеющие активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы). Активность целлюлазы включает в себя активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы. В одном из аспектов фармацевтические композиции и диетические добавки (например, диетические средства) приготавливаются для перорального заглатывания, например, для улучшения перевариваемости пищевых продуктов и кормов, имеющих высокое содержание целлюлозы или лигноцеллюлозного компонента.

Соединения для периодонтального лечения могут содержать фермент по настоящему изобретению, например, как описано в патенте США № 6776979. Композиции и способы лечения или профилактики синдрома кислотного кишечника могут содержать фермент по настоящему изобретению, например, как описано в патенте США № 6468964.

В другом аспекте повязки на раны, импланты и т.п. содержат противомикробные (например, действующие как антибиотики) ферменты, включая фермент по настоящему изобретению (включая, например, примерные последовательности по настоящему изобретению). Ферменты по настоящему изобретению также могут использоваться в альгинатных повязках, противомикробных барьерных повязках, ожоговых повязках, компрессионных бандажах, диагностических инструментах, гелевых повязках, гидроселективных повязках, гидроцеллюлярных (пенистых) повязках, гидроколлоидных повязках, повязках при внутривенных вливаниях, хирургических салфетках, слабоприлипающих повязках, повязках, поглощающих запахи, бинтах для наложения мазей, послеоперационных повязках, при залечивании рубцов, для ухода за кожей, в повязках и/или наклейках на раны в виде прозрачной пленки. Ферменты по настоящему изобретению могут использоваться при отмывке ран, при приготовлении тампонов для ран, при лечении пролежневых язв, язв бедер, ожогов, диабетических язв ног, рубцов, для фиксирования устройств для внутривенного вливания, для хирургических ран и небольших ран. Ферменты по настоящему изобретению могут использоваться в стерильных ферментативных композициях для обработки ран, например, в мазях. В различных аспектах, целлюлаза приготавливается в виде таблетки, геля, пилюли, импланта, жидкости, спрея, порошка, пищевого продукта, гранулы корма или в виде инкапсулированного препарата.

Применения для биологической защиты.

В других аспектах целлюлазы по настоящему изобретению (например, ферменты, имеющие активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы) могут использоваться при биологической защите (например, для разрушения спор или бактерий, содержащих лигноцеллюлозный материал). Использование целлюлаз по настоящему изобретению в применениях для биологической защиты дает значительное преимущество в том, что они могут быть очень быстро разработаны против любых неизвестных в настоящее время агентов или агентов биологического оружия в будущем. В дополнение к этому целлюлазы по настоящему изобретению могут использоваться для деконтаминации зараженных окружающих сред. В одном из аспектов настоящее изобретение предусматривает агент биологической защиты или биологической детоксификации, содержащий полипептид, имеющий активность целлюлазы, где полипептид содержит последовательность по настоящему изобретению (включая, например, примерные последовательности по настоящему изобретению), или полипептид, кодируемый нуклеиновой кислотой по настоящему изобретению (включая, например, примерные последовательности по настоящему изобретению), где полипептид необязательно имеет активность, включающую активность эндоглюканазы, целлобиогидролазы, маннаназы и/или бета-глюкозидазы.

Список литературы

1. Sambrook, J. and Russell, D.W. 2001. Molecular Cloning: A Laboratory Manual. Third Edition. Cold Spring Harbor Laboratory Press, New York.

2. Benhar, I. Biotechnological applications of phage and cell display. Biotechnology Advances 19, 1-13, 2001.

3. Coutinho, P.M. and Henrissat, B. Carbohydrate-Active Enzymes server at URL: http://afmb.cnrs-mrs.fr/~cazy/CAZY/index.html. 1999.

4. Felix, С.R. and L.G. Ljungdabl. 1993. The cellulosome: the exocellular organelle of Clostridium. Annu. Rev. Microbiol 47:791-819:791-819.

5. Gray, K.A., T.H. Richardson, K. Kretz, J.M. Short, F. Bartnek, Knowles R., L. Kan, Swanson P.E., and Robertson D.E. 2001. Rapid evolution of reversible denaturation and elevated melting temperature in a microbial haloalkane dehalogenase. Advanced Synthesis and Catalysis 343:607-617.

6. Guttman, A., F.T. Chen, R.A. Evangelista, and N. Cooke. 1996. High-resolution capillary gel electrophoresis of reducing oligosaccharides labeled with 1-aminopyrene-3,6,8-trisulfonate. Anal. Biochem 233:234-242.

7. Harjunpaa, V., A. Teleman, A. Koivula, L. Ruohonen, T.T. Teeri, О. Teleman, and T. Drakenberg. 1996. Cello-oligosaccharide hydrolysis by cellobiohydrolase II from Trichoderma reesei. Association and rate constants derived from an analysis of progress curves. Eur. J. Biochem 240:584-591.

8. Himmel, M.E., M.F. Ruth, and С.Е. Wyman. 1999. Cellulase for commodity products from cellulosic biomass. Curr. Opin. Biotechnol 10:358-364.

9. Kerr, R.A. 1998. GEOLOGY:The Next Oil Crisis Looms Large-and Perhaps Close. Science 281:1128.

10. Kerr, R.A. 2000. OIL OUTLOOK:USGS Optimistic on World Oil Prospects. Science 289:237.

11. King, R.W., K.D. Lustig, P.T. Stukenberg, T.J. McGarry, and M.W. Kirschner. 1997. Expression cloning in the test tube. Science 277:973-974.

12. Kuritz, T. 1999. An easy colorimetric assay for screening and qualitative assessment of deiodination and dehalogenation by bacterial cultures. Lett. Appl Microbiol 28:445-447.

13. Lundberg, K.S., P.L. Kretz, G.S. Provost, and J.M. Short. 1993. The use of selection in recovery of transgenic targets for mutation analysis. Mutat. Res. 301:99-105.

14. MacKenzie, L.F., G. Sulzenbacher, C. Divne, T.A. Jones, H.F. Woldike, M. Schulein, S.G. Withers, and G.J. Davies. 1998. Crystal structure of the family 7 endoglucanase I (Cel7B) from Humicola insolens at 2.2 A resolution and identification of the catalytic nucleophile by trapping of the covalent glycosyl-enzyme intermediate. Biochem J. 335:409-416.

15. Richardson, T.H., X. Tan, G. Frey, W. Callen, M. Cabell, D. Lam, J. Macomber, J.M. Short, D.E. Robertson, and С. Miller. 2002. A novel, high performance enzyme for starch liquefaction. Discovery and optimization of a low pH, thermostable alpha-amylase. J. Biol Chem 277:26501-26507.

16. Sakon, J., D. Irwin, D.B. Wilson, and P.A. Karplus. 1997. Structure and mechanism of endo/exocellulase E4 from Thermomonospora fusca. Nat. Struct. Biol 4:810-818.

17. Short, J.M., J.M. Fernandez, J.A. Sorge, and W.D. Huse. 1988. Lambda ZAP: a bacteriophage lambda expression vector with in vivo excision properties. Nucleic Acids Res. 16:7583-7600.

18. Snustad, D.P., J.P. Hunsperger, В.М. Chereskin, and J. Messing. 1988. Maize glutamine synthetase cDNAs: isolation by direct genetic selection in Escherichia coli. Genetics 120:1111-1123.

19. Varrot, A., S. Hastrup, M. Schulein, and G.J. Davies. 1999. Crystal structure of the catalytic core domain of the family 6 cellobiohydrolase II, Cel6A, from Humicola insolens, at 1.92 A resolution. Biochem J. 337:297-304.

20. Yano, Т., S. Oue, and H. Kagamiyama. 1998. Directed evolution of an aspartate aminotransferase with new substrate specificities. Proc. Natl. Acad. Sci USA 95:5511-5515.

21. Zverlov, V.V., G.A. Velikodvorskaya, and W.H. Schwarz. 2002. A newly described cellulosomal cellobiohydrolase, CelO, from Clostridium thermocellum: investigation of the exo-mode of hydrolysis, and binding capacity to crystalline cellulose. Microbiology 148:247-255.

Следующие далее примеры предназначены для иллюстрации, но не для ограничения заявляемого изобретения.

Примеры

Пример 1. Устройство для скрининга GIGAMATRIX ™.

В одном из аспектов способы по настоящему изобретению используют соответствующую платформу GIGAMATRIX ™, Diversa Corporation; см. публикацию РСТ заявки на патент № WO 01/38583; заявки на патент США № 20050046833; 20020080350; патент США № 6918738; патент на конструкцию № D480814. Например, в одном из аспектов GIGAMATRIX ™ используется в способах для определения того, имеет ли полипептид активность целлюлазы и находится ли он в рамках настоящего изобретения, или для идентификации и выделения полипептида, имеющего активность целлюлазы.

Платформа GIGAMATRIX ® может содержать сверхвысокопроизводительное устройство для скрининга на основе 100000-луночного микропланшета с размерами обычного 96-луночного планшета. В этом примере, скрининг с помощью GIGAMATRIX ™ осуществляют с использованием 2 субстратов, на основе показанной ранее с помощью СВН активности. Исследуют метилумбеллиферилцеллобиозид (MUC) и метилумбеллифериллактозид (MUL). Фагемидные версии различных клонов подвергают скринингу, поскольку субстрат диффундирует в клетки, и флуоресценция, как считается, должна детектироваться легче. Штамм-хозяин, в котором нет бета-галоктозидазы, используют для уменьшения активности по отношению к субстрату лактозиду. Субстрат лактозид приводит к появлению нескольких совпадений и считается более специфичным, чем субстрат целлобиоза. В дополнение к этому субстрат лактозид приводит к появлению нескольких совпадений бета-глюкозидазы. Для исследования возможности использования этих субстратов при скрининге, для скрининга выбирают 14 библиотек на основе того факта, что эти библиотеки дают совпадения эндоглюканазы по программе предыдущего скрининга. Из подвергнутых скринингу библиотек, имеется в целом 50 первичных совпадений из 11 библиотек, из подвергнутых скринингу. Вторичный скрининг состоит из нанесения клонов на пластины агара, а затем отбора колоний в 384-луночных планшетах, содержащих среды и MUL. Клоны, активные по отношению к MUL, дифференцируют от фона неактивных клонов. Затем индивидуальные клоны выращивают в течение ночи и измеряют флуоресценцию, и наиболее активные совпадения отбирают для секвенирования.

Все геномные вставки клонов из совпадений секвенируют. Как правило, совпадения происходят от нескольких различных семейств гликозилгидролазы, включая 1, 2, 5, 6, 10 и 16. Обнаружены несколько других совпадений, где открытая рамка считывания не является гомологичной любому из известных семейств гликозилгидролазы. В дополнение к этому некоторые из совпадений кодируют гены GTP циклогидролазы.

Таблица 1Сводка совпадений GIGAMATRIX ™

Сокращения: СВМ-модуль связывания углевода.

Характеризация активности фермента и субстрата.

39 совпадений (см. табл. 1), обнаруженных при скрининге с помощью GIGAMATRIX ™, сначала подвергаются скринингу на целлогексаозу для определения паттерна действия на олигомер целлюлозы. Геномные клоны определяются как клоны, которые имеют полную вставку ДНК, потенциально содержащую множество открытых рамок считывания. Например, в табл. 1 один из таких геномных клонов содержит две открытые рамки считывания, отмеченные как ферменты 22 и 22а, с указанными открытыми рамками считывания, имеющими последовательности, как изображено в SEQ ID NO:37 и SEQ ID NO:35 соответственно. Другой такой геномный клон содержит три открытые рамки считывания, которые обозначены как ферменты 27, 27а и 27b. Субклоны получают из геномных клонов, и они могут содержать только одну открытую рамку считывания. Геномные клоны выращивают в течение ночи на средах ТВ, содержащих антибиотик, клетки лизируют, и лизаты осветляют посредством центрифугирования. Субклоны выращивают до OD600=0,5, индуцируя соответствующим индуктором, а затем выращивают дополнительные 3 ч перед лизированием клеток и осветлением лизата. Геномные клоны будут, как правило, иметь меньшую активность, чем субклон, но представляют собой более удобный способ оценки активности в большом диапазоне клонов. Начальные исследования осуществляют с использованием тонкослойной хроматографии (ТСХ) для конечных реакций, осуществляемых обычно в течение 24 ч. Ферменты также исследуют на набухшей в фосфорной кислоте целлюлозе (PASC), которая представляет собой кристаллическую целлюлозу, которую сделали более аморфной посредством набухания в результате обработки кислотой.

Ряд целлюлаз, которые клонируют из библиотек из окружающей среды, являются активными против PASC, но высвобождают целлобиозу, а также целлотриозу и/или глюкозу. Геномные клоны от попытки обнаружения с помощью GIGAMATRIX ™ исследуют также по отношению к PASC и на целлюлозных субстратах, таких как целлогексаоза (Seikagaku, Japan). Эксперименты по тонкослойной хроматографии (ТСХ) показали, что несколько геномных клонов способны гидролизовать целлогексаозу, как иллюстрируется на фиг. 6 и 7. Из этих клонов, многие способны генерировать глюкозу в качестве конечного продукта, что согласуется с тем фактом, что они имеют идентичность последовательности с семейством 1 гликозилгидролазы, которая включает бета-глюкозидазы. Несколько ферментов производят целлобиозу и/или большие фрагменты, но точная природа паттерна продукта не может быть получена из экспериментов ТСХ, так что разработан способ капиллярного электрофореза (СЕ).

Пример 2. Капиллярный электрофорез.

В некоторых аспектах капиллярный электрофорез (СЕ) используется в анализах для скрининга активности ферментов, например СЕ используется в способах определения того, имеет ли полипептид активность целлюлазы и находится ли он в рамках настоящего изобретения, или для идентификации и выделения полипептида, имеющего активность целлюлазы. Капиллярный электрофорез (СЕ) дает преимущества более быстрых опытов и большей чувствительности анализа. Способ СЕ использует 1-аминопирен-3,6,8-трисульфонат (APTS) в качестве флюорофора и оптимизируется для использования с сахарами и олигомерами сахаров (Guttman (1996). High-resolution capillary gel electrophoresis of reducing oligosaccharides labeled with 1-aminopyrene-3,6,8-trisulfonate. Anal. Biochem 233:234-242). Ферменты, которые, как показано, являются активными по отношению к целлогексаозе, подвергаются исследованиям на набухшей в фосфорной кислоте целлюлозе, а также целлогексаозе. Гены субклонируются, экспрессируются и частично очищаются с использованием колонки с хелатами никеля. Ферменты инкубируют с субстратом в течение 1 ч, и продукты анализируют с использованием 10-см или 48-см капилляра. Целлогексаоза элюируется на 2 и 9 мин, для 10- и 48-см капилляров соответственно. 48-см капилляр дает лучшее разделение продуктов в случае, когда имеются малые количества сахара или имеются примеси в смеси. Способ СЕ осуществляется для исследования ферментов, полученных с помощью GIGAMATRIX ™, которые показали хорошую активность на целлогексаозе при детекции с помощью ТСХ.

Фермент 22/22а (см. табл. 1 выше) показывает хорошие рабочие характеристики на PASC (данные приводятся в форме графика на фиг. 8), высвобождая в основном целлобиозу. В дополнение к этому фермент 22/22а способен высвобождать целлобиозу из AVICEL ® Macrocrystalline Cellulose (MCC) (FMC Corporation, Philadelphia, PA) (данные приводятся в форме графика на фиг. 9).

Анализ последовательностей показывает, что фермент 22 и фермент 21 являются идентичными на ~92% и принадлежат к семейству 5 гликозилгидролазы. Семейство 5 содержит в основном эндоглюканазы, но имеются примеры целлобиогидролаз. CelO из Clostridium thermocellum характеризуется как целлобиогидролаза на основе активности по высвобождению только лишь целлобиозы из аморфной и кристаллической целлюлозы (Zverlov (2002), A newly described cellulososomal cellobiohydrolase, CelO, from Clostridium thermocellum: investigation of the exo-mode of hygrolysis, and binding capacity to crystalline cellulose. Microbiology 148:247-255).

Все три этих фермента, по сравнению с эндоглюканазой из Acidothermus cellulolyticus, имеют инсерцию, которая находится в тесной близости к сайту связывания субстрата. Эта инсерция могла бы образовывать петлю, внутри которой находится сайт связывания субстрата, преобразуя, таким образом этот фермент из эндоглюканазы в целлобиогидролазу. Когда эти ферменты исследуют на целлогексаозе, они дают в основном целлобиозу, с меньшим количеством целлотриозы. Эти результаты объясняются тем фактом, что целлобиогидролазы имеют способность к продуцированию как целлобиозы, так и целлотриозы из субстрата целлогексаозы (Harjunpaa (1996), Cello-oligosaccharide hydrolysis by cellobiohydrolase II from Trichoderma reesei. Association and rate constants derived from an analysis of progress curves. Bur. J. Biochem 240:584-591).

Пример 3. Данные на основе последовательностей.

Настоящее изобретение относится к способам идентификации и выделения целлюлаз, например целлобиогидролаз, с использованием последовательностей по настоящему изобретению. В одном из примерных способов, праймеры, которые являются гомологичными к консервативным областям трех семейств гликозилгидролазы, которые содержат целлобиогидролазы, используются для скрининга либо библиотек полинуклеотидов, либо ДНК, полученных из образцов грибков. Праймеры конструируются по отношению к 48 консервативным областям семейства, и осуществляется скрининг 96 библиотек, приводящий к получению 1 подтвержденного совпадения. В дополнение к этому конструируют праймеры по отношению к семейству 6 и семейству 7. С помощью этих праймеров осуществляют скрининг библиотек грибков, который дает 1 совпадение для семейства 6 и 56 совпадений для семейства 7. Одно совпадение из семейства 7 выбирают для исследований, для извлечения полноразмерной последовательности. Полноразмерную последовательность успешно получают, и она демонстрирует 73% идентичность с экзоцеллобиогидролазой I Penicillium janthinellum.

Пример 4. Генная инженерия фермента с активностью целлобиогидролазы.

Этот пример описывает генную инженерию примерного фермента по настоящему изобретению. Этот фермент может использоваться при преобразовании биологической массы в топлива и химикалии, и для получения эффективных и стабильных альтернатив для продуктов на основе нефти. Этот фермент может экспрессироваться в организмах (например, микроорганизмах, таких как бактерии) в течение их участия в химических циклах, включающих преобразование природной биологической массы. В одном из аспектов этот фермент используется в "ансамблях ферментов" для эффективной деполимеризации целлюлозных и гемицеллюлозных полимеров до метаболизируемых углеродных остатков. Как обсуждается выше, настоящее изобретение относится к способам обнаружения и использования наиболее эффективных ферментов, чтобы сделать возможными эти важные новые промышленные процессы "преобразования биологической массы" и альтернативного получения энергии.

Используются метагеномные данные и нестохастический способ направленной эволюции (называемый "DIRECTEVOLUTION ®, как описано, например, в патенте США № 6939689, который включает методики насыщающего мутагенеза генных сайтов (GSSM) (как обсуждается выше, см. также патенты США № 6171820 и 6579258) и Tunable GeneReassembly (TGR - настраиваемой перестановки генов) (см., например, патент США № 6537776). Это попытка сосредотачивается на обнаружении и оптимизации важного компонента фермента для восстановления целлюлозы до глюкозы, целлобиогидролазы.

Скрининг для обнаружения фермента осуществляют с использованием высокопроизводительной платформы для скрининга экспрессии GIGAMATRIX ™, Diversa Corporation (обсуждается выше), для идентификации целлобиогидролаз с использованием метилумбеллиферилцеллобиозида в качестве субстрата. В целом 100 комплексных библиотек из окружающей среды подвергаются скринингу, приводящему к 25 подтвержденным совпадениям целлобиогидролазы, в основном из семейств 5 и 10 гликозилгидролазы. Эти совпадения характеризуются на активность по отношению к AVICEL ® Microcrystalline Cellulose (MCC) (FMC Corporation, Philadelphia, PA). На основе его рабочих характеристик, один из ферментов, SEQ ID NO:162 (кодируемый, например, SEQ ID NO:161), выбирается в качестве кандидата для оптимизации с использованием методики насыщающего мутагенеза генных сайтов (GSSM). Однако, до осуществления эволюции GSSM, сигнальная последовательность (аминокислоты от 1 до 30) удаляется из SEQ ID NO:162, и добавляется начальный метионин. Эта не содержащая сигнала последовательность, называемая далее "дикого типа" и представленная посредством SEQ ID NO:164 (кодируемая, например, SEQ ID NO:163), представляет собой родительскую последовательность, которая оптимизируется с использованием методики GSSM. Как обсуждается выше, методика GSSM может быстро осуществлять мутации всех аминокислот в белке с их заменой на 19 других аминокислот последовательным образом. Мутанты подвергаются скринингу с использованием анализа на основе волокон, и идентифицируются потенциальные положительные мутанты, представляющие изменения одной аминокислоты. Эти положительные мутанты объединяются в новую библиотеку, представляющую собой сочетания положительных мутантов. Осуществляют скрининг этой библиотеки, приводящей к идентификации нескольких ферментов как кандидатов для коммерциализации.

Итоги исследований.

Скрининг с помощью GIGAMATRIX ™.

Платформа для скрининга GIGAMATRIX ™ (GMx) представляет собой сверхвысокопроизводительный способ на основе 100000-луночного микропланшета с размерами обычного 96-луночного планшета (см. заявку фазы II относительно деталей). Скрининг работает с флуоресцентными субстратами. Скрининг с помощью GMx осуществляется с использованием 2 субстратов на основе предварительно показанной активности целлюлаз.

Метилумбеллиферилцеллобиозид (MUC) используют в качестве субстрата для скрининга. В дополнение к этому резофурин-бета-глюкопиранозид также включается в скрининг для устранения клонов, которые имеют активность на обоих субстратах и предположительно представляющих собой бета-глюкозидазы.

Осуществляется скрининг амплифицированных фаговых или фагемидных версий целевых библиотек. Два штамма-хозяина (СЕН6 и GAL631), где нет генов бета-галоктозидазы, используют для уменьшения эндогенной активности хозяина на субстратах. 100 библиотек выбирается для скрининга на основе того факта, что эти библиотеки дают совпадения для целлюлазы из предыдущей программы скрининга. Из подвергнутых скринингу библиотек, имеется в целом 355 первичных совпадений из 69 библиотек, подвергнутых скринингу.

Вторичный скрининг состоит из нанесения клонов на пластины агара, а затем отбора колоний в 384-луночных планшетах, содержащих среды и метилумбеллиферилцеллобиозид (MUC), называемого "разрушение". Фиг. 10 иллюстрирует в форме графика данные, показывающие типичное разрушение с помощью GIGAMATRIX ™ (GMx). Для генерирования этих данных клоны, активные против MUC (т.е. способные гидролизовать метилумбеллиферилцеллобиозид), дифференцируются от фона неактивных клонов. Индивидуальные клоны затем выращиваются в течение ночи, измеряется флуоресценция и наиболее активные совпадения выбираются для секвенирования. На фиг. 10 ось X показывает наименование образца; ось Y представляет собой относительные единицы флуоресценции. Положительные "совпадения" наносятся на пластины агара, а затем производят отбор колоний в 384-луночных планшетах, содержащих LB + антибиотик плюс 50 мкМ MUC, и выращивают в течение ночи.

Таблица 2Сводка совпадений GIGAMATRIX ™ (GMx)

Все вставки геномных клонов от совпадений секвенируют. Как и в табл. 1 выше, некоторые геномные клоны содержат более одной открытой рамки считывания. Например, один такой геномный клон содержит две открытые рамки считывания, обозначенных как ферменты № Н8 и Н8а, при этом указанные открытые рамки считывания имеют последовательности, как отображается в SEQ ID NO:67 и SEQ ID NO:69 соответственно. В целом имеется 25 совпадений гликозилгидролазы от 17 библиотек, подвергнутых скринингу. Как правило, совпадения происходят из нескольких различных семейств гликозилгидролазы, включая 5 и 10. Табл. 2 (выше) перечисляет совпадения и их идентификации. Обнаружено, несколько других совпадений, где открытая рамка считывания не является гомологичной каким-либо известным семействам гликозилгидролазы. В дополнение к этому некоторых из совпадений, кодирующих гены GTP циклогидролазы, известны как фальшивые положительные результаты в этой системе, поскольку они создают флуоресценцию независимо от деградации субстрата. В целом скрининг является успешным при идентификации ферментов, которые являются активными на MUC.

Характеризация.

Гены, обнаруженные при скрининге с помощью GIGAMATRIX ™, секвенируются и данные анализируются. Открытые рамки считывания (ORF) обозначаются с использованием системы программного обеспечения. ORF субклонируются в соответствующий вектор (векторы) с помощью введения ДНК, кодирующей His-тагов С-окончания. Конструкт ДНК трансформируется в соответствующем хозяине (хозяевах) E.coli и экспрессируется для исследований по характеризации. Осуществляется скрининг генных продуктов по отношению к целлюлозе, набухшей в фосфорной кислоте (PASC). PASC представляет собой кристаллическую целлюлозу, которая делается более аморфной при набухании при обработке кислотой. PASC получают из AVICEL ® Macrocrystalline Cellulose (MCC). Субклоны выращивают, экспрессируют и лизируют. Лизаты инкубируют вместе с PASC, и продукты реакции анализируют с использованием анализа восстанавливающего сахара с помощью бицинхонининовой кислоты (ВСА). Наиболее активные субклоны выбираются для более масштабного роста и очистки. Удельная активность этих субклонов определяется на PASC.

Субклоны также анализируются с помощью капиллярного электрофореза (СЕ). Лизаты инкубируют вместе с субстратом в течение 30 ч. Продукты реакции дериватизируют с помощью флюорофора 1-аминопирен-3,6,8-трисульфоната (APTS). Продукты анализируют с использованием 48-см капилляра. Целлобиоза элюируется на 6 мин. Фиг. 11 иллюстрирует в форме графика данные, показывающие активность выбранных ферментов по отношению к PASC, с помощью анализа посредством капиллярного электрофореза (СЕ). Образцы Н9-Н1 представляют собой индивидуальные клоны. На фиг. 11 ряд образцов имеет профили продуктов реакции, репрезентативные для работающих ферментов. Работающий фермент определяется как имеющий отношение целлобиоза/(глюкоза + целлотриоза), равное 10. Два потенциальных рабочих фермента, которые являются наиболее активными, имеют удельные активности на PASC 0,35 и 0,04 ед./мг соответственно.

СВН грибков в Pichia.

Гены вновь обнаруженных целлобиогидролаз грибков семейств 6 и 7 трансформируются в P. Pastoris, и трансформации распределяют на пластинах твердого агара. Выбирают 160 колоний для каждого конструкта. Образцы выращивают и индуцируют, и супернатанты инкубируют вместе с PASC в присутствии β-глюкозидазы. Продукты реакции анализируют с использованием глюкоза-оксидазного анализа. Целлобиогидролаза семейства 6 гликозилгидролазы успешно экспрессируется гетерологично в Р. pastoris.

Экзо/эндодействующая целлюлаза.

Фермент дикого типа, гликозилгидролаза семейства 9, обнаруженный при скрининге ферментов, который представляет собой гомолог Thermomonospora fusca Е4. Е4, как показано, имеет как эндо-, так и экзоактивность. Начальные исследования фермента дикого типа показали, что он является активным как на PASC, так и на AVTCEL ® Microcrystalline Cellulose (MCC). ВЭЖХ анализ продуктов реакций показал, что первичные продукты представляют собой глюкозу и целлобиозу. Фермент дикого типа представляет собой мультидоменный белок, который содержит каталитический домен гликозилгидролазы семейства 9, домен связывания целлюлозы семейства 3 и три бактериальных Ig-подобных домена, которые, как предполагается, вовлечены в клеточную адгезию. Три дополнительных варианта субклонов фермента дикого типа исследуются для определения влияния доменов на активность. Фермент дикого типа субклонируется: 1) с одним только каталитическим доменом (CD); 2) с каталитическим и углеводным доменом (CCD) и 3) с каталитическим доменом и доменом связывания углеводов плюс 11 последующих аминокислот (CCD+11). Полноразмерный белок и 3 варианта субклонов анализируются на AVICEL ® Microcrystalline Cellulose (MCC), и продукты реакции анализируются посредством анализа восстанавливающего сахара с помощью ВСА, и сводка данных приводится в форме графика на фиг. 12. Данные, иллюстрируемые на фиг. 12, генерируются посредством ВСА для фермента дикого типа и процессированных мутантов, инкубируемых вместе с AVICEL ® Microcrystalline Cellulose (MCC) в течение 74 ч, при 37 °С, рН 5. СВН1 представляет собой положительный контроль. Отрицательный контроль представляет собой хозяин без вставки.

Фермент дикого типа, полноразмерный белок (SEQ ID NO:164, кодируемый, например, SEQ ID NO:163), является наиболее активным. Полноразмерный белок выбирается для эволюции с помощью GSSM. Каталитический домен и домен связывания углеводов включаются.

Скрининг с помощью GSSM.

Методика GSSM (обсуждаемая выше) используется для быстрого и последовательного введения мутаций аминокислот каталитического домена и домена связывания углеводов целевого белка в виде 19 других аминокислот. Целью скрининга GSSM является идентификация мутантов, которые увеличивают степень гидролиза нерастворимой микрокристаллической целлюлозы. Роботизированный способ скрининга разработан для облегчения процесса скрининга GSSM.

ДНК из конструктов мутации трансформируется в клетках-хозяевах DH10b. Индивидуальные колонии отбираются в 96-луночные (мелкие) планшеты, содержащие 150 мкл LB/амфициллина, с использованием автоматической системы отбора колоний. Планшеты инкубируют в течение 24 ч, при 37 °С, 400 об/мин. 15 мкл культуры переносят из каждой лунки на индукционный планшет. Каждая лунка индукционного планшета содержит 135 мкл LB/амфициллина с 1,1 мМ IPTG. Индукционные планшеты инкубируются в течение 24 ч при 37 °С, 400 об/мин. Планшеты центрифугируют и супернатант удаляют.

В этот момент начинается автоматизированная часть анализа. Клетки лизируются и повторно суспендируются с помощью робота. По 150 мкл лизисного буфера (125 мкл воды плюс 25 мкл BPER, содержащего 0,2 мг/мл лизоцима и 20 ед./мл ДНКазы I) добавляют в каждую лунку. По 15 мкл лизата переносят из каждой лунки в реакционный планшет. Каждая лунка реакционного планшета содержит 185 мкл реакционной смеси (1% AVICEL ® Microcrystalline Cellulose (MCC), 50 мМ натрий-ацетатного буфера, рН 5,0). Реакционные планшеты инкубируют при 37 °С в течение 30 ч при 95% влажности. После инкубирования планшеты центрифугируют и 15 мкл супернатанта переносят в планшеты с ВСА. Планшеты с ВСА содержат 50 мкл реагента А, 50 мкл реагента В, и 80 мкл 400 мМ карбонатного буфера, рН 10, на лунку. Планшеты покрывают резиновым уплотнением и инкубируют при 80 °С в течение 30 мин, затем охлаждают посредством центрифугирования и регистрируют коэффициент поглощения на А560.

Результаты.

По меньшей мере 80 колоний со случайными мутациями подвергаются скринингу на каждый сайт аминокислоты. Пример данных первичного скрининга GSSM ™ иллюстрируется графически на фиг. 13. Столбец 6 содержит образцы дикого типа, и столбец 12 содержит отрицательные контроли хозяин/вектор. После 30-часового инкубирования вместе с AVICEL ® Microcrystalline Cellulose (MCC) сигнал, производимый образцами дикого типа, составляет примерно 0,53 со стандартным отклонением 0,07. Отрицательный контроль имеет средний сигнал 0,29. Образцы с сигналом более высоким, чем среднее у положительных контролей, плюс 2 стандартных отклонения, считаются первичными совпадениями. От скрининга этого планшета выбираются примерно десять первичных совпадений для вторичного скрининга с целью подтверждения.

Первичные совпадения повторно подтверждаются при вторичном анализе. Этот анализ является таким же, как первичный скрининг. Однако опыты осуществляют с четырьмя экземплярами каждого образца. Пример данных вторичного скрининга GSSM иллюстрируется в виде графика на фиг. 14. Образцы в лунках Е3-Н3, A4-D4, А7-D7, в среднем, имеют более высокую активность, чем дикий тип. Эти 12 лунок соответствуют 3 совпадениям, поскольку образцы анализируются по четыре экземпляра. Эти образцы представляют собой первичные совпадения, показанные в лунках Е4, G2, и Н3 на фиг. 13 (планшет 29805-АА89 планшет с ВСА).

Имеются 77 совпадений от вторичного скрининга. Эти образцы секвенируют. Тридцать пять образцов имеют изменения аминокислот, 22 имеют инсерции транспозонов, а остальные представляют собой дикий тип или имеют делеции.

Совпадения от вторичного скрининга анализируются дополнительно. Положительные мутанты от GSSM картируются на кристаллической структуре Т. fusca E4. Образцам присваивается приоритет на основе положения аминокислот, изменения аминокислот и оценки кратности улучшения. Восемь положительных мутантов выбирают от GSSM скрининга и выбирают для эволюции с помощью перестановки генов, т.е. Tunable GeneReassembly (TGR), обсуждаемой выше, и также см., например, патент США № 6537776.

Таблица 4Положительные мутанты, выбранные для перестановки посредством сайт-направленного мутагенеза

Смешивание положительных мутантов.

С использованием методики перестановки генов (Tunable GeneReassembly (TGR)) положительные мутанты, показанные в табл. 4 выше, смешиваются для идентификации кандидата с наилучшей активностью. Анализы активности являются такими же, как при GSSM скрининге, за исключением того, что реакционные смеси дополнительно разбавляются, принимая во внимание повышенную активность положительных мутантов, по сравнению с ферментом дикого типа. Фиг. 15 иллюстрирует в форме графика данные анализов смешанного или "перемешанного" скрининга GSSM ™.

В итоге, настоящее изобретение предусматривает ферменты, имеющие активность целлюлазы, имеющие следующие последовательности на основе SEQ ID NO:164 (кодируется, например, SEQ ID NO:163):

Описан ряд аспектов настоящего изобретения. Тем не менее, будет понятно, что различные модификации могут быть проделаны без отклонения от духа и рамок настоящего изобретения. Соответственно, другие аспекты находятся в рамках следующей далее формулы изобретения.