EA201890355A1 20180831 Номер и дата охранного документа [PDF] EAPO2018\PDF/201890355 Полный текст описания [**] EA201890355 20160725 Регистрационный номер и дата заявки GB1513176.6 20150727 Регистрационные номера и даты приоритетных заявок EP2016/067622 Номер международной заявки (PCT) WO2017/017050 20170202 Номер публикации международной заявки (PCT) EAA1 Код вида документа [PDF] eaa21808 Номер бюллетеня [**] НОВЫЕ СПОСОБЫ ИНДУКЦИИ ИММУННОГО ОТВЕТА Название документа [8] A61K 39/04, [8] C12N 7/00, [8] C12N 15/861, [8] C07K 14/075 Индексы МПК [BE] Демуатье Мари-Анж, [BE] Доннер Мари-Ноэль, [BE] Уакед Надиа Сведения об авторах [BE] ГЛАКСОСМИТКЛАЙН БАЙОЛОДЖИКАЛС С.А. Сведения о заявителях
 

Патентная документация ЕАПВ

 
Запрос:  ea201890355a*\id

больше ...

Термины запроса в документе

Реферат

[RU]

Изобретение относится к способам индукции иммунного ответа, в частности к способам индукции иммунного ответа против микобактериальных инфекций или заболеваний, включающим (1) по меньшей мере одно введение полипептидного Rv1196-родственного антигена и по меньшей мере одно введение аденовируса, кодирующего Rv1196-родственный антиген, или (2) по меньшей мере одно введение полипептидного Rv0125-родственного антигена и по меньшей мере одно введение аденовируса, кодирующего Rv0125-родственный антиген. Также предложены связанные с ними композиции, аденовирусные конструкции и полинуклеотидные последовательности.


Полный текст патента

(57) Реферат / Формула:

Изобретение относится к способам индукции иммунного ответа, в частности к способам индукции иммунного ответа против микобактериальных инфекций или заболеваний, включающим (1) по меньшей мере одно введение полипептидного Rv1196-родственного антигена и по меньшей мере одно введение аденовируса, кодирующего Rv1196-родственный антиген, или (2) по меньшей мере одно введение полипептидного Rv0125-родственного антигена и по меньшей мере одно введение аденовируса, кодирующего Rv0125-родственный антиген. Также предложены связанные с ними композиции, аденовирусные конструкции и полинуклеотидные последовательности.


Евразийское (21) 201890355 (13) A1
патентное
ведомство
(12) ОПИСАНИЕ ИЗОБРЕТЕНИЯ К ЕВРАЗИЙСКОЙ ЗАЯВКЕ
(43) Дата публикации заявки 2018.08.31
(22) Дата подачи заявки 2016.07.25
(51) Int. Cl.
A61K39/04 (2006.01) C12N 7/00 (2006.01) C12N15/861 (2006.01) C07K14/075 (2006.01)
(54) НОВЫЕ СПОСОБЫ ИНДУКЦИИ ИММУННОГО ОТВЕТА
(31) 1513176.6
(32) 2015.07.27
(33) GB
(86) PCT/EP2016/067622
(87) WO 2017/017050 2017.02.02
(71) Заявитель: ГЛАКСОСМИТКЛАЙН БАЙОЛОДЖИКАЛС С.А. (BE)
(72) Изобретатель:
Демуатье Мари-Анж, Доннер Мари-Ноэль, Уакед Надиа (BE)
(74) Представитель:
Поликарпов А.В., Соколова М.В., Путинцев А.И., Черкас Д.А., Игнатьев А.В. (RU)
(57) Изобретение относится к способам индукции иммунного ответа, в частности к способам индукции иммунного ответа против микобактериаль-ных инфекций или заболеваний, включающим (1) по меньшей мере одно введение полипептидного Яу1196-родственного антигена и по меньшей мере одно введение аденовируса, кодирующего Rv1196-родственный антиген, или (2) по меньшей мере одно введение полипептидного Rv0125-родственно-го антигена и по меньшей мере одно введение аденовируса, кодирующего Rv0125-родственный антиген. Также предложены связанные с ними композиции, аденовирусные конструкции и полинук-леотидные последовательности.
РСТ/ЕР2016/067622 МПК: А61К39/04 (2006.01)
C12N 7/00 (2006.01) C12N 15/861(2006.01) С07К 14/075(2006.01)
НОВЫЕ СПОСОБЫ ИНДУКЦИИ ИММУННОГО ОТВЕТА
Область изобретения
Настоящее изобретение относится к способам индукции иммунного ответа, в частности к способам индукции иммунного ответа против микобактериальных инфекций или заболеваний, включающим (1) по меньшей мере одно введение полипептидного Rvl 196-родственного антигена и по меньшей мере одно введение аденовируса, кодирующего Rvl 196-родственный антиген или (2) по меньшей мере одно введение полипептидного Яу0125-родственного антигена и по меньшей мере одно введение аденовируса, кодирующего КлЮ125-родственный антиген. Также предложены связанные с ними композиции, аденовирусные конструкции и полинуклеотидные последовательности.
Предшествующий уровень техники
Вакцинация является одним из наиболее эффективных способов профилактики инфекционных заболеваний. Однако одного введения антигена часто недостаточно для получения оптимального иммунитета и/или долговременного ответа. Подходы к установлению сильного и долговременного иммунитета к специфическим патогенам включают добавление адъювантов к вакцинам и/или повторную вакцинацию, то есть усиление иммунного ответа путем введения одной или более дополнительных доз антигена. Такие дополнительные введения могут быть выполнены с использованием той же самой вакцины (гомологичная бустер-иммунизация) или другой вакцины (гетерологичная бустер-иммунизация).
Туберкулез (ТВ) является хроническим инфекционным заболеванием, вызванным инфицированием Mycobacterium tuberculosis и другими видами Mycobacterium. Он является основным заболеванием в развивающихся странах, а также усиливающейся проблемой в развитых регионах мира.
Mtb72f и М72 представляют собой слитые белковые антигены, происходящие от белков Mycobacterium tuberculosis Rvl 196 и Rv0125. Mtb72f и M72 (описанные например, в международных патентных заявках WO2006/117240, WO2012/080369 и WO2012/080370, которые включены в данный документ посредством ссылки), или их фрагменты, или их производные представляют собой белковые антигены, потенциально полезные для лечения или предупреждения туберкулеза.
Доклинические и клинические исследования привели к введению людям М72 в сочетании с иммуностимуляторами-З-О-деацилированным монофосфориллипидом A (3D-MPL) и QS21-B липосомальной композиции и со схемой приема на 0,1 месяц с использованием 10 мкг полипептида М72, 25 мкг 3D-MPL и 25 мкг QS21 (Leroux-Roels et al Vaccine 2013 31 2196-2206, Montoya et al J. Clin. Immunol. 2013 33(8): 1360-1375; Thacher EG et al AIDS 2014 28(12): 1769-1781; Idoko ОТ et al Tuberculosis (Edinb) 2014 94(6):564-578; Penn-Nicholson A, et al Vaccine 2015 33(32):4025-4034 doi: 10.1016/j.vaccine.2015.05.088). Вакцина-кандидат, использующая антиген M72, в настоящее время находится на фазе ПВ клинического исследования (ClinicalTrials.gov Identifier: NCT01755598) для оценки защитной эффективности двух доз адъювантированного белка против легочного ТВ в сравнении с плацебо у взрослых в возрасте 18-50 лет, живущих в ТВ-эндемичных странах.
В WO2008107370A1 (включенном в данный документ посредством ссылки) описано совместное введение полипептидного антигена и аденовируса, кодирующего полипептидный антиген.
В WO2010023260 (включенном в данный документ посредством ссылки) описано совместное введение полипептидного антигена и вирусного вектора, кодирующего полипептидный антиген.
Остается необходимость в новых способах иммунизации против заболеваний, в том числе туберкулеза, которые являются высокоэффективными, безопасными, удобными, рентабельными, длительно действующими и вызывают широкий спектр иммунных ответов.
Краткое изложение сущности изобретения
Теперь было неожиданно обнаружено, что первичная вакцинация полипептидным Rvl 196Л^лЮ125-родственным антигеном и бустер-иммунизация аденовирусом нечеловекообразных обезьян, кодирующим Rvl 196Л^лЮ125-родственный антиген, или первичная вакцинация аденовирусом нечеловекообразных обезьян, кодирующим Rvl 196Л^лЮ125-родственный антиген, и бустер-иммунизация полипептидным Rvl 196Л^лЮ125-родственным антигеном может обеспечить иммунные ответы, которые существенно улучшены по сравнению с другими возможными подходами.
Соответственно, в первом аспекте изобретения предложен способ индукции иммунного ответа у субъекта, включающий введение полипептидного Rvl 196-родственного антигена субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген.
Во втором аспекте изобретения предложен способ индукции иммунного ответа у субъекта, включающий введение аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, с последующим введением субъекту полипептидного Rvl 196-родственного антигена.
Подходящим образом полипептидный Rvl 196-родственный антиген представлен в композиции, которая также содержит адъювант. Возможно, что адъювант содержит агонист TLR (Toll-подобного рецептора) и/или иммунологически активный сапонин. Подходящим агонистом TLR является агонист TLR4.
Подходящим образом полипептидный Rvl 196-родственный антиген представлен в композиции, которая не содержит аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген.
Подходящим образом аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, представлен в композиции, которая не содержит полипептидный Rvl 196-родственный антиген.
В третьем аспекте изобретения предложен способ индукции иммунного ответа у субъекта, включающий введение полипептидного RvO 125 -родственного антигена субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbrii антиген.
В четвертом аспекте изобретения предложен способ индукции иммунного ответа у субъекта, включающий введение аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbffl антиген, с последующим введением субъекту полипептидного Rv0125-poflCTBeHHoro антигена.
Подходящим образом полипептидный Rv0125-poflCTBeHHbrii антиген представлен в композиции, которая также содержит адъювант. В некоторых случаях адъювант содержит агонист TLR и/или иммунологически активный сапонин. Подходящим агонистом TLR является агонист TLR4.
Подходящим образом полипептидный Rv0125-poflCTBeHHbrii антиген представлен в композиции, которая не содержит аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbffl антиген.
Подходящим образом аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbffl антиген, представлен в композиции, которая не содержит полипептидный Rv0125-poflCTBeHHbrii антиген.
Краткое описание графических материалов
Фиг. 1: Медианный процент М72-специфического CD4 Т-клеточного ответа у
мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа (фактор некроза опухоли-альфа) цитокины, на 7, 14 и 21 сутки после иммунизации с использованием ChAd3 в диапазоне доз.
Фиг. 2: Медианный процент М72-специфического CD4 Т-клеточного ответа у мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины, на 7, 14 и 21 сутки после иммунизации с использованием ChAd63 в диапазоне доз.
Фиг. 3: Медианный процент М72-специфического CD8 Т-клеточного ответа у мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины, на 7, 14 и 21 сутки после иммунизации с использованием ChAd3 в диапазоне доз.
Фиг. 4: Медианный процент М72-специфического CD8 Т-клеточного ответа у мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины, на 7, 14 и 21 сутки после иммунизации с использованием ChAd63 в диапазоне доз.
Фиг. 5: Процент М72-специфического CD4 Т-клеточного ответа от цельной крови мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины в 14 PI и 14PII с использованием стратегий гетерологичной (ChAd/Prot и Prot/ChAd) прайм-бустерной вакцинации.
Фиг. 6: Процент М72-специфического CD4 Т-клеточного ответа от цельной крови мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины, в 14 PI и 14PII с использованием стратегий гомологичной (ChAd/ChAd) прайм-бустерной вакцинации и в комбинации с M72/AS01E (смесь или совместное введение).
Фиг. 7: Процент М72-специфического CD8 Т-клеточного ответа от цельной крови мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины, в 14 PI и 14PII с использованием стратегии гетерологичной (ChAd/Prot и Prot/ChAd) прайм-бустерной вакцинации.
Фиг. 8: Процент М72-специфического CD8 Т-клеточного ответа от цельной крови мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины, в 14 PI и 14PII с использованием стратегии гомологичной (ChAd/ChAd) и в комбинации с M72/AS01E (смесь или совместное введение) прайм-бустерной вакцинации.
Фиг. 9: Процент М72-специфического CD4 Т-клеточного ответа от легочной ткани мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины в 14PII.
Фиг. 10: Процент М72-специфического CD8 Т-клеточного ответа от легочной ткани мышей CB6F1, экспрессирующих IFN-гамма, и/или IL-2, и/или TNF-альфа цитокины в 14PII.
Фиг. 11: Профиль цитокинов М72-специфического CD4 Т-клеточного ответа в WBLO в 14PI у иммунизированных мышей CB6F1.
Фиг. 12: Таблица, показывающая данные профиля цитокинов М72-специфического CD4 Т-клеточного ответа в WBLO в 14PI у иммунизированных мышей CB6F1.
Фиг. 13: Профиль цитокинов М72-специфического CD4 Т-клеточного ответа в WBLO в 14PII у иммунизированных мышей CB6F1.
Фиг. 14: Таблица, показывающая данные профиля цитокинов М72-специфического CD4 Т-клеточного ответа в WBLO в 14PII у иммунизированных мышей CB6F1.
Фиг. 15: Профиль цитокинов М72-специфического CD4 Т-клеточного ответа в легком в 14PII у иммунизированных мышей CB6F1.
Фиг. 16: Таблица, показывающая данные профиля цитокинов М72-специфического CD4 Т-клеточного ответа в легких в 14PII у иммунизированных мышей CB6F1.
Фиг. 17: Профиль цитокинов М72-специфического CD8 Т-клеточного ответа в WBLO в 14PI у иммунизированных мышей CB6F1.
Фиг. 18: Таблица, показывающая данные профиля цитокинов М72-специфического CD8 Т-клеточного ответа в WBLO в 14PI у иммунизированных мышей CB6F1.
Фиг. 19: Профиль цитокинов М72-специфического CD8 Т-клеточного ответа в WBLO в 14PII у иммунизированных мышей CB6F1.
Фиг. 20: Таблица, показывающая данные профиля цитокинов М72-специфического CD8 Т-клеточного ответа в WBLO в 14PII у иммунизированных мышей CB6F1.
Фиг. 21: Профиль цитокинов М72-специфического CD8 Т-клеточного ответа в легком в 14PII у иммунизированных мышей CB6F1.
Фиг. 22: Таблица, показывающая данные профиля цитокинов М72-специфического CD8 Т-клеточного ответа в легком в 14PII у иммунизированных мышей CB6F1.
Фиг. 23: Анти-М72 Ig tot серология в 13dPII.
Фиг. 24: Схематическое представление компоновки конструкции M72-ChAd3 Фиг. 25:Схематическое представление компоновки конструкции M72-ChAd63
Краткое описание идентификаторов последовательностей
SEQIDNO: 1 последовательность полипептида Rvl 196 Mycobacterium tuberculosis
H37Rv
SEQ ID NO: 2 последовательность полипептида Rvl 196 Mycobacterium tuberculosis
Fll
SEQ Ш NO: 3 последовательность полипептида (зрелая последовательность)
Rv0125 Mycobacterium tuberculosis H37Rv
SEQ Ш NO: 4полипептидная последовательность М72 2-his SEQ Ш NO: 5 полинуклеотид М72 2-his
SEQ Ш NO: 6полипептидная последовательность М72 без his SEQ Ш NO: 7полинуклеотид М72 без his
SEQ Ш NO: 8человеческий оптимизированный полинуклеотид М72 без his SEQ Ш NO: 9полинуклеотид ChAd3
SEQ Ш NO:
полипептидная последовательность пентона ChAd3
SEQ Ш NO:
полипептидная последовательность гексона ChAd3
SEQ Ш NO:
полипептидная последовательность фибриллы ChAd3
SEQ Ш NO:
ДНК конструкции M72-ChAd3
SEQ Ш NO:
полинуклеотид ChAd63
SEQ Ш NO:
полипептидная последовательность пентона ChAd63
SEQ Ш NO:
полипептидная последовательность гексона ChAd63
SEQ Ш NO:
полипептидная последовательность фибриллы ChAd63
SEQ Ш NO:
ДНК конструкции M72-ChAd63
SEQ Ш NO:
полинуклеотид ChAdl55
SEQ Ш NO:
полипептидная последовательность пентона ChAdl55
SEQ Ш NO:
полипептидная последовательность гексона ChAdl55
SEQ Ш NO:
полипептидная последовательность фибриллы ChAdl55
Подробное описание изобретения
Туберкулез (ТВ) представляет собой хроническое инфекционное заболевание, вызванное инфицированием Mycobacterium tuberculosis и другими видами Mycobacterium. Он является основным заболеванием в развивающихся странах, а также усиливающейся проблемой в развитых регионах мира. Считается, что примерно трети населения мира латентно инфицированы ТВ (туберкулезными бациллами) с примерно 9 миллионов новых случаев активного туберкулеза и 1,5 миллионами смертей каждый год. У примерно 10% субъектов, инфицированных ТВ, развивается активный туберкулез, и каждый субъект с туберкулезом заражает в среднем от 10 до 15 других субъектов в год. (World Health Organisation Tuberculosis Facts 2014)
Mycobacterium tuberculosis инфицирует субъектов респираторным путем. Альвеолярные макрофаги поглощают бактерию, но она способна выжить и размножиться путем ингибирования слияния фагосом с кислыми лизосомами. Возникает комплексный иммунный ответ с участием CD4+ и CD8+ Т-клеток, что в конечном итоге приводит к образованию гранулемы. Главным для успеха Mycobacterium tuberculosis как патогена
является то, что выделенная, но не искорененная бактерия может продолжать существование в течение длительных периодов времени, оставляя человека уязвимым к более позднему развитию активного туберкулеза.
У менее чем 5% инфицированных людей развивается активный ТВ в первые годы после инфицирования. Гранулема может сохраняться в течение десятилетий и, как полагают, содержит живые Mycobacterium tuberculosis в состоянии покоя, лишенные кислорода и питательных веществ. Однако было высказано предположение, что большинство бактерий в состоянии покоя расположены в немакрофагальных типах клеток, рассеянных по всему организму (Locht et al, Expert Opin. Biol. Ther. 2007 7(11): 1665-1677). Развитие активного ТВ происходит, когда равновесие между естественным иммунитетом хозяина и патогеном меняется, например в результате иммуносупрессивного события (Anderson Р Trends in Microbiology 2007 15(1):7-13; Ehlers S Infection 2009 37(2):87-95).
Также была предложена динамическая гипотеза, описывающая равновесие между латентным ТВ и активным ТВ (Cardona P-J Inflammation & Allergy - Drug Targets 2006 6:27-39; Cardona P-J Infection 2009 37(2):80-86).
Хотя инфекция может быть бессимптомной в течение значительного периода времени, активное заболевание чаще всего проявляется как острое воспаление легких, приводящее к усталости, потере массы, лихорадке и непрекращающемуся кашлю. Отсутствие лечения обычно приводит к серьезным осложнениям и смерти.
Туберкулез обычно можно контролировать с помощью расширенной антибиотической терапии, хотя такое лечение недостаточно для предупреждения распространения болезни. Активно инфицированные субъекты могут в большинстве случаев не обнаруживать симптомов заболевания в течение некоторого времени, но быть заразными. Кроме того, хотя соблюдение режима лечения (которое обычно длится 6 месяцев или более) является чрезвычайно важным, поведение пациентов трудно контролировать. Некоторые пациенты не завершают курс лечения, что может привести к неэффективному лечению и развитию лекарственной резистентности.
ТВ с множественной лекарственной резистентностью (MDR-TB) является формой, которая не отвечает на лекарственные средства первой линии. По оценкам, в 2013 году у 480000 человек развился MDR-TB. MDR-TB можно лечить, используя лекарственные средства второй линии. Однако возможности лечения второй линии ограничены и рекомендуемые лекарственные средства не всегда доступны. Необходимая экстенсивная химиотерапия (вплоть до двух лет лечения) является дорогостоящей и может вызвать
серьезные побочные реакции у пациентов.
ТВ с экстенсивной лекарственной резистентностью (XDR-TB) возникает, когда резистентность к лекарственным средствам второй линии развивается в дополнение к резистентности к лекарственным средствам первой линии. По оценкам, примерно 9,0% случаев MDR-TB имеют XDR-TB (World Health Organisation Tuberculosis Facts 2014).
Даже если полный курс лечения антибиотиками завершен, инфицирование М. tuberculosis может быть не ликвидировано у инфицированного человека и может оставаться в виде латентной инфекции, которая может повторно активизироваться. Следовательно, точная и ранняя диагностика заболевания имеет первостепенное значение.
В настоящее время вакцинация ослабленными живыми бактериями является наиболее широко используемым способом индуцирования защитного иммунитета. Наиболее распространенным Mycobacterium, используемым для этой цели, является бацилла Кальметта-Герена (БЦЖ), авирулентный штамм М. bovis, который был впервые разработан более 60 лет назад. Его вводят при рождении в эндемичных по туберкулезу регионах. Однако безопасность и эффективность БЦЖ является предметом споров - в то время как она защищает детей от тяжелого проявления заболевания, эффективность БЦЖ против заболевания у взрослых варьируется. Кроме того, некоторые страны, такие как Соединенные Штаты, не вакцинируют основную часть населения этим агентом.
Было показано, что некоторые белки, которые сильно экспрессируются на ранних стадиях инфицирования Mycobacterium, обеспечивают защитную эффективность в моделях вакцинации животных. Однако вакцинация антигенами, которые высоко экспрессируются на ранних стадиях инфекции, не может обеспечить оптимальный иммунный ответ для лечения более поздних стадий инфекции. Для адекватного контроля во время латентной инфекции могут потребоваться Т-клетки, специфичные в отношении конкретных антигенов, которые экспрессируются в это время. Постконтактные вакцины, которые непосредственно нацелены на латентные устойчивые бактерии, могут помочь в защите от реактивации ТВ, тем самым усиливая контроль над ТВ или даже обеспечивая освобождение от инфекции. Следовательно, вакцина, нацеленная на латентный ТВ, может значительно и экономично снизить глобальные показатели заболеваемости туберкулезом.
Субъединичные вакцины, основанные на антигенах поздней стадии, также могут быть использованы в комбинации с антигенами ранней стадии, чтобы обеспечить многофазную вакцину. Альтернативно, антигены ранней и/или поздней стадии могут быть использованы для дополнения и улучшения вакцинации БЦЖ (либо путем усиления БЦЖ-ответа или путем разработки улучшенных рекомбинантных штаммов БЦЖ).
Mtb72f и M72 являются слитыми белковыми антигенами с возможными преимуществами для лечения или предупреждения туберкулеза. Mtb72f и М72 происходят от белков Rvl 196 и Rv0125 Mycobacterium tuberculosis, оба гена присутствуют и в вирулентных, и в невирулентных штаммах комплекса Mycobacterium tuberculosis и в БЦЖ.
Rvl 196 (описанный, например, под названием Mtb39a в Dillon et al Infection and Immunity 1999 67(6): 2941-2950) является высококонсервативным, имеющим 100% идентичность последовательности со штаммами H37Rv, С, Haarlem, CDC1551, 94-М4241А, 98-R604INH-RIF-EM, KZN605, KZN1435, KZN4207, KZNR506, штаммом F11, имеющим одноточечную мутацию Q30K (большинство других клинических изолятов имеют более чем 90% идентичность с H37Rv). Аденовирус, кодирующий Rvl 196-родственный антиген, описан в Lewinsohn et al Am J Respir Crit Care Med 2002 116:843848.
Rv0125 (описанный, например, под названием Mtb32a в Skeiky et al Infection and Immunity 1999 67(8): 3998-4007) является высококонсервативным, имеющим 100% идентичность последовательности со многими штаммами. Аденовирус (человеческий Ad5), кодирующий Rv0125-poflCTBeHHbrii антиген, описан в Zhang et al Human Vaccines & Therapeutics 2015 11(7): 1803-1813 doi: 10.1080/21645515.2015.1042193. Полноразмерный Rv0125 включает N-концевую сигнальную последовательность, которая отщепляется с получением зрелого белка.
Было показано, что Mtb72f обеспечивает защиту в ряде животных моделей (см., например: Brandt et al Infect. Immun. 2004 72(11):6622-6632; Skeiky et al J. Immunol. 2004 172:7618-7628; Tsenova et al Infect. Immun. 2006 74(4):2392-2401). Mtb72f также был предметом клинических исследований (Von Eschen et al 2009 Human Vaccines 5(7):475-482). M72 является улучшенным антигеном, который включает одну мутацию замены серина на аланин по сравнению с Mtb72f, что приводит к улучшенным характеристикам стабильности. Было также показано, что М72-родственные антигены были полезны в модели латентного ТВ (международная патентная заявка WO2006/117240, включенная в данный документ посредством ссылки). Предыдущие доклинические и клинические исследования привели к тому, что М72 вводили людям в сочетании с иммуностимуляторами З-О-деацилированным монофосфориллипидом A (3D-MPL) и QS21 в липосомальной композиции и в схеме приема на 0,1 месяц, где использовали 10 мкг полипептида М72, 25 мкг 3D-MPL и 25 мкг QS21 (см., например, Leroux-Roels et al Vaccine 2013 31 2196-2206, Montoya et al J. Clin. Immunol. 2013 33(8): 1360-1375; Thacher
EG et al AIDS 2014 28(12): 1769-1781; Idoko ОТ et al Tuberculosis (Edinb) 2014 94(6):564-578; Penn-Nicholson A, et al Vaccine 2015 33(32):4025-4034 doi:10.1016/j.vaccine.2015.05.088).
Вакцина-кандидат, использующая антиген M72, в настоящее время находится в фазе ПВ клинических испытаний (ClinicalTrials.gov Identifier: NCT01755598) для оценки защитной эффективности двух доз адъювантированного белка против легочного туберкулеза по сравнению с плацебо у взрослых в возрасте 18-50 лет, живущих в ТВ-эндемичных странах. Тем не менее, остается необходимость в улучшенных подходах к вакцинации.
В первом аспекте изобретения предложен способ индукции иммунного ответа у субъекта, включающий введение полипептидного Rvl 196-родственного антигена субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген.
Во втором аспекте изобретения предложен способ индукции иммунного ответа у субъекта, включающий введение субъекту аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, с последующим введением полипептидного Rvl 196-родственного антигена.
В третьем аспекте изобретения предложен способ индукции иммунного ответа у субъекта, включающий введение субъекту полипептидного RvO 125-родственного антигена с последующим введением иммуногенной композиции, содержащей аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbrii антиген.
В четвертом аспекте изобретения предложен способ индукции иммунного ответа у субъекта, включающий введение субъекту аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbrii антиген, с последующим введением полипептидного Rv0125-poflCTBeHHoro антигена.
При использовании здесь, введение первой композиции "с последующим" введением второй композиции, указывает на то, что прошел некоторый промежуток времени между введением первой композиции и введением второй композиции. Подходящим образом промежуток времени между введениями составляет от одной недели до двух лет, в частности от двух недель до восемнадцати месяцев, обычно от трех недель до пятнадцати месяцев, например от трех недель до шести месяцев, например от трех недель до двух месяцев, особенно от трех недель до шести недель, например примерно четыре недели.
Также предложен полипептидный Rvl 196-родственный антиген для применения в
индукции иммунного ответа у субъекта, где полипептидный Rvl 196-родственный антиген вводят субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген.
Аналогично, предложен аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, для применения в индукции иммунного ответа у субъекта, где полипептидный Rvl 196-родственный антиген вводят субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген.
Кроме того, предложено применение полипептидного Rvl 196-родственного антигена в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где полипептидный Rvl 196-родственный антиген вводят субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген.
Кроме того, предложено применение аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где полипептидный Rvl 196-родственный антиген вводят субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген.
Также предложен полипептидный Rvl 196-родственный антиген для применения в индукции иммунного ответа у субъекта, где аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, вводят субъекту, с последующим введением полипептидного Rvl 196-родственного антигена.
Аналогично, предложен аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, для применения в индукции иммунного ответа у субъекта, где аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, вводят субъекту с последующим введением полипептидного Rvl 196-родственного антигена.
Кроме того, предложено применение полипептидного Rvl 196-родственного антигена в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, вводят субъекту с последующим введением полипептидного Rvl 196-родственного антигена.
Также предложено применение аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, в изготовлении лекарственного средства для
индукции иммунного ответа у субъекта, где аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, вводят субъекту, после чего вводят полипептидный Rvl 196-родственный антиген.
Также представлен полипептидный Rv0125-poflCTBeHHbift антиген для применения в индукции иммунного ответа у субъекта, где полипептидный RvO 125-родственный антиген вводят субъекту и затем вводят аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift антиген.
Аналогично, предложен аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbffl антиген, для применения в индукции иммунного ответа у субъекта, где полипептидный Rv0125-poflCTBeHHbift антиген вводят субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbift антиген.
Кроме того, предложено применение полипептидного Rv0125-poflCTBeHHoro антигена в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где полипептидный Rv0125-poflCTBeHHbift антиген вводят субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbffl антиген.
Кроме того, предложено применение аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbrii антиген, в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где полипептидный RvO 125-родственный антиген вводят субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbrii антиген.
Также предложен полипептидный Rv0125-poflCTBeHHbift антиген для применения в индукции иммунного ответа у субъекта, где субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift антиген, с последующим введением полипептидного Rv0125-poflCTBeHHoro антигена.
Аналогично, предложен аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift антиген, для применения в индукции иммунного ответа у субъекта, где аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbifl антиген, вводят субъекту с последующим введением полипептидного Rv0125-poflCTBeHHoro антигена.
Кроме того, предложено применение полипептидного Rv0125-poflCTBeHHoro антигена в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift
антиген, вводят субъекту с последующим введением полипептидного RvO125-родственного антигена.
Также предлагается применение аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbiM антиген, в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbiM антиген, вводятся субъекту с последующим введением полипептидного Rv0125-poflCTBeHHoro антигена.
Подходящим образом полипептидный Rvl 196-родственный антиген представлен в композиции, которая также содержит адъювант. Возможно, адъювант содержит агонист TLR и/или иммунологически активный сапонин. Подходящим агонистом TLR является агонист TLR4.
Подходящим образом полипептидный RvO 125-родственный антиген представлен в композиции, которая также содержит адъювант. Возможно, адъювант содержит агонист TLR и/или иммунологически активный сапонин. Агонист TLR является подходящим агонистом TLR4.
Подходящим образом полипептидный Rvl 196-родственный антиген представлен в композиции, которая по существу свободна от аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, то есть она не содержит аденовирус нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген. Например, она по существу не содержит или совсем не содержит аденовирус нечеловекообразных обезьян, кодирующего микобактериальный антиген (например, она по существу не содержит или совсем не содержит никакого аденовируса нечеловекообразных обезьян), в частности она по существу не содержит или совсем не содержит никакого аденовируса, кодирующего микобактериальный антиген (например, она по существу не содержит или совсем не содержит аденовирус). В некоторых воплощениях полипептидный Rvl 196-родственный антиген представлен в композиции, которая по существу не содержит или совсем не содержит никакого аденовируса, кодирующего микобактериальный антиген.
Кроме того, полипептидный Rvl 196-родственный антиген соответственно не вводят в течение периода одних суток (например двух, трех или шести суток) от аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, такого как аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген. Например, аденовируса нечеловекообразных обезьян, кодирующего микобактериальный антиген (например любого аденовируса нечеловекообразных обезьян), в частности любого аденовируса, кодирующего микобактериальный антиген
(например любой аденовирус). Полипептидный Rvl 196-родственный антиген соответственно не вводят в течение периода одних суток (например двух, трех или шести суток) от любого аденовируса, кодирующего микобактериальный антиген.
Соответственно, аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, представлен в композиции, которая по существу не содержит или совсем не содержит полипептидный Rvl 196-родственный антиген. Например, она по существу не содержит или совсем не содержит полипептидный микобактериальный антиген (например по существу не содержит или совсем не содержит никаких других антигенов). В некоторых воплощениях аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, представлен в композиции, которая по существу не содержит или совсем не содержит полипептидный микобактериальный антиген.
Кроме того, аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, соответственно не вводят в течение периода одних суток (например двух, трех или шести суток) от полипептидного Rvl 196-родственного антигена. Например, полипептидного микобактериального антигена (например любых других антигенов). Аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, соответственно не вводят в течение периода одних суток (например двух, трех или шести суток) от полипептидного микобактериального антигена.
Подходящим образом полипептидный RvO 125-родственный антиген представлен в композиции, которая по существу не содержит аденовирус нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbift антиген, например не содержит аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbrii антиген. Например, она по существу не содержит или совсем не содержит аденовирус нечеловекообразных обезьян, кодирующий микобактериальный антиген (например, она по существу не содержит или совсем не содержит никакого аденовируса нечеловекообразных обезьян), в частности, она по существу не содержит или совсем не содержит никакого аденовируса, кодирующего микобактериальный антиген (например, она по существу не содержит или совсем не содержит никакого аденовируса). В некоторых воплощениях полипептидный Rv0125-poflCTBeHHbift антиген представлен в композиции, которая по существу не содержит или совсем не содержит никакого аденовируса, кодирующего микобактериальный антиген.
Кроме того, полипептидный Rvl 196-родственный антиген соответственно не вводят в течение периода одних суток (например двух, трех или шести суток) от
аденовируса нечеловекообразных обезьян, кодирующего КлЮ125-родственный антиген, такого как аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген. Например, аденовирус нечеловекообразных обезьян, кодирующий микобактериальный антиген (такой как любой аденовирус нечеловекообразных обезьян), в частности любой аденовирус, кодирующий микобактериальный антиген (такой как любой аденовирус). Полипептидный Rv0125-poflCTBeHHbrii антиген соответственно не вводят в течение одних суток (например двух, трех или шести суток) от любого аденовируса, кодирующего микобактериальный антиген.
Соответственно, аденовирус нечеловекообразных обезьян, кодирующий Rv0125-родственный антиген, представлен в композиции, которая по существу не содержит или совсем не содержит полипептидный Rv0125-poflCTBeHHbift антиген. Например, она по существу не содержит или совсем не содержит полипептидный микобактериальный антиген (например, по существу не содержит или совсем не содержит никаких других антигенов). В некоторых воплощениях аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift антиген, представлен в композиции, которая по существу не содержит или совсем не содержит полипептидный микобактериальный антиген.
Кроме того, аденовирус нечеловекообразных обезьян, кодирующий Rv0125-родственный антиген, соответственно не вводят в течение периода одних суток (например двух, трех или шести суток) от полипептидного Rvl 196-родственного антигена. Например, полипептидного микобактериального антигена (такого как любые другие антигены). Аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbrii антиген, соответственно не вводят в течение периода одних суток (например двух, трех или шести суток) от полипептидного микобактериального антигена.
Подходящим образом, субъектом является млекопитающее, например крупный рогатый скот или человек. В частности, субъектом является человек.
Под термином "по существу не содержащий" в контексте аденовируса обычно
4 3 2
подразумевают содержащий менее 10 , например менее 10 , в частности менее 10 или менее 101 вирусных частиц релевантного типа на дозу. Подходящие способы определения количества вирусных частиц включают количественный ПЦР-анализ, аналитическую ВЭЖХ или спектрофотометрические способы на основе А260 нм.
Под термином "по существу не содержащий" в контексте полипептидного антигена обычно подразумевают содержащий менее 1 мкг, например менее 0,1 мкг, в частности менее 0,01 мкг соответствующего антигена или антигенов на дозу. Подходящие способы
определения количества пептидного антигена известны специалисту в данной области и, в зависимости от композиции, могут объединять способы очистки для облегчения соответствующего способа количественной оценки (такого как аналитическая ВЭЖХ или спектрофотометрические метода).
Как правило, целью способа по изобретению является индукция защитного иммунного ответа, то есть иммунизация или вакцинация субъекта против родственного патогена. Следовательно, изобретение может быть применено для профилактики, лечения или облегчения инфекции, вызванной микобактериями, таких как инфекции, вызванные Mycobacterium bovis или Mycobacterium tuberculosis, в частности Mycobacterium tuberculosis.
Изобретение может быть предложено для:
- профилактики активного туберкулеза, вызванного инфекцией (то есть первичного туберкулеза) или реактивации (то есть вторичного туберкулеза), например путем введения неинфицированному субъекту или, альтернативно, субъекту, имеющему латентную инфекцию;
профилактики латентного туберкулеза, например путем введения неинфицированному субъекту;
- лечения латентного туберкулеза;
- предупреждения или задержки реактивации туберкулеза, особенно задержки реактивации, например на месяцы, годы или на неопределенный период; или
- лечения активного туберкулеза (например снижения необходимости в химиотерапевтическом лечении: например сокращения срока химиотерапевтического лечения, снижения сложности схемы приема или дозировки при химиотерапевтическом лечении; альтернативно, для снижения риска последующего рецидива после химиотерапевтического лечения).
Вызванный иммунный ответ может представлять собой антигенспецифический Т-клеточный ответ (который может быть системным и/или локальным ответом). Системные ответы могут быть обнаружены, например, в образце цельной крови. Локальные ответы (например локальный ответ в легких) могут быть обнаружены в соответствующем образце ткани (например легочной ткани) или другом локально сфокусированном образце (например бронхоальвеолярном лаваже). Специфический антигенспецифический Т-клеточный ответ может включать CD4+ Т-клеточный ответ, такой как ответ, включающий CD4+ Т-клетки, экспрессирующие множество цитокинов (например IFN-гамма, TNF-альфа или JL2, особенно IFN-гамма, TNF-альфа и JL2). Альтернативно или
дополнительно, антигенспецифический Т-клеточный ответ включает CD8+ Т-клеточный ответ, такой как ответ, включающий CD8+ Т-клетки, экспрессирующие множество цитокинов (например IFN-гамма, TNF-альфа или IL2, особенно IFN-гамма, TNF-альфа и JL2).
Термин "активная инфекция" относится к инфекции, например к инфекции, вызванной М. tuberculosis, с обнаруживаемыми симптомами заболевания и/или поражениями, соответственно с обнаруживаемыми симптомами заболевания.
Термины "неактивная инфекция", "скрытая инфекция" или "латентная инфекция", или "латентный туберкулез" относится к инфекции, например к инфекции М. tuberculosis, без обнаруживаемых симптомов заболевания и/или поражений, соответственно, без обнаруживаемых симптомов заболевания. Субъект с латентной инфекцией подходящим образом представляет собой субъекта с положительными тестами на инфекцию, например посредством туберкулиновой кожной пробы (TST) или анализов высвобождения гамма-интерферона (IGRA), но при этом не обнаруживает симптомов заболевания и/или расстройств, которые связаны с активной инфекцией.
Термин "первичный туберкулез" относится к клиническому заболеванию, например к проявлению симптомов заболевания, непосредственно сопутствующих инфекции, например инфекции М. tuberculosis. См., Harrison's Principles of Internal Medicine, Chapter 150, pp. 953-966 (16th ed., Braunwald, et al., eds., 2005).
Термины "вторичный туберкулез" или "постпервичный туберкулез" относится к реактивации скрытой, неактивной или латентной инфекции, например инфекции М. tuberculosis. См., Harrison's Principles of Internal Medicine, Chapter 150, pp. 953-966 (16th ed., Braunwald, etal., eds., 2005).
Термин "реактивация туберкулеза" относится к более позднему проявлению симптомов заболевания у субъекта с положительным тестом на наличие инфекции (например посредством туберкулиновой кожной пробы (TST) и анализов высвобождения гамма-интерферона (IGRA)), но без явных симптомов заболевания. Подходящим образом, субъект не подвергнут повторно инфекции. Положительный диагностический тест указывает на то, что субъект инфицирован, однако у субъекта могли ранее проявляться или не проявляться симптомы активного заболевания, которое было подвергнуто лечению в достаточной степени, чтобы привести туберкулез в неактивное или латентное состояние.
Подходящим образом способ применяют к неинфицированному субъекту или субъекту с латентной инфекцией микобактериями, такими как инфекция Mycobacterium tuberculosis. В одном воплощении способы применяют к субъекту, не имеющему
инфекции Mycobacterium tuberculosis (в контексте людей) или Mycobacterium bovis (в контексте крупного рогатого скота). В другом воплощении способы применяют к субъекту, имеющему латентную инфекцию микобактериями, такими как Mycobacterium tuberculosis (в контексте людей) или Mycobacterium bovis (в контексте крупного рогатого скота).
В некоторых воплощениях субъект ранее был вакцинирован БЦЖ. Подходы настоящего изобретения можно, например, использовать для субъекта через по меньшей мере год после вакцинации БЦЖ, например по через меньшей мере два года после вакцинации БЦЖ, например через по меньшей мере пять лет после вакцинации БЦЖ.
В некоторых воплощениях субъект ранее был инфицирован М. tuberculosis.
Антигены, используемые в изобретении.
Т-клеточные эпитопы представляют собой короткие смежные участки аминокислот, которые распознаются Т-клетками (например CD4+ или CD8+ Т-клетками). Идентификация Т-клеточных эпитопов может быть достигнута с помощью экспериментов по картированию эпитопов, которые известны специалисту в данной области (см., например, Paul, Fundamental Immunology, 3rd ed., 243-247 (1993); Beipbarth et al Bioinformatics 2005 21(Suppl. I):i29-i37). В разных аутбредных популяциях, например у людей, разные типы HLA означают, что конкретные эпитопы могут не распознаваться всеми членами популяции. Исходя из определяющего участия Т-клеточного ответа в туберкулезе, для максимизации уровня распознавания и величины иммунного ответа, иммуногенное производное стандартной последовательности желательно представляет собой такое, которое содержит большую часть (или соответственно все) Т-клеточных эпитопов в интактном виде. Mortier et al ВМС Immunology 2015 16:63 выполнил анализ консервативности последовательности и прогнозирование пептидного связывания человеческих лейкоцитарных антигенов in silico для антигенов вакцины-кандидата против туберкулеза Mtb72f и М72.
Специалисту в данной области очевидно, что отдельные замены, делеции или добавления к белку, которые заменяют, добавляют или удаляют единичную аминокислоту или небольшой процент аминокислот, представляют собой "иммуногенное производное", где изменение(я) приводит(ят) к замещению аминокислоты функционально подобной аминокислотой или к замещению/делеции/добавлению остатков, которые существенно не влияют на иммуногенную функцию.
Таблицы консервативных замещений, представляющих функционально схожие аминокислоты, хорошо известны в данной области. В общем случае, такие
консервативные замены попадают в одну группу аминокислот, указанных ниже, хотя в некоторых случаях возможны другие замены без существенного влияния на иммуногенные свойства антигена. Каждая из следующие восьми групп содержит аминокислоты, которые обычно являются консервативными заменами друг для друга:
Алании (А), Глицин (G);
Аспарагиновая кислота (D), Глутаминовая кислота (Е);
Аспарагин (N), Глутамин (Q);
Аргинин (R), Лизин (К);
Изолейцин (I), Лейцин (L), Метионин (М), Валин (V);
Фенилаланин (F), Тирозин (Y), Триптофан (W);
Серии (S), Треонин (Т); и
Цистеин (С), Метионин (М)
(см.,
, например, Creighton, Proteins 1984).
Соответственно, такие замены не происходят в области эпитопа и поэтому не оказывают существенного влияния на иммуногенные свойства антигена.
Иммуногенные производные также могут включать такие производные, в которые встроены дополнительные аминокислоты по сравнению с эталонной последовательностью. Соответственно, такие вставки не происходят в области эпитопа и поэтому не оказывают существенного влияния на иммуногенные свойства антигена. Один пример вставок включает короткий отрезок гистидиновых остатков (например 2-6 остатков) для содействия экспрессии и/или очистке рассматриваемого антигена.
Иммуногенные производные включают такие производные, в которых были удалены аминокислоты по сравнению с эталонной последовательностью. Соответственно, такие делеции не происходят в области эпитопа и поэтому не оказывают существенного влияния на иммуногенные свойства антигена.
Специалисту в данной области понятно, что конкретное иммуногенное производное может содержать замены, делеции и добавления (или любую их комбинацию).
Термины "идентичный" или процент "идентичности" в контексте двух или более полипептидных последовательностей относятся к двум или более последовательностям или подпоследовательностям, которые являются одинаковыми или имеют определенный процент аминокислотных остатков, которые являются одинаковыми (то есть имеют 70% идентичность, возможно 75%, 80%, 85%, 90%, 95%, 98% или 99% идентичность в определенной области), при сравнении и выравнивании для максимального соответствия в
окне сравнения или в определенной области, при измерении с использованием одного из следующих алгоритмов сравнения последовательностей или ручного выравнивания и визуального контроля. Это определение также относится к последовательности, комплементарной тестируемой последовательности. Возможно, идентичность наблюдается в области, которая составляет по меньшей мере 200 аминокислот в длину, например по меньшей мере 300 аминокислот или по меньшей мере 400 аминокислот. Соответственно, сравнение выполняют в окне, соответствующем всей длине эталонной последовательности (в отличие от производной последовательности).
Для сравнения последовательностей, одну последовательность используют как эталонную последовательность, с которой сравнивают тестируемые последовательности. При использовании алгоритма сравнения последовательностей, тестируемые и эталонные последовательности вводят в компьютер, при необходимости обозначают координаты подпоследовательностей и указывают параметры программы алгоритма последовательности. Можно использовать стандартные параметры программы или указать альтернативные параметры. Затем, используя алгоритм сравнения последовательностей, вычисляют проценты идентичности тестируемых последовательностей относительно эталонной последовательности на основе параметров программы.
"Окно сравнения", при использовании здесь, относится к сегменту, в котором последовательность можно сравнить с эталонной последовательностью с таким же числом смежных положений после оптимального выравнивания двух этих последовательностей. Способы выравнивания последовательностей для сравнения хорошо известны в данной области техники. Оптимальное выравнивание последовательностей для сравнения может быть выполнено, например, посредством алгоритма локальной гомологии Smith & Waterman, Adv. Appl. Math. 2:482 (1981), посредством алгоритма гомологичного выравнивания Needleman & Wunsch, J. Mol. Biol. 48:443 (1970), посредством способа поиска подобия Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), посредством компьютерной реализации этих алгоритмов (GAP, BESTFIT, FASTA и TFASTA в программном пакете Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, WI) или посредством ручного выравнивания и визуального контроля (см., например,, Current Protocols in Molecular Biology (Ausubel et al., eds. 1995 дополнение)).
Одним примером полезного алгоритма является PILEUP. PILEUP создает множественное выравнивание последовательностей из группы родственных последовательностей с использованием прогрессивных парных выравниваний для
демонстрации соответствия и процента идентичности последовательности. Он также вычерчивает дерево или дендрограмму, показывающие отношения кластеризации, используемые для создания выравнивания. PILEUP использует упрощенный вариант способа прогрессивного выравнивания Feng & Doolittle, J. Mol. Evol. 35:351-360 (1987). Используемый способ аналогичен способу, описанному Higgins & Sharp, CABIOS 5:151153 (1989). Программа может выравнивать вплоть до 300 последовательностей, каждая из которых имеет максимальную длину 5000 нуклеотидов или аминокислот. Процедура множественного выравнивания начинается с парного выравнивания двух наиболее похожих последовательностей, с созданием кластера из двух выровненных последовательностей. Затем этот кластер выравнивают со следующей наиболее родственной последовательностью или с кластером выровненных последовательностей. Два кластера последовательностей выравнивают путем простого расширением парного выравнивания двух отдельных последовательностей. Окончательного выравнивания достигают посредством ряда прогрессивных парных выравниваний. Программу запускают путем указания определенных последовательностей и их аминокислотных координат для областей сравнения последовательностей и путем указания параметров программы. При использовании PILEUP, эталонную последовательность сравнивают с другими тестируемыми последовательностями для определения соотношения процента идентичности последовательности, используя следующие параметры: штраф за делецию по умолчанию (3.00), штраф за продолжение делеции по умолчанию (0.10) и оцениваемые концевые делеции. PILEUP может быть получен из пакета программ для анализа GCG-последовательности, например версии 7.0 (Devereaux et al, Nuc. Acids Res. 12:387-395 (1984)).
Другим примером алгоритма, который подходит для определения процентной идентичности последовательности и подобия последовательностей, являются алгоритмы BLAST и BLAST 2.0, которые описаны в Altschul et al, Nuc. Acids Res. 25:3389-3402 (1977) and Altschul et al, J. Mol. Biol. 215:403-410 (1990) соответственно. Программное обеспечение для осуществления анализа BLAST общедоступно через Национальный центр биотехнологической информации (National Center for Biotechnology Information (сайт www.ncbi.nlm.nih.gov/)). Этот алгоритм включает сначала идентификацию пар последовательностей с высоким показателем подобия (HSP) путем идентификации коротких слов длины W в искомой последовательности, которые либо соответствуют, либо удовлетворяют некоторому положительному пороговому значению Т при выравнивании со словом той же длины в базе данных последовательности. Т называется
порогом сравнения соседнего слова (Altschul et al, выше). Эти начальные совпадения соседних слов действуют, как затравки для начала поисков более длинных HSP, содержащих их. Совпадения слов расширяются в обоих направлениях вдоль каждой последовательности, до тех пор, пока может быть увеличен общий счет выравнивания. Общий счет рассчитывают, используя для нуклеотидных последовательностей, параметры М (вознаграждение для пары совпадающих остатков; всегда > 0) и N (штраф для несовпадающих остатков; всегда < 0). Для аминокислотных последовательностей используют весовую матрицу для вычисления общего счета. Расширение совпадений слов в каждом направлении прекращают, когда: общий счет выравнивания уменьшается на величину X от его максимального достигнутого значения; суммарный счет доходит до нуля или ниже из-за накопления одного или более остатков выравниваний с отрицательной оценкой; или достигнут конец любой последовательности. Параметры алгоритма BLAST W, Т и X определяют чувствительность и скорость выравнивания. В программе BLASTN (для нуклеотидных последовательностей) используют в качестве стандартных значений длину слова (W) 11, ожидание (Е) 10, М=5, N=-4 и сравнение обеих нитей. Для аминокислотных последовательностей программа в программе BLASTP используют в качестве стандартных значений длину слова 3 и ожидание (Е) 10 и весовую матрицу BLOSUM62 (см. Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1989)) выравнивания (В) 50, ожидание (E) 10, M=5, N=-4, и сравнение обеих нитей.
Алгоритм BLAST также выполняет статистический анализ подобия двух последовательностей (см., например,, Karlin & Altschul, Proc. Nat'I. Acad. Sci. USA 90:5873-5787 (1993)). Одна оценка подобия, обеспечиваемая алгоритмом BLAST, представляет собой наименьшую суммарную вероятность (P(N)), которая указывает вероятность, с которой совпадение двух нуклеотидных или аминокислотных последовательностей происходит случайно. Например, нуклеиновая кислота считается подобной эталонной последовательности, если наименьшая суммарная вероятность при сравнении тестируемой нуклеиновой кислоты с эталонной нуклеиновой кислотой составляет менее чем примерно 0,2, более предпочтительно менее чем примерно 0,01 и наиболее предпочтительно менее чем примерно 0,001.
В любом случае иммуногенные производные полипептидной последовательности обычно имеют по существу такую же активность, что и эталонная последовательность. Под термином "по существу такая же активность" подразумевается по меньшей мере 50%, подходящим образом по меньшей мере 75%/, и особенно по меньшей мере 90% активность эталонной последовательности в анализе рестимуляции РВМС
(мононуклеарных клеток периферической крови) in vitro, цельной крови, легочной ткани или бронхоальвеолярного лаважа специфическими антигенами (например рестимуляция в течение периода от нескольких часов вплоть до двух недель, например вплоть до одних суток, от 1 суток до 1 недели или от 1 недели до 2 недель), где измеряют активацию клеток посредством лимфопролиферации, продуцирование цитокинов в супернатанте культуры (измеренное посредством ELISA, СВА и т.д.) или характеристику Т- и В-клеточных ответов посредством внутри- и внеклеточного окрашивания (например с использованием антител, специфичных к иммунным маркерам, таким как CD3, CD4, CD8, IL2, TNF-альфа, IFN-гамма, IL-17, CD40L, CD69 и т.д.) с последующим анализом посредством проточной цитометрии. Соответственно, по существу такая же активность означает по меньшей мере 50%, подходящим образом по меньшей мере 75% и особенно по меньшей мере 90% активность эталонной последовательности в анализе пролиферации Т-клеток и/или анализе продуцирования IFN-гамма.
В одном воплощении полипептидный антиген и кодируемый антиген представляют собой Rvl 196-родственные антигены. Термин "Rvl 196-родственный антиген" относится к белку Rvl 196, представленному в SEQ Ш NO: 1, или к его иммуногенному производному. Используемый здесь термин "производное" относится к антигену, который модифицирован относительно эталонной последовательности. Иммуногенные производные довольно похожи на эталонную последовательность, чтобы по существу сохранять иммуногенные свойства эталонной последовательности и оставаться способными вызывать иммунный ответ против эталонной последовательности. Иммуногенное производное может, например, содержать модифицированный вариант эталонной последовательности или, в качестве альтернативы, может состоять из модифицированного варианта эталонной последовательности.
Rvl 196-родственный антиген может, например, содержать 2500 или менее аминокислотных остатков, например 1500 или менее аминокислотных остатков, в частности 1200 или менее аминокислотных остатков, особенно 1000 или менее аминокислотных остатков, как правило 800 или менее аминокислотных остатков.
Подходящим образом, Rvl 196-родственный антиген содержит, например состоит из, последовательность(и), имеющей по меньшей мере 70% идентичность SEQ Ш NO: 1, например по меньшей мере 80%, в частности по меньшей мере 90%, особенно по меньшей мере 95%, например по меньшей мере 98%, например по меньшей мере 99%.
Конкретным примером Rvl 196-родственного антигена является Rvl 196 из штамма Mycobacterium tuberculosis H37Rv, как представлено в SEQ ID NO: 1. Следовательно, в
одном воплощении изобретения Rvl 196-родственный антиген представляет собой белок, содержащий SEQ Ш NO: 1. Во втором воплощении изобретения Rvl 196-родственный антиген представляет собой белок, состоящий из SEQ Ш NO: 1.
Другим примером Rvl 196-родственного антигена является Rvl 196 из штамма Mycobacterium tuberculosis F11. В одном воплощении изобретения Rvl 196-родственный антиген представляет собой белок, содержащий SEQ Ш N0: 2. Во втором воплощении изобретения Rvl 196-родственный антиген представляет собой белок, состоящий из SEQ IDNO: 2.
Типичные Rvl 196-родственные антигены содержат иммуногенное производное SEQ Ш NO: 1 (например состоят из него), имеющее небольшое количество делеций, вставок и/или замещений. Примерами являются производные, которые имеют делеции вплоть до 5 остатков в 0-5 местах, вставки вплоть до 5 остатков в 0-5 местах и замены вплоть до 20 остатков.
Другими иммуногенными производными Rvl 196 являются такие, которые содержат фрагмент SEQ Ш NO: 1 (например состоят из него) длиной по меньшей мере 200 аминокислот, например длиной по меньшей мере 250 аминокислот, в частности длиной по меньшей мере 300 аминокислот, особенно длиной по меньшей мере 350 аминокислот.
Дополнительными иммуногенными производными Rvl 196 являются такие, которые содержат фрагмент SEQ Ш NO: 2, например состоят из него, длиной по меньшей мере 200 аминокислот, например длиной по меньшей мере 250 аминокислот, в частности, длиной по меньшей мере 300 аминокислот, особенно длиной по меньшей мере 350 аминокислот.
Rvl 196-родственные антигены могут быть получены ранее описанными способами (например, Dillon et al Infection and Immunity 1999 67(6): 2941-2950; WO2006/117240), способами, предложенными в Примерах, или аналогичными им способами.
В одном воплощении полипептидный антиген и кодируемый антиген представляют собой Rv0125-poflCTBeHHbie антигены. Термин 'Т <лЮ125-родственный антиген" относится к белку Rv0125, представленному в SEQ Ш NO: 3, или к его иммуногенному производному Используемый здесь термин "производное" относится к антигену, который модифицирован по сравнению с эталонной последовательностью. Иммуногенные производные достаточно похожи на эталонную последовательность, чтобы по существу сохранить иммуногенные свойства эталонной последовательности и оставаться способными вызывать иммунный ответ против эталонной последовательности.
Иммуногенное производное может, например, содержать модифицированную версию эталонной последовательности или, в качестве альтернативы, может состоять из модифицированной версии эталонной последовательности.
КлЮ125-родственный антиген может, например, содержать 2500 или менее аминокислотных остатков, например 1500 или менее аминокислотных остатков, в частности 1200 или менее аминокислотных остатков, особенно 1000 или менее аминокислотных остатков, как правило 800 или менее аминокислотных остатков.
Подходящим образом, КлЮ125-родственный антиген содержит последовательность, например состоит из нее, имеющую по меньшей мере 70% идентичность SEQ Ш NO: 3, например по меньшей мере 80%, в частности по меньшей мере 90%, особенно по меньшей мере 95%, например по меньшей мере 98%, такую как по меньшей мере 99%.
Конкретным примером Яу0125-родственного антигена является Rv0125 штамма Mycobacterium tuberculosis H37Rv, как указано в SEQ ID NO: 3. Следовательно, в одном воплощении изобретения Ку0125-родственный антиген представляет собой белок, содержащий SEQ Ш NO: 3. Во втором воплощении изобретения КлЮ125-родственный антиген представляет собой белок, состоящий из SEQ Ш NO: 3.
Типичные КлЮ125-родственные антигены содержат иммуногенное производное SEQ Ш NO: 3 (например состоят из него), имеющее небольшое количество делеций, вставок и/или замен. Примерами являются антигены, которые имеют делеции вплоть до 5 остатков в 0-5 местах, вставки вплоть до 5 остатков в 0-5 местах и замену вплоть до 20 остатков.
Другими иммуногенными производными RvO 125 являются производные, которые содержат фрагмент SEQ Ш NO: 3 (например состоят из него) длиной по меньшей мере 150 аминокислот, например длиной по меньшей мере 200 аминокислот, в частности длиной по меньшей мере 250 аминокислот, особенно длиной по меньшей мере 300 аминокислот. Конкретными иммуногенными производными RvO 125 являются производные, содержащие фрагмент SEQ Ш NO: 3 (например состоящие из него), соответствующий 1-195 остаткам SEQ Ш NO: 3. Другие иммуногенные производные RvO 125 представляют собой производные, содержащие фрагмент SEQ ID NO: 3 (например состоящие из него), соответствующий 192-323 остаткам SEQ ГО NO: 3.
Особенно предпочтительными RvO 125-родственными антигенами являются производные SEQ ГО NO: 3, где по меньшей мере одна аминокислота (например одна, две или даже все три) каталитической триады была(и) заменена(ы) или удалена(ы), так что была уменьшена активность протеазы и белок было легче получить - каталитический
остаток серина может быть удален или заменен (например заменен аланином), и/или каталитический остаток гистидина может быть удален или заменен, и/или замещенный каталитический остаток аспарагиновой кислоты может быть удален или заменен. Особенно интересны производные SEQ Ш N0: 3, где каталитический остаток серина заменен (например заменен аланином). Также представляют интерес КлЮ125-родственные антигены, которые содержат последовательность, например состоят из нее, имеющую по меньшей мере 70% идентичность SEQ Ш N0: 3, например по меньшей мере 80%, в частности по меньшей мере 90%, особенно по меньшей мере 95%, например по меньшей мере 98%, например по меньшей мере 99% и, где по меньшей мере одна аминокислота каталитической триады была заменена или удалена, или антигены, содержащие фрагмент SEQ Ш N0: 3, например состоящие из него, длиной по меньшей мере 150 аминокислот, например длиной по меньшей мере 200 аминокислот, в частности длиной по меньшей мере 250 аминокислот, особенно длиной по меньшей мере 300 аминокислот и, где по меньшей мере одна аминокислота каталитической триады была заменена или удалена. Другими иммуногенными производными RvO 125 являются содержащие фрагмент SEQ Ш NO: 3 (например состоящие из него), соответствующий 192-323 остаткам SEQ Ш NO: 3, где по меньшей мере одна аминокислота (например одна, две или даже все три) каталитической триады была заменена или удалена. Конкретными иммуногенными производными RvO 125 являются содержащие фрагмент SEQ Ш NO: 3 (например состоящие из него), соответствующий остаткам 1-195 в SEQ Ш NO: 3, где каталитический остаток серина (положение 176 в SEQ Ш NO: 3) был заменен (например заменен аланином).
В некоторых воплощениях полипептидный антиген и кодируемый антиген представляют собой Rvl 196- и Rv0125-poflCTBeHHbie антигены, например М72-родственные антигены. Конкретные производные белка М72 включают производные с дополнительными остатками His на N-конце (например два остатка His, как указано в SEQ Ш NO: 4; или полигистидиновый тег из пяти или особенно шести остатков His, который может быть использован для никель-афинной очистки). Mtb72f, содержащий исходный остаток серина, который мутирован в М72, является еще одним производным М72, как и белки Mtb72f с дополнительными остатками His на N-конце (например два остатка His; или полигистидиновый тег из пяти или особенно из шести остатков His, который может быть использован для никель-афинной очистки).
Однако специалисту понятно, что в некоторых воплощениях два разных полипептида, один из которых является Rvl 196-родственным антигеном и другой
является КлЮ125-родственным антигеном, могут быть представлены в композиции. В этих случаях понятно, что ранее установленные исключения в отношении аденовирусов, кодирующих Rvl 196-родственный антиген, и аденовирусов, кодирующих Rv0125-родственный антиген, могут быть оба применены к композиции с соответствующими изменениями. Аналогично, ранее установленные исключения в отношении одновременного введения аденовирусов, кодирующих Rvl 196-родственный антиген, и аденовирусов, кодирующих Rv0125-poflCTBeHHbift антиген, оба могут быть применены с необходимыми изменениями.
Также в некоторых воплощениях одиночный аденовирус может кодировать два разных полипептида, один из которых является Rvl 196-родственным антигеном, а другой является Rv0125-poflCTBeHHbiM антигеном. В таких случаях понятно, что ранее указанные исключения в отношении полипептидного Rvl 196-родственного антигена и полипептидного RvO 125-родственного антигена оба могут быть применены к композиции с соответствующими изменениями. Аналогично, ранее установленные исключения в отношении одновременного введения полипептидного Rvl 196-родственного антигена и полипептидного RvO 125-родственного антигена оба могут быть применены с соответствующими изменениями.
Альтернативно, могут быть предложены две различающиеся аденовирусные конструкции, одна, кодирующая Rvl 196-родственный антиген, и одна, кодирующая Rv0125-poflCTBeHHbift антиген. В таких случаях понятно, что ранее указанные исключения в отношении полипептидного Rvl 196-родственного антигена и полипептидного Rv0125-родственного антигена оба могут быть применены к композиции с соответствующими изменениями. Аналогично, ранее установленные исключения в отношении одновременного введения полипептидного Rvl 196-родственного антигена и полипептидного Rv0125-poflCTBeHHoro антигена оба могут применяться с соответствующими изменениями.
Подходящим образом, М72-родственный антиген содержит последовательность, например состоит из нее, имеющую по меньшей мере 70% идентичность SEQ Ш N0: 6, например по меньшей мере 80%, в частности по меньшей мере 90%, особенно по меньшей мере 95%, например по меньшей мере 98%, например по меньшей мере 99%.
Типичные М72-родственные антигены содержат производное SEQ Ш N0: 6, например состоят из него, имеющее небольшое количество делеций, вставок и/или замен. Примерами являются такие производные, которые имеют делеции вплоть до 5 остатков в 0-5 местах, вставки вплоть до 5 остатков в 0-5 местах и замену вплоть до 20 остатков.
Другие производные М72 представляют собой производные, которые содержат фрагмента SEQ Ш N0: 6, например состоят из него, длиной по меньшей мере 450 аминокислот, например длиной по меньшей мере 500 аминокислот, например длиной по меньшей мере 550 аминокислот, например длиной по меньшей мере 600 аминокислот, например длиной по меньшей мере 650 аминокислот или длиной по меньшей мере 700 аминокислот. Поскольку М72 представляет собой слитый белок, происходящий из двух отдельных антигенов, любой фрагмент из по меньшей мере 450 остатков будет содержать множество эпитопов полноразмерной последовательности (Skeiky et al J. Immunol. 2004 172:7618-7628; Skeiky Infect. Immun. 1999 67(8):3998-4007; Dillon Infect. Immun. 1999 67(6):2941-2950).
В конкретных воплощениях М72-родственный антиген будет содержать остатки 2723 из SEQ Ш NO: 6, например будет содержать SEQ Ш NO: 6 (или состоять из нее).
В одном воплощении полипептидный антиген соответствует SEQ Ш NO: 4 и кодируемый антиген соответствует SEQ Ш NO: 6.
М72-родственные антигены могут быть получены ранее описанными способами (WO2006/117240) или способами, аналогичными им.
Полипептидный антиген может быть таким же или может быть подобным кодируемому антигену. В одном воплощении полипептидный антиген является таким же, что и кодируемый антиген.
Соответственно, полипептидный антиген является подобным кодируемому антигену. Например, кодируемый антиген может иметь 70% идентичность, например по меньшей мере 80% идентичность, соответственно, по меньшей мере 90% идентичность, в частности по меньшей мере 95% идентичность полипептидному антигену. Альтернативно, кодируемый антиген может содержать фрагмент из по меньшей мере 100 аминокислотных остатков, например из по меньшей мере 200 аминокислотных остатков, соответственно из по меньшей мере 300 аминокислотных остатков полипептидного антигена. В некоторых случаях кодируемый антиген содержит фрагмент из по меньшей мере 400 аминокислотных остатков, в частности из 500 аминокислотных остатков, например из по меньшей мере 600 и соответственно из по меньшей мере 700 остатков полипептидного микобактериального антигена.
Полипептидный антиген и аденовирус могут быть представлены в виде иммуногенных композиций, которые содержат один или более дополнительных антигенных компонентов.
Дополнительные антигенные компоненты могут быть предназначены для усиления
и дополнения иммунных ответов, востребованных в области предупреждения и терапии туберкулеза, или дополнительные антигены могут быть ассоциированы с другими патогенами и предназначены для совместного введения, исходя из соображений удобства. Когда в композиции присутствует несколько антигенных компонентов, они могут быть представлены в виде отдельных полипептидов или слитых белков. В некоторых случаях дополнительные антигенные компоненты могут быть представлены в виде полинуклеотида (или полинуклеотидов), кодирующего(их) один или более полипептидов.
Как правило, для введения людям, композиции, содержащие полипептидный Rvl 196-родственный антиген, будут содержать от 1 мкг до 100 мкг Rvl 196-родственного антигена, например от 1 мкг до 50 мкг на дозу. Соответственно, предложено от 1 мкг до 50 мкг Rvl 196-родственного антигена (например от 5 мкг до 50 мкг), особенно от 1 мкг до 20 мкг (например от 5 мкг до 20 мкг) и, в частности, примерно или точно 10 мкг.
Как правило, для введения людям, композиции, содержащие полипептидный Rv0125-poflCTBeHHbift антиген, будут содержать от 1 мкг до 100 мкг Rv0125-poflCTBeHHoro антигена, например от 1 мкг до 50 мкг на дозу. Соответственно, предложено от 1 мкг до 50 мкг Rv0125-poflCTBeHHoro антигена (например от 5 мкг до 50 мкг), особенно от 1 мкг до 20 мкг (например от 5 мкг до 20 мкг) и, в частности, примерно или точно 10 мкг.
Как правило, для введения людям, композиции, содержащие полипептидный М72-родственный антиген, будут содержать от 1 мкг до 100 мкг М72-родственного антигена, например от 1 мкг до 50 мкг на дозу. Соответственно, предложено от 1 мкг до 50 мкг М72-родственного антигена (например от 5 мкг до 50 мкг), особенно от 1 мкг до 20 мкг (например от 5 мкг до 20 мкг) и, в частности, примерно или точно 10 мкг.
В общем случае, полипептид, используемый в изобретении (если он обнаружен в природе), будет выделенным полипептидом (то есть отделенным от тех компонентов, с которыми он обычно может быть обнаружен). Например, природный белок является выделенным при отделении его от некоторых или всех веществ, сопутствующих в естественной системе. Предпочтительно, чтобы такие полипептиды были по меньшей мере на примерно 90% чистыми, более предпочтительно по меньшей мере на примерно 95% чистыми, и наиболее предпочтительно по меньшей мере на примерно 99% чистыми. Полинуклеотид считается изолированным, если, например, он клонирован в вектор, который не является частью естественной среды.
Адъюванты, используемые в изобретении
Как описано выше, в одном аспекте изобретения полипептидный антиген предложен в иммуногенной композиции, которая содержит адъювант. Целесообразно,
адъювант содержит агонист TLR и/или иммунологически активный сапонин.
В некоторых воплощениях адъювант может включать гидроксид алюминия или фосфат алюминия.
Таким образом, в одном воплощении адъювант содержит агонист TLR. В другом воплощении адъювант содержит иммунологически активный сапонин. В еще одном воплощении адъювант содержит агонист TLR и иммунологически активный сапонин.
Адъювант может содержать агонист TLR и сапонин в липосомальной композиции. Соотношение агониста TLR к сапонину может составлять от 5:1 до 1:5 (масса/масса), целесообразно от 2:1 до 1:2, обычно примерно 1:1.
Использование агониста TLR в адъювантах хорошо известно в данной области и было рассмотрено, например, в Lahiri et al. (2008) Vaccine 26:6777. TLR, которые могут быть стимулированы для получения адъювантного эфеекта, включают агонисты TLR2, TLR4, TLR5, TLR7, TLR8 и TLR9. Агонисты TLR2, TLR4, TLR7 и TLR8, особенно агонисты TLR4, являются предпочтительными.
Подходящие агонисты TLR4 включают липополисахариды, такие как
монофосфорилпирид A (MPL) и З-О-деацилированный монофосфорилипид A (3D-MPL).
В патенте US 4436727 описан MPL и его получение. В патенте US 4912094 и
свидетельстве о повторно произведённой экспертизе патентоспособности В1 4912094
раскрыт 3D-MPL и способ его получения. Другой агонист TLR4 представляет собой
глюкопиранозиллипидный адъювант (GLA), синтетическую липид А-подобную молекулу
(см., например, Fox et al. (2012) Clin. Vaccine Immunol 19:1633). В другом воплощении,
агонист TLR4 может быть синтетическим агонистом TLR4, например синтетической
дисахаридной молекулой, аналогичной по структуре MPL и 3D-MPL, или может быть
синтетическими моносахаридными молекулами, такими как
аминоалкилглюкозаминидфосфатные (AGP) соединения, описанные, например, в WO9850399, WO0134617, WO0212258, W03065806, WO04062599, WO06016997, WO0612425, WO03066065 и WO0190129. Такие молекулы также были описаны в научной и патентной литературе как миметики липида А. Миметики липида А целесообразно обладают некоторой общей функциональной и/или структурной активностью с липид ом А и в одном аспекте распознаются рецепторами TLR4. AGP, описанные здесь, иногда упоминаются в данной области как миметики липида А. В предпрочтительном воплощении, агонист TLR4 представляет собой 3D-MPL. Агонисты TLR4, такие как З-О-деацилированный монофосфорилипид A (3D-MPL), и их применение в качестве адъювантов в вакцинах были описаны, например, в WO 96/33739 и WO2007/068907 и
рассмотрены в Alving et al. (2012) Curr Opin Immunol 24:310.
Адъювант может содержать иммунологически активный сапонин, например иммунологически активную сапониновую фракцию, такую как QS21.
Адъюванты, содержащие сапонин, описаны в данной области техники. Сапонины описаны в: Lacaille-Dubois and Wagner (1996) A review of the biological and pharmacological activities of saponins. Phytomedicine vol 2:363. Сапонины известны в качестве адъювантов в вакцинах. Например, Quil А (полученный из коры южноамериканского дерева Quillaja Saponaria Molina) был описан в Dalsgaard et al. in 1974 ("Saponin adjuvants", Archiv. fur die gesamte Virusforschung, Vol. 44, Springer Verlag, Berlin, 243) как имеющий адъювантную активность. Очищенные фракции Quil А были выделены с помощью ВЭЖХ, что сохраняло адъювантную активность без токсичности, связанной с Quil A (Kensil et al. (1991) J. Immunol. 146: 431. Quil A fractions также описаны в US 5057540 и "Saponins as vaccine adjuvants", Kensil, C. R., CritRev Ther Drug Carrier Syst, 1996, 12 (1-2): 1-55.
Две такие фракции, подходящие для применения в настоящем изобретении, представляют собой QS7 и QS21 (также известные как QA-7 и QA-21). QS21 является предпочтительной иммунологически активной сапониновой фракцией для использования в настоящем изобретении. QS21 был описан в Kensil (2000) In O'Hagan: Vaccine Adjuvants: preparation methods and research protocols. Homana Press, Totowa, New Jersey, Chapter 15. Адъювантные системы в виде частиц, содержащие фракции Quil А, такие как QS21 и QS7, описаны, например, в WO 96/33739, WO 96/11711 и WO2007/068907.
В дополнение к другим компонентам, адъювант предпочтительно содержит стерол. Присутствие стерола может дополнительно снижать реактогенность композиций, содержащих сапонины, см., например, ЕР0822831. Подходящие стеролы включают бета-ситостерол, стигмастерол, эргостерол, эргокальциферол и холестерол. Холестерол является особенно подходящим. Соответственно, иммунологически активная сапониновая фракция представляет собой QS21, и соотношение QS21: стерол составляет от 1:100 до 1:1 масса/масса, например от 1:10 до 1:1 масса/масса, например от 1:5 до 1:1 масса/масса.
В предпрочтительном воплощении способов по изобретению агонист TLR4 представляет собой 3D-MPL и иммунологически активный сапонин представляет собой QS21.
В некоторых воплощениях адъювант представлен в виде эмульсии масло-в-воде, например содержащей сквален, альфа-токоферол и поверхностно-активное вещество (см., например, WO 95/17210) или в виде липосомы. Липосомальное представление является предпочтительным.
Термин "липосома", при использовании здесь, относится к одно- или
многослойным (в частности 2, 3, 4, 5, 6, 7, 8, 9 или 10-слойным, в зависимости от числа
образованных липидных мембран) липидным структурам, окружающим водную
внутреннюю часть. Липосомы и липосомные композиции хорошо известны в данной
области. Представления в виде липосом описаны, например, в W096/33739 и
WO2007/068907. Липиды, которые способны образовывать липосомы, включают все
вещества, обладающие жирными или жироподобными свойствами. Липиды, которые
могут составлять липиды в липосомах, могут быть выбраны из группы, включающей
глицериды, глицерофосфолипиды, глицерофосфинолипиды, глицерофосфонолипиды,
сульфолипиды, сфинголипиды, фосфолипиды, изопренолиды, стероиды, стеарины,
стеролы, археолипиды, синтетические катионные липиды и липиды, содержащие
углеводы. В конкретном воплощении изобретения липосомы содержат фосфолипид.
Подходящие фосфолипиды включают (без ограничения ими): фосфохолин (PC), который
является промежуточным продуктом в синтезе фосфатидилхолина; производные
природного фосфолипида: яичный фосфохолин, соевый фосфохолин,
гидрогенизированный соевый фосфохолин, сфингомиелин в качестве природных
фосфолипидов; и синтетические фосфолипидные производные: фосфохолин (дидеканоил-
L-A-фосфатидилхолин [DDPC], дилауроилфосфатидилхолин [DLPC],
димиристоилфосфатидилхолин [DMPC], дипалмитоилфосфатидилхолин [DPPC], дистеароилфосфатидилхолин [DSPC], диолеоилфосфатидилхолин, [DOPC], 1 -пальмитоил, 2-олеоилфосфатидилхолин [РОРС], диэлаидоилфосфатидилхолин [DEPC]), фосфоглицерин (1,2-димиристоил-8п-глицеро-3-фосфоглицерин [DMPG], 1,2-дипалмитоил-зп-глицеро-З-фосфоглицерин [DPPG], 1,2-дистеароил-8п-глицеро-3-фосфоглицерин [DSPG], 1 -пальмитоил-2-олеоил-8п-глицеро-3-фосфоглицерин [POPG]), фосфатидная кислота (1,2-димиристоил-8п-глицеро-3-фосфатидная кислота [DMPA], дипалмитоилфосфатидная кислота [DPPA], дистеароил-фосфатидная кислота [DSPA]), фосфоэтаноламин-( 1,2-димиристоил-8п-глицеро-3 -фосфоэтаноламин [DMPE], 1,2-дипалмитоил-8п-глицеро-3-фосфоэтаноламин [DPPE], 1,2-дистеароил-8п-глицеро-3-фосфоэтаноламин [DSPE], 1,2-диолеоил-8п-глицеро-3-фосфоэтаноламин [DOPE]), фосфосерин, полиэтиленгликолевый [PEG] фосфолипид.
Размер липосом может варьировать от 30 нм до нескольких мкм в зависимости от фосфолипидной композиции и способа, используемого для их получения. В конкретных воплощениях изобретения размер липосом находится в диапазоне от 50 нм до 500 нм, и в других воплощениях -от 50 нм до 200 нм. Динамическое рассеяние лазерного излучения
представляет собой способ, используемый для измерения размера липосом, и хорошо известен специалистам в данной области техники.
В особенно подходящем воплощении липосомы, используемые в изобретении, содержат DOPC и стерол, в частности холестерол. Таким образом, в конкретном воплощении композиции по изобретению содержат QS21 в любом количестве, описанном здесь, в форме липосомы, где указанная липосома содержит DOPC и стерол, в частности холестерол.
Предпочтительно, адъювант содержит 3D-MPL и QS21 в липосомальной композиции.
Адъювант может содержать от 1 до 100 микрограмм агониста TLR4 на дозу. Адъювант может содержать от 1 до 100 микрограмм иммунологически активного сапонина на дозу.
В одном воплощении, для применения у человека адъювант содержит от 12,5 до 75 микрограмм 3D-MPL и от 12,5 до 75 микрограмм QS21 на дозу в липосомальной композиции.
В другом воплощении адъювант содержит от 12,5 до 37,5, например от 20 до 30 микрограмм (например примерно или точно 25 микрограмм) 3D-MPL и от 12,5 до 37,5, например от 20 до 30 микрограмм (например примерно или точно 25 микрограмм) QS21 в липосомальной композиции на дозу. Целесообразно, количество 3D-MPL совпадает с количеством QS21.1
Полипептид или аденовирус должны быть представлены в фармацевтически приемлемой форме, подходящей для предполагаемого пути доставки. Растворы должны иметь фармацевтически приемлемую осмоляльность, чтобы избежать деструкции или лизиса клеток. Фармацевтически приемлемая осмоляльность в общем случае означает, что растворы имеют осмоляльность, соответствующую примерно изотонической или слегка гипертонической. Целесообразно, иммуногенные композиции по настоящему изобретению имеют осмоляльность в диапазоне от 250 до 750 мОсм/кг, например, осмоляльность может находиться в диапазоне от 250 до 550 мОсм/кг, например в диапазоне от 280 до 500 мОсм/кг. Осмоляльность может быть измерена в соответствии со способами, известными в данной области, например, с использованием имеющегося в продаже осмометра, например Advanced(r) Model 2020 компании Advanced Instruments Inc. (США). "Изотонический агент" представляет собой соединение, которое является физиологически переносимым и придает подходящую тоничность композиции (например иммуногенным композициям по изобретению) для предупреждения чистого потока воды
через клеточные мембраны, находящиеся в контакте с композицией. Известны водные адъювантные композиции, которые содержат 100 мМ хлорида натрия или более, например адъювантная система A (ASA) в WO 2005/112991 и WO 2008/142133 или липосомальные адъюванты, описанные в WO 2007/688907.
В некоторых воплощениях используемым в композиции изотоническим агентом является соль. Однако в других воплощениях композиция содержит неионный изотонический агент и концентрация хлорида натрия или ионная сила в композиции составляет менее 100 мМ, например менее 80 мМ, например менее 30 мМ, например менее 10 мМ или менее 5 мМ. Композиция может содержать неионный изотонический агент и проводимость композиции составляет менее 5 мСм/см, например менее 4 мСм/см. В предпрочтительном воплощении неионный изотонический агент представляет собой полиол, такой как сорбит. Концентрация сорбита может, например, составлять от примерно 3% до примерно 15% (масса/об.), например от примерно 4% до примерно 10% (масса/об.). Адъюванты, содержащие фракцию иммунологически активного сапонина и агонист TLR4, где изотонический агент представляет собой соль или полиол, описаны в WO2012/080369 и WO2012/080370, которые включены в данный документ посредством ссылки.
рН иммуногенных композиций должен быть подходящим для введения. Как правило, рН находится в диапазоне от 6,0 до 9,0, например от 7,0 до 9,0, особенно от 7,25 до 8,75, например от 7,5 до 8,5, в частности рН от 7,75 до 8,25. Особый интерес представляет рН примерно 8,0.
Для жидких композиций, вводимых парентерально, объем композиции будет, как правило, находиться в интервале от 50 мкл до 2 мл (в зависимости от конкретного пути введения). Обычно используют объем 400-600 мкл, например примерно 500 мкл, в частности для введения внутримышечным путем.
Композиции, как правило, являются стерильными.
Аденовирусные векторы
Аденовирус широко используется для переноса генов благодаря своей способности обеспечивать высокоэффективный перенос генов в различные ткани-мишени и большой транс генной емкостью. Аденовирусные векторы, используемые в настоящем изобретении, могут быть получены из ряда млекопитающих хозяев. Выделено более 100 различных серотипов аденовируса, которые инфицируют различные виды млекопитающих. Эти аденовирусные серотипы были разделены на шесть подродов (A-F; где В подразделяется на В1 и В2) в соответствии с гомологией последовательностей и их способностью
агглютинировать эритроциты (Tatsis and Ertl Molecular Therapy (2004) 10: 616-629).
Примерами аденовирусов, полученных от человека, являются Adl, Ad2, Ad4, Ad5, Ad6, Adll, Ad24, Ad34 и Ad35. Хотя векторы на основе Ad5 широко используются в некоторых геннотерапевтических исследованиях, могут быть ограничения на использование Ad5 и аденовирусных векторов другой человеческой группы С из-за предсуществующего иммунитета в общей популяции из-за естественной инфекции. Представители Ad5 и другой человеческой группы С ка правило оказываются среди наиболее серопревалирующих серотипов. Кроме того, иммунитет к существующим векторам может развиваться в результате воздействия вектора во время лечения. Эти типы предсуществующего или развившегося иммунитета к серопревалирующим векторам могут ограничивать попытки генной терапии или вакцинации. Альтернативные аденовирусные серотипы, таким образом, образуют очень важные мишени в поиске систем доставки генов, способных избежать иммунного ответа хозяина.
Аденовирусный вектор, используемый в настоящем изобретении, получен из аденовируса нечеловекообразных обезьян. Многочисленные аденовирусы были выделены из нечеловекообразных обезьян, таких как шимпанзе, бонобо, макаки резус и гориллы, и векторы, полученные из этих аденовирусов, индуцируют сильные иммунные ответы на трансгены, кодируемыми этими векторами (Colloca et al. (2012) Sci. Transl. Med. 4:1-9; Roy et al. (2004) Virol. 324: 361-372; Roy et al. (2010) J. of Gene Med. 13:17-25). Некоторые преимущества векторов, основанных на аденовирусах нечеловекообразных обезьян, включают относительное отсутствие перекрестно-нейтрализующих антител к этим аденовирусам в целевой популяции. Например, перекрестная реакция некоторых аденовирусов шимпанзе с предсуществующими ответами нейтрализующих антител имеется только у 2% целевой популяции по сравнению с 35% в случае некоторых векторов-кандидатов на основе человеческого аденовируса.
В частности, аденовирусный вектор получают из аденовируса нечеловекообразных обезьян, в частности аденовируса шимпанзе, такого как ChAd3, ChAd63, ChAd83, ChAdl55, Pan 5, Pan 6, Pan 7 (также называемого C7) или Pan 9. Примеры таких штаммов описаны в WO 03/000283, WO 2005/071093, WO 2010/086189 и GB 1510357.5 и также доступны в Американской коллекции типовых культур, 10801 University Boulevard, Manassas, Virginia 20110-2209 и в других источниках. Альтернативно, аденовирусные векторы могут быть получены из аденовирусов нечеловекообразных обезьян, выделенных из бонобо, таких как PanAdl, PanAd2 или PanAd3. Примеры векторов, описанных в данном документе, могут быть найдены, например, в WO 2005/071093 и WO 2010/086189.
Аденовирусные векторы также могут быть получены из аденовирусов, выделенных из горилл, как описано в WO 2013/52799, WO 2013/52811 и WO 2013/52832.
Некоторые аденовирусные векторы могут демонстрировать одну или более улучшенных характеристик по сравнению с другими векторами: более высокую продуктивность, улучшенную иммуногенность и повышенную экспрессию трансгена.
В одном воплощении аденовирусный вектор представляет собой аденовирус нечеловекообразных обезьян, содержащий по меньшей мере пентон, выбранный из SEQ ID N0: 10 или SEQ ГО NO: 20, гексон, выбранный из SEQ ГО NO: 11 или SEQ ID NO: 21, или фибриллу, выбранную из SEQ ГО NO: 12 или SEQ ГО NO: 22, в частности пентон и гексон, пентон и фибриллу, или гексон и фибриллу, например пентон, гексон и фибриллу. В некоторых примерах аденовирусный вектор представляет собой аденовирус нечеловекообразных обезьян, содержащий по меньшей мере пентон с SEQ ID NO: 10, гексон с SEQ ГО NO: 11 или фибриллу с SEQ ГО NO: 12, в частности пентон и гексон, пентон и фибриллу, или гексон и фибриллу. В других примерах аденовирусный вектор представляет собой аденовирус нечеловекообразных обезьян, содержащий по меньшей мере пентон с SEQ ГО NO: 20, гексон с SEQ ID NO: 21 или фибриллу с SEQ ГО NO: 22, в частности пентон и гексон, пентон и фибриллу или гексон и фибриллу.
В одном воплощении аденовирусный вектор получен из ChAd3 и содержит по меньшей мере пентон (SEQ ГО NO: 10), гексон (SEQ ГО NO: 11) и фибриллу (SEQ ГО NO: 12) из него.
В одном воплощении аденовирусный вектор получен из ChAdl55 и содержит пентон (SEQ ГО NO: 20), гексон (SEQ ГО NO: 21) и фибриллу (SEQ ГО NO: 22) из него.
В одном воплощении аденовирусный вектор представляет собой аденовирус нечеловекообразных обезьян, содержащий по меньшей мере пентон с SEQ ID NO: 15, гексон с SEQ ГО NO: 16 или фибриллу с SEQ ГО NO: 17, в частности пентон и гексон, пентон и фибриллу или гексон и фибриллу. В некоторых примерах аденовирусный вектор получен из ChAd63, содержащего по меньшей мере пентон с SEQ ГО NO: 15, гексон с SEQ ГО NO: 16 и фибриллу с SEQ ГО NO: 17.
Структура аденовирусного вектора
Аденовирусы имеют характерную морфологию с икосаэдрическим капсидом, содержащим три основные белка, гексон (II), пентонное основание (III) и выпяченный фибриллу (IV), а также ряда других второстепенных белков, VI, VIII, IX, Ша и IVa2. На гексон приходится большинство структурных компонентов капсида, который состоит из 240 тримерных гексонных капсомеров и 12 пентонных оснований. Гексон имеет три
консервативных двойных цилиндра, в то время как на вершине имеется три башни, каждая башня содержит петлю от каждой субъединицы, которая образует большую часть капсида. Основание гексона высококонсервативно у аденовирусных серотипов, в то время как поверхностные петли являются вариабельными (Tatsis and Ertl Molecular Therapy (2004) 10:616-629). Пентон представляет собой еще один аденовирусный капсидный белок, который образует пентамерное основание, к которому прикрепляется фибрилла. Трехмерный белок фибриллы выступает из основания пентона в каждой из 12 вершин капсида и представляет собой выступающую палочковидную структуру. Основная роль белка фибриллы заключается в прикреплении вирусного капсида к клеточной поверхности посредством взаимодействия выступающей области с клеточным рецептором, и вариации в гибком стержне, а также в выступающих областях фибриллы специфичные для разных серотипов (Nicklin et al Molecular Therapy 2005 12:384-393).
Аденовирусный геном хорошо охарактеризован. Линейная двухцепочечная ДНК ассоциирована с высокоосновным белком VII и небольшим пептидом рХ (также называемым mu). Другой белок V упакован с этим ДНК-белковым комплексом и обеспечивает структурную связь с капсидом через белок VI. Имеется общая консервативность в общей организации аденовирусного генома в отношении к конкретным рамкам считывания, расположенным аналогичным образом, например расположение генов Е1А, Е1В, Е2А, Е2В, ЕЗ, Е4, LI, L2, L3, L4 и L5 каждого вируса. Каждый конец аденовирусного генома содержит последовательность, известную как инвертированный терминальный повтор (ITR), который необходим для репликации вируса. 5'-конец аденовирусного генома содержит 5'-цис-элементы, необходимые для упаковки и репликации; то есть 5'-ITR последовательности (которые функционируют как начало репликации) и нативные 5'-домены энхансеров упаковки (которые содержат последовательности, необходимые для упаковки линейных геномов Ad и энхансерные элементы для промотора Е1). 3'-конец аденовирусного генома включает З'-цис-элементы (включая ITR), необходимые для упаковки и инкапсулирования. Вирус также содержит протеазу, кодируемую вирусом, которая необходима для обработки некоторых структурных белков, необходимых для продуцирования инфекционных вирионов. Структура аденовирусного генома описана на основе порядка, в котором вирусные гены экспрессируются после трансдукции клеток-хозяев. Более конкретно, вирусные гены упоминаются как ранние (Е) или поздние (L) гены в зависимости от того, происходит транскрипция до или после начала репликации ДНК. В ранней фазе трансдукции экспрессируются гены Е1А, Е1В, Е2А, Е2В, ЕЗ и Е4 аденовируса с получением клетки
хозяина для репликации вируса. В поздней фазе инфекции активируется экспрессия поздних генов L1-L5, которые кодируют структурные компоненты вирусных частиц.
Аннотация последовательности ChAd3 дикого типа (SEQ Ш N0: 9) последовательность представлена ниже.
CDS (всего 38)
Е1А30.8К
Начало: 589 Конец: 1544 Описание исходной локализации: присоединение(589..1129,1243..1544)
Е1А25.5К
Начало: 589 Конец: 1544 Описание исходной локализации: присоединение(589..991,1243..1544)
Е1В 22К
Начало: 1716 Конец: 2279 Описание исходной локализации: 1716..2279
Е1В 57К
Начало: 2021 Конец: 3544 Описание исходной локализации: 2021..3544
Начало: 3640 Конец: 4104 Описание исходной локализации: 3640..4104
IVa2
Начало: 4163 Конец: 5790 (комлементирующый) Описание исходной локализации: дополнение(4163..5499,5778..5790)
pol
Начало: 5269 Конец: 14236 (комлементирующый) Описание исходной локализации: дополнение(5269..8865,14228.. 14236)
рТР
Начало: 8664 Конец: 14236 (комлементирующый) Описание исходной локализации: дополнение(8664..10667,14228..14236)
48К
Начало: 11120 Конец:12379 Описание исходной локализации: 11120..12379
рШа
Начало: 12403 Конец: 14181 Описание исходной локализации: 12403..14181
Начало: 14273 Конец:16054 Пентон
Описание исходной локализации:
14273..16054
pVII
Начало: 16069 Конец:16665 Описание исходной локализации: 16069..16665
Начало: 16738 Конец:17853 Описание исходной локализации: 16738..17853
Начало: 17878 Конец: 18123 Описание исходной локализации: 17878..18123
pVI
Начало: 18219 Конец:18974 Описание исходной локализации: 18219..18974
гексон
Начало: 19086 Конец:21968 Описание исходной локализации: 19086..21968
протеаза
Начало: 21998 Конец:22627 Описание исходной локализации: 21998..22627
DBP
Начало: 22743 Конец: 24395 (комлементирующый) Описание исходной локализации: дополнение(22743. .24395)
92К
Начало: 24445 Конец:26940 Описание исходной локализации: 24445..26940
22К
Начало: 26630 Конец: 27229 Описание исходной локализации: 26630..27229
ЗЗК
Начало: 26630 Конец: 27551 Описание исходной локализации: присоединение(26630..26966,27169..27551)
pVIII
Начало: 27626 Конец: 28309 Описание исходной локализации: 27626..28309
ЕЗ 12К
Начало: 28310 Конец: 28627 Описание исходной локализации: 28310..28627
ЕЗ CRl-альфарО
Начало: 29125 Конец: 29325 Описание исходной локализации:
29125..29325
ЕЗ gpl8K
Начало: 29328 Конец:29819 Описание исходной локализации: 29328..29819
ЕЗ ЗЗК
Начало: 29848 Конец:30738 Описание исходной локализации: 29848..30738
ЕЗА 11 К
Начало: 31293 Конец:31589 Описание исходной локализации: 31293..31589
ЕЗ RID альфа
Начало: 31601 Конец:31873 Описание исходной локализации: 31601..31873
ЕЗ RID бета
Начало: 31876 Конец:32274 Описание исходной локализации: 31876..32274
ЕЗ 15К
Начало: 32267 Конец:32653 Описание исходной локализации: 32267..32653
U экзон
Начало: 32684 Конец: 32848 (комлементирующый) Описание исходной локализации: дополнение(32684..32848)
фибрилла
Начало: 32859 Конец:34490 Описание исходной локализации: 32859..34490
E40RF6/7
Начало: 34698 Конец: 35858 (комлементирующый) Описание исходной локализации: дополнение(34698..34973,35685..35858)
E4 0RF6
Начало: 34974 Конец: 35858 (комлементирующый) Описание исходной локализации: дополнение(34974..35858)
E4 0RF4
Начало: 35758 Конец: 36123 (комлементирующый) Описание исходной локализации: дополнение(35758..36123)
E4 0RF3
Начало: 36139 Конец: 36486 (комлементирующый) Описание исходной локализации: дополнение(36139..36486)
E4 0RF2
Начало: 36483 Конец: 36875 (комлементирующый) Описание исходной локализации:
дополнение(36483.. 36875) E4 0RF1
Начало: 36928 Конец: 37314 (комлементирующый) Описание исходной локализации: дополнение(36928..37314)
Прочие признаки (всего 3)
VA RNAI
Начало: 10693 Конец: 10860 Описание исходной локализации: 10693..10860
VAII
Начало: 10927 Конец: 11102 Описание исходной локализации: 10927..11102
ЕЗ делеция-5'
Начало: 28642 Конец: 28647 Описание исходной локализации: 28642..28647
Аннотация последовательности ChAd63 дикого типа (SEQ Ш NO: 14) представлена
ниже.
ЛОКУС ChAd63 35994 п.о. ДНК линейная 27-июль-2015
ОПРЕДЕЛЕНИЕ аденовирус 163 шимпанзе, полный геном.
КОММЕНТАРИИ Аннотация в соответствии с выравниванием CliAd63 против человеческого
аденовируса 4 стандартный штамм NC 003266 СВОЙСТВА Локализация/Определители источник 1.. 35 994
/организм-' аденовирус шимпанзе 63"
/мол.тип-'геномная ДНК"
/акроним="С11Ас!63" обл. повтора 1..129
/общепринятое название-'ITR"
/гр1_тип=инвертированный
ген 479.. 1501
/ген="Е1А" регуляторный 479..484
/регуляторныйкласс-'ТАТАбокс"
/ген="Е1А"
CDS присоединение(576..1143,1229..1437)
/ген="Е1А"
/продукт="контрольный белок Е1 А"
/TpaHCJM4HH="MRHLRDLPGNVFLATGNEILELVVDAMMGDDPPEPPTPFEAPSL YDL YDLEVD VPENDPNEE AVNDLFSD AALL A AEQ ANTD SGSD SD S SLHTPRPGRGEKK IPELKGEELDLRCYEECLPPSDDEEDEEAIRAAASEGVKVAGESFSLDCPTLPGHGCK SCEFHRMNTGDKNVMCALCYMRAYNHCVYSPVSDVDETPTSECISSPPEIGEEPPEDI IHRPVAVRVTGRRAAVESLDDLLQGGDEPLDLCTRKRPPJI" интрон 1144.1228
/ген="Е1А" регуляторный 1495.. 1501
/регуляторныйкласс-'поли Асигнальнаяпоследовательность"
/ген="Е1А"
ген 1555..3953
/ген="Е1В" регуляторный 1555..1664
/регуляторныйкласс-'ТАТАбокс"
/ген="Е1В"
CDS 1601..2179
/ген="Е1В" /начало_кодона=1
/продукт="контрольный белок Е1В 19К"
//TpaHCJM4ra="MEIWTVLEDFHQTRQLLENSSAEVSYLWRFCFGGPLAKLVYRAK
QDYKDQFEDILRECPGIFDSLNLGHQSHFNQSILRALDFSTPGRTTAAVAFFAFILDK
WSQETHFSRDYRLDCLAVALWRTWRCQRLNAISGYLPVQPVDTLRILSLQSPQEHQRR
QQPQQEQQQEEEEDREENLRAGLDPPVAEEEE"
CDS 1906..3420
CDS 1906..3420 /ген="Е1В" /начало_кодона=1
/продукт="контрольный белок Е1В 55К" /TpaHCJMHHH="MESRNPFQQGLPSGLLSSSFVENMEVPAPECNLRLLASTAGRHA
EDPESPVTPGTPTPPAAAAGAAARGGGGPRREPESRSGPSGGGGGGVADLFPELRRVL
TRSSSGRERGIKRERHEETSHRTELTVSLMSRRRPESWWHEVQSQGIDEVSVMHEKY
SLEQVKTCmEPEDDWEVAKNYAKLALKPDKKYKITKLINIRNSCYISGNGAEVEIS
TQERAAFRCCMMNMYPGVVGMEGVTFMNTRFRGDGYNGVVFMANTKLTVHGCSFFGFN
NMCIEAWGSVSVRGCSFSANWMGVVGRTKSVVSVKKCLFERCHLGVMSEGEAKVKHCA
STETGCFVLIKGNAKVKHNMICGASDERGYQMLTCAGGNSHMLATVHVASHPRKTWPE
FEHNVMTRCNVHLGSRRGMFMPYQCNMQFVKVLLEPDAMSRVSLTGVFDMNVELWKIL
RYDESKTRCRACECGGKHARLQPVCVEVTEDLRPDHLVLSCNGTEFGSSGEESD"
ген 3454..3953
/ген="ГХ" регуляторный 3454..3459
/регуляторныйкласс-'ТАТАбокс"
/ген="1Х"
CDS 3505..3933
/ген="1Х"
/продукт="капсидный белок IX"
/тpaнcляция="MSGSASFEGGVFSPYLTGRLPSWAGVRQNVMGSTVDGRPVQPAN SSTLTYATL SSS S VD АААААА A AS AAS AVRGM ALG AGYYS SLVANSS STNNP ASLNEE KLLLLMAQLEALTQRLGELTQQVAQLQAETRAAVATVKTK" регуляторный 3929..3934
/регуляторный_класс="поли Асигнальнаяпоследовательность"
/примечание="Е1В, IX" регуляторный 3944..3949
/регуляторный_класс="поли А сигнальная последовательность"
/примечание="Е1В. IX" регуляторный 3948.. 3953
/регуляторный_класс="поли Асигнальнаяпоследовательность"
/примечание="Е1В, IX" ген комплемент (3992..26364)
/ген="Е2В" ген комплемент(3992..5735)
/ген="1Уа2" регуляторный комплемент(3 992.. 3997)
/регуляторный_класс="поли А сигнальная последовательность"
/примечание="1Уа2, Е2В"
CDS комплемент(присоединение(3993..5326,5605..5617))
/ген="1Уа2"
/продукт="инкапсулирование белка IVa2" /TpaHCJMmM="METRGRRPGAVLDQPDEPEAHPRKRPARRAPLHRDGDHADADPA TLEGPDPGLAGRPSPGALLPQSPQPAKRGGLLDRDALEHITELWDRLELLQQTLSKMP MADGLKPLKNFASLQELLSLGGEPiLAELVRENMHVREMMNEVAPLLREDGSCLSLNY HLQPVIGVIYGPTGCGKSQLLRNLLSAQLISPAPETVFFIAPQVDMIPPSELKAWEMQ ICEGNYAPGIEGTFVPQSGTLRPKFIKMAYDELTQDHNYDVSDPRNVFAQAAAHGPIA IIMDECMENLGGHKGVSKFFHAFPSKLHDKFPKCTGYTVLVVLHNMNPRRDLGGNIAN LKIQAKMHLISPRMHPSQLNRFVNTYTKGLPVAISLLLKDIVQHHALRPCYDWVIYNT TPEHEALQWSYLHPPJDGLMPMYLNIQAHLYRVLEKfflRVLNDRJJRWSRAYRARKIK1'
CDS комплемент(присоединение(5096..8659,13841..13849))
/ген="Е2В" /ЕС_номер="2.7.7.7" /продукт="ДНК полимераза" /TpaHCjramM="MALVQraGSRGLHPEASDPGRQPSPJlRSRQSSPGAVPEPARARR RRAPAAPASGPRAAPAARRASSPPLLSMEPPPPKKKRGTVVAPQGHGTLQAVDVATNG AVEKYHLDLPRALEKLLQVNRAPPLPTDLTPQRLRTLDSSGLRALVLALRPVRAEVW TCLPRGLVSMTTIEADDGHADGQDVVQHQMQPPALHCPLKFLVKGTQVQLVQHVHPVQ RCEHCGRLYKHKHECSARRRHFYFHHINSHSSNWWQEIQFFPIGSHPRTERLFLTYDV ETYTWMGSFGKQLVPFMLVMKLSGDPPLVELAHDLALQLKWDRWHGDPRTFYCVTPEK MAVGQQFRQYRDRLQTALAVDLWTSFLSANPHVADWALEQHGLSDPAELTYDELKKLP HVKGRPRFVELYIVGHNINGFDEIVLAAQVINNRAEVPQPFRITRNFMPRAGKILFND VTFALPNPAYKKRTDFQLWEQGGCDDLDFKHQFLKVMVRDTFALTHTSLRKAAQAYAL PVEKGCCAYKAVNQFYMVGSYRADQDGFPLEEYWKDREEFLLNRELWKQKGQLKYDII QETLD YC ALD VL VTAEL VAKLQD SYAHFIRD S VGLPH AHFNIFQRPTIS SNSH AIFRQ IVYRAEKPQRSNLGTGLLAPSHELYDYVRASIRGGRCYPTYIGVLQEPLYVYDICGMY ASALTHPMPWGTPLSPYERALAVRDWQASLDDLGTCISYFDPELLPGIFTVDADPPDE LMLDPLPPFCSPJiGGRLCWTNEPLRGEVATSVDLITLHNRGWRVRIVPDELTTVFPEW KCVAREYVQLNIAAKERADKEKNQTMRSIAKLLSNALYGSFATKLDNKKIVFSDQMDE GLMKGVSNGTVNIKS S SFLETDNLS AE VMP AFEREYLPQQL ALLD SDPED SEDEQGP A PFYTPPAGTPGHVAYTYKPITFLDVDEGDMCLHTLEKVDPLVDNDRYPSHVASFVLAW TRAFVSEWAGFLYDEDRGTPLEDRPIKSVYGDTDSLFVTQRGHELMETRGKKRIKKHG GNLVFDPDRPDLTWLVECETVCASCGADAYAPESVFLAPKLYALKSLLCPVCGHTSKG KLRAKGHAAEALNYELMLNCYLADAQGADRERFSTSRMSLKRTLASAQPGAHPFTVTE TTLTRTLRPWKDRTLASLDAHRLVPYSRSRPNPRNEEVCWIEMP1' интрон комплемент(5327..5604)
/ген="1Уа2"
ген 5917..33604
/ген='Ъ5" ген 5917..27469
/ген='Ъ4" ген 5917..21839
/ген='ЪЗ"
ген 5917.. 17466
/ген='Ъ2"
ген 5917.. 13827
/ген="Ы" регуляторный 5917..5922
/регуляторныйкласс-'ТАТАбокс" /примечание-'L" интрон 5989.7009
/примечание="между L1 и L2 лидерными последовательностями" интрон 7082.9518
/примечание="между L2 и L3 лидерными последовательностями" интрон 7082..7850
/примечание="между L2 и i лидерными последовательностями; предшествует белку 13,6К CDS"
CDS присоединение(7877..8275,9519..9539)
/ген="Ы"
/начало кодона=1
/продукт="белок 13.6К" /TpaHCJMura="MRADGEELDLLPPVGGMAVDVMEVEMPTARRALVLVFIQASAVL ATLHGMHVLHELYLGSFDEEFQWAVERWRLHLVLYYVLAIGVAIVCLDGGHADEPARE AGPDLGSDGSESEDEGAQAGAVQGPETLRSQGLRART"
CDS комплемент(присоединение(8458..10392,13841..13849))
/ген="Е2В"
/продукт="предшественник конечного белка рТР"
/TpaHCJMHHH="MALSmDCARLTGQTAATMNYFLPLRNIWNRVREFPRASTTAAG ITWMSRYiYGYHRLMLEDLAPGAPATERWPLYRQPPPHFLVGYQYLVRTCNDYIFDTR AYSRLKYHELVRPGHQTVNWSVMANCSYTINTGAYHRFVDFDDFQTTLTQIQQAILAE RVVADLALVQPQRGFGLTRMHGRAGEEEVPVERLMQDYYKDLARCQDHAWGMADRLRI QQAGPKDLVLLATIRRLRTAYFNFITSSIARPPPDQIPEEQETGLSLPCDCDWLEAFV QRFSDPVDLETLRSLRGVPTGQLIRCIVSALSLPNGDPPGGHLEMRGGVFTLRPREDG RAVTETMRRRRGETIERFIDRLPVRRRRRRAPPPPPPPEEEVEEMLVEEEEEEMEEEP
PGAFEbffiWATIAELIPXLEEELTVSARNSQFFNFAVDFYEAMERLEALGDVSEMPLR RWIMYFFVTEHIATTLNYLYQRLCNYAVFTRHVELNLAQVVMRARDPDGAVVYSRVWN EAGMNAFSQLMGRISNDLAATVERAGRGDLQEEEffiQFMTEIAYQDNSGDVQEE.RQA AVNDTEIDSVELSFRFKLTGPVAFTQRRQIQDVNRRVVAHASLLRAQYQNLPARGADV PLPPLPPGPEPPLPPGARPRRRF" интрон комплемент(8660..26296)
/ген="Е2В" интрон 9606.32253 /ген='Ъ5"
/примечание="предшествует фибрилле CDS" интрон 9606.26463 /ген='Ъ4"
/примечание="предшествует предшественнику капсидного белка pVIII CDS" интрон 9606.25554 /ген='Ъ4"
/примечание="предшествует белку ЗЗК и белка инкапсулирования 22К CDSs" интрон 9606.23430 /ген='Ъ4"
/примечание="предшествует белку сборки гексона ШОК CDS" интрон 9606.21177 /ген='ЪЗ"
/примечание="предшествует протеазе CDS" интрон 9606.18296 /ген="ЬЗ"
/примечание="предшествует гексону CDS" интрон 9606.17508 /ген='ЪЗ"
/примечание="предшествует предшественнику капсидного белка pVI CDS" интрон 9606.17201 /ген='Ъ2"
/примечание="предшествует предшественнику корового белка рХ CDS" интрон 9606.16132 /ген='Ъ2"
/примечание="предшествует коровому белку V CDS" интрон 9606.15498 /ген="Ь2"
/примечание-'предшествует предшественнику корового белкаpVII CDS" интрон 9606.13887 /ген='Ъ2"
/примечание="предшествует основанию пентона CDS" интрон 9606.12043 /ген="Ы"
/примечание="предшествует предшественнику капсидного белка рШа CDS" интрон 9606.10844 /ген="Ы"
/примечание-'предшествует белку инкапсулирования 52К CDS" интрон комплемент(10393..26296)
/ген="Е2В"
ген 10426.. 10585
/ген="УА1" прочаяРНК 10426.. 10585
/ген="УА1"
/продукт="вирус-ассоциированная РНК I"
ген 10648.. 10818
/ген="УАП" прочаяРНК 10648.. 10818
/ген="УАП"
/продукт="вирус-ассоциированная РНК П"
CDS 10845..12020
/ген="Ы"
/продукт=" белок инкапсулирования 52К"
/TpaHCJMHHH="MHPVLRQMRPHPPPQPPLPQQQQQPALLPPPQQQQPATTAAAAV
SGAGVQYDLALEEGEGLAPiGASSPEPJIPRVQMKRDAREAYWKQNLFRDRSGEEPEE
MRASRFHAGRELRRGLDRKRVLRDEDFEADELTGISPARAHVAAANLVTAYEQTVKEE
SNFQKSFNNHVRTLIAREEVTLGLMHLWDLLEAIVQNPTSKPLTAQLFLVVQHSRDNE
TFREALLNITEPEGRWLLDLVNILQSIVVQERGLPLSEKLAAINFSVLSLGKYYARKI
YKTPYWmKEVKroGFYMRMTLKVLTLSDDLGVYRNDRMHRAVSASRRRELSDQELM
HSLQRALTGAGTEGESYFDMGADLRWQPSRRALEAAGGVPYVEEVDDEEEEGEYLED"
CDS 12044..13810
/ген="Ы"
/продукт="предшественник капсидного белка рШа"
/TpaHCJMHHH="MQQQPPPPPPDPAMRAALQSQPSGINSSDDWTQAMQRIMALTTR NPEAFRQQPQANRLSAILEAVVPSRSNPraEKVLAIVNALVENKAIRGDEAGLVYNAL LERVARYNSTNVQTNLDRMVTDVREAVSQRERFHRESNLGSMVALNAFLSTQPANVPR GQEDYTNFISALRLMVAEVPQSEVYQSGPDYFFQTSRQGLQTVNLSQAFKNLQGLWGV Q АР VGDRAT VS SLLTPNSRLLLLL VAPFTD SGS VSRD S YLGYLLNL YRE AIGQ AH VDE QTYQEITHVSRALGQEDPGNLEATLNFLLTNRSQKIPPQYALSTEEERILRYVQQSVG LFLMQEGATPSAALDMTARNMEPSMYARNRPFINKLMDYLHRAAAMNSDYFTNAILNP HWLPPPGFYTGEYDMPDPNDGFLWDD VD S S VFSPRPTTTT VWKKEGGDRRP S S AL SGR AGAAAAVPEAASPFPSLPFSLNSVRSSELGRLTRPRLLGEEEYLNDSLLKPEREKNFP NNGIESL VDKMSRWKTY AHEHRDEPRAS S AGTRRRQRHDRQRGL VWDDED S ADD S S VL DLGGSGGGNPFAHLRPRIGRLM" регуляторный 13822.. 13827
/регуляторный_класс="поли Асигнальнаяпоследовательность"
/ген="Ы"
CDS 13889..15511
/ген='Ъ2"
/продукт="основание пентона"
/TpaHCJMHHH="MMRRVYPEGPPPSYESVMQQAVAAAMQPPLEAPYVPPRYLAPTE GRNSIRYSELAPLYDTTRLYLVDNKSADIASLNYQNDHSNFLTTVVQNNDFTPTEAST QTINFDERSRWGGQLKTIMHTNMPNVNEFMYSNKFKARVMVSRKTPNGVTVGDDYDGS QDELTYEWVEFELPEGNFSVTMTIDLMNNAIIDNYLAVGRQNGVLESDIGVKFDTRNF RLGWDPVTELVMPGVYTNEAFHPDIVLLPGCGVDFTESRLSNLLGIRKRQPFQEGFQI L YEDLE GGNIP ALLD VE AYEE SKEK АЕ АЕ ATT А V AT A AT V AD AT VTRGDTF ATQ АЕЕ А AALAATDDSESKIVIKPVEKDSKNRSYNVLPDGKNTAYRSWYLAYNYGDPEKGVRSWT LLTTSDVTCGVEQVYWSLPDMMQDPVTFRSTRQVSNYPVVGAELLPVYSKSFFNEQAV YSQQLRAFTSLTHVFNRFPENQILVRPPAPTITTVSENVPALTDHGTLPLRSSIRGVQ R VT VTD ARRRTCP YV YK AL G V V APR VL S SRTF" интрон комплемент(14013..26296)
/ген="Е2В"
/примечание="предшествует ДНК полимеразе и предшественнику конечного белка
рТР CDS"
CDS 15515..16099
/ген='Ъ2"
/продукт="предшественнику корового белка pVII"
/TpaHCJMHHH="MSILISPSNNTGWGLRAPSKMYGGARQRSTQHPVRVRGHFRAPW
GALKGRVRSRTTVDDVIDQVVADARNYTPAAAPASTVDAVIDSVVADARRYARAKSRR
RRIARRHRSTP AMRAARALLRRARRTGRRAMLR AARR AAS GS S S AGRTRRR AATA AAA
AIASMSRPRRGNVYWVRDAATGVRVPVRTRPPRT"
CDS 16144..17181
/ген='Ъ2"
/продукт="коровый белок V"
/TpaHCJMHHH="MSK№YKEEMLQVIAPEIYGPAAAVKEEP^RKLKRVKKDKKEE
EDDGLVEFVREFAPRRRVQWRGRKVKPVLRPGTTVVFTPGERSGSASKRSYDEVYGDE
DILEQAVERLGEFAYGKRSRPAPLKEEAVSIPLDHGNPTPSLKPVTLQQVLPSAAPRR
GFKREGGEDLYPTMQLMVPKRQKLEDVLEHMKVDPEVQPEVKVRPIKQVAPGLGVQTV
DIKIPTEPMETQTEPVKPSTSTMEVQTDPWMPAASTTTTRRRRKYGAASLLMPNYALH
PSIlPTPGYRGTRFYRGYTSSRRRKTTTRRRRRSRRSSTATSALVRRVYRSGREPLTL
PRARYHPSIAI"
CDS 17204.. 17437
/ген='Ъ2"
/продукт="предшественник корового белка рХ"
TpaHCJMHHH="MALTCRLRVPITGYRGRKPRRRRLTGNGLRRHHHRRRRAISKRL GGGFLP АЫРП AAAIGAIPGI AS V AVQ ASQRH" регуляторный 17461.. 17466
/регуляторный_класс="поли Асигнальнаяпоследовательность"
/ген='Ъ2"
CDS 17509..18237
/ген='ЪЗ"
/продукт="предшественник капсидного белка pVI"
/TpaHCJMHHH="MEDINFSSLAPRHGTRPFMGTWSDIGNSQLNGGAFNWSSLWSGL KNFGSTLKTYGNKAWNSSTGQALPJiKLKEQNFQQKVVDGLASGINGVVDLANQAVQKQ INSPXDAVTPAGSVEMPQVEEELPPLDKRGDKRPRPDAEETLLTHTDEPPPYEEAVKL GLPTTRP VAPL ATGVLKP S S S SQPATLDLPPPASRPSTVAKPLPPVAVASRAPRGRPQ ANWQSTLNSIVGLGVQSVKRRRCY"
CDS 18329..21154 /ген='ЪЗ"
/примечание="капсидный белок П" /продукт="гексон"
/транс ляция="М ATP SMLPQW AYMHIAGQD ASE YL SPGL VQF AR ATDT YF SL GNK FRNPTVAPTHDVTTDRSQRLTLRFVPVDREDNTYSYKVRYTLAVGDNRVLDMASTYFD IRGVLDRGPSFKPYSGTAYNSLAPKGAPNTSQWKDSDSKMHTFGVAAMPGVVGKKIEA DGLPIGIDSSSGTDTIiYADKTFQPEPQVGSDSWVDTNGAEEKYGGRALKDTTNMKPC YGSFARPTNKEGGQANIKDSETASTTPNYDIDLAFFDSKNIAANYDPDIVMYTENVEL QTPDraiWKPGTSDESSEANLGQQAMPNRPNYIGFRDNFIGLMYYNSTGNMGVLAGQ ASQLNAVVDLQDRNTELSYQLLLDSLGDRTRYFSMWNQAVDSYDPDVRIIENHGVEDE LPNYCFPLNGVGFTDTYQGVKVKTDTAATGTNGTQWDKDDTTVSTANEIHSGNPFAME INIQANLWNFLYANVALYLPDSYKYTPANITLPTNTNTYDYMNGRVVAPSLVDAYIN IGARWSLDPMDNVNPFNHHRNAGLRYRSMLLGNGRYVPFHIQVPQKFFAIKSLLLLPG SYTYEWNFRKDVNMILQSSLGNDLRTDGASIAFTSINLYATFFPMAHNTASTLEAMLR NDTNDQSFNDYLSAANMLYPIPANATNVPISIPSRNWAAFRGWSFTRLKTRETPSLGS СРВРУРУУЗСЗГРУЬВСТРУЬКНТЖКУЗХТРВЗЗУЗ^УРСКВРЬЬТРКЕРЕХИ^ТУВС EGYNVAQCNMTKTJWFLVQMLAHYNIGYQGFYWEGYKDRMYSFFRNFQPMSRQVVDEV NYKDYQAVTLAYQHNNSGFVGYLAPTMRQGQPYPANYPYPLIGKSAVASVTQKKFLCD RVMWRIPFSSNFMSMGALTDLGQNMLYANSAHALDMNFEVDPMDESTLLYVVFEVFDV VRVHQPHRGVIEAVYLRTPFSAGNATT" CDS 21182..21802
/ген='ЪЗ"
/ЕС_номер="3.4.22.39" /продукт="протеаза"
/TpaHCJMHHH="TACGSGEQELRAILRDLGCGPCFLGTFDKRFPGFMAPHKLACAI VNTAGRETGGEHWLAFAWNPRSHTCYLFDPFGFSDERLKQIYQFEYEGLLRRSALATE DRCITLEKSTQTVQGPRSAACGLFCCMFLHAFVHWPDRPMDKNPTMNLLTGVPNGMLQ SPQVEPTLRRNQEALYRFLNAHSAYFRSHRARIEKATAFDRMNQDM" регуляторный 21834..21839
/регуляторный_класс="поли Асигнальнаяпоследовательность" /ген='ЪЗ" ген комплемент(21877..26364)
/ген="Е2А" ген комплемент(21877..25341) /ген="Е2А-Ь регуляторный комплемент(21877..)
/регуляторный_класс="поли Асигнальнаяпоследовательность" /примечание="Е2А, E2A-L" CDS комплемент(21882..23417) /ген="Е2А"
/продукт="одноцепочечный ДНК-связывающий белок" /TpaHCJMHHH="MAGRGGSQSEQRRQERTPERGRGSASRPPNRESPSPPPLPQKRH AYRRVVSDDGQEEEIVWSENSRSPSTSPPPPLPPKKKPRKTKHVPLQDISQDSEDER Q AEEEL A AVGF SFPP VRITEKD GKR VFETLDENDPLTS А А ATKMT VKNPL SLPIV S AW EKGMEVMTLLMERYRVESDLKSAFQLMPEQGEVYRRICHLYVNEEHRGIPLTFTSNKT LTTMMGRFLQGFVHSHSQIAHKNWECTGCALWLHGCTEAEGKLRCLHGTVMIQKEHTI EMDVASENGQRALKENPDRAKITQNRWGRSVVQLANNDARCCVHDAGCATNQFSSKSC GWFTEGGKAQQAFRQLEAFMKAMYPGMSSEQAQMMLIPLHCDCNHKPGCVPSMGRQT CKMTPFGMANAEDLDVEGITDATVLASVKHPALMVFQCCNPVYRNSRAQNAGPNCDFK ISAPDLLGALQLTRKLWSDSFPDLPVPKLLIPEFKWLPKYQFRNVSLPAGHAESRQNP FDF"
интрон комплемент(23427..24079)
/примечание="Е2А, E2A-L; предшествует одноцепочечному ДНК-связывающему белку CDS"
CDS 23443..25842
/ген='Ъ4"
/продукт="белок сборки гексона ШОК" /TpaHCJMiiHM="METQPSSPTSPSAPAADENQQQQNESLTAPPPSPTSDAAAAPDM
QEMEESffilDLGYVTPAEHEEELAARFSAPEENHQEQPEQEAESEQQQAGLEHGDYLS
GAEDVLIKHLARQSIIVKDALLDRAEVPLSVAELSRAYERNLFSPRVPPKRQPNGTCE
PNPPiNFYPWAWEALATYHLFFKNQRIPVSCRAl^TRADALLNLGPGARLPDITSL
EEWKIFEGLGSDETRAANALQGSGEEHEHHSALVELEGDNARLAVLKRTVELTHFAY
P ALNLPPKVMS AVMDQ VLKRASPL SEEEMQDPES SDEGKP VVSDEQL ARWL GAS STP
QSLEEPJ^MMAVVLVTVELECLRRFFADAETLRKVEENLHYLFRHGFVRQACKISNV
ELTmVSYMGILHENRLGQNVLHTTLRGEARRDYIRDCVYLYLCHTWQTGMGWQQCL
EEQNLKELCKLLQKNLKALWTGFDERTTASDLADLIFPERLRLTLRNGLPDFMSQSML
QNFRSFILERSGILPATCSALPSDFVPLTFRECPPPLWSHCYLLRLANYLAYHSDVffi
DVSSEGLLECHCRCNLCTPHRSLACNPQLLSETQIIGTFELQGPGEGKGGLKLTPGLW
TSAYLRKFVPEDYHPFEIRFYEDQSQPPKAELSACVITQGAILAQLQAIQKSRQEFLL
KKGHGVYLDPQTGEELNPSFPQDAPRKQQEAESGAAAAAGGFGGRLGEQSGRGDGRLG
QHSGRGGQPARQSGGGRRGGGGGRGRSSRRQTVVLGGGESKQHGYHLRSGSGSRRPGP
интрон ко мплемент(24157..26296)
/примечание="Е2А, Е2В" интрон комплемент(24157..25253)
/ген="Е2А-Ь" регуляторный комплемент(253 36..25341)
/регуляторныйкласс-'ТАТАбокс"
/ген="Е2А-Ь"
CDS присоединение(25556..25886,26056..26399) /ген='Ъ4"
/продукт="белок ЗЗК"
//TpaHCJM4HM="MPRGS SKKLKVELPLPPEDLEED WES SQ AEEMEDWD STQAEED S LQD SLEEEDE VEEE АЕЕЕ AAAARP S S SAEEKAS STDTIS APGRGRGGRAHSRWDETGR FPNPTTQTAPTT VSKKRQKP S SS SRKP АА AAA ARKST AAAGGLRIAANEP AQTRELRN RIFPTLYAIFQQSRGQEQELKVKNRSLRSLTRSCLYHKSEDQLQRTLEDAEALFNKYC ALTLKE" CDS 25556..26125
/ген='Ъ4"
/продукт="инкапсулирование белок 22К"
/транс jramra="MPRGS SKKLKVELPLPPEDLEED WES SQ AEEMEDWD STQAEED S LQD SLEEEDE VEEE AEEE AAAARP S S SAEEKAS STDTIS APGRGRGGRAHSRWDETGR FPNPTTQTGKKERQGYKSWRGHKNAIVSCLQACGGNISFTRRYLLFHRGVOTPRNILH YYRHLH SP YYCFQEE AETQQQQQKT S GS S" интрон 25887..26055
/ген='Ъ4"
регуляторный комплемент(26388..26393)
/регуляторный_класс="ТАТА_бокс"
CDS 26471..27154
/ген='Ъ4"
/продукт="предшественник капсидного белка pVIII"
/TpaHCJMHHH="MSKEIPTPYMWSYQPQMGLAAGAAQDYSTRMNWLSAGPAMISRV NDIRAHRNQILLEQSAITATPRHHLNPRNWPAALVYQEIPQPTTVLLPRDAQAEVQLT NSGVQLAGGAALCRHRPAQGIKRLVIRGRGTQLNDEVVSSSLGLRPDGVFQLAGSGRS SFTPRQA\TTLESSSSQPRSGGIGTLQFVEEFTPSVYFNPFSGSPGHYPDEFIPNFDA ISESVDGYD" ген 26836..32075
/ген="ЕЗ" регуляторный 26836..26842
/регуляторный_класс="ТАТА_бокс" /ген="ЕЗ" интрон 26888..31546 /ген="ЕЗ"
/примечание="предшествует контрольному белку ЕЗ 14.7К CDS" интрон 26888..31098 /ген="ЕЗ"
/примечание="предшествует мембранному белку ЕЗ RID-бета CDS" интрон 26888..30849 /ген="ЕЗ"
/примечание-'предшествует мембранному белку ЕЗ RID-альфа CDS" интрон 26888..29956 /ген="ЕЗ"
/примечание="предшествует мембранному гликопротеину ЕЗ CRl-гамма CDS" интрон 26888..28596 /ген="ЕЗ"
/примечание="предшествует мембранному гликопротеину ЕЗ CRl-бета CDS" интрон 26888..28011 /ген="ЕЗ"
/примечание="предшествует мембранному гликопротеину ЕЗ gpl9K CDS" интрон 26888..27370 /ген="ЕЗ"
/примечание="предшествует мембранному гликопротеину ЕЗ CRl-альфа CDS" CDS 27155..27475 /ген="ЕЗ"
/продукт="контрольный белок ЕЗ 12.5К"
/TpaHCJMHHH=''MSHGGAADLAPiPJILDHCPJlFRCFARDLAEFAYFELPEEHPQGP АНСУКХУУЕССЬВЗНЬЬКГЕЗрРЛЬУЕБШдсрТЬЬТЬУСЮКНРСЬНЕЗЬССЬЬСТЕ YNKS" CDS 27429..28055
/ген="ЕЗ"
/продукт="мембранный гликопротеин ЕЗ CRl-альфа"
/TpaHCJMHHH="MKVFVVCCVLSIIKAEISDYSGLDCGVPAINRSLFFTGNETELQ LQCKPHKXYLTWLFQGSPIAVVNHCDNDGVLLSGPANLTFSTRRSKLQLFQPFLPGTY QCVSGPCraTT^IPNTTAPLPATNNQTmQrmr^^LSESOTTTHTGGELRGriPTSGI YYGPWEVVGLIALGLVAGGLLALCYLYLPCCSYLVVLCCWFKKWGRSP" регуляторный 27464..27469
/регуляторный_класс="поли Асигнальнаяпоследовательность"
/ген="Ь4" CDS 28037..28570
/ген="ЕЗ"
/продукт="мембранный гликопротеин ЕЗ gpl9K"
/TpaHCjra4HH=,'MGOTLVSCGVLVAV\aJSIVGLGGAAVVKEEKADPCLHFNPDKC QLSFQPDGNRCTVLIKCGWECENVRffiYNNKTRNNTLASWQPGDPEWYTVSVPGADG SPRTVNOTFIFAHMCDTVMWMSKQYDMWPPTKENIVVFSIAYSLCTALITAIVCLSIH МЫ AIRPRNN AEKEKQP" CDS 28600..29305
/ген="ЕЗ"
/продукт="мембранный гликопротеин ЕЗ CRl-бета"
/TpaHCJMHHM="MASVTALTIFLGLVGTSSTFQHINKTVYAGSNSVLPGHQSHQKV SWYWYDKSNTPVTLCKGHQTPINRSGIFFKCNHNNITLLSITKHYSGTYYGTNFNIKQ DTYYSVTVLDPTTPRTTTKPTTTKRHTKPKTTKKTTVKTTTTRTTTTTEATTSTTLAA TTHTHTELTLQTTNDLIALLQKGDNSTTSNEEIPRSMIGIIVAVVVCMLIIALCMVYY AFCYRKHRLNDKLEHL" прочаяхарактеристика 29636..29946
/примечание="остаточная нефункциональная 3'-область мембранного
гликопротеина ЕЗ CRl-гамма CDS, которая является интактной у других членов этих видов;
лишены акцептора сплайсинга и 5'-области"
CDS 29961..30857
/ген="ЕЗ"
/продукт="мембранный гликопротеин ЕЗ CRl-дельта" /TpaHCJMHHM="MKAVSALVFCSLIGIVFSAGFLKNLTiYEGENATLVGISGQNVS WLKYHLDGWKDICDWNVTVYTCNGVNLTITNATQDQNGRFKGQSFTRNNGYESHNMFI YDVTVIRNETATTTQMPTTHSSTTTTMQTTQTTTFYTSTQHMTTTTAAKPSSAAPQPQ ALALIAAQPSTTTRTNEQTTDFLSTVESHTTATSSAFSSTANLSSLSSTPISPATTTP SPAPLPTPLKQTEDSGMQWQITLLIVIGLVILAVLLYYIFCRRIPNAHRKPVYKPIVD GQPEPLQVEGGLRNLLFSFTVW" CDS 30865..31140 /ген="ЕЗ"
/продукт="мембранный белок ЕЗ RID-альфа"
/TpaHCj^HH="MIPRQFLITILICLLQVCATLALVANASPDCIGPFASYVLFAFV TCICCCSIVCLLITFFQFIDWIFVRIAYLRHHPQYRDQRVARLLRLL" CDS 31146..31577 /ген="ЕЗ" /начало кодона=1
/продукт="мембранный белок ЕЗ RID-бета"
/TpaHCJMHHH=,'MRALLLLALLLLVLPRPVNPRSPTQSPEEVRKCKFQEPWKFLKC YRQKSDMHPSWIMIIGIVNILACTLISFVIYPCFDFGWNSPEALYLPPEPDTPPQQPQ AHALPPPQPRPQYMPILDYEAEPQRPMLPAISYFNLTGGDD" CDS 31570..31977
/ген="ЕЗ"
/примечание="семейство 12,5К" /продукт="контрольный белок ЕЗ 14,7К"
/TpaHCJMHHH=''MTDPLANNNVNDLLLDMDGRASEQRLAQLRIRQQQERAVKELQD GIAIHQCKKGIFCLVKQAKISYEVTQTDHRLSYELLQQRQKFTCLVGVM'IVITQQSG DTKGCIHCSCDSPDCVHTLIKTLCGLRDLLPMN" регуляторный 32001..32006
/регуляторный_класс="поли Асигнальнаяпоследовательность"
/ген="ЕЗ" регуляторный 32070..32075
/регуляторный_класс="поли Асигнальнаяпоследовательность"
/ген="ЕЗ" CDS 32254..33531
/ген='Ъ5"
/примечание="капсидный белок IV"
/продукт=" фибрилла" /TpaHCJMHHM="MSKKRVRVDDDFDPVYPYDADNAPTVPFINPPFVSSDGFQEKPL
GVLSLRLADPVTmNGEITLKLGEGVDLDSSGKLISNTATKAAAPLSFSNNTISLNMD HPFYTKDGKLSLQVSPPLNILRTSILNTLALGFGSGLGLRGSALAVQLVSPLTFDTDG NIKLTLDRGLHVTTGDAIESNISWAKGLKFEDGAIATNIGNGLEFGSSSTETGVDDAY PIQVKLGSGLSFDSTGAIMAGNKEDDKLTLWTTPDPSPNCQILAENDAKLTLCLmCG SQILATVSVLVVGSGNLNPITGTVSSAQVFLRFDANGVLLTEHSTLKKYWGYRQGDSI DGTPYTNAVGFMPNLKAYPKSQSSTTKNNIVGQVYMNGDVSKPMLLTITLNGTDDSNS TYSMSFSYTWTNGSYVGATFGANSYTFSYIAQE" регуляторный 33599..33604
/регуляторный_класс="поли Асигнальнаяпоследовательность"
/ген="Ь5" ген комплемент(33620..36319)
/ген="Е4"
регуляторный комплемент(3 3620..33625)
/регуляторный_класс="поли Асигнальнаяпоследовательность" /ген="Е4"
CDS комплемент(присоединение(33638..33889,34621..34791))
/ген="Е4"
/продукт="контрольный белок E4orf6/7"
/TpaHCJMHHH="MSESNCIMTRSRARSAASRHHPYRPAPLPRCEETETRASLVEDH PVLPDCDTLSMHNITVIPTTEDNPQLLSCEVQMRECPEGFISLTDPRLARSETVWNVE TKSMSITNGVQMFKAVRGERVVYSMSWEGGGKITARIL"
CDS комплемент(33886..34791)
/ген="Е4"
/примечание="Е4ог1"5; 34К семейство"
/продукт="контрольный белок Е4 34К" /TpaHCJMHHM="MSESNCIMTRSRARSAASRHHPYRPAPLPRCEETETRASLVEDH
PVLPDCDTLSMHNVSSVRGLPCSAGFAVLQEFPVPWDMVLTPEELRVLKRCMSVCLCC
ANroLFSSQMfflGYERWVLHCHCRDPGSLRCMAGGAVLALWFRRIIRGCMFNQRVMWY
REVWffiHMPKE^YMGSWWRGRHLIYL^
VVLCCTYCSDL SEIRMRCC ARRTRRLMLRAVGIMLRESLDPDPL S S SLTERRRQRLLR GLMRHHRPIPF AD YD SHRRS SASSR" интрон комплемент(33890..34620) /ген="Е4"
CDS комплемент(34697..35062)
/ген="Е4"
/продукт="контрольный белок E4orf4"
/трансляция="МУЬРУЬР8РАУТЕТддМСПтСЬАН8ТУУВУ1КА1БШВС1Р1Т PEALDLLHGL№mFYNFNTERSKPJ^PJlPJlSVCSARTRFCYSKYENVPJCQLHHDTVA STISRVPPSPVSAGPLTTL" интрон комплемент(34815..36232) /ген="Е4"
/примечание-'предшествует контрольному белку Е4 34К CDS" CDS комплемент(35072..35425) /ген="Е4"
/продукт="контрольный белок E4orf3"
/тpaнcляц]Iя=,'MRVCLPJvlPVEGAL№LFIMAGLDLPQELVRIIQGWKNENYLGMV QECNMMIEELENPPAFAIVLFLDVRVEALLEATVEHLENRITFDLAVIFHQHSGGERC HLRDLHFE VLRDRLD" интрон комплемент(35136..36232)
/ген="Е4"
/примечание-'предшествует контрольному белку E4orf4 CDS" CDS комплемент(35422..35811) /ген="Е4"
/продукт="контрольный белок E4orf2" /тpaнcляция="MLERTACIYSIVVPEALNVHLEDFSFVDFLKNCLGDFLSSYLED
ITGSSQHAYSSLAFGNAHWGGLRFICTVACPNLIPGGPMAKNFGEDMKEYLQLLLREE LRDRGREFDIPL VNLLQ VNQEQNILEL" интрон комплемент(35455..36232) /ген="Е4"
/примечание-'предшествует контрольному белку E4orf3 CDS" интрон комплемент(35827..36232) /ген="Е4"
/примечание="предшествует контрольному белку E4orf2 CDS" CDS комплемент(35851.. 36225) /ген="Е4"
/примечание="видоспецифичный; DURP семейство" /продукт="контрольный белок E4orfl"
/TpaHCjrauroi="MDAEALYVYLEGSGALLPVQEGSNYILYAPENFVLHPHGIALLD LRLSIVVPYCFLGRFFSLADANVPGVYSSCRIIHAGHRERLSVMVFNHSDNFYEGRAG DPVACLVLERTIYPPVRQASMV" регуляторный комплемент(36314..36319) /регуляторныйкласс-'ТАТАбокс" /ген="Е4" обл. повтора 36515..36643
/общепринятое название-'ITR"
/rpt_Tim=инвертированный
Аннотация последовательности ChAdl55 дикого типа (SEQ Ш N0: 19) последовательность представлена ниже.
ЛОКУС ChAdl55 37830 п.о. ДНК линейная 10-июня-2015
ОПРЕДЕЛЕНИЕ аденовирус шимпанзе 155, полный геном.
КОММЕНТАРИИ Аннотация согласно выравниванию ChAdl55 по сравнению с человеческим аденовирусом 2 эталонного штамма NC 001405 Две предполагаемые ORF в области ЕЗ добавлены вручную СВОЙСТВА Локализация/Определители источник 1..37830
/организм=" аденовирус шимпанзе155" /мол_тип=" геномная ДНК" /aKpoHHM="ChAdl55" обл. повтора 1..101
/общепринятое название-'ITR"
/фт_тип=инвертированный ген 466.. 1622
/ген="Е1А" ТАТАсигнал 466.All
/ген="Е1А" первтранскрипт 497.. 1622
/ген="Е1А"
CDS присоединение(577.. 1117,1231.. 1532)
/ген="Е1А"
/продукт="Е 1A 280R" CDS присоединение(577..979,1231..1532)
/ген="Е1А"
/продукт="Е1А_24311" поли Асигнал 1600.. 1605
/ген="Е1А" ген 1662..4131
/ген="Е1В" ТАТАсигнал 1662.. 1667
/ген="Е1В" перв.транскрипт 1692..4131
/ген="Е1В" CDS 1704..2267
/ген="Е1В"
/продукт="Е1В_19К" CDS 2009..3532
/ген="Е1В"
/продукт="Е1В_55К"
ген 3571..4131
/ген="1Х" ТАТАсигнал 3571..3576
/ген="1Х" перв. транскрипт 3601..4131
/ген="ГХ" CDS 3628..4092
/ген="1Х"
/продукт="ГХ" полиАсигнал 4097..4102
/примечание="Е1В, IX" ген комплемент(4117..27523)
/ген="Е2В" перв.транскрипт комплемент(4117..27494)
/ген="Е2В" ген комплемент(4117..5896)
/ген="1Уа2" перв.транскрипт комплемент(4117..5896)
/ген="1Уа2"
CDS комплемент(присоединение(4151..5487,5766..5778))
/ген="ГУа2"
/прод\кт="Е2В_1Уа2" поли Асигнал комплемент(4150..4155)
/примечание="1Уа2. Е2В"
CDS комплемент(присоединение(5257..8838,14209..14217))
/ген="Е2В"
/продукт="Е2В_полимераза" ген 6078..34605
/ген='Ъ5" ген 6078..28612
/ген='Ъ4" ген 6078..22658
/ген='ЪЗ"
ген 6078.. 18164
/ген='Ъ2" ген 6078.. 14216
/ген="Ы" ТАТАсигнал 6078..6083
/примечание-'!." перв.транскрипт 6109..34605
/ген="Ь5" перв.транскрипт 6109..28612
/ген="Ь4" перв.транскрипт 6109..22658
/ген="ЬЗ" перв.транскрипт 6109..18164
/ген="Ь2" перв.транскрипт 6109.. 14216
/ген="Ы"
CDS присоединение(8038..8457,9722..9742) /ген="Ы"
/продукт="Ы_13.6К"
CD S комплемент(присоединение(8637..10640,14209..14217))
/ген="Е2В"
/продукт="Е2В_рТР"
ген 10671..10832
/ген="УА1" miscPHK 10671..10832
/ген="УА1"
/продукт="УА1"
ген 10902.. 11072
/ген="УАП" miscPHK 10902.. 11072
/ген="УАП"
/продукт="УАП"
CDS 11093..12352
/ген="Ы"
/продукт="Ы_52К"
CDS 12376..14157
/ген="Ы"
/продукт="Ы_рШа" полиАсигнал 14197..14202
/ген="Ы"
CDS 14254.. 16035
/ген='Ъ2"
/продукт="Ь2_пентон"
CDS 16050.. 16646
/ген="Ь2"
/продукт="Ь2_рУП"
CDS 16719..17834
/ген="Ь2"
/продукт="Ь2_У"
CDS 17859..18104
/ген="Ь2"
/продукт="Ь2_рХ" полиАсигнал 18143..18148
/ген="Ь2"
CDS 18196..18951
/ген="ЬЗ"
/продукт="ЬЗ_р\Т"
CDS 19063..21945
/ген="ЬЗ"
/продукт="ЬЗ_гексон" CDS 21975..22604 /ген="ЬЗ"
/продукт="ЬЗ_протеаза" полиАсигнал 22630..22635
/ген="ЬЗ" ген комплемент(22632..27523)
/ген="Е2А" перв.транскрипт комплемент(22632..27494)
/ген="Е2А" ген комплемент(22632..26357)
/ген="Е2А-Ь" перв.транскрипт комплемент(22632..26328)
/ген="Е2А-Ь" поли Асигнал комплемент(22649..22654)
/примечание="Е2А, E2A-L"
CDS комплемент(22715..24367)
/ген="Е2А"
/примечание-'DBP; род общий; DBP семейство" /начало_кодона=1 /продукт="Е2А" CDS 24405..26915 /ген="Ь4"
/продукт="Ь4_100к" Т AT Асигнал комплемент(263 52..263 57) /ген="Е2А-Ь"
CDS присоединение(26602. .26941,27147. .27529)
/ген="Ь4"
/прод> кт="Ь4_ЗЗК" CDS 26602..27207 /ген="Ь4"
/прод> кт="Ь4_22К" ТАТАсигнал комплемент(27518..27523)
/примечание="Е2А, Е2В; номинальный" CDS 27604..28287
/ген="Ь4"
/продукт="Ь4_рУШ"
ген 27969..32686
/ген="ЕЗВ" ген 27969..31611
/ген="ЕЗА" ТАТАсигнал 27969..27974
/примечание="ЕЗА, ЕЗВ" перв.транскрипт 27998..32686
/ген="ЕЗВ" перв.транскрипт 27998..31611
/ген="ЕЗА" CDS 28288..28605
/ген="ЕЗА"
/продукт="ЕЗ 0RF1" полиАсигнал 28594..28599
/ген="Ь4" CDS 29103..29303
/ген="ЕЗА"
/продукт="ЕЗ ORF2" CDS 29300..29797
/ген="ЕЗА"
/продукт="ЕЗ ORF3" CDS 29826..30731
/ген="ЕЗА"
/продукт="ЕЗ ORF4" CDS 30728..31579
/ген="ЕЗА"
/продукт="ЕЗ ORF5"
CDS 31283..31579
/ген="ЕЗА"
/продукт="ЕЗ ORF6" полиАсигнал 31578..31584
/ген="ЕЗА" CDS 31591..31863
/ген="ЕЗВ"
/продукт="ЕЗ ORF7" CDS 31866..32264
/ген="ЕЗВ"
/продукт="ЕЗ ORF8" CDS 32257..32643
/ген="ЕЗВ"
/продукт="ЕЗ ORF9" полиАсигнал 32659..32664
/ген="ЕЗВ" ген комплемент( <32678..32838) /ген="и"
CDS комплемент( <32678..32838)
/ген="и"
/примечание="экзон, кодирующий неидентифицированный С-конец; род-общий" /продукт="белок U" CDS 32849..34585 /ген='Ъ5"
/продукт="Ь5_фибрилла" полиАсигнал 34581..34586
/ген='Ъ5" ген комплемент(34611..37520)
/ген="Е4"
перв. транскрипт комплемент(34611..37490) /ген="Е4"
поли А сигнал комплемент(34625..34630) /ген="Е4"
CDS комплемент(присоединение(34794..35069,35781..35954))
/ген="Е4"
/продукт="Е4 ORF7"
CDS комплемент(35070..35954)
/ген="Е4"
/продукт="Е4 ORF6"
CDS комплемент(35875..36219)
/ген="Е4"
/продукт="Е4 ORF4"
CDS комплемент(36235..36582)
/ген="Е4"
/продукт="Е4 ORF3"
CDS комплемент(36579..36971)
/ген="Е4"
/продукт="Е4 ORF2" CDS комплемент(37029..37415) /ген="Е4"
/продукт="Е4 ORF1" ТАТАсигнал комплемент(37515..37520)
/ген="Е4" обл. повтора 37740..37830
/общепринятое название-'ITR"
/ф1_тип=инвертированный
Трансгены
Аденовирусные векторы могут быть использованы для доставки нужной РНК или белковых последовательностей, например гетерологичных последовательностей, для экспрессии in vivo. Вектор может включать любой генетический элемент, включающий депротеинизированную ДНК, фаг, транспозон, космиду, эписому, плазмиду или вирус. Под "экспрессионной кассетой" (или "минигеном") подразумевается комбинация выбранного гетерологичного гена (трансгена) и других регуляторных элементов, необходимых для трансляции, транскрипции и/или экспрессии продукта этого гена в клетке-хозяине.
Как правило, аденовирусный вектор сконструирован таким образом, что экспрессионная кассета расположена в молекуле нуклеиновой кислоты, которая содержит другие аденовирусные последовательности в области, родственной выбранному
аденовирусному гену. Экспрессионная кассета может быть встроена в существующую область гена, чтобы, при необходимости, нарушить функцию этой области. Альтернативно, экспрессионная кассета может быть встроена в сайт частично или полностью удаленного аденовирусного гена. Например, экспрессионная кассета может быть расположена в сайте мутации, вставки или делеции, которая делает нефункциональными по меньшей мере один ген геномной области, выбранной из группы, состоящей из Е1А, Е1В, Е2А, Е2В, ЕЗ и Е4. Термин "делает нефункциональными" означает, что достаточная часть этой области гена удалена или иным образом разрушена, так что эта область гена больше не способна продуцировать функциональные продукты экспрессии генов. При необходимости, всю область гена можно удалить (или подходящим образом заменить экспрессионной кассетой). Соответственно, гены Е1 аденовируса удаляют и заменяют экспрессионной кассетой, состоящей из предпочтительного промотора, последовательности кДНК интересующего гена и поли-А сигнала, что приводит к репликативно-дефектному рекомбинантному вирусу.
Трансгенная последовательность также может включать репортерную последовательность, которая после экспрессии продуцирует детектируемый сигнал. Такие репортерные последовательности включают, без ограничения ими, последовательности ДНК, кодирующие Р-лактамазу, Р-галактозидазу (LacZ), щелочную фосфатазу, тимидинкиназу, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансферазу (CAT), люциферазу, связанные с мембраной белки, включающие, например, CD2, CD4, CD8, белок гемагглютинина вируса гриппа и другие, хорошо известные в данной области, высокоаффинные антитела к которым существуют или могут быть получены обычными способами, и слитые белки, содержащие мембраносвязанный белок, подходящим образом слитый с доменом антигенного тега из, среди прочего, гемагглютининам или Мус. Эти кодирующие последовательности в ассоциации с регуляторными элементами, которые управляют их экспрессией, создают сигналы, обнаруживаемые обычными способами, включающими ферментативные, радиографические, колориметрические, флуоресцентные или другие спектрографические анализы, анализ с использованием клеточного сортера с активацией флуоресценции и иммунологические анализы, включающие твердофазный иммуноферментный анализ (ELISA), радиоиммуноанализ (RIA) и иммуногистохимию.
В дополнение к трансгену экспрессионная кассета также включает обычные регуляторные элементы, которые функционально связаны с трансгеном таким образом, который позволяет осуществить их транскрипцию, трансляцию и/или экспрессию в клетке, трансфицированной аденовирусным вектором. При использовании здесь,
"функционально связанные" последовательности включают как последовательности, регулирующие экспрессию, которые являются смежными с интересующим геном, так и последовательности, регулирующие экспрессию, которые в трансположении или на расстоянии контролируют интересующий ген.
Регуляторные последовательности экспрессии включают соответствующие последовательности инициации транскрипции, терминации, промотора и энхансера; эффективные сигналы процессинга РНК, такие как сигналы сплайсинга и полиаденилирования (поли А), включающие кроличий бета-глобин поли А; последовательности, которые стабилизируют цитоплазматическую мРНК; последовательности, которые повышают эффективность трансляции (например консенсусная последовательность Козака); последовательности, которые повышают стабильность белка; и, когда это желательно, последовательности, которые повышают секрецию кодируемого продукта. Среди других последовательностей могут быть использованы химерные интроны.
"Промотор" представляет собой нуклеотидную последовательность, которая позволяет связывать РНК-полимеразу и направляет транскрипцию гена. Как правило, промотор расположен в 5'-некодирующей области гена, проксимальной к транскрипционному начальному сайту гена. Элементы последовательности внутри промоторов, которые функционируют при инициировании транскрипции, часто характеризуются консенсусными нуклеотидными последовательностями. Примеры промоторов включают, без ограничения ими, промотор бактерий, дрожжей, растений, вирусов и млекопитающих (включая людей). В данной области известно и может быть использовано большое количество регуляторных последовательностей экспрессии, включающих промоторы, которые являются внутренними, нативными, конститутивными, индуцируемыми и/или тканеспецифическими.
Примеры конститутивных промоторов включают, без ограничения ими, промотор TBG (тироксин-связывающий глобулин), промотор LTR (динный концевой повтор) ретровируса саркомы Раусса (возможно с энхансером), промотор цитомегаловируса (CMV) (возможно с энхансером CMV, см., например, Boshart et al, Cell, 41:521-530 (1985)), промотор CASI (WO2012/115980), промотор SV40, промотор дигидрофолатредуктазы, промотор Р-актина, промотор фосфоглицеринкиназы (PGK) и промотор EFla (Invitrogen).
Индуцируемые промоторы позволяют регулировать экспрессию гена и могут регулироваться экзогенно доставляемыми соединениями, факторами окружающей среды, такими как температура, или наличие определенного физиологического состояния,
например острой фазы, определенного состояния дифференцировки клетки, или только в реплицирующихся клетках. Индуцируемые промоторы и индуцируемые системы доступны из различных коммерческих источников, включая, без ограничения ими, Invitrogen, Clontech и Ariad. Многие другие системы были описаны и могут быть легко выбраны специалистом в данной области техники. Например, индуцируемые промоторы включают промотор цинк-индуцируемого металлотионеина (МТ) овцы и дексаметазон(Вех)-индуцируемый промотор вируса опухоли молочной железы мышей (MMTV). Другие индуцируемые системы включают систему промотора полимеразы Т7 (WO 98/10088); промотор экдизона насекомых (No et al, Proc. Natl. Acad. Sci. USA, 93:3346-3351 (1996)), тетрациклин-репрессируемую систему (Gossen et al, Proc. Natl. Acad. Sci. USA, 89:5547-5551 (1992)), тетрациклин-индуцируемую систему (Gossen et al, Science, 378:1766-1769 (1995), см. также Harvey et al, Curr. Opin. Chem. Biol, 2:512-518 (1998)). Другие системы включают димер FK506, VP 16 или р65 с использование кастрадиола, дифенол-мурислерона, Ки486-индуцируемую систему (Wang et al, Nat. Biotech., 15:239243 (1997) и Wang et al, Gene Ther., 4:432-441 (1997)) и рапамицин-индуцируемую систему (Magari et al, J. Clin. Invest., 100:2865-2872 (1997)). Эффективность некоторых индуцируемых промоторов увеличивается со временем. В таких случаях можно повысить эффективность таких систем посредством вставки множества репрессоров в тандеме, например TetR, связанный с TetR с помощью IRES (участок внутренней посадки рибосомы).
Трансген может быть функционально связан с тканеспецифическим промотором. Например, если необходима экспрессия в скелетной мышце, следует использовать промотор, активный в мышце. Они включают промоторы генов, кодирующих скелетный Р-актин, легкую цепь миозина 2А, дистрофии, мышечную креатинкиназу, а также синтетические мышечные промоторы с активностями выше, чем у природных промоторов (см. Li et al, Nat. Biotech., 17:241-245 (1999)). Примеры тканеспецифичных промоторов известны для печени (альбумин, Miyatake et al, J. Virol, 71:5124-32 (1997); промотор кора вируса гепатита В, Sandig et al, Gene Ther., 3:1002-9 (1996); альфа-фетопротеина (AFP), Arbuthnot et al., Hum. Gene Ther., 7: 1503-14 (1996)), костного остеокальцина (Stein et al, Mol. Biol. Rep., 24:185-96 (1997)); костного сиалопротеина (Chen et al., J. Bone Miner. Res., 11:654-64 (1996)), лимфоцитов (CD2, Hansal et al, J. Immunol, 161:1063-8 (1998); тяжелая цепь иммуноглобулина; цепь Т-клеточного рецептора), нейрональные, такие как промотор нейронспецифической энолазы (NSE) (Andersen et al, Cell. Mol. Neurobiol, 13:503-15 (1993)), гена легкой цепи нейрофиламентов (Piccioli et al, Proc. Natl. Acad. Sci. USA,
88:5611-5 (1991)), и нейронспецифического гена vgf (Piccioli et al, Neuron, 15:373-84 (1995)).
В некоторых воплощениях посттранскрипционный регуляторный элемент гепатита вируса лесного сурка (WPRE) (Zuffrey et al. (1999) J Virol; 73(4):2886-9) может быть функционально связан с трансгеном.
Конструкция аденовирусного вектора
Аденовирусные векторы образуются посредством модификации аденовируса дикого типа для экспрессии гетерологичных генов и/или удаления или инактивации нежелательных аденовирусных последовательностей. Аденовирусные векторы могут также иметь измененную эффективность репликации. Например, вектор может быть репликативно-дефектным или иметь ограниченную репликацию, так что он обладает пониженной способностью реплицироваться в некомлементирующих клетках, по сравнению с вирусом дикого типа. Это может быть обусловлено мутацией вируса, например посредством функциональной инактивации или удаления гена, участвующего в репликации, например Ela, Elb, Е2, ЕЗ or Е4.
Аденовирусные векторы по настоящему изобретению могут содержать функционально инактивированный или удаленный Е1. Таким образом, аденовирусные векторы по настоящему изобретению могут быть репликативно-дефектными из-за отсутствия способности экспрессировать аденовирусный Ela и/или Elb. Рекомбинантные аденовирусы также могут нести функциональные инактивации в других генах (см. WO 03/000283), например делеции в генах ЕЗ или Е4. Аденовирус с задержанно ранним геном ЕЗ может быть исключен из аденовирусной последовательности, которая образует часть рекомбинантного вируса. Функция ЕЗ не является необходимой для получения рекомбинантной аденовирусной частицы. Таким образом, нет необходимости заменять функцию продукта этого гена для упаковки рекомбинантного аденовируса, полезного в данном изобретении. В одном конкретном воплощении рекомбинантные аденовирусы имеют функционально делетированные гены Е1 и ЕЗ. Конструкция таких векторов описана в Roy et al., Human Gene Therapy 15:519-530, 2004.
Рекомбинантные аденовирусы также могут быть сконструированы имеющими функциональную делецию гена Е4. В конкретном воплощении рекомбинантные аденовирусы имеют функционально делетированные гены Е1 иЕ4, как описано в Colloca et al. (2012) Sci. Transl. Med. 4:1-9; Roy et al. (2004) Virol.324: 361-372. В некоторых воплощениях может быть желательно сохранить функцию Е4 ORF6. В одном воплощении нативная область Е4 ORF6 может быть заменена гетерологичным Е4 ORF6, таким как
Ad5. Таким образом, в одном конкретном воплощении аденовирусный вектор может быть функционально делетирован в Е1 и иметь область Е4 ORF6 из Ad5.
Аденовирусные векторы согласно изобретению также могут содержать функциональную делецию в задержанно раннем гене Е2а. Делеции также могут быть произведены в любом из поздних генов L1-L5 генома аденовируса. Аналогично, могут быть полезными делеции в промежуточных генах IX и IVa.
Другие делеции могут быть осуществлены в других структурных или неструктурных генах аденовируса. Вышеупомянутые делеции можно использовать по отдельности, например аденовирусная последовательность для применения в настоящем изобретении может содержать делеции только Е1. Альтернативно, делеции целых генов или их частей, эффективные для ликвидации их биологической активности, могут быть использованы в любой комбинации. Например, в одном типичном векторе аденовирусные последовательности могут иметь делеции гена Е1 и гена Е4, или генов Е1, Е2а и ЕЗ, или генов Е1 и ЕЗ (таких как функциональные делеции в Ela и Elb, и делеция по меньшей мере части ЕЗ), или генов Е1, Е2а и Е4, с делецией или без делеции ЕЗ, и так далее. Такие делеции могут быть частичными или полными делециями этих генов и могут быть использованы в комбинации с другими мутациями, такими как чувствительные к температуре мутации, для достижения нужного результата.
Эти векторы получают, используя способы, известные специалистам в данной области техники. Такие способы включают обычные методы клонирования кДНК, такие как описаны в текстах, использование перекрывающихся олигонуклеотидных последовательностей аденовирусных геномов, полимеразная цепная реакция и любой подходящий способ, который обеспечивает нужную нуклеотидную последовательность. Особенно подходящие способы включают стандартные способы гомологичной рекомбинации, такие как способы, представленные в Colloca et al. (2012) Sci. Transl. Med. 4:1-9; Roy et al. (2004) Virol.324: 361-372; Roy et al. (2010) J. of Gene Med. 13:17-25; и WO2010/085984, или способы рекомбинации, описанные в Warming et al. Nuc. Acids Res. (2005)33:e36.
Целесообразно, чтобы аденовирусная последовательность по настоящему изобретению содержала функциональную инактивацию (такую как делеция) по меньшей мере генов Е1 и Е4, возможно с функциональной инактивацией (такой как делеция) ЕЗ в сочетании с заменой гена Ad5E4orf6.
В одном воплощении аденовирус содержит функциональную инактивацию (такую как делеция) генов Е1 и Е4, с включением E4orf6 из Ad5. В таких воплощениях
аденовирус подходящим образом получают из ChAdl55, ChAd3 или ChAd63, в частности ChAd3.
Во втором воплощении аденовирус содержит функциональную инактивацию (такую как делеция) генов Е1, ЕЗ и Е4, с включением E4orf6 из Ad5. В таких воплощениях аденовирус подходящим образом получают из ChAdl55, ChAd3 или ChAd63, в частности ChAd63.
Получение аденовирусного вектора
Аденовирусные векторы могут быть получены с использованием любой подходящей клеточной линии, в которой вирус способен реплицироваться. В частности, могут быть использованы комлементирующие клеточные линии, которые обеспечивают факторы, отсутствующие в вирусном векторе, что приводит к нарушениям характеристик его репликации (например Е1). Без ограничения, такими клеточными линиями могут быть HeLa (АТСС Номер доступа. CCL 2), А549 (АТСС Номер доступа. CCL 185), НЕК 293, KB (CCL 17), Detroit (например Detroit 510, CCL 72) и клетки WI-38 (CCL 75). Эти клеточные линии доступны из Американской коллекции типовых культур, 10801 University Boulevard, Manassas, Virginia 20110-2209. Другие подходящие исходные клеточные линии могут быть получены из других источников, например клетки PER.C6(tm), которые представлены клетками, депонированными под номером ЕСАСС по. 96022940 в Европейской коллекции культур клеток животных (ЕСАСС) в Центре прикладной микробиологии и исследований (CAMR, UK) или клетками Her 96 (Crucell).
Особенно подходящей комлементирующей клеточной линией является клеточная линия Ргосе1192. Клеточная линия Ргосе1192 основана на клетках НЕК 293, которые экспрессируют аденовирусные гены Е1, трансфицированных Tet-репрессором под контролем промотора фосфоглицераткиназы-1 (PGK) человека и геном резистентности к G418 (Vitelli et al. PLOS One (2013) 8(e55435):l-9). Procell92.S адаптирована для роста в суспензионных условиях и также полезна для получения аденовирусных векторов, экспрессирующих токсичные белки (www.okairos.com/e/inners.php?m=00084, последний доступ 13 апреля 2015).
Способы доставки и доза аденовирусов
Аденовирусные векторы могут быть введены в иммуногенные композиции. Иммуногенная композиция, как описано здесь, представляет собой композицию, содержащую один или более рекомбинантных векторов, способных индуцировать иммунный ответ, например гуморальный (например антительный) и/или клеточный (например цитотоксический Т-клеточный) ответ, против трансгенного продукта,
доставляемого вектором, после доставки млекопитающему, целесообразно человеку. Рекомбинантный аденовирус может содержать (целесообразно в какой-либо из его генных делеций) ген, кодирующий нужный иммуноген, и, следовательно, может быть использован в вакцине.
Такие вакцинные или другие иммуногенные композиции могут быть приготовлены в подходящем носителе для доставки. Как правило, дозы иммуногенных композиций находятся в диапазоне, приведенном ниже в разделе "Способы доставки и доза".
Возможно, вакциная или иммуногенная композиция по изобретению может быть приготовлена так, чтобы содержать другие компоненты, включая, например, адъюванты, стабилизаторы, регуляторы рН, консерванты и тому подобное. Адъювант можно вводить с примирующей ДНК-вакциной, кодирующей антиген, для усиления антигенспецифического иммунного ответа по сравнению с иммунным ответом, генерируемым при примировании ДНК-вакциной, кодирующей только антиген.
Аденовирусный вектор может быть приготовлен для введения путем суспендирования или растворения в фармацевтически или физиологически приемлемом носителе, таком как изотонический физиологический раствор; изотонический солевой раствор или другие композиции, очевидные для специалистов в данной области. Подходящий носитель очевиден для специалистов в данной области и во многом зависит от пути введения. Композиции, описанные здесь, могут быть введены млекопитающему в композиции с замедленным высвобождением с использованием биоразлагаемого биосовместимого полимера или путем доставки на место с использованием мицелл, гелей и липосом.
В некоторых воплощениях рекомбинантный аденовирус по изобретению вводят субъекту путем внутримышечной инъекции, интравагинальной инъекции, внутривенной инъекции, внутрибрюшинной инъекции, подкожной инъекции, накожного введения, внутрикожного введения, назального введения или перорального введения. Также может быть желательной доставка в легкие. По причинам простоты и удобства обычным путем может быть внутримышечная доставка.
Если терапевтический режим включает совместное введение одного или более аденовирусных векторов и дополнительного компонента, каждый из которых приготовлен в разных композициях, их подходящим образом совместно вводят в одно и то же место или вблизи него. Например, компоненты можно вводить (например путем введения, выбранным из внутримышечного, трансдермального, внутрикожного, подкожного) на одну ту же сторону или конечность ("ко-латеральное" введение) или на противоположную
сторону или конечность ("контралатеральное" введение).
Дозы вирусного вектора зависят в первую очередь от таких факторов, как состояние, подлежащее лечению, возраст, масса тела и здоровье пациента, и, таким образом, могут варьироваться среди пациентов. Например, терапевтически эффективная доза для взрослого человека или ветеринарная доза вирусного вектора обычно содержит
5 15 8 12 8 8
от 1x10 до 1x10 вирусных частиц, например от 1x10 до 1x10 (например 1x10 , 5x10 , lxlO9, 5х109, 1х1010, 2.5х1010, 5x10ю, lxlO11 5xl0u, lxlO12 частиц). Альтернативно, вирусный вектор можно вводить в дозе, которая обычно составляет от 1x105 до 1x1010 бляшкообразующих единиц (PFU), например lxlO5 PFU, 5х105 PFU, lxlO6 PFU, 5х106 PFU, lxlO7 PFU, 5х107 PFU, lxlO8 PFU, 5xl08 PFU, lxlO9 PFU, 5xl09 PFU или lxl010PFU. Дозы варьируются в зависимости от размера животного и пути введения. Например, подходящая для человека или ветеринарная доза (для животного массой примерно 80 кг) для внутримышечной инъекции находится в диапазоне от примерно 1x109 до примерно
5x10 частиц на мл для одного места введения. Возможно можно использовать несколько мест введения. В другом примере подходящая для человека или ветеринарная доза может находиться в диапазоне от примерно 1x10й до примерно 1х1015 частиц для пероральной композиции.
Аденовирусный вектор можно количественно определить с помощью количественного ПНР-анализа (Q-PCR), например с праймерами и пробой, сконструированными на основе промоторной области CMV с использованием в качестве стандартной кривой серийного разведения плазмидной ДНК, содержащей векторный геном с экспрессионной кассетой, включающей промотор HCMV. Число копий в тестируемом образце определяют посредством метода анализа параллельной линии. Альтернативными способами количественного определения векторных частиц может быть анализ аналитический ВЭЖХ или спектрометрический способ на основе А260 нм.
Как правило, доза для человека находится в объеме от 0,5 мл до 2 мл. Таким образом, описанная здесь композиция может быть приготовлена в объеме, например, 0,5, 1,0, 1,5 или 2,0 мл дозы для человека на отдельные или комбинированные иммуногенные компоненты. Обычно используют объем 400-600 мкл, например примерно 500 мкл, в частности для введения внутримышечным путем.
Специалист в данной области может регулировать эти дозы в зависимости от пути введения и применения в качестве терапии или вакцины, для которого используется рекомбинантный вектор. Уровни экспрессии трансгена или адъюванта, уровень циркулирующего антитела можно контролировать, чтобы определить частоту введения
доз.
Терапевтические уровни или уровень иммунного ответа против белка, кодируемого выбранным трансгеном, можно контролировать, чтобы определить необходимость, если таковая имеется, в бустерных введениях. После оценки CD8+ Т-клеточного ответа, или возможно, титров антител в сыворотке может быть желательной возможные бустерные иммунизации. Возможно, аденовирусный вектор может быть доставлен в режимах единичного введения или в виде различных комбинаций, например в комбинации с режимом или курсом лечения, включающим другие активные ингредиенты или в режиме примирование-бустер.
Трансген М72
Дополнительный аспект настоящего изобретения относится к новому полинуклеотиду, кодирующему антиген М72, который оптимизирован для использования в настоящем изобретении, но также пригоден в других контекстах. Следовательно, в изобретении также предложен полинуклеотид, содержащий SEQ Ш N0: 8 или его вырожденный вариант, имеющий по меньшей мере 95% идентичность SEQ Ш N0: 8 (например по меньшей мере 98% идентичность, целесообразно по меньшей мере 99% идентичность, в частности по меньшей мере 99,5% идентичность и особенно 100% идентичность). Также предложен полинуклеотид, состоящий из SEQ Ш N0: 8 или его вырожденного варианта, имеющего по меньшей мере 95% идентичность SEQ Ш N0: 8 (например по меньшей мере 98% идентичность, целесообразно по меньшей мере 99% идентичность, в частности по меньшей мере 99,5% идентичность и особенно 100% идентичность). Под термином "вырожденный вариант" подразумевается вариант полинуклеотид а, который кодирует тот же самый полипептид.
Оптимизированный полинуклеотид помогает обеспечить полное достижение преимуществ настоящего изобретения за счет эффективной трансгенной экспрессии в клетках человека.
Аденовирусные конструкции
Дополнительный аспект настоящего изобретения относится к новым аденовирусным конструкциям для использования в настоящем изобретении, но также пригодным в других контекстах. Следовательно, в изобретении также предложен аденовирус нечеловекообразных обезьян, содержащий трансген, кодирующий Rvl196-или Rv0125-poflCTBeHHbift антиген. Целесообразно, аденовирус нечеловекообразных обезьян содержит пентон с SEQ Ш N0: 10, гексон с SEQ Ш N0: 11 или фибриллу с SEQ Ш N0: 12, в частности пентон с SEQ Ш N0: 10, гексон с SEQ Ш N0: 11 и фибриллу с
SEQ Ш NO: 12. Альтернативно, аденовирус нечеловекообразных обезьян содержит пентон с SEQ Ш N0: 15, гексон с SEQ ID N0: 16 или фибриллу с SEQ ГО N0: 17, в частности пентон с SEQ ГО N0: 15, гексон с SEQ ГО N0: 16 и фибриллу с SEQ ГО N0: 17. Также аденовирус нечеловекообразных обезьян может содержать пентон с SEQ ГО N0: 20, гексон с SEQ ГО N0: 21 или фибриллу с SEQ ГО N0: 22, в частности пентон с SEQ ГО N0: 21, гексон с SEQ ГО N0: 22 и фибриллу с SEQ ГО N0: 23.
Трансген, кодирующий Rvl 196-родственный антиген, может представлять собой последовательность, кодирующую полипептид, содержащий последовательность, имеющую по меньшей мере 90% идентичность SEQ ГО NO: 1, особенно по меньшей мере 95%, например по меньшей мере 98%, например по меньшей мере 99% с SEQ ГО NO: 1, такую как SEQ ГО NO: 1, например состоящий из этих последовательностей.
Трансген, кодирующий Rv0125-poflCTBeHHbift антиген, может представлять собой последовательность, кодирующую полипептид, содержащий последовательность, имеющую по меньшей мере 90% идентичность SEQ ГО N0: 3, особенно по меньшей мере 95%, например по меньшей мере 98%, например по меньшей мере 99% с SEQ ГО N0: 3, такую как SEQ ГО N0: 3, например состоящий из этих последовательностей.
Целесообразно, трансген кодирует антиген, содержащий (например состоящий из нее) последовательность, имеющую по меньшей мере 90% идентичность SEQ ГО N0: 6. Альтернативно, трансген кодирует антиген, содержащий (например состоящий из него) фрагмент SEQ ID N0: 6 длиной по меньшей мере 450 аминокислот. В некоторых воплощениях трансген кодирует антиген, содержащий (например состоящий из них) аминокислоты 2-723 из SEQ ГО N0: 6. Целесообразно, трансген содержит SEQ ГО N0: 8 или ее вырожденный вариант, имеющий по меньшей мере 95% идентичность SEQ ГО N0: 8. В некоторых воплощениях трансген содержит SEQ ГО N0: 8.
Целесообразно, аденовирус является репликативно-дефектным. Например, аденовирус содержит функциональную инактивацию (например делецию) гена Е1. Аденовирус может содержать функциональную инактивацию (например делецию) гена Е4. Аденовирус также может содержать функциональную инактивацию (например делецию) гена ЕЗ. Аденовирус также может содержать замену гена Ad5E4orf6.
Типичными конструкциями аденовируса по изобретению являются такие, которые имеют полинуклеотидную последовательность SEQ ГО N0: 13 или 18.
Дополнительный аспект изобретения представляет собой полинуклеотидную последовательность, содержащую SEQ ГО N0: 13 или 18, например полинуклеотидную последовательность, состоящую из SEQ ГО N0: 13 или 18.
Режимы иммунизации, целевые популяции и способы введения
В одном воплощении субъект получает однократную дозу полипептидного антигена и однократную дозу ассоциированного вируса. В других воплощениях субъект получает две дозы полипептидного антигена и однократную дозу ассоциированного аденовируса (дополнительная доза полипептидного антигена может быть назначена до начала стандартных способов белок/адено или адено/белок или после завершения стандартных способов). В других воплощениях субъект получает одну дозу полипептидного антигена и две дозы ассоциированного аденовируса (дополнительная доза ассоциированного аденовируса может быть назначена до начала стандартных способов белок/адено или адено/белок или после завершения стандартных способов). Когда предусмотрены две дозы аденовируса, кодирующего антиген, они могут использовать или могут не использовать один и тот же штамм аденовируса и вставку.
Когда субъект получает две дозы полипептидного антигена, целесообразно вводить дополнительную дозу от одной недели до трех месяцев, в частности от двух недель до двух месяцев, обычно от трех недель до шести недель, например от трех недель до пяти недель, например примерно за четыре недели до начала или примерно через четыре недели после завершения стандартного способа.
Когда субъект получает две дозы ассоциированного аденовируса, целесообразно вводить дополнительную дозу от одной недели до трех месяцев, в частности от двух недель до двух месяцев, обычно от трех недель до шести недель, например от трех недель до пяти недель, например примерно за четыре недели до начала или примерно через четыре недели после завершения стандартного способа.
Субъект, подвергнутый лечению с использованием способа по изобретению, может быть любого возраста. В одном аспекте изобретения субъектом является человек.
В одном воплощении субъектом является взрослый человек (обычно в возрасте I860 лет).
Полипептидные и аденовирусные композиции могут быть введены с помощью различных подходящих путей, включая парентеральный, например внутримышечное или подкожное введение.
В одном конкретном воплощении одну или более композиций вводят внутрикожно. Используемый здесь термин внутрикожно предназначен для обозначения применения антигенов в дерме и/или эпидермисе кожи человека. Внутрикожное применение иммуногенной композиции может быть осуществлено с использованием любого кожного способа, известного специалисту, включая, без ограничения ими, доставку с
использованием короткоигольного устройства (устройства, содержащего микроиглу длиной от примерно 0,2 до примерно 0,6 мм) или с использованием кожного пластыря. Подходящие устройства для использования с описанными здесь кожными вакцинами, включают короткоигольные устройства, такие как описаны в US 4886499, US 5190521, US 5328483, US 5527288, US 4270537, US 5015235, US 5141496, US 5417662 и EP1092444. Кожные вакцины также могут быть введены с помощью устройств, которые ограничивают эффективную глубину проникновения иглы в дерму, такими, как описаны в WO99/34850. Также подходят устройства струйного впрыскивания, которые доставляют жидкие вакцины в кожу при помощи жидкоструйного инжектора или посредством иглы. Также подходят баллистические устройства для доставки порошка/частиц, которые используют сжатый газ для ускорения проникновения вакцины в виде порошка через внешние слои кожи в дерму. Кожный пластырь, как правило, содержит подложку, которая содержит твердый субстрат. Пластырь доставляет антиген и адъювант, используемые в изобретении, в дерму или эпидермис. В конкретном воплощении пластыри, используемые в настоящем изобретении, содержат множество микровыступов. Эти микровыступы могут иметь любую форму, подходящую для прокалывания рогового слоя, эпидермиса и/или дермы и доставки антигена и адъюванта в эпидермис или дерму. В конкретном воплощении микровыступы являются биоразлагаемыми и содержат биоразлагаемый полимер.
В альтернативном подходе полипептид можно вводить внутримышечно, а аденовирус вводить интраназально или с помощью аэрозоля в легкие. Целесообразно, обе композиции вводят внутримышечно.
Иммуногенные композиции, используемые в изобретении, можно приготовить путем смешивания антигена(ов) и адъюванта. Антиген(ы) может(гут) быть представлен(ы) в лиофилизированной форме или в жидкой композиции. Может быть предложен набор, содержащий первый контейнер, содержащий антиген, и второй контейнер, содержащий адъювант.
Целесообразно, композиции по настоящему изобретению имеют объем дозы для человека от 0,05 мл до 1 мл, например от 0,1 до 0,5 мл, в частности объем дозы примерно 0,5 мл или 0,7 мл. Объем второй иммуногенной композиции может быть уменьшен и может составлять, например, от 0,05 мл до 0,5 мл, например от 0,1 до 0,2 мл. Объемы используемых композиций могут зависеть от пути доставки, с меньшими дозами при доставке внутрикожным путем.
Дополнительные воплощения изобретения включают:
(а) Аденовирус нечеловекообразных обезьян, содержащий трансген, кодирующий
Rvl 196 или Rv0125-poflCTBeHHbift антиген, где указанный аденовирус имеет по меньшей
мере пентон с SEQ ID N0: 20, гексон с SEQ ID N0: 21 или фибриллу с SEQ ГО N0: 22.
(б) Аденовирус нечеловекообразных обезьян согласно (а), содержащий пентон
(SEQ ГО N0: 20), гексон (SEQ ГО N0: 21) и белок фибриллы (SEQ ГО N0: 22) из ChAdl55.
(в) Аденовирус нечеловекообразных обезьян согласно (а) или (б), где кодируемый
антиген содержит последовательность, имеющую по меньшей мере 90% идентичность
SEQ ГО N0: 6.
(г) Аденовирус нечеловекообразных обезьян согласно любому из (а), (б) или (в),
где кодируемый антиген содержит фрагмент SEQ ГО N0: 6 длиной по меньшей мере 450
аминокислот, например 2-723 из SEQ ГО N0: 6.
(д) Аденовирус нечеловекообразных обезьян согласно любому из (а)-(г), который
представляет собой репликативно-дефицитный аденовирус.
(е) Аденовирус нечеловекообразных обезьян согласно любому из (а)-(д), где
аденовирус содержит функциональную инактивацию (например делецию) гена Е1.
(ж) Аденовирус нечеловекообразных обезьян согласно любому из (а)-(е), где
аденовирус содержит функциональную инактивацию (например делецию) гена Е4.
(з) Аденовирус нечеловекообразных обезьян согласно любому из (а)-(ж), где
аденовирус содержит функциональную инактивацию (например делецию) гена ЕЗ.
(и) Аденовирус нечеловекообразных обезьян согласно любому из (а)-(д), где
аденовирус содержит замену гена Ad5E4orf6.
Руководства из всех ссылок в настоящей заявке, включая патентные заявки и полученные патенты, полностью включены в настоящее описание посредством ссылок. Подразумевается, что композиция, способ или процесс, определенные как "содержащая(ий)" определенные элементы, включает композицию, способ или процесс (соответственно), состоящую(ий) из этих элементов. Изобретение далее будет описано со ссылкой на следующие, неограничивающие примеры:
ПРИМЕРЫ
Пример 1 - Создание векторов ChAd3 и ChAd63, кодирующих белок М72 Получение конструкций
ДНК-последовательность М72 была оптимизирована в GeneArt(r) (Life Technologies Corporation) для экспрессии у человека (SEQ ID NO: 8). В соответствии со стандартными способами оптимизированную последовательность ДНК синтезировали и клонировали в GeneWiz(r) под контролем HCMV промоторной TetO системы и BGH полиА
последовательностей в шаттл-плазмиде PVJ с использованием сайтов рестрикции EcoRV-Notl. Эту плазмиду расщепляли рестрикционными ферментами Spel и Sgfl и рекомбинантно вводили или в ChAd3 (с делециями Е1 и Е4 ) или в ChAd63 (с делециями Е1, ЕЗ и Е4) векторы посредством гомологичной рекомбинации в Е. coli BJ5183.
В кратком изложении, конструирование векторов ChAd3 происходило по приведенным ниже стадиям.
Вектор pChAd3 получают из аденовируса 3 дикого типа генома шимпанзе. Аденовирус типа 3 дикого типа генома шимпанзе выделяли из здорового молодого шимпанзе, размещенного в центре исследований Новой Иберии (New Iberia Research Center; The University of Louisiana at Lafayette) с использованием стандартных процедур. Затем вирусный геном клонировали в плазмидном векторе и затем модифицировали для осуществления следующих модификаций в разных областях вирусного генома ChAd3:
1) делеция области Е1 (от 460 до 3543 п.о.) вирусного генома;
2) делеция всей кодирующей области ChAd3 Е4 (охватывающей нуклеотиды 34634-37349 последовательности ChAd3 дикого типа) и замена геном Ad5E4orf6. Делетированная область содержала всю область Е4 за исключением нативного промотора Е4 и сигнала полиаденилирования.
Конструирование векторов ChAd 63 происходило по приведенным ниже стадиям.
Аденовирус типа 63 дикого типа шимпанзе выделяли из группы здоровых шимпанзе, размещенных в центре в Новой Иберии с использованием стандартных процедур. Затем вирусный геном клонировали в плазмидном векторе и затем модифицировали для осуществления следующих модификаций в разных областях вирусного генома ChAd3:
1) делеция области Е1 (от 456 до 3421 п.о.) вирусного генома;
2) делеция области ЕЗ (от 27208 до 31786 п.о.) вирусного генома;
3) делеция всей кодирующей области ChAd63 Е4 (охватывающей нуклеотиды 33825-36216 последовательности дикого типа ChAd63) и замена геном Ad5E4orf6. Делетированная область содержала всю область Е4 за исключением нативного промотора Е4 и сигнала полиаденилирования.
Подтверждающее тестирование
Спасения и амплификацию вирусов (от пассажа 1 до пассажа 4) выполняли в клеточной линии procell-92.S в соответствии со стандартными процедурами, и генетическую структуру вирусной ДНК проверяли на пассаже 3 (M72-ChAd63) или пассаже 4 (M72-ChAd3) с помощью двух разных схем рестрикции. Каждый
рекомбинантный вирус очищали из 1 литра культуры с помощью CsCl градиентного способа. Очищенные вирусы титровали с помощью количественной ПЦР и измеряли инфекционность с помощью метода иммуноокрашивания гексонов.
Хорошая экспрессия М72 была подтверждена Вестерн-блоттингом после инфицирования клеточной линии HeLa очищенными вирусами. Геномную стабильность оценивали вплоть до пассажа 10, а последовательность ДНК полной экспрессионной кассеты подтверждали секвенированием.
Пример 2 - Исследование дозы аденовируса у мышей
Тестируемые группы
Целью этого исследования была оценка и сравнение иммуногенности 2 аденовирусов шимпанзе, кодирующих антиген туберкулеза М72: M72-ChAd3 и М72-ChAd63. Аденовирусы получали согласно Примеру 1.
Самкам мышей CB6Fl/01aHsd в возрасте 6 недель, 12 мышей на группу, инъецировали внутримышечным путем 50 мкл в сутки 0 (раствор ChAd3: рН 7,4, 10 мМ TRIS (трис-(гидроксиметил)-аминометан), 10 мМ гистидин, 5% сахароза, 75 мМ NaCl, 1 мМ MgCb, 0,02% полисорбат 80, 0,1 мМ EDTA (этилендиаминтетрауксуная кислота), 0,5%) (об./об.) этанол; раствор ChAd63: рН 6,6, 10 мМ гистидин, 7,5% сахароза, 35 мМ NaCl, 1 мМ MgCl2, 0.1% полисорбат 80, 0,1 мМ EDTA, 0,5% (об./об.) этанол):
Группа
Аденовирус
Число вирусных частиц
M72-ChAd3
10A10
M72-ChAd3
10A9
M72-ChAd3
10A8
M72-ChAd3
10A7
M72-ChAd63
10A10
M72-ChAd63
10A9
M72-ChAd63
10A8
M72-ChAd63
10A7
Для того чтобы иметь достаточный объем, цельную кровь из 4 пулов от 3 мышей на группы собирали на 7, 14 и 21 сутки.
Измерение клеточного иммунного ответа - внутриклеточное окрашивание
цитокинов (ICS)
Выделение лейкоцитов из цельной крови
В каждый момент времени от каждой мыши собирали кровь и затем ее объединяли (4 пула от 3 мышей). Кровь собирали в пробирки, содержащие RPMI/вспомогательные вещества (RPMI 1640 с добавлением глутамина, пенициллина/стрептомицина, пирувата натрия, заменимых аминокислот и 2-меркаптоэтанола), содержащие 5000 единиц/мл гепарина (Heparin Leo). Десять объемов лизирующего буфера добавляли к цельной крови и пробирки инкубировали при комнатной температуре (RT) в течение 10 минут. После центрифугирования (335g, 10 мин при RT), осадок собирали в смеси RPMI/вспомогательные вещества и фильтровали (Клеточный фильтр 100 мкм). Клетки осаждали еще раз (335g, 10 мин при RT) и ресуспендировали в полной среде (RPMI 1640 с добавлением глутамина, пенициллина/стрептомицина, пирувата натрия, заменимых аминокислот и 2-меркаптоэтанола и 5% термически инактивированной эмбриональной телячьей сыворотки).
Стимуляция in vitro только что полученных лейкоцитов
Лейкоциты помещали в круглодонные 96-луночные планшеты в количестве примерно 1 миллион клеток на лунку. Лейкоциты затем стимулировали в течение 6 часов (37°С, 5% С02) анти-СБ28 (клон 37.51) и анти-СБ49с1 (клон 9С10) при 1 мкг/мл, вместе с или без 1 мкг/мл пептидов, охватывающих последовательность М72 (смесь 15-мерных пептидов с перекрыванием 11 аминокислотных остатков). После 2 часового периода стимуляции добавляли BD GolgiPlug(tm), содержащий брефелдин А, разведенный полной средой (окончательное разведение 1/1000) в течение еще 4 часов. Затем планшеты помещали на ночь при 4°С.
ICS IFNg. IL-2. TNF-a
Клетки окрашивали и анализировали с использованием 5-цветного ICS-анализа.
Клетки переносили в 96-луночные планшеты с V-образным дном, центрифугировали при 189g в течение 5 минут при 4°С после промывания 200 мкл проточного буфера (PBS IX, 1% FCS), клетки ресуспендировали в 50 мкл проточного буфера, содержащего анти-С016/32 (клон 2.4G2), разведенный 1/50, в течение 10 минут при 4°С. Затем 50 мкл проточного буфера, содержащего анти-СБ4-У450 (клон RM4-5, разведенный 1/50) и анти-СБ8-РегСр-Су5.5 (клон 53-6.7, разведенный 1/50) антитела и LIVE/DEAD(r) Pacific Orange (Life Technologies, разведенный 1/500) добавляли на 30 минут при 4°С. Клетки центрифугировали (189g в течение 5 минут при 4 °С) и промывали
200 мкл проточного буфера.
Лейкоциты фиксировали и пермеабилизировали добавлением 200 мкл раствора Cytofix/Cytoperm (коммерческий буферо Becton Dickinson) в течение 20 минут при 4°С. Клетки центрифугировали (189g в течение 5 минут при 4 °С) и промывали 200 мкл буфера Perm/Wash (коммерческий буфер Becton Dickinson, разбавленный 1:10 в дистиллированной воде). После дополнительной стадии центрифугирования клетки окрашивали в 50 мкл буфера Perm/Wash анти-ГЬ2-Р1ТС (клон JES6-5H4, разведенный 1/400), анти-IFNg-APC (клон XMG1.2, разведенный 1/200) и анти-TNFa-PE (клон МР6-ХТ22, разведенный 1/700) антителами в течение 1 часа при 4°С. Клетки промывали два раза буфером Perm/Wash и ресуспендировали в 220 мкл PBS. Окрашенные клетки анализировали с помощью проточной цитометрии, используя LSRII и программу FlowJo.
Результаты
Как видно на Фиг. 1 и 2 (CD4 Т-клеточный ответ для конструкций M72-ChAd3 и M72-ChAd63 соответственно) и на Фиг. 3 и 4 (CD8 Т-клеточный ответ для конструкций M72-ChAd3 и M72-ChAd63 соответственно), доза 1x108 вирусных частиц на мышь индуцировала самый высокий уровень М72-специфического ответа во временной точке 14PI для обеих конструкций M72-ChAd3 и M72-ChAd63.
Пример 3 - Исследование влияния совместного приготовления аденовируса и
адъюванта на инфекционность
Влияние совместного приготовления в одной композиции оценивали с помощью рекомбинантного eGFP-ChAd3 или eGFP-ChAd63. Эти ChAd3 и ChAd 63 являются контролями, сконструированными для экспрессии зеленого флуоресцентного белка вместо трансгена М72 в соответствующих СпАденовирусных остовах (ChAd3 с удаленными Е1-Е4 и ChAd63 с удаленными Е1-ЕЗ-Е4). Совместное приготовление в одной композиции с AS01E (липосомальная композиция ТЬЯ4-агониста 3D-MPL и сапонина QS21) оценивали с помощью анализа инфекционности на основе клеток HeLa
Материалы и методы
Тест на инфекционность
Клетки HeLa выращивали в экспоненциальной фазе роста и сеяли на 24 ч до инфицирования. Клетки HeLa использовали между пассажами Р45 и Р65 (Molbiol; GSK Rix).
Сутки 0: Сбор клеток
Среду удаляли из сосуда и клетки тщательно промывали DPBS (фосфатно-солевой буфер Дульбекко) для удаления остаточной клеточной среды. К клеткам добавляли 5 мл
трипсина-EDTA, затем наблюдали за клетками под инвертированным микроскопом вплоть до отделения и диспергирования клеточного слоя (от 2 до 4 минут). Клеточную суспензию осторожно пипетировали вверх-вниз, переносили в пробирку фирмы Falcon и центрифугировали при 1200 об/мин в течение 5-10 минут при комнатной температуре. Клеточный осадок ресуспендировали в соответствующем объеме и подсчитывали. Клетки сеяли в 96-луночный планшет в количестве 1,5 х104 клеток/лунка (в сутки инфицирования ожидается 3 х 104 клеток HeLa на лунку). Сутки 1: Сутки инфицирования
Наблюдаемая конфлюэнтность клеток HeLa составляла от 50% до 80%. Всю среду удаляли от клеток. Запасы рекомбинантных eGFP-ChAd3 и eGFP-ChAd63 разбавляли до конечного титра 5х107 вирусных частиц/мл в 80 мкл полной среды Игла в модификации Дульбекко (DMEM). Это объем для 1 лунки. В каждую лунку добавляли 80 мкл каждого образца для инфицирования (это выполняли в двух повторах). Отрицательный контроль неинфицированных клеток HeLa с композицией, содержащей только буферы в полной DMEM, использовали для измерения любого отрицательного влияния на адено-инфекционность из-за адъювантного буфера. Положительный инфекционный контроль клеток HeLa, инфицированных eGFP-ChAd3 (такое же состояние инфекции) обрабатывали в идентичных условиях. Через 3 часа при 37°С, 5% С02, добавляли 120 мкл полной DMEM и затем культивировали при 37°С, 5% СО2 в течение примерно 24 часов.
Сутки 2: Сбор и считывание FACS
Клеточные супернатанты собирали в 96-луночном планшете. Клетки Hela промывали 40 мкл смеси трипсин/EDTA и затем инкубировали с дополнительными 40 мкл смеси трипсин/EDTA. Как только клетки отделялись от планшета, каждую лунку аккуратно промывали, чтобы извлечь все клетки. 96-луночный планшет затем центрифугировали при 1200 об/мин в течение 10 минут. Супернатант отбрасывали. Клетки суспендировали в 200 мкл DPBS и хранили при 4°С вплоть до их анализа с помощью FACS (LSRII Beckman Dickinson).
Результаты
Тестируемая группа
%GF]
%жизнеспособности
Описание
среднее
(среднее)
DMEM контроль
89,14
AS01E
91,20
AS01E+eGFP-ChAd3
81,9
84,79
83,35
89,01
AS01E+eGFP-ChAd63
70,43
73,28
71,86
88,95
AS 6y 86,4
86,93
86,67
88,57
AS 6y 69,59
71,38
70,49
87,49
eGFP-ChAd3
78,78
81,29
80,04
90,96
eGFP-ChAd63
51,43
53,46
52,45
90,41
буфер AS pH 8,0, ЮмМ P04, 5MM NaCl, 4,7% сорбит
буфер ChAd3: pH 7,4, ЮмМ TRIS, 10 мМ гистидин, 5% сахароза, 75 мМ NaCl, 1 мМ MgCl2, 0,02% полисорбат 80, 0,1 мМ EDTA, 0,5% (об./об.) этанол
буфер ChAd63: рН 6,6, 10 мМ гистидин, 7,5% сахароза, 35 мМ NaCl, 1 мМ MgCl2, 0,1% полисорбат 80, 0,1 мМ EDTA, 0,5% (об./об.) этанол
Данные выражают как процент клеток, экспрессирующих GFP, коррелирующих с количеством клеток, инфицированных вирусом ChAd-GFP. Для всех условий регистрировали жизнеспособность клеток. Это делали для оценки любой возможной клеточной токсичности, которая может привести к ложному выводу. К счастью, это был иной случай, поскольку жизнеспособность клеток во всех этих условиях была приемлемой и сравнимой.
Согласно данным, не наблюдалось никакого отрицательного воздействия AS на ChAd3- или ChAd63-GFP. Вектор ChAd3-GFP, приготовленный в одной композиции с AS01E, сохранял свой потенциал инфекционности, который был сопоставим с одним ChAd3-GFP.
Такое же наблюдение было сделано для ChAd63-GFP. В последнем случае даже наблюдалось некоторое увеличение инфекционности, что может быть связано с использованными буферными растворами, в которых был разведен аденовирус. Пример 4 - Исследование влияния приготовления в одной композиции аденовируса
и адъюванта на гашение OS21 Целью исследования было проверить детоксификацию QS21.
Характеристики
Группа
Описание
Визуальный аспект
И (тест-полоски)
Осмо (мОсм/кг)
AS01E
Опалесцирующий
5,5-6
291
eGFP-ChAd3 при 2,10х109 в AS01E
Слегка
опалесцирующий
5-5,5
289
eGFP-ChAd63 при 2,10х109 в AS01E
Слегка
опалесцирующий
5-5,5
297
eGFP-ChAd3 при 2,10xl09 в AS01E буфере
Прозрачный
5-5,5
292
eGFP-ChAd63 при 2,10xl09 в ASOIE буфере
Прозрачный
5-5,5
304
eGFP-ChAd3 при 2,10xl09
Прозрачный
425
eGFP-ChAd63 при 2,10xl09
Прозрачный
6-6,5
408
Приготовленные в виде композиции образцы, содержащие адъювант или адъювантный буфер, имеют осмоляльность > 285 мОсм/кг. Значение рН был взято с индикаторной полоски.
Промывание эритроцитов
Эритроциты (10 мл) центрифугировали в течение 10 минут при 1600 об/мин (550g) при 4°С и супернатант удаляли. Эритроциты аккуратно ресуспендировали в объеме буфера DPBS, эквивалентном исходному объему (± 10мл). Операцию повторяли (минимум 2-3 раза), пока супернатант не становился прозрачным (красноватое окрашивание исчезало, но супернатант никогда не становился полностью прозрачным), и затем удаляли последнюю надосадочную жидкость после промывки. Осадок хранили при 4°С в течение максимум 3-4 суток, если его не использовали сразу (и снова промывали в сутки его использования), или разбавляли примерно в 10 раз в буфере, если его использовали в те же сутки.
Предварительные разведения эритроцитов
Выполняли разные предварительные разведения эритроцитов. Было выбрано предварительное разведение, для которого достигается 100% лизис со значением OD (оптической плотностью) (540 нм) от 1,5 до 2.
Следующие разведения были приготовлены в гемолизных пробирках:
разведение
эритроциты
dPBS
1/10
100 мкл
900 мкл
1/12,5
100 мкл
1150 мкл
1/15
100 мкл
1400 мкл
Эритроциты центрифугировали (10 мл) в течение 10 минут при 1600 об/мин (550g) при 4°С. Извлекали 100 мкл предварительного разбавления, смешивали с 900 мкл WFI (вода для инъекции) и центрифугировали в течение 5 минут при 2000 об/мин (900g).
Супернатант переносили в кювету для спектроскопии и измеряли OD при 540 нм. Выбранное разбавление обеспечило OD от 1,5 до 2. Получение стандартной кривой для QS21
Стандартную кривую для QS21 получали для рабочего раствора QS21 (2 мг/мл), экстемпорально разбавленного до 20 мкг/мл в буфере РО^сорбит.
Определение лизирующей активности выполняли при помощи анализа предельных значений.
1. Предел обнаружения (LOD) был определен как самая низкая концентрация QS21, обеспечивающая OD:
- выше базового уровня (OD> 0,1)
- примерно в три раза выше чем OD буфера ("0 мкг" QS21)
- в восходящей части кривой
- определенное для каждого теста.
2. Лизирующую активность QS21 поддерживали положительной в адъювантных
образцах, если OD адъювантного образца была выше ODLOD Пример кривой для QS21
Образцы
QS21 (мкг)
O.D.
Образца
O.D.
Буфера
Дельта
(O.D. образца -O.D. буфера)
* проходит/ не
проходит
AS01E
0,151
0,122
0,029
проходит
ChAd3 в AS01E
0,148
0,122
0,026
проходит
ChAd63 в AS01E
0,143
0,122
0,021
проходит
*Проходит: если дельта (O.D. образца- O.D. буфера) < LOD (O.D.) теста суток *Не проходит: если дельта (O.D. образца- O.D. буфер) > LOD (O.D.) теста суток Заключение
При приготовлении eGFP-ChAd3 и eGFP-ChAd63 отдельно от AS01E, размер адъюванта остается неизменным после приготовления композиции. Кроме того, после приготовления нет свободного QS21, как видно из анализа лизиса эритроцитов.
Пример 5 - Режимы дозирования М72
Оценка применения нерепликативных аденовекторов шимпанзе, экспрессирующих М72, в контексте туберкулезной вакцины путем оценки и гомологичной (ChAd/ChAd), и гетерологичной (Prot/ChAd или ChAd/Prot) стратегий вакцинации примирование-бустер, а также в комбинации с M72/AS01E, который вводят в смеси или в совместном введении.
Материалы и методы
Животная модель
Самкам мышей CB6Fl/01aHsd в возрасте 6-недель, 12 мышей в группе,
инъецировали внутримышечным путем 50 мкл в сутки 0-28, как указано в таблице ниже.
1р.
Введение DO
Введение D28
Антиген
Доза
Раствор
Антиген
Доза
Раствор
Станда
M72/AS01E
1мкг
AS буфер
M72/AS01E
1мкг
AS буфер
Примирование: Аде но/Бустер: Белок
M72-ChAd3
10А8вч
ChAd3 буфер
M72/AS01E
1мкг
AS буфер
М72-ChAd63
10А8вч
ChAd63 буфер
eGFP-ChAd3
10А8вч
ChAd3 буфер
Примирование: Белок/Бустер: Аде но
M72/AS01E
1мкг
AS буфер
M72-ChAd3
10А8в ч
ChAd3 буфер
1мкг
AS буфер
М72-ChAd63
10А8в ч
ChAd63 буфер
Примирование: Адено+AS/ Бустер: Адено+ AS
M72-ChAd3 /AS01E
10А8вч
AS буфер
M72-ChAd3 /AS01E
10А8в ч
AS буфер
Примирование: Адено/Бустер: Аде но
M72-ChAd3
10А8вч
ChAd3 буфер
M72-ChAd3
10А8в ч
ChAd3 буфер
M72-ChAd3
10А8вч
ChAd3 буфер
M72-ChAd63
10А8в ч
ChAd63 буфер
M72-ChAd63
10А8вч
ChAd63 буфер
M72-ChAd3
10А8в ч
ChAd3 буфер
Комбинировние Первичная вакцинация и Бустер; Адено+
эелок
M72/AS01E M72-ChAd3 Combo
1мкг 10А8вч
AS буфер
M72/AS01E M72-ChAd3 Combo
1мкг 10А8в ч
AS буфер
M72/AS01E
Co-Ad M72-ChAd3
1мкг 10А8вч
AS буфер (адъювантированный белок) и ChAd3 буфер (адено)
M72/AS01E
Co-Ad M72-ChAd3
1мкг 10А8в ч
AS буфер (адъювантированный белок) и ChAd3 буфер (адено)
M72/AS01E eGFPChAd3 Combo
1мкг 10А8вч
AS буфер
M72/AS01E eGFPChAd3 Combo
1мкг 10А8в ч
AS буфер
буфер AS: примерно рН 8,0, 10 мМ Р04, 5 мМ NaCl, 4,7% сорбит
буфер ChAd3: рН 7,4, 10 мМ TRIS, 10 мМ гистидин, 5% сахароза, 75 мМ NaCl, 1 мМ MgCl2, 0.02% полисорбат 80, 0,1 мМ EDTA, 0,5% (об./об.) этанол
буфер ChAd63: рН 6,6, 10 мМ гистидин, 7,5% сахароза, 35 мМ NaCl, 1 мМ MgCl2, 0,1% полисорбат 80, 0,1 мМ EDTA, 0,5% (об./об.) этанол
Жидкость
Тест
Момент
Комментарии
времени сбора
Оценка ответов ТВ антиген-специфических
CD4 и CD8 клеток периферической цельной
Цельная
ICS
D14(14PI)
крови, определенных посредством
кровь
одновременного измерения IFNg, IL-2, TNF-а после рестимуляции пулами перекрывающихся 15-мерных пептидов
Оценка ответов ТВ антиген-специфических
Цельная
кровь/
легкие
ICS
D42(14PII)*
CD4 и CD8 клеток периферической цельной крови и легких, определенных посредством одновременного измерения IFNg, IL-2, TNF-а, IL-17 после рестимуляции пулами перекрывающихся 15-мерных пептидов
Сыворотка
серология анти-М72 IgTot
D41(13PII)**
* Ограничения +/-36 сбора легких в сутки, поэтому исследование проводили в нескольких повторах
* * Из-за практических ограничений образцы сыворотки были взяты за 1 сутки до цельной крови
Для того чтобы иметь достаточный объем, цельную кровь из 4 пулов от 3 мышей на группы собирали на 14 и 42 сутки. На 42 сутки тот же процесс применяли для легких.
Из-за ограничений на сбор в сутки, один пул каждой группы обрабатывали в сутки - в течение 4 суток, для того чтобы иметь 4 пула на группы. Сыворотку отдельных мышей собирали на 41 сутки.
Мышей идентифицировали, чтобы установить связь между PI и РП для ICS считываний и серологии.
Клеточный иммунный ответ - внутриклеточное окрашивание цитокинов (ICS)
Выделение лейкоцитов из цельной крови
В каждый момент времени кровь собирали от каждой мыши и затем объединяли (4 пула от 3 мышей). Кровь собирали в пробирки, содержащие RPMI/вспомогательные вещества (RPMI 1640 с добавлением глутамина, пенициллина/стрептомицина, пирувата
натрия, заменимых аминокислот и 2-меркаптоэтанола), содержащие гепарин (1/10). Десять объемов лизирующего буфера добавляли к цельной крови и пробирки инкубировали при комнатной температуре (RT) в течение 10 минут. После центрифугирования (335g, 10 минут при RT) осадок собирали в смеси RPMI/вспомогательные вещества и фильтровали (клеточный фильтр 100 мкм). Клетки снова осаждали (3 3 5 g, 10 мин при комнатной температуре) и ресуспендировали в полной среде (RPMI 1640 с добавлением глутамина, пенициллина/стрептомицина, пирувата натрия, заменимых аминокислот и 2-меркаптоэтанола и 5% инактивированной нагреванием фетальной сыворотки теленка). Выделение лейкоцитов из легких
Легкие собирали в пробирки, содержащие RPMI/вспомогательные вещества (RPMI 1640 с добавлением глутамина, пенициллина/стрептомицина, пирувата натрия, заменимых аминокислот и 2-меркаптоэтанолома). Образец переносили на чашку Петри и разрезали на мелкие кусочки (примерно 5x5 мм). Образцы ресуспендировали в пробирке gentleMACS С (фиолетовая), содержащей 10 мл предварительно нагретой полной среды, содержащей либеразу (0,0625 МЕ/мл = 50 мкл)+ДНКазу (25 мкг = 25 мкл). Пробирку С прикрепляли вверх дном в рукав диссоциатора gentleMACS и запускали программу мышь-легкое 02 (40 сек). В конце программы пробирку С отсоединяли и инкубировали в течение 30 минут при 37°С во встряхивателе-инкубаторе. После инкубации образец переносили на клеточный фильтр (100 мкм), помещенный в 50 мл пробирку фирмы Falcon. Клеточный фильтр два раза промывали 5 мл полной среды (RPMI 1640 с добавлением глутамина, пенициллина/стрептомицина, пирувата натрия, заменимых аминокислот и 2-меркаптоэтанола и 5% инактивированной нагреванием эмбриональной телячьей сыворотки). Полную среду добавляли до 45 мл. Клетки центрифугировали (400g в течение 10 минут - 4 °С), удаляли супернатант аспирацией и затем клетки ресуспендировали в 10 мл полной среды. Эту стадию промывания повторяли. После второго промывания клетки ресуспендировали в 3 мл Перколл Р30. Слой Перколла Р30, содержащий клетки, помещали поверх градиента слоев Перколла Р40/Р75. Клетки центрифугировали в течение 20 минут при 754g при RT (комнатная температура). Рассматриваемые клетки находились в интерфазе между Р40 и Р75 в конце центрифугирования (нижняя интерфаза). Слой Р30 удаляли аспирацией и клетки собирали в интерфазе Р40-Р75. Клетки собирали в 15 мл пробирку и добавляли полную среду до конечного объема 15 мл. Клетки центрифугировали (900g в течение 10 минут - 4 °С). Удаляли аспирацией супернатант и клетки промывали 15 мл полной среды два раза. Осадок ресуспендировали в полной среде
до конечного объема 250 мкл. Клетки подсчитывали с помощью метода Macsquant, включая определение жизнеспособности с PI (пропидия иодид). Стимуляция in vitro недавно выделенных лейкоцитов
Лейкоциты помещали в круглодонные 96-луночные планшеты в количестве примерно 1 миллион клеток на лунку. Затем лейкоциты стимулировали в течение 6 часов (37°С, 5% С02) анти-СБ28 (клон 37.51) и анти-СБ49с1 (клон 9С10) при 1 мкг/мл, с или без 1 мкг/мл пептидов, охватывающих последовательность М72. После 2-часовой стимуляции добавляли BD GolgiPlug(tm), содержащий брефелдин А, разведенный в полной среде (окончательное разбавление 1/1000), в течение еще 4 часов. Затем планшеты переносили при 4°С на ночь.
ICS IFNg, IL-2, TNF-a в точке 14PI - WBLO
Клетки окрашивали и анализировали с использованием 5-цветного ICS-анализа.
Клетки переносили в 96-луночные планшеты с V-образным дном, центрифугировали при 189g в течение 5 минут при 4°С после промывания 200 мкл проточного буфера (PBS IX, 1% FCS), клетки ресуспендировали в 50 мкл проточного буфера, содержащего анти-С016/32 (клон 2.4G2), разведенный 1/50, в течение 10 минут при 4°С. Затем 50 мкл проточного буфера, содержащего анти-СБ4-У450 (клон RM4-5, разведенный 1/50) и анти-СБ8-РегСр-Су5.5 (клон 53-6.7, разведенный 1/50) антитела и Live &Dead РО (препарат для определения живых и мертвых клеток) (разведенный 1/500) добавляли на 30 минут при 4°С. Клетки центрифугировали (189g в течение 5 минут при 4°С) и промывали 200 мкл проточного буфера.
Лейкоциты фиксировали и пермеабилизировали путем добавления 200 мкл раствора Cytofix/Cytoperm (коммерческий буфер Becton Dickinson) в течение 20 минут при 4°С. Клетки центрифугировали (189g в течение 5 минут при 4°С) и промывали 200 мкл буфера Perm/Wash (коммерческий буфер Becton Dickinson, разбавленный 1:10 дистиллированной водой). После дополнительной стадии центрифугирования клетки окрашивали в 50 мкл буфера Perm/Wash с помощью aHTH-IL2-FITC (клон JES6-5H4, разведенный 1/400), анти-IFNg-APC (клон XMG1.2, разведенный 1/200) и анти-TNFa-PE (клон МР6-ХТ22, разведенный 1/700) антител в течение 1 часа при 4°С. Клетки промывали два раза буфером Perm/Wash и ресуспендировали в 220 мкл PBS. Окрашенные клетки анализировали с помощью проточной цитометрии, используя LSRII и программу Flow Jo.
ICS IFNg, IL-2, TNF-a и JL-П в точке 14PII - WBLO & легкие
Использовали тот же протокол, за исключением стадии цитокина; Клетки
окрашивали в 50 мкл буфера Peirn/Wash с помощью анти-ГЬ2-Р1ТС (клон JES6-5H4, разведенный 1/400), анти-IFNg-APC (клон XMG1.2, разведенный 1/200) и анти-TNFa-PE (клон МР6-ХТ22, разведенный 1/700), анти-ГЫ7 BV786 (клон ТС11-18Н10, разведенный 1/50) антител в течение 1 часа при 4°С.
Гуморальный ответ- анти-М72 Ig tot серология посредством Elisa
96-луночные планшеты для Elisa покрывали рекомбинантным антигеном М72 в количестве 0,25 мкг/мл в PBS и инкубировали в течение ночи при 4°С. Сыворотку от вакцинированных мышей на в Post II разбавляли в соотношении 1/5000 или 1/40000 для повтора, в PBS (0,2%)-BSA и затем выполняли 2-кратное серийное разведение с лунки 112 и инкубировали. Серийные разведения стандартного и контрольного материала использовали для расчета стандартных титров анти-М72 антител тестируемой сыворотки и для обеспечения достоверности теста. Планшеты промывали буфером PBS с 0,1% tween 20 после каждой стадии инкубации. Затем добавляли биотинилированные козлиные антитела, специфичные к мышиному Ig и комплекс антиген-антитело выявляли путем инкубации с стрептавидин-пероксидазным комплексом и пероксидазным субстратом ордао-фенилендиаминдигидрохлорид/НгОг. Оптические плотности (O.D.) регистрировали при 490-620 нм. Титр анти-М72 антитела для каждой отдельной мышиной сыворотки определяли из стандартной кривой ELISA с использованием регрессионной модели и выражали в единицах ELISA (ЕЦ)/мл. Затем вычисляли среднегеометрические титры (GMT) для каждой группы мышей.
Результаты
Т-клеточные ответы
А. М72-специфические CD4 Т и CD8 Т-клеточные ответы Для оценки применения нерепликативных аденовекторов шимпанзе, экспрессирующих М72, в контексте туберкулезной вакцины, оценивали и гомологичные (ChAd/ChAd), и гетерологичные (Prot/ChAd или ChAd/Prot) стратегии вакцинации примирование-бустер, а также в комбинации с M72/AS01E4, вводимым в виде смеси или при совместном введении. Стратегии примирование/бустер и комбинирования оценивали в схеме D0-D28. Цельную кровь собирали в точках 14PI и 14PII для оценки системной индукции М72-специфических CD4 и CD8 Т-клеток.
Во всех группах специфический С04-Т-клеточный ответ наблюдался в цельной крови с максимальным ответом ниже 3% (Фиг. 5 и 6). Самые высокие уровни М72-специфических CD4 Т-клеток в цельной крови наблюдались в случае стратегий гетерологичной вакцинации (Prot/ChAd или ChAd/Prot) (Фиг. 5). Примирование мышей
векторами M72-ChAd и бустер-иммунизация M72/AS01E индуцировала более высокий уровень М72-специфических CD4 Т-клеток, чем в противоположном случае, и в обоих случаях M72-ChAd3 был более эффективными, чем M72-ChAd63 (Фиг. 5). Прайм-бустерная вакцинация с векторами M72-ChAd, либо гомологичными (M72-ChAd3/M72-ChAd3)+/-AS01E, либо гетерологичными (M72-ChAd3/M72-ChAd63 или М72-ChAd63/M72-ChAd3) не обеспечивала дополнительного значения в величине CD4 Т-клеточного ответа по сравнению со сравнительным тестом M72/AS01E (Фиг. 6). Комбинирование M72-ChAd3 и M72/AS01E индуцировало немного более высокий уровень М72-специфических CD4 Т-клеток по сравнению с эталоном M72/AS01E, но более низкий, чем гетерологичная (Prot/ChAd or ChAd/Prot) прайм-бустерная вакцинация. Совместное введение индуцировало аналогичные уровни М72-специфических CD4 Т-клеток, что и комбинации, что позволило предполагать, что физическая близость не требуется (Фиг. 6).
Было обнаружено, что уровень М72-специфических CD8 Т-клеток был значительно повышен у мышей, получавших вектор M72-ChAd в виде примирования бустера или обоих. Когда вектор M72-ChAd был включен во время примирования, уровень М72-специфических CD8 Т-клеток дополнительно не увеличивался после бустер-иммунизации, за исключением мышей, примированных M72-ChAd63 и бустер-иммунизированных M72-ChAd3 (Фиг. 7 и 8). Это также свидельствует о том, что М72-ChAd3 является более эффективным, чем M72-ChAd63. Бустер-иммунизация M72/AS01E примирования с помощью M72-ChAd3 индуцировала более высокие уровни CD8 Т-клеток (Медиана=30%), чем с помощью M72-ChAd63 (Медиана = 17%). Добавление M72-ChAd3 к адъювантированному белку М72 в комбинации также значительно увеличивало уровень М72-специфических CD8 Т-клеток (Медиана = 13%) по сравнению с соответствующим эталоном (Медиана=0,2%).
В легких наблюдалась такая же общая картина ответа (Фиг. 9), что и в цельной крови (Фиг. 5 и 6), за исключением стратегии смешанной комбинированной вакцины. В легких комбинированная стратегия индуцировала более низкий уровень ответа, чем в цельной крови, вследствие чего сравнимый уровень М72-специфических CD4 Т-клеток мог наблюдаться с комбинированной вакциной и с гетерологичной (Prot/ChAd или ChAd/Prot) прайм-бустерной вакцинацией, все из которых показали повышенный уровень CD4 Т-клеток по сравнению с соответствующим эталоном.
Общая картина М72-специфического CD8 Т-клеточного ответа в легких (Фиг. 10) также отражала то, что наблюдалось в цельной крови (Фиг. 7 и 8). Очень низкие уровни
специфического CD8 Т-клеточного ответа наблюдали, когда мыши получали контрольный вектор M72/AS01E (Фиг. 10), а добавление вектора M72-ChAd сильно улучшало уровень CD8 Т-клеток. Самый высокий уровень М72-специфических CD8 Т-клеток наблюдался, когда мышей примировали M72/AS01E и бустер-иммунизировали M72-ChAd3 (Медиана=36% - Фиг. 10).
Б. Профиль цитокинов М72-специфических CD4 и CDS-клеточных ответов В группах, которые были примированы M72/AS01E, М72-специфический CD4+T-клеточный ответ главным образом включал двойные (IL-2/TNFa) секретирующие клетки в цельной крови в точке 14PI (Фиг. 11 и 12). Напротив, примирование вектором M72-ChAd индуцировало полифункциональный М72-специфический CD4 Т-клеточный ответ, главным образом с тройными положительными (IL2/IFNg/TNFa) и в меньшей степени с двойными (IFNg/TNFa) и одиночными (только IFNg) продуцирующими CD4 Т-клетками (Фиг. 11 и 12). Комбинирование белка и вектора ChAd индуцировало низкие уровни тройных (IL2/IFNg/TNFa) и двойных (IFNg/TNFa) продуцирующих CD4 Т-клеток (Фиг. 11 и 12).
Аналогичные профили экспрессии цитокинов СВ4+Т-клеток наблюдали в точке 14PII в цельной крови (Фиг. 13 и 14) и в легких (Фиг. 15 и 16) во всех группах, где стратегия вакцинации включала вектор M72-ChAd. М72-специфический CD4+T-клеточный ответ включал, главным образом, тройные (IL2/IFNg/TNFa) и двойные (IFNg/TNFa) положительные клетки. По сравнению с эталоном наблюдали пониженный уровень IL2/TNFa и повышенный уровень IFNg/TNFa секретирующих клеток в присутствии вектора M72-ChAd. Секрецию IL-17 также оценивали в точке 14dPII, как в цельной крови, так и в легких. Однако обнаруженные уровни были чрезвычайно низкими во всех условиях.
Аналогичные профили цитокинов М72-специфичных CD8 Т-клеток наблюдали во всех положительных группах в цельной крови в точке 14PI (Фиг. 17 и 18), 14PII (Фиг. 19 и 20), а также в легких в 14PII (Фиг. 21 и 22). М72-специфичные CD8 Т-клеточные ответы в основном состояли из двойных (IFNg/TNFa) и одиночных (только IFNg) продуцирующих CD8 Т-клеток. Были также обнаружены низкие уровни IL2/INFg/TNFa и очень низкие уровни TNFa-продуцирующих С08+Т-клеток.
В целом, стратегия вакцинации не оказала заметного влияния на профиль цитокинов М72-специфических CD8 Т-клеток.
Антительный ответ
А. Анти-М72 Ig tot серология
Как показано на Фиг. 23, анти-М72 Ig Tot серология была очень вариабельной во всех группах, случаи без ответа наблюдались со всеми стратегиями вакцинации, за исключением комбинированного подхода при совместном введении. Что касается Т-клеточного ответа, M72-ChAd3 представляется более эффективным, чем M72-ChAd63 в индукции иммунного ответа, поскольку количество не животных, не имеющих ответа, увеличивается при использовании M72-ChAd63.
Во всем описании изобретения и следующей ниже формуле изобретения, если контекст не требует иного, слово "содержать" и его варианты, такие как "содержит" и "содержащий" следует понимать как включающее заявленное целое число, стадию, группу целых чисел или группу стадий, но не исключение любого другого целого числа, стадии, группы целых чисел или группы стадий.
Все документы, упомянутые здесь, включая патенты и заявки на патент, включены в виде ссылки во всей своей полноте.
SEQUENCE LISTING
<110> GlaxoSmithKline Biologicals sa
<120> NOVEL METHODS FOR INDUCING AN IMMUNE RESPONSE
<130> VB65845
<150> GB1513176.6
<151> 2015-07-27
<160> 22
<170> PatentIn version 3.5
<210> 1
<211> 391
<212> PRT
<213> Mycobacterium tuberculosis
<400> 1
Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met
1 5 10 15
Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp
20 25 30
Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser
35 40 45
Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly
50 55 60
Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr
65 70 75 80
Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala
85 90 95
Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala
100 105 110
Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly
115 120 125
Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met
130 135 140
Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala
145 150 155 160
Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr
165 170 175
Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser
180 185 190
Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu
195 200 205
Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu
210 215 220
Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn
225 230 235 240
Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val
245 250 255
Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala
260 265 270
Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala
275 280 285
Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly
290 295 300
Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val
305 310 315 320
Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg
325 330 335
Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly
340 345 350
Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly
355 360 365
Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met
370 375 380
Pro His Ser Pro Ala Ala Gly 385 390
<210> 2
<211> 391
<212> PRT
<213> Mycobacterium tuberculosis
<400> 2
Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met
1 5 10 15
Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp
20 25 30
Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser
35 40 45
Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly
50 55 60
Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr
65 70 75 80
Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala
85 90 95
Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala
100 105 110
Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly
115 120 125
Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met
130 135 140
Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala
145 150 155 160
Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr
165 170 175
Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser
180 185 190
Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu
195 200 205
Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu
210 215 220
Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn
225 230 235 240
Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val
245 250 255
Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala
260 265 270
Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala
275 280 285
Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly
290 295 300
Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val
305 310 315 320
Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg
325 330 335
Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly
340 345 350
Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly
355 360 365
Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met
370 375 380
Pro His Ser Pro Ala Ala Gly 385 390
<210> 3
<211> 323
<212> PRT
<213> Mycobacterium tuberculosis
<400> 3
Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu
1 5 10 15
Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Gly Pro Gln Val Val
20 25 30
Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr
35 40 45
Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val
50 55 60
Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln
65 70 75 80
Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala
85 90 95
Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly
100 105 110
Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly
115 120 125
Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu
130 135 140
Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr
145 150 155 160
Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser
165 170 175
Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr
180 185 190
Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala
195 200 205
Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly
210 215 220
Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu
225 230 235 240
Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val
245 250 255
Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile
260 265 270
Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp
275 280 285
Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Thr Trp Gln
290 295 300
Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly
305 310 315 320
Pro Pro Ala
<210> 4
<211> 725
<212> PRT
<213> Artificial Sequence
<220>
<223> M72 2-his
<220> <221> <222> <223>
MISC_FEATURE Start codon
<220> <221> <222> <223>
MISC_FEATURE
(2)..(3)
His residues (improved expression in E. coli)
<220> <221> <222> <223>
MISC_FEATURE (4)..(135)
Rv0125 derived
<220> <221> <222> <223>
MISC_FEATURE
(136)..(137)
Linkers
<220> <221> <222> <223>
MISC_FEATURE
(138)..(528)
Rv119 6 derived
<220> <221> <222> <223>
MISC_FEATURE (529)..(530)
Linkers
<220> <221> <222>
MISC_FEATURE (529)..(530)
<223> Linker
<220> <221> <222> <223>
MISC_FEATURE (531)..(725)
Rv0125 derived
<400> 4
Met His His Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly
1 5 10 15
Gln Gly Phe Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln
20 25 30
Ile Arg Ser Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala
35 40 45
Phe Leu Gly Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val
50 55 60
Gln Arg Val Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr
65 70 75 80
Gly Asp Val Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr
85 90 95
Ala Met Ala Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser
100 105 110
Val Thr Trp Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr
115 120 125
Leu Ala Glu Gly Pro Pro Ala Glu Phe Met Val Asp Phe Gly Ala Leu
130 135 140
Pro Pro Glu Ile Asn Ser Ala Arg Met Tyr Ala Gly Pro Gly Ser Ala
145 150 155 160
Ser Leu Val Ala Ala Ala Gln Met Trp Asp Ser Val Ala Ser Asp Leu
165 170 175
Phe Ser Ala Ala Ser Ala Phe Gln Ser Val Val Trp Gly Leu Thr Val
180 185 190
Gly Ser Trp Ile Gly Ser Ser Ala Gly Leu Met Val Ala Ala Ala Ser
195 200 205
Pro Tyr Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr
210 215 220
Ala Ala Gln Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly
225 230 235 240
Leu Thr Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Glu Leu Met
245 250 255
Ile Leu Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala
260 265 270
Val Asn Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala
275 280 285
Met Phe Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu
290 295 300
Pro Phe Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu
305
310
315
320
Gln Ala Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln
325 330 335
Leu Met Asn Asn Val Pro Gln Ala Leu Gln Gln Leu Ala Gln Pro Thr
340 345 350
Gln Gly Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val
355 360 365
Ser Pro His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn
370 375 380
His Met Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser
385 390 395 400
Ser Met Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln
405 410 415
Thr Ala Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser
420 425 430
Leu Gly Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg
435 440 445
Ala Ala Ser Val Gly Ser Leu Ser Val Pro Gln Ala Trp Ala Ala Ala
450 455 460
Asn Gln Ala Val Thr Pro Ala Ala Arg Ala Leu Pro Leu Thr Ser Leu
465 470 475 480
Thr Ser Ala Ala Glu Arg Gly Pro Gly Gln Met Leu Gly Gly Leu Pro
485 490 495
Val Gly Gln Met Gly Ala Arg Ala Gly Gly Gly Leu Ser Gly Val Leu
500 505 510
Arg Val Pro Pro Arg Pro Tyr Val Met Pro His Ser Pro Ala Ala Gly
515 520 525
Asp Ile Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro
530 535 540
Ala Leu Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Gly Pro Gln
545 550 555 560
Val Val Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala
565
570
575
Gly Thr Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn
580 585 590
His Val Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser
595 600 605
Gly Gln Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp
610 615 620
Val Ala Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala
625 630 635 640
Ile Gly Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn
645 650 655
Ser Gly Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val
660 665 670
Ala Leu Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu
675 680 685
Glu Thr Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly
690 695 700
Asp Ala Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met
705 710 715 720
Asn Thr Ala Ala Ser 725
<210> 5
<211> 2178
<212> DNA
<213> Artificial Sequence
<220>
<223> M72 2-his <400> 5
atgcatcaca cggccgcgtc cgataacttc cagctgtccc agggtgggca gggattcgcc 60 attccgatcg ggcaggcgat ggcgatcgcg ggccagatcc gatcgggtgg ggggtcaccc 120 accgttcata tcgggcctac cgccttcctc ggcttgggtg ttgtcgacaa caacggcaac 180 ggcgcacgag tccaacgcgt ggtcgggagc gctccggcgg caagtctcgg catctccacc 240 ggcgacgtga tcaccgcggt cgacggcgct ccgatcaact cggccaccgc gatggcggac 300
gcgcttaacg ggcatcatcc cggtgacgtc atctcggtga cctggcaaac caagtcgggc 360
ggcacgcgta cagggaacgt gacattggcc gagggacccc cggccgaatt catggtggat 420
ttcggggcgt taccaccgga gatcaactcc gcgaggatgt acgccggccc gggttcggcc 480
tcgctggtgg ccgcggctca gatgtgggac agcgtggcga gtgacctgtt ttcggccgcg 540
tcggcgtttc agtcggtggt ctggggtctg acggtggggt cgtggatagg ttcgtcggcg 600
ggtctgatgg tggcggcggc ctcgccgtat gtggcgtgga tgagcgtcac cgcggggcag 660
gccgagctga ccgccgccca ggtccgggtt gctgcggcgg cctacgagac ggcgtatggg 720
ctgacggtgc ccccgccggt gatcgccgag aaccgtgctg aactgatgat tctgatagcg 780
accaacctct tggggcaaaa caccccggcg atcgcggtca acgaggccga atacggcgag 840
atgtgggccc aagacgccgc cgcgatgttt ggctacgccg cggcgacggc gacggcgacg 900
gcgacgttgc tgccgttcga ggaggcgccg gagatgacca gcgcgggtgg gctcctcgag 960
caggccgccg cggtcgagga ggcctccgac accgccgcgg cgaaccagtt gatgaacaat 1020
gtgccccagg cgctgcaaca gctggcccag cccacgcagg gcaccacgcc ttcttccaag 1080
ctgggtggcc tgtggaagac ggtctcgccg catcggtcgc cgatcagcaa catggtgtcg 1140
atggccaaca accacatgtc gatgaccaac tcgggtgtgt cgatgaccaa caccttgagc 1200
tcgatgttga agggctttgc tccggcggcg gccgcccagg ccgtgcaaac cgcggcgcaa 1260
aacggggtcc gggcgatgag ctcgctgggc agctcgctgg gttcttcggg tctgggcggt 1320
ggggtggccg ccaacttggg tcgggcggcc tcggtcggtt cgttgtcggt gccgcaggcc 1380
tgggccgcgg ccaaccaggc agtcaccccg gcggcgcggg cgctgccgct gaccagcctg 1440
accagcgccg cggaaagagg gcccgggcag atgctgggcg ggctgccggt ggggcagatg 1500
ggcgccaggg ccggtggtgg gctcagtggt gtgctgcgtg ttccgccgcg accctatgtg 1560
atgccgcatt ctccggcagc cggcgatatc gccccgccgg ccttgtcgca ggaccggttc 1620
gccgacttcc ccgcgctgcc cctcgacccg tccgcgatgg tcgcccaagt ggggccacag 1680
gtggtcaaca tcaacaccaa actgggctac aacaacgccg tgggcgccgg gaccggcatc 1740
gtcatcgatc ccaacggtgt cgtgctgacc aacaaccacg tgatcgcggg cgccaccgac 1800
atcaatgcgt tcagcgtcgg ctccggccaa acctacggcg tcgatgtggt cgggtatgac 1860
cgcacccagg atgtcgcggt gctgcagctg cgcggtgccg gtggcctgcc gtcggcggcg 1920
atcggtggcg gcgtcgcggt tggtgagccc gtcgtcgcga tgggcaacag cggtgggcag 1980
ggcggaacgc cccgtgcggt gcctggcagg gtggtcgcgc tcggccaaac cgtgcaggcg 2040
tcggattcgc tgaccggtgc cgaagagaca ttgaacgggt tgatccagtt cgatgccgcg 2100
atccagcccg gtgatgcggg cgggcccgtc gtcaacggcc taggacaggt ggtcggtatg 2160
aacacggccg cgtcctag 2178
<210> 6
<211> 723
<212> PRT
<213> Artificial Sequence
<220>
<223> M72 no his
<400> 6
Met Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly
1 5 10 15
Phe Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg
20 25 30
Ser Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu
35 40 45
Gly Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg
50 55 60
Val Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp
65 70 75 80
Val Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met
85 90 95
Ala Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Thr
100 105 110
Trp Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala
115 120 125
Glu Gly Pro Pro Ala Glu Phe Met Val Asp Phe Gly Ala Leu Pro Pro
130 135 140
Glu Ile Asn Ser Ala Arg Met Tyr Ala Gly Pro Gly Ser Ala Ser Leu
145 150 155 160
Val Ala Ala Ala Gln Met Trp Asp Ser Val Ala Ser Asp Leu Phe Ser
165 170 175
Ala Ala Ser Ala Phe Gln Ser Val Val Trp Gly Leu Thr Val Gly Ser
180 185 190
Trp Ile Gly Ser Ser Ala Gly Leu Met Val Ala Ala Ala Ser Pro Tyr
195 200 205
Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr Ala Ala
210 215 220
Gin Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly Leu Thr
225 230 235 240
Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Glu Leu Met Ile Leu
245 250 255
Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala Val Asn
260 265 270
Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala Met Phe
275 280 285
Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu Pro Phe
290 295 300
Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu Gln Ala
305 310 315 320
Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln Leu Met
325 330 335
Asn Asn Val Pro Gln Ala Leu Gln Gln Leu Ala Gln Pro Thr Gln Gly
340 345 350
Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val Ser Pro
355 360 365
His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn His Met
370 375 380
Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser Ser Met
385 390 395 400
Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln Thr Ala
405 410 415
Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser Leu Gly
420 425 430
Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg Ala Ala
435 440 445
Ser Val Gly Ser Leu Ser Val Pro Gln Ala Trp Ala Ala Ala Asn Gln
450 455 460
Ala Val Thr Pro Ala Ala Arg Ala Leu Pro Leu Thr Ser Leu Thr Ser
465 470 475 480
Ala Ala Glu Arg Gly Pro Gly Gln Met Leu Gly Gly Leu Pro Val Gly
485 490 495
Gln Met Gly Ala Arg Ala Gly Gly Gly Leu Ser Gly Val Leu Arg Val
500 505 510
Pro Pro Arg Pro Tyr Val Met Pro His Ser Pro Ala Ala Gly Asp Ile
515 520 525
Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu
530 535 540
Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Gly Pro Gln Val Val
545 550 555 560
Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr
565 570 575
Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val
580 585 590
Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln
595 600 605
Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala
610 615 620
Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly
625 630 635 640
Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly
645 650 655
Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu
660 665 670
Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr
675 680 685
Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ala
690 695 700
Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr
705 710 715 720
Ala Ala Ser
<210> 7
<211> 2172 <212> DNA
<213> Artificial Sequence
<220>
<223> M72 no his <400> 7
atgacggccg cgtccgataa cttccagctg tcccagggtg ggcagggatt cgccattccg 60
atcgggcagg cgatggcgat cgcgggccag atccgatcgg gtggggggtc acccaccgtt 120
catatcgggc ctaccgcctt cctcggcttg ggtgttgtcg acaacaacgg caacggcgca 180
cgagtccaac gcgtggtcgg gagcgctccg gcggcaagtc tcggcatctc caccggcgac 240
gtgatcaccg cggtcgacgg cgctccgatc aactcggcca ccgcgatggc ggacgcgctt 300
aacgggcatc atcccggtga cgtcatctcg gtgacctggc aaaccaagtc gggcggcacg 360
cgtacaggga acgtgacatt ggccgaggga cccccggccg aattcatggt ggatttcggg 420
gcgttaccac cggagatcaa ctccgcgagg atgtacgccg gcccgggttc ggcctcgctg 480
gtggccgcgg ctcagatgtg ggacagcgtg gcgagtgacc tgttttcggc cgcgtcggcg 540
tttcagtcgg tggtctgggg tctgacggtg gggtcgtgga taggttcgtc ggcgggtctg 600
atggtggcgg cggcctcgcc gtatgtggcg tggatgagcg tcaccgcggg gcaggccgag 660
ctgaccgccg cccaggtccg ggttgctgcg gcggcctacg agacggcgta tgggctgacg 720
gtgcccccgc cggtgatcgc cgagaaccgt gctgaactga tgattctgat agcgaccaac 780
ctcttggggc aaaacacccc ggcgatcgcg gtcaacgagg ccgaatacgg cgagatgtgg 840
gcccaagacg ccgccgcgat gtttggctac gccgcggcga cggcgacggc gacggcgacg 900
ttgctgccgt tcgaggaggc gccggagatg accagcgcgg gtgggctcct cgagcaggcc 960
gccgcggtcg aggaggcctc cgacaccgcc gcggcgaacc agttgatgaa caatgtgccc 1020
caggcgctgc aacagctggc ccagcccacg cagggcacca cgccttcttc caagctgggt 1080
ggcctgtgga agacggtctc gccgcatcgg tcgccgatca gcaacatggt gtcgatggcc 1140
aacaaccaca tgtcgatgac caactcgggt gtgtcgatga ccaacacctt gagctcgatg 1200
ttgaagggct ttgctccggc ggcggccgcc caggccgtgc aaaccgcggc gcaaaacggg 1260
gtccgggcga tgagctcgct gggcagctcg ctgggttctt cgggtctggg cggtggggtg 1320
gccgccaact tgggtcgggc ggcctcggtc ggttcgttgt cggtgccgca ggcctgggcc 1380
gcggccaacc aggcagtcac cccggcggcg cgggcgctgc cgctgaccag cctgaccagc 1440
gccgcggaaa gagggcccgg gcagatgctg ggcgggctgc cggtggggca gatgggcgcc 1500
agggccggtg gtgggctcag tggtgtgctg cgtgttccgc cgcgacccta tgtgatgccg 1560
cattctccgg cagccggcga tatcgccccg ccggccttgt cgcaggaccg gttcgccgac 1620
ttccccgcgc tgcccctcga cccgtccgcg atggtcgccc aagtggggcc acaggtggtc 1680
aacatcaaca ccaaactggg ctacaacaac gccgtgggcg ccgggaccgg catcgtcatc 1740
gatcccaacg gtgtcgtgct gaccaacaac cacgtgatcg cgggcgccac cgacatcaat 1800
gcgttcagcg tcggctccgg ccaaacctac ggcgtcgatg tggtcgggta tgaccgcacc 1860
caggatgtcg cggtgctgca gctgcgcggt gccggtggcc tgccgtcggc ggcgatcggt 1920
ggcggcgtcg cggttggtga gcccgtcgtc gcgatgggca acagcggtgg gcagggcgga 1980
acgccccgtg cggtgcctgg cagggtggtc gcgctcggcc aaaccgtgca ggcgtcggat 2040
tcgctgaccg gtgccgaaga gacattgaac gggttgatcc agttcgatgc cgcgatccag 2100
cccggtgatg cgggcgggcc cgtcgtcaac ggcctaggac aggtggtcgg tatgaacacg 2160
gccgcgtcct ag 2172
<210> 8 <211> 2172 <212> DNA
<213> Artificial Sequence
<220>
<223> M72 no his human optimised
<400> 8
atgaccgccg ccagcgacaa cttccagctg tctcagggcg gccagggctt cgccatccct 60
atcggccaag ctatggccat tgctggacag atcagaagcg gcggaggcag ccctaccgtg 120
catatcggcc ctaccgcctt cctgggcctg ggcgtggtgg acaacaacgg caacggcgcc 180
agagtgcagc gggtggtcgg atctgcccct gccgcaagcc tgggcatcag caccggggat 240
gtgatcaccg ccgtggatgg cgcccctatc aacagcgcca cagccatggc cgacgccctg 300
aatggacacc accccggcga cgtgatcagc gtgacctggc agaccaagag cggaggcacc 360
agaaccggca acgtgacact ggccgaggga cctcccgccg agttcatggt ggatttcggc 420
gccctgcccc ccgagatcaa ctccgccagg atgtatgccg gccctggcag cgcctctctg 480
gtggccgctg ctcagatgtg ggacagcgtg gccagcgatc tgttcagcgc cgcctccgcc 540
ttccagtccg tggtctgggg cctgaccgtg ggcagctgga tcggaagcag tgccggcctg 600
atggtggctg ccgcctctcc ctacgtggcc tggatgtcag tcacagccgg ccaggccgaa 660
ctgactgccg ctcaagtgcg agtggctgct gctgcctatg agacagccta cggcctgaca 720
gtgcccccac ccgtgatcgc cgagaaccgg gccgagctga tgatcctgat cgccaccaac 780
ctgctgggcc agaacacccc cgccattgcc gtgaacgagg ccgagtacgg cgagatgtgg 840
gcccaggacg ccgctgccat gtttggctat gccgctgcta cagccaccgc cactgccacc 900
ctgctgccct tcgaagaggc ccccgagatg acctctgccg gcggactgct ggaacaggcc 960
gctgccgtgg aagaggccag cgacacagcc gccgctaacc agctgatgaa caacgtgccc 1020
caggccctgc agcagctggc acagcctaca cagggcacca ccccttctag caagctcggc 1080
ggcctgtgga aaaccgtgtc cccccaccgg tcccccatca gcaacatggt gtccatggcc 1140
aacaaccaca tgagcatgac caacagcggc gtgtccatga ccaataccct gagcagcatg 1200
ctgaagggct ttgccccagc cgctgccgct caggctgtgc agacagctgc tcagaatggc 1260
gtgcgggcca tgagcagcct gggcagttcc ctgggcagct ctggactggg agggggcgtg 1320
gccgccaatc tgggcagagc cgctagcgtg ggcagcctgt ctgtgcctca agcctgggct 1380
gctgccaatc aggccgtgac accagccgct agagccctgc ctctgaccag cctgacctct 1440
gctgccgaga ggggccctgg ccagatgctg ggaggactgc ctgtgggcca gatgggagcc 1500
agagccggcg gaggactgag cggcgtgctg agagtgcccc ccagacccta cgtgatgccc 1560
cactctcccg ccgctggcga tattgcccct cccgccctga gccaggacag attcgccgac 1620
ttccctgccc tgcccctgga tccttctgcc atggtggctc aagtgggacc ccaggtggtg 1680
aacatcaaca ccaagctggg ctacaacaac gccgtgggag ccggcaccgg catcgtgatc 1740
gaccccaatg gcgtggtgct gaccaacaat cacgtgatcg ctggcgccac cgacatcaac 1800
gccttcagcg tgggctccgg ccagacctac ggcgtggacg tggtcggata cgaccggacc 1860
caggatgtgg ccgtgctgca gctgagaggc gctggcggac tgccttctgc cgccattgga 1920
ggcggagtgg ccgtgggaga acctgtggtg gccatgggca atagcggcgg acagggcggc 1980
acacctagag ctgtgcctgg aagagtggtg gccctgggac agaccgtgca ggccagcgat 2040
agcctgacag gcgccgagga aaccctgaac ggcctgatcc agttcgacgc cgccatccag 2100
cctggggatg ctggcggacc tgtggtgaac ggactgggcc aggtggtcgg aatgaatacc 2160
gccgcctcct ga 2172
<210> 9 <211> 37741 <212> DNA
<213> Pan troglodytes
<400> 9
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cgaggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctccgtttt attattatag tcagctgacg cggagtgtat 480
ttataccctc tgatctcgtc aagaggccac tcttgagtgc cagcgagtag agttttctcc 540
tctgccgctc tccgctccgc tccgctcggc tctgacaccg gggaaaaaat gagacatttc 600
acctacgatg gcggtgtgct caccggccag ctggctgctg aggtcctgga caccctgatc 660
gaggaggtat tggccgataa ttatcctccc tcgactcctt ttgagccacc tacacttcac 720
gaactatacg atctggatgt ggtggggccc agcgatccga acgagcaggc ggtttccagt 780
ttttttccag agtccatgtt gttggccagc caggaggggg tcgaacttga gacccctcct 840
ccgatcgtgg attcccccga tccgccgcag ctgactaggc agcccgagcg ctgtgcggga 900
cctgagacta tgccccagct gctacctgag gtgatcgatc tcacctgtaa tgagtctggt 960
tttccaccca gcgaggatga ggacgaagag ggtgagcagt ttgtgttaga ttctgtggaa 1020
caacccgggc gaggatgcag gtcttgtcaa tatcaccgga aaaacacagg agactcccag 1080
attatgtgtt ctctgtgtta tatgaagatg acctgtatgt ttatttacag taagtttatc 1140
atcggtgggc aggtgggcta tagtgtgggt ggtggtcttt ggggggtttt ttaatatatg 1200
tcaggggtta tgctgaagac ttttttattg tgatttttaa aggtccagtg tctgagcccg 1260
agcaagaacc tgaaccggag cctgagcctt ctcgccccag gagaaagcct gtaatcttaa 1320
ctagacccag cgcaccggta gcgagaggcc tcagcagcgc ggagaccacc gactccggtg 1380
cttcctcatc acccccggag attcaccccc tggtgcccct atgtcccgtt aagcccgttg 1440
ccgtgagagt cagtgggcgg cggtctgctg tggagtgcat tgaggacttg ctttttgatt 1500
cacaggaacc tttggacttg agcttgaaac gccccaggca ttaaacctgg tcacctggac 1560
tgaatgagtt gacgcctatg tttgcttttg aatgacttaa tgtgtataga taataaagag 1620
tgagataatg ttttaattgc atggtgtgtt taacttgggc ggagtctgct gggtatataa 1680
gcttccctgg gctaaacttg gttacacttg acctcatgga ggcctgggag tgtttggaga 1740
actttgccgg agttcgtgcc ttgctggacg agagctctaa caatacctct tggtggtgga 1800
ggtatttgtg gggctctccc cagggcaagt tagtttgtag aatcaaggag gattacaagt 1860
gggaatttga agagcttttg aaatcctgtg gtgagctatt ggattctttg aatctaggcc 1920
accaggctct cttccaggag aaggtcatca ggactttgga tttttccaca ccggggcgca 1980
ttgcagccgc ggttgctttt ctagcttttt tgaaggatag atggagcgaa gagacccact 2040
tgagttcggg ctacgtcctg gattttctgg ccatgcaact gtggagagca tggatcagac 2100
acaagaacag gctgcaactg ttgtcttccg tccgcccgtt gctgattccg gcggaggagc 2160
aacaggccgg gtcagaggac cgggcccgtc gggatccgga ggagagggca ccgaggccgg 2220
gcgagaggag cgcgctgaac ctgggaaccg ggctgagcgg ccatccacat cgggagtgaa 2280
tgtcgggcag gtggtggatc tttttccaga actgcggcgg attttgacta ttagggagga 2340
tgggcaattt gttaagggtc ttaagaggga gaggggggct tctgagcata acgaggaggc 2400
cagtaattta gcttttagct tgatgaccag acaccgtcca gagtgcatca cttttcagca 2460
gattaaggac aattgtgcca atgagttgga tctgttgggt cagaagtata gcatagagca 2520
gctgaccact tactggctgc agccgggtga tgatctggag gaagctatta gggtgtatgc 2580
taaggtggcc ctgcggcccg attgcaagta caagctcaag gggctggtga atatcaggaa 2640
ttgttgctac atttctggca acggggcgga ggtggagata gagaccgaag acagggtggc 2700
tttcagatgc agcatgatga atatgtggcc gggggtgctg ggcatggacg gggtggtgat 2760
tatgaatgtg aggttcacgg ggcccaactt taacggcacg gtgtttttgg ggaacaccaa 2820
cctggtcctg cacggggtga gcttctatgg gtttaacaac acctgtgtgg aggcctggac 2880
cgatgtgaag gtccgcggtt gcgcctttta tggatgttgg aaggccatag tgagccgccc 2940
taagagcagg agttccatta agaaatgctt gtttgagagg tgcaccttgg ggatcctggc 3000
cgagggcaac tgcagggtgc gccacaatgt ggcctccgag tgcggttgct tcatgctagt 3060
caagagcgtg gcggtaatca agcataatat ggtgtgcggc aacagcgagg acaaggcctc 3120
acagatgctg acctgcacgg atggcaactg ccacttgctg aagaccatcc atgtaaccag 3180
ccacagccgg aaggcctggc ccgtgttcga gcacaacttg ctgacccgct gctccttgca 3240
tctgggcaac aggcgggggg tgttcctgcc ctatcaatgc aactttagtc acaccaagat 3300
cttgctagag cccgagagca tgtccaaggt gaacttgaac ggggtgtttg acatgaccat 3360
gaagatctgg aaggtgctga ggtacgacga gaccaggtcc cggtgcagac cctgcgagtg 3420
cgggggcaag catatgagga accagcccgt gatgctggat gtgaccgagg agctgaggac 3480
agaccacttg gttctggcct gcaccagggc cgagtttggt tctagcgatg aagacacaga 3540
ttgaggtggg tgagtgggcg tggcctgggg tggtcatgaa aatatataag ttgggggtct 3600
tagggtctct ttatttgtgt tgcagagacc gccggagcca tgagcgggag cagcagcagc 3660
agcagtagca gcagcgcctt ggatggcagc atcgtgagcc cttatttgac gacgcggatg 3720
ccccactggg ccggggtgcg tcagaatgtg atgggctcca gcatcgacgg ccgacccgtc 3780
ctgcccgcaa attccgccac gctgacctat gcgaccgtcg cggggacgcc gttggacgcc 3840
accgccgccg ccgccgccac cgcagccgcc tcggccgtgc gcagcctggc cacggacttt 3900
gcattcctgg gaccactggc gacaggggct acttctcggg ccgctgctgc cgccgttcgc 3960
gatgacaagc tgaccgccct gctggcgcag ttggatgcgc ttactcggga actgggtgac 4020
ctttctcagc aggtcatggc cctgcgccag caggtctcct ccctgcaagc tggcgggaat 4080
gcttctccca caaatgccgt ttaagataaa taaaaccaga ctctgtttgg attaaagaaa 4140
agtagcaagt gcattgctct ctttatttca taattttccg cgcgcgatag gccctagacc 4200
agcgttctcg gtcgttgagg gtgcggtgta tcttctccag gacgtggtag aggtggctct 4260
ggacgttgag atacatgggc atgagcccgt cccgggggtg gaggtagcac cactgcagag 4320
cttcatgctc cggggtggtg ttgtagatga tccagtcgta gcaggagcgc tgggcatggt 4380
gcctaaaaat gtccttcagc agcaggccga tggccagggg gaggcccttg gtgtaagtgt 4440
ttacaaaacg gttaagttgg gaagggtgca ttcggggaga gatgatgtgc atcttggact 4500
gtatttttag attggcgatg tttccgccca gatcccttct gggattcatg ttgtgcagga 4560
ccaccagtac agtgtatccg gtgcacttgg ggaatttgtc atgcagctta gagggaaaag 4620
cgtggaagaa cttggagacg cccttgtggc ctcccagatt ttccatgcat tcgtccatga 4680
tgatggcaat gggcccgcgg gaggcagctt gggcaaagat atttctgggg tcgctgacgt 4740
cgtagttgtg ttccagggtg aggtcgtcat aggccatttt tacaaagcgc gggcggaggg 4800
tgcccgactg ggggatgatg gtcccctctg gccctggggc gtagttgccc tcgcagatct 4860
gcatttccca ggccttaatc tcggaggggg gaatcatatc cacctgcggg gcgatgaaga 4920
aaacggtttc cggagccggg gagattaact gggatgagag caggtttcta agcagctgtg 4980
attttccaca accggtgggc ccataaataa cacctataac cggttgcagc tggtagttta 5040
gagagctgca gctgccgtcg tcccggagga ggggggccac ctcgttgagc atgtccctga 5100
cgcgcatgtt ctccccgacc agatccgcca gaaggcgctc gccgcccagg gacagcagct 5160
cttgcaagga agcaaagttt ttcagcggct tgaggccgtc cgccgtgggc atgtttttca 5220
gggtctggct cagcagctcc aggcggtccc agagctcggt gacgtgctct acggcatctc 5280
tatccagcat atctcctcgt ttcgcgggtt ggggcgactt tcgctgtagg gcaccaagcg 5340
gtggtcgtcc agcggggcca aagtcatgtc cttccatggg cgcagggtcc tcgtcagggt 5400
ggtctgggtc acggtgaagg ggtgcgctcc gggctgagcg cttgccaagg tgcgcttgag 5460
gctggttctg ctggtgctga agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca 5520
tttgaccatg gtgtcatagt ccagcccctc cgcggcgtgt cccttggcgc gcagcttgcc 5580
cttggaggtg gcgccgcacg aggggcagag caggctcttg agcgcgtaga gcttgggggc 5640
gaggaagacc gattcggggg agtaggcgtc cgcgccgcag accccgcaca cggtctcgca 5700
ctccaccagc caggtgagct cggggcgcgc cgggtcaaaa accaggtttc ccccatgctt 5760
tttgatgcgt ttcttacctc gggtctccat gaggtggtgt ccccgctcgg tgacgaagag 5820
gctgtccgtg tctccgtaga ccgacttgag gggtcttttc tccagggggg tccctcggtc 5880
ttcctcgtag aggaactcgg accactctga gacgaaggcc cgcgtccagg ccaggacgaa 5940
ggaggctatg tgggaggggt agcggtcgtt gtccactagg gggtccacct tctccaaggt 6000
gtgaagacac atgtcgcctt cctcggcgtc caggaaggtg attggcttgt aggtgtaggc 6060
cacgtgaccg ggggttcctg acgggggggt ataaaagggg gtgggggcgc gctcgtcgtc 6120
actctcttcc gcatcgctgt ctgcgagggc cagctgctgg ggtgagtatt ccctctcgaa 6180
ggcgggcatg acctccgcgc tgaggttgtc agtttccaaa aacgaggagg atttgatgtt 6240
cacctgtccc gaggtgatac ctttgagggt acccgcgtcc atctggtcag aaaacacgat 6300
ctttttattg tccagcttgg tggcgaacga cccgtagagg gcgttggaga gcagcttggc 6360
gatggagcgc agggtctggt tcttgtccct gtcggcgcgc tccttggccg cgatgttgag 6420
ctgcacgtac tcgcgcgcga cgcagcgcca ctcggggaag acggtggtgc gctcgtcggg 6480
caccaggcgc acgcgccagc cgcggttgtg cagggtgacc aggtccacgc tggtggcgac 6540
ctcgccgcgc aggcgctcgt tggtccagca gagacggccg cccttgcgcg agcagaaggg 6600
gggcaggggg tcgagctggg tctcgtccgg ggggtccgcg tccacggtga aaaccccggg 6660
gcgcaggcgc gcgtcgaagt agtctatctt gcaaccttgc atgtccagcg cctgctgcca 6720
gtcgcgggcg gcgagcgcgc gctcgtaggg gttgagcggc gggccccagg gcatggggtg 6780
ggtgagtgcg gaggcgtaca tgccgcagat gtcatagacg tagaggggct cccgcaggac 6840
cccgatgtag gtggggtagc agcggccgcc gcggatgctg gcgcgcacgt agtcatacag 6900
ctcgtgcgag ggggcgagga ggtcggggcc caggttggtg cgggcggggc gctccgcgcg 6960
gaagacgatc tgcctgaaga tggcatgcga gttggaagag atggtggggc gctggaagac 7020
gttgaagctg gcgtcctgca ggccgacggc gtcgcgcacg aaggaggcgt aggagtcgcg 7080
cagcttgtgt accagctcgg cggtgacctg cacgtcgagc gcgcagtagt cgagggtctc 7140
gcggatgatg tcatatttag cctgcccctt ctttttccac agctcgcggt tgaggacaaa 7200
ctcttcgcgg tctttccagt actcttggat cgggaaaccg tccggttccg aacggtaaga 7260
gcctagcatg tagaactggt tgacggcctg gtaggcgcag cagcccttct ccacggggag 7320
ggcgtaggcc tgcgcggcct tgcggagcga ggtgtgggtc agggcgaagg tgtccctgac 7380
catgactttg aggtactggt gcttgaagtc ggagtcgtcg cagccgcccc gctcccagag 7440
cgagaagtcg gtgcgcttct tggagcgggg gttgggcaga gcgaaggtga catcgttgaa 7500
gaggattttg cccgcgcggg gcatgaagtt gcgggtgatg cggaagggcc ccggcacttc 7560
agagcggttg ttgatgacct gggcggcgag cacgatctcg tcgaagccgt tgatgttgtg 7620
gcccacgatg tagagttcca ggaagcgggg ccggcccttt acggtgggca gcttctttag 7680
ctcttcgtag gtgagctcct cgggcgaggc gaggccgtgc tcggccaggg cccagtccgc 7740
gaggtgcggg ttgtctctga ggaaggactc ccagaggtcg cgggccagga gggtctgcag 7800
gcggtccctg aaggtcctga actggcggcc cacggccatt ttttcggggg tgatgcagta 7860
gaaggtgagg gggtcttgct gccagcggtc ccagtcgagc tgcagggcga ggtcgcgcgc 7920
ggcggtgacc aggcgctcgt cgcccccgaa tttcatgacc agcatgaagg gcacgagctg 7980
ctttccgaag gcccccatcc aagtgtaggt ctctacatcg taggtgacaa agaggcgctc 8040
cgtgcgagga tgcgagccga tcgggaagaa ctggatctcc cgccaccagt tggaggagtg 8100
gctgttgatg tggtggaagt agaagtcccg tcgccgggcc gaacactcgt gctggctttt 8160
gtaaaagcga gcgcagtact ggcagcgctg cacgggctgt acctcctgca cgagatgcac 8220
ctttcgcccg tggctggtgc tacggtggag tcggagtttg cggcggcagg gggcaggtct caggagcccg ggtggtggtg gggggctccg agttggtgct atctggcgcc acagaatcaa gagttgtctt ccgcgtccgg gagaaggcgt tcgcgggcgc tagttgcgca aagttcatga tccatggcct gtcaactcct aaggctatgg ggcacttcca ggcgctctgc ccgcggcggc aagacgccgc acgatgcatc tccaccggat ctgagcaccg atgtaattga ggtccggcct cgcaggtcct tctgcttctt cgcacgagga tcttctactt cggaccacca atgacgacat tcagccggga aggtggtacc catccccggg gtggcggtgc gtcccgccgg gtgcccggag tctgcgtgaa tctcggtgtc ggtaggcgat cgcgttccac tgagtccgcc gcatgaccac gacgctggaa cccagcggcg cgtagaagtc cctccagaag ggatctcttc tgatggcttc gccggcggcg ggcgcatggt cggacatctg tcaacaattg ccgaaaacct tggcgggcgg agtaggcgga gctggatgcg tgtagtagtc ccatgtctgc agccgagggg tggatgcgtg cgccgcgcga cgcgcagctg gttcttgcag tgatctctag gggcgacgac agctcagaag caggggcggc gttgctggcg gacgacgggc attgaccgcg ctcggccatg ggtggccgcc ctcgttccag ctgcgcgagg gaggtagttg caacgtggat cacggcgaag acggatgagc ctccgctagc ctcctcttcg gcgcaccggg ctcggtgacg gtgctggggc ctgcgtaggt ttcgaggaag
cggggggtgg
cttgacacgg gaggcggtcg ttgcatgagc ttcggccctg aaatctgagc tccgtctccg gccgcaggtc ggagctgtcc gttcacctcg gggcgtgttg ggtgccccgc cggtgccgcg agcggcacgt aaggcgacga ccggtgagct gcctggcgca aactgctcga aggtcgttgg actcggctgt ttgagctcca agggtggtgg tcgttgatgt ttgaaaaact tcggcgacgg atcaccacct
gggggcggcg
aggcggtcca gcgcggccgt gggtggccgt acgccgccga gcgtctaacc ggggagtgtc cggatggtcg gctatgcccc ctttccaccg gggcggcgcc cccccgcctg tctggctcct cagatatcgg atggtctgga cagagtcggg gtggcggcgt
ggggtggtgg
ggcgggcccc cggcgtggag cgcggcggtt tgaacctgaa ggatctcctg tctcttcctc agatgcgccc agaccacgcc cgtgccgcgc cggtgtgctc cccccaaggc gggagttgcg tgtcgcgcac cctcctcttc gcggcggcgg cgaagcgcgc tctcccgggg gaggcagcga gggacctgag agtcgcagtc tggcggaggt acaggagcac aggcttcgtt gcacctcttc gcgcccccct gctcgcggca cgaggggtgt cgcgcggcgg gctcccgcgg ccagggcgcg cgatggcttg tggtggtggt cggaggtagg cgcgggcagg gatctcctgg agagagttcg cacgtctccc ctggaggtct catgagctgc cccctggtca gaagacggcg ggccacgaag ctccagccgt cgccgacacg ctcgcgctcg ctcctcttct
tgggggaggg
gatcatctcc gcgcagttgg aacggcgctg ggagtccata gcaaggtagg gctgctgatg catgtccttg ctggcatcgg tccttcctct gccccccatg
8280
8340
8400 8460 8520 8580 8640
8700 8760
8820 8880 8940 9000 9060 9120 9180 9240 9300 9360 9420 9480 9540 9600 9660 9720 9780 9840 9900 9960 10020 10080 10140
cgcgtgaccc gccaggatgg cggtggtagg gtctggtggc aagacgtagt ggctggcggt atgaggcggt gaggcgcgcg atggtaggcg aacgaaagcc tggcggaggg ggttaccgcc ttggcgtttt cagtaagtgg accccggttc ctccccctcg ttatttttgc gcagcaacaa acccaccctc
cggcgggggg
ggacctggag gcgggtgcag ggaccgcgcg gctgcggcag gcggacgggg cgagcagacg gctggtggcg gctggtgcag cagcagggac gtggctgctg cctggccgac gcgcaagatc cgaaccccct cctgctgcac cgcccgtgtt ccggttgcga cgttgcaagt agaggggcca ggtaggcgta ggaagtcgcg tgctctgtcc ggtcagcggg cctcggttcg cgcgtgtcga tctggccggg ctcgctcccc gaatcccgta tataaagacc tttccccaga caccagcaag ggcgggccgg ccggctgacg gagggcgagg ctgaagcgcg ggcgaggagc gggctgaacc atcagccccg gtgaaccagg cgcgaggagg aaccccaaca aacgaggcgt gacctgatta aaggtggcgg taccagacgc gagcggttgg ctgcgtgagg gatggtgtag catctcggtg ccgcaccagg gcgcagggtg gatgtacctg cacccggttc agtcagacgc cactcttccg agccccgggt acccaggtgt cgccggcgtc gtagccggag ctcgggccgg ccgcttgcgg tgcatccggt agcggcagca ccacctcggc accccgagga gcctggcgcg actcgcgcga ccgaggagat gcgagcggct cgcgcgcgca agatcaactt tgaccatcgg gcaagcctct ttagggacgc acatcctgca ccatcaacta cgtacgtgcc agcagggcca gtggtttgga gtgcagttgg tacctgagtc tactggtagc gcgggggctc gacatccagg cagatgttgc gcgcagtcgt tggtctggtg ccgggccgga gcgacgtcag gcgtaagaga ggatccttgc ccggacccgc attgactccg gctgcggcag acagcagcgg gtccgcggcc gcccccgcgg gctgggggcg ggcgtacgtg gcgggacagg gctgcgcgag cgtggcggcc ccaaaagagt gctgatgcac gacggcgcag gctgctgaac gagcatagtg ctcgatgctg catagacaag ggtcggcgac agtcatccaa ccatgacgga gcgagtaggc ccaccaggaa cgggggccag tgatacccgc gcaggggcag tgatactcta aatagatcgc cggtccgcca acaacggtgg ctaagccgcg taagggttgc ggctaaggtg gacacgggga atgcgccccc gagtcatgca gtgtctggcg cgcagggcca ccgtctcccg cctcggcaga aggttcagcg gaggactttg gccgacctgg ttcaacaacc ctgtgggact ctgttcctga atcaccgagc gtgcaggagc agcctgggca gaggtgaaga gacgcgctcg gtccacgaag ccagttgacg gcgggagtcg gtgcggcggc gtcttccagc ggcggtggtg aaagtgctcc gaccagggaa aagggtatca tgatccacgc agtgttcctt aaagcgaaag gttgcggcga ttggattggc cgagcccctt cgccccagca gggccccctc cctgcggcgg gacactacct agcgccaccc acctgttcag cagggcggga agcccgacgc tgacggcgta acgtgcgcac ttgtaagcgc tagtgcagca ccgagggtcg gcagcctgag agttttacgc tcgacggttt
10200 10260 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060
ttacatgcgc cgagcgcatc gatgcacagc ctacttcgat gggggtccgc gggcgagtac gtggacccgg gactggcgac cggcagcagc tcgaacccca atccgcccgg aacagcggca gcgcagcgcg ttcctgagca agcgcgctgc gactacttct aagaacctgc agcctgctga ggcagcgtgt gggcaggcgc gggcaggagg cagaagattc cagcagagcg atgaccgcgc ctgatggact ctgaacccgc gccaacgatg gcgctggcgg cgcggcagca gggtccctgg acccgccctc cgggagaaaa atggcgctga cacaaggccg ctgcagcggg
gcgggggcgg
gaggactatg ctggactaaa cgctgcgggc aggtcatgga cgcaggccaa cgcacgagaa acgaggccgg acgtgcagac agcgcgcgga cgcagccggc ggctgatggt tccagaccag gggggctgtg cgcccaactc cccgggacac aggtggacga acacgagcag cctcgctgca tgagcctgaa gcaacatgga acctgcatcg actggctccc gcttcctgtg aagcgtccct gcggcgtggc gcggcagccc ggctgctggg acctgccccc aggtgctcac tgagcgtgag cgctggcggg acctgcgctg acgaggacgg ccgcgggtgg ggctctgcag ccgcatcatg caggctctcc ggtgctggcc gctggtgtac caacctggac tcggcagggc caacgtgccg gaccgagacc cagacagggc gggcgtgaag gcgcctgctg ctacctgggg gcacaccttc cctggaggcg cagcctgacc cctgatgcgc accgggcatg cgcggcggcc gccgcccggg ggacgacatg gctgcgtccc ttctctgtcc ctttccgagc cgaggacgag cgccttcccc cctgagcgac ccggcggcgc cgccggcagc ggcgcccagc cgaggaggat tgtttccggt agccagccgt tcgctgacgg gccatcctgg atagtgaacg gacgcgctgc cggctggtgg aacctgggct cgggggcagg ccccagagcg ctgcagacgg gcgcccaccg ctgctgctga cacctgctga caggagatca actctgaact tccgaggagg gacggggtga tacgccgcgc gtgaaccccg ttctacagcg gacgacagcg aagaaggagg gagctggggg ctggtggggt tacctgaata aacaacggga gacctgggcg gagctgagcg ggcgacaggg cggcgggccc gaggagtacg agatgcaaga ccggccttaa cgcgtaaccc aggcggtggt cgctggccga tgcagcgcgt gggacgtgcg ccatggtggc aagactacac aggtgtacca tgaacctgag gcgaccgggc tcgcgccgtt ccctgtaccg ccagcgtgag acctgctgac agcgcatctt cgcccagcgt accggcctta agtactttac ggggcttcga tgttctcccc aggaggaggc cggcagccgc ctctgcacag actccctgct tagagagcct tgtaccgcaa accgcgagct aggcggagtc tggaggccgc agctagagga cccgaacgtg ctcctcagac ggacgcgttc gcctgcgcgc gaacagggcc ggcccgctac cgaggcggtg gctgaatgcc caactttgtg gtcgggcccg ccaggctttc gacggtgtcc cacggacagc cgaggccatc ccgcgcgctg caaccggcgg gcgctacgtg ggcgctggac catcaaccgc caacgccatc ggtcccggag gcggccgcag gagtcgccgc cgcgcgcccc cgagcgcacc gcagccggtg ggtggacaag
12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740 13800 13860 13920 13980
atgagcagat acgcggcgcc gacgatagca cgcctgggga aactcaccaa cgcggcgatg ggcggcgccc ctacctgcgg cgacaccacc ccagaacgac cgaggccagc aaccatcctg ggcgcgggtg gtgggtggag gaacaacgcg cgacatcggg gctggttatg cggctgcggg gcagcccttc cgcgctcctc ggataccacc ggccgcggac ggatatgaat agcggaggcc gttggccgcg gcccctgacc cgcgtaccgc ctggaccctg gcccgacatg ggtggtgggc ctactcccag gaaccagatt ggaagaccta agcgccacga gcgtgctgga ggatgtttta ggccatggcg taccaggagg tcttctccct cctacggggg cgggtgtacc cacagcaatt acccagacca cacaccaaca atggtgtcgc ttcgagctgc atcgtggagc gtcaagttcg cccggggtgt gtggacttca caggagggct gatgtggagg cccgccgcct ggggcagagg gacagtgcgg gaggccgcgg gcggaggctg gaagatagca agctggtacc ctgtgcacgc atgcaagacc gccgagctgc ctcatccgcc ctggcgcgcc tgcgcaggag ccggcagcgg cctgggaggg aaaaaaaaaa accgagcgtt gacctcctcc ttgcgtcgca ggagaaacag tggtggacaa ttttgaccac tcaatctgga tgcccaacgt gctcgcacac cagagggcaa actatctgaa acaccaggaa acaccaacga cttacagccg tcaggatcac cctaccagga ccgccgccgc ccgaccccgc tgcgcggaga ccgaggaaaa agtctgaggg agaagcgcag tggcctacaa cggacgtgac ccgtgacctt tgcccgtgca agttcacctc cgcccgcccc cacagggacg gggctggtgt agcggcaacc aagcaagaag ggtttcttgt ctcttacgag gctgctggag catccgttac caagtcggcg ggtcatccag tgaccggtcg gaacgagttc caaggaagac ctactccgag agtgggcagg cttccgcctg ggccttccat cctgagcaac ctacgaggac tagcttgaag cgagcagggc tatggtggtg caccttcgtc gcaactggcg gaccaagccc ttacaacctg ctacggcgac ctgcggctcg ccgctccacg ctccaagagc tctgacccac caccatcacc cgcccgcgct gggatgacga cgttcgcgca catgatgcaa gttcccttca agcgtggtgg ccgccgtacg tcggagctgg gacgtggcct aacaatgact cactggggcg atgttcacca cgggtggagc accatgacca caaaacgggg gggctggacc cccgacatca ctcctgggca ctggaggggg gaaaatgagg gaggatgctg gaggctcccg acccgggggg gcagcagcgg gccaaggagc ctcaaggaca ccgtcgacgg gagcaggtgt cggcaggtca ttctacaacg gtgttcaatc accgtcagtg ccggccgccc ggactccgcg cctgcgcccc aattaaataa gtatgcggcg gcgcggcggc tgcctccgcg cgcccctgtt ccctgaacta acagcccgag gcgacctgaa ataagttcaa tgaagtacga ttgacctgat tcctggagag ccgtgaccgg tcctgctgcc tccgcaagcg gcaacatccc cgggacagga ctgacaccgc agcaggagga aggaaaagca cggcggcggc ccgtgattaa gcaccaacac gggtgcgctc actggtcgct gcaacttccc accaggccgt gctttcctga aaaacgttcc
14040 14100 14160 14220 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 14940 15000 15060 15120 15180 15240 15300 15360 15420 15480 15540 15600 15660 15720 15780 15840 15900
tgctctcaca gaccgttact ctcgccgcgc atctcaccca ggggcgagga tggggagcgc gtggtggagc accgtggtgc cgccgccacc cgggccaagc atcaccgccg gccatcagtg accggcacgc caacactgag tccaagcgca ccgaagaagg aaagatgatg ccggtgcagt ttcacgcccg gacgaagacc cagcgggcgc cccagtctga aagcggggtc aagcggcaga gacatcaggg gtggtcatcc atggagacac gcggaggtgc ggacgcagaa atcgcgccca acccgccgtc cccgcactgg gatcacggga gacgccagac gtcctttcca gcaataactc agcgttccga acaaacgcgg aggcgcgcaa ggggcgcgcg gccgccgacc gcacgggccg ccaccatggc acatggccag gcgtgcccgt tctcctgctg aaatcaaaga aagagcagga acgatgccga ggaagggccg gcgagcgctc tgctggagca tggggaagga agcccgtgac tgaagcgcga ggctggagga tccgtcccat ccaccggcaa agaccgatcc agacggaccc agtacggcgc cccccggcta cccgccgacg ctccagtctc cgctaccgct gccgcacctg gccgcacttt cggctgggga gcagcacccc ccgcgcgggg ctacaggccc gcggtacgcc cggggccgcc ccgcgccgcc cccccgtacc caggcgccgg gcgcttccgc ttgtgtgtat agagatgctc ttcgaagccc tggggaggtg gcgcgtaaag cacccggact ggccaacgag ggacctgctg cctgcagcag gggcggcgac tgtgctggag caagcaggtg ctcccccgcc cgccgcagcc ctggctgccg cgccaacgcg ccgaggctat cgccgccgcc cgtgaggaga gcgcaacagc cccctacgtt ttgagcaaca ctgctgcgcg gtgcgcgtgc cgcaccaccg gcggtctcta aagctgaaga gccaaacgcg atgagggccg cgaagacgcg ggcaacgtgt cccccgcgga cccagcggcg caggtcgtcg cgcaagataa gagttcctgc cgcgtcctgc ttcaagcgcg cgcttcggag gcgctgccgc gtgctgccga ctggcgccca aaaatgaaag gcgccgggcc gccaccacca gcagccgccg ccggcgatgt ctcctgcccg acctaccgcc accacccgcc gtggcgcgcg atcggaggag tacaaggcct ccaccatcat cgcccagcaa gcgggcactt tggacgacgc ccgtggacgc gccgccggaa ccgccgcggc cgcgccgctt cggccgccgc actgggtgcg cttgagatga gcggcgcgcg cgccggagat agcgggtcaa gcgccacggc gccccggcac tctatgacga agtttgctta tggaccaggg gcagcgcacc ccgtgcagct tagaccccgg tcggcgtgca ctaccgctgc ccgcagccgc cagctccccg agtacgcctt cgcgaagagc gccgccgccg acggacacac tccagcgagt tgggcatagt gtccatcctg gatgttcgga ccgcgccccc catcgactcg ggccatccag gcgcgtggcc cctgcttcgc ggccgccggc cgccgccgcc cgactcggtg tgtgaaaaaa cagcgtcatg ctatgggccc aaagaaaaag gcccaggcgc cgcggtggtc ggtgtacggc cgggaagcgt caaccccacc ctccgaggcg catggtgccc tctgcagccg gaccgtggac ctccacggac gacctcctcg cgcgcgccgc gcatccttcc caagggttcc cagacgccag cctggtgctg
15960 16020 16080 16140 16200 16260 16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 17580 17640 17700 17760 17820
cccagggcgc gccctcactt aggaggggtc cgcgccacca gcggcgatcg tgacagactt actctcacgc cgctggcccc gcaacatgag ggtctgccgt gagacaagtt tcaacggggt acccccggcc gtggcgagaa agccgccccc ccatggccac ccgatgtgcc cctccgccgg gcaactggca gccgatgcta gccagaggag tcaagatggc acgcctcgga tcagcctgag accggtctca cgtacaaggc cctactttga ccgcctacaa aaactcaggc aggaagagca aaaaaattag ctatttatgc gctaccaccc gccgcctccg tggccggccg gccgacgcat gcgccgtgcc gcaaacttgc tcgcttggtc gcgtcacggc cggtggcgcc taaaaattac gaaagagcag ggtggacctg gccggtggag gcgcccgcgg gtatgaggag cggggtggtg gcagcagcag tcctctgcgc gagcacgctg ctgaatagct ctgctgagtc gaccccatcg gtacctgagc taacaagttt gcgcctgacg gcggttcacc catccgcggg ctccctggcc agttgaagaa agcagctacc taaagatggt agaccctaca cagcatcgtt tttcccggtg cggcctgagc gcgcggcggg cgggatcgcc aaatatggaa ctgtgactat tcgcgcccgt ttcagttggg ggctcccggg aacttccagc gccaaccagg gaggtgccgc cccgataggg gccctaaagc ggccgccaca aaggcggcac cgcgcggcca aacagcatcg tagctaacgt gccgccgttc atgatgccgc cccgggctgg aggaacccca ctgcggttca ctggccgtgg gtgctggacc cccaagggcg gcagcagaag aaaaagactc ctgcaaatag ttccagcccg taaaagcctg ccgggatacc ggaggcagcc gtgctgcccc tccgtggcct aaaaaaaaaa tttgtagaat tcctgggaca gctctctgtg cctggaacag agaaggtggt ccgtgcagaa cggcgctgga aagagaccac aaggtctgcc cccccgccac agccgggccc gcggcccccg tgggtctggg gttgtatgtg gcgcgcccac agtggtcgta tgcagttcgc cggtggcgcc ttcccgtgga gcgacaaccg ggggtcccac ctcccaactc aggaagaaga atgtatatgc gaacggacgc aaccccaaat ttgtggttct gaggaggaag gccgcgcgca tgttaatccc tgcaagcgtc aaccccaata ggaagacatc ctggaacgat gagcggcatt cagcacgggc ggagggcctg taaaatcaac gacggtgtcc tctggtcacg caccacgcgg gctggacttg gcccgcgacc cgggggggtc ggtgcggtcc tgtatgcgcc caccaccgcc catgcacatc ccgcgccacc cacgcacgat ccgcgaggac cgtgctggac tttcaagccc ctgcgagtgg agatgctgac tcaggctccc tacagctaca cggggagtcc tgcagatatg atcgcgccgc ccggcggcga cctgatcgcc ccagaggcat aaaagtctag aactttgcgt atcggcacca aaaagtatcg cagatgttga gcctccggca agcagactgg cccgatgggc cagaccgatg cccatcgcgc cctccgcccg gcctcccgtt gcgaggcacg gtgaagcgcc ctatgtcgcc actccgcccc tcgggccagg gagagctact gtgaccaccg accgcgtact atggcctcca tactctggca gagcaagagg ggtcaagctg ctttctggcg gaacaaaaac cagtggaatg
17880 17940 18000 18060 18120
18180 18240 18300 18360 18420 18480
18540
18600 18660 18720 18780 18840 18900 18960 19020 19080 19140 19200 19260 19320 19380 19440 19500 19560 19620 19680 19740
aggcagatgc gctatggttc atgcccaggg cccgtaacga tggagacccc tcatgctggg ttatcggcct ctcagttgaa tgcttgattc gttatgaccc attgtttccc atggcaataa aaataggggt acttcctgta atgtggacat cggggctggt acgtcaaccc gcaacgggcg acctcctcct tggtcctcca agagcatctg aggccatgct acatgctcta actgggcggc tgggctcggg ccttctacct ggccgggcaa gggaaggcta tggccaacta tgtactcctt acaaggacta acctcgcccc tacagtcgcc ctatgcaaga acagctagaa ggctaacaac ggatacgcac tcagcagtcc catgtattac tgcagtggtg catgggtgac agatgttaga tctgggtggc cgggggccag gggaaacaat ctccaacgtg ctctgacaac ggactgctac cttcaaccac ctacgtgccc cctgccgggc gagctctctg cctctacgcc caggaacgac ccccataccc cttccgcggc attcgacccc caaccacact cgaccgtctg caacgtggcc caacatcggc cttcaggaac ccaggaggtg caccatgcgc ggcggtagag cccacaaatg tctcaggttg attcagccca ctttcttaca atgcccaaca aatagcactg gacttgcaag agaaccagat attattgaaa ataggggtaa gtgacttgga ttcgctatgg gcgctgtacc cccaacacct atcaacctgg caccgcaatg ttccacatcc tcctacacct ggtaacgatc accttcttcc accaacgacc gccaacgcca tgggccttca tactacacct ttcaagaagg ctcaccccca cagtgcaaca taccagggct ttccagccca ggcatcatcc gagggacagg tgctaaagaa ctaatggagg aaatgcaatt aattggtgct agcccgcaaa gacctaatta gcaacatggg acagaaacac acttttccat atcatggaac ctgacactta caaaagatga agatcaacct taccagacaa acgattacat gcgcgcgctg cgggcctgcg aggtgcccca acgagtggaa tcagggtgga ccatggccca agtccttcaa ccaacgtccc cccgcctcaa actcgggctc tctcggtcac acgagttcga tgaccaagga tctacatccc tgagccggca accagcacaa cctaccccgc atctactccc tcagggtgta cttttcaact gtatagtgag aagcgatgac catcggcttc agtgcttgca agaactgtcc gtggaatcag tgaagacgag ccaggctgtt aacttttgca cagtgccaac gcttaagtac gaacaagcga gtcgctggac ctaccgctcc gaagttcttt cttcaggaag cggggccagc caacacggcc tgactacctt catctccatc gaccaaggag tattccctac cttcgactcc gatcaagcgc ctggttcctg agagagctac ggtggtggac caactcgggc caacttcccc atgaaaccat ctaacggcaa tctgaaaacg gatgtgcaca aattcaaaaa agagacaact ggtcaggcct taccagctct gcagtggaca ctccccaact aaaaccaaca gatcgcaatg ctgtggagaa aacccctcca gtggtggccc tacatggaca atgctcctgg gccatcaaga gatgtcaaca atcaagttcg tccacgctcg tccgccgcca ccctcgcgca accccctccc ctggacggca tcggtcagct tcggtcgacg gtccagatgc aaggacagga cagaccaagt ttcgtgggct tacccgctca
19800 19860 19920 19980 20040 20100 20160 20220 20280 20340 20400 20460 20520 20580 20640 20700 20760 20820 20880 20940 21000 21060 21120 21180 21240 21300 21360 21420 21480 21540 21600 21660
taggcaagac ggcgcatccc acttgctcta acgagcccac cgcaccgcgg ccacctaaag agagctcagg caagcgcttc cggccgcgag atgcttcctc cgagtacgag cctcgaaaag ctgcatgttt catgaacttg cctgcgccgc ccgccacagc agggtaataa aagctctctg atttagaaat cgatactggt aagttttcgc atcttgaagt cagcactgga atcagctcgg tgccgcccca agcaggtgcc tggcggaagg gagaactggt atctgcacca ttcagcgcgc accatgctgc cacagcgcgc cgcggtcgac cttctccagc cgccaactcc ccttctctat cgtcatcgag aagcaagccg gccatcgtca cctggctttg accgggggcg tttgacccct ggcttgctgc tccacccaga ctgcacgcct ctgacggggg aaccaggagc gcacagatca cgatgtacac gggtattcat cgaaagggtt agcgggtgcc tccacaggct cgcagttggg acaccaacag cgtccaggtc ggaagggcgc cgtgcccgga ccatctgggc ttgcggggca cgttgcgccc gctgcccgtt tgccgtgcag agcccgtggg agcatcaccc aacttcatgt gcccacgccc gttctgttcg accgtgtacc cagtcatcgc gagacctggg tctccccaca tgcactggct tcggcttttc gtcgcagcgc ccgtgcaggg ttgtgcactg tgcccaactc agctctacag ggagggccac acttttttct ttcccaccac ctgccgggag ccacttgaac gcgggtcagc gccgccgccc cgccgggtgc ctccgcgttg gtgccccggt ctcggcgttg cttggcgccc gctggcgtcg ccaccggttc ctcgctggtc acacttcagc ctcgaaagac agaaaaagtt ccatgggtgc tcgacatgac aagtctttga tgcgtacgcc cgcctgcatg atgcgggccc caagctggcc ggcctttgcc ggaccagcgg catcgcctcc gcccgactcg gcctcagagt catgctccaa cttcctggag ctccttctgc caataaatgg caccacccgc tcgccgtgcg tcgggcacca accagcgcgt tgcgcgcgcg ttcacgctgg ctcagcgcga ttcgagttgc gggtacagcg tccgagaaga tgcaggcagc ttcacgatct acatccatct tcgccctccg ttgtaggtca cctctgcgac gctctcggac cttcgaggtc cgtggtccgg cttctcggcc ccgtcgggtt tattttttgg tgcgccatcg tggaacccgc ctcaagcaaa tcgcccgacc gccgcctgcg cccatggacc agcccccagg cgccactcgc cacttgcaag catttttttt cgttgtcgcc ccacgggcag ccaggcgagg tcatcaggtc agttgcggta ccagcacgct acggggtcat agtcgcagcg cgcgcatgaa acatgccgca agcgcgcgtc tggccttgga cgatcacatg tctcggtgca cctccgcgaa cgcaccctct ctgggccaga gaccccatgg gtccaccagc ggcaacgcca ccaccgagca gcaccttcga tcaacacggc gctccaaaac tctacgagtt gctgcgtcac gtctcttctg gcaaccccac tcgagcccac cctacttccg agatgcaaga ttatttatac atctggctct ggacacgttg cagctcgggg gggcgccgag caccgggttg gcggtcggag cttgggcact cagcgggatc ggcctgcatc ggacttgccc ggtgttggcg cgattgctcc ttccttgttc gcggtgctgc ggactgcagg
21720 21780 21840 21900 21960 22020 22080 22140 22200 22260
22320 22380
22440 22500 22560 22620 22680 22740 22800 22860 22920 22980 23040 23100 23160 23220 23280 23340 23400 23460 23520 23580
tacccctgca tgcagcccgc tggtcgggca agcgtgcgcg ttcttcacca tcttcctctt tcttcctgca gggttgctga atgacctccg ctgggggcgt ggcgtgcgcg aggcgggccc ggggacgaga gtggtttcgc cagaaagaga ccctctgagc accgagacca ctgatcgagc aaggaggagg gataaggatg ctagacgtgg gacgcgctgc gagcggcacc cccaacccgc cacatcttct gacaaaaccc gtgcccaaga ggagacagcg cgcctggccg ctgcccccca ctggccgcgg gagcagctag aaaagcggcc ggtgctcctc gcatcttgaa ccgcctccat tcaccgtggc cctcctcttc ggcgctgcac agcccaccat
gggagggggg
tcgccagctc gcaccagcgc gcttcttcgg catcgtccag gctggtcctc tcatggagtc cctccaccac ccgccagtac aggacccggg tcgccgcctc agacagcagt gagacgacgt aggagcgctg tcttcgcgcc gtctcaactt tccaaaactg tgaccctgcg tcttcgaggg aaaacgagag tactcaagcg aggtcatgag atgcaaactt cgcgctggct catcatggtc gttcagccag gttcaccttc gcccttctcc cgccgcctcc ctcgccgccg cttgcgcttg caccagcgcg gttggtcatc cgcggctgcg gtcttgcgag gggcgcgcgg ggtgggtgga ttcccgactg tctcatgcga cgccgccacc caccctcccc ttttgtgagc agtgccaaaa
cgggcggggg
gctgcttaag cgaagtgccc gcacgtgccc ctacccggtc caagatcccc gcagggcgcc tctcggtcgc tcactcgggg cagcatagag tgtggtcatg gcaagagtcc ggagacccgc acgaaggtct gtcttgcaca agctcattct caggccgaca gccgcgcttt cccactcgca ccgttgcgcc gcctcttctt ctcagtaccg gccgctgccg ccgtcctcgt ggcggcggag cggcgggccg gccatctccc gtcgagaagg accgccaatg agcgacgcac ggagaggagg gaggataaaa aacggaagcc cacctgcacc ctggacgtgg cccaagcgcc ttcgcggtac ctctcctgcc cacatacctg gacgagaaac gtgctggtgg gtcacccact ggcgagctca tccgaggaag gaccccgcgc tgttgctgct cggccgccag ccacgtggta ccagcggcag cgctttccgc gcccccgcac cctgcttgat gctcgtcctc aggcacgctt aggtcgaagg cctcctcgga gcggcggcgg cgccgcgtcc actgctcctt aggaggacag ccgccgcgga ccccgctcga atgaggtgga agcaagacca atgatgctga gccagtgcgt cggaggtcag gggagaacgg ccgaggtgct gcgctaaccg atattgcctc gggcggcgaa agctcgaggg ttgcctaccc tcatgcgccg gcctgcccgc agctggagga gaaggtcagc cgcctccacc cttgtccatc gctcacgggg cccgctgttc cacggggtcg gcgcacgggc gctgtccaga ctttttcttc ccgagggctg ctcgagacgg cgacggagac gcgctcgggg ctcctatagg cctaaccgcc cgacgcgccc gaatgaagtg tgagaaggag ggacgacgca tgacggctac catcgtctgc ccgcgcctac cacctgcgag ggccacctac cacccgcgcc tctggaggaa cgctctgcac cgacaacgcg ggcgctcaac cgctcagccc ggtcagcgac gcggcgcaag
23640 23700 23760 23820 23880 23940 24000 24060 24120 24180 24240 24300 24360 24420 24480 24540 24600 24660 24720 24780 24840 24900 24960 25020 25080 25140 25200 25260 25320 25380 25440 25500
ctcatgatgg gaccccgaga gtgcgccagg atcctgcacg cgccgcgact atgggggtct aagcgcaccc gcggacatca accagccaga cctgccactt ccgccgctct gacctcatgg tgcacgcccc ggtaccttcg ctcactccgg gcccacgaga tgcgtcatca gagttcttgc aacccgctac aaagaagcag ctgggacagt ggaggaggac accatcaccc cagcgctata atgggacacc gcagcagcag cttgcaagac ggtcgccttt cggcgaccca ccgcgggcaa tgggcgcact tcttccccac ccgcggtgct tgcagcgcaa cctgcaagat agaaccgcct acatccgcga ggcagcagtg tcagggacct tcttccccga gcatgctgca gctgcgcgct ggggccactg aagacgtgag accgctctct agctgcaggg ggctgtggac tcaggttcta cccaggggca tgaaaaaggg ccccgccgcc cagccgccgc caggcagagg agcagcctag tcggtcgcag acctccgctc acaggaaccg cgccagggct tgcgggggca ccccgcaatg gaggcggcag gacagcggca gcgcctctcg tttgtatgcc ggtcaccgtg gctcgaggag ctccaacgtg cgggcagaac ctgcgcctac cctggaggag ctggacgggc gcgcctgctc gaactttagg gcccagcgac ctacctcttc cggcgagggc agtctgcaac tccctcgcct ttccgcctac cgaagaccaa catcctgggc tcggggggtg gccccagcag cgccgcagcc aggtttcgga acgaggaagc ccccctcgcc ctccggcgcc gggtcggtaa accgctcgtg acatctcttt tcctgcatta cggcagccac gcagcggcca cccaacgaac atcttccaac gagctcgagt accctgcact gagctctgca gtcctgcact ctcttcctct cgcaacctca ttcaacgagc aagaccctgc actttcatcc ttcgtgccca cagctggcca ctgctcgagt ccgcagctgc gacgagaagt ctacgcaaat tcccgcccgc caattgcaag tacctggacc cgggaccttg atacatgctt cgaggagcag ttcagaggcc ggggcccctg ggcgccaccc gtccaagtgc gcgcgggcac cgcccggcgc ctaccgtcat agcggcgacc ggagacccgc ccctctcgac agagcagagg gtctgcagcg acaccttccg acctggtctc ccaccctcaa gctacacctg aggagctgga gctcggtggc agcagggcct tggagcgctc tcaagtacag actacctcgc gccactgccg tcagcgagag ccgcggctcc ttgtacctga ccaaggcgga ccatcaacaa cccagtccgg cttcccagga ctggaggaag gaggagatga gaagaggtgg aaatcctccg gcccgcagac ccgccgccgc aagaacgcca ttcctgctat ctctacagcc accacctagg ggcagcagcg ccgggagctc ccaggagcag cttcttcgcg ccagggctac ctacctgggc aggggaggcg gcagacggcc aaagctactc cgccgcgctg gcccgacttc gggcatcctg ggagtgcccg ctaccactcg ctgcaacctc tcagattatc ggggctgaaa ggactaccac gctcaccgcc agcccgccga cgaggagcta tggcacccag aggaggagga tggaagactg cagacgcaac aacccagcac ccaaccgtag caccgcagca tagtcgcctg tccaccacgg cctactgcag aagatatcct gcgggagcgg agacacagga gagctgaaaa
25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 26220 26280 26340 26400 26460 26520 26580 26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360 27420
taaaaaacag agcttcggcg ttaaagacta ccgccgccca ctaccagccg ctacatgagc ccaaatactg aaattggccc gcgtgacgcc tcgtcacggg tatccagctc ccagctcgcc gacctcgtcc cgtgccctcg cattccgaac cgaggcagag ccgcggttcc gcacggcgtc cctccgtccc ctgccctaac acgctgagat cccaccccga acctcacctg gagtctccct tccaactctt acctcacccg gaacaggagg ttgtggggtt gatttgttct tcggaatcag ttccttatca atctactgct atctctgcgc cacgctggag gctccgcgcc gcccgcccag cagatgggac gcgggacccc ctggaacagg gccgccctcg caggccgaag gcgcggccgc aacgacgagt ggatccggcc tcggagcccc gtctacttca tttgacgcgg cagcttcgcc ggtgagttct cgcctgacca ctgctagtgg cctggattac cagaatctac ccaggcccag gtacttcaac gaaagaccag ccctccctac cctgatcgta tgagctcagg aggatttttt ttccttctac gtgacttctc tactcagcct ggttgctcaa tccctcaccc gacgcggagg cttctcgaat ccgagatgag tcgcggcggg acatgatctc cggccatcac tgtaccagga tccagatgac tccgaccagg cggtgagctc gctcttcgtt gctccggagg accccttctc tgaaggactc tgagacacct gctactttca cccagggcga agcgggagcg atcaagatct tggggctcct gcgaacctca ggcaccccct ctctccggtc ctgccgggaa aaccagagct aaactccccg attaccgggt gtgtatgaac tgaaatcggg tctgtgcctc gtgcaggggt gcagctgtct cactcttcag ttaggcggga caaagagatt agcggcccag acaggtcaac cgccacgccc aaccccctcc taactcaggg tataagacac ttcgctcggt cacgccccgc catcggaacc gggacctccc ggcggacggc cgagcactgc gctacccgag ggttacctgt gggtccctgt ttgctgtcat gtcgccatcc cctgcggtct ttgtggttta tcagctactc cctacgagtg ttccgggaac gggaccaggg tgctggctct acctcagcct cttggtgtgc aggctcgccg cgccacccaa gtatcacaaa caaatactgc gaaaactacg cccacgccat gactactcca gggatccgcg cgccataatc gccaccaccg gcgcagctcg ctgatgatca ctccgtccgg caggcgtacc ctccagttcg ggacgctacc tacgactgaa cgccgccaca gagcataccg tccctcatcc gtcctaacta ctctgtgctg tgtgaacgcc gcatcggagg caacagcttc catccacaag cgtcaccggc agataactcc cggagacgta tttaatcaaa ccaataactc tgcttactct cctgctgcgc gatgaacagg agcgaagatc gcgctcactc tcatcgccgg acatgtggag cccgcatgaa cccagcgaaa tcaacccccg tactacttcc cgggcggctt gaggccgagg acggaacttt tgactctgca tggaggagtt ccgaccagtt tgtcaggtgc agtgcttcgc aggggccggc gggagttcac tcgcctgcaa agtttaataa accgtcttca gccaagaagt gacggggacg aacaccaccc cgctgcaccc ctcttcccca ccttcgaccc gcttccttga taccctttct gttgattttt acacatctat tacatggtcc
27480 27540 27600 27660 27720 27780 27840 27900 27960 28020 28080 28140 28200 28260 28320 28380 28440 28500 28560 28620 28680 28740 28800 28860 28920 28980 29040 29100 29160 29220 29280 29340
tatcgatcct ttgaggagcc tcaaatgcgt ttgcggtcta agggcggaca tcatgtacat atactgggtc tgctatacat cgctaacacc accctccttg accatggtgg tgggttcatt aatctaactc gaaatcatta cccactacca actaccacta cgtgctcact ttctgccaat cagcagagct ggtgattcaa ttccacatca atctctgtgg agaaagagaa tttgcagata taacccttgt ttactttcaa ctatctgcaa gcctgttcac cctttggtgg ctacccaagc gcagccacag cccaggccat aggcctgctg cgcttgcaat taccaatcat tagtgtgttt gtctaagata gtcaaaacag ttactgctgt aaaattcagg ggctttctat cgattgccca gccccgccgg tctgctctaa tgatcaatgt attactggcg cccccactac ccgctgcccg cccacgccgg gcactaacgc ccgcttgcct taattgactc cgggtaccaa tctcttccgc aagctcgctc acaagatatg cgcttgcgac ctccacggcc tagctccact cctcatcaac gcaaggaaag ttctcccacc cagcagcagc ctacagctct gccctggcgg gtaactttca gagaggctgc acgcccggag ttcaattaca tacaacctgt atggctttgg cagaggcgaa ctgcagaatg tgggttgaca caattccacc ccgaatcagt gcaaatgatg accccacaag cacctctccc ccatacccgc cgggcccatc cagcgctcat gacccaggag ttcttctttt agaccctaac gctgatgtta tcagggccaa agctcgctgc tcgagattcc gatacccagt tcccccagca gcttccaccc acccacgctt accaccacca agattattga gtgcccgaaa cctgcagcgc agcccgaggg gcatcgacta acccctctaa ctttcccttt ggcctccctc caatcactac tctttatcga aatgcaatca cgaatcgaag ctcatgtggg atcaagccca gatgctgggt gactacatgc accaccacta aaaagcacca ggtgcgacct gaactgttcg gctgtggagc gccactcccg ctctctttct ctggggatgt ccactgatgc tgacactaac acaatgtcac ggtcgtggag tatccccaac tggacaatgg acaacctgga ccaccaccac ctttggtttt ccactcagat cgccaaaaaa tgaccaatgc caaaaacaaa ctactctgtc ttatgagtta tccccaggcg gctcgctcta tgaaaagaaa cctccctact tgccagtggg aaaaatttgt gagccatctg actattacgg tgcatgtagt ccaccactac tgattagcac cagaaaccac acctggagaa ccgttgccct aataccctcc acctgatgct tctgctgcct ccttccccta cgctttacta agctgtggca tggctcaggt caagtaccaa actctatgta agttcgccag caccatcacc ggccagctca ccaccgccca gagattacct accaccctcg actggccagt accgtcttcc tgcgatgcgg tgtgtggaaa atctgcacgg atgccttgat aatcaccacc gtccaatgtc ccgcaatcaa cgatgggcaa gcagcgggga cgaggcactt tactactact aaagccccct cgagctttgc tgaggatgcc gaagcagatc cgattctact gctgctctgt gatctgccgc ccccccggat gcctgcgctc ggagaaaatg agctacttaa tgcaatgcca ggctatgtac cccagaacca agcagcagca tctgccgcta gaaacgacca
29400 29460 29520 29580 29640 29700 29760 29820 29880 29940 30000 30060 30120 30180 30240 30300 30360 30420 30480 30540 30600 30660 30720 30780 30840 30900 30960 31020 31080 31140 31200 31260
ccgccaccac ttcaaatggg tcgtcaatga gcctgcttct atagacccat aaaacctact catgttcctt ggtagactgc catctgcagc gcgcctcgca aagactgctc accctcacct ttcacccaac tggctgtatg tacccctact gcacccgaga tcccctacgc agatctagaa ggctgagcaa aagaggcatc ccaccgcctc gaatcccatc tcggggtcca cccctttaac gcaggtctct ccaaacgcct cctgtccctc acgagagctt tcctcacccc ctctgaacct gtggcctctc ctcccctcaa cctacacacc acttacaagc ctgggcgggg gctctggctc cattgtcctg
tttttctttt
ctcccacctt ctctcaccct ctaatcacag tacttcagac taatcatgca cctgccagta tgtggaatat gggtcatctg ttgatttggg taattccact ccactgaaat atggacggca gagcgcctca ttttgtctgg agttacaaat accgtcaccc gaagacctct taatcaaaca gtccagttta tctggcggca cgcacccact caaccccgtg tcccttcgtg ggccgagccc cctggacgac aaaaaccaag tccagcgatc cccactccaa ctgggaatgt atctgctgcc aaccccgata acagtatgat ttctggggtg tcactgtcta taatcatcgc accacccgca taagactgtg caccacaaaa acccaaatgc tgtcttagtt atggaacgcg gcgacaagtt cagctacttt tcagtaccga atcaggagct taaagcaggc tgcccaccca agcactcggt gcaccctggt ctggaatcaa ttcagcagca aacttcctcc atcttcatgt tacccctatg tctcccgatg ctggtcactt gctggcaacc accaacctca agatgccgac aaccagtgga ggtggttcgc tccaccgcag atgatgggat aaattgagac ttctacgctg cctgctttac cttcatccag gtaccgagac atctgccttc tctccgcgca tacaacgaaa ttctgcagca atcgatgcca gtacccgttg aacctaacag gcagcgtctc ccgagatctc caaagtcacc gcgccagaag agagaccgag aaagaccctg taaaaagaat cctccttccc acaccctgaa tgttgcagat acacggaaag gattccaaga cccacggcat tcacctctca gcctagaaac caacatcacc tgcggccgag cataggcatg gcgagccaga ccatagattg atgcctcgca gccgctgtgt ggattggtca tgcattgatt aggaacattg tgatcctctg aaagacatgc agagcgagct ctgtctttgc tgaattaccc tcgttaatca gcggagatga ctagagaggc gttaacctgc tacgagaaga ctggtgctca gggtgtctgc tgcggtctca cacttactta ctcctcccaa gggaatgtca gaagcgcacc cggccctccc aagccccccc gctcgccctg agatatcacc ctcatccccc cccttggctc gtctccgccc atggcgctct ccccccatct gatggcctga ttttcttgta ctcacctgga ccctcactct acatctgtgt cccaacttct catcctgccc ctcctgccgc ctccgaagct cctcatgatc cacctttccc acgcccccca ctgacgccct gcaggcaggc accagtgcaa ccggcaacag tggtgggtga actctccctg gagatttagt aaatcagaca ctctggtact gattcttgct aaaacgtctg tccgtccctt ggggtcctgt aaaatgggaa accgctagcc ctaactgtaa
31320 31380 31440 31500 31560 31620 31680 31740
31800 31860
31920 31980
32040 32100 32160 32220 32280 32340 32400 32460 32520 32580 32640 32700 32760 32820 32880 32940 33000 33060 33120 33180
gcacctcagg tcaccatgca aaggccccct ccgctgacag gtttaggctt ttgggggtcc gactaactgt catcaggaaa ttatccttaa agggacccct ccacaactac atgacaccaa gcgccctaac catctccaaa agtgtggaag cgataacagg ttatggaaaa acgctgcccc cgcaaagcca ccaaacccat aggtgagtca aaacctttgc actgatgttc cattcttcca cattctagct tcaggaaatc acagaataca gacatgttct atgttgataa tccggctgac ggggtagagt atctgctgcc cgccctcacc atcagaggcc gaccgtgtct cagcaccctc agacatggaa actaagagta agataacaat tctacaattg tgtggcatac gtatataaac caccaacaac tggtgctgtc tgtgggaaac ttgcagaatt ccaaatcctg caccgttgcc ctcctcgcta ctacaccaat gactgctaaa gacccttacc ctactccatg caccaactcc atttctgatt tcttagctta tatagatcag atgatcatca cagtcctctc taggggttat actctcccgg gcgataactg cataatcctc gccgccgctc gtagcagccg cccctgacag gaaggcaaac accgttagcg gaccctatgt gtagacagct gccctccaaa agagctgcag ccatttgatg acagaccaca acaaaaaaac attattaaac actggtgatg cactcagaca gcctctgtcg agcgttacca gacaggcagt gcagttgggt aacaacattg atcaccctca tcatttacat ttcacctttt cttattttat atagacacag acagtgataa caggatccta cccccgactg attccacacg cagctcgctc tgcgaccggc ggtcaggata cgtccggcag ccgctcccct tacaggatgc tggccttgca ccacaccacc atactcacga tgcacacact ctagagttac gaggtatgcg ctcagaacaa acctggattt ttgagactaa ttggcactgg ataaactgac aagactgcaa ccgccctagc tctttctcag actggaactt tcatgccaaa taagtcaggt atggaactaa gggcttggga cttacattgc tattttcaaa tagcttaata ttaaccacca gtcttcaggc gctttaaata gtctcctgcc aagttcacgt tgctggacaa gggcggtgat gaaaacaaca ggcagtggcc aaaactcacc aacatcggcc aattaatgta tggaaaactg cactgtagtt gggcgcccta aattgatgca tctcagcctt gaattgcaac aattagctca tctaagcttc tctgtggacg gtttactcta ggtatcagga atttgatcag cagaaatggc cctcgcagca ttacttgaat tgaatccagt aagtgggcaa tgaacaataa cacaacaaaa gacccagtag ccaccaccat cgccccctcc acaccatctg gcgccaggcg cgctgtccag acggaggccg gcagcagcag agccggtggt ggcacctccc ctggccacca ccgctgacgg agcagtggaa ggaataagaa accggaaatg ggttatgaca aatggccaac agacttggtc agaggtctaa ggcttagact gacaacacag accccagacc gtcctaacta aatctggctt aatggagtgc aactcaacta taccccaaaa ggagacaaat gaaactagcc tatgccactg aaagcatgac tcattcaagt tgcaaagccc accttttgat ctcccaagac gttggtcaca ctcgtcggtg cggctgaacc cgcctacaag cgagcgaaac ctcctccgcg
33240 33300 33360 33420 33480 33540 33600 33660 33720 33780 33840 33900 33960 34020 34080 34140 34200 34260 34320 34380 34440 34500 34560 34620 34680 34740 34800 34860 34920 34980 35040 35100
ataatccgca atctcgctca cagtgcaggg taccacaagc acttccttgg agggcacctt tgcagggaac atccggctgc atgattagca aacgtaaaac gtgttgcatt cagggaggta cgtagtgtca tcgcgcgtgg gttgtagtac gactccgtct ccaagcaata catgataaaa gtggcagcgc atttctaaga tatgaatgaa acccagataa aagtccggcc catcatgatt ttaacaaaaa aggtctgaac ctgattatga tgcatgggcg aaaaaagcta aaaacggaat aaaattataa aaccacttta ccgcccgcag agtcggcgca cgctgtatcc gcacgtaaat gcatgttgta ccaccaccat ccgggttgga tgaaggcatc gctcttccct ccacacagca ctggaaacag aagggtccct tggaaaaggg caggcctcct agccactccc tgcaccgcgg cactcgctct aacttttttt tcccctccac tgttccttaa aacccatccg ttttcttctc atgccaaaaa gcaaaaattc ttcctctgtc ggaccagtga cgcgcatact gcgagataaa acacatcata aacacacgat ataaaaaatt atcaacataa catcagcttc gtaggtacag aaagctcatg taagtgtcga attcaccacc cctgaaccaa acaatgacaa gatgttggca cgtcaggatc gggaaggcct cggatgatcc gctgtacgga aacgccggac tgcgtctgcg gcagagcgtc ccctgataat gcgagcggca aaagaatatt tggcgcggtc tggcgtccaa gctgattttc tccagcggtt tctgctcaag aggttcttca gcgcagatcc ggccaaatcc cggggctatg atgcaaagtg atcatgctca tttcctctca aattaactta gacgggccac ctcgttctcc cacagcacca ccgggaacca cccctcatga tcccggtacc gaggccagaa tgcagactcc caacacagac atatcccaag cgcacataac tccagtatcg ctgcgccggg gtggtcatac gtctcgccgt gaggcgcacc atccaccacc gacaggagga ttccaattct aaactctacg aagacacacc caatatagac tagaatctgt agcgccctcc gagacctgta cttcgcaggg ccaccaggaa ctgaccagcg ctggttaaaa tgcaggtagt aacatgactt aacattggaa gggcatgccg gcgcgcagca cgatgttatt ccgcccccac acgtgctgga agataaacct cctgcccacc aaggctcgta acacgtgcat gaataaccca tcacgttgtg aggcgcgggt acgaccgaga ttcttgaagc ctagctcgct ctggcttccg gtagaataag gcgggcagag tcgaaagtaa gccaaagcac gctctcaagt gcgccggcgg ctaagcaaat accttcatga taagattcaa caagctgaac ccagatccag tagcgccgat aatcaggcaa tgcaggtaag cgcggatact gcctgtctca gcatagccgt cctcaccctg catgatccca gtggccatcg cacaaacatt ctggttaaac ggctatgcac accgtggatc gcactttctc ttcttgaatc catggtcagc ctccttctca tcgtgttgag agaaccaggt ccgtgtgata gatctatgta caacacccag atgggagaac gatctatcaa agacaacggc tgcagtaaac cgtccaccaa cccttatatc ccaagcagcg aatgggaaca ataatcagac agaccctata gtaggcgtgc agcctcgcgc ctcaggaacc gcgtaaaaca caacaggaaa aaaaaaattg
35160 35220 35280 35340 35400 35460 35520 35580 35640 35700 35760 35820 35880 35940 36000 36060 36120 36180 36240 36300 36360 36420 36480 36540 36600 36660 36720 36780 36840 36900 36960 37020
gtccccgtga agactctgta gcccggaggt cacaaaatta aatagcgccc gacccgagtc tcgcagtgta gggcaaagtc ccaaaaaaca tgccccagtc ctacacctcc gcgccgccca
<210> <211> <212> <213>
<400> 10
Met Arg Arg
Ser Val Val Gln Leu Leu
Gly Gly Arg 50
Thr Thr Arg
65 ttaacaagta tacacgtctg ataatcaccc gtaggagaaa tcccgatcca ttaccagtaa aaaggccaag caaaaaacgc ctagacactc aaacaaacta ccgcccgccg tctcattatc ccacagacag gattgtgaac gcaggcggag aaaatacata aaacaacata aagaaaaaag tgccgagaga ccagaaaaac ccttccggcg catatcccga gcccgccccc atattggctt ctccccggtc atcagacaaa gtacagcaaa aacaccagaa aagcgcttcc atctctcaac gtatatatag cgcacgcgaa tcaacttccg acttccaagt aaacccgcct caatccaaaa atgtcggggg caaagaaatc acgaccccca aaaccctgtt acaggagcag gcagcaccag gaataaaaag cctacgcccc ctttcccacg cgccacgccc cccgccccgc taaggtatat tcatcatgtg gagccacgta taggaggaat gctgaggcaa ccataacaaa caccaacact tgacgtaaac gaaacgaaag ctacgtcact aaaacaccgc gccccgcctc tattgatgat
37080 37140 37200 37260 37320 37380 37440 37500 37560 37620 37680 37740 37741
Leu Asn Tyr
Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Gln
85 90 95
Asn Asn Asp
Tyr Ser Pro Ser Glu Ala Ser Thr Gln Thr Ile Asn Leu
100 105 110
Asp Asp Arg Ser His Trp Gly Gly Asp Leu Lys
Thr Ile Leu His Thr
115
120
125
Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Ala
130 135 140
Arg Val Met Val Ser Arg Ser His Thr Lys Glu Asp Arg Val Glu Leu
145 150 155 160
Lys Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Tyr Ser Glu
165 170 175
Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Leu
180 185 190
Lys Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys
195 200 205
Phe Asp Thr Arg Asn Phe Arg Leu Gly Leu Asp Pro Val Thr Gly Leu
210 215 220
Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Ile
225 230 235 240
Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn
245 250 255
Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile
260 265 270
Thr Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val
275 280 285
Glu Ala Tyr Gln Asp Ser Leu Lys Glu Asn Glu Ala Gly Gln Glu Asp
290 295 300
Thr Thr Pro Ala Ala Ser Ala Ala Ala Glu Gln Gly Glu Asp Ala Ala
305 310 315 320
Asp Thr Ala Ala Ala Asp Gly Ala Glu Ala Asp Pro Ala Met Val Val
325 330 335
Glu Ala Pro Glu Gln Glu Glu Asp Met Asn Asp Ser Ala Val Arg Gly
340 345 350
Asp Thr Phe Val Thr Arg Gly Glu Glu Lys Gln Ala Glu Ala Glu Ala
355 360 365
Ala Ala Glu Glu Lys Gln Leu Ala Ala Ala Ala Ala Ala Ala Ala Leu
370
375
380
Ala Ala Ala Glu Ala Glu Ser Glu Gly Thr Lys Pro Ala Lys Glu Pro
385 390 395 400
Val Ile Lys Pro Leu Thr Glu Asp Ser Lys Lys Arg Ser Tyr Asn Leu
405 410 415
Leu Lys Asp Ser Thr Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr
420 425 430
Asn Tyr Gly Asp Pro Ser Thr Gly Val Arg Ser Trp Thr Leu Leu Cys
435 440 445
Thr Pro Asp Val Thr Cys Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro
450 455 460
Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser
465 470 475 480
Asn Phe Pro Val Val Gly Ala Glu Leu Leu Pro Val His Ser Lys Ser
485 490 495
Phe Tyr Asn Asp Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Phe Thr
500 505 510
Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ala
515 520 525
Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
530 535 540
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Asn Ser Ile Gly Gly Val
545 550 555 560
Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
565 570 575
Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu Ser Ser Arg Thr
580 585 590
Phe
<210> 11
<211> 960
<212> PRT
<213> Pan troglodytes
<400> 11
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Glu Ser Tyr Phe Ser Leu Ser Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr
65 70 75 80
Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Ser Cys Glu Trp Glu Gln Glu Glu Thr Gln Ala Val Glu
130 135 140
Glu Ala Ala Glu Glu Glu Glu Glu Asp Ala Asp Gly Gln Ala Glu Glu
145 150 155 160
Glu Gln Ala Ala Thr Lys Lys Thr His Val Tyr Ala Gln Ala Pro Leu
165 170 175
Ser Gly Glu Lys Ile Ser Lys Asp Gly Leu Gln Ile Gly Thr Asp Ala
180 185 190
Thr Ala Thr Glu Gln Lys Pro Ile Tyr Ala Asp Pro Thr Phe Gln Pro
195 200 205
Glu Pro Gln Ile Gly Glu Ser Gln Trp Asn Glu Ala Asp Ala Thr Val
210 215 220
Ala Gly Gly Arg Val Leu Lys Lys Ser Thr Pro Met Lys Pro Cys Tyr
225 230 235 240
Gly Ser Tyr Ala Arg Pro Thr Asn Ala Asn Gly Gly Gln Gly Val Leu
245 250 255
Thr Ala Asn Ala Gln Gly Gln Leu Glu Ser Gln Val Glu Met Gln Phe
260 265 270
Phe Ser Thr Ser Glu Asn Ala Arg Asn Glu Ala Asn Asn Ile Gln Pro
275 280 285
Lys Leu Val Leu Tyr Ser Glu Asp Val His Met Glu Thr Pro Asp Thr
290 295 300
His Leu Ser Tyr Lys Pro Ala Lys Ser Asp Asp Asn Ser Lys Ile Met
305 310 315 320
Leu Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg
325 330 335
Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly
340 345 350
Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val Asp Leu Gln
355 360 365
Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp Ser Met Gly
370 375 380
Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val Asp Ser Tyr
385 390 395 400
Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Thr Glu Asp Glu Leu
405 410 415
Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ile Gly Val Thr Asp Thr Tyr
420 425 430
Gln Ala Val Lys Thr Asn Asn Gly Asn Asn Gly Gly Gln Val Thr Trp
435 440 445
Thr Lys Asp Glu Thr Phe Ala Asp Arg Asn Glu Ile Gly Val Gly Asn
450 455 460
Asn Phe Ala Met Glu Ile Asn Leu Ser Ala Asn Leu Trp Arg Asn Phe
465 470 475 480
Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Lys Leu Lys Tyr Asn
485 490 495
Pro Ser Asn Val Asp Ile Ser Asp Asn Pro Asn Thr Tyr Asp Tyr Met
500 505 510
Asn Lys Arg Val Val Ala Pro Gly Leu Val Asp Cys Tyr Ile Asn Leu
515 520 525
Gly Ala Arg Trp Ser Leu Asp Tyr Met Asp Asn Val Asn Pro Phe Asn
530 535 540
His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn
545 550 555 560
Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala
565 570 575
Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn
580 585 590
Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser Leu Gly Asn Asp
595 600 605
Leu Arg Val Asp Gly Ala Ser Ile Lys Phe Glu Ser Ile Cys Leu Tyr
610 615 620
Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala
625 630 635 640
Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser
645 650 655
Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Val Pro
660 665 670
Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ala Phe
675 680 685
Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp
690 695 700
Pro Tyr Tyr Thr Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe
705 710 715 720
Tyr Leu Asn His Thr Phe Lys Lys Val Ser Val Thr Phe Asp Ser Ser
725 730 735
Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu
740 745 750
Ile Lys Arg Ser Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn
755 760 765
Met Thr Lys Asp Trp Phe Leu Val Gln Met Leu Ala Asn Tyr Asn Ile
770 775 780
Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Ser Tyr Lys Asp Arg Met Tyr
785 790 795 800
Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Gln
805 810 815
Thr Lys Tyr Lys Asp Tyr Gln Glu Val Gly Ile Ile His Gln His Asn
820 825 830
Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Glu Gly Gln
835 840 845
Ala Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile Gly Lys Thr Ala Val
850 855 860
Asp Ser Ile Thr Gln Lys Lys Phe Leu Cys Asp Arg Thr Leu Trp Arg
865 870 875 880
Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Ser Asp Leu
885 890 895
Gly Gln Asn Leu Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Thr
900 905 910
Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu Tyr Val Leu Phe
915 920 925
Glu Val Phe Asp Val Val Arg Val His Gln Pro His Arg Gly Val Ile
930 935 940
Glu Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
945 950 955 960
<210> 12
<211> 543
<212> PRT
<213> Pan troglodytes
<400> 12
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ser Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Ile Thr Thr Ala Ser Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ser Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ala Thr Pro Pro Ile Asn Val Ser Ser Gly Ser Leu Gly Leu Asp
180 185 190
Met Glu Asp Pro Met Tyr Thr His Asp Gly Lys Leu Gly Ile Arg Ile
195 200 205
Gly Gly Pro Leu Arg Val Val Asp Ser Leu His Thr Leu Thr Val Val
210 215 220
Thr Gly Asn Gly Leu Thr Val Asp Asn Asn Ala Leu Gln Thr Arg Val
225 230 235 240
Thr Gly Ala Leu Gly Tyr Asp Thr Ser Gly Asn Leu Gln Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Ile Asp Ala Asn Gly Gln Leu Ile Leu Asn Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Tyr Ile Asn Thr Asp His Asn Leu Asp Leu Asn Cys Asn
290 295 300
Arg Gly Leu Thr Thr Thr Thr Thr Asn Asn Thr Lys Lys Leu Glu Thr
305 310 315 320
Lys Ile Ser Ser Gly Leu Asp Tyr Asp Thr Asn Gly Ala Val Ile Ile
325 330 335
Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly Ala Leu Thr Val
340 345 350
Gly Asn Thr Gly Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro
355 360 365
Ser Pro Asn Cys Arg Ile His Ser Asp Lys Asp Cys Lys Phe Thr Leu
370 375 380
Val Leu Thr Lys Cys Gly Ser Gln Ile Leu Ala Ser Val Ala Ala Leu
385 390 395 400
Ala Val Ser Gly Asn Leu Ala Ser Ile Thr Gly Thr Val Ala Ser Val
405 410 415
Thr Ile Phe Leu Arg Phe Asp Gln Asn Gly Val Leu Met Glu Asn Ser
420 425 430
Ser Leu Asp Arg Gln Tyr Trp Asn Phe Arg Asn Gly Asn Ser Thr Asn
435 440 445
Ala Ala Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Ala Ala
450 455 460
Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Asn Asn Ile Val Ser Gln
465 470 475 480
Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr Leu Thr Ile Thr
485 490 495
Leu Asn Gly Thr Asn Glu Ser Ser Glu Thr Ser Gln Val Ser His Tyr
500 505 510
Ser Met Ser Phe Thr Trp Ala Trp Glu Ser Gly Gln Tyr Ala Thr Glu
515 520 525
Thr Phe Ala Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala Glu Gln
530 535 540
<210> 13 <211> 36182
<212> DNA
<213> Artificial Sequence
<220>
<223> M72-ChAd3 construct <400> 13
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cgaggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 12 0
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctccgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg accgccgcca gcgacaactt ccagctgtct 1380
cagggcggcc agggcttcgc catccctatc ggccaagcta tggccattgc tggacagatc 1440
agaagcggcg gaggcagccc taccgtgcat atcggcccta ccgccttcct gggcctgggc 1500
gtggtggaca acaacggcaa cggcgccaga gtgcagcggg tggtcggatc tgcccctgcc 1560
gcaagcctgg gcatcagcac cggggatgtg atcaccgccg tggatggcgc ccctatcaac 1620
agcgccacag ccatggccga cgccctgaat ggacaccacc ccggcgacgt gatcagcgtg 1680
acctggcaga ccaagagcgg aggcaccaga accggcaacg tgacactggc cgagggacct 1740
cccgccgagt tcatggtgga tttcggcgcc ctgccccccg agatcaactc cgccaggatg 1800
tatgccggcc ctggcagcgc ctctctggtg gccgctgctc agatgtggga cagcgtggcc 1860
agcgatctgt tcagcgccgc ctccgccttc cagtccgtgg tctggggcct gaccgtgggc 1920
agctggatcg gaagcagtgc cggcctgatg gtggctgccg cctctcccta cgtggcctgg 1980
atgtcagtca cagccggcca ggccgaactg actgccgctc aagtgcgagt ggctgctgct 2040
gcctatgaga cagcctacgg cctgacagtg cccccacccg tgatcgccga gaaccgggcc 2100
gagctgatga tcctgatcgc caccaacctg ctgggccaga acacccccgc cattgccgtg 2160
aacgaggccg agtacggcga gatgtgggcc caggacgccg ctgccatgtt tggctatgcc 2220
gctgctacag ccaccgccac tgccaccctg ctgcccttcg aagaggcccc cgagatgacc 2280
tctgccggcg gactgctgga acaggccgct gccgtggaag aggccagcga cacagccgcc 2340
gctaaccagc tgatgaacaa cgtgccccag gccctgcagc agctggcaca gcctacacag 2400
ggcaccaccc cttctagcaa gctcggcggc ctgtggaaaa ccgtgtcccc ccaccggtcc 2460
cccatcagca acatggtgtc catggccaac aaccacatga gcatgaccaa cagcggcgtg 2520
tccatgacca ataccctgag cagcatgctg aagggctttg ccccagccgc tgccgctcag 2580
gctgtgcaga cagctgctca gaatggcgtg cgggccatga gcagcctggg cagttccctg 2640
ggcagctctg gactgggagg gggcgtggcc gccaatctgg gcagagccgc tagcgtgggc 2700
agcctgtctg tgcctcaagc ctgggctgct gccaatcagg ccgtgacacc agccgctaga 2760
gccctgcctc tgaccagcct gacctctgct gccgagaggg gccctggcca gatgctggga 2820
ggactgcctg tgggccagat gggagccaga gccggcggag gactgagcgg cgtgctgaga 2880
gtgcccccca gaccctacgt gatgccccac tctcccgccg ctggcgatat tgcccctccc 2940
gccctgagcc aggacagatt cgccgacttc cctgccctgc ccctggatcc ttctgccatg 3000
gtggctcaag tgggacccca ggtggtgaac atcaacacca agctgggcta caacaacgcc 3060
gtgggagccg gcaccggcat cgtgatcgac cccaatggcg tggtgctgac caacaatcac 3120
gtgatcgctg gcgccaccga catcaacgcc ttcagcgtgg gctccggcca gacctacggc 3180
gtggacgtgg tcggatacga ccggacccag gatgtggccg tgctgcagct gagaggcgct 3240
ggcggactgc cttctgccgc cattggaggc ggagtggccg tgggagaacc tgtggtggcc 3300
atgggcaata gcggcggaca gggcggcaca cctagagctg tgcctggaag agtggtggcc 3360
ctgggacaga ccgtgcaggc cagcgatagc ctgacaggcg ccgaggaaac cctgaacggc 3420
ctgatccagt tcgacgccgc catccagcct ggggatgctg gcggacctgt ggtgaacgga 3480
ctgggccagg tggtcggaat gaataccgcc gcctcctaat agtgagcggc cgcgatctgc 3540
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 3600
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 3660
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 3720
ggaagacaat agcaggcatg ctggggatgc ggtgggctct agatatcagc gatcgctgag 3780
gtgggtgagt gggcgtggcc tggggtggtc atgaaaatat ataagttggg ggtcttaggg 3840
tctctttatt tgtgttgcag agaccgccgg agccatgagc gggagcagca gcagcagcag 3900
tagcagcagc gccttggatg gcagcatcgt gagcccttat ttgacgacgc ggatgcccca 3960
ctgggccggg gtgcgtcaga atgtgatggg ctccagcatc gacggccgac ccgtcctgcc 4020
cgcaaattcc gccacgctga cctatgcgac cgtcgcgggg acgccgttgg acgccaccgc 4080
cgccgccgcc gccaccgcag ccgcctcggc cgtgcgcagc ctggccacgg actttgcatt 4140
cctgggacca ctggcgacag gggctacttc tcgggccgct gctgccgccg ttcgcgatga 4200
caagctgacc gccctgctgg cgcagttgga tgcgcttact cgggaactgg gtgacctttc 4260
tcagcaggtc atggccctgc gccagcaggt ctcctccctg caagctggcg ggaatgcttc 4320
tcccacaaat gccgtttaag ataaataaaa ccagactctg tttggattaa agaaaagtag 4380
caagtgcatt gctctcttta tttcataatt ttccgcgcgc gataggccct agaccagcgt 4440
tctcggtcgt tgagggtgcg gtgtatcttc tccaggacgt ggtagaggtg gctctggacg 4500
ttgagataca tgggcatgag cccgtcccgg gggtggaggt agcaccactg cagagcttca 4560
tgctccgggg tggtgttgta gatgatccag tcgtagcagg agcgctgggc atggtgccta 4620
aaaatgtcct tcagcagcag gccgatggcc agggggaggc ccttggtgta agtgtttaca 4680
aaacggttaa gttgggaagg gtgcattcgg ggagagatga tgtgcatctt ggactgtatt 4740
tttagattgg cgatgtttcc gcccagatcc cttctgggat tcatgttgtg caggaccacc 4800
agtacagtgt atccggtgca cttggggaat ttgtcatgca gcttagaggg aaaagcgtgg 4860
aagaacttgg agacgccctt gtggcctccc agattttcca tgcattcgtc catgatgatg 4920
gcaatgggcc cgcgggaggc agcttgggca aagatatttc tggggtcgct gacgtcgtag 4980
ttgtgttcca gggtgaggtc gtcataggcc atttttacaa agcgcgggcg gagggtgccc 5040
gactggggga tgatggtccc ctctggccct ggggcgtagt tgccctcgca gatctgcatt 5100
tcccaggcct taatctcgga ggggggaatc atatccacct gcggggcgat gaagaaaacg 5160
gtttccggag ccggggagat taactgggat gagagcaggt ttctaagcag ctgtgatttt 5220
ccacaaccgg tgggcccata aataacacct ataaccggtt gcagctggta gtttagagag 5280
ctgcagctgc cgtcgtcccg gaggaggggg gccacctcgt tgagcatgtc cctgacgcgc 5340
atgttctccc cgaccagatc cgccagaagg cgctcgccgc ccagggacag cagctcttgc 5400
aaggaagcaa agtttttcag cggcttgagg ccgtccgccg tgggcatgtt tttcagggtc 5460
tggctcagca gctccaggcg gtcccagagc tcggtgacgt gctctacggc atctctatcc 5520
agcatatctc ctcgtttcgc gggttggggc gactttcgct gtagggcacc aagcggtggt 5580
cgtccagcgg ggccaaagtc atgtccttcc atgggcgcag ggtcctcgtc agggtggtct 5640
gggtcacggt gaaggggtgc gctccgggct gagcgcttgc caaggtgcgc ttgaggctgg 5700
ttctgctggt gctgaagcgc tgccggtctt cgccctgcgc gtcggccagg tagcatttga 5760
ccatggtgtc atagtccagc ccctccgcgg cgtgtccctt ggcgcgcagc ttgcccttgg 5820
aggtggcgcc gcacgagggg cagagcaggc tcttgagcgc gtagagcttg ggggcgagga 5880
agaccgattc gggggagtag gcgtccgcgc cgcagacccc gcacacggtc tcgcactcca 5940
ccagccaggt gagctcgggg cgcgccgggt caaaaaccag gtttccccca tgctttttga 6000
tgcgtttctt acctcgggtc tccatgaggt ggtgtccccg ctcggtgacg aagaggctgt 6060
ccgtgtctcc gtagaccgac ttgaggggtc ttttctccag gggggtccct cggtcttcct 6120
cgtagaggaa ctcggaccac tctgagacga aggcccgcgt ccaggccagg acgaaggagg 6180
ctatgtggga ggggtagcgg tcgttgtcca ctagggggtc caccttctcc aaggtgtgaa 6240
gacacatgtc gccttcctcg gcgtccagga aggtgattgg cttgtaggtg taggccacgt 6300
gaccgggggt tcctgacggg ggggtataaa agggggtggg ggcgcgctcg tcgtcactct 6360
cttccgcatc gctgtctgcg agggccagct gctggggtga gtattccctc tcgaaggcgg 6420
gcatgacctc cgcgctgagg ttgtcagttt ccaaaaacga ggaggatttg atgttcacct 6480
gtcccgaggt gatacctttg agggtacccg cgtccatctg gtcagaaaac acgatctttt 6540
tattgtccag cttggtggcg aacgacccgt agagggcgtt ggagagcagc ttggcgatgg 6600
agcgcagggt ctggttcttg tccctgtcgg cgcgctcctt ggccgcgatg ttgagctgca 6660
cgtactcgcg cgcgacgcag cgccactcgg ggaagacggt ggtgcgctcg tcgggcacca 6720
ggcgcacgcg ccagccgcgg ttgtgcaggg tgaccaggtc cacgctggtg gcgacctcgc 6780
cgcgcaggcg ctcgttggtc cagcagagac ggccgccctt gcgcgagcag aaggggggca 6840
gggggtcgag ctgggtctcg tccggggggt ccgcgtccac ggtgaaaacc ccggggcgca 6900
ggcgcgcgtc gaagtagtct atcttgcaac cttgcatgtc cagcgcctgc tgccagtcgc 6960
gggcggcgag cgcgcgctcg taggggttga gcggcgggcc ccagggcatg gggtgggtga 7020
gtgcggaggc gtacatgccg cagatgtcat agacgtagag gggctcccgc aggaccccga 7080
tgtaggtggg gtagcagcgg ccgccgcgga tgctggcgcg cacgtagtca tacagctcgt 7140
gcgagggggc gaggaggtcg gggcccaggt tggtgcgggc ggggcgctcc gcgcggaaga 7200
cgatctgcct gaagatggca tgcgagttgg aagagatggt ggggcgctgg aagacgttga 7260
agctggcgtc ctgcaggccg acggcgtcgc gcacgaagga ggcgtaggag tcgcgcagct 7320
tgtgtaccag ctcggcggtg acctgcacgt cgagcgcgca gtagtcgagg gtctcgcgga 7380
tgatgtcata tttagcctgc cccttctttt tccacagctc gcggttgagg acaaactctt 7440
cgcggtcttt ccagtactct tggatcggga aaccgtccgg ttccgaacgg taagagccta 7500
gcatgtagaa ctggttgacg gcctggtagg cgcagcagcc cttctccacg gggagggcgt 7560
aggcctgcgc ggccttgcgg agcgaggtgt gggtcagggc gaaggtgtcc ctgaccatga 7620
ctttgaggta ctggtgcttg aagtcggagt cgtcgcagcc gccccgctcc cagagcgaga 7680
agtcggtgcg cttcttggag cgggggttgg gcagagcgaa ggtgacatcg ttgaagagga 7740
ttttgcccgc gcggggcatg aagttgcggg tgatgcggaa gggccccggc acttcagagc 7800
ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 7860
cgatgtagag ttccaggaag cggggccggc cctttacggt gggcagcttc tttagctctt 7920
cgtaggtgag ctcctcgggc gaggcgaggc cgtgctcggc cagggcccag tccgcgaggt 7980
gcgggttgtc tctgaggaag gactcccaga ggtcgcgggc caggagggtc tgcaggcggt 8040
ccctgaaggt cctgaactgg cggcccacgg ccattttttc gggggtgatg cagtagaagg 8100
tgagggggtc ttgctgccag cggtcccagt cgagctgcag ggcgaggtcg cgcgcggcgg 8160
tgaccaggcg ctcgtcgccc ccgaatttca tgaccagcat gaagggcacg agctgctttc 8220
cgaaggcccc catccaagtg taggtctcta catcgtaggt gacaaagagg cgctccgtgc 8280
gaggatgcga gccgatcggg aagaactgga tctcccgcca ccagttggag gagtggctgt 8340
tgatgtggtg gaagtagaag tcccgtcgcc gggccgaaca ctcgtgctgg cttttgtaaa 8400
agcgagcgca gtactggcag cgctgcacgg gctgtacctc ctgcacgaga tgcacctttc 8460
gcccgcgcac gaggaagccg aggggaaatc tgagcccccc gcctggctcg cggcatggct 8520
ggtgctcttc tactttggat gcgtgtccgt ctccgtctgg ctcctcgagg ggtgttacgg 8580
tggagcggac caccacgccg cgcgagccgc aggtccagat atcggcgcgc ggcggtcgga 8640
gtttgatgac gacatcgcgc agctgggagc tgtccatggt ctggagctcc cgcggcggcg 8700
gcaggtcagc cgggagttct tgcaggttca cctcgcagag tcgggccagg gcgcggggca 8760
ggtctaggtg gtacctgatc tctaggggcg tgttggtggc ggcgtcgatg gcttgcagga 8820
gcccgcatcc ccggggggcg acgacggtgc cccgcggggt ggtggtggtg gtggtggtgg 8880
tggtggtggc ggtgcagctc agaagcggtg ccgcgggcgg gcccccggag gtaggggggg 8940
ctccggtccc gccggcaggg gcggcagcgg cacgtcggcg tggagcgcgg gcaggagttg 9000
gtgctgtgcc cggaggttgc tggcgaaggc gacgacgcgg cggttgatct cctggatctg 9060
gcgcctctgc gtgaagacga cgggcccggt gagcttgaac ctgaaagaga gttcgacaga 9120
atcaatctcg gtgtcattga ccgcggcctg gcgcaggatc tcctgcacgt ctcccgagtt 9180
gtcttggtag gcgatctcgg ccatgaactg ctcgatctct tcctcctgga ggtctccgcg 9240
tccggcgcgt tccacggtgg ccgccaggtc gttggagatg cgccccatga gctgcgagaa 9300
ggcgttgagt ggcgcgcatg gcgcagacgc catgacccag ggcctcgtag ctcctcctcc tatggggatc ttccatgatg tctgcgccgg gcggcggcgc gccgccggac gcatctcaac cggatccgaa caccgtggcg attgaagtag ggcctgctgg gtccttgtag ttcttccatg gaccccgaac gatggcctgc gtaggcgccc gtggcccggt gtagtcgttg gcggtagagg gcggtggtag gcgcgggaag aggcgtgctc aagccggtca gagggcctcg ccgcccgcgt gtttttctgg agtggctcgc ccgccctcgt accacctgcg tggaagaggt cggcgcaacg aagtccacgg agaagacgga tcttcctccg gcttcctcct cggcggcgca atggtctcgg atctggtgct aattgctgcg aacctttcga
ggcggcgggg
gcggacttga atgcggaggc tagtcttgca tctgcttcgg cccctgagcg tgcacctgcg gtgttgatgg tgcgacatct caagtccgca ggccagcgca gcgtagatgt tcgcgcaccc tgtccagtca gcgggcactc gttcgagccc gtcgaaccca ccgggcgccg tccccgtagc tccagactcg cgaggttgag agttgagggt tggattcgtt cgaagttgaa tgagctcggc ctagcatcac cttcgggggg ccgggaggcg tgacggcgcg
ggggcgggtg
taggtacgcc ggaaggcgtc
ggtgggggga
cacggcggat ggtcggctat tgagcctttc ccctggggcg gttggagcag tgagggtggt tgtaggtgca cggtgtacct ccaggtactg
gggtggcggg
acctggacat ggttccagat gacgcgcgca ttccgtggtc cgggtccggg ggtgtgcgac gcgtcgcgta cggagggatc gctgtagacc ctccacgtgc ggtggcggtg gatgtccccc aaactgggag gacggtgtcg cacctcctcc cggcggcggc gtccacgaag gccgttctcc gccgtgaggc gccgagggac taaccagtcg gtgtctggcg ggtcgacagg gccccaggct caccggcacc gcgccgcgcc ggccaggtcg ttggaagtca gttggccatg gagtcgcgag gtagcccacc ggctccgggg ccaggtgata gttgcgcagg gtcgttgata tggtgaatag ccggacggtc gtcagacaac agagactaag cttgctaagg acgcccccct cgcgcgaaga tgctcggcca aaggcctcca ttgcgcgccg cgcacctcgc tcttcctcct
ggcggtgggg
cgcgcgatca cgggggcgca agcgaaacgg ctgagggagt cagtcgcaag gaggtgctgc agcaccatgt tcgttctggc tcttctcctt cccctgcccc gcgacgacgc tccaagtcca acggaccagt taggcgcggg aggaagtgcg gccaggtctt cccgcggcgg ggcagaaagt ctctagacca atcgcaaggg cgccatgatc ggtggagtgt ccgcgaaagc gttgcgttgc ggtcatcgcg cggcgtagtt cgaagaagtt gccgttccat acacggtcaa gctcgaaggc cttctggcac gagggggcgc tctccccgcg gttggaagac cgctgacgat ccatatccac gtaggctgag tgatgatgta ccttgggtcc atcggcgcag cctcttctgc ccatgcgcgt gctcggccag cgaagcggtg tgacggtctg agtcgaagac gcggcggctg ccagcatgag tggtggaggc gctccatggt gggaaaacga tatcatggcg cacgcggtta tccttttggc gaaagcagta ggcgaacccc
9360 9420 9480
9540
9600 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220
ggttcgaatc cctcgtataa tttgctttcc aacaacacca ccctcggcgg gggggccggc tggaggaggg tgcagctgaa gcgcgggcga ggcaggggct cggggatcag agacggtgaa tggcgcgcga tgcagaaccc gggacaacga tgctggacct ccgacaaggt agatctacca tgcgcatggc gcatccacaa acagcctgca tcgatgcggg tccgcgagga agtacctgga cccggcgctg gcgacaggtc gcagccgcag ccccacgcac cccggacgag cggcaacgtg gcgcgagcgc gagcacgcag ccgtactcgg agaccccgct ccagatgcat gcaagagcgg gccggccacc tgacgacccc cgagggcctg gcgcgactcg ggagcccgag gaaccgcgag ccccgcgcgc ccaggagatc ggaggtgacc caacagcaag ggcgtttagg gattaacatc ggcggccatc gacgccgtac gctgaaggtg ggccgtgagc gcgggcgctg ggcggacctg ctatgacgag ctaaaccgcg cgggcggctc atggaccgca gccaacaggc gagaaggtgc gccgggctgg cagaccaacc gcggatcggc ccggccaacg gccggccgga tgcggattga ccggtgctgc cagcaacagc tcggcgtccg gaggagcccc gcgcggctgg cgcgaggcgt gagatgcggg cggctgctgc gcgcacgtgg aacttccaaa atcgggctga cctctgacgg gacgcgctgc ctgcagagca aactactcga gtgcccatag ctcaccctga gtgagccggc gcgggcgccg cgctgggcgc gacggcgagg ggtggtgttt tgcagagcca tcatgtcgct tctccgccat tggccatagt tgtacgacgc tggaccggct agggcaacct tgccgcgggg cccgcggcta ctccggacac ggcagatgcg agcgggagtc cggccgtgtc cgcggcgcag gggcgccgtc acgtgcctcg acaggaggtt gcgaggagga cggccgccga agagtttcaa tgcacctgtg cgcagctgtt tgaacatcac tagtggtgca tgctgagcct acaaggaggt gcgacgacct ggcgcgagct gcagcggcga ccagccggcg aggatgagga ccggtagatg gccgtccggc gacggcgcgt cctggaggcg gaacgcgctg gctgctgcag ggtgggggac gggctccatg gcaggaagac aggtgttgga ggggacgagc ccccccgccc atgcagggcc tggcgcctgc ggccagacac tcccgagcgc gcagaacctg cagcgcaggg ctttgagccc cctggtgacg caaccacgtg ggactttgta cctgatagtg cgagcccgag ggagcgcagc gggcaagttt gaagatcgac gggcgtgtac gagcgaccgc cagggaggcg ggccctggag gtacgagcta caagacccga cttaactcct aacccggacg gtggtgcctg gccgagaaca cgcgtggccc gtgcgcgagg gtggcgctga tacaccaact ttggcctccc cccttttatt cagcagcagc ccctcaccca ggcggcggcg tacctggacc cacccgcggg ttcagggacc cgggagctgc gacgcgcgga gcgtacgagc cgcacgctgg agcgcgctgg cagcacagca ggtcggtggc ctgagcctgg tacgcgcgca ggtttttaca cgcaacgagc gagctgatgc gagtcctact gccgcggggg gaggagggcg acgtggtgga cagacgactg cgttccggca cgcgctcgaa gggccatccg gctacaacag cggtggcgca atgccttcct ttgtgagcgc
11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140
gctgcggctg cttcttccag cctgcggggg gctgacgccc cgtgtcccgg ggcgcaggtg ggaggacacg gattccctcg gagcgtgagc cgcgcgcaac ggactacctg cccgcactgg cgatggcttc ggcggaagcg cagcagcggc cctgggcggc ccctcggctg gaaaaacctg cagatggaag gcgccagcgc tagcagcgtg ggggaggatg accaaggcca cgatgtacca cgccctcttc tgcggcctac ccacccgggt acgaccacag ccagcaccca tcctgcacac gggtgatggt tggagttcga atggtgaccg accagcagac ctgtggggcg aactcgcgcc gacacctacc gacgagcaca agcagcctgg ctgcacagcc ctgaacctga atggaaccgg catcgcgcgg ctcccgccgc ctgtgggacg tccctgctgc gtggcttctc agcccctttc ctgggcgagg ccccccgcct acctatgcgc cacgaccggc ctggacctgg ttttaaaaaa tggcgaccga ggagggacct tccctttgcg
gggggggaga
gtacctggtg caattttttg gaccatcaat caacatgccc gtcgcgctcg gctgccagag agacccccca agggcctgca tgaaggcgcc tgctgctgct tggggcacct ccttccagga aggcgactct tgacctccga tgcgcgacgg gcatgtacgc cggccgtgaa ccgggttcta acatggacga gtcccaagaa tgtccgagct cgagcctggt acgagtacct tccccaacaa aggagcacag agcgggggct gagggagcgg aaaaaaagca gcgttggttt cctccctctt tcgcagctgc aacagcatcc gacaacaagt accacggtca ctggatgacc aacgtgaacg cacaccaagg ggcaactact gagcgaggtg gacggtgaac caccggcgac gctgatcgcg gctgaccctg gatcaccagc gaactacctg ggaggagcgc ggtgacgccc cgcgcaccgg ccccgagtac cagcgggggc cagcgtgttc ggaggaggag gggggcggca ggggtctctg gaataactcc cgggatagag ggacgcgccc ggtgtgggat caacccgttc agaagcatga cttgtgttcc acgagagcgt tggagccgcc gttactcgga cggcggacgt tccagaacaa ggtcgcactg agttcatgtt aagaccgggt ccgagaccat taccagtcgg ctgagccagg cgggcgacgg ccgttcacgg taccgcgagg gtgagccgcg ctgaccaacc atcttgcgct agcgtggcgc ccttacatca tttaccaacg ttcgaggtcc tccccgcggc gaggcgagtc gccgccgcgc cacagcgagc ctgctgcagc agcctggtgg gcgctccggc gacgaggact gcgcacctgc tgcaaaatta cttcagtatg ggtgggcgcg gtacgtgcct gctggcgccc ggcctccctg tgactacagc gggcggcgac caccaataag ggagctgaag gaccattgac gcccggacta ctttcaagaa tgtccagcct acagcggcag ccatcgggca cgctggggca ggcggcagaa acgtgcagca tggacatgac accgcctgat ccatcctgaa cggaggccaa cgcaggcgct gccgccgcgg gccccgggtc gcaccacccg cggtgcggga acaagatgag cgcccacgcg ccgcggacga gcccccgcct aataaaactc cggcgcgcgg gcggcggcgg ccgcgctacc ctgttcgaca aactaccaga ccgagcgagg ctgaaaacca ttcaaggcgc tacgagtggg ctgatgaaca
13200 13260 13320 13380
13440 13500 13560 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 14940 15000 15060
acgcgatcgt tcggggtcaa ttatgcccgg gcggggtgga ccttccagga tcctcgatgt ccacccccgc cggacggggc tgaatgacag aggccgaggc ccgcggcgga tgaccgaaga accgcagctg ccctgctgtg acatgatgca tgggcgccga cccagctcat agattctggc tcacagatca ttactgacgc cgcgcgtcct acccagcaat gaggaagcgt agcgcacaaa ggagcaggcg ggtgcggggc ccaccgccgc caagcgcacg cgccgccacc cagtgacatg cacgcgcgtg ctgagtctcc ggagcactat gttcgacacc ggtgtacacc cttcacttac gggcttcagg ggaggcctac cgcctccgcc agaggccgac tgcggtgcgc cgcggccgag ggctgagtct tagcaagaag gtacctggcc cacgccggac agaccccgtg gctgctgccc ccgccagttc gcgcccgccc cgggacgcta cagacgccgc ttccagccgc aactccggct tccgagcagc cgcggccgcg cgcaactaca gcgcggcggt cgacccgggg ggccgccgcg atggcccccc gccagcaggc cccgtgcgct tgctgttgtg ctgaaagtgg aggaacttcc aacgaggcct agccgcctga atcacctacg caggatagct gccgccgagc cccgctatgg ggagacacct gaaaagcaac gaggggacca cgcagttaca tacaactacg gtgacctgcg accttccgct gtgcactcca acctctctga gcccccacca ccgctgcgca acctgcccct actttttgag ggggactgct accccgtgcg cggggcgcac ggcccgcggt acgccaagct ccgccgccaa ccgccatgag gtacccgaag gccggggcaa tccgcccccc tgtatcccag gcaggcaaaa gcctggggct tccatcccga gcaacctcct aggacctgga tgaaggaaaa agggcgagga tggtggaggc tcgtcacccg tggcggcagc agcccgccaa acctgctcaa gcgacccgtc gctcggagca ccacgcggca agagcttcta cccacgtgtt tcaccaccgt acagcatcgg acgtttacaa caacaccacc gcgcgcgccc cgtgcgcggg caccgtggac ctctaccgtg gaagagccgc acgcgccgcc ggccgcgcgc acgcgcggcc cgtgtactgg gcggacttga cggcggcggc cggggtcctg ggaccccgtg catcatcctg gggcatccgc ggggggcaac tgaggcggga tgctgctgac tcccgagcag gggggaggaa agcggcggcg ggagcccgtg ggacagcacc gacgggggtg ggtgtactgg ggtcagcaac caacgaccag caatcgcttt cagtgaaaac aggagtccag ggccttgggc atcatgtcca agcaagatgt cacttccgcg gacgccatcg gacgcggcca cggaagcgcg gcggccctgc cgcttggccg gccgccgccg gtgcgcgact gatgatgtga gcgcgcagcg gagagcgaca accgggctgg ctgcccggct aagcggcagc atccccgcgc caggaggata accgcggccg gaggaggata aagcaagcgg gcggcgttgg attaagcccc aacaccgcgt cgctcctgga tcgctgcccg ttcccggtgg gccgtctact cctgagaacc gttcctgctc cgagtgaccg atagtctcgc tcctgatctc tcggaggggc ccccctgggg actcggtggt tccagaccgt tggcccgccg ttcgccgggc ccggcatcac ccgccgccat cggtgaccgg aaaaacaaca tcatgtccaa
15120 15180 15240 15300 15360 15420 15480 15540 15600 15660 15720 15780 15840 15900 15960 16020 16080 16140 16200 16260 16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 16920 16980
gcgcaaaatc gaaggaagag tgatgacgat gcagtggaag gcccggcgag agacctgctg ggcgctgggg tctgaagccc gggtctgaag gcagaggctg cagggtccgt catccccacc gacacagacc ggtgcagacg cagaaagtac gcccaccccc ccgtccccgc actggctcca ggcgcgctac cacttgccgc gggtctggcc caccagccga gatcggcgcc gacttgcaaa cacgctcgct gccccgcgtc atgagcggtg gccgttaaaa aagttgaaag
ggggtggtgg
cggccgccgg gagaagcgcc aaagaagaga caggattcga gccgatgggg ggccggcgcg cgctccaccc gagcaggcca aaggaggacc gtgaccctgc cgcgagggcg gaggatgtgc cccatcaagc ggcaactccc gatcccgccg gacccctggc ggcgccgcca ggctaccgag cgacgcgccg gtctccgtga caccccagca ctccgtttcc ggccgcggcc cgcatgcgcg gtgcccggga cttgcaaata tggtcctgtg acggctcgcg gcgccttcag attacggctc agcagaactt acctggccaa tggaggaggt cgcggcccga tgctccaggt agccccgcaa aggtggagtt taaagcgcgt ggactttcaa acgagcgctt tgctggcgct agcaggtgct gcgacctggc tggagaaaat aggtggcgcc ccgccgccac cagccgcagc tgccgccggc acgcgctcct gctataccta ccgccaccac ggagagtggc tcgtttaaaa cggtgccggg tgagcggagg gcggggtgct tcgcctccgt tggaaaaaaa actattttgt cccgttcctg ttggggctct ccgggcctgg ccagcagaag ccaggccgtg gccgccggcg tagggaagag cgtcgcgccg gataaagcgg cctgcgcgcc cctgcgcccc gcgcgtctat cggagagttt gccgctggac gccgagcagc gcccaccgtg gaaagtagac gggcctcggc caccactacc cgccgccgca gatgtcagct gcccgagtac ccgcccgcga ccgccgccgc gcgcgacgga gcctgttgtg ataccgagga cagccgccgc gcccctgtta ggccttgcaa aaaaaaaccc agaatggaag ggacactgga ctgtggagcg aacagcagca gtggtggagg cagaataaaa ctggagacgg accactctgg gagatctatg gtcaaaaaga acggcgccca ggcaccgcgg gacgaggtgt gcttacggga cagggcaacc gcaccctccg cagctcatgg cccggtctgc gtgcagaccg gctgcctcca gccgcgacct ccccgcgcgc gccttgcatc agagccaagg cgccgcagac cacaccctgg gttcttgcag ggaagatcgc gcgcaccggc atccccctga gcgtcccaga caataaaaag acatcaactt acgatatcgg gcattaaaag cgggccagat gcctggcctc tcaacagcag tgtcccccga tcacgcagac ggcccccgaa aaaagaaaga ggcgcccggt tggtcttcac acggcgacga agcgtcagcg ccacccccag aggcgaagcg tgcccaagcg agccggacat tggacgtggt cggacatgga cctcggcgga gccgcggacg cttccatcgc gttccacccg gccagcccgc tgctgcccag atatggccct gccgcaggag ggcgacgcgc tcgccgcggc ggcattgaca tctagactct tgcgtcgctg caccagcaac tatcgggtct gttgagagac cggcatcaac actggacccc tgggcgtggc cgatgagccg
17040 17100 17160 17220
17280 17340 17400 17460 17520 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180 18240 18300 18360 18420 18480 18540 18600 18660 18720 18780 18840 18900
cccccgtatg gccaccgggg gtgccgcagc gccggtcctc tggcagagca tgctactgaa aggagctgct atggcgaccc tcggagtacc ctgagtaaca tctcagcgcc aaggcgcggt tttgacatcc tacaactccc caggcagttg gagcaagcag attagtaaag tatgcagacc gatgctacag ggttcctatg cagggacagc aacgaggcta accccggata ctgggtcagc ggcctcatgt ttgaatgcag gattccatgg gacccagatg ttccctctgg aataacgggg ggggtgggaa ctgtactcca aggaggccct tggtgggccg agcagaaggc tgcgccgcgc cgctgaacag tagcttagct gagtcgccgc catcgatgat tgagccccgg agtttaggaa tgacgctgcg tcaccctggc gcggggtgct tggcccccaa aagaagcagc ctaccaaaaa atggtctgca ctacattcca tcgccggcgg caagacccac tagaatctca acaacattca cgcacctttc agtccatgcc attacaatag tggtggactt gtgacagaac ttagaattat gtggcatagg gccaggtgac acaatttcgc acgtggcgct aaagcaaggt ccacaccccc ggcacagccg ggccagcggc catcgtgggt aacgtgttgt cgttcgcgcg gccgcagtgg gctggtgcag ccccacggtg gttcattccc cgtgggcgac ggaccggggt gggcgctccc agaagaggaa gactcatgta aataggaacg gcccgaaccc tagagtgcta aaatgctaat ggttgaaatg gcccaaattg ttacaagccc caacagacct cactggcaac gcaagacaga cagatacttt tgaaaatcat ggtaactgac ttggacaaaa tatggagatc gtacctacca ctgcccacca gccacgctgg ggcccgcccg ccccgcgggg ctgggggtgc atgtgtgtat cccaccacca tcgtacatgc ttcgcccgcg gcgcccacgc gtggaccgcg aaccgcgtgc cccactttca aactcctgcg gaagaagatg tatgctcagg gacgctacag caaatcgggg aagaaatcta ggaggtcagg caattctttt gtgctgtata gcaaaaagcg aattacatcg atgggagtgc aacacagaac tccatgtgga ggaactgaag acttaccagg gatgaaactt aacctcagtg gacaagctta cgcggcccat acttgcctcc cgaccgcctc gggtcgcgag ggtccgtgaa gcgccctatg ccgccactcc acatctcggg ccaccgagag acgatgtgac aggacaccgc tggacatggc agccctactc agtgggagca ctgacggtca ctcccctttc ctacagaaca agtcccagtg ctcccatgaa gtgtactaac caacttctga gtgaggatgt atgacaattc gcttcagaga ttgcaggtca tgtcctacca atcaggcagt acgagctccc ctgttaaaac ttgcagatcg ccaacctgtg agtacaaccc cgcgcccatg gcccgccgat ccgttcctcc gcacggcaac gcgccgccga tcgccgccag gcccctcaag ccaggacgcc ctacttcagc caccgaccgg gtactcgtac ctccacctac tggcaccgcc agaggaaact agctgaggaa tggcgaaaaa aaaacctatt gaatgaggca accatgctat ggcaaatgcc aaacgcccgt gcacatggag aaaaatcatg caactttatc ggcctctcag gctcttgctt ggacagttat caactattgt caacaatggc caatgaaata gagaaacttc ctccaatgtg
18960 19020 19080 19140 19200 19260 19320 19380 19440 19500 19560 19620 19680 19740 19800 19860 19920 19980 20040 20100 20160 20220 20280 20340 20400 20460 20520 20580 20640 20700 20760 20820
gacatctctg ctggtggact aaccccttca gggcgctacg ctcctcctgc ctccagagct atctgcctct atgctcagga ctctacccca gcggccttcc tcgggattcg tacctcaacc ggcaacgacc ggctacaacg aactacaaca tccttcttca gactaccagg gcccccacca aagaccgcgg atccccttct ctctacgcca cccacccttc cgcggcgtca taaagaagca tcagggccat gcttccctgg gcgagaccgg tcctctttga acgagggctt aaaagtccac tgtttctgca acttgctgac acaaccccaa gctacatcaa accaccaccg tgcccttcca cgggctccta ctctgggtaa acgccacctt acgacaccaa tacccgccaa gcggctgggc acccctacta acactttcaa gtctgctcac tggcccagtg tcggctacca ggaacttcca aggtgggcat tgcgcgaggg tcgacagcat ccagcaactt actccgccca tctatgttct tcgagaccgt agccgcagtc cgtcagagac ctttgtctcc gggcgtgcac ccccttcggc gctgcgtcgc ccagaccgtg cgcctttgtg gggggtgccc cacctacgat cctgggcgcg caatgcgggc catccaggtg cacctacgag cgatctcagg cttccccatg cgaccagtcc cgccaccaac cttcacccgc cacctactcg gaaggtctcg ccccaacgag caacatgacc gggcttctac gcccatgagc catccaccag acaggcctac cacccagaaa catgtccatg cgccctcgac gttcgaagtc gtacctgcgt atcgccgcct ctgggatgcg ccacacaagc tggctggcct ttttcggacc agcgccatcg caggggcccg cactggcctc aactccatgc tacatgaaca cgctggtcgc ctgcgctacc ccccagaagt tggaacttca gtggacgggg gcccacaaca ttcaatgact gtccccatct ctcaagacca ggctctattc gtcaccttcg ttcgagatca aaggactggt atcccagaga cggcaggtgg cacaacaact cccgccaact aagttcctct ggtgcgctct atgaccttcg tttgacgtgg acgcccttct gcatgccgtc ggccctattt tggcctgcgc ttgcctggaa agcggctcaa cctcctcgcc actcggccgc agagtcccat tccaaagccc agcgagtggt tggactacat gctccatgct tctttgccat ggaaggatgt ccagcatcaa cggcctccac acctttccgc ccatcccctc aggagacccc cctacctgga actcctcggt agcgctcggt tcctggtcca gctacaagga tggaccagac cgggcttcgt tcccctaccc gcgaccgcac cggacctggg aggtcgaccc tccgggtcca cggccggcaa gggttccacc tttgggcacc catcgtcaac cccgcgctcc gcaaatctac cgaccgctgc ctgcggtctc ggaccgcaac ccaggtcgag ggccccgggg ggacaacgtc cctgggcaac caagaacctc caacatggtc gttcgagagc gctcgaggcc cgccaacatg gcgcaactgg ctccctgggc cggcaccttc cagctggccg cgacggggaa gatgctggcc caggatgtac caagtacaag gggctacctc gctcataggc cctctggcgc ccagaacttg catggacgag ccagccgcac cgccaccacc gagcaagagc ttcgacaagc acggccggcc aaaacatgct gagttcgagt gtcaccctcg ttctgctgca cccaccatga cccaccctgc
20880 20940 21000 21060 21120 21180 21240 21300 21360 21420 21480 21540 21600 21660 21720 21780 21840 21900 21960 22020 22080 22140 22200 22260 22320 22380 22440 22500 22560 22620 22680 22740
gccgcaacca acagcgcaca aataacgatg ctctggggta gaaatcgaaa ctggtagcgg ttcgctccac gaagtcgcag ctggaacacc ctcggcgtcc ccccaggaag gtgcccgtgc gaaggccatc ctggtttgcg caccacgttg cgcgcgctgc gctgctgccg cgcgcagccc ctgcaaaaag cccgcggtgc gggcagcatc gcgcgccgcc caccatcacc ctcttcctcc ctgcaggcgc gctgaagccc ctccggggag ggcgttcgcc gcgcggcacc ggcccgcttc cgagacatcg ttcgcgctgg ggagcagctc gatcaggagg tacacacttt ttcatttccc gggttctgcc gtgccccact aggctgcggg ttggggccgc aacagcgccg aggtcctccg ggcgcgtgcc ccggactcgg tgggccttgg gggcagctgg cgcccccacc ccgttctcgc tgcagacact gtgggctcga cggcccatca tcctcgttca ttgaagttca tccatgccct gtggccgccg tcttcctcgc tgcaccttgc accatcacca
ggggggttgg
agctccgcgg agcgcgtctt ttcgggggcg tccagggtgg tcctcttccc tacagcttcc gccacctcct tttctcaata accaccacca gggagtcgcc tgaactcggg tcagcaccag cgccctgcgc ggtgcttcac cgttgctcag ccggtttcga cgttggggta cgccctccga cgtcgtgcag ggttcttcac tggtcacatc tcagctcgcc aagacttgta tggtcacgaa gccaggtctt ccttcagctc tctcccaggc cctccgccgc cgccgcccac gcttgccgtt gcgcggcctc tcatcctcag ctgcggccgc gcgagccgtc cgcggggcgg gtggacggcg gactggccat tggagcgcca tctgccactt aatggcattt cccgccgttg gtgcgccacg caccaccagg cgcgttcatc gcgcgagttg gctggccagc cgcgaacggg gttgcagtcg cagcgcgcgc gaagaacatg gcagcagcgc gatcttggcc catctcgatc ctccgtctcg ggtcacctcc ggtcttgttg gcacacggcc attctccacg cgacaccagc gctttcgctt tcgcagcccc gcgcccctgc ttcttgctcg taccgaggca tgccgaggtc ctcgtcctcc cggaggcggc ggccgcgccg ctcccactgc ctcgccctac gcaagagatg
tttttttatt
tcgccatctg ggcagggaca cgaggcagct aggtcgggcg cggtacaccg acgctgcggt gtcatcttgg cagcgcagcg atgaaggcct ccgcaggact gcgtcggtgt ttggacgatt acatgttcct gtgcagcggt gcgaaggact ctgctgaagg gccagcgcct tggtacttgt ggcaggctca tccgccccgc cgcaccacgg ttgatgcgca tcctcgctgt cgcttctttt gaaggccgag tcggactcga ggcggcgacg cgtccgcgct tccttctcct ttccgccgcc caagaagggt tatacaagct gctctattta cgttgcgata cggggaagtt ccgagatctt ggttgcagca cggagatcag gcacttgccg ggatcagcag gcatctggcg tgcccgagaa tggcgatctg gctccttcag tgttcaccat gctgccacag gcaggtaccc tcagctgcag ccacctggtc ccatcagcgt cggggttctt tgttctcttc ggtcgtcttc cgggcgggtt ccagaatgac tcttcctggg ggctgggcgt gacggaggcg gagacgggga cgggggtggt ataggcagaa
22800 22860
22920 22980
23040 23100 23160 23220 23280 23340 23400 23460
23520 23580
23640 23700 23760 23820 23880 23940 24000 24060 24120 24180 24240 24300 24360 24420 24480 24540 24600 24660
agagatcatg tgagccctcc gaccaccgcc cgagcaggac ggaggtcgcc ggatgagaca cgtgggagac gctgcaggag gcacctcttc cccgcgtctc cttcttccaa aaccctgacc caagatcttc cagcgaaaac ggccgtactc ccccaaggtc cgcggatgca gctagcgcgc gatggccgcg cgagatgcag ccaggcctgc gcacgagaac cgactacatc ggtctggcag caccctcagg catcatcttc ccagagcatg cacttgctgc gctctggggc catggaagac gccccaccgc cttcgagctg gagtctctca accaccgccg agtaccaccc ccgggttttg gcctcagtgc gcagtcgggc gacgtgctgc cgctgcgaag gcgccgcacg aacttctacc aactgcaaga ctgcggcagg gagggtctcg gagagtcact aagcgcagca atgagtgtgg aacttgcaag tggctggaga gtgctggtca cgcaagctcg aagatctcca cgcctcgggc cgcgactgcg cagtgcctgg gacctctgga cccgagcgcc ctgcagaact gcgctgccca cactgctacc gtgagcggcg tctctagtct cagggtccct tgcgagtcga ccaccaccgc tccccagcga tgagcggaga caaaagagga gggggaacgg ttaagcacct tgcccctgga tgccccccaa cggtcttcgc tccccctctc gcgcccacat gtcgcgacga cgggggtgct tagaggtcac tcatgggcga agtcctccga cccgcgaccc ccgtggagct aggagaccct acgtggagct agaacgtcct cctacctctt aggagcgcaa cgggcttcaa tgctcaagac ttaggacttt gcgacttcgt tcttccagct agggcctgct gcaacccgca cgcctgacga gaaggaggag caatgccgcc cgcacccccg ggaggatgag taaaaagcaa aagccatgat gcaccgccag cgtggcggag gcgccgggag ggtacccgag ctgccgcgct acctgatatt gaaacgggcg ggtggagctc ccactttgcc gctcatcatg ggaaggcctg cgcgcagctg cgagtgtctg gcactacacc ctgcaacctg gcactccacc cctctgctac cctcaaggag cgagcgctcg cctgcagcag catcctggag gcccatcaag ggccaactac cgagtgccac gctgctcagc gaagtccgcg gacagcctaa gcggacgacg ctcgagaatg gtggatgaga gaccaggacg gctgatgacg tgcgtcatcg gtcagccgcg aacggcacct gtgctggcca aaccgcaccc gcctctctgg gcgaacgctc gagggcgaca tacccggcgc cgccgcgctc cccgcggtca gaggagcggc cagcgcttct ttccgccagg gtctcctacc ctcaaagggg acctggcaga ctggaaaagc gtggccgccg ggcctgcccg cgctcgggca tacagggagt ctcgcctacc tgccgctgca gagagtcaga gctccggggc ccgccccctc cgcccaccga aagtgctgat aggagaagga acgcagataa gctacctaga tctgcgacgc cctacgagcg gcgagcccaa cctaccacat gcgccgacaa aggaagtgcc tgcacggaga acgcgcgcct tcaacctgcc agcccctggc gcgacgagca gcaagctcat tcgcggaccc gctacgtgcg tgggcatcct aggcgcgccg cggccatggg tactcaagcg cgctggcgga acttcaccag tcctgcctgc gcccgccgcc actcggacct acctctgcac ttatcggtac tgaaactcac
24720 24780 24840 24900 24960 25020 25080 25140 25200 25260 25320 25380 25440 25500 25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 26220 26280 26340 26400 26460 26520 26580
tccggggctg cgagatcagg catcacccag cttgctgaaa gctacccccg agcagcagcc acagtcaggc aggacagcag caccctcggt ctataacctc acaccacagg agcagcgcca aagactgcgg cctttccccg acccagaggc ggcaagacag gcactgcgcc cccactttgt aacagatctc cggcgcacgc gactagctcc gcccagcccg agccgcagat tgagcgcggg tactgctgga ggcccgccgc acgcccaggc acggggcgcg agctcaacga tcgccggatc cgtcctcgga cctcggtcta tggacttccg ttctacgaag gggcacatcc aagggtcggg ccgccgcccc gccgccgccg agaggaggtt cctagacgag cgcagccccc cgctcctccg aaccggggtc gggctaccgc gggcaacatc caatgtcctg ggcagcggca cggcagcagc tctcgcccaa atgccatctt tgcgctccct tggaggacgc gcgcccttct cccagccgag gggactcgcg accccacatg acaggcggcc cctcgtgtac cgaagtccag gccgctccga cgagtcggtg cggccgctct gccccgctcc cttcaacccc cctacctacg accaatcccg tgggccaatt gggtgtacct agcagcggga cagccataca tcggacgagg gaagcttcag tcgccggggc gcgccggcgc ggtaagtcca tcgtggcgcg tctttcgccc cattactacc gccacagcgg ggccaggaga cgaacccctc ccaacagagc cacccgcagc ggaggcactc cgaatttagg atgagcaaag gcgggagcgg atctcacagg atcaccgcca caggaaaccc atgactaact ccaggtataa agctcttcgc tcgttcacgc ggaggcatcg ttctcgggac caaatttgta cccgcccaag gcaagccatc ggacccccag ccttgcttcc tgcttctgga agcaggagga aggccgaaga ccctgaaatc cacccgcccg agtgcccgcc ggcacaagaa ggcgcttcct gtcatctcta cgaccaccac cccgcggcag tcgacccggg agaggccagg tgtctgtatc ttcagcaaat cgggagaaaa agattcccac cccaggacta tcaacgggat cgccccgcca cctccgccac caggggcgca gacacctgat tcggtctccg cccgccaggc gaaccctcca ctcccggacg cctgaggact gcggagctca aacaaagccc tccggcgagg caggatggca ggaagaggag gatgatggaa ggtggcagac ctccgaaccc cagacccaac gccgccaccg cgccatagtc gctattccac cagcccctac ctaggaagat cagcggcggg agctcagaca agcaggagct acaaaagcga actgcgcgct ctacgtcatc gccatacatg ctccacccgc ccgcgcccag taatctcaac caccgtacta gctcgcgggc gatcagaggc tccggacgga gtacctgact gttcgtggag ctaccccgac accacgccca ccgcctgcgt gccgagagtt agctaaaccc cccagaaaga gaggactggg gactgggagg gcaacaccat agcaccagcg cgtagatggg cagcagcagc gcctgcttgc cacggggtcg tgcagcggcg atcctccgcg agcggtgggc caggatcttc gaaaataaaa agatcagctt cactcttaaa gccggccgcc tggagctacc atgaactaca cgaaaccaaa ccccgaaatt cttccgcgtg ggctttcgtc cgaggtatcc actttccagc ctgcagacct gagttcgtgc cagttcattc
26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360 27420 27480 27540 27600 27660 27720 27780 27840 27900 27960 28020 28080 28140 28200 28260 28320 28380 28440 28500
cgaactttga cagagcagct gttccggtga gcgtccgcct gtcccctgct ctaaccctgg gagatcagaa cccgaccagg acctggtact tccctgaaag ctcttccctc acccgcctga ggaggtgagc gggttaggat gttctttcct atcaggtgac tatcatactc ctgctggttg atcctaggcc gagcccgctt tgcgttacca gtctatagtg ggacagtcta tacatgtcaa gggtcttact tacataaaat acaccggctt ccttgcgatt ggtgggcccc tcatttctgc aactctgatc cattaattac cgcggtgaag tcgcctgaga gttctgctac gaccacccag agtggagcgg attacatcaa tctactgggg cccaggcgaa tcaacggcac accagctctc cctacctgcc tcgtaaacca tcaggaaact tttttattac tctacgtgta ttctctgaaa agccttctgt ctcaagtgca tgctggccct gcaatgtaac atcatgagag tgtttacgcc agatattcaa aacagtacaa gctgtatggc tcaggcagag tctatctgca gcccatgggt gccggcaatt tctaaccgaa aatgtgcaaa tggcgacccc gactcggcgg cacctcgagc tttcagctac ggcgaggtta gagcggggtc gatctttgct ctcctgtcgc cctcacctgc cccctttgtg cggtctcagc gggaacctac gagctttccg ccccggggac cgggttgctg tgaacacctc tcgggcttgg gcctcaggct ggggtcgcca ggcggcctgc tttcaagccc gctgcgcatc cggagacccc ttacactttc cctgtggcct tttggcaatc gcgaatcttt gaatgaatgc tgacacgaat ccaccctcat tcagtatcaa tgatggatgc acaaggacta acggctacga actgccgccg ccgaggagca cctgttccct cctgtgtcct gtcatctctg catcctgtga ggtctgcatc gtttacaaca tactccatcc gagtgcgtca ggaacagata cagggcggag gctcttttaa agcctccaat tgtgctgctt cgccgcctgc cccaagatga agcgccgcca gagggtgacc gactacaaaa tctaactact cctttttatg ccctctcccc actacgctcg atcgatgaaa aatcacctcc cgaagtgcca gtgggaaaaa gcccagagcc tgggtactat catgctgcat ctgaatgtca ccacaagtgc taccgagggg catccgggag aactatcgcc tgctgagttt acgccaccgt ggagggccaa gcttcgacgg acaagaacac ccggccgctg actccctctt acgtaccttc tcaaagcttc aactctaccc actctgttga tgcgcacaca acaggtacat aaaaagagat aatgcaccac acaaaactgg ctgtcaccgt agttatgcga aggcgtgtgt ctctaatctg agaaaatgcc ctactaatca gtggggtcca tttgtccgca atctgcgatg tacgggcagc gtagtcgagg ggtgccgagg ttcgcccgcg ccggcgcacg ttcaccctcc tgcaactgcc aataaacgct cttcacccac gaagtacctc ggacggagtc caccctccaa cacccacctc ccccagaaca gacccttgtg cttgagattt tttcttcgga tttttttcct tctatatcta ggtcctatcg tacctttgag cctcgtcaaa ccagtttgcg cttccagggc tgcggtcatg ggaaaatact cacggtgcta ttgatcgcta ccaccaccct atgtcaccat atcaatgggt ggcaaaatct ggggagaaat cacttcccac
28560 28620 28680 28740 28800 28860 28920 28980 29040 29100 29160 29220 29280 29340 29400 29460 29520 29580 29640 29700 29760 29820 29880 29940 30000 30060 30120 30180 30240 30300 30360 30420
taccaccccc cactaccgct tcactcccac ccaatgcact gagctccgct ttcaataatt catcacgggt tgtggtctct gagaaaagct agataacaag cttgtcgctt ttcaactcca tgcaatagct ttcaccctca ggtgggcaag caagcttctc cacagcagca gccatctaca accaccctac atgggactta aatgactggg cttctgctct cccatcattg ctactttttt tccttctccc actgcctctc gcagcctaat tcgcatactt tgctctaatc cacctcctgc ccaactgtgg gtatggggtc actaccacct gcccgccata gccggcgggc aacgccagcg tgcctgaccc gactcttctt accaaagacc tccgcgctga cgctctcagg atatgagctc gcgactcgag cggccgatac ccacttcccc tcaacgcttc gaaagaccca ccaccaccac gcagcagatt gctctgtgcc acacctccag caagccccac cggggctggg ggctcatctg tcctgaaccc cttttacagt accttttctg acccttcact cacagtaatc cagacaccac atgcataaga cagtacacca aatataccca atctgtgtct ctcccaccac cccgcaaaag ccatcggtgc ctcatgaact aggaggctgt cttttgccac ctaacctctc tgttactggg gccaaccact gctgctgaca attccacaat ccagtggtcg cagcatatcc caccctggac cgcttacaac caccaccacc attgactttg cgaaaccact cgatcagatg tccaaaacca aatgtggtgg ctgcctccac cgataatgat atgataaatt gggtgttcta gtctacctgc atcgccttca ccgcagtacc ctgtgatctg caaaatctcc aatgctacaa tagttttctg cactaccacc caccatgatt gacctcagaa gttcgacctg ggagcccgtt tcccgaatac tttctacctg gatgttctgc gatgcccttc ctaaccgctt gtcacagctg tggagtggct ccaaccaagt aatggactct ctggaagttc accaccacca gttttggcca cagatccacc ccgaccaaca gtggatgcgg ttcgccatag cgcaggcgag gggatccata gagacatgcc cgctggccgc tttacggatt tccagtgcat gagacaggaa ccttctgatc gcgcaaaaga cgaaaagagc cagcactgtc actactacta agcacaaagc accaccgagc gagaatgagg gccctgaagc cctcccgatt atgctgctgc tgcctgatct ccctaccccc tactagcctg tggcaggaga caggtagcta accaatgcaa atgtaggcta gccagcccag tcaccagcag gctcatctgc gcccagaaac tcaccccctt ccgaggtctc gcatgatggc ccagaccccc gattggatgg tcgcattttc tgtgtctcac ggtcaccctc tgattacatc cattgcccaa ctctgcatcc catgcctcct gagctctccg tttgccctca ctactactac cccctcgtgc tttgcttctg atgcccagca agatcggtga ctactttcca tctgtatctc gccgcagaaa cggattttgc cgctctaacc aaatgttact cttaactatc tgccagcctg tgtacccttt aaccactacc cagcagcagc cgctacccag gaccaccgcc ggctcttcaa cgccctcgtc gctctgcctg catctataga cctgaaaaac ttgtacatgt ctggaggtag actctcatct tgtgtgcgcc cttctaagac tgcccaccct gccgcttcac aagcttggct tgatctaccc
30480 30540 30600 30660 30720 30780
30840 30900 30960
31020 31080 31140 31200
31260 31320 31380 31440 31500 31560 31620 31680 31740 31800 31860 31920 31980 32040 32100 32160 32220 32280 32340
ctactttgat cgagataatt tacgcccact tagaaatgga agcaagagcg gcatcttttg gcctcagtta ccatcaccgt gtccagaaga ttaactaatc tctctgtcca cgccttctgg ccctccgcac agcttcaacc acccctccct aacctggccg ctctccctgg ctcaaaaaaa tcaggcgccc atgcaatcag cccctgaccg gacagcagca ggcttagaca ggtccactaa actgtagata ggaaatctac cttaatgtgg cccctgtata actaccacca accaatggtg ctaactgtgg ccaaattgca ttgggatgga ccactgcgac gaaatcagct cggcatcagt cctcaatcag tctggtaaag caaattgccc cacccagcac cctctgcacc aaacactgga gtttattcag cggcaaactt ccactatctt ccgtgtaccc tcgtgtctcc agcccctggt acgacgctgg ccaagaccaa tcaccgtagc aggcccccct tgtctgaagg ccctcaccgt tggaagaccc gagtagtaga acaatgccct aattgagagc catacccatt taaacacaga acaacacaaa ctgtcattat gaaacactgg gaattcactc acgcgatcga aagttgtacc actttaacct accgagcagc gagctccgag caggccaaag acccagcgcc tcggtagaga ctggtaaaga atcaataaaa cagcacctcc cctccacacc catgttgttg ctatgacacg cgatggattc cacttcccac caacctcacc cctcagccta agccgccgct gacagtacag caaactggcc tagcgccaca tatgtatact cagcttgcac ccaaactaga tgcaggaggt tgatgctcag ccacaacctg aaaacttgag taaacttggc tgatgataaa agacaaagac tgccatgaat cgttgtcgtt aacaggcgga gtctcctaga atctcgttaa tcacctacga agaagctggt ccgaggggtg ccctgtgcgg agaatcactt ttcccctcct ctgaagggaa cagatgaagc gaaagcggcc caagaaagcc ggcatgctcg tctcaagata gaaacctcat cccctggcag gatgcaaaac ttgcaaacat ccaccaatta cacgatggaa acactcactg gttacgggcg atgcgaattg aacaatctca gatttgaatt actaaaatta actggtctaa ctgactctgt tgcaagttta taccccacct aatcaacgcc gatgactgac gaggcgcagg cctgcaccag gaagaccggc gctcatggtg tctgcactct tctcagagat acttaaaatc cccaactctg tgtcagattc gcaccaaaac ctccctccgt cccccggggt ccctgaaaat tcaccaccgc cccccctaac tggccggcac tcaccctggc cggccccgct atgtaagcag aactgggaat tagttaccgg ccctaggtta atgcaaatgg gccttagact gcaacagagg gctcaggctt gcttcgacaa ggacgacccc ctctagtcct ttcccgcacc ccccatcccc gccctagatc caggcggctg tgcaaaagag aacagccacc ggtgagaatc ccctgtcggg ttagtcccct agacagcagg gtactccaaa ttgctcctgt gtctgacgag ccctttcctc cctgtctctg gggaagtggc tagccctccc tgtaagcacc ctccctcacc caccaaaggc gacggccgct tggaagttta aagaattggg aaatggacta tgacacatca ccaacttatc tggtcaggga tctaaccaca agactatgac cacaggcgcc agacccatct aactaagtgt
32400 32460 32520 32580 32640 32700 32760 32820 32880 32940 33000 33060 33120 33180 33240 33300 33360 33420 33480 33540 33600 33660 33720 33780 33840 33900 33960 34020 34080 34140 34200 34260
ggaagccaaa acaggcaccg gaaaactcct gccccctaca agccagactg cccatgaccc agtcactact tttgccacca tgttcatttc ttccatctta tagcttataa aggatagggc ctgcaggaat aggcgccttg ctgcagcaca ctcatggcgg tggcgacccc accacctccc aaccagctgg tgacagtgga ttggcacaac agaaccatat agacctcgca tgatcctcca tacggagtgc ccggacgtag ttcgcagtgt cgggcaaagt gccaaaaaac ttgccccagt cctacacctc cgcgccgccc tcctggcctc ttgccagcgt cgctagacag ccaatgcagt ctaaaaacaa ttaccatcac ccatgtcatt actccttcac tgattcttat gcttaataga ctagtggaga ggtggtgctg acaacatggc tcctccgggc gcaccacaat ggaccacaga tcataaacac ggtaccatat ccaaaacctg gagcccagga acaggcacac cccagggaac cgtaactcac gtatggtagc gccgagacaa tcatatttcc aaaaggccaa ccaaaaaacg actagacact caaacaaact cccgcccgcc atctcattat tgtcgccgcc taccatcttt gcagtactgg tgggttcatg cattgtaagt cctcaatgga tacatgggct cttttcttac tttattattt cacagtagct agtactcgcc cagcagcgcg agtggtctcc acagcagcgc attgttcaaa acccacgtgg gctggacata aaacctctga cccgccggct ctcgtaacca gtgcatacac aacccattcc gttgtgcatt gcgggtttct ccgagatcgt tgaagtctta gtgccgagag cccagaaaaa cccttccggc acatatcccg ggcccgcccc catattggct ctagcggtat ctcagatttg aacttcagaa ccaaacctcg caggtttact actaatgaat tgggaaagtg attgctgaac tcaaacacaa taatagaccc tacatggggg cgaataaact tcagcgatga accctgatct atcccacagt ccatcatacc aacattacct ttaaacatgg atacactgca tggatcatca ttcctcagga tgaatcagcg gtcaaagtgt gtctcaaaag gttggtcgta gatctctcaa agtatatata ccgcacgcga gtcaacttcc aacttccaag caaacccgcc tcaatccaaa caggaaatct atcagaatgg atggcaactc cagcataccc tgaatggaga ccagtgaaac ggcaatatgc aataaaaagc caaaatcatt agtagtgcaa tagagtcata gctgccgccg ttcgcaccgc cacttaaatc gcaaggcgct acaagcgcag cttttggcat cgccatccac gggaaccggg tgctcgtcat ttacaagctc taaatcccac tacattcggg gaggtagacg gtgtcatgcc cgcagcacca ggaataaaaa acctacgccc gctttcccac tcgccacgcc tcccgccccg ataaggtata ggcttcgata agtgcttatg aactaacgct caaaacgcaa caaatccaaa tagccaggtg cactgaaacc atgacactga caagtcattc agccccattc atcgtgcatc ccgctccgtc ccgcagcata agcacagtaa gtatccaaag gtagattaag gttgtaattc caccatccta actggaacaa gatatcaatg ctcccgcgtt actgcaggga cagcagcgga atccctactg aaatggaacg gcaccaacac gtgacgtaaa cgaaacgaaa gctacgtcac caaaacaccg cgccccgccc ttattgatga
34320 34380 34440 34500 34560 34620 34680 34740 34800 34860 34920 34980 35040 35100 35160 35220 35280 35340 35400 35460 35520 35580 35640 35700 35760 35820 35880 35940 36000 36060 36120 36180
tg 36182
<210> 14 <211> 36643
<212> DNA
<213> Pan troglodytes
<400> 14
catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg aggtgtttga 60
atttggggat gcggggcgct gattggctga gagacgggcg accgttaggg gcggggcggg 120
tgacgttttg atgacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt 180
gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240
ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300
aatgaggaag tgaaaatctg agtaattccg cgtttatggc agggaggagt atttgccgag 360
ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat 420
ttccgcgtac ggtgtcaaag tccggtgttt ttacgtaggc gtcagctgat cgccagggta 480
tttaaacctg cgctctctag tcaagaggcc actcttgagt gccagcgagt agagttttct 540
cctccgcgcc gcgagtcaga tctacacttt gaaagatgag gcacctgaga gacctgcccg 600
gtaatgtttt cctggctact gggaacgaga ttctggaact ggtggtggac gccatgatgg 660
gtgacgaccc tcccgagccc cctaccccat ttgaggcgcc ttcgctgtac gatttgtatg 720
atctggaggt ggatgtgccc gagaacgacc ccaacgagga ggcggtgaat gatttgttta 780
gcgatgccgc gctgctggct gccgagcagg ctaatacgga ctctggctca gacagcgatt 840
cctctcttca taccccgaga cccggcagag gtgagaaaaa gatccccgag cttaaagggg 900
aagagctcga cctgcgctgc tatgaggaat gcttgcctcc gagcgatgat gaggaggacg 9 60
aggaggcgat tcgagctgca gcgagcgagg gagtgaaagt tgcgggcgag agctttagcc 1020
tggactgtcc tactctgccc ggacacggct gtaagtcttg tgaatttcat cgcatgaata 1080
ctggagataa gaatgtgatg tgtgccctgt gctatatgag agcttacaac cattgtgttt 1140
acagtaagtg tgattaactt tagttgggaa ggcagagggt gactgggtgc tgactggttt 1200
atttatgtat atgttttttt atgtgtaggt cccgtctctg acgtagatga gacccccact 1260
tcagagtgca tttcatcacc cccagaaatt ggcgaggaac cgcccgaaga tattattcat 1320
agaccagttg cagtgagagt caccgggcgg agagcagctg tggagagttt ggatgacttg 1380
ctacagggtg gggatgaacc tttggacttg tgtacccgga aacgccccag gcactaagtg 1440
ccacacatgt gtgtttactt aaggtgatgt cagtatttat agggtgtgga gtgcaataaa 1500
aatatgtgtt gactttaagt gcgtggttta tgactcaggg gtggggactg tgggtatata 1560
agcaggtgca gacctgtgtg gtcagttcag agcaggactc atggagatct ggacggtctt 1620
ggaagacttt caccagacta gacagctgct agagaactca tcggcggaag tctcttacct 1680
gtggagattc tgcttcggtg ggcctctagc taagctagtc tatagggcca agcaggatta 1740
taaggatcaa tttgaggata ttttgagaga gtgtcctggt atttttgact ctctcaactt 1800
gggccatcag tctcacttta accagagtat tctgagagcc cttgactttt ccactcctgg 1860
cagaactacc gccgcggtag ccttttttgc ctttatcctt gacaaatgga gtcaagaaac 1920
ccatttcagc agggattacc gtctggactg cttagcagta gctttgtgga gaacatggag 1980
gtgccagcgc ctgaatgcaa tctccggcta cttgccagta cagccggtag acacgctgag 2040
gatcctgagt ctccagtcac cccaggaaca ccaacgccgc cagcagccgc agcaggagca 2100
gcagcaagag gaggaggagg accgagaaga gaacctgaga gccggtctgg accctccggt 2160
ggcggaggag gaggagtagc tgacttgttt cccgagctgc gccgggtgct gactaggtct 2220
tccagtggac gggagagggg gattaagcgg gagaggcatg aggagactag ccacagaact 2280
gaactgactg tcagtctgat gagccgcagg cgcccagaat cggtgtggtg gcatgaggtg 2340
cagtcgcagg ggatagatga ggtctcagtg atgcatgaga aatattccct agaacaagtc 2400
aagacttgtt ggttggagcc tgaggatgat tgggaggtag ccatcaggaa ttatgccaag 2460
ctggctctga agccagacaa gaagtacaag attaccaaac tgattaatat cagaaattcc 2520
tgctacattt cagggaatgg ggccgaggtg gagatcagta cccaggagag ggcggccttc 2580
agatgttgta tgatgaatat gtacccgggg gtggtgggca tggagggagt cacctttatg 2640
aacacgaggt tcaggggtga tgggtataat ggggtggtct ttatggccaa caccaagttg 2700
acagtgcacg gatgctcctt ctttggcttc aataacatgt gcatcgaggc ctggggcagt 2760
gtttcagtga ggggatgcag cttttcagcc aactggatgg gggtcgtggg cagaaccaag 2820
agcgtggttt cagtgaagaa atgcctgttt gagaggtgcc acctgggggt gatgagcgag 2880
ggcgaagcca aagtcaaaca ctgcgcctct accgagacgg gctgctttgt gctgatcaag 2940
ggcaatgcca aagtcaagca taacatgatc tgtggggcct cggatgagcg cggctaccag 3000
atgctgacct gcgccggtgg gaacagccat atgctggcca ccgtgcatgt ggcctcgcac 3060
ccccgcaaga catggcccga gttcgagcac aacgtcatga cccgctgcaa tgtgcacctg 3120
gggtcccgcc gaggcatgtt catgccctac cagtgcaaca tgcaatttgt gaaggtgctg 3180
ctggagcccg atgccatgtc cagagtgagc ctgacggggg tgtttgacat gaatgtggag 3240
ctgtggaaaa ttctgagata tgatgaatcc aagaccaggt gccgggcctg cgaatgcgga 3300
ggcaagcacg ccaggcttca gcccgtgtgt gtggaggtga cggaggacct gcgacccgat 3360
catttggtgt tgtcctgcaa cgggacggag ttcggctcca gcggggaaga atctgactag 3420
agtgagtagt gtttgggggt gggtgggagc ctgcatgatg ggcagaatga ctaaaatctg 3480
tgtttttctg tgtgttgcag cagcatgagc ggaagcgcct cctttgaggg aggggtattc 3540
agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa tgtgatggga 3600
tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac ctacgcgacc 3660
ctgagctcct cgtccgtgga cgcagctgcc gccgcagctg ctgcttccgc cgccagcgcc 3720
gtgcgcggaa tggccctggg cgccggctac tacagctctc tggtggccaa ctcgagttcc 3780
accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc ccagctcgag 3840
gccctgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca ggcggagacg 3900
cgggccgcgg ttgccacggt gaaaaccaaa taaaaaatga atcaataaat aaacggagac 3960
ggttgttgat tttaacacag agtcttgaat ctttatttga tttttcgcgc gcggtaggcc 4020
ctggaccacc ggtctcgatc attgagcacc cggtggatct tttccaggac ccggtagagg 4080
tgggcttgga tgttgaggta catgggcatg agcccgtccc gggggtggag gtagctccat 4140
tgcagggcct cgtgctcggg ggtggtgttg taaatcaccc agtcatagca ggggcgcagg 4200
gcgtggtgct gcacgatgtc tttgaggagg agactgatgg ccacgggcag ccccttggtg 4260
taggtgttga cgaacctatt gagctgggag ggatgcatgc ggggggagat gagatgcatc 4320
ttggcctgga tcttgagatt ggcgatgttc ccgcccagat cccgccgggg gttcatgttg 4380
tgcaggacca ccagcacggt gtatccggtg cacttgggga atttgtcatg caacttggaa 4440
gggaaggcgt gaaagaattt ggagacgccc ttgtgaccgc ccaggttttc catgcactca 4500
tccatgatga tggcgatggg cccgtgggcg gcggcctggg caaagacgtt tcgggggtcg 4560
gacacatcgt agttgtggtc ctgggtgagc tcgtcatagg ccattttaat gaatttgggg 4620
cggagggtac ccgactgggg gacaaaggtg ccctcgatcc cgggggcgta gttcccctcg 4680
cagatctgca tctcccaggc cttgagctcg gaggggggga tcatgtccac ctgcggggcg 4740
atgaaaaaaa cggtttccgg ggcgggggag atgagctgcg ccgaaagcag gttccggagc 4800
agctgggact tgccgcagcc ggtggggccg tagatgaccc cgatgaccgg ctgcaggtgg 4860
tagttgaggg agagacagct gccgtcctcg cggaggaggg gggccacctc gttcatcatc 4920
tcgcgcacat gcatgttctc gcgcacgagt tccgccagga ggcgctcgcc ccccagcgag 4980
aggagctctt gcagcgaggc gaagtttttc agcggcttga gcccgtcggc catgggcatt 5040
ttggagaggg tctgttgcaa gagttccaga cggtcccaga gctcggtgat gtgctctagg 5100
gcatctcgat ccagcagacc tcctcgtttc gcgggttggg gcgactgcgg gagtagggca 5160
ccaggcgatg ggcgtccagc gaggccaggg tccggtcctt ccagggtcgc agggtccgcg 5220
tcagcgtggt ctccgtcacg gtgaaggggt gcgcgccggg ctgggcgctt gcgagggtgc 5280
gcttcaggct catccggctg gtcgagaacc gctcccggtc ggcgccctgc gcgtcggcca 5340
ggtagcaatt gagcatgagt tcgtagttga gcgcctcggc cgcgtggccc ttggcgcgga 5400
gcttaccttt ggaagtgtgt ccgcagacgg gacagaggag ggacttgagg gcgtagagct 5460
tgggggcgag gaagacggac tcgggggcgt aggcgtccgc gccgcagctg gcgcagacgg 5520
tctcgcactc cacgagccag gtgaggtcgg ggcggtcggg gtcaaaaacg aggtttcctc 5580
cgtgcttttt gatgcgtttc ttacctctgg tctccatgag ctcgtgtccc cgctgggtga 5640
caaagaggct gtccgtgtcc ccgtagaccg actttatggg ccggtcctcg agcggggtgc 5700
cgcggtcctc gtcgtagagg aaccccgccc actccgagac gaaggcccgg gtccaggcca 5760
gcacgaagga ggccacgtgg gaggggtagc ggtcgttgtc caccagcggg tccaccttct 5820
ccagggtatg caagcacatg tccccctcgt ccacatccag gaaggtgatt ggcttgtaag 5880
tgtaggccac gtgaccgggg gtcccggccg ggggggtata aaagggggcg ggcccctgct 5940
cgtcctcact gtcttccgga tcgctgtcca ggagcgccag ctgttggggt aggtattccc 6000
tctcgaaggc gggcatgacc tcggcactca ggttgtcagt ttctagaaac gaggaggatt 6060
tgatattgac ggtgccgttg gagacgcctt tcatgagccc ctcgtccatc tggtcagaaa 6120
agacgatctt tttgttgtcg agcttggtgg cgaaggagcc gtagagggcg ttggagagca 6180
gcttggcgat ggagcgcatg gtctggttct tttccttgtc ggcgcgctcc ttggcggcga 6240
tgttgagctg cacgtactcg cgcgccacgc acttccattc ggggaagacg gtggtgagct 6300
cgtcgggcac gattctgacc cgccagccgc ggttgtgcag ggtgatgagg tccacgctgg 6360
tggccacctc gccgcgcagg ggctcgttgg tccagcagag gcgcccgccc ttgcgcgagc 6420
agaagggggg cagcgggtcc agcatgagct cgtcgggggg gtcggcgtcc acggtgaaga 6480
tgccgggcag gagctcgggg tcgaagtagc tgatgcaggt gcccagatcg tccagacttg 6540
cttgccagtc gcgcacggcc agcgcgcgct cgtaggggct gaggggcgtg ccccagggca 6600
tggggtgcgt gagcgcggag gcgtacatgc cgcagatgtc gtagacgtag aggggctcct 6660
ggaggacgcc gatgtaggtg gggtagcagc gccccccgcg gatgctggcg cgcacgtagt 6720
cgtacagctc gtgcgagggc gcgaggagcc ccgtgccgag attggagcgc tgcggctttt 6780
cggcgcggta gacgatctgg cggaagatgg cgtgggagtt ggaggagatg gtgggcctct 6840
ggaagatgtt gaagtgggca tggggcagtc cgaccgagtc cctgatgaag tgggcgtagg 6900
agtcctgcag cttggcgacg agctcggcgg tgacgaggac gtccagggcg cagtagtcga 6960
gggtctcttg gatgatgtcg tacttgagct ggcccttctg cttccacagc tcgcggttga 7020
gaaggaactc ttcgcggtcc ttccagtact cttcgagggg gaacccgtcc tgatcggcac 7080
ggtaagagcc caccatgtag aactggttga cggccttgta ggcgcagcag cccttctcca 7140
cggggagggc gtaagcttgc gcggccttgc gcagggaggt gtgggtgagg gcgaaggtgt 7200
cgcgcaccat gactttgagg aactggtgct tgaagtcgag gtcgtcgcag ccgccctgct 7260
cccagagctg gaagtccgtg cgcttcttgt aggcggggtt gggcaaagcg aaagtaacat 7320
cgttgaagag gatcttgccc gcgcggggca tgaagttgcg agtgatgcgg aaaggctggg 7380
gcacctcggc ccggttgttg atgacctggg cggcgaggac gatctcgtcg aagccgttga 7440
tgttgtgccc gacgatgtag agttccacga atcgcgggcg gcccttgacg tggggcagct 7500
tcttgagctc gtcgtaggtg agctcggcgg ggtcgctgag cccgtgctgc tcgagggccc 7560
agtcggcgac gtgggggttg gcgctgagga aggaagtcca gagatccacg gccagggcgg 7620
tctgcaagcg gtcccggtac tgacggaact gctggcccac ggccattttt tcgggggtga 7 680
cgcagtagaa ggtgcggggg tcgccgtgcc agcggtccca cttgagctgg agggcgaggt 7740
cgtgggcgag ctcgacgagc ggcgggtccc cggagagttt catgaccagc atgaagggga 7800
cgagctgctt gccgaaggac cccatccagg tgtaggtttc cacatcgtag gtgaggaaga 7860
gcctttcggt gcgaggatgc gagccgatgg ggaagaactg gatctcctgc caccagttgg 7920
aggaatggct gttgatgtga tggaagtaga aatgccgacg gcgcgccgag cactcgtgct 7980
tgtgtttata caagcgtccg cagtgctcgc aacgctgcac gggatgcacg tgctgcacga 8040
gctgtacctg ggttcctttg acgaggaatt tcagtgggca gtggagcgct ggcggctgca 8100
tctggtgctg tactacgtcc tggccatcgg cgtggccatc gtctgcctcg atggtggtca 8160
tgctgacgag cccgcgcggg aggcaggtcc agacctcggc tcggacgggt cggagagcga 8220
ggacgagggc gcgcaggccg gagctgtcca gggtcctgag acgctgcgga gtcaggtcag 8280
tgggcagcgg cggcgcgcgg ttgacttgca ggagcttttc cagggcgcgc gggaggtcca 8340
gatggtactt gatctccacg gcgccgttgg tggcgacgtc cacggcttgc agggtcccgt 8400
gcccctgggg cgccaccacc gtgccccgtt tcttcttggg cggcggcggc tccatgctta 8460
gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520
cggcaggggc acgtcggcgc cgcgcgcggg caggttctgg tactgcgccc ggagaagact 8580
ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640
gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700
ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760
catgaactgc tcgatctcct cctcctgaag gtctccgcgg ccggcgcgct cgacggtggc 8820
cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc cggcctcgtt 8880
ccagacgcgg ctgtagacca cggctccgtc ggggtcgcgc gcgcgcatga ccacctgggc 8940
gaggttgagc tcgacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000
gttgagcgtg gtggcgatgt gctcggtgac gaagaagtac atgatccagc ggcggagcgg 9060
catctcgctg acgtcgccca gggcttccaa gcgctccatg gcctcgtaga agtccacggc 9120
gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180
gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc ccggggggct cctcttccat 9240
ttcctcctct tcctcctcca ctaacatctc ttctacttcc tcctcaggag gcggcggcgg 9300
gggaggggcc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360
ctccccgcgc cgtgaagacg gagggcgctg cgtctcgaga gcaaggtagg gatgctgctg caccaggtcc gtcctgacac ctcctcgccc cgccaggtcg ctggaagtcg gttggccatg gaggcgcgag gtatccgacg ggcgccgggc ccaggtgatg gttgcgcagc gtcgtggatg cctggaggct gctggagccg acctccagga taagcgcgga agggttgcgt cggctaacgt cagttacgga ggcagatgcg cgcttctgcc gagccggcgt cgtcgtcgcc tgcccaagca cccgcttcca acgaggattt cggcgacgca ccgccgcgca acgatgcatc tccacgggat ctgagcccgg gtgatgaagt ttgggcccgg ctggcgaggt gcgcggccgt gcgacgacgc tcgaagtcga acggaccagt taggcgcgcg aggaagtgcg gcgaggtcct ccggcggcgg ggcaggaagt ctctagacat aagcgaacgg cagctaacgt tacggaggcg aagcggccgc tgcggtgtgc gggcgtggct gcgagcccct cccccaccct cccgccccag tcagtatgac ggagcggcac gaacctgttc cgcggggcgg cgaggcggac tggtctcggt tctccaggtg ttatcaattg ccgaaaaccg tttcttgttc tgaagtaggc cttgctggat ccttgtagta gcatgcgcgt gctcggcgag cgaagcggtg tgacggtctg tgtcgaagat gcggcggctg cgagcatgag tggtggaggc agttcatggt acgggcaaaa gttgggctgc ggtactggca ggtcgttttt ccgcgatggc cccggttcga gccccgtcgt ctttttttct ccaccacaac cagcagcagc ctggccttgg ccgcgcgtgc agagacagga gagctgcggc gagctgacgg gacggcgcgc gccgccgggg acccgtaggg ctgaacgaag ttcgggtatt ggtcctgaga gcgcagacgg gtcctgcatg gagcccgaac gatggcctgc gtaggctccg gtggccgggg gtagtcgttg gcggtagagc gcggtggtag gcgcgggaac ggccgcggtc acgaaagcgg gcgtgtaccc ctcccgtctc tggccttggt tcgctgccgt gcctcagcgc ttccaagacc tgtgtttttg cgcccctacc cagccactac aagagggcga agatgaaaag gcggcgagga gcggcctgga ggatcagccc ccgtcctcgc gggtctccgt actccgcgca gcttcgagcc tggtcgggag cggcggatgg tcggccatgc agccgctcca ccgcgctgcg tggatctggg gtgttgatgg cgcacgagct caggtgcgca ggccatcgct ccgtagatgt tcgcggacgc tggcccgtga tcagcggctc cggttcgaat gacccaagcc cgctggtcat agtctggaga tcggcgccgg ccttagccag ccagatgcat gcagcagcag cgcggcggcc ggggctggcg ggacgctcgc gcccgaggag ccgaaagcgg cgcgcgcgcg ggggccgcag tgggcaggga aggacctgag agtcgcagtc gcgggcgggc tggcgaggag cccaggcgtg cgggcacctc gctggacgag tgagggtggt tgtaggagca cgtggtactt cgaggtactg cggtggcggg acctggacat ggttccagat ggcgcgcgca gactccgtgg ctcgaatcag tgctaacgaa gaaaaactag aagaatcgcc ccggattccg ccgacttctc cccgtactgc caacagccgg gccgtgagcg cggctggggg gaggcctacg atgcgcgcct gtgctgaggg cacgtggccg
9420 9480 9540 9600 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280
cggccaacct ccttcaacaa acctgtggga agctgtttct atatcaccga tggtgcagga tgagcctggg aggaggtgaa acgatctggg gcgagctgag ccgaggggga ccttggaagc gcgagtacct gccgccgcct ctcctcggac cgaagccttt gccctcgcgc gaacaaggcc ggcccgctac cgaggcggtg gctgaacgcc caacttcatc gtcggggccg ccaggctttc gacggtgtcg cacggacagc cgaggccatc ccgcgcgctg caaccggtcg gcgctacgtg cgcgctcgac catcaataag ggtcacggcg ccacgtgcgc cctgctggag ggtggtgcag gcccgagggc gcgcgggctg caagtactac gatcgatggg ggtgtaccgc cgaccaggag gagctacttt tgccggcggc ggaagactga cctgatcccg gattggaccc agacagcagc tcgaacccca atccgcggcg aacagcacca tcgcagcgcg ttcctgagca agcgcgctgc gactacttct aagaacttgc agcctgctga ggcagcgtga gggcaggcgc ggccaggagg cagaagatcc cagcagagcg atgaccgcgc ctgatggact tacgagcaga acgctgatcg gccatcgtgc cacagtcggg cgctggctcc ccgctgtccg gctaggaaga ttttacatgc aacgacagga ctgatgcaca gacatgggcg gtgccctacg tggcgcgacc cgatgcgggc aggccatgca ctcaggccaa cgcacgagaa acgaggccgg acgtgcagac agcggttcca cgcagcccgc ggctgatggt tccagaccag agggactgtg cgccgaactc gccgcgactc acgtggacga acccgggcaa cgccccagta tggggctgtt gcaacatgga acttgcatcg ccgtgaagga cgcgcgagga agaaccccac acaacgagac tggacctggt agaagctggc tctacaagac gcatgaccct tgcaccgcgc gcctgcagcg cggacctgcg tggaggaggt gtatttttgc ggcgctgcag acgcatcatg ccggctctcg ggtgctggcc gctggtgtac gaacctggac ccgcgagtcg caacgtgccc ggccgaggtg tcgccagggc gggcgtgcag gcgcctgctg gtacctgggc gcagacctac cctggaggcc cgcgctgagc cttgatgcag gcccagcatg ggcggccgcc ggagagcaac ggtgaccctg gagcaagccg gttcagggag gaacattctg ggccatcaac cccgtacgtg gaaagtgctg ggtgagcgcc ggccctgacc ctggcagccc ggacgatgag tagatgcagc agccagccgt gcgctgacga gccatcctgg atcgtgaacg aacgcgctgc cgcatggtga aacctgggct cggggccagg ccccagagcg ttgcagaccg gccccggtcg ctgctgctgg tacctgctta caggagatca accctgaact accgaggagg gagggggcca tacgcccgca atgaactcgg ttccaaaaat ggcctgatgc ctgacggcgc gcgctgctga cagagcatcg ttctcggtgc cccatagaca accctgagcg agccgccggc ggggccggga agccgccggg gaggaggagg aacagccacc ccggcattaa cccgcaatcc aggccgtggt cgctggtgga tggagcgcgt ccgacgtgcg ccatggtggc aggactacac aggtgtacca tgaacctgag gggaccgcgc tggcgccctt acctgtaccg cccacgtgag tcctgctgac agcgcatcct cgcccagcgc accgcccgtt actactttac
11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140 13200
caacgccatc catgcccgac gcggcccacc gctgtccggt cctgcccttt cctgctgggc cttccccaat gcacgagcac cgacaggcag ggacttgggt cctgatgtaa tgcgttcttc tccctcgtac ggcgccttac ctcggagctg ggacatcgcc gaacaacgat gcggtggggc catgtacagc cacggtaggg tgagctgccc catcgacaac gaagttcgac gggcgtgtac ggacttcacc ggagggcttc tgtcgaagcc taccgccgcg ggaggaagca ggtggagaag ctaccgcagc gacgctgctc ttgaacccgc cccaacgacg accaccaccg cgcgcgggtg tcgctgaaca gaggaggagt aacgggatag agggacgagc cggggactgg gggagtggtg gaatctgaaa tctgttgttt gagagcgtga gtgcccccgc gcacccttgt tcgctgaact ttcaccccca ggccagctga aacaagttca gatgattatg gagggcaact tacttggcgg acgcgcaact accaacgagg gagagccgcc cagatcctgt tatgaagaaa actgtggcag gccgccctag gacagcaaga tggtacctgg accacctcgg actggctccc ggttcctgtg tgtggaagaa ctgccgcggc gcgtgcgcag acctgaacga agagcctggt cccgagctag tgtgggacga gtggtaaccc aaataaaaga gtagtagtat tgcagcaggc ggtacctggc acgataccac accagaacga cggaggccag aaaccatcat aggcgcgggt atggtagtca tctcggtgac tggggcggca tccggctggg ccttccaccc tcagcaacct acgaggacct gtaaggaaaa atgccactgt cggcgaccga acaggagcta cctacaacta acgtcacctg gccgcccggg ggacgacgtg agagggcggg ggtgcccgag cagcgagctg ctccttgttg ggacaagatg cagcgcaggc tgaggattcc gttcgctcac cggtactcac gatgaggcgc ggtggcggcg gcctacggag ccggttgtac ccacagcaac cacccagacc gcacaccaac gatggtctcg ggacgagctg catgaccatc gaacggggtg ctgggacccc cgacatcgtc gctgggcatc
ggaggggggc
agcagaggct caccaggggc tgatagtgaa caacgttcta cggcgacccc cggcgtggag ttctacacgg gacagcagcg gaccggcggc gctgccagcc ggtcggctga aagcccgagc agccgctgga acccgtagac gccgacgaca ctgcgccccc caaggccatg gtgtacccgg gcgatgcagc gggcggaaca ctggtggaca ttcctgacca atcaactttg atgcccaacg cgcaagaccc acctacgagt gatctgatga ctggagagcg gtgaccgagc ctgctgcccg cgcaagcggc aacatccccg gaggcaacta gatacattcg agtaagatag ccggatggaa gagaagggcg caagtctact gcgagtacga tgttctcgcc cgtcctcggc ccttcccgag cgcggccgcg gcgagaagaa agacgtacgc gccagcggca gcagcgtgtt gtatcgggcg gcgaccagcg agggtcctcc ccccgctgga gcattcgtta acaagtcggc ccgtggtgca acgagcgctc tgaacgagtt ccaacggggt gggtggagtt acaacgccat acatcggcgt tggtgatgcc gctgcggcgt agcccttcca cgctcttgga cagccgtggc ccacccaggc tcatcaagcc agaacaccgc tgcgctcctg ggtcgctgcc
13260 13320 13380 13440
13500 13560 13620 13680 13740 13800 13860
13920 13980
14040 14100 14160 14220 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 14940 15000 15060 15120
cgacatgatg ggtgggcgcc ctcgcagcag ccagatcctc tctcacagat cgtcactgac gccgcgcgtc taacaccggt cacgcaacac ccgcgtgcgc caactacacg ggccgacgcg ccggagcacc acgcagggcc gacccgcaga gcgcggcaac ccgcccccct aggatgtcca ggccccgcgg gacaaaaagg cggcgcgtgc gtcttcacgc ggggacgagg cgcagccgcc cccacgccga cggggcttca aagcgccaga gaggtcaagg atcaagatcc accatggagg agacgcaagt atccccacgc caagacccgg gagctcctgc ctgcgtgcct gtccgcccgc cacgggaccc gccagacgcc ctctcgagcc tggggcctgc cccgtgcgcg tcgcgcacca cccgccgccg cgccggtacg cccgccatgc atgctcaggg cgcgcggcca gtgtactggg cgcacttgaa agcgcaaata cggcggtgaa aggaggaaga agtggcgcgg ccggcgagcg acatcctcga ccgcgccctt gcctgaagcc agcgcgaggg agctggagga tgcggcccat ccacggagcc tgcagacgga acggcgcggc cgggctaccg tcaccttccg ccgtctactc tcacctcgct ccgcgcccac tgccgctgcg gcacctgccc gcaccttcta gcgcgcccag tgcgcgggca ccgtcgacga cgcccgcctc cccgcgccaa gcgcggcgcg cggccagacg cggcggcggc tgcgcgacgc gatgctgact caaggaagag ggaggaaaga tgacggactg gcggaaagtg ttccggctcc gcaggcggtc gaaagaggag ggtgaccctg cggcgaggat cgtgctggag caagcaggtg catggaaacg tccctggatg cagcctgctg cggcacgcgc ctccacgcga caagagcttc cacgcacgtc cattaccacc cagcagtatc ctacgtctac aaaaatgtcc caagatgtac cttccgcgct cgtgatcgac caccgtggac gagccggcgg agccttgctg cgcggcctcc ggcggccatc cgccaccggt tcgcgatgtt atgctccagg aagccccgca gtggagtttg aaaccggtgc gcctccaagc gagcgtctgg gcggtgtcca cagcaggtgc ctgtacccga cacatgaagg gccccgggcc cagaccgagc ccagcggctt atgcccaact ttctaccgcg caagttagca ttcaacgagc ttcaaccgct gtcagtgaaa cggggagtcc aaggccctgg attctcatct ggaggcgctc ccctggggcg caggtggtgg gccgtcatcg cggcgcatcg cgcagggcca ggcagcagca gccagcatgt gtgcgcgtgc gatgtgtccc tcatcgcgcc aactgaagcg tgcgcgagtt tgcggcccgg gctcctacga gcgagtttgc tcccgctgga tgccgagcgc ccatgcagct tggaccccga tgggcgtgca ccgtgaagcc ccaccaccac acgcgctgca gctacaccag actacccggt aggccgtcta tccccgagaa acgttcctgc agcgcgtgac gcgtagtcgc cgcccagtaa gccaacgctc ccctcaaggg ccgacgcgcg acagcgtggt cccggcggca ggcgcacggg gcgccggcag cccgcccgcg ccgtgcgcac agcggcgagg tgagatctac ggtcaaaaag cgccccccgg caccacggtg cgaggtgtac ttacggcaag ccacggcaac ggcgccgcgc gatggtgccc ggtgcagccc gaccgtggac cagcaccagc cactcgccga tccttccatc cagccgccgc
15180 15240 15300 15360 15420 15480 15540 15600 15660 15720 15780 15840 15900 15960 16020 16080 16140 16200 16260 16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 16920 16980 17040
cgcaagacca ttggtgcgga cacccgagca cctccgcgtc gaacgggctg aggcttcctg agcttccgtg aataaaaaaa aatttttcgt atcggcaaca aagaatttcg caggcgctga gcctcgggca agccgcctgg ctgcctcccc ctgacgcaca acgcggcccg gcgaccctgg ccggtggccg ctgaacagca acactgtagc aggaagaggc gtacatgcac cgcccgcgcc gcccacgcac ggaccgcgag ccgcgtgctg cagcttcaaa cacctcacag cggtgttgtt tggaactgac tgacagttgg ccacccgccg gagtgtatcg tcgccattta cccattacgg cgtcgccatc cccgcgctga gcggtgcagg tggactgacg ccctggcacc gccaactgaa ggtccacgct gggaaaagct tcaacggggt acgcggtccc tggacaagcg cggacgagcc tggcgcctct acttgcctcc tcgcgtcgcg tcgtgggtct gcttaacttg gcgtcgccga atcgccggac acagacacct gatgtgacca gacaacacct gacatggcca ccctactccg tggaaggatt ggtaaaaaaa accataattt gtcgacacca ccgtcgtcgc cagcgggcgc actaccgcct gctaccgagg accaccggcg tccccatcat cctctcagcg ctcctggtcc gcgacacggc cgggggcgcc caaaacctat gaaagagcag ggtggacctg gcccgcgggg cggcgacaag gcccccgtac ggccaccggg gcctgcttcc cgccccccga gggagtgcag cttgtctgtg gttgcaagat aggacgcttc acttcagtct ccgaccgcag actcgtacaa gcacctactt gcaccgccta ccgacagcaa tagaagccga atgctgataa atggtgcaga agccgccgca gagcctctga cctacttgca aagaaagccg gcggcgcgcc cgccgcggcg ccactgagac tgtgatgtgt acgcggccgt ttcaattgga ggcaacaagg aacttccagc gccaaccagg tccgtggaga cgaccgcgtc gaggaggcgg gtgctgaaac cgcccctcca ggccgccccc agtgtgaagc tgtgtatatg ggccacccca ggagtacctg ggggaacaag ccagcggctg agtgcgctac tgacatccgc caacagccta aatgcatact tggtctgcct aactttccaa ggaaaaatat gcagcaccgc ccctgccgcg gatatggccc cgccgtagaa atcagcaagc atcggggcga acaaaaaagc gtttttagat ttatgggcac gcagtctctg cgtggaacag agaaggtggt ccgtgcagaa tgccccaggt ccgacgcgga tgaaactggg ccagcagcag cagtggctaa aggcgaactg gccgccgctg tatgtccgcc tcgatgctgc agtccgggtc tttaggaacc acgctgcgct acgctggccg ggcgtgctgg gctcccaagg tttggagttg attggaatag ccagagccac ggaggtagag gacttccgcc cgcgcgctac tcacatgccg ggctgacggg
ggttgggggg
tccccggcat atggatttgt ggaagacatc ctggagcgac gagcgggctt cagcacaggg cgatggcctg acagatcaac ggaggaggag ggagacgctg tctgcccacc cagccagccc gcccctgccg gcagagcact ctattaaaag gaccagaagg cccagtgggc tggtgcagtt ccacggtggc tcgtgcccgt tgggcgacaa atcggggccc gagcgcccaa ctgccatgcc attcatcctc aggttggaag ctcttaagga
17100 17160 17220 17280 17340 17400 17460 17520 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180 18240 18300 18360 18420 18480 18540 18600 18660 18720 18780 18840 18900 18960
cactacaaac acaggctaac ggcattcttt agaaaatgtt tgaaagttca gttcagagac ggctggtcag gtcctaccag tcaggcggtg tgaactcccc tgttaaagtt tgataccaca caacatccag cgactcctac ttacatgaac gcgctggtcg cctgcgctac gccccaaaag gtggaacttc cacggacggg ggcgcacaac cttcaacgac cgtgcccatc cctcaagacc gggctccatc catcaccttc gttcgaaatc caaggactgg cgtgcccgag ccgccaggtc gcacaacaac ccccgccaac atgaagccct ataaaagatt gacagcaaaa gagttgcaaa gaagccaatt aactttatcg gcctcccagc ctcttgcttg gacagctatg aattattgct aagacagata gtcagcactg gccaacctgt aagtacacgc ggccgcgtgg ctggacccca cgctccatgc tttttcgcca cgcaaggacg gcctccatcg accgcctcca tacctctcgg tccatcccct cgcgagacgc ccctacctcg gactcctccg aagcgcaccg ttcctggtcc ggctacaagg gtggacgagg tcgggcttcg tacccctacc gctacggttc ctgaaactgc atattgcagc ctccagatac tgggccagca ggctcatgta taaatgctgt actctctggg accccgatgt tccctttgaa cagccgctac ccaatgagat ggcggaactt cggccaacat tggcgccctc tggacaacgt tcctgggcaa tcaagagcct tcaacatgat ccttcaccag cgctcgaggc cggccaacat cgcgcaactg cctcgctcgg acggcacctt tcagctggcc tcgacggaga agatgctggc accgcatgta tcaactacaa tcggctacct cgctcatcgg ttttgccagg cagcactact taactacgat tcatattgtg ggccatgccc ctacaacagc ggtggacttg tgacagaacc gcgcattatt tggtgtaggc tggtaccaat ccactcaggc cctctacgcg cacgctgccg gctggtggac caaccccttc cgggcgctac cctgctcctg cctgcagagc catcaacctc catgctgcgc gctctacccc ggccgccttc ctccgggttc ctacctcaac cggcaacgac gggatacaac ccactacaac ctccttcttc ggactaccag cgcgcccacc caagagcgcc cctaccaaca cctaactatg ccagatattg tttaagccag aacagaccca actggcaata caggacagaa aggtatttca gaaaatcacg tttacagata ggaacgcagt aatcctttcg aacgtggcgc accaacacca gcctacatca aaccaccacc gtgcccttcc cccgggtcct tccctcggca tacgccacct aacgacacca atcccggcca cgcggatggt gacccctact cacaccttca cgcctcctga gtggcccagt atcggctacc cgcaacttcc gccgtcaccc atgcgccagg gtcgccagcg aagaaggtgg atatagattt taatgtacac gaacttcaga actacatcgg tgggtgtact acaccgaact gtatgtggaa gtgtggagga cttaccaggg gggacaaaga ccatggagat tgtacctgcc acacctacga acatcggggc gcaacgcggg acatccaggt acacctacga acgacctgcg tcttccccat acgaccagtc acgccaccaa ccttcacgcg tcgtctactc agaaggtctc cgcccaacga gcaacatgac agggcttcta agcccatgag tggcctacca gccagcccta tcacccagaa
19020 19080 19140 19200 19260 19320 19380 19440 19500 19560 19620 19680 19740 19800 19860 19920 19980 20040 20100 20160 20220 20280 20340 20400 20460 20520 20580 20640 20700 20760 20820 20880
aaagttcctc gggcgcgctc catgaatttc cttcgacgtc cacgcccttc gacggcctgt gccctgcttc ggcctgcgcc cgcctggaac gcgcctcaag caccgaggac ggccgcctgc ccccatggac gtcgccccag cgcccactcc ccgcatgaat agcacatgtt tgccggctct cacttgaact agcttgcgcg ttgggacccg atcagggccg agatcctcgg ggcacgcagc tgctcggagc tgctgcgcct gtggcgcagc ctgcgccccc tgcccgttct ccgtgcaggc ccggtgcact aagcggccca tgcgaccggg accgacctcg gaagtcgacc gtccgagtgc tcggccggca ggctccggcg ctgggcacct atcgtcaaca ccgcgctccc cagatctacc cgctgcatca gggctcttct aagaacccca gtggaaccca gcctactttc caagacatgt tatgccacct cggcgtgccc cggggatcag tgagttgcag cgttctgcgc ggtgcttcac cgttggccat cgggcttgtg tcatgcccgg tgccgccctc ccgcgtcgtg agcggttctg cgctcgccac accgcagctt cccagttctt tcatcgtggt tcatgtggcg gccagaacat ccatggatga accagcccca acgccaccac agcaggagct tcgacaagcg cggccggccg acacctgcta agttcgagta ccctggaaaa gctgcatgtt ccatgaactt ccctgcgccg gctcccaccg aaactgtgtg tctctgaggc cgcgggcagg cagcttcggc ggcgcccagc gcgagagttg gctcgccagc cccgaagggg gttgcaatcg gtacatggcc ggtgaagaag cacgcagcag ggtgatcttg atccatctcg gccctcggcc gtgggcgatc cagggtcttg catccccttc gctctacgcc gtccaccctt ccgcggcgtc ctaaagcccc cagggccatc cttcccggga cgagaccggg cctcttcgac cgagggcctg gtccacccag cctgcacgcc gctgacgggg caaccaggag cgcgcgcatc tatgtgaatg tctgacttta gatacgttgc acggggaggt aggtcgggcg cggtacacgg accgtcgcgt gtcatcttgc cagtgcaggg ttcatgaaag accccacagg cgcgcgtcgt gcccggtcgg atcgtgtgct tcggtgcacc tgggagtgcg ttgctggtga tccagcaact aactccgccc ctctatgttg atcgaggccg gctcttgctt ctccgcgacc ttcatggccc ggcgagcact cccttcgggt ctgcgccgca accgtgcagg ttcgtgcact gtgcccaacg gcgctctacc gagaaggcca ctttattcat tttagaaatc ggaactggta cggggaacga cggagatctt ggttgcagca cggtgatgcc aggtctgccg ggatcagcat cctccagctg acttgctaga tgttggccag ggttctcctt ccttctggat cgtgcagcca agtgcacgaa aggtcagcgg tcatgtccat acgcgctaga tcttcgaagt tctacctgcg cttgcaagat tgggctgcgg cgcacaagct ggctggcctt tctcggacga gcgccctggc gtccgcgctc ggcccgaccg gcatgctcca gcttcctcaa ccgccttcga cataataaac gaaggggttc cttgggcagc gtcgctccac gaaatcgcag ctggaacacc ctccacgtcc ccccatgctg catctgagcc gcggaaggcc gaactggttg ctgcaccacg cagcgcgcgc catcacggtc cagcgcgcag gccctgcagg gatgccgcgg
20940 21000 21060 21120 21180 21240 21300 21360 21420 21480
21540
21600 21660
21720 21780
21840 21900 21960 22020 22080 22140 22200 22260 22320 22380 22440 22500 22560 22620 22680 22740 22800
tgctcctcgt agctggaagg acttccatgc atcttagtcg ttgccgtcct tcctcggcct gtcttgcggg gagttctcgc taggcatgcc ctggcagagc cctccgcggc tcgccaacat ttaaccgccc atggaggaat ctggcagcgc gagagcgagc gtgctcatca gccgaggtgc ccgcgcgtgc ttctacccgg caaaggatcc ggtcccggcg ggtctgggca gagcaccaca cgcacggtcg agcgccgtca caggaccccg tggctgggag gtggtcctgg ctgcgcaagg tgcaagatct aaccgcctgg tcacatacag cggacttcag ccttctccca ccgccgccga tctcggtgat gcctttcgtc gtttcttttt tcaccacgac tcttctgggg cccttccgcg cggccattgt cgccatctgc cgccgcccag ccatcgagat gcttttcagc agcagcaggc agcatctggc ccctcagcgt cccccaagcg tcttcgcggt ccgtctcctg cccgcctacc gcgacgagac gcgccctggt agctgaccca tggaccaggt agagctcgga cgagcagcac tgaccgtgga tcgaggagaa ccaacgtgga ggcagaacgt gtggcagatg gtcgctctcc ggccgaaacg agtcaggggg gcgcacgggg ctcgctgtcc gggcggcaga tatttcttct cagaggcgga ttcgggggtg gttctcctag ccccgccgcc ccccacctcc tgacctgggc cccggaagag tgggctcgag ccgccaaagc ggcggagctc ccagcccaac gcccgaggcc ccgcgccaac tgatatcacc tcgggccgcg ggagttggaa cttcgcctac gctcatcaag cgagggcaag cccccagagc gctggagtgt cctgcactac gctgaccaac gctgcacacc cggcggtaca acgcggtacc atcggcaggc tcgttctcgt ggaaagctga tggctgatgt ggcggcggcg tcttggccgt ggcgacgggc cgctcctggc ggagcaacaa gacgagaacc gacgccgccg tacgtgacgc aaccaccaag catggcgact atcatcgtca agccgcgcct ggcacctgcg ctggccacct cgcacccgcg tccttggaag aacgctctgc ggcgacaacg ccggcgctca cgcgcctcgc cccgtggtca ctggaagagc ctgcgccgct ctcttcaggc ctggtctcct accctgcgcg cctcgccctg gctccatcag tcagggggtt ccagggtctc agcccacggc cttgcaaagg gagacgtgct cgtccgagac tctcgcggtt ggcgctgctc gcatggagac agcagcagca cggccccaga ccgcggagca agcagccaga acctgagcgg aggacgcgct acgagcgcaa agcccaaccc accacctctt ccgacgccct aggttcccaa aaggaagcgg cgcgcctggc acctgccccc ccctctcaga gcgacgagca ggcgcaagct tcttcgccga acgggttcgt acatgggcat gggaggcccg ctcgggcatc cagcgtcatc cttcaccgtc aaacactcgc cgccagctcc cacatgcttg gggcgagcgc cacgcggcgg cggcgggcgg tgactgactt tcagccatcg gaatgaaagc catgcaagag cgaggaggag gcaggaagca ggcagaggac gctcgaccgc cctcttctcg gcgcctcaac tttcaagaac gctcaacctg gatcttcgag agaggagcat ggtgctcaag caaggtcatg ggaggagatg gctggcgcgc catgatggcc cgcggagacc gcgccaggcc cctgcacgag ccgcgactac
22860 22920 22980 23040 23100 23160 23220 23280 23340 23400 23460 23520 23580 23640 23700 23760 23820 23880 23940 24000 24060 24120 24180 24240 24300 24360 24420 24480 24540 24600 24660 24720
atccgcgact cagcagtgcc aaggccctgt ttccccgagc atgttgcaaa tccgcactgc agccactgct gacgtcagca cgctccttgg ttgcaaggcc gcctacttgc gaccaatccc ctggcccaat ggggtctact ccgaggaagc agactgggag ggacagcctg agcagccgcc ctccgctccg cttcccgaac ggggcacaaa ccggcgctac ccgtcacctc gcagaaaacc ggatcgcggc tctatgccat ctctgcgctc ctctcgagga ccgcgcccgc gaccatcatc gggcctggcc gcccgcgatg gcgtctacct tggaggagca ggaccgggtt gcctgcggct actttcgctc cctcggactt acttgctgcg gcgagggtct cctgcaaccc ccggcgaggg gcaagttcgt agccgcccaa tgcaagccat tggaccccca agcaagaagc agcagtcagg caagacagtc gccagaccgt ggtcggggtc cccaccaccc aacgccatcg ctgctcttcc cacagcccct agcggcagca gaacgagccg cttccagcag gctcacccgc cgccgaggct ccacacacgg atgagcaaag gccggcgccg atctcacggg gtacctctgc gaacctgaaa cgacgagcgc gacgctgcgc tttcatcctc cgtgccgctg cctggccaac gctcgagtgc ccagctgctg caaggggggt gcccgaggac ggccgagctg ccagaaatcc gaccggagag tgaaagtgga cagaggagat tggaggagga cgtcctcggc gcggcggccg agaccggtaa tctcctgctt accgcggggt actactgttt gcagcagcta gcgcagaccc agtcgggggc agttgtctgt ctcttcaaca aaaaaggcgg agattcccac cccaggacta tgaatgacat cacacctggc gagctctgca accaccgcct aacgggctgc gaacgctccg accttccgcg tacctggcct cactgccgct agcgagaccc ctcaaactca taccatccct tcggcctgcg cgccaagaat gagctcaacc gctgccgctg ggaagactgg agacgaggtg ggaggagaaa ggcccacagt gaaggagcgg gcaagcctgc gaacttcccc ccaagaagag gaaaatccac gggagctgag aggagcagga atcacaagag agtactgcgc gaattacgtc gccttacatg ctccacccgc ccgcgcccac agacgggcat agctcctgca cggacctggc ccgactttat ggatcctgcc agtgcccccc accactcgga gcaacctctg agatcatcgg ccccggggct tcgagatcag tcatcaccca ttctgctgaa ccagcttccc ccgccggagg gacagcactc gaggaggagg gcaagcagca agatgggacg cagggataca gggggcaaca cgcaacatct gcagaaaccc agcggcggca gaaccggatc actgaaagtc cgaagaccaa gctcactctt accacctgcg tggagctacc atgaactggc cgaaaccaga gggcgtgtgg gaagaacctc cgacctcatc gagccaaagc cgccacctgc gccgctctgg cgtgatcgag cacgccgcac caccttcgag gtggacctcg gttctacgag gggggccatc aaagggccac ccaggatgcc atttggagga aggcagagga cagaggaaga cggataccat agaccgggcg agtcctggcg tctccttcac tgcattacta agcagcagca ggtggactga tttcccaccc aagaaccgtt cttcagcgca aaagagtagc cccttcgccc agccccagat tcagtgccgg tactcctaga
24780 24840 24900 24960 25020 25080 25140 25200 25260 25320 25380 25440 25500 25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 26220 26280 26340 26400 26460 26520 26580 26640
acagtcagcg cctggtgtac cgaagtccag ccgccccgct cgaggtggtg ggggagatct gccccgctcg cttcaacccc cgccatcagc agctcggctt cgagtttgcc gatcgtcgtc cctggtcgag cggcctgcat gcgactactc ggaacgagac tccagggctc gccctgccaa tccccgggac ataccacagc acctttctga ctgggattta gtgggctttt gttgctggtt ggtgctttcg ctgcttgcat cacggtgctg gactcggaac ctctgtcccc catgtgcgac gaacatcgtg gtgcctgagc atcaccgcca caggaaattc ctgactaact cagggtataa agctcttcgc tccttcacgc ggcggcatcg ttctccggct gagtcggtgg cgacacctgg tactttgagc gaagggggcc cgcgagcaag gaaagtcttt cggactcgat cgagctccag tccgatcgcc ccttactttt ctatcagtgc gccgctcccc atctaatact ctacggcccc ggctctctgc taagaaatgg attgtgggac ttcaatcccg atcaagtgcg aatactctcg ggtgctgacg acggtcatgt gtcttctcca attcacatgc cgccccgcca cccagcccac caggtgtcca agcggctggt tgggtctgcg ctcgtcaggc gcactctcca cccccggcca acggctacga accactgccg tgcccgagga tcgactccca gacagaccct gttgtctgct tgtggtgttc ctccagtgta gttgtcaacc tccacccgca gtctcgggac gctactaaca accacccaca tgggaggtgg tacctatacc ggaagatcac tgggcggcgc acaaatgcca gatgggaatg cgtccgtgtg gctccccgcg ggatgagcaa tcgcttacag tcatcgctat tcaccttaat gaccgtacta gctggccggc gatccgaggc acctgacgga cgtcctgact gttcgtggag ctacccggac ttgaatgtcc ccgcttccgc gcaccctcag cctgcttcgg tctgaccctg gtgtactgag ctgctatcaa agccccacaa actgcgacaa gaagcaagct cctgccatca accaaactac ccggaggtga tagggttaat tcccttgctg cctagtgagc ggctgtagtg gctgagtttt cgagaacgtg gcagcccggg caccgtgaac gcagtacgat cctgtgcacg tcgccccaga ccgcgtaatt cttccgcgag ggcgccgccc agaggcacac gtcttccaac ttggagagtt gagttcactc gagttcatcc catggtggcg tgcttcgctc ggcccggccc attttcagcc tactgcatct tataataaaa ccggtccctg gaagtatctc cgacggagtc ccagctcttc caccttccac ccaccaacgc gctccgaggt agcgctaggc ttcgtactta tgcggtgtgc aaggaggaga cagcccgatg agaatcgagt gaccccgagt aatactttca atgtggcccc gcgctaatca aataatgccg ggcccgccgc acgcccaggc tgtgtcgtca agctcaacga tcgccggatc cgtcctcgca cctcggtcta cgaacttcga cggctgacct gggatctcgc acggagtgcg agcgtccgat gcaaccaccc gctgagatca ttcttcaccg acctggctgt ctgctgagcg caacccttcc ctgatcccga caccgtcgcg cgaccaacct ctagttgcgg gtggtgctgt tggtggcggt aggccgatcc gcaatcggtg acaataacaa ggtacaccgt tttttgcgca ccacgaagga ccgctatcgt aaaaagagaa
26700 26760 26820 26880 26940
27000 27060 27120 27180 27240
27300 27360
27420 27480 27540 27600 27660 27720 27780 27840 27900 27960 28020 28080 28140 28200 28260 28320 28380 28440 28500 28560
acagccataa actatttttt tatgctggtt tggtatgata cgtagtggaa cactattctg gtcacagtat cacactaaac acaactacag ctaaccttac acttccaatg atgttgatca aacgacaagc ctaggccttt gttactatta tggtattgct aaaacctcaa aatgtcacga attttttaca cacaccacac cacggagatt gtcagcggca tttgcttgct gtttaatttt gcattgtttt ctctagtggg aagacatttg ctaatgccac ggtatgaatc ccaccacaca caaccacttt gtgcagcgcc cacgtttttt tgggccttgt ctaattctgt aaagtaacac ttttttttaa gtacttacta tggatccaac ctaaaactac aggctaccac agaccactaa aggagatacc tcgccttgtg tggaacactt ttagtttttc ccactggttc attttggaac actctaaaat aagcatatgg aagtggaagt acacagaaca cctttgctgt ttgtcggtgt gctatagaag ttccagagcc tagtgctggg catcagtggt cgattggaat ccaagatcag ccataacatg gatgcccact ttatacatca tcagccccag cacacacctt gggtactagc attacctggg gccagtcaca atgtaatcat tggaaccaat tactcctaga caagaaaacc cagcacaaca tgatttgatc cagatccatg catggtgtac actaagtgtt tatcattacc taattataca tgacactgat ctctaattat tggcagttat ggttgatccc aacaccagag caatacccct gctttcggga gctttaccga atgaaggcag tttttgaaaa caaaatgtca gtcactgtgt aatggtaggt tttatctatg acacacagtt actcagcata gctttggctt tttcagacca agcacttttc catcaatcac ctctgcaagg aataatatta tttaacataa acaactacaa actgtcaaaa cttgctgcca gccctgttgc attggcatta tatgccttct gaattttaat tctactcttt ctgaaagggc caaactgaat caatgcaatg tcttgccctg actactccac gcagcagaag acacccgatc ttagcagtca caaaaatcag ttagcgctct atcttaccat gctggctaaa atacatgtaa ttaagggcca acgtcactgt ctaccactac tgaccaccac tgatagctgc tggcctctgt agcatataaa accagaaagt gtcatcaaac cactactttc aacaggacac aacccacaac ctacaacaac ctacacacac aaaaggggga ttgttgctgt gctacagaaa tttttagaac gtgaatcagt caccctcagg tatgcaattt gcactgatct gacaaaacac cgcccaccac cagagttggc agcggtgtcc taatcatctg acccactgct agttttttgt ttatgaaggt ataccatcta tggagttaac gagtttcact catcagaaat taccatgcaa tacagcagca acaacctagt tactgcccta caaaactgtt ttcatggtac acccataaac aattacaaag ttactatagt tactaagagg taggaccacc acacactgag taacagcacc agtggtgtgc gcacagactg catgaagatc ggataaagat tatgctttcg tcaaaaaggc gatactactc tgaggatatg cacaactact cttccaggtt ggggctgctc catgttcatt gaacctctat tctttgattg gagaatgcca gatgggtgga ctcaccatta agaaataatg gagactgcca accacacaga aagccaagta acaactacta
28620 28680 28740 28800 28860 28920 28980 29040 29100 29160 29220 29280 29340 29400 29460 29520 29580 29640 29700 29760 29820 29880 29940 30000 30060 30120 30180 30240 30300 30360 30420 30480
ggaccaatga ccagtgcctt ctactactac gcatgcaatg tctactacat tcgttgacgg cttttacagt tgcctcctcc gggcccttcg gtctgcctgc ctgcgccacc taagcatgcg acccccggtc ggaaattcct ttgggatcgt actttggttg agcaacctca tagactatga ccggcggaga gacggccgcg gccgtcaagg ctggtgaaac gagctcctgc acccagcagt gtccacactc cccccttatc atcatattga caggtctctg ctgcaggccc ctgtccctca gatgacttcg aaccccccct gcagactact ctctagcacc tcctagcccc gcagatcacc cttctgccgc gcaaccggag atggtgattg aagtctgtgc cctcctacgt ttatcacctt acccccagta ggctctgcta ccccactcag caaatgctac gaacattctg gaactcgcca ggcacacgca ggccgagcca tgactgaccc cctcggagca agctgcagga aggccaagat agcagcgcca cgggcgatac tgatcaagac cagtgaaata tgatttgagt tccatgtttt cggcgggctg atcttcattt accccgtcta tcgtctcttc gattttttgt gccaatctct gctcctcttc ctgctcattg cgcattccca ccgcttcagg aactatgatt caccctcgct gctctttgcc cttccagttc ccgcgaccag cttctcgcgc tcccccgagg cgccaaaaat gcctgcaccc gaggcgctct ctaccaccac cagcgaccca actggccaac gcgactcgcc cggcatagcc ctcctacgag gaagttcacc caaggggtgc cctctgcggc aagatcatat ttaataaaaa ctgccaacac caaacttcct tatcttctat cccctacgat agatggattc ccactgtcga cctcgctttc ccactcccct tgatcgggtt acgcgcaccg tggaaggggg cctagacaat ctggtggcca ttcgtcacct attgactgga cgagtggcgc ttctgctgtt aggtccgcaa cagacatgca tcatctcctt atctcccgcc cacagcctag tgctccccgc aacaacgtca caacttcgca atccaccagt gtcacccaga tgcctggtcg atccactgct ctccgcgacc tgatgatgat ataaagaatc cacttcactc ccacacgctg cagatgtcca gcagacaacg caagagaagc gagccacacc ctctacacca gaagcaaact ggtcattctg caagccggtc tctaaggaat tcttgatcac acgccagtcc gcatctgctg tctttgtgcg ggctgctcag agtgctcccc atgcaaattc tcccagctgg tgtgatttac tgaacctgac gccacaatac tattagttac acgaccttct ttcgccagca gcaagaaagg ccgaccatcg gagtcaaccc cctgcgactc tcctccccat tttacagaaa acttacttga ccctcttccc aaggggatgt aaaagcgcgt caccgaccgt ccctgggggt acagctacct atcagtcccg gaggacagcg gccgtgttgc tacaagccca cttctcttct tattcttatc agactgtatt ctgtagcata catcgcctac gctcctctga cgtcccgtca caagaaccct atcatgatca ccctgctttg acaccaccac atgcccatat ttcaatctaa cctggacatg gcaggagaga catcttctgc cctctcctac catcgtcatc ccccgactgc gaactaatca taaagataca aatctgatac agctctggta caaattcctc ccgggtggat gcccttcatc gctgtccctg
30540 30600 30660 30720 30780 30840 30900 30960 31020 31080 31140 31200 31260 31320 31380 31440 31500 31560 31620 31680 31740 31800 31860 31920 31980 32040 32100 32160 32220 32280 32340 32400
cgactggccg gtggacctcg ctcagttttt ggaaaattat acactagctt ttagtctctc ttgcatgtta tttgaagatg acagaaacag tttgacagta acaacacctg ctttgcttga agtggaaacc gatgcaaacg cagggagata aaagcttatc atgaatggag agcaacagta gcaacatttg cccaccctgc taaaataaag ttcctccacc tctgaacgcc gagccagtct cacagctcaa agaagagcgg gccccgcagc cagggactcc gcagcagcgc gttgttcaac acccacgtgg gctgcccatg accccgtcac actcctcggg ccaacaacac ccttacaagt taggttttgg cacttacatt caacaggaga gagccatagc gtgttgatga caggagccat atccatcgcc ctaaatgtgg taaaccccat gtgttctttt gcatagatgg caaagtcaca atgtttcaaa catattcaat gggctaactc atgccaaccc ttcaagtgtt ctcccaggac attggtgatg cgggtcggtc cagctgagga cggtgggaat agtcgctgtc ctcagcatga atgcggatct agtccatagt ccgtcgtacc tacatgatct caccaagaac aaaactcatc catttccctt ttctccacca atcaggttta tgatactgat tgcaattgaa aaccaacatt tgcttaccca aatggctggt aaactgtcaa tagtcaaata tactggcacc aacagaacat cactccatat aagttctact acctatgctt gtcattttca ttataccttc ttcccacccc ttattgattc atggaataca gacatgcttt agggagatga ttgtcctcgg catagtccgc gccgccgctc tgcccacggc cgctcaggtc tcaacacgct agatcctcag ccttgggcat ggggaaatca tccaacacgg aacatggatc ttaaatatac ggactccgtg ggaaacataa agcaacataa ggaaatgggt atccaagtta aacaaagaag atactcgcag ctggccactg gtaagcagtg tctacactaa accaatgctg actaaaaata ctcactataa tacacctgga tcatacatcg actctgtgga aacagtttta ccaccctctc tggtctccac aaccctccgg tggtcgggat gaacgggatc cgtcaagctg cctcagcatc gctgcagtac ccagccgaaa gtaaatcaag gtggcggttc ccctcaagct ccaccaaggc acccctttta tgagaacaag gctctgcctt agcttacctt gctgggctaa tagagtttgg aacttggatc acgataaact aaaatgatgc tgtcagtctt ctcaggtgtt aaaaatactg taggattcat atatagtagg ccctcaatgg ctaatggaag cccaagaatg aaaaactctg caggattcga cccccgcaca gttccacaca gcactcccgc cacggttatc ggccggtggt ctgctcaggg agtcgtctgg gtgcaacaca ctcatcgcgg tggcgccccc accacctccc gggagagggg
cgccgcccct cactaaagat cattctaaac ggcagtacag agacagaggt aggtttaaaa aagcagtagt tggccttagc cactttgtgg aaaactaaca agttgtagga tctacgtttt ggggtatagg gcccaattta gcaagtatac tactgatgac ctatgttgga aacactgtat aaacacaaaa gcagttattt gccttgaaca gtttcagagc atctgcacct tggaagaagc gtcgcatcag ggtccgggtc tgcggcgggc ggaccaccag gaaggatgct tccagaacac ggtaccacat
32460 32520 32580 32640 32700 32760 32820 32880 32940 33000 33060 33120 33180 33240 33300 33360 33420 33480 33540 33600 33660 33720 33780 33840 33900 33960 34020 34080 34140 34200 34260 34320
caccctctgg cccgcccgcc ctcgtacccg gctcatgcat ggggaactct attgtgcatg gcgggtctcg cgcggctgat tgctgtagca tggaacgctc gggcctcagg tggaatgggc agggaagaac aatgaagatc ggtcaaaggt gcacatccag tgttacactc ctagttcctg ccggcattct cagattgaca taactgtaag aagattaggg tgcaagactg aaaatcgccc tagagcctcg gctgatctgt gtaaatcgtt attgtcgcta tcgacaagat gaagcaataa aagcacaaaa agcccccgat ttgaacatgc atgcagcgaa tggatcatct ctcttcagca tgcaggacag gacagggtat gtctcctcac cgtgctcgcg gaacctggtc ggtgttgaag agtgatgaaa cagacccagc aggaagaacc gcggagatgg gatacggttc aaacaagaca ctgcaccatc aggtaaatcc taagcacacc agcggaatat tactctttca caagccacag ctataagcat aggcaatttt ggaacaacga agaaaaaaca ctttccagca tgattgaaaa gaatacaccc ggcactacaa ttctcaggtg ccctccaggt agccccggat gagaccccgg gggagctgaa ctctcagctc cgaaccccgc cgcaatcagg agcgtggtaa accgtgtcat cgggcgctgc ttgtaaaaca atcccatcat cagatgatgc atgattaact cacctctcgc tcgagatgtt atagcgaaag cccagataat aagccagcca ctcataattc caaactctct tatcctctcc tacagataaa gctggctaga taagaaaatc tggagtaaat aaaatgaaca ccaggcaggc ccatcacaga ccggaacatt tgctcagtct cgtacaaaat acacatacaa gatcctgcgg gtcccggcaa caagtctatg ctcgggggtc agaacagggc cagcaccggg gggggccggc gatgcagttg acaccgatcg gccactctct gcctgatagc aattttgttg tttaatccaa ccccgctgtg ccacggtggc cgggagggtt tttcattttt tgataaagag caagatattc gccgcgatcc gaaattttta ccgaagtcct cccggtgata aacaaaagaa gcaagcggtg ttaaaccatg cacggggtct gagacgttcc ggcgtccgcg caagtccagc gtaattactc agcctcagcg aaccacaggg tggcaatgga ttggcacagc aaaaccatat aatcctcgca tgatcctcca cgatacgggt ctttcggaca ccggcggcgg cagaccgtgc tctgatcaca ggtttcggta acggtctcgg ttggtggaaa ttccagcaaa ctctaattcc ccagccttga ctcgcgcaga tgctcctggt ctaagctcct gccataggac ccccagtgag tcttccagat aaatcctcca cgttccagca ctagcctggc ccggcacgac cggtggccgg agtgaaaaaa aaagcgatgc ccctcctgca tccatagctt ccagcaccgc ggacccaccg acaggcacac cccagggcac cagaacttac ccagggaagc gatggcggga ttttcgtact tcccggcgct agcagatcta tcgaccaccg acggcggggg agcacttcaa ataacagcca gcctccacgc tcaatcatca atgattcgaa gcgccctcca tcacctgcag ccctcagcaa cgccaggaat cattgccaaa aactggacag ggtgcacgtt tggttagtta gaacaggtgg cctcgtaaaa cgtgaatgat agcgcccgag catgcggatg caggcagcaa accgagcagc
34380 34440
34500 34560
34620 34680 34740 34800 34860 34920 34980 35040
35100 35160
35220 35280 35340 35400 35460 35520 35580 35640 35700 35760 35820 35880 35940 36000 36060 36120 36180 36240
agcagcagca cacaacaggc gcaagagtca gagaaaggct gagctctaac ctgtccaccc 36300
gctctctgct caatatatag cccagatcta cactgacgta aaggccaaag tctaaaaata 36360
cccgccaaat agtcacacac gcccagcaca cgcccagaaa ccggtgacac actcaaaaaa 36420
atacgcgcac ttcctcaaac gcccaaactg ccgtcatttc cgggttccca cgctacgtca 36480
tcaaaacacg actttcaaat tccgtcgacc gttaaaaacg tcacccgccc cgcccctaac 36540
ggtcgcccgt ctctcagcca atcagcgccc cgcatcccca aattcaaaca cctcatttgc 36600
atattaacgc gcaccaaaag tttgaggtat attattgatg atg 36643
<210> 15
<211> 540
<212> PRT
<213> Pan troglodytes
<400> 15
Met Met Arg Arg Val Tyr Pro Glu Gly Pro Pro Pro Ser Tyr Glu Ser
1 5 10 15
Val Met Gln Gln Ala Val Ala Ala Ala Met Gln Pro Pro Leu Glu Ala
20 25 30
Pro Tyr Val Pro Pro Arg Tyr Leu Ala Pro Thr Glu Gly Arg Asn Ser
35 40 45
Ile Arg Tyr Ser Glu Leu Ala Pro Leu Tyr Asp Thr Thr Arg Leu Tyr
50 55 60
Leu Val Asp Asn Lys Ser Ala Asp Ile Ala Ser Leu Asn Tyr Gln Asn
65 70 75 80
Asp His Ser Asn Phe Leu Thr Thr Val Val Gln Asn Asn Asp Phe Thr
85 90 95
Pro Thr Glu Ala Ser Thr Gln Thr Ile Asn Phe Asp Glu Arg Ser Arg
100 105 110
Trp Gly Gly Gln Leu Lys Thr Ile Met His Thr Asn Met Pro Asn Val
115 120 125
Asn Glu Phe Met Tyr Ser Asn Lys Phe Lys Ala Arg Val Met Val Ser
130 135 140
Arg Lys Thr Pro Asn Gly Val Thr Val Gly Asp Asp Tyr Asp Gly Ser
145 150 155 160
Gln Asp Glu Leu Thr Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly
165 170 175
Asn Phe Ser Val Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Ile
180 185 190
Asp Asn Tyr Leu Ala Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp
195 200 205
Ile Gly Val Lys Phe Asp Thr Arg Asn Phe Arg Leu Gly Trp Asp Pro
210 215 220
Val Thr Glu Leu Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His
225 230 235 240
Pro Asp Ile Val Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Glu Ser
245 250 255
Arg Leu Ser Asn Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu
260 265 270
Gly Phe Gln Ile Leu Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala
275 280 285
Leu Leu Asp Val Glu Ala Tyr Glu Glu Ser Lys Glu Lys Ala Glu Ala
290 295 300
Glu Ala Thr Thr Ala Val Ala Thr Ala Ala Thr Val Ala Asp Ala Thr
305 310 315 320
Val Thr Arg Gly Asp Thr Phe Ala Thr Gln Ala Glu Glu Ala Ala Ala
325 330 335
Leu Ala Ala Thr Asp Asp Ser Glu Ser Lys Ile Val Ile Lys Pro Val
340 345 350
Glu Lys Asp Ser Lys Asn Arg Ser Tyr Asn Val Leu Pro Asp Gly Lys
355 360 365
Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr Asn Tyr Gly Asp Pro
370 375 380
Glu Lys Gly Val Arg Ser Trp Thr Leu Leu Thr Thr Ser Asp Val Thr
385 390 395 400
Cys Gly Val Glu Gln Val Tyr Trp Ser Leu Pro Asp Met Met Gln Asp
405 410 415
Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser Asn Tyr Pro Val Val
420
425
430
Gly Ala Glu Leu Leu Pro Val Tyr Ser Lys Ser Phe Phe Asn Glu Gln
435 440 445
Ala Val Tyr Ser Gln Gln Leu Arg Ala Phe Thr Ser Leu Thr His Val
450 455 460
Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Val Arg Pro Pro Ala Pro
465 470 475 480
Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala Leu Thr Asp His Gly
485 490 495
Thr Leu Pro Leu Arg Ser Ser Ile Arg Gly Val Gln Arg Val Thr Val
500 505 510
Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val Tyr Lys Ala Leu Gly
515 520 525
Val Val Ala Pro Arg Val Leu Ser Ser Arg Thr Phe
530 535 540
<210> 16
<211> 958
<212> PRT
<213> Pan troglodytes
<400> 16
Met Tyr Val Arg Arg Pro Glu Gly Gly Arg Gly Ala Ser Pro Ser Cys
1 5 10 15
Lys Met Ala Thr Pro Ser Met Leu Pro Gln Trp Ala Tyr Met His Ile
20 25 30
Ala Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe
35 40 45
Ala Arg Ala Thr Asp Thr Tyr Phe Ser Leu Gly Asn Lys Phe Arg Asn
50 55 60
Pro Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg
65 70 75 80
Leu Thr Leu Arg Phe Val Pro Val Asp Arg Glu Asp Asn Thr Tyr Ser
85 90 95
Tyr Lys Val Arg Tyr Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp
100 105 110
Met Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro
115 120 125
Ser Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys
130 135 140
Gly Ala Pro Asn Thr Ser Gln Trp Lys Asp Ser Asp Ser Lys Met His
145 150 155 160
Thr Phe Gly Val Ala Ala Met Pro Gly Val Val Gly Lys Lys Ile Glu
165 170 175
Ala Asp Gly Leu Pro Ile Gly Ile Asp Ser Ser Ser Gly Thr Asp Thr
180 185 190
Ile Ile Tyr Ala Asp Lys Thr Phe Gln Pro Glu Pro Gln Val Gly Ser
195 200 205
Asp Ser Trp Val Asp Thr Asn Gly Ala Glu Glu Lys Tyr Gly Gly Arg
210 215 220
Ala Leu Lys Asp Thr Thr Asn Met Lys Pro Cys Tyr Gly Ser Phe Ala
225 230 235 240
Arg Pro Thr Asn Lys Glu Gly Gly Gln Ala Asn Ile Lys Asp Ser Glu
245 250 255
Thr Ala Ser Thr Thr Pro Asn Tyr Asp Ile Asp Leu Ala Phe Phe Asp
260 265 270
Ser Lys Asn Ile Ala Ala Asn Tyr Asp Pro Asp Ile Val Met Tyr Thr
275 280 285
Glu Asn Val Glu Leu Gln Thr Pro Asp Thr His Ile Val Phe Lys Pro
290 295 300
Gly Thr Ser Asp Glu Ser Ser Glu Ala Asn Leu Gly Gln Gln Ala Met
305 310 315 320
Pro Asn Arg Pro Asn Tyr Ile Gly Phe Arg Asp Asn Phe Ile Gly Leu
325 330 335
Met Tyr Tyr Asn Ser Thr Gly Asn Met Gly Val Leu Ala Gly Gln Ala
340 345 350
Ser Gln Leu Asn Ala Val Val Asp Leu Gln Asp Arg Asn Thr Glu Leu
355 360 365
Ser Tyr Gln Leu Leu Leu Asp Ser Leu Gly Asp Arg Thr Arg Tyr Phe
370 375 380
Ser Met Trp Asn Gln Ala Val Asp Ser Tyr Asp Pro Asp Val Arg Ile
385 390 395 400
Ile Glu Asn His Gly Val Glu Asp Glu Leu Pro Asn Tyr Cys Phe Pro
405 410 415
Leu Asn Gly Val Gly Phe Thr Asp Thr Tyr Gln Gly Val Lys Val Lys
420 425 430
Thr Asp Thr Ala Ala Thr Gly Thr Asn Gly Thr Gln Trp Asp Lys Asp
435 440 445
Asp Thr Thr Val Ser Thr Ala Asn Glu Ile His Ser Gly Asn Pro Phe
450 455 460
Ala Met Glu Ile Asn Ile Gln Ala Asn Leu Trp Arg Asn Phe Leu Tyr
465 470 475 480
Ala Asn Val Ala Leu Tyr Leu Pro Asp Ser Tyr Lys Tyr Thr Pro Ala
485 490 495
Asn Ile Thr Leu Pro Thr Asn Thr Asn Thr Tyr Asp Tyr Met Asn Gly
500 505 510
Arg Val Val Ala Pro Ser Leu Val Asp Ala Tyr Ile Asn Ile Gly Ala
515 520 525
Arg Trp Ser Leu Asp Pro Met Asp Asn Val Asn Pro Phe Asn His His
530 535 540
Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met Leu Leu Gly Asn Gly Arg
545 550 555 560
Tyr Val Pro Phe His Ile Gln Val Pro Gln Lys Phe Phe Ala Ile Lys
565 570 575
Ser Leu Leu Leu Leu Pro Gly Ser Tyr Thr Tyr Glu Trp Asn Phe Arg
580 585 590
Lys Asp Val Asn Met Ile Leu Gln Ser Ser Leu Gly Asn Asp Leu Arg
595 600 605
Thr Asp Gly Ala Ser Ile Ala Phe Thr Ser Ile Asn Leu Tyr Ala Thr
610 615 620
Phe Phe Pro Met Ala His Asn Thr Ala Ser Thr Leu Glu Ala Met Leu
625 630 635 640
Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn Asp Tyr Leu Ser Ala Ala
645 650 655
Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala Thr Asn Val Pro Ile Ser
660 665 670
Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg Gly Trp Ser Phe Thr Arg
675 680 685
Leu Lys Thr Arg Glu Thr Pro Ser Leu Gly Ser Gly Phe Asp Pro Tyr
690 695 700
Phe Val Tyr Ser Gly Ser Ile Pro Tyr Leu Asp Gly Thr Phe Tyr Leu
705 710 715 720
Asn His Thr Phe Lys Lys Val Ser Ile Thr Phe Asp Ser Ser Val Ser
725 730 735
Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro Asn Glu Phe Glu Ile Lys
740 745 750
Arg Thr Val Asp Gly Glu Gly Tyr Asn Val Ala Gln Cys Asn Met Thr
755 760 765
Lys Asp Trp Phe Leu Val Gln Met Leu Ala His Tyr Asn Ile Gly Tyr
770 775 780
Gln Gly Phe Tyr Val Pro Glu Gly Tyr Lys Asp Arg Met Tyr Ser Phe
785 790 795 800
Phe Arg Asn Phe Gln Pro Met Ser Arg Gln Val Val Asp Glu Val Asn
805 810 815
Tyr Lys Asp Tyr Gln Ala Val Thr Leu Ala Tyr Gln His Asn Asn Ser
820 825 830
Gly Phe Val Gly Tyr Leu Ala Pro Thr Met Arg Gln Gly Gln Pro Tyr
835 840 845
Pro Ala Asn Tyr Pro Tyr Pro Leu Ile Gly Lys Ser Ala Val Ala Ser
850 855 860
Val Thr Gln Lys Lys Phe Leu Cys Asp Arg Val Met Trp Arg Ile Pro
865 870 875 880
Phe Ser Ser Asn Phe Met Ser Met Gly Ala Leu Thr Asp Leu Gly Gln
885 890 895
Asn Met Leu Tyr Ala Asn Ser Ala His Ala Leu Asp Met Asn Phe Glu
900 905 910
Val Asp Pro Met Asp Glu Ser Thr Leu Leu Tyr Val Val Phe Glu Val
915 920 925
Phe Asp Val Val Arg Val His Gln Pro His Arg Gly Val Ile Glu Ala
930 935 940
Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly Asn Ala Thr Thr
945 950 955
<210> 17
<211> 425
<212> PRT
<213> Pan troglodytes
<400> 17
Met Ser Lys Lys Arg Val Arg Val Asp Asp Asp Phe Asp Pro Val Tyr
1 5 10 15
Pro Tyr Asp Ala Asp Asn Ala Pro Thr Val Pro Phe Ile Asn Pro Pro
20 25 30
Phe Val Ser Ser Asp Gly Phe Gln Glu Lys Pro Leu Gly Val Leu Ser
35 40 45
Leu Arg Leu Ala Asp Pro Val Thr Thr Lys Asn Gly Glu Ile Thr Leu
50 55 60
Lys Leu Gly Glu Gly Val Asp Leu Asp Ser Ser Gly Lys Leu Ile Ser
65 70 75 80
Asn Thr Ala Thr Lys Ala Ala Ala Pro Leu Ser Phe Ser Asn Asn Thr
85 90 95
Ile Ser Leu Asn Met Asp His Pro Phe Tyr Thr Lys Asp Gly Lys Leu
100 105 110
Ser Leu Gln Val Ser Pro Pro Leu Asn Ile Leu Arg Thr Ser Ile Leu
115 120 125
Asn Thr Leu Ala Leu Gly Phe Gly Ser Gly Leu Gly Leu Arg Gly Ser
130 135 140
Ala Leu Ala Val Gln Leu Val Ser Pro Leu Thr Phe Asp Thr Asp Gly
145 150 155 160
Asn Ile Lys Leu Thr Leu Asp Arg Gly Leu His Val Thr Thr Gly Asp
165 170 175
Ala Ile Glu Ser Asn Ile Ser Trp Ala Lys Gly Leu Lys Phe Glu Asp
180 185 190
Gly Ala Ile Ala Thr Asn Ile Gly Asn Gly Leu Glu Phe Gly Ser Ser
195 200 205
Ser Thr Glu Thr Gly Val Asp Asp Ala Tyr Pro Ile Gln Val Lys Leu
210 215 220
Gly Ser Gly Leu Ser Phe Asp Ser Thr Gly Ala Ile Met Ala Gly Asn
225 230 235 240
Lys Glu Asp Asp Lys Leu Thr Leu Trp Thr Thr Pro Asp Pro Ser Pro
245 250 255
Asn Cys Gln Ile Leu Ala Glu Asn Asp Ala Lys Leu Thr Leu Cys Leu
260 265 270
Thr Lys Cys Gly Ser Gln Ile Leu Ala Thr Val Ser Val Leu Val Val
275 280 285
Gly Ser Gly Asn Leu Asn Pro Ile Thr Gly Thr Val Ser Ser Ala Gln
290 295 300
Val Phe Leu Arg Phe Asp Ala Asn Gly Val Leu Leu Thr Glu His Ser
305 310 315 320
Thr Leu Lys Lys Tyr Trp Gly Tyr Arg Gln Gly Asp Ser Ile Asp Gly
325 330 335
Thr Pro Tyr Thr Asn Ala Val Gly Phe Met Pro Asn Leu Lys Ala Tyr
340 345 350
Pro Lys Ser Gln Ser Ser Thr Thr Lys Asn Asn Ile Val Gly Gln Val
355 360 365
Tyr Met Asn Gly Asp Val Ser Lys Pro Met Leu Leu Thr Ile Thr Leu
370 375 380
Asn Gly Thr Asp Asp Ser Asn Ser Thr Tyr Ser Met Ser Phe Ser Tyr
385 390 395 400
Thr Trp Thr Asn Gly Ser Tyr Val Gly Ala Thr Phe Gly Ala Asn Ser
405 410 415
Tyr Thr Phe Ser Tyr Ile Ala Gln Glu 420 425
<210> 18 <211> 30971
<212> DNA
<213> Artificial Sequence
<220>
<223> M72-ChAd63 construct <400> 18
catcatcaat aatatacctc aaacttttgg tgcgcgttaa tatgcaaatg aggtgtttga 60
atttggggat gcggggcgct gattggctga gagacgggcg accgttaggg gcggggcggg 12 0
tgacgttttg atgacgtggc cgtgaggcgg agccggtttg caagttctcg tgggaaaagt 180
gacgtcaaac gaggtgtggt ttgaacacgg aaatactcaa ttttcccgcg ctctctgaca 240
ggaaatgagg tgtttctggg cggatgcaag tgaaaacggg ccattttcgc gcgaaaactg 300
aatgaggaag tgaaaatctg agtaattccg cgtttatggc agggaggagt atttgccgag 360
ggccgagtag actttgaccg attacgtggg ggtttcgatt accgtatttt tcacctaaat 420
ttccgcgtac ggtgtcaaag tccggtgttt ttacggatat cccattgcat acgttgtatc 480
catatcataa tatgtacatt tatattggct catgtccaac attaccgcca tgttgacatt 540
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 600
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 660
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 720
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 780
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 840
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 900
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 960
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1020
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 1080
gtaggcgtgt acggtgggag gtctatataa gcagagctct ccctatcagt gatagagatc 1140
tccctatcag tgatagagat cgtcgacgag ctcgtttagt gaaccgtcag atcgcctgga 1200
gacgccatcc acgctgtttt gacctccata gaagacaccg ggaccgatcc agcctccgcg 1260
gccgggaacg gtgcattgga acgcggattc cccgtgccaa gagtgagatc ttccgtttat 1320
ctaggtacca gatatcgcca ccatgaccgc cgccagcgac aacttccagc tgtctcaggg 1380
cggccagggc ttcgccatcc ctatcggcca agctatggcc attgctggac agatcagaag 1440
cggcggaggc agccctaccg tgcatatcgg ccctaccgcc ttcctgggcc tgggcgtggt 1500
ggacaacaac ggcaacggcg ccagagtgca gcgggtggtc ggatctgccc ctgccgcaag 1560
cctgggcatc agcaccgggg atgtgatcac cgccgtggat ggcgccccta tcaacagcgc 1620
cacagccatg gccgacgccc tgaatggaca ccaccccggc gacgtgatca gcgtgacctg 1680
gcagaccaag agcggaggca ccagaaccgg caacgtgaca ctggccgagg gacctcccgc 1740
cgagttcatg gtggatttcg gcgccctgcc ccccgagatc aactccgcca ggatgtatgc 1800
cggccctggc agcgcctctc tggtggccgc tgctcagatg tgggacagcg tggccagcga 1860
tctgttcagc gccgcctccg ccttccagtc cgtggtctgg ggcctgaccg tgggcagctg 1920
gatcggaagc agtgccggcc tgatggtggc tgccgcctct ccctacgtgg cctggatgtc 1980
agtcacagcc ggccaggccg aactgactgc cgctcaagtg cgagtggctg ctgctgccta 2040
tgagacagcc tacggcctga cagtgccccc acccgtgatc gccgagaacc gggccgagct 2100
gatgatcctg atcgccacca acctgctggg ccagaacacc cccgccattg ccgtgaacga 2160
ggccgagtac ggcgagatgt gggcccagga cgccgctgcc atgtttggct atgccgctgc 2220
tacagccacc gccactgcca ccctgctgcc cttcgaagag gcccccgaga tgacctctgc 2280
cggcggactg ctggaacagg ccgctgccgt ggaagaggcc agcgacacag ccgccgctaa 2340
ccagctgatg aacaacgtgc cccaggccct gcagcagctg gcacagccta cacagggcac 2400
caccccttct agcaagctcg gcggcctgtg gaaaaccgtg tccccccacc ggtcccccat 2460
cagcaacatg gtgtccatgg ccaacaacca catgagcatg accaacagcg gcgtgtccat 2520
gaccaatacc ctgagcagca tgctgaaggg ctttgcccca gccgctgccg ctcaggctgt 2580
gcagacagct gctcagaatg gcgtgcgggc catgagcagc ctgggcagtt ccctgggcag 2640
ctctggactg ggagggggcg tggccgccaa tctgggcaga gccgctagcg tgggcagcct 2700
gtctgtgcct caagcctggg ctgctgccaa tcaggccgtg acaccagccg ctagagccct 2760
gcctctgacc agcctgacct ctgctgccga gaggggccct ggccagatgc tgggaggact 2820
gcctgtgggc cagatgggag ccagagccgg cggaggactg agcggcgtgc tgagagtgcc 2880
ccccagaccc tacgtgatgc cccactctcc cgccgctggc gatattgccc ctcccgccct 2940
gagccaggac agattcgccg acttccctgc cctgcccctg gatccttctg ccatggtggc 3000
tcaagtggga ccccaggtgg tgaacatcaa caccaagctg ggctacaaca acgccgtggg 3060
agccggcacc ggcatcgtga tcgaccccaa tggcgtggtg ctgaccaaca atcacgtgat 3120
cgctggcgcc accgacatca acgccttcag cgtgggctcc ggccagacct acggcgtgga 3180
cgtggtcgga tacgaccgga cccaggatgt ggccgtgctg cagctgagag gcgctggcgg 3240
actgccttct gccgccattg gaggcggagt ggccgtggga gaacctgtgg tggccatggg 3300
caatagcggc ggacagggcg gcacacctag agctgtgcct ggaagagtgg tggccctggg 3360
acagaccgtg caggccagcg atagcctgac aggcgccgag gaaaccctga acggcctgat 3420
ccagttcgac gccgccatcc agcctgggga tgctggcgga cctgtggtga acggactggg 3480
ccaggtggtc ggaatgaata ccgccgcctc ctaatagtga gcggccgcga tctgctgtgc 3540
cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag 3600
gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta 3660
ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag 3720
acaatagcag gcatgctggg gatgcggtgg gctctagata tcagcgatcg cgtgagtagt 3780
gtttgggggt gggtgggagc ctgcatgatg ggcagaatga ctaaaatctg tgtttttctg 3840
tgtgttgcag cagcatgagc ggaagcgcct cctttgaggg aggggtattc agcccttatc 3900
tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa tgtgatggga tccacggtgg 3960
acggccggcc cgtgcagccc gcgaactctt caaccctgac ctacgcgacc ctgagctcct 4020
cgtccgtgga cgcagctgcc gccgcagctg ctgcttccgc cgccagcgcc gtgcgcggaa 4080
tggccctggg cgccggctac tacagctctc tggtggccaa ctcgagttcc accaataatc 4140
ccgccagcct gaacgaggag aagctgttgc tgctgatggc ccagctcgag gccctgaccc 4200
agcgcctggg cgagctgacc cagcaggtgg ctcagctgca ggcggagacg cgggccgcgg 4260
ttgccacggt gaaaaccaaa taaaaaatga atcaataaat aaacggagac ggttgttgat 4320
tttaacacag agtcttgaat ctttatttga tttttcgcgc gcggtaggcc ctggaccacc 4380
ggtctcgatc attgagcacc cggtggatct tttccaggac ccggtagagg tgggcttgga 4440
tgttgaggta catgggcatg agcccgtccc gggggtggag gtagctccat tgcagggcct 4500
cgtgctcggg ggtggtgttg taaatcaccc agtcatagca ggggcgcagg gcgtggtgct 4560
gcacgatgtc tttgaggagg agactgatgg ccacgggcag ccccttggtg taggtgttga 4620
cgaacctatt gagctgggag ggatgcatgc ggggggagat gagatgcatc ttggcctgga 4680
tcttgagatt ggcgatgttc ccgcccagat cccgccgggg gttcatgttg tgcaggacca 4740
ccagcacggt gtatccggtg cacttgggga atttgtcatg caacttggaa gggaaggcgt 4800
gaaagaattt ggagacgccc ttgtgaccgc ccaggttttc catgcactca tccatgatga 4860
tggcgatggg cccgtgggcg gcggcctggg caaagacgtt tcgggggtcg gacacatcgt 4920
agttgtggtc ctgggtgagc tcgtcatagg ccattttaat gaatttgggg cggagggtac 4980
ccgactgggg gacaaaggtg ccctcgatcc cgggggcgta gttcccctcg cagatctgca 5040
tctcccaggc cttgagctcg gaggggggga tcatgtccac ctgcggggcg atgaaaaaaa 5100
cggtttccgg ggcgggggag atgagctgcg ccgaaagcag gttccggagc agctgggact 5160
tgccgcagcc ggtggggccg tagatgaccc cgatgaccgg ctgcaggtgg tagttgaggg 5220
agagacagct gccgtcctcg cggaggaggg gggccacctc gttcatcatc tcgcgcacat 5280
gcatgttctc gcgcacgagt tccgccagga ggcgctcgcc ccccagcgag aggagctctt 5340
gcagcgaggc gaagtttttc agcggcttga gcccgtcggc catgggcatt ttggagaggg 5400
tctgttgcaa gagttccaga cggtcccaga gctcggtgat gtgctctagg gcatctcgat 5460
ccagcagacc tcctcgtttc gcgggttggg gcgactgcgg gagtagggca ccaggcgatg 5520
ggcgtccagc gaggccaggg tccggtcctt ccagggtcgc agggtccgcg tcagcgtggt 5580
ctccgtcacg gtgaaggggt gcgcgccggg ctgggcgctt gcgagggtgc gcttcaggct 5640
catccggctg gtcgagaacc gctcccggtc ggcgccctgc gcgtcggcca ggtagcaatt 5700
gagcatgagt tcgtagttga gcgcctcggc cgcgtggccc ttggcgcgga gcttaccttt 5760
ggaagtgtgt ccgcagacgg gacagaggag ggacttgagg gcgtagagct tgggggcgag 5820
gaagacggac tcgggggcgt aggcgtccgc gccgcagctg gcgcagacgg tctcgcactc 5880
cacgagccag gtgaggtcgg ggcggtcggg gtcaaaaacg aggtttcctc cgtgcttttt 5940
gatgcgtttc ttacctctgg tctccatgag ctcgtgtccc cgctgggtga caaagaggct 6000
gtccgtgtcc ccgtagaccg actttatggg ccggtcctcg agcggggtgc cgcggtcctc 6060
gtcgtagagg aaccccgccc actccgagac gaaggcccgg gtccaggcca gcacgaagga 6120
ggccacgtgg gaggggtagc ggtcgttgtc caccagcggg tccaccttct ccagggtatg 6180
caagcacatg tccccctcgt ccacatccag gaaggtgatt ggcttgtaag tgtaggccac 6240
gtgaccgggg gtcccggccg ggggggtata aaagggggcg ggcccctgct cgtcctcact 6300
gtcttccgga tcgctgtcca ggagcgccag ctgttggggt aggtattccc tctcgaaggc 6360
gggcatgacc tcggcactca ggttgtcagt ttctagaaac gaggaggatt tgatattgac 6420
ggtgccgttg gagacgcctt tcatgagccc ctcgtccatc tggtcagaaa agacgatctt 6480
tttgttgtcg agcttggtgg cgaaggagcc gtagagggcg ttggagagca gcttggcgat 6540
ggagcgcatg gtctggttct tttccttgtc ggcgcgctcc ttggcggcga tgttgagctg 6600
cacgtactcg cgcgccacgc acttccattc ggggaagacg gtggtgagct cgtcgggcac 6660
gattctgacc cgccagccgc ggttgtgcag ggtgatgagg tccacgctgg tggccacctc 6720
gccgcgcagg ggctcgttgg tccagcagag gcgcccgccc ttgcgcgagc agaagggggg 6780
cagcgggtcc agcatgagct cgtcgggggg gtcggcgtcc acggtgaaga tgccgggcag 6840
gagctcgggg tcgaagtagc tgatgcaggt gcccagatcg tccagacttg cttgccagtc 6900
gcgcacggcc agcgcgcgct cgtaggggct gaggggcgtg ccccagggca tggggtgcgt 6960
gagcgcggag gcgtacatgc cgcagatgtc gtagacgtag aggggctcct ggaggacgcc 7020
gatgtaggtg gggtagcagc gccccccgcg gatgctggcg cgcacgtagt cgtacagctc 7080
gtgcgagggc gcgaggagcc ccgtgccgag attggagcgc tgcggctttt cggcgcggta 7140
gacgatctgg cggaagatgg cgtgggagtt ggaggagatg gtgggcctct ggaagatgtt 7200
gaagtgggca tggggcagtc cgaccgagtc cctgatgaag tgggcgtagg agtcctgcag 7260
cttggcgacg agctcggcgg tgacgaggac gtccagggcg cagtagtcga gggtctcttg 7320
gatgatgtcg tacttgagct ggcccttctg cttccacagc tcgcggttga gaaggaactc 7380
ttcgcggtcc ttccagtact cttcgagggg gaacccgtcc tgatcggcac ggtaagagcc 7440
caccatgtag aactggttga cggccttgta ggcgcagcag cccttctcca cggggagggc 7500
gtaagcttgc gcggccttgc gcagggaggt gtgggtgagg gcgaaggtgt cgcgcaccat 7560
gactttgagg aactggtgct tgaagtcgag gtcgtcgcag ccgccctgct cccagagctg 7620
gaagtccgtg cgcttcttgt aggcggggtt gggcaaagcg aaagtaacat cgttgaagag 7680
gatcttgccc gcgcggggca tgaagttgcg agtgatgcgg aaaggctggg gcacctcggc 7740
ccggttgttg atgacctggg cggcgaggac gatctcgtcg aagccgttga tgttgtgccc 7800
gacgatgtag agttccacga atcgcgggcg gcccttgacg tggggcagct tcttgagctc 7860
gtcgtaggtg agctcggcgg ggtcgctgag cccgtgctgc tcgagggccc agtcggcgac 7920
gtgggggttg gcgctgagga aggaagtcca gagatccacg gccagggcgg tctgcaagcg 7980
gtcccggtac tgacggaact gctggcccac ggccattttt tcgggggtga cgcagtagaa 8040
ggtgcggggg tcgccgtgcc agcggtccca cttgagctgg agggcgaggt cgtgggcgag 8100
ctcgacgagc ggcgggtccc cggagagttt catgaccagc atgaagggga cgagctgctt 8160
gccgaaggac cccatccagg tgtaggtttc cacatcgtag gtgaggaaga gcctttcggt 8220
gcgaggatgc gagccgatgg ggaagaactg gatctcctgc caccagttgg aggaatggct 8280
gttgatgtga tggaagtaga aatgccgacg gcgcgccgag cactcgtgct tgtgtttata 8340
caagcgtccg cagtgctcgc aacgctgcac gggatgcacg tgctgcacga gctgtacctg 8400
ggttcctttg acgaggaatt tcagtgggca gtggagcgct ggcggctgca tctggtgctg 8460
tactacgtcc tggccatcgg cgtggccatc gtctgcctcg atggtggtca tgctgacgag 8520
cccgcgcggg aggcaggtcc agacctcggc tcggacgggt cggagagcga ggacgagggc 8580
gcgcaggccg gagctgtcca gggtcctgag acgctgcgga gtcaggtcag tgggcagcgg 8640
cggcgcgcgg ttgacttgca ggagcttttc cagggcgcgc gggaggtcca gatggtactt 8700
gatctccacg gcgccgttgg tggcgacgtc cacggcttgc agggtcccgt gcccctgggg 8760
cgccaccacc gtgccccgtt tcttcttggg cggcggcggc tccatgctta gaagcggcgg 8820
cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg cggcaggggc 8880
acgtcggcgc cgcgcgcggg caggttctgg tactgcgccc ggagaagact ggcgtgagcg 8940
acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac gggacccgtg 9000
agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac ggcggcctgc 9060
cgcaggatct tcgatctcct ttggagatgc ctgtagacca tcgacgtggc gtggcgatgt acgtcgccca aactgggagt atggtggcgc tcctcctcca ctgcgtcgcc cggcgacgca ccgccgcgca acgatgcatc tccacgggat ctgagcccgg gtgatgaagt ttgggcccgg ctggcgaggt gcgcggccgt gcgacgacgc tcgaagtcga acggaccagt taggcgcgcg aggaagtgcg gcgaggtcct ccggcggcgg ggcaggaagt ctctagacat aagcgaacgg cagctaacgt tacggaggcg cttgcacgtc cctcctgaag ggcccatgag cggctccgtc gcgtgaagac gctcggtgac gggcttccaa tgcgcgccga gcacctcgcg ctaacatctc ggcggcgcac tggtctcggt tctccaggtg ttatcaattg ccgaaaaccg tttcttgttc tgaagtaggc cttgctggat ccttgtagta gcatgcgcgt gctcggcgag cgaagcggtg tgacggtctg tgtcgaagat gcggcggctg cgagcatgag tggtggaggc agttcatggt acgggcaaaa gttgggctgc ggtactggca ggtcgttttt gcccgagttg gtctccgcgg ctgcgagaag ggggtcgcgc cgcgtagttg gaagaagtac gcgctccatg gacggtcaac ctcgaaggcc ttctacttcc gggcagacgg gacggcgcgc gccgccgggg acccgtaggg ctgaacgaag ttcgggtatt ggtcctgaga gcgcagacgg gtcctgcatg gagcccgaac gatggcctgc gtaggctccg gtggccgggg gtagtcgttg gcggtagagc gcggtggtag gcgcgggaac ggccgcggtc acgaaagcgg gcgtgtaccc ctcccgtctc tggccttggt tcctggtagg ccggcgcgct gcgttcatgc gcgcgcatga cagaggcgct atgatccagc gcctcgtaga tcctcctcca ccggggggct tcctcaggag tcgatgaagc ccgtcctcgc gggtctccgt actccgcgca gcttcgagcc tggtcgggag cggcggatgg tcggccatgc agccgctcca ccgcgctgcg tggatctggg gtgttgatgg cgcacgagct caggtgcgca ggccatcgct ccgtagatgt tcgcggacgc tggcccgtga tcagcggctc cggttcgaat gacccaagcc cgctggtcat cgatctcggt cgacggtggc cggcctcgtt ccacctgggc ggtagaggta ggcggagcgg agtccacggc gaagacggat cctcttccat gcggcggcgg gctcgatggt ggggccgcag tgggcaggga aggacctgag agtcgcagtc gcgggcgggc tggcgaggag cccaggcgtg cgggcacctc gctggacgag tgagggtggt tgtaggagca cgtggtactt cgaggtactg cggtggcggg acctggacat ggttccagat ggcgcgcgca gactccgtgg ctcgaatcag tgctaacgaa gaaaaactag catgaactgc cgcgaggtcg ccagacgcgg gaggttgagc gttgagcgtg catctcgctg gaagttgaaa gagctcggcg ttcctcctct gggaggggcc ctccccgcgc cgtgaagacg gagggcgctg cgtctcgaga gcaaggtagg gatgctgctg caccaggtcc gtcctgacac ctcctcgccc cgccaggtcg ctggaagtcg gttggccatg gaggcgcgag gtatccgacg ggcgccgggc ccaggtgatg gttgcgcagc gtcgtggatg cctggaggct gctggagccg acctccagga taagcgcgga
9120 9180 9240
9300 9360
9420 9480 9540 9600 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980
aagcggccgc tgcggtgtgc gggcgtggct gcgagcccct cccccaccct cccgccccag tcagtatgac ggagcggcac gaacctgttc cgcggggcgg cgaggcggac ggtcacggcg ccacgtgcgc cctgctggag ggtggtgcag gcccgagggc gcgcgggctg caagtactac gatcgatggg ggtgtaccgc cgaccaggag gagctacttt tgccggcggc ggaagactga cctgatcccg gattggaccc agacagcagc tcgaacccca atccgcggcg aacagcacca tcgcagcgcg ttcctgagca ccgcgatggc cccggttcga gccccgtcgt ctttttttct ccaccacaac cagcagcagc ctggccttgg ccgcgcgtgc agagacagga gagctgcggc gagctgacgg tacgagcaga acgctgatcg gccatcgtgc cacagtcggg cgctggctcc ccgctgtccg gctaggaaga ttttacatgc aacgacagga ctgatgcaca gacatgggcg gtgccctacg tggcgcgacc cgatgcgggc aggccatgca ctcaggccaa cgcacgagaa acgaggccgg acgtgcagac agcggttcca cgcagcccgc tcgctgccgt gcctcagcgc ttccaagacc tgtgtttttg cgcccctacc cagccactac aagagggcga agatgaaaag gcggcgagga gcggcctgga ggatcagccc ccgtgaagga cgcgcgagga agaaccccac acaacgagac tggacctggt agaagctggc tctacaagac gcatgaccct tgcaccgcgc gcctgcagcg cggacctgcg tggaggaggt gtatttttgc ggcgctgcag acgcatcatg ccggctctcg ggtgctggcc gctggtgtac gaacctggac ccgcgagtcg caacgtgccc agtctggaga tcggcgccgg ccttagccag ccagatgcat gcagcagcag cgcggcggcc ggggctggcg ggacgctcgc gcccgaggag ccgaaagcgg cgcgcgcgcg ggagagcaac ggtgaccctg gagcaagccg gttcagggag gaacattctg ggccatcaac cccgtacgtg gaaagtgctg ggtgagcgcc ggccctgacc ctggcagccc ggacgatgag tagatgcagc agccagccgt gcgctgacga gccatcctgg atcgtgaacg aacgcgctgc cgcatggtga aacctgggct cggggccagg aagaatcgcc ccggattccg ccgacttctc cccgtactgc caacagccgg gccgtgagcg cggctggggg gaggcctacg atgcgcgcct gtgctgaggg cacgtggccg ttccaaaaat ggcctgatgc ctgacggcgc gcgctgctga cagagcatcg ttctcggtgc cccatagaca accctgagcg agccgccggc ggggccggga agccgccggg gaggaggagg aacagccacc ccggcattaa cccgcaatcc aggccgtggt cgctggtgga tggagcgcgt ccgacgtgcg ccatggtggc aggactacac agggttgcgt cggctaacgt cagttacgga ggcagatgcg cgcttctgcc gagccggcgt cgtcgtcgcc tgcccaagca cccgcttcca acgaggattt cggccaacct ccttcaacaa acctgtggga agctgtttct atatcaccga tggtgcagga tgagcctggg aggaggtgaa acgatctggg gcgagctgag ccgaggggga ccttggaagc gcgagtacct gccgccgcct ctcctcggac cgaagccttt gccctcgcgc gaacaaggcc ggcccgctac cgaggcggtg gctgaacgcc caacttcatc
11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900
agcgcgctgc gactacttct aagaacttgc agcctgctga ggcagcgtga gggcaggcgc ggccaggagg cagaagatcc cagcagagcg atgaccgcgc ctgatggact ttgaacccgc cccaacgacg accaccaccg cgcgcgggtg tcgctgaaca gaggaggagt aacgggatag agggacgagc cggggactgg gggagtggtg gaatctgaaa tctgttgttt gagagcgtga gtgcccccgc gcacccttgt tcgctgaact ttcaccccca ggccagctga aacaagttca gatgattatg gagggcaact ggctgatggt tccagaccag agggactgtg cgccgaactc gccgcgactc acgtggacga acccgggcaa cgccccagta tggggctgtt gcaacatgga acttgcatcg actggctccc ggttcctgtg tgtggaagaa ctgccgcggc gcgtgcgcag acctgaacga agagcctggt cccgagctag tgtgggacga gtggtaaccc aaataaaaga gtagtagtat tgcagcaggc ggtacctggc acgataccac accagaacga cggaggccag aaaccatcat aggcgcgggt atggtagtca tctcggtgac ggccgaggtg tcgccagggc gggcgtgcag gcgcctgctg gtacctgggc gcagacctac cctggaggcc cgcgctgagc cttgatgcag gcccagcatg ggcggccgcc gccgcccggg ggacgacgtg agagggcggg ggtgcccgag cagcgagctg ctccttgttg ggacaagatg cagcgcaggc tgaggattcc gttcgctcac cggtactcac gatgaggcgc ggtggcggcg gcctacggag ccggttgtac ccacagcaac cacccagacc gcacaccaac gatggtctcg ggacgagctg catgaccatc ccccagagcg ttgcagaccg gccccggtcg ctgctgctgg tacctgctta caggagatca accctgaact accgaggagg gagggggcca tacgcccgca atgaactcgg ttctacacgg gacagcagcg gaccggcggc gctgccagcc ggtcggctga aagcccgagc agccgctgga acccgtagac gccgacgaca ctgcgccccc caaggccatg gtgtacccgg gcgatgcagc gggcggaaca ctggtggaca ttcctgacca atcaactttg atgcccaacg cgcaagaccc acctacgagt gatctgatga aggtgtacca tgaacctgag gggaccgcgc tggcgccctt acctgtaccg cccacgtgag tcctgctgac agcgcatcct cgcccagcgc accgcccgtt actactttac gcgagtacga tgttctcgcc cgtcctcggc ccttcccgag cgcggccgcg gcgagaagaa agacgtacgc gccagcggca gcagcgtgtt gtatcgggcg gcgaccagcg agggtcctcc ccccgctgga gcattcgtta acaagtcggc ccgtggtgca acgagcgctc tgaacgagtt ccaacggggt gggtggagtt acaacgccat gtcggggccg ccaggctttc gacggtgtcg cacggacagc cgaggccatc ccgcgcgctg caaccggtcg gcgctacgtg cgcgctcgac catcaataag caacgccatc catgcccgac gcggcccacc gctgtccggt cctgcccttt cctgctgggc cttccccaat gcacgagcac cgacaggcag ggacttgggt cctgatgtaa tgcgttcttc tccctcgtac ggcgccttac ctcggagctg ggacatcgcc gaacaacgat gcggtggggc catgtacagc cacggtaggg tgagctgccc catcgacaac
12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820
tacttggcgg acgcgcaact accaacgagg gagagccgcc cagatcctgt tatgaagaaa actgtggcag gccgccctag gacagcaaga tggtacctgg accacctcgg caagacccgg gagctcctgc ctgcgtgcct gtccgcccgc cacgggaccc gccagacgcc ctctcgagcc tggggcctgc cccgtgcgcg tcgcgcacca cccgccgccg cgccggtacg cccgccatgc atgctcaggg cgcgcggcca gtgtactggg cgcacttgaa agcgcaaata cggcggtgaa aggaggaaga agtggcgcgg tggggcggca tccggctggg ccttccaccc tcagcaacct acgaggacct gtaaggaaaa atgccactgt cggcgaccga acaggagcta cctacaacta acgtcacctg tcaccttccg ccgtctactc tcacctcgct ccgcgcccac tgccgctgcg gcacctgccc gcaccttcta gcgcgcccag tgcgcgggca ccgtcgacga cgcccgcctc cccgcgccaa gcgcggcgcg cggccagacg cggcggcggc tgcgcgacgc gatgctgact caaggaagag ggaggaaaga tgacggactg gcggaaagtg gaacggggtg ctgggacccc cgacatcgtc gctgggcatc
ggaggggggc
agcagaggct caccaggggc tgatagtgaa caacgttcta cggcgacccc cggcgtggag ctccacgcga caagagcttc cacgcacgtc cattaccacc cagcagtatc ctacgtctac aaaaatgtcc caagatgtac cttccgcgct cgtgatcgac caccgtggac gagccggcgg agccttgctg cgcggcctcc ggcggccatc cgccaccggt tcgcgatgtt atgctccagg aagccccgca gtggagtttg aaaccggtgc ctggagagcg gtgaccgagc ctgctgcccg cgcaagcggc aacatccccg gaggcaacta gatacattcg agtaagatag ccggatggaa gagaagggcg caagtctact caagttagca ttcaacgagc ttcaaccgct gtcagtgaaa cggggagtcc aaggccctgg attctcatct ggaggcgctc ccctggggcg caggtggtgg gccgtcatcg cggcgcatcg cgcagggcca ggcagcagca gccagcatgt gtgcgcgtgc gatgtgtccc tcatcgcgcc aactgaagcg tgcgcgagtt tgcggcccgg acatcggcgt tggtgatgcc gctgcggcgt agcccttcca cgctcttgga cagccgtggc ccacccaggc tcatcaagcc agaacaccgc tgcgctcctg ggtcgctgcc actacccggt aggccgtcta tccccgagaa acgttcctgc agcgcgtgac gcgtagtcgc cgcccagtaa gccaacgctc ccctcaaggg ccgacgcgcg acagcgtggt cccggcggca ggcgcacggg gcgccggcag cccgcccgcg ccgtgcgcac agcggcgagg tgagatctac ggtcaaaaag cgccccccgg caccacggtg gaagttcgac gggcgtgtac ggacttcacc ggagggcttc tgtcgaagcc taccgccgcg ggaggaagca ggtggagaag ctaccgcagc gacgctgctc cgacatgatg ggtgggcgcc ctcgcagcag ccagatcctc tctcacagat cgtcactgac gccgcgcgtc taacaccggt cacgcaacac ccgcgtgcgc caactacacg ggccgacgcg ccggagcacc acgcagggcc gacccgcaga gcgcggcaac ccgcccccct aggatgtcca ggccccgcgg gacaaaaagg cggcgcgtgc gtcttcacgc
14880 14940 15000 15060 15120 15180 15240
15300 15360 15420 15480 15540 15600 15660
15720 15780
15840 15900 15960 16020 16080 16140 16200 16260 16320 16380 16440 16500 16560 16620 16680 16740
ccggcgagcg acatcctcga ccgcgccctt gcctgaagcc agcgcgaggg agctggagga tgcggcccat ccacggagcc tgcagacgga acggcgcggc cgggctaccg ccacccgccg gagtgtatcg tcgccattta cccattacgg cgtcgccatc cccgcgctga gcggtgcagg tggactgacg ccctggcacc gccaactgaa ggtccacgct gggaaaagct tcaacggggt acgcggtccc tggacaagcg cggacgagcc tggcgcctct acttgcctcc tcgcgtcgcg tcgtgggtct gcttaacttg ttccggctcc gcaggcggtc gaaagaggag ggtgaccctg cggcgaggat cgtgctggag caagcaggtg catggaaacg tccctggatg cagcctgctg cggcacgcgc ccgtcgtcgc cagcgggcgc actaccgcct gctaccgagg accaccggcg tccccatcat cctctcagcg ctcctggtcc gcgacacggc cgggggcgcc caaaacctat gaaagagcag ggtggacctg gcccgcgggg cggcgacaag gcccccgtac ggccaccggg gcctgcttcc cgccccccga gggagtgcag cttgtctgtg gcctccaagc gagcgtctgg gcggtgtcca cagcaggtgc ctgtacccga cacatgaagg gccccgggcc cagaccgagc ccagcggctt atgcccaact ttctaccgcg agccgccgca gagcctctga cctacttgca aagaaagccg gcggcgcgcc cgccgcggcg ccactgagac tgtgatgtgt acgcggccgt ttcaattgga ggcaacaagg aacttccagc gccaaccagg tccgtggaga cgaccgcgtc gaggaggcgg gtgctgaaac cgcccctcca ggccgccccc agtgtgaagc tgtgtatatg gctcctacga gcgagtttgc tcccgctgga tgccgagcgc ccatgcagct tggaccccga tgggcgtgca ccgtgaagcc ccaccaccac acgcgctgca gctacaccag gcagcaccgc ccctgccgcg gatatggccc cgccgtagaa atcagcaagc atcggggcga acaaaaaagc gtttttagat ttatgggcac gcagtctctg cgtggaacag agaaggtggt ccgtgcagaa tgccccaggt ccgacgcgga tgaaactggg ccagcagcag cagtggctaa aggcgaactg gccgccgctg tatgtccgcc cgaggtgtac ttacggcaag ccacggcaac ggcgccgcgc gatggtgccc ggtgcagccc gaccgtggac cagcaccagc cactcgccga tccttccatc cagccgccgc gacttccgcc cgcgcgctac tcacatgccg ggctgacggg
ggttgggggg
tccccggcat atggatttgt ggaagacatc ctggagcgac gagcgggctt cagcacaggg cgatggcctg acagatcaac ggaggaggag ggagacgctg tctgcccacc cagccagccc gcccctgccg gcagagcact ctattaaaag gaccagaagg ggggacgagg cgcagccgcc cccacgccga cggggcttca aagcgccaga gaggtcaagg atcaagatcc accatggagg agacgcaagt atccccacgc cgcaagacca ttggtgcgga cacccgagca cctccgcgtc gaacgggctg aggcttcctg agcttccgtg aataaaaaaa aatttttcgt atcggcaaca aagaatttcg caggcgctga gcctcgggca agccgcctgg ctgcctcccc ctgacgcaca acgcggcccg gcgaccctgg ccggtggccg ctgaacagca acactgtagc aggaagaggc
16800 16860 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180 18240 18300 18360 18420 18480 18540 18600 18660
gcgtcgccga atcgccggac acagacacct gatgtgacca gacaacacct gacatggcca ccctactccg tggaaggatt ggtaaaaaaa accataattt gtcgacacca atgaagccct ataaaagatt gacagcaaaa gagttgcaaa gaagccaatt aactttatcg gcctcccagc ctcttgcttg gacagctatg aattattgct aagacagata gtcagcactg gccaacctgt aagtacacgc ggccgcgtgg ctggacccca cgctccatgc tttttcgcca cgcaaggacg gcctccatcg accgcctcca gttgcaagat aggacgcttc acttcagtct ccgaccgcag actcgtacaa gcacctactt gcaccgccta ccgacagcaa tagaagccga atgctgataa atggtgcaga gctacggttc ctgaaactgc atattgcagc ctccagatac tgggccagca ggctcatgta taaatgctgt actctctggg accccgatgt tccctttgaa cagccgctac ccaatgagat ggcggaactt cggccaacat tggcgccctc tggacaacgt tcctgggcaa tcaagagcct tcaacatgat ccttcaccag cgctcgaggc ggccacccca ggagtacctg ggggaacaag ccagcggctg agtgcgctac tgacatccgc caacagccta aatgcatact tggtctgcct aactttccaa ggaaaaatat ttttgccagg cagcactact taactacgat tcatattgtg ggccatgccc ctacaacagc ggtggacttg tgacagaacc gcgcattatt tggtgtaggc tggtaccaat ccactcaggc cctctacgcg cacgctgccg gctggtggac caaccccttc cgggcgctac cctgctcctg cctgcagagc catcaacctc catgctgcgc tcgatgctgc agtccgggtc tttaggaacc acgctgcgct acgctggccg ggcgtgctgg gctcccaagg tttggagttg attggaatag ccagagccac ggaggtagag cctaccaaca cctaactatg ccagatattg tttaagccag aacagaccca actggcaata caggacagaa aggtatttca gaaaatcacg tttacagata ggaacgcagt aatcctttcg aacgtggcgc accaacacca gcctacatca aaccaccacc gtgcccttcc cccgggtcct tccctcggca tacgccacct aacgacacca cccagtgggc tggtgcagtt ccacggtggc tcgtgcccgt tgggcgacaa atcggggccc gagcgcccaa ctgccatgcc attcatcctc aggttggaag ctcttaagga aagaaggtgg atatagattt taatgtacac gaacttcaga actacatcgg tgggtgtact acaccgaact gtatgtggaa gtgtggagga cttaccaggg gggacaaaga ccatggagat tgtacctgcc acacctacga acatcggggc gcaacgcggg acatccaggt acacctacga acgacctgcg tcttccccat acgaccagtc gtacatgcac cgcccgcgcc gcccacgcac ggaccgcgag ccgcgtgctg cagcttcaaa cacctcacag cggtgttgtt tggaactgac tgacagttgg cactacaaac acaggctaac ggcattcttt agaaaatgtt tgaaagttca gttcagagac ggctggtcag gtcctaccag tcaggcggtg tgaactcccc tgttaaagtt tgataccaca caacatccag cgactcctac ttacatgaac gcgctggtcg cctgcgctac gccccaaaag gtggaacttc cacggacggg ggcgcacaac cttcaacgac
18720 18780 18840 18900 18960 19020 19080 19140 19200 19260 19320 19380 19440 19500 19560 19620 19680 19740 19800 19860 19920 19980 20040 20100 20160 20220 20280 20340 20400 20460 20520 20580
tacctctcgg tccatcccct cgcgagacgc ccctacctcg gactcctccg aagcgcaccg ttcctggtcc ggctacaagg gtggacgagg tcgggcttcg tacccctacc tgcgaccggg accgacctcg gaagtcgacc gtccgagtgc tcggccggca ggctccggcg ctgggcacct atcgtcaaca ccgcgctccc cagatctacc cgctgcatca gggctcttct aagaacccca gtggaaccca gcctactttc caagacatgt tatgccacct cggcgtgccc cggggatcag tgagttgcag cgttctgcgc cggccaacat cgcgcaactg cctcgctcgg acggcacctt tcagctggcc tcgacggaga agatgctggc accgcatgta tcaactacaa tcggctacct cgctcatcgg tcatgtggcg gccagaacat ccatggatga accagcccca acgccaccac agcaggagct tcgacaagcg cggccggccg acacctgcta agttcgagta ccctggaaaa gctgcatgtt ccatgaactt ccctgcgccg gctcccaccg aaactgtgtg tctctgaggc cgcgggcagg cagcttcggc ggcgcccagc gcgagagttg gctctacccc ggccgccttc ctccgggttc ctacctcaac cggcaacgac gggatacaac ccactacaac ctccttcttc ggactaccag cgcgcccacc caagagcgcc catccccttc gctctacgcc gtccaccctt ccgcggcgtc ctaaagcccc cagggccatc cttcccggga cgagaccggg cctcttcgac cgagggcctg gtccacccag cctgcacgcc gctgacgggg caaccaggag cgcgcgcatc tatgtgaatg tctgacttta gatacgttgc acggggaggt aggtcgggcg cggtacacgg atcccggcca cgcggatggt gacccctact cacaccttca cgcctcctga gtggcccagt atcggctacc cgcaacttcc gccgtcaccc atgcgccagg gtcgccagcg tccagcaact aactccgccc ctctatgttg atcgaggccg gctcttgctt ctccgcgacc ttcatggccc ggcgagcact cccttcgggt ctgcgccgca accgtgcagg ttcgtgcact gtgcccaacg gcgctctacc gagaaggcca ctttattcat tttagaaatc ggaactggta cggggaacga cggagatctt ggttgcagca acgccaccaa ccttcacgcg tcgtctactc agaaggtctc cgcccaacga gcaacatgac agggcttcta agcccatgag tggcctacca gccagcccta tcacccagaa tcatgtccat acgcgctaga tcttcgaagt tctacctgcg cttgcaagat tgggctgcgg cgcacaagct ggctggcctt tctcggacga gcgccctggc gtccgcgctc ggcccgaccg gcatgctcca gcttcctcaa ccgccttcga cataataaac gaaggggttc cttgggcagc gtcgctccac gaaatcgcag ctggaacacc cgtgcccatc cctcaagacc gggctccatc catcaccttc gttcgaaatc caaggactgg cgtgcccgag ccgccaggtc gcacaacaac ccccgccaac aaagttcctc gggcgcgctc catgaatttc cttcgacgtc cacgcccttc gacggcctgt gccctgcttc ggcctgcgcc cgcctggaac gcgcctcaag caccgaggac ggccgcctgc ccccatggac gtcgccccag cgcccactcc ccgcatgaat agcacatgtt tgccggctct cacttgaact agcttgcgcg ttgggacccg atcagggccg
20640 20700 20760 20820 20880 20940 21000 21060 21120 21180 21240 21300 21360 21420 21480 21540 21600 21660 21720 21780 21840 21900 21960 22020 22080 22140 22200 22260 22320 22380 22440 22500
ggtgcttcac cgttggccat cgggcttgtg tcatgcccgg tgccgccctc ccgcgtcgtg agcggttctg cgctcgccac accgcagctt cccagttctt tcatcgtggt tcacatacag cggacttcag ccttctccca ccgccgccga tctcggtgat gcctttcgtc gtttcttttt tcaccacgac tcttctgggg cccttccgcg cggccattgt cgccatctgc cgccgcccag ccatcgagat gcttttcagc agcagcaggc agcatctggc ccctcagcgt cccccaagcg tcttcgcggt ccgtctcctg gctcgccagc cccgaagggg gttgcaatcg gtacatggcc ggtgaagaag cacgcagcag ggtgatcttg atccatctcg gccctcggcc gtgggcgatc cagggtcttg gtggcagatg gtcgctctcc ggccgaaacg agtcaggggg gcgcacgggg ctcgctgtcc gggcggcaga tatttcttct cagaggcgga ttcgggggtg gttctcctag ccccgccgcc ccccacctcc tgacctgggc cccggaagag tgggctcgag ccgccaaagc ggcggagctc ccagcccaac gcccgaggcc ccgcgccaac accgtcgcgt gtcatcttgc cagtgcaggg ttcatgaaag accccacagg cgcgcgtcgt gcccggtcgg atcgtgtgct tcggtgcacc tgggagtgcg ttgctggtga cggcggtaca acgcggtacc atcggcaggc tcgttctcgt ggaaagctga tggctgatgt ggcggcggcg tcttggccgt ggcgacgggc cgctcctggc ggagcaacaa gacgagaacc gacgccgccg tacgtgacgc aaccaccaag catggcgact atcatcgtca agccgcgcct ggcacctgcg ctggccacct cgcacccgcg cggtgatgcc aggtctgccg ggatcagcat cctccagctg acttgctaga tgttggccag ggttctcctt ccttctggat cgtgcagcca agtgcacgaa aggtcagcgg cctcgccctg gctccatcag tcagggggtt ccagggtctc agcccacggc cttgcaaagg gagacgtgct cgtccgagac tctcgcggtt ggcgctgctc gcatggagac agcagcagca cggccccaga ccgcggagca agcagccaga acctgagcgg aggacgcgct acgagcgcaa agcccaaccc accacctctt ccgacgccct ctccacgtcc ccccatgctg catctgagcc gcggaaggcc gaactggttg ctgcaccacg cagcgcgcgc catcacggtc cagcgcgcag gccctgcagg gatgccgcgg ctcgggcatc cagcgtcatc cttcaccgtc aaacactcgc cgccagctcc cacatgcttg gggcgagcgc cacgcggcgg cggcgggcgg tgactgactt tcagccatcg gaatgaaagc catgcaagag cgaggaggag gcaggaagca ggcagaggac gctcgaccgc cctcttctcg gcgcctcaac tttcaagaac gctcaacctg agatcctcgg ggcacgcagc tgctcggagc tgctgcgcct gtggcgcagc ctgcgccccc tgcccgttct ccgtgcaggc ccggtgcact aagcggccca tgctcctcgt agctggaagg acttccatgc atcttagtcg ttgccgtcct tcctcggcct gtcttgcggg gagttctcgc taggcatgcc ctggcagagc cctccgcggc tcgccaacat ttaaccgccc atggaggaat ctggcagcgc gagagcgagc gtgctcatca gccgaggtgc ccgcgcgtgc ttctacccgg caaaggatcc ggtcccggcg
22560 22620 22680 22740 22800 22860 22920 22980
23040 23100 23160 23220
23280 23340 23400 23460 23520 23580 23640 23700 23760 23820 23880 23940 24000 24060 24120 24180 24240 24300 24360 24420
cccgcctacc gcgacgagac gcgccctggt agctgaccca tggaccaggt agagctcgga cgagcagcac tgaccgtgga tcgaggagaa ccaacgtgga ggcagaacgt gcgtctacct tggaggagca ggaccgggtt gcctgcggct actttcgctc cctcggactt acttgctgcg gcgagggtct cctgcaaccc ccggcgaggg gcaagttcgt agccgcccaa tgcaagccat tggaccccca agcaagaagc agcagtcagg caagacagtc gccagaccgt ggtcggggtc cccaccaccc aacgccatcg tgatatcacc tcgggccgcg ggagttggaa cttcgcctac gctcatcaag cgagggcaag cccccagagc gctggagtgt cctgcactac gctgaccaac gctgcacacc gtacctctgc gaacctgaaa cgacgagcgc gacgctgcgc tttcatcctc cgtgccgctg cctggccaac gctcgagtgc ccagctgctg caaggggggt gcccgaggac ggccgagctg ccagaaatcc gaccggagag tgaaagtgga cagaggagat tggaggagga cgtcctcggc gcggcggccg agaccggtaa tctcctgctt tccttggaag aacgctctgc ggcgacaacg ccggcgctca cgcgcctcgc cccgtggtca ctggaagagc ctgcgccgct ctcttcaggc ctggtctcct accctgcgcg cacacctggc gagctctgca accaccgcct aacgggctgc gaacgctccg accttccgcg tacctggcct cactgccgct agcgagaccc ctcaaactca taccatccct tcggcctgcg cgccaagaat gagctcaacc gctgccgctg ggaagactgg agacgaggtg ggaggagaaa ggcccacagt gaaggagcgg gcaagcctgc aggttcccaa aaggaagcgg cgcgcctggc acctgccccc ccctctcaga gcgacgagca ggcgcaagct tcttcgccga acgggttcgt acatgggcat gggaggcccg agacgggcat agctcctgca cggacctggc ccgactttat ggatcctgcc agtgcccccc accactcgga gcaacctctg agatcatcgg ccccggggct tcgagatcag tcatcaccca ttctgctgaa ccagcttccc ccgccggagg gacagcactc gaggaggagg gcaagcagca agatgggacg cagggataca gggggcaaca gatcttcgag agaggagcat ggtgctcaag caaggtcatg ggaggagatg gctggcgcgc catgatggcc cgcggagacc gcgccaggcc cctgcacgag ccgcgactac gggcgtgtgg gaagaacctc cgacctcatc gagccaaagc cgccacctgc gccgctctgg cgtgatcgag cacgccgcac caccttcgag gtggacctcg gttctacgag gggggccatc aaagggccac ccaggatgcc atttggagga aggcagagga cagaggaaga cggataccat agaccgggcg agtcctggcg tctccttcac ggtctgggca gagcaccaca cgcacggtcg agcgccgtca caggaccccg tggctgggag gtggtcctgg ctgcgcaagg tgcaagatct aaccgcctgg atccgcgact cagcagtgcc aaggccctgt ttccccgagc atgttgcaaa tccgcactgc agccactgct gacgtcagca cgctccttgg ttgcaaggcc gcctacttgc gaccaatccc ctggcccaat ggggtctact ccgaggaagc agactgggag ggacagcctg agcagccgcc ctccgctccg cttcccgaac ggggcacaaa ccggcgctac
24480 24540 24600 24660 24720 24780 24840 24900 24960 25020 25080 25140 25200 25260 25320 25380 25440 25500 25560 25620 25680 25740 25800 25860 25920 25980 26040 26100 26160 26220 26280 26340
ctgctcttcc cacagcccct agcggcagca gaacgagccg cttccagcag gctcacccgc cgccgaggct ccacacacgg atgagcaaag gccggcgccg atctcacggg atcaccgcca caggaaattc ctgactaact cagggtataa agctcttcgc tccttcacgc ggcggcatcg ttctccggct gagtcggtgg cgacacctgg agttcacctg aggggtgcat tctgcggcct gatcatattg aataaaaaat gccaacacca aacttcctcc tcttctatca cctacgatgc atggattcca ccaagaacgg accgcggggt actactgttt gcagcagcta gcgcagaccc agtcgggggc agttgtctgt ctcttcaaca aaaaaggcgg agattcccac cccaggacta tgaatgacat cgccccgcca cccagcccac caggtgtcca agcggctggt tgggtctgcg ctcgtcaggc gcactctcca cccccggcca acggctacga accactgtta cctggtcgga ccactgctcc ccgcgacctc atgatgattt aaagaatcac cttcactccc acacgctgaa gatgtccaaa agacaacgca agagaagccc ggaaatcacc gaacttcccc ccaagaagag gaaaatccac gggagctgag aggagcagga atcacaagag agtactgcgc gaattacgtc gccttacatg ctccacccgc ccgcgcccac tcaccttaat gaccgtacta gctggccggc gatccgaggc acctgacgga cgtcctgact gttcgtggag ctacccggac ttgaatgtcc attaatcgcc gtcaacccca tgcgactccc ctccccatga tacagaaata ttacttgaaa ctcttcccag ggggatgtca aagcgcgtcc ccgaccgtgc ctgggggtgc ctcaagctgg cgcaacatct gcagaaaccc agcggcggca gaaccggatc actgaaagtc cgaagaccaa gctcactctt accacctgcg tggagctacc atgaactggc cgaaaccaga ccgcgtaatt cttccgcgag ggcgccgccc agaggcacac gtcttccaac ttggagagtt gagttcactc gagttcatcc catggtggcg tctcctacga tcgtcatcac ccgactgcgt actaatcacc aagatacaat tctgatacca ctctggtact aattcctcct gggtggatga ccttcatcaa tgtccctgcg gagagggggt tgcattacta agcagcagca ggtggactga tttcccaccc aagaaccgtt cttcagcgca aaagagtagc cccttcgccc agccccagat tcagtgccgg tactcctaga ggcccgccgc acgcccaggc tgtgtcgtca agctcaacga tcgccggatc cgtcctcgca cctcggtcta cgaacttcga cggctgacct gctcctgcag ccagcagtcg ccacactctg cccttatcca catattgatg ggtctctgtc gcaggccccg gtccctcaat tgacttcgac cccccccttc actggccgac ggacctcgac ccgtcacctc gcagaaaacc ggatcgcggc tctatgccat ctctgcgctc ctctcgagga ccgcgcccgc gaccatcatc gggcctggcc gcccgcgatg acagtcagcg cctggtgtac cgaagtccag ccgccccgct cgaggtggtg ggggagatct gccccgctcg cttcaacccc cgccatcagc agctcggctt cagcgccaga ggcgatacca atcaagaccc gtgaaataaa atttgagttt catgttttct gcgggctgca cttcatttta cccgtctacc gtctcttcag cccgtcacca tcctcgggaa
26400 26460 26520 26580 26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360 27420 27480 27540 27600 27660 27720 27780 27840 27900 27960 28020 28080 28140 28200 28260
aactcatctc tttcccttaa ctccaccatt caggtttagg atactgatgg caattgaaag ccaacattgg cttacccaat tggctggtaa actgtcaaat gtcaaatact ctggcaccgt cagaacattc ctccatatac gttctactac ctatgcttct cattttcata ataccttctc cccaccccac attgattcaa ggaatacacc catgcttttg ggagatgaaa taatcgtgca cgccgctccg gcccgcagca tcagcacagt ctgtatccaa aggtagatta atgttgtaat accaccatcc ggactggaac caacacggcc catggatcac aaatatactg actccgtggc aaacataaag caacataagc aaatgggtta ccaagttaaa caaagaagac actcgcagaa ggccactgtg aagcagtgct tacactaaaa caatgctgta taaaaataat cactataacc cacctggact atacatcgcc tctgtggaaa cagttttaca accctctccc gtctccacgt ccctccgggc tcaggatagg tcctgcagga taaggcgcct aactgcagca agctcatggc agtggcgacc tcaccacctc taaaccagct aatgacagtg accaaggccg cccttttaca agaacaagca tctgccttgg cttaccttag tgggctaaag gagtttggaa cttggatctg gataaactca aatgatgcaa tcagtcttag caggtgtttc aaatactggg ggattcatgc atagtagggc ctcaatggta aatggaagct caagaatgaa aaactctgaa ggattcgagc cccgcacagc tccacacagt acaattggga gcggtggtgc atacaacatg tgtcctccgg cagcaccaca ggggaccaca cctcataaac ccggtaccat ggccaaaacc gagagcccag ccgcccctct ctaaagatgg ttctaaacac cagtacagtt acagaggttt gtttaaaatt gcagtagtac gccttagctt ctttgtggac aactaacact ttgtaggaag tacgttttga ggtataggca ccaatttaaa aagtatacat ctgatgacag atgttggagc cactgtatcc acacaaaata agttattttt cttgaacatc ttcagagcga gaagtactcg tgcagcagcg gcagtggtct gcacagcagc atattgttca gaacccacgt acgctggaca ataaacctct tgcccgccgg gactcgtaac cagtttttcc aaaattatcc actagcttta agtctctcca gcatgttaca tgaagatgga agaaacaggt tgacagtaca aacacctgat ttgcttgact tggaaaccta tgcaaacggt gggagatagc agcttatcca gaatggagat caacagtaca aacatttggg caccctgcat aaataaagtt cctccaccct tgaatgccat gccagtctcg cctacatggg cgcgaataaa cctcagcgat gcaccctgat aaatcccaca ggccatcata taaacattac gattaaacat ctatacactg catggatcat aacaacacca ttacaagttt ggttttggat cttacatttg acaggagatg gccatagcaa gttgatgatg ggagccataa ccatcgccaa aaatgtggta aaccccatta gttcttttaa atagatggca aagtcacaaa gtttcaaaac tattcaatgt gctaactctt gccaaccctt caagtgtttt cccaggacat tggtgatgga ggtcggtcag ggtagagtca ctgctgccgc gattcgcacc ctcacttaaa gtgcaaggcg ccacaagcgc ctcttttggc ggcgccatcc cagggaaccg catgctcgtc
28320 28380 28440 28500 28560
28620 28680
28740
28800 28860
28920 28980 29040 29100
29160 29220 29280 29340 29400 29460 29520 29580 29640 29700 29760 29820 29880 29940 30000 30060 30120 30180
atgatatcaa tgttggcaca acacaggcac acgtgcatac acttcctcag gattacaagc 30240
tcctcccgcg ttagaaccat atcccaggga acaacccatt cctgaatcag cgtaaatccc 30300
acactgcagg gaagacctcg cacgtaactc acgttgtgca ttgtcaaagt gttacattcg 30360
ggcagcagcg gatgatcctc cagtatggta gcgcgggttt ctgtctcaaa aggaggtaga 30420
cgatccctac tgtacggagt gcgccgagac aaccgagatc gtgttggtcg tagtgtcatg 30480
ccaaatggaa cgccggacgt agtcatattt cctgaagtct tggcgcgcca aagtctagaa 30540
gcggtccata gcttaccgag cggcagcagc agcggcacac aacaggcgca agagtcagag 30600
aaaagactga gctctaacct gtccgcccgc tctctgctca atatatagcc cagatctaca 30660
ctgacgtaaa ggccaaagtc taaaaatacc cgccaaatag tcacacacgc ccagcacacg 30720
cccagaaacc ggtgacacac tcaaaaaaat acgcgcactt cctcaaacgc ccaaactgcc 30780
gtcatttccg ggttcccacg ctacgtcatc aaaacacgac tttcaaattc cgtcgaccgt 30840
taaaaacgtc acccgccccg cccctaacgg tcgcccgtct ctcagccaat cagcgccccg 30900
catccccaaa ttcaaacacc tcatttgcat attaacgcgc accaaaagtt tgaggtatat 30960
tattgatgat g 30971
<210> 19 <211> 37830
<212> DNA
<213> Pan troglodytes
<400> 19
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcggga ggcgggtccg ggggcgggcc ggcgggcggg gcggtgtggc ggaagtggac 120
tttgtaagtg tggcggatgt gacttgctag tgccgggcgc ggtaaaagtg acgttttccg 180
tgcgcgacaa cgcccacggg aagtgacatt tttcccgcgg tttttaccgg atgttgtagt 240
gaatttgggc gtaaccaagt aagatttggc cattttcgcg ggaaaactga aacggggaag 300
tgaaatctga ttaatttcgc gttagtcata ccgcgtaata tttgtcgagg gccgagggac 360
tttggccgat tacgtggagg actcgcccag gtgttttttg aggtgaattt ccgcgttccg 420
ggtcaaagtc tccgttttat tattatagtc agctgacgcg gagtgtattt ataccctctg 480
atctcgtcaa gtggccactc ttgagtgcca gcgagtagag ttttctcctc tgccgctctc 540
cgctccgctc cgctcggctc tgacaccggg gaaaaaatga gacatttcac ctacgatggc 600
ggtgtgctca ccggccagct ggctgctgaa gtcctggaca ccctgatcga ggaggtattg 660
gccgataatt atcctccctc gactcctttt gagccaccta cacttcacga actctacgat 720
ctggatgtgg tggggcccag cgatccgaac gagcaggcgg tttccagttt ttttccagag 780
tccatgttgt tggccagcca ggagggggtc gaacttgaga cccctcctcc gatcgtggat 840
tcccccgatc cgccgcagct gactaggcag cccgagcgct gtgcgggacc tgagactatg 900
ccccagctgc tacctgaggt gatcgatctc acctgtaatg agtctggttt tccacccagc 960
gaggatgagg acgaagaggg tgagcagttt gtgttagatt ctgtggaaca acccgggcga 1020
ggatgcaggt cttgtcaata tcaccggaaa aacacaggag actcccagat tatgtgttct 1080
ctgtgttata tgaagatgac ctgtatgttt atttacagta agtttatcat ctgtgggcag 1140
gtgggctata gtgtgggtgg tggtctttgg ggggtttttt aatatatgtc aggggttatg 1200
ctgaagactt ttttattgtg atttttaaag gtccagtgtc tgagcccgag caagaacctg 1260
aaccggagcc tgagccttct cgccccagga gaaagcctgt aatcttaact agacccagcg 1320
caccggtagc gagaggcctc agcagcgcgg agaccaccga ctccggtgct tcctcatcac 1380
ccccggagat tcaccccctg gtgcccctgt gtcccgttaa gcccgttgcc gtgagagtca 1440
gtgggcggcg gtctgctgtg gagtgcattg aggacttgct ttttgattca caggaacctt 1500
tggacttgag cttgaaacgc cccaggcatt aaacctggtc acctggactg aatgagttga 1560
cgcctatgtt tgcttttgaa tgacttaatg tgtatagata ataaagagtg agataatgtt 1620
ttaattgcat ggtgtgttta acttgggcgg agtctgctgg gtatataagc ttccctgggc 1680
taaacttggt tacacttgac ctcatggagg cctgggagtg tttggagaac tttgccggag 1740
ttcgtgcctt gctggacgag agctctaaca atacctcttg gtggtggagg tatttgtggg 1800
gctctcccca gggcaagtta gtttgtagaa tcaaggagga ttacaagtgg gaatttgaag 1860
agcttttgaa atcctgtggt gagctattgg attctttgaa tctaggccac caggctctct 1920
tccaggagaa ggtcatcagg actttggatt tttccacacc ggggcgcatt gcagccgcgg 1980
ttgcttttct agcttttttg aaggatagat ggagcgaaga gacccacttg agttcgggct 2040
acgtcctgga ttttctggcc atgcaactgt ggagagcatg gatcagacac aagaacaggc 2100
tgcaactgtt gtcttccgtc cgcccgttgc tgattccggc ggaggagcaa caggccgggt 2160
cagaggaccg ggcccgtcgg gatccggagg agagggcacc gaggccgggc gagaggagcg 2220
cgctgaacct gggaaccggg ctgagcggcc atccacatcg ggagtgaatg tcgggcaggt 2280
ggtggatctt tttccagaac tgcggcggat tttgactatt agggaggatg ggcaatttgt 2340
taagggtctt aagagggaga ggggggcttc tgagcataac gaggaggcca gtaatttagc 2400
ttttagcttg atgaccagac accgtccaga gtgcatcact tttcagcaga ttaaggacaa 2460
ttgtgccaat gagttggatc tgttgggtca gaagtatagc atagagcagc tgaccactta 2520
ctggctgcag ccgggtgatg atctggagga agctattagg gtgtatgcta aggtggccct 2580
gcggcccgat tgcaagtaca agctcaaggg gctggtgaat atcaggaatt gttgctacat 2640
ttctggcaac ggggcggagg tggagataga gaccgaagac agggtggctt tcagatgcag 2700
catgatgaat atgtggccgg gggtgctggg catggacggg gtggtgatta tgaatgtgag 2760
gttcacgggg cccaacttta acggcacggt gtttttgggg aacaccaacc tggtcctgca 2820
cggggtgagc ttctatgggt ttaacaacac ctgtgtggag gcctggaccg atgtgaaggt 2880
ccgcggttgc gccttttatg gatgttggaa ggccatagtg agccgcccta agagcaggag 2940
ttccattaag aaatgcttgt ttgagaggtg caccttgggg atcctggccg agggcaactg 3000
cagggtgcgc cacaatgtgg cctccgagtg cggttgcttc atgctagtca agagcgtggc 3060
ggtaatcaag cataatatgg tgtgcggcaa cagcgaggac aaggcctcac agatgctgac 3120
ctgcacggat ggcaactgcc acttgctgaa gaccatccat gtaaccagcc acagccggaa 3180
ggcctggccc gtgttcgagc acaacttgct gacccgctgc tccttgcatc tgggcaacag 3240
gcggggggtg ttcctgccct atcaatgcaa ctttagtcac accaagatct tgctagagcc 3300
cgagagcatg tccaaggtga acttgaacgg ggtgtttgac atgaccatga agatctggaa 3360
ggtgctgagg tacgacgaga ccaggtcccg gtgcagaccc tgcgagtgcg ggggcaagca 3420
tatgaggaac cagcccgtga tgctggatgt gaccgaggag ctgaggacag accacttggt 3480
tctggcctgc accagggccg agtttggttc tagcgatgaa gacacagatt gaggtgggtg 3540
agtgggcgtg gcctggggtg gtcatgaaaa tatataagtt gggggtctta gggtctcttt 3600
atttgtgttg cagagaccgc cggagccatg agcgggagca gcagcagcag cagtagcagc 3660
agcgccttgg atggcagcat cgtgagccct tatttgacga cgcggatgcc ccactgggcc 3720
ggggtgcgtc agaatgtgat gggctccagc atcgacggcc gacccgtcct gcccgcaaat 3780
tccgccacgc tgacctatgc gaccgtcgcg gggacgccgt tggacgccac cgccgccgcc 3840
gccgccaccg cagccgcctc ggccgtgcgc agcctggcca cggactttgc attcctggga 3900
ccactggcga caggggctac ttctcgggcc gctgctgccg ccgttcgcga tgacaagctg 3960
accgccctgc tggcgcagtt ggatgcgctt actcgggaac tgggtgacct ttctcagcag 4020
gtcatggccc tgcgccagca ggtctcctcc ctgcaagctg gcgggaatgc ttctcccaca 4080
aatgccgttt aagataaata aaaccagact ctgtttggat taaagaaaag tagcaagtgc 4140
attgctctct ttatttcata attttccgcg cgcgataggc cctagaccag cgttctcggt 4200
cgttgagggt gcggtgtatc ttctccagga cgtggtagag gtggctctgg acgttgagat 4260
acatgggcat gagcccgtcc cgggggtgga ggtagcacca ctgcagagct tcatgctccg 4320
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcatggtgc ctaaaaatgt 4380
ccttcagcag caggccgatg gccaggggga ggcccttggt gtaagtgttt acaaaacggt 4440
taagttggga agggtgcatt cggggagaga tgatgtgcat cttggactgt atttttagat 4500
tggcgatgtt tccgcccaga tcccttctgg gattcatgtt gtgcaggacc accagtacag 4560
tgtatccggt gcacttgggg aatttgtcat gcagcttaga gggaaaagcg tggaagaact 4620
tggagacgcc tttgtggcct cccagatttt ccatgcattc gtccatgatg atggcaatgg 4680
gcccgcggga ggcagcttgg gcaaagatat ttctggggtc gctgacgtcg tagttgtgtt 4740
ccagggtgag gtcgtcatag gccattttta caaagcgcgg gcggagggtg cccgactggg 4800
ggatgatggt cccctctggc cctggggcgt agttgccctc gcagatctgc atttcccagg 4860
ccttaatctc ggagggggga atcatatcca cctgcggggc gatgaagaaa acggtttccg 4920
gagccgggga gattaactgg gatgagagca ggtttctaag cagctgtgat tttccacaac 4980
cggtgggccc ataaataaca cctataaccg gttgcagctg gtagtttaga gagctgcagc 5040
tgccgtcgtc ccggaggagg ggggccacct cgttgagcat gtccctgacg cgcatgttct 5100
ccccgaccag atccgccaga aggcgctcgc cgcccaggga cagcagctct tgcaaggaag 5160
caaagttttt cagcggcttg aggccgtccg ccgtgggcat gtttttcagg gtctggctca 5220
gcagctccag gcggtcccag agctcggtga cgtgctctac ggcatctcta tccagcatat 5280
ctcctcgttt cgcgggttgg ggcgactttc gctgtagggc accaagcggt ggtcgtccag 5340
cggggccaga gtcatgtcct tccatgggcg cagggtcctc gtcagggtgg tctgggtcac 5400
ggtgaagggg tgcgctccgg gctgagcgct tgccaaggtg cgcttgaggc tggttctgct 5460
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt 5520
gtcatagtcc agcccctccg cggcgtgtcc cttggcgcgc agcttgccct tggaggtggc 5580
gccgcacgag gggcagagca ggctcttgag cgcgtagagc ttgggggcga ggaagaccga 5640
ttcgggggag taggcgtccg cgccgcagac cccgcacacg gtctcgcact ccaccagcca 5700
ggtgagctcg gggcgcgccg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt 5760
cttacctcgg gtctccatga ggtggtgtcc ccgctcggtg acgaagaggc tgtccgtgtc 5820
tccgtagacc gacttgaggg gtcttttctc caggggggtc cctcggtctt cctcgtagag 5880
gaactcggac cactctgaga cgaaggcccg cgtccaggcc aggacgaagg aggctatgtg 5940
ggaggggtag cggtcgttgt ccactagggg gtccaccttc tccaaggtgt gaagacacat 6000
gtcgccttcc tcggcgtcca ggaaggtgat tggcttgtag gtgtaggcca cgtgaccggg 6060
ggttcctgac gggggggtat aaaagggggt gggggcgcgc tcgtcgtcac tctcttccgc 6120
atcgctgtct gcgagggcca gctgctgggg tgagtattcc ctctcgaagg cgggcatgac 6180
ctccgcgctg aggttgtcag tttccaaaaa cgaggaggat ttgatgttca cctgtcccga 6240
ggtgatacct ttgagggtac ccgcgtccat ctggtcagaa aacacgatct ttttattgtc 6300
cagcttggtg gcgaacgacc cgtagagggc gttggagagc agcttggcga tggagcgcag 6360
ggtctggttc ttgtccctgt cggcgcgctc cttggccgcg atgttgagct gcacgtactc 6420
gcgcgcgacg cagcgccact cggggaagac ggtggtgcgc tcgtcgggca ccaggcgcac 6480
gcgccagccg cggttgtgca gggtgaccag gtccacgctg gtggcgacct cgccgcgcag 6540
gcgctcgttg gtccagcaga gacggccgcc cttgcgcgag cagaaggggg gcagggggtc 6600
gagctgggtc tcgtccgggg ggtccgcgtc cacggtgaaa accccggggc gcaggcgcgc 6660
gtcgaagtag tctatcttgc aaccttgcat gtccagcgcc tgctgccagt cgcgggcggc 6720
gagcgcgcgc tcgtaggggt tgagcggcgg gccccagggc atggggtggg tgagtgcgga 6780
ggcgtacatg ccgcagatgt catagacgta gaggggctcc cgcaggaccc cgatgtaggt 6840
ggggtagcag cggccgccgc ggatgctggc gcgcacgtag tcatacagct cgtgcgaggg 6900
ggcgaggagg tcggggccca ggttggtgcg ggcggggcgc tccgcgcgga agacgatctg 6960
cctgaagatg gcatgcgagt tggaagagat ggtggggcgc tggaagacgt tgaagctggc 7020
gtcctgcagg ccgacggcgt cgcgcacgaa ggaggcgtag gagtcgcgca gcttgtgtac 7080
cagctcggcg gtgacctgca cgtcgagcgc gcagtagtcg agggtctcgc ggatgatgtc 7140
atatttagcc tgccccttct ttttccacag ctcgcggttg aggacaaact cttcgcggtc 7200
tttccagtac tcttggatcg ggaaaccgtc cggttccgaa cggtaagagc ctagcatgta 7260
gaactggttg acggcctggt aggcgcagca gcccttctcc acggggaggg cgtaggcctg 7320
cgcggccttg cggagcgagg tgtgggtcag ggcgaaggtg tccctgacca tgactttgag 7380
gtactggtgc ttgaagtcgg agtcgtcgca gccgccccgc tcccagagcg agaagtcggt 7440
gcgcttcttg gagcgggggt tgggcagagc gaaggtgaca tcgttgaaga ggattttgcc 7500
cgcgcggggc atgaagttgc gggtgatgcg gaagggcccc ggcacttcag agcggttgtt 7560
gatgacctgg gcggcgagca cgatctcgtc gaagccgttg atgttgtggc ccacgatgta 7620
gagttccagg aagcggggcc ggccctttac ggtgggcagc ttctttagct cttcgtaggt 7680
gagctcctcg ggcgaggcga ggccgtgctc ggccagggcc cagtccgcga ggtgcgggtt 7740
gtctctgagg aaggacttcc agaggtcgcg ggccaggagg gtctgcaggc ggtctctgaa 7800
ggtcctgaac tggcggccca cggccatttt ttcgggggtg atgcagtaga aggtgagggg 7860
gtcttgctgc cagcggtccc agtcgagctg cagggcgagg tcgcgcgcgg cggtgaccag 7920
gcgctcgtcg cccccgaatt tcatgaccag catgaagggc acgagctgct ttccgaaggc 7980
ccccatccaa gtgtaggtct ctacatcgta ggtgacaaag aggcgctccg tgcgaggatg 8040
cgagccgatc gggaagaact ggatctcccg ccaccagttg gaggagtggc tgttgatgtg 8100
gtggaagtag aagtcccgtc gccgggccga acactcgtgc tggcttttgt aaaagcgagc 8160
gcagtactgg cagcgctgca cgggctgtac ctcatgcacg agatgcacct ttcgcccgcg 8220
cacgaggaag ccgaggggaa atctgagccc cccgcctggc tcgcggcatg gctggttctc 8280
ttctactttg gatgcgtgtc cgtctccgtc tggctcctcg aggggtgtta cggtggagcg 8340
gaccaccacg ccgcgcgagc cgcaggtcca gatatcggcg cgcggcggtc ggagtttgat 8400
gacgacatcg cgcagctggg agctgtccat ggtctggagc tcccgcggcg gcggcaggtc 8460
agccgggagt tcttgcaggt tcacctcgca gagtcgggcc agggcgcggg gcaggtctag 8520
gtggtacctg atctctaggg gcgtgttggt ggcggcgtcg atggcttgca ggagcccgca 8580
gccccggggg aagcggtgcc ggcagcggca gcgaaggcga ggcccggtga gcggcctggc atgaactgct gccaggtcgt cagactcggc aggttgagct ttgagggtgg gattcgttga aagttgaaaa agctcggcga agcatcacca tcggggggtg gggaggcggt acggcgcggc ggcgggtggc ggtacgccgc aaggcgtcta tggggggagt cggcggatgg tcggctatgc agcctttcca ctggggcggc tggagcaggg agggtggttt taggtgcagt gtgtacctga aggtactggt
gtggcggggg gcgacgacgg gcgggcgggc cgtcggcgtg cgacgcggcg gcttgaacct gcaggatctc cgatctcttc tggagatgcg tgtagaccac ccacgtgccg tggcggtgtg tgtcccccaa actgggagtt cggtgtcgcg cctcctcctc gcggcggcgg ccacgaagcg cgttctcccg cgtgaggcag cgagggacct accagtcgca gtctggcgga tcgacaggag cccaggcttc ccggcacctc gccgcgcccc ccaggtcggc ggaagtcatc tggccatgac gtcgcgagta agcccaccag ctccgggggc tgccccgcgg ccccggaggt gagcgcgggc gttgatctcc gaaagagagt ctgcacgtct ctcctggagg ccccatgagc gcccccctgg cgcgaagacg ctcggccacg ggcctccagc gcgcgccgac cacctcgcgc ttcctcctct cggtggggga cgcgatcatc ggggcgcagt cgagacggcg gagggagtcc gtcgcaaggt ggtgctgctg caccatgtcc gttctggcat ttctccttcc cctgcccccc gacgacgcgc caagtccacg ggaccagttg ggcgcgggag gaagtgcggc caggtcttcc ggtggtggtg agggggggct aggagttggt tggatctggc tcgacagaat cccgagttgt tctccgcgtc tgcgagaagg tcatcgcggg gcgtagttgc aagaagttca cgttccatgg acggtcaact tcgaaggcta tctggcactt gggggcgctc tccccgcggc tggaagacgc ctgacgatgc atatccaccg aggctgagca atgatgtaat ttgggtccgg cggcgcaggt tcttctgctt atgcgcgtga tcggccagga aagcggtggt acggtctggt tcgaagacgt ggcggctggc agcatgaggc gtggtggcgg ccggtcccgc gctgtgcccg gcctctgcgt caatctcggt cttggtaggc cggcgcgttc cgttgagtcc cgcgcatgac gcagacgctg tgacccagcg cctcgtagaa cctcctccag tggggatctc ccatgatggc tgcgccggcg ggcggcgcat cgccggacat atctcaacaa gatccgaaaa ccgtggcggg tgaagtaggc cctgctggat ccttgtagta cttccatgtc ccccgaaccc tggcctgctg aggcgcccgt ggcccggttg agtcgttgca ggtagagggg ggtggtaggc tgcagctcag gggcaggggc gaggttgctg gaagacgacg gtcattgacc gatctcggcc cacggtggcc gccctcgttc cacctgcgcg gaagaggtag gcgcaacgtg gtccacggcg aagacggatg ttcctccgct ttcctcctct gcggcgcacc ggtctcggtg ctggtgctgg ttgctgcgta cctttcgagg
cggcgggggg
ggacttgaca gcggaggcgg gtcttgcatg tgcttcggcc cctgagcggt cacctgcgtg gttgatggtg cgacatctcg agtccgcacc ccagcgcagg gtagatgtac
8640 8700
8760 8820 8880 8940 9000 9060 9120 9180 9240 9300 9360 9420 9480 9540 9600 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 10320 10380 10440 10500
ctggacatcc ttccagatgt cgcgcgcagt ccgtggtctg ggtccgggcc tgtgcgacgt gccgcgtaag gagggatcct cggccggacc cggattgact ggtgctgcgg gcaacagcag ggcgtccgcg ggagcccccg gcggctgggg cgaggcgtac gatgcgggac gctgctgcgc gcacgtggcg cttccaaaag cgggctgatg tctgacggcg cgcgctgctg gcagagcata ctactcgatg gcccatagac caccctgagc gagccggcgg gggcgccggc ctgggcgccc cggcgaggag tggtgtttcc aggtgatacc tgcgcagggg cgttgatact gtgaatagat ggacggtccg cagacaacgg agactaagcc tgctaagggt cgcggctaag ccggacacgg cagatgcgcc cgggagtcat gccgtgtctg cggcgcaggg gcgccgtctc gtgcctcggc aggaggttca gaggaggact gccgccgacc agtttcaaca cacctgtggg cagctgttcc aacatcaccg gtggtgcagg ctgagcctgg aaggaggtga gacgacctgg cgcgagctga agcggcgaca agccggcggg gatgaggagt ggtagatgca cgcggcggtg cagaaagtgc ctagaccagg cgcaagggta ccatgatcca tggagtgttc gcgaaagcga tgcgttgcgg gtgttggatt ggacgagccc ccccgcccca gcagggcccc gcgcctgcgg ccagacacta ccgagcgcca agaacctgtt gcgcagggcg ttgagcccga tggtgacggc accacgtgcg actttgtaag tgatagtgca agcccgaggg agcgcagcct gcaagtttta agatcgacgg gcgtgtaccg gcgaccgcga gggaggcgga ccctggaggc acgagctaga agacccgaac gtggaggcgc tccatggtag gaaaacgaaa tcatggcgga cgcggttacc cttttggcgt aagcagtaag cgaaccccgg ggcctccccc cttttatttt gcagcagcaa ctcacccacc cggcggcggg cctggacctg cccgcgggtg cagggaccgc ggagctgcgg cgcgcggacg gtacgagcag cacgctggtg cgcgctggtg gcacagcagg tcggtggctg gagcctggcc cgcgcgcaag tttttacatg caacgagcgc gctgatgcac gtcctacttc cgcgggggtc ggagggcgag gtggtggacc gcgggaagtc gcgtgctctg gccggtcagc gggcctcggt gcccgcgtgt ttttctggcc tggctcgctc ttcgaatccc tcgtataaag tgctttcccc caacaccagc ctcggcgggc gggccggctg gaggagggcg cagctgaagc gcgggcgagg caggggctga gggatcagcc acggtgaacc gcgcgcgagg cagaacccca gacaacgagg ctggacctga gacaaggtgg atctaccaga cgcatggcgc atccacaagg agcctgcagc gatgcggggg cgcgaggact tacctggact cggcgctgcg gcgcacccgg tccagtcaga gggcactctt tcgagccccg cgaacccagg gggcgccggc cccgtagccg gtactcgggc accccgcttg agatgcatcc aagagcggca cggccacctc acgaccccga agggcctggc gcgactcgcg agcccgagga accgcgagcg ccgcgcgcgc aggagatcaa aggtgaccat acagcaagcc cgtttaggga ttaacatcct cggccatcaa cgccgtacgt tgaaggtgct ccgtgagcgt gggcgctggc cggacctgcg atgacgagga aaaccgcggg ggcggctctg
10560
10620 10680 10740 10800 10860
10920 10980
11040 11100 11160 11220 11280
11340
11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 12300 12360 12420
cagagccagc atgtcgctga tccgccatcc gccatagtga tacgacgcgc gaccggctgg ggcaacctgg ccgcgggggc accccccaga ggcctgcaga aaggcgccca ctgctgctgc gggcacctgc ttccaggaga gcgactctga acctccgagg cgcgacgggg atgtacgccg gccgtgaacc gggttctaca atggacgaca cccaagaagg ctgtccgagc ccgagcctgg gacgagtacc ttccccaaca caggagcaca cagcgggggc ggagggagcg aaaaaaaaaa gaccgagcgt ggacctcctc cgtccggcct cggcgcgtaa tggaggcggt acgcgctggc tgctgcagcg tgggggacgt gctccatggt aggaagacta gcgaggtgta cggtgaacct ccggcgaccg tgatcgcgcc tgaccctgta tcaccagcgt actacctgct aggagcgcat tgacgcccag cgcaccggcc ccgagtactt gcgggggctt gcgtgttctc aggaggagga tgggggcggc tggggtctct tgaataactc acgggataga gggacgcgcc tggtgtggga gcaacccgtt aagcaagaag tggtttcttg cctcttacga taactcctca cccggacgcg ggtgcctgcg cgagaacagg cgtggcccgc gcgcgaggcg ggcgctgaat caccaacttt ccagtcgggc gagccaggct ggcgacggtg gttcacggac ccgcgaggcc gagccgcgcg gaccaaccgg cttgcgctac cgtggcgctg ttacatcaac taccaacgcc cgaggtcccg cccgcggccg ggaggcgagt agccgccgcg gcacagcgag cctgctgcag gagcctggtg tgcgctccgg tgacgaggac cgcgcacctg catgatgcaa tgttcccttc gagcgtggtg gacgactggc ttccggcagc cgctcgaacc gccatccgcc tacaacagcg gtggcgcagc gccttcctga gtgagcgcgc ccggactact ttcaagaacc tccagcctgc agcggcagcg atcgggcagg ctggggcagg cggcagaaga gtgcagcaga gacatgaccg cgcctgatgg atcctgaacc gagaccaacg caggcgctgg cgccgccgcg cgccccgggt cgcaccaccc ccggtgcggg gacaagatga ccgcccacgc tccgcggacg cgcccccgcc aaattaaata agtatgcggc ggcgcggcgg gacaggtcat agccgcaggc ccacgcacga cggacgaggc gcaacgtgca gcgagcgcgc gcacgcagcc tgcggctgat tcttccagac tgcgggggct tgacgcccaa tgtcccggga cgcaggtgga aggacacgag ttccctcgct gcgtgagcct cgcgcaacat actacctgca cgcactggct atggcttcct cggaagcgtc gcagcagcgg ccctgggcgg gccctcggct agaaaaacct gcagatggaa ggcgccagcg atagcagcgt tggggaggat aaactcacca gcgcggcgat cggcggcgcc ggaccgcatc caacaggctc gaaggtgctg cgggctggtg gaccaacctg ggatcggcag ggccaacgtg ggtgaccgag cagcagacag gtggggcgtg ctcgcgcctg cacctacctg cgagcacacc cagcctggag gcacagcctg gaacctgatg ggaaccgggc tcgcgcggcg cccgccgccc gtgggacgac cctgctgcgt cgtggcttct cagccccttt gctgggcgag gcctcccgcc gacctatgcg ccacgaccgg gctggacctg gttttaaaaa aggccatggc gtaccaggag ctcttctccc
12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 14280 14340
tttgcgtcgc gggagaaaca ctggtggaca tttttgacca atcaatctgg atgcccaacg cgctcgcaca ccagagggca cactatctga gacaccagga tacaccaacg acttacagcc ttcaggatca gcctaccagg tccgccgccg gccgaccccg gtgcgcggag gccgaggaaa gagtctgagg aagaagcgca ctggcctaca ccggacgtga cccgtgacct ctgcccgtgc cagttcacct ccgcccgccc acgctaccgc cgccgcacct agccgcactt ccggctgggg agcagcaccc gccgcgcggg agctgctgga gcatccgtta acaagtcggc cggtcatcca atgaccggtc tgaacgagtt ccaaggaaga actactccga aagtgggcag acttccgcct aggccttcca gcctgagcaa cctacgagga atagcttgaa ccgagcaggg ctatggtggt acaccttcgt agcaactggc ggaccaagcc gttacaacct actacggcga cctgcggctc tccgctccac actccaagag ctctgaccca ccaccatcac tgcgcaacag gcccctacgt tttgagcaac actgctgcgc cgtgcgcgtg gcgcaccacc gccgccgtac ctcggagctg ggacgtggcc gaacaatgac gcactggggc catgttcacc ccgggtggag gaccatgacc gcagaacggg ggggctggac tcccgacatc cctcctgggc cctggagggg ggaaaatgag cgaggatgct ggaggctccc cacccggggg ggcagcagcg cgccaaggag gctcaaggac cccgtcgacg ggagcaggtg gcggcaggtc cttctacaac cgtgttcaat caccgtcagt catcggagga ttacaaggcc accaccatca gcgcccagca cgcgggcact gtggacgacg gtgcctccgc gcgcccctgt tccctgaact tacagcccga ggcgacctga aataagttca ctgaagtacg attgacctga gtcctggaga cccgtgaccg atcctgctgc atccgcaagc ggcaacatcc gcgggacagg gctgacaccg gagcaggagg gaggaaaagc gcggcggcgg cccgtgatta agcaccaaca ggggtgcgct tactggtcgc agcaacttcc gaccaggccg cgctttcctg gaaaacgttc gtccagcgag ttgggcatag tgtccatcct agatgttcgg tccgcgcccc ccatcgactc gctacctgcg tcgacaccac accagaacga gcgaggccag aaaccatcct aggcgcgggt agtgggtgga tgaacaacgc gcgacatcgg ggctggttat ccggctgcgg ggcagccctt ccgcgctcct aggataccgc cggccgcgga aggacatgaa aagcggaggc cgttggccgc agcccctgac ccgcgtaccg cctggaccct tgcccgacat cggtggtggg tctactccca agaaccagat ctgctctcac tgaccgttac tctcgccgcg gatctcaccc aggggcgagg ctggggagcg ggtggtggag gcctacgggg ccgggtgtac ccacagcaat cacccagacc gcacaccaac gatggtgtcg gttcgagctg gatcgtggag ggtcaagttc gcccggggtg ggtggacttc ccaggagggc cgatgtggag ccccgccgcc cggggcagag tgacagtgcg cgaggccgcg ggcggaggct cgaagatagc cagctggtac gctgtgcacg gatgcaagac cgccgagctg gctcatccgc tctggcgcgc agatcacggg tgacgccaga cgtcctttcc agcaataact aagcgttccg cacaaacgcg caggcgcgca
14400 14460 14520 14580 14640 14700 14760 14820 14880 14940 15000 15060 15120 15180 15240 15300 15360 15420 15480 15540 15600 15660 15720 15780 15840 15900 15960 16020 16080 16140 16200 16260
actacaggcc ggcggtacgc ccggggccgc gccgcgccgc ccccccgtac gcaggcgccg tgcgcttccg gttgtgtgta aagagatgct attcgaagcc atggggaggt ggcgcgtaaa ccacccggac aggccaacga aggacctgct ccctgcagca agggcggcga atgtgctgga tcaagcaggt actcccccgc ccgccgcagc cctggctgcc ccgccaacgc accgaggcta gcgccgccgc ccgtgaggaa ccagcatcgt gtttcccggt gcggcctgag tgcgcggcgg ccgggatcgc caaatatgga cgcggtctct caagctgaag cgccaaacgc catgagggcc ccgaagacgc gggcaacgtg ccccccgcgg tcccagcggc ccaggtcgtc ccgcaagata ggagttcctg gcgcgtcctg tttcaagcgc gcgcttcgga ggcgctgccg ggtgctgccg cctggcgccc gaaaatgaaa ggcgccgggc cgccgccacc cgcagccgca gccggcgatg gctcctgccc tacctaccgc caccacccgc agtggcgcgc ttaaaagcct gccgggatac cggaggcagc ggtgctgccc ctccgtggcc aaaaaaaacc accgtggacg agccgccgga gccgccgcgg gcgcgccgct gcggccgccg tactgggtgc acttgagatg ggcggcgcgc gcgccggaga aagcgggtca cgcgccacgg cgccccggca gtctatgacg gagtttgctt ctggaccagg agcagcgcac accgtgcagc gtagaccccg ctcggcgtgc actaccgctg gccgccgccg tcagctcccc gagtacgcct ccgcgaagag cgccgccgcc gacggacaca gttgtggttc cgaggaggaa cgccgcgcgc ctgttaatcc ttgcaagcgt ccaataaaaa cggccatcca agcgcgtggc ccctgcttcg tggccgccgg ccgccgccgc gcgactcggt atgtgaaaaa gcagcgtcat tctatgggcc aaaagaaaaa cgcccaggcg ccgcggtggt aggtgtacgg acgggaagcg gcaaccccac cctccgaggc tcatggtgcc gtctgcagcc agaccgtgga cctccacgga cgacctcctc gcgcgcgtcg tgcatccttc ccaagggttc gcagacgcca ccctggtgct ttgcagatat gatcgcgccg accggcggcg ccctgatcgc cccagaggca agtctagact gaccgtggtg ccgccgccac ccgggccaag catcaccgcc cgccatcagt gaccggcacg acaacactga gtccaagcgc cccgaagaag gaaagatgat cccggtgcag cttcacgccc cgacgaagac tcagcgggcg ccccagtctg gaagcggggt caagcggcag ggacatcagg cgtggtcatc catggagaca ggcggaggtg cgggcgcagg catcgcgccc cacccgccgt gcccgcactg gcccagggcg ggccctcact caggaggggt acgcgccacc cgcggcgatc ttgacagact ctcacgctcg cggggcgcgc cgccgccgac cgcacgggcc gccaccatgg gacatggcca cgcgtgcccg gtctcctgct aaaatcaaag gaagagcagg gacgatgccg tggaagggcc ggcgagcgct ctgctggagc ctggggaagg aagcccgtga ctgaagcgcg aggctggagg gtccgcccca cccaccggca cagaccgatc cagacggacc aagtacggcg acccccggct ccccgccgac gctccagtct cgctaccacc tgccgcctcc ctggccggcc agccgacgca ggcgccgtgc tgcaaacttg cttggtcctg
16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180
tgactatttt cgcccgttcc agttggggct tcccgggcct ttccagcaga aaccaggccg gtgccgccgg gatagggaag ctgaagcaag cgccacaccc gcggcacagc gcggccagcg agcatcgtgg ctaacgtgtt gccgttcgcg atgccgcagt gggctggtgc aaccccacgg cggttcattc gccgtgggcg ctggaccggg aagggcgctc gcagaagagg aagactcatg caaataggaa cagcccgaac ggtagagtgc acaaatgcta caggttgaaa cagcccaaat tcttacaagc cccaacagac gtagaatgga tgggacactg ctctgtggag ggaacagcag aggtggtgga tgcagaataa cgctggagac agaccactct gtctgcccac ccgccacgct cgggcccgcc gcccccgcgg gtctgggggt gtatgtgtgt cgcccaccac ggtcgtacat agttcgcccg tggcgcccac ccgtggaccg acaaccgcgt gtcccacttt ccaactcctg aagaagaaga tatatgctca cggacgctac cccaaatcgg taaagaaatc atggaggtca tgcaattctt tggtgctgta ccgcaaaaag ctaattacat agacatcaac gaacgatatc cggcattaaa cacgggccag gggcctggcc gatcaacagc ggtgtccccc ggtcacgcag cacgcggccc ggacttgcct cgcgaccgcc gggggtcgcg gcggtccgtg atgcgcccta caccgccact gcacatctcg cgccaccgag gcacgatgtg cgaggacacc gctggacatg caagccctac cgagtgggag tgctgacggt ggctcccctt agctacagaa ggagtcccag tactcccatg gggtgtacta ttcaacttct tagtgaggat cgatgacaat cggcttcaga tttgcgtcgc ggcaccagca agtatcgggt atgttgagag tccggcatca agactggacc gatgggcgtg accgatgagc atcgcgccca ccgcccgccg tcccgttcct aggcacggca aagcgccgcc tgtcgccgcc ccgcccctca ggccaggacg agctacttca accaccgacc gcgtactcgt gcctccacct tctggcaccg caagaggaaa caagctgagg tctggcgaaa caaaaaccta tggaatgagg aaaccatgct acggcaaatg gaaaacgccc gtgcacatgg tcaaaaatca gacaacttta tggccccgcg acatgagcgg ctgccgttaa acaagttgaa acggggtggt cccggccgcc gcgagaagcg cgcccccgta tggccaccgg atgtgccgca ccgccggtcc actggcagag gatgctactg agaggagctg agatggcgac cctcggagta gcctgagtaa ggtctcagcg acaaggcgcg actttgacat cctacaactc ctcaggcagt aagagcaagc aaattagtaa tttatgcaga cagatgctac atggttccta cccagggaca gtaacgaggc agaccccgga tgctgggtca tcggcctcat tcacggctcg tggcgccttc aaattacggc agagcagaac ggacctggcc ggtggaggag cccgcggccc tgaggaggcc ggtggtgggc gcagcagaag tctgcgccgc cacgctgaac aatagcttag ctgagtcgcc cccatcgatg cctgagcccc caagtttagg cctgacgctg gttcaccctg ccgcggggtg cctggccccc tgaagaagca agctaccaaa agatggtctg ccctacattc agtcgccggc tgcaagaccc gctagaatct taacaacatt tacgcacctt gcagtccatg gtattacaat
18240 18300 18360 18420 18480 18540 18600 18660 18720 18780 18840 18900 18960 19020 19080 19140 19200 19260 19320 19380 19440 19500 19560 19620 19680 19740 19800 19860 19920 19980 20040 20100
agcactggca ttgcaagaca accagatact attgaaaatc ggggtaactg acttggacaa gctatggaga ctgtacctac aacacctacg aacctgggcg cgcaatgcgg cacatccagg tacacctacg aacgatctca ttcttcccca aacgaccagt aacgccacca gccttcaccc tacacctact aagaaggtct acccccaacg tgcaacatga cagggcttct cagcccatga atcatccacc ggacaggcct atcacccaga ttcatgtcca cacgccctcg ctgttcgaag gtgtacctgc tcatcgccgc acatgggagt gaaacacaga tttccatgtg atggaactga acacttacca aagatgaaac tcaacctcag cagacaagct attacatgaa cgcgctggtc gcctgcgcta tgccccagaa agtggaactt gggtggacgg tggcccacaa ccttcaatga acgtccccat gcctcaagac cgggctccat cggtcacctt agttcgagat ccaaggactg acatcccaga gccggcaggt agcacaacaa accccgccaa aaaagttcct tgggtgcgct acatgacctt tctttgacgt gtacgccctt ctgcatgccg gcttgcaggt actgtcctac gaatcaggca agacgagctc ggctgttaaa ttttgcagat tgccaacctg taagtacaac caagcgagtg gctggactac ccgctccatg gttctttgcc caggaaggat ggccagcatc cacggcctcc ctacctctcc ctccatcccc caaggagacc tccctacctg cgactcctcg caagcgctcg gttcctggtc gagctacaag ggtggaccag ctcgggcttc cttcccctat ctgcgaccgc ctcggacctg cgaggtcgac ggtccgggtc ctcggccggc tcgggttcca caggcctctc cagctcttgc gtggacagtt cccaactatt accaacaatg cgcaatgaaa tggagaaact ccctccaatg gtggccccgg atggacaacg ctcctgggca atcaagaacc gtcaacatgg aagttcgaga acgctcgagg gccgccaaca tcgcgcaact ccctccctgg gacggcacct gtcagctggc gtcgacgggg cagatgctgg gacaggatgt accaagtaca gtgggctacc ccgctcatag accctctggc ggccagaact cccatggacg caccagccgc aacgccacca ccgagcaaga agttgaatgc ttgattccat atgacccaga gtttccctct gcaataacgg taggggtggg tcctgtactc tggacatctc ggctggtgga tcaacccctt acgggcgcta tcctcctcct tcctccagag gcatctgcct ccatgctcag tgctctaccc gggcggcctt gctcgggatt tctacctcaa cgggcaacga agggctacaa ccaactacaa actccttctt aggactacca tcgcccccac gcaagaccgc gcatcccctt tgctctacgc agcccaccct accgcggcgt cctaaagaag gctcagggcc agtggtggac gggtgacaga tgttagaatt gggtggcata gggccaggtg aaacaatttc caacgtggcg tgacaacccc ctgctacatc caaccaccac cgtgcccttc gccgggctcc ctctctgggt ctacgccacc gaacgacacc catacccgcc ccgcggctgg cgacccctac ccacactttc ccgtctgctc cgtggcccag catcggctac caggaacttc ggaggtgggc catgcgcgag ggtcgacagc ctccagcaac caactccgcc tctctatgtt catcgagacc caagccgcag atcgtcagag
20160 20220 20280 20340 20400 20460 20520 20580 20640 20700 20760 20820 20880 20940 21000 21060 21120 21180 21240 21300 21360 21420 21480 21540 21600 21660 21720 21780 21840 21900 21960 22020
acctgggatg ccccacacaa actggctggc gcttttcgga gcagcgccat tgcaggggcc tgcactggcc ccaactccat tctacagctt gggccacctc ttttttctca accaccaccc agtcgccgtg actcgggcac gcaccagcgc cctgcgcgcg gcttcacgct tgctcagcgc gtttcgagtt tggggtacag cctccgagaa cgtgcaggca tcttcacgat tcacatccat gctcgccctc acttgtaggt tcacgaaggt aggtcttgca tcagctcatt cccaggccga ccgccgcgct cgcccactcg cgggccctat gctggcctgc cttcgcctgg ccagcggctc cgcctcctcg cgactcggcc tcagagtccc gctccagagc cctggagcgc cttctgccac ataaatggca gccgttgtcg cgccacgggc caccaggcga gttcatcagg cgagttgcgg ggccagcacg gaacggggtc gcagtcgcag cgcgcgcatg gaacatgccg gcagcgcgcg cttggccttg ctcgatcaca cgtctcggtg cacctccgcg cttgttgctg cacggccgcc ctccacgtgg caccagcggc ttcgctttcc cagcccccgc tttttgggca gccatcgtca aacccgcgct aagcaaatct cccgaccgct gcctgcggtc atggaccgca ccccaggtcg cactcgcctt ttgcaagaga tctttttatt ccatctggct agggacacgt ggcagctcgg tcgggcgccg tacaccgggt ctgcggtcgg atcttgggca cgcagcggga aaggcctgca caggacttgc tcggtgttgg gacgattgct tgttccttgt cagcggtgct aaggactgca ctgaaggtca agcgcctcca tacttgtcca aggctcacgg gccccgctgt accacggggt ccttcgacaa acacggccgg ccaaaacatg acgagttcga gcgtcaccct tcttctgctg accccaccat agcccaccct acttccgccg tgcaagaagg tatacaagct ctatttagaa tgcgatactg ggaagttttc agatcttgaa tgcagcactg agatcagctc cttgccgccc tcagcaggtg tctggcggaa ccgagaactg cgatctgcac ccttcagcgc tcaccatgct gccacagcgc ggtacccctg gctgcagccc cctggtcggg tcagcgtgcg ggttcttcac tctcttcctc cgtcttcctg gcgcttccct ccgcgagacc cttcctcttt gtacgagggc cgaaaagtcc catgtttctg gaacttgctg gcgccgcaac ccacagcgca gtaataacga ctctggggta atcgaaaggg gtagcgggtg gctccacagg gtcgcagttg gaacaccaac ggcgtccagg caggaagggc cccgtgcccg ggccatctgg gtttgcgggg cacgttgcgc gcgctgcccg gctgccgtgc gcagcccgtg caaaaagcgg gcggtgctcc cagcatcttg cgccgcctcc catcaccgtg ttcctcctct caggcgctgc ggctttgtct gggggcgtgc gaccccttcg ttgctgcgtc acccagaccg cacgcctttg acgggggtgc caggagcagc cagatcagga tgtacacact ttcatttccc ttctgccggg ccccacttga ctgcgggtca gggccgccgc agcgccgggt tcctccgcgt gcgtgccccg gactcggcgt gccttggcgc cagctggcgt ccccaccggt ttctcgctgg agacacttca ggctcgaaag cccatcatgg tcgttcagcc aagttcacct atgcccttct gccgccgcct tcctcgccgc accttgcgct
22080 22140 22200 22260 22320 22380 22440 22500 22560 22620 22680
22740
22800 22860 22920 22980 23040 23100 23160 23220 23280 23340 23400 23460 23520 23580 23640 23700 23760 23820 23880 23940
tgccgttgcg cggcctcttc tcctcagtac cggccgctgc agccgtcctc
ggggcggcgg
gacggcgggc tggccatctc gagtcgagaa ccaccgccaa ccagcgacgc gcggagagga aagaggataa ggaacggaag agcacctgca ccctggacgt cccccaagcg tcttcgcggt ccctctcctg cccacatacc gcgacgagaa gggtgctggt aggtcaccca tgggcgagct cctccgagga gcgaccccgc tggagctcga agaccctgca tggagctctg acgtcctgca acctcttcct agcgcaacct cccctgcttg ttgctcgtcc cgaggcacgc cgaggtcgaa gtcctcctcg aggcggcggc cgcgccgcgt ccactgctcc ggaggaggac tgccgccgcg acccccgctc ggatgaggtg aaagcaagac ccatgatgct ccgccagtgc ggcggaggtc ccgggagaac acccgaggtg ccgcgccaac tgatatcgcc acgggcggcg ggagctcgag ctttgcctac catcatgcgc aggcctgccc gcagctggag gtgtctgcag ctacaccttc caacctggtc ctccaccctc ctgctacacc caaggagctg atgcgcacgg tcgctgtcca ttctttttct ggccgagggc gactcgagac ggcgacggag ccgcgctcgg ttctcctata agcctaaccg gacgacgcgc gagaatgaag gatgagaagg caggacgacg gatgacggct gtcatcgtct agccgcgcct ggcacctgcg ctggccacct cgcacccgcg tctctggagg aacgctctgc ggcgacaacg ccggcgctca cgcgcccagc gcggtcagcg gagcggcgca cgcttcttcg cgccagggct tcctacctgg aaaggggagg tggcagacgg gaaaagctcc gcgggttgct gaatgacctc tcctgggggc tgggcgtgcg ggaggcgggc acggggacga gggtggtctc ggcagaaaga ccccctctga ccaccgagac tgctgatcga agaaggagga cagataagga acctagacgt gcgacgcgct acgagcggca agcccaaccc accacatctt ccgacaaaac aagtgcccaa acggagacag cgcgcctggc acctgccccc ccctggccgc acgagcagct agctcatgat cggaccccga acgtgcgcca gcatcctgca cgcgccgcga ccatgggggt tcaagcgcac gaagcccacc
cggggagggg
gttcgccagc cggcaccagc ccgcttcttc gacatcgtcc gcgctggtcc gatcatggag gccctccacc caccgccagt gcaggacccg ggtcgccgcc tgagacagca gggagacgac gcaggagcgc cctcttcgcg gcgtctcaac tttccaaaac cctgaccctg gatcttcgag cgaaaacgag cgtactcaag caaggtcatg ggatgcaaac ggcgcgctgg ggccgcggtg gatgcagcgc ggcctgcaag cgagaaccgc ctacatccgc ctggcagcag cctcagggac atcaccagcg gggttggtca tccgcggctg gcgtcctgcg gggggcgcgc agggtgggtg tcttcccgac tctctcatgc accgccgcca accaccctcc ggttttgtga tcagtgccaa gtcgggcggg gtgctgctta tgcgaagtgc ccgcacgtgc ttctacccgg tgcaagatcc cggcagggcg ggtctcggtc agtcactcgg cgcagcatag agtgtggtca ttgcaagagt ctggagaccc ctggtcaccg aagctcgagg atctccaacg ctcgggcaga gactgcgcct tgcctggagg ctctggacgg
24000
24060 24120 24180
24240
24300 24360
24420 24480
24540
24600 24660 24720 24780 24840
24900 24960
25020 25080 25140 25200 25260 25320 25380 25440 25500 25560 25620 25680 25740 25800 25860
gcttcaacga tcaagaccct ggactttcat acttcgtgcc tccagctggc gcctgctcga acccgcagct ctgacgagaa acctacgcaa aatcccgccc gccaattgca tgtacctgga agcgggacct cagccataca tcggacgagg gaagcttcag tcgccggggc gcgccggcgc ggtaagtcca cgctcgtggc atctctttcg ctgcattact gcagccacag agcggccagg caacgaaccc cttccaacag cctcacccgc cgcggaggca tctcgaattt gagatgagca gcggcgggag atgatctcac gcgctcggtg gcagcagggc cctggagcgc catcaagtac caactacctc gtgccactgc gctcagcgag gtccgcggct atttgtacct gcccaaggcg agccatcaac cccccagtcc tgcttcccag tgcttctgga agcaggagga aggccgaaga ccctgaaatc cacccgcccg agtgcccgcc gcgggcacaa cccgccgctt accgtcatct cggcgaccac agacccgcgg ctctcgaccc agcagaggcc agctgtctgt ctcttcagca aggcgggaga aagagattcc cggcccagga aggtcaacgg gccgccgcgc ctgcccgact tcgggcatcc agggagtgcc gcctaccact cgctgcaacc agtcagatta ccagggctga gaggactacc gagctcaccg aaagcccgcc ggcgaggagc gatggcaccc ggaagaggag gatgatggaa ggtggcagac ctccgaaccc cagacccaac gccgccaccg gaacgccata cctgctattc ctacagcccc cacctaggaa cagcagcggc gggagctcag aggagcagga atcacaaaag aatactgcgc aaactacgtc cacgccatac ctactccacc gatccgcgcc tggcggacat tcaccagcca tgccggccac cgccgccgct cggacctcat tctgcacgcc tcggtacctt aactcactcc acgcccacga cctgcgtcat gagagttctt taaacccgct agaaagaagc gaggactggg gactgggagg gcaacaccat agcaccagcg cgtagatggg cagcagcagc gtcgcctgct caccacgggg tactgcagcg gatatcctcc gggagcggtg acacaggatc gctgaaaata cgaagatcag gctcactctt atcgccggcc atgtggagct cgcatgaact cagcgaaacc catctttccc gagcatgctg ttgctgcgcg ctggggccac ggaagacgtg ccaccgctct cgagctgcag ggggctgtgg gatcaggttc cacccagggg gctgaaaaag acccccgccg agcagccgcc acagtcaggc aggacagcag cgccctcggt ctataacctc acaccacagg agcagcagcg tgcaagactg tcgcctttcc gcgacccaga gcgggcaaga ggcgcactgc ttccccactt aaaaacagat cttcggcgca aaagactagc gccgcccagc accagccgca acatgagcgc aaatactgct gagcgcctgc cagaacttca ctgcccagcg tgctacctct agcggcgagg ctagtctgca ggtccctcgc acttccgcct tacgaagacc cacatcctgg
ggtcgggggg
ccgccccagc gccgccgccg agaggaggtt cctagacgag cgcagccccc cgctcctccg aaccggggtc ccagggctac cgggggcaac ccgcaatgtc ggcggcagcg cagcggcagc gcctctcgcc tgtatgccat ctctgcgctc cgctggagga tccgcgccct ccgcccagcc gatgggactc gggaccccac ggaacaggcg
25920 25980 26040 26100 26160 26220 26280 26340 26400 26460 26520 26580 26640 26700 26760 26820 26880 26940 27000 27060 27120 27180 27240 27300 27360 27420 27480 27540 27600 27660 27720 27780
gccatcaccg taccaggaaa cagatgacta cgaccaggta gtgagctctt tcttcgttca tccggcggca cccttctcgg aaggactcgg agacacctcg tactttcagc cagggcgagg cgggagcggg caagatcttt gggctcctgt gaacctcacc cacccccttt ctccggtctc gccgggaacc ccagagcttt actccccggg taccgggttg gtatgaacac aaatcgggct tgtgcctcag gcaggggtcg cctggcggcc aactttcaag gaggctgcgc gcccggagac caattacact caacctgtgg ccacgccccg ccccctccgc actcaggggc taagacacct cgctcggtct cgccccgcca tcggaaccct gacctcccgg cggacggcta agcactgccg tacccgagga ttacctgttc gtccctgtgt gctgtcatct cgccatcctg tgcggtctgc gtggtttaca agctactcca tacgagtgcg ccgggaacag gaccagggcg ctggctcttt ctcaacctcc tggtgtgctg gctcgccgcc ccacccaaga tgcagcgccg cccgagggtg atcgactaca ccctctaact ttcccttttt cctccctctc ccataatctc caccaccgta gcagctcgcg gatgatcaga ccgtccggac ggcgtacctg ccagttcgtg acgctacccc cgactgaatg ccgccacaag gcataccgag cctcatccgg cctaactatc ctgtgctgag tgaacgccac atcggagggc acagcttcga tccacaagaa tcaccggccg ataactccct gagacgtacc taatcaaagt aataactcta cttactctgt tgctgcgcac tgaacaggta ccaaaaaaga accaatgcac aaaacaaaac actctgtcac atgagttatg cccaggcgtg aacccccgaa ctacttccgc ggcggctttc ggccgaggta ggaactttcc actctgcaga gaggagttcg gaccagttca tcaggtgtcg tgcttcgccc gggccggcgc gagtttaccc gcctgcaact tttaataaac cgtcttcacc caagaagtac cggggacgga caccaccctc ctgcacccac cttccccaga ttcgaccctt ttccttgaga ccctttcttc tgattttttt acatctatat catggtccta gattaccttt caccctcgtc tggccagttt cgtcttccag cgatgcggtc tgtggaaaat attggcccgc gtgacgccca gtcacggggc tccagctcaa agctcgccgg cctcgtcctc tgccctcggt ttccgaactt aggcagagca gcggttctgg acggcgtccg tccgtcccct gccctaaccc gctgagatca caccccgacc ctcacctggt gtctccctga caactcttcc ctcacccgcc acaggaggtg gtggggttag tttgttcttt ggaatcaggt ccttatcata ctactgctgg tcgatcctag gaggagcccg aaatgcgtta gcggtctata ggcggacagt atgtacatgt actgggtctt cgccctcgtg ggccgaagtc gcggccgctc cgacgagtcg atccggccgc ggagccccgc ctacttcaac tgacgcggtg gcttcgcctg tgagttctgc cctgaccacc gctagtggag tggattacat gaatctactg aggcccaggc acttcaacgg aagaccagct ctccctacct tgatcgtaaa agctcaggaa gattttttat ccttctacgt gacttctctg ctcagccttc ttgctcaagt gcctgctggc cttgcaatgt ccaatcatga gtgtgtttac ctaagatatt caaaacagta actgctgtat
27840 27900 27960 28020 28080 28140 28200 28260 28320 28380 28440 28500 28560 28620 28680 28740 28800 28860 28920 28980 29040 29100 29160 29220 29280 29340 29400 29460 29520 29580 29640 29700
ggctttcgca gaggcgaatc gcagaatgaa ggttgacacg attccaccct gaatcagtat aaatgatgga cccacaagga cctctcccac ccgctgcccg cccacgccgg gcactaacgc ccgcttgcct taattgactc cgggtaccaa tctcttccgc aagctcgctc acaagatatg cgcttgcgac ctccacggcc tagctccact cctcatcaac gcaaggaaag ttctcccacc cagcagcagc ctacagctct cctacacacc acttacaagc ctgggcgggg gctctggctc cattgtcctg
tttttctttt atcactacgc tttatcgatg tgcaatcacc aatcgaagtg catgtgggaa caagcccaga tgctgggtac ctacatgctg caccaccacc ccatacccgc cgggcccatc cagcgctcat gacccaggag ttcttctttt agaccctaac gctgatgtta tcagggccaa agctcgctgc tcgagattcc gatacccagt tcccccggca gcttccaccc acccacgctt accaccacca agattattga gtgcccgaaa tccagcgatc cccactccaa ctgggaatgt atctgctgcc aaccccgata acagtatgat tcgctctaat aaaagaaaat tccctactaa ccagtggggt aaatttgtcc gccatctgcg tattacgggc catgtagtcg actactacta aaaagcacca ggtgcgacct gaactgttcg gctgtggagc gccactcccg ctctctttct ctggggatgt ccactgatgc tgacactaac acaatgtcac ggtcgtggag tatccccaac tggacaatgg acaacctgga ccaccaccat ctttggtttt ccactcagat agatgccgac aaccagtgga ggtggttcgc tccaccgcag atgatgggat aaattgagac ctgcacggtg gccttgatcg tcaccaccac ccaatgtcac gcaatcaatg atgggcaaaa agcggggaga aggcacttcc ctactactac tgattagcac cagaaaccac acctggagaa ccgttgccct aataccctcc acctgatgct tctgctgcct ccttccccta cgctttacta agctgtggca tggctcaggt caagtaccaa actctatgta agttcgccag caccagcagc ggccagctca ccaccgccca caacatcacc tgcggccgag cataggcatg gcgagccaga ccatagattg atgcctcgca ctatacataa ctaacaccgg cctccttgcg catggtgggc ggttcatttc tctaactctg aatcattaat cactaccacc tactactact aaagccccct cgagctttgc tgaggatgtc gaagcagatc cgattctact gctgctctgt gatctgccgc ccccccggat gcctgcgctc ggagaaaatg agctacttaa tgcaatgcca ggctatgtac cccagaacca agcagcagca tctgccgcta gaaacgacca cccttggctc gtctccgccc atggcgctct ccccccatct gatggcctga ttttcttgta aattcaggca ctttctatct attgcccatg cccgccggca tgctctaacc atcaatgtgc tactggcgac cccactacca actaccacta cgtgctcact ttctgccaat cagcagagct ggtgattcaa ttccacatca atctctgtgg agaaagagaa tttgcagata taacccttgt ttactttcaa ctatctgcaa gcctgttcac cctttggtgg ctacccaagc gcagccacag cccaggccat ccgccaccac ttcaaatggg tcgtcaatga gcctgcttct atagacccat aaaacctact catgttcctt
29760 29820 29880 29940 30000 30060 30120 30180 30240 30300 30360 30420 30480 30540 30600 30660 30720 30780 30840 30900 30960 31020 31080 31140 31200 31260 31320 31380 31440 31500 31560 31620
ctcccacctt ctctcaccct ctaatcacag tacttcagac taatcatgca cctgccagta tgtggaatat gggtcatctg ttgatttggg taattccact ccactgaaat atggacggca gagcgcctca ttttgtctgg agttacaaat accgtcaccc gaagacctct taatcaaaca gtccagttta tctggcggca cgcacccact caaccccgtg tcccttcgtg ggccgagccc cctggacgac aaaaaccaag cgccctcacc atcagaggcc gaccgtgtct cagcaccctc tgacatgcaa cctgcatgtg ttctggggtg tcactgtcta taatcatcgc accacccgca taagactgtg caccacaaaa acccaaatgc tgtcttagtt atggaacgcg gcgacaagtt cagctacttt tcagtaccga atcaggagct taaagcaggc tgcccaccca agcactcggt gcaccctggt ctggaatcaa ttcagcagca aacttcctcc atcttcatgt tacccctatg tctcccgatg ctggtcactt gctggcaacc accaacctca gtagcagccg cccctgacag gaaggcaaac acagtcagtg gcccccattt gtagacagcc ttctacgctg cctgctttac cttcatccag gtaccgagac atctgccttc tctccgcgca tacaacgaaa ttctgcagca atcgatgcca gtacccgttg aacctaacag gcagcgtctc ccgagatctc caaagtcacc gcgccagaag agagaccgag aaagaccctg taaaaagaat cctccttccc acaccctgaa tgttgcagat acacggaaag gattccaaga cccacggcat tcacctctca gcctagaaac ccgctcccct tacaggatgc tggccttgca ccacaccacc acaccaccaa taaatgcact gccgctgtgt ggattggtca tgcattgatt aggaacattg tgatcctctg aaagacatgc agagcgagct ctgtctttgc tgaattaccc tcgttaatca gcggagatga ctagagaggc gttaacctgc tacgagaaga ctggtgctca gggtgtctgc tgcggtctca cacttactta ctcctcccaa gggaatgtca gaagcgcacc cggccctccc aagtcccccc gctcgccctg agatatcacc ctcatccccc ggcggtggcc aaaactcacc aacatcggcc ccttagcaca tggaaaacta gactgtagtt ctcacctgga ccctcactct acatctgtgt cccaacttct catcctgccc ctcctgccgc ctccgaagct cctcataatc cacctttccc acgcccccca ctgacgccct gcaggcaggc accagtgcaa ccggcaacag tggtgggtga actccccctg gagatttagt aaatcagaca ctctggtact gattcttgct aaaacgtctg tccgtccctt ggggtcctgt aaaatgggaa accgctagcc ctaactgtga ggcacctccc ctggccacca ccgctgacgg agcaatggca ggacttaact actggccaag ggtagactgc catctgcagc gcgcctcgca aagactgctc accctcacct ttcacccaac tggctgtatg tacccctact gcacccgaga tcccctacgc agatctagaa ggctgagcaa aagaggcatc ccaccgcctc gaatcccatc tcggggtcca cccctttaac gcaggtctct ccaaacgcct cctgtccctc acgagagctt tcctcacccc ctctgaacct gtggcctctc ctcccctcaa gcacctcagg tcaccatgca aaggccccct ccgctgacag gcttgggtat ttggcgctcc gtcttacgat
31680 31740 31800 31860 31920 31980 32040 32100 32160 32220 32280 32340 32400 32460 32520 32580 32640 32700 32760 32820 32880 32940 33000 33060 33120 33180 33240 33300 33360 33420 33480 33540
aaacggaaca cctagaattg tgtagcttac gtttgttaac atctggaaat tgacactgct aaatccatta tgctaaactg aaatgatgac ttcagagaaa cagcgtttct tgctcagatt ccctcaatac agtgggattt caacattgta taccctcaat ctcatggaac cttctcctac ctgttttatt acacagtagc tgataattaa atcctagtct cgactggctt cacacggtct tcgctcaagt accggctgct aggatagggc cggcaggaaa agcttcctcg gtacagcaca ctcatgccgg tgtcgacccc gccctacaaa agagctgcag ccatttgatg tctgcccaca accaaaaagc atagcaatca aaaactaaac ggaactggcc aagcttacct gatgctaaat gttttatctg gtcctcagat tggaactaca atgcccaacc agtcaggttt ggaactaatg tggaatggaa atcgcccaag ttcaagcaca ttaatagacc ccaccaccac tcaggccgcc taaataacac cctgccgcgc tcacgtcgct ggacgaacgg ggtgatgcag acaacacgcc ttctccgcgc gcaccacgat gaaccaccgc tcatgaacgc ctagagtctc ggggtatgcg cacaaaacaa acttggatgt tagaagttaa atgcgggtga ttggattagg taagctttga tgtggaccac tcacacttgt taaaaggtag ttgatgaaaa gaaaaggtga tcacagcata acttgaatgg aaacaggaga gtaattacat aataaaaagc acaaaatcat cagtagtgca caccatacct ccctccctcc catctggttg caggcgctcg gtccagcggc aggccgcgcc cagcagcgag ggtggtctcc gcagcacctc gttattcatg ccccacgtgg gctggacaca aggtgccctc agttgatgca tctcagcctt taactacaac tatcaaaaca tgggctacag actggattat caacacaggt accagaccca tttgactaaa ccttgcgccc tggagttcta ccttacagag cccaaaaaca ggacaaatcc tgccacagta taatgaaacg atgacgctgt tcaagtcatt aagccccatt tttgattcag caagacacag gtcacagaca tcggtgatgt tgaacctccg tacaaggggg cgaaacatct tccgcgataa acccttatct atcccacagt ccatcgtacc aacattactt aactatgaca aatggtcaac aggcttggac agaggcctct gccaagggtc tttgactcag gactccagca gccatcacag tcccctaact tgcggcagtc atcagtggca ctaagcaatt ggcactgcat cagagccaaa aaacccatga agcacttact ttccaaacca tgatttgatt cttccatctt ctagcttata gaaatcatga aatacacagt tgttcttagg tgataaactc gctgacgcga tagagtcata gctgccgccg tccgcaccgc cgctcaaatc gcagggcgct acaagcgcac ccttgggcat catcaggaaa ttatccttga agggacccct acctgttcac tcatttatga gctcagatac gagccataat taggcaacaa gtagaatcta aggtgttggc cagtaactag cttcccttga ataccaacgc ctgctaaaag ccctcaccat ccatgtcatt actccttcac caatgtgttt agcttaatag gatcagacag tcatcacagg cctctccccc ggttatattc tcccggcagc taactgtgcg atcctcggtc ccgctccgtc ccgcagcatc ggcgcagtag gtatccaaag gtaaatcaag gttgtaattc
33600 33660 33720 33780 33840 33900 33960 34020 34080 34140 34200 34260 34320 34380 34440 34500 34560 34620 34680 34740 34800 34860 34920 34980 35040 35100 35160 35220 35280 35340 35400 35460
accacctccc aaccaagagg tgacaatgca ttggcacaac aggatcatat aggcctcgca tgatcctcca tacggactgc ccggacgtgg tctgcggtct agcgtcgagg gataatatcc gcggcagaca aatattttcc gcggtcaaac gtccaaaaga attttccaat gcggtttacg ctcaagagcg tcttcagaga agatcccttc aaatccccac gctatgctga aaagtgctgg tgctcatgca ctctcaaaca taaataactt agacgggcca accacagaca ggattgtgaa cgcaggcgga aaaaatacat ggtaccagat ccagaacctg gactccaagg acagacacac cccaaggaat cataactcac gtatcgaggc gccgggacga tcatacttct cgccgtctag cgcaccctgg accaccgtag ggaggagcgg aattcttcga tctacggcca cacaccgctc atagacgcgc atctgtctaa ccctccacct cctgtataag gcagggcaag caggaaccag ccagcgtagc ttaaaaaatc ggtagttgca tgacttcgcg aaacattgga cgggcatgcc gctccccggt catcagacaa ggtacagcaa aaacaccaga aaacctctgg cccaccggct ctcgtaaccg gtgcatgcac aacccattct gttgtgcatg gcgggtctcc ccgagatcgt tgaagcagaa ctcgctccgt cttccggatc aataagcaac gcagagatgg aagtaagatc aagcacagac tcaagttgca cggcagcgtc gcaaatccct tcatgtacaa attcaaaatg ctgaacataa atccagagac gccgatgtag aggcaaagcc ggtaagctca gatactgcgt agcctgtctc ggcatagccg catgtcgggg acaaagaaat aacgaccccc aaaaccctgt ttgaacaggg atgcactgca tggatcatcc tttctcatga tgaatcaacg gtcagcgtgt ttctcacagg gttgagcgta ccaggttcgc gtgatagttg tatgtagact acccagccaa gagaaccatg tatcaagtgg aacggcattt gtaaactatg caccaaaccc tatatcaagt gcagcgcatc ggaacattaa tcagacaggt cctatactga gcgtgctgca tcgcgcaaaa ggaaccaaaa aaaacaaaaa acaacaggaa taaaaaaatt gtcatcatgt cgagccacgt ataggaggaa tgctgaggca caccttccac gggaacccgg ggctgctgaa ttagcagctc taaaacccac tgcattccgg gaggtaaagg gtgtcatgga gcgtggcagg tagtacagcc ccgtcttgca gcaatacact ataaaaaact cagcgctccc ctaagatgtt aatgaaaacc agataatttt ccgaccatgc atgattgcaa caaaaattcc ccgaacggac ttatgacgcg tgggcggcga aagctaacac cggaataaca attataaata aaaccacttt ggtccccgtg gagactctgt agcccggagg tcacaaaatt aaatagcgcc caccatcctg gttggaacaa ggcatcgatg ttccctcgtc acagcaggga aaacagcgga gtccctgctg aaagggaacg cctccttgcg actcccgcag ccgcggccct cgctctgcga ttttttaaag ctccactggc ccttaatggc catccggctg cttctctcca caaaaatctg aaattcaggt tctgtcgcgc cagtgaggcc catactcggg gataaaatgc atcataatca cacgattttc aaaaattaat aatcaacata attaacaagt atacacgtct tataatcacc agtaggagaa ctcccgatcc
35520 35580 35640
35700 35760
35820 35880 35940 36000 36060 36120 36180 36240 36300 36360 36420 36480 36540 36600 36660 36720 36780 36840 36900 36960 37020 37080 37140 37200 37260 37320 37380
aaaacaacat aaagcgcttc cacaggagca gccataacaa agacccgagt cttaccagta 37440
aaagaaaaaa gatctctcaa cgcagcacca gcaccaacac ttcgcagtgt aaaaggccaa 37500
gtgccgagag agtatatata ggaataaaaa gtgacgtaaa cgggcaaagt ccaaaaaacg 37560
cccagaaaaa ccgcacgcga acctacgccc cgaaacgaaa gccaaaaaac actagacact 37620
cccttccggc gtcaacttcc gctttcccac gctacgtcac ttcccccggt caaacaaact 37680
acatatcccg aacttccaag tcgccacgcc caaaacaccg cctacacctc cccgcccgcc 37740
ggcccgcccc cggacccgcc tcccgccccg cgccgcccat ctcattatca tattggcttc 37800
aatccaaaat aaggtatatt attgatgatg 37830
<210> 20
<211> 593
<212> PRT
<213> Pan troglodytes
<400> 20
Met Arg Arg Ala Ala Met Tyr Gln Glu Gly Pro Pro Pro Ser Tyr Glu
1 5 10 15
Ser Val Val Gly Ala Ala Ala Ala Ala Pro Ser Ser Pro Phe Ala Ser
20 25 30
Gln Leu Leu Glu Pro Pro Tyr Val Pro Pro Arg Tyr Leu Arg Pro Thr
35 40 45
Gly Gly Arg Asn Ser Ile Arg Tyr Ser Glu Leu Ala Pro Leu Phe Asp
50 55 60
Thr Thr Arg Val Tyr Leu Val Asp Asn Lys Ser Ala Asp Val Ala Ser
65 70 75 80
Leu Asn Tyr Gln Asn Asp His Ser Asn Phe Leu Thr Thr Val Ile Gln
85 90 95
Asn Asn Asp Tyr Ser Pro Ser Glu Ala Ser Thr Gln Thr Ile Asn Leu
100 105 110
Asp Asp Arg Ser His Trp Gly Gly Asp Leu Lys Thr Ile Leu His Thr
115 120 125
Asn Met Pro Asn Val Asn Glu Phe Met Phe Thr Asn Lys Phe Lys Ala
130 135 140
Arg Val Met Val Ser Arg Ser His Thr Lys Glu Asp Arg Val Glu Leu
145 150 155 160
Lys Tyr Glu Trp Val Glu Phe Glu Leu Pro Glu Gly Asn Tyr Ser Glu
165 170 175
Thr Met Thr Ile Asp Leu Met Asn Asn Ala Ile Val Glu His Tyr Leu
180 185 190
Lys Val Gly Arg Gln Asn Gly Val Leu Glu Ser Asp Ile Gly Val Lys
195 200 205
Phe Asp Thr Arg Asn Phe Arg Leu Gly Leu Asp Pro Val Thr Gly Leu
210 215 220
Val Met Pro Gly Val Tyr Thr Asn Glu Ala Phe His Pro Asp Ile Ile
225 230 235 240
Leu Leu Pro Gly Cys Gly Val Asp Phe Thr Tyr Ser Arg Leu Ser Asn
245 250 255
Leu Leu Gly Ile Arg Lys Arg Gln Pro Phe Gln Glu Gly Phe Arg Ile
260 265 270
Thr Tyr Glu Asp Leu Glu Gly Gly Asn Ile Pro Ala Leu Leu Asp Val
275 280 285
Glu Ala Tyr Gln Asp Ser Leu Lys Glu Asn Glu Ala Gly Gln Glu Asp
290 295 300
Thr Ala Pro Ala Ala Ser Ala Ala Ala Glu Gln Gly Glu Asp Ala Ala
305 310 315 320
Asp Thr Ala Ala Ala Asp Gly Ala Glu Ala Asp Pro Ala Met Val Val
325 330 335
Glu Ala Pro Glu Gln Glu Glu Asp Met Asn Asp Ser Ala Val Arg Gly
340 345 350
Asp Thr Phe Val Thr Arg Gly Glu Glu Lys Gln Ala Glu Ala Glu Ala
355 360 365
Ala Ala Glu Glu Lys Gln Leu Ala Ala Ala Ala Ala Ala Ala Ala Leu
370 375 380
Ala Ala Ala Glu Ala Glu Ser Glu Gly Thr Lys Pro Ala Lys Glu Pro
385 390 395 400
Val Ile Lys Pro Leu Thr Glu Asp Ser Lys Lys Arg Ser Tyr Asn Leu
405 410 415
Leu Lys Asp Ser Thr Asn Thr Ala Tyr Arg Ser Trp Tyr Leu Ala Tyr
420 425 430
Asn Tyr Gly Asp Pro Ser Thr Gly Val Arg Ser Trp Thr Leu Leu Cys
435 440 445
Thr Pro Asp Val Thr Cys Gly Ser Glu Gln Val Tyr Trp Ser Leu Pro
450 455 460
Asp Met Met Gln Asp Pro Val Thr Phe Arg Ser Thr Arg Gln Val Ser
465 470 475 480
Asn Phe Pro Val Val Gly Ala Glu Leu Leu Pro Val His Ser Lys Ser
485 490 495
Phe Tyr Asn Asp Gln Ala Val Tyr Ser Gln Leu Ile Arg Gln Phe Thr
500 505 510
Ser Leu Thr His Val Phe Asn Arg Phe Pro Glu Asn Gln Ile Leu Ala
515 520 525
Arg Pro Pro Ala Pro Thr Ile Thr Thr Val Ser Glu Asn Val Pro Ala
530 535 540
Leu Thr Asp His Gly Thr Leu Pro Leu Arg Asn Ser Ile Gly Gly Val
545 550 555 560
Gln Arg Val Thr Val Thr Asp Ala Arg Arg Arg Thr Cys Pro Tyr Val
565 570 575
Tyr Lys Ala Leu Gly Ile Val Ser Pro Arg Val Leu Ser Ser Arg Thr
580 585 590
Phe
<210> 21
<211> 964
<212> PRT
<213> Pan troglodytes
<400> 21
Met Ala Thr Pro Ser Met Met Pro Gln Trp Ser Tyr Met His Ile Ser
1 5 10 15
Gly Gln Asp Ala Ser Glu Tyr Leu Ser Pro Gly Leu Val Gln Phe Ala
20 25 30
Arg Ala Thr Asp Ser Tyr Phe Ser Leu Ser Asn Lys Phe Arg Asn Pro
35 40 45
Thr Val Ala Pro Thr His Asp Val Thr Thr Asp Arg Ser Gln Arg Leu
50 55 60
Thr Leu Arg Phe Ile Pro Val Asp Arg Glu Asp Thr Ala Tyr Ser Tyr
65 70 75 80
Lys Ala Arg Phe Thr Leu Ala Val Gly Asp Asn Arg Val Leu Asp Met
85 90 95
Ala Ser Thr Tyr Phe Asp Ile Arg Gly Val Leu Asp Arg Gly Pro Thr
100 105 110
Phe Lys Pro Tyr Ser Gly Thr Ala Tyr Asn Ser Leu Ala Pro Lys Gly
115 120 125
Ala Pro Asn Ser Cys Glu Trp Glu Gln Glu Glu Thr Gln Thr Ala Glu
130 135 140
Glu Ala Gln Asp Glu Glu Glu Asp Glu Ala Glu Ala Glu Glu Glu Met
145 150 155 160
Pro Gln Glu Glu Gln Ala Pro Val Lys Lys Thr His Val Tyr Ala Gln
165 170 175
Ala Pro Leu Ser Gly Glu Lys Ile Thr Lys Asp Gly Leu Gln Ile Gly
180 185 190
Thr Asp Ala Thr Ala Thr Glu Gln Lys Pro Ile Tyr Ala Asp Pro Thr
195 200 205
Phe Gln Pro Glu Pro Gln Ile Gly Glu Ser Gln Trp Asn Glu Ala Asp
210 215 220
Ala Ser Val Ala Gly Gly Arg Val Leu Lys Lys Thr Thr Pro Met Lys
225 230 235 240
Pro Cys Tyr Gly Ser Tyr Ala Arg Pro Thr Asn Ala Asn Gly Gly Gln
245 250 255
Gly Val Leu Val Glu Lys Asp Gly Gly Lys Met Glu Ser Gln Val Asp
260 265 270
Met Gln Phe Phe Ser Thr Ser Glu Asn Ala Arg Asn Glu Ala Asn Asn
275 280 285
Ile Gln Pro Lys Leu Val Leu Tyr Ser Glu Asp Val His Met Glu Thr
290 295 300
Pro Asp Thr His Ile Ser Tyr Lys Pro Ala Lys Ser Asp Asp Asn Ser
305 310 315 320
Lys Val Met Leu Gly Gln Gln Ser Met Pro Asn Arg Pro Asn Tyr Ile
325 330 335
Gly Phe Arg Asp Asn Phe Ile Gly Leu Met Tyr Tyr Asn Ser Thr Gly
340 345 350
Asn Met Gly Val Leu Ala Gly Gln Ala Ser Gln Leu Asn Ala Val Val
355 360 365
Asp Leu Gln Asp Arg Asn Thr Glu Leu Ser Tyr Gln Leu Leu Leu Asp
370 375 380
Ser Met Gly Asp Arg Thr Arg Tyr Phe Ser Met Trp Asn Gln Ala Val
385 390 395 400
Asp Ser Tyr Asp Pro Asp Val Arg Ile Ile Glu Asn His Gly Thr Glu
405 410 415
Asp Glu Leu Pro Asn Tyr Cys Phe Pro Leu Gly Gly Ile Gly Val Thr
420 425 430
Asp Thr Tyr Gln Ala Ile Lys Thr Asn Gly Asn Gly Asn Gly Gly Gly
435 440 445
Asn Thr Thr Trp Thr Lys Asp Glu Thr Phe Ala Asp Arg Asn Glu Ile
450 455 460
Gly Val Gly Asn Asn Phe Ala Met Glu Ile Asn Leu Ser Ala Asn Leu
465 470 475 480
Trp Arg Asn Phe Leu Tyr Ser Asn Val Ala Leu Tyr Leu Pro Asp Lys
485 490 495
Leu Lys Tyr Asn Pro Ser Asn Val Glu Ile Ser Asp Asn Pro Asn Thr
500 505 510
Tyr Asp Tyr Met Asn Lys Arg Val Val Ala Pro Gly Leu Val Asp Cys
515 520 525
Tyr Ile Asn Leu Gly Ala Arg Trp Ser Leu Asp Tyr Met Asp Asn Val
530 535 540
Asn Pro Phe Asn His His Arg Asn Ala Gly Leu Arg Tyr Arg Ser Met
545 550 555 560
Leu Leu Gly Asn Gly Arg Tyr Val Pro Phe His Ile Gln Val Pro Gln
565 570 575
Lys Phe Phe Ala Ile Lys Asn Leu Leu Leu Leu Pro Gly Ser Tyr Thr
580 585 590
Tyr Glu Trp Asn Phe Arg Lys Asp Val Asn Met Val Leu Gln Ser Ser
595 600 605
Leu Gly Asn Asp Leu Arg Val Asp Gly Ala Ser Ile Lys Phe Glu Ser
610 615 620
Ile Cys Leu Tyr Ala Thr Phe Phe Pro Met Ala His Asn Thr Ala Ser
625 630 635 640
Thr Leu Glu Ala Met Leu Arg Asn Asp Thr Asn Asp Gln Ser Phe Asn
645 650 655
Asp Tyr Leu Ser Ala Ala Asn Met Leu Tyr Pro Ile Pro Ala Asn Ala
660 665 670
Thr Asn Val Pro Ile Ser Ile Pro Ser Arg Asn Trp Ala Ala Phe Arg
675 680 685
Gly Trp Ala Phe Thr Arg Leu Lys Thr Lys Glu Thr Pro Ser Leu Gly
690 695 700
Ser Gly Phe Asp Pro Tyr Tyr Thr Tyr Ser Gly Ser Ile Pro Tyr Leu
705 710 715 720
Asp Gly Thr Phe Tyr Leu Asn His Thr Phe Lys Lys Val Ser Val Thr
725 730 735
Phe Asp Ser Ser Val Ser Trp Pro Gly Asn Asp Arg Leu Leu Thr Pro
740 745 750
Asn Glu Phe Glu Ile Lys Arg Ser Val Asp Gly Glu Gly Tyr Asn Val
755 760 765
Ala Gln Cys Asn Met Thr Lys Asp Trp Phe Leu Ile Gln Met Leu Ala
770 775 780
Asn Tyr Asn Ile Gly Tyr Gln Gly Phe Tyr Ile Pro Glu Ser Tyr Lys
785 790 795 800
Asp Arg Met Tyr Ser Phe Phe Arg Asn Phe Gln Pro Met Ser Arg Gln
805 810 815
Val Val Asp Glu Thr Lys Tyr Lys Asp Tyr Gln Gln Val Gly Ile Ile
820 825 830
His Gln His Asn Asn Ser Gly Phe Val Gly Tyr Leu Ala Pro Thr Met
835 840 845
Arg Glu Gly Gln Ala Tyr Pro Ala Asn Phe Pro Tyr Pro Leu Ile Gly
850 855 860
Lys Thr Ala Val Asp Ser Val Thr Gln Lys Lys Phe Leu Cys Asp Arg
865 870 875 880
Thr Leu Trp Arg Ile Pro Phe Ser Ser Asn Phe Met Ser Met Gly Ala
885 890 895
Leu Thr Asp Leu Gly Gln Asn Leu Leu Tyr Ala Asn Ser Ala His Ala
900 905 910
Leu Asp Met Thr Phe Glu Val Asp Pro Met Asp Glu Pro Thr Leu Leu
915 920 925
Tyr Val Leu Phe Glu Val Phe Asp Val Val Arg Val His Gln Pro His
930 935 940
Arg Gly Val Ile Glu Thr Val Tyr Leu Arg Thr Pro Phe Ser Ala Gly
945 950 955 960
Asn Ala Thr Thr
<210> 22
<211> 578
<212> PRT
<213> Pan troglodytes
<400> 22
Met Lys Arg Thr Lys Thr Ser Asp Glu Ser Phe Asn Pro Val Tyr Pro
1 5 10 15
Tyr Asp Thr Glu Ser Gly Pro Pro Ser Val Pro Phe Leu Thr Pro Pro
20 25 30
Phe Val Ser Pro Asp Gly Phe Gln Glu Ser Pro Pro Gly Val Leu Ser
35 40 45
Leu Asn Leu Ala Glu Pro Leu Val Thr Ser His Gly Met Leu Ala Leu
50 55 60
Lys Met Gly Ser Gly Leu Ser Leu Asp Asp Ala Gly Asn Leu Thr Ser
65 70 75 80
Gln Asp Ile Thr Thr Ala Ser Pro Pro Leu Lys Lys Thr Lys Thr Asn
85 90 95
Leu Ser Leu Glu Thr Ser Ser Pro Leu Thr Val Ser Thr Ser Gly Ala
100 105 110
Leu Thr Val Ala Ala Ala Ala Pro Leu Ala Val Ala Gly Thr Ser Leu
115 120 125
Thr Met Gln Ser Glu Ala Pro Leu Thr Val Gln Asp Ala Lys Leu Thr
130 135 140
Leu Ala Thr Lys Gly Pro Leu Thr Val Ser Glu Gly Lys Leu Ala Leu
145 150 155 160
Gln Thr Ser Ala Pro Leu Thr Ala Ala Asp Ser Ser Thr Leu Thr Val
165 170 175
Ser Ala Thr Pro Pro Leu Ser Thr Ser Asn Gly Ser Leu Gly Ile Asp
180 185 190
Met Gln Ala Pro Ile Tyr Thr Thr Asn Gly Lys Leu Gly Leu Asn Phe
195 200 205
Gly Ala Pro Leu His Val Val Asp Ser Leu Asn Ala Leu Thr Val Val
210 215 220
Thr Gly Gln Gly Leu Thr Ile Asn Gly Thr Ala Leu Gln Thr Arg Val
225 230 235 240
Ser Gly Ala Leu Asn Tyr Asp Thr Ser Gly Asn Leu Glu Leu Arg Ala
245 250 255
Ala Gly Gly Met Arg Val Asp Ala Asn Gly Gln Leu Ile Leu Asp Val
260 265 270
Ala Tyr Pro Phe Asp Ala Gln Asn Asn Leu Ser Leu Arg Leu Gly Gln
275 280 285
Gly Pro Leu Phe Val Asn Ser Ala His Asn Leu Asp Val Asn Tyr Asn
290 295 300
Arg Gly Leu Tyr Leu Phe Thr Ser Gly Asn Thr Lys Lys Leu Glu Val
305
310
315
320
Asn Ile Lys Thr Ala Lys Gly Leu Ile Tyr Asp Asp Thr Ala Ile Ala
325 330 335
Ile Asn Ala Gly Asp Gly Leu Gln Phe Asp Ser Gly Ser Asp Thr Asn
340 345 350
Pro Leu Lys Thr Lys Leu Gly Leu Gly Leu Asp Tyr Asp Ser Ser Arg
355 360 365
Ala Ile Ile Ala Lys Leu Gly Thr Gly Leu Ser Phe Asp Asn Thr Gly
370 375 380
Ala Ile Thr Val Gly Asn Lys Asn Asp Asp Lys Leu Thr Leu Trp Thr
385 390 395 400
Thr Pro Asp Pro Ser Pro Asn Cys Arg Ile Tyr Ser Glu Lys Asp Ala
405 410 415
Lys Phe Thr Leu Val Leu Thr Lys Cys Gly Ser Gln Val Leu Ala Ser
420 425 430
Val Ser Val Leu Ser Val Lys Gly Ser Leu Ala Pro Ile Ser Gly Thr
435 440 445
Val Thr Ser Ala Gln Ile Val Leu Arg Phe Asp Glu Asn Gly Val Leu
450 455 460
Leu Ser Asn Ser Ser Leu Asp Pro Gln Tyr Trp Asn Tyr Arg Lys Gly
465 470 475 480
Asp Leu Thr Glu Gly Thr Ala Tyr Thr Asn Ala Val Gly Phe Met Pro
485 490 495
Asn Leu Thr Ala Tyr Pro Lys Thr Gln Ser Gln Thr Ala Lys Ser Asn
500 505 510
Ile Val Ser Gln Val Tyr Leu Asn Gly Asp Lys Ser Lys Pro Met Thr
515 520 525
Leu Thr Ile Thr Leu Asn Gly Thr Asn Glu Thr Gly Asp Ala Thr Val
530 535 540
Ser Thr Tyr Ser Met Ser Phe Ser Trp Asn Trp Asn Gly Ser Asn Tyr
545 550 555 560
Ile Asn Glu Thr Phe Gln Thr Asn Ser Phe Thr Phe Ser Tyr Ile Ala
Gln Glu
565 570 575
ФОРМУЛА ИЗОБРЕТЕНИЯ
1. Способ индукции иммунного ответа у субъекта, включающий:
(1) введение полипептидного Rvl 196-родственного антигена субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген; или
(2) введение полипептидного RvO 125-родственного антигена субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbift антиген.
2. Способ индукции иммунного ответа у субъекта, включающий:
(1) введение аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, с последующим введением полипептидного Rvl 196-родственного антигена субъекту; или
(2) введение аденовируса нечеловекообразных обезьян, кодирующего Rv0125-родственный антиген, с последующим введением полипептидного RvO 125-родственного антигена субъекту.
3. Способ по п. 1 или 2, включающий:
(1) введение полипептидного Rvl 196-родственного антигена субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген; или
(2) введение аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, с последующим введением полипептидного Rvl 196-родственного антигена субъекту.
4. Способ по п. 1 или 2, включающий:
(1) введение полипептидного Rv0125-poflCTBeHHoro антигена субъекту с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbift антиген; или
(2) введение аденовируса нечеловекообразных обезьян, кодирующего Rv0125-родственный антиген, с последующим введением полипептидного RvO 125-родственного антигена субъекту.
5. Полипептидный Rvl 196-родственный антиген для применения в индукции
иммунного ответа у субъекта, где:
(1) субъекту вводят полипептидный Rvl 196-родственный антиген с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген; или
(2) субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, с последующим введением полипептидного Rvl 196-родственного антигена.
6. Аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный
антиген, для применения в индукции иммунного ответа у субъекта, где:
(1) субъекту вводят полипептидный Rvl 196-родственный антиген с последующим
введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный
антиген; или
(2) субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий
Rvl 196-родственный антиген, с последующим введением полипептидного Rvl 196-
родственного антигена.
7. Применение полипептидного Rvl 196-родственного антигена в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где субъекту вводят полипептидный Rvl 196-родственный антиген с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген.
8. Применение аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где субъекту вводят полипептидный Rvl 196-родственный антиген с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген.
9. Применение полипептидного Rvl 196-родственного антигена в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, с последующим введением полипептидного Rvl 196-родственного антигена.
10. Применение аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, с последующим введением полипептидного Rvl 196-родственного антигена.
11. Полипептидный Rv0125-poflCTBeHHbrii антиген для применения в индукции иммунного ответа у субъекта, где:
(1) субъекту вводят полипептидный Rv0125-poflCTBeHHbnr антиген с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbift антиген; или
(2) субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий КлЮ125-родственный антиген, с последующим введением полипептидного Rv0125-родственного антигена.
12. Аденовирус нечеловекообразных обезьян, кодирующий Ку0125-родственный
антиген, для применения в индукции иммунного ответа у субъекта, где:
(1) субъекту вводят полипептидный КлЮ125-родственный антиген с последующим
введением аденовируса нечеловекообразных обезьян, кодирующего КлЮ125-родственный
антиген; или
(2) субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий
КлЮ125-родственный антиген, с последующим введением полипептидного Rv0125-
родственного антигена.
13. Применение полипептидного RvO 125-родственного антигена в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где субъекту вводят полипептидный Ку0125-родственный антиген с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbrii антиген.
14. Применение аденовируса нечеловекообразных обезьян, кодирующего Rv0125-родственный антиген, в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где субъекту вводят полипептидный Rv0125-poflCTBeHHbnr антиген с последующим введением аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbift антиген.
15. Применение полипептидного RvO 125-родственного антигена в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbnr антиген, с последующим введением полипептидного Rv0125-poflCTBeHHoro антигена.
16. Применение аденовируса нечеловекообразных обезьян, кодирующего Rv0125-родственный антиген, в изготовлении лекарственного средства для индукции иммунного ответа у субъекта, где субъекту вводят аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift антиген, с последующим введением полипептидного Rv0125-poflCTBeHHoro антигена.
17. Способ, применение, полипептид или аденовирус по любому из пп. 1-3 или 510, где полипептидный Rvl 196-родственный антиген содержит последовательность, имеющую по меньшей мере 90% идентичность SEQ Ш NO: 1.
13.
18. Способ, применение, полипептид или аденовирус по любому из пп. 1-3 или 510, где полипептидный Rvl 196-родственный антиген содержит фрагмент SEQ Ш NO: 1 длиной по меньшей мере 200 аминокислот.
19. Способ, применение, полипептид или аденовирус по любому из пп. 1-3 или 510, 17 или 18, где кодируемый Rvl 196-родственный антиген содержит последовательность, имеющую по меньшей мере 90% идентичность SEQ Ш NO: 1.
20. Способ, применение, полипептид или аденовирус по любому из пп. 1-3 или 510, 17 или 18, где кодируемый Rvl 196-родственный антиген содержит фрагмент SEQ Ш NO: 1 длиной по меньшей мере 200 аминокислот.
21. Способ, применение, полипептид или аденовирус по любому из пп. 1, 2, 4 или 11-16, где полипептидный Rv0125-poflCTBeHHbrii антиген содержит последовательность, имеющую по меньшей мере 90% идентичность SEQ Ш NO: 3.
22. Способ, применение, полипептид или аденовирус по любому из пп. 1, 2, 4 или 11-16, где полипептидный Rv0125-poflCTBeHHbift антиген содержит фрагмент SEQ Ш NO: 3 длиной по меньшей мере 150 аминокислот.
23. Способ, применение, полипептид или аденовирус по любому из пп. 1, 2, 4 или 11-16, 21 или 22, где кодируемый Rv0125-poflCTBeHHbrii антиген содержит последовательность, имеющую по меньшей мере 90% идентичность SEQ Ш NO: 3.
24. Способ, применение, полипептид или аденовирус по любому из пп. 1-3 или 510, 21 или 22, где кодируемый Rv0125-poflCTBeHHbrii антиген содержит фрагмент SEQ Ш NO: 3 длиной по меньшей мере 150 аминокислот.
25. Способ, применение, полипептид или аденовирус по любому из пп. 1-24, где полипептидный антиген содержит 1500 или менее аминокислотных остатков.
26. Способ, применение, полипептид или аденовирус по любому из пп. 1-25, где кодируемый антиген содержит 1500 или менее аминокислотных остатков.
27. Способ, применение, полипептид или аденовирус по любому из пп. 1-26, где предоставлены полипептидный антиген, содержащий Rvl 196-родственный антиген, и полипептидный антиген, содержащий Rv0125-poflCTBeHHbrii антиген.
28. Способ, применение, полипептид или аденовирус по любому из пп. 1-27, где предоставлены аденовирус, кодирующий Rvl 196-родственный антиген, и аденовирус, кодирующий Rv0125-poflCTBeHHbift антиген.
29. Способ, применение, полипептид или аденовирус по любому из пп. 1-27, где аденовирус кодирует Rvl 196-родственный антиген и Rv0125-poflCTBeHHbift антиген.
13.
30. Способ, применение, полипептид или аденовирус по любому из пп. 1-29, где полипептидный антиген содержит последовательность, имеющую по меньшей мере 90% идентичность SEQ Ш N0: 6.
31. Способ, применение, полипептид или аденовирус по любому из пп. 1-29, где полипептидный антиген содержит фрагмент SEQ Ш N0: 6 длиной по меньшей мере 450 аминокислот, например аминокислоты 2-723 из SEQ Ш N0: 6.
32. Способ, применение, полипептид или аденовирус по любому из пп. 1-30, где кодируемый антиген содержит последовательность, имеющую по меньшей мере 90% идентичность SEQ Ш NO: 6.
33. Способ, применение, полипептид или аденовирус по любому из пп. 1-30, где кодируемый антиген содержит фрагмент SEQ Ш NO: 6 длиной по меньшей мере 450 аминокислот, например аминокислоты 2-723 SEQ Ш NO: 6.
34. Способ, применение, полипептид или аденовирус по любому из пп. 1-33, где субъект представляет собой человека.
35. Способ, применение, полипептид или аденовирус по любому из пп. 1-34, где полипептид и аденовирус вводят внутримышечно.
36. Способ, применение, полипептид или аденовирус по любому из пп. 1-35, где полипептид и аденовирус вводят в диапазоне доз 400-600 мкл включительно.
37. Способ, применение, полипептид или аденовирус по любому из пп. 1-36, где диапазон доз полипептида составляет 1-100 мкг включительно.
38. Способ, применение, полипептид или аденовирус по любому из пп. 1-37, где диапазон доз аденовируса составляет от 1х105 до 1х1015 вирусных частиц включительно.
39. Способ, применение, полипептид или аденовирус по любому из пп. 1-38, где полипептидный антиген представлен в композиции, которая дополнительно содержит адъювант.
40. Способ, применение, полипептид или аденовирус по п. 39, где адъювант содержит агонист TLR (Toll-подобного рецептора) и/или иммунологически активный сапонин.
41. Способ, применение, полипептид или аденовирус по п. 40, где адъювант содержит 3D-MPL (З-О-деацилированный монофосфориллипид А).
42. Способ, применение, полипептид или аденовирус по п. 40 или 41, где адъювант содержит QS21.
43. Способ, применение, полипептид или аденовирус по п. 42, где адъювант содержит 3D-MPL и QS21 в липосомальной композиции.
13.
44. Способ, применение, полипептид или аденовирус по п. 42 или 43, где полипептидный антиген представлен в композиции, которая содержит от 12,5 до 75 микрограмм 3D-MPL включительно и от 12,5 до 75 микрограмм QS21 включительно.
45. Способ, применение, полипептид или аденовирус по любому из пп. 1-44, где промежуток времени между введениями находится в диапазоне от одной недели до трех месяцев включительно.
46. Способ, применение, полипептид или аденовирус по любому из пп. 1-45 для профилактики, лечения или уменьшения интенсивности инфекции, вызванной микобактериями, такими как Mycobacterium tuberculosis.
47. Способ, применение, полипептид или аденовирус по п. 46, для профилактики инфекции микобактериями, такими как Mycobacterium tuberculosis.
48. Способ, применение, полипептид или аденовирус по п. 46 для лечения инфекции микобактериями, такими как Mycobacterium tuberculosis.
49. Способ, применение, полипептид или аденовирус по любому из пп. 1-47, где субъект не инфицирован.
50. Способ, применение, полипептид или аденовирус по любому из пп. 1-46 или 48, где субъект имеет латентную инфекцию.
51. Способ, применение, полипептид или аденовирус по любому из пп. 1-46 или 48, где субъект имеет активную инфекцию.
52. Способ, применение, полипептид или аденовирус по любому из пп. 1-49, где субъект предварительно вакцинирован БЦЖ (бацилла Кальметта-Герена).
53. Способ, применение, полипептид или аденовирус по любому из пп. 1-49, где иммунный ответ включает CD4 Т-клетки, экспрессирующие 1ИчГ(интерферон)-гамма, ТЖРХфактор некроза опухоли)-альфа и 1Ь(интерлейкин)-2.
54. Способ, применение, полипептид или аденовирус по любому из пп. 1-53, где аденовирус представляет собой аденовирус шимпанзе.
55. Способ, применение, полипептид или аденовирус по п. 54, где аденовирус является репликативно-дефектным.
56. Способ, применение, полипептид или аденовирус по п. 54 или 55, где аденовирус представляет собой ChAd3.
57. Способ, применение, полипептид или аденовирус по п. 54 или 55, где аденовирус представляет собой ChAd63.
58. Способ, применение, полипептид или аденовирус по любому из пп. 54-57, где аденовирус содержит функциональную инактивацию (такую как делеция) по меньшей
13.
мере генов El и Е4, возможно с функциональной инактивацией (такой как делеция) ЕЗ, в сочетании с заменой гена Ad5E4orf6.
59. Способ, применение, полипептид или аденовирус по любому из пп. 1-58, где полипептидный Rvl 196-родственный антиген представлен в композиции, которая по существу не содержит аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, в частности по существу не содержит аденовирус нечеловекообразных обезьян, кодирующий микобактериальный антиген, в частности по существу не содержит никакой аденовирус нечеловекообразных обезьян, особенно по существу не содержит никакой аденовирус, кодирующий микобактериальный антиген (например по существу не содержит никакой аденовирус).
60. Способ, применение, полипептид или аденовирус по любому из пп. 1-58, где полипептидный RvO 125-родственный антиген представлен в композиции, которая по существу не содержит аденовирус нечеловекообразных обезьян, кодирующий Rv0125-родственный антиген, например по существу не содержит аденовирус нечеловекообразных обезьян, кодирующий микобактериальный антиген, в частности по существу не содержит никакой аденовирус нечеловекообразных обезьян, особенно по существу не содержит никакой аденовирус, кодирующий микобактериальный антиген (например по существу не содержит никакой аденовирус).
61. Способ, применение, полипептид или аденовирус по любому из пп. 1-58, где полипептидный Rvl 196-родственный антиген представлен в композиции, которая не содержит аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, например не содержит аденовирус нечеловекообразных обезьян, кодирующий микобактериальный антиген, в частности не содержит никакой аденовирус нечеловекообразных обезьян, особенно не содержит никакой аденовирус, кодирующий микобактериальный антиген (например не содержит никакой аденовирус).
62. Способ, применение, полипептид или аденовирус по любому из пп. 1-58, где полипептидный RvO 125-родственный антиген представлен в композиции, которая не содержит аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift антиген, например не содержит аденовирус нечеловекообразных обезьян, кодирующий микобактериальный антиген, в частности не содержит никакой аденовирус нечеловекообразных обезьян, особенно не содержит никакой аденовирус, кодирующий микобактериальный антиген (например не содержит никакой аденовирус).
63. Способ, применение, полипептид или аденовирус по любому из пп. 1-62, где аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген,
59.
представлен в композиции, которая по существу не содержит полипептидный Rvl 196-родственный антиген, например по существу не содержит полипептидный микобактериальный антиген, в частности, по существу не содержит никакие другие антигены.
64. Способ, применение, полипептид или аденовирус по любому из пп. 1-62, где аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbnr антиген, представлен в композиции, которая по существу не содержит полипептидный Rv0125-родственный антиген, например по существу не содержит полипептидный микобактериальный антиген, в частности по существу не содержит никакие другие антигены.
65. Способ, применение, полипептид или аденовирус по любому из пп. 1-62, где аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, представлен в композиции, которая не содержит полипептидный Rvl 196-родственный антиген, например не содержит полипептидный микобактериальный антиген, в частности не содержит никакие другие антигены.
66. Способ, применение, полипептид или аденовирус по любому из пп. 1-62, где аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbnr антиген, представлен в композиции, которая не содержит полипептидный Rv0125-poflCTBeHHbift антиген, например не содержит полипептидный микобактериальный антиген, в частности не содержит никакие другие антигены.
67. Способ, применение, полипептид или аденовирус по любому из пп. 1-66, где полипептидный Rvl 196-родственный антиген не вводят в течение одних суток (например двух, трех или шести суток) от аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, например аденовируса нечеловекообразных обезьян, кодирующего Rvl 196-родственный антиген, например аденовируса нечеловекообразных обезьян, кодирующего микобактериальный антиген (например любого аденовируса нечеловекообразных обезьян), в частности любого аденовируса, кодирующего микобактериальный антиген (например любого аденовируса).
68. Способ, применение, полипептид или аденовирус по любому из пп. 1-66, где полипептид Rv0125-poflCTBeHHbift антиген не вводят в течение одних суток (например двух, трех или шести суток) от аденовируса нечеловекообразных обезьян, кодирующего Rv0125-poflCTBeHHbift антиген, такого как аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift антиген, например аденовирус нечеловекообразных обезьян, кодирующий микобактериальный антиген (такой как любой аденовирус
64.
нечеловекообразных обезьян), в частности любой аденовирус, кодирующий микобактериальный антиген (такой как любой аденовирус).
69. Способ, применение, полипептид или аденовирус по любому из пп. 1-68, где аденовирус нечеловекообразных обезьян, кодирующий Rvl 196-родственный антиген, не вводят в течение одних суток (например двух, трех или шести суток) от полипептидного Rvl 196-родственного антигена, например любого полипептидного микобактериального антигена (например любых других антигенов).
70. Способ, применение, полипептид или аденовирус по любому из пп. 1-68, где аденовирус нечеловекообразных обезьян, кодирующий Rv0125-poflCTBeHHbift антиген, не вводят в течение одних суток (например двух, трех или шести суток) от полипептидного Rv0125-poflCTBeHHoro антигена, например любого полипептидного микобактериального антигена (например любых других антигенов).
71. Аденовирус нечеловекообразных обезьян, содержащий трансген, кодирующий Rvl 196- или Rv0125-poflCTBeHHbift антиген.
72. Аденовирус нечеловекообразных обезьян по п. 71, содержащий по меньшей мере пентон с SEQ ID N0: 10, гексон с SEQ ID N0: 11 или фибриллы с SEQ ГО N0: 12.
73. Аденовирус нечеловекообразных обезьян по п. 72, содержащий пентон (SEQ ГО N0: 10), гексон (SEQ ID NO: 11) и белок фибриллы (SEQ ГО N0: 12) из ChAd3.
74. Аденовирус нечеловекообразных обезьян по п. 71, содержащий по меньшей мере пентон с SEQ ГО N0: 15, гексон с SEQ ID N0: 16 или фибриллу с SEQ ГО N0: 17.
75. Аденовирус нечеловекообразных обезьян по п. 74, содержащий пентон (SEQ ГО N0: 16), гексон (SEQ ID N0: 17) и белок фибриллы (SEQ ГО N0: 18) из ChAd63.
76. Аденовирус нечеловекообразных обезьян по любому из пп. 71-75, где кодируемый антиген содержит последовательность, имеющую по меньшей мере 90% идентичность SEQ ГО N0: 6.
77. Аденовирус нечеловекообразных обезьян по любому из пп. 71-76, где кодируемый антиген содержит фрагмент SEQ ГО N0: 6 длиной по меньшей мере 450 аминокислот, например 2-723 из SEQ ГО N0: 6.
78. Аденовирус нечеловекообразных обезьян по любому из пп 71-77, который представляет собой репликативно-дефицитный аденовирус.
79. Аденовирус нечеловекообразных обезьян по любому из пп. 71-78, содержащий функциональную инактивацию (например делецию) гена Е1.
80. Аденовирус нечеловекообразных обезьян по любому из пп. 71-79, содержащий функциональную инактивацию (например делецию) гена Е4.
69.
81. Аденовирус нечеловекообразных обезьян по любому из пп 71-80, содержащий функциональную инактивацию (например делецию) гена ЕЗ.
82. Аденовирус нечеловекообразных обезьян по любому из пп 71-81, содержащий замену гена Ad5E4orf6.
83. Аденовирус нечеловекообразных обезьян по п. 71, состоящий из последовательности SEQ Ш N0: 13.
84. Аденовирус нечеловекообразных обезьян по п. 71, состоящий из последовательности SEQ Ш N0: 18.
85. Полинуклеотид, содержащий SEQ Ш N0: 8 или содержащий его вырожденный вариант, имеющий по меньшей мере 95% идентичность SEQ Ш N0: 8.
86. Полинуклеотид по п. 85, содержащий SEQ Ш N0: 8 или содержащий вырожденный вариант, имеющий по меньшей мере 98% идентичность SEQ Ш N0: 8.
87. Полинуклеотид по п. 85, состоящий из SEQ Ш N0: 8 или состоящий из вырожденного варианта, имеющего по меньшей мере 95% идентичность SEQ IDNO: 8.
88. Полинуклеотид по п. 85, состоящий из SEQ Ш N0: 8 или состоящий из вырожденного варианта, имеющего по меньшей мере 98% идентичность SEQ IDNO: 8.
89. Полинуклеотид по п. 85, содержащий SEQ Ш N0: 8.
90. Полинуклеотид по п. 89, состоящий из SEQ Ш N0: 8.
85.
Новые способы индукции иммунного ответа
Фиг. 2
Медианный М72-специфическй CD4 Т-клеточный ответ с использованием ChAd63
(среда удалена)
1.8
1.6
1.4
я 1-2 Z
I- 1
0.8 0,6 0.4 0.2 О
-"-M72-ChAd63
10Л10 в.ч./мышь
-*-M72-ChAd63
10л9 в.ч./мышь
-*-M72-ChAd63
10л8 в.ч./мышь
M72-ChAd63 10л7 в.ч./мышь
7dpi 14dpi
Временная точка
Новые способы индукции иммунного ответа
Фиг. 4
Медианный М72-специфическй CD8 Т-клеточный ответ с использованием СпАсШЗ
(среда удалена)
-*-M72-ChAd63
10*10 В.Ч./МЬ|ШЬ
4fl-M72-ChAd6310A9 в.ч./мышь
M72-ChAd6310"8
в.ч./мышь
-w-M72-ChAd63 10*7
в.ч./мышь
з о М72-специфический Т-КПРТПМНЫЙ ответ аденовирусных векторов шимпанзе, экспрессирующих М72, в WBLO
эталон
ChAd/Prot
Prot/ChAd
h- 2.5
2.0
I "
N 1 1.=
"Пул 1 пПул 2 О Пул 3 О Пул 4 _ Медиана
¦1.0
14PI
Группа 1
M72/AS01E
0.080 0.189 0,143 0.130 0.137
14PII
Группа 1:2х
M72/AS01E
0.250
0.486 0.624 0.288 0.387
О й
14PI
Группа 2:М72 2~ ChAd310A8VP
0.516
0.554 0.674 0.428 0.535
14PII
14PI
Группа 2:М72
М72 AS01E
1.623 2.Ш 2.833
2.027 2.069
ChAd3 10Л8?Р / r°vnna 3:М72
ChAd6310*8VP
0.065 0.229
0.317
о7з5з"
0.273
14И1
14P1I
. Группа 4 eGFp -
Группа 3:М72 " р
/ М72 AS01E
0.954 1.146 1.175 0.563 1.050
M72 AS01E
0.3484 0.349 0.276 0.422 0.349
ChAd63 10Л8УР Группа 4 eGFp ChAd310A8VP/
ChAd310A8VP
0.000 0.129"
0.000 0.018 0.009
14PI
Группа 5 M72/AS01E
0.097 0.246 0.121 0.161 0.141 14PI1
Группа 5 M72/AS01E /
M72-ChAd3
10"8VP
1.5569
1.131 1.637 0.508 1.344 14PI
Группа 6 M72/AS01E
0.222 0.134 0.288 0.114 0.178
14PII
Группа 6
M72/AS01E /
M72-ChAd63
1QA8VP 0.4783
0.496
0.279
0.419
0.449
ш Е ф
S О
g X
К О
< < о
Я о
х а
о к
о s
о to
ш я Ф д ^ s
временная точка
з.о
М72-специфический CD4 Т-клеточный ответ аденовирусных векторов шимпанзе, экспрессирующие М72, в WBLO
ChAd/ChAd \ комбинации
*- 2.5
2.0
з I
s > ; '1.5
3 |
s о,
О ?
2 1.0
14PII
14Р1
14PI
14PII
0.5
Группа 1:
M72/AS01E M72/AS01E
10Л8УР AS01E
10*8VP
AS01E
0.0
ДПул 1
0.080
0.250
0.361
0.2738
0.581
?Пул 2
0.189
0.486
0.426
0.338
0.707
ОПул 3
0.143
0.624
0.103
0.585
0.582
(c)Пул 4
0.130
0.288
0.093
0.202
0.647
"Медиана
0.137
0.387
0.232
0.306
0.614
Временная точка
14PII
? 14 PI
Группа 12: Группа 12:
M72-AS01E M72-AS01E
0.336 0.047 1.116
0.320
0.328
/ М72- / М72-ChAd3 CoAdChAd3 CoAd
0.9973
0.843 0.494 0.605
0.724
Пул 1
О г, "
Пул 2 ° Пул 3 О Пул 4 - Медиана
14P1I
Группа 13: M72-AS01E / eGFP-ChAd3
Combo
0.7814 0.166
0.729 0.286 0.507
ш E CD
S О g Я
s о
ч; о
я о
я а
о Е
я to
и я
CD К
^ s
0J s
45,0
40.0
М72-специфический ответ CD8 Т-клеток на аденовирусные векторы шимпанзе, экспрессирующие М72, в WBLO
ChAd/Prot 0 Prot/ChAd
эталон
35.0
- 30.0
25.0
ЛПул 1 °Пул 2 ОПул 3 (c)Пул 4 _Медиана
20.0
15.0
Временная точка
45 о М72-специфический CD8 Т-клеточный ответ аденовирусных векторов шимпанзе, экспрессирующих М72, в WBLO
0.0
Эталон
ChAd/ChAd
комбинации
S 5.0
и о.о
J 5 о.о
Пуп 1 °Пул2 ОПулЗ О Пул 4 _ Медиана
5.0
0.0
в д й
О О о о о о
О A а
т 50 I 0.0
14Р1 lBll i
Группа 1: Группа1:2х M72/AS01E M72/AS01E 14PI 14РН
1QA8VP
AS01E
Группа 7: Группа 7:2х M72-ChAd3 M72-ChAdi
10A8VP AS01E
14PI
14РН ! 14PI 14PII
Группа 8:
Группа 8: M72-ChAd; Группа 9:
M72-ChAd3 10A8VP / M72-ChAd3
10A8VP M72-ChAd3 10Л8?Р
1QA8VP
11.14912 6.977
16.281 13.007
14.583 21.233
11.676 7.945
13.129 10.476
14PI
Группа 10:
М72-ChAd63 10A8VP
6.957 12.559 14.758
7.066 9.813 14PII
Группа 10:' М72-
ChAd63
10A8VP /
M72-ChAd3
10A8VP
12.61668
25.729
18.736
18.022
18.379 14PI
Группа 11: M72-AS01E
/М72-ChAd3 Combo
10.495 11.222 18.801 11.833 11.528
14PII
14PI
14PI
14Р1!
Й 14PII
13.5277 13.957 12.970
14.063 13.742
14.928 7.857 18.409 7.807 11.393
0.35566 0.104
10.815 0.064 0.230
Группа 11: Группа 12: Группа 12: Группа 13: Группа 13:
M72-AS01E М72- M72-AS01E M72-AS01E M72-AS01E
/М72- AS01E./ /М72- /ебЕР- / eGFP-
ChAd3 M72-ChAd3 ChAd3 ChAd3 ChAd3
Combo CoAd CoAd Combo Combo
12.16355 0.272
15.350 0.213
0.032 0.016
15.786 0.046
13.757 0.129
S О g Я S О
ч; о
я о
я а
о Е
о s
Временная точка
и я
CD Д ^ S
60.0
М72-специфический CD8 Т-клеточный ответ аденовирусных векторов шимпанзе, экспрессирующих М72,
в легких в точке 14PII
50.0
Пул 1
3 I
40.0
30.0
Пул 2
Пул 3
Пул 4
Медиана
2.5
Профиль цитокинов М72-специфического CD4 Т-клеточного ответа в WBLO в точке 141 у иммунизированных мышей
CB6F1
2.0
1.5
III IL2/IFNg/TNFa IFNg/TNFa
Ш IL2/TNFa
¦ IL2/!FNg TNFa IFNg
"IL2
2 и 1.0
0.5
0.0
iiiiiiiiiiiiiiiiii
Группа 1: Группа 2: Группа 3: Группа 4: Группа 5: Группа 6: Группа 7: Группа 8: Группа 9: Группа 10: Группа 11: Группа 12: Группа 13:
M72/AS01E M72-ChAd3 M72-ChAd63 eGFP-ChAd3 M72/AS01E M72/AS01E M72-ChAd3 M72-ChAd3 M72-ChAd3 M72-ChAd63 M72-AS01E / M72-AS01E / M72-AS01E /
I0*8VP 10*8VP 10*8VP 10*8VP 10*8VP 10*8VP 10*8VP M72-ChAd3 M72-ChAd3 eGFP-ChAd3
AS01E Combo CoAd Combo
rovnna
% CD4 Т-клеток, экспрессирующих цитокины (WBLO в 141)
IL2
IFNg
TNFa
IL2/IFNg
IL2/TNFa
IFNg/TNFa
IL2/IFNg/ TNFa
Группа 1
0,000
0,000
0,018
0,000
0,072
0,000
0,029
Группа 2
0,011
0,071
0,000
0,032
0,000
0,166
0,225
Группа 3
0,000
0,025
0,017
0,006
0,006
0,035
0,064
Группа 4
0,000
0,000
0,009
0,000
0,000
0,000
0,000
Группа 5
0,016
0,000
0,048
0,000
0,056
0,000
0,000
Группа 6
0,000
0,000
0,000
0,013
0,095
0,000
0,034
Группа 7
0,000
0,002
0,079
0,026
0,000
0,020
0,041
Группа 8
0,000
0,137
0,002
0,000
0,000
0,148
0,362
Группа 9
0,000
0,116
0,000
0,018
0,000
0,106
0,190
Группа 10
0,000
0,027
0,007
0,023
0,000
0,018
0,042
Группа 11
0,000
0,000
0,043
0,000
0,008
0,072
0,091
Группа 12
0,006
0,032
0,012
0,000
0,027
0,060
0,081
Группа 13
0,000
0,000
0,030
0,000
0,059
0,000
0,000
x a
О E
о s
о to
я < <
w я
CD Д
Я S
OJ s
2.5
2.0
Ф1.5
Профиль цитокинов М72-специфического CD4 Т-клеточного ответа в WBLO в 1411 у
иммунизированных мышей CB6F1
Группа 1:2x Группа 2. Группа 3: Группа 4: Группа 5: Группа 6': Группа 7 2х Группа 8: Группа 9: Группа 10: Группа 11: Группа 12: Группа 13:
M72/AS01E M72-ChAd3 M72-ChAd63 eGFP-ChAd3 M72/AS01E / M72/AS01E / M72-ChAd3 M72-ChAd3 M72-ChAd3 M72-ChAd63 M72-AS01E / M72-AS01E / M72-AS01E/
10A8VP/M7210*8VP/M7210*8VP/M72 M72-ChAd3 M72-ChAd63 10A8VP 10*8VP/ 10*8VP/ 10й8VP/ M72-ChAd3 M72-ChAd3 eGFP-ChAd3
AS01E AS01E AS01E 10*8VP 10A8VP AS01E M72-ChAd3 M72-ChAd63 M72-ChAd3 Combo CoAd Combo
r- " 10A8VP 10*8VP 10A8VP
Группа
% CD4 Т-клеток, экспрессирующих цитокины (WBLO в 141)
CD4 IL2
CD4 IFNg
CD4 TNFa
CD4 IL17
CD4 IL2/ IFNg
CD4 IL2/ TNFa
CD4 IL2/ IL17
CD4
IFNg/
TNFa
CD4
IFNg/
IL17
CD4
TNFa/
IL17
CD4 IL2/ IFNg/ TNFa
CD4 IL2/ IFNg/ IL17
CD4 IL2/ TNFa/ IL17
CD4 IFNg/ TNFa/ IL17
CD4
IL2/
IFNg/
TNFa/
IL17
Группа 1
0,000
0,000
0,000
0,011
0,009
0,119
0,000
0,029
0,000
0,000
0,112
0,000
0,000
0,000
0,000
Группа 2
0,005
0,044
0,084
0,000
0,000
0,026
0,000
0,951
0,000
0,000
0,855
0,000
0,000
0,000
0,000
Группа 3
0,014
0,009
0,000
0,016
0,000
0,009
0,000
0,370
0,000
0,000
0,449
0,000
0,000
0,000
0,000
Группа 4
0,001
0,041
0,000
0,036
0,001
0,115
0,000
0,000
0,000
0,000
0,058
0,014
0,000
0,000
0,000
Группа 5
0,000
0,140
0,090
0,018
0,011
0,028
0,000
0,255
0,000
0,000
0,649
0,000
0,000
0,000
0,000
Группа 6
0,009
0,002
0,041
0,027
0,000
0,085
0,000
0,040
0,000
0,000
0,177
0,000
0,000
0,000
0,000
Группа 7
0,000
0,051
0,000
0,000
0,000
0,000
0,000
0,068
0,000
0,000
0,119
0,000
0,000
0,000
0,000
Группа 8
0,033
0,008
0,142
0,047
0,000
0,000
0,000
0,098
0,000
0,000
0,142
0,000
0,000
0,000
0,000
Группа 9
0,000
0,019
0,007
0,007
0,008
0,002
0,000
0,052
0,000
0,000
0,157
0,000
0,000
0,000
0,000
Группа 10
0,022
0,041
0,009
0,043
0,000
0,008
0,000
0,073
0,000
0,000
0,204
0,000
0,000
0,000
0,000
Группа 11
0,000
0,063
0,000
0,019
0,000
0,016
0,000
0,365
0,000
0,000
0,436
0,000
0,000
0,000
0,000
Группа 12
0,000
0,039
0,004
0,027
0,000
0,045
0,000
0,150
0,000
0,000
0,365
0,000
0,000
0,000
0,000
Группа 13
0,028
0,000
0,013
0,013
0,000
0,071
0,000
0,009
0,000
0,000
0,059
0,000
0,000
0,000
0,000
< <
5.0
4.0
Профиль цитокинов М72-специфического CD4 Т-клеточного ответа в легких в 14PII у иммунизированных мышей CB6F1
¦ CD4 IL2/IFNg/TNFa/ltl7
• C.D4 IFNg/F NFa/ILl /
IHCD4IL2/TNFa/IL17
¦ CD4IL2/IFNg/ILl/
:::CD4IL2/IFNg/TNFa
CD4TNFa/IL17
¦I CD4IFNg/IL17
Ш CD4 IFNg/TNFa
Ж CD4IL2/1L17
SCD4IL2/TNFa
CD4 IL2/iFNg
¦ CD41L17
CD4 TNFa
Ж CD4 IFNg
CD4IL2
0.0
Группа 1:2x Группа 2: Группа 3: Группа 4: Группа 5: Группа 6: Группа 7:2х ; M72/AS01E M72-ChAd3 M72-ChAd83 eGFP-ChAd3M72/AS01E / M72/AS01E / M72-ChAd3 10*8VP/M7210*8VP/M7210"8VP/M72 M72-ChAd3 M72-ChAd63 10*8VP AS01E AS01E AS01E 10A8VP 10'8VP AS01E
Группа
Группа 8: Группа 9: Группа 10: Группа 11: Группа 12: Группа 13:: M72-ChAd3 M72-ChAd3 M72-ChAd63 M72-AS01E / M72-AS01E / M72-AS01E /
10*8VP/ 10*8VP/ 10*8VP/ M72-ChAd3 M72-ChAd3 eGFP-ChAd3
M72-ChAd3 M72-ChAd63 M72-ChAd3 Combo CoAd Combo
10*8VP 10*8VP 10A8VP
% CD4 Т-клеток, экспрессирующих цитокины (легкие в 14PII)
CD4IL2
CD4 IFNg
CD4 TNFa
CD4IL17
CD4 IL2/ IFNg
CD4 IL2/ TNFa
CD4 IL2/ IL17
CD4
IFNg/
TNFa
CD4
IFNg/
IL17
CD4
TNFa/
IL17
CD4IL2/
IFNg/
TNFa
CD4IL2/
IFNg/
IL17
CD4IL2/
TNFa/
IL17
CD4 IFNg/ TNFa/ IL17
CD4IL2/ IFNg/ TNFa/ IL17
Группа 1
0,000
0,000
0,000
0,011
0,009
0,119
0,000
0,029
0,000
0,000
0,112
0,000
0,000
0,000
0,000
Группа 2
0,005
0,044
0,084
0,000
0,000
0,026
0,000
0,951
0,000
0,000
0,855
0,000
0,000
0,000
0,000
Группа 3
0,014
0,009
0,000
0,016
0,000
0,009
0,000
0,370
0,000
0,000
0,449
0,000
0,000
0,000
0,000
Группа 4
0,001
0,041
0,000
0,036
0,001
0,115
0,000
0,000
0,000
0,000
0,058
0,014
0,000
0,000
0,000
Группа 5
0,000
0,140
0,090
0,018
0,011
0,028
0,000
0,255
0,000
0,000
0,649
0,000
0,000
0,000
0,000
Группа 6
0,009
0,002
0,041
0,027
0,000
0,085
0,000
0,040
0,000
0,000
0,177
0,000
0,000
0,000
0,000
Группа 7
0,000
0,051
0,000
0,000
0,000
0,000
0,000
0,068
0,000
0,000
0,119
0,000
0,000
0,000
0,000
Группа 8
0,033
0,008
0,142
0,047
0,000
0,000
0,000
0,098
0,000
0,000
0,142
0,000
0,000
0,000
0,000
Группа 9
0,000
0,019
0,007
0,007
0,008
0,002
0,000
0,052
0,000
0,000
0,157
0,000
0,000
0,000
0,000
Группа 10
0,022
0,041
0,009
0,043
0,000
0,008
0,000
0,073
0,000
0,000
0,204
0,000
0,000
0,000
0,000
Группа 11
0,000
0,063
0,000
0,019
0,000
0,016
0,000
0,365
0,000
0,000
0,436
0,000
0,000
0,000
0,000
Группа 12
0,000
0,039
0,004
0,027
0,000
0,045
0,000
0,150
0,000
0,000
0,365
0,000
0,000
0,000
0,000
Группа 13
0,028
0,000
0,013
0,013
0,000
0,071
0,000
0,009
0,000
0,000
0,059
0,000
0,000
0,000
0,000
40.0
35.0
30.0
Профиль цитокинов М72-специфического CD8 Т-клеточного ответа в WBLO в 14PII у
иммунизированных мышей CB6F1
III IL2/lFNg/TNFa Ss IFNg/TNFa m lL2/TNFa
¦ lL2/IFNg
¦ TNFa ш IFNg
¦ IL2
О 25.0 0)
Н 20.0 00
О О
lllllllllllllllllll
iiiiiiiiiiiiiinii
Группа 1: Группа 2: Группа 3: Группа 4: Группа 5: Группа 6: Группа 7:
М72/А501Е M72-ChAd3 M72-CnAd63 eGFP-ChAd3 M72/AS01E M72/AS01E M72-ChAd3
10*8VP 10*8VP 10*8VP 10*8VP
Группа ASOIE
Группа 8: M72-ChAd3
10*8VP
Группа 9: M72-ChAd3 10*8VP
Группа 10: Группа 11:; Группа 12: Группа 13: M72-ChAd63 M72-AS01E / M72-AS01E / M72-AS01E I IfreVP M72-ChAd3 M72-ChAd3 eGFP-ChAd3
Combo CoAd Combo
% CD8 Т-клеток, экспрессирующих цитокины (цельная кровь в 14PII)
IL2
IFNg
TNFa
IL2/IFNg
IL2/TNFa
IFNg/TNFa
IL2/IFNg/ TNFa
Группа 1
0,000
0,009
0,040
0,000
0,000
0,000
0,000
Группа 2
0,005
4,528
0,046
0,047
0,000
6,451
0,749
Группа 3
0,000
4,744
0,041
0,022
0,000
4,155
0,293
Группа 4
0,000
0,000
0,000
0,000
0,000
0,000
0,000
Группа 5
0,000
0,012
0,000
0,000
0,000
0,000
0,000
Группа 6
0,000
0,021
0,009
0,000
0,000
0,019
0,000
Группа 7
0,000
4,694
0,141
0,000
0,000
6,410
0,321
Группа 8
0,000
4,352
0,000
0,038
0,000
5,090
0,410
Группа 9
0,000
5,046
0,180
0,017
0,000
5,064
0,510
Группа 10
0,000
5,515
0,050
0,009
0,000
4,455
0,234
Группа 11
0,000
4,850
0,233
0,000
0,000
6,440
0,182
Группа 12
0,000
4,547
0,118
0,035
0,000
6,545
0,385
Группа 13
0,000
0,000
0,102
0,000
0,000
0,000
0,000
h-1
< <
< <
40.0
35.0
Профиль цитокинов М72-специфического CD8 Т-клеточного ответа в WBLO в 14PII у иммунизированных мышей CB6F1
¦ CD8 IL2/IFNg/TNfa/ILl/
• CD8IFNg/[Nfa/ILl/
II! CD8IL2/TNFa/(L17
¦ CD8IL2/IFNg/IL17
¦ CD8 IL2/IFNg/TNFa
" CD8TNFa/IL17
HI CD8IFNg/IL17
9i CDS IFNg/TNFa
S8CD8IL2/IL17
:::CD8IL2/TNFa
".; CDS 112/IFNg
CD8IL17
¦ CD8TNFa
Ш CDS IFNg
M CD8IL2
% CD8 Т-клеток, экспрессирующих цитокины (цельная кровь в 14PII)
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
IL2
IFNg
TNFa
IL17
IL2/
IL2/
IL2/
IFNg/
IFNg/
TNFa/
IL2/
IL2/
IL2/
IFNg/
IL2/
IFNg
TNFa
IL17
TNFa
IL17
IL17
IFNg/
IFNg/
TNFa/
TNFa/
IFNg/
TNFa
IL17
IL17
IL17
TNFa/
IL17
Группа 1
0,022
0,000
0,073
0,000
0,000
0,013
0,000
0,000
0,000
0,000
0,013
0,000
0,000
0,000
0,000
Группа 2
0,000
1,033
0,358
0,031
0,011
0,014
0,000
5,025
0,000
0,000
0,611
0,000
0,000
0,000
0,000
Группа 3
0,035
0,939
0,207
0,027
0,000
0,000
0,000
4,370
0,000
0,000
0,544
0,000
0,000
0,000
0,000
Группа 4
0,009
0,019
0,010
0,018
0,000
0,000
0,000
0,011
0,003
0,000
0,014
0,000
0,000
0,000
0,000
Группа 5
0,000
5,514
0,238
0,000
0,023
0,000
0,000
21,497
0,004
0,000
1,670
0,000
0,000
0,011
0,000
Группа 6
0,009
3,145
0,208
0,001
0,000
0,000
0,000
11,115
0,009
0,000
0,837
0,000
0,000
0,011
0,000
Группа 7
0,023
1,196
0,271
0,030
0,000
0,000
0,000
8,742
0,021
0,000
0,773
0,000
0,000
0,000
0,000
Группа 8
0,019
2,830
0,401
0,000
0,017
0,000
0,000
8,740
0,002
0,004
0,584
0,000
0,000
0,000
0,000
Группа 9
0,000
1,771
0,522
0,000
0,019
0,000
0,000
9,275
0,000
0,000
1,218
0,000
0,000
0,000
0,000
Группа 10
0,014
3,514
0,346
0,009
0,039
0,006
0,000
12,300
0,008
0,000
1,220
0,000
0,000
0,000
0,000
Группа 11
0,000
1,141
0,318
0,010
0,007
0,007
0,000
10,800
0,000
0,000
1,145
0,000
0,000
0,000
0,000
Группа 12
0,000
1,965
0,204
0,000
0,024
0,000
0,000
8,900
0,000
0,000
0,910
0,000
0,000
0,012
0,000
Группа 13
0,000
0,019
0,148
0,018
0,000
0,006
0,000
0,011
0,013
0,000
0,000
0,000
0,000
0,000
0,000
40.0
0.0
Профиль цитокинов М72-специфического CD8 Т-клеточного ответа в легких в 14 РП у иммунизированных мышей CB6F1
¦ ГО8 H2/!FNg/TNFa/itl7
^ CDS IF Ng/TNF a/Ill/
111 CD8 IL2/TNFa/IL17
ш CD8 lL2/IFNg/IL17
II CDS IL2/IFNg/TNFa
CDS TNFa/IL17
ill CDS IFNg/IL17
"; CDS IF Ng/TNFa
Ш CD 8 IL2/IL17
;ii CDS IL2/TNFa
CD8 IL2/IFNg
¦ CDS IL17
¦ CDS TNFa
Ш CDS IFNg
CDS IL2
Группа 1:2x M72/AS01E
Группа 2:: M72-ChAd3
10A8VP / M72AS01E
Группа 3: Группа 4: Группа 5: Группа 6: Группа 7:2х Группа 8: M72-ChAd63eGFP-ChAd3M72/AS01E /M72/AS01E/ M72-ChAd3 M72-ChAd3
10*8VP/ 10*8VP/ M72-ChAd3 M72-ChAd63 10*8VP 10A8VP/
10*8VP
M72AS01E M72AS01E 10A8VP 10*8VP AS01E M72-ChAd3
Группа
Группа 9: Группа 10: Группа 11: Группа 12: Группа 13: M72-ChAd3 M72-ChAd63 M72-AS01E / M72-AS01E / M72-AS01E / 10*8VP/ 10*8VP/ M72-ChAd3 M72-ChAd3 eGFP-ChAd3 M72-ChAd63 M72-ChAd3 Combo CoAd Combo 10A8VP 10A8VP
% CD8 Т-клеток, экспрессирующих цитокины (легкие в 14PII)
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
CD8
IL2
IFNg
TNFa
IL17
IL2/
IL2/
IL2/
IFNg/
IFNg/
TNFa/
IL2/
IL2/
IL2/
IFNg/
IL2/
IFNg
TNFa
IL17
TNFa
IL17
IL17
IFNg/
IFNg/
TNFa/
TNFa/
IFNg/
TNFa
IL17
IL17
IL17
TNFa/
IL17
Группа 1
0,003
0,001
0,000
0,006
0,004
0,000
0,000
0,007
0,000
0,000
0,014
0,000
0,000
0,000
0,000
Группа 2
0,000
5,514
0,043
0,000
0,140
0,004
0,000
5,038
0,000
0,000
1,190
0,000
0,000
0,000
0,000
Группа 3
0,005
4,198
0,015
0,012
0,077
0,000
0,000
4,324
0,004
0,000
0,728
0,000
0,000
0,000
0,000
Группа 4
0,000
0,015
0,001
0,013
0,013
0,000
0,000
0,009
0,006
0,000
0,042
0,000
0,000
0,000
0,000
Группа 5
0,000
19,541
0,012
0,000
0,351
0,000
0,000
13,197
0,003
0,000
2,192
0,000
0,000
0,003
0,000
Группа 6
0,004
13,756
0,078
0,000
0,233
0,000
0,000
8,007
0,000
0,000
1,550
0,000
0,000
0,000
0,000
Группа 7
0,003
7,149
0,077
0,008
0,125
0,000
0,000
9,360
0,003
0,000
1,253
0,000
0,000
0,003
0,000
Группа 8
0,000
11,930
0,074
0,000
0,186
0,000
0,000
11,598
0,000
0,000
1,605
0,000
0,000
0,000
0,000
Группа 9
0,000
10,236
0,070
0,000
0,229
0,000
0,000
9,624
0,000
0,000
1,860
0,000
0,000
0,002
0,000
Группа 10
0,007
14,468
0,033
0,000
0,209
0,000
0,000
8,383
0,006
0,000
1,357
0,000
0,000
0,006
0,000
Группа 11
0,000
7,477
0,015
0,001
0,108
0,003
0,000
9,159
0,001
0,000
1,245
0,000
0,000
0,000
0,000
Группа 12
0,008
10,488
0,095
0,000
0,248
0,002
0,000
8,624
0,012
0,000
1,595
0,000
0,000
0,002
0,000
Группа 13
0,000
0,010
0,030
0,015
0,000
0,000
0,000
0,018
0,000
0,000
0,006
0,000
0,000
0,000
0,000
< <
Prot/ChAd
ChAd/Chad
10'
Combo
°|о - в-
_о_
С h Ad/Prot О
10'
5 ,
•оооооо¦
' оооооо*
•ооооо•
•ООО-
ООО-
1 о3-
10'
1 1/12
M72/AS01 Е
ChAd3 М72
ChAd63 М72
ChAd3 M72/AS01E GFP
M72/AS01E
ChAd3
M72 AS01 E
ChAd3 M72
ChAd3 M72
ChAd63 M72
ChAd3 M72 M72/AS01E combo
ChAd3 M72 M72/AS01E Co-Ad
1 1
ChAd3 GFP M72/AS01E Co-Ad
M72/AS01 Е
M72/AS01E
M72/AS01E
M72/AS01E ChAd3 M72
ChAd63 M72
ChAd3
M72 AS01 E
ChAd3 M72
ChAd63 M72
ChAd3 M72
ChAd3 M72 M72/AS01E com bo
ChAd3 M72 M72/AS01E Co-Ad
ChAd3 GFP M72/AS01E Co-Ad
'Из-за технического аспекта, число животных/групп составляет от 9 до 12, как указано
ChAcO
фибрилла
AdSEtorfB
гексон n pVI / / ITR-R
ChAd3 M72
О Ш
3618 n.O. ? О
S X
g О
< О
я о
х а
о Е
о s х
о и
ч < <
и я
CD ?
Ч S
си S
рК BghPoiyA hCM/TetO ChAd63 (1 to455)
ГШ L \ Ш2.
гексон
фибрилла
Ad5E4orf6 ГШ R
ChAd63 M72
3097 n.O.
о ш Е ф
S О
S Я S О
д о х а о Е
о s
о и я
S S
(19)
(19)
(19)
III
III
Фиг. 1
Фиг. 1
Фиг. 1
Фиг. 1
Фиг. 1
Фиг. 1
Фиг. 3
Фиг. 3
Фиг. 3
Фиг. 3
Фиг. 3
Фиг. 3
Фиг. 5
Фиг. 5
Фиг. 5
Фиг. 5
Фиг. 5
Фиг. 5
Фиг. 5
Фиг. 5
Фиг. 5
Фиг. 5
Фиг. 6
Фиг. 6
Фиг. 6
Фиг. 6
Фиг. 7
Фиг. 7
Фиг. 7
Фиг. 7
Фиг. 7
Фиг. 7
Фиг. 7
Фиг. 7
Фиг. 7
Фиг. 7
Фиг. 8
Фиг. 8
Фиг. 8
Фиг. 8
Фиг. 8
Фиг. 8
Фиг. 8
Фиг. 8
Фиг. 8
Фиг. 8
Фиг. 9
Фиг. 9
Фиг. 10
Фиг. 10
Фиг. 10
Фиг. 10
Фиг. 11
Фиг. 11
Фиг. 11
Фиг. 11
Фиг. 11
Фиг. 11
Фиг. 11
Фиг. 11
Фиг. 12
Фиг. 12
Фиг. 13
Фиг. 13
Фиг. 14
Фиг. 14
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 15
Фиг. 16
Фиг. 16
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 17
Фиг. 18
Фиг. 18
Фиг. 19
Фиг. 19
Фиг. 21
Фиг. 21
Фиг. 21
Фиг. 21
Фиг. 22
Фиг. 22
Фиг. 23
Фиг. 23
Фиг. 24
Фиг. 24
Фиг. 24
Фиг. 24
Фиг. 24
Фиг. 24
Фиг. 25
Фиг. 25
Фиг. 25
Фиг. 25
Фиг. 25
Фиг. 25
Фиг. 25
Фиг. 25