誘導腫瘤特異性細胞毒性的方法和組合物的製作方法
2023-12-09 02:08:16 2
專利名稱:誘導腫瘤特異性細胞毒性的方法和組合物的製作方法
1.發明領域本發明屬於腫瘤細胞生物學和癌症治療領域。更具體而言,本發明涉及病毒載體在腫瘤細胞中的選擇性特異表達。
2.背景技術2.1 H19基因H19基因是少數已知的人類印記基因之一(Hurst等,1996,自然遺傳學12234-237)。在胚胎發生的最早期,H19在2個染色體等位基因上都表達(DeGroof等,1994,滋養層8285-302)。自此不久,出現父系等位基因沉默,而僅母系遺傳的等位基因被轉錄。
H19在胚胎發生期廣泛表達,並首先被鑑定為通過反式作用基因座raf在肝中和甲胎蛋白協同調節的基因(Pachnis等,1984,美國國家科學院院報815523-5527)。另外,H19已被許多研究組用目的是分離在組織分化期表達的基因的篩選方法獨立克隆。例如,Davis等(1987,細胞51987-1000)在篩選C3H19T1/2細胞的分化過程中早期活性基因時鑑定了H19的小鼠同源物。Pourier等(1991,發育 1131105-1114)發現鼠H19在幹細胞分化期間和植入期表達。在人胎盤滋養層細胞分化中也發現了人H19基因的轉錄(Rachmilewitz等1992,分子生殖發育32196-202)。
儘管H19 RNA的轉錄在整個胎兒期和胎盤發育期許多不同的胚胎組織中發生,H19表達在出生後下調。然而,已有報導H19轉錄在鼠成年肌肉和肝中為相對低水平(Brunkow和Tilghman,1991,基因和發育51092-1101)。在癌細胞中H19也在出生後活化。Ariel等人(1997,分子病理學5034-44)表明來源於出生前H19表達的組織的許多腫瘤中H19表達升高。另外,這些作者發現來源於神經組織的腫瘤尤其是星形細胞瘤和成神經節膠質細胞瘤中有H19 RNA,其中這被已知與H19的表達無關。鑑於大量癌細胞表達H19 RNA,這些作者推測H19是一種癌胚RNA並建議研究作為人惡性腫瘤的腫瘤標誌的H19。
已經克隆和測序了人和鼠H19基因(Brannan等,1990,分子細胞生物學1028-36)。比較人和小鼠H19基因顯示全長77%的核苷酸序列一致性。儘管種間核苷酸同源性的保守性,根據兩種基因的開放讀框可預測非常低的胺基酸序列一致性(同上)。而且,雖然H19 RNA被RNA聚合酶II轉錄,然後拼接和聚腺苷化,但似乎它不被翻譯。反之,發現H19 RNA和28S細胞質RNA有關,導致人們推測H19 RNA可能作為核糖核苷酸蛋白的RNA組分起作用(同上)。
H19的真正生理作用還沒有完全了解。H19能作為一種顯性致死基因起作用;H19轉基因的高異位表達引起小鼠將要出生前的致死性(Brunkow等,上文)。該致死期恰與H19的表達被抑制的時間相一致。另一個方面,在攜帶H19敲除等位基因的雜合或純合的小鼠中,沒有觀察到缺陷(Leighton等,1995,自然37534-39)。敲除母系遺傳的等位基因確實幹擾遺傳連鎖和相反印記IGF-2基因的印記過程;由於增加的出生前IGF-2的表達,得到的小鼠出生時比同窩鼠更大(同上)。因為這2個相反印記基因具有順式作用的調節序列,Leighton和同事們推測H19可能涉及IGF-2基因的印記。
提出的H19基因產物的另一個功能是腫瘤抑制RNA。Hao等人(1993,自然365764-767)報導用H19表達構建體轉染的2種胚胎性腫瘤細胞系,RD和G401,導致在裸鼠中細胞生長阻滯,形態改變和降低致癌性。已注意到上述腫瘤抑制活性與小鼠中觀察到的異位表達的致死性(Hao等,同上)以及敲除母系H19等位基因的小鼠增加體積(Leighton等,同上)的結果一致。然而,H19是腫瘤抑制因子的建議存在爭議。某些結果被報導不能重複,可能存在另一種與H19緊密連鎖的候選腫瘤抑制基因(Areil等,同上)。建議的H19作為腫瘤抑制因子的作用還與以下實驗數據相牴觸,即H19在廣泛種類的腫瘤細胞中活化(如見例如Lustig-Yariv等,1997,癌基因23169-177)。
2.2 條件複製型病毒正常情況下,病毒編碼病毒基因組複製、包裝和釋放(即從感染宿主細胞中產生子代病毒)所需的全部核酸和肽因子。條件複製型病毒是一種僅在特定條件下複製的病毒。
可被制為條件複製的病毒的一個說明性的實例為腺病毒。腺病毒是無包膜的,規則的二十面體。該蛋白外殼(衣殼)由252個殼粒組成,其中240個為六鄰體,12個為五鄰體。已經使用2和5型腺病毒實施了大多數針對腺病毒多肽的詳盡的研究。病毒DNA在2型腺病毒中為23.85×106道爾頓,其大小在不同血清型之間有輕微變化。所述DNA具有末端反向重複,其在各血清型之間具有不同的長度。
複製周期分為早(E)期和晚(L)期。晚期確定病毒DNA複製開始。腺病毒結構蛋白通常在晚期合成。腺病毒感染後,在被大多數血清型感染的細胞中宿主DNA和蛋白的合成受到抑制。2型腺病毒和5型腺病毒的腺病毒裂解周期非常有效,結果導致大約10,000病毒體/每個感染細胞,以及過量病毒蛋白和未整合至病毒體中的DNA。腺病毒早期轉錄是一系列複雜的相關生物化學事件,但實質上必須有病毒DNA複製開始前的病毒RNA的合成過程。
腺病毒家族中全部成員的腺病毒基因組的結構相似,且對於已研究的每一血清型而言,其特異性功能通常定位於同樣的位置。早期胞質信使RNA與四種已確定的,病毒DNA上的非鄰接區互補。這些區域命名為E1-E4。早期轉錄本被分為即早(immediate early)期(ELa),延遲早期(ELb,E2a,E2b,E3和E4)和中期(IVA2.IX)區。
E1a區參與病毒和細胞性基因以及轉錄性再表達序列的轉錄性轉活(transactivation)。E1a基因具有對全部其它早期腺病毒信使RNA重要的控制功能。在正常組織中,為了有效轉錄E1b、E2a、E2b、E3、或E4,需要活化的E1a產物。病毒感染後事件的正常進展中需要E1b區。E1b產物在宿主核內發揮作用。E1b序列內出現的突變表現為後期病毒mRNA的積累的降低以及可在腺病毒感染後正常觀察到的宿主細胞輸送抑制中的損害。E1b是宿主細胞功能改變所需要的,從而加工和傳送移向病毒後期基因產物。然後這些產物導致病毒包裝和病毒體的釋放。E1b生成的19kD蛋白可以阻止細胞調亡。E1b還生成與p53結合的55kD蛋白。
2.3 腫瘤特異的基因治療來自腫瘤有關的基因的調節序列被用於選擇地導向表達在衍生於腫瘤細胞中的自殺基因。例如,在肝細胞癌中誘導甲胎蛋白的表達。Huber等(1991,美國國家科學院院報888039-8043)用來自白蛋白基因或胎兒蛋白基因的控制序列將水痘帶狀皰疹胸腺嘧啶激酶(VZV TK)基因編碼序列在肝癌細胞中導向表達。用含有這些表達構建體之一的逆轉錄病毒載體感染的肝癌細胞表達VZV TK而變得對正常無毒性的藥物原6-甲基嘌呤阿拉伯核苷(araM)敏感。Kaneko等,(1995,癌症研究555283-5287)構建了在甲胎蛋白控調序列控制下表達HSV TK的腺病毒載體。含有該載體的重組腺病毒顆粒被直接注射到在無胸腺裸鼠中產生的衍生於肝細胞癌的腫瘤。接著用更昔洛韋(ganciclovir)腹膜內注射引起衍生於肝細胞癌的腫瘤消退。
Osaki等(1994,癌症研究545258-5261)把一種表達構建體轉染到A549肺癌細胞中,該表達構建體含有連接負責簡單皰疹病毒胸腺嘧啶激酶(HSV TK)的編碼序列的肺癌胚抗原基因的控制序列。所轉染的細胞對更昔洛韋敏感。另外,在裸鼠中來自皮下注射轉染細胞的腫瘤生長被重複的腹膜內注射更昔洛韋所抑制。不過,最近描述該癌胚抗原基因在正常結腸黏膜中表達,因而限制了這些控制序列作為腫瘤特異調節區的有用性(Osaka等,同上)。
美國專利6,087,164和6,306,833(Hochberg等)公開了一種使用H19啟動子來誘導細胞毒性和/或細胞抑制基因產物在癌細胞中的選擇性、癌細胞特異性表達。細胞毒性基因產物一般為毒素(如白喉毒素)、細胞凋亡誘導因子、藥物代謝酶(如胸苷激酶)、反義、核酶和一直特定基因表達的單鏈RNA。
Alemany等(2000,自然生物工程學18723-727)的綜述文章中討論了在用於治療癌症的具有複製能力的病毒工程學上的進步。美國專利5,998,205(Hallenbech等)描述了含有受組織特異性轉錄調節元件調控的基因(如E1a、E1b、E2和E4)的複製所需基因的條件複製型腺病毒載體。由於對於每一組織需要使用另一啟動子,因此腺病毒載體需要針對其將要在其中表達的各自和每一組織進行重新構建。
可以通過很多方法將病毒載體施用於腫瘤。脂質體載體已通過全身給藥途徑而用於治療肺癌(Ramesh等,2001,分子治療3(3)337-350)。含有腫瘤抑制基因的腺病毒載體可通過膀胱內的施用方式用於治療膀胱癌(Lance C.Pagliaro,2000,World J.Uncol.18148-151)。另一項關於膀胱癌的研究報導了皰疹載體的靜脈內施用(OYAMA等,2000,人類基因治療111683-1693)。在美國基因治療協會第4次年會上,報導了一些如下成功的實驗,如腺病毒經動脈內途徑用於結直腸腫瘤(871號摘要),經肌肉內遞送途徑用於糖尿病患者(205號摘要)以及採用基於IL-2的質粒通過全身給藥途徑的基因治療(分子治療3(5),2001,學術出版社)。
本節或本申請任一節中任何參考文件的引用和標誌(identification)均不應理解為承認所屬參考文件可用作本發明的現有技術。
3.發明概述本發明提供了條件複製型病毒載體,所述載體能夠在癌和/或高增殖性細胞中選擇性複製,而基本上不在非癌或高增殖性細胞中複製。所述載體含有操作性與H19轉錄調節序列,更特別為H19啟動子、H19增強子(且啟動子或增強子的亞序列(subsequences)仍然具有轉錄活性)或它們的組合相連的核酸,所述核酸的基因產物為病毒複製所必需。該條件複製型病毒的複製依賴於存在與H19調節序列結合的癌症特異性活化轉錄調節因子,由此使得編碼病毒複製必需基因產物的核酸能在H19表達控制下進行表達。本文使用的病毒複製是指包含病毒基因組的複製、子代病毒顆粒的產生和/或從感染細胞中釋放子代病毒顆粒。
由於癌細胞中存在H19活化轉錄因子,且其基本上不存在於非癌細胞中,編碼病毒複製所必需基因產物的核酸在癌細胞中選擇性表達,導致病毒選擇性複製,由此,選擇性抑制增殖或生長,或導致癌細胞裂解。初始時用所述載體轉染的癌細胞中釋放出來子代能隨後感染鄰近細胞。在鄰近細胞為癌性的且含有H19活化轉錄因子時,病毒將再次複製,抑制或殺死鄰近細胞,並由於腫瘤破壞過程的「旁向(lateral)擴散」而進一步在鄰近癌細胞中擴散以及複製。對非病毒初始轉染的癌細胞破壞性過程的該旁向擴散導致治療性過程的收益增加。本發明的載體以及將其用於選擇性破壞或抑制癌細胞增殖或生長的方法可用於治療多種癌症和高增殖性疾病。
用於本發明的H19調節序列包括但不局限於H19啟動子和增強子的序列,這些序列的轉錄活性片段、以及這些序列的組合。參見,例如
圖1A-1C、3、4、5A-5B和6A-6C(SEQ ID NOS1-6),其為H19啟動子和增強子的序列。H19增強子及其活性部分可與H19啟動子或啟動子的活性部分任意聯合使用。本發明還包括含有所述載體的宿主細胞。本發明的另一個方面是通過施用本發明的載體治療癌症或高增殖性疾病。
根據本發明,可以使用一種或多種編碼病毒複製必需產物的核酸。當使用多於一種必需核酸時,它們的表達可置於單個異源調節序列的控制之下,或分別置於異源調節序列的控制之下。異源調節序列可以是兩個相同的H19調節序列,兩個不同的H19調節序列或一個H19調節序列和另一個非H19調節序列。所述非H19調節序列可以是組織特異性啟動子,或其它癌或腫瘤特異性啟動子,如端粒酶啟動子。
本發明的一個方面涉及治療個體中癌症的方法,包括對需要治療的個體施用條件複製型病毒載體,其中至少一種編碼其複製必需產物的病毒核酸操作性連接於H19調節序列。
本發明的另一個方面涉及條件複製型病毒載體,其中至少一種編碼其複製必需產物的病毒核酸操作性連接於H19調節序列。
而本發明的另一個方面涉及降低癌細胞生長的方法,包括將細胞與有效量的條件複製型病毒載體接觸,其中至少一種編碼其複製必需產物的病毒基因操作性連接於H19調節序列。
本發明的另一個方面還涉及條件複製型病毒載體在製備治療癌症的藥物中的用途,所述載體中至少一種編碼其複製必需產物的病毒基因操作性連接於H19調節序列。
本發明的另一個方面還涉及治療癌症的藥物組合物,包括藥學可接受載體和作為活性成分的條件複製型病毒載體,其中至少一種編碼其複製必需產物的病毒基因操作性連接於H19調節序列。
3.1 定義此處使用的「條件複製型病毒或病毒載體」是指僅能在細胞中表達病毒複製必需產物時在細胞中複製的病毒或病毒載體。在一個示例性實施例中,病毒可通過如下方法而製備為條件複製型病毒滅活編碼複製必需產物基因的天然轉錄調節序列。所述滅活可例如,通過用外源調節序列完全置換天然調節序列、通過全部或部分刪除天然調節序列,通過其它突變,如鹼基置換、插入、反轉或缺失,能夠使得天然調節序列失去活性的方法得以實施。為重新獲得複製能力,將必需基因產物置於異源轉錄調節序列的表達控制下,從而使病毒根據外源轉錄調節序列的活性而發生條件性複製。
此處使用的「治療」並非必須僅指疾病或病情的恢復,還可以指至少症狀進展的抑制、患者病情的好轉和改善、或疾病或病情的症狀的好轉。關於治療癌或高增殖性病情的治療,症狀進展的抑制、患者病情的好轉和改善、或疾病或病情的症狀的好轉可聯合或涉及至少下述之一腫瘤大小或體積的減小;腫瘤生長率的降低;腫瘤大小或體積停滯;轉移灶或繼發腫瘤數量的減少;癌的侵襲性(轉移能力)降低;腫瘤從一個階段進展到下一階段速率的降低;或由癌症或高增殖性疾病所誘導的血管生成的降低。
此處使用的「降低癌細胞的生長」是指降低至少下述之一與對照相比的癌細胞的數量(由可以是壞死、凋亡或其二者組合的細胞死亡所致的);細胞生長率的降低,例如細胞的全部數量可以增加但以與對照未處理的細胞的增加相比較低的水平或較低的速率增加;與對照相比,細胞對周圍環境的侵襲力降低(可通過例如軟瓊脂法測定)即使其全部數量沒有轉變;以及未分化癌細胞向更分化的表型的進展。
為了本發明此處描述的目的,術語「操作性連接於」是指核苷酸序列以能受控於調節序列而得以表達的方式連接於調節序列。
此處使用的「基因產物」是指有能夠由核酸編碼的任何分子,包括但不限於蛋白或其它核酸例如,DNA、RNA、dsRNAi、核酶、DNA酶等。病毒複製必需的基因產物為病毒基因組的天然產物,沒有所述產物該病毒無法複製。下文中所述的基因產物將指「必需基因產物」。
此處使用的「表達」是指編碼興趣物的核苷酸序列的轉錄和相應轉錄本的剪接、加工、穩定化和可選地,翻譯。根據載體的結構表達可以是瞬時的或連續的。
此處使用的「病毒複製」是指包括病毒基因組的複製、子代病毒顆粒的生成和/或從感染細胞中釋放子代病毒顆粒。
3.2 發明目的本發明的一個目的是提供治療個體中癌症或高增殖性疾病的方法,包括按照所述治療所需對個體施以條件複製型病毒載體,其中至少一個編碼其複製必需產物的病毒核酸操作性連接於H19調節序列。本發明的另一目的是提供條件複製型病毒載體,其中至少一個編碼其複製必需產物的病毒核酸操作性連接於H19調節序列。本發明的另一目的是提供降低癌細胞生長的方法,包括將細胞與有效量的條件複製型病毒載體接觸,其中至少一個編碼其複製必需產物的病毒核酸操作性連接於H19調節序列。
本發明的另一目的是提供條件複製型病毒載體在製備治療癌症或高增殖性疾病的藥物中的用途,所述載體中至少一個編碼其複製必需產物的病毒基因操作性連接於H19調節序列。本發明的另一個方面還涉及治療癌症或高增殖性疾病的藥物組合物,包括藥學可接受載體和作為活性成分的條件複製型病毒載體,其中至少一個編碼其複製必需產物的病毒基因操作性連接於H19調節序列。
可參照下面的詳細描述、具體實施方案的示例性實施例和附圖更全面地理解本發明。
4.附圖簡述圖1A-1C.人H19啟動子區的核苷酸序列。顯示從核苷酸位置-837至-7(相對於轉錄起始點)的啟動子區(SEQ ID NO1)。
圖2.用於在H19調節序列控制下表達E1基因產物地條件複製型病毒載體地結構簡圖。基因產物,例如操作性連接於H19調節序列的腺病毒E1a首先被克隆至穿梭載體。得到的質粒被線性化然後與病毒骨架質粒共轉化至細菌細胞例如大腸桿菌。利用抗生素抗性選擇重組體,通過限制性核酸內切酶分析來證實重組。線性化的重組質粒被轉染至適用的細胞系中,來進行病毒包裝,重組病毒通常在7~12日內生成。在這一特定圖中,病毒載體為腺病毒。「左臂」和「右臂」表示穿梭載體和病毒骨架之間的連接同源重組的區域。BmBamHI;RIEcoRI;LITR左手ITR和包裝信號;RITR右手ITR;SpSpeI。
圖3.人H19啟動子片段的核苷酸序列(SEQ ID NO2)。
圖4.0.9kb的H19增強子片段的核苷酸序列(SEQ ID NO3)。
圖5A和5B.2kb的H19增強子片段的核苷酸序列(SEQ ID NO4)。
圖6A-6C.4kb的H19增強子片段的核苷酸序列(SEQ ID NO5)。
圖7.5型腺病毒的基因產物E1a(SEQ ID NO6)、E1b(SEQ IDNO8)、E2a(SEQ ID NO9)和E4(SEQ ID NO10)的編碼核苷酸序列和/或胺基酸序列。
圖8.2型腺病毒的核苷酸序列(SEQ ID NO11)。
圖9.2型腺病毒的基因產物E1a(SEQ ID NO12)、E1b(SEQ IDNO13)、E2a(SEQ ID NO14)和E4(SEQ ID NO15)的胺基酸序列。
圖10.1a型人乳頭瘤病毒基因產物E6(SEQ ID NO16)和E7(SEQID NO18,19)的編碼核苷酸序列和/或胺基酸序列。
圖11.巨細胞病毒即早期區轉錄本的核苷酸序列(SEQ ID NO20)。
圖12.猿猴病毒40的大T抗原的胺基酸序列(SEQ ID NO21)。
5.發明詳述本發明部分基於如下的發現,可以使用在多數腫瘤細胞中活化而基本上不在非腫瘤細胞中活化的H19啟動子使得裂解病毒在腫瘤細胞中複製,從而選擇性殺死癌細胞或減少癌細胞的生長。具體而言,已經發現H19的表達在各種類型的癌瘤中活化,這些腫瘤包括但不局限於膀胱癌、肝細胞癌、成肝細胞癌、成橫紋肌細胞瘤、卵巢癌、頸部癌、肺癌、乳腺癌、頭頸部扁平細胞癌、食管癌、類胸腺癌、星形細胞瘤、成神經節膠質神經瘤和成神經細胞瘤。
因此,在本發明的一個方面中,本發明提供選擇性殺死癌細胞或減少癌細胞的生長的方法和組合物,所述癌細胞優選為在個體體內。本目的通過把一種載體輸送到所述的細胞來完成,所述載體為條件複製型病毒載體,其能在必需基因產物在H19調節元件的表達控制下進行表達時而得以複製。必需基因產物表達時發生的病毒複製倒是癌宿主細胞的死亡或,最小化減少癌宿主細胞的生長。複製的病毒(子代病毒)從被殺死或被感染的細胞釋放至其附近,感染其它鄰近細胞,再次選擇型複製,由此選擇性殺死或減少鄰近癌細胞的生長。「擴散」現象有助於破壞腫瘤。在本發明中,由於H19調節序列的腫瘤特異性活化使得病毒具有複製性,其又可以至少導致癌細胞生長的減少。
H19調節序列包括但不局限於H19啟動子和增強子的全長序列,仍然保持轉錄調節活性的上述二者的亞序列、以及上述任何序列的組合。參見,例如圖1、3和4,5A-5B和6A-6C(SEQ ID NOS1-6),其為H19啟動子和增強子的序列。
下面將描述病毒的示例性實例和可被置於H19調節序列下表達的適用的必需基因產物。
根據本發明,可以使用一個或多個編碼病毒複製必需產物的核酸。當使用多個基本核酸時,例如,腺病毒的E1a和E1b,二者可置於單個異源調節序列下,或分別置於異源調節序列下進行同時表達。異源調節序列可以是兩個相同的H19調節序列,兩個不同的H19調節序列或一個H19調節序列和另一個非H19調節序列。所述非H19調節序列可以是組織特異性啟動子,或其它癌或腫瘤特異性啟動子,如端粒酶啟動子。
5.1 H19基因的調節序列在此描述的是H19調節序列,該調節序列能用於指導異源編碼序列在腫瘤細胞中特異性表達。這些H19的調節序列包括上遊H19啟動子區和/或下遊H19增強子區。一種H19啟動子區的核苷酸序列在圖1A-1C顯示(SEQ ID NO1)。該830個核苷酸的序列從-837延長到帽部位點的-7(如Brannan等的描述,上文)。一個共有的TATA序列出現在核苷酸-27~-35處。2個共有的AP2結合位點(8/9匹配)出現在轉錄起始位點上遊大約-500和-40的核苷酸處。當如在下面更詳細討論的那樣被置於異源基因編碼區的上遊時,大約830個鹼基對的調節區足以指導操作性連接的異源基因在也表達內源H19的癌細胞中表達。另外,另一個位於核苷酸-819至+14位核苷酸的H19啟動子區(圖5,SEQ IDNO2)也足以指導操作性連接的異源基因在癌細胞中表達。對於上述而言,很明顯全長H19啟動子序列的亞序列即片段也具有足夠的H19的調節序列,因此不需要使用全長啟動子序列。
為了提供增強水平的腫瘤細胞特異性的表達,可任選將人H19基因的下遊增強子區加到H19啟動子/異源基因的構建體上。如在第6節以實施例的形式更詳細描述和闡明的,下遊增強子區包含在相對於轉錄起始位點從+6kb延長到+11kb的SacI限制性片段上。根據增強子序列預計,當在H19啟動子控制之下,以反向或正向(相對於內源H19基因中的H19增強子的方向)置於異源基因編碼區的下遊時,該下遊增強子能發揮其作用。另外,含有在圖4、5A-5B和6A-6C(SEQ ID NOS3-5)所示的序列的該增強子片段也可用於促進基因表達。
這些在癌細胞中活化的H19調節序列可被進一步描述(delineated)以獲得所希望腫瘤特異性表達所需的最短序列,以找到仍能保持特異性轉錄調節活性的H19調節元件的最短亞序列。例如,通過添加、替換或缺失可改變啟動子區,然後分析其保留的特異於腫瘤的表達功能。可逐個檢測H19下遊增強子的各個部分增強從H19啟動子轉錄的能力。
用各種化學和酶方法能引起調節序列中的各種改變,這些方法在本領域的技術人員中眾所周知。例如,由限制性位點確定的序列區能被缺失。能用寡核苷酸定點誘變方法以確定的方式改變序列和/或把限制性位點導入到序列特定區中。另外,用諸如Bal 31或ExoIII和S1核酸酶的DNA核酸酶能產生缺失突變體。通過把所述的DNA與核酸酶溫育更長的時間逐步產生調節序列中更大的缺失(見Ausubel等,1989,分子生物學現代技術,見誘變技術綜述)。
評價改變的序列在合適的宿主細胞,尤其是表達H19衍生於癌的細胞(例如膀胱癌細胞,作為一個實例)中指導編碼病毒複製必需產物序列的特異於腫瘤的表達的能力。為進一步用途保留其指導腫瘤特異表達能力並結合到重組表達載體中的任何改變的H19調節序列在本發明的範圍之中。
此處使用的腫瘤特應性或腫瘤選擇性複製是指病毒在癌細胞中的複製是在非癌性相似細胞中複製的至少兩倍。更優選地,在癌細胞中的複製是在非癌性相似細胞中複製的至少5倍、至少10倍、至少25倍、至少50倍、至少100倍、至少500倍、至少1000倍、至少5000倍、至少10,000倍、至少50,000倍、至少100,000倍。可採用本領域技術人員眾所周知的方法測定選擇性複製的水平。一個示例性實例為採用如下數學公式 (見Alemany等,2000,自然生物技術)。
5.2 條件複製型病毒載體和必需基因產物本發明提供了能夠在癌和/或高增殖性細胞中選擇性複製,而在非癌和/或非高增殖性細胞中基本不複製的條件複製型病毒載體。所述載體含有操作性連接於H19轉錄調節序列的核酸,所述核酸的表達產物為病毒複製所必需的。
病毒的示例性實例和可被置於H19調節序列下表達的適用的必需基因產物包括但不局限於,DNA腫瘤病毒和RNA腫瘤病毒。DNA腫瘤病毒的示例性實例通常包括但不局限於,腺病毒、乳頭瘤病毒、巨細胞病毒、皰疹病毒(如Epstein-Barr病毒、帶狀皰疹和單純皰疹)、乳多空病毒(如多瘤和SV40)和肝炎病毒。在另一個實施例方案中,病毒載體為RNA病毒載體,優選為逆轉錄病毒載體。對本領域技術人員來說,將任何潛在的複製性病毒載體製備為條件複製型並根據本說明書所公開的內容進行使用是可顯而易見的。
在一個優選實施方案中,條件複製型病毒腺病毒。腺病毒的核苷酸和胺基酸序列是本領域已知的且是可以獲得的,例如獲自GenBank。例如,GenBank記錄號J01917中公開了來自腺病毒2完整基因組的核苷酸和胺基酸序列。還可以參見圖8,其中描述了腺病毒2的核苷酸序列(SEQID NO11)。Chroboczek等(1992,病毒學186(1)280-285)中公開了來自腺病毒5完整基因組的核苷酸和胺基酸序列。示例性腺病毒必需基因產物包括但不限於E1a、E1b、E2a和E4。圖7、8和9(SEQ ID NOS6-15)中描述了這些基因產物的核苷酸和/或胺基酸序列。
而且,工程化(engineering)條件複製型腺病毒的方法是本領域公知的,包含眾所周知的分子生物學克隆技術。例如,可工程化腺病毒載體以便任意一個或多個E1a、E1b、E2a或E4的調節序列控制的表達可置於此處所述的H19調節序列的控制下。圖2是插入含有操作性連接於E1A的編碼序列的H19調節序列的核酸的簡圖。在該特定實施方案中,腺病毒載體缺失了天然E1a區從而在將該載體引入細胞中時,病毒不會發生複製。將操作性連接於H19調節序列的E1a的編碼序列克隆入穿梭載體,例如,PadTractk-CMV。穿梭載體被線性化,然後與腺病毒骨架質粒例如,pAdEasy-1共轉染,所述質粒不含必需基因產物(該實施方案中具體為E1a)的編碼序列。利用適宜的抗生素抗性選擇重組體,通過限制性分析來證實重組。將重組質粒轉染至適用的腺病毒包裝細胞系中,重組病毒通常在7~12日內生成。示例性載體,pAdTrack-CMV和PAdEasy-1,可商業上獲自Stratagene,LaJolla California。
在另一個實施方案中,條件複製型病毒是人乳頭瘤病毒。人乳頭瘤病毒的核苷酸和胺基酸序列是本領域已知的且是可以獲得的,例如獲自GenBank。例如,GenBank記錄號NC_001356中公開了來自1a型人乳頭瘤病毒完整基因組的核苷酸和胺基酸序列。示例性人乳頭瘤病毒必需基因產物包括但不限於E6和E7區基因產物。圖10(SEQ ID NOS16-19)中描述了這些基因產物的核苷酸和/或胺基酸序列。
而且,工程化條件複製型乳頭瘤病毒的方法是本領域公知的,包含眾所周知的分子生物學克隆技術。例如,可工程化乳頭瘤病毒載體以便任任意一個E6或E7的調節序列控制的表達可置於此處所述的H19調節序列的控制下。與圖2所示相似,乳頭瘤病毒載體缺失了天然E6區從而在將該載體引入細胞中時,病毒不會發生複製。將操作性連接於H19調節序列的E6的編碼序列克隆入穿梭載體。穿梭載體被線性化,然後與乳頭瘤病毒骨架質粒共轉染,所述質粒不含必需基因產物(該實施方案中具體為E6)的編碼序列。利用適宜的抗生素抗性選擇重組體,通過限制性分析來證實重組。將重組質粒轉染至適用的細胞系中,生成病毒子代,即H19調節序列活化的細胞系。
在另一個實施方案中,條件複製型病毒是巨細胞病毒(CMV)。巨細胞病毒的核苷酸和胺基酸序列是本領域已知的且是可以獲得的,例如獲自GenBank。例如,GenBank記錄號X17403中公開了來自1a型巨細胞病毒完整基因組的核苷酸和胺基酸序列。示例性巨細胞病毒必需基因產物包括但不限於即早區基因產物。圖11(SEQ ID NOS20)中描述了所述即早區基因產物的核苷酸和/或胺基酸序列。
而且,工程化條件複製型巨細胞病毒的方法是本領域公知的,包含眾所周知的分子生物學克隆技術。例如,可工程化巨細胞病毒載體以便任任意一個即早期區基因的調節序列控制的表達可置於此處所述的H19調節序列的控制下。與圖2所示相似,巨細胞病毒載體缺失了天然即早期區從而在將該載體引入細胞中時,病毒不會發生複製。將操作性連接於H19調節序列的即早期編碼序列克隆入穿梭載體。穿梭載體被線性化,然後與巨細胞病毒骨架質共轉化,所述質粒不含即早區。利用適宜的抗生素抗性選擇重組體,通過限制性分析來證實重組。將重組質粒轉染至適用的細胞系中,生成病毒子代,即H19調節序列活化的細胞系。
條件複製型病毒的其它示例性實例包括但不局限於,其它DNA腫瘤病毒和RNA腫瘤病毒。DNA腫瘤病毒的示例性實例通常包括但不局限於,皰疹病毒(如Epstein-Barr病毒、帶狀皰疹和單純皰疹)、PAPOVA病毒(如多瘤和SV40)和肝炎病毒。在另一個實施例方案中,病毒載體為RNA病毒載體,優選為逆轉錄病毒載體。對本領域技術人員來說,將任何潛在的複製性病毒載體製備為條件複製型並根據本說明書所公開的內容進行使用是可顯而易見的。
這些示例性病毒的核苷酸和胺基酸序列可獲自GenBank。例如,GenBank記錄號NC_001489,NC_003977和NC_004102中分別公開了A型、B型和C型肝炎病毒完整基因組的核苷酸和胺基酸序列。示例性巨細胞病毒必需基因產物包括但不限於即早區基因產物。圖11(SEQ IDNOS209)中描述了所述即早區基因產物的核苷酸和/或胺基酸序列。GenBank記錄號NC_001806、NC_001798、NC_001348、NC_001345、NC_001347、NC_001664、NC_000898和NC_001716中分別公開了1、2、3、4、5、6、6B和7型人皰疹病毒完整基因組的核苷酸和胺基酸序列。GenBank記錄號V01555中公開了來自Epstein-Barr病毒完整基因組的核苷酸和胺基酸序列。GenBank記錄號NC_001538中公開了來自BK多瘤病毒完整基因組的核苷酸和胺基酸序列。GenBank記錄號NC_001515中公開了來自多瘤病毒完整基因組的核苷酸和胺基酸序列。GenBank記錄號NC_001669中公開了來自猿猴病毒40完整基因組的核苷酸和胺基酸序列。上述GenBank條目中的核苷酸和胺基酸序列全文引入此處作為參考。
相關病毒核酸的實例為編碼病毒載體或病毒複製必需產物的核酸。示例性所述必需基因產物包括但不限於即早區基因產物PAPOVA病毒的T抗原(圖12,SEQ ID NO21)、逆轉錄病毒的聚合酶等。這些基本上包括任何病毒生命周期中必需的基因。
根據本發明,可以使用一個或多個編碼病毒複製必需產物的核酸。當使用多個基本核酸時,例如,腺病毒的E1a和E1b,二者可置於單個異源調節序列下,或分別置於異源調節序列下進行同時表達。異源調節序列可以是兩個相同的H19調節序列,兩個不同的H19調節序列或一個H19調節序列和另一個非H19調節序列。所述非H19調節序列可以是組織特異性啟動子,或其它癌或腫瘤特異性啟動子,如端粒酶啟動子。
根據本發明,雖然病毒的自我複製有時足以選擇性抑制癌細胞的生長或破壞癌細胞,仍需要通過在病毒載體中引入編碼細胞毒或細胞生長抑制產物的核酸來增加破壞過程。因此,在另一實施方案中,編碼細胞毒或細胞生長抑制產物的核酸可與編碼必需基因產物一起置於單H19調節基因的控制下。通過另一實施方案,必需基因產物和編碼細胞毒或細胞生長抑制產物的核酸可分別置於異源轉錄調節序列的表達控制下。所述異源轉錄調節序列可以是兩個相同的H19調節序列,兩個不同的H19調節序列或將編碼必需基因產物的核酸置於一個H19調節序列表達控制之下,而將編碼細胞毒或細胞生長抑制產物的核酸置於非H19調節序列表達控制之下。所述非H19調節序列可以是來自另一組織特異性啟動子,或其它癌或腫瘤特異性啟動子,如端粒酶啟動子的異源序列。或者,啟動子可以是僅在必需基因產物表達後才活化的病毒啟動子。
廣義來說,細胞毒基因產物定義為包括毒素和誘導凋亡劑。此外,針對本發明的目的,細胞毒基因產物包括把前藥轉變成細胞毒產物的藥物代謝酶類。用在本發明方法中的細胞毒基因產物的實施例包括白喉毒素、假單胞菌毒素、蓖麻毒蛋白霍亂毒素、PE 40和腫瘤抑制子基因如視網膜成細胞瘤和p53。此外,也可用編碼誘導細胞凋亡的凋亡肽的序列。上述凋亡肽包括阿爾茨海默Aβ肽(見LaFerla等,1995,自然遺傳學921-30)、前房鈉尿肽(見Wu等,1997,生物化學雜誌27214860-14866)、降鈣素基因相關肽(見Sakuta等,1996,神經免疫學雜誌67103-109)、以及其他已知的或待發現的凋亡肽。
把前藥轉變成細胞毒產物的藥物代謝酶包括胸腺嘧啶激酶(來自單純皰疹病毒或水痘帶狀皰疹病毒)、胞嘧啶脫氨酶、硝酸還原酶、細胞色素p-450 2B1、胸腺嘧啶磷酸化酶、嘌呤核苷磷酸化酶、鹼性磷酸酶、羧肽酶A和G2、亞麻苦苷酶(linamarase)、 內醯胺酶、黃嘌呤氧化酶(見Rigg和Sikora,1997年8月,今日分子醫學,pp359-366的有關背景資料)。
此外,用本發明描述的表達構建體可把反義、反基因(antigene)或aptameric寡核苷酸傳遞到癌細胞中。核酶或單鏈RNA也能在癌細胞中表達以抑制特殊的目的基因的表達。這些反義或核酶分子作用的靶基因應該是那些對細胞維持或維持癌細胞表型所必需的編碼基因產物。上述靶基因包括但不局限於cdk2、cdk8、cdk21、cdc25A、周期蛋白D1、周期蛋白E、周期蛋白A和cdk4。
例如,為了下調內源基因的表達,把下列載體、反義RNAS或核酶導入到細胞中,其中所述的載體在來源於在癌細胞中表達的印記基因或IGF-1啟動子的調節序列控制下;而反義RNAS或核酶對癌基因形式的p53、c-fos、c-jun、Kr-ras和/或Her2/neu的轉錄體具有特異性。表達H19和能活化H19調節序列的腫瘤細胞能特異地被導向用於表達反義RNA或核酶RNA。
反義方法包括設計與靶mRNA互補的寡核苷酸(在此情況下,mRNA)。該反義寡核苷酸將結合到互補的靶mRNA轉錄體,然後阻止翻譯。絕對的互補性,儘管是優選的,並不需要。在此所指的對部分RNA的序列「互補性」意味著一種具有能和RNA雜交,形成穩定的雙鏈體的足夠互補性的序列。雜交能力將依賴於互補性的程度和反義核酸的長度。一般來說,所雜交的核酸越長,它可能含有的與RNA形成的鹼基錯配就越多,但仍能形成穩定的雙鏈體(或三聯體,視具體情況而定)。本領域的技術人員可使用標準方法確定錯配的可容許程度,以確定雜交複合體的熔點。
與靶信使RNA的5′末端互補的寡核苷酸,例如直到並包括AUG起始密碼子的5′非翻譯序列,應最有效地起抑制翻譯的作用。然而,最近研究表明,與mRNAs的3′非翻譯序列互補的序列也有效地抑制mRNAs的翻譯。一般性地參見,Wagner R,1994,自然372333-335。因此,與靶基因轉錄體的5′-或3′-非翻譯、非編碼區互補的寡核苷酸可用於反義方法,以抑制內源基因的翻譯。與mRNA的5′非翻譯區互補的寡核苷酸應包括AUG起始密碼子的互補部分。與mRNA編碼區互補的反義寡核苷酸是不太有效地翻譯抑制劑,但根據本發明可以使用。不管被設計成與靶mRNA的5′、3′或與編碼區雜交,反義核酸至少長為6個核苷酸,優選地為長6-約50個核苷酸範圍的寡核苷酸。具體來說,該寡核苷酸至少有10個核苷酸、至少17個核苷酸、至少25個核苷酸或至少50個核苷酸。
不管如何選擇靶序列,首先進行體外研究以定量確定反義寡核苷酸抑制基因表達的能力是優選。這些研究應該使用對照組,該對照組區分寡核苷酸的反義基因抑制和非特異的生物學效應。將所述的靶RNA或蛋白水平與內部對照RNA或蛋白的水平進行比較的這些研究方法,也是優選的。
設計催化性裂解必需靶基因的核酶分子也能用於阻止靶mRNA的翻譯。(如見,PCT國際公開WO 90/11364,1990年10月4日公開;Sarver等,1990,科學2471222-1255)。當該核酶特異於一種編碼對癌細胞生長必需的基因轉錄體時,上述核酶能引起癌細胞表型的逆轉。雖然在特異識別序列的位點裂解mRNA的核酶可被用於摧毀靶mRNAs時,但優選地使用錘頭核酶。錘頭核酶在與靶mRNA形成互補鹼基對的側翼區所示的位置裂解mRNAs。唯一的要求是靶mRNA具有下列2個鹼基的序列5′-UG-3′。錘頭核酶的構建和產生在本領域眾所周知,並且在Haseloff和Gerlach,1988,自然,334585-591的方法中更完整地描述。優選工程化核酶,這樣裂解識別位點位於靶mRNA的5′末端附近;即能增加有效性並使細胞內非功能性mRNA轉錄體的積累最少。
用於本發明的核酶也包括RNA內切核糖核酸酶(下文被稱為「Cech型核酶」),例如在嗜溫四膜蟲中天然產生的核酶(稱之為IVS,或L-19 IVS RNA),該酶由Thomas Cech和合作者進行了深入的描述(Zaug等,1984,科學224574-578;Zaug和Cech,1986,科學,231470-475;Zaug等,1986,自然,324429-433;大學專利公司出版的公開的國際專利申請號WO 88/04300;Been和Cech,1986,細胞,47207-216)。Cech型核酶擁有一個8鹼基對的活性位點,該位點與靶RNA序列雜交,然後出現靶RNA的裂解。本發明設想使用靶定存在於靶基因中的8個鹼基對活性位點序列的那些Cech類型的核酶。
在另一實施方案中,條件複製型病毒載體還包含標記基因的編碼序列,例如螢光素酶、 -半乳糖苷酶、綠色螢光蛋白等。這些構建體可用於研究構建體的分布、定位和穩定性的研究或體內實驗中和/或有助於測定適宜的施用模式和/或施用所述載體的治療方案。
5.3 基因產物在腫瘤細胞中的H19-依賴性表達活化內源H19基因產物表達的細胞也能特異地活化表達必需基因產物,因此導致條件複製型病毒載體的複製。上述細胞,尤其是腫瘤(癌,癌性)細胞和/或高增殖性細胞,是本發明基因治療方法的合適靶物。應用RNA分析、原位雜交和報導基因構建體技術,可以測定腫瘤和非腫瘤細胞系中的H19依賴性特異表達。
對於大部分RNA分析應用,用本領域熟知的任何技術製備特異與目的基因轉錄體雜交的標記探針。該標記探針可含有至少15-30個與H19核苷酸序列互補的鹼基,更優選地含有與H19轉錄體互補的50-150個鹼基。針對H19表達的特別優選的雜交探針是一種與H19信使RNA的3′末端互補,從聚A位點上遊大約800個鹼基對到聚A位點的多核苷酸。
在以下由實施例方式說明的本發明具體實施方案中,用T7或T3表達質粒體外產生標記過的反義RNA探針。在標記核苷酸的存在下通過隨機引物法,例如用Prime-It試劑盒(Stratagene,La Jolla,CA;商品名號300392),也能標記H19探針。另外,標記探針也能用PCR反應或標準缺刻翻譯反應的方法產生,其中在PCR反應中,用H19編碼區的cDNA克隆和被設計用來擴增編碼區的某一區域的探針。
適於多核苷酸探針的標記物包括摻入了放射性同位素(如35S和32P)、螢光素、發光和顯色標籤分子和酶組分的核苷酸。
用標準技術原位把標記探針與細胞或組織樣品雜交,例如用以下實施例描述的方法及本文引作參考的未決美國專利5,955,273的方法。另外,如果能獲得足夠量的合適細胞,可進行標準RNA分析(如Northern分析、RNA酶保護法或RNA酶引物延伸法),測定目的基因mRNA的表達水平。
另外,有可能「原位」進行上述基因表達分析,即直接從活檢或切除物獲得的病人組織的組織切片(固定和/或冷凍)上進行,這樣沒有必要純化核酸。諸如上面描述的那些核酸試劑可在這些原位方法中用作探針和/或引物(例如見,Nuovo,1992,「原位雜交的PCR法方法和應用」,Raven出版社,紐約)。
確定一種細胞類型或腫瘤能特異地活化含有操作性與H19調節序列相連的編碼病毒複製必需的基因產物的核酸的條件複製型病毒載體的一種替代方法事實上是把上述條件複製型病毒載體轉染到細胞中。為這些目的,可以將編碼標價基因的如螢光素酶導入病毒載體中,為了鑑別適用細胞的目的。在一次對標記基因產物分析中的陽性結果顯示細胞或細胞系能從該調節區活化表達。
5.4 使用方法和藥物組合物本發明還涉及用含有與H19調節序列操作性連接的編碼病毒複製必需基因產物的核苷酸序列的條件複製型病毒載體轉染的宿主細胞。所述宿主細胞可維持在培養基中,或者可以是動物優選哺乳動物,更優選人類的一部分。所述載體可以通過如下文6節中所述方法製備。
5.4.1 培養細胞用條件複製型病毒載體轉染的宿主細胞可以是任一種原核或真核細胞。可以採用微生物或組織培養技術中已知且廣泛使用的標準方法將載體轉染到真核(酵母、鳥類、昆蟲或哺乳動物)或原核(細菌細胞)的宿主細胞中。
5.4.2 條件複製型病毒載體和組合物的輸送本發明還涉及含有與H19調節序列操作性連接的編碼病毒複製必需基因產物的核苷酸序列的條件複製型病毒載體的在治療癌症和高增殖性疾病例如特徵為細胞生長不受控的疾病中的用途。對於本發明的方法,本發明的載體可用任何生物學上有效的載體如任何能在體內有效地將載體輸送至細胞的製劑或組合物進行施用。病毒載體直接轉染細胞,因此不需要複雜的轉染技術如那些需要通過質粒轉染的技術。在《病毒載體基因治療和神經科學應用》(Caplitl和Loewy編著,學術出版社,聖迭哥(1995)中Cooper(1996,腫瘤學研討會23172-187)報導了用於癌症治療的基因轉化和表達的近期綜述。
已經表明通過修飾病毒顆粒表面的病毒包裝蛋白(例如見PCT公開WO 93/25234和WO 94/06920),有可能限制病毒和接著基於病毒的載體的感染譜。例如,修飾逆轉錄病毒載體的感染譜的策略包括將特異於細胞表面抗原的抗體偶聯至病毒env蛋白中(Roux等,1989,美國國家科學院院報869079-9083;Julan等,1992,普通病毒學雜誌,u33251-3255;和Goud等,1983,病毒學163251-254);或將細胞表面受體配體偶聯至病毒env蛋白中(Neda等,1991,生物化學雜誌;26614143-14146)。偶聯方法可以是和蛋白或其他種類的分子化學交聯的形式(如把env蛋白轉化成脫唾液酸糖蛋白的乳糖),以及產生融合蛋白(如單鏈抗體/env融合蛋白)。例如,使用該技術,例如通過將抗腫瘤有關分子的抗體或癌細胞表面蛋白的抗體偶聯至重組病毒表面可靶定癌細胞。該技術,在用於限制或另外指導對某些組織類型的感染的同時,也能用於把外向載體轉變成兼嗜性載體。更優選的方法是在病毒基因組中插入編碼在病毒包膜上表達的蛋白,從而導致病毒載體優選地被攝取或進入癌細胞或特定組織的細胞中。
通過使用所述方法,能夠保證雙重安全性,即不僅條件複製型病毒可在癌細胞中複製,而且其開始即可以優選地輸送至腫瘤細胞的位點。
如優選的實施方案中所述,優選的用於本發明的病毒載體為腺病毒條件複製型載體,關於腺病毒的信息可參見Berkner等,1988,生物技術6616;Rosenfeld等,1991,科學252431-434;和Rosenfeld等,1992,細胞68143-155。合適的來源於腺病毒株AD型5 d1324或其他腺病毒株(如Ad2、Ad3、Ad7等)的腺病毒載體在本領域的技術人員中眾所周知。應當注意的是,當條件複製型病毒載體是腺病毒載體時,其是特別有利的,因為其可用於感染各種類型的細胞類型,這些細胞包括氣管表皮(Rosenfeld等,1992,見上文的引用)、內皮細胞(Lemarchand等,1992,美國國家科學院院報896482-6486)、肝細胞(Herz和Gerard,1993,美國國家科學院院報902812-2816)和肌肉細胞(Quantin等,1992,美國國家科學院院報892581-2584)。而且,病毒顆粒相對穩定,容易純化和濃縮,並可被修飾以影響感染譜。此外,導入的腺病毒DNA(和含在其中的外源DNA)不整合到宿主細胞的基因組中但以附加體形式存在,因而避免可能出現的插入誘變的潛在問題,在插入誘變的情形中,導入的DNA成為整合到宿主基因組中(如逆病毒DNA)。再者,相對於其他基因傳遞載體,腺病毒基因組攜帶外源DNA的能力大(高達8個鹼基對)(Berkner等,見上文的引用,Haj-Ahmand和Graham,1986,病毒學雜誌57267)。
普遍使用並因此受本發明推崇的大部分條件複製型腺病毒載體,被缺失所有或部分病毒的E1和E3基因,但仍保留多達80%的腺病毒遺傳物質(如見,Jones等,1979,細胞16683;Berkner等,同上;和Graham等,分子生物學方法,E.J.Murray編著(Humana,Clifton NJ,1991)7卷,109-127頁)。
在臨床應用方面,所述條件複製型病毒載體可由眾多方法之任一種導入到病人中,其中每一種方法在本領域眾所周知。多種輸送系統是已知的,可用於施用含有條件複製型載體和藥學上可接受載體的藥物組合物。導入的方法包括但不限於如,皮內、肌內、腹膜內、靜脈內、皮下、鼻內、硬膜外和口腔等途徑。病毒載體或組合物的施用可通過任何便利的途徑,例如通過融合或輸液或單次快速靜脈注射、通過經上皮或皮膚黏膜層的吸收(例如,口腔黏膜、直腸或結腸黏膜等),還可以與其它生物活性物一起施用。可以採用全身或局部的施用。另外,可以通過任何適用的途徑包括腦心室內或鞘內注射將本發明的病毒載體或組合物導入至中樞神經系統,可採用腦室內導管輔助腦室內注射,例如附加貯器,如奧馬耶貯器(Ommaya reservoir)。也可採用肺施用方式,例如,通過使用吸入劑或霧化器,以及霧化劑的組合。
在一個具體的實施方案中,可將本發明的病毒載體或組合物局部施用於需要治療的區域,可以採用但不限於手術期間的局部輸液、通過注射、通過導管的方法、或通過植入的方法,所述植入為多空、無孔或膠狀物質,包括膜,如唾液酸鹽膜或纖維膜。在一個實施方案中,可通過腫瘤或瘤性或瘤前性組織位點(或前位點)直接注射施用。
在一個具體的實施方案中,術語「藥學可接受」是指由聯邦或州政府管理機構認可的或記載於美國藥典或其它一般公認的用於動物更優選用於人的藥典中。術語「載體」稀釋劑、佐劑、賦形劑或可施用於治療的載體。所述藥學載體可以是無菌液,如水和油,其來源包括石油、動物、植物或合成,如花生油、豆油、礦物油、芝麻油等。當藥物組合物通過靜脈內施用時,水是優選的載體。鹽水溶液和葡萄糖和甘油水溶液也可以用作液體載體,特別時用於注射性溶液。適用的藥物賦形劑包括澱粉、葡萄糖、乳糖、蔗糖、凝膠、麥芽、米、麵粉、白堊、矽膠、硬脂酸鈉、單硬脂酸甘油酯、滑石、氯化鈉,脫脂奶粉、丙三醇、丙烯、乙二醇、水、乙醇等。組合物,如有需要,還可包含少量溼潤劑和乳化劑,或pH緩衝劑。這些組合物可製成溶液、懸液、乳液、片劑、膠囊、粉末、持續釋放劑型等。口服劑型可包括標準載體如藥物級甘露醇、乳糖、澱粉、硬脂酸鎂、鈉糖精、纖維素、碳酸鎂等。E.W.Martin在「Remington藥物學」中記載了適用的藥物載體的實例。製劑應適用於施用途徑。
在另一實施方案中,病毒載體可通過控釋系統進行遞送。在一個實施方案中,可以使用泵(參見Langer,如前;Sefton,CRC Crit.Ref.Biomed.ENG.14201(1987);Buchwald等,Surgery 88507(1980);Saudek等,N.Engl.J.Med.321574(1989))。在另一實施方案中,可使用多聚材料(參見Medical Applicants of controlled Release,Langer和Wise(編),CRC出版社,Boca Raton,Florida(1974);Controlled DrugBioavailability,Drug Product Design and Performance,Smolen和Ball(編),Wiley,NEW YORK(1984);Ranger和Peppas,J.Macromol.Sci.Rev.Macromol.Chem.2361(1983);還可以參見Levy等,科學228190(1985);During等,Ann.Neurol.25351(1989);Howard等,J.Neurosurg.71105(1989))。在另一實施方案中,可將控釋系統置於治療部位即腦附近,因此僅需要全身劑量的部分(參見,例如,Goodson,in Medical Applicationsof Controlled Release,如前,2卷,115-138(1984))。Langer在綜述中(SCIENCE 2491527-1533(1990))記載了其它控釋系統。在一個實施方案中,可將病毒載體置於緩釋介質中。
在一個優選的實施方案中,組合物根據使用途徑過程進行製備為適於對人類靜脈內注射的劑型。通常,用於靜脈施用的組合物為無菌等滲水緩衝液中的溶液。需要時,組合物還可以含有溶解劑和局部麻醉劑如利多卡因以便減輕注射位點的疼痛。一般而言,可以按單位劑量形式例如,熔封容器如標明活性物量的安瓿或小袋中的低壓凍幹的粉末或無水濃縮物分開或混合提供成分。在通過輸液施用組合物時,其可以在含有無菌藥物級水或鹽溶液的輸液瓶中配製。在通過注射施用組合物時,用於注射的無菌水或鹽溶液的安瓿可被提供以便在施用前混合成分。在優選的實施方案中,病毒載體的藥物製劑可全身導入,例如通過如靜脈注射、動脈內注射(例如肝血管),靶細胞中發生的病毒的特異性複製主要來自編碼病毒複製必需產物的基因的表達的特異性。在另一具體實施方案中,伴隨著導入相當局限的動物中,重組表達構建體的初始傳遞更受限制。例如,基因傳遞載體可直接注射至腫瘤位點(腫瘤內注射),或用導管(見美國專利5,328,470)導入身體的任何腔內如膀胱內的方法將其導入身體的腔室內,或立體注射法(例如,Chen等,1994,美國國家科學院院報913054-3057)。或者,藥物製劑可包含一種或多種生成條件複製型病毒載體和向環境中分泌感染性病毒細胞。
5.4.3 治療終點和劑量普通技術人員應當懂得,從醫生或病人的角度來看,任何基本上緩解或預防和癌症病情有關的非所希望的症狀(如,疼痛、敏感性和體重減輕等)是合乎要求的。另外,任何腫瘤重量或生長率的降低以及改善腫瘤組織病理圖像是所希望的。特定病毒載體對癌或高增殖病的治療作用的能力可用任意本領域已知的體外或體內方法來評估與對照相比的癌(癌性)細胞由於細胞死亡(由可以是壞死、凋亡或其二者組合的細胞死亡所致的)導致的數量下降;細胞生長率的降低,例如細胞的全部數量可以增加但以與對照未處理的細胞的增加相比較低的水平或較低的速率增加;與對照相比,細胞對周圍環境的侵襲力降低(可通過例如軟瓊脂法測定)即使其全部數量沒有轉變;或未分化癌細胞向更分化的表型的進展等。
具有活化H19表達的示例腫瘤類型如下癌、肉瘤、腺瘤、肝細胞癌、肝胚細胞瘤、橫紋肌肉瘤、食管癌、甲狀腺癌、惡性神經節瘤、纖維肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、內皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、結腸癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鱗狀細胞癌、基底細胞癌、腺癌、腎細胞癌、血腫(hematoma)、膽管癌、黑色素瘤、絨毛膜瘤、精原細胞瘤、胚胎性癌、維爾姆斯氏腫瘤、子宮頸癌、睪丸腫瘤、肺癌、小肺癌、膀胱癌、胃腸道間質瘤、上皮癌、膠質瘤、星形細胞瘤(glioma astrocyoma)、髓母細胞瘤、顱咽管瘤、ependynoma、松果體瘤、視網膜母細胞瘤、多發性骨髓瘤、直腸癌、甲狀腺癌、頭頸癌、子宮內膜癌(cancer of the edometrium)、以及它們的轉移灶(metastases)。由此,本發明包含治療上述全部癌症的方法。在一特別實施方案中,所述方法包含治療如下腫瘤的方法膀胱癌、肝細胞癌、肝胚細胞癌、橫紋肌肉瘤、卵巢癌、子宮頸癌、肺癌、乳癌、頭頸部鱗狀細胞癌、食管癌、甲狀腺癌、星形細胞瘤、惡性神經節瘤或成神經細胞瘤。
有效劑量和治療方案可通過常規方法確定,在實驗室動物中用低劑量開始,然後增加劑量並同時監測作用效果,並也可以用全身性地改變劑量方案。動物研究,優選地哺乳動物研究通常被用來確定每公斤體重生物活性劑的最大可耐受劑量,或MTD。本領域的技術人員通常外推有效劑量並避免對其他物種,包括人類的毒性。
進行對人的效能研究前,在正常個體中的I期臨床研究有助於確立安全劑量。當確定對給定個體的最佳劑量時,臨床醫生可能考慮許多因素。這些因素中最主要的是所選擇的異源基因產物的毒性和半衰期。其他因素包括病人的個體大小、病人的年齡、病人的一般情況、被治療的具體癌症、疾病的嚴重度、病人所用的其他藥物、基因產物的體內活性等。考慮動物研究的結果和臨床文獻後,選擇實驗劑量。
例如,含有操作性連接於H19調節序列的編碼病毒複製所需產物的核酸的條件複製腺病毒載體的直接注射到腫瘤塊內的一般人用劑量為1×107pfu-1×1012pfu/天。更優選地,依據腫瘤大小,上述腺病毒載體直接注射到腫瘤內的每日劑量為1×108pfu-1×1010pfu。尤其是考慮體內使用時,本發明的各種生化組分優選地具有高純度並且基本上無潛在的有害汙染物(例如,至少國家食品(NF)級、通常至少分析級和優選地至少藥用級)。由於所確定的化合物必須使用前合成,上述合成或隨後的純化優選產生這樣的產物,該產物在合成或純化方法中基本上無任何潛在的所用的毒性劑。
對於用於治療個體的癌症病情,本發明在其一個方面還提供了以無菌分裝的小瓶或安瓿形式的一種試劑盒或試劑包,其中含有條件複製型病毒載體,所述病毒載體包含編碼病毒複製所需產物的操作性連接於H19調節序列的核酸。在一實施方案中,試劑盒實質上包含以適用的載體或其它任何穩定的形式的上述病毒載體。另外,根據本發明的另一個實施方案,該試劑包提供一種無菌分裝的含有上述釋放載體的細胞或細胞系的小瓶或安瓿。為了貯存和運輸,應該冷凍載體釋放細胞或細胞系。另外,該試劑包也可以含有用於培養所述釋放載體的細胞或細胞系的培養基和試劑。另外,試劑包中含有試劑盒的使用說明書。
描述本發明後,提供下列實施例用以說明而不是限制本發明。
6.實施例製備條件複製腺病毒載體的一般方法通常,可以使用標準分子生物學技術構建此處描述的載體。構建所述載體的標準技術是本領域技術人員所眾所周知的,並可以參閱如Sambrook等,分子克隆實驗室手冊,冷泉港,紐約(1989)或任一種關於重組DNA技術的種類繁多的能夠廣泛得到的實驗室手冊。多種策略可用於連接DNA片段,根據DNA片段末端的性質選擇策略,且本領域技術人員可以很容易地確定。
在一個實施方案種,可採用根據標準技術構建含有,開始於5』末端,「關鍵性左末端元件」的穿梭載體來構建腺病毒載體,所述「關鍵性左末端元件」含有腺病毒5』ITR;腺病毒包裝信號和E1a增強子序列;H19調節序列如H19啟動子或其亞序列;三聯前導序列;多克隆位點(可以是此處所描述的);poly A信號;和相應於腺病毒基因組片段的DNA片段。所述DNA片段作為與修飾或突變腺病毒同源重組的底物。質粒還可用包括選擇性標記和複製起點。複製起點可以是細菌性複製起點。所述穿梭載體的代表性實例包括pAVS6,如此處所述以及參閱Trapnell等,1994,Adv.Drug Deliv.Rev 12185-189。含有異源基因的所需DNA序列可被插入至多克隆位點以製備質粒載體。
然後用將該構建體製備腺病毒載體。然後用修飾或突變的腺病毒進行同源重組,所述腺病毒中一個或多個天然轉錄調節序列被刪除和用H19轉錄調節序列取代,如用H19啟動子取代。所述同源重組可通過採用CaPO4沉澱的方法將質粒和修飾腺病毒共轉染至輔助細胞系來實現。
通過所述同源重組,構建了含有不含一個或多個天然轉錄調節序列的腺病毒DNA的載體。然後可將該載體轉染至輔助細胞系中以進行病毒複製以及產生感染性病毒顆粒。轉染可採用電穿孔、磷酸鈣沉澱、顯微注射或通過脂蛋白體(proteoliposomes)實施。
所述載體可包含便於將含有H19調節序列的DNA序列插入載體的多克隆位點。通常,多克隆位點包括「罕見」限制性酶位點,即在真核生物基因中發現的概率為每10,000個鹼基對中約有1個至每100,000個鹼基對中約有1個的位點。因此通過標準技術在多克隆位點中的合適限制性位點剪切克隆載體來構建適用的載體,然後將含有外源基因的DNA序列連接至克隆載體中。
在一個實施方案中,可採用含有根據Ketner等,1994,Proc.Nat.Acad.Sci.916186-6190中所描述的腺病毒基因組的酵母人工染色體並結合此處所包含的方法來構建腺病毒。在該實施方案中,採用腺病毒DNA和攜帶腺病毒左和右基因組末端片段的酵母人工染色體之間的體內同源重組來製備所述腺病毒酵母人工染色體。然後將含有外源基因的DNA序列克隆至腺病毒DNA中。然後從腺病毒酵母人工染色體中切斷修飾的腺病毒基因組以便將其用於生成感染性腺病毒顆粒。
6.1 材料和方法6.1.1 細胞系和轉染方法膀胱癌細胞系HT-1376、EJ28、T24P、1197和UM-UC-3從美國典型培養物保藏中心(ATCC)獲得,並按照ATCC推薦的方法維持。
6.1.2 病毒傳代實驗為確定腺病毒變體是否在膀胱癌細胞中優先複製,實施了針對釋放數量的病毒產量實驗。測定前述膀胱癌細胞系、人胚腎細胞系(293)和正常膀胱癌中的病毒複製效率。293細胞作為複製效率的陽性對照,由於該細胞構成性表達5型腺病毒E1a和E1b蛋白。為測定病毒子代的生成,將1.5×104細胞鋪於24孔板上,然後用200μl含有2%FBS的生長介質中的腺病毒以MOI 2(2PFU/細胞)進行感染。次日,用HBSS衝洗細胞三次,再培育在含有10%FBS的生長介質中。感染三日後,收穫細胞和介質,凍/融三次,然後採用針對293細胞的標準噬菌斑測定法測定病毒滴度。
6.1.3 表達載體的構建方法將優化的H19轉錄調節序列整合至腺病毒基因組中,來驅動必需病毒基因主要是E1A基因的定向表達。
按下述方法構建腺病毒基因組引入相應的Pshuttle限制性位點含有XhoI限制性位點的片段,然後從522位核苷酸至3924位的Mfe4I限制性位點(核苷酸位是指GenBank中編號AD5001所示序列)Ad5基因組序列。用H19啟動子(SEQ ID NO1中所示核苷酸-810至+14)或作為對照的遍在表達的CMV增強子/啟動子置換含有腺病毒E1啟動子Ad5核苷酸346-521。另外,這些啟動子上遊的合成poly A位點(來自Luc-PH19)也要整合。該元件顯示出可以避免非特異性的基因表達,由於Ad5左ITR的轉錄起始。然後採用PmeI酶切消化將這些穿梭載體線性化,並用於與pAdEasy-1的同源重組來生成分別含有重組腺病毒基因組的pAdCMV和pAdH19。質粒用PCR和限制性酶切消化進行證實。使用Lipofectamine(Life Technologies,Inc),按照用戶操作手冊將PacI酶切的pAd質粒轉染至293細胞中,來製備腺病毒。按照AdEasy系統的操作方法中所述(如下)擴增病毒。病毒基因組的證實和野生型汙染排除用PCR和限制性酶切消化進行。
出於多種監測目的,也可將報告基因(綠色螢光蛋白(GFP)或螢光素酶)整合至腺病毒載體中。作為該方法的擴展,表達HSVtk的腺病毒或胞嘧啶脫氨酶基因也可以發展使用。在這些構建體中,由H19啟動子驅動的含有HSVtk、E1a基因的表達盒整合至穿梭質粒中。HSVtk轉錄本藉助內核糖體進入位點(IRES)與E1a相連。
6.1.4 H-19啟動子的構建方法為構建H19啟動子,用下列引物,從人胎盤DNA擴增含有H19啟動子序列的多核苷酸。
ESPCR21CGGTTCCCCACTTCCCCAGTTT(SEQ ID NO22)ESPCR22CGGAAGTCGACAACCCTCACCAAAGGCCAAGGT(SEQ ID NO23)用Klenow酶把該PCR產物的末端抹平並克隆到pBluescriptIISK+的EcoRV位點上。所插入的DNA用內切酶PvuII、EcoRI和ApaI消化證實。該啟動子的方向與載體的lacZ編碼區的方向相反。然後用HindIII和PstI切割法切下該啟動子區,所得到的大約0.9kb的片段插入到pCAT基本質粒HindIII-PstI位點中以產生pH19E。
6.1.5 AdEasyTM系統AdEasyTM系統用於快速構建重組腺病毒載體,而無需噬斑純化的時間。AdEasyTM系統由He等建立,該系統利用了強壯(robust)、有效的大腸桿菌重組結構,從而避免了難以處理的(36kb)腺病毒基因組的限制-連接。該技術必需的細菌性以及293細胞包括在每個試劑盒,每個試劑盒均提供生成至多5重組腺病毒的足夠的試劑。高度詳盡的用戶手冊是初學者以及本領域有經驗技術人員的重要資源。
一般方案第1步如SEQ ID NO6中所示的操作性連接於上述H19調節序列的E1a腺病毒必需基因的cDNA首先克隆至傳遞載體。
第2步用PmeI將得到的質粒線性化,然後與pAdEasy-1,病毒DNA質粒一同共轉染至大腸桿菌BJ5183株。用對卡那黴素的耐藥性選擇重組體,並用限制性酶分析篩選。
STEP 3然後用PacI將該重組腺病毒構建體剪切,以暴露其ITR(末端反向重複),並轉染至QBI-293A細胞來製備病毒顆粒。
在細菌細胞中生成重組1.採用本領域已知的技術在20微升/管等份中製備電活性BJ5183細胞。
2.用PmeI將穿梭質粒線性化。通常五分之一的小量製品(一般為100-500ng)即是足夠的。在酶切消化後,用酚-氯仿提取DNA,乙醇沉澱,然後用6.0微升DDH20中重懸。
3.該PmeI-酶切消化的穿梭質粒1.0微升腺病毒骨架載體(100ng/ul)共轉化。加入20微升的電感受態大腸桿菌BJ5183細胞,電穿孔在2.0mm管中,以2,500V,200Ohms和25微-FD在Bio-Rad GenePulser電穿孔儀中實施。轉化混合物在500微升L-培養基(可選擇地,在37EC中孵育10~20分鐘,依賴環境)中重懸。將混合物置於3~5LB/Kan培養板上,於37EC過夜生長(16-20小時)。
4.挑起10~20個極小的克隆,然後使其在含有25微克/ml卡那黴素的2ml L-培養基生長10-15小時。
5.採用普通的鹼性分離法實施小量製備,通過將五分之一的小量製品在0.8%瓊脂糖凝膠上泳動來檢查超螺旋質粒的大小。
6.來自克隆的DNA用PacI進行限制性酶切消化。候選克隆產出大量(接近30kb),加3.0kb或4.5Kb的較小片段。
7.將2微升正確重組miniprep DNA再轉化至DH10B(或任意質粒繁殖株)。採用CSCL-BANDING或採用商業可獲得的純化試劑盒純化質粒以用於轉染293細胞。
V293或911細胞中的病毒生成1.在轉染前,將293細胞(E1a-轉化的人胚腎細胞)或911細胞(E1-轉化的人胚視網膜細胞)置於一個或兩個T-25瓶內約24小時,每瓶2×106細胞。轉染時的融合為約50%~70%。
2.轉染當日,用Pad(通常一個T-25瓶需要轉染4μg DNA)酶切消化重組腺病毒質粒。用乙醇沉澱該質粒,在20μl無菌水中重懸。
3.根據廠商手冊實施標準Lipofectamine轉染。4μg的PacI-酶切消化的質粒和20μl的Lipofectamine(GIBCO BRL)在含500μl OptiMem I培養基的每一T-25中混合,然後於室溫下孵育15~30分鐘。
4.等待期間,從用4ml無血清培養基(例如,普通DMEM,或Hank′s)衝洗一次的受體細胞中去除再生長培養基。每個T-25瓶中加入2.5mlOptiMemI。將其再置於37EC CO2培養箱中約10分鐘。
5.將Lipofectamine-DNA混合物加入瓶中,然後將瓶返回37EC CO2培養箱。
6.四小時後,除去含有Lipofectamin-DNA混合物的培養基,加入6ml新的完全DMEM(10%FBS,1%Pen/Strep)。次日早晨更換培養基。
7.如果使用基於pAdTrack的載體,即可以採用GFP表達的方法來監測轉染和病毒生成。
8.在轉染後7~10日,用橡皮細胞帚從瓶中刮取細胞,轉移至50ml錐形管。細胞在benchtop離心機中離心,然後在2.0ml HBSS或無菌PBS中重懸片狀沉澱物。然後在乾冰/甲醇浴中冷凍細胞,然後在37攝氏度的水浴中融化,然後強烈離心渦旋。凍/融/渦旋重複超過3個循環(一共4個循環)。將樣品簡單離心,將上清保藏於-20EC。
9.在每瓶中使用30-50%上述病毒上清感染兩個50%~70%融合的T-25瓶的911或293細胞。應在感染後2~3日出現明顯的CPE或細胞溶解。使用AdTrack載體易於觀察到有效感染。
10.在三分之一至半數細胞分離時,通常在感染後3~5日收集病毒。可通過Western blot或PCR(對於PCR,去5μl病毒樣品,加入10μl PCR級蛋白酶K,於55EC下1小時,然後煮沸樣品5分鐘,簡單離心,取1~2μl用於證實重組腺病毒的存在。
11.刮去細胞,並按上述第8步中所述製備病毒上清。在這一階段,至少107個感染性顆粒/ml是可用的,通常會更多。每一輪擴增的病毒應比前一輪中的病毒至少高10倍。
12.為進一步擴增,細胞感染步驟可以用來自11步中的30-50%的病毒上清重複,用T75瓶替換T25瓶。可以任意時間檢測滴度,使用AD-Track載體使得該檢測特別容易。用多種稀釋度的病毒上清感染293細胞,然後在18小時後檢測多少細胞為綠色。
高滴度病毒株的製備1.將911或293細胞置於T-75瓶中,在感染時90%的融合(大約1×107細胞/T-75)。通常,15~20個T-75瓶足以製備高滴度原種。
2.以5~10PFU/每細胞的複合感染(MOI),用病毒上清感染細胞。當全部細胞聚集和約半數細胞分離時(通常在感染後3~4日),在全部瓶中收集併集中。將內容物在benchtop離心機中離心(約500g)5分鐘,除去上清。
3.將片狀沉澱物在8.0ml無菌PBS中重懸。實施4次凍/融/渦旋循環。溶胞產物在Sorvall HS4轉子,6000rpm(7000g)4℃離心5分鐘。
4.在50ml錐形管中稱重CSCI的克數,然後將8.0ml的澄清病毒上清轉移至該管,通過離心使之完全混合。將CSCI溶液(約10ml,密度為1.35g/ml)轉移至12ml用於SW41轉子的polyallomer聚合物管,並覆蓋2ml液體石蠟。製備平衡管,在SW41轉子以32,000rpm,10EC,離心18~24小時。
5.病毒級分(約0.5~1.0ml)用3cc注射器和18g針頭收集,用等體積的2×儲存緩衝液混合(2×儲存緩衝液=10mM Tris,pH8.0,100mMNaCl,0.1%BSA和50%丙三醇,滅菌濾器)。病毒保存在-20EC。
6.通過噬菌斑測定的GFP(優選)或免疫組織化學染色或與260nm直接讀取OD來檢測病毒滴度。為了讀取OD,在加入了100μl TE/0.1%SDS的15μl空白溶液中(空白溶液=1.35g/ml CSCI與等體積的2×儲存緩衝液混合)加入15μl病毒;攪動30秒,離心5分鐘,檢測A260。一個A260單位包含大約1012個病毒顆粒(顆粒∶感染性顆粒=大約20∶1)。
7.實施例條件複製病毒對膀胱癌細胞的影響-體外實驗在體外測定H19調節的腺病毒的細胞毒性。1.5×104表達不同水平H19RNA的腫瘤細胞如HT-1376、EJ28、T24P、1197和UM-UC-3,和原代細胞被置於24孔板上,然後用200μl含有2%FBS的生長介質中的腺病毒以多種MOI2(0.1-10)或模擬進行感染。將E1-缺失AdCMVLuc構建體用作陰性對照。次日用生長培養基替換感染培養基。細胞裂解後,將細胞固定並用1%結晶紫染色。乾燥培養板,採用Olympus數字照像機拍攝圖像來確定由本發明的載體所導致的細胞裂解的程度/水平。
8.實施例條件複製病毒對膀胱癌細胞的影響-xenographic模型中的體內實驗在第6節(如前)中製備的載體的效能被用來研究在SCID小鼠皮下生長的人膀胱癌細胞系。這一更複雜的動物模型是研究腺病毒癌細胞溶解所需要的,因為條件複製型腺病毒通常不在小鼠和大鼠細胞中生長。用螢光素酶表達載體穩定轉染用於這些實驗的人膀胱癌腫瘤系(UM-UC-3)以便在體內對腫瘤退化成像。或者,將GFP報告子整合至條件複製載體,如上述,以便對切除的腫瘤中的表達進行成像。
更具體地,對SCID小鼠皮下注射5×106的穩定表達螢光素酶的人UM-UC-3膀胱腫瘤細胞。對測得腫瘤體積大約為100-120mm3的小鼠組(n=8)將用不同劑量的如第6節(如前)中製備的條件複製型H19-腺病毒載體進行瘤內注射,所述劑量為200μl的培養液中107~109pfu。對照動物組僅接受介質(PBS)。
採用測徑器和通過體內螢光素酶(由於腫瘤細胞自身發出螢光)檢測來檢測皮下注射的腫瘤的生長率,並在處死動物後,稱重剖開的腫瘤以便確定本發明條件複製型病毒載體的治療效果。通過在接種後1、3、5、7和14日收穫腫瘤組織並評測腺病毒複製來測定作為時間函數的病毒擴散的實驗,實驗中改變是使用抗-腺病毒抗血清以及用標記基因如3-半乳糖苷酶,綠色螢光蛋白(GFP)或螢光素酶作為檢測的腺病毒。治療效果,以及病毒在腫瘤中的擴散度,每一含有H19-啟動子的細胞溶解性腺病毒與啟動子的外源活性相關(如用腫瘤細胞中的相應RNA水平來評測)。還檢測了腫瘤-選擇性溶細胞病毒在種群種殺死陰性表現型(例如,H19-陰性)腫瘤細胞的能力,顯示了條件複製型病毒載體僅在表達活化H19調節序列的轉錄因子的腫瘤細胞中活化。
9.實施例H19條件複製病毒系統在膀胱癌的直立(orthotropic)模型中的用途該動物模型由人膀胱腫瘤細胞系UM-UC-3,RT-112和5637組成,植入嚴重聯合免疫缺陷病(SCID)小鼠的膀胱。在雌性CD-1無胸腺裸鼠中建立膀胱內(進入腫瘤)生成的直立人膀胱癌。在植入後4和7日將按照6節中所述(如前)製備的本發明的載體通過導管注入膀胱內。採用腺病毒載體(1×107pfu/100μl PBS)單或多重滴注處理動物。生長率可通過兩種方式中的一種進行測定通過體內檢測螢光素酶(由於腫瘤細胞自身發出螢光,如8節中所述),以及在處理開始後的不同時間處死動物後,稱重剖開的腫瘤以便確定本發明條件複製型病毒載體的治療效果。
10.克隆的保藏根據用於專利程序的微生物保藏的國際承認的布達佩斯條約的有關規定,將下述質粒保藏於美國典型培養物保藏中心(ATCC)、Manassas,VA。
克隆ATCC登記號保藏日期pH19EH192093221997年10月2日本發明的範圍並不限於前面描述的具體實施方案。的確,對本領域技術人員來說根據前述內容和附圖可以顯而易見地作出上述方案的各種修改方案。所述修改方案被認為在下列權利要求的範圍之內。
在此引用的各種專利、出版物和GenBank記錄其全文引入本文作為參考。
序列表110Yissum Research and Development Company of the Hebrew University of JerusalemHochberg,Abraham Ayesh,Suhail120誘導腫瘤特異性細胞毒性的方法和組合物1301413111140PCT/IL02/008431412002-10-2215010/012,1311512001-10-2216021170PatentIn version 3.02101211830212DNA213人4001ctgcagggcc ccaacaaccc tcaccaaagg ccaaggtggt gaccgacgga cccacagcgg 60ggtggctggg ggagtcgaaa ctcgccagtc tccactccac tcccaaccgt ggtgccccac120gcgggcctgg gagagtctgt gaggccgccc accgcttgtc agtagagtgc gcccgcgagc180cgtaagcaca gcccggcaac atgcggtctt cagacaggaa agtggccgcg aatgggaccg240gggtgcccag cggctgtggg gactctgtcc tgcggaaacc gcggtgacga gcacaagctc300ggtcaactgg atgggaatcg gcctgggggg ctggcaccgc gcccaccagg gggtttgcgg360cacttccctc tgcccctcag caccccaccc ctactctcca ggaacgtgag gtctgagccg420tgatggtggc aggaaggggc cctctgtgcc atccgagtcc ccagggaccc gcagctggcc480cccagccatg tgcaaagtat gtgcagggcg ctggcaggca gggagcagca ggcatggtgt540cccctgaggg gagacagtgg tctgggaggg agaggtcctg gaccctgagg gaggtgatgg600ggcaatgctc agccctgtct ccggatgcca aaggaggggt gcggggaggc cgtctttgga660gaattccagg atgggtgctg ggtgagagag acgtgtgctg gaactgtcca gggcggaggt720gggccctgcg ggggccctcg ggagggccct gctctgattg gccggcaggg caggggcggg780aattctggcg ggccacccca gttagaaaaa gcccgggcta ggaccgagga 8302102211833212DNA213人
4002gacaaccctc accaagggcc aaggtggtga ccgacggacc cacagcgggg tggctggggg 60agtcgaaact cgccagtctc cactccactc ccaaccgtgg tgccccacgc gggcctggga120gagtctgtga ggccgcccac cgcttgtcag tagagtgcgc ccgcgagccg taagcacagc180ccggcaacat gcggtcttca gacaggaaag tggccgcgaa tgggaccggg gtgcccagcg240gctgtgggga ctctgtcctg cggaaaccgc ggtgacgagc acaagctcgg tcaactggat300gggaatcggc ctggggggct ggcaccgcgc ccaccagggg gtttgcggca cttccctctg360cccctcagca ccccacccct actctccagg aacgtgagtt ctgagccgtg atggtggcag420gaaggggccc tctgtgccat ccgagtcccc agggacccgc agctggcccc cagccatgtg480caaagtatgt gcagggcgct ggcaggcagg gagcagcagg catggtgtcc cctgagggga540gacagtggtc tgggagggag aagtcctggc cctgagggag gtgatggggc aatgctcagc600cctgtctccg gatgccaaag gaggggtgcg gggaggccgt ctttggagaa ttccaggatg660ggtgctgggt gagagagacg tgtgctggaa ctgtccaggg cggaggtggg ccctgcgggg720gccctcggga gggccctgct ctgattggcc ggcagggcag gggcgggaat tctgggcggg780gccaccccag ttagaaaaag cccgggctag gaccgaggag cagggtgagg gag 8332103211877212DNA213人4003caaggacatg gaatttcgga ccttctgtcc ccaccctctc tgctgagcct aggaacctct 60gagcagcagg aaggccttgg gtctagagcc tagaaatgga cccccacgtc cacctgccca120gcctagaccc ccagcattga agggtggtca gacttcctgt gagaggaagc cactaagcgg180gatggacacc atcgcccact ccacccggcc ctgcccagcc ctgcccagtc cagcccagtc240cagcccagcc ctgcccttcc cagccctgcc cagcccagct catccctgcc ctacccagcc300cagccctgtc ctgccctgcc cagcccagcc cagcccagcc ctgccctgcc ctgccctgcc360cttcccagcc ctgaccttcc cagccctgcc cagcccagct catccctgcc ctacccagct420cagccctgcc ctgccctgcc ctgccctgcc cagccctacc cagcccagcc ctgccctgcc480ctgcccagct cagccctgcc caccccagcc cagcccagcc cagcatgcgt tctctggatg540gtgagcacag gcttgacctt agaaagaggc tggcaacgag ggctgaggcc accaggccac600tgggtgctca cgggtcagac aagcccagag cctgctcccc tgccacgggt cggggctgtc660accgccagca tgctgtggat gtgcatggcc tcagggctgc tggctccagg ctgcccccgc720cctggctccc gaggccaccc ctcttatgcc atgaaccctg tgccacaccc acctctgagc780tgtccccgct cctgccgcct gcaccccctg agcagccccc tgtgtgtttc atgggagtct840tagcaaggaa ggggagctcg aattcctgca gcccggg 87721042112010212DNA213人
220
221misc_feature222(1026)..(1126)223n=a,t,c,或g4004ccgggtaccg agctcccagg aagataaatg atttcctcct ctctagagat gggggtggga 60tctgagcact cagagccaag ggcgcagtgg gtccgggcgg gggccctcct cggccctccc 120aacatggggg ccaggaggtc agcccctcaa cctggacccc ggctgggtct cagggaatgg 180tctcccccag tggcccagct tgcttgtgtt ttcagatggg tgtgcatggg tgtgtgtgtg 240tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgatgcct gacaagcccc agagagccaa 300agacctgagt ggagatcttg tgacttctca aaagggggat tggaaggttc gagaaagagc 360tgtggtcagc cttgctctcc cttaaggctg tggtaaccac actaggcata gcataggcct 420gcgccccgtc cctccttccc tcctccgcgc ctctcctttc tctttctccc ccctctaccc 480cgctccctgg cctgctcctg gtgacaccgt tggccccctt ccagggctga gggaagccag 540cgggggcccc ttcctgaaag cccacctgca ggccggcttg ctgggaaggg gctgctctcg 600cagaggctcc cgcccgccct gcagccgttt cctggaagca gtcgctgtgg gtattctgtt 660ccttgtcagc actgtgcttg caaagaaagc agacactgtg ctccttgtcc ttagggagcc 720ccgctccatc acccaacacc tggctggaca caggcgggag gccgggtccg cggggagcgg 780cgcggggctg gggccggacc attaaacaca cacgggcgcc aggcactgca ggctcctcct 840cctcctcctg cccagcgcct ctgctcacag gcacgtgcca agcccctagg ccaggaggcc 900agcagtgggt gcagaacaag ctcctgggaa gggggtgcag ggcggacccc cggggagaag 960ggctggcagg gctgtggggg acgctgaccg tgggccccac gttgcagaaa actggntgcc1020tggctggaag atgggggaga tgccaagcct ctgaggcagc acgagcaggg tgcatggagg1080ccggggcgcg gggaggctgc actgcagcat gcaccccaaa gcccanaggg agtggagacc1140aggccctgga atcgagaagt agaaaggcgg cttggaggcc tcggaaccgg ctgacctcca1200acagagtggg tctccagcct ggctctgccc tgccgcaggt cccctcccct cattaccagg1260cctagagcct ccagtcccgg tggcccccag cccgagggtg aacggcctca ccctgggtcg1320tgggacagag ggcacgttca tcaagagtgg ctcccaaggg acacgtggct gtttgcagtt1380cacaggaagc attcgagata aggagcttgt tttcccagtg ggcacggagc cagcaggggg1440gctgtggggc agcccagggt gcaaggccag gctgtggggc tgcagctgcc ttgggcccca1500ctcccaggcc tttgcgggag gtgggaggcg ggaggcggca gctgcacagt ggccccaggc1560gaggctctca gccccagtcg ctctccgggt gggcagccca agagggtctg gctgagcctc1620ccacatctgg gactccatca cccaacaact taattaaggc tgaatttcac gtgtcctgtg1680acttgggtag acaaagcccc tgtccaaagg ggcagccagc ctaaggcagt ggggacggcg1740tgggtggcgg gcgacggggg agatggacaa caggaccgag ggtgtgcggg cgatggggga1800gatggacaac aggaccgagg gtgtgcgggc gatgggggag atggacaaca ggaccgaggg1860tgtgcgggac acgcatgtca ctcatgcacg ccaatggggg gcgtgggagg ctggggagca1920gacagactgg gctgggctgg gcgggaagga cgggcagatg aattctggcg ggccacccca1980gttagaaaaa gcccgggcta ggaccgagga 201021052114085212DNA
213人220
221misc_feature222(2194)..(3235)223n=a,t,c,或g4005ccgggtaccg agctcccagg aagataaatg atttcctcct ctctagagat gggggtggga 60tctgagcact cagagccaag ggcgcagtgg gtccgggcgg gggccctcct cggccctccc 120aacatggggg ccaggaggtc agcccctcaa cctggacccc ggctgggtct cagggaatgg 180tctcccccag tggcccagct tgcttgtgtt ttcagatggg tgtgcatggg tgtgtgtgtg 240tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgatgcct gacaagcccc agagagccaa 300agacctgagt ggagatcttg tgacttctca aaagggggat tggaaggttc gagaaagagc 360tgtggtcagc cttgctctcc cttaaggctg tggtaaccac actaggcata gcataggcct 420gcgccccgtc cctccttccc tcctccgcgc ctctcctttc tctttctccc ccctctaccc 480cgctccctgg cctgctcctg gtgacaccgt tggccccctt ccagggctga gggaagccag 540cgggggcccc ttcctgaaag cccacctgca ggccggcttg ctgggaaggg gctgctctcg 600cagaggctcc cgcccgccct gcagccgttt cctggaagca gtcgctgtgg gtattctgtt 660ccttgtcagc actgtgcttg caaagaaagc agacactgtg ctccttgtcc ttagggagcc 720ccgctccatc acccaacacc tggctggaca caggcgggag gccgggtccg cggggagcgg 780cgcggggctg gggccggacc attaaacaca cacgggcgcc aggcactgca ggctcctcct 840cctcctcctg cccagcgcct ctgctcacag gcacgtgcca agcccctagg ccaggaggcc 900agcagtgggt gcagaacaag ctcctgggaa gggggtgcag ggcggacccc cggggagaag 960ggctggcagg gctgtggggg acgctgaccg tgggccccac gttgcagaaa actggntgcc1020tggctggaag atgggggaga tgccaagcct ctgaggcagc acgagcaggg tgcatggagg1080ccggggcgcg gggaggctgc actgcagcat gcaccccaaa gcccanaggg agtggagacc1140aggccctgga atcgagaagt agaaaggcgg cttggaggcc tcggaaccgg ctgacctcca1200acagagtggg gccggccctg gaggcaaaga ggtgcccggg gtccggccct gcctggggga1260gctatgtgtc atgggcaagc cacaggatat gtagcccgct ctgagcctat ggacccaggg1320cagggctgca aggcagggca ggggagacag cacgggggag caaggagcag agagggggcc1380tcaggctctc ccaggaggaa cattctcccg acaggaggaa gagacggccc aggggtgact1440gtggggagcc atggtggcag ctggggtcgt ggcagatggg agagaggctg gcgaggtgaa1500ggtgcagggg tcagggctct ggggcccaca tgcctgtggg agcaggcagg cccagggctc1560tccgccactc cccactcccg cttggctcat aggctgggcc caagggtggg gtgggatgag1620caggagatgg ggcccagggg gcaagcaggg ccccaaagac atttagaaaa accggtttat1680gcaggcagca ttcagagcag gcggcgtgcg tggcgggggc cctgggagca cagagaggca1740cacgtagggc ccccgagggg ctccccattg gccggcagtg acatcacccc tgtgtcaaca1800gtgatgtctg cagctccggc cagccagggt ttatggagcg agacccagcc cggcctgggc1860cctcactccc caggcccaca cactagccca ctgttcaggg tccggggtgg cggcatggcc1920tgggggtcct ggcaccgctg ctcctctgcc caccctaact tcccggcatc gcggctgccc1980cctctgagcg tccccaacca gtaagtgtgg ggcccagcag gcctgccgtc ctcctcctct2040tcccctctag agagaaacgt ggaggtcctg gggctggggg cgctcatagc cctgtgacac2100aggtgcatgg ggtcaggggt cccagaatgg cccctgggaa ggacctcagc tgggccggcg2160
gctctaggct tcaggggtct gtctgcacag gggntagccc ctcccagacc tctgtgaagc2220cagtacgggc ctcccctccc tgccccgtgc tctgtccggt gcttcctgga ctgcactgcg2280ggccactggt gagagggtgg acagggaagg gccgccgtgg tgcctgttcc tgcccacctg2340gctgtgtggt cccctccaag tagggacaac ccttctgagg gcttgggggc accctggggt2400tgccagggcc tcccagagcc ctgtgagccc ctggggggtc tggcctgatg cccccctcca2460cgtccagggc cggctgtggc ccagaacccc agcttcccag caggccggtg tgcggtggtg2520acccaggaga ggcctcgcct ccactgaggg gccaccgacc tctgtcagac cacagagacc2580cccaaggagt ctgaaggctg gagacccggg gctgggacca ggtgggactt tcccacggag2640ccgtccccag gcccagctgg ggacacgtcc cccttctctc cagacacacc ctgcctgcca2700ccaggacaca ccggcctgtt gggggtctct tttaagtgct tgccactctg aggtgactgt2760ccctttccaa agaggtttct ggggcccagg tgggatgcgt cggcctgagc aggaggatct2820gggccgccag gggctgggga ctgtctcctg gggaaggaag cgcctgggag cgtgtgtgct2880gacccaggac catccaggga ggcccgtctg tggggcaagc gggaagggag cggctggaga2940ggcttggccg cccccgccct gcctcccatt ccttagctcc atgcctgtca acctctgtca3000cccagtgagt gatgtccagg ggccctggaa aggtcacagc atgtttgagc ggggtgagag3060agaggggaaa ggcgggggcg gggaaaagta cgtggaggaa gctttaggcc caaggaagga3120gacagggttc tgggagggag ggagccactg gggccgccgg gaaggtccct gcttgctgct3180gccacccaga accctcgcct cttagctagc ccccgcagcc ccagcctttc tggcntgtgg3240ccctctcccc catccccagg tgtcctgtgc aaccaggcct tggacccaaa ccctcctgcc3300ccctcctctc cctcctcacc ctcccaatgc agtggtctcc agcctggctc tgccctgccg3360caggtcccct cccctcatta ccaggcctag agcctccagt cccggtggcc cccagcccga3420gggtgaacgg cctcaccctg ggtcgtggga cagagggcac gttcatcaag agtggctccc3480aagggacacg tggctgtttg cagttcacag gaagcattcg agataaggag cttgttttcc3540cagtgggcac ggagccagca ggggggctgt ggggcagccc agggtgcaag gccaggctgt3600ggggctgcag ctgccttggg ccccactccc aggcctttgc gggaggtggg aggcgggagg3660cggcagctgc acagtggccc caggcgaggc tctcagcccc agtcgctctc cgggtgggca3720gcccaagagg gtctggctga gcctcccaca tctgggactc catcacccaa caacttaatt3780aaggctgaat ttcacgtgtc ctgtgacttg ggtagacaaa gcccctgtcc aaaggggcag3840ccagcctaag gcagtgggga cggcgtgggt ggcgggcgac gggggagatg gacaacagga3900ccgagggtgt gcgggcgatg ggggagatgg acaacaggac cgagggtgtg cgggcgatgg3960gggagatgga caacaggacc gagggtgtgc gggacacgca tgtcactcat gcacgccaat4020ggggggcgtg ggaggctggg gagcagacag actgggctgg gctgggcggg aaggacgggc4080agatg408521062113408212DNA213人腺病毒5型220
221CDS222(44)..(598)220
221CDS222(715)..(1026)4006gtagagtttt ctcctccgag ccgctccgac accgggactg aaa atg aga cat att 55Met Arg His Ile1atc tgc cac gga ggt gtt att acc gaa gaa atg gcc gcc agt ctt ttg 103Ile Cys His Gly Gly Val Ile Thr Glu Glu Met Ala Ala Ser Leu Leu5 10 15 20gac cag ctg atc gaa gag gta ctg gct gat aat ctt cca cct cct agc 151Asp Gln Leu Ile Glu Glu Val Leu Ala Asp Asn Leu Pro Pro Pro Ser25 30 35cat ttt gaa cca cct acc ctt cac gaa ctg tat gat tta gac gtg acg 199His Phe Glu Pro Pro Thr Leu His Glu Leu Tyr Asp Leu Asp Val Thr40 45 50gcc ccc gaa gat ccc aac gag gag gcg gtt tcg cag att ttt ccc gac 247Ala Pro Glu Asp Pro Asn Glu Glu Ala Val Ser Gln Ile Phe Pro Asp55 60 65tct gta atg ttg gcg gtg cag gaa ggg att gac tta ctc act ttt ccg 295Ser Val Met Leu Ala Val Gln Glu Gly Ile Asp Leu Leu Thr Phe Pro70 75 80ccg gcg ccc ggt tct ccg gag ccg cct cac ctt tcc cgg cag ccc gag 343Pro Ala Pro Gly Ser Pro Glu Pro Pro His Leu Ser Arg Gln Pro Glu85 90 95 100cag ccg gag cag aga gcc ttg ggt ccg gtt tct atg cca aac ctt gta 391Gln Pro Glu Gln Arg Ala Leu Gly Pro Val Ser Met Pro Asn Leu Val105 110 115ccg gag gtg atc gat ctt acc tgc cac gag gct ggc ttt cca ccc agt 439Pro Glu Val Ile Asp Leu Thr Cys His Glu Ala Gly Phe Pro Pro Ser120 125 130gac gac gag gat gaa gag ggt gag gag ttt gtg tta gat tat gtg gag 487Asp Asp Glu Asp Glu Glu Gly Glu Glu Phe Val Leu Asp Tyr Val Glu135 140 145cac ccc ggg cac ggt tgc agg tct tgt cat tat cac cgg agg aat acg 535His Pro Gly His Gly Cys Arg Ser Cys His Tyr His Arg Arg Asn Thr150 155 160ggg gac cca gat att atg tgt tcg ctt tgc tat atg agg acc tgt ggc 583Gly Asp Pro Asp Ile Met Cys Ser Leu Cys Tyr Met Arg Thr Cys Gly165 170 175 180atg ttt gtc tac agt aagtgaaaat tatgggcagt gggtgataga gtggtgggtt 638Met Phe Val Tyr Ser185tggtgtggta attttttttt taatttttac agttttgtgg tttaaagaat tttgtattgt698
gattttttta aaaggt cct gtg tct gaa cct gag cct gag ccc gag cca gaa 750Pro Val Ser Glu Pro Glu Pro Glu Pro Glu Pro Glu190 195ccg gag cct gca aga cct acc cgc cgt cct aaa atg gcg cct gct atc 798Pro Glu Pro Ala Arg Pro Thr Arg Arg Pro Lys Met Ala Pro Ala Ile200 205 210ctg aga cgc ccg aca tca cct gtg tct aga gaa tgc aat agt agt acg 846Leu Arg Arg Pro Thr Ser Pro Val Ser Arg Glu Cys Asn Ser Ser Thr215 220 225gat agc tgt gac tcc ggt cct tct aac aca cct cct gag ata cac ccg 894Asp Ser Cys Asp Ser Gly Pro Ser Asn Thr Pro Pro Glu Ile His Pro230 235 240 245gtg gtc ccg ctg tgc ccc att aaa cca gtt gcc gtg aga gtt ggt ggg 942Val Val Pro Leu Cys Pro Ile Lys Pro Val Ala Val Arg Val Gly Gly250 255 260cgt cgc cag gct gtg gaa tgt atc gag gac ttg ctt aac gag cct ggg 990Arg Arg Gln Ala Val Glu Cys Ile Glu Asp Leu Leu Asn Glu Pro Gly265 270 275caa cct ttg gac ttg agc tgt aaa cgc ccc agg cca taaggtgtaa 1036Gln Pro Leu Asp Leu Ser Cys Lys Arg Pro Arg Pro280 285acctgtgatt gcgtgtgtgg ttaacgcctt tgtttgctga atgagttgat gtaagtttaa1096taaagggtga gataatgttt aacttgcatg gcgtgttaaa tggggcgggg cttaaagggt1156atataatgcg ccgtgggcta atcttggtta catctgacct catggaggct tgggagtgtt1216tggaagattt ttctgctgtg cgtaacttgc tggaacagag ctctaacagt acctcttggt1276tttggaggtt tctgtggggc tcatcccagg caaagttagt ctgcagaatt aaggaggatt1336acaagtggga atttgaagag cttttgaaat cctgtggtga gctgtttgat tctttgaatc1396tgggtcacca ggcgcttttc caagagaagg tcatcaagac tttggatttt tccacaccgg1456ggcgcgctgc ggctgctgtt gcttttttga gttttataaa ggataaatgg agcgaagaaa1516cccatctgag cggggggtac ctgctggatt ttctggccat gcatctgtgg agagcggttg1576tgagacacaa gaatcgcctg ctactgttgt cttccgtccg cccggcgata ataccgacgg1636aggagcagca gcagcagcag gaggaagcca ggcggcggcg gcaggagcag agcccatgga1696acccgagagc cggcctggac cctcgggaat gaatgttgta caggtggctg aactgtatcc1756agaactgaga cgcattttga caattacaga ggatgggcag gggctaaagg gggtaaagag1816ggagcggggg gcttgtgagg ctacagagga ggctaggaat ctagctttta gcttaatgac1876cagacaccgt cctgagtgta ttacttttca acagatcaag gataattgcg ctaatgagct1936tgatctgctg gcgcagaagt attccataga gcagctgacc acttactggc tgcagccagg1996ggatgatttt gaggaggcta ttagggtata tgcaaaggtg gcacttaggc cagattgcaa2056gtacaagatc agcaaacttg taaatatcag gaattgttgc tacatttctg ggaacggggc2116cgaggtggag atagatacgg aggatagggt ggcctttaga tgtagcatga taaatatgtg2176gccgggggtg cttggcatgg acggggtggt tattatgaat gtaaggttta ctggccccaa2236ttttagcggt acggttttcc tggccaatac caaccttatc ctacacggtg taagcttcta2296tgggtttaac aatacctgtg tggaagcctg gaccgatgta agggttcggg gctgtgcctt2356ttactgctgc tggaaggggg tggtgtgtcg ccccaaaagc agggcttcaa ttaagaaatg2416
cctctttgaa aggtgtacct tgggtatcct gtctgagggt aactccaggg tgcgccacaa2476tgtggcctcc gactgtggtt gcttcatgct agtgaaaagc gtggctgtga ttaagcataa2536catggtatgt ggcaactgcg aggacagggc ctctcagatg ctgacctgct cggacggcaa2596ctgtcacctg ctgaagacca ttcacgtagc cagccactct cgcaaggcct ggccagtgtt2656tgagcataac atactgaccc gctgttcctt gcatttgggt aacaggaggg gggtgttcct2716accttaccaa tgcaatttga gtcacactaa gatattgctt gagcccgaga gcatgtccaa2776ggtgaacctg aacggggtgt ttgacatgac catgaagatc tggaaggtgc tgaggtacga2836tgagacccgc accaggtgca gaccctgcga gtgtggcggt aaacatatta ggaaccagcc2896tgtgatgctg gatgtgaccg aggagctgag gcccgatcac ttggtgctgg cctgcacccg2956cgctgagttt ggctctagcg atgaagatac agattgaggt actgaaatgt gtgggcgtgg3016cttaagggtg ggaaagaata tataaggtgg gggtcttatg tagttttgta tctgttttgc3076agcagccgcc gccgccatga gcaccaactc gtttgatgga agcattgtga gctcatattt3136gacaacgcgc atgcccccat gggccggggt gcgtcagaat gtgatgggct ccagcattga3196tggtcgcccc gtcctgcccg caaactctac taccttgacc tacgagaccg tgtctggaac3256gccgttggag actgcagcct ccgccgccgc ttcagccgct gcagccaccg cccgcgggat3316tgtgactgac tttgctttcc tgagcccgct tgcaagcagt gcagcttccc gttcatccgc3376ccgcgatgac aagttgacgg ctcttttggc ac 34082107211289212PRT213人腺病毒5型4007Met Arg His Ile Ile Cys His Gly Gly Val Ile Thr Glu Glu Met Ala1 5 10 15Ala Ser Leu Leu Asp Gln Leu Ile Glu Glu Val Leu Ala Asp Asn Leu20 25 30Pro Pro Pro Ser His Phe Glu Pro Pro Thr Leu His Glu Leu Tyr Asp35 40 45Leu Asp Val Thr Ala Pro Glu Asp Pro Asn Glu Glu Ala Val Ser Gln50 55 60Ile Phe Pro Asp Ser Val Met Leu Ala Val Gln Glu Gly Ile Asp Leu65 70 75 80Leu Thr Phe Pro Pro Ala Pro Gly Ser Pro Glu Pro Pro His Leu Ser85 90 95Arg Gln Pro Glu Gln Pro Glu Gln Arg Ala Leu Gly Pro Val Ser Met100 105 110
Pro Asn Leu Val Pro Glu Val Ile Asp Leu Thr Cys His Glu Ala Gly115 120 125Phe Pro Pro Ser Asp Asp Glu Asp Glu Glu Gly Glu Glu Phe Val Leu130 135 140Asp Tyr Val Glu His Pro Gly His Gly Gys Arg Ser Cys His Tyr His145 150 155 160Arg Arg Asn Thr Gly Asp Pro Asp Ile Met Cys Ser Leu Cys Tyr Met165 170 175Arg Thr Cys Gly Met Phe Val Tyr Ser Pro Val Ser Glu Pro Glu Pro180 185 190Glu Pro Glu Pro Glu Pro Glu Pro Ala Arg Pro Thr Arg Arg Pro Lys195 200 205Met Ala Pro Ala Ile Leu Arg Arg Pro Thr Ser Pro Val Ser Arg Glu210 215 220Cys Asn Ser Ser Thr Asp Ser Cys Asp Ser Gly Pro Ser Asn Thr Pro225 230 235 240Pro Glu Ile His Pro Val Val Pro Leu Cys Pro Ile Lys Pro Val Ala245 250 255Val Arg Val Gly Gly Arg Arg Gln Ala Val Glu Cys Ile Glu Asp Leu260 265 270Leu Asn Glu Pro Gly Gln Pro Leu Asp Leu Ser Cys Lys Arg Pro Arg275 280 285Pro2108211496212PRT213人腺病毒5型4008Met Glu Arg Arg Asn Pro Ser Glu Arg Gly Val Pro Ala Gly Phe Ser
1 5 10 15Gly His Ala Ser Val Glu Ser Gly Cys Glu Thr Gln Glu Ser Pro Ala20 25 30Thr Val Val Phe Arg Pro Pro Gly Asp Asn Thr Asp Gly Gly Ala Ala35 40 45Ala Ala Ala Gly Gly Ser Gln Ala Ala Ala Ala Gly Ala Glu Pro Met50 55 60Glu Pro Glu Ser Arg Pro Gly Pro Ser Gly Met Asn Val Val Gln Val65 70 75 80Ala Glu Leu Tyr Pro Glu Leu Arg Arg Ile Leu Thr Ile Thr Glu Asp85 90 95Gly Gln Gly Leu Lys Gly Val Lys Arg Glu Arg Gly Ala Cys Glu Ala100 105 110Thr Glu Glu Ala Arg Asn Leu Ala Phe Ser Leu Met Thr Arg His Arg115 120 125Pro Glu Cys Ile Thr Phe Gln Gln Ile Lys Asp Asn Cys Ala Asn Glu130 135 140Leu Asp Leu Leu Ala Gln Lys Tyr Ser Ile Glu Gln Leu Thr Thr Tyr145 150 155 160Trp Leu Gln Pro Gly Asp Asp Phe Glu Glu Ala Ile Arg Val Tyr Ala165 170 175Lys Val Ala Leu Arg Pro Asp Cys Lys Tyr Lys Ile Ser Lys Leu Val180 185 190Asn Ile Arg Asn Cys Cys Tyr Ile Ser Gly Asn Gly Ala Glu Val Glu195 200 205Ile Asp Thr Glu Asp Arg Val Ala Phe Arg Cys Ser Met Ile Asn Met210 215 220Trp Pro Gly Val Leu Gly Met Asp Gly Val Val Ile Met Asn Val Arg225 230 235 240Phe Thr Gly Pro Asn Phe Ser Gly Thr Val Phe Leu Ala Asn Thr Asn245 250 255Leu Ile Leu His Gly Val Ser Phe Tyr Gly Phe Asn Asn Thr Cys Val260 265 270Glu Ala Trp Thr Asp Val Arg Val Arg Gly Cys Ala Phe Tyr Cys Cys275 280 285Trp Lys Gly Val Val Cys Arg Pro Lys Ser Arg Ala Ser Ile Lys Lys290 295 300Cys Leu Phe Glu Arg Cys Thr Leu Gly Ile Leu Ser Glu Gly Asn Ser305 310 315 320Arg Val Arg His Asn Val Ala Ser Asp Cys Gly Cys Phe Met Leu Val325 330 335Lys Ser Val Ala Val Ile Lys His Asn Met Val Cys Gly Asn Cys Glu340 345 350Asp Arg Ala Ser Gln Met Leu Thr Cys Ser Asp Gly Asn Cys His Leu
355 360 365Leu Lys Thr Ile His Val Ala Ser His Ser Arg Lys Ala Trp Pro Val370 375 380Phe Glu His Asn Ile Leu Thr Arg Cys Ser Leu His Leu Gly Asn Arg385 390 395 400Arg Gly Val Phe Leu Pro Tyr Gln Cys Asn Leu Ser His Thr Lys Ile405 410 415Leu Leu Glu Pro Glu Ser Met Ser Lys Val Asn Leu Asn Gly Val Phe420 425 430Asp Met Thr Met Lys Ile Trp Lys Val Leu Arg Tyr Asp Glu Thr Arg435 440 445Thr Arg Cys Arg Pro Cys Glu Cys Gly Gly Lys His Ile Arg Asn Gln450 455 460Pro Val Met Leu Asp Val Thr Glu Glu Leu Arg Pro Asp His Leu Val465 470 475 480Leu Ala Cys Thr Arg Ala Glu Phe Gly Ser Ser Asp Glu Asp Thr Asp485 490 4952109211529212PRT213人腺病毒5型4009Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly1 5 10 15Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro20 25 30Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Met Arg35 40 45Arg Arg Ile Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu50 55 60Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Ala Ala Asp Leu65 70 75 80Ala Ile Ala Pro Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu85 90 95Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu100 105 110Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile115 120 125Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp130 135 140Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Glu Glu Glu Pro145 150 155 160Ser Glu Ala Glu Ser Glu Ile Thr Val Met Asn Pro Leu Ser Val Pro
165 170 175Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met180 185 190Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Ash Phe Lys Leu Leu195 200 205Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn210 215 220Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Lys Lys Thr Phe225 230 235 240Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala245 250 255Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu260 265 270His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser275 280 285Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu290 295 300Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val305 310 315 320Lys Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala325 330 335Arg Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly340 345 350Lys Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala355 360 365Phe Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln370 375 380Thr Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser385 390 395 400Lys Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr405 410 415Pro Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser420 425 430Asp Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe435 440 445Gln Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly450 455 460Pro Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu465 470 475 480Val Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg485 490 495Met Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn500 505 510Val Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp
515520 525Phe21010211116212PRT213人腺病毒5型40010Met Ile Arg Cys Leu Arg Leu Lys Val Glu Gly Ala Leu Glu Gln Ile1 5 10 15Phe Thr Met Ala Gly Leu Asn Ile Arg Asp Leu Leu Arg Asp Ile Leu20 25 30Arg Arg Trp Arg Asp Glu Asn Tyr Leu Gly Met Val Glu Gly Ala Gly35 40 45Met Phe Ile Glu Glu Ile His Pro Glu Gly Phe Ser Leu Tyr Val His50 55 60Leu Asp Val Arg Ala Val Cys Leu Leu Glu Ala Ile Val Gln His Leu65 70 75 80Thr Asn Ala Ile Ile Cys Ser Leu Ala Val Glu Phe Asp His Ala Thr85 90 95Gly Gly Glu Arg Val His Leu Ile Asp Leu His Phe Glu Val Leu Asp100 105 110Asn Leu Leu Glu1152101121135937212DNA213人腺病毒2型40011catcatcata atatacctta ttttggattg aagccaatat gataatgagg gggtggagtt 60tgtgacgtgg cgcggggcgt gggaacgggg cgggtgacgt agtagtgtgg cggaagtgtg120atgttgcaag tgtggcggaa cacatgtaag cgccggatgt ggtaaaagtg acgtttttgg180tgtgcgccgg tgtatacggg aagtgacaat tttcgcgcgg ttttaggcgg atgttgtagt240aaatttgggc gtaaccaagt aatgtttggc cattttcgcg ggaaaactga ataagaggaa300gtgaaatctg aataattctg tgttactcat agcgcgtaat atttgtctag ggccgcgggg360actttgaccg tttacgtgga gactcgccca ggtgtttttc tcaggtgttt tccgcgttcc420gggtcaaagt tggcgtttta ttattatagt cagctgacgc gcagtgtatt tatacccggt480gagttcctca agaggccact cttgagtgcc agcgagtaga gttttctcct ccgagccgct540ccgacaccgg gactgaaaat gagacatatt atctgccacg gaggtgttat taccgaagaa600atggccgcca gtcttttgga ccagctgatc gaagaggtac tggctgataa tcttccacct660cctagccatt ttgaaccacc tacccttcac gaactgtatg atttagacgt gacggccccc720gaagatccca acgaggaggc ggtttcgcag atttttcccg agtctgtaat gttggcggtg780
caggaaggga ttgacttatt cacttttccg ccggcgcccg gttctccgga gccgcctcac 840ctttcccggc agcccgagca gccggagcag agagccttgg gtccggtttc tatgccaaac 900cttgtgccgg aggtgatcga tcttacctgc cacgaggctg gctttccacc cagtgacgac 960gaggatgaag agggtgagga gtttgtgtta gattatgtgg agcaccccgg gcacggttgc1020aggtcttgtc attatcaccg gaggaatacg ggggacccag atattatgtg ttcgctttgc1080tatatgagga cctgtggcat gtttgtctac agtaagtgaa aattatgggc agtcggtgat1140agagtggtgg gtttggtgtg gtaatttttt tttaattttt acagttttgt ggtttaaaga1200attttgtatt gtgatttttt aaaaggtcct gtgtctgaac ctgagcctga gcccgagcca1260gaaccggagc ctgcaagacc tacccggcgt cctaaattgg tgcctgctat cctgagacgc1320ccgacatcac ctgtgtctag agaatgcaat agtagtacgg atagctgtga ctccggtcct1380tctaacacac ctcctgagat acacccggtg gtcccgctgt gccccattaa accagttgcc1440gtgagagttg gtgggcgtcg ccaggctgtg gaatgtatcg aggacttgct taacgagtct1500gggcaacctt tggacttgag ctgtaaacgc cccaggccat aaggtgtaaa cctgtgattg1560cgtgtgtggt taacgccttt gtttgctgaa tgagttgatg taagtttaat aaagggtgag1620ataatgttta acttgcatgg cgtgttaaat ggggcggggc ttaaagggta tataatgcgc1680cgtgggctaa tcttggttac atctgacctc atggaggctt gggagtgttt ggaagatttt1740tctgctgtgc gtaacttgct ggaacagagc tctaacagta cctcttggtt ttggaggttt1800ctgtggggct cctcccaggc aaagttagtc tgcagaatta aggaggatta caagtgggaa1860tttgaagagc ttttgaaatc ctgtggtgag ctgtttgatt ctttgaatct gggtcaccag1920gcgcttttcc aagagaaggt catcaagact ttggattttt ccacaccggg gcgcgctgcg1980gctgctgttg cttttttgag ttttataaag gataaatgga gcgaagaaac ccatctgagc2040ggggggtacc tgctggattt tctggccatg catctgtgga gagcggtggt gagacacaag2100aatcgcctgc tactgttgtc ttccgtccgc ccggcaataa taccgacgga ggagcaacag2160caggaggaag ccaggcggcg gcggcggcag gagcagagcc catggaaccc gagagccggc2220ctggaccctc gggaatgaat gttgtacagg tggctgaact gtttccagaa ctgagacgca2280ttttaaccat taacgaggat gggcaggggc taaagggggt aaagagggag cggggggctt2340ctgaggctac agaggaggct aggaatctaa cttttagctt aatgaccaga caccgtcctg2400agtgtgttac ttttcagcag attaaggata attgcgctaa tgagcttgat ctgctggcgc2460agaagtattc catagagcag ctgaccactt actggctgca gccaggggat gattttgagg2520aggctattag ggtatatgca aaggtggcac ttaggccaga ttgcaagtac aagattagca2580aacttgtaaa tatcaggaat tgttgctaca tttctgggaa cggggccgag gtggagatag2640atacggagga tagggtggcc tttagatgta gcatgataaa tatgtggccg ggggtgcttg2700gcatggacgg ggtggttatt atgaatgtga ggtttactgg tcccaatttt agcggtacgg2760ttttcctggc caataccaat cttatcctac acggtgtaag cttctatggg tttaacaata2820cctgtgtgga agcctggacc gatgtaaggg ttcggggctg tgccttttac tgctgctgga2880agggggtggt gtgtcgcccc aaaagcaggg cttcaattaa gaaatgcctg tttgaaaggt2940gtaccttggg tatcctgtct gagggtaact ccagggtgcg ccacaatgtg gcctccgact3000gtggttgctt catgctagtg aaaagcgtgg ctgtgattaa gcataacatg gtgtgtggca3060actgcgagga cagggcctct cagatgctga cctgctcgga cggcaactgt cacttgctga3120agaccattca cgtagccagc cactctcgca aggcctggcc agtgtttgag cacaacatac3180tgacccgctg ttccttgcat ttgggtaaca ggaggggggt gttcctacct taccaatgca3240atttgagtca cactaagata ttgcttgagc ccgagagcat gtccaaggtg aacctgaacg3300gggtgtttga catgaccatg aagatctgga aggtgctgag gtacgatgag acccgcacca3360ggtgcagacc ctgcgagtgt ggcggtaaac atattaggaa ccagcctgtg atgctggatg3420
tgaccgagga gctgaggccc gatcacttgg tgctggcctg cacccgcgct gagtttggct3480ctagcgatga agatacagat tgaggtactg aaatgtgtgg gcgtggctta agggtgggaa3540agaatatata aggtgggggt ctcatgtagt tttgtatctg ttttgcagca gccgccgcca3600tgagcgccaa ctcgtttgat ggaagcattg tgagctcata tttgacaacg cgcatgcccc3660catgggccgg ggtgcgtcag aatgtgatgg gctccagcat tgatggtcgc cccgtcctgc3720ccgcaaactc tactaccttg acctacgaga ccgtgtctgg aacgccgttg gagactgcag3780cctccgccgc cgcttcagcc gctgcagcca ccgcccgcgg gattgtgact gactttgctt3840tcctgagccc gcttgcaagc agtgcagctt cccgttcatc cgcccgcgat gacaagttga3900cggctctttt ggcacaattg gattctttga cccgggaact taatgtcgtt tctcagcagc3960tgttggatct gcgccagcag gtttctgccc tgaaggcttc ctcccctccc aatgcggttt4020aaaacataaa taaaaaccag actctgtttg gattttgatc aagcaagtgt cttgctgtct4080ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt cgttgagggt4140cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat acatgggcat4200aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg gggtggtgtt4260gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt ctttcagtag4320caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt taagctggga4380tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt tggctatgtt4440cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag tgtatccggt4500gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact tggagacgcc4560cttgtgacct ccgagatttt ccatgcattc gtccataatg atggcaatgg gcccacgggc4620ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt ccaggatgag4680atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg gtataatggt4740tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg ctttgagttc4800agatgggggg atcatgtcta cctgcggggc gatgaagaaa accgtttccg gggtagggga4860gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc cggtgggccc4920gtaaatcaca cctattaccg gctgcaactg gtagttaaga gagctgcagc tgccgtcatc4980cctgagcagg ggggccactt cgttaagcat gtccctgact tgcatgtttt ccctgaccaa5040atgcgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag caaagttttt5100caacggtttg aggccgtccg ccgtaggcat gcttttgagc gtttgaccaa gcagttccag5160gcggtcccac agctcggtca cgtgctctac ggcatctcga tccagcatat ctcctcgttt5220cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag acgggccagg5280gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac ggtgaagggg5340tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct ggtgctgaag5400cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt gtcatagtcc5460agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc gccgcacgag5520gggcagtgca gacttttaag ggcgtagagc ttgggcgcga gaaataccga ttccggggag5580taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca ggtgagctct5640ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt cttacctctg5700gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc cccgtataca5760gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag aaactcggac5820cactctgaga cgaaggctcg cgtccaggcc agcacgaagg aggctaagtg ggaggggtag5880cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat gtcgccctct5940tcggcatcaa ggaaggtgat tggtttatag gtgtaggcca cgtgaccggg tgttcctgaa6000ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc atcgctgtct6060
gcgagggcca gctgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta6120agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc ggtgatgcct6180ttgagggtgg ccgcgtccat ctggtcagaa aagacaatct ttttgttgtc aagcttggtg6240gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag ggtttggttt6300ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc gcgcgcaacg6360caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac gcgccaaccg6420cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag gcgctcgttg6480gtccagcaga ggcggccgcc cttgcgcgaa cagaatggcg gtagtgggtc tagctgcgtc6540tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc gtcgaagtag6600tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc aagcgcgcgc6660tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga ggcgtacatg6720ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt agggtagcat6780cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg agcgaggagg6840tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg cctgaagatg6900gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc gtctgtgaga6960cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac cagctcggcg7020gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc atacttatcc7080tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc tttccagtac7140tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta gaactggttg7200acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg cgcggccttc7260cggagcgagg tgtgggtgag cgcaaaggtg tccctaacca tgactttgag gtactggtat7320ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt gcgctttttg7380gaacgcgggt ttggcagggc gaaggtgaca tcgttgaaaa gtatctttcc cgcgcgaggc7440ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt aattacctgg7500gcggcgagca cgatctcgtc gaagccgttg atgttgtggc ccacgatgta aagttccaag7560aagcgcgggg tgcccttgat ggagggcaat tttttaagtt cctcgtaggt gagctcctca7620ggggagctga gcccgtgttc tgacagggcc cagtctgcaa gatgagggtt ggaagcgacg7680aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa ggtcctaaac7740tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg gtcttgttcc7800cagcggtccc atccaaggtc cacggctagg tctcgcgcgg cggtcaccag aggctcatct7860ccgccgaact tcataaccag catgaagggc acgagctgct tcccaaaggc ccccatccaa7920gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg cgagccgatc7980gggaagaact ggatctcccg ccaccagttg gaggagtggc tgttgatgtg gtgaaagtag8040aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc gcagtactgg8100cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg cacaaggaag8160cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc tacttcggct8220gcttgtcctt gaccgtctgg ctgctcgagg ggagttatgg tggatcggac caccacgccg8280cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac aacatcgcgc8340agatgggagc tgtccatggt ctggagctcc cgcggcgaca ggtcaggcgg gagctcctgc8400aggtttacct cgcatagccg ggtcagggcg cgggctaggt ccaggtgata cctgatttcc8460aggggctggt tggtggcggc gtcgatgact tgcaagaggc cgcatccccg cggcgcgact8520acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc atctaaaagc8580ggtgacgcgg gcgggccccc ggaggtaggg ggggctcggg acccgccggg agagggggca8640ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcggagg ttgctggcga8700
acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag acgacgggcc 8760cggtgagctt gaacctgaaa gagagttcga cagaatcaat ttcggtgtcg ttgacggcgg 8820cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatt tcggccatga 8880actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg gtggcggcga 8940ggtcgttgga gatgcgggcc atgagctgcg agaaggcgtt gaggcctccc tcgttccaga 9000cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc tgcgcgagat 9060tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag aggtagttga 9120gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc aacgtggatt 9180cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc acggcgaagt 9240tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga cggatgagct 9300cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct tcttcaatct 9360cctcttccat aagggcctcc ccttcttctt cttcttctgg cggcggtggg ggagggggga 9420cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc atctccccgc 9480ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc agttggaaga 9540cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccgtgcggc agggatacgg 9600cgctaacgat gcatctcaac aattgttgtg taggtactcc gccaccgagg gacctgagcg 9660agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag tcacagtcgc 9720aaggtaggct gagcaccgtg gcgggcggca gcgggtggcg gtcggggttg tttctggcgg 9780aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg gtcgacagaa 9840gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg ccccaggctt 9900cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct accggcactt 9960cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctacggcg gcggcggagt10020ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc ctcatcggct10080gaagcagggc caggtcggcg acaacgcgct cggctaatat ggcctgctgc acctgcgtga10140gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg ttgatggtgt10200aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc gagagctcgg10260tgtacctgag acgcgagtaa gcccttgagt caaagacgta gtcgttgcaa gtccgcacca10320ggtactgata tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc cagcgtaggg10380tggccggggc tccgggggcg aggtcttcca acataaggcg atgatatccg tagatgtacc10440tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg cggacgcggt10500tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg ccggtgaggc10560gtgcgcagtc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg ggcactcttc10620cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt tcgaaccccg10680gatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc caggtgtgcg10740acgtcagaca acgggggagc gctccttttg gcttccttcc aggcgcggcg gctgctgcgc10800tagctttttt ggccactggc cgcgcgcggc gtaagcggtt aggctggaaa gcgaaagcat10860taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc gcaggacccc10920cggttcgagt ctcgggccgg ccggactgcg gcgaacgggg gtttgcctcc ccgtcatgca10980agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc ttttcccaga11040tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag caagagcagc11100ggcagacatg cagggcaccc tccccttctc ctaccgcgtc aggaggggca acatccgcgg11160ctgacgcggc ggcagatggt gattacgaac ccccgcggcg ccgggcccgg cactacctgg11220acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag cgacacccaa11280gggtgcagct gaagcgtgac acgcgcgagg cgtacgtgcc gcggcagaac ctgtttcgcg11340
accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca gggcgcgagt11400tgcggcatgg cctgaaccgc gagcggttgc tgcgcgagga ggactttgag cccgacgcgc11460ggaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta accgcgtacg11520agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac gtgcgcacgc11580ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt gtaagcgcgc11640tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata gtgcagcaca11700gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc gagggccgct11760ggctgctcga tttgataaac attctgcaga gcatagtggt gcaggagcgc agcttgagcc11820tggctgacaa ggtggccgcc attaactatt ccatgctcag tctgggcaag ttttacgccc11880gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc gaggggttct11940acatgcgcat ggcgttgaag gtgcttacct tgagcgacga cctgggcgtt tatcgcaacg12000agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac cgcgagctga12060tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag gccgagtcct12120actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg gaggcagctg12180gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc ggcgtggagg12240aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg gtgatgtttc12300tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc agagccagcc12360gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca tgtcgctgac12420tgcgcgtaac cctgacgcgt tccggcagca gccgcaggcc aaccggctct ccgcaattct12480ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg cgatcgtaaa12540cgcgctggcc gaaaacaggg ccatccggcc cgatgaggcc ggcctggtct acgacgcgct12600gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg accggctggt12660gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg gcaacctggg12720ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc cgcggggaca12780ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga caccgcaaag12840tgaggtgtac cagtccgggc cagactattt tttccagacc agtagacaag gcctgcagac12900cgtaaacctg agccaggctt tcaagaactt gcaggggctg tggggggtgc gggctcccac12960aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt tgctgctgct13020aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag gtcacttgct13080gacactgtac cgcgaggcca taggtcaggc gcatgtgggc gagcatactt tccaggagat13140tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg caaccctgaa13200ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa acagcgagga13260ggagcgcatc ttgcgctatg tgcagcagag cgtgagcctt aacctgatgc gcgacggggt13320aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca tgtatgcctc13380aaaccggccg tttatcaatc gcctaatgga ctacttgcat cgcgcggccg ccgtgaaccc13440cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg gtttctacac13500cgggggattt gaggtgcccg agggtaacga tggattcctc tgggacgaca tagacgacag13560cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc aggcagaggc13620ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag gcgctgcggc13680cccgcggtca gatgcgagta gcccatttcc aagcttgata gggtctttta ccagcactcg13740caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc tgctgcagcc13800gcagcgcgaa aagaacctgc ctccggcatt tcccaacaac gggatagaga gcctagtgga13860caagatgagt agatggaaga cgtatgcgca ggagcacagg gatgtgcccg gcccgcgccc13920gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg acgatgactc13980
ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg cgcaccttcg14040ccccaggctg gggagaatgt tttaaaaaaa aaaaaaaaaa gcatgatgca aaataaaaaa14100ctcaccaagg ccatggcacc gagcgttggt tttcttgtat tccccttagt atgcagcgcg14160cggcgatgta tgaggaaggt cctcctccct cctacgagag cgtggtgagc gcggcgccag14220tggcggcggc gctgggttcc cccttcgatg ctcccctgga cccgccgttt gtgcctccgc14280ggtacctgcg gcctaccggg gggagaaaca gcatccgtta ctctgagttg gcacccctat14340tcgacaccac ccgtgtgtac cttgtggaca acaagtcaac ggatgtggca tccctgaact14400accagaacga ccacagcaac tttctaacca cggtcattca aaacaatgac tacagcccgg14460gggaggcaag cacacagacc atcaatcttg acgaccgttc gcactggggc ggcgacctga14520aaaccatcct gcataccaac atgccaaatg tgaacgagtt catgtttacc aataagttta14580aggcgcgggt gatggtgtcg cgctcgctta ctaaggacaa acaggtggag ctgaaatatg14640agtgggtgga gttcacgctg cccgagggca actactccga gaccatgacc atagacctta14700tgaacaacgc gatcgtggag cactacttga aagtgggcag gcagaacggg gttctggaaa14760gcgacatcgg ggtaaagttt gacacccgca acttcagact ggggtttgac ccagtcactg14820gtcttgtcat gcctggggta tatacaaacg aagccttcca tccagacatc attttgctgc14880caggatgcgg ggtggacttc acccacagcc gcctgagcaa cttgttgggc atccgcaagc14940ggcaaccctt ccaggagggc tttaggatca cctacgatga cctggagggt ggtaacattc15000ccgcactgtt ggatgtggac gcctaccagg caagcttaaa agatgacacc gaacagggcg15060gggatggcgc aggcggcggc aacaacagtg gcagcggcgc ggaagagaac tccaacgcgg15120cagccgcggc aatgcagccg gtggaggaca tgaacgatca tgccattcgc ggcgacacct15180ttgccacacg ggcggaggag aagcgcgctg aggccgaggc agcggcagaa gctgccgccc15240ccgctgcgca acccgaggtc gagaagcctc agaagaaacc ggtgatcaaa cccctgacag15300aggacagcaa gaaacgcagt tacaacctaa taagcaatga cagcaccttc acccagtacc15360gcagctggta ccttgcatac aactacggcg accctcagac cgggatccgc tcatggaccc15420tcctttgcac tcctgacgta acctgcggct cggagcaggt ctactggtcg ttgccagaca15480tgatgcaaga ccccgtgacc ttccgctcca cgagccagat cagcaacttt ccggtggtgg15540gcgccgagct gttgcccgtg cactccaaga gcttctacaa cgaccaggcc gtctactccc15600agctcatccg ccagtttacc tctctgaccc acgtgttcaa tcgctttccc gagaaccaga15660ttttggcgcg cccgccagcc cccaccatca ccaccgtcag tgaaaacgtt cctgctctca15720cagatcacgg gacgctaccg ctgcgcaaca gcatcggagg agtccagcga gtgaccatta15780ctgacgccag acgccgcacc tgcccctacg tttacaaggc cctgggcata gtctcgccgc15840gcgtcctatc gagccgcact ttttgagcaa acatgtccat ccttatatcg cccagcaata15900acacaggctg gggcctgcgc ttcccaagca agatgtttgg cggggcaaag aagcgctccg15960accaacaccc agtgcgcgtg cgcgggcact accgcgcgcc ctggggcgcg cacaaacgcg16020gccgcactgg gcgcaccacc gtcgatgacg ccattgacgc ggtggtggag gaggcgcgca16080actacacgcc cacgccgcca ccagtgtcca cagtggacgc ggccattcag accgtggtgc16140gcggagcccg gcgttatgct aaaatgaaga gacggcggag gcgcgtagca cgtcgccacc16200gccgccgacc cggcactgcc gcccaacgcg cggcggcggc cctgcttaac cgcgcacgtc16260gcaccggccg acgggcggcc atgcgggccg ctcgaaggct ggccgcgggt attgtcactg16320tgccccccag gtccaggcga cgagcggccg ccgcagcagc cgcggccatt agtgctatga16380ctcagggtcg caggggcaac gtgtactggg tgcgcgactc ggttagcggc ctgcgcgtgc16440ccgtgcgcac ccgccccccg cgcaactaga ttgcaagaaa aaactactta gactcgtact16500gttgtatgta tccagcggcg gcggcgcgca acgaagctat gtccaagcgc aaaatcaaag16560aagagatgct ccaggtcatc gcgccggaga tctatggccc cccgaagaag gaagagcagg16620
attacaagcc ccgaaagcta aagcgggtca aaaagaaaaa gaaagatgat gatgatgatg16680aacttgacga cgaggtggaa ctgctgcacg caaccgcgcc caggcggcgg gtacagtgga16740aaggtcgacg cgtaagacgt gttttgcgac ccggcaccac cgtagttttt acgcccggtg16800agcgctccac ccgcacctac aagcgcgtgt atgatgaggt gtacggcgac gaggacctgc16860ttgagcaggc caacgagcgc ctcggggagt ttgcctacgg aaagcggcat aaggacatgt16920tggcgttgcc gctggacgag ggcaacccaa cacctagcct aaagcccgtg acactgcagc16980aggtgctgcc cacgcttgca ccgtccgaag aaaagcgcgg cctaaagcgc gagtctggtg17040acttggcacc caccgtgcag ctgatggtac ccaagcgcca gcgactggaa gatgtcttgg17100aaaaaatgac cgtggagcct gggctggagc ccgaggtccg cgtgcggcca atcaagcagg17160tggcaccggg actgggcgtg cagaccgtgg acgttcagat acccaccacc agtagcacta17220gtattgccac tgccacagag ggcatggaga cacaaacgtc cccggttgcc tcggcggtgg17280cagatgccgc ggtgcaggcg gccgctgcgg ccgcgtccaa aacctctacg gaggtgcaaa17340cggacccgtg gatgtttcgc gtttcagccc cccggcgccc gcgccgttcc aggaagtacg17400gcaccgccag cgcactactg cccgaatatg ccctacatcc ttccatcgcg cctacccccg17460gctatcgtgg ctacacctac cgccccagaa gacgagcgac tacccgacgc cgaaccacca17520ctggaacccg ccgccgccgt cgccgtcgcc agcccgtgct ggccccgatt tccgtgcgca17580gggtggctcg cgaaggaggc aggaccctgg tgctgccaac agcgcgctac caccccagca17640tcgtttaaaa gccggtcttt gtggttcttg cagatatggc cctcacctgc cgcctccgtt17700tcccggtgcc gggattccga ggaagaatgc accgtaggag gggcatggcc ggccacggcc17760tgacgggcgg catgcgtcgt gcgcaccacc ggcggcggcg cgcgtcgcac cgtcgcatgc17820gcggcggtat cctgcccctc cttattccac tgatcgccgc ggcgattggc gccgtgcccg17880gaattgcatc cgtggccttg caggcgcaga gacactgatt aaaaacaagt tgcatgtgga17940aaaatcaaaa taaaaagtct ggagtctcac gctcgcttgg tcctgtaact attttgtaga18000atggaagaca tcaactttgc gtctctggcc ccgcgacacg gctcgcgccc gttcatggga18060aactggcaag atatcggcac cagcaatatg agcggtggcg ccttcagctg gggctcgctg18120tggagcggca ttaaaaattt cggttccacc attaagaact atggcagcaa ggcctggaac18180agcagcacag gccagatgct gagggacaag ttgaaagagc aaaatttcca acaaaaggtg18240gtagatggcc tggcctctgg cattagcggg gtggtggacc tggccaacca ggcagtgcaa18300aataagatta acagtaagct tgatccccgc cctcccgtag aggagcctcc accggccgtg18360gagacagtgt ctccagaggg gcgtggcgaa aagcgtccgc ggcccgacag ggaagaaact18420ctggtgacgc aaatagatga gcctccctcg tacgaggagg cactaaagca aggcctgccc18480accacccgtc ccatcgcgcc catggctacc ggagtgctgg gccagcacac acctgtaacg18540ctggacctgc ctccccccgc tgacacccag cagaaacctg tgctgccagg gccgtccgcc18600gttgttgtaa cccgccctag ccgcgcgtcc ctgcgccgtg ccgccagcgg tccgcgatcg18660atgcggcccg tagccagtgg caactggcaa agcacactga acagcatcgt gggtctgggg18720gtgcaatccc tgaagcgccg acgatgcttc taaatagcta acgtgtcgta tgtgtcatgt18780atgcgtccat gtcgccgcca gaggagctgc tgagccgccg tgcgcccgct ttccaagatg18840gctacccctt cgatgatgcc gcagtggtct tacatgcaca tctcgggcca ggacgcctcg18900gagtacctga gccccgggct ggtgcagttt gcccgcgcca ccgagacgta cttcagcctg18960aataacaagt ttagaaaccc cacggtggca cctacgcacg acgtaaccac agaccggtcc19020cagcgtttga cgctgcggtt catccctgtg gaccgcgagg ataccgcgta ctcgtacaaa19080gcgcggttca ccctggctgt gggtgacaac cgtgtgcttg atatggcttc cacgtacttt19140gacatccgcg gcgtgctgga cagggggcct acttttaagc cctactccgg cactgcctac19200aacgctctag ctcccaaggg cgctcctaac tcctgtgagt gggaacaaac cgaagatagc19260
ggccgggcag ttgccgagga tgaagaagag gaagatgaag atgaagaaga ggaagaagaa19320gagcaaaacg ctcgagatca ggctactaag aaaacacatg tctatgccca ggctcctttg19380tctggagaaa caattacaaa aagcgggcta caaataggat cagacaatgc agaaacacaa19440gctaaacctg tatacgcaga tccttcctat caaccagaac ctcaaattgg cgaatctcag19500tggaacgaag ctgatgctaa tgcggcagga gggagagtgc ttaaaaaaac aactcccatg19560aaaccatgct atggatctta tgccaggcct acaaatcctt ttggtggtca atccgttctg19620gttccggatg aaaaaggggt gcctcttcca aaggttgact tgcaattctt ctcaaatact19680acctctttga acgaccggca aggcaatgct actaaaccaa aagtggtttt gtacagtgaa19740gatgtaaata tggaaacccc agacacacat ctgtcttaca aacctggaaa aggtgatgaa19800aattctaaag ctatgttggg tcaacaatct atgccaaaca gacccaatta cattgctttc19860agggacaatt ttattggcct aatgtattat aacagcactg gcaacatggg tgttcttgct19920ggtcaggcat cgcagctaaa tgccgtggta gatttgcaag acagaaacac agagctgtcc19980tatcaactct tgcttgattc cataggtgat agaaccagat atttttctat gtggaatcag20040gctgtagaca gctatgatcc agatgttaga atcattgaaa accatggaac tgaggatgaa20100ttgccaaatt attgttttcc tcttgggggt attggggtaa ctgacaccta tcaagctatt20160aaggctaatg gcaatggctc aggcgataat ggagatacta catggacaaa agatgaaact20220tttgcaacac gtaatgaaat aggagtgggt aacaactttg ccatggaaat taacctaaat20280gccaacctat ggagaaattt cctttactcc aatattgcgc tgtacctgcc agacaagcta20340aaatacaacc ccaccaatgt ggaaatatct gacaacccca acacctacga ctacatgaac20400aagcgagtgg tggctcccgg gcttgtagac tgctacatta accttggggc gcgctggtct20460ctggactaca tggacaacgt taatcccttt aaccaccacc gcaatgcggg cctccgttat20520cgctccatgt tgttgggaaa cggccgctac gtgccctttc acattcaggt gccccaaaag20580ttttttgcca ttaaaaacct cctcctcctg ccaggctcat atacatatga atggaacttc20640aggaaggatg ttaacatggt tctgcagagc tctctgggaa acgatcttag agttgacggg20700gctagcatta agtttgacag catttgtctt tacgccacct tcttccccat ggcccacaac20760acggcctcca cgctggaagc catgctcaga aatgacacca acgaccagtc ctttaatgac20820tacctttccg ccgccaacat gctatacccc atacccgcca acgccaccaa cgtgcccatc20880tccatcccat cgcgcaactg ggcagcattt cgcggttggg ccttcacacg cttgaagaca20940aaggaaaccc cttccctggg atcaggctac gacccttact acacctactc tggctccata21000ccataccttg acggaacctt ctatcttaat cacaccttta agaaggtggc cattaccttt21060gactcttctg ttagctggcc gggcaacgac cgcctgctta ctcccaatga gtttgagatt21120aaacgctcag ttgacgggga gggctacaac gtagctcagt gcaacatgac caaggactgg21180ttcctggtgc agatgttggc caactacaat attggctacc agggcttcta cattccagaa21240agctacaagg accgcatgta ctcgttcttc agaaacttcc agcccatgag ccggcaagtg21300gttgacgata ctaaatacaa ggagtatcag caggttggaa ttcttcacca gcataacaac21360tcaggattcg taggctacct cgctcccacc atgcgcgagg gacaggctta ccccgccaac21420gtgccctacc cactaatagg caaaaccgcg gttgacagta ttacccagaa aaagtttctt21480tgcgatcgca ccctttggcg catcccattc tccagtaact ttatgtccat gggcgcactc21540acagacctgg gccaaaacct tctctacgcc aactccgccc acgcgctaga catgactttt21600gaggtggatc ccatggacga gcccaccctt ctttatgttt tgtttgaagt ctttgacgtg21660gtccgtgtgc accagccgca ccgcggcgtc atcgagaccg tgtacctgcg cacgcccttc21720tcggccggca acgccacaac ataaaagaag caagcaacat caacaacagc tgccgccatg21780ggctccagtg agcaggaact gaaagccatt gtcaaagatc ttggttgtgg gccatatttt21840ttgggcacct atgacaagcg ctttccaggc tttgtttctc cacacaagct cgcctgcgcc21900
atagtcaata cggccggtcg cgagactggg ggcgtacact ggatggcctt tgcctggaac21960ccgcgctcaa aaacatgcta cctctttgag ccctttggct tttctgacca acgactcaag22020caggtttacc agtttgagta cgagtcactc ctgcgccgta gcgccattgc ttcttccccc22080gaccgctgta taacgctgga aaagtccacc caaagcgtgc aggggcccaa ctcggccgcc22140tgtggactat tctgctgcat gtttctccac gcctttgcca actggcccca aactcccatg22200gatcacaacc ccaccatgaa ccttattacc ggggtaccca actccatgct taacagtccc22260caggtacagc ccaccctgcg tcgcaaccag gaacagctct acagcttcct ggagcgccac22320tcgccctact tccgcagcca cagtgcgcag attaggagcg ccacttcttt ttgtcacttg22380aaaaacatgt aaaaataatg tactaggaga cactttcaat aaaggcaaat gtttttattt22440gtacactctc gggtgattat ttacccccca cccttgccgt ctgcgccgtt taaaaatcaa22500aggggttctg ccgcgcatcg ctatgcgcca ctggcaggga cacgttgcga tactggtgtt22560tagtgctcca cttaaactca ggcacaacca tccgcggcag ctcggtgaag ttttcactcc22620acaggctgcg caccatcacc aacgcgttta gcaggtcggg cgccgatatc ttgaagtcgc22680agttggggcc tccgccctgc gcgcgcgagt tgcgatacac agggttgcag cactggaaca22740ctatcagcgc cgggtggtgc acgctggcca gcacgctctt gtcggagatc agatccgcgt22800ccaggtcctc cgcgttgctc agggcgaacg gagtcaactt tggtagctgc cttcccaaaa22860agggtgcatg cccaggcttt gagttgcact cgcaccgtag tggcatcaga aggtgaccgt22920gcccggtctg ggcgttagga tacagcgcct gcatgaaagc cttgatctgc ttaaaagcca22980cctgagcctt tgcgccttca gagaagaaca tgccgcaaga cttgccggaa aactgattgg23040ccggacaggc cgcgtcatgc acgcagcacc ttgcgtcggt gttggagatc tgcaccacat23100ttcggcccca ccggttcttc acgatcttgg ccttgctaga ctgctccttc agcgcgcgct23160gcccgttttc gctcgtcaca tccatttcaa tcacgtgctc cttatttatc ataatgctcc23220cgtgtagaca cttaagctcg ccttcgatct cagcgcagcg gtgcagccac aacgcgcagc23280ccgtgggctc gtggtgcttg taggttacct ctgcaaacga ctgcaggtac gcctgcagga23340atcgccccat catcgtcaca aaggtcttgt tgctggtgaa ggtcagctgc aacccgcggt23400gctcctcgtt tagccaggtc ttgcatacgg ccgccagagc ttccacttgg tcaggcagta23460gcttgaagtt tgcctttaga tcgttatcca cgtggtactt gtccatcaac gcgcgcgcag23520cctccatgcc cttctcccac gcagacacga tcggcaggct cagcgggttt atcaccgtgc23580tttcactttc cgcttcactg gactcttcct tttcctcttg cgtccgcata ccccgcgcca23640ctgggtcgtc ttcattcagc cgccgcaccg tgcgcttacc tcccttgccg tgcttgatta23700gcaccggtgg gttgctgaaa cccaccattt gtagcgccac atcttctctt tcttcctcgc23760tgtccacgat cacctctggg gatggcgggc gctcgggctt gggagagggg cgcttctttt23820tctttttgga cgcaatggcc aaatccgccg tcgaggtcga tggccgcggg ctgggtgtgc23880gcggcaccag cgcatcttgt gacgagtctt cttcgtcctc ggactcgaga cgccgcctca23940gccgcttttt tgggggcgcg cggggaggcg gcggcgacgg cgacggggac gacacgtcct24000ccatggttgg tggacgtcgc gccgcaccgc gtccgcgctc gggggtggtt tcgcgctgct24060cctcttcccg actggccatt tccttctcct ataggcagaa aaagatcatg gagtcagtcg24120agaaggagga cagcctaacc gccccctttg agttcgccac caccgcctcc accgatgccg24180ccaacgcgcc taccaccttc cccgtcgagg cacccccgct tgaggaggag gaagtgatta24240tcgagcagga cccaggtttt gtaagcgaag acgacgagga tcgctcagta ccaacagagg24300ataaaaagca agaccaggac gacgcagagg caaacgagga acaagtcggg cggggggacc24360aaaggcatgg cgactaccta gatgtgggag acgacgtgct gttgaagcat ctgcagcgcc24420agtgcgccat tatctgcgac gcgttgcaag agcgcagcga tgtgcccctc gccatagcgg24480atgtcagcct tgcctacgaa cgccacctgt tctcaccgcg cgtacccccc aaacgccaag24540
aaaacggcac atgcgagccc aacccgcgcc tcaacttcta ccccgtattt gccgtgccag24600aggtgcttgc cacctatcac atctttttcc aaaactgcaa gataccccta tcctgccgtg24660ccaaccgcag ccgagcggac aagcagctgg ccttgcggca gggcgctgtc atacctgata24720tcgcctcgct cgacgaagtg ccaaaaatct ttgagggtct tggacgcgac gagaaacgcg24780cggcaaacgc tctgcaacaa gaaaacagcg aaaatgaaag tcactgtgga gtgctggtgg24840aacttgaggg tgacaacgcg cgcctagccg tgctgaaacg cagcatcgag gtcacccact24900ttgcctaccc ggcacttaac ctacccccca aggttatgag cacagtcatg agcgagctga24960tcgtgcgccg tgcacgaccc ctggagaggg atgcaaactt gcaagaacaa accgaggagg25020gcctacccgc agttggcgat gagcagctgg cgcgctggct tgagacgcgc gagcctgccg25080acttggagga gcgacgcaag ctaatgatgg ccgcagtgct tgttaccgtg gagcttgagt25140gcatgcagcg gttctttgct gacccggaga tgcagcgcaa gctagaggaa acgttgcact25200acacctttcg ccagggctac gtgcgccagg cctgcaaaat ttccaacgtg gagctctgca25260acctggtctc ctaccttgga attttgcacg aaaaccgcct cgggcaaaac gtgcttcatt25320ccacgctcaa gggcgaggcg cgccgcgact acgtccgcga ctgcgtttac ttatttctgt25380gctacacctg gcaaacggcc atgggcgtgt ggcagcaatg cctggaggag cgcaacctaa25440aggagctgca gaagctgcta aagcaaaact tgaaggacct atggacggcc ttcaacgagc25500gctccgtggc cgcgcacctg gcggacatta tcttccccga acgcctgctt aaaaccctgc25560aacagggtct gccagacttc accagtcaaa gcatgttgca aaactttagg aactttatcc25620tagagcgttc aggaattctg cccgccacct gctgtgcgct tcctagcgac tttgtgccca25680ttaagtaccg tgaatgccct ccgccgcttt ggggtcactg ctaccttctg cagctagcca25740actaccttgc ctaccactcc gacatcatgg aagacgtgag cggtgacggc ctactggagt25800gtcactgtcg ctgcaaccta tgcaccccgc accgctccct ggtctgcaat tcgcaactgc25860ttagcgaaag tcaaattatc ggtacctttg agctgcaggg tccctcgcct gacgaaaagt25920ccgcggctcc ggggttgaaa ctcactccgg ggctgtggac gtcggcttac cttcgcaaat25980ttgtacctga ggactaccac gcccacgaga ttaggttcta cgaagaccaa tcccgcccgc26040caaatgcgga gcttaccgcc tgcgtcatta cccagggcca catccttggc caattgcaag26100ccatcaacaa agcccgccaa gagtttctgc tacgaaaggg acggggggtt tacctggacc26160cccagtccgg cgaggagctc aacccaatcc ccccgccgcc gcagccctat cagcagccgc26220gggcccttgc ttcccaggat ggcacccaaa aagaagctgc agctgccgcc gccgccaccc26280acggacgagg aggaatactg ggacagtcag gcagaggagg ttttggacga ggaggaggag26340atgatggaag actgggacag cctagacgaa gcttccgagg ccgaagaggt gtcagacgaa26400acaccgtcac cctcggtcgc attcccctcg ccggcgcccc agaaattggc aaccgttccc26460agcatcgcta caacctccgc tcctcaggcg ccgccggcac tgcctgttcg ccgacccaac26520cgtagatggg acaccactgg aaccagggcc ggtaagtcta agcagccgcc gccgttagcc26580caagagcaac aacagcgcca aggctaccgc tcgtggcgcg ggcacaagaa cgccatagtt26640gcttgcttgc aagactgtgg gggcaacatc tccttcgccc gccgctttct tctctaccat26700cacggcgtgg ccttcccccg taacatcctg cattactacc gtcatctcta cagcccctac26760tgcaccggcg gcagcggcag cggcagcaac agcagcggtc acacagaagc aaaggcgacc26820ggatagcaag actctgacaa agcccaagaa atccacagcg gcggcagcag caggaggagg26880agcgctgcgt ctggcgccca acgaacccgt atcgacccgc gagcttagaa ataggatttt26940tcccactctg tatgctatat ttcaacaaag caggggccaa gaacaagagc tgaaaataaa27000aaacaggtct ctgcgctccc tcacccgcag ctgcctgtat cacaaaagcg aagatcagct27060tcggcgcacg ctggaagacg cggaggctct cttcagcaaa tactgcgcgc tgactcttaa27120ggactagttt cgcgcccttt ctcaaattta agcgcgaaaa ctacgtcatc tccagcggcc27180
acacccggcg ccagcacctg tcgtcagcgc cattatgagc aaggaaattc ccacgcccta27240catgtggagt taccagccac aaatgggact tgcggctgga gctgcccaag actactcaac27300ccgaataaac tacatgagcg cgggacccca catgatatcc cgggtcaacg gaatccgcgc27360ccaccgaaac cgaattctcc tcgaacaggc ggctattacc accacacctc gtaataacct27420taatccccgt agttggcccg ctgccctggt gtaccaggaa agtcccgctc ccaccactgt27480ggtacttccc agagacgccc aggccgaagt tcagatgact aactcagggg cgcagcttgc27540gggcggcttt cgtcacaggg tgcggtcgcc cgggcagggt ataactcacc tgaaaatcag27600agggcgaggt attcagctca acgacgagtc ggtgagctcc tctcttggtc tccgtccgga27660cgggacattt cagatcggcg gcgctggccg ctcttcattt acgccccgtc aggcgatcct27720aactctgcag acctcgtcct cggagccgcg ctccggaggc attggaactc tacaatttat27780tgaggagttc gtgccttcgg tttacttcaa ccccttttct ggacctcccg gccactaccc27840ggaccagttt attcccaact ttgacgcggt gaaagactcg gcggacggct acgactgaat27900gaccagtgga gaggcagagc gactgcgcct gacacacctc gaccactgcc gccgccacaa27960gtgctttgcc cgcggctccg gtgagttttg ttactttgaa ttgcccgaag agcatatcga28020gggcccggcg cacggcgtcc ggctcaccac ccaggtagag cttacacgta gcctgattcg28080ggagtttacc aagcgccccc tgctagtgga gcgggagcgg ggtccctgtg ttctgaccgt28140ggtttgcaac tgtcctaacc ctggattaca tcaagatctt tgttgtcatc tctgtgctga28200gtataataaa tacagaaatt agaatctact ggggctcctg tcgccatcct gtgaacgcca28260ccgtttttac ccacccaaag cagaccaaag caaacctcac ctccggtttg cacaagcggg28320ccaataagta ccttacctgg tactttaacg gctcttcatt tgtaatttac aacagtttcc28380agcgagacga agtaagtttg ccacacaacc ttctcggctt caactacacc gtcaagaaaa28440acaccaccac caccaccctc ctcacctgcc gggaacgtac gagtgcgtca ccggttgctg28500cgcccacacc tacagcctga gcgtaaccag acattactcc catttttcca aaacaggagg28560tgagctcaac tcccggaact caggtcaaaa aagcattttg cggggtgctg ggatttttta28620attaagtata tgagcaattc aagtaactct acaagcttgt ctaatttttc tggaattggg28680gtcggggtta tccttactct tgtaattctg tttattctta tactagcact tctgtgcctt28740agggttgccg cctgctgcac gcacgtttgt acctattgtc agctttttaa acgctggggg28800caacatccaa gatgaggtac atgattttag gcttgctcgc ccttgcggca gtctgcagcg28860ctgccaaaaa ggttgagttt aaggaaccag cttgcaatgt tacatttaaa tcagaagcta28920atgaatgcac tactcttata aaatgcacca cagaacatga aaagcttatt attcgccaca28980aagacaaaat tggcaagtat gctgtatatg ctatttggca gccaggtgac actaacgact29040ataatgtcac agtcttccaa ggtgaaaatc gtaaaacttt tatgtataaa tttccatttt29100atgaaatgtg cgatattacc atgtacatga gcaaacagta caagttgtgg cccccacaaa29160agtgtttaga gaacactggc accttttgtt ccaccgctct gcttattaca gcgcttgctt29220tggtatgtac cttactttat ctcaaataca aaagcagacg cagttttatt gatgaaaaga29280aaatgccttg attttccgct tgcttgtatt cccctggaca atttactcta tgtgggatat29340gctccaggcg ggcaagatta tacccacaac cttcaaatca aactttcctg gacgttagcg29400cctgatttct gccagcgcct gcactgcaaa tttgatcaaa cccagcttca gcttgcctgc29460tccagagatg accggctcaa ccatcgcgcc cacaacggac tatcgcaaca ccactgctac29520cggactaaca tctgccctaa atttacccca agttcatgcc tttgtcaatg actgggcgag29580cttggacatg tggtggtttt ccatagcgct tatgtttgtt tgccttatta ttatgtggct29640tatttgttgc ctaaagcgca gacgcgccag accccccatc tataggccta tcattgtgct29700caacccacac aatgaaaaaa ttcatagatt ggacggtctg aaaccatgtt ctcttctttt29760acagtatgat taaatgagac atgattcctc gagttcttat attattgacc cttgttgcgc29820
ttttctgtgc gtgctctaca ttggccgcgg tcgctcacat cgaagtagat tgcatcccac29880ctttcacagt ttacctgctt tacggatttg tcacccttat cctcatctgc agcctcgtca29940ctgtagtcat cgccttcatt cagttcattg actgggtttg tgtgcgcatt gcgtacctca30000ggcaccatcc gcaatacaga gacaggacta tagctgatct tctcagaatt ctttaattat30060gaaacggagt gtcatttttg ttttgctgat tttttgcgcc ctacctgtgc tttgctccca30120aacctcagcg cctcccaaaa gacatatttc ctgcagattc actcaaatat ggaacattcc30180cagctgctac aacaaacaga gcgatttgtc agaagcctgg ttatacgcca tcatctctgt30240catggttttt tgcagtacca tttttgccct agccatatat ccataccttg acattggctg30300gaatgccata gatgccatga accaccctac tttcccagtg cccgctgtca taccactgca30360acaggttatt gccccaatca atcagcctcg ccccccttct cccaccccca ctgagattag30420ctactttaat ttgacaggtg gagatgactg aatctctaga tctagaattg gatggaatta30480acaccgaaca gcgcctacta gaaaggcgca aggcggcgtc cgagcgagaa cgcctaaaac30540aagaagttga agacatggtt aacctacacc agtgtaaaag aggtatcttt tgtgtggtca30600agcaggccaa acttacctac gaaaaaacca ctaccggcaa ccgcctcagc tacaagctac30660ccacccagcg ccaaaaactg gtgcttatgg tgggagaaaa acctatcacc gtcacccagc30720actcggcaga aacagagggc tgcctgcact tcccctatca gggtccagag gacctctgca30780ctcttattaa aaccatgtgt ggtattagag atcttattcc attcaactaa cataaacaca30840caataaatta cttacttaaa atcagtcagc aaatctttgt ccagcttatt cagcatcacc30900tcctttcctt cctcccaact ctggtatctc agccgccttt tagctgcaaa ctttctccaa30960agtttaaatg ggatgtcaaa ttcctcatgt tcttgtccct ccgcacccac tatcttcata31020ttgttgcaga tgaaacgcgc cagaccgtct gaagacacct tcaaccccgt gtatccatat31080gacacagaaa ccgggcctcc aactgtgccc tttcttaccc ctccatttgt ttcacccaat31140ggtttccaag aaagtccccc tggagttctc tctctacgcg tctccgaacc tttggacacc31200tcccacggca tgcttgcgct taaaatgggc agcggtctta ccctagacaa ggccggaaac31260ctcacctccc aaaatgtaac cactgttact cagccactta aaaaaacaaa gtcaaacata31320agtttggaca cctccgcacc acttacaatt acctcaggcg ccctaacagt ggcaaccacc31380gctcctctga tagttactag cggcgctctt agcgtacagt cacaagcccc actgaccgtg31440caagactcca aactaagcat tgctactaaa gggcccatta cagtgtcaga tggaaagcta31500gccctgcaaa catcagcccc cctctctggc agtgacagcg acacccttac tgtaactgca31560tcacccccgc taactactgc cacgggtagc ttgggcatta acatggaaga tcctatttat31620gtaaataatg gaaaaatagg aattaaaata agcggtcctt tgcaagtagc acaaaactcc31680gatacactaa cagtagttac tggaccaggt gtcaccgttg aacaaaactc ccttagaacc31740aaagttgcag gagctattgg ttatgattca tcaaacaaca tggaaattaa aacgggcggt31800ggcatgcgta taaataacaa cttgttaatt ctagatgtgg attacccatt tgatgctcaa31860acaaaactac gtcttaaact ggggcaggga cccctgtata ttaatgcatc tcataacttg31920gacataaact ataacagagg cctatacctt tttaatgcat caaacaatac taaaaaactg31980gaagttagca taaaaaaatc cagtggacta aactttgata atactgccat agctataaat32040gcaggaaagg gtctggagtt tgatacaaac acatctgagt ctccagatat caacccaata32100aaaactaaaa ttggctctgg cattgattac aatgaaaacg gtgccatgat tactaaactt32160ggagcgggtt taagctttga caactcaggg gccattacaa taggaaacaa aaatgatgac32220aaacttaccc tgtggacaac cccagaccca tctcctaact gcagaattca ttcagataat32280gactgcaaat ttactttggt tcttacaaaa tgtgggagtc aagtactagc tactgtagct32340gctttggctg tatctggaga tctttcatcc atgacaggca ccgttgcaag tgttagtata32400ttccttagat ttgaccaaaa cggtgttcta atggagaact cctcacttaa aaaacattac32460
tggaacttta gaaatgggaa ctcaactaat gcaaatccat acacaaatgc agttggattt32520atgcctaacc ttctagccta tccaaaaacc caaagtcaaa ctgctaaaaa taacattgtc32580agtcaagttt acttgcatgg tgataaaact aaacctatga tacttaccat tacacttaat32640ggcactagtg aatccacaga aactagcgag gtaagcactt actctatgtc ttttacatgg32700tcctgggaaa gtggaaaata caccactgaa acttttgcta ccaactctta caccttctcc32760tacattgccc aggaataaag aatcgtgaac ctgttgcatg ttatgtttca acgtgtttat32820ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca32880tagcttatat tgatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc32940acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat33000catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc33060caaacgctca tcagtgatat taataaactc cccgggcagc tcgcttaagt tcatgtcgct33120gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgctcaacgg gcggcgaagg33180ggaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg33240ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat33300ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc atgagacgcc ttgtcctccg33360ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac33420aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac33480agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa33540cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca33600tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac33660ctgcccgccg gctatgcact gcagggaacc gggactggaa caatgacagt ggagagccca33720ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca33780cacgtgcata cacttcctca ggattacaag ctcctcccgc gtcagaacca tatcccaggg33840aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact33900cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt33960agcgcgggtc tctgtctcaa aaggaggtag gcgatcccta ctgtacggag tgcgccgaga34020caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt34080tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgtcgct34140tagctcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc34200tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg34260cagaataagc cacacccagc cagcctacac attcgttctg cgagtcacac acgggaggag34320cgggaagagc tggaagaacc atgttttttt tttttttatt ccaaaagatt atccaaaacc34380tcaaaatgaa gatctattaa gtgaacgcgc tcccctccgg tggcgtggtc aaactctaca34440gccaaagaac agataatggc atttgtaaga tgttgcacaa tggcttccaa aaggcaaact34500gccctcacgt ccaagtggac gtaaaggcta aacccttcag ggtgaatctc ctctataaac34560attccagcac cttcaaccat gcccaaataa ttttcatctc gccaccttat caatatgtct34620ctaagcaaat cccgaatatt aagtccggcc attgtaaaaa tctgctccag agcgccctcc34680accttcagcc tcaagcagcg aatcatgatt gcaaaaattc aggttcctca cagacctgta34740taagattcga aagcggaaca ttaacaaaaa taccgcgatc ccgtaggtcc cttcgcaggg34800ccagctgaac ataatcgtgc aggtctgcac ggaccagcgc ggccacttcc ccgccaggaa34860ccatgacaaa agaacccaca ctgattatga cacgcatact cggagctatg ctaaccagcg34920tagcccctat gtaagcttgt tgcatgggcg gcgatataaa atgcaaggtg ctgctcaaaa34980aatcaggcaa agcctcgcgc aaaaaagcaa gcacatcgta gtcatgctca tgcagataaa35040ggcaggtaag ttccggaacc accacagaaa aagacaccat ttttctctca aacatgtctg35100
cgggttcctg cattaaacac aaaataaaat aacaaaaaaa aacatttaaa cattagaagc35160ctgtcttaca acaggaaaaa caacccttat aagcatagga cggactacgg ccatgccggc35220gtgaccgtaa aaaaactggt caccgtgatt aaaaagcacc accgacagtt cctcggtcat35280gtccggagtc ataatgtaag actcggtaaa cacatcaggt tggttaacat cggtcagtgc35340taaaaagcga ccgaaatagc ccgggggaat acatacccgc aggcgtagag acaacattac35400agcccccata ggaggtataa caaaattaat aggagagaaa aacacataaa cacctgaaaa35460accctcctgc ctaggcaaaa tagcaccctc ccgctccaga acaacataca gcgcttccac35520agcggcagcc ataacagtca gccttaccag taaaaaaacc tattaaaaaa caccactcga35580cacggcacca gctcaatcag tcacagtgta aaaagggcca agtacagagc gagtatatat35640aggactaaaa aatgacgtaa cggttaaagt ccacaaaaaa cacccagaaa accgcacgcg35700aacctacgcc cagaaacgaa agccaaaaaa cccacaactt cctcaaatct tcacttccgt35760tttcccacga tacgtcactt cccattttaa aaaaactaca attcccaata catgcaagtt35820actccgccct aaaacctacg tcacccgccc cgttcccacg ccccgcgcca cgtcacaaac35880tccaccccct cattatcata ttggcttcaa tccaaaataa ggtatattat gatgatg 3593721012211289212PRT213人腺病毒2型40012Met Arg His Ile Ile Cys His Gly Gly Val Ile Thr Glu Glu Met Ala1 5 10 15Ala Ser Leu Leu Asp Gln Leu Ile Glu Glu Val Leu Ala Asp Asn Leu20 25 30Pro Pro Pro Ser His Phe Glu Pro Pro Thr Leu His Glu Leu Tyr Asp35 40 45Leu Asp Val Thr Ala Pro Glu Asp Pro Asn Glu Glu Ala Val Ser Gln50 55 60Ile Phe Pro Asp Ser Val Met Leu Ala Val Gln Glu Gly Ile Asp Leu65 70 75 80Leu Thr Phe Pro Pro Ala Pro Gly Ser Pro Glu Pro Pro His Leu Ser85 90 95Arg Gln Pro Glu Gln Pro Glu Gln Arg Ala Leu Gly Pro Val Ser Met100 105 110Pro Asn Leu Val Pro Glu Val Ile Asp Leu Thr Cys His Glu Ala Gly115 120 125Phe Pro Pro Ser Asp Asp Glu Asp Glu Glu Gly Glu Glu Phe Val Leu130 135 140Asp Tyr Val Glu His Pro Gly His Gly Cys Arg Ser Cys His Tyr His145 150 155 160Arg Arg Asn Thr Gly Asp Pro Asp Ile Met Cys Ser Leu Cys Tyr Met165 170 175Arg Thr Cys Gly Met Phe Val Tyr Ser Pro Val Ser Glu Pro Glu Pro
180 185 190Glu Pro Glu Pro Glu Pro Glu Pro Ala Arg Pro Thr Arg Arg Pro Lys195 200 205Leu Val Pro Ala Ile Leu Arg Arg Pro Thr Ser Pro Val Ser Arg Glu210 215 220Cys Asn Ser Ser Thr Asp Ser Cys Asp Ser Gly Pro Ser Asn Thr Pro225 230 235 240Pro Glu Ile His Pro Val Val Pro Leu Cys Pro Ile Lys Pro Val Ala245 250 255Val Arg Val Gly Gly Arg Arg Gln Ala Val Glu Cys Ile Glu Asp Leu260 265 270Leu Asn Glu Ser Gly Gln Pro Leu Asp Leu Ser Cys Lys Arg Pro Arg275 280 285Pro21013211495212PRT213人腺病毒2型40013Met Glu Arg Arg Asn Pro Ser Glu Arg Gly Val Pro Ala Gly Phe Ser1 5 10 15Gly His Ala Ser Val Glu Ser Gly Gly Glu Thr Gln Glu Ser Pro Ala20 25 30Thr Val Val Phe Arg Pro Pro Gly Asn Asn Thr Asp Gly Gly Ala Thr35 40 45Ala Gly Gly Ser Gln Ala Ala Ala Ala Ala Gly Ala Glu Pro Met Glu50 55 60Pro Glu Ser Arg Pro Gly Pro Ser Gly Met Asn Val Val Gln Val Ala65 70 75 80Glu Leu Phe Pro Glu Leu Arg Arg Ile Leu Thr Ile Thr Glu Asp Gly85 90 95Gln Gly Leu Lys Gly Val Lys Arg Glu Arg Gly Ala Ser Glu Ala Thr100 105 110Glu Glu Ala Arg Asn Leu Thr Phe Ser Leu Met Thr Arg His Arg Pro115 120 125Glu Cys Val Thr Phe Gln Gln Ile Lys Asp Asn Cys Ala Asn Glu Leu130 135 140Asp Leu Leu Ala Gln Lys Tyr Ser Ile Glu Gln Leu Thr Thr Tyr Trp145 150 155 160Leu Gln Pro Gly Asp Asp Phe Glu Glu Ala Ile Arg Val Tyr Ala Lys165 170 175Val Ala Leu Arg Pro Asp Cys Lys Tyr Lys Ile Ser Lys Leu Val Asn
180 185 190Ile Arg Asn Cys Cys Tyr Ile Ser Gly Asn Gly Ala Glu Val Glu Ile195 200 205Asp Thr Glu Asp Arg Val Ala Phe Arg Gys Ser Met Ile Asn Met Trp210 215 220Pro Gly Val Leu Gly Met Asp Gly Val Val Ile Met Asn Val Arg Phe225 230 235 240Thr Gly Pro Asn Phe Ser Gly Thr Val Phe Leu Ala Asn Thr Asn Leu245 250 255Ile Leu His Gly Val Ser Phe Tyr Gly Phe Asn Asn Thr Cys Val Glu260 265 270Ala Trp Thr Asp Val Arg Val Arg Gly Cys Ala Phe Tyr Cys Cys Trp275 280 285Lys Gly Val Val Cys Arg Pro Lys Ser Arg Ala Ser Ile Lys Lys Cys290 295 300Leu Phe Glu Arg Cys Thr Leu Gly Ile Leu Ser Glu Gly Asn Ser Arg305 310 315 320Val Arg His Asn Val Ala Ser Asp Cys Gly Cys Phe Met Leu Val Lys325 330 335Ser Val Ala Val Ile Lys His Asn Met Val Cys Gly Asn Cys Glu Asp340 345 350Arg Ala Ser Gln Met Leu Thr Cys Ser Asp Gly Asn Cys His Leu Leu355 360 365Lys Thr Ile His Val Ala Ser His Ser Arg Lys Ala Trp Pro Val Phe370 375 380Glu His Asn Ile Leu Thr Arg Cys Ser Leu His Leu Gly Asn Arg Arg385 390 395 400Gly Val Phe Leu Pro Tyr Gln Cys Asn Leu Ser His Thr Lys Ile Leu405 410 415Leu Glu Pro Glu Ser Met Ser Lys Val Asn Leu Asn Gly Val Phe Asp420 425 430Met Thr Met Lys Ile Trp Lys Val Leu Arg Tyr Asp Glu Thr Arg Thr435 440 445Arg Cys Arg Pro Cys Glu Cys Gly Gly Lys His Ile Arg Asn Gln Pro450 455 460Val Met Leu Asp Val Thr Glu Glu Leu Arg Pro Asp His Leu Val Leu465 470 475 480Ala Cys Thr Arg Ala Glu Phe Gly Ser Ser Asp Glu Asp Thr Asp485 490 49521014211529212PRT213人腺病毒2型
40014Met Ala Ser Arg Glu Glu Glu Gln Arg Glu Thr Thr Pro Glu Arg Gly1 5 10 15Arg Gly Ala Ala Arg Arg Pro Pro Thr Met Glu Asp Val Ser Ser Pro20 25 30Ser Pro Ser Pro Pro Pro Pro Arg Ala Pro Pro Lys Lys Arg Leu Arg35 40 45Arg Arg Leu Glu Ser Glu Asp Glu Glu Asp Ser Ser Gln Asp Ala Leu50 55 60Val Pro Arg Thr Pro Ser Pro Arg Pro Ser Thr Ser Thr Ala Asp Leu65 70 75 80Ala Ile Ala Ser Lys Lys Lys Lys Lys Arg Pro Ser Pro Lys Pro Glu85 90 95Arg Pro Pro Ser Pro Glu Val Ile Val Asp Ser Glu Glu Glu Arg Glu100 105 110Asp Val Ala Leu Gln Met Val Gly Phe Ser Asn Pro Pro Val Leu Ile115 120 125Lys His Gly Lys Gly Gly Lys Arg Thr Val Arg Arg Leu Asn Glu Asp130 135 140Asp Pro Val Ala Arg Gly Met Arg Thr Gln Glu Glu Lys Glu Glu Ser145 150 155 160Ser Glu Ala Glu Ser Glu Ser Thr Val Ile Asn Pro Leu Ser Leu Pro165 170 175Ile Val Ser Ala Trp Glu Lys Gly Met Glu Ala Ala Arg Ala Leu Met180 185 190Asp Lys Tyr His Val Asp Asn Asp Leu Lys Ala Asn Phe Lys Leu Leu195 200 205Pro Asp Gln Val Glu Ala Leu Ala Ala Val Cys Lys Thr Trp Leu Asn210 215 220Glu Glu His Arg Gly Leu Gln Leu Thr Phe Thr Ser Asn Lys Thr Phe225 230 235 240Val Thr Met Met Gly Arg Phe Leu Gln Ala Tyr Leu Gln Ser Phe Ala245 250 255Glu Val Thr Tyr Lys His His Glu Pro Thr Gly Cys Ala Leu Trp Leu260 265 270His Arg Cys Ala Glu Ile Glu Gly Glu Leu Lys Cys Leu His Gly Ser275 280 285Ile Met Ile Asn Lys Glu His Val Ile Glu Met Asp Val Thr Ser Glu290 295 300Asn Gly Gln Arg Ala Leu Lys Glu Gln Ser Ser Lys Ala Lys Ile Val305 310 315 320Lys Asn Arg Trp Gly Arg Asn Val Val Gln Ile Ser Asn Thr Asp Ala325 330 335Arg Cys Cys Val His Asp Ala Ala Cys Pro Ala Asn Gln Phe Ser Gly
340 345 350Lys Ser Cys Gly Met Phe Phe Ser Glu Gly Ala Lys Ala Gln Val Ala355 360 365Phe Lys Gln Ile Lys Ala Phe Met Gln Ala Leu Tyr Pro Asn Ala Gln370 375 380Thr Gly His Gly His Leu Leu Met Pro Leu Arg Cys Glu Cys Asn Ser385 390 395 400Lys Pro Gly His Ala Pro Phe Leu Gly Arg Gln Leu Pro Lys Leu Thr405 410 415Pro Phe Ala Leu Ser Asn Ala Glu Asp Leu Asp Ala Asp Leu Ile Ser420 425 430Asp Lys Ser Val Leu Ala Ser Val His His Pro Ala Leu Ile Val Phe435 440 445Gln Cys Cys Asn Pro Val Tyr Arg Asn Ser Arg Ala Gln Gly Gly Gly450 455 460Pro Asn Cys Asp Phe Lys Ile Ser Ala Pro Asp Leu Leu Asn Ala Leu465 470 475 480Val Met Val Arg Ser Leu Trp Ser Glu Asn Phe Thr Glu Leu Pro Arg485 490 495Met Val Val Pro Glu Phe Lys Trp Ser Thr Lys His Gln Tyr Arg Asn500 505 510Val Ser Leu Pro Val Ala His Ser Asp Ala Arg Gln Asn Pro Phe Asp515 520 525Phe21015211114212PRT213人腺病毒2型40015Met Val Leu Pro Ala Leu Pro Ala Pro Pro Val Cys Asp Ser Gln Asn1 5 10 15Glu Cys Val Gly Trp Leu Gly Val Ala Tyr Ser Ala Val Val Asp Val20 25 30Ile Arg Ala Ala Ala His Glu Gly Val Tyr Ile Glu Pro Glu Ala Arg35 40 45Gly Arg Leu Asp Ala Leu Arg Glu Trp Ile Tyr Tyr Asn Tyr Tyr Thr50 55 60Glu Arg Ala Lys Arg Arg Asp Arg Arg Arg Arg Ser Val Cys His Ala65 70 75 80Arg Thr Trp Phe Cys Phe Arg Lys Tyr Asp Tyr Val Arg Arg Ser Ile85 90 95Trp His Asp Thr Thr Thr Asn Thr Ile Ser Val Val Ser Ala His Ser
100 105 110Val Gln21016211540212DNA213人乳頭瘤病毒1a型220
221CDS222(104)..(526)40016gttaactacc atcattcatt attcaagtta caacaagaac ctaggagtta tatgccagaa 60gtaagcctat aaaatacaca ggtaagacac tgcacaggac cag atg gcg aca cca 115Met Ala Thr Pro1atc cgg acc gtc aga cag ctt tcc gaa agc ctc tgt atc cca tat att 163Ile Arg Thr Val Arg Gln Leu Ser Glu Ser Leu Cys Ile Pro Tyr Ile5 10 15 20gat gtt tta ttg cct tgt aat ttt tgt aat tat ttt ttg tct aat gct 211Asp Val Leu Leu Pro Cys Asn Phe Cys Asn Tyr Phe Leu Ser Asn Ala25 30 35gag aag ctg ctt ttt gat cat ttt gat ttg cat ctt gtc tgg aga gac 259Glu Lys Leu Leu Phe Asp His Phe Asp Leu His Leu Val Trp Arg Asp40 45 50aat ttg gtg ttt gga tgc tgt caa ggg tgt gct aga act gtt agc cta 307Asn Leu Val Phe Gly Cys Cys Gln Gly Cys Ala Arg Thr Val Ser Leu55 60 65ttg gag ttt gtt tta tat tat cag gag tct tat gag gta ccg gaa ata 355Leu Glu Phe Val Leu Tyr Tyr Gln Glu Ser Tyr Glu Val Pro Glu Ile70 75 80gaa gaa att ttg gac aga cct tta ttg caa att gaa ctc cgt tgt gtt 403Glu Glu Ile Leu Asp Arg Pro Leu Leu Gln Ile Glu Leu Arg Cys Val85 90 95 100aca tgc ata aaa aaa atg agt gtt gct gaa aaa ttg gag gtt gtg tca 451Thr Cys Ile Lys Lys Met Ser Val Ala Glu Lys Leu Glu Val Val Ser105 110 115aac gga gaa aga gtg cat aga gtt aga aac aga ctt aaa gca aag tgt 499Asn Gly Glu Arg Val His Arg Val Arg Asn Arg Leu Lys Ala Lys Cys120 125 130agt ttg tgt cgc ttg tat gca ata taa caatggtggg cgaa 540Ser Leu Cys Arg Leu Tyr Ala Ile135 140
21017211140212PRT213人乳頭瘤病毒1a型40017Met Ala Thr Pro Ile Arg Thr Val Arg Gln Leu Ser Glu Ser Leu Cys1 5 10 15Ile Pro Tyr Ile Asp Val Leu Leu Pro Cys Asn Phe Cys Asn Tyr Phe20 25 30Leu Ser Asn Ala Glu Lys Leu Leu Phe Asp His Phe Asp Leu His Leu35 40 45Val Trp Arg Asp Asn Leu Val Phe Gly Cys Cys Gln Gly Cys Ala Arg50 55 60Thr Val Ser Leu Leu Glu Phe Val Leu Tyr Tyr Gln Glu Ser Tyr Glu65 70 75 80Val Pro Glu Ile Glu Glu Ile Leu Asp Arg Pro Leu Leu Gln Ile Glu85 90 95Leu Arg Cys Val Thr Cys Ile Lys Lys Met Ser Val Ala Glu Lys Leu100 105 110Glu Val Val Ser Asn Gly Glu Arg Val His Arg Val Arg Asn Arg Leu115 120 125Lys Ala Lys Cys Ser Leu Cys Arg Leu Tyr Ala Ile130 135 14021018211192212DNA213人乳頭瘤病毒1a型220
221CDS222(1)..(189)40018
atg ttt tat tgc ctt gta att ttt gta att att ttt tgt cta atg ctg 48Met Phe Tyr Cys Leu Val Ile Phe Val Ile Ile Phe Cys Leu Met Leu1 5 10 15aga agc tgc ttt ttg atc att ttg att tgc atc ttg tct gga gag aca 96Arg Ser Cys Phe Leu Ile Ile Leu Ile Cys Ile Leu Ser Gly Glu Thr20 25 30att tgg tgt ttg gat gct gtc aag ggt gtg cta gaa ctg tta gcc tat144Ile Trp Cys Leu Asp Ala Val Lys Gly Val Leu Glu Leu Leu Ala Tyr35 40 45tgg agt ttg ttt tat att atc agg agt ctt atg agg tac cgg aaa tag192Trp Ser Leu Phe Tyr Ile Ile Arg Ser Leu Met Arg Tyr Arg Lys50 55 602101921163212PRT213人乳頭瘤病毒1a型40019Met Phe Tyr Cys Leu Val Ile Phe Val Ile Ile Phe Cys Leu Met Leu1 5 10 15Arg Ser Cys Phe Leu Ile Ile Leu Ile Cys Ile Leu Ser Gly Glu Thr20 25 30Ile Trp Cys Leu Asp Ala Val Lys Gly Val Leu Glu Leu Leu Ala Tyr35 40 45Trp Ser Leu Phe Tyr Ile Ile Arg Ser Leu Met Arg Tyr Arg Lys50 55 60210202115290212DNA213CMV40020ctgtctagtg aaatccgtat ggacctccag cacgccgcgg atcatcaggg cctccatttc 60gaaatcggcc gacacgctct gggccgcgcc gctcctcgtc tgccgtgatc aagcggcgcg120gcgcggacct ttcaagtgtt cctgggccgc cgctcgaggc agttcccctt tctggcactc180cgcccgccgc ttcgcggctc atttggcgcc gacgcgcctt ctcgcggctg caaatcagct240ccacgtatcg gcaaaacttg ctgtcgtcgt aggcggcggc cacgatctcg ccgaaggaga300gctgcaggta ggcctcgggt acggggtcca gcgtgcccag cgccaggatg tgacacagat360agggcagggt cacgcgctct accgtgtaat tggagtagac gatggcctct tcggcccctt420
gatgcgtgac cagacgccgt aggcgaaagg tacggaaata ctcgttttcc cacaactgcg 480tgaggaagcg ttccagcgac tcggtgccgg gcacgaactg cgagaagaag ctgttggcca 540ccaggcggtt gtcttccacc gccagcggac ggaagggcgc cgcgtcgcgc gccttgcgca 600cggcctccaa cacgggcagg tggtagagtt cggcgtcgcg cgcgcccagg ctcatggagt 660cctcgcgccg cgaggcgtag cgcgtgagca ggtcgcgcag ttcgcgcacg cgattctccc 720aggtctggtt aagcgtgcgc aggtcctgga tctcgtccac ctgcgactgg atctgctcct 780ccaggcactt gataacctgc ttcttaaaca ggtcgcggat gtcccgctcg ggcgccgccg 840ggccgggtgg cggcggcagc agcccgacgt ggcccgcggg tcctcccacc acggcgccgc 900cgggtcccac cacgccgggt ccgcccggac cacgcgcggg tagtagacgg ttttggtcca 960ccagcgaggg ggtcaggtcc tgcagaaagg actcgacgct gtcctcgatg ccgatgcgcg1020atttgctgtc cgagacgtta agcaaaaact tcataatgga ctttttggcg tcgctgcccc1080ggtcgtgctg ctccatcatc tccaccagct tcttgcagtt gagctcgtgg cggctggcgg1140tcaccacttt cacaggaaag gtattgagca actggcagat cttttggtgg cggcagagcc1200cgtcgtagcg cagaatctcc tcgtgcaggt gtgccaccgg cgtggtgaac agcagcttgt1260cgcgctcata agccagcggt tcggccgcca cgtacaagcg gatgtgcttg ccgcgcagct1320gcgcctccag ccgctccgag cgcaccttct tgaagacgcg tacctcgggc gcgttggcta1380cgcgcacggc gcccaggcgc tcggccacct gcagcagcag cgccaggtta gcctgcagca1440ggtcctgcgc cagcgggtgt gtctcggtgg cccgctgcac ggccgcgcgt acaaattgcg1500cccgctcggc cgcctcgctc ggcttggtct tcacgtccag cagcggtacc agtcccaccg1560ttacgcacca atccacgtag agaccatagt cgtcgttatc ggcgtactga tataaaatgt1620cgcggaggcc gcccagcacg cccgtttgca cgctctggcg caacgaggcg ctccacacca1680acagatactg ctccaggtcc tcttcgtcca gcgcgcggta gggaaatagc gccgcgtgca1740acttccactc ctcggccacg cgccgcaccg tgatggtgtc aaagagcgtt ttgcacactc1800cgtagagcag ctgcttgcgc agcacgcacg ggtcgcgcag cacctggtgc atgctttggc1860cgcgacacgt ccccagaaag ccgtgcagca accgcaggaa gctcatcgtc tgccccgtgg1920ggaaaatgtc gatgacggcc tcgtcatcca cgccgcggcc cacgcccaag tacgacgacg1980ccttgatcct caacctctcg tcggccgcca agatcgaacg gatcgtcgac aaggtcaagt2040ccctctcgcg cgagcgcttt gcgcccgagg atttttcgtt ccagtggttt cgctccatca2100gtcgcgttga acgaacgaca gataacaacc cctctgccgc aactaccgcc gcggcaacga2160cgaccgttca ctcctccgcc tcctcttctg ccgccgctgc cgcttcgtcc gaggccggcg2220gcacgcgcgt gccctgcgtc gaccgttggc ccttctttcc cttccgcgcg ctgctcgtca2280ccggcacggc gggcgccggc aagacttcca gcatccaggt gctggcggcc aatctagatt2340gcgtgatcac cggtaccacg gtgatcgccg cgcagaacct cagcgcgatc ctcaaccgca2400ctcgctcggc gcaggtcaag accatctacc gcgtcttcgg cttcgtcagc aagcacgtgc2460cgctggctga cagcgccgtt agccacgaga cgctggaacg ctaccgcgtg tgcgagccgc2520acgaggagac caccatccag cgcctgcaga tcaacgatct gctcgcctac tggccggtca2580tcgccgacat cgtggacaaa tgcttaaata tgtgggagcg caaggccgct tcggcctccg2640ccgcggccgc agccgccgcc tgcgaggacc tctcggagct gtgcgagagc aatatcatcg2700tcatcgacga gtgcggcctt atgctgcgct acatgctgca ggtggtggtg tttttttact2760acttttacaa cgccctgggc gacacgcgac tttaccgcga acgccgcgtg ccctgcatca2820tctgcgtcgg ttcgcccacg cagaccgagg cgctggagag ccgctacgac cactacacgc2880aaaacaagag cgtgcgcaag ggcgttgacg tgctctcggc gctgattcag aacgaggtgc2940tcatcaacta ctgcgacatc gccgacaact gggtcatgtt tattcacaac aagcgttgca3000ccgacctgga ctttggcgac ctgctcaagt acatggagtt cggtatcccg ctcaaggagg3060
agcacgtggc ctacgtggat cgcttcgtgc ggccgcccag ctccatccgc aacccctcgt3120acgccgccga gatgacgcgg ctttttctct cacacgtcga ggtgcaggct tacttcaagc3180ggctgcacga gcagatccgc ctgagcgagc gccaccgtct ctttgatctg cccgtctact3240gcgtggtcaa caaccgcgcg taccaggagc tctgcgagct ggccgacccg ctgggcgact3300cgccgcagcc cgtcgagctc tggttccgcc agaacttggc gcgcatcatt aactactcgc3360agtttgtcga ccacaacctc tccagcgaga tcaccaagga ggcgctgcgc cccgcggccg3420acgtcgttgc caccaacaac tcctccgtcc aggctcacgg agggggagga tctgtaatcg3480ggagcaccgg cggcaacgac gagacggcgt ttttccagga cgatgatacc accactgcgc3540ccgatagccg tgagacgctg ctcaccttgc gcattaccta catcaagggc agttcggtgg3600gagtcaactc taaggtgcgg gcctgtgtta tcggatacca gggcacggtc gaacgtttcg3660tggacatctt gcaaaaggac acgtttatcg aacgcacgcc ctgcgagcag gcggcctacg3720cctactcgtt agtttcgggc ctgctcttct cggccatgta ctacttctac gtgtcgccct3780acacgaccga ggagatgttg cgtgagctgg cgcgcgttga gctgcccgac gtgagttcgc3840tctgcgccgc tgccgccgcc acggccgccg ctcccgcttg gagcggggga gagaatccga3900taaataatca cgtcgacgcg gattcttctc agggcggcca gagcgtgccg gtatctcaac3960ggatggaaca tggccaagag gagacccacg acatcccctg cctgtccaac caccatgacg4020actcggacgc catcacggac gccgaactca tggatcacac cagtctgtac gcggatccct4080tttttctcaa atacgtcaag ccacctagcc tggcgctgct ttctttcgag gagacggtgc4140acatgtacac taccttccgc gacatttttc tcaagcgcta ccagctcatg cagcgtctca4200cgggcggtcg cttcgccacg ttgccgctcg ttacctacaa tcgccgtaac gtggtgttca4260aggccaactg tcagatcagc tcgcagaccg gctccttcgt gggcatgctt tcgcatgtgt4320cgccggcgca gacgtacacg ctcgagggct acaccagcga caacgtgctc agtctgccca4380gtgaccgcca ccgcatccac cccgaggtgg tgcagcgcgg cctttcgcgg ctggtgctac4440gcgatgcgct tgggttcctc tttgtgctcg acgttaacgt ttcgcgcttc gtcgagtcgg4500cgcagggcaa gagtctgcac gtgtgcacca ccgtggacta cggcctcact tcgcgcacgg4560ccatgaccat cgccaagagt cagggcctgt cgctcgagaa ggtggccgtg gactttgggg4620accatcccaa gaacctcaag atgagccaca tctacgtggc catgtcgcga gtcacggacc4680ccgaacacct catgatgaac gttaacccgt tgcgactgcc ctatgagaag aacaccgcta4740tcacccccta tatctgtcgc gcgctcaaag acaaacgcac cacgcttatt ttttgacaca4800acaccgtgta aggaaaacgt gactttattg agcagggtaa aaaccacgta caagaaccac4860gttgtctatc cccaaaaaaa cacacaccgt cagggaacac atcgcctata gatagcggca4920ctttacataa aaccaccgta cctgcatcac ggtggctcga tacactggaa attcaataaa4980aaccaccgtg tctccgtgac ggtacttatc gggtcagcgt cttttgagat ttctgttcgt5040aaacttatcc gtttccccgg tccgcggtgt ctcctcgcga ggctgacagt cgacgggtgg5100tacctgcaag agaagaaacc cgggtgggag cgacgccgtc gctgggtatc aaccccgcgg5160ctgaccgtcg tccggtaaag gaacaacccg tcgtcgcaag ccgggttcga ccaagagaaa5220aaacccgggt gcggggggag acgggtcgtc ctttggttgt tcgcggacgg cgtacatgcc5280gcgtgggtca 529021021211708212PRT213猿猴病毒40
40021Met Asp Lys Val Leu Asn Arg Glu Glu Ser Leu Gln Leu Met Asp Leu1 5 10 15Leu Gly Leu Glu Arg Ser Ala Trp Gly Asn Ile Pro Leu Met Arg Lys20 25 30Ala Tyr Leu Lys Lys Cys Lys Glu Phe His Pro Asp Lys Gly Gly Asp35 40 45Glu Glu Lys Met Lys Lys Met Asn Thr Leu Tyr Lys Lys Met Glu Asp50 55 60Gly Val Lys Tyr Ala His Gln Pro Asp Phe Gly Gly Phe Trp Asp Ala65 70 75 80Thr Glu Ile Pro Thr Tyr Gly Thr Asp Glu Trp Glu Gln Trp Trp Asn85 90 95Ala Phe Asn Glu Glu Asn Leu Phe Cys Ser Glu Glu Met Pro Ser Ser100 105 110Asp Asp Glu Ala Thr Ala Asp Ser Gln His Ser Thr Pro Pro Lys Lys115 120 125Lys Arg Lys Val Glu Asp Pro Lys Asp Phe Pro Ser Glu Leu Leu Ser130 135 140Phe Leu Ser His Ala Val Phe Ser Asn Arg Thr Leu Ala Cys Phe Ala145 150 155 160Ile Tyr Thr Thr Lys Glu Lys Ala Ala Leu Leu Tyr Lys Lys Ile Met165 170 175Glu Lys Tyr Ser Val Thr Phe Ile Ser Arg His Asn Ser Tyr Asn His180 185 190Asn Ile Leu Phe Phe Leu Thr Pro His Arg His Arg Val Ser Ala Ile195 200 205Asn Asn Tyr Ala Gln Lys Leu Cys Thr Phe Ser Phe Leu Ile Cys Lys210 215 220Gly Val Asn Lys Glu Tyr Leu Met Tyr Ser Ala Leu Thr Arg Asp Pro225 230 235 240Phe Ser Val Ile Glu Glu Ser Leu Pro Gly Gly Leu Lys Glu His Asp245 250 255Phe Asn Pro Glu Glu Ala Glu Glu Thr Lys Gln Val Ser Trp Lys Leu260 265 270Val Thr Glu Tyr Ala Met Glu Thr Lys Cys Asp Asp Val Leu Leu Leu275 280 285Leu Gly Met Tyr Leu Glu Phe Gln Tyr Ser Phe Glu Met Cys Leu Lys290 295 300Cys Ile Lys Lys Glu Gln Pro Ser His Tyr Lys Tyr His Glu Lys His305 310 315 320Tyr Ala Asn Ala Ala Ile Phe Ala Asp Ser Lys Asn Gln Lys Thr Ile325 330 335Cys Gln Gln Ala Val Asp Thr Val Leu Ala Lys Lys Arg Val Asp Ser
340 345 350Leu Gln Leu Thr Arg Glu Gln Met Leu Thr Asn Arg Phe Asn Asp Leu355 360 365Leu Asp Arg Met Asp Ile Met Phe Gly Ser Thr Gly Ser Ala Asp Ile370 375 380Glu Glu Trp Met Ala Gly Val Ala Trp Leu His Cys Leu Leu Pro Lys385 390 395 400Met Asp Ser Val Val Tyr Asp Phe Leu Lys Cys Met Val Tyr Asn Ile405 410 415Pro Lys Lys Arg Tyr Trp Leu Phe Lys Gly Pro Ile Asp Ser Gly Lys420 425 430Thr Thr Leu Ala Ala Ala Leu Leu Glu Leu Cys Gly Gly Lys Ala Leu435 440 445Asn Val Asn Leu Pro Leu Asp Arg Leu Asn Phe Glu Leu Gly Val Ala450 455 460Ile Asp Gln Phe Leu Val Val Phe Glu Asp Val Lys Gly Thr Gly Gly465 470 475 480Glu Ser Arg Asp Leu Pro Ser Gly Gln Gly Ile Asn Asn Leu Asp Asn485 490 495Leu Arg Asp Tyr Leu Asp Gly Ser Val Lys Val Asn Leu Glu Lys Lys500 505 510His Leu Asn Lys Arg Thr Gln Ile Phe Pro Pro Gly Ile Val Thr Met515 520 525Asn Glu Tyr Ser Val Pro Lys Thr Leu Gln Ala Arg Phe Val Lys Gln530 535 540Ile Asp Phe Arg Pro Lys Asp Tyr Leu Lys His Cys Leu Glu Arg Ser545 550 555 560Glu Phe Leu Leu Glu Lys Arg Ile Ile Gln Ser Gly Ile Ala Leu Leu565 570 575Leu Met Leu Ile Trp Tyr Arg Pro Val Ala Glu Phe Ala Gln Ser Ile580 585 590Gln Ser Arg Ile Val Glu Trp Lys Glu Arg Leu Asp Lys Glu Phe Ser595 600 605Leu Ser Val Tyr Gln Lys Met Lys Phe Asn Val Ala Met Gly Ile Gly610 615 620Val Leu Asp Trp Leu Arg Asn Ser Asp Asp Asp Asp Glu Asp Ser Gln625 630 635 640Glu Asn Ala Asp Lys Asn Glu Asp Gly Gly Glu Lys Asn Met Glu Asp645 650 655Ser Gly His Glu Thr Gly Ile Asp Ser Gln Ser Gln Gly Ser Phe Gln660 665 670Ala Pro Gln Ser Ser Gln Ser Val His Asp His Asn Gln Pro Tyr His675 680 685Ile Cys Arg Gly Phe Thr Cys Phe Lys Lys Pro Pro Thr Pro Pro Pro
690 695 700Glu Pro Glu Thr70權利要求
1.一種治療癌或高增殖性疾病患者的方法,該方法包括給需要治療患者施用一種條件複製型病毒載體,其中至少一種編碼其複製必需產物的病毒核酸操作性連接於H19調節序列。
2.權利要求1的方法,其中H19調節序列選自H19啟動子、H19增強子、仍保持轉錄調節活性的H19啟動子或H19增強子的亞序列和它們的組合。
3.權利要求2的方法,其中H19啟動子包含SEQ ID NO1的1-830位核苷酸。
4.權利要求2的方法,其中H19啟動子包含SEQ ID NO2的序列。
5.權利要求2的方法,其中H19增強子包含克隆至質粒pH19EH19(ATCC保藏號209322)的H19增強子的序列。
6.權利要求2的方法,其中H19增強子包含SEQ ID NO3的序列。
7.權利要求2的方法,其中H19增強子包含SEQ ID NO4的序列。
8.權利要求2的方法,其中H19增強子包含SEQ ID NO5的序列。
9.權利要求2的方法,其中H19增強子被置於病毒複製必需病毒基因序列的3′側。
10.權利要求1的方法,其中所述的癌症選自癌、肉瘤、腺瘤、肝細胞癌、肝胚細胞瘤、橫紋肌肉瘤、食管癌、甲狀腺癌、惡性神經節瘤、纖維肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、內皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、結腸癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鱗狀細胞癌、基底細胞癌、腺癌、腎細胞癌、血腫、膽管癌、黑色素瘤、絨毛膜瘤、精原細胞瘤、胚胎性癌、維爾姆斯氏腫瘤、子宮頸癌、睪丸腫瘤、肺癌、小肺癌、膀胱癌、胃腸道間質瘤、上皮癌、膠質瘤、星形細胞瘤、髓母細胞瘤、顱咽管瘤、ependynoma、松果體瘤、視網膜母細胞瘤、多發性骨髓瘤、直腸癌、甲狀腺癌、頭頸癌、子宮內膜癌、以及它們的轉移灶。
11.權利要求10的方法,其中癌是膀胱癌且施用途徑為腔內。
12.權利要求1的方法,其中條件複製型病毒為腺病毒。
13.權利要求12的方法,其中至少一種編碼病毒複製必需產物的核酸選自腺病毒的E1a、E1b、E2a和E4基因。
14.一種條件複製型病毒載體,其中至少一種編碼其複製必需產物的病毒核酸操作性連接於H19調節序列。
15.權利要求14的載體,其中H19調節序列選自H19啟動子、H19增強子、仍保持轉錄調節活性的H19啟動子或H19增強子的亞序列和它們的組合。
16.權利要求15的載體,其中H19啟動子包含SEQ ID NO1的1-830位核苷酸。
17.權利要求15的載體,其中H19啟動子包含SEQ ID NO2的序列。
18.權利要求15的載體,其中H19增強子包含克隆至質粒pH19EH19(ATCC保藏號209322)的H19增強子的序列。
19.權利要求15的載體,其中H19增強子包含SEQ ID NO3的序列。
20.權利要求15的載體,其中H19增強子包含SEQ ID NO4的序列。
21.權利要求15的載體,其中H19增強子包含SEQ ID NO5的序列。
22.權利要求15的載體,其中H19增強子被置於病毒複製必需病毒基因序列的3′側。
23.權利要求14的載體,其中條件複製型病毒為腺病毒。
24.權利要求23的載體,其中至少一種編碼病毒複製必需產物的核酸選自腺病毒的E1a、E1b、E2a和E4基因。
25.一種降低癌或高增殖性細胞生長的方法,該方法包括將細胞與有效量的條件複製型病毒載體接觸,所述病毒載體中至少一種編碼其複製必需產物的病毒核酸操作性連接於H19調節序列。
26.權利要求25的方法,其中H19調節序列選自H19啟動子、H19增強子、仍保持轉錄調節活性的H19啟動子或H19增強子的亞序列和它們的組合。
27.權利要求26的方法,其中H19啟動子包含SEQ ID NO1的1-830位核苷酸。
28.權利要求26的方法,其中H19啟動子包含SEQ ID NO2的序列。
29.權利要求26的方法,其中H19增強子包含克隆至質粒pH19EH19(ATCC保藏號209322)的H19增強子的序列。
30.權利要求26的方法,其中H19增強子包含SEQ ID NO3的序列。
31.權利要求26的方法,其中H19增強子包含SEQ ID NO4的序列。
32.權利要求26的方法,其中H19增強子包含SEQ ID NO5的序列。
33.權利要求26的方法,其中H19增強子被置於病毒複製必需病毒基因序列的3′側。
34.權利要求25的方法,其中所述的癌症選自癌、肉瘤、腺瘤、肝細胞癌、肝胚細胞瘤、橫紋肌肉瘤、食管癌、甲狀腺癌、惡性神經節瘤、纖維肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、內皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、結腸癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鱗狀細胞癌、基底細胞癌、腺癌、腎細胞癌、血腫、膽管癌、黑色素瘤、絨毛膜瘤、精原細胞瘤、胚胎性癌、維爾姆斯氏腫瘤、子宮頸癌、睪丸腫瘤、肺癌、小肺癌、膀胱癌、胃腸道間質瘤、上皮癌、膠質瘤、星形細胞瘤、髓母細胞瘤、顱咽管瘤、ependynoma、松果體瘤、視網膜母細胞瘤、多發性骨髓瘤、直腸癌、甲狀腺癌、頭頸癌、子宮內膜癌、以及它們的轉移灶。
35.權利要求25的方法,其中條件複製型病毒為腺病毒。
36.權利要求35的方法,其中至少一種編碼病毒複製必需產物的基因選自腺病毒的E1a、E1b、E2a和E4基因。
37.條件複製型病毒載體在製備治療癌或高增殖性疾病的藥物中的用途,所述載體中至少一種編碼其複製必需產物的病毒基因操作性連接於H19調節序列。
38.權利要求37的用途,其中H19調節序列選自H19啟動子、H19增強子、仍保持轉錄調節活性的H19啟動子或H19增強子的亞序列和它們的組合。
39.權利要求38的用途,其中H19啟動子包含SEQ ID NO1的1-830位核苷酸。
40.權利要求38的用途,其中H19啟動子包含SEQ ID NO2的序列。
41.權利要求38的用途,其中H19增強子包含克隆至質粒pH19EH19(ATCC保藏號209322)的H19增強子的序列。
42.權利要求38的用途,其中H19增強子包含SEQ ID NO3的序列。
43.權利要求38的用途,其中H19增強子包含SEQ ID NO4的序列。
44.權利要求38的用途,其中H19增強子包含SEQ ID NO5的序列。
45.權利要求38的用途,其中H19增強子被置於病毒複製必需病毒基因序列的3′側。
46.權利要求37的用途,其中所述的癌症選自癌、肉瘤、腺瘤、肝細胞癌、肝胚細胞瘤、橫紋肌肉瘤、食管癌、甲狀腺癌、惡性神經節瘤、纖維肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、內皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、結腸癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鱗狀細胞癌、基底細胞癌、腺癌、腎細胞癌、血腫、膽管癌、黑色素瘤、絨毛膜瘤、精原細胞瘤、胚胎性癌、維爾姆斯氏腫瘤、子宮頸癌、睪丸腫瘤、肺癌、小肺癌、膀胱癌、胃腸道間質瘤、上皮癌、膠質瘤、星形細胞瘤、髓母細胞瘤、顱咽管瘤、ependynoma、松果體瘤、視網膜母細胞瘤、多發性骨髓瘤、直腸癌、甲狀腺癌、頭頸癌、子宮內膜癌、以及它們的轉移灶。
47.權利要求37的用途,其中條件複製型病毒為腺病毒。
48.權利要求47的用途,其中至少一種編碼病毒複製必需產物的基因選自腺病毒的E1a、E1b、E2a和E4基因。
49.一種治療癌或高增殖性疾病的藥物組合物,該組合物包括藥學可接受的載體和作為活性成分的條件複製型病毒載體,所述病毒載體中至少一種編碼其複製必需產物的病毒基因操作性連接於H19調節序列。
50.權利要求49的組合物,其中H19調節序列選自H19啟動子、H19增強子、仍保持轉錄調節活性的H19啟動子或H19增強子的亞序列和它們的組合。
51.權利要求50的組合物,其中H19啟動子包含SEQ ID NO1的1-830位核苷酸。
52.權利要求50的組合物,其中H19啟動子包含SEQ ID NO2的序列。
53.權利要求50的組合物,其中H19增強子包含克隆至質粒pH19EH19(ATCC保藏號209322)的H19增強子的序列。
54.權利要求50的組合物,其中H19增強子包含SEQ ID NO3的序列。
55.權利要求50的組合物,其中H19增強子包含SEQ ID NO4的序列。
56.權利要求50的組合物,其中H19增強子包含SEQ ID NO5的序列。
57.權利要求50的組合物,其中H19增強子被置於病毒複製必需病毒基因序列的3′側。
58.權利要求49的組合物,其中所述的癌症選自癌、肉瘤、腺瘤、肝細胞癌、肝胚細胞瘤、橫紋肌肉瘤、食管癌、甲狀腺癌、惡性神經節瘤、纖維肉瘤、粘液肉瘤、脂肪肉瘤、cohndrosarcoma、骨肉瘤、脊索瘤、血管肉瘤、內皮肉瘤、lymphagiosarcoma、滑膜瘤、尤因氏瘤、平滑肌肉瘤、rhabdotheliosarcoma、結腸癌、胰腺癌、乳癌、卵巢癌、前列腺癌、鱗狀細胞癌、基底細胞癌、腺癌、腎細胞癌、血腫、膽管癌、黑色素瘤、絨毛膜瘤、精原細胞瘤、胚胎性癌、維爾姆斯氏腫瘤、子宮頸癌、睪丸腫瘤、肺癌、小肺癌、膀胱癌、胃腸道間質瘤、上皮癌、膠質瘤、星形細胞瘤、髓母細胞瘤、顱咽管瘤、ependynoma、松果體瘤、視網膜母細胞瘤、多發性骨髓瘤、直腸癌、甲狀腺癌、頭頸癌、子宮內膜癌、以及它們的轉移灶。
59.權利要求49的組合物,其中條件複製型病毒為腺病毒。
60.權利要求49的組合物,其中至少一種編碼病毒複製必需產物的基因選自腺病毒的E1a、E1b、E2a和E4基因。
全文摘要
本發明涉及使用條件複製型病毒載體的腫瘤特異性病毒複製和/或表達,所述病毒載體中病毒複製必需基因產物在H19調節序列的控制下表達。本發明提供了所述病毒載體,製備所述載體的方法和所述載體的施用方法。本發明的組合物和方法可用於治療癌症和高增殖性疾病。
文檔編號C07K14/65GK1608135SQ02825940
公開日2005年4月20日 申請日期2002年10月22日 優先權日2001年10月22日
發明者A·霍克伯格, S·亞野斯 申請人:耶路撒冷希伯來大學伊森姆研究發展公司