新四季網

穩定化的流感血凝素莖區三聚體及其用途的製作方法

2023-08-11 00:34:56 1


本發明提供了新的基於血凝素(HA)蛋白的流感疫苗,其是易於製造的,有力的並且引發針對流感HA蛋白的莖區的廣泛中和性流感抗體。特別地,本發明提供了融合前構象的修飾的流感HA莖區蛋白及其部分,其可用於誘導中和性抗體的產生。本發明還提供在其表面上表達流感HA蛋白的新型基於納米顆粒(np)的疫苗。此類納米顆粒包含融合蛋白,每個融合蛋白包含連接到來自流感HA蛋白的莖區的抗原性或免疫原性部分的鐵蛋白的單體亞基。因為此類納米顆粒在其表面上展示流感HA蛋白莖區,所以它們可以用於針對流感病毒對個體接種疫苗。

發明背景

通過針對流感病毒接種疫苗誘導的保護性免疫應答主要針對病毒HA蛋白,其是病毒表面上負責病毒與宿主細胞受體的相互作用的糖蛋白。病毒表面上的HA蛋白是HA蛋白單體的三聚體,其被酶促切割以產生氨基端末端HA1和羧基端末端HA2多肽。球狀頭部僅由HA1多肽的主要部分組成,而將HA蛋白錨定到病毒脂質包膜中的莖由HA2和HA1的部分組成。HA蛋白的球狀頭部包括兩個結構域:受體結合結構域(RBD),包括唾液酸結合位點的約148個胺基酸殘基結構域,和退化酯酶結構域(vestigial esterase domain),剛好低於RBD的較小的約75個胺基酸殘基區域。球狀頭部牽涉幾個包括免疫顯性表位的抗原位點。實例包括Sa,Sb,Ca1,Ca2和Cb抗原位點(參見例如Caton AJ et al,1982,Cell 31,417-427)。RBD-A區包括Sa抗原位點和Sb抗原位點的部分。

針對流感的抗體通常靶向HA球狀頭中的可變抗原位點,其圍繞保守的唾液酸結合位點,因此僅中和抗原緊密相關的病毒。HA頭部的可變性是由於流感病毒的恆定抗原漂移所致,並且造成流感的季節性流行病。相比之下,HA莖是高度保守的,並且經歷很少的抗原漂移。不幸的是,不同於免疫顯性頭部,保守的HA莖不是非常免疫原性的。此外,病毒基因組的基因區段可以在宿主物種中進行重配(抗原漂移),創建具有改變的抗原性的能夠變成大流行的新病毒[Salomon,R.et al.Cell 136,402-410(2009)]。直到現在,每年更新流感疫苗以反映即將到來的流行病毒的預測的HA和神經氨酸酶(NA)。

最近,分離了一類全新的針對流感病毒的廣泛中和性抗體,其識別高度保守的HA莖[Corti,D.et al.J Clin Invest 120,1663-1673(2010);Ekiert,D.C.et al.Science 324,246-251(2009);Kashyap,A.K.et al.Proc Natl Acad Sci USA105,5986-5991(2008);Okuno,Y.et al.J Virol 67,2552-2558(1993);Sui,J.et al.Nat Struct Mol Biol 16,265-273(2009);Ekiert,D.C.et al.Science 333,843-850(2011);Corti,D.et al.Science 333,850-856(2011)]。與毒株特異性抗體不同,那些抗體能夠中和多種抗原性獨特的病毒,因此誘導此類抗體已成為下一代通用疫苗開發的焦點[Nabel,G.J.et al.Nat Med 16,1389-1391(2010)]。然而,通過疫苗接種用此類異源中和概況強力引發這些抗體是困難的[Steel,J.et al.MBio 1,e0018(2010);Wang,T.T.et al.PLoS Pathog 6,e1000796(2010);Wei,C.J.et al.Science 329,1060-1064(2010)]。通過遺傳操作除去HA(其含有競爭性表位)的免疫顯性頭部區和穩定化所得莖結構域是改善這些廣泛中和性莖抗體的引發的一種潛在方式。

目前用於流感的疫苗策略使用化學滅活或減毒活流感病毒。兩種疫苗通常在含胚卵中產生,其由於耗時的方法和有限的生產能力而存在主要的製造限制。當前疫苗的另一個更關鍵的限制是其高度毒株特異性功效。在2009年H1N1大流行的出現期間,這些挑戰變得顯著,從而驗證了能夠克服這些限制的新疫苗平臺的必要性。病毒樣顆粒代表了這種替代方法之一,目前正在臨床試驗中進行評估[Roldao,A.et al.Expert Rev Vaccines 9,1149-1176(2010);Sheridan,C.Nat Biotechnol 27,489-491(2009)]。代替含胚卵,通常包含HA,NA和基質蛋白1(M1)的VLP可以在哺乳動物或昆蟲細胞表達系統中大規模生產[Haynes,J.R.Expert Rev Vaccines 8,435-445(2009)]。這種方法的優點是其顆粒,多價性質和正確摺疊、三聚體HA刺突的真實展示,其忠實模擬感染性病毒體。相比之下,由於其組裝的性質,有包膜的VLP含有小的但有限的宿主細胞組分,其可以在重複使用該平臺後呈現潛在的安全性,免疫原性挑戰[Wu,C.Y.et al.PLoS One 5,e9784(2010)]。此外,VLP誘導的免疫與當前疫苗基本相同,因此不可能顯著改善疫苗誘導的保護性免疫的效力和廣度。除了VLP外,重組HA蛋白也已經在人體中進行了評估[Treanor,J.J.et al.Vaccine 19,1732-1737(2001);Treanor,J.J.JAMA 297,1577-1582(2007)],儘管誘導保護性中和性抗體滴度的能力有限。在這些試驗中使用的重組HA蛋白在昆蟲細胞中產生並且可能不優先形成天然三聚體[Stevens,J.Science303,1866-1870(2004)]。

儘管常規流感疫苗有幾種替代,但在過去幾十年中生物技術的進步已經允許利用生物材料的工程化來產生新的疫苗平臺。鐵蛋白,幾乎所有活生物體中發現的鐵貯存蛋白,是已經廣泛研究和工程化以用於許多潛在的生物化學/生物醫學目的的實例[Iwahori,K.U.S.Patent 2009/0233377(2009);Meldrum,F.C.et al.Science 257,522-523(1992);Naitou,M.et al.U.S.Patent2011/0038025(2011);Yamashita,I.Biochim Biophys Acta 1800,846-857(2010)],包括用於展示外源表位肽的潛在疫苗平臺[Carter,D.C.et al.U.S.Patent 2006/0251679(2006);Li,C.Q.et al.Industrial Biotechnol 2,143-147(2006)]。其作為疫苗平臺的用途是特別有趣的,這是由於其自身組裝和抗原的多價呈遞,這比單價形式誘導更強的B細胞應答以及誘導T細胞非依賴性抗體應答[Bachmann,M.F.et al.Annu Rev Immunol 15,235-270(1997);Dintzis,H.M.et al.Proc Natl Acad Sci USA 73,3671-3675(1976)]。此外,鐵蛋白的分子結構,其由組裝成具有432對稱的八面體籠的24個亞基組成,具有在其表面上展示多聚體抗原的潛力。

仍然需要提供強力的針對流感病毒的保護的有效的流感疫苗。特別地,仍然需要保護個體免受流感病毒異源株,包括進化中的未來的季節性和大流行性流感病毒株的流感疫苗。本發明通過提供新穎的基於納米顆粒的疫苗來滿足這種需要,所述疫苗由新的HA穩定化的莖(SS)組成,沒有遺傳上融合到納米顆粒表面的可變免疫顯性頭部區(gen6HA-SS np),從而產生流感疫苗,其是易於製造的,有力的,並且引發廣泛異亞型保護性的抗體。

附圖簡述

圖1a顯示了HA頭部的基於結構的除去允許保留莖免疫原抗原性。帶狀模型描繪了HA-SS設計途徑,開始於融合到T4摺疊物(foldon)三聚化結構域(在HA胞外域下方為綠色)的HA胞外域的模型。最後三個HA-SS設計(Gen4-6)遺傳融合到鐵蛋白納米顆粒(下圖)。每個HA三聚體的一個單體被遮蔽。用於創建Gen6的核心穩定化突變顯示為球體。每種HA-SS免疫原設計下方顯示了三聚化百分比(包括摺疊物)和對規定mAb的抗原親和常數(KD,M)。ND,未確定;NA,不適用。圖1b分別顯示沒有摺疊物結構域的H1N1HA胞外域(PDB ID 1GBN),Gen4HA-SS和Gen6HA-SS的HA部分的表面呈現,其通過與H5N1 2004VN的序列保守加陰影(深灰色,可變;白色,保守)。分別對於Gen4和Gen6HA-SS,無摺疊物結構域的免疫原的HA莖百分比增加。*進一步評估此免疫原,並且在本公開的實施例部分中稱為H1-SS-np。圖1c顯示了描繪在Gen6HA-SS中Glu103-Lys51鹽橋替換為Leu103-Met51疏水對的橫截面圖的帶狀圖。虛線(左)指示橫截面的位置。圖1d顯示了以其可溶性和納米顆粒形式呈現的Gen6HA-SS的抗原性。三個圖顯示了一個頭(CH65)和三個莖特異性抗體(CR6261,CR9114,FI6v3)對Gen6』HA-SS(左圖),H1-SS-np(中圖)和H1-SS-np』(右圖)的ELISA結合。濃度範圍為10-6.40×10-4μg/mL的抗體的ELISA結合。圖1e和圖1f顯示了H1-SS-np(圖1e)和H1-SS-np』(圖1f)與HA莖定向性bNAb結合的Octet傳感圖。將H1-SS-np固定在Octet探針上,並與不同濃度的抗體結合片段Fab或scFv莖定向性抗體溫育,其在每個傳感圖的頂部指示。圖1g顯示通過抗IgM(=總受體活性),空np,HA-np(HA含有Y98F突變,以消除與唾液酸的非特異性結合)和H1-SS-np』的野生型IGHV1-69v-基因逆轉的CR6261BCR(左圖)對雙重Ile53Ala/Phe54Ala CDRH2突變體BCR(右圖)的刺激通過流式細胞術測量為Ca2+敏感染料FuraRed的Ca2+結合/未結合狀態的比率。

圖2a顯示三聚體,而不是納米顆粒莖免疫原,展示HA莖展開。左圖描述了Gen3HA-SS(黑色和灰色)和mAb C179(標記)之間的複合物的晶體結構的帶狀圖。圖2a的中間圖示出了在兩個不同視圖(側面和底部)中比較晶體結構(光)與模型(暗)的展開的草圖。圖2a的右圖顯示了Gen3HA-SS/C179結合界面與1957H2N2HA/C179結合界面(PDB ID 4HLZ)的重疊。抗體CDR環對於重鏈用「H」標記,對於輕鏈用「L」標記。重鏈框架3環標記為FR3。RMSD,均方根偏差。圖2b描繪了與圖2a中相同的圖格式,顯示了Gen4HA-SS,並且在右圖中,Gen4HA-SS/CR6261重鏈結合界面與1918H1N1HA/CR6261結合界面(PDB ID 3GBN)的重疊。圖2c顯示H1-SS-np冷凍電子顯微術(cryo-electron microscopy)分析。前兩個圖分別顯示了Gen4HA-SS晶體結構(剪切(cropped))和H1-SS-np模型,分別適合於一個H1-SS-np刺突的冷凍電子顯微術圖。圖2c的接下來兩個圖顯示了適合到H1-SS-np低溫電子顯微術圖中的整個H1-SS-np模型的兩個不同視圖。圖2d顯示分別用Superdex 20010/300和Superose 610/300柱得到的HA,Gen4HA-SS和H1-SS-np』(左圖)和HA np,Gen4HA-SS-np np和H1-SS-np』和H1-SS-np(右圖)的大小排阻層析中流感病毒HA和HA-SS不溶性和納米顆粒形式的表徵。圖2e是HA-np(左圖)和Gen4HA-SS-np(中圖)和H1-SS-np(右圖)的負染色透射電子顯微術圖像。最初以67,000×放大率記錄圖像。圖2f顯示H1-SS-np場的低溫EM圖像。箭頭描繪一些環樣納米顆粒;比例尺為20nm。圖2g顯示了通過納米顆粒(插圖)的全局圓形平均值的2D徑向密度概況(曲線)對H1-SS-np的大小分析。該概況示出了兩層結構,其具有以距離顆粒中心約為中心的基峰和跨越約至範圍的第二峰。峰高度的差異對於以含有幾個離散刺突的層為頂部的更連續的蛋白質層是一致的。圖2h顯示H1-SS-np的無參考的2D類平均值,沒有施加對稱。類別指示具有蛋白質殼和突出的刺突密度的顆粒的不同視圖,並且視圖與預期的八面體對稱一致。圖2i通過傅立葉殼關聯(FSC)圖的H1-SS-np 3D重建的解析度評估。遵循如在RELION軟體包中實施的金標準程序(gold-standard procedure),使用FSC(0.143)作為截留值。

圖3a顯示免疫的小鼠和雪貂的免疫應答。左圖顯示針對多種多樣的HA蛋白的抗體端點滴度,並且右圖顯示來自用SAS佐劑化(SAS-adjuvanted)的H1-SS-np免疫的小鼠(每組n=10)的血清的中和滴度。圖3b顯示了用SAS-佐劑化的空np(n=5),H1-SS-np』(n=6),2006-07TIV(n=6)或H5HA(2xDNA/1xMIV;n=6)免疫的雪貂的免疫應答。圖3b的左圖顯示了H1-SS-np』免疫血清對多種多樣的HA蛋白的抗體端點滴度,並且右圖顯示了來自四種免疫方案的血清的HA莖反應性。圖3c顯示了用三種施用方案免疫的雪貂的血清的中和滴度。在加強後兩周對每個個體動物顯示抗體端點和IC50滴度。虛線指示ELISA和假型化慢病毒報告物測定法兩者的基線(1:25稀釋)。誤差棒表示平均值±s.d。使用雙尾學生t檢驗(two-tailed student’s t-test)進行統計分析。

圖4a顯示了在小鼠和雪貂中針對致死性H5N1 2004VN流感病毒攻擊賦予的免疫保護。在第0、8和11周,用SAS-佐劑化的空np或H1-SS-np對BALB/c小鼠(每組n=10)接種疫苗三次,或保持未接種疫苗(未處理)。最後一次疫苗接種後四周,用高劑量(25LD50)的H5N1 2004VN病毒攻擊小鼠,並監測體重減輕(左圖)和存活(右圖)達14天。圖4b顯示用SAS-佐劑化的空np(n=5),H1-SS-np』(n=6),2006-07TIV(n=6)或H5HA(DNA/MIV;n=6),並在用1000TCID50的H5N1 2004VN最後免疫後6周攻擊。監測體重減輕(左圖)和存活(右圖)達14天。圖4c顯示在用高劑量(25LD50)的H5N1 2004VN流感病毒攻擊之前24小時用來自未處理或H1-SS-np-免疫動物的10mg Ig被動免疫(腹膜內)的BALB/c小鼠(每組n=10)。監測體重減輕(左圖)和存活(右圖)達14天。在圖4a,4b和4c的每一個中,黑色虛線(右圖)指示50%存活。使用時序(Mantel-Cox)檢驗進行統計分析。圖4d顯示了未處理和H1-SS-np免疫Ig的表徵。通過ELISA,未處理Ig(左)和H1-SS-np-免疫Ig(右)對空鐵蛋白np和各種HA蛋白的結合。圖4e顯示在輸注多克隆Ig後24小時的小鼠血清中Gen6HA-SS特異性Ig的估計濃度。

圖5-24提供了用於產生本發明的肽構建體的質粒圖譜和序列。如本公開表2中詳細描述的,圖5顯示了包含SEQ ID NO:266的Gen6_H1NC99_K394M/E446L/E448Q/R449W/D452L/Y437D/N438L_N19Q的圖譜。圖6顯示了包含SEQ ID NO:273的Gen6_H1CA09_K394M/E446L/E448Q/R449W/D452L/Y437D/N438L_N19Q的圖譜。圖7顯示包含SEQ ID NO:280的Gen6_H2Sing57_K394M/M445L/E446L/E448Q/R449W/D452L/Y437D/N438L_N19Q的圖譜。圖8顯示包含SEQ ID NO:287的Gen6_H5Ind05K394M/M445L/E446L/E448Q/R449W/D452L/Y437D/N438L/S49bW_N19Q的圖譜。圖9顯示包含SEQ ID NO:294的Gen6_H1NC99_K394M/E446L_N19Q的圖譜。圖10顯示包含SEQ ID NO:301的Gen6_H1NC99_K394M/E446L/Y437D/N438L_N19Q的圖譜。圖11顯示包含SEQ ID NO:308的Gen6_H1NC99_K394I/E446I/Y437D/N438L_N19Q的圖譜。圖12顯示包含SEQ ID NO:315的Gen6H1NC99K394L/E446I/Y437D/N438L_N19Q的圖譜。圖13顯示包含SEQ ID NO:322的Gen6_H1NC99_K394L/E446L/Y437D/N438L_N19Q的圖譜。圖14顯示包含SEQ ID NO:329的Gen6_H1NC99_K394M/E446M/Y437D/N438L_N19Q的圖譜。圖15顯示包含SEQ ID NO:336的Gen6H1NC99K394Q/E446Q/Y437D/N438L_N19Q的圖譜。圖16顯示包含SEQ ID NO:343的Gen6H1NC99K394M/E446L/Y437D/N438L/H45N/V47T_N19Q的圖譜。圖17顯示包含SEQ ID NO:350的Gen6H1NC99V36I/K394M/L445M/E446L/E448Q/R449F/D452L/Y437D/N438L N19Q的圖譜。圖18顯示包含SEQ ID NO:357的Gen6_H1NC99_K394M/E446L/E448Q/R449W/D452L/S402aN/G402cT/S402dG/T402fA/Y437D/N438L_N19Q的圖譜。圖19顯示包含SEQ ID NO:364的Gen6_H1NC99_K394M/E446L/E448Q/R449W/D452L/S402bG/G402cN/S402eT/T402fA/Y437D/N438L_N19Q的圖譜。圖20顯示包含SEQ ID NO:371的Gen6_H1NC99_K394M/E446L/E448Q/R449W/D452L/S402eN/Y437D/N438L_N19Q的圖譜。圖21顯示了包含SEQ ID NO:378的Gen6H1NC99K394M/E446L/E448Q/R449W/D452L/G402cN/G402eT/T402fA/Q370N/E372T/Y437D/N438L_S21T的圖譜。圖22顯示了包含SEQ ID NO:386的Gen6_H1NC99_K394M/E446L/E448Q/R449W/D452L/G402cN/G402eT/T402fA/Q370N/E372T/Y437D/N438L_S21T/Q69N的圖。圖23顯示了包含SEQ ID NO:392的Gen6_H1NC99_K394M/E446L/Y437D/N438L/Δ172-174的圖。圖24顯示了包含SEQ ID NO:399的Gen6_H1NC99_rpk3_Dloop2的圖。

發明詳述

本發明涉及用於流感病毒的新型疫苗。更具體地,本發明涉及新的基於流感HA蛋白的疫苗,其引發針對來自一大批流感病毒的HA蛋白的莖區的免疫應答。它還涉及自組裝納米顆粒,所述自組裝納米顆粒在其表面上展示來自流感HA蛋白的莖區的融合前構象的免疫原性部分。此類納米顆粒可用於針對流感病毒對個體接種疫苗。因此,本發明還涉及用於產生此類納米顆粒的蛋白質構建體和編碼此類蛋白質的核酸分子。另外,本發明涉及生產本發明的納米顆粒的方法,以及使用此類納米顆粒對個體接種疫苗的方法。

在進一步描述本發明前,應當理解本發明不限於描述的具體實施方案,因此當然可以有所變化。還應當理解,本文中使用的術語僅為了描述具體的實施方案,而並不意圖為限制性的,因為本發明的範圍僅會以權利要求書為限。

應當注意到,如本文中及所附權利要求書中使用的,單數形式「一個」、「一種」和「該/所述」包括複數提及物,除非上下文另有明確規定。例如,核酸分子指一種或多種核酸分子。因此,術語「一個」、「一種」、「一個/種或多個/種」和「至少一個/種」可以互換使用。類似地,術語「包含」、「包括」和「具有」可以互換使用。進一步注意到,權利要求書可以撰寫為排除任何任選要素。因此,此陳述意圖充當與權利要求要素的敘述結合使用排除術語,如「單獨」、「僅」等,或者使用「負」限定的前置基礎。

在上文外,除非另有明確定義,本文中公開的各個實施方案共同的下列術語和短語如下定義:

如本文中使用的,蛋白質構建體是由人工製備的蛋白質,其中兩個或更多個胺基酸序列以自然界中未發現的方式共價連接。被連接的胺基酸序列可以是相關的或不相關的。如本文所使用的,如果通常沒有發現多肽序列的胺基酸序列在其天然環境(例如細胞內)中通過共價鍵連接在一起,則它們是不相關的。例如,通常沒有發現構成鐵蛋白的單體亞基的胺基酸序列和流感HA蛋白的胺基酸序列通過共價鍵連接在一起。因此,此類序列被認為是不相關的。

蛋白質構建體還可以包含相關的胺基酸序列。例如,流感HA蛋白的結構使得頭部區胺基酸序列在兩端側翼為莖區胺基酸序列。通過遺傳手段,可以通過從頭部區的中間除去胺基酸殘基,同時保持側翼為莖區序列的頭部區的部分,來創建HA蛋白的缺失形式。雖然最終分子中序列的順序保持相同,但胺基酸之間的空間關係將不同於天然蛋白。因此,此類分子將被認為是蛋白質構建體。根據本發明,蛋白質構建體也可以稱為融合蛋白。

蛋白質構建體中的胺基酸序列可以彼此直接連接,或者它們可以使用接頭序列連接。接頭序列,肽或多肽是用於連接具有期望特徵(例如,結構,表位,免疫原性,活性等)的兩種蛋白質的短(例如,2-20)胺基酸序列。接頭序列通常不具有其自身的活性,並且通常用於允許蛋白質構建體的其它部分呈現期望的構象。接頭序列通常由小胺基酸殘基和/或其運行(runs),例如絲氨酸,丙氨酸和甘氨酸製備,儘管不排除使用其它胺基酸殘基。

如本文中使用的,術語免疫原性是指特定蛋白質或其特定區域引發對特定蛋白質或包含與特定蛋白質具有高度同一性的胺基酸序列的蛋白質的免疫應答的能力。根據本發明,具有高同一性程度的兩種蛋白質具有至少80%相同,至少85%相同,至少87%相同,至少90%相同,至少92%相同,至少93%相同,至少94%相同,至少95%相同,至少96%相同,至少97%相同,至少98%相同或至少99%相同的胺基酸序列。測定兩個胺基酸或核酸序列之間的百分比同一性的方法是本領域已知的。

如本文中使用的,對本發明的疫苗或納米顆粒的免疫應答是受試者中形成對疫苗中存在的HA蛋白的體液和/或細胞免疫應答。為了本發明的目的,「體液免疫應答」是指由抗體分子(包括分泌型(IgA)或IgG分子)介導的免疫應答,而「細胞免疫應答」是由T淋巴細胞和/或其它白血細胞介導的。細胞免疫的一個重要方面涉及溶細胞性T細胞(「CTL」)的抗原特異性應答。CTL對肽抗原具有特異性,所述肽抗原與由主要組織相容性複合物(MHC)編碼並且在細胞表面上表達的蛋白質聯合呈現。CTL有助於誘導和促進細胞內微生物的破壞或被此類微生物感染的細胞的溶解。細胞免疫的另一方面涉及輔助T細胞的抗原特異性應答。輔助T細胞作用為幫助刺激非特異性效應細胞針對細胞的功能,並且聚焦非特異性效應細胞針對細胞的活性,所述細胞在其表面上展示與MHC分子聯合的肽抗原。細胞免疫應答還指由活化的T細胞和/或其它白細胞(包括源自CD4+和CD8+T細胞的那些)產生的細胞因子,趨化因子和其它此類分子的產生。

因此,免疫應答可以是刺激CTL和/或輔助T細胞的產生或激活的應答。也可以刺激趨化因子和/或細胞因子的產生。疫苗還可以引發抗體介導的免疫應答。因此,免疫應答可以包括一種或多種以下效應:由B細胞產生抗體(例如IgA或IgG);和/或特異性針對存在於疫苗中的HA蛋白的抑制物(suppressor),細胞毒性或輔助T細胞和/或T細胞的活化。這些應答可用來中和感染性(例如抗體依賴性保護),和/或介導抗體-補體或抗體依賴性細胞細胞毒性(ADCC)以向免疫的個體提供保護。此類反應可以使用本領域熟知的標準免疫測定法和中和測定法來測定。

如本文中使用的,術語抗原性的,抗原性等是指由抗體或一組抗體結合的蛋白質。類似地,蛋白質的抗原部分是被抗體或一組抗體識別的任何部分。根據本發明,通過抗體識別蛋白質是指抗體選擇性地與蛋白質結合。如本文中使用的,短語選擇性地結合,選擇性結合等是指抗體與同HA無關的結合蛋白或樣品或測定法中非蛋白質組分形成對比優先結合HA蛋白的能力。優先結合HA的抗體是結合HA但不顯著結合可能存在於樣品或測定法中的其它分子或組分的抗體。認為顯著的結合是例如抗HA抗體與非HA分子的結合,其親和力或親合力大到足以幹擾測定法檢測和/或測定樣品中抗流感抗體,或HA蛋白水平的能力。可存在於樣品或測定法中的其它分子和化合物的實例包括但不限於非HA蛋白,如白蛋白,脂質和碳水化合物。根據本發明,非HA蛋白是具有與本文公開的流感HA蛋白的序列共享小於60%同一性的胺基酸序列的蛋白質。在一些實施方案中,一種或多種抗體提供廣泛的異亞型保護。在一些實施方案中,一種或多種抗體是中和性的。

如本文中使用的,中和性抗體是防止流感病毒完成一輪複製的抗體。如本文所定義的,一輪複製指病毒的生命周期,從病毒附著到宿主細胞開始,並以從宿主細胞出芽新形成的病毒結束。該生命周期包括但不限於以下步驟:附著於細胞,進入細胞,HA蛋白的切割和重排,病毒膜與內體膜的融合,病毒核糖核蛋白向細胞質的釋放,形成新病毒顆粒和自宿主細胞膜的病毒顆粒的出芽。根據本發明,中和性抗體是抑制一個或多個此類步驟的抗體。

如本文中使用的,廣泛中和性抗體是中和流感病毒的多於一種類型,亞型和/或毒株的抗體。例如,針對來自A型流感病毒的HA蛋白引發的廣泛中和性抗體可以中和B型或C型病毒。作為另一個實例,針對來自I型流感病毒的HA蛋白引發的廣泛中和性抗體可以中和組2病毒。作為另一個實例,針對來自病毒的一種亞型或株的HA蛋白引發的廣泛中和性抗體可以中和病毒的另一種亞型或株。例如,針對來自H1流感病毒的HA蛋白引發的廣泛中和性抗體可以中和來自一種或多種選自下組的亞型的病毒:H2,H3,H4,H5,H6,H7,H8,H8,H10,H11,H12,H13,H14,H15,H16,H17或H18。

根據本發明,用於分類流感病毒的所有命名法是本領域技術人員通常使用的。因此,流感病毒的類型或組是指A型流感,B型流感或C型流感。本領域技術人員應當理解,病毒作為特定類型的命名涉及在各自的M1(基質)蛋白質或NP(核蛋白)中的序列差異。A型流感病毒進一步分為組1和組2。這些組進一步分為亞型,其指基於其HA蛋白的序列的病毒分類。目前普遍認可的亞型的實例是H1,H2,H3,H4,H5,H6,H7,H8,H8,H10,H11,H12,H13,H14,H15,H16,H17或H18。組1流感亞型是H1,H2,H5,H6,H8,H9,H11,H12,H13,H16,H17和H18。組2流感亞型是H3,H4,H7,H10,H14,和H15。最後,術語毒株是指亞型內彼此不同之處在於它們在其基因組中具有小的遺傳變異的病毒。

如本文中使用的,流感血凝素蛋白或HA蛋白是指全長流感血凝素蛋白或其任何部分,其可用於產生本發明的蛋白質構建體和納米顆粒或能夠引發免疫應答。優選的HA蛋白是能夠形成三聚體的那些。全長流感HA蛋白的表位是指此類蛋白質的部分,其可以引發針對同源流感病毒株,即衍生HA的菌株的抗體應答。在一些實施方案中,此類表位也可以引發針對異源流感病毒株,即具有與免疫原的HA不同的HA的毒株的抗體應答。在一些實施方案中,表位引發廣泛異亞型保護性應答。在一些實施方案中,表位引發中和性抗體。

如本文中使用的,變體指在序列上與參照序列相似但不相同的蛋白質或核酸分子,其中變體蛋白質(或由變體核酸分子編碼的蛋白質)的活性沒有顯著改變。這些序列變異可以是天然存在的變異或者它們可以經由使用本領域技術人員已知的遺傳工程化技術來工程化改造。此類技術的例子可見Sambrook J,Fritsch E F,Maniatis T等,於Molecular Cloning--A Laboratory Manual,2nd Edition,Cold Spring Harbor Laboratory Press,1989,pp.9.31-9.57),或於Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6,這兩篇的完整內容通過提及併入本文。

就變體而言,胺基酸或核酸序列的任何類型變化是可允許的,只要所得的變體蛋白質保留引發針對流感病毒的中和性或非中和性抗體的能力。此類變異的例子包括但不限於缺失、插入、取代及其組合。例如,就蛋白質而言,本領域技術人員公知的是,一個或多個(例如2,3,4,5,6,7,8,9或10)胺基酸經常可以從蛋白質的氨基和/或羧基端末端除去,而不顯著影響所述蛋白質的活性。類似地,一個或多個(例如2,3,4,5,6,7,8,9或10)胺基酸經常可以插入蛋白質中,而不顯著影響蛋白質的活性。在已經進行插入的變體中,插入的胺基酸可以通過參考其後進行插入的胺基酸殘基來提及。例如,在胺基酸殘基402之後插入四個胺基酸殘基可以稱為402a-402d。此外,如果那些插入的胺基酸之一隨後被另一個胺基酸取代,則這種變化可以參考字母位置提及。例如,用蘇氨酸取代插入的甘氨酸(在插入物的另一個位置中)可以稱為S402dT。

如記錄的,相對於本文中公開的流感HA蛋白,本發明的變體蛋白質可以含有胺基酸取代。任何胺基酸取代是可允許的,只要蛋白質的活性不受顯著影響。在這點上,本領域中應當理解,胺基酸可以基於其物理特性而分成組。此類組的例子包括但不限於帶電荷的胺基酸、不帶電荷的胺基酸、極性不帶電荷的胺基酸、和疏水性胺基酸。含有取代的優選變體是那些其中的胺基酸用來自相同組的胺基酸取代的變體。此類取代稱為保守取代。

天然存在的殘基可以基於共同的側鏈特性而分成類:

1)疏水性:Met,Ala,Val,Leu,Ile;

2)中性親水性:Cys,Ser,Thr;

3)酸性:Asp,Glu;

4)鹼性:Asn,Gln,His,Lys,Arg;

5)影響鏈取向的殘基:Gly,Pro;和

6)芳香基:Trp,Tyr,Phe。

例如,非保守取代可以牽涉用這些類別之一的成員替換來自另一類別的成員。

在進行胺基酸變化中,可以考慮胺基酸的親水指數。基於每種胺基酸的疏水性和電荷性質,已給每種胺基酸的親水指數賦值。親水指數是:異亮氨酸(+4.5);纈氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);蘇氨酸(-0.7);絲氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);組氨酸(-3.2);穀氨酸(-3.5);穀氨醯胺(-3.5);天冬氨酸(-3.5);天冬醯胺(-3.5);賴氨酸(-3.9);和精氨酸(-4.5)。本領域一般了解親水胺基酸指數在賦予蛋白質相互作用性生物學功能中的重要性(Kyte等,1982,J.Mol.Biol.157:105-31)。已知可以用某些胺基酸替代其它具有相似親水指數或分值的胺基酸,而仍然保留相似的生物學活性。在進行基於親水指數的變化中,親水指數在±2之內的胺基酸取代是優選的,在±1之內的那些胺基酸取代是特別優選的,且在±0.5之內的那些胺基酸取代是甚至更特別優選的。

本領域還了解可以基於疏水性有效地進行類似胺基酸的取代,特別是在意圖將由此產生的生物功能等同性蛋白質或肽用於結合免疫學發明(本案就是如此)的情況中。蛋白質的最大局部平均親水性(如由其相鄰胺基酸的親水性所決定的)與其免疫原性和抗原性,即與蛋白質的生物學特性相關聯。已將下列親水性數值(hydrophilicity value)賦予這些胺基酸殘基:精氨酸(+3.0);賴氨酸(+3.0);天冬氨酸(+3.0±1);穀氨酸(+3.0±1);絲氨酸(+0.3);天冬醯胺(+0.2);穀氨醯胺(+0.2);甘氨酸(0);蘇氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);組氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);纈氨酸(-1.5);亮氨酸(-1.8);異亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);和色氨酸(-3.4)。在進行基於相似親水性數值的變化時,親水性數值在±2之內的胺基酸取代是優選的,在±1之內的那些胺基酸取代是特別優選的,且在±0.5之內的那些胺基酸取代是甚至更特別優選的。還可以基於親水性鑑定來自一級胺基酸序列的表位。

在期望此類取代時,本領域技術人員可以確定期望的胺基酸取代(無論是保守的還是非保守的)。例如,可以使用胺基酸取代來鑑定HA蛋白的重要殘基,或者提高或降低本文中描述的HA蛋白的免疫原性、溶解度或穩定性。下文在表I中顯示了例示性的胺基酸取代。

表1

胺基酸取代

如本文中使用的,短語顯著影響蛋白質活性指將蛋白質活性降低至少10%,至少20%,至少30%,至少40%或至少50%。就本發明而言,此類活性可以例如以蛋白質引發針對流感病毒的保護性抗體的能力測量。此類活性可以通過測量針對流感病毒的此類抗體的效價,此類抗體針對流感感染提供保護的能力或者通過測量由引發的抗體中和的類型、亞型或毒株的數目測量。測定抗體效價,實施保護測定法,和實施病毒中和測定法的方法是本領域技術人員已知的。在上文描述的活性外,可以測量的其它活性包括凝集紅細胞的能力和蛋白質對細胞的結合親和力。測量此類活性的方法是本領域技術人員已知的。

術語個體、受試者和患者是本領域中公知的,並且在本文中可互換使用,指對流感感染易感的任何人或其它動物。例子包括但不限於人和其它靈長類,包括非人靈長類,諸如黑猩猩及其它猿和猴物種;家畜,諸如牛、綿羊、豬、海豹、山羊和馬;馴養哺乳動物,諸如犬和貓;實驗室動物,包括嚙齒類,諸如小鼠、大鼠和豚鼠;禽類,包括馴養禽類、野生禽類和獵禽,諸如雞、火雞和其它雞形目(gallinaceous)禽類、鴨、鵝,等等。術語個體、受試者和患者單獨不表示特定年齡、性別、人種,等等。因此,任何年齡的個體(無論雄性或雌性)意圖為本公開內容覆蓋,並且包括但不限於老年人、成人、兒童、嬰孩(babies)、嬰兒(infant)、和幼童(toddler)。同樣地,本發明的方法可以適用於任何人種,包括例如高加索人(Caucasian)(白種人)、非洲裔美國人(African-American)(黑人)、美洲原住民(Native American)、夏威夷原住民(Native Hawaiian)、西班牙裔(Hispanic)、拉美裔(Latino)、亞裔(Asian)、和歐洲裔。感染的受試者是已知在其體內具有流感病毒的受試者。

如本文中使用的,接種疫苗的受試者是已經施用意圖提供針對流感病毒的保護性效果的疫苗的受試者。

如本文中使用的,術語暴露指受試者已經與已知感染流感病毒的動物個體接觸。

本文中討論的出版物僅提供其在本申請的提交日前的公開內容。本文中的任何內容不應解釋為承認憑藉在先發明,本發明沒有資格早於此類出版物。此外,提供的出版日期可以與實際出版日期不同,這可能需要獨立確認。

除非另有定義,本文中使用的所有技術和科學術語與本發明所屬領域的普通技術人員的通常理解具有相同的意義。雖然與本文中描述的方法和材料類似或等同的任何方法和材料也可以用於實施或測試本發明,現在描述優選的方法和材料。本文中提及的所有出版物通過提及收入本文以公開並描述與結合出版物引用的方法和/或材料。

應當領會,本發明的某些特徵(為了清楚,其在不同實施方案的背景中描述)也可以在單一實施方案中組合提供。相反,本發明的各個特徵(為了簡潔,其在單一實施方案的背景中描述)也可以分開或在任何合適的亞組合中提供。實施方案的所有組合是本發明明確涵蓋的,並且在本文中公開,就像每種組合單獨且明確公開一樣。另外,所有亞組合也是本發明明確涵蓋的,並且在本文中公開,就像每種此類亞組合在本文中單獨且明確公開一樣。

本發明的一個實施方案是包含流感HA蛋白的蛋白質構建體,其中流感HA蛋白的頭部區已被包含距HA蛋白頭部區少於5個連續胺基酸殘基的胺基酸序列替換。如本文中使用的,HA蛋白是指可用於產生本發明的蛋白質構建體和納米顆粒的全長流感HA蛋白或其任何一個或多個部分和/或變體。因此,本發明涉及能夠引發對流感HA蛋白的莖區的免疫應答的分子。在一些實施方案中,HA蛋白構建體的序列已經進一步改變(即突變),以穩定蛋白的莖區,其形式可以呈遞給免疫系統。此類HA蛋白的一些代表性實例和由其製備的蛋白質構建體示於下表2中。

表2

病毒表面上的三聚體HA蛋白包含球狀頭部區和莖或柄區域,其將HA蛋白錨定到病毒脂質包膜中。流感HA的頭部區僅由HA1多肽的主要部分形成,而柄區由HA1和HA2的區段製成。根據本發明,頭部區大致由對應於流感H1N1NC的全長HA蛋白(SEQ ID NO:8)的胺基酸59-291的HA蛋白的胺基酸組成。類似地,如本文所使用的,莖區大約由胺基酸1-58和對應於流感H1N1NC的全長HA蛋白(SEQ ID NO:8)的胺基酸328-564的HA蛋白的胺基酸組成。如本文中使用的,關於頭部和莖區的術語大約是指上述序列在長度上可以改變幾個胺基酸,而不影響本發明的性質。因此,例如,頭部區可以由胺基酸50-291,胺基酸59-296或胺基酸59-285組成。通常,頭部和莖區域將不會從上述位置改變超過十個胺基酸;然而,在一個實施方案中,頭部區的羧基端末端可以延伸得遠達對應於SEQ ID NO:8的胺基酸327的胺基酸。在一個實施方案中,頭部區由在對應於流感A/新喀裡多尼亞/20/1999(SEQ ID NO:8)的Cys59和Cys291的胺基酸殘基之間的胺基酸序列組成,並且包括所述胺基酸殘基。關於HA蛋白,本領域技術人員應當理解,來自不同流感病毒的HA蛋白可能由於蛋白質中的突變(插入,缺失)而具有不同的長度。因此,提及相應的區域是指與所比較的區域在序列、結構和/或功能上相同或幾乎相同(例如,至少90%相同,至少95%相同,至少98%相同或至少99%相同)的另一種蛋白質的區域。例如,關於HA蛋白的莖區,另一HA蛋白中的相應區域可以不具有相同的殘基數,但是將具有幾乎相同的序列並且將執行相同的功能。作為實例,在上述實施方案中,來自A/新喀裡多尼亞/20/1999的HA蛋白(SEQ ID NO:8)的頭部區在胺基酸C291處結束。A/加利福尼亞/4/2009(H1)(SEQ ID NO:11)中頭部區末端的相應胺基酸是半胱氨酸292。為了更好地闡明病毒之間的序列比較,本領域技術人員使用編號系統,其將胺基酸位置與參考序列相關。因此,來自不同流感毒株的HA蛋白中的相應胺基酸殘基相對於其與蛋白質的n-末端胺基酸的距離可能不具有相同的殘基數。例如,使用H3編號系統,參考A/新喀裡多尼亞/20/1999(1999NC,H1)中的殘基100並不意味著它是距離N-末端胺基酸的第100個殘基。相反,A/新喀裡多尼亞/20/1999(1999NC,H1)的殘基100與流感H3N2毒株的殘基100對齊。本領域技術人員理解這種編號系統的使用。雖然H3編號系統可用於鑑定胺基酸的位置,除非另有說明,HA蛋白中胺基酸殘基的位置將通過一般性參考來自本文公開的序列的相應胺基酸的位置來鑑定。

本發明人還發現,通過將流感病毒HA蛋白的特定序列與能夠將HA蛋白呈遞給免疫系統的不相關分子組合,可以引發對HA蛋白的靶向區域的免疫應答。本發明的一個實施方案是包含與單體亞基蛋白的至少部分連接的流感HA蛋白的蛋白質構建體,其中流感HA蛋白的頭部區已被包含來自HA蛋白的頭部區的少於5個連續胺基酸殘基的胺基酸序列替換,並且其中所述蛋白質構建體能夠形成納米顆粒。

通過至少將流感HA蛋白的部分與單體亞基連接,本發明的蛋白質構建體能夠組裝成在其表面上表達HA的三聚體的納米顆粒。應當理解,構成此類三聚體的HA蛋白是融合前形式,並且與單體亞基的連接和在納米顆粒上的表達使融合前蛋白以其三聚體形式穩定化。這是重大的,因為HA蛋白以更天然的形式呈現,意味著莖多肽的某些表面不被暴露,從而降低莖多肽可能誘導不利抗體應答的風險。

在一個實施方案中,HA蛋白包含來自流感HA蛋白的莖區的至少一個免疫原性部分,其中所述蛋白引發針對流感病毒的保護性抗體。在一個實施方案中,HA蛋白包含來自選自A型流感病毒,B型流感病毒和C型流感病毒的病毒的HA蛋白的莖區的至少一個免疫原性部分,其中蛋白質引發針對流感病毒的保護性抗體。在一個實施方案中,HA蛋白包含來自選自以下的HA蛋白的莖區的至少一個免疫原性部分:H1流感病毒HA蛋白,H2流感病毒HA蛋白,H3流感病毒HA蛋白,流感H4病毒HA蛋白,H5流感病毒HA蛋白,H6流感病毒HA蛋白,H7流感病毒HA蛋白,H8流感病毒HA蛋白,H9流感病毒HA蛋白,H10流感病毒HA蛋白HA蛋白,H11流感病毒HA蛋白,H12流感病毒HA蛋白,H13流感病毒HA蛋白,H14流感病毒HA蛋白,H15流感病毒HA蛋白,H16流感病毒HA蛋白,H17流感病毒HA蛋白和H18流感病毒HA蛋白。

在一個實施方案中,HA蛋白包含來自蛋白質的至少一個免疫原性部分,所述蛋白質包含與選自下組的序列至少80%相同的胺基酸序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,HA蛋白包含來自蛋白質的至少一個免疫原性部分,所述蛋白質包含選自下組的胺基酸序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,HA蛋白包含來自蛋白質的至少一個免疫原性部分,所述蛋白質包含與選自下組的序列至少80%相同的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:156,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。在一個實施方案中,HA蛋白包含來自蛋白質的至少一個免疫原性部分,所述蛋白質包含選自下組的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:156,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。在一個實施方案中,包含HA蛋白的免疫原性部分的此類蛋白質引發針對流感病毒的廣泛保護性抗體的產生。

蛋白質的免疫原性部分包含表位,其是被免疫系統識別的胺基酸殘基的簇,從而引發免疫應答。此類表位可以由連續的胺基酸殘基(即,在蛋白質中彼此相鄰的胺基酸殘基)組成,或者它們可以由非連續的胺基酸殘基(即,蛋白質中彼此不相鄰的胺基酸殘基),但在最終摺疊的蛋白質中緊密空間接近。本領域技術人員完全理解,表位需要最少六個胺基酸殘基,以便被免疫系統識別。因此,在一個實施方案中,來自流感HA蛋白的免疫原性部分包含至少一個表位。在一個實施方案中,HA蛋白包含來自流感HA蛋白的莖區的至少6個胺基酸,至少10個胺基酸,至少25個胺基酸,至少50個胺基酸,至少75個胺基酸或至少100個胺基酸。在一個實施方案中,HA蛋白包含來自HA蛋白的莖區的至少6個胺基酸,至少10個胺基酸,至少25個胺基酸,至少50個胺基酸,至少75個胺基酸或至少100個胺基酸,所述HA蛋白來自選自A型流感病毒,B型流感病毒和C型流感病毒的病毒。在一個實施方案中,HA蛋白包含來自HA蛋白的莖區的至少6個胺基酸,至少10個胺基酸,至少25個胺基酸,至少50個胺基酸,至少75個胺基酸或至少100個胺基酸,所述HA蛋白來自選自H1流感病毒HA蛋白,H2流感病毒HA蛋白,H3流感病毒HA蛋白,H4流感病毒HA蛋白,H5流感病毒HA蛋白,H6流感病毒HA蛋白,H7流感病毒病毒HA蛋白,H8流感病毒HA蛋白,H9流感病毒HA蛋白,H10流感病毒HA蛋白HA蛋白,H11流感病毒HA蛋白,H12流感病毒HA蛋白,H13流感病毒HA蛋白,H14流感病毒HA蛋白,H15流感病毒HA蛋白,H16流感病毒HA蛋白,H17流感病毒HA蛋白和H18流感病毒HA蛋白。在一個實施方案中,HA蛋白包含來自HA蛋白的莖區的至少6個胺基酸,至少10個胺基酸,至少25個胺基酸,至少50個胺基酸,至少75個胺基酸或至少100個胺基酸,所述HA蛋白來自於選自下組的病毒株:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)及其變體。在一個實施方案中,胺基酸是來自HA蛋白的莖區的連續胺基酸。在一個實施方案中,包含來自HA蛋白的莖區的至少6個胺基酸,至少10個胺基酸,至少25個胺基酸,至少50個胺基酸,至少75個胺基酸或至少100個胺基酸的此類蛋白質引發針對流感病毒的廣泛保護性抗體的產生。本發明的一個實施方案是包含蛋白質構建體,其包含來自HA蛋白的莖區的至少6個胺基酸,至少10個胺基酸,至少25個胺基酸,至少50個胺基酸,至少75個胺基酸或至少100個胺基酸,所述HA蛋白包含選自SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17的胺基酸序列。本發明的一個實施方案是蛋白質構建體,其包含來自HA蛋白的莖區的至少6個胺基酸,至少10個胺基酸,至少25個胺基酸,至少50個胺基酸,至少75個胺基酸或至少100個胺基酸,所述HA蛋白包含選自下組的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:156,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。在一個實施方案中,胺基酸是來自HA蛋白的莖區的連續胺基酸。在一個實施方案中,胺基酸是非連續的,但在最終蛋白質中緊密空間接近。

雖然本申請例示了來自幾種示例性HA蛋白的莖區序列的使用,但是本發明也可以使用來自包含所公開的HA序列的變異的蛋白質的莖區來實施。因此,在一個實施方案中,HA蛋白來自選自下組的病毒:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)及其變體。在一個實施方案中,HA蛋白包含與HA蛋白的莖區至少80%,至少85%,至少90%,至少92%,至少94%,至少96%,至少98%或至少99%相同的胺基酸序列,所述HA蛋白包含選自下組的胺基酸序列:SEQ ID NO:8,SEQ ID NO:,SEQ ID NO:11,SEQ ID NO:14,SEQ ID NO:17。在一個實施方案中,HA蛋白包含選自SEQ ID NO:8,SEQ ID NO:,SEQ ID NO:11,SEQ ID NO:14,SEQ ID NO:17的胺基酸序列。

在一個實施方案中,HA蛋白的頭部區序列被接頭序列替換。可以使用任何接頭序列,只要莖區序列能夠形成期望的結構。雖然任何胺基酸可用於製備接頭序列,但優選使用缺少大的或帶電荷的側鏈的胺基酸。優選的胺基酸包括但不限於絲氨酸,甘氨酸和丙氨酸。在一個實施方案中,接頭由絲氨酸和甘氨酸殘基製成。接頭序列的長度可以變化,但是優選的實施方案使用最短的可能序列,以允許莖序列形成期望的結構。在一個實施方案中,接頭序列的長度小於10個胺基酸。在一個實施方案中,接頭序列的長度小於5個胺基酸。在優選的實施方案中,接頭序列缺乏來自HA蛋白的頭部區的連續胺基酸序列。在一個實施方案中,接頭序列包含來自HA蛋白頭部區的少於5個連續胺基酸。

如上所述,HA序列與單體亞基蛋白的部分連接。如本文中使用的,單體亞基蛋白是指能夠結合其它單體亞基蛋白的蛋白單體,使得單體亞基蛋白自組裝成納米顆粒。任何單體亞基蛋白可以用於產生本發明的蛋白質構建體,只要該蛋白質構建體能夠形成在其表面上展示HA蛋白的多聚體結構。在一個實施方案中,單體亞基是鐵蛋白。

鐵蛋白是在所有動物,細菌和植物中發現的球狀蛋白,其主要通過將水合鐵離子和質子運輸到礦化核心和從礦化核心運輸來控制多核Fe(III)2O3形成的速率和位置起作用。鐵蛋白的球狀形式由單體亞基蛋白(也稱為單體鐵蛋白亞基)組成,其是具有約17-20kDa的分子量的多肽。一個此類單體鐵蛋白亞基的序列的實例由SEQ ID NO:2表示。每個單體鐵蛋白亞基具有螺旋束的拓撲結構,其包括四個反向平行螺旋基序,具有大致垂直於4螺旋束的長軸的第五較短螺旋(c-端螺旋)。根據慣例,螺旋分別從N-末端標記為「A,B,C和D&E」。N-末端序列位於納米顆粒三折軸附近並延伸到表面,而E螺旋在四摺疊軸上聚集在一起,C-末端延伸到顆粒核心中。這種包裝的結果在納米顆粒表面上創建兩個孔。預期這些孔中的一個或兩個代表水合鐵擴散進入和離開納米顆粒的點。產生後,這些單體鐵蛋白亞基蛋白自組裝成球狀鐵蛋白蛋白。因此,鐵蛋白的球狀形式包含24個單體,鐵蛋白亞基蛋白,並具有432對稱的殼體樣結構。

根據本發明,本發明的單體鐵蛋白亞基是鐵蛋白蛋白的全長單一多肽或其任何部分,其能夠指導單體鐵蛋白亞基自組裝成蛋白質的球狀形式。此類蛋白質的實例包括但不限於SEQ ID NO:2和SEQ ID NO:5。來自任何已知的鐵蛋白蛋白的單體鐵蛋白亞基的胺基酸序列可以用於產生本發明的蛋白質構建體,只要單體鐵蛋白亞基能夠自組裝成在其表面上展示HA的納米顆粒。在一個實施方案中,單體亞基來自選自下組的鐵蛋白蛋白:細菌鐵蛋白蛋白,植物鐵蛋白蛋白,藻鐵蛋白蛋白,昆蟲鐵蛋白蛋白,真菌鐵蛋白蛋白和哺乳動物鐵蛋白蛋白。在一個實施方案中,所述鐵蛋白蛋白來自幽門螺桿菌(Helicobacter pylori)。

本發明的蛋白質構建體不需要包含鐵蛋白蛋白的單體亞基多肽的全長序列。可以使用單體鐵蛋白亞基蛋白的部分或區域,只要該部分包含指導單體鐵蛋白亞基自組裝成蛋白的球形形式的胺基酸序列。此類區域的一個實例位於幽門螺桿菌鐵蛋白蛋白的胺基酸5和167之間。更具體的區域描述於Zhang,Y.Self-Assembly in the Ferritin Nano-Cage Protein Super Family.2011,Int.J.Mol.Sci.,12,5406-5421,其通過引用整體併入本文。

在一個實施方案中,HA蛋白與來自鐵蛋白的至少50個,至少100個或至少150個胺基酸連接,其中所述蛋白質構建體能夠形成納米顆粒。在一個實施方案中,HA蛋白與來自SEQ ID NO:2或SEQ ID NO:5的至少50,至少100或至少150個胺基酸連接,其中所述蛋白質構建體能夠形成納米顆粒。在一個實施方案中,HA蛋白與蛋白質連接,所述蛋白質包含與鐵蛋白序列至少85%,至少90%或至少95%相同的胺基酸序列,其中蛋白質構建體能夠形成納米顆粒。在一個實施方案中,HA蛋白與蛋白質連接,所述蛋白質包含與SEQ ID NO:2或SEQ ID NO:5至少85%,至少90%,至少95%相同的胺基酸序列,其中所述蛋白質構建體形成納米顆粒。

在一個實施方案中,單體亞基是2,4-二氧四氫蝶啶合成酶(lumazine synthase)。在一個實施方案中,HA蛋白與來自2,4-二氧四氫蝶啶合酶的至少50個,至少100個或至少150個胺基酸連接,其中所述蛋白質構建體能夠形成納米顆粒。因此,在一個實施方案中,HA蛋白與蛋白質連接,所述蛋白質與2,4-二氧四氫蝶啶合酶至少85%,至少90%,至少95%相同,其中蛋白質構建體能夠形成納米顆粒。

如本文中使用的,本發明的納米顆粒是指通過本發明的蛋白質構建體(融合蛋白)的自組裝形成的三維顆粒。本發明的納米顆粒通常是球形形狀的,儘管不排除其它形狀,並且通常直徑為約20nm至約100nm。本發明的納米顆粒可以但不需要包含除了蛋白質構建體外的分子,如蛋白質,脂質,碳水化合物等,它們從所述蛋白質構建體中形成。

可以使用重組技術製備本發明的蛋白質構建體以將HA蛋白,接頭和單體亞基的各部分連接在一起。以這種方式,可以產生僅包含產生納米顆粒疫苗所必需的那些序列的蛋白質構建體。因此,本發明的一個實施方案是蛋白質構建體(也稱為融合蛋白),其包含來自流感病毒HA蛋白的莖區的第一胺基酸序列和來自流感病毒HA蛋白的莖區的第二胺基酸序列,所述第一和第二胺基酸序列通過接頭序列共價連接,

其中所述第一胺基酸序列包含來自頭部區序列的氨基端末端上遊的胺基酸序列的至少20個連續胺基酸殘基;

其中所述第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少20個連續胺基酸殘基;和,

其中所述第一或第二胺基酸序列與單體亞基結構域的至少部分連接,使得所述蛋白質構建體能夠形成納米顆粒。

在一個實施方案中,第一胺基酸序列來自選自下組的病毒的HA蛋白的莖區:A型流感病毒,B型流感病毒和C型流感病毒。在一個實施方案中,第一胺基酸序列來自選自下組的病毒的HA蛋白的莖區:H1流感病毒,H2流感病毒,流感H3病毒,流感H4病毒,流感H5病毒,流感H6病毒,H7流感病毒,H8流感病毒,H9流感病毒,H10流感病毒,H11流感病毒,H12流感病毒,H13流感病毒,H14流感病毒,H15流感病毒,H16流感病毒,H17流感病毒,和H18流感病毒。在一個實施方案中,第一胺基酸序列來自選自下組的病毒的HA蛋白的莖區:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)。在一個實施方案中,第一胺基酸序列來自HA蛋白的莖區,所述HA蛋白具有與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:8,SEQ ID NO:,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,第一胺基酸序列來自HA蛋白的莖區,所述HA蛋白包含選自下組的序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,HA蛋白包含來自蛋白質的至少一個免疫原性部分,所述蛋白質包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:156,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。在一個實施方案中,HA蛋白包含來自蛋白質的至少一個免疫原性部分,所述蛋白質包含選自下組的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:156,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。

在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:A型流感病毒,B型流感病毒和C型流感病毒。在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:H1流感病毒,H2流感病毒,流感H3病毒,流感H4病毒,流感H5病毒,流感H6病毒,H7流感病毒,H8流感病毒,H9流感病毒,H10流感病毒,H11流感病毒,H12流感病毒,H13流感病毒,H14流感病毒,H15流感病毒,H16流感病毒,H17流感病毒和H18流感病毒。在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)。在一個實施方案中,第二胺基酸序列來自HA蛋白的莖區,所述HA蛋白具有與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,第二胺基酸序列來自HA蛋白的莖區,所述HA蛋白包含選自下組的序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,HA蛋白包含來自蛋白質的至少一個免疫原性部分,所述蛋白質包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:156,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。在一個實施方案中,HA蛋白包含來自蛋白質的至少一個免疫原性部分,所述蛋白質包含選自下組的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154,SEQ ID NO:156,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。

如上所述,第一胺基酸序列包含來自頭部區序列的氨基端末端上遊的胺基酸序列的至少20個連續胺基酸殘基。根據本發明,術語上遊指與頭部區的第一個胺基酸殘基的氨基端末端連接的胺基酸序列的全部。在一個實施方案中,頭部區的氨基端末端位於對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白(SEQ ID NO:8)的Cys59的胺基酸殘基。因此,在一個實施方案中,第一胺基酸序列包含來自對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基1-58的HA蛋白區域的至少20個連續胺基酸殘基。在一個實施方案中,第一胺基酸序列包含來自與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的序列的至少20個連續胺基酸殘基:SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65。在一個實施方案中,第一胺基酸序列包含來自選自SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65的序列的至少20個連續胺基酸殘基。

在一個實施方案中,第一胺基酸序列包含來自對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基1-58的HA蛋白的胺基酸區域的至少40個連續胺基酸殘基。在一個實施方案中,第一胺基酸序列包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的序列的至少40個連續胺基酸殘基:SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65。在一個實施方案中,第一胺基酸序列包含來自選自SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65的序列的至少40個連續胺基酸殘基。

在一個實施方案中,第一胺基酸序列包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的序列:SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65。在一個實施方案中,第一胺基酸序列包含選自SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65的序列。

在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:A型流感病毒,B型流感病毒和C型流感病毒。在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:H1流感病毒,H2流感病毒,H3流感病毒,H4流感病毒,H5流感病毒病毒,H6流感病毒,H7流感病毒,H8流感病毒,H9流感病毒,H10流感病毒,H11流感病毒,H12流感病毒,H13流感病毒,H14流感病毒,H15流感病毒病毒,H16流感病毒,H17流感病毒和H18流感病毒。在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)。在一個實施方案中,第二胺基酸序列來自HA蛋白的莖區,所述HA蛋白具有與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,第二胺基酸序列來自HA蛋白的莖區,所述HA蛋白包含選自SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17的序列。

如上所述,第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少20個連續胺基酸殘基。根據本發明,術語下遊指與頭部區的羧基端末端胺基酸殘基連接的整個胺基酸序列。在一個實施方案中,頭部區的羧基端末端位於對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白(SEQ ID NO:8)的Cys291的胺基酸位置。因此,在一個實施方案中,第二胺基酸序列包含來自對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基292-517的HA蛋白的胺基酸區域的至少20個連續胺基酸。在一個實施方案中,第二胺基酸序列包含來自對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基328-517的HA蛋白的胺基酸區域的至少20個連續胺基酸。在一個實施方案中,第二胺基酸序列包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的序列的至少20個連續胺基酸殘基:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。在一個實施方案中,第二胺基酸序列包含來自選自下組的序列的至少20個連續胺基酸殘基:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。

在一個實施方案中,第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少40個,至少60個,至少75個,至少100個或至少150個連續胺基酸。在一個實施方案中,第二胺基酸序列包含來自HA蛋白的胺基酸區的至少40個,至少60個,至少75個,至少100個或至少150個連續胺基酸,所述胺基酸區對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基292-517。在一個實施方案中,第二胺基酸序列包含來自HA蛋白的胺基酸區域的至少40個,至少60個,至少75個,至少100個或至少150個連續胺基酸,所述胺基酸區域對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基328-517。在一個實施方案中,第二胺基酸序列包含來自序列的至少40,至少60,至少75,至少100或至少150個連續胺基酸,所述序列與選自下組的序列至少85%,至少90%,至少95%或至少97%相同:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。在一個實施方案中,第二胺基酸序列包含來自下組的至少40,至少60,至少75,至少100或至少150個連續胺基酸:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。在一個實施方案中,第二胺基酸序列包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。在一個實施方案中,第二胺基酸序列包含選自下組的序列:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。

如上所述,蛋白質構建體的第一和第二胺基酸序列可以通過接頭序列連接。可以使用任何接頭序列,只要該接頭序列具有距HA蛋白的頭部區少於5個連續的胺基酸殘基,並且只要第一和第二胺基酸能夠形成期望的構象即可。在一個實施方案中,接頭序列長度小於10個胺基酸,小於7個胺基酸或小於5個胺基酸。在一個實施方案中,接頭序列包含甘氨酸和絲氨酸。在一個實施方案中,接頭序列將第一胺基酸序列的羧基端末端連接到第二胺基酸序列的氨基端末端。在一個實施方案中,接頭序列將第二胺基酸序列的羧基端末端連接到第一胺基酸序列的氨基端末端。

如上所述,蛋白質構建體的第一或第二胺基酸序列與單體亞基蛋白的至少部分連接,使得蛋白質構建體能夠形成納米顆粒。在一個實施方案中,單體亞基蛋白的至少部分連接到第二胺基酸序列。在優選的實施方案中,單體亞基蛋白的至少部分連接到第二胺基酸序列的羧基端末端。在一個實施方案中,所述部分包含來自單體亞基的至少50個,至少100個或至少150個胺基酸。在一個實施方案中,單體亞基是鐵蛋白。在一個實施方案中,單體亞基是2,4-二氧四氫蝶啶合成酶。在一個實施方案中,所述部分包含來自SEQ ID NO:2,SEQ ID NO:5或SEQ ID NO:194的至少50,至少100或至少150個胺基酸。在一個實施方案中,單體亞基包含與SEQ ID NO:2,SEQ ID NO:5或SEQ ID NO:194具有至少85%相同,至少90%相同或至少95%相同的序列。在一個實施方案中,單體亞基包含選自SEQ ID NO:2,SEQ ID NO:5和SEQ ID NO:194的序列。

發明人已經發現,上述蛋白質構建體的流感HA序列的修飾導致蛋白質構建體的改進的穩定性。例如,本發明人已經發現,從對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白(SEQ ID NO:8)的胺基酸N403-W435的胺基酸區的HA蛋白的缺失導致更穩定的蛋白質構建體。在該區域缺失時,該區域側翼的胺基酸序列可以直接連接在一起,或者它們可以用接頭序列如例如甘氨酸-絲氨酸-甘氨酸連接。因此,在一個實施方案中,第二胺基酸序列包含與來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基至少85%,至少90%或至少95%相同的多肽序列,其中所述多肽序列缺少對應於來自流感A/新喀裡多尼亞1999的HA蛋白(SEQ ID NO:8)的SEQ ID NO:133,SEQ ID NO:134,SEQ ID NO:135或SEQ ID NO:136的區域。在一個實施方案中,第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基,其中多肽序列缺乏對應於流感A/新喀裡多尼亞1999的HA蛋白(SEQ ID NO:8)的SEQ ID NO:133,SEQ ID NO:134,SEQ ID NO:135或SEQ ID NO:136的區域。

在一個實施方案中,第二胺基酸序列包含與來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基至少85%,至少90%或至少95%相同的多肽序列,其中所述多肽序列缺少對應於流感A/加利福尼亞/4/2009的HA蛋白(SEQ ID NO:10)的SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:139或SEQ ID NO:140的區域。在一個實施方案中,第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基,其中多肽序列缺少對應於流感A/加利福尼亞/4/2009的HA蛋白(SEQ ID NO:10)的SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:139或SEQ ID NO:140的區域。

在一個實施方案中,第二胺基酸序列包含與來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基至少85%,至少90%或至少95%相同的胺基酸序列,其中多肽序列缺少對應於流感A/新加坡/1957的HA蛋白(SEQ ID NO:12)的SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:143或SEQ ID NO:144的區域。在一個實施方案中,第二胺基酸序列包含與來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基至少85%,至少90%或至少95%相同的胺基酸序列,其中多肽序列缺少對應於流感A/新加坡/1957的HA蛋白(SEQ ID NO:12)的SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:143或SEQ ID NO:144的區域。

在一個實施方案中,第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基,其中多肽序列缺少對應於流感A/印度尼西亞/05/2005(H5)的HA蛋白(SEQ ID NO:16)的SEQ ID NO:145,SEQ ID NO:146,SEQ ID NO:147或SEQ ID NO:148的區域。在一個實施方案中,第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基,其中多肽序列缺少對應於流感A/印度尼西亞/05/2005(H5)的HA蛋白(SEQ ID NO:16)的SEQ ID NO:145,SEQ ID NO:146,SEQ ID NO:147或SEQ ID NO:148的區域。

在一個實施方案中,第二胺基酸序列包含與SEQ ID NO:23,SEQ ID NO:26或SEQ ID NO:29的100個連續胺基酸至少85%,至少90%或至少95%相同的序列,其中所述100個連續胺基酸不包含選自SEQ ID NO:133,SEQ ID NO:134,SEQ ID NO:135和SEQ ID NO:136的序列。在一個實施方案中,第二胺基酸序列包含來自SEQ ID NO:23,SEQ ID NO:26或SEQ ID NO:29的100個連續胺基酸,其中所述100個連續胺基酸不包含選自下組的序列:SEQ ID NO:133,SEQ ID NO:134,SEQ ID NO:135和SEQ ID NO:136。

在一個實施方案中,第二胺基酸序列包含與SEQ ID NO:38,SEQ ID NO:41或SEQ ID NO:44的100個連續胺基酸至少85%,至少90%或至少95%相同的序列,其中所述100個連續胺基酸不包含選自SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:139和SEQ ID NO:140的序列。在一個實施方案中,第二胺基酸序列包含來自SEQ ID NO:38,SEQ ID NO:41或SEQ ID NO:44的100個連續胺基酸,其中所述100個連續胺基酸不包含選自下組的序列:SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:139和SEQ ID NO:140。

在一個實施方案中,第二胺基酸序列包含與SEQ ID NO:53,SEQ ID NO:56或SEQ ID NO:59的100個連續胺基酸至少85%,至少90%或至少95%相同的序列,其中所述100個連續胺基酸不包含選自SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:143和SEQ ID NO:144的序列。在一個實施方案中,第二胺基酸序列包含來自SEQ ID NO:53,SEQ ID NO:56或SEQ ID NO:59的100個連續胺基酸,其中所述100個連續胺基酸不包含選自下組的序列:SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:143和SEQ ID NO:144。

在一個實施方案中,第二胺基酸序列包含與SEQ ID NO:68,SEQ ID NO:71或SEQ ID NO:74的100個連續胺基酸至少85%,至少90%或至少95%相同的序列,其中所述100個連續胺基酸不包含選自SEQ ID NO:145,SEQ ID NO:146,SEQ ID NO:147和SEQ ID NO:148的序列。在一個實施方案中,第二胺基酸序列包含來自SEQ ID NO:68,SEQ ID NO:71或SEQ ID NO:74的100個連續胺基酸,其中所述100個連續胺基酸不包含選自下組的序列:SEQ ID NO:145,SEQ ID NO:146,SEQ ID NO:147和SEQ ID NO:148。

在一個實施方案中,第二胺基酸序列包含與來自選自下組的序列的100個連續胺基酸至少85%,至少90%或至少95%相同的序列:SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:32,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:71和SEQ ID NO:77。在一個實施方案中,第二胺基酸序列包含來自選自下組的序列的至少100個連續胺基酸:SEQ ID NO:26,SEQ ID NO:32,SEQ ID NO:41,SEQ ID NO:47,SEQ ID NO:56,SEQ ID NO:62,SEQ ID NO:71和SEQ ID NO:77。在一個實施方案中,第二胺基酸序列包含選自下組的序列:SEQ ID NO:26,SEQ ID NO:32,SEQ ID NO:41,SEQ ID NO:47,SEQ ID NO:56,SEQ ID NO:62,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。

本發明人還發現了,HA莖區序列的序列改變導致更穩定的蛋白質構建體。例如,在摺疊的HA蛋白中,對應於流感A新喀裡多尼亞/20/1999(H1)的K394和E446(對應於SEQ ID NO:149的K1和E53)的胺基酸殘基形成鹽橋,有助於穩定摺疊的蛋白質。本發明人已經發現,通過用合適的胺基酸取代賴氨酸和穀氨酸殘基,可以加強兩個胺基酸殘基之間的相互作用,這改善了分子的穩定性並允許對其進行更廣泛的操作。因此,本發明的一個實施方案是蛋白質構建體,其包含來自流感病毒HA蛋白的莖區的第一胺基酸序列和來自流感病毒HA蛋白的莖區的第二胺基酸序列,所述第一和第二胺基酸酸序列通過接頭序列共價連接,

其中所述第一胺基酸序列包含來自頭部區序列的氨基端末端上遊的胺基酸序列的至少20個連續胺基酸性殘基,

其中所述第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少60個連續胺基酸,

其中所述60個連續胺基酸包含對應於來自A/新喀裡多尼亞/20/1999的SEQ ID NO:149或SEQ ID NO:150的序列的多肽序列,且

其中對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的所述多肽序列中的胺基酸殘基被除賴氨酸以外的胺基酸取代,

並且對應於SEQ ID NO:149的E53或SEQ ID NO:150的E20的胺基酸殘基被除穀氨酸之外的胺基酸殘基取代,使得取代的胺基酸殘基之間的相互作用的強度大於在野生型蛋白中的相互作用的強度。

如上所述,對應於流感A新喀裡多尼亞/20/1999(H1)的K394和E446的胺基酸殘基形成鹽橋,其是一類鍵。本領域已知存在胺基酸之間的其它類型的鍵,其強度根據鍵的類型而變化。此類鍵的實例包括但不限於疏水鍵和氫鍵,二者通常比鹽橋更強。因此,在一個實施方案中,對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的多肽中的胺基酸殘基和對應於SEQ ID NO:149的E53或SEQ ID NO:150的E20的多肽中的胺基酸殘基被改變,使得它們在最終摺疊的蛋白質中形成氫鍵。在一個實施方案中,對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的多肽中的胺基酸殘基和對應於SEQ ID NO:149的E53或SEQ ID NO:150的E20的多肽中的胺基酸殘基被改變,使得它們在最終摺疊的蛋白質中形成疏水鍵。

對應於SEQ ID NO:149的K1,SEQ ID NO:150的K1,SEQ ID NO:149的E53或SEQ ID NO:150的E20的胺基酸可以被任何胺基酸殘基取代,只要兩個胺基酸之間的所得相互作用比未改變的蛋白質中的鹽橋更強。增加對應於流感A新喀裡多尼亞/20/1999(H1)的K394和E446(SEQ ID NO:149的K1和E53)的胺基酸之間的相互作用強度的取代的實例包括但不限於:

其中對應於SEQ ID NO:149的K1的多肽序列中的胺基酸殘基被甲硫氨酸取代,並且對應於SEQ ID NO:149的E53的胺基酸殘基被亮氨酸取代;

其中對應於SEQ ID NO:149的K1的多肽序列中的胺基酸殘基被甲硫氨酸取代,並且對應於SEQ ID NO:149的E53的胺基酸殘基被甲硫氨酸取代;

其中對應於SEQ ID NO:149的K1的多肽序列中的胺基酸殘基被亮氨酸取代,並且對應於SEQ ID NO:149的E53的胺基酸殘基被亮氨酸取代;

其中對應於SEQ ID NO:149的K1的多肽序列中的胺基酸殘基被異亮氨酸取代,並且對應於SEQ ID NO:149的E53的胺基酸殘基被異亮氨酸取代;

其中對應於SEQ ID NO:149的K1的多肽序列中的胺基酸殘基被亮氨酸取代,並且對應於SEQ ID NO:149的E53的胺基酸殘基被異亮氨酸取代;

其中對應於SEQ ID NO:149的K1的多肽序列中的胺基酸殘基被穀氨醯胺取代,並且對應於SEQ ID NO:149的E53的胺基酸殘基被穀氨醯胺取代。

在一個實施方案中,第一胺基酸序列來自選自下組的病毒的HA蛋白的莖區:A型流感病毒,B型流感病毒和C型流感病毒。在一個實施方案中,第一胺基酸序列來自選自下組的病毒的HA蛋白的莖區:H1流感病毒,H2流感病毒,流感H3病毒,流感H4病毒,流感H5病毒,流感H6病毒,H7流感病毒,H8流感病毒,H9流感病毒,H10流感病毒,H11流感病毒,H12流感病毒,H13流感病毒,H14流感病毒,H15流感病毒,H16流感病毒,H17流感病毒,和H18流感病毒。在一個實施方案中,第一胺基酸序列來自選自下組的病毒的HA蛋白的莖區:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)。在一個實施方案中,第一胺基酸序列來自HA蛋白的莖區,所述HA蛋白具有與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,第一胺基酸序列來自HA蛋白的莖區,所述HA蛋白包含選自下組的序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。

在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:A型流感病毒,B型流感病毒和C型流感病毒。在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:H1流感病毒,H2流感病毒,流感H3病毒,流感H4病毒,流感H5病毒,流感H6病毒,H7流感病毒,H8流感病毒,H9流感病毒,H10流感病毒,H11流感病毒,H12流感病毒,H13流感病毒,H14流感病毒,H15流感病毒,H16流感病毒,H17流感病毒,和H18流感病毒。在一個實施方案中,第二胺基酸序列來自來自選自下組的病毒的HA蛋白的莖區:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)。在一個實施方案中,第二胺基酸序列來自HA蛋白的莖區,所述HA蛋白具有與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列。在一個實施方案中,第二胺基酸序列來自HA蛋白的莖區,所述HA蛋白包含選自下組的序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。

在一個實施方案中,第一胺基酸序列包含來自對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基1-58的HA蛋白的區域的至少20個連續胺基酸殘基。在一個實施方案中,第一胺基酸序列包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的序列的至少20個連續胺基酸殘基:SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65。在一個實施方案中,第一胺基酸序列包含來自選自SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65的序列的至少20個連續胺基酸殘基。

在一個實施方案中,第一胺基酸序列包含來自HA蛋白的胺基酸區域的至少40個連續胺基酸殘基,所述胺基酸區域對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基1-58。在一個實施方案中,第一胺基酸序列包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的序列的至少40個連續胺基酸殘基:SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65。在一個實施方案中,第一胺基酸序列包含來自選自SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65的序列的至少40個連續胺基酸殘基。在一個實施方案中,第一胺基酸序列包含與選自下組的序列至少85%,至少90%或至少95%相同的序列:SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65。在一個實施方案中,第一胺基酸序列包含選自SEQ ID NO:20,SEQ ID NO:35,SEQ ID NO:50和SEQ ID NO:65的序列。

在一個實施方案中,第二胺基酸序列來自選自A型流感病毒,B型流感病毒和C型流感病毒的病毒的HA蛋白的莖區。在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:H1流感病毒,H2流感病毒,H3流感病毒,H4流感病毒,H5流感病毒病毒,H6流感病毒,H7流感病毒,H8流感病毒,H9流感病毒,H10流感病毒,H11流感病毒,H12流感病毒,H13流感病毒,H14流感病毒,H15流感病毒病毒,H16流感病毒,H17流感病毒和H18流感病毒。在一個實施方案中,第二胺基酸序列來自選自下組的病毒的HA蛋白的莖區:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)。在一個實施方案中,第二胺基酸序列來自HA蛋白的莖區,所述HA蛋白具有與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。在一個實施方案中,第二胺基酸序列來自HA蛋白的莖區,所述HA蛋白包含選自SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17的序列。

在一個實施方案中,第二胺基酸序列的至少60個連續胺基酸來自HA蛋白的胺基酸區,所述胺基酸區對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基292-517。在一個實施方案中,第二胺基酸序列的至少60個連續胺基酸來自HA蛋白的胺基酸區,其對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基328-517。在一個實施方案中,第二胺基酸序列的至少60個連續胺基酸來自與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的序列:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。在一個實施方案中,第二胺基酸序列的至少60個連續胺基酸來自選自下組的序列

SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。

在一個實施方案中,第二胺基酸序列包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少75個,至少100個,至少150個或至少200個連續胺基酸,其中至少75個,至少100個,至少150個或至少200個連續胺基酸包含對應於H1N1NC的SEQ ID NO:149或SEQ ID NO:150的序列的多肽序列,並且其中對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的多肽序列中的胺基酸殘基,和多肽序列中對應於SEQ ID NO:149的E53或SEQ ID NO:150的E20的胺基酸殘基已經分別被除了賴氨酸和穀氨酸外的胺基酸取代,使得取代的胺基酸殘基之間的相互作用的強度大於野生型蛋白質中的相互作用的強度。在一個實施方案中,第二胺基酸序列包含來自HA蛋白的胺基酸區域的至少75,至少100,至少150或至少200個連續胺基酸,所述HA蛋白對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基292-517,其中所述至少75個,至少100個,至少150個或至少200個連續胺基酸包含對應於H1N1NC的SEQ ID NO:149或SEQ ID NO:150的序列的多肽序列,並且其中對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的多肽序列中的胺基酸殘基,和對應於SEQ ID NO:149的E53或SEQ ID NO:150的E20的多肽序列中的胺基酸殘基分別被除了賴氨酸和穀氨酸之外的胺基酸取代,使得取代的胺基酸殘基之間的相互作用的強度大於強度的野生型蛋白中的相互作用。在一個實施方案中,第二胺基酸序列包含來自HA蛋白的胺基酸區域的至少75個,至少100個,至少150個或至少200個連續胺基酸,所述胺基酸區域對應於流感A新喀裡多尼亞/20/1999(H1)(SEQ ID NO:8)的胺基酸殘基328-517,其中至少75,至少100,至少150或至少200個連續胺基酸包含對應於H1N1NC的SEQ ID NO:149或SEQ ID NO:150的序列的多肽序列,並且其中對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的多肽序列中的胺基酸殘基,和對應於SEQ ID NO:149的E53或SEQ ID NO:150的E20的多肽序列中的胺基酸殘基分別被除了賴氨酸和穀氨酸之外的胺基酸取代,使得取代的胺基酸殘基之間的相互作用的強度大於強度的野生型蛋白中的相互作用。在一個實施方案中,第二胺基酸序列包含來自與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的序列的至少75,至少100,至少150或至少200個連續胺基酸:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77,其中所述至少75個,至少100個,至少150個或至少200個連續胺基酸包含對應於H1N1NC的SEQ ID NO:149或SEQ ID NO:150的序列的多肽序列,和其中對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的多肽序列中的胺基酸殘基和對應於SEQ ID NO:149的E53或SEQ ID NO:150的E20的多肽序列中的胺基酸殘基分別被除了賴氨酸和穀氨酸之外的胺基酸取代,使得取代的胺基酸殘基之間的相互作用的強度大於野生型蛋白質中相互作用的強度。在一個實施方案中,第二胺基酸序列包含來自下組的至少75,至少100,至少150或至少200個連續胺基酸:SEQ ID NO:23,SEQ ID NO:26,SEQ ID NO:29,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:41,SEQ ID NO:44,SEQ ID NO:47,SEQ ID NO:53,SEQ ID NO:56,SEQ ID NO:59,SEQ ID NO:62,SEQ ID NO:68,SEQ ID NO:71,SEQ ID NO:74和SEQ ID NO:77。其中所述至少75個,至少100個,至少150個或至少200個連續胺基酸包含對應於H1N1NC的SEQ ID NO:149或SEQ ID NO:150的序列的多肽序列,並且其中對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的多肽序列中的胺基酸殘基,並且多肽序列中對應於SEQ ID NO:149的E53或SEQ ID NO:150的E20的胺基酸殘基已經分別被除了賴氨酸和穀氨酸之外的胺基酸取代,使得取代的胺基酸殘基之間的相互作用的強度大於野生型蛋白質中的相互作用的強度。

含有規定位點特異性突變的蛋白質構建體可用於通過將本發明的納米顆粒連接到單體亞基來製備本發明的納米顆粒。因此,在一個實施方案中,將含有所公開的位點特異性突變(例如,SEQ ID NO:149或SEQ ID NO:150的K1和SEQ ID NO:149的E53或SEQ ID NO:150的E20)的蛋白質構建體連接到單體亞基蛋白的至少部分,其中所述單體亞基蛋白的所述部分能夠指導蛋白質構建體的自組裝。在一個實施方案中,單體亞基蛋白的至少部分連接到第二胺基酸序列。在優選的實施方案中,單體亞基蛋白的至少部分連接到第二胺基酸序列的羧基端末端。在一個實施方案中,所述部分包含來自單體亞基的至少50個,至少100個或至少150個胺基酸。在一個實施方案中,單體亞基是鐵蛋白。在一個實施方案中,單體亞基是2,4-二氧四氫蝶啶合成酶。在一個實施方案中,單體亞基包含與SEQ ID NO:2,SEQ ID NO:5或SEQ ID NO:194至少85%相同,至少90%相同或至少95%相同的序列。在一個實施方案中,單體亞基包含選自SEQ ID NO:2,SEQ ID NO:5和SEQ ID NO:194的序列。

儘管對本文公開的HA蛋白進行的修飾已經描述為單獨的實施方案,但是應當理解,所有此類修飾可以包含在單一蛋白質構建體中。例如,可以製備蛋白質構建體,其中第一胺基酸序列通過接頭連接到第二胺基酸序列,其中第二胺基酸序列包含來自頭部區的羧基端末端下遊的區域的胺基酸序列,但是缺乏由SEQ ID NO:133-148表示的內部環序列,並且其中對應於SEQ ID NO:149的K1或SEQ ID NO:50的K1和SEQ ID NO:149的E53或SEQ ID NO:150的E20的第二胺基酸序列中的胺基酸分別被除了賴氨酸和穀氨酸之外的胺基酸取代,以增加摺疊蛋白中這些胺基酸殘基之間的相互作用的強度。因此,本發明的一個實施方案是蛋白質構建體,其包含來自流感病毒HA蛋白的莖區的第一胺基酸序列和來自流感病毒HA蛋白的莖區的第二胺基酸序列,所述第一和第二胺基酸酸序列通過接頭序列共價連接,

其中所述第一胺基酸序列包含來自頭部區序列的氨基端末端上遊的胺基酸序列的至少20個連續胺基酸殘基;

其中所述第二胺基酸序列包含與來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基至少85%,至少90%或至少95%相同的多肽序列,

其中所述多肽序列包含對應於由SEQ ID NO:150代表的流感A新喀裡多尼亞/20/1999(H1)中的序列,由SEQ ID NO:152代表的流感A加利福尼亞/2009(H1)中的序列,由SEQ ID NO:154表示的流感A新加坡/1957(H2)中的序列和由SEQ ID NO:156表示的流感A印度尼西亞/2005H5)中的序列和,

其中對應於SEQ ID NO:150的K1的多肽序列中的胺基酸殘基已經被除了賴氨酸之外的胺基酸取代,並且對應於SEQ ID NO:150的E20的胺基酸殘基已經被除了穀氨酸外的胺基酸取代。

在一個實施方案中,多肽包含來自頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸。在一個實施方案中,所述至少100個連續胺基酸包含SEQ ID NO:150。在一個實施方案中,所述至少100個連續胺基酸包含SEQ ID NO:152。在一個實施方案中,所述至少100個連續胺基酸序列包含SEQ ID NO:154。在一個實施方案中,所述至少100個連續胺基酸包含SEQ ID NO:156。應當理解,在上述構建體中,當除去內部環區時,剩餘的HA蛋白的各個末端可以直接連接在一起。然而,在一些情況下,此類直接連接可能降低肽主鏈的柔性。因此,在一些情況下,用接頭序列替代內部環區域可能是有益的。作為實例,如果六個胺基酸接頭序列插入SEQ ID NO:150,則最終序列可表現如下:VNSVIEKMGSGGSGTYNAELLVLL。

因此,在一個實施方案中,蛋白質構建體的多肽序列包含SEQ ID NO:150,其中插入短接頭序列。在一個實施方案中,蛋白質構建體的多肽序列包含SEQ ID NO:152,其中插入短接頭序列。在一個實施方案中,蛋白質構建體的多肽序列包含SEQ ID NO:154,其中插入短接頭序列。在一個實施方案中,蛋白質構建體的多肽序列包含SEQ ID NO:156,其中插入短接頭序列。在一個實施方案中,接頭由絲氨酸和甘氨酸殘基製成。在一個實施方案中,接頭的長度少於10個胺基酸。在一個實施方案中,接頭的長度少於5個胺基酸。在一個實施方案中,接頭的長度少於3個胺基酸。

儘管上文所述的蛋白質構建體可用於產生能夠產生針對一種或多種流感病毒的免疫應答的納米顆粒,但是在一些實施方案中,可能有用的是將進一步的突變工程化改造到本發明的蛋白質的胺基酸序列中。例如,可以有用的是改變單體亞基蛋白,三聚化結構域或接頭序列中的位點,如酶識別位點或糖基化位點,以便對蛋白質給予有益的性質(例如溶解度,半衰期,免於免疫監視的蛋白質的掩蔽部分)。在這方面,已知鐵蛋白的單體亞基不是天然糖基化的。然而,如果其在哺乳動物或酵母細胞中作為分泌性蛋白質表達,則其可以被糖基化。因此,在一個實施方案中,來自單體鐵蛋白亞基的胺基酸序列中的潛在N連接的糖基化位點被突變,使得突變的鐵蛋白亞基序列在突變位點不再被糖基化。突變的單體鐵蛋白亞基的一個此類序列由SEQ ID NO:5表示。

也可以改變蛋白質構建體序列以包括其它有用的突變。例如,在一些情況下,可以期望阻斷針對蛋白質構建體中的某些胺基酸序列的免疫應答的產生。這可以通過在待阻斷的位點附近添加糖基化位點來完成,使得聚糖在空間上阻礙免疫系統到達阻斷位點的能力。因此,在一個實施方案中,蛋白質構建體的序列已經改變為包括一個或多個糖基化位點。這樣的位點的實例包括但不限於Asn-X-Ser,Asn-X-Thr和Asn-X-Cys。在一些情況下,可以將糖基化位點引入接頭序列中。引入糖基化位點的有用位點的其它實例包括但不限於對應於來自流感A新喀裡多尼亞/20/1999(H1)的胺基酸45-47或胺基酸370-372的胺基酸。引入糖基化位點的方法是本領域技術人員已知的。

本文的公開內容證明在HA或單體亞基蛋白中的特定位置處的突變產生有用的蛋白質構建體,並因此產生本發明的納米顆粒。引入突變的鐵蛋白蛋白質中有用位置的實例包括對應於選自下組的胺基酸位置的胺基酸:SEQ ID NO:2的胺基酸位置18,胺基酸位置20和胺基酸位置68。引入突變的有用位置的實例包括HA蛋白中對應於選自下組的胺基酸位置的胺基酸:流感A新喀裡多尼亞/20/1999(H1)的HA蛋白(SEQ ID NO:8)的胺基酸位置36,胺基酸位置45,胺基酸位置47,胺基酸位置49,胺基酸位置339,胺基酸位置340,胺基酸位置341,胺基酸位置342,胺基酸位置361,胺基酸位置372,胺基酸位置394,胺基酸位置402,胺基酸位置437,胺基酸位置438,胺基酸位置445,胺基酸位置446,胺基酸位置448,胺基酸449,胺基酸位置450和胺基酸位置452。表2中列出了此類突變的一些實例。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置36的位置處包含異亮氨酸或與其具有相似性質的胺基酸殘基A。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置45的位置處包含天冬醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999的HA蛋白的胺基酸位置47的位置包含蘇氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置49的位置處包含色氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置339的位置處包含穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置340的位置處包含精氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置341的位置包含穀氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置342的位置包含蘇氨酸或與其具有相似性質的胺基酸殘基(H1)。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置372的位置處包含蘇氨酸或與其具有相似性質的胺基酸殘基(H1)。在一個實施方案中,蛋白質構建體的HA部分在對應於在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置394的位置包含甲硫氨酸,異亮氨酸,亮氨酸,穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置402的位置處包含天冬醯胺,蘇氨酸,甘氨酸,天冬醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置437的位置包含天冬氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置438的位置包含亮氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置445的位置包含亮氨酸,甲硫氨酸或具有與其相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置446的位置包含異亮氨酸,亮氨酸,甲硫氨酸,穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置448的位置處包含穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置449的位置包含色氨酸,苯丙氨酸或具有與其相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置450的位置處包含丙氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置452的位置處包含亮氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分缺少對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸515-517的一個或多個胺基酸。

本發明的一個實施方案是蛋白質構建體,所述蛋白質構建體包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。

在一個實施方案中,對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的胺基酸殘基的胺基酸殘基被除了賴氨酸之外的胺基酸取代,並且對應於SEQ ID NO:149的E53的胺基酸殘基或SEQ ID NO:20的E20的胺基酸殘基被穀氨酸以外的胺基酸取代,使得在摺疊蛋白中取代的胺基酸之間的相互作用的強度增加。

本發明的一個實施方案是蛋白質構建體,所述蛋白質構建體包含選自下組的序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。在一個實施方案中,當與單體亞基蛋白連接時,蛋白構建體能夠形成納米顆粒,其中納米顆粒能夠引發針對流感病毒的免疫應答。

如前已經描述,由流感HA蛋白製成的蛋白質構建體可以用於通過將其連接到單體亞基來製備本發明的納米顆粒。因此,在一個實施方案中,蛋白質構建體與單體亞基蛋白質的至少一部分連接,其中單體亞基蛋白質的部分能夠指導蛋白質構建體的自組裝。在一個實施方案中,單體亞基蛋白的至少一部分連接到第二胺基酸序列。在優選的實施方案中,單體亞基蛋白的至少一部分連接到第二胺基酸序列的羧基末端。在一個實施方案中,所述部分包含來自單體亞基的至少50個,至少100個或至少150個胺基酸。在一個實施方案中,單體亞基是鐵蛋白。在一個實施方案中,單體亞基是2,4-二氧四氫蝶啶合成酶。在一個實施方案中,單體亞基包含與SEQ ID NO:2,SEQ ID NO:5或SEQ ID NO:194至少85%相同,至少90%相同或至少95%相同的序列。在一個實施方案中,單體亞基包含選自SEQ ID NO:2,SEQ ID NO:5和SEQ ID NO:194的序列。

本發明的一個實施方案是蛋白質構建體,其包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的胺基酸序列:SEQ ID NO:107,SEQ ID NO:110,SEQ ID NO:113,SEQ ID NO:116,SEQ ID NO:119,SEQ ID NO:122,SEQ ID NO:125,SEQ ID NO:128,SEQ ID NO:131,SEQ ID NO:161,SEQ ID NO:167,SEQ ID NO:173,SEQ ID NO:179,SEQ ID NO:185,SEQ ID NO:191,SEQ ID NO:200,SEQ ID NO:206,SEQ ID NO:212,SEQ ID NO:215,SEQ ID NO:220,SEQ ID NO:223,SEQ ID NO:225,SEQ ID NO:227,SEQ ID NO:229,SEQ ID NO:231,SEQ ID NO:233,SEQ ID NO:238,SEQ ID NO:241,SEQ ID NO:243,SEQ ID NO:245,SEQ ID NO:247,SEQ ID NO:249,SEQ ID NO:251,SEQ ID NO:253,SEQ ID NO:255,SEQQ ID NO:257,SEQ ID NO:259,SEQ ID NO:264,SEQ ID NO:271,SEQ ID NO:278,SEQ ID NO:285,SEQ ID NO:292,SEQ ID NO:299,SEQ ID NO:306,SEQ ID NO:313,SEQ ID NO:320,SEQ ID NO:327,SEQ ID NO:334,SEQ ID NO:341,SEQ ID NO:348,SEQ ID NO:355,SEQ ID NO:362,SEQ ID NO:369,SEQ ID NO:376,SEQ ID NO:383,SEQ ID NO:390和SEQ ID NO:397。在一個實施方案中,對應於SEQ ID NO:149的K1或SEQ ID NO:150的K1的胺基酸殘基被除了賴氨酸之外的胺基酸取代,並且對應於SEQ ID NO:149的E53的胺基酸殘基或SEQ ID NO:20的E20被除了穀氨酸之外的胺基酸取代,使得在摺疊蛋白中取代的胺基酸之間的相互作用的強度增加。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置36的位置包含異亮氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置45的位置處包含天冬醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置47的位置包含蘇氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置49的位置處包含色氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置339的位置處包含穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置340的位置處包含精氨酸或與其具有相似性質的胺基酸殘基(H1)。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/20的HA蛋白的胺基酸位置341的位置包含穀氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置342的位置包含蘇氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置372的位置處包含蘇氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置394的位置包含甲硫氨酸,異亮氨酸,亮氨酸,穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置402的位置處包含天冬醯胺,蘇氨酸,甘氨酸,天冬醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置437的位置包含天冬氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置438的位置包含亮氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置445的位置包含亮氨酸,甲硫氨酸或具有與其相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置446的位置包含異亮氨酸,亮氨酸,甲硫氨酸,穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置448的位置處包含穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置449的位置包含色氨酸,苯丙氨酸或具有與其相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置450的位置處包含丙氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置452的位置處包含亮氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分缺少對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸515-517的一個或多個胺基酸。

本發明的一個實施方案是蛋白質構建體,所述蛋白質構建體包含選自下組的序列:SEQ ID NO:107,SEQ ID NO:110,SEQ ID NO:113,SEQ ID NO:116,SEQ ID NO:119,SEQ ID NO:122,SEQ ID NO:125,SEQ ID NO:128,SEQ ID NO:131,SEQ ID NO:161,SEQ ID NO:167,SEQ ID NO:173,SEQ ID NO:179,SEQ ID NO:185,SEQ ID NO:191,SEQ ID NO:200,SEQ ID NO:206,SEQ ID NO:212,SEQ ID NO:215,SEQ ID NO:220,SEQ ID NO:223,SEQ ID NO:225,SEQ ID NO:227,SEQ ID NO:229,SEQ ID NO:231,SEQ ID NO:233,SEQ ID NO:238,SEQ ID NO:241,SEQ ID NO:243,SEQ ID NO:245,SEQ ID NO:247,SEQ ID NO:249,SEQ ID NO:251,SEQ ID NO:253,SEQ ID NO:255,SEQQ ID NO:257,SEQ ID NO:259,SEQ ID NO:264,SEQ ID NO:271,SEQ ID NO:278,SEQ ID NO:285,SEQ ID NO:292,SEQ ID NO:299,SEQ ID NO:306,SEQ ID NO:313,SEQ ID NO:320,SEQ ID NO:327,SEQ ID NO:334,SEQ ID NO:341,SEQ ID NO:348,SEQ ID NO:355,SEQ ID NO:362,SEQ ID NO:369,SEQ ID NO:376,SEQ ID NO:383,SEQ ID NO:390和SEQ ID NO:397。

本發明的一個實施方案是由核酸分子編碼的蛋白質構建體,所述核酸分子包含與選自下組的序列至少85%,至少90%,至少95%或至少97%相同的核酸序列:SEQ ID NO:266,SEQ ID NO:273,SEQ ID NO:SEQ ID NO:280,SEQ ID NO:287,SEQ ID NO:294,SEQ ID NO:301,SEQ ID NO:308,SEQ ID NO:315,SEQ ID NO:322,SEQ ID NO:329,SEQ ID NO:336,SEQ ID NO:343,SEQ ID NO:350,SEQ ID NO:357,SEQ ID NO:364,SEQ ID NO:371,SEQ ID NO:378,SEQ ID NO:385SEQ ID NO:392和SEQ ID NO:399。本發明的一個實施方案是由核酸分子編碼的蛋白質構建體,所述核酸分子包含選自下組的核酸序列:SEQ ID NO:266,SEQ ID NO:273,SEQ ID NO:SEQ ID NO:280,SEQ ID NO:287,SEQ ID NO:294,SEQ ID NO:301,SEQ ID NO:308,SEQ ID NO:315,SEQ ID NO:322,SEQ ID NO:329,SEQ ID NO:336,SEQ ID NO:343,SEQ ID NO:350,SEQ ID NO:357,SEQ ID NO:364,SEQ ID NO:371,SEQ ID NO:378,SEQ ID NO:385SEQ ID NO:392和SEQ ID NO:399。

本發明的蛋白質和蛋白質構建體由本發明的核酸分子編碼。此外,它們由本發明的核酸構建體表達。如本文所使用的,核酸構建體是重組表達載體,即連接到編碼蛋白質的核酸分子的載體,使得當將核酸構建體施用於,例如,受試者或器官,組織或細胞時,核酸分子可以實現蛋白質表達。載體還能夠將核酸分子轉運到環境內的細胞,例如但不限於生物體,組織或細胞培養物。本公開的核酸構建體通過人類幹預產生。核酸構建體可以是DNA,RNA或其變體。載體可以是DNA質粒,病毒載體或其它載體。在一個實施方案中,載體可以是巨細胞病毒(CMV),逆轉錄病毒,腺病毒,腺伴隨病毒,皰疹病毒,牛痘病毒,脊髓灰質炎病毒,辛德畢斯病毒或任何其它DNA或RNA病毒載體。在一個實施方案中,載體可以是假型化的慢病毒或逆轉錄病毒載體。在一個實施方案中,載體可以是DNA質粒。在一個實施方案中,載體可以是包含能夠進行核酸分子遞送和表達的病毒組分和質粒組分的DNA質粒。構建本公開的核酸構建體的方法是公知的。參見,例如,Molecular Cloning:a Laboratory Manual,3rd edition,Sambrook et al.2001Cold Spring Harbor Laboratory Press,以及Current Protocols in Molecular Biology,Ausubel et al.eds.,John Wiley&Sons,1994。在一個實施方案中,載體是DNA質粒,如CMV/R質粒,如CMV/R或CMV/R 8KB(本文也稱為CMV/R 8kb)。本文提供了CMV/R和CMV/R 8kb的實例。CMV/R也在2006年8月22日授權的US 7,094,598B2中描述。

如本文中使用的,核酸分子包含編碼本發明的蛋白質構建體的核酸序列。核酸分子可以重組地,合成地或通過重組和合成程序的組合產生。本公開的核酸分子可以具有野生型核酸序列或密碼子修飾的核酸序列,以例如摻入由人翻譯系統更好識別的密碼子。在一個實施方案中,核酸分子可以被遺傳工程化以引入或消除編碼不同胺基酸的密碼子,如引入編碼N-連接的糖基化位點的密碼子。產生本公開核酸分子的方法是本領域已知的,特別是一旦知道核酸序列。應當理解,核酸構建體可以包含一個核酸分子或多於一個核酸分子。還應當理解,核酸分子可以編碼一種蛋白質或多於一種蛋白質。

一個實施方案是編碼流感HA蛋白的核酸分子,所述流感HA蛋白包含與選自SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154和SEQ ID NO:156的序列至少80%,至少85%,至少90%,至少92%,至少94%,至少96%,至少98%或至少99%相同的胺基酸序列。一個實施方案是編碼流感HA蛋白的核酸分子,所述流感HA蛋白包含選自SEQ ID NO:150,SEQ ID NO:152,SEQ ID NO:154和SEQ ID NO:156的胺基酸序列。

在一個實施方案中,核酸分子編碼流感HA蛋白,其包含與選自下組的序列至少80%,至少85%,至少90%,至少92%,至少94%,至少96%,至少98%或至少99%相同的胺基酸序列:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。在一個實施方案中,核酸分子編碼流感HA蛋白,其包含選自下組的胺基酸:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400。

本發明的一個實施方案是核酸分子,所述核酸分子包含與選自下組的序列至少80%,至少85%,至少90%,至少92%,至少94%,至少96%,至少98%或至少99%相同的核酸序列:SEQ ID NO:79,SEQ ID NO:82,SEQ ID NO:85,SEQ ID NO:88,SEQ ID NO:91,SEQ ID NO:94,SEQ ID NO:97,SEQ ID NO:100,SEQ ID NO:103,SEQ ID NO:157,SEQ ID NO:163,SEQ ID NO:169,SEQ ID NO:175,SEQ ID NO:181,SEQ ID NO:187,SEQ ID NO:196,SEQ ID NO:202,SEQ ID NO:208,SEQ ID NO:216,SEQ ID NO:234,SEQ ID NO:260,SEQ ID NO:267,SEQ ID NO:274,SEQ ID NO:281,SEQ ID NO:288,SEQ ID NO:295,SEQ ID NO:302,SEQ ID NO:309,SEQ ID NO:316,SEQ ID NO:323,SEQ ID NO:330,SEQ ID NO:337,SEQ ID NO:344,SEQ ID NO:351,SEQ ID NO:358,SEQ ID NO:365,SEQ ID NO:372,SEQ ID NO:379,SEQ ID NO:386和SEQ ID NO:393。本發明的一個實施方案是核酸分子,其包含選自下組的核酸:SEQ ID NO:79,SEQ ID NO:82,SEQ ID NO:85,SEQ ID NO:88,SEQ ID NO:91,SEQ ID NO:94,SEQ ID NO:97,SEQ ID NO:100,SEQ ID NO:103,SEQ ID NO:157,SEQ ID NO:163,SEQ ID NO:169,SEQ ID NO:175,SEQ ID NO:181,SEQ ID NO:187,SEQ ID NO:196,SEQ ID NO:202,SEQ ID NO:208,SEQ ID NO:216,SEQ ID NO:234,SEQ ID NO:260,SEQ ID NO:267,SEQ ID NO:274,SEQ ID NO:281,SEQ ID NO:288,SEQ ID NO:295,SEQ ID NO:302,SEQ ID NO:309,SEQ ID NO:316,SEQ ID NO:323,SEQ ID NO:330,SEQ ID NO:337,SEQ ID NO:344,SEQ ID NO:351,SEQ ID NO:358,SEQ ID NO:365,SEQ ID NO:372,SEQ ID NO:379,SEQ ID NO:386和SEQ ID NO:393。

優選的核酸分子是編碼單體亞基,HA蛋白和/或包含與流感HA蛋白連接的單體亞基蛋白的蛋白質構建體的那些。因此,本發明的一個實施方案是包含編碼蛋白質的核酸序列的核酸分子,所述蛋白質包含與流感HA蛋白連接的鐵蛋白蛋白的單體亞基。在一個實施方案中,單體亞基包含與選自SEQ ID NO:2和SEQ ID NO:5的序列至少80%,至少85%,至少90%,至少92%,至少94%,至少96%,至少98%或至少99%序列相同的胺基酸序列。在一個實施方案中,單體亞基包含選自SEQ ID NO:2和SEQ ID NO:5的胺基酸序列。

本發明的一個實施方案是包含編碼蛋白質的核酸序列的核酸分子,所述蛋白質包含與流感HA蛋白連接的2,4-二氧四氫蝶啶合酶單體亞基。在一個實施方案中,單體亞基包含與SEQ ID NO:194至少80%,至少85%,至少90%,至少92%,至少94%,至少96%,至少98%或至少99%相同的胺基酸序列。在一個實施方案中,單體亞基包含SEQ ID NO:194。

本發明的一個實施方案是編碼蛋白質構建體的核酸分子,所述蛋白質構建體包含與選自下組的序列至少80%,至少85%,至少90%,至少92%,至少94%,至少96%,至少98%或至少99%相同的胺基酸序列:SEQ ID NO:107,SEQ ID NO:110,SEQ ID NO:113,SEQ ID NO:116,SEQ ID NO:119,SEQ ID NO:122,SEQ ID NO:125,SEQ ID NO:128,SEQ ID NO:131,SEQ ID NO:161,SEQ ID NO:167,SEQ ID NO:173,SEQ ID NO:179,SEQ ID NO:185,SEQ ID NO:191,SEQ ID NO:200,SEQ ID NO:206,SEQ ID NO:212,SEQ ID NO:215,SEQ ID NO:220,SEQ ID NO:223,SEQ ID NO:225,SEQ ID NO:227,SEQ ID NO:229,SEQ ID NO:231,SEQ ID NO:233,SEQ ID NO:238,SEQ ID NO:241,SEQ ID NO:243,SEQ ID NO:245,SEQ ID NO:247,SEQ ID NO:249,SEQ ID NO:251,SEQ ID NO:253,SEQ ID NO:255,SEQQ ID NO:257,SEQ ID NO:259,SEQ ID NO:264,SEQ ID NO:271,SEQ ID NO:278,SEQ ID NO:285,SEQ ID NO:292,SEQ ID NO:299,SEQ ID NO:306,SEQ ID NO:313,SEQ ID NO:320,SEQ ID NO:327,SEQ ID NO:334,SEQ ID NO:341,SEQ ID NO:348,SEQ ID NO:355,SEQ ID NO:362,SEQ ID NO:369,SEQ ID NO:376,SEQ ID NO:383,SEQ ID NO:390和SEQ ID NO:397。本發明的一個實施方案是編碼蛋白質構建體的核酸分子,所述蛋白質構建體包含選自下組的序列:SEQ ID NO:107,SEQ ID NO:110,SEQ ID NO:113,SEQ ID NO:116,SEQ ID NO:119,SEQ ID NO:122,SEQ ID NO:125,SEQ ID NO:128,SEQ ID NO:131,SEQ ID NO:161,SEQ ID NO:167,SEQ ID NO:173,SEQ ID NO:179,SEQ ID NO:185,SEQ ID NO:191,SEQ ID NO:200,SEQ ID NO:206,SEQ ID NO:212,SEQ ID NO:215,SEQ ID NO:220,SEQ ID NO:223,SEQ ID NO:225,SEQ ID NO:227,SEQ ID NO:229,SEQ ID NO:231,SEQ ID NO:233,SEQ ID NO:238,SEQ ID NO:241,SEQ ID NO:243,SEQ ID NO:245,SEQ ID NO:247,SEQ ID NO:249,SEQ ID NO:251,SEQ ID NO:253,SEQ ID NO:255,SEQQ ID NO:257,SEQ ID NO:259,SEQ ID NO:264,SEQ ID NO:271,SEQ ID NO:278,SEQ ID NO:285,SEQ ID NO:292,SEQ ID NO:299,SEQ ID NO:306,SEQ ID NO:313,SEQ ID NO:320,SEQ ID NO:327,SEQ ID NO:334,SEQ ID NO:341,SEQ ID NO:348,SEQ ID NO:355,SEQ ID NO:362,SEQ ID NO:369,SEQ ID NO:376,SEQ ID NO:383,SEQ ID NO:390和SEQ ID NO:397。

本發明的一個實施方案是包含核酸序列的核酸分子,所述核酸序列與選自下組的序列至少80%,至少85%,至少90%,至少92%,至少94%,至少96%,至少98%或至少99%相同:SEQ ID NO:106,SEQ ID NO:109,SEQ ID NO:112,SEQ ID NO:115,SEQ ID NO:118,SEQ ID NO:121,SEQ ID NO:124,SEQ ID NO:127,SEQ ID NO:130,SEQ ID NO:160,SEQ ID NO:166,SEQ ID NO:172,SEQ ID NO:178,SEQ ID NO:184,SEQ ID NO:190,SEQ ID NO:199,SEQ ID NO:205,SEQ ID NO:211,SEQ ID NO:219,SEQ ID NO:237,SEQ ID NO:263,SEQ ID NO:270,SEQ ID NO:277,SEQ ID NO:284,SEQ ID NO:291,SEQ ID NO:298,SEQ ID NO:305,SEQ ID NO:312,SEQ ID NO:319,SEQ ID NO:326,SEQ ID NO:333,SEQ ID NO:340,SEQ ID NO:347,SEQ ID NO:354,SEQ ID NO:361,SEQ ID NO:368,SEQ ID NO:375,SEQ ID NO:382,SEQ ID NO:389和SEQ ID NO:396。本發明的一個實施方案是包含選自下組的核酸序列的核酸分子:SEQ ID NO:106,SEQ ID NO:109,SEQ ID NO:112,SEQ ID NO:115,SEQ ID NO:118,SEQ ID NO:121,SEQ ID NO:124,SEQ ID NO:127,SEQ ID NO:130,SEQ ID NO:160,SEQ ID NO:166,SEQ ID NO:172,SEQ ID NO:178,SEQ ID NO:184,SEQ ID NO:190,SEQ ID NO:199,SEQ ID NO:205,SEQ ID NO:211,SEQ ID NO:219,SEQ ID NO:237,SEQ ID NO:263,SEQ ID NO:270,SEQ ID NO:277,SEQ ID NO:284,SEQ ID NO:291,SEQ ID NO:298,SEQ ID NO:305,SEQ ID NO:312,SEQ ID NO:319,SEQ ID NO:326,SEQ ID NO:333,SEQ ID NO:340,SEQ ID NO:347,SEQ ID NO:354,SEQ ID NO:361,SEQ ID NO:368,SEQ ID NO:375,SEQ ID NO:382,SEQ ID NO:389和SEQ ID NO:396。

本發明還涵蓋用於產生本發明的蛋白質構建體的表達系統。在一個實施方案中,本發明的核酸分子可操作地連接於啟動子。如本文中使用的,操作連接是指當連接的啟動子被激活時,可以表達由連接的核酸分子編碼的蛋白質。用於實施本發明的啟動子是本領域技術人員已知的。本發明的一個實施方案是包含核酸序列的核酸分子,所述核酸序列與選自下組的序列至少85%,至少90%,至少95%或至少97%相同:SEQ ID NO:266,SEQ ID NO:273,SEQ ID NO:SEQ ID NO:280,SEQ ID NO:287,SEQ ID NO:294,SEQ ID NO:301,SEQ ID NO:308,SEQ ID NO:315,SEQ ID NO:322,SEQ ID NO:329,SEQ ID NO:336,SEQ ID NO:343,SEQ ID NO:350,SEQ ID NO:357,SEQ ID NO:364,SEQ ID NO:371,SEQ ID NO:378,SEQ ID NO:385SEQ ID NO:392和SEQ ID NO:399。本發明的一個實施方案是包含選自下組的核酸序列的核酸分子:SEQ ID NO:266,SEQ ID NO:273,SEQ ID NO:SEQ ID NO:280,SEQ ID NO:287,SEQ ID NO:294,SEQ ID NO:301,SEQ ID NO:308,SEQ ID NO:315,SEQ ID NO:322,SEQ ID NO:329,SEQ ID NO:336,SEQ ID NO:343,SEQ ID NO:350,SEQ ID NO:357,SEQ ID NO:364,SEQ ID NO:371,SEQ ID NO:378,SEQ ID NO:385SEQ ID NO:392和SEQ ID NO:399。

本發明的一個實施方案是包含本發明的核酸分子的重組細胞。本發明的一個實施方案是包含本發明的核酸分子的重組病毒。

如上指示,本發明的蛋白質構建體的重組生產可以使用本領域目前已知的任何合適的常規重組技術來完成。例如,可以如下在大腸桿菌(E.coli)中進行編碼融合蛋白的核酸分子的產生,即使用編碼合適的單體亞基蛋白(如幽門螺桿菌鐵蛋白單體亞基)的核酸分子,並且將其融合到編碼本文公開的合適的流感蛋白的核酸分子。然後,可以將構建體轉化成蛋白質表達細胞,培養至合適的大小,並誘導產生融合蛋白。

如已經描述的,因為本發明的蛋白質構建體包含單體亞基蛋白質,所以它們可以自組裝。根據本發明,由此類自組裝產生的超分子被稱為HA表達性、基於單體亞基的納米顆粒。為了便於討論,將HA表達性、基於單體亞基的納米顆粒簡稱為納米顆粒(np)。本發明的納米顆粒具有與製備它們的單體蛋白質的納米顆粒相似的結構特徵。例如,關於鐵蛋白,基於鐵蛋白的納米顆粒含有24個亞基並且具有432對稱性。在本發明的納米顆粒的情況下,亞基是包含與流感HA蛋白連接的單體亞基(例如,鐵蛋白,2,4-二氧四氫蝶啶合酶等)的蛋白質構建體。此類納米顆粒在其表面上以HA三聚體展示HA蛋白的至少一部分。在此類構建中,HA三聚體對於免疫系統是可及的,並且因此可以引發免疫應答。因此,本發明的一個實施方案是包含本發明的蛋白構建體的納米顆粒,其中所述蛋白構建體包含來自與單體亞基蛋白連接的HA蛋白的莖區的胺基酸。在一個實施方案中,納米顆粒在其表面上以HA三聚體展示HA蛋白。在一個實施方案中,流感HA蛋白能夠引發針對流感病毒的保護性抗體。

在本發明的一個實施方案中,納米顆粒包含蛋白質構建體,其包含來自流感病毒HA蛋白的莖區的第一胺基酸序列和來自流感病毒HA蛋白的莖區的第二胺基酸序列,所述第一和第二胺基酸序列通過接頭序列共價連接,

其中所述第一胺基酸序列包含來自頭部區序列的氨基端末端上遊的胺基酸序列的至少20個連續胺基酸殘基;

其中所述第二胺基酸序列包含來自所述頭部區序列的羧基端末端下遊的胺基酸序列的至少20個連續胺基酸殘基;且

其中所述第一或第二胺基酸序列與單體亞基結構域的至少一部分連接。

在本發明的一個實施方案中,納米顆粒包含蛋白質構建體,其包含來自流感病毒HA蛋白的莖區的第一胺基酸序列和來自流感病毒HA蛋白的莖區的第二胺基酸序列,所述第一和第二胺基酸序列通過接頭序列共價連接,

其中所述第一胺基酸序列包含來自頭部區序列的氨基端末端上遊的胺基酸序列的至少20個連續胺基酸殘基;

其中所述第二胺基酸序列包含與頭部區序列的羧基端末端下遊的胺基酸序列的至少100個連續胺基酸殘基至少85%,至少90%或至少95%相同的多肽序列,

其中所述多肽序列包含與由SEQ ID NO:150代表的流感A新喀裡多尼亞/20/1999(H1)中的序列,由SEQ ID NO:150代表的流感A加利福尼亞/2009中的序列,由SEQ ID NO:154代表的流感A新加坡/1957(H2)中的序列和由SEQ ID NO:156代表的流感A印度尼西亞/2005H5中的序列對應的序列;和

其中所述第一或第二胺基酸序列與單體亞基蛋白連接。

在另一個實施方案中,多肽序列中對應於SEQ ID NO:150的K1的胺基酸殘基已被除賴氨酸以外的胺基酸取代,並且對應於SEQ ID NO:150的E20的胺基酸殘基已經被除穀氨酸以外的胺基酸取代。

在一個實施方案中,在構成納米顆粒的蛋白質構建體的單體亞基部分和/或第一和/或第二胺基酸序列中進行了另外的突變。引入突變的鐵蛋白蛋白質中有用位置的實例包括對應於選自下組的胺基酸位置的胺基酸:SEQ ID NO:2的胺基酸位置18,胺基酸位置20和胺基酸位置68。在一個實施方案中,蛋白質構建體包含在對應於選自下組的胺基酸位置的胺基酸位置處的突變:流感A新喀裡多尼亞/20/1999(H1)的HA蛋白(SEQ ID NO:8)的胺基酸位置36,胺基酸位置45,胺基酸位置47,胺基酸位置49,胺基酸位置339,胺基酸位置340,胺基酸位置341,胺基酸位置342,胺基酸位置361,胺基酸位置372,胺基酸位置394,胺基酸位置402,胺基酸位置437,胺基酸位置438,胺基酸位置445,胺基酸位置446,胺基酸位置448,胺基酸449,胺基酸位置450和胺基酸位置452。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置36的位置包含異亮氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置45的位置處包含天冬醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置47的位置包含蘇氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置49的位置處包含色氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置339的位置處包含穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置340的位置處包含精氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置341的位置包含穀氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置342的位置包含蘇氨酸或與其具有相似性質的胺基酸殘基(H1)。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置372的位置處包含蘇氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置394的位置包含甲硫氨酸,異亮氨酸,亮氨酸,穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置402的位置處包含天冬醯胺,蘇氨酸,甘氨酸,天冬醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置437的位置包含天冬氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置438的位置包含亮氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置445的位置包含亮氨酸,甲硫氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置446的位置包含異亮氨酸,亮氨酸,甲硫氨酸,穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置448的位置處包含穀氨醯胺或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置449的位置包含色氨酸,苯丙氨酸或具有與其相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置450的位置處包含丙氨酸或與其具有相似性質的胺基酸殘基。在一個實施方案中,蛋白質構建體的HA部分在對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸位置452的位置處包含亮氨酸或與其具有相似性質的胺基酸殘基(H1)。在一個實施方案中,蛋白質構建體的HA部分缺少對應於流感A新喀裡多尼亞/20/1999(H1)的HA蛋白的胺基酸515-517的一個或多個胺基酸。

在一個實施方案中,本發明的納米顆粒包含單體亞基蛋白,其包含來自2,4-二氧四氫蝶啶合酶的至少50個胺基酸,至少100個胺基酸或至少150個胺基酸。在一個實施方案中,單體亞基蛋白包含來自選自SEQ ID NO:194的胺基酸序列的至少50個胺基酸,至少100個胺基酸或至少150個胺基酸,和/或包含與SEQ ID NO:194至少85%,至少90%,至少95%,至少97%,至少99%相同的胺基酸序列。在一個實施方案中,單體亞基包含SEQ ID NO:194。

在一個實施方案中,單體亞基蛋白包含來自鐵蛋白蛋白的至少50個胺基酸,至少100個胺基酸或至少150個胺基酸。在一個實施方案中,單體亞基蛋白包含來自選自SEQ ID NO:2和SEQ ID NO:5的胺基酸序列的至少50個胺基酸,至少100個胺基酸或至少150個胺基酸,和或包含與選自SEQ ID NO:2和SEQ ID NO:5的胺基酸序列至少85%,至少90%,至少95%,至少97%,至少99%相同的胺基酸序列。在一個實施方案中,單體鐵蛋白亞基包含SEQ ID NO:2或SEQ ID NO:5。

在一個實施方案中,納米顆粒包含蛋白質構建體,其包含與來自病毒的HA蛋白的至少一個免疫原性部分連接的本發明的單體蛋白質,所述病毒選自A型流感病毒,B型流感病毒和C型流感病毒。在一個實施方案中,蛋白質構建體包含與選自下組的HA蛋白的至少一個免疫原性部分連接的本發明的單體蛋白:H1流感病毒HA蛋白,H2流感病毒HA蛋白,H3流感病毒HA蛋白,H4流感病毒HA蛋白,H5流感病毒HA蛋白,H6流感病毒HA蛋白,H7流感病毒HA蛋白,H8流感病毒HA蛋白,H9流感病毒HA蛋白,H10流感病毒HA蛋白,H11流感病毒HA蛋白,H12流感病毒HA蛋白,H13流感病毒HA蛋白,H14流感病毒HA蛋白,H15流感病毒HA蛋白,H16流感病毒HA蛋白,H17流感病毒HA蛋白,和H18流感病毒HA蛋白。在一個實施方案中,免疫原性部分包含至少一個表位。

在一個實施方案中,納米顆粒包含包含蛋白質構建體,所述蛋白質構建體包含與胺基酸序列連接的本發明的單體蛋白,所述胺基酸序列與選自下組的序列是至少約80%,至少約85%,至少約90%,至少約95%,至少約97%或至少約99%相同的:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400,其中蛋白質構建體能夠選擇性結合抗流感抗體。在一個實施方案中,納米顆粒包含蛋白質構建體,所述蛋白質構建體包含與胺基酸序列連接的本發明的單體蛋白,所述胺基酸序列選自下組:SEQ ID NO:80,SEQ ID NO:83,SEQ ID NO:86,SEQ ID NO:89,SEQ ID NO:92,SEQ ID NO:95,SEQ ID NO:98,SEQ ID NO:101,SEQ ID NO:104,SEQ ID NO:158,SEQ ID NO:164,SEQ ID NO:170,SEQ ID NO:176,SEQ ID NO:182,SEQ ID NO:188,SEQ ID NO:197,SEQ ID NO:203,SEQ ID NO:209,SEQ ID NO:214,SEQ ID NO:217,SEQ ID NO:222,SEQ ID NO:224,SEQ ID NO:226,SEQ ID NO:228,SEQ ID NO:230,SEQ ID NO:232,SEQ ID NO:235,SEQ ID NO:240,SEQ ID NO:242,SEQ ID NO:244,SEQ ID NO:246,SEQ ID NO:248,SEQ ID NO:250,SEQ ID NO:252,SEQ ID NO:254,SEQ ID NO:256,SEQ ID NO:258,SEQ ID NO:261,SEQ ID NO:268,SEQ ID NO:275,SEQ ID NO:282,SEQ ID NO:289,SEQ ID NO:296,SEQ ID NO:303,SEQ ID NO:310,SEQ ID NO:317,SEQ ID NO:324,SEQ ID NO:331,SEQ ID NO:338,SEQ ID NO:345,SEQ ID NO:352,SEQ ID NO:359,SEQ ID NO:366,SEQ ID NO:373,SEQ ID NO:380,SEQ ID NO:387,SEQ ID NO:394和SEQ ID NO:400,其中蛋白質構建體能夠選擇性結合抗流感抗體。

在本發明的一個實施方案中,納米顆粒包含蛋白質構建體,所述蛋白質構建體包含與選自下組的序列至少80%,至少約85%,至少約90%,至少約95%,至少約97%或至少約99%相同的胺基酸序列:SEQ ID NO:107,SEQ ID NO:110,SEQ ID NO:113,SEQ ID NO:116,SEQ ID NO:119,SEQ ID NO:122,SEQ ID NO:125,SEQ ID NO:128,SEQ ID NO:131,SEQ ID NO:161,SEQ ID NO:167,SEQ ID NO:173,SEQ ID NO:179,SEQ ID NO:185,SEQ ID NO:191,SEQ ID NO:200,SEQ ID NO:206,SEQ ID NO:212,SEQ ID NO:215,SEQ ID NO:220,SEQ ID NO:223,SEQ ID NO:225,SEQ ID NO:227,SEQ ID NO:229,SEQ ID NO:231,SEQ ID NO:233,SEQ ID NO:238,SEQ ID NO:241,SEQ ID NO:243,SEQ ID NO:245,SEQ ID NO:247,SEQ ID NO:249,SEQ ID NO:251,SEQ ID NO:253,SEQ ID NO:255,SEQQ ID NO:257,SEQ ID NO:259,SEQ ID NO:264,SEQ ID NO:271,SEQ ID NO:278,SEQ ID NO:285,SEQ ID NO:292,SEQ ID NO:299,SEQ ID NO:306,SEQ ID NO:313,SEQ ID NO:320,SEQ ID NO:327,SEQ ID NO:334,SEQ ID NO:341,SEQ ID NO:348,SEQ ID NO:355,SEQ ID NO:362,SEQ ID NO:369,SEQ ID NO:376,SEQ ID NO:383,SEQ ID NO:390和SEQ ID NO:397,其中蛋白質構建體能夠選擇性結合抗流感抗體。在本發明的一個實施方案中,納米顆粒包含蛋白質構建體,所述蛋白質構建體包含選自下組的胺基酸序列:SEQ ID NO:107,SEQ ID NO:110,SEQ ID NO:113,SEQ ID NO:116,SEQ ID NO:119,SEQ ID NO:122,SEQ ID NO:125,SEQ ID NO:128,SEQ ID NO:131,SEQ ID NO:161,SEQ ID NO:167,SEQ ID NO:173,SEQ ID NO:179,SEQ ID NO:185,SEQ ID NO:191,SEQ ID NO:200,SEQ ID NO:206,SEQ ID NO:212,SEQ ID NO:215,SEQ ID NO:220,SEQ ID NO:223,SEQ ID NO:225,SEQ ID NO:227,SEQ ID NO:229,SEQ ID NO:231,SEQ ID NO:233,SEQ ID NO:238,SEQ ID NO:241,SEQ ID NO:243,SEQ ID NO:245,SEQ ID NO:247,SEQ ID NO:249,SEQ ID NO:251,SEQ ID NO:253,SEQ ID NO:255,SEQQ ID NO:257,SEQ ID NO:259,SEQ ID NO:264,SEQ ID NO:271,SEQ ID NO:278,SEQ ID NO:285,SEQ ID NO:292,SEQ ID NO:299,SEQ ID NO:306,SEQ ID NO:313,SEQ ID NO:320,SEQ ID NO:327,SEQ ID NO:334,SEQ ID NO:341,SEQ ID NO:348,SEQ ID NO:355,SEQ ID NO:362,SEQ ID NO:369,SEQ ID NO:376,SEQ ID NO:383,SEQ ID NO:390和SEQ ID NO:397。

在一個實施方案中,本發明的納米顆粒包含由核酸分子編碼的蛋白質構建體,所述核酸分子包含與選自下組的序列至少85%,至少90%,至少95%or至少97%相同的核酸序列:SEQ ID NO:266,SEQ ID NO:273,SEQ ID NO:SEQ ID NO:280,SEQ ID NO:287,SEQ ID NO:294,SEQ ID NO:301,SEQ ID NO:308,SEQ ID NO:315,SEQ ID NO:322,SEQ ID NO:329,SEQ ID NO:336,SEQ ID NO:343,SEQ ID NO:350,SEQ ID NO:357,SEQ ID NO:364,SEQ ID NO:371,SEQ ID NO:378,SEQ ID NO:385SEQ ID NO:392和SEQ ID NO:399。在一個實施方案中,本發明的納米顆粒包含由核酸分子編碼的蛋白質構建體,所述核酸分子包含選自下組的核酸序列:SEQ ID NO:266,SEQ ID NO:273,SEQ ID NO:SEQ ID NO:280,SEQ ID NO:287,SEQ ID NO:294,SEQ ID NO:301,SEQ ID NO:308,SEQ ID NO:315,SEQ ID NO:322,SEQ ID NO:329,SEQ ID NO:336,SEQ ID NO:343,SEQ ID NO:350,SEQ ID NO:357,SEQ ID NO:364,SEQ ID NO:371,SEQ ID NO:378,SEQ ID NO:385SEQ ID NO:392和SEQ ID NO:399。

本發明的納米顆粒可用於引發對流感病毒的免疫應答。一類免疫應答是B細胞應答,其導致產生針對引發免疫應答的抗原的抗體。因此,在一個實施方案中,納米顆粒引發結合來自選自A型流感病毒,B型流感病毒和C型流感病毒的病毒的流感HA蛋白的莖區的抗體。本發明的一個實施方案是納米顆粒,其引發結合流感HA蛋白的莖區的抗體,所述流感HA蛋白選自H1流感病毒HA蛋白,H2流感病毒HA蛋白,H3流感病毒HA蛋白,H4流感病毒HA蛋白,H5流感病毒HA蛋白,H6流感病毒HA蛋白,H7流感病毒HA蛋白,H8流感病毒HA蛋白,H9流感病毒HA蛋白,H10流感病毒HA蛋白HA蛋白,H11流感病毒HA蛋白,H12流感病毒HA蛋白,H13流感病毒HA蛋白,H14流感病毒HA蛋白,H15流感病毒HA蛋白,H16流感病毒HA蛋白,H17流感病毒HA蛋白,和H18流感病毒HA蛋白。本發明的一個實施方案是納米顆粒,其引發結合來自病毒株的流感HA蛋白的莖區的抗體,所述病毒株選自流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)及其變體。

儘管所有抗體能夠結合引發導致抗體產生的免疫應答的抗原,但優選的抗體是那些提供針對流感病毒的廣泛的異亞型保護的抗體。因此,本發明的一個實施方案是引發保護性抗體的納米顆粒,所述保護性抗體結合來自選自A型流感病毒,B型流感病毒和C型流感病毒的病毒的流感HA蛋白的莖區。本發明的一個實施方案是引發與流感HA蛋白的莖區結合的保護性抗體的蛋白質,所述流感HA蛋白選自H1流感病毒HA蛋白,H2流感病毒HA蛋白,H3流感病毒HA蛋白,H4流感病毒HA蛋白,H5流感病毒HA蛋白,H6流感病毒HA蛋白,H7流感病毒HA蛋白,H8流感病毒HA蛋白,H9流感病毒HA蛋白,H10流感病毒HA蛋白HA蛋白,H11流感病毒HA蛋白,H12流感病毒HA蛋白,H13流感病毒HA蛋白,H14流感病毒HA蛋白,H15流感病毒HA蛋白,H16流感病毒HA蛋白,H17流感病毒HA蛋白,和H18流感病毒HA蛋白。本發明的一個實施方案是引發針對選自下組的病毒的抗體的納米顆粒:流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1)and B/布裡斯班/60/2008(2008Bris,B)。本發明的一個實施方案是引發結合蛋白質的抗體的納米顆粒,所述蛋白質包含與選自下組的序列至少80%相同的胺基酸序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。本發明的一個實施方案是引發結合蛋白質的抗體的納米顆粒,所述蛋白質包含選自SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17的胺基酸序列。

由本發明的蛋白質引發的保護性抗體可通過影響病毒生命周期中的任何步驟來提供保護免受病毒感染。例如,保護性抗體可以防止流感病毒附著於細胞,進入細胞,將病毒核糖核蛋白釋放到細胞質中,在受感染的細胞中形成新的病毒顆粒並從受感染的宿主細胞膜出芽新的病毒顆粒。在一個實施方案中,由本發明的蛋白質引發的保護性抗體防止流感病毒進入宿主細胞。在一個實施方案中,由本發明的蛋白質引發的保護性抗體防止病毒膜與內體膜的融合。在一個實施方案中,由本發明的蛋白質引發的保護性抗體防止核糖核蛋白釋放到宿主細胞的細胞質中。在一個實施方案中,由本發明的蛋白質引發的保護性抗體防止新病毒在感染的宿主細胞中的裝配。在一個實施方案中,由本發明的蛋白質引發的保護性抗體防止新形成的病毒從感染的宿主細胞釋放。

因為流感病毒的莖區的胺基酸序列是高度保守的,所以由本發明的納米顆粒引發的保護性抗體可以是廣泛保護性的。也就是說,本發明的納米顆粒引發的保護性抗體可以針對多於一種類型,亞型和/或毒株的流感病毒提供保護。因此,本發明的一個實施方案是引發結合流感HA蛋白莖區的廣泛保護性抗體的蛋白質。一個實施方案是引發結合來自多於一種類型的流感病毒的HA蛋白的莖區的抗體的納米顆粒,所述流感病毒選自A型流感病毒,B型流感病毒和C型流感病毒。一個實施方案是引發結合來自多於一種亞型流感病毒的HA蛋白的莖區的抗體的納米顆粒,所述流感病毒選自H1流感病毒,H2流感病毒,H3流感病毒,H4流感病毒,H5流感病毒,H6流感病毒,H7流感病毒,H8流感病毒,H9流感病毒,H10流感病毒,H11流感病毒,H12流感病毒,H13流感病毒,H14流感病毒,H15流感病毒,H16流感病毒,H17流感病毒和H18流感病毒。一個實施方案是引發結合來自超過流感病毒株的HA蛋白的莖區的抗體的納米顆粒。本發明的一個實施方案是引發結合超過一種蛋白質的抗體的納米顆粒,所述蛋白質包含與選自下組的序列至少80%相同的胺基酸序列:SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17。本發明的一個實施方案是引發結合多於一種蛋白質的抗體的納米顆粒,所述蛋白質包含選自SEQ ID NO:8,SEQ ID NO:11,SEQ ID NO:14和SEQ ID NO:17的胺基酸序列。

因為本發明的納米顆粒可以引發對流感病毒的免疫應答,所以它們可用作保護個體免受流感病毒感染的疫苗。因此,本發明的一個實施方案是包含本發明的納米顆粒的疫苗。本發明的疫苗還可以含有其它成分,如佐劑,緩衝液等。儘管可以使用任何佐劑,但優選的實施方案可以含有:化學佐劑,如磷酸鋁,benzyalkonium chloride,烏苯美司(ubenimex)和QS21;遺傳佐劑如IL-2基因或其片段,粒細胞巨噬細胞集落刺激因子(GM-CSF)基因或其片段,IL-18基因或其片段,趨化因子(CC基序)配體21(CCL21)基因或其片段,IL-6基因或其片段,CpG,LPS,TLR激動劑和其它免疫刺激基因;蛋白質佐劑如IL-2或其片段,粒細胞巨噬細胞集落刺激因子(GM-CSF)或其片段,IL-18或其片段,趨化因子(CC基序)配體21(CCL21)或其片段,IL-6或其片段,CpG,LPS,TLR激動劑和其它免疫刺激性細胞因子或其片段;脂質佐劑如陽離子脂質體,N3(陽離子脂質),單磷醯脂質A(MPL1);其它佐劑,包括霍亂毒素,腸毒素,Fms樣酪氨酸激酶-3配體(Flt-3L),布比卡因(bupivacaine),丁哌卡因(marcaine)和左旋咪唑。

本發明的一個實施方案是包含多於一種流感HA蛋白的納米顆粒疫苗。此類疫苗可以包括在單個納米顆粒上或作為納米顆粒混合物的不同流感HA蛋白的組合,其中至少兩種具有獨特的流感HA蛋白。多價疫苗可包含與必要一樣多的流感HA蛋白,以便導致提供保護免於期望的病毒毒株寬度必需的免疫應答的產生。在一個實施方案中,疫苗包含來自至少兩種不同流感株(二價)的HA蛋白。在一個實施方案中,疫苗包含來自至少三種不同流感株(三價)的HA蛋白。在一個實施方案中,疫苗包含來自至少四種不同流感株(四價)的HA蛋白。在一個實施方案中,疫苗包含來自至少五種不同流感株(五價)的HA蛋白。在一個實施方案中,疫苗包含來自至少六種不同流感病毒株(六價)的HA蛋白。在各種實施方案中,疫苗包含來自7、8、9或10種不同流感病毒株之每種的HA蛋白。此類組合的實例是包含流感A組1HA蛋白,流感A組2HA蛋白,和流感B HA蛋白的納米顆粒疫苗。在一個實施方案中,流感HA蛋白是H1HA,H3HA和B HA。在一個實施方案中,流感HA蛋白是包括在2011-2012流感疫苗中的那些。多價疫苗的另一個實例是包含來自四種不同流感病毒的HA蛋白的納米顆粒疫苗。在一個實施方案中,多價疫苗包含來自流感A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1)和B/布裡斯班/60/2008(2008Bris,B)的HA蛋白。

本發明的一個實施方案是針對流感病毒對個體接種疫苗的方法,所述方法包括向個體施用納米顆粒,使得在個體中產生針對流感病毒的免疫應答,其中所述納米顆粒包含連接到流感HA蛋白的單體亞基蛋白,並且其中所述納米顆粒在其表面上展示所述流感HA。在一個實施方案中,納米顆粒是單價納米顆粒。在一個實施方案中,納米顆粒是多價納米顆粒。本發明的另一個實施方案是針對流感病毒感染對個體接種疫苗的方法,所述方法包括:

a)獲得包含單體亞基的納米顆粒,其中所述單體亞基與流感血凝素蛋白連接,並且其中所述納米顆粒在其表面上展示流感HA;並且,

b)將納米顆粒施用於個體,使得產生針對流感病毒的免疫應答。

本發明的一個實施方案是針對流感病毒對個體接種疫苗的方法,所述方法包括向個體施用實施方案的疫苗,使得在個體中產生針對流感病毒的免疫應答,其中所述疫苗包含至少一種納米顆粒,其包含與流感HA蛋白連接的單體亞基,並且其中所述納米顆粒在其表面上展示流感HA。在一個實施方案中,疫苗是單價疫苗。在一個實施方案中,疫苗是多價疫苗。本發明的另一個實施方案是針對流感病毒感染對個體接種疫苗的方法,所述方法包括:

a)獲得包含至少一種包含本發明的蛋白質構建體的納米顆粒的疫苗,其中所述蛋白質構建體包含與流感HA蛋白連接的單體亞基蛋白,並且其中所述納米顆粒在其表面上展示流感HA;並且,

b)將所述疫苗施用於個體,使得產生針對流感病毒的免疫應答。

在一個實施方案中,納米顆粒是單價納米顆粒。在一個實施方案中,納米顆粒是多價納米顆粒。

在一個實施方案中,納米顆粒具有八面體對稱。在一個實施方案中,流感HA蛋白能夠引發針對流感病毒的抗體。在一個實施方案中,流感HA蛋白能夠廣泛引發針對流感病毒的抗體。在優選的實施方案中,引發的抗體是保護性抗體。在優選的實施方案中,引發的抗體是廣泛異亞型保護性的。

本發明的疫苗可用於使用初免/加強方案對個體接種疫苗。此類方案在美國專利公開號20110177122中描述,其通過引用整體併入本文。在此類方案中,可以向個體施用第一疫苗組合物(初次),然後在一段時間後,可以向個體施用第二疫苗組合物(加強)。施用加強組合物通常是在施用引發組合物後數周或數月,優選約2-3周或4周,或8周,或16周,或20周,或24周,或28周,或32周。在一個實施方案中,配製加強組合物,用於在施用引發組合物後約1周,或2周,或3周,或4周,或5周,或6周,或7周,或8周,或9周,或16周,或20周,或24周,或28周,或32周施用。

第一和第二疫苗組合物可以是,但不需要是相同的組合物。因此,在本發明的一個實施方案中,施用疫苗的步驟包括施用第一疫苗組合物,然後在稍後時間施用第二疫苗組合物。在一個實施方案中,第一疫苗組合物包含本發明的納米顆粒。在一個實施方案中,第一疫苗組合物包含納米顆粒,其包含來自流感病毒的HA蛋白的胺基酸序列,所述流感病毒選自A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005Indo,H5),B/佛羅裡達/4/2006(2006Flo,B),A/珀斯/16/2009(2009Per,H3),A/布裡斯班/59/2007(2007Bris,H1),B/布裡斯班/60/2008(2008Bris,B)。

在一個實施方案中,接種疫苗的個體已暴露於流感病毒。如本文所使用的,術語暴露的,暴露等指示受試者已經與已知感染流感病毒的動物對象接觸。可以使用本領域技術人員熟知的技術來施用本發明的疫苗。用於配製和施用的技術可以在例如「Remington’s Pharmaceutical Sciences」,18th ed.,1990,Mack Publishing Co.,Easton,PA中找到。疫苗可通過包括但不限於傳統注射器,無針注射裝置或微粒轟擊基因槍的手段施用。合適的施用途徑包括但不限於腸胃外遞送,如肌內,皮內,皮下,髓內注射以及鞘內,直接心室內,靜脈內,腹膜內,鼻內或眼內注射,僅舉幾個例子。對於注射,本發明的一個實施方案的化合物可以配製在水溶液中,優選在生理上相容的緩衝液如Hanks溶液,林格氏溶液或生理鹽水緩衝液中配製。

在一個實施方案中,本發明的疫苗或納米顆粒可用於保護個體免受異源流感病毒的感染。也就是說,使用來自流感病毒的一種毒株的HA蛋白製備的疫苗能夠保護個體免受不同流感病毒株的感染。例如,使用來自流感A/新喀裡多尼亞/20/1999(1999NC,H1)的HA蛋白製備的疫苗可以用於保護個體免受流感病毒感染,所述流感病毒包括但不限於A/新喀裡多尼亞/20/1999(1999NC,H1),A/加利福尼亞/04/2009(2009CA,H1),A/新加坡/1/1957(1957Sing,H2),A/香港/1/1968(1968HK,H3),A/布裡斯班/10/2007(2007Bris,H3),A/印度尼西亞/05/2005(2005indo,H5),A/珀斯/16/2009(2009Per,H3),和/或A/布裡斯班/59/2007(2007Bris,H1)。

在一個實施方案中,本發明的疫苗或納米顆粒可用於保護個體免於抗原性趨異的流感病毒的感染。抗原性趨異的是指流感病毒株隨時間突變的趨勢,從而改變展示給免疫系統的胺基酸。此類隨時間的突變也稱為抗原漂移。因此,例如,使用來自A/新喀裡多尼亞/20/1999(1999NC,H1)流感病毒株的HA蛋白製備的疫苗能夠保護個體免受早期的,抗原性趨異的新喀裡多尼亞流感毒株的感染,和未來的進化(或趨異)流感毒株。

因為本發明的納米顆粒展示與完整HA在抗原性上相似的HA蛋白,所以它們可用於檢測針對流感病毒的抗體(抗流感抗體)的測定法中。

因此,本發明的一個實施方案是使用本發明的納米顆粒檢測抗流感病毒抗體的方法。本發明的檢測方法通常可以通過以下步驟實現:

a.使測試抗流感抗體的存在的樣品的至少部分與本發明的納米顆粒接觸;並且,

b.檢測納米顆粒/抗體複合物的存在;

其中納米顆粒/抗體複合物的存在指示樣品含有抗流感抗體。

在本發明的一個實施方案中,從待測試抗流感病毒抗體的存在的個體獲得或收集樣品。個體可以是或不是懷疑具有抗流感抗體或已經暴露於流感病毒的。樣品是從個體獲得的任何樣本,其可用於測試抗流感病毒抗體的存在。優選的樣品是可用於檢測抗流感病毒抗體的存在的體液。可用於實施本發明方法的體液的實例包括但不限於血液,血漿,血清,淚液和唾液。本領域技術人員可以容易地鑑定適於實施所公開的方法的樣品。

血液或血液衍生的液體如血漿,血清等特別適合作為樣品。可以使用本領域已知的方法從個體收集和製備此類樣品。樣品可以在測定前冷藏或冷凍。

本發明的任何納米顆粒可用於實施所公開的方法,只要納米顆粒結合抗流感病毒抗體。有用的納米顆粒及其製備方法已在本文中詳細描述。在優選的實施方案中,納米顆粒包含蛋白質構建體,其中蛋白質構建體包含連接到(融合到)來自流感HA蛋白的至少一個表位的來自單體亞基蛋白的至少25個,至少50個,至少75個,至少100個或至少150個連續胺基酸,使得納米顆粒在其表面上包含流感病毒HA蛋白表位的三聚體,並且其中蛋白質構建體能夠自組裝成納米顆粒。

如本文中使用的,術語接觸是指將測試抗流感抗體存在的樣品引入本發明的納米顆粒,例如通過組合或混合樣品和本發明的納米顆粒,使得納米顆粒能夠與樣品中的抗體(如果存在的話)物理接觸。當抗流感病毒抗體存在於樣品中時,然後形成抗體/納米顆粒複合物。此類複合物形成是指抗流感病毒抗體選擇性結合納米顆粒中蛋白質構建體的HA部分以形成可檢測的穩定複合物的能力。樣品中抗流感病毒抗體與納米顆粒的結合在適合形成複合物的條件下完成。此類條件(例如,適當的濃度,緩衝液,溫度,反應時間)以及優化此類條件的方法是本領域技術人員已知的。結合可以使用本領域標準的多種方法測量,包括但不限於凝集測定法,沉澱測定法,酶免疫測定法(例如ELISA),免疫沉澱測定法,免疫印跡測定法和其它免疫測定法,如例如記載於Sambrook et al.,Molecular Cloning:A Laboratory Manual,(Cold Spring Harbor Labs Press,1989)和Harlow et al.,Antibodies,a Laboratory Manual(Cold Spring Harbor Labs Press,1988),兩者均通過引用整體併入本文。這些參考文獻還提供了複合物形成條件的實例。

如本文所使用的,短語選擇性地結合HA,選擇性結合HA等,是指與結合與HA無關的蛋白質,或樣品或測定法中的非蛋白質組分形成對比,抗體優先結合HA蛋白的能力。選擇性結合HA的抗體是結合HA但不顯著結合可能存在於樣品或測定法中的其它分子或組分的抗體。顯著的結合被認為是例如抗HA抗體與非HA分子的結合,以大到足以幹擾測定法檢測和/或測定樣品中的抗流感抗體的水平的能力的親和力或親合力。可存在於樣品或測定法中的其它分子和化合物的實例包括但不限於非HA蛋白,例如白蛋白,脂質和碳水化合物。

在一個實施方案中,可以在溶液中形成抗流感病毒抗體/納米顆粒複合物(本文中也稱為抗體/納米顆粒複合物)。在一個實施方案中,可以形成抗體/納米顆粒複合物,其中納米顆粒固定在(例如,塗覆到)基底上。固定化技術是本領域技術人員已知的。合適的基底材料包括但不限於塑料,玻璃,凝膠,賽璐珞(celluloid),織物,紙和顆粒材料。基底材料的實例包括但不限於膠乳,聚苯乙烯,尼龍,硝化纖維素,瓊脂糖,棉,PVDF(聚偏氟乙烯)和磁性樹脂。用於基底材料的合適形狀包括但不限於孔(例如,微量滴定盤孔),微量滴定板,浸漬片,條,珠,側流裝置,膜,過濾器,管,盤,賽璐珞型基質,磁性顆粒和其它顆粒。特別優選的底物包括例如ELISA板,浸漬片,免疫斑點條,放射免疫測定板,瓊脂糖珠,塑料珠,乳膠珠,棉線,塑料晶片,免疫印跡膜,免疫印跡紙和流通膜。在一個實施方案中,基底,如顆粒,可以包括�