新四季網

包含肺炎球菌抗原的組合物的製作方法

2023-10-05 16:11:29

包含肺炎球菌抗原的組合物的製作方法
【專利摘要】本發明涉及包含肺炎鏈球菌抗原組合的免疫原性組合物。有效的肺炎鏈球菌疫苗可能需要若干抗原性組分,因此本發明鑑定了用於免疫的各種肺炎球菌多肽組合。本發明也鑑定了可用作單一抗原的一些肺炎球菌多肽。這些多肽任選與肺炎球菌糖聯用。該抗原可用於肺炎球菌疫苗,但也可用作對多種病原體進行免疫的疫苗的組分。
【專利說明】包含肺炎球菌抗原的組合物
[0001]本發明專利申請是國際申請號為PCT/IB2008/002866,國際申請日為2008年8月I日,進入中國國家階段的申請號為200880108017.1的發明專利申請的分案申請。
【技術領域】
[0002]本發明涉及衍生自肺炎鏈球菌(S.pneumoniae)的抗原及其在免疫接種中的應用。
【背景技術】
[0003]肺炎鏈球菌(Streptococcuspneumoniae)也稱為肺炎球菌,是革蘭陽性球狀細菌。它是成年人和五歲以上兒童的急性細菌性腦膜炎的最常見病因。
[0004]現有的肺炎球菌疫苗均基於莢膜糖。唯一一種兒科疫苗是PREVNAR?,它是來自7種不同血清型的偶聯糖的混合物。也能夠獲得基於23種不同血清型的偶聯糖的混合物的成人疫苗。但這兩類疫苗難以生產,並且總共存在超過90種肺炎球菌血清型。因此,仍然需要鑑定用於肺炎球菌疫苗的其他改良抗原。

【發明內容】

[0005]類似於參考文獻I和2,本
【發明者】認為有效的肺炎鏈球菌疫苗可能需要幾種抗原性組分,因此他們鑑定了用於免疫接種的多種肺炎球菌多肽的組合。他們也鑑定了可用作單一抗原的一些肺炎球菌多肽。任選地,這些多肽可與肺炎球菌糖或其他肺炎球菌多肽聯用。該抗原可用於肺炎球菌疫苗,但也可用作對多種病原體進行免疫的疫苗的組分。
[0006]本
【發明者】已鑑定到以下7種肺炎球菌多肽:spr0057 ;spr0286 ;spr0565 ;sprl098 ;sprl345 ;sprl416 ;sprl418。這組抗原在本文中稱為『第一抗原組』。因此,本發明提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或多種(即 2、3、4、5、6 或所有 7 種)抗原:(1) spr0057 抗原;(2) spr0286 抗原;(3) spr0565 抗原;
(4)sprl098 抗原;(5) sprl345 抗原;(6) sprl416 抗原;和 / 或(7) sprl418 抗原。
[0007]本
【發明者】已鑑定到以下4種肺炎球菌多肽:spr0867 ;sprl431 ;sprl739 ;spr2021o這組抗原在本文中稱為『第二抗原組』。因此,本發明提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或多種(即2、3或所有4種)抗原:(1) spr0867 抗原;(2) sprl431 抗原;(3) sprl739 抗原;和 / 或(4) spr2021 抗原。
[0008]本
【發明者】已鑑定到以下3種肺炎球菌多肽:spr0096 ;sprl433 ;sprl707。這組抗原在本文中稱為『第三抗原組』。因此,本發明提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或三種抗原:(1) spr0096抗原;(2) sprl433抗原;和/或(3) sprl707 抗原。 [0009]第一和第二抗原組中11種肺炎球菌多肽的組合在本文中稱為『第四抗原組』。因此,本發明提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或多種(即 2、3、4、5、6、7、8、9、10 或所有 11 種)抗原:(1) spr0057 抗原;(2) spr0286 抗原;(3) spr0565 抗原;(4) sprl098 抗原;(5) sprl345 抗原;(6) sprl416 抗原;(7) sprl418抗原;(8) spr0867 抗原;(9) sprl431 抗原;(10) sprl739 抗原;和 / 或(11) spr2021 抗原。
[0010]第一和第三抗原組中10種肺炎球菌多肽的組合在本文中稱為『第五抗原組』。因此,本發明提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或多種(即2、3、4、5、6、7、8、9或所有10種)抗原:(I) spr0057抗原;(2) spr0286抗原;
(3)spr0565 抗原;(4) sprl098 抗原;(5) sprl345 抗原;(6) sprl416 抗原;(7) sprl418 抗原;
(8)spr0096 抗原;(9) sprl433 抗原;和 / 或(10) sprl707 抗原。
[0011]第二和第三抗原組中7種肺炎球菌多肽的組合在本文中稱為『第六抗原組』。因此,本發明提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或多種(即2、3、4、5、6或所有7種)抗原:(l)spr0867抗原;(2)sprl431抗原;(3)sprl739 抗原;(4) spr2021 抗原;(5) spr0096 抗原;(6) sprl433 抗原;和 / 或(7) sprl707抗原。
[0012]第一、第二和第三抗原組中14種肺炎球菌多肽的組合在本文中稱為『第七抗原組』。因此,本發明提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或多種(即2、3、4、5、6、7、8、9、10、11、12、13或所有14種)抗原:(I) spr0057抗原;(2) spr0286 抗原;(3) spr0565 抗原;(4) sprl098 抗原;(5) sprl345 抗原;(6) sprl416抗原;(7) sprl418 抗原;(8) spr0867 抗原;(9) sprl431 抗原;(10) sprl739 抗原;(11)spr2021 抗原;(12)spr0096 抗原;(13) sprl433 抗原;和 / 或(14) sprl707 抗原。
[0013]在第七抗原組內,優選的四種抗原的亞組是『第八抗原組』,其包括來自第一、第二和第三組的抗原,即spr0057、spr0096、spr0565和spr2021。因此,本發明提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或多種(即2、3或所有4 種)抗原:(I) spr0057 抗原;(2) spr0096 抗原;(3) spr0565 抗原;和 / 或(4) spr2021 抗原。在第八組中,組成可包括:(I)、(2)和(3) ;(1)、(2)和(4) ;(1)、(3)和(4);⑵、(3)和(4);或(I)、(2)、(3)和(4)。在血清型不同的32種肺炎球菌菌株上,通過免疫學方法確認這四種抗原的表達。
[0014]『第九抗原組』是第八抗原組加RrgB菌毛抗原。因此,本發明還提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括一種或多種RrgB菌毛抗原和選自下組的兩種或多種(即2、3或所有4種)抗原:(I) spr0057抗原;(2) spr0096抗原;(3) spr0565抗原;和/或⑷spr2021抗原。
[0015]『第十抗原組』是第八抗原組加Pmp多肽。因此,本發明也提供包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括選自下組的兩種或多種(即2、3、4或所有5種)抗原:(I) spr0057 抗原;(2) spr0096 抗原;(3) spr0565 抗原;(4) spr2021 抗原;和 / 或(5)Pmp多肽。
[0016]感興趣的特定組合包括:(i) spr0057抗原和spr0096抗原;(ii)spr0057抗原和 spr2021 抗原;(iii) spr0057 抗原、spr0096 抗原和 spr2021 抗原;(iv) spr0057 抗原和 spr0565 抗原;(v) spr0565 抗原和 spr2021 抗原;(vi) spr0057 抗原、spr0565 抗原和spr2021抗原;(vii) spr0565抗原、spr2021抗原和sprl739抗原,如脫毒抗原;以及(viii)spr0565抗原、spr2021抗原和Pmp多肽。
[0017]本發明還提供包含兩種或多種不同的肺炎球菌外切糖苷酶的免疫原性組合物。[0018]本發明還提供包含至少一種肺炎球菌外切糖苷酶和至少一種肺炎球菌肽聚糖水解酶的免疫原性組合物。
[0019]本發明還提供包含兩種或多種不同的肽聚糖水解酶的免疫原性組合物。
[0020]本發明的優選組合是兩種或多種抗原協同作用的組合。因此,通過聯合給藥保護免遭肺炎球菌疾病侵擾的效果超過了只加入單獨保護功效的預期效果。
[0021]其他多肽抗原
[0022]除來自本發明各個抗原組的抗原外,免疫原性組合物可包含一種或多種以下多肽,以提高該組合物引發的抗-肺炎球菌免疫應答:
[0023].肺炎球菌菌毛的一個或多個亞基,如RrgA、RrgB和/或RrgC。
[0024].ClpP 多肽。
[0025].LytA 多肽。
[0026].CPLl 多肽。
[0027].PhtA 多肽。
[0028].PhtB 多肽。 [0029].PhtD 多肽。
[0030].PhtE 多肽。
[0031].CbpD 多肽
[0032].CbpG 多肽
[0033].PvaA 多肽。
[0034].Hic 多肽。
[0035].Pmp 多肽。
[0036].ZmpB 多肽。
[0037].PspA 多肽
[0038].PsaA 多肽
[0039].PspC 多肽。
[0040].PrtA 多肽。
[0041].Sp91 多肽。
[0042].Sp 133 多肽。
[0043].PiuA多肽和/或PiaA多肽。
[0044].spr0222 多肽。
[0045].選自下組的抗原:.ICl ;IC2 ;IC3 ;IC4 ;IC5 ;IC6 ;IC7 ;IC8 ;IC9 ;IC10 ;IC11 ;IC12 ;IC13 ;IC14 ;IC15 ;IC16 ;IC17 ;IC18 ;IC19 ;IC20 ;IC21 ;IC22 ;IC23 ;IC24 ;IC25 ;IC26 ;IC27 ;IC28 ;IC29 ;IC30 ;IC31 ;IC32 ;IC33 ;IC34 ;IC35 ;IC36 ;IC37 ;IC38 ;IC39 ;IC40 ;IC41 ;IC42 ;IC43 ;IC44 ;IC45 ;IC46 ;IC47 ;IC48 ;IC49 ;IC50 ;IC51 ;IC52 ;IC53 ;IC54 ;IC55 ;IC56 ;IC57 ;IC58 ;IC59 ;IC60 ;IC61 ;IC62 ;IC63 ;IC64 ;IC65 ;IC66 ;IC67 ;IC68 ;IC69 ;IC70 ;IC71 ;IC72 ;IC73 ;IC74 ;IC75 ;IC76 ;IC77 ;IC78 ;IC79 ;IC80 ;IC81 ;IC82 ;IC83 ;IC84 ;IC85 ;IC86 ;IC88 ;IC89 ;IC90 ;IC91 ;IC92 ;IC93 ;IC94 ;IC95 ;IC96 ;IC97 ;IC98 ;IC99 ;IC100 ;IC101 ;IC102 ;IC103 ;IC104 ;IC105 ;IC106 ;IC107 ;IC108 ;IC109 ;IC110 ;IC111 ;IC112 ;IC113 ;IC114 ;IC115 ;IC116 ;IC117 ;IC118 ;IC119 ;IC120 ;IC121;IC122 ;IC123 ;IC124 ;IC125 ;IC126 ;IC127 ;IC128 ;IC129 ;IC130 ;和 IC131。
[0046].選自下組的抗原:ID-204, ID-212, ID-213, ID-214, ID-215, ID-216, ID-217,ID-219、ID-220、ID-225, ID-301, ID-302, ID-303, ID-304, ID-305, ID-306,如參考文獻 3所述。
[0047].選自下組的抗原:SitlA、SitlB, SitlC, Sit2B、Sit2C、Sit2D、Sit3A、Sit3B、Sit3C、Sit3D、0RF1、0RF2、0RF3、0RF4、0RF5、0RF6、0RF6、0RF7、0RF8、0RF9、0RF10, ORFl1、0RF12、0RF13、0RF14、MS1、MS2、MS3、MS4、MS5、MS6、MS7、MS8、MS9、MSlO 或 MSI I,如參考文獻4所述。
[0048].如參考文獻5所述的抗原。
[0049].參考文獻6的表1-3所述的抗原,如CbiO。 [0050].參考文獻7所述的抗原,如30S核糖體蛋白S8。
[0051]?選自下組的抗原:磷酸烯丙醇丙酮酸蛋白磷酸轉移酶;磷酸甘露糖變位酶;觸發因子(trigger factor);延伸因子G ;四環素抗性蛋白(tetO) ;DNA_指導的RNA聚合酶α-鏈;NADH氧化酶;穀氨醯-tRNA醯胺轉移酶亞基A ;N利用物質蛋白A同源物(Nutilization substance protein A homolog) ;Xaa_His二妝酶;細胞分裂蛋白 ftsz ;鋒金屬蛋白酶;L-乳酸脫氫酶;甘油醛3-磷酸脫氫酶(GAPDH);果糖-磷酸氫鹽醛縮酶;UDP-葡萄糖4-差向異構酶;GTP結合蛋白typA/BipA ;GMP合酶;穀氨醯-tRNA合成酶;NADP_特異性穀氨酸脫氫酶;延伸因子TS ;磷酸甘油酸激酶;吡啶核苷酸-二硫化物氧化還原酶;40S核糖體蛋白SI ;6_磷酸葡糖酸脫氫酶;氨基肽酶C ;氨甲醯基磷酸合酶(大亞基);PTS系統甘露糖-特異性IIAB組件;核糖體蛋白S2 ;二氫乳清酸脫氫酶;天冬氨酸氨甲醯基轉移酶;延伸因子Tu ;肺炎球菌表面免疫原性蛋白A(PsipA);磷酸甘油酸激酶;ABC轉運蛋白底物結合蛋白內肽酶O ;肺炎球菌表面免疫原性蛋白B(PsipB);或肺炎球菌表面免疫原性蛋白 C(PsipC) [8] ο
[0052]菌毛
[0053]許多肺炎鏈球菌菌株都具有致病性島(rlrA)內編碼的菌毛。該島編碼三種表面蛋白(RrgA、RrgB和RrgC)和三種分選酶。在本發明一些實施方式中,除來自本發明抗原組之一的抗原外,組合物包括以下一種或多種物質:RrgA ;RrgB ;RrgC ;SrtB ;SrtC ;和/或SrtD。在這六種蛋白質中,優選包括RrgA、RrgB和/或RrgC中的一種或多種。RrgB是最好包含的菌毛蛋白。
[0054]一些菌株具有不同的菌毛類型[9],『P1-2』。P1-2操縱子編碼PitA、SipA, PitB,SrtGl和SrtG2。在本發明一些實施方式中,除來自本發明抗原組之一的抗原外,組合物包括以下一種或多種物質:PitA、SipA, PitB, SrtGl和/或SrtG2。
[0055]IC1-1C131
[0056]如上所述,在本發明一些實施方式中,除來自本發明抗原組之一的抗原外,組合物包括選自IC1-1C131的一種或多種物質。這131種多肽參見參考文獻10,即其中表3所列的 144 種多肽,除了 SP0117、SP0641、SP0664、SP1003、SP1004、SP1174、SP1175、SP1573、SP1687、SP1693、SP1937和SP2190。在132種多肽IC1-1C131中,可從其中選擇一種或多種多肽的優選亞組是:IC1 ;IC8 ;IC16 ;IC23 ;IC31 ;IC34 ;IC40 ;IC45 ;IC47 ;IC57 ;IC58 ;IC60和 IC69。[0057]與肺炎球菌偶聯物聯用
[0058]本發明抗原組中鑑定的單獨抗原可與肺炎球菌偶聯物聯用。因此,本發明提供一種包含以下組合的免疫原性組合物:
[0059](I)選自第一、第二、第三、第四、第五、第六、第七、第八、第九和第十抗原組(如上所述)的一種或多種抗原;和
[0060](2) 一種或多種肺炎球菌莢膜糖和載體蛋白的偶聯物。
[0061]該組合組分(2)中所用的偶聯物包括糖部分和載體部分。糖部分來自肺炎球菌的莢膜糖。糖可以是多糖,其大小是由細菌純化該糖時產生的大小,或者可以是這種多糖片段化產生的寡糖。例如,在7價PREVNAR?產品中,6種糖是完整多糖,而一種(18C血清型)是寡糖。
[0062]一種組合物可包含來自以下一種或多種肺炎球菌血清型的莢膜糖:1、2、3、4、5、6A、6B、7F、8、9N、9V、10A、11A、12F、14、15B、17F、18C、19A、19F、20、22F、23F 和 / 或 33F。一種組合物可包含多種血清型,例如 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或多種血清型。本領域已知7價、9價、10價、11價和13價偶聯物組合,也了解23
價非偶聯組合。
[0063]例如,10價組合可包含來自血清型1、4、5、68、7卩、抑、14、18(:、19卩和23?的糖。11價組合還可包含來自血清型3的糖。可以在10價混合物中加入以下組合形成12價組合:血清型 6A 和 19A ;6A 和 22F ;19A 和 22F ;6A 和 15B ;19A 和 15B ;r22F 和 15B ;可以在 11 價混合物中加入以下組合形成13價組合:血清型19A和22F ;8和12F ;8和15B ;8和19A ;8和 22F ;12F 和 15B ;12F 和 19A ;12F 和 22F ;15B 和 19A ;15B 和 22F ;等等。
[0064] 載體部分通常是蛋白質,但優選不是(I)中的抗原之一。典型的載體蛋白是細菌毒素,如白喉或破傷風毒素,或者其類毒素或突變體。可使用CRM197白喉毒素突變體[11],它是PREVNAR?產品中的載體。其他合適的載體蛋白包括腦膜炎奈瑟球菌(N.meningitidis)外膜蛋白複合物[12]、合成肽[13,14]、熱激蛋白[15,16]、百日咳蛋白[17,18]、細胞因子[19]、淋巴因子[19]、激素[19]、生長因子[19]、包含多種來自各種病原體衍生抗原的人CD4+T細胞表位的人工蛋白[20]例如N19[21]、來自流感嗜血桿菌(H.1nfluenzae)的蛋白D [22-24]、肺炎球菌溶血素[25]或其無毒衍生物[26]、肺炎球菌表面蛋白PspA[27]、攝鐵蛋白[28]、來自艱難梭菌(C.difficile)的毒素A或B[29]、重組綠膿假單胞菌(P.aeruginosa)胞外蛋白A(rEPA) [30]等等。
[0065]當組合物包含一種以上偶聯物時,每種偶聯物可使用相同的載體蛋白或不同的載體蛋白。參考文獻31描述了在多價肺炎球菌偶聯物疫苗中使用不同載體蛋白的潛在優點。
[0066]在一些實施方式中,一種偶聯物可攜帶來自多種血清型的糖[32]。然而,每種偶聯物通常包含來自一種血清型的糖。
[0067]偶聯物可包含過量載體(w/w)或過量糖(w/w)。在一些實施方式中,偶聯物可包含相同重量的載體和糖。
[0068]載體分子可直接與載體共價偶聯,或通過接頭偶聯。可通過(例如)糖和載體之間的還原性胺化(如參考文獻33和34所述),實現與蛋白質的直接連接。首先需要通過,例如氧化激活糖。可用任何已知方法,如參考文獻35和36所述的方法通過接頭基團進行連接。優選的連接類型是己二酸接頭,這種連接可通過以下方式形成:將游離-NH2基團與己二酸偶聯(如通過胺化引入葡聚糖中)(例如,利用二醯亞胺活化),然後將蛋白質偶聯於所得的糖-己二酸中間體[37,38]。另一種優選連接形式是羰基接頭,這種連接可通過以下方式形成:使糖CDI的游離羥基發生反應[39,40],然後與蛋白質反應形成氨基甲酸酯連接。其它接頭包括β -丙醯胺基[41]、硝基苯基-乙胺[42]、滷代醯基滷化物[43]、配糖鍵[44]、6_氨基己酸[45]、ADH[46]、C4-C12部分[47]等。也可使用碳二亞胺縮合反應
[48]。
[0069]本發明抗原組中鑑定的單獨抗原可用作肺炎球菌莢膜糖的載體蛋白,以形成共價偶聯物。因此,本發明提供一種免疫原性組合物,其包含⑴選自第一、第二、第三、第四、第五、第六、第七、第八、第九或第十抗原組的抗原和(2)肺炎球菌莢膜糖。這類偶聯物的其他特徵如上所述。本領域已知可將肺炎球菌蛋白質用作偶聯物中的載體[例如,參考文獻25、27和67]。這些偶聯物可與本文所述的任何其他抗原聯用。
[0070]與非肺炎球菌抗原聯用
[0071]本發明抗原組中鑑定的單獨抗原可與非肺炎球菌抗原聯用。因此,本發明提供一種包含以下組合的免疫原性組合物:
[0072](I)選自第一、第二、第三、第四、第五、第六、第七、第八、第九或第十抗原組(如上所述)的一種或多種抗原;和
[0073](2) 一種或多種選自下組的抗原:白喉類毒素;破傷風類毒素;B型肝炎病毒表面抗原;滅活的脊髓灰質炎病毒抗原;一種或多種非細胞百日咳抗原;B型流感嗜血桿菌(Haemophilus influenzae)莢膜糖抗原的偶聯物;腦膜炎奈瑟球菌(Neisseriameningitidis)血清組C莢膜糖抗原的偶聯物;腦膜炎奈瑟球菌血清組Y莢膜糖抗原的偶聯物;腦膜炎奈瑟球菌血清組W135莢膜糖抗原的偶聯物;和腦膜炎奈瑟球菌血清組A莢膜糖抗原的偶聯物。
[0074]可通過處理(例如用甲醒)來自白喉棒狀桿菌(Corynebacterium diphtheriae)的白喉毒素獲得白喉類毒素。參考文獻49的第13章更詳細地公開了白喉類毒素。
[0075]可通過處理(例如用甲醒)來自破傷風梭菌(Clostridiumtetani)的破傷風毒素獲得破傷風類毒素。參考文獻49的第27章更詳細地公開了破傷風類毒素。
[0076]B型肝炎病毒表面抗原(HBsAg)是B型肝炎病毒衣殼的主要組分。可通過在酵母,如釀酒酵母(Saccharomycescerevisiae)中重組表達,方便地產生這種抗原。
[0077]滅活的脊髓灰質炎病毒抗原由細胞培養物上培養的病毒製備並滅活(例如用甲醛)。因為脊髓灰質炎可由三類脊髓灰質炎病毒之一引起(如參考文獻49的第24章所述),所以組合物可包含以下三類脊髓灰質炎病毒抗原:1型脊髓灰質炎病毒(例如Mahoney毒株)、2型脊髓灰質炎病毒(例如MEF-1毒株)和3型脊髓灰質炎病毒(例如Saukett毒株)。
[0078]非細胞百日咳抗原包含特定的純化百日咳博德特菌(B.pertussis)抗原,它們或者是由天然細菌純化的,或者是在重組宿主中表達後純化的。通常使用一種以上非細胞抗原,因此組合物可包含以下熟知和已良好鑑定的百日咳博德特菌抗原中的一種、兩種或三種:(1)脫毒的百日咳毒素(百日咳類毒素或「PT」) ;(2)絲狀血細胞凝集素(「FHA」);(3)百日咳桿菌粘附素(也稱為「69千道爾頓外膜蛋白」)。在用於本發明之前,可用甲醛處理FHA和百日咳桿菌粘附素。可通過甲醛和/或戊二醛處理對PT脫毒,但是,作為此種化學脫毒方法的替代方案,它可以是酶活性經誘變降低的突變PT[50]。可以使用的其他非細胞百日咳抗原包括菌毛(如凝集原2和3)。
[0079]組合物的組分(2)中包含白喉類毒素、破傷風類毒素或非細胞百日咳抗原之一時,它通常包含所有這三種抗原,即組分(2)包含D-T-Pa組合。
[0080]第一抗原組
[0081](I) spr0057
[0082]參考文獻84中將原始』 spr0057』序列標註為』 B -N-乙醯基-己糖胺酶前體』(參見G1: 15902101)。出於參比目的,R6菌株中發現的全長spr0057的胺基酸序列在本文中列為 SEQ ID NO:1。
[0083]本發明所用的優選spr0057多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:1具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ ID NO:1 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 spr0057 蛋白包括 SEQ ID NO:1 的變體。(b)的優選片段包含來自SEQ ID NO:1的表位。其他優選片段缺少SEQ ID NO:1C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDNOiIN末端的一個或多 個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:1的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ IDNO: 180,其缺少天然前導肽和分選酶識別序列。
[0084]spr0057與其他肺炎球菌抗原的組合顯示出良好的協同作用。
[0085](2) spr0286
[0086]參考文獻84中將原始’spr0286』序列標註為』透明質酸裂解酶前體』(參見G1: 15902330)。出於參比目的,R6菌株中發現的全長spr0286的胺基酸序列在本文中列為SEQ ID NO:2。
[0087]本發明所用的優選spr0286多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 2具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ IDN0:2 的至少』η』個連續胺基酸的片段,其中,η,是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 spr0286 蛋白包括 SEQ ID NO:2 的變體。(b)的優選片段包含來自SEQ ID NO:2的表位。其他優選片段缺少SEQ ID N0:2C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDN0:2N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO: 2的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ IDNO: 181,其缺少天然前導肽和分選酶識別序列。其他合適片段是SEQ ID NO: 182和183。
[0088](3) spr0565
[0089]參考文獻84中將原始』 spr0565』序列標註為』 β _半乳糖苷酶前體』(參見G1: 15902609)。出於參比目的,R6菌株中發現的全長spr0565的胺基酸序列在本文中列為SEQ ID NO:3。
[0090]本發明所用的優選spr0565多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 3具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ IDNO:3 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 spr0565 蛋白包括 SEQ ID NO: 3 的變體(如SEQ ID NO:66 ;見下)。(b)的優選片段包含來自SEQ ID NO:3的表位。其他優選片段缺少SEQ ID NO: 3C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO: 3N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 3的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ ID NO: 184,其缺少天然前導肽和分選酶識別序列。其他合適片段是 SEQ ID NO: 177 和 178。
[0091]本文中Spr0565的變體形式是SEQ ID N0:66。參考文獻10中報導將此種變體形式(其中的SEQ ID NO: 178)用於免疫。有用的spr0565多肽可包含某胺基酸序列,該序列:(a)與 SEQ ID NO:66 具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQID NO: 66的至少』η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些多肽包括 SEQ IDNO:66的變體。(b)的優選片段包含來自SEQ ID NO:66的表位。其他優選片段缺少SEQ IDNO:66C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO: 66N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 66的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0092]參考文獻10的表1中鑑定 了 SEQ ID NO:66的免疫原性片段。
[0093]由於Spr0565在天然情況下是長多肽(>2000aa),所以表達片段可能更方便。因此,本發明所用spr0565合適形式的長度可小於1500個胺基酸(例如〈1400、〈1300、〈1200、〈1100等)。spr0565 的這種短形式包括 『spr0565A』 (SEQ ID NO: 177)和 『spr0565B』 (SEQID NO: 178) ο
[0094]spr0565與其他肺炎球菌抗原的組合顯示出良好的協同作用。
[0095](4) sprl098
[0096]參考文獻84中將原始』 sprl098』序列標註為』分選酶』(參見G1: 15903141)。出於參比目的,R6菌株中發現的全長sprl098的胺基酸序列在本文中列為SEQ ID NO:4。
[0097]本發明所用的優選sprl098多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:4具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ IDN0:4 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 sprl098 蛋白包括 SEQ ID NO:4 的變體。(b)的優選片段包含來自SEQ ID NO:4的表位。其他優選片段缺少SEQ ID N0:4C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDN0:4N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO: 4的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ IDNO: 187,其缺少天然前導肽序列。[0098](5) sprl345
[0099]參考文獻84中將原始』 sprl345』序列標註為』假擬蛋白』(參見G1: 15903388)。出於參比目的,R6菌株中發現的全長sprl345的胺基酸序列在本文中列為SEQ ID NO: 5。
[0100]本發明所用的優選sprl345多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 5具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ IDN0:5 的至少』η』個連續胺基酸的片段,其中,η,是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 sprl345 蛋白包括 SEQ ID NO:5 的變體。(b)的優選片段包含來自SEQ ID NO:5的表位。其他優選片段缺少SEQ ID N0:5C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDN0:5N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO: 5的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ IDNO: 188,其缺少天然前導肽和分選酶識別序列。
[0101](6)sprl416
[0102]參考文獻84中將原始』 sprl416』序列標註為』假擬蛋白』(參見G1: 15903459)。出於參比目的,R6菌株中發現的全長sprl416的胺基酸序列在本文中列為SEQ ID N0:6。
[0103]本發明所用的優選sprl416多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:6具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ IDN0:6 的至少』η』個連續胺基酸的片段,其中,η,是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 sprl416 蛋白包括 SEQ ID NO:6 的變體。(b)的優選片段包含來自SEQ ID NO: 6的表位。其他優選片段缺少SEQ ID N0:6C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDN0:6N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDN0:6的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0104](7) sprl418
[0105]參考文獻84中將原始』 sprl418』序列標註為』假擬蛋白』(參見G1: 15903461)。出於參比目的,R6菌株中發現的全長sprl418的胺基酸序列在本文中列為SEQ ID NO: 7。
[0106]本發明所用的優選sprl418多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 7具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ IDN0:7 的至少』η』個連續胺基酸的片段,其中,η,是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 sprl418 蛋白包括 SEQ ID NO:7 的變體。(b)的優選片段包含來自SEQ ID NO:7的表位。其他優選片段缺少SEQ ID N0:7C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDN0:7N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:7的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0107]第二抗原組
[0108](I) spr0867[0109]參考文獻84中將原始’spr0867』序列標註為』內切-β _N_乙醯氨基葡糖苷酶』(參見G1: 15902911)。出於參比目的,R6菌株中發現的全長spr0867的胺基酸序列在本文中列為SEQ ID NO:8。
[0110]本發明所用的優選spr0867多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:8具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ IDN0:8 的至少』η』個連續胺基酸的片段,其中,η,是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 spr0867 蛋白包括 SEQ ID NO:8 的變體。(b)的優選片段包含來自SEQ ID NO:8的表位。其他優選片段缺少SEQ ID N0:8C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDN0:8N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDN0:8的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ IDNO: 185,其缺少天然前導肽序列。
[0111](2) sprl431
[0112]參考文獻84中將原始’sprl431』序列標註為』 1,4_β _N_乙醯溶菌酶』(參見G1:15903474)。它也稱為『LytC』,參考文獻67中報導了它的免疫應用。出於參比目的,R6菌株中發現的全長sprl431的胺基酸序列在本文中列為SEQ ID NO:9。
[0113]本發明所用的優選sprl431多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:9具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ IDN0:9 的至少』η』個連續胺基酸的片段,其中 150、200、250 或更多個)。這些 sprl431 蛋白包括 SEQ ID NO:9 的變體。(b)的優選片段包含來自SEQ ID NO: 9的表位。其他優選片段缺少SEQ ID N0:9C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDN0:9N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:9的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ IDNO: 189,其缺少天然前導肽序列。
[0114](3) sprl739
[0115],sprl739』多肽是肺炎鏈球菌溶血素(例如,參見G1: 15903781)。出於參比目的,R6菌株中發現的全長sprl739的胺基酸序列在本文中列為SEQ ID NO: 10。
[0116]本發明所用的優選sprl739多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 10具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 10 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些sprl739 蛋白包括SEQ ID NO: 10的變體。(b)的優選片段包含來自SEQ ID NO: 10的表位。其他優選片段缺少SEQ ID NO:1OC末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:1ON末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 10的至少一個表位。其他片段缺少一個或多個蛋白質結構域。[0117]本領域已知用於疫苗接種應用的肺炎鏈球菌溶血素的多種形式[26,51-56],這些突變形式可用於本發明。可通過C-末端截短(例如參見,參考文獻57),例如缺失34個胺基酸、45個胺基酸、7個胺基酸[58]等實現脫毒。根據SEQ ID NO: 20編號,其他突變包括Pro325 — Leu (如 SEQ ID NO: 169)和 / 或 Trp433 — Phe (如 SEQ ID NO: 171)。可將這些突變與C末端截短聯用,以便將Pro325 — Leu突變與7-聚體截短組合(如SEQ ID NO: 170)。
[0118](4) spr2021
[0119]參考文獻84中將原始’spr2021』序列標註為』全身應激蛋白GSP-781』(參見G1: 15904062)。出於參比目的,R6菌株中發現的全長spr2021的胺基酸序列在本文中列為SEQ ID NO: 11。
[0120]本發明所用的優選spr2021多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 11具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 11 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些spr2021 蛋白包括SEQ ID NO: 11的變體。(b)的優選片段包含來自SEQ ID NO: 11的表位。其他優選片段缺少SEQ ID NO:1lC末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:1lN末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 11的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ ID NO: 190,其缺少天然前導肽序列。
[0121]spr2021與其他肺炎球菌抗原的組合顯示出良好的協同作用。 [0122]參考文獻10將spr2021標註為與GbpB具有同源性的分泌型45kDa蛋白,還公開了它作為免疫原的應用(其中的SEQ ID N0:243 ;SP2216)。參考文獻10的表1中鑑定了spr2021的免疫原性片段(第73頁)。參考文獻59的SEQ ID NO:1是spr2021的另一有用片段(本文SEQ ID NO: 11的胺基酸28-278)。
[0123]第三抗原組
[0124](I) spr0096
[0125]參考文獻84中將原始』 spr0096』序列標註為』假擬蛋白』(參見G1: 15902140)。出於參比目的,R6菌株中發現的全長spr0096的胺基酸序列在本文中列為SEQ ID NO: 12。
[0126]本發明所用的優選spr0096多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 12具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 12 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 spr0096 蛋白包括SEQ ID NO: 12的變體(如SEQ ID NO: 40 ;見下)。(b)的優選片段包含來自SEQ ID NO: 12的表位。其他優選片段缺少SEQ ID NO: 12C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO: 12N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 12的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0127]spr0096與其他肺炎球菌抗原的組合顯示出良好的協同作用。[0128]相對於SEQ ID NO: 12在C末端附近有插入物的spr0096的變體形式是本文所述的SEQ ID N0:40。參考文獻10中報導將此種變體(其中的SEQ ID NO: 150)用於免疫,在其中標註為LysM結構域蛋白。因此,本發明所用的spr0096可包含某胺基酸序列,該序列:(a)與 SEQ ID NO:40 具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQID NO: 40的至少』η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些多肽包括 SEQ IDNO:40的變體。(b)的優選片段包含來自SEQ ID NO:40的表位。其他優選片段缺少SEQ IDNO:40C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:40N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:40的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 SEQ ID NO:40的免疫原性片段。 [0129]spr0096多肽可以二聚體,如同源二聚體的形式使用。
[0130](2) sprl433
[0131]參考文獻84中將原始』 sprl433』序列標註為』假擬蛋白』(參見G1: 15903476)。出於參比目的,R6菌株中發現的全長sprl433的胺基酸序列在本文中列為SEQ ID NO: 13。
[0132]本發明所用的優選sprl433多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 13具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 13 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 sprl433 蛋白包括SEQ ID NO: 13的變體。(b)的優選片段包含來自SEQ ID NO: 13的表位。其他優選片段缺少SEQ ID NO: 13C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO: 13N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 13的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0133](3) sprl707
[0134]參考文獻84中將原始’sprl707』序列標註為』 ABC轉運蛋白底物結合蛋白-寡肽轉運』(參見G1: 15903749)。出於參比目的,R6菌株中發現的全長sprl707的胺基酸序列在本文中列為SEQ ID NO: 14。
[0135]本發明所用的優選sprl707多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 14具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 14 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些sprl707 蛋白包括SEQ ID NO: 14的變體(如SEQ ID NO: 100 ;見下)。(b)的優選片段包含來自SEQ ID NO: 14的表位。其他優選片段缺少SEQ ID NO: 14C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDN0:14N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 14的至少一個表位。其他片段缺少一個或多個蛋白質結構域。[0136]與SEQ ID NO: 14相比4個胺基酸不同的sprl707的變體形式是本文所述的SEQ IDNO: 100。參考文獻10報導了 SEQ ID NO: 100的免疫應用(其中的SEQ ID NO: 220)。因此,本發明所用的sprl707多肽可包含某胺基酸序列,該序列:(a)與SEQ ID NO: 100具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 100 的至少 』 η』 個連續胺基酸的片段,其中,η,是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些多肽包括SEQ ID NO: 100的變體。(b)的優選片段包含來自SEQ ID NO: 100的表位。其他優選片段缺少SEQ ID NO: 100C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID NO: 100N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 100的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0137]參考文獻10的表1中鑑定了 SEQ ID NO: 100的免疫原性片段。
[0138]其他肺炎球菌抗原
[0139]ClpP
[0140]ClpP是ATP依賴性Clp蛋白酶的蛋白水解亞基。出於參比目的,全長ClpP的胺基酸序列是本文所述的SEQ ID NO: 16。在R6基因組中,ClpP是spr0656[84]。
[0141]本發明所用的優選ClpP多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 16具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 16 的至少 』 η』 個連續胺基酸的片段,其中 』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 ClpP 蛋白包括 SEQ ID NO: 16 的變體。(b)的優選片段包含來自SEQ ID NO: 16的表位。其他優選片段缺少SEQ ID NO: 16C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:16N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO: 16的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0142]參考文獻60和61報導了 ClpP的免疫應用。它優選與PspA和PsaA和/或PspC聯用[60]。
[0143]LytA
[0144]LytA是N-乙醯基胞壁醯-L-丙氨酸醯胺酶(自溶素)。出於參比目的,全長LytA的胺基酸序列是本文所述的SEQ ID NO: 17。在R6基因組中,LytA是sprl754[84]。
[0145]本發明所用的優選LytA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 17具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO: 17 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 LytA 蛋白包括 SEQ ID NO: 17 的變體(如G1: 18568354)。(b)的優選片段包含來自SEQ ID NO: 17的表位。其他優選片段缺少SEQ IDNO: 17C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO: 17N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 17的至少一個表位。其他片段缺少一個或多個蛋白質結構域。[0146]參考文獻62報導了 LytA的免疫應用,特別是含有與異源混雜T輔助細胞表位融合的LytA膽鹼結合域的形式的應用。
[0147]PhtA
[0148]PhtA是肺炎球菌組氨酸三聚體(triad)蛋白A。出於參比目的,全長PhtA前體的胺基酸序列是本文所述的SEQ ID NO: 18。在R6基因組中,PhtA是sprl061 [84]。
[0149]本發明所用的優選PhtA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 18具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO: 18 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 PhtA 蛋白包括 SEQ ID NO: 18 的變體。(b)的優選片段包含來自SEQ ID NO: 18的表位。其他優選片段缺少SEQ ID NO: 18C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:18N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO: 18的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0150]參考文獻63和64報導了 PhtA的免疫應用。
[0151]PhtB
[0152]PhtB是肺炎球菌組氨酸三聚體(triad)蛋白B。出於參比目的,全長PhtB前體的胺基酸序列是本文所述的SEQ ID NO: 19。殘基578處的Xaa可以是賴氨酸。
[0153]本發明所用的優選PhtB多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 19具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO: 19 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些PhtB 蛋白包括 SEQ ID NO: 19 的變體。(b)的優選片段包含來自SEQ ID NO: 19的表位。其他優選片段缺少SEQ ID NO: 19C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:19N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO: 19的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0154]參考文獻2、63和64報導了 PhtB的免疫應用。
[0155]PhtD
[0156]PhtD是肺炎球菌組氨酸三聚體蛋白D。出於參比目的,全長PhtD前體的胺基酸序列是本文所述的SEQ ID NO:20。在R6基因組中,PhtD是spr0907[84]。
[0157]本發明所用的優選PhtD多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 20具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:20 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 PhtD 蛋白包括 SEQ ID NO: 20 的變體。(b)的優選片段包含來自SEQ ID NO: 20的表位。其他優選片段缺少SEQ ID N0:20C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:20N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:20的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0158]參考文獻63、64和65報導了 PhtD的免疫應用。
[0159]PhtE
[0160]PhtE是肺炎球菌組氨酸三聚體(triad)蛋白E。出於參比目的,全長PhtE前體的胺基酸序列是本文所述的SEQ ID NO:21。在R6基因組中,PhtE是spr0908[84]。
[0161]本發明所用的優選PhtE多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 21具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ IDN0:21 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些PhtE 蛋白包括 SEQ ID Ν0:21 的變體。(b)的優選片段包含來自SEQ ID NO: 21的表位。其他優選片段缺少SEQ ID NO: 2IC末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:21N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:21的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0162]參考文獻63和64報導 了 PhtE的免疫應用。
[0163]ZmpB
[0164]ZmpB是鋅金屬蛋白酶。出於參比目的,全長ZmpB的胺基酸序列是本文所述的SEQID NO:22。在 R6 基因組中,ZmpB 是 spr0581[84]。
[0165]本發明所用的優選ZmpB多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 22具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 22 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些 ZmpB 蛋白包括 SEQ ID NO: 22 的變體。(b)的優選片段包含來自SEQ ID NO: 22的表位。其他優選片段缺少SEQ ID N0:22C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:22N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:22的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0166]CbpD
[0167]CbpD是膽鹼結合蛋白D。出於參比目的,全長CbpD的胺基酸序列是本文所述的SEQ ID NO:23。在 R6 基因組中,CbpD 是 spr2006[84]。
[0168]本發明所用的優選CbpD多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 23具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:23 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 CbpD 蛋白包括 SEQ ID NO: 23 的變體(如SEQ ID NO: 119 ;見下)。(b)的優選片段包含來自SEQ ID NO: 23的表位。其他優選片段缺少SEQ ID NO: 23C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和 / 或 SEQ ID NO: 23N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO: 23的至少一個表位。其他片段缺少一個或多個蛋白質結構域。[0169]參考文獻67報導了 CbpD的免疫應用。
[0170]在本文中,SEQ ID N0:23的變體是SEQ ID NO: 119。參考文獻10報導了 SEQ IDNO: 119的免疫應用(其中的SEQ ID NO: 241)。因此,本發明所用的CbpD多肽可包含某胺基酸序列,該序列:(a)與SEQ ID NO: 119具有50%或更高的相同性(如60%、65%、70%、75%、80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ ID NO: 119的至少』η』個連續胺基酸的片段,其中』 η』是7個或更多個(如
8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些CbpD蛋白包括SEQ ID NO: 119的變體。(b)的優選片段包含來自SEQ ID NO: 119的表位。其他優選片段缺少SEQ ID NO: 119C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO: 119N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、
9、10、15、20、25或更多個),而保留SEQID NO: 119的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0171]參考文獻10的表1中鑑定了 SEQ ID NO: 119的免疫原性片段。
[0172]CbpG
[0173]CbpG是膽鹼結合蛋白G。出於參比目的,全長CbpG的胺基酸序列是本文所述的SEQ ID NO:24。在 R6 基因組中,CbpG 是 spr0350[84]。
[0174]本發明所用的優選CbpG多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 24具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:24 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 CbpG 蛋白包括 SEQ ID NO: 24 的變體。(b)的優選片段包含來自SEQ ID NO: 24的表位。其他優選片段缺少SEQ ID N0:24C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:24N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:24的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0175]參考文獻67報導了 CbpG的免疫應用。
[0176]PvaA
[0177]PvaA(肺炎鏈球菌肺炎球菌疫苗抗原A)也稱為splOl。出於參比目的,全長PvaA的胺基酸序列是本文所述的SEQ ID NO: 25。在R6基因組中,PvaA是spr0930[84]。
[0178]本發明所用的優選PvaA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 25具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:25 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 PvaA 蛋白包括 SEQ ID NO: 25 的變體。(b)的優選片段包含來自SEQ ID NO: 25的表位。其他優選片段缺少SEQ ID N0:25C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:25N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:25的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0179]參考文獻I和318報導了 PvaA的免疫應用。[0180]CPLl
[0181]CPLl是肺炎球菌噬菌體CPl溶菌酶。出於參比目的,全長CPLl的胺基酸序列是本文所述的SEQ ID NO:26。
[0182]本發明所用的優選CPLl多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 26具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:26 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 CPLl 蛋白包括 SEQ ID NO: 26 的變體。(b)的優選片段包含來自SEQ ID NO: 26的表位。其他優選片段缺少SEQ ID N0:26C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:26N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:26的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0183]參考文獻62報導了 CPLl的免疫應用,特別是含有與異源混雜T輔助細胞表位融合的CPLl膽鹼結合域的形式的應用。
[0184]PspC
[0185]PspC是肺炎球菌表面蛋白C[66],也稱為膽鹼結合蛋白A(CbpA)。參考文獻I和67報導了它的免疫應用。在R6菌株中它是sprl995,出於參比目的,在本文中全長sprl995的胺基酸序列是SEQ ID NO: 15。
[0186]本發明所用的優選PspC多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 15具有50%或更高的相同性(如 6 0%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 15 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 sprl995 蛋白包括 SEQ ID NO: 15 的變體(如SEQ ID NO:27 ;見下)。(b)的優選片段包含來自SEQ ID NO: 15的表位。其他優選片段缺少SEQ ID NO: 15C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO: 15N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 15的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0187]一種PspC變體稱為『Hie』。它類似於PspC,如參考文獻68圖1所示,該參考文獻中報導它能結合於因子H(fH)。出於參比目的,全長Hic的胺基酸序列是本文所述的SEQ IDNO:27。Hic蛋白可用於本發明,以便與PspC多肽一起使用或替代PspC多肽。
[0188]本發明所用的優選Hic多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 27具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:27 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 Hic 蛋白包括 SEQ ID NO: 27 的變體。(b)的優選片段包含來自SEQ ID NO: 27的表位。其他優選片段缺少SEQ ID N0:27C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:27N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:27的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0189]PspC和/或Hic宜與PspA和/或PsaA聯用。
[0190]Pmp
[0191]Pmp是肽醯脯氨醯異構酶,也稱為蛋白酶成熟蛋白。出於參比目的,全長Pmp的胺基酸序列是本文所述的SEQ ID NO:28。在R6基因組中,Pmp是spr0884[84]。
[0192]本發明所用的優選Pmp多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 28具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:28 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 Pmp 蛋白包括 SEQ ID NO: 28 的變體。(b)的優選片段包含來自SEQ ID NO: 28的表位。其他優選片段缺少SEQ ID N0:28C末端的一個或多個胺基酸(如 1、2、3、4、5 、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:28N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDN0:28的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQID NO: 186,其缺少天然前導肽序列。
[0193]參考文獻69報導了 Pmp的免疫應用。
[0194]PspA
[0195]PspA是肺炎球菌表面蛋白A。出於參比目的,全長PspA的胺基酸序列是本文所述的 SEQ ID NO: 29。在 R6 基因組中,PspA 是 spr0121 [84]。
[0196]本發明所用的優選PspA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 29具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:29 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些PspA 蛋白包括 SEQ ID NO: 29 的變體。(b)的優選片段包含來自SEQ ID NO: 29的表位。其他優選片段缺少SEQ ID N0:29C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:29N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:29的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0197]參考文獻70報導了 PspA的免疫應用等。它宜與PspC聯合給藥。
[0198]PsaA
[0199]PsaA是肺炎球菌表面粘附素。出於參比目的,全長PsaA的胺基酸序列是本文所述的 SEQ ID NO:30。
[0200]本發明所用的優選PsaA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 30具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:30 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 PsaA 蛋白包括 SEQ ID NO: 30 的變體。(b)的優選片段包含來自SEQ ID NO: 30的表位。其他優選片段缺少SEQ ID N0:30C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:30N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO: 30的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻59中的SEQ IDNO: 3是PsaA的有用片段(對應於本文SEQ ID NO: 30的胺基酸21-309)。
[0201]參考文獻71報導了 PsaA的免疫應用。它可與PspA和/或PspC聯用。
[0202]PrtA
[0203]PrtA是細胞壁-相關性絲氨酸蛋白酶。它也稱為spl28和spl30,屬於枯草桿菌蛋白酶-樣絲氨酸蛋白酶。出於參比目的,全長PrtA前體的胺基酸序列是本文所述的SEQID NO: 31。在 R6 基因組中,PrtA 是 spr0561 [84]。
[0204]本發明所用的優選PrtA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 31具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ IDN0:31 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些PrtA 蛋白包括 SEQ ID Ν0:31 的變體。(b)的優選片段包含來自SEQ ID NO: 31的表位。其他優選片段缺少SEQ ID NO: 3IC末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:31N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:31的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0205]參考文獻72和73,以及參考文獻I報導了 PrtA的免疫應用。
[0206]Sp 133
[0207]Spl33是保守性肺炎球菌抗原。出於參比目的,全長Spl33的胺基酸序列是本文所述的 SEQ ID NO:32。在 R6 基因組中,Spl33 是 spr0931[84]。
[0208]本發明所用的優選Spl33多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 32具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO: 32 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 Spl33 蛋白包括 SEQ ID NO: 32的變體。(b)的優選片段包含來自SEQ ID NO: 32的表位。其他優選片段缺少SEQ ID N0:32C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO: 32N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO: 32的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0209]參考文獻74報導了 Spl33的免疫應用。
[0210]PiaA
[0211]PiaA是參與肺炎球菌鐵獲取的膜通透酶。出於參比目的,全長PiaA的胺基酸序列是本文所述的SEQ ID NO: 33。在R6基因組中,PiaA是spr0935[84]。
[0212]本發明所用的優選PiaA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 33具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQIDN0:33 的至少 』 η』 個連續胺基酸的片段,其 中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 PiaA 蛋白包括 SEQ ID NO: 33 的變體。(b)的優選片段包含來自SEQ ID NO: 33的表位。其他優選片段缺少SEQ ID N0:33C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:33N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:33的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0213]參考文獻75、76和77報導了 PiaA的免疫應用,特別是與PiuA聯用。
[0214]PiuA
[0215]PiuA是用於轉運三價鐵的ABC轉運蛋白底物結合蛋白。它也稱為FatB。出於參比目的,全長PiuA的胺基酸序列是本文所述的SEQ IDN0:34。在R6基因組中,PiuA是sprl687[84]。
[0216]本發明所用的優選PiuA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 34具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:34 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 PiuA 蛋白包括 SEQ ID NO: 34 的變體。(b)的優選片段包含來自SEQ ID NO: 34的表位。其他優選片段缺少SEQ ID N0:34C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:34N 末端的一個或多個胺基酸 (如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:34的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0217]參考文獻75-77報導了 PiuA的免疫應用,特別是與PiaA聯用。
[0218]ICl
[0219]在參考文獻10中,將ICl標註為假擬蛋白。出於參比目的,全長ICl的胺基酸序列是本文所述的SEQ ID NO: 35。在R6基因組中,ICl是spr0008 [84]。參考文獻10中報導了 ICl的免疫應用(其中的SEQ ID NO: 145)。
[0220]本發明所用的優選ICl多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 35具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:35 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 ICl 蛋白包括 SEQ ID NO: 35 的變體。(b)的優選片段包含來自SEQ ID NO: 35的表位。其他優選片段缺少SEQ ID N0:35C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:35N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:35的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 ICl的免疫原性片段。
[0221]IC2
[0222]IC2是polA DNA聚合酶I。出於參比目的,全長IC2的胺基酸序列是本文所述的SEQ ID NO:36ο在R6基因組中,IC2是spr0032 [84]。參考文獻10中報導了 IC2的免疫應用(其中的 SEQ ID NO: 146)。
[0223]本發明所用的優選IC2多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 36具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:36 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC2 蛋白包括 SEQ ID NO:36 的變體。(b)的優選片段包含來自SEQ ID NO: 36的表位。其他優選片段缺少SEQ ID N0:36C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:36N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:36的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC2的免疫原性片段。
[0224]IC3
[0225]IC3是膽鹼結合蛋白。出於參比目的,全長IC3的胺基酸序列是本文所述的SEQ IDNO:37。在R6基因組中,IC3是sprl945[84]。參考文獻10中報導了 IC3的免疫應用(其中的 SEQ ID NO: 147)。
[0226]本發明所用的優選IC3多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 37具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:37 的至少 』 η』 個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC3 蛋白包括 SEQ ID NO:37 的變體。(b)的優選片段包含來自SEQ ID NO: 37的表位。其他優選片段缺少SEQ ID N0:37C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:37N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:37的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC3的免疫原性片段。
[0227]IC4
[0228]IC4是IgAl蛋白酶。出於參比目的,全長IC4的胺基酸序列是本文所述的SEQ IDNO:38o在R6基因組中,IC4是sprl042[84]。參考文獻10中報導了 IC4的免疫應用(其中的 SEQ ID NO: 148) ο
[0229]本發明所用的優選IC4多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:38具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:38 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC4 蛋白包括 SEQ IDNO:38 的變體。(b)的優選片段包含來自SEQ ID NO:38的表位。其他優選片段缺少SEQ ID NO:38C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:38N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:38的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC4的免疫原性片段。
[0230]IC5
[0231]IC5標註為假擬蛋白,但它可能是細胞壁表面錨定蛋白。出於參比目的,全長IC5的胺基酸序列是本文所述的SEQ ID NO:39。在R6基因組中,IC5是spr0075[84]。參考文獻10中報導了 IC5的免疫應用(其中的SEQ ID NO:149)。
[0232]本發明所用的優選IC5多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:39具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:39 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC5 蛋白包括 SEQ IDNO:39 的變體。(b)的優選片段包含來自SEQ ID NO:39的表位。其他優選片段缺少SEQ ID NO:39C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:39N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:39的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC5的免疫原性片段。
[0233]IC6
[0234]IC6是spr0096的變體形式,如上所述(本文中的SEQ ID NO:40)。可用於本發明的IC6多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:40具有50%或更高的相同性(如60%,65%,70%,75%,80%,85%,90%,91 %,92%,93%,94%,95%,96%,97%,98%,99%、99.5%或更高);和/或(b)包含SEQ ID NO:40的至少』 η』個連續胺基酸的片段,其中』η』是 7 個或更多個(如 8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200,250或更多個)。這些IC6蛋白包括SEQ ID NO:40的變體。(b)的優選片段包含來自SEQ ID NO:40的表位。其他優選片段缺少SEQ ID NO:40C末端的一個或多個胺基酸(如1、
2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:40N末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留 SEQ ID NO:40 的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0235]IC7
[0236]在參考文獻10中將IC7標註為假擬蛋白。出於參比目的,全長IC7的胺基酸序列是本文所述的SEQ IDNO:41。在R6基因組中,IC7是spr0174 [84]。參考文獻10中報導了IC7的免疫應用(其中的SEQ ID NO:152)。 [0237]本發明所用的優選IC7多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:41具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ IDNO:41 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC7 蛋白包括 SEQ IDNO:41 的變體。(b)的優選片段包含來自SEQ ID NO:41的表位。其他優選片段缺少SEQ ID NO:41C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ IDN0:41N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:41的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC7的免疫原性片段。
[0238]IC8
[0239]IC8是二氫葉酸:葉醯聚穀氨酸合成酶。出於參比目的,全長IC8的胺基酸序列是本文所述的SEQ IDNO:42。在R6基因組中,IC8是spr0178 [84]。參考文獻10中報導了IC8的免疫應用(其中的SEQ ID NO:153)。
[0240]本發明所用的優選IC8多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:42具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ IDNO:42 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC8 蛋白包括 SEQ IDNO:42 的變體。(b)的優選片段包含來自SEQ ID NO:42的表位。其他優選片段缺少SEQ ID NO:42C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:42N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:42的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC8的免疫原性片段。
[0241]IC9
[0242]IC9是50S核糖體蛋白L2。出於參比目的,全長IC9的胺基酸序列是本文所述的SEQ IDNO:43o在R6基因組中,IC9是spr0191 [84]。參考文獻10中報導了 IC9的免疫應用(其中的 SEQ ID NO :154)。
[0243]本發明所用的優選IC9多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:43具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO:43 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC9 蛋白包括 SEQ ID NO:43 的變體。(b)的優選片段包含來自SEQ ID NO:43的表位。其他優選片段缺少SEQ ID NO:43C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID N0:43N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:43的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC9的免疫原性片段。
[0244]IClO
[0245]IClO是30S核糖體蛋白S14。出於參比目的,全長IClO的胺基酸序列是本文所述的SEQIDN0:44。在R6基因組中,IClO是spr0202 [84]。參考文獻10中報導了 IClO的免疫應用(其中的SEQ ID NO:155)。
[0246]本發明所用的優選IClO多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:44具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:44 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IClO 蛋白包括 SEQ ID NO:44的變體。(b)的優選片段包含來自SEQ ID NO:44的表位。其他優選片段缺少SEQ ID NO:44C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:44N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:44的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IClO的免疫原性片段。[0247]ICll
[0248]在參考文獻10中將ICll標註為假擬蛋白。出於參比目的,全長ICll的胺基酸序列是本文所述的SEQ ID NO:45o在R6基因組中,ICll是spr0218[84]。參考文獻10中報導了 ICll的免疫應用(其中的SEQ ID NO:156)。
[0249]本發明所用的優選ICll多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:45具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:45 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 ICll 蛋白包括 SEQ ID NO:45的變體。(b)的優選片段包含來自SEQ ID NO:45的表位。其他優選片段缺少SEQ ID NO:45C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:45N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:45的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 ICll的免疫原性片段。
[0250]ICl 2
[0251]IC12是甲酸乙醯基轉移酶3。出於參比目的,全長IC12的胺基酸序列是本文所述的SEQIDN0:46。在R6基因組中,IC12是spr0232 [84]。參考文獻10中報導了 IC12的免疫應用(其中的SEQ ID NO:157)。
[0252]本發明所用的優選IC12多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:46具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:46 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC12 蛋白包括 SEQ ID NO:46的變體。(b)的優選片段包含來自SEQ ID NO:46的表位。其他優選片段缺少SEQ ID NO:46C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:46N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:46的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC12的免疫原性片段。
[0253]IC13
[0254]IC13是30S核糖體蛋白S9。出於參比目的,全長IC13的胺基酸序列是本文所述的SEQIDN0:47。在R6基因組中,IC13是spr0272 [84]。參考文獻10中報導了 IC13的免疫應用(其中的SEQ ID NO:158)。
[0255]本發明所用的優選IC13多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:47具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96% 、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:47 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC13 蛋白包括 SEQ ID NO:47的變體。(b)的優選片段包含來自SEQ ID NO:47的表位。其他優選片段缺少SEQ ID NO:47C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:47N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:47的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC13的免疫原性片段。
[0256]IC14
[0257]IC14是轉錄調節物。出於參比目的,全長IC14的胺基酸序列是本文所述的SEQIDNO:48o在R6基因組中,IC14是spr0298[84]。參考文獻10中報導了 IC14的免疫應用(其中的 SEQ ID NO: 159) ο
[0258]本發明所用的優選IC14多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:48具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:48 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC14 蛋白包括 SEQ ID NO:48的變體。(b)的優選片段包含來自SEQ ID NO:48的表位。其他優選片段缺少SEQ ID NO:48C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:48N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:48的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC14的免疫原性片段。
[0259]IC15
[0260]在參考文獻10中將IC15標註為細胞壁表面錨定蛋白家族的蛋白質。出於參比目的,全長IC15的胺基酸 序列是本文所述的SEQ ID N0:49。在R6基因組中,IC15是spr0328[84]。參考文獻10中報導了 IC15的免疫應用(其中的SEQ ID NO:160),參考文獻78證明它具有保護作用(抗原SP0368)。
[0261]本發明所用的優選IC15多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:49具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:49 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC15 蛋白包括 SEQ ID NO:49的變體。(b)的優選片段包含來自SEQ ID NO:49的表位。其他優選片段缺少SEQ ID NO:49C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:49N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:49的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC15的免疫原性片段。
[0262]IC16
[0263]IC16是青黴素結合蛋白1A。出於參比目的,全長IC16的胺基酸序列是本文所述的SEQIDN0:50。在R6基因組中,IC16是spr0329 [84]。參考文獻10中報導了 IC16的免疫應用(其中的SEQ ID NO:161)。
[0264]本發明所用的優選IC16多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:50具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:50 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC16 蛋白包括 SEQ ID NO:50的變體。(b)的優選片段包含來自SEQ ID NO:50的表位。其他優選片段缺少SEQ ID NO:50C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:50N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:50的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC16的免疫原性片段。
[0265]IC17
[0266]在參考文獻10中將IC17標註為假擬蛋白。出於參比目的,全長IC17的胺基酸序列是本文所述的SEQ ID NO:51o在R6基因組中,IC17是spr0334[84]。參考文獻10中報導了 IC17的免疫應用(其中的SEQ ID NO:162)。
[0267]本發明所用的優選IC17多肽包含某胺基酸序列,該序列:(a)與SEQ IDNO:51具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO:51 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些 IC17 蛋白包括 SEQ IDNO:51 的變體。(b)的優選片段包含來自SEQ ID NO:51的表位。其他優選片段缺少SEQ ID NO:51C末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個)和 / 或 SEQ ID NO:51N 末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:51的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC17的免疫原性片段。
[0268]IC18
[0269]在參考文獻10中將IC18標註為膽鹼結合蛋白F。出於參比目的,全長IC18的胺基酸序列是本文所述的SEQ IDNO:52o在R6基因組中,IC18是spr0337 [84]。參考文獻10中報導了 IC18的免疫應用(其中的SEQ ID NO:163)。
[0270]本發明所用的優選IC18多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:52具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97% 、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:52 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC18 蛋白包括 SEQ ID NO:52的變體。(b)的優選片段包含來自SEQ ID NO:52的表位。其他優選片段缺少SEQ ID NO:52C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:52N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:52的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC18的免疫原性片段。
[0271]IC19
[0272]在參考文獻10中將IC19標註為膽鹼結合蛋白J (cbpj)。出於參比目的,全長IC19的胺基酸序列是本文所述的SEQ ID NO:53。參考文獻10中報導了 IC19的免疫應用(其中的 SEQ ID NO:164)。[0273]本發明所用的優選IC19多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:53具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:53 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC19 蛋白包括 SEQ ID NO:53的變體。(b)的優選片段包含來自SEQ ID NO:53的表位。其他優選片段缺少SEQ ID NO:53C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:53N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:53的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC19的免疫原性片段。
[0274]IC20
[0275]IC20是膽鹼結合蛋白G。出於參比目的,全長IC20的胺基酸序列是本文所述的SEQ ID NO:54o在R6基因組中,IC20是spr0349[84]。參考文獻10中報導了 IC20的免疫應用(其中的SEQ IDNO:165)。 [0276]本發明所用的優選IC20多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:54具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO:54 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC20 蛋白包括 SEQ ID NO:54的變體。(b)的優選片段包含來自SEQ ID NO:54的表位。其他優選片段缺少SEQ ID NO -MC末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:54N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:54的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC20的免疫原性片段。
[0277]IC21
[0278]在參考文獻10中將IC21標註為假擬蛋白。出於參比目的,全長IC21的胺基酸序列是本文所述的SEQ ID NO:55o在R6基因組中,IC21是spr0410[84]。參考文獻10中報導了 IC21的免疫應用(其中的SEQ ID NO:166)。
[0279]本發明所用的優選IC21多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:55具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:55 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC21 蛋白包括 SEQ ID NO:55的變體。(b)的優選片段包含來自SEQ ID NO:55的表位。其他優選片段缺少SEQ ID NO:55C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:55N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:55的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC21的免疫原性片段。
[0280]IC22[0281]在參考文獻10中將IC22標註為細胞壁表面錨定蛋白家族的蛋白質。出於參比目的,全長IC22的胺基酸序列是本文所述的SEQ IDNO:56。在R6基因組中,IC22是spr0051[84]o參考文獻10中報導了 IC22的免疫應用(其中的SEQ ID NO: 167)。
[0282]本發明所用的優選IC22多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:56具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:56 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC22 蛋白包括 SEQ ID NO:56的變體。(b)的優選片段包含來自SEQ ID NO:56的表位。其他優選片段缺少SEQ ID NO:56C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:56N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:56的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC22的免疫原性片段。
[0283]IC23
[0284]IC23是分選酶(cf.sprl098)。出於參比目的,全長IC23的胺基酸序列是本文所述的SEQ ID NO:57o參考文獻10中報導了 IC23的免疫應用(其中的SEQ ID NO:168)。
[0285]本發明所用的優選IC23多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:57具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:57 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC23 蛋白包括 SEQ ID NO:57的變體。(b)的優選片段包含 來自SEQ ID NO:57的表位。其他優選片段缺少SEQ ID NO:57C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:57N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:57的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC23的免疫原性片段。
[0286]IC24
[0287]IC24是分選酶(cf.sprl098)。出於參比目的,全長IC24的胺基酸序列是本文所述的SEQ ID NO:58o參考文獻10中報導了 IC24的免疫應用(其中的SEQ ID NO:169)。
[0288]本發明所用的優選IC24多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:58具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:58 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC24 蛋白包括 SEQ ID NO:58的變體。(b)的優選片段包含來自SEQ ID NO:58的表位。其他優選片段缺少SEQ ID NO:58C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:58N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:58的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC24的免疫原性片段。[0289]IC25
[0290]在參考文獻10中將IC25標註為推定的內切-β-Ν-乙醯氨基葡糖苷酶。出於參比目的,全長IC25的胺基酸序列是本文所述的SEQ ID NO:590在R6基因組中,IC25是spr0440[84]。參考文獻10中報導了 IC25的免疫應用(其中的SEQ ID NO:170)。
[0291]本發明所用的優選IC25多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:59具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:59 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC25 蛋白包括 SEQ ID NO:59的變體。(b)的優選片段包含來自SEQ ID NO:59的表位。其他優選片段缺少SEQ ID NO:59C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:59N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:59的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC25的免疫原性片段。
[0292]IC26
[0293]IC26是EcoE I型限制性修飾酶。出於參比目的,全長IC26的胺基酸序列是本文所述的SEQ ID NO:60o在R6基因組中,IC26是spr0449[84]。參考文獻10中報導了 IC26的免疫應用(其中的SEQ ID NO:171)。
[0294]本發明所用的優選IC26多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:60具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:60 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC26 蛋白包括 SEQ ID NO:60的變體。(b)的優選片段包含來自SEQ ID NO:60的表位。其他優選片段缺少SEQ ID NO:60C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:60N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:60的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC26的免疫原性片段。
[0295]IC27
[0296]在參考文獻10中將IC27標註為dnaj蛋白。出於參比目的,全長IC27的胺基酸序列是本文所述的SEQ ID NO:61o在R6基因組中,IC27是spr0456[84]。參考文獻10中報導了 IC27的免疫應用(其中的SEQ ID NO:172)。
[0297]本發明所用的優選IC27多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:61具有 50% 或更高的 相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:61 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC27 蛋白包括 SEQ ID NO:61的變體。(b)的優選片段包含來自SEQ ID NO:61的表位。其他優選片段缺少SEQ ID NO:61C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:61N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:61的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC27的免疫原性片段。
[0298]IC28
[0299]在參考文獻10中將1028標註為犯?0 48(:轉運蛋白031?8)。出於參比目的,全長IC28的胺基酸序列是本文所述的SEQ ID NO:62。在R6基因組中,IC28是spr0466[84]。參考文獻10中報導了 IC28的免疫應用(其中的SEQ IDNO:173)。
[0300]本發明所用的優選IC28多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:62具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:62 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC28 蛋白包括 SEQ ID NO:62的變體。(b)的優選片段包含來自SEQ ID NO:62的表位。其他優選片段缺少SEQ ID NO:62C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:62N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:62的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC28的免疫原性片段。
[0301]IC29
[0302]在參考文獻10中將IC29標註為假擬蛋白。出於參比目的,全長IC29的胺基酸序列是本文所述的SEQ ID NO:63o在R6基因組中,IC29是spr0488[84]。參考文獻10中報導了 IC29的免疫應用(其中的SEQ ID NO:174)。
[0303]本發明所用的優選IC29多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:63具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:63 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC29 蛋白包括 SEQ ID NO:63的變體。(b)的優選片段包含來自SEQ ID NO:63的表位。其他優選片段缺少SEQ ID NO:63C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:63N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:63的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC29的免疫原性片段。
[0304]IC30
[0305]IC30是ABC轉運蛋白底物結合蛋白。出於參比目的,全長IC30的胺基酸序列是本文所述的SEQ ID NO:64o在R6基因組中,IC30是spr0534[84]。參考文獻10中報導了IC30的免疫應用(其中的SEQ IDNO:175)。
[0306]本發明所用的優選IC30多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:64具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:64 的至少』 η』個連續氨基 酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC30 蛋白包括 SEQ ID NO:64的變體。(b)的優選片段包含來自SEQ ID NO:64的表位。其他優選片段缺少SEQ ID NO -MC末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:64N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:64的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC30的免疫原性片段。
[0307]IC31
[0308]在參考文獻10中將IC31標註為金屬-β-內醯胺酶超家族的蛋白質。出於參比目的,全長IC31的胺基酸序列是本文所述的SEQ ID NO:650在R6基因組中,IC31是spr0538[84]o參考文 獻10中報導了 IC31的免疫應用(其中的SEQ ID NO: 176)。
[0309]本發明所用的優選IC31多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:65具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:65 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC31 蛋白包括 SEQ ID NO:65的變體。(b)的優選片段包含來自SEQ ID NO:65的表位。其他優選片段缺少SEQ ID NO:65C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:65N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:65的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC31的免疫原性片段。
[0310]IC32
[0311]IC32是spr0565的變體形式,如上所述(本文中的SEQ IDNO:66)。有用的IC32多肽可包含某胺基酸序列,該序列:(a)與SEQ ID NO: 66具有50%或更高的相同性(如60 %、65%,70%,75%,80%,85%,90%,91 %,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ ID NO:66的至少』 η』個連續胺基酸的片段,其中』 η』是 7 個或更多個(如 8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些IC32多肽包括SEQ ID NO:66的變體。(b)的優選片段包含來自SEQID NO:66的表位。其他優選片段缺少SEQ ID NO:66C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:66N末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留 SEQ ID NO:66 的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 SEQ ID NO:66的免疫原性片段。
[0312]IC33
[0313]在參考文獻10中將IC33標註為推定的肺炎球菌表面蛋白。出於參比目的,全長IC33的胺基酸序列是本文所述的SEQ ID NO:67。在R6基因組中,IC33是spr0583[84]。參考文獻10中報導了 IC33的免疫應用(其中的SEQ IDNO:180),參考文獻78證明它具有保護作用(抗原SP0667)。
[0314]本發明所用的優選IC33多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:67具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:67 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC33 蛋白包括 SEQ ID NO:67的變體。(b)的優選片段包含來自SEQ ID NO:67的表位。其他優選片段缺少SEQ ID NO:67C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:67N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:67的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC33的免疫原性片段。
[0315]IC34
[0316]IC34是UDP-N-乙醯基胞壁醯-L-丙氨醯-D-穀氨酸合成酶。出於參比目的,全長IC34的胺基酸序列是本文所述的SEQ ID NO:68。在R6基因組中,IC34是spr0603[84]。參考文獻10中報導了 IC34的免疫應用(其中的SEQ ID NO:181)。
[0317]本發明所用的優選IC34多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:68具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:68 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC34 蛋白包括 SEQ ID NO:68的變體。(b)的優選片段包含來自SEQ ID NO:68的表位。其他優選片段缺少SEQ ID NO:68C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:68N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:68的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC34的 免疫原性片段。
[0318]IC35
[0319]IC35是ABC轉運蛋白底物結合蛋白。出於參比目的,全長IC35的胺基酸序列是本文所述的SEQ ID NO:69o在R6基因組中,IC35是spr0659[84]。參考文獻10中報導了IC35的免疫應用(其中的SEQ ID NO:182)。
[0320]本發明所用的優選IC35多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:69具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:69 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC35 蛋白包括 SEQ ID NO:69的變體。(b)的優選片段包含來自SEQ ID NO:69的表位。其他優選片段缺少SEQ ID NO:69C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:69N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:69的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC35的免疫原性片段。
[0321]IC36
[0322]IC36是ABC轉運蛋白ATP-結合蛋白。出於參比目的,全長IC36的胺基酸序列是本文所述的SEQ ID NO:70o在R6基因組中,IC36是spr0678[84]。參考文獻10中報導了IC36的免疫應用(其中的SEQ ID NO:183)。
[0323]本發明所用的優選IC36多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:70具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:70 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC36 蛋白包括 SEQ ID NO:70的變體。(b)的優選片段包含來自SEQ ID NO:70的表位。其他優選片段缺少SEQ ID NO:70C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:70N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:70的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC36的免疫原性片段。
[0324]IC37 [0325]在參考文獻10中將IC37標註為假擬蛋白。出於參比目的,全長IC37的胺基酸序列是本文所述的SEQ ID NO:71o在R6基因組中,IC37是spr0693[84]。參考文獻10中報導了 IC37的免疫應用(其中的SEQ ID NO:184)。
[0326]本發明所用的優選IC37多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:71具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:71 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC37 蛋白包括 SEQ ID NO:71的變體。(b)的優選片段包含來自SEQ ID NO:71的表位。其他優選片段缺少SEQ ID NO:71C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:71N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:71的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC37的免疫原性片段。
[0327]IC38
[0328]在參考文獻10中將IC38標註為被截短的根瘤素相關蛋白。出於參比目的,全長IC38的胺基酸序列是本文所述的SEQ ID NO -J2。在R6基因組中,IC38是spr0814[84]。參考文獻10中報導了 IC38的免疫應用(其中的SEQ ID NO:185)。
[0329]本發明所用的優選IC38多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:72具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:72 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC38 蛋白包括 SEQ ID NO:72的變體。(b)的優選片段包含來自SEQ ID NO:72的表位。其他優選片段缺少SEQ ID NO:72C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:72N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:72的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC38的免疫原性片段。[0330]IC39
[0331]IC39是磷壁酸磷酸膽鹼酯酶/膽鹼結合蛋白E(cbpE)。它也可稱為『LytD』。出於參比目的,全長IC39的胺基酸序列是本文所述的SEQ ID NO:73。在R6基因組中,IC39是spr0831[84]o參考文獻10中報導了 IC39的免疫應用(其中的SEQ ID NO: 186)。
[0332]本發明所用的優選IC39多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:73具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:73 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC39 蛋白包括 SEQ ID NO:73的變體。(b)的優選片段包含來自SEQ ID NO:73的表位。其他優選片段缺少SEQ ID NO:73C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:73N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:73的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC39的免疫原性片段。
[0333]IC40
[0334]IC40是葡萄糖抑制的分裂蛋白A。出於參比目的,全長IC40的胺基酸序列是本文所述的SEQ ID NO:74o在R6基因組中,IC40是spr0844[84]。參考文獻10中報導了 IC40的免疫應用(其中的SEQ ID NO:187)。
[0335]本發明所用的優選IC40多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:74具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:74 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC40 蛋白包括 SEQ ID NO:74的變體。(b)的優選片段包含來自SEQ ID NO:74的表位。其他優選片段缺少SEQ ID NO:74C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:74N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:74的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC40的免疫原性片段。
[0336]IC41
[0337]IC41是截短的丙氨酸脫氫酶。出於參比目的,全長IC41的胺基酸序列是本文所述的SEQ ID NO:75o在R6基因組中,IC41是spr0854[84]。參考文獻10中報導了 IC41的免疫應用(其中的SEQ ID NO:188)。
[0338] 本發明所用的優選IC41多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:75具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:75 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC41 蛋白包括 SEQ ID NO:75的變體。(b)的優選片段包含來自SEQ ID NO:75的表位。其他優選片段缺少SEQ ID NO:75C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:75N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:75的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC41的免疫原性片段。
[0339]IC42
[0340]IC42是糖原合酶。出於參比目的,全長IC42的胺基酸序列是本文所述的SEQ IDNO:76o在R6基因組中,IC42是sprl032[84]。參考文獻10中報導了 IC42的免疫應用(其中的 SEQ ID NO:191)。
[0341]本發明所用的優選IC42多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:76具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:76 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC42 蛋白包括 SEQ ID NO:76的變體。(b)的優選片段包含來自SEQ ID NO:76的表位。其他優選片段缺少SEQ ID NO:76C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:76N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:76的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC42的免疫原性片段。
[0342]IC43
[0343]IC43是免疫球蛋白Al蛋白酶。出於參比目的,全長IC43的胺基酸序列是本文所述的SEQ ID NO:77o參考文獻10中報導了 IC43的免疫應用(其中的SEQ ID NO:192)。 [0344]本發明所用的優選IC43多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:77具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:77 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC43 蛋白包括 SEQ ID NO:77的變體。(b)的優選片段包含來自SEQ ID NO:77的表位。其他優選片段缺少SEQ ID NO:77C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:77N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:77的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC43的免疫原性片段。
[0345]IC44
[0346]IC44是未鑑定的限制性酶。出於參比目的,全長IC44的胺基酸序列是本文所述的SEQ IDNO:78o在R6基因組中,IC44是sprllOl [84]。參考文獻10中報導了 IC44的免疫應用(其中的SEQ ID NO:195)。
[0347]本發明所用的優選IC44多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:78具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:78 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC44 蛋白包括 SEQ ID NO:78的變體。(b)的優選片段包含來自SEQ ID NO:78的表位。其他優選片段缺少SEQ ID NO:78C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:78N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:78的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC44的免疫原性片段。
[0348]IC45
[0349]IC45是反應調節蛋白。出於參比目的,全長IC45的胺基酸序列是本文所述的SEQIDNO:79o在R6基因組中,IC45是sprll07[84]。參考文獻10中報導了 IC45的免疫應用(其中的 SEQ ID NO: 196) ο
[0350]本發明所用的優選IC45多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:79具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:79 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC45 蛋白包括 SEQ ID NO:79的變體。(b)的優選片段包含來自SEQ ID NO:79的表位。其他優選片段缺少SEQ ID NO:79C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:79N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:79的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC45的免疫原性片段。
[0351]IC46
[0352]IC46是ABC轉運蛋白跨膜通透酶。出於參比目的,全長IC46的胺基酸序列是本文所述的SEQ ID NO:80o在R6基因組中,IC46是sprll20[84]。參考文獻10中報導了 IC46的免疫應用(其中的SEQ ID NO:197)。
[0353]本發明所用的優選IC46多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:80具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:80 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC46 蛋白包括 SEQ ID NO:80的變體。(b)的優選片段包含來自SEQ ID NO:80的表位。其他優選片段缺少SEQ ID NO:80C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:80N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:80的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC46的免疫原性片段。
[0354]IC47
[0355]IC47是信號識別顆粒。出於參比目的,全長IC47的胺基酸序列是本文所述的SEQIDNO:81o在R6基因組中,IC47是sprll66[84]。參考文獻10中報導了 IC47的免疫應用(其中的 SEQ ID NO: 198) ο
[0356]本發明所用的優選IC47多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:81具有 50% 或更高的相同性 (如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:81 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC47 蛋白包括 SEQ ID NO:81的變體。(b)的優選片段包含來自SEQ ID NO:81的表位。其他優選片段缺少SEQ ID NO:81C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:81N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:81的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC47的免疫原性片段。
[0357]IC48
[0358]IC48是N-乙醯基甘露糖胺-6-磷酸2-差向異構酶。出於參比目的,全長IC48的胺基酸序列是本文所述的SEQ IDNO:82。在R6基因組中,IC48是sprl529 [84]。參考文獻10中報導了 IC48的免疫應用(其中的SEQ ID NO:199)。
[0359]本發明所用的優選IC48多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:82具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:82 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC48 蛋白包括 SEQ ID NO:82的變體。(b)的優選片段包含來自SEQ ID NO:82的表位。其他優選片段缺少SEQ ID NO:82C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:82N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:82的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC48的免疫原性片段。
[0360]IC49
[0361]IC49是分支酸合酶。出於參比目的,全長IC49的胺基酸序列是本文所述的SEQIDNO:83o在R6基因組中,IC49是sprl232[84]。參考文獻10中報導了 IC49的免疫應用(其中的 SEQ ID NO:200)。
[0362]本發明所用的優選IC49多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:83具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:83 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC49 蛋白包括 SEQ ID NO:83的變體。(b)的優選片段包含來自SEQ ID NO:83的表位。其他優選片段缺少SEQ ID NO:83C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:83N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:83的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC49 的免疫原性片段。
[0363]IC50
[0364]在參考文獻10中將IC50標註為假擬蛋白。出於參比目的,全長IC50的胺基酸序列是本文所述的SEQ ID NO:84o在R6基因組中,IC50是sprl236[84]。參考文獻10中報導了 IC50的免疫應用(其中的SEQ ID NO:201)。
[0365]本發明所用的優選IC50多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:84具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:84 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC50 蛋白包括 SEQ ID NO:84的變體。(b)的優選片段包含來自SEQ ID NO:84的表位。其他優選片段缺少SEQ ID NO:84C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:84N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:84的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC50的免疫原性片段。
[0366]IC51
[0367]IC51是蛋白酶。出於參比目的,全長IC51的胺基酸序列是本文所述的SEQ ID NO:85。在R6基因組中,IC51是sprl284[84]。參考文獻10中報導了 IC51的免疫應用(其中的 SEQ ID NO:202)。
[0368]本發明所用的優選IC51多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:85具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:85 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC51 蛋白包括 SEQ ID NO:85的變體。(b)的優選片段包含來自SEQ ID NO:85的表位。其他優選片段缺少SEQ ID NO:85C末端的一個或多個胺基酸( 如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:85N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:85的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC51的免疫原性片段。
[0369]IC52
[0370]在參考文獻10中,將IC52標註為氧化還原酶或醛/酮還原酶。出於參比目的,全長IC52的胺基酸序列是本文所述的SEQ ID NO:86。在R6基因組中,IC52是sprl332[84]。參考文獻10中報導了 IC52的免疫應用(其中的SEQ ID NO:203)。
[0371]本發明所用的優選IC52多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:86具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:86 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC52 蛋白包括 SEQ ID NO:86的變體。(b)的優選片段包含來自SEQ ID NO:86的表位。其他優選片段缺少SEQ ID NO:86C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:86N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:86的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC52的免疫原性片段。[0372]IC53
[0373]在參考文獻10中將IC53標註為假擬蛋白。出於參比目的,全長IC53的胺基酸序列是本文所述的SEQ ID NO:87o在R6基因組中,IC53是sprl370[84]。參考文獻10中報導了 IC53的免疫應用(其中的SEQ ID NO:204)。
[0374]本發明所用的優選IC53多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:87具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:87 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC53 蛋白包括 SEQ ID NO:87的變體。(b)的優選片段包含來自SEQ ID NO:87的表位。其他優選片段缺少SEQ ID NO:87C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:87N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:87的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC53的免疫原性片段。
[0375]IC54
[0376]IC54標註為保守性結構域蛋白。出於參比目的,全長IC54的胺基酸序列是本文所述的SEQ ID NO:88o 在R6基因組中,IC54是sprl374[84]。參考文獻10中報導了 IC54的免疫應用(其中的SEQ ID NO:205)。
[0377]本發明所用的優選IC54多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:88具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:88 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC54 蛋白包括 SEQ ID NO:88的變體。(b)的優選片段包含來自SEQ ID NO:88的表位。其他優選片段缺少SEQ ID NO:88C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:88N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:88的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC54的免疫原性片段。
[0378]IC55
[0379]IC55是ABC轉運蛋白底物結合蛋白。出於參比目的,全長IC55的胺基酸序列是本文所述的SEQ ID NO:89o在R6基因組中,IC55是sprl382[84]。參考文獻10中報導了IC55的免疫應用(其中的SEQ ID NO:206)。
[0380]本發明所用的優選IC55多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:89具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:89 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC55 蛋白包括 SEQ ID NO:89的變體。(b)的優選片段包含來自SEQ ID NO:89的表位。其他優選片段缺少SEQ ID NO:89C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:89N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:89的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC55的免疫原性片段。
[0381]IC56
[0382]在參考文獻10中將IC56標註為假擬蛋白。出於參比目的,全長IC56的胺基酸序列是本文所述的SEQ ID NO:90o在R6基因組中,IC56是sprl457[84]。參考文獻10中報導了 IC56的免疫應用(其中的SEQ ID NO:208)。
[0383]本發明所用的優選IC56多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:90具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:90 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC56 蛋白包括 SEQ ID NO:90的變體。(b)的優選片段包含來自SEQ ID NO:90的表位。其他優選片段缺少SEQ ID NO:90C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:90N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:90的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC56的免疫原性片段。
[0384]IC57
[0385]IC57是細胞分裂啟動蛋白。出於參比目的,全長IC57的胺基酸序列是本文所述的SEQ IDNO:91o在R6基因組中,IC57是sprl505 [84]。參考文獻10中報導了 IC57的免疫應用(其中的SEQ ID NO:209)。
[0386]本發明所用的優選IC57多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:91具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:91 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC57 蛋白包括 SEQ ID NO:91的變體。(b)的優選片段包含來自SEQ ID NO:91的表位。其他優選片段缺少SEQ ID NO:91C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:91N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:91的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC57的免疫原性片段。
[0387]IC58
[0388]在參考文獻10中將IC58標註為ylmF蛋白。出於參比目的,全長IC58的胺基酸序列是本文所述的SEQ ID NO:92o在R6基因組中,IC58是sprl508[84]。參考文獻10中報導了 IC58的免疫應用(其中的SEQ ID NO:210)。
[0389]本發明所用的優選IC58多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:92具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:92 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC58 蛋白包括 SEQ ID NO:92的變體。(b)的優選片段包含來自SEQ ID NO:92的表位。其他優選片段缺少SEQ ID NO:92C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:92N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:92的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC58的免疫原性片段。
[0390]IC59
[0391]IC59是N-乙醯基神經氨酸裂合酶亞基。出於參比目的,全長IC59的胺基酸序列是本文所述的SEQ ID NO:93o在R6基因組中,IC59是sprll86[84]。參考文獻10中報導了 IC59的免疫應用(其中的SEQ ID NO:211)。
[0392]本發明所用的優選IC59多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:93具有 50% 或更高的相同性(如 60%、65%、70 %、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:93 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC59 蛋白包括 SEQ ID NO:93的變體。(b)的優選片段包含來自SEQ ID NO:93的表位。其他優選片段缺少SEQ ID NO:93C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:93N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:93的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC59的免疫原性片段。
[0393]IC60
[0394]IC60是真核型絲氨酸/蘇氨酸激酶(StkP)。出於參比目的,全長IC60的胺基酸序列是本文所述的SEQ ID NO:94o在R6基因組中,IC60是sprl577[84]。參考文獻10中報導了 IC60的免疫應用(其中的SEQ ID NO:214),參考文獻78中報導它是先導候選疫苗。
[0395]本發明所用的優選IC60多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:94具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:94 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC60 蛋白包括 SEQ ID NO:94的變體。(b)的優選片段包含來自SEQ ID NO:94的表位。其他優選片段缺少SEQ ID NO:94C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:94N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:94的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC60的免疫原性片段。另一有用片段是參考文獻59公開的SEQ IDN0:2(對應於本文SEQ ID NO:94的胺基酸345-659)。
[0396]IC61
[0397]IC61是甲硫氨醯基-tRNA甲醯基轉移酶。出於參比目的,全長IC61的胺基酸序列是本文所述的SEQ ID NO:95o在R6基因組中,IC61是sprl580[84]。參考文獻10中報導了 IC61的免疫應用(其中的SEQ ID NO:215)。[0398]本發明所用的優選IC61多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:95具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:95 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC61 蛋白包括 SEQ ID NO:95的變體。(b)的優選片段包含來自SEQ ID NO:95的表位。其他優選片段缺少SEQ ID NO:95C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:95N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:95的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC61的免疫原性片段。
[0399]IC62
[0400]IC62是易位酶。出於參比目的,全長IC62的胺基酸序列是本文所述的SEQ ID NO:96。在R6基因組中,IC62是sprl544[84]。參考文獻10中報導了 IC62的免疫應用(其中的 SEQ ID NO:216)。
[0401]本發明所用的優選IC62多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:96具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:96 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC62 蛋白包括 SEQ ID NO:96的變體。(b)的優選片段包含來自SEQ ID NO:96的表位。其他優選片段缺少SEQ ID NO:96C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:96N末端的一個或多個 胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:96的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC62的免疫原性片段。
[0402]IC63
[0403]在參考文獻10中將IC63標註為細胞壁表面錨定蛋白家族的蛋白質。出於參比目的,全長IC63的胺基酸序列是本文所述的SEQ ID NO:97。在R6基因組中,IC63是sprl403[84]o參考文獻10中報導了 IC63的免疫應用(其中的SEQ ID NO:217)。
[0404]本發明所用的優選IC63多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:97具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:97 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC63 蛋白包括 SEQ ID NO:97的變體。(b)的優選片段包含來自SEQ ID NO:97的表位。其他優選片段缺少SEQ ID NO:97C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:97N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:97的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC63的免疫原性片段。
[0405]IC64[0406]在參考文獻10中將IC64標註為推定的全身應激蛋白24。出於參比目的,全長IC64的胺基酸序列是本文所述的SEQ ID NO:98。在R6基因組中,IC64是sprl625[84]。參考文獻10中報導了 IC64的免疫應用(其中的SEQ ID NO:218)。
[0407]本發明所用的優選IC64多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:98具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:98 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC64 蛋白包括 SEQ ID NO:98的變體。(b)的優選片段包含來自SEQ ID NO:98的表位。其他優選片段缺少SEQ ID NO:98C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:98N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:98的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC64的免疫原性片段。
[0408]IC65
[0409]IC65是ABC轉運蛋白ATP-結合蛋白。出於參比目的,全長IC65的胺基酸序列是本文所述的SEQ ID NO:99o在R6基因組中,IC65是sprl704[84]。參考文獻10中報導了IC65的免疫應用(其中的SEQ ID NO:219)。
[0410]本發明所用的優選IC65多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:99具有 50% 或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5% 或更高);和/或(b)包含 SEQ ID NO:99 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC65 蛋白包括 SEQ ID NO:99的變體。(b)的優選片段包含來自SEQ ID NO:99的表位。其他優選片段缺少SEQ ID NO:99C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:99N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:99的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC65的免疫原性片段。
[0411]IC66
[0412]如上所述,IC66是sprl707的變體形式。可用於本發明的IC66多肽包含某胺基酸序列,該序列:(a)與SEQ IDNO:100具有50%或更高的相同性(如60%、65%、70%、75%、80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ ID NO:100的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如 8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些IC66蛋白包括SEQ ID NO:100的變體。(b)的優選片段包含來自SEQ ID NO:100的表位。其他優選片段缺少SEQ ID NO:100C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、
9、10、15、20、25或更多個)和/或SEQ IDNO: 100N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、 15、20、25或更多個),而保留SEQ ID NO:100的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0413]IC67[0414]IC67是枯草桿菌蛋白酶-樣絲氨酸蛋白酶。出於參比目的,全長IC67的胺基酸序列是本文所述的SEQ IDNO:101。在R6基因組中,IC67是sprl771 [84]。參考文獻10中報導了 IC67的免疫應用(其中的SEQ ID NO:222)。
[0415]本發明所用的優選IC67多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:101具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:101 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC67 蛋白包括 SEQ ID NO:101的變體。(b)的優選片段包含來自SEQ ID NO:101的表位。其他優選片段缺少SEQ ID NO:IOlC末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:101N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:101的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC67的免疫原性片段。
[0416]IC68
[0417]IC68是Cmp-結合因子I。出於參比目的,全長IC68的胺基酸序列是本文所述的SEQ ID NO:102。在R6基因組中,IC68是sprl794[84]。參考文獻10中報導了 IC68的免疫應用(其中的SEQ ID NO:223)。
[0418]本發明所用 的優選IC68多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:102具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:102 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC68 蛋白包括 SEQ ID NO:102的變體。(b)的優選片段包含來自SEQ ID NO:102的表位。其他優選片段缺少SEQ ID NO:102C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:102N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:102的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC68的免疫原性片段。
[0419]IC69
[0420]在參考文獻10中將IC69標註為細胞壁表面錨定蛋白家族的蛋白質。出於參比目的,全長IC69的胺基酸序列是本文所述的SEQ IDN0:103。在R6基因組中,IC69是sprl806[84]。參考文獻10中報導了 IC69的免疫應用(其中的SEQ ID NO:224)。
[0421]本發明所用的優選IC69多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:103具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO:103 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC69 蛋白包括 SEQ ID NO:103的變體。(b)的優選片段包含來自SEQ ID NO:103的表位。其他優選片段缺少SEQ ID NO:103C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:103N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:103的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC69的免疫原性片段。
[0422]IC70
[0423]IC70是分解代謝物控制蛋白A。出於參比目的,全長IC70的胺基酸序列是本文所述的SEQ ID NO: 104。在R6基因組中,IC70是sprl813[84]。參考文獻10中報導了 IC70的免疫應用(其中的SEQ ID NO:225)。
[0424]本發明所用的優選IC70多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:104具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:104 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC70 蛋白包括 SEQ ID NO:104的變體。(b)的優選片段包含來自SEQ ID NO:104的表位。其他優選片段缺少SEQ ID NO:104C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:104N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:104的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC70的免疫原性片段。
[0425]IC71
[0426]IC71是β-葡糖苷酶。出於參比目的,全長IC71的胺基酸序列是本文所述的SEQID NO:105。在R6基因組中,IC71是sprl833[84]。參考文獻10中報導了 IC71的免疫應用(其中的 SEQ ID NO:226)。
[0427]本發明所用的優選IC71多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:105具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:105 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC71 蛋白包括 SEQ IDNO:105的變體。(b)的優選片段包含來自SEQ ID NO:105的表位。其他優選片段缺少SEQ ID NO:105C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:105N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:105的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC71的免疫原性片段。
[0428]IC72
[0429]在參考文獻10中將IC72標註為假擬蛋白。出於參比目的,全長IC72的胺基酸序列是本文所述的SEQ IDNO: 106。在R6基因組中,IC72是sprl838 [84]。參考文獻10中報導了 IC72的免疫應用(其中的SEQ ID NO:227)。
[0430]本發明所用的優選IC72多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:106具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:106 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC72 蛋白包括 SEQ ID NO:106的變體。(b)的優選片段包含來自SEQ ID NO:106的表位。其他優選片段缺少SEQ ID NO:106C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:106N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:106的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC72的免疫原性片段。
[0431]IC73
[0432]在參考文獻10中將IC73標註為假擬蛋白。出於參比目的,全長IC73的胺基酸序列是本文所述的SEQ IDNO: 107。在R6基因組中,IC73是sprl850 [84]。參考文獻10中報導了 IC73的免疫應用(其中的SEQ ID NO:228)。
[0433]本發明所用的優選IC73多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:107具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:107 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC73 蛋白包括 SEQ ID NO:107的變體。(b)的優選片段包含來自SEQ ID NO:107的表位。其他優選片段缺少SEQ ID NO:107C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:107N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:107的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC73的免疫原性片段。
[0434]IC74 [0435]在參考文獻10中將IC74標註為假擬蛋白。出於參比目的,全長IC74的胺基酸序列是本文所述的SEQ IDNO: 108。在R6基因組中,IC74是sprl859 [84]。參考文獻10中報導了 IC74的免疫應用(其中的SEQ ID NO:229)。
[0436]本發明所用的優選IC74多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:108具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:108 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC74 蛋白包括 SEQ ID NO:108的變體。(b)的優選片段包含來自SEQ ID NO:108的表位。其他優選片段缺少SEQ ID NO:108C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:108N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:108的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC74的免疫原性片段。
[0437]IC75
[0438]IC75是感受態蛋白。出於參比目的,全長IC75的胺基酸序列是本文所述的SEQ IDNO:109。在R6基因組中,IC75是sprl862[84]。參考文獻10中報導了 IC75的免疫應用(其中的 SEQ ID NO:230)。
[0439]本發明所用的優選IC75多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:109具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:109 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC75 蛋白包括 SEQ ID NO:109的變體。(b)的優選片段包含來自SEQ ID NO:109的表位。其他優選片段缺少SEQ ID NO:109C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:109N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:109的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC75的免疫原性片段。
[0440]IC76
[0441]IC76是UTP-葡萄糖-1-磷酸尿苷基轉移酶。出於參比目的,全長IC76的胺基酸序列是本文所述的SEQ IDNO:110。在R6基因組中,IC76是sprl903 [84]。參考文獻10中報導了 IC76的免疫應用(其中的SEQ ID NO:231)。
[0442]本發明所用的優選IC76多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:110具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:110 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC76 蛋白包括 SEQ ID NO:110的變體。(b)的優選片段包含來自SEQ ID NO:110的表位。其他優選片段缺少SEQ ID NO:IlOC末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:110N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:110的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC76的免疫原性片段。
[0443]IC77
[0444]IC77是青黴素結合蛋白lb。出於參比目的,全長IC77的胺基酸序列是本文所述的SEQ ID NO:111。在R6基因組中,IC77是sprl909 [84]。參考文獻10中報導了 IC77的免疫應用(其中的SEQ ID NO:232)。
[0445]本發明所用的優選IC77多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:111具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:111 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC77 蛋白包括 SEQ IDNO:111的變體。(b)的優選片段包含來自SEQ ID NO:111的表位。其他優選片段缺少SEQ ID NO:IllC末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:111N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:111的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC77的免疫原性片段。
[0446]IC78
[0447]IC78是ABC轉運蛋白底物結合蛋白-麥芽糖/麥芽糊精。出於參比目的,全長IC78的胺基酸序列是本文所述的SEQ ID NO:112。在R6基因組中,IC78是sprl918 [84]。參考文獻10中報導了 IC78的免疫應用(其中的SEQ ID NO:233)。
[0448]本發明所用的優選IC78多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:112具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:112 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC78 蛋白包括 SEQ IDNO:112的變體。(b)的優選片段包含來自SEQ ID NO:112的表位。其他優選片段缺少SEQ ID NO:112C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:112N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:112的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC78的免疫原性片段。
[0449]IC79
[0450]在參考文獻 10中將IC79標註為假擬蛋白。出於參比目的,全長IC79的胺基酸序列是本文所述的SEQ IDNO:113。在R6基因組中,IC79是spr2120 [84]。參考文獻10中報導了 IC79的免疫應用(其中的SEQ ID NO:234)。
[0451]本發明所用的優選IC79多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:113具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:113 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC79 蛋白包括 SEQ ID NO:113的變體。(b)的優選片段包含來自SEQ ID NO:113的表位。其他優選片段缺少SEQ ID NO:113C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:113N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:113的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC79的免疫原性片段。
[0452]IC80
[0453]IC80是推定的轉酮酶η-末端部分。出於參比目的,全長IC80的胺基酸序列是本文所述的SEQ IDN0:114。在R6基因組中,IC80是sprl937 [84]。參考文獻10中報導了IC80的免疫應用(其中的SEQ ID NO:235)。
[0454]本發明所用的優選IC80多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:114具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:114 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC80 蛋白包括 SEQ ID NO:114的變體。(b)的優選片段包含來自SEQ ID NO:114的表位。其他優選片段缺少SEQ ID NO:114C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:114N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:114的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC80的免疫原性片段。[0455]IC81
[0456]IC81是膽鹼結合蛋白。出於參比目的,全長IC81的胺基酸序列是本文所述的SEQIDN0:115。其C-末端與IC3有關。參考文獻10中報導了 IC81的免疫應用(其中的SEQID NO:236)。
[0457]本發明所用的優選IC81多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:115具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:115 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC81 蛋白包括 SEQ ID NO:115的變體。(b)的優選片段包含來自SEQ ID NO:115的表位。其他優選片段缺少SEQ ID NO:115C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:115N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:115的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC81的免疫原性片段。
[0458]IC82
[0459]IC82是.糖基水解酶相關蛋白。出於參比目的,全長IC82的胺基酸序列是本文所述的SEQ IDN0:116。在R6基因組中,IC82是spr2141 [84]。參考文獻10中報導了 IC82的免疫應用(其中的SEQ ID NO:237)。 [0460]本發明所用的優選IC82多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:116具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:116 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC82 蛋白包括 SEQ ID NO:116的變體。(b)的優選片段包含來自SEQ ID NO:116的表位。其他優選片段缺少SEQ ID NO:116C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:116N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:116的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC82的免疫原性片段。
[0461]IC83
[0462]在參考文獻10中將IC83標註為假擬蛋白。出於參比目的,全長IC83的胺基酸序列是本文所述的SEQ IDNO:117。在R6基因組中,IC83是sprl983 [84]。參考文獻10中報導了 IC83的免疫應用(其中的SEQ ID NO:238)。
[0463]本發明所用的優選IC83多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:117具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:117 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC83 蛋白包括 SEQ ID NO:117的變體。(b)的優選片段包含來自SEQ ID NO:117的表位。其他優選片段缺少SEQ ID NO:117C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:117N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:117的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC83的免疫原性片段。
[0464]IC84
[0465]IC84是III類應激反應相關性ATP酶。出於參比目的,全長IC84的胺基酸序列是本文所述的SEQ IDNO:118。在R6基因組中,IC84是spr2000 [84]。參考文獻10中報導了IC84的免疫應用(其中的SEQ ID NO:240)。
[0466]本發明所用的優選IC84多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:118具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:118 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC84 蛋白包括 SEQ ID NO:118的變體。(b)的優選片段包含來自SEQ ID NO:118的表位。其他優選片段缺少SEQ ID NO:118C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:118N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:118的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC84的免疫原性片段。
[0467]IC85
[0468]IC85是SEQ ID NO:23的變體,如上所述(SEQ ID NO:119)。可用於本發明的IC85多肽包含某胺基酸序列,該序列:(a)與SEQ IDNO:119具有50%或更高的相同性(如60%、65%,70%,75%,80%,85%,9 0%,91 %,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和/或(b)包含SEQ ID NO:119的至少』η』個連續胺基酸的片段,其中』η』是 7 個或更多個(如 8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些IC85蛋白包括SEQ ID NO:119的變體。(b)的優選片段包含來自SEQIDNO:119的表位。其他優選片段缺少SEQ IDNO:119C末端的一個或多個胺基酸(如1、2、
3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:119N末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:119 的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0469]IC86
[0470]IC86是50S核糖體蛋白L9。出於參比目的,全長IC86的胺基酸序列是本文所述的SEQ ID NO:120。在R6基因組中,IC86是spr2009[84]。參考文獻10中報導了 IC86的免疫應用(其中的SEQ ID NO:242)。
[0471]本發明所用的優選IC86多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:120具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO:120 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC86 蛋白包括 SEQ ID NO:120的變體。(b)的優選片段包含來自SEQ ID NO:120的表位。其他優選片段缺少SEQ ID NO:120C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:120N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:120的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC86的免疫原性片段。
[0472]IC87
[0473]在參考文獻10中將IC87標註為假擬蛋白。出於參比目的,全長IC87的胺基酸序列是本文所述的SEQ IDNO: 166。在R6基因組中,IC87是spr0987 [84]。參考文獻10中報導了 IC87的免疫應用(其中的SEQ ID NO:288)。
[0474]本發明所用的優選IC87多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:166具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO:166 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC87 蛋白包括 SEQ ID NO:166的變體。(b)的優選片段包含來自SEQ ID NO:166的表位。其他優選片段缺少SEQ ID NO:166C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:166N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:166的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC87的免疫原性片段。
[0475]IC88
[0476]IC88是膽鹼結合蛋白。出於參比目的,全長IC88的胺基酸序列是本文所述的SEQID NO:122。在R6基因組中,IC88是sprl274[84]。參考文獻10中報導了 IC88的免疫應用(其中的 SEQ ID NO:244)。
[0477]本發明所用的優選IC88多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:122具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:122 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC88 蛋白包括 SEQ IDNO:122的變體。(b)的優選片段包含來自SEQ ID NO:122的表位。其他優選片段缺少SEQ ID NO:122C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:122N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:122的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC88的免疫原性片段。
[0478]IC89
[0479]在參考文獻10中將IC89標註為假擬蛋白。出於參比目的,全長IC89的胺基酸序列是本文所述的SEQ ID NO:123。參考文獻10中報導了 IC89的免疫應用(其中的SEQ IDNO:245)。
[0480]本發明所用的優選IC89多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:123具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:123 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC89 蛋白包括 SEQ ID NO:123的變體。(b)的優選片段包含來自SEQ ID NO:123的表位。其他優選片段缺少SEQ ID NO:123C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:123N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:123的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC89的免疫原性片段。
[0481]IC90
[0482]在參考文獻10中將IC90標註為假擬蛋白。出於參比目的,全長IC90的胺基酸序列是本文所述的SEQ ID NO:124。參考文獻10中報導了 IC90的免疫應用(其中的SEQ IDNO:246)。
[0483]本發明所用的優選IC90多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:124具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:124 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC90 蛋白包括 SEQ IDNO:124的變體。(b)的優選片段包含來自SEQ ID NO:124的表位。其他優選片段缺少SEQ ID NO:124C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:124N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:124的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC90的免疫原性片段。
[0484]IC91
[0485]在參考文獻10中將IC91標註為假擬蛋白。出於參比目的,全長IC91的胺基酸序列是本文所述的SEQ IDNO: 125。在R6基因組中,IC91是spr0415 [84]。參考文獻10中報導了 IC91的免疫應用(其中的SEQ ID NO:247)。
[0486]本發明所用的優選IC91多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:125具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:125 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC91 蛋白包括 SEQ ID NO:125的變體。(b)的優選片段包含來自SEQ ID NO:125的表位。其他優選片段缺少SEQ ID NO:125C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:125N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:125的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC91的免疫原性片段。
[0487]IC92
[0488]在參考文獻10中將IC92標註為假擬蛋白。出於參比目的,全長IC92的胺基酸序列是本文所述的SEQ IDNO: 126。在R6基因組中,IC92是spr0695 [84]。參考文獻10中報導了 IC92的免疫應用(其中的SEQ ID NO:248)。
[0489]本發明所用的優選IC92多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:126具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:126 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC92 蛋白包括 SEQ ID NO:126的變體。(b)的優選片段包含來自SEQ ID NO:126的表位。其他優選片段缺少SEQ ID NO:126C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:126N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:126的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC92的免疫原性片段。
[0490]IC93
[0491]在參考文獻10中將IC93標註為假擬蛋白。出於參比目的,全長IC93的胺基酸序列是本文所述的SEQ IDNO: 127。在R6基因 組中,IC93是sprl334 [84]。參考文獻10中報導了 IC93的免疫應用(其中的SEQ ID NO:249)。
[0492]本發明所用的優選IC93多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:127具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:127 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC93 蛋白包括 SEQ ID NO:127的變體。(b)的優選片段包含來自SEQ ID NO:127的表位。其他優選片段缺少SEQ ID NO:127C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:127N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:127的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC93的免疫原性片段。
[0493]IC94
[0494]在參考文獻10中將IC94標註為假擬蛋白。出於參比目的,全長IC94的胺基酸序列是本文所述的SEQ IDNO: 128。在R6基因組中,IC94是spr0242 [84]。參考文獻10中報導了 IC94的免疫應用(其中的SEQ ID NO:250)。
[0495]本發明所用的優選IC94多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:128具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:128 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC94 蛋白包括 SEQ ID NO:128的變體。(b)的優選片段包含來自SEQ ID NO:128的表位。其他優選片段缺少SEQ ID NO:128C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:128N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:128的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC94的免疫原性片段。
[0496]IC95
[0497]在參考文獻10中將IC95標註為假擬蛋白。出於參比目的,全長IC95的胺基酸序列是本文所述的SEQ IDNO: 129。在R6基因組中,IC95是sprl367 [84]。參考文獻10中報導了 IC95的免疫應用(其中的SEQ ID NO:251)。
[0498]本發明所用的優選IC95多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:129具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:129 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC95 蛋白包括 SEQ IDNO:129的變體。(b)的優選片段包含來自SEQ ID NO:129的表位。其他優選片段缺少SEQ ID NO:129C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:129N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:129的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC95的免疫原性片段。
[0499]IC96
[0500]在參考文獻10中將IC96標註為假擬蛋白。出於參比目的,全長IC96的胺基酸序列是本文所述的SEQ ID NO:130。參考文獻10中報導了 IC96的免疫應用(其中的SEQ IDNO:252)。
[0501]本發明所用的優選IC96多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:130具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:130 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC96 蛋白包括 SEQ ID NO:130的變體。(b)的優選片段 包含來自SEQ ID NO:130的表位。其他優選片段缺少SEQ ID NO:130C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:130N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:130的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC96的免疫原性片段。
[0502]IC97
[0503]在參考文獻10中將IC97標註為假擬蛋白。出於參比目的,全長IC97的胺基酸序列是本文所述的SEQ IDNO:131。在R6基因組中,IC97是sprl502 [84]。參考文獻10中報導了 IC97的免疫應用(其中的SEQ ID NO:253)。
[0504]本發明所用的優選IC97多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:131具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:131 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC97 蛋白包括 SEQ ID NO:131的變體。(b)的優選片段包含來自SEQ ID NO:131的表位。其他優選片段缺少SEQ ID NO:131C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:131N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:131的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC97的免疫原性片段。
[0505]IC98
[0506]在參考文獻10中將IC98標註為假擬蛋白。出於參比目的,全長IC98的胺基酸序列是本文所述的SEQ IDNO: 132。在R6基因組中,IC98是spr0730 [84]。參考文獻10中報導了 IC98的免疫應用(其中的SEQ ID NO:254)。
[0507]本發明所用的優選IC98多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:132具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:132 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC98 蛋白包括 SEQ ID NO:132的變體。(b)的優選片段包含來自SEQ ID NO:132的表位。其他優選片段缺少SEQ ID NO:132C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:132N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:132的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC98的免疫原性片段。
[0508]IC99
[0509]在參考文獻 10中將IC99標註為假擬蛋白。出於參比目的,全長IC99的胺基酸序列是本文所述的SEQ IDNO: 133。在R6基因組中,IC99是sprl961 [84]。參考文獻10中報導了 IC99的免疫應用(其中的SEQ ID NO:255)。
[0510]本發明所用的優選IC99多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:133具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:133 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC99 蛋白包括 SEQ IDNO:133的變體。(b)的優選片段包含來自SEQ ID NO:133的表位。其他優選片段缺少SEQ ID NO:133C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:133N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ ID NO:133的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC99的免疫原性片段。
[0511]IC100
[0512]在參考文獻10中將IC100標註為假擬蛋白。出於參比目的,全長IC100的胺基酸序列是本文所述的SEQ ID NO:134。參考文獻10中報導了 IC100的免疫應用(其中的SEQID NO:256)。
[0513]本發明所用的優選IC100多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:134具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:134 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC100 蛋白包括 SEQ ID NO:134的變體。(b)的優選片段包含來自SEQ ID NO:134的表位。其他優選片段缺少SEQ IDNO:134C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:134N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:134的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC100的免疫原性片段。
[0514]IClOl
[0515]在參考文獻10中將IClOl標註為假擬蛋白。出於參比目的,全長IClOl的胺基酸序列是本文所述的SEQ IDN0:135。在R6基因組中,IClOl是spr0516 [84]。參考文獻10中報導了 IClOl的免疫應用(其中的SEQ ID NO:257)。
[0516]本發明所用的優選IClOl多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:135具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:135 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IClOl 蛋白包括 SEQ ID NO:135的變體。(b)的優選片段包含來自SEQ ID NO:135的表位。其他優選片段缺少SEQ IDNO:135C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:135N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:135的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IClOl的免疫原性片段。
[0517]IC102
[0518]在參考文獻10中將IC102標註為假擬蛋白。出於參比目的,全長IC102的胺基酸序列是本文所述的SEQ IDN0:136。在R6基因組中,IC102是sprl785 [84]。參考文獻10中報導了 IC102的免疫應用(其中的SEQ ID NO:258)。
[0519]本發明所用的優選IC102多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:136具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:136 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC102 蛋白包括 SEQ ID NO:136的變體。(b)的優選片段包含來自SEQ ID NO:136的表位。其他優選片段缺少SEQ IDNO:136C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:136N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:136的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC102的免疫原性片段。
[0520]IC103
[0521]在參考文獻10中將IC103標註為假擬蛋白。出於參比目的,全長IC103的胺基酸序列是本文所述的SEQ IDN0:137。在R6基因組中,IC103是spr0215 [84]。參考文獻10中報導了 IC103的免疫應用(其中的SEQ ID NO:259)。
[0522]本發明所用的優選IC103多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:137具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:137 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC103 蛋白包括 SEQ ID NO:137的變體。(b)的優選片段包含來自SEQ ID NO:137的表位。其他優選片段缺少SEQ IDNO:137C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:137N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:137的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC103的免疫原性片段。
[0523]IC104
[0524]在參考文獻10中將IC104標註為假擬蛋白。出於參比目的,全長IC104的胺基酸序列是本文所述的SEQ ID NO:1380在R6基因組中,IC104是sprl815[84]。參考文獻10中報導了 IC104的免疫應用(其中的SEQ ID NO:260)。
[0525]本發明所用的優選IC104多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:138具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:138 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC104 蛋白包括 SEQ ID NO:138的變體。(b)的優選片段包含來自SEQ ID NO:138的表位。其他優選片段缺少SEQ IDNO:138C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:138N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:138的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC104的免疫原性片段。
[0526]IC105
[0527]在參考文獻10中將IC105標註為假擬蛋白。出於參比目的,全長IC105的胺基酸序列是本文所述的SEQ IDN0:139。在R6基因組中,IC105是spr0102 [84]。參考文獻10中報導了 IC105的免疫應用(其中的SEQ ID NO:261)。
[0528]本發明所用的優選IC105多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:139具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:139 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC105 蛋白包括 SEQ ID NO:139的變體。(b)的優選片段包含來自SEQ ID NO:139的表位。其他優選片段缺少SEQ IDNO:139C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:139N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:139的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC105的免疫原性片段。
[0529]IC106
[0530]在參考文獻10中將IC106標註為假擬蛋白。出於參比目的,全長IC106的胺基酸序列是本文所述的SEQ ID NO:140。在R6基因組中,IC106是sprl994[84]。參考文獻10中報導了 IC106的免疫應用(其中的SEQ ID NO:262)。[0531]本發明所用的優選IC106多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:140具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:140 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC106 蛋白包括 SEQ ID NO:140的變體。(b)的優選片段包含來自SEQ ID NO:140的表位。其他優選片段缺少SEQ IDNO:140C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:140N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:140的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC106的免疫原性片段。
[0532]IC107
[0533]在參考文獻10中將IC107標註為假擬蛋白。出於參比目的,全長IC107的胺基酸序列是本文所述的SEQ ID NO:141。參考文獻10中報導了 IC107的免疫應用(其中的SEQID NO:263)。
[0534]本發明所用的優選IC107多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:141具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:141 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC107 蛋白包括 SEQ ID NO:141的變體。(b)的優選片段包含來自SEQ ID NO:141的表位。其他優選片段缺少SEQ IDNO:141C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:141N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:141的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC107的免疫原性片段。
[0535]IC108
[0536]在參考文獻10中將IC108標註為假擬蛋白。出於參比目的,全長IC108的胺基酸序列是本文所述的SEQ ID NO:142。參考文獻10中報導了 IC108的免疫應用(其中的SEQID NO:264)。
[0537]本發明所用的優選IC108多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:142具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:142 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC108 蛋白包括 SEQ ID NO:142的變體。(b)的優選片段包含來自SEQ ID NO:142的表位。其他優選片段缺少SEQ IDNO:142C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:142 N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:142的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC108的免疫原性片段。
[0538]IC109[0539]在參考文獻10中將IC109標註為假擬蛋白。出於參比目的,全長IC109的胺基酸序列是本文所述的SEQ ID NO:143。在R6基因組中,IC109是spr0309[84]。參考文獻10中報導了 IC109的免疫應用(其中的SEQ ID NO:265)。
[0540]本發明所用的優選IC109多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:143具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:143 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC109 蛋白包括 SEQ ID NO:143的變體。(b)的優選片段包含來自SEQ ID NO:143的表位。其他優選片段缺少SEQ IDNO:143C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:143N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:143的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC109的免疫原性片段。
[0541]ICllO
[0542]在參考文獻10中將ICllO標註為假擬蛋白。出於參比目的,全長ICllO的胺基酸序列是本文所述的SEQ IDN0:144。在R6基因組中,ICllO是sprl070[84]。參考文獻10中報導了 ICllO的免疫應用(其中的SEQ IDNO:266)。
[0543]本發明所用的優選ICllO多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:144具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:144 的至少』 η』個連續胺基酸 的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 ICllO 蛋白包括 SEQ ID NO:144的變體。(b)的優選片段包含來自SEQ ID NO:144的表位。其他優選片段缺少SEQ IDNO:144C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:144N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:144的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 ICllO的免疫原性片段。
[0544]IClll
[0545]在參考文獻10中將IClll標註為假擬蛋白。出於參比目的,全長IClll的胺基酸序列是本文所述的SEQ IDN0:145。在R6基因組中,IClll是spr0258[84]。參考文獻10中報導了 IClll的免疫應用(其中的SEQ IDNO:267)。
[0546]本發明所用的優選IClll多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:145具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO:145 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IClll 蛋白包括 SEQ ID NO:145的變體。(b)的優選片段包含來自SEQ ID NO:145的表位。其他優選片段缺少SEQ IDNO:145C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:145N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:145的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IClll的免疫原性片段。
[0547]ICl 12
[0548]在參考文獻10中將ICl 12標註為假擬蛋白。出於參比目的,全長ICl 12的胺基酸序列是本文所述的SEQ ID NO:146。在R6基因組中,IC112是spr0254[84]。參考文獻10中報導了 ICl 12的免疫應用(其中的SEQ IDNO:268)。
[0549]本發明所用的優選ICl 12多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:146具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:146 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC112 蛋白包括 SEQ ID NO:146的變體。(b)的優選片段包含來自SEQ ID NO:146的表位。其他優選片段缺少SEQ IDNO:146C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:146N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:146的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC112的免疫原性片段。 [0550]ICl13
[0551]在參考文獻10中將ICl 13標註為假擬蛋白。出於參比目的,全長ICl 13的胺基酸序列是本文所述的SEQ IDN0:147。在R6基因組中,IC113是spr0171 [84]。參考文獻10中報導了 ICl 13的免疫應用(其中的SEQ IDNO:269)。
[0552]本發明所用的優選ICl 13多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:147具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:147 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC113 蛋白包括 SEQ ID NO:147的變體。(b)的優選片段包含來自SEQ ID NO:147的表位。其他優選片段缺少SEQ IDNO:147C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:147N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:147的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC113的免疫原性片段。
[0553]ICl 14
[0554]在參考文獻10中將ICl 14標註為假擬蛋白。出於參比目的,全長ICl 14的胺基酸序列是本文所述的SEQ ID NO:148。參考文獻10中報導了 IC114的免疫應用(其中的SEQID NO:270)。
[0555]本發明所用的優選ICl 14多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:148具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:148 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC114 蛋白包括 SEQ ID NO:148的變體。(b)的優選片段包含來自SEQ ID NO:148的表位。其他優選片段缺少SEQ IDNO:148C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:148N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:148的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC114的免疫原性片段。
[0556]ICl15
[0557]在參考文獻10中將ICl 15標註為假擬蛋白。出於參比目的,全長ICl 15的胺基酸序列是本文所述的SEQ ID NO:149。在R6基因組中,IC115是spr0464[84]。參考文獻10中報導了 ICl 15的免疫應用(其中的SEQ IDNO:271)。
[0558]本發明所用的優選ICl 15多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:149具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:149 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC115 蛋白包括 SEQ ID NO:149的變體。(b)的優選片段包含來自SEQ ID NO:149的表位。其他優選片段缺少SEQ IDNO:149C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:149N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:149的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC115的免疫原性片段。
[0559]ICl 16
[0560]在參考文獻10中將ICl 16標註為假擬蛋白。出於參比目的,全長ICl 16的胺基酸序列是本文所述的SEQ IDN0:150。在R6基因組中,IC116是spr0026[84]。參考文獻10中報導了 ICl 16的免疫應用(其中的SEQ IDNO:272)。
[0561]本發明所用的優選ICl 16多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:150具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:150 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC116 蛋白包括 SEQ ID NO:150的變體。(b)的優選片段包含來自SEQ ID NO:150的表位。其他優選片段缺少SEQ IDNO:150C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:150N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:150的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC116的免疫原性片段。
[0562]ICl 17
[0563]在參考文獻10中將ICl 17標註為假擬蛋白。出於參比目的,全長ICl 17的胺基酸序列是本文所述的SEQ IDN0:151。在R6基因組中,IC117是sprl652[84]。參考文獻10中報導了 ICl 17的免疫應用(其中的SEQ IDNO:273)。
[0564]本發明所用的優選IC117多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:151具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:151 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC117 蛋白包括 SEQ ID NO:151的變體。(b)的優選片段包含來自SEQ ID NO:151的表位。其他優選片段缺少SEQ IDNO:151C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:151N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:151的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC117的免疫原性片段。
[0565]ICl 18
[0566]在參考文獻10中將ICl 18標註為假擬蛋白。出於參比目的,全長ICl 18的胺基酸序列是本文所述的SEQ IDN0:152。在R6基因組中,IC118是sprl783[84]。參考文獻10中報導了 ICl 18的免疫應用(其中的SEQ IDNO:274)。
[0567]本發明所用的優選ICl 18多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:152具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:152 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC118 蛋白包括 SEQ ID NO:152的變體。(b)的優選片段包含來自SEQ ID NO:152的表位。其他優選片段缺少SEQ IDNO:152C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:152N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:152的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC118的免疫原性片段。
[0568]ICl 19
[0569]在參考文獻10中將ICl 19標註為假擬蛋白。出於參比目的,全長ICl 19的胺基酸序列是本文所述的SEQ ID NO:153。參考文獻10中報導了 IC119的免疫應用(其中的SEQID NO:275)。
[0570]本發明所用的優選ICl 19多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:153具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:153 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC119 蛋白包括 SEQ ID NO:153的變體。(b)的優選片段包含來自SEQ ID NO:153的表位。其他優選片段缺少SEQ IDNO:153C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:153N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:153的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC119的免疫原性片段。
[0571]IC120
[0572]在參考文獻10中將IC120標註為假擬蛋白。出於參比目的,全長IC120的胺基酸序列是本文所述的SEQ IDN0:154。在R6基因組中,IC120是sprll53[84]。參考文獻10中報導了 IC120的免疫應用(其中的SEQ ID NO:276)。
[0573]本發明所用的優選IC120多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:154具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:154 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC120 蛋白包括 SEQ ID NO:154的變體。(b)的優選片段包含來自SEQ ID NO:154的表位。其他優選片段缺少SEQ IDNO:154C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:154N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:154的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC120的免疫原性片段。
[0574]IC121
[0575]在參考文獻10中將IC121標註為假擬蛋白。出於參比目的,全長IC121的胺基酸序列是本文所述的SEQ IDN0:155。在R6基因組中,IC121是sprl977 [84]。參考文獻10中報導了 IC121的免疫應用(其中的SEQ ID NO:277)。
[0576]本發明所用的優選IC121多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:155具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:155 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC121 蛋白包括 SEQ ID NO:155的變體。(b)的優選片段包含來自SEQ ID NO:155的表位。其他優選片段缺少SEQ IDNO:155C末端的一個或多 個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:155N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:155的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC121的免疫原性片段。
[0577]IC122
[0578]在參考文獻10中將IC122標註為假擬蛋白。出於參比目的,全長IC122的胺基酸序列是本文所述的SEQ ID NO:156。參考文獻10中報導了 IC122的免疫應用(其中的SEQID NO:278)。
[0579]本發明所用的優選IC122多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:156具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:156 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC122 蛋白包括 SEQ ID NO:156的變體。(b)的優選片段包含來自SEQ ID NO:156的表位。其他優選片段缺少SEQ IDNO:156C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:156N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:156的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC122的免疫原性片段。[0580]IC123
[0581]在參考文獻10中將IC123標註為假擬蛋白。出於參比目的,全長IC123的胺基酸序列是本文所述的SEQ IDN0:157。在R6基因組中,IC123是sprl049 [84]。參考文獻10中報導了 IC123的免疫應用(其中的SEQ ID NO:279)。
[0582]本發明所用的優選IC123多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:157具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:157 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC123 蛋白包括 SEQ ID NO:157的變體。(b)的優選片段包含來自SEQ ID NO:157的表位。其他優選片段缺少SEQ IDNO:157C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:157N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:157的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC123的免疫原性片段。
[0583]IC124
[0584]在參 考文獻10中將IC124標註為假擬蛋白。出於參比目的,全長IC124的胺基酸序列是本文所述的SEQ IDN0:158。在R6基因組中,IC124是sprl811 [84]。參考文獻10中報導了 IC124的免疫應用(其中的SEQ ID NO:280)。
[0585]本發明所用的優選IC124多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:158具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:158 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC124 蛋白包括 SEQ ID NO:158的變體。(b)的優選片段包含來自SEQ ID NO:158的表位。其他優選片段缺少SEQ IDNO:158C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:158N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:158的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC124的免疫原性片段。
[0586]IC125
[0587]在參考文獻10中將IC125標註為假擬蛋白。出於參比目的,全長IC125的胺基酸序列是本文所述的SEQ IDN0:159。在R6基因組中,IC125是spr0381 [84]。參考文獻10中報導了 IC125的免疫應用(其中的SEQ ID NO:281)。
[0588]本發明所用的優選IC125多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:159具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5% 或更高);和 / 或(b)包含 SEQ ID NO:159 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC125 蛋白包括 SEQ ID NO:159的變體。(b)的優選片段包含來自SEQ ID NO:159的表位。其他優選片段缺少SEQ IDNO:159C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:159N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:159的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC125的免疫原性片段。
[0589]IC126
[0590]在參考文獻10中將IC126標註為假擬蛋白。出於參比目的,全長IC126的胺基酸序列是本文所述的SEQ ID NO:160。參考文獻10中報導了 IC126的免疫應用(其中的SEQID NO:282)。
[0591]本發明所用的優選IC126多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:160具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:160 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC126 蛋白包括 SEQ ID NO:160的變體。(b)的優選片段包含來自SEQ ID NO:160的表位。其他優選片段缺少SEQ IDNO:160C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:160N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:160的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC126的免疫原性片段。
[0592]IC127
[0593]在參考文獻10中將IC127標註為假擬蛋白。出於參比目的,全長IC127的胺基酸序列是本文所述的SEQ IDN0:161。在R6基因組中,IC127是spr0061 [84]。參考文獻10中報導了 IC127的免疫應用(其中的SEQ ID NO:283)。
[0594]本發明所用的優選IC127多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:161具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:161 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC127 蛋白包括 SEQ ID NO:161的變體。(b)的優選片段包含來自SEQ ID NO:161的表位。其他優選片段缺少SEQ IDNO:161C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:161N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:161的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC127的免疫原性片段。
[0595]IC128
[0596]在參考文獻10中將IC128標註為假擬蛋白。出於參比目的,全長IC128的胺基酸序列是本文所述的SEQ IDN0:162。在R6基因組中,IC128是spr0641 [84]。參考文獻10中報導了 IC128的免疫應用(其中的SEQ ID NO:284)。
[0597]本發明所用的優選IC128多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:162具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:162 的至少』 η』個連續 胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC128 蛋白包括 SEQ ID NO:162的變體。(b)的優選片段包含來自SEQ ID NO:162的表位。其他優選片段缺少SEQ IDNO:162C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:162N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:162的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC128的免疫原性片段。
[0598]IC129
[0599]在參考文獻10中將IC129標註為假擬蛋白。出於參比目的,全長IC129的胺基酸序列是本文所述的SEQ IDN0:163。在R6基因組中,IC129是sprl205 [84]。參考文獻10中報導了 IC129的免疫應用(其中的SEQ ID NO:285)。
[0600]本發明所用的優選IC129多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:163具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:163 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC129 蛋白包括 SEQ ID NO:163的變體。(b)的優選片段包含來自SEQ ID NO:163的表位。其他優選片段缺少SEQ IDNO:163C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:163N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:163的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC129的免疫原性片段。
[0601]IC130
[0602]在參考文獻10中將IC130標註為假擬蛋白。出於參比目的,全長IC130的胺基酸序列是本文所述的SEQ ID NO:1640在R6基因組中,IC130是sprl841 [84]。參考文獻10中報導了 IC130的免疫應用(其中的SEQ ID NO:286)。
[0603]本發明所用的優選IC130多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:164具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:164 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC130 蛋白包括 SEQ ID NO:164的變體。(b)的優選片段包含來自SEQ ID NO:164的表位。其他優選片段缺少SEQ IDNO:164C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:164N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:164的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC130的免疫原性片段。
[0604]ICl31
[0605]在參考文獻10中將IC131標註為假擬蛋白。出於參比目的,全長IC131的胺基酸序列是本文所述的SEQ IDN0:165。在R6基因組中,IC131是sprl777 [84]。參考文獻10中報導了 IC131的免疫應用(其中的SEQ ID NO:287)。
[0606]本發明所用的優選IC131多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:165具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:165 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 IC131 蛋白包括 SEQ ID NO:165的變體。(b)的優選片段包含來自SEQ ID NO:165的表位。其他優選片段缺少SEQ IDNO:165C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:165N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:165的至少一個表位。其他片段缺少一個或多個蛋白質結構域。參考文獻10的表1中鑑定了 IC131的免疫原性片段。
[0607]spr0222
[0608]參考文獻228中將原始』 spr0222』序列標註為』 ABC轉運蛋白ATP結合蛋白_鐵轉運』(參見G1: 15457768)。出於參比目的,R6菌株中發現的全長spr0222的胺基酸序列在本文中列為SEQ ID NO: 121。參考文獻5中提示其免疫應用。
[0609]本發明所用的優選spr0222多肽包含某胺基酸序列,該序列:(a)與SEQ IDNO:121具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:121 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 spr022 蛋白包括 SEQ ID NO:121的變體。(b)的優選片段包含來自SEQ ID NO:121的表位。其他優選片段缺少SEQ IDNO:121C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ IDNO:121N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ IDNO:121的至少一個表位。其他片段缺少一個或多個蛋白質結構域。 [0610]CbiO
[0611]CbiO被標註為鈷轉運蛋白ATP-結合亞基。出於參比目的,全長CbiO的胺基酸序列是本文所述的SEQ ID NO:1670在R6基因組中,CbiO是spr2025[84]。參考文獻6報導了 CbiO的免疫應用(其中的『ID2』 )。
[0612]本發明所用的優選CbiO多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:167具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO:167 的至少』 η』個連續胺基酸的片段,其中』 η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 CbiO 蛋白包括 SEQ IDNO:167的變體。(b)的優選片段包含來自SEQ ID NO:167的表位。其他優選片段缺少SEQ ID NO:167C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:167N 末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或更多個),而保留SEQ IDNO:167的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0613]30S核糖體蛋白S8
[0614]出於參比目的,30S核糖體蛋白S8的胺基酸序列是本文所述的SEQ IDNO: 168。在R6基因組中,S8亞基是spr0203[84]。
[0615]本發明所用的優選S8多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO:168具有50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO:168 的至少』 η,個連續胺基酸的片段,其中』 η,是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 S8 蛋白包括 SEQ ID NO:168 的變體。(b)的優選片段包含來自SEQ ID NO:168的表位。其他優選片段缺少SEQ ID NO:168C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個)和/或SEQ ID NO:168N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或更多個),而保留SEQ ID NO:168的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0616]RrgA
[0617]RrgA是肺炎球菌菌毛的表面亞基之一 [79,80],並且是重要的粘附素[81]。RrgA有至少兩種等位基因形式,出於參比目的,其胺基酸序列是本文所述的SEQ ID NO: 172和179。這兩種等位基因在其N末端和C末端非常保守,但之間的部分有差異。
[0618]本發明所用的優選RrgA多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 172具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 172 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些RrgA蛋白包括SEQ ID NO: 172 的變體。(b)的優選片段包含來自SEQ ID NO: 172的表位。其他優選片段缺少SEQ ID NO: 172C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個)和/或SEQ IDNO: 172N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個),而保留SEQ ID NO: 172的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ ID NO: 192,其缺少天然前導肽和分選酶識別序列。
[0619]本發明所用的其他優選RrgA多肽包含某胺基酸序列,該序列:(a)與SEQ IDNO: 179 具有 50%或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 179的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 RrgA 蛋白包括 SEQ IDNO: 179的變體。(b)的優選片段包含來自SEQ ID NO: 179的表位。其他優選片段缺少SEQ IDNO: 179C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個)和/或SEQ ID NO: 179N末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或多個),而保留SEQ ID NO: 179的至少一個表位。其他片段缺少一個或多個蛋白質結構域。一個合適的片段是SEQ ID NO: 191,其缺少天然前導肽和分選酶識別序列。
[0620]RrgB
[0621]RrgB是肺炎球菌菌毛的表面亞基之一 [79,80]。RrgB有至少三種等位基因形式,出於參比目的,其胺基酸序列是本文所述的SEQ ID NO: 173、174和175。這三種等位基因在其N末端和C末端非常保守,但之間的部分有差異。
[0622]本發明所用的優選RrgB多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 173具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 173 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些RrgB蛋白包括SEQ ID NO: 173 的變體。(b)的優選片段包含來自SEQ ID NO: 173的表位。其他優選片段缺少SEQ ID NO: 173C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個)和/或SEQ IDNO: 173N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個),而保留SEQ ID NO: 173的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0623]本發明所用的其他優選RrgB多肽包含某胺基酸序列,該序列:(a)與SEQ IDNO: 174 具有 50%或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%,94%,95%,96%,97%,98%,99%,99.5%或更高);和 / 或(b)包含 SEQ ID NO: 174的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 RrgB 蛋白包括 SEQ IDNO: 174的變體。(b)的優選片段包含來自SEQ ID NO: 174的表位。其他優選片段缺少SEQ IDNO: 174C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個)和/或SEQ ID NO: 174N 末端的一個 或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或多個),而保留SEQ ID NO: 174的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0624]本發明所用的其他優選RrgB多肽包含某胺基酸序列,該序列:(a)與SEQ IDNO: 175 具有 50%或更高的相同性(如 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 175的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250 或更多個)。這些 RrgB 蛋白包括 SEQ IDNO: 175的變體。(b)的優選片段包含來自SEQ ID NO: 175的表位。其他優選片段缺少SEQ IDNO: 175C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個)和/或SEQ ID NO: 175N末端的一個或多個胺基酸(如 1、2、3、4、5、6、7、8、9、10、15、20、25 或多個),而保留SEQ ID NO: 175的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0625]RrgC
[0626]RrgC是肺炎球菌菌毛的表面亞基之一 [79,80]。出於參比目的,RrgC的胺基酸序列是本文所述的SEQ ID NO: 176。
[0627]本發明所用的優選RrgC多肽包含某胺基酸序列,該序列:(a)與SEQ ID NO: 176具有 50%或更高的相同性(如 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%、95%、96%、97%、98%、99%、99.5%或更高);和 / 或(b)包含 SEQ ID NO: 176 的至少』η』個連續胺基酸的片段,其中』η』是7個或更多個(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200、250或更多個)。這些RrgC蛋白包括SEQ ID NO: 176 的變體。(b)的優選片段包含來自SEQ ID NO: 176的表位。其他優選片段缺少SEQ ID NO: 176C末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個)和/或SEQ IDNO: 176N末端的一個或多個胺基酸(如1、2、3、4、5、6、7、8、9、10、15、20、25或多個),而保留SEQ ID NO: 176的至少一個表位。其他片段缺少一個或多個蛋白質結構域。
[0628]雜交多肽
[0629]本發明所用的肺炎球菌抗原可以單獨多肽的形式存在於組合物中。然而,使用一種以上抗原時,它們不一定以單獨多肽的形式存在。取而代之的是,至少兩種(如2、3、4、5或更多種)抗原可表達成一條多肽鏈(『雜交』多肽)。雜交多肽主要提供以下兩個優點:首先,本身不穩定或者表達較差的多肽可以通過加入能夠克服該問題的合適的雜交伴侶得到改善,其次,商業生產得到簡化,因為只需利用一次表達和純化即可生產可作抗原應用的兩種多肽。
[0630]雜交多肽可包含來自第一抗原組的兩種或多種多肽序列。雜交多肽可包含來自第一抗原組的一種或多種多肽序列,和來自第二抗原組的一種或多種多肽序列。雜交多肽可包含來自第一抗原組的一種或多種多肽序列,和來自第三抗原組的一種或多種多肽序列。雜交多肽可包含來自第二抗原組的一種或多種多肽序列,和來自第三抗原組的一種或多種多肽序列。雜交多肽可包含來自第七抗原組的兩種或多種多肽序列。雜交多肽可包含來自第八抗原組的兩種或多種多肽序列。雜交多肽可包含來自第九抗原組的兩種或多種多肽序列。雜交多肽可包含來自第十抗原組的兩種或多種多肽序列。而且,雜交多肽可包含來自上述各抗原的兩種或多種多肽序列,或在該序列在菌株之間有部分變化的情況下,可包含相同抗原的兩種或多種變體。
[0631 ] 可使用由兩種、三種、四種、五種、六種、七種、八種、九種或十種肺炎球菌抗原的胺基酸序列組成的雜交體。具體說,優選由兩種、三種、四種或五種肺炎球菌抗原,如兩種或三種肺炎球菌抗原的胺基酸序列組成的雜交體。
[0632]不同的雜交多肽可以在單一製劑中混合在一起。雜交體可與選自第一、第二或第三抗原組的非雜交抗原組合。在這類組合中,肺炎球菌抗原可以一種以上雜交多肽和/或非雜交多肽的形式存在。然而,抗原優選以雜交形式或者作為非雜交多肽存在,但不同時以兩種形式存在。
[0633]雜交多肽也可與 上述偶聯物或非肺炎球菌抗原組合。
[0634]雜交多肽可以通式NH2-A-{-X-L-}n-B-C00H表示,其中:X是肺炎球菌抗原的胺基酸序列,如上所述;L是任選接頭的胺基酸序列;A是任選的N末端胺基酸序列;B是任選的C末端胺基酸序列;n是2或更大的整數(如2、3、4、5、6等)。η通常是2或3。
[0635]如果野生型形式中-X-部分具有前導肽序列,那麼在雜交蛋白中可以包含或者略去該序列。在一些實施方式中,前導肽可缺失,除非-X-部分位於雜交蛋白的N-末端,即保留X1的前導肽,但略去X^Xn的前導肽。這相當於刪除所有前導肽並使用X1的前導肽作為-A-部分。
[0636]在{-X-L-}的各個η值的情況下,接頭胺基酸序列-L-可存在或不存在。例如,當 η = 2 時,雜交體可以是 NH2-X1-L1-X2-L2-COOl NH2-X1-X2-COOH, NH2-X1-L1-X2-COOH,NH2-X1-X2-L2-COOH等。接頭胺基酸序列-L- 一般較短(如20個或更少的胺基酸,即20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1)。例子包括有利於克隆的短肽序列,聚-甘氨酸接頭(即包含Glyn,其中η = 2、3、4、5、6、7、8、9、10或更高),組氨酸標籤(即Hisn,其中η = 3、4、5、6、7、8、9、10或更高)。本領域技術人員顯然了解其它合適的接頭胺基酸序列。有用的接頭是 GSGGGG (SEQ ID NO: 232)或 GSGSGGGG (SEQ ID NO: 233),Gly-Ser 二肽由BamHI限制位點形成,因而有助於克隆和操作,(Gly)4四肽是常用的多聚甘氨酸接頭。其他合適接頭,尤其用作最後一個Ln的接頭是Leu-Glu 二肽或SEQ ID NO: 235。
[0637]-A-是任選的N末端胺基酸序列。它通常較短(如40個或更少的胺基酸,即40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1)。例子包括指導蛋白質運輸的前導序列,或有利於克隆或純化的短肽序列(如組氨酸標籤,即Hisn,其中n = 3、4、5、6、7、8、9、10或更多)。本領域技術人員顯然了解其它合適的N-末端胺基酸序列。如果X1缺少其自身的N-末端甲硫氨酸,-A-優選是提供N-末端甲硫氨酸的寡肽(例如,具有1、2、3、4、5、6、7或8個胺基酸),如Met-Ala-Ser或單個Met殘基。
[0638]-B-是任選的C末端胺基酸序列。它一般較短(例如,40個或更少的胺基酸,SP39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1)。例子包括指導蛋白質運輸的序列,有利於克隆或純化的短肽序列(如包含組氨酸標籤,即Hisn,其中η = 3、4、5、6、7、8、9、10或更多,如SEQ IDΝ0:234),或能提高蛋白質穩定性的序列。本領域技術人員顯然了解其它合適的C-末端胺基酸序列。
[0639]雜交體的例子包括包含選自下組的胺基酸序列的多肽:spr2021-spr0057(如SEQ ID NO:193) ;spr2021-spr0096 (如 SEQ ID NO:194) ;spr2021-spr0565(如 SEQID NO:195 或 SEQ ID NO:196 或 SEQ ID NO:197) ;spr2021-RrgA (如 SEQ ID NO:198);spr0057-spr2021 (如 SEQ ID NO:199) ;spr0057-spr0096 (如 SEQ ID NO:200);spr0057-RrgA (如 SEQ ID NO:201) ;spr0057-spr0565 (如 SEQ ID NO:202 或 SEQ ID NO:203 或 SEQ ID NO:204) ;spr0096-spr2021 (如 SEQ ID NO:205) ;spr0096-spr0057(如 SEQID NO:206) ;spr0096-RrgA(如 SEQ ID NO:207) ;spr0096-spr0565 (如 SEQ ID NO:208 或SEQ ID NO:209 或 SEQ ID NO:210) ;RrgA-spr2021 (如 SEQ ID NO:211) ;RrgA_spr0565(如SEQ ID NO:212 或 SEQ ID NO:213 或 SEQ ID NO:214) ;RrgA_spr0057 (如 SEQ ID NO:215);RrgA-spr0096 (如 SEQ ID NO:216) ;spr0565-spr0057 (如 SEQ ID NO:217 或 SEQ ID NO:218 或 SEQ ID NO:219) ;spr0565-spr0096 (如 SEQ ID NO:220 或 SEQ ID NO:221 或 SEQ IDNO:222) ;spr0565-spr2021 (如 SEQ ID NO:223 或 SEQ ID NO:224 或 SEQ ID NO:225);或spr0565-RrgA(如 SEQ ID NO:226 或 SEQ ID NO:227 或 SEQ ID NO:228)。
[0640]本發明所用多肽
[0641]本發明所用多肽可採取各種形式(如天然多肽、融合多肽、糖基化多肽、非糖基化多肽、脂化多肽、非脂化多肽、磷酸化多肽、非磷酸化多肽、肉豆蘧醯化多肽、非肉豆蘧醯化多肽、單體、多聚體、顆粒、變性多肽等)。
[0642]本發明所用多肽可通過各種方式(如重組表達、由細胞培養物純化、化學合成等)製備。優選重組表達的蛋白質,特別是雜交多肽。
[0643]本發明所用多肽優選以純化或基本純化,即基本不含其它多肽(如不含天然產生的多肽)、特別是不含其它鏈球菌或宿主細胞多肽的形式提供,本發明多肽的純度通常為至少約50重量%,通常至少約90%,即組成中少於約50%,更優選少於約10% (如5%)是其它表達的多肽。因此,組合物中的抗原是與表達該分子的完整生物體分離的。
[0644]本發明所用多肽優選是肺炎球菌多肽。[0645]術語「多肽」指任何長度的胺基酸聚合物。該聚合物可以是線性或支鏈聚合物,可包含修飾的胺基酸,可被非胺基酸打斷。該術語也包括天然或通過人工介入修飾的胺基酸聚合物;這些修飾包括例如:二硫鍵形成、糖基化、脂化、乙醯化、磷酸化或任何其它操作或修飾,如與標記組分偶聯。也包括,例如,含有一個或多個胺基酸類似物(包括例如,非天然胺基酸等),以及本領域已知的其它修飾的多肽。多肽可以是單鏈或結合的鏈。
[0646]本發明提供含有序列-P-Q-或-Q-P-的多肽,其中:-P-是上述胺基酸序列,-Q-不是上述序列,即本發明提供融合蛋白。-P-的N-末端密碼子不是ATG且此密碼子未出現在多肽的N末端時,它將被翻譯成該密碼子的標準胺基酸,而不是Met。然而,當該密碼子位於多肽N末端時,它將被翻譯成Met。-Q-部分的例子包括但不限於:組氨酸標籤(即Hisn,其中η = 3、4、5、6、7、8、9、10或更高)、麥芽糖結合蛋白或穀胱甘肽-S-轉移酶(GST)。
[0647]本發明還提供產生本發明多肽的方法,該方法包括在誘導多肽表達的條件下培養用本發明核酸轉化的宿主細胞的步驟。
[0648]雖然可以在鏈球菌(Streptococcus)中表達本發明多肽,但本發明通常使用異源宿主進行表達(重組表達)。異源宿主可以是原核(例如細菌)或真核生物。可以是大腸桿菌(E.coli),其他合適的宿主包括枯草桿菌(Bacillus subtilis)、霍亂弧菌(Vibriocholerae)、傷寒沙門菌(Salmonella typhi)、鼠傷寒沙門菌(Salmonella typhimurium) >乳酸胺奈瑟菌(Neisseria Iactamica)、灰色奈瑟菌(Neisseria cinerea)、分枝桿菌(Mycobacteria)(例如結核分支桿菌(M.tuberculosis))、酵母等。與編碼本發明多肽的野生型肺炎球菌基因相比,改變密碼子以優化在這類宿主中的表達效率而不影響編碼胺基酸是有幫助的。
[0649]本發明提供一種產生本發明多肽的方法,所述方法包括通過化學方式合成所述多肽的至少一部分的步驟。
[0650]核酸
[0651]本發明也提供編碼本發明多肽和雜交多肽的核酸。還提供包含編碼一種或多種本發明多肽或雜交多肽的核苷酸序列的核酸。
[0652]本發明也提供包含與這種核苷酸序列有序列相同性的核苷酸序列的核酸。序列之間的相同性優選通過Smith-Waterman同源性搜索算法(如上所述)確定。這類核酸包括使用替代密碼子編碼相同胺基酸的那些核酸。
[0653]本發明也提供可與這些核酸雜交的核酸。可以在不同「嚴謹性」的條件下進行雜交反應。提高雜交反應嚴謹性的條件是本領域眾所周知的,且已公開過[如參考文獻288的第7.52頁]。相關條件的例子包括(嚴謹性逐漸提高的順序):培育溫度25°C、37°C、50°C、55。。和 68°C;緩衝液濃度 10xSSC、6x SSCUx SSC、0.1x SSC (其中 SSC 是 0.15M NaCl 和 15mM檸檬酸鹽緩衝液)和使用其它緩衝液體系的等同條件;甲醯胺濃度和75%;培育時間5分鐘-24小時;1個、2個或多個洗滌步驟;洗滌培育時間1、2或15分鐘;洗滌溶液6x SSCUx SSC、0.1x SSC或去離子水。雜交技術和其優化方法是本領域眾所周知的[例如,參見參考文獻82、83、288、290等]。
[0654]在一些實施方式中,本發明核酸與本發明靶標在低嚴謹條件下雜交;在其它實施方式中,它們在中等嚴謹條件下雜交;在優選實施方式中,它們在高嚴謹條件下雜交。一組示範性的低嚴謹雜交條件是50°C和IOx SSC0 一組示範性的中等嚴謹雜交條件是55°C和IxSSC0 一組示範性的高嚴謹雜交條件是68°C和0.1x SSC0 [0655]本發明包括含有這些序列的互補序列的核酸(例如,用於反義或檢測,或用作引物)。
[0656]本發明核酸可用於雜交反應(如Northern或Southern印跡,或核酸微陣列或『基因晶片』)和擴增反應(如PCR、SDA、SSSR、LCR、TMA, NASBA等)和其它核酸技術。
[0657]本發明核酸可採取各種形式(如單鏈、雙鏈、載體、引物、探針、標記形式等)。本發明核酸可以是環狀或分枝狀核酸,但通常是線性核酸。除非另有說明或要求,利用核酸的本發明任何實施方式可利用雙鏈形式和構成該雙鏈形式的兩條互補單鏈形式的每條鏈。引物、探針以及反義核酸通常是單鏈。
[0658]本發明核酸優選以純化或基本純化的形式提供,即基本不含其它核酸(如不含天然產生的核酸),特別是不含其它肺炎球菌或宿主細胞核酸,通常其純度至少為約50重量%,通常至少為約90%。本發明核酸優選為肺炎球菌核酸。
[0659]可以多種方式製備本發明核酸,這些方式包括例如,完全或部分化學合成(如DNA的亞磷醯胺合成),用核酸酶(如限制性酶)消化較長核酸、連接較短核酸或核苷酸(如使用連接酶或聚合酶),由基因組或cDNA文庫製備等。
[0660]本發明核酸可連接於固體支持物(如珠、平板、濾紙、膜、玻片、微陣列支持物、樹脂等)。可用,例如放射性或螢光標記、或生物素標記標記本發明核酸。在準備將核酸用於檢測技術時,例如核酸是引物或探針時,這特別有用。
[0661]總的來看,術語「核酸」包括任何長度的核苷酸聚合形式,其包含脫氧核糖核苷酸、核糖核苷酸和/或其類似物。它包括DNA、RNA、DNA/RNA雜交體。它也包括DNA或RNA類似物,如含有修飾主鏈(如肽核酸(PNA)或硫代磷酸酯)或修飾鹼基的類似物。因此,本發明包括mRNA、tRNA、rRNA、 核酶、DNA、cDNA、重組核酸、分枝核酸、質粒、載體、探針、引物等。本發明核酸採取RNA形式時,它可能具有或不具有5』帽。
[0662]本發明核酸可以是載體的一部分,即設計用於轉導/轉染一種或多種細胞類型的核酸構建物的一部分。載體可以是,例如,設計用於分離、增殖和複製插入的核苷酸的「克隆載體」,設計用於在宿主細胞中表達核苷酸序列的「表達載體」,設計用於產生重組病毒或病毒樣顆粒的「病毒載體」,或具有一種以上載體類型的屬性的「穿梭載體」。優選的載體是質粒。「宿主細胞」包括單個細胞或細胞培養物,它可能是或已經是外源核酸的接受者。宿主細胞包括單個宿主細胞的後代,由於天然、偶然或有意的突變和/或改變,這些後代與原始親本細胞不一定完全相同(形態或總DNA互補物方面)。宿主細胞包括用本發明核酸體內或體外轉染或感染的細胞。
[0663]應理解,核酸是DNA時,RNA序列中的「U」被DNA中的「T」所替代。相似地,應理解,核酸是RNA時,DNA中的「 T 」被RNA序列中的「U」所替代。
[0664]用於核酸時,術語「互補物」或「互補」指沃森克裡克鹼基配對。因此,C的互補物是G,G的互補物是C,A的互補物是T(或U),T(或U)的互補物是A。也可能使用諸如1(嘌呤肌苷)等鹼基,與嘧啶(C或T)互補。
[0665]例如,可使用本發明核酸產生多肽;作為檢測生物樣品中的核酸的雜交探針;產生額外的核酸拷貝;產生核酶或反義寡核苷酸;作為單鏈DNA引物或探針;或作為形成三鏈體的寡核苷酸。
[0666]本發明提供產生本發明核酸的方法,其中所述核酸部分或完全用化學方式合成。
[0667]本發明提供包含本發明核苷酸序列的載體(如克隆或表達載體)和用這種載體轉化的宿主細胞。
[0668]本發明核酸擴增可以是定量擴增和/或實時擴增。[0669]在本發明的某些實施方式中,核酸的長度優選為至少7個核苷酸(如8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、90、100、110、120、130、140、150、160、170、180、190、200、225、250、275、300 個核苷酸或更長)。
[0670]在本發明的某些實施方式中,核酸長度優選為至多500個核苷酸(例如450、400、350、300、250、200、150、140、130、120、110、100、90、80、75、70、65、60、55、50、45、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15 個核苷酸
或更短)。
[0671]本發明的引物和探針,以及用於雜交的其它核酸的長度優選為10-30個核苷酸(如 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29 或 30 個核苷酸)。
[0672]菌株和變體
[0673]上述抗原根據「spr」命名法定義。該命名法是根據參考文獻84所用的編號系統,以便對肺炎鏈球菌R6菌株中的開放閱讀框作唯一標註。不難在公共基因資料庫中找到任何「spr」編號對應的基本參考序列。例如,GenBank登錄號NC_003098 (G1: 15902044)是完整的R6基因組序列(2,038,615bp),單獨的spr序列在基因組序列的「特徵」部分作為「基因座_標籤」條目給出。因此,對菌株R6而言,可毫無疑問地確定任何給定spr編號對應的胺基酸序列和其天然編碼序列。資料庫中也給出功能標註。
[0674]本發明不限於來自R6菌株的序列。可獲得肺炎鏈球菌的若干其他菌株的基因組序列,包括23F[85] >670 [86]和TIGR4[87,88,89]。可使用標準的搜索和比對技術在這些(或其他)基因組序列中鑑定來自R6的任何特定spr序列的同源物。而且,可利用可獲得的R6(和其他)序列設計引物擴增來自其他菌株的同源序列。因此,本發明不限於R6序列,可包括來自其他肺炎鏈球菌菌株的這類變體和同源物,以及非天然變體。通常,特定SEQ IDNO的合適變體包括其等位基因變體、其多態性形式、其同源物、其直向同源物、其旁系同源物、其突變體等。
[0675]因此,例如,與R6參比序列相比,本發明所用多肽可包括一個或多個(如1、2、3、4、5、6、7、8、9個等)胺基酸取代,如保守取代(即用具有側鏈相關的另一胺基酸取代某胺基酸)。遺傳編碼的氨 基酸通常分為四類:(I)酸性,即天冬氨酸、穀氨酸;(2)鹼性,即賴氨酸、精氨酸、組氨酸;(3)非極性,即丙氨酸、纈氨酸、亮氨酸、異亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸;和(4)不帶電的極性胺基酸,即甘氨酸、天冬醯胺、谷胺醯胺、胱氨酸、絲氨酸、蘇氨酸、酪氨酸。有時將苯丙氨酸、色氨酸和酪氨酸一起稱為芳族胺基酸。通常,這些家族中單個胺基酸的替換不會對生物活性產生重要影響。相對於R6序列,該多肽也可包含一個或多個(如1、2、3、4、5、6、7、8、9等)單個胺基酸的缺失。相對於R6序列,該多肽也可包含一個或多個(如1、2、3、4、5、6、7、8、9個等)插入(如1、2、3、4或5個胺基酸)。
[0676]類似地,本發明所用多肽可包含某胺基酸序列,該序列:
[0677](a)與序列表公開的某一序列相同(即100%相同);
[0678](b)與序列表公開的某一序列具有序列相同性(如60%、65%、70%、75%、80%、85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%或更高);
[0679](c)與(a)或(b)的序列相比,含有1、2、3、4、5、6、7、8、9或10個(或更多個)單胺基酸改變(缺失、插入、取代)的序列,這些改變可以位於不同位置或連續出現;和
[0680](d)用逐對比對算法與序列表中的特定序列比對時,每個從N-末端向C-末端移動的X個胺基酸的窗口(使得在p(p>x)個胺基酸上比對時,存在ρ-χ+1個這種窗口)具有至少X.y個相同的比對胺基酸,其中:Χ選自20、25、30、35、40、45、50、60、70、80、90、100、150,200 ;y 選自 0.50,0.60,0.70,0.75,0.80,0.85,0.90,0.91,0.92,0.93,0.94,0.95、0.96,0.97,0.98,0.99 ;如果x.y不是整數,則四捨五入至整數。優選的逐對比對算法是Needleman-Wunsch全局比對算法[90],使用默認參數(如缺口開放罰分=10.0,缺口延伸罰分=0.5,使用EBL0SUM62積分矩陣)。用EMBOSS軟體包中的needle工具能方便地實施這種算法[91] ο
[0681]使用雜交多肽時,雜交體內的單個抗原(即單個-X-部分)可來自一種或多種菌株。例如,η = 2時,X2可來自與X1相同的菌株,或來自不同菌株。當η = 3時,該菌株可以是(i)X1 = X2 = X3 (ii)X1 = X2 古 X3(iii)X1 ^ X2 = X3 (iv)X1 古 X2 古 X3 或(v)X1 = X3 ^ X2
坐寸ο
[0682]在(c)組內,缺失或取代可發生在N末端和/或C末端,或者可以出現在兩末端之間。因此,截短是缺失的一個例子。截短可包括在N末端和/或C末端缺失多達40個(或更多)胺基酸。
[0683]通常,當本發明多肽包括與序列表所示完整肺炎球菌序列不同的序列時(例如,當它包含序列相同性 〈100%的序列,或包含其片段時),在各種單獨情況下,該多肽優選可引發識別完整肺炎球菌序列的抗體。
[0684]突變細菌
[0685]本發明也提供來自本發明各種抗原組的一種或多種抗原被敲除的肺炎球菌。產生敲除細菌的技術是本領域熟知的,曾報導過敲除的肺炎球菌。敲除突變可位於基因的編碼區,或者可位於轉錄控制區內(如啟動子內)。敲除突變會將編碼抗原的mRNA水平降低至野生型細菌產量水平的〈I %,優選降低至〈0.5 %,更優選降低至〈0.1 %,最優選降低至O %。
[0686]本發明也提供其中來自本發明各種抗原組的一種或多種抗原具有抑制其活性的突變的肺炎球菌。編碼該抗原的基因將具有改變所編碼胺基酸序列的突變。突變可包括缺失、取代和/或插入,其中任何一種均可涉及一個或多個胺基酸。
[0687]免疫原性組合物和藥物
[0688]本發明免疫原性組合物可用作疫苗。本發明疫苗可以是預防性(即預防感染)或治療性(即治療感染)疫苗,但一般是預防性疫苗。
[0689]因此,組合物可以是藥學上可接受的。除抗原外,它們通常還包含其它組分,例如它們一般包含一種或多種藥物載體和/或賦形劑。對這類組分的充分討論參見參考文獻285。
[0690]組合物通常以水性形式給予哺乳動物。然而在給藥前,該組合物可以是非水性形式。例如,雖然一些疫苗製備成水性形式後以水性形式填裝、分銷和給藥,但其他疫苗在製備過程中凍幹,並在使用時重建成水性形式。因此,本發明組合物可以是乾燥製劑,例如凍幹製劑。
[0691]該組合物可含有防腐劑,如硫柳汞或2-苯氧乙醇。然而,疫苗優選應基本不含(即小於5μ g/ml)含汞物質,如不含硫柳汞。更優選無汞的疫苗。特別優選不含防腐劑的疫苗。[0692]為了提高熱穩定性,組合物可包含溫度保護劑。這種物質的詳情如下所述。
[0693]為了控制張力,優選包含生理性鹽如鈉鹽。優選氯化鈉(NaCl),它的濃度可以是
l-20mg/ml,例如約10±2mg/ml NaCl。可以存在的其它鹽包括氯化鉀、磷酸二氫鉀、二水合
磷酸氫二鈉、氯化鎂、氯化鈣等。
[0694]組合物的滲透壓通常為200m0sm/kg-400m0sm/kg,優選為240-360m0sm/kg,更優選為 290-310m0sm/kg。
[0695]組合物可含有一種或多種緩衝劑。緩衝劑一般包括:磷酸鹽緩衝劑;Tris緩衝劑;硼酸鹽緩衝劑;琥珀酸鹽緩衝劑;組氨酸緩衝劑(特別是與氫氧化鋁佐劑聯用時);或檸檬酸緩衝劑。包含的緩衝劑的濃度一般是5-20mM。
[0696]組合物的pH通常為5.0-8.1,更一般為6.0-8.0,例如6.5-7.5,或者7.0-7.8。
[0697]該組合物優選無菌。該組合物優選無熱原,如每劑量含有<1EU(內毒素單位,標準量度),優選每劑量〈0.1EU0該組合物優選不含谷蛋白。
[0698]該組合物可含有一次免疫的物質,或者可含有多次免疫的物質(即『多劑量』藥盒)。多劑量配置優選含有防腐劑。作為多劑量組合物中包含防腐劑的替代方案(或除此之外),該組合物可包含在裝有用於取出物質的無菌接頭的容器中。
[0699]人疫苗的給藥劑量體積一般為約0.5ml,但可將一半劑量(即約0.25ml)給予兒 裡。
[0700]本發明免疫原性組合物也可包含一種或多種免疫調節劑。優選地,一種或多種免疫調節劑包括一種或多種佐劑。佐劑可包括THl佐劑和/或TH2佐劑,詳述見下。
[0701]可用於本發明組合物的佐劑包括但不限於:
[0702]A.含礦物質的組合物
[0703]本發明中適合用作佐劑的含有礦物質的組合物包括礦物鹽,例如鋁鹽和鈣鹽(或其混合物)。鈣鹽包括磷酸鈣(如參考文獻92公開的「CAP」顆粒)。鋁鹽包括氫氧化鋁、磷酸鋁、硫酸鋁等,所述鹽取任何合適形式(如凝膠、晶體、無定形態等)。優選吸附於這些鹽。也可將含有礦物質的組合物製成金屬鹽的顆粒[93]。
[0704]可使稱為氫氧化招和磷酸招的佐劑。這些名稱是常規名稱,僅為方便使用,因為它們都不是所代表的實際化合物的準確描述[例如參見參考文獻94的第9章]。本發明可採用通常用作佐劑的任何〃氫氧化物〃或〃磷酸鹽〃佐劑。稱為〃氫氧化鋁〃的佐劑一般是羥基氧化鋁鹽(通常至少部分為晶體)。稱為〃磷酸鋁〃的佐劑一般是羥基磷酸鋁,也常常含有少量硫酸鹽(即羥基磷酸硫酸鋁)。可通過沉澱獲得這些佐劑,沉澱期間的反應條件和濃度影響磷酸根取代該鹽中羥基的程度。
[0705]氫氧化鋁佐劑呈典型的纖維形態(例如,電子透射顯微照片所見的)。氫氧化鋁佐劑的Pl通常約11,即在生理pH下佐劑本身具有表面正電荷。據報導,pH7.4時,氫氧化鋁佐劑的吸附能力在每mg A1+++1.8-2.6mg蛋白質之間。
[0706]磷酸鋁佐劑的PO4Al摩爾比通常為0.3-1.2,優選0.8-1.2,更優選0.95±0.1。磷酸鋁通常是無定形的,尤其是羥基磷酸鹽。典型的佐劑是PO4Al摩爾比為0.84-0.92的無定形的羥基磷酸鋁,包含0.6mg Al3+Ail。磷酸鋁通常是顆粒(如在透射電子顯微鏡照片上觀察到的板狀形態)。抗原吸附後顆粒直徑一般是0.5-20 μ m(如約5-10 μ m)。據報導,PH7.4時磷酸鋁佐劑的吸附容量為0.7-1.5毫克蛋白質/毫克Al+++。[0707]磷酸鋁的零點電荷(PZC)與磷酸對羥基的取代程度逆相關,這種取代程度可能取決於用於通過沉澱製備鹽的反應條件和反應物濃度。也通過改變溶液中游離磷酸根離子的濃度(更多磷酸根=更多酸性PZC)或加入緩衝劑如組氨酸緩衝劑(使PZC鹼性更強)改變PZC。本發明所用的磷酸鋁的PZC通常為4.0-7.0,更優選為5.0-6.5,例如約為5.7。
[0708]用於製備本發明組合物的鋁鹽懸浮液可以,但不一定含有緩衝液(如磷酸鹽或組氨酸或Tris緩衝液)。該懸浮液優選無菌且無熱原。該懸浮液可含有游離的水性磷酸根離子,如濃度為1.0-20mM,優選5-15mM,更優選約IOmM的磷酸根離子。該懸浮液也可含有氯化鈉。
[0709]本發明可使用氫氧化鋁和磷酸鋁的混合物。在這種情況下,磷酸鋁比氫氧化鋁多,例如重量比為至少2:1,例如≥5:1、≥6:1、≥7:1、≥8:1、≥9:1等。
[0710]給予患者的組合物中Al+++的濃度優選小於10mg/ml,例如≤5mg/ml、≤ 4mg/ml、≤ 3mg/ml、≤ 2mg/ml、≤ lmg/ml等。優選範圍是0.3-lmg/ml。最大值優選為0.85毫克/劑量。
[0711]特別優選磷酸招,尤其是在包含流感嗜血桿菌(H.1nfluenzae)糖抗原的組合物中,典型的佐劑是P04/A1摩爾比在0.84和0.92之間的無定形羥基磷酸鋁,含量為0.6mgAl3Vml0可採用低劑量磷酸鋁吸附,如50-100 μ g Al3+/偶聯物/劑。當組合物中含有一種以上偶聯物時,不需要吸附所有偶聯物。 [0712]B.油乳劑
[0713]適合用作本發明佐劑的油乳劑組合物包含鯊烯-水乳劑,如MF59 [參考文獻94第10章;也參見參考文獻95] (5%鯊烯、0.5%吐溫80和0.5%司盤85,用微流化床配製成亞微米顆粒)。也可用完全弗氏佐劑(CFA)和不完全弗氏佐劑(IFA)。
[0714]已知各種水包油乳劑,它們通常包括至少一種油和至少一種表面活性劑,所述油和表面活性劑是可生物降解(可代謝)和生物相容的。乳劑中的油滴直徑通常小於5μπι,理想情況下具有亞微米直徑,通過微流化床實現這種小尺寸以提供穩定乳劑。優選小於220nm的液滴,因為它們可進行過濾除菌。
[0715]乳劑可包含諸如動物(如魚)或植物來源的油。植物油的來源包括堅果、種籽和穀物。堅果油中最常見的是花生油、大豆油、可可油和橄欖油。也可使用獲自(例如)霍霍巴豆的霍霍巴油。種籽油包括紅花油、棉花籽油、葵花籽油、芝麻油等。在穀物油中,最常見的是玉米油,但也可採用其它穀類如小麥、燕麥、裸麥、稻、畫眉草(teff)、黑小麥(triticale)等的油。可從堅果和種籽油開始,通過水解、分離和酯化合適物質製備甘油和1,2_丙二醇的6-10碳脂肪酸酯(不是種籽油中天然產生的)。來自哺乳動物乳汁的脂肪和油是可代謝的,因此可用於實施本發明。由動物來源獲得純油的過程中必需的分離、純化、皂化和其它步驟是本領域眾所周知的。大多數魚類含有容易回收的可代謝油。例如,鱈魚肝油、鯊魚肝油和鯨油如鯨蠟代表了可用於本發明的幾種魚油的例子。通過生化途徑用5-碳異戊二烯單位合成許多支鏈油,它們總稱為萜類。鯊魚肝油含有稱為鯊烯的支鏈不飽和類萜,2,6, 10,15,19,23-六甲基-2,6,10,14,18,22-二十四碳六烯,本文特別優選此類萜。鯊烯的飽和類似物鯊烷也是優選的油。魚油,包括鯊烯和鯊烷易於從商業來源購得,或可通過本領域已知方法獲得。其它優選油是生育酚(見下)。可採用油的混合物。
[0716]可通過』 HLB』 (親水/親脂平衡)對表面活性劑分類。本發明優選的表面活性劑的HLB為至少10,優選至少15,更優選至少16。可用於本發明的表面活性劑包括但不限於:聚氧乙烯去水山梨糖醇酯表面活性劑(通常稱為吐溫),特別是聚山梨酯20和聚山梨酯80 ;以商品名DOWF AX出售的環氧乙烷(EO)、環氧丙烷(PO)和/或環氧丁烷(BO)的共聚物,如直鏈ΕΡ/Ρ0嵌段共聚物;重複的乙氧基(氧-1,2-乙二基)數量不同的辛苯聚醇,特別感興趣的是辛苯聚醇9 (曲通(Triton) X-100,或叔辛基苯氧基聚乙氧基乙醇);(辛基苯氧基)聚乙氧基乙醇(IGEPAL CA-630/NP-40);磷脂如磷脂醯膽鹼(卵磷脂);壬酚乙醇酯,如Tergitol? NP系列;衍生自十二烷醇、十六烷醇、十八烷醇和油醇的聚氧乙烯脂肪醚(稱為苄澤表面活性劑),如三乙二醇單月桂基醚(苄澤30);以及去水山梨糖醇酯(通常稱為司盤),如去水山梨糖醇三油酸酯(司盤85)和去水山梨糖醇單月桂酸酯。優選非離子型表面活性劑。乳液中包含的優選表面活性劑是吐溫80 (聚氧乙烯去水山梨糖醇單油酸酯)、司盤85 (去水山梨糖醇三油酸酯)、卵磷脂和曲通X-100。
[0717]可使用表面活性劑的混合物,如吐溫80/司盤85混合物。也適合採用聚氧乙烯去水山梨糖醇酯如聚氧乙烯去水山梨糖醇單油酸酯(吐溫80)和辛苯聚醇如叔辛基苯氧基聚乙氧基乙醇(曲通X-100)的混合物。另一種有用的混合物包含聚乙二醇單月桂醚9和聚氧乙烯去水山梨糖醇酯和/或辛苯聚醇。
[0718]表面活性劑的含量(重量% )優選為:聚氧乙烯去水山梨糖醇酯(如吐溫80) 0.01-1%,特別是約0.1 %;辛基-或壬基苯氧基聚氧乙醇(如曲通X-100或曲通系列的其它去汙劑)0.001-0.1%,特別是0.005-0.02%;聚氧乙烯醚(如月桂醇聚醚9)0.1-20%,優選0.1-10%,特別是0.1-1%或約0.5%。
[0719]優選乳液佐劑的平均液滴大小為〈I μ m,例如(750nm、( 500nm、( 400nm、 300nm、i^ 250nm>^ 220nm>^ 200nm或更小。可通過諸如微流化等技術方便地獲得這種
液滴大小。
[0720]本發明所用的具體水包油乳液佐劑包括但不限於:
[0721].鯊烯、吐溫80和司盤85的亞微米乳液。該乳液的體積組成可以是約5%鯊烯、約0.5%聚山梨酯80和約0.5%司盤85。以重量計,這些比例變為4.3%鯊烯、0.5%聚山梨酯80和0.48%司盤85。這種佐劑稱為『MF59』 [96-98],參考文獻99的第10章和參考文獻100的第12章更詳細地描述了該佐劑。MF59乳液宜包含檸檬酸根離子,如IOmM檸檬酸鈉緩衝液。
[0722]?鯊烯、生育酚和聚山梨酯80 (吐溫80)的乳液。該乳液可包含磷酸鹽緩衝鹽水。它也可含有司盤85(如1% )和/或卵磷脂。這些乳液可含有2-10%鯊烯、2-10%生育酚和0.3-3%吐溫80,鯊烯:生育酚的重量比優選≤1,因為這能使乳液更穩定。角鯊烯和吐溫80的體積比可以約為5:2,或者重量比約為11:5。可通過下述方法製備一種這樣的乳液:將吐溫80溶解於PBS得到2%溶液,然後將90ml該溶液與5g DL- α -生育酚和5ml鯊烯的混合物混合,然後使該混合物微流體化。得到的乳液可含有(如)平均直徑為100-250nm,優選約ISOnm的亞微米油滴。該乳液也可含有3-脫-O-醯化單磷醯脂質A( 『3d_MPL』 )。此種類型的另一種有用乳液可包含(每個人用劑量)0.5-10mg鯊烯、0.5-1 Img生育酚和
0.l_4mg 聚山梨酯 80 [101]。
[0723]?鯊烯、生育酚和曲通去汙劑(如曲通X-100)的乳液。該乳液也可包含3d_MPL (見下)。該乳液可含有磷酸鹽緩衝液。[0724]?含有聚山梨酯(如聚山梨酯80)、曲通去汙劑(如曲通X-100)和生育酚(如琥珀酸α-生育酚)。該乳液可包含這三種組分,其質量比約為75:11:10(如750μg/ml聚山梨酯80、110 μ g/ml曲通X-100和100 μ g/ml琥珀酸α -生育酚),這些濃度應包括抗原中這些組分的貢獻。該乳液還可包含鯊烯。該乳液也可包含3d-MPL(見下)。水相可含有磷酸鹽緩衝液。
[0725]?鯊烯、聚山梨酯80和泊洛沙姆401(〃普流羅尼克?L121〃)的乳液。可以用磷酸鹽緩衝鹽水,PH7.4配製該乳液。該乳液是一種有用的胞壁醯二肽遞送載體,已與用〃SAF-1〃佐劑(0.05-1% Thr-MDP、5%鯊烯、2.5%普流羅尼克L121和0.2%聚山梨酸酯80)配的蘇氨醯基-MDP[102] —起使用。也可不與Thr-MDP—起使用,例如用"AF〃佐劑(5%鯊烯、
1.25%普流羅尼克L121和0.2%聚山梨酸酯80) [103]。優選微流體化。
[0726].含有鯊烯、水性溶劑、聚氧乙烯烷基醚親水性非離子型表面活性劑(如聚氧乙烯(12)十六十八醚)和疏水性非離子型表面活性劑(如去水山梨糖醇酯或二縮甘露醇酯,如去水山梨糖醇單油酸酯或『司盤80』)的乳液。該乳劑優選為熱可逆的和/或其中至少90%油滴(以體積計)小於200nm[104]。該乳劑也可含有以下一種或多種物質:糖醇;低溫保護劑(例如,糖,如十二烷基麥芽苷和/或鹿糖);和/或烷基聚糖苷(alkylpolyglycoside)。該乳液可包含TLR4激動劑[105]。這類乳液可以被凍幹。
[0727].角鯊烯、泊洛沙姆-105和Abil-Care的乳液[106]。含佐劑疫苗中這些組分的終濃度(重量)是5%鯊烯、4%泊洛沙姆-105(普流羅尼克多元醇)和2%Abil-Care85(雙-PEG/PPG-16/16PEG/PPG-16/16 二甲矽油;辛酸 / 癸酸甘油三酯)。
[0728].含有0.5-50%油、0.1_10%磷脂和0.05_5%非離子型表面活性劑的乳液。如參考文獻107述,優選的磷脂組分是磷脂醯膽鹼、磷脂醯乙醇胺、磷脂醯絲氨酸、磷脂醯肌醇、磷脂醯甘油、磷脂酸、鞘磷脂和心磷脂。優選亞微米液滴尺寸。
[0729].不可代謝油(如輕質礦物油)和至少一種表面活性劑(如卵磷脂、吐溫80或司盤80)的亞微米水包油乳液。可包含添加劑,例如QuilA皂苷、膽固醇、皂苷-親脂體偶聯物(如通過葡糖醛酸的羧基將脂族胺加到脫醯基皂苷上而產生的GP1-0100,參見參考文獻108、二甲基二-十八烷基溴化銨和/或N,N-二-十八烷基-N,N-雙(2-羥乙基)丙二胺。
[0730]?皂苷(如QuilA或QS21)和固醇(如膽固醇)結合成螺旋膠束的乳液[109]。
[0731].包含礦物油、非離子親脂性乙氧基化脂肪醇和非離子親水性表面活性劑(例如,乙氧基化脂肪醇和/或 聚氧乙烯-聚氧丙烯嵌段共聚物)的乳液[110]。
[0732].包含礦物油、非離子親脂水性乙氧基化脂肪醇和非離子親脂性表面活性劑(例如,乙氧基化脂肪醇和/或聚氧乙烯-聚氧丙烯嵌段共聚物)的乳液[110]。
[0733]在一些實施方式中,可在遞送時即時將乳液與抗原混合,因此佐劑和抗原可單獨地保存在包裝或分銷的疫苗中,以便在使用時配製成最終製劑。在其它實施方式中,在生產過程中將乳液與抗原混合,因此組合物以含佐劑液體形式包裝。抗原通常是水性形式,以便最終通過混合兩種液體製備疫苗。混合的兩種液體的體積比可變(例如5:1-1:5),但通常約為1:1。上述對具體乳液的說明給出組分濃度時,這些濃度通常是非稀釋組合物,因此與抗原溶液混合後濃度降低。
[0734]當組合物包含生育酚時,可採用α、β、Υ、δ、ε或ξ生育酚中的任何一種,但優選α-生育酚。生育酚可取不同形式,例如不同的鹽和/或異構體。鹽包括有機鹽,例如琥珀酸鹽、乙酸鹽、煙酸鹽等。可同時採用D-α-生育酚和DL-α-生育酚。用於老年患者(如年齡大於60歲或更大的患者)的疫苗中宜包含生育酚,因為據報導維生素E在此患者群體中對免疫應答有正面作用[111]。它們也具有抗氧化特性,這種特性有助於穩定該乳液[112]。優選的α-生育酚是DL-α-生育酚,此種生育酚的優選鹽是琥珀酸鹽。發現琥珀酸鹽在體內能與TNF相關配體協作。
[0735]C.皂苷製劑[參考文獻94的第22章]
[0736]皂苷製劑也可用作本發明的佐劑。皂苷是在許多種類植物的樹皮、葉、莖幹、根甚至花中發現的留醇糖苷和三萜糖苷的異質群體。已廣泛研究了作為佐劑的來自皂樹(Quillaia saponaria)Molina樹皮的阜苷。阜苷也可購自麗花菝葜(Smilax ornata)(墨西哥菝葜)、滿天星(Gypsophilla paniculata)(婚紗花)和肥阜草(Saponaria officianalis)(皂根)。皂苷佐劑製劑包括純化製劑如QS21以及脂質製劑如ISCOM。QS21以商標Stimu I on? 出售。
[0737]已採用HPLC和RP-HPLC純化皂苷組合物。已鑑定了用這些技術純化的特定組分,包括QS7、QS17、QS18、QS21、QH_A、QH-B和QH-C。製備QS21的方法參見參考文獻113。皂苷製劑也可包含留醇,如膽固醇[114]。
[0738]皂苷和膽固醇的組合可用於形成稱為免疫刺激複合物(ISCOM)的獨特顆粒[參考文獻94的第23章]。ISCOM通常也含有磷脂如磷脂醯乙醇胺或磷脂醯膽鹼。ISCOM中可採用任何已知的皂苷。ISCOM優選包含QuilA、QHA和QHC中的一種或多種。參考文獻114-116中進一步描述了 ISC0M。任選地,ISCOM可不含其它去汙劑[117]。
[0739]開發基於皂苷的佐劑的綜述可參見參考文獻118和119。
[0740]D.病毒體和病毒樣顆粒
[0741]病毒體和病毒樣顆粒(VLP)也可用作本發明的佐劑。這些結構通常包含一種或多種任選地與磷脂組合或一起配製的病毒蛋白。病毒體和顆粒通常無病原性、不能複製,通常不含任何天然病毒基因組。可用重組方法產生或從全病毒分離得到這種病毒蛋白。這些適用於病毒體或VLP中的病毒蛋白包括來源於流感病毒(例如HA或NA)、B肝病毒(例如核心蛋白或包膜蛋白)、戊肝病毒、麻疫病毒、辛德比斯病毒、輪狀病毒、口蹄疫病毒、逆轉錄病毒、諾瓦克病毒、人乳頭狀瘤病毒、HIV、RNA-噬菌體、Qi3-噬菌體(例如外殼蛋白)、GA_噬菌體、fr-噬菌體、AP205噬菌體和Ty (例如反轉錄轉座子Ty蛋白pi)的蛋白。VLP在參考文獻120-125中有進一步描述。病毒體在(例如)參考文獻126中有進一步描述。
[0742]E.細菌或微生物衍生物
[0743]適用於本發明的佐劑包括細菌或微生物衍生物,例如腸細菌的脂多糖(LPS)的無毒衍生物、脂質A衍生物、免疫刺激性寡核苷酸和ADP-核糖基化毒素及其脫毒衍生物。
[0744]LPS的無毒衍生物包括單磷醯脂質A (MPL)和3_0_脫醯基MPL (3dMPL)。3dMPL是3脫-O-醯基單磷醯脂質A與4、5或6醯化鏈的混合物。3脫-O-醯基單磷醯脂質A的優選「小顆粒」形式見參考文獻127中所述。3dMPL的這種「小顆粒」小到足以在過濾除菌時通過0.22 μ m膜[127]。其它無毒LPS衍生物包括單磷醯脂質A模擬物,例如氨基烷基氨基葡萄糖苷磷酸鹽衍生物如RC529[128,129]。 [0745]脂質A衍生物包括大腸桿菌(Escherichia coli),如0M-174的脂質A衍生物。(例如)參考文獻130和131中描述了 0M-174。[0746]適合用作本發明佐劑的免疫刺激性寡核苷酸包括含CpG基序的核苷酸序列(含有通過磷酯鍵與鳥嘌呤連接的非甲基化胞嘧啶的二核苷酸序列)。含迴文結構或聚(dG)序列的雙鏈RNA和寡核苷酸也顯示具有免疫刺激作用。
[0747]CpG可包含核苷酸修飾/類似物,如硫代磷酸酯修飾,可以是雙鏈或單鏈。參考文獻132、133和134公開了可能的類似取代,例如用2』 -脫氧-7-脫氮鳥苷取代鳥苷。參考文獻135-140中進一步討論了 CpG寡核苷酸的佐劑作用。
[0748]CpG序列可能導向TLR9,例如基序GTCGTT或TTCGTT [141]。CpG序列可特異性誘導Thl免疫應答,例如CpG-A 0DN,或更特異地誘導B細胞應答,例如CpG-B ODN0參考文獻142-144 中討論了 CpG-A 和 CpG-BODN。CpG 優選是 CpG-A ODN。
[0749]優選構建CpG寡核苷酸時使其5』端可為受體所識別。任選將兩個CpG寡核苷酸序列的3』端相連接形成「免疫聚體」。參見例如,參考文獻141和145-147。
[0750]有用的CpG佐劑是CpG7909,也稱為ProMune?(科雷製藥集團公司(ColeyPharmaceutical Group, Inc.))。另一種是CpG1826。或者或此外,為了使用CpG序列,可使用TpG序列[148],這些寡核苷酸可不含非甲基化CpG基序。免疫刺激性寡核苷酸可能富含嘧啶。例如,它可能含有一個以上連續的胸腺嘧啶核苷酸(例如,參考文獻148所公開的TTTT),和/或它的核苷酸組成中可能含有>25%胸腺嘧啶(例如>35%、>40%, >50%,>60%、>80%等)。例如,它可能含有一個以上連續的胞嘧啶核苷酸(例如,參考文獻148所公開的CCCC),和/或它的核苷酸組成中可能含有>25 %胞嘧啶(例如>35 %、>40 %、>50 %、>60%、>80%等)。這些寡核苷酸可以不含未甲基化的CpG基序。免疫刺激性寡核苷酸一般含有至少20個核苷酸。它們可含有少於100個核苷酸。 [0751]基於免疫刺激性寡核苷酸的特別有用的佐劑被稱為IC_31?[149]。因此,本發明佐劑可包含(i)和(ii)的混合物:(i)包含至少一個(優選多個)CpI基序(即胞嘧啶與肌苷相連形成的二核苷酸)的寡核苷酸(例如15-40個核苷酸),和(ii)聚陽離子聚合物,如包含至少一個(優選多個)Lys-Arg-Lys三肽序列的寡肽(如5_20個胺基酸)。寡核苷酸可以是含有26-聚體序列5』-(IC) 13-3』 (SEQ ID NO: 230)的脫氧核苷酸。聚陽離子聚合物可以是含有ll-聚體胺基酸序列KLKLLLLLKLK(SEQ IDN0:231)的肽。寡核苷酸和聚合物可形成複合物,如參考文獻150和151所述。
[0752]細菌ADP-核糖基化毒素及其脫毒衍生物可用作本發明的佐劑。優選該蛋白獲自大腸桿菌(大腸桿菌不耐熱腸毒素「LT」)、霍亂(「CT」)或百日咳(「PT」)菌。參考文獻152中描述了將脫毒的ADP-核糖基化毒素用作黏膜佐劑,參考文獻153中描述了將其用作胃腸道外佐劑。毒素和類毒素優選包含A和B亞單位的全毒素形式。優選A亞單位含有脫毒突變亞單位優選不突變。佐劑優選脫毒的LT突變體如LT-K63、LT-R72和LT-G192。參考文獻154-161中描述了將ADP-核糖基化毒素及其脫毒衍生物,尤其是LT-K63和LT-R72用作佐劑。有用的CT突變體是CT-E29H[162]。優選根據參考文獻163中提出的ADP-核糖基化毒素的A和B亞單位的排列對比對胺基酸取代基編號,該參考文獻的全部內容特別納入本文作為參考。
[0753]F.人免疫調節劑
[0754]適合用作本發明佐劑的人免疫調節劑包括細胞因子,如白介素(如IL-1、IL-2、IL-4、IL-5、IL-6、IL-7、IL-12[164]等)[165]、幹擾素(如幹擾素-Y )、巨噬細胞集落刺激因子和腫瘤壞死因子。優選的免疫調節劑是IL-12。
[0755]G.生物粘著劑和黏膜粘著劑
[0756]生物粘著劑和黏膜粘著劑也可用作本發明的佐劑。合適的生物粘著劑包括酯化透明質酸微球[166]或黏膜粘著劑如聚(丙烯酸)交聯衍生物、聚乙烯醇、聚乙烯吡咯烷酮、多糖和羧甲基纖維素。殼聚糖及其衍生物也可用作本發明的佐劑[167]。
[0757]H.微粒
[0758]微粒也可用作本發明的佐劑。微粒(即直徑~IOOnm至~150 μ m,優選~200nm至~30 μ m,最優選~500nm至~10 μ m的顆粒)由無毒材料(例如聚(α -輕酸)、聚羥基丁酸、聚正酯、聚酐、聚己酸內酯等),優選聚(丙交酯-乙交酯共聚物)形成,並任選經處理而具有帶負電荷表面(例如用SDS處理)或帶正電荷表面(例如用陽離子去汙劑如CTAB處理)。
[0759]1.脂質體(參考文獻94的第13和14章)。 [0760]適合用作佐劑的脂質體製劑的例子見參考文獻168-170所述。
[0761]J.聚氧乙烯醚和聚氧乙烯酯製劑
[0762]適合用於本發明的佐劑包括聚氧乙烯醚和聚氧乙烯酯[171]。這種製劑還包括聚氧乙烯去水山梨糖醇酯表面活性劑和辛苯糖醇[172]以及聚氧乙烯烷基醚或酯表面活性劑和至少一種其它非離子表面活性劑如辛苯糖醇[173]的混合物。優選的聚氧乙烯醚選自:優選的聚氧乙烯醚選自下組:聚氧乙烯-9-月桂醚(月桂醇聚醚9)、聚氧乙烯-9-硬脂醯基(steoryl)醚、聚氧乙烯_8_硬脂醯基醚、聚氧乙烯_4_月桂醚、聚氧乙烯_35_月桂醚和聚氧乙稀~23~月桂釀。
[0763]K.磷腈
[0764]可使用磷腈,如參考文獻174和175中所述的聚[二(羧基苯氧基)磷腈](poly [di (carboxylatophenoxy) phosphazene], 「PCPP,,)。
[0765]L.胞壁醯肽
[0766]適合用作本發明佐劑的胞壁醯肽的例子包括N-乙醯基-胞壁醯-L-蘇氨醯-D-異谷醯胺(thr-MDP)、N-乙醯基-正胞壁醯-L-丙氨醯-D-異谷醯胺(正-MDP)和N-乙醯胞壁醯-L-丙氨醯-D-異穀氨醯胺醯-L-丙氨酸-2-(1』 -2』 - 二棕櫚醯-sn-甘油-3-羥基磷醯氧基)_乙胺MTP-PE)。
[0767]M.咪唑並喹諾酮化合物。
[0768]適合用作本發明佐劑的咪唑並喹諾酮化合物的例子包括咪喹莫特("R-837")[176,177]、瑞喹莫德(「R-848」)[178],以及它們的類似物和鹽(如鹽酸鹽)。有關免疫刺激性咪唑喹啉的其它細節可參見參考文獻179-183。
[0769]N.取代的脲
[0770]用作佐劑的取代的脲包括式1、II或III的化合物,或其鹽:
[0771]
【權利要求】
1.一種包含肺炎鏈球菌抗原組合的免疫原性組合物,所述組合包括spr0096抗原和spr2021 抗原。
2.如權利要求1所述的免疫原性組合物,其包含一種或多種選自下組的抗原:(I)sprl739 抗原;(2) spr0867 抗原;(3) sprl431 抗原;(4) sprl433 抗原;(5) sprl707 抗原;(6)spr0057 抗原;(7) spr0565 抗原;(8) sprl345 抗原;(9) sprl416 抗原;(10) sprl418 抗原;(11) sprl098 抗原;和 / 或(12) spr0286 抗原; 其中優選的是,一種或多種抗原選自:(I) sprl739抗原;(2) spr0867抗原;(3) sprl431抗原;(4) sprl433抗原;和/或(5) sprl707抗原。
3.如權利要求1所述的免疫原性組合物,其中: 所述spr0096抗原是包含某胺基酸序列的多肽,該序列:(a)與SEQ ID NO: 12具有80%或更高的相同性;和/或(b)包含含有表位的SEQ ID NO: 12的至少10個連續胺基酸的片段;和 所述spr2021抗原是包含某胺基酸序列的多肽,該序列:(a)與SEQ ID NO: 11具有80%或更高的相同性;和/或(b)包含含有表位的SEQ ID NO: 11的至少10個連續胺基酸的片段。
4.如權利要求3所述的免疫原性組合物,所述組合包括spr0057抗原和/或spr0565抗原,其中: 所述spr0057抗原是包含某胺基酸序列的多肽,該序列:(a)與SEQ ID NO:1具有80%或更高的相同性;和/或(b)包含含有表位的SEQ ID NO:1的至少10個連續胺基酸的片段;和 所述spr0565抗原是包含某胺基酸序列的多肽,該序列:(a)與SEQ ID NO: 3具有80%或更高的相同性;和/或(b)包含含有表位的SEQ ID NO: 3的至少10個連續胺基酸的片段。
5.如權利要求3或4所述的組合物,其特徵在於,還包含一種或多種下列物質: (a)肺炎鏈球菌RrgA和/或RrgB菌毛抗原;和/或 (b)肺炎鏈球菌Pmp抗原;和/或 (C) 一種或多種肺炎球菌莢膜糖和載體蛋白的偶聯物,其中(i)所述莢膜糖來自以下一種或多種肺炎球菌血清型:1、3、4、5、6B、7F、9V、14、18C、19F和23F ;和(ii)所述載體蛋白是細菌毒素或類毒素,或者是流感嗜血桿菌的蛋白D。
6.如權利要求1或2所述的免疫原性組合物,其包含: (a)一種或多種肺炎球菌莢膜糖和載體蛋白的偶聯物; (b)一種或多種選自下組的抗原:白喉類毒素;破傷風類毒素;B型肝炎病毒表面抗原;滅活的脊髓灰質炎病毒抗原;一種或多種非細胞百日咳抗原出型流感嗜血桿菌莢膜糖抗原的偶聯物;腦膜炎奈瑟球菌血清組C莢膜糖抗原的偶聯物;腦膜炎奈瑟球菌血清組Y莢膜糖抗原的偶聯物;腦膜炎奈瑟球菌血清組W135莢膜糖抗原的偶聯物;和腦膜炎奈瑟球菌血清組A莢膜糖抗原的偶聯物;或 (c)溫度保護劑。
7.一種式NH2-A-{-X-L-}n-B-COOH所示的多肽,式中: X是選自下組的肺炎球菌抗原的胺基酸序列:(I) spr0057抗原;(2) spr0096抗原;(3)spr0565 抗原;(4) spr2021 抗原;(5) RrgA 抗原;和(6) RrgB 抗原;L是任選的接頭胺基酸序列; A是任選的N末端胺基酸序列; B是任選的C末端胺基酸序列;和 η是2或更大的整數,至少一種情況下X是spr0096,至少一種情況下X是spr2021。
8.如權利要求7所述的多肽,它具有式NH2-A-X1-L1-X2-L2-B-COOH,式中: (B)X1是spr0096肺炎球菌抗原的胺基酸序列,X2是spr2021肺炎球菌抗原的胺基酸序列;或 (WX1是spr2021肺炎球菌抗原的胺基酸序列,X2是spr0096肺炎球菌抗原的胺基酸序列; L是任選的接頭胺基酸序列; A是任選的N末端胺基酸序列; B是任選的C末端胺基酸序列。
9.如權利要求7或8所述的多肽,其特徵在於,至少一個L序列包含Glyx,其中x= 2、3、4、5、6、7、8、9 或 10。
10.如權利要求7或8所述的多肽,其特徵在於,其包含選自SEQID NO: 194和205的胺基酸序列。
11.一種多肽,其與選自SEQ ID NO: 194和205的胺基酸序列具有75%或更高的序列相同性。
12.一種免疫原性組合物,它包含權利要求7-11任一所述的多肽。
13.—種編碼權利要求7-11中任一項所述多肽的核酸。
14.一種肺炎球菌,其中spr2021和spr0096多肽被敲除,任選的是一種或多種下列多肽也被敲除:(I) spr0057 ; (2) spr0286 ; (3) spr0565 ; (4) sprl098 ; (5) sprl345 ; (6)sprl416 ; (7)sprl418 ; (8)spr0867 ; (9)sprl431 ; (10)sprl739 ; (13)sprl433 ;和 / 或(14)sprl707o
15.如權利要求1-6任一或12所述的免疫原性組合物在哺乳動物中產生免疫應答的方法中的應用,優選的是,其用於保護哺乳動物免遭肺炎球菌感染。
【文檔編號】C12N1/20GK104001165SQ201410192895
【公開日】2014年8月27日 申請日期:2008年8月1日 優先權日:2007年8月1日
【發明者】C·多納蒂, A·穆茲, V·馬西格納尼, F·巴格諾利, P·魯格洛, M·巴羅奇 申請人:諾華股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀