生產蛋白質的方法
2023-07-13 20:33:46 2
專利名稱:生產蛋白質的方法
技術領域:
本發明涉及在棒狀桿菌型細菌中分泌生產(產生並分泌)異源蛋白質的方法,並更具體地,涉及在棒狀桿菌型細菌中分泌生產異源蛋白質,包括工業上有用的酶和生理學活性蛋白質的方法。
背景技術:
棒狀桿菌型細菌作為L-胺基酸如L-穀氨酸和L-賴氨酸以及核酸的生產菌在發酵工業中是非常有用的。此外,棒狀桿菌型細菌與被認為更優選用於分泌異源蛋白質的黴菌、酵母和芽孢桿菌細菌相比固有地向細胞外分泌極低水平的蛋白,這使得在生產和分泌異源蛋白質的情況中簡化或省略純化步驟成為可能。棒狀桿菌型細菌也可以在含有糖、氨和無機鹽的簡單培養基中快速生長,這使得它們在培養基成本、培養方法和培養物生產力方面是優越的,而且也被認為在異源蛋白質的產生中是極為有用的細菌。
使用棒狀桿菌型細菌有效地生產並分泌異源蛋白質的方法的實例包括通過穀氨酸棒桿菌(Corynebacterium glutamicum)(縮寫為C.glutamicum)分泌核酸酶和脂肪酶(美國專利No.4965197,J.Bacteriol.,174,1854-1861(1992)),分泌蛋白酶例如枯草桿菌蛋白酶(subtilisin)(App.Environ.Microbiol.,61,1610-1613(1995)),分泌棒狀桿菌型細菌的細胞表層蛋白(日本國際專利申請公開No.H6-502548),使用棒狀桿菌型細菌分泌纖連蛋白結合蛋白(fibronectin-bound protein)(Appi.Environ.Microbiol.,63,4392-4400(1997)),使用突變的分泌元件(component)分泌蛋白質的方法(日本專利申請公開No.H11-169182),生產並分泌轉穀氨醯胺酶(transglutaminase)的方法(Appl.Environ.Microbiol.,69,358-366(2003)),以及使用突變菌株生產並分泌轉穀氨醯胺酶的方法(WO 02/81694)。對於積累的蛋白質的量來說,使用源自枯草芽孢桿菌(Bacillus subtilis)的枯草桿菌蛋白酶基因(aprE)的啟動子,核糖體結合位點和信號肽序列在穀氨酸棒桿菌中表達源自節瘤偶蹄形菌(Dichelobacter nodosus)的鹼性蛋白酶基因,已觀察到約2.5mg/ml的積累(Appl.Environ.Micribiol.,61,1610-1613(1995))。對於轉穀氨醯胺酶的分泌,已經證實了930mg/L的最大分泌積累(WO 02/81694)。
在棒狀桿菌型細菌中先前已知的蛋白分泌途徑是稱為Sec系統(機制)的途徑。Sec機制存在於內細胞質膜,並由一些元件組成,所述元件主要含有SecY(日本專利申請公開No.H6-169780)、SecE(日本專利申請公開No.H6-277073)和SecG(日本專利申請公開No.H11-169182),其作為蛋白質分泌通道起作用,以及SecA(日本專利申請公開No.H7-107981),其作為蛋白透過的驅動力來源起作用。這個系統存在於廣泛的微生物中,從包括大腸桿菌(Escherichia coli)和枯草芽孢桿菌的原核生物到包括酵母、黴菌和人的真核生物,是最重要和最常見的蛋白質分泌途徑。
然而,已知某些蛋白質難以在棒狀桿菌型細菌中通過Sec系統分泌,這種蛋白質的實例包括工業上有用的蛋白質,例如異麥芽糖葡聚糖酶和蛋白轉穀氨醯胺酶。
近來在植物細胞葉綠體的類囊體膜(thylakoid membrane)中發現了與Sec系統完全不同的蛋白質分泌途徑(EMBO J.,14,2715-2722(1995))。對於通過這個途徑分泌的蛋白質的信號序列,一種精氨酸-精氨酸序列是共同的(EMBO J.,14,2715-2722(1995)),因此,這個途徑被稱為Tat系統(雙精氨酸轉位系統,Twin-Arginine Translocation system)。隨後,這種Tat系統被確定為特異性地參與具有共有的精氨酸-精氨酸信號序列的蛋白質的分泌,所述蛋白質例如大腸桿菌還原激酶(reductokinase)、硝酸還原酶(nitratereductase)、枯草芽孢桿菌硫辛酸(lipoic acid)合成酶和磷酸二酯酶(Science,278,1467-1470(1997),美國專利No.6022952,美國專利No.6335178,J.Biol.Chem.,275,41350-41357,國際專利公開No.WO 02/22667)。
另外,與蛋白質在Sec系統中在形成高級結構前被分泌相對的,Tat系統的特徵在於通過細胞膜分泌形成高級結構後的蛋白質(J.Biol.Chem.,25,273(52),34868-74(1998))。
雖然與編碼Tat系統元件的基因具有高同源性的基因已經被證明也存在於棒狀桿菌型細菌中,其包括tatA(GENEBANK cg103060 1571065-1571382)、tatB(GENEBANK cg103060 1167110-1167580)、tatC(GENEBANK cg1030601569929-1570873)和tatE(gi|41223046|emb|CAF18991.1),但它們的功能是未知的,而且不知道在棒狀桿菌型細菌中蛋白質是否通過Tat系統途徑分泌。
另外,雖然有通過將表達編碼Tat系統分泌元件的tatA、tatB和tatC基因的質粒導入到大腸桿菌中,觀察到改善了由Tat途徑分泌到周質中的量的報導,但積累的量僅有5到10mg/L,這沒有達到工業上的實用水平(Biochem.Biophys.Res.Commun.,304,279-284(2003))。
發明內容
本發明的目的是提供在棒狀桿菌型細菌中有效地在細胞外分泌(分泌生產)工業上有用的異源蛋白質的方法,所述蛋白質難以使用分泌蛋白質的途徑之一的Sec系統來分泌。
更具體地,本發明的目的是提供通過在棒狀桿菌型細菌中產生並有效地分泌(分泌生產)工業上有用的異源蛋白質來有效地生產異源蛋白質的方法,所述異源蛋白質難以通過蛋白質分泌途徑之一的Sec系統來分泌。
作為致力於棒狀桿菌型細菌中蛋白質分泌途徑的機制的結果,本發明人發現,一種不同於先前已知的Sec系統的蛋白質分泌途徑-Tat系統,在棒狀桿菌型細菌中是有功能的。更具體地,本發明人發現這樣的現象通過在被認為構成棒狀桿菌型細菌蛋白質分泌途徑Tat系統的蛋白質的編碼基因中引起缺陷,使先前被分泌的蛋白質不再被分泌。這證實了在棒狀桿菌型細菌中Tat系統也是有功能的。此外,本發明人發現了Tat系統依賴性信號序列,並且發現,通過將表達構建體導入棒狀桿菌型細菌並培養得到的轉化的棒狀桿菌型細菌可以有效地分泌目標蛋白質,所述表達構建體含有連接到編碼所述信號的序列下遊的目標蛋白質的基因序列,所述蛋白質難以用先前已知的蛋白質分泌途徑Sec系統來分泌。本發明人還發現,難以通過Sec系統的常規蛋白質分泌途徑分泌的異源蛋白質,例如,異麥芽糖葡聚糖酶和蛋白-穀氨醯胺酶,可以通過使用Tat系統有效地分泌,所述Tat系統是在棒狀桿菌型細菌中新發現的蛋白質分泌途徑,由此產生了本發明。此外,本發明人還發現,在棒狀桿菌型細菌中通過擴增編碼Tat系統分泌元件的基因,使用Tat系統可以提高可分泌蛋白質的量。
本發明是生產異源蛋白質的方法,其包括培養攜帶表達遺傳構建體的棒狀桿菌型細菌並通過所述棒狀桿菌型細菌生產並分泌異源蛋白質,所述表達遺傳構建體在5′-端到3′-端方向上含有在棒狀桿菌型細菌中起作用的啟動子序列、編碼Tat系統依賴性信號肽區域的核酸序列和編碼異源蛋白質的核酸序列。
更具體地,本發明是以上說明的用於生產異源蛋白質的方法,其中所述Tat系統依賴性信號肽含有SEQ ID NO.31或32中描述的序列。
再更具體地,本發明是以上說明的用於生產異源蛋白質的方法,其中所述Tat系統依賴性信號肽含有SEQ ID NO.28到30中描述的任一序列。
具體地,本發明是以上說明的用於生產異源蛋白質的方法,其中所述Tat系統依賴性信號肽是異麥芽糖葡聚糖酶的信號肽或三甲胺-N-氧化物還原酶的信號肽。
更具體地,本發明是上述用於生產異源蛋白質的方法,其中所述異麥芽糖葡聚糖酶的Tat系統依賴性信號肽具有SFQ ID NO.6中描述的胺基酸序列,或者三甲胺-N-氧化物還原酶的信號肽具有SEQ ID NO.8中描述的胺基酸序列。
優選實施方式的說明在本發明的方法中,棒狀桿菌型細菌被用作宿主載體;產生表達構建體,在所述表達構建體中待分泌的目標蛋白的基因被連接到棒狀桿菌型細菌的Tat系統依賴性信號肽的下遊;這個表達構建體被插入到棒狀桿菌型細菌中並且被表達以在細胞外分泌目標蛋白。
如在本說明書中使用的,「分泌」蛋白質或肽是指蛋白質或肽的分子被轉運到細菌細胞的外部(在細胞外),而且它包括這樣的情況,其中蛋白質或肽分子最終以完全游離的形式置於培養基中,以及這樣的情況,其中僅蛋白質的一部分處在細菌的外部,和這樣的情況,其中蛋白質存在於細菌的表層。
已知分泌性蛋白質通常被翻譯成前肽(prepeptide)或前肽原(prepropeptide),之後它們成為成熟的蛋白質。即,一般地,在被翻譯為前肽或前肽原之後,信號肽(前體區域(pre-region))通常被切斷以產生成熟的肽或肽原(propeptide),已知肽原的原體區域(pro-region)進一步由蛋白酶切斷而產生成熟肽。此外,如本說明書中使用的「信號序列」是指存在於分泌性蛋白質前體的N-末端上但不存在於天然存在的成熟蛋白質中的序列,而「信號肽」是指從這種蛋白質前體切下來的肽。一般地,信號序列伴隨著細胞外分泌而被蛋白酶(通常稱為信號肽酶)切斷。雖然這種信號肽在生物物種之間在序列上具有恆定的、共同的特徵,但是在某些生物物種中顯示分泌功能的信號肽不一定在另一個生物物種中顯示分泌功能。
在本發明中,同時具有信號肽和原體區域的蛋白質,即初步翻譯產物(primary translation product),可被稱為「前蛋白質原(preproprotein)」,而具有原體區域而沒有信號肽的蛋白質可以稱為「蛋白質原(proprotein)」。蛋白質的原體區域可以被稱為「原體結構部分(pro-structural portion)」或簡稱「原體結構(pro-structure)」,而如在本說明書中使用的,蛋白質的「原體結構部分/原體結構」和蛋白質的「原體區域」可互換地使用。在前蛋白質原或前蛋白(preprotein)中,信號肽可以是天然地存在於目標蛋白質中的信號肽,或可以是不同蛋白質的信號肽,其優選來自所使用的宿主的分泌性蛋白質。可選擇地,它也可以被修飾以具有相應於所使用宿主的密碼子使用習慣(codon usage)的最適密碼子。此外,可用於本發明的信號肽可以部分地含有天然存在的成熟蛋白質的N-末端胺基酸序列,所述信號肽源自所述成熟蛋白質。在信號肽源自不同蛋白質的情況中,前蛋白可以被具體地稱為「異源融合前蛋白原」。
例如,在蛋白質是蛋白-穀氨醯胺酶的情況下,它分別被稱為「前蛋白原-穀氨醯胺酶」、「蛋白原-穀氨醯胺酶」和「異源融合前蛋白-穀氨醯胺酶」。此外,其中「原體部分被切斷」的蛋白質包括通過肽鍵的切斷已經從其上除去了構成原體區域的至少一個胺基酸的蛋白質,還包括其N-末端區域完全相應於天然存在的成熟蛋白質的N-末端區域的蛋白質,並且只要保持了蛋白質的活性,它還包括與天然存在的蛋白質相比,其在N-末端上具有源自原體部分的一個多個多餘胺基酸的蛋白質,以及胺基酸序列比天然存在的蛋白質短的蛋白質。
在本發明中,「Tat系統」是一種也被稱為「雙精氨酸轉位途徑(twin-arginine-translocation pathway)」的途徑,是指這樣的機制或途徑,其識別在信號肽中保守的精氨酸-精氨酸保留區域,並通過這種途徑,蛋白質通過包括TatA、B、C和E的膜蛋白分泌。此外,「Tat系統分泌元件」是指含有TatA、B、C和E的膜蛋白。這些TatA、B、C和E是位於細胞膜中的跨膜蛋白。它們被認為形成複合物,在細胞膜上形成孔洞供蛋白質穿過。此外,對於當蛋白質轉運穿過細胞膜時TatA、B、C和E的詳細的高級結構和功能,研究正在進行中。在穀氨酸棒桿菌ATCC13869中,編碼TatA的基因和編碼TatC的基因位置極其接近。編碼TatA和其5′-上遊區域的基因序列,以及編碼TatC的基因序列,在SEQ ID NO.38中示出。此外,TatA的胺基酸序列在SEQ ID NO.46中示出,而TatC的胺基酸序列在SEQ ID NO.10中示出。編碼TatB和其5′-上遊區域的基因序列在SEQ ID NO.41中示出,TatB的胺基酸序列在SEQ ID NO.47中示出,編碼TatE的基因序列在SEQ ID NO.48中示出,TatE的胺基酸序列在SEQ ID NO.49中示出。TatA和TatE享有極高程度的同源性,而在大腸桿菌中,已知TatA和TatE的功能是功能上互補的(EMBO J.,117(13)3640-3650(1998))。
在本發明使用的棒狀桿菌型細菌中,可以擴增的Tat系統分泌元件不限於穀氨酸棒桿菌中的Tat系統分泌元件,包括能在棒狀桿菌型細菌中起作用的任何Tat系統分泌元件,包括其中元件的胺基酸序列部分缺失或添加的情況。
根據這種系統的分泌信號具有「Tat系統依賴性信號肽」(也稱為「雙精氨酸信號肽」)。「Tat系統依賴性信號肽」是指被Tat系統識別的信號肽,而且其中存在精氨酸-精氨酸的保守區域。「Tat依賴性信號肽」的實例包括大腸桿菌的三甲胺-N-氧化還原酶(TorA)、大腸桿菌的SufI(ftsI的抑制物ftsI抑制物)、枯草芽孢桿菌的PhoD(磷酸二酯酶)、LipA、和來自球形節桿菌(Arthrobacter globiformis)的異麥芽糖葡聚糖酶(IMD)的信號肽。這些信號肽的胺基酸序列如下所示TorA信號肽MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATA(SEQ ID NO.8)SufI信號肽MSLSRRQFIQASGIALCAGAVPLKASA(SEQ ID NO.28)PhoD信號肽MAYDSRFDEWVQKLKEESFQNNTFDRRKFIQGAGKIAGLSLGLTIAQS(SEQ ID NO.29)LipA信號肽MKFVKRRTTALVTTLMLSVTSLFALQPSAKAAEH(SEQID NO.30)IMD信號肽MMNLSRRTLLTTGSAATLAYALGMAGSAQA(SEQ ID NO.6)此外,在本說明書中,當涉及TorA信號肽、SufI信號肽、PhoD信號肽、LipA信號肽或IMD信號肽時,除了分別具有上述SEQ ID NO.8、28、29、30或6的肽之外,包括在每個序列中具有一個或幾個胺基酸的取代、缺失、插入或添加的肽。術語「幾個」通常是指1到7個,優選1到5個,特別優選1到2個左右的胺基酸,而這取決於在這些Tat系統依賴性信號肽中胺基酸殘基的位置和種類。此外,信號肽可以是具有胺基酸序列的信號肽,所述胺基酸序列通常與SEQ ID NO.8、28、29、30或6中所示胺基酸序列具有85%或更高,優選90%或更高,更優選95%或更高的同源性。
編碼具有這種取代、缺失、插入或添加的信號肽的核酸序列可以從大腸桿菌、枯草芽孢桿菌和球形節桿菌的變體、天然突變株或人工突變株,除了球形節桿菌的節桿菌菌種和除了枯草芽孢桿菌的芽孢桿菌菌種獲得。此外,編碼具有取代、缺失、添加或插入的Tat系統依賴性信號肽的核酸序列可以體外誘變或位點特異性誘變核酸來獲得,所述核酸編碼具有SEQ ID NO.8、28、29、30或6所示的胺基酸序列的Tat系統依賴性信號肽。這種誘變可由本領域技術人員使用通常已知的方法來進行。
上述取代、刪除、插入或添加是保守的突變,從而保留了以下將描述的共有基序。保守的突變通常是保守性取代。取代這些信號肽的原有胺基酸並認為是保守性取代的胺基酸的實例包括,從Ala到Ser或Thr的取代、從Arg到Gln、His或Lys的取代、從Asn到Glu、Gln、Lys、His或Asp的取代、從Asp到Asn、Glu或Gln的取代、從Cys到Ser或Ala的取代、從Gln到Asn、Glu、Lys、His、Asp或Arg的取代、從Glu到Asn、Gln、Lys或Asp的取代、從Gly到Pro的取代、從His到Asn、Lys、Gln、Arg或Tyr的取代、從Ile到Leu、Met、Val或Phe的取代、從Leu到Ile、Met、Val或Phe的取代,從Lys到Asn、Glu、Gln、His或Arg的取代、從Met到Ile、Leu、Val或Phe的取代、從Phe到Trp、Tyr、Met、Ile或Leu的取代、從Ser到Thr或Ala的取代、從Thr到Ser或Ala的取代、從Trp到Phe或Tyr的取代、從Tyr到His、Phe或Trp的取代以及從Val到Met、Ile或Leu的取代。
在「Tat系統依賴性信號肽」中,共有基序S/T-R-R-X-F-L-K(SEQ ID NO.31)或R-R-X-#-#(#疏水性殘基)(SEQ ID NO.32)的疏水性區域是保守的。然而,即使這些共有基序是保守的,它們也受到待分泌的蛋白質的影響。例如,雖然枯草芽孢桿菌的信號肽WprA和WapA具有雙精氨酸基序,已經證明了它們依賴SRP/Sec系統而不是Tat系統分泌(Biochem Biophys ResCommun.2003 Apr25304(1)48-54)。可以在Tat系統中分泌的蛋白質的實例包括,但不限於,來自大腸桿菌的TorA和SufI、來自枯草芽孢桿菌的PhoD和來自枯草芽孢桿菌的LipA。具體地在棒狀桿菌型細菌中,可以使用Tat系統分泌的蛋白質的實例包括各種酶,例如異麥芽糖葡聚糖酶、蛋白-穀氨醯胺酶(protein-glutaminase)和轉穀氨醯胺酶。具體的實例包括,但不限於,來自球形節桿菌T6(NRRL B-4425,IMA12103)的異麥芽糖葡聚糖酶,優選具有SEQ ID NO.2中描述的胺基酸序列的異麥芽糖葡聚糖酶,Chryseobacterium proteolyticum的蛋白-穀氨醯胺酶,優選具有SEQ ID NO.4中所示胺基酸序列的蛋白-穀氨醯胺酶,GFP(綠色螢光蛋白),和WO 02/81694中所示的茂原鏈輪絲菌(Streptoverticillium mobaraense)的轉穀氨醯胺酶。球形節桿菌菌株T6以登記號no.NRRL B-4425被保藏在Northern UtilizationResearch and Development Division。Chryseobacterium roteollyticum已經於2000年11月8日作為FERM BP-3523保藏在工業技術院生命工學工業技術研究所(當前為國際專利生物保藏中心,國家先進工業科技研究所,TsukubaCentral 6,1-1-1 Higashi,Tsukuba,Ibaraki,Japan 305-8566)。
異麥芽糖葡聚糖酶是一種有效地從葡聚糖等等產生異麥芽糖的酶。異麥芽糖葡聚糖酶是工業上有用的酶,因為通過使這種酶作用於葡聚糖等等來獲得的異麥芽糖是工業上有用的,而且它具有防齲效果(參見日本專利申請公開No.5 8-76063)和對在人體中有用的腸細菌雙歧桿菌的增殖效果(參見日本專利申請公開No.61-22777)。蛋白-穀氨醯胺酶是作為穀氨醯胺酶起作用的酶,是極為有用的,因為它直接作用於蛋白質中存在的穀氨醯胺殘基而不降低蛋白質的分子量,並且具有脫醯胺功能而不切斷肽鍵或伴隨蛋白質交聯(日本專利申請公開No.2001-218590)。GFP是指來自水母(jellyfish)的綠色螢光蛋白,當通過與其他蛋白融合來插入到細胞中時,能夠在細胞內的任意位置產生螢光,從而展現了在體內特定結構的螢光標記方面的有效性,這使它能用於許多研究中。這些酶不由常規的Sec系統分泌,但是僅能通過使用Tat系統分泌。然而,通過本發明有效生產的蛋白質不限於這些酶,它們可以是可使用Tat系統通過棒狀桿菌型細菌分泌的任何蛋白質。
在本發明中棒狀桿菌型細菌是需氧的、革蘭氏陽性的桿菌,雖然其通常被分類為短桿菌屬(Brevibacterium)菌種,當前包括併入棒桿菌屬(Corynebacterium)的細菌(Int.J.Syst.Bacteriol.,41,255(1981)),和與棒桿菌屬菌種極其類似的短桿菌屬菌種的細菌。使用棒狀桿菌型細菌的益處包括這樣的事實,與已被認為適合於分泌異源蛋白質的黴菌、酵母和芽孢桿菌屬菌種的細菌相比,它們原本分泌極少量的細胞外蛋白,因而使得在異源蛋白質的分泌生產中簡化或縮短純化過程成為可能。此外,由於棒狀桿菌型細菌可以容易地在含有糖類、氨或無機鹽等的簡單培養基中生長,在培養基成本、培養方法和培養物生產力方面它們也是優越的。棒狀桿菌型細菌的實例包括以下菌種。
嗜乙醯乙酸棒桿菌(Corynebacterium acetoacidophylum),醋谷棒桿菌(Corynebacterium acetoglutamicum),烷醇棒桿菌(Corynebacterium alkanolyticum),美棒桿菌(Corynebacterium callunae),穀氨酸棒桿菌(Corynebacterium glutamicum),百合花棒桿菌(Corynebacterium lilium),棲糖蜜棒桿菌(Corynebacterium melassecola),嗜熱產氨棒桿菌(Corynebacterium thermoaminogenes),力士棒桿菌(Corynebacterium herculis),二歧短桿菌(Brevibacterium divaricatum),黃色短桿菌(Brevibacterium flavum),Brevibacterium immariophilum乳發酵短桿菌(Brevibacterium lactofermentum),玫瑰色短桿菌(Brevibacterium roseum),解糖短桿菌(Brevibacterium saccharolyticum),生硫短桿菌(Brevibacterium thiogenitalis),產氨棒桿菌(Corynebacterium ammoniagenes),白色短桿菌(Brevibacterium album),蠟狀短桿菌(Brevibacterium cerinum),嗜氨微桿菌(Microbacterium ammoniaphilum)。
具體的實例包括下列的菌株。
嗜乙醯乙酸棒桿菌ATCC 13870,醋谷棒桿菌ATCC 15806,烷醇棒桿菌ATCC 21511,美棒桿菌ATCC 15991,穀氨酸棒桿菌ATCC 13020,ATCC 13032,ATCC 13060,百合花棒桿菌ATCC 15990,
棲糖蜜棒桿菌ATCC 17965,Corynebacterium efficiens AJ12340(FERM BP-1539),力士棒狀桿菌ATCC 13868,二歧短桿菌ATCC 14020,黃色短桿菌ATCC 13826,ATCC 14067,AJ12418(FERM BP-2205),Brevibacterium immariophilum ATCC 14068,乳發酵短桿菌ATCC 13869,玫瑰色短桿菌ATCC 13825,解糖短桿菌ATCC 14066,生硫短桿菌ATCC 19240,產氨棒桿菌ATCC 6871,ATCC 6872,白色短桿菌ATCC 15111,蠟狀短桿菌ATCC 15112,和嗜氨微桿菌ATCC 15354。
這些生物體可以從例如美國典型培養物保藏中心(American Type CultureCollection)獲得。即,已經給每個微生物菌株分配了保藏號,在美國典型培養物保藏中心的目錄中描述了這些保藏號,這允許通過參考這些編號來提供每種微生物菌株。
具體地,作為鏈黴素(Sm)抗性突變菌株從野生菌株穀氨酸棒桿菌ATCC13869分離的穀氨酸棒桿菌AJ12036(FERM BP-734)(最初於1984年3月26日保藏)(當前保藏在國際專利生物保藏中心,國家先進工業科技研究所,Tsukuba Central 6,1-1-1 Higashi,Tsukuba,Ibaraki,Japan 305-8566)預期在涉及蛋白質分泌的功能基因中含有突變,而且對於在最佳培養條件下積累的量而言,展現了極高的異源蛋白質生產和分泌能力,比親本菌株(野生菌株)高2到3倍,因而使得它適合作為宿主生物體(參見,WO 02/081694)。
此外,特別優選使用經過修飾從而不產生細胞表層蛋白的這種微生物菌株作為宿主,因為其分泌到培養基中的異源蛋白質的純化變得容易。可以使用誘變或基因重組方法通過將突變導入細胞表層蛋白中或導入其位於染色體上的表達調控區域中來進行這種修飾。已經被修飾而不產生細胞表層蛋白質的棒狀桿菌型細菌的實例是穀氨酸棒桿菌菌株YDK010,一種來自AJ12036(國際公開WO 02/081694)的破壞了細胞表層蛋白(PS2)的菌株。
在本發明中使用的遺傳構建體通常含有啟動子、編碼適合的信號肽的序列、編碼目標蛋白質的核酸片段、和在棒狀桿菌型細菌中表達目標蛋白質所需的控制序列(例如操縱子或終止子),其位於處於適合的位置從而它們能夠起作用。目標蛋白可以在N-末端上具有原體結構(pro-structure)。在用於此構建體的載體上沒有特別的限制,可以是染色體外自我複製的載體,例如質粒,或摻入到細菌染色體中的載體,只要它可以在棒狀桿菌型細菌內起作用。這些載體的實例包括PAM330(日本專利申請公開No.58-067699)、pHM1519(日本專利申請公開No.58-77895)和pSFK6(日本專利申請公開No.2000-262288)。此外,當將在這個質粒上賦予在棒狀桿菌型細菌中自我複製能力的DNA片段從這些載體上切下並插入到上述大腸桿菌載體中時,所述載體可被用做所謂的穿梭載體(shuttle vector),其能在大腸桿菌和棒狀桿菌型細菌中複製。此外,也可以使用人工的轉座子等等。在使用轉座子的情況下,目標基因將通過同源重組或通過其可轉座能力被導入到染色體中。
在可用於本發明的啟動子上沒有特別的限制,可以使用任何啟動子,只要它能在棒狀桿菌型細菌細胞中起作用,而且也可以是異源啟動子,例如tac啟動子或來自大腸桿菌的其他啟動子。強啟動子例如tac啟動子是更優選的。源自棒狀桿菌型細菌的啟動子的實例包括細胞表層蛋白PS1、PS2和SlpA的基因啟動子、各種胺基酸生物合成系統的每種啟動子,所述合成系統例如涉及穀氨酸生物合成系統的穀氨酸脫氫酶基因、涉及穀氨醯胺生物合成系統的穀氨醯胺合成酶基因、涉及賴氨酸生物合成系統的天冬氨酸激酶基因、涉及蘇氨酸生物合成系統的高絲氨酸脫氫酶基因、涉及異亮氨酸和纈氨酸生物合成系統的乙醯羥酸合成酶基因、涉及亮氨酸生物合成系統的2-異丙基蘋果酸合成酶基因、涉及脯氨酸和精氨酸生物合成系統的穀氨酸激酶基因、涉及組氨酸生物合成系統的磷酸核糖-ATP焦磷酸化酶基因、涉及芳香族胺基酸,例如色氨酸、酪氨酸和苯丙氨酸的生物合成系統的deoxyarabinoheptutonate(DAHP)基因,和涉及核酸生物合成例如次黃嘌呤核苷酸(inosinic acid)和鳥嘌呤核苷酸(guanylic acid)生物合成系統的磷酸核糖焦磷酸(PRPP)氨基轉移酶基因、肌苷酸脫氫酶基因和鳥苷酸合成酶基因。
在用於本發明的信號肽上沒有特別的限制,只要它是能在棒狀桿菌型細菌細胞中起作用的Tat系統依賴性信號肽。可以使用在棒狀桿菌型細菌細胞內起作用的任何Tat系統依賴性信號肽。因而,異源來源的Tat系統依賴性信號肽例如來自大腸桿菌或枯草芽孢桿菌的Tat系統依賴性信號肽可以用於本發明中,只要它可以在棒狀桿菌型細菌細胞內起作用。信號肽可以含有分泌性蛋白質的N-末端胺基酸序列的部分,所述信號肽是來自所述分泌性蛋白質的。當翻譯的產物被分泌到細菌細胞外時,信號序列被信號肽酶切斷。此外,雖然天然存在形式的基因可以用作編碼信號肽的基因;它也可以被修飾以具有取決於所使用宿主的密碼子使用習慣的最適密碼子。在使用這些信號肽的情況下,編碼目標蛋白質的基因將被定位,以使該基因連接到編碼信號肽的基因的3』-末端並且表達受到上述啟動子的控制。
可以根據本發明生產並分泌的有用蛋白質包括任何蛋白質,無論它們原本是以Tat系統分泌的還是以Sec系統分泌的,包括來自動植物和微生物的細胞內蛋白質,只要它們是由核酸編碼的蛋白質,所述核酸可包括在與編碼上述Tat系統依賴性信號肽的編碼核酸序列相同的基因構建體中。可以根據本發明分泌和生產的蛋白質的實例包括蛋白酶、氨肽酶、羧肽酶、膠原酶和幾丁質酶。具體地,不能用常規的Sec系統分泌的蛋白質適合於根據本發明來生產並分泌。編碼這些蛋白質的基因可以取決於使用的宿主和/或為了獲得期望的活性而被修飾。所述修飾包括一個或多個胺基酸添加、缺失或取代等等。如果需要,取決於宿主的密碼子使用習慣,可以轉換為最適密碼子。這些通常的分子生物學技術,包括修飾技術、基因克隆技術和產生的蛋白質的檢測技術,是本領域技術人員公知的,人們可以參考例如Sambrook et al.,1989,Molecular CloningA Laboratory Manual,Second Edition(1989)Cold SpringHarbor Laboratory Press,Cold Spring Harbor New York;DNA CloningAPractical Approach,Volumes I and II(D.N Clover ed.1985);FM.Ausubel et at(eds),Current Protocols in Molecular Biology John Wiley Sons,Inc.(1994);PCR TechnologyPrinciples and Application for DNA Amplification,H Erich,ed.,Stockton Press。
在將可用於本發明的基因構建體導入棒狀桿菌型細菌的方法方面沒有特別的限制,並可以採用通常使用的方法,例如,原生質體法(Gene,39,281-286(1985))和電穿孔(Bio/Technology,7,1067-1070(1989))。
此外,在本發明中,棒狀桿菌型細菌可以是其中tat系統分泌元件已經被擴增了的菌株,即,其中構成tat系統分泌元件的包括TatA、B、C和E的膜蛋白已經被擴增的菌株。通過增強編碼親本菌株的tat系統分泌元件的含有tatA、tatB、tatC和tatE的基因組中一種或多種基因的表達,獲得這種棒狀桿菌型細菌。
增強編碼tat系統分泌元件的基因,包括tatA、tatB、tatC和tatE(它們的每一種都被稱為「tat基因」)的表達通過提高一種或多種tat基因的拷貝數來實現。例如,可將編碼含有tatA的基因的片段或編碼含有連接的tatA和tatB的基因的片段連接到在棒狀桿菌型細菌中起作用的載體,優選多拷貝載體,以產生重組DNA,其隨後被導入和轉化入如上所述的棒狀桿菌型細菌。在此時使用的載體與可用於上述的基因構建體的載體是相同的。此外,通過將編碼tat系統分泌元件的基因的一個或多個拷貝轉移到染色體中來實現增加拷貝數。將tat基因的多個拷貝插入到棒狀桿菌型細菌的染色體DNA中,這通過使用存在於染色體DNA上的多拷貝序列作為目標的同源重組來進行。對於存在於染色體DNA中的多拷貝序列,可以使用存在於可轉座因子的末端的重複DNA或反向重複。可選擇地,如在日本專利申請公開No.2-109985中公開的,通過將tat基因加載到轉座子上並轉移轉座子,也可以將多拷貝插入到染色體DNA中(日本專利申請公開No.2-109985;日本專利申請公開No.7-107976;Vertes,A.A.,Asai,Y.,Inui,M.,Kobayashi,M.,Kurusu,Y.and Yukawa,H.Mol.Gen.Genet.,245,397-405(1994))。將tat基因導入到染色體上可以通過使用tat基因的一部份作為探針進行Southern雜交來證實。
除了如上所述的基因擴增之外,通過用更強大的表達調控序列取代位於染色體DNA上或質粒上的表達調控序列,例如tat基因的啟動子,或通過修飾涉及調節tat基因表達的因子,例如操縱子或抑制物(repressor),也可以實現tat系統分泌元件的提高的表達(Hamilton et al.Journal of Bacteriology1714617-4622)。強啟動子的已知實例包括lac啟動子、trp啟動子和trc啟動子。評估啟動子強度的方法和強啟動子的實例在例如Goldstein et al.(Prokaryotic promoters in biotechnology.Biotechnol.Annu.Rev.,1995,1,105-128)中描述。此外,如在國際公開WO 00/18935中公開的,通過導入幾個核苷酸的核苷酸取代到目標基因的啟動子區域,可將啟動子修飾成更強的啟動子。此外,已知在核糖體結合位點(RBS)和起始密碼子之間的間隔區中的取代,特別是緊靠起始密碼子上遊的序列中幾個核苷酸的取代,對mRNA翻譯效率顯示出極大的影響,因而也可以修飾這些間隔區和核苷酸。使用啟動子檢測載體或遺傳分析軟體例如GENETYX,可以確定tat基因的啟動子或其他表達調控序列。例如,表達調控序列的取代也可以按照與使用上述溫度敏感質粒的基因取代相同的方式來進行。
得到的導入了基因的轉化體可以根據通常使用的方法和條件來培養。例如,轉化體可以在含有碳源、氮源和無機離子的普通培養基中培養。此外,為了獲得高生長,如果需要,也可以添加有機痕量營養物例如維生素和胺基酸。可以使用的碳源的實例包括碳水化合物如葡萄糖和蔗糖、有機酸如乙酸、醇類和其他碳源。可以使用的氮源的實例包括氨氣、氨水、銨鹽和其他氮源。如果需要,可以適當地使用的無機離子的實例包括鈣離子、鎂離子、磷酸根離子、鉀離子和鐵離子。培養可以在好氧條件下、在pH5.0到8.5的適合範圍內、在15到37℃的溫度下進行,培養時間可以是約1到7天。作為在這種條件下培養轉化體的結果,在細胞中大量產生目標蛋白質,並被高效地在細胞外分泌。
在培養之後,根據本領域技術人員公知的方法,可以從培養基分離和純化分泌到根據本發明的培養基中的蛋白質。例如,在通過離心分離等除去細菌細胞之後,通過適合的已知方法,例如鹽析、乙醇沉澱、超濾、凝膠過濾層析、離子交換柱層析、親和層析、中高壓液相層析、反相層析或疏水層析或它們的組合,可以分離和純化蛋白質。在通過本領域技術人員公知的方法,例如提高鹽濃度或使用表面活性劑來溶解蛋白質之後,按照與分泌到培養基中的情況相同的方式,也可以分離和純化根據本發明分泌到細胞表層的蛋白質。此外,在某些情況下,也可以不用溶解而使用分泌到細胞表層的蛋白質,例如,作為固定的酶。
雖然以下使用隨後的實施例提供了本發明的更詳細的說明,在任何情況下本發明不應被理解為受到這些實施例的限制。
實施例1-使用來自球形節桿菌的異麥芽糖葡聚糖酶的信號序列分泌表達異麥芽糖葡聚糖酶(1-1)使用穀氨酸棒桿菌的異麥芽糖葡聚糖酶的信號序列構建用於異麥芽糖葡聚糖酶的分泌表達的質粒早先已經測定了球形節桿菌菌株T6衍生的異麥芽糖葡聚糖酶基因(EC.3.2.1.94;1,6-α-D-葡聚糖異麥芽糖-葡聚糖酶)的序列(Joumal ofBacteriology,176,7730-7734(1994))。參考這個序列,合成具有SEQ ID NO.11(5′-ATGATGAACCTGTCCCGCCG-3′)和SEQ ID NO.12(5′-CGCGGATCCCTGAGGGCGGGAAC-3′)所示的序列的引物,使用根據普通方法(Saitoh和Miura的方法,(Biochim.Biophys Acta,72,619(1963))製備的球形節桿菌的染色體DNA作為模板,通過PCR來擴增編碼異麥芽糖葡聚糖酶的區域。使用Pyrobest DNA聚合酶(Takara)用於PCR反應,反應條件根據製造商建議的方案。SEQ ID NO.12的序列含有BamHI限制性內切酶識別序列。
此外,使用上述的pPKSPTG1(描述於WO 01/23591中)作為模板,使用SEQ ID NO.14(5′-AAATTCCTGTGAATTAGCTGATTTAG-3′)和SEQ IDNO.16(5′-GGCGGGACAGGTTCATCATAGAGGCGAAGGCTCCTTGAA-3′)所示的引物,通過PCR來擴增編碼啟動子和信號序列的區域。SEQ ID NO.16所示的序列含有編碼異麥芽糖葡聚糖酶的信號序列的N-末端區的區域。
將用具有SEQ ID NO.11和SEQ ID NO.12所示序列的引物擴增的PCR產物和用SEQ ID NO.14和SEQ ID NO.16的引物擴增的PCR產物混合,這些被用做模板使用SEQ ID NO.12和SEQ ID NO.14所示的引物來進行交叉PCR。在用限制性內切酶ScaI和BamHI消化這個PCR產物之後,通過瓊脂糖凝膠電泳回收約2.5kb的DNA片段,並將這個片段插入pPKSPTG1(描述於WO 01/23591中)的ScaI-BamHI區域中來構建異麥芽糖葡聚糖酶表達質粒pPKI-IMD。使用DyeTerminator Cycle測序試劑盒(PE Applied Biosystems)和DNA測序儀377A(PE Applied Biosystems)來測定插入到構建的質粒中的基因的序列。作為測定核苷酸序列的結果,顯示了產生的異麥芽糖葡聚糖酶基因部分地不同於報導的序列。新測定的異麥芽糖葡聚糖酶基因的序列在SEQ ID NO.1中示出,而胺基酸序列在SEQ ID NO.2中示出。
(1-2)使用IMD信號序列通過穀氨酸棒桿菌分泌IMD穀氨酸棒桿菌菌株YDK010(WO 01/23591)是鏈黴素(Sm)抗性菌株AJ12036的破壞了細胞表層蛋白(PS2)的菌株,AJ12036本身來自穀氨酸棒桿菌ATCC13869,用構建的質粒pPKI-IMD轉化穀氨酸棒桿菌菌株YDK010,挑選在含有25mg/l卡那黴素的CM2G瓊脂培養基上生長的微生物菌株。選擇的菌株在含有25mg/l卡那黴素的MM液體培養基中在30℃培養48小時。在完成培養之後,通過SDS-PAGE分析10μl培養物上清液。使用12.5%凝膠(Daiichi Pure Chemicals)進行SDS-PAGE,並用考馬斯亮藍染色檢測蛋白質條帶。結果,檢測到具有約65kDa的預計分子量的條帶。作為通過反相色譜分析定量蛋白質的結果,蛋白質濃度被確定為約120mg/l。此外,根據Journal of Bacteriology,176,7730-7734(1994)中描述的方法測量異麥芽糖葡聚糖酶的酶活性,產生的蛋白質被證實實際上具有異麥芽糖葡聚糖酶的酶活性。
此外,用蛋白質測序儀分析了分泌的異麥芽糖葡聚糖酶的N-末端胺基酸序列。結果,證實分泌了從SEQ ID NO.2所示胺基酸序列的第31位Ala開始的異麥芽糖葡聚糖酶。因而,證實了信號序列區是SEQ ID NO.5(核苷酸序列)和SEQ ID NO.6(胺基酸序列)所示的序列。
參考實施例A使用來自產氨棒桿菌(Corynebacterium ammoniagenes)的細胞表層蛋白質SlpA的信號序列分泌表達異麥芽糖葡聚糖酶(A-1)來自球形節桿菌菌株T6(NRRL B-4425,IMA12103)異麥芽糖葡聚糖酶基因的獲取合成具有SEQ ID NO.11和SEQ ID NO.12所示序列的引物,通過PCR從根據常規方法(Saitch和Miura的方法(Biochim.Biophys.Acts 72,619(1963))製備的球形節桿菌的染色體DNA擴增編碼異麥芽糖葡聚糖酶的區域。使用Pyrobest DNA聚合酶(Takara)用於PCR反應,反應條件根據製造商建議的方案。此外,SEQ ID NO.12的序列含有限制性內切酶BamHI識別序列。
然後,使用通過PCR擴增的DNA片段作為模板,使用SEQ ID NO.13(5′-GTCCCCGTCACGGCCGCGCC-3′)和SEQ ID NO.12所示的引物進行PCR來擴增編碼無信號序列的成熟異麥芽糖葡聚糖酶的區域。
(A-2)使用SlpA信號序列構建用於在穀氨酸棒桿菌中分泌生產異麥芽糖葡聚糖酶的質粒使用WO 01/23591中描述的質粒pPKSPTG1作為模板,使用具有SEQ IDNO.14和SEQ ID NO.15(5′-CCCGGGCGGGCGGTGACGGCGGTGGCTGCCGTTGCC ACAGGTGCGG-3′)所示序列的引物通過PCR擴增編碼啟動子和信號序列的區域。用作模板的質粒pPKSPTG1含有來自穀氨酸棒桿菌的細胞表層蛋白質PS2的啟動子、編碼來自產氨棒桿菌(C.ammoniagenes)的細胞表層蛋白質SlpA的信號序列的區域,和編碼來自茂原鏈輪絲菌(S.mobaraense)的轉穀氨醯胺酶原的區域。通過上述的PCR來擴增這個質粒中含有PS2啟動子和編碼SlpA信號序列的區域的片段。SEQ ID NO.15所示的引物含有編碼成熟異麥芽糖葡聚糖酶的N-末端側胺基酸區域的序列。
然後,將使用具有(A-1)中SEQ ID NO.13和SEQ ID NO.12所示序列的引物擴增的PCR產物和使用具有SEQ ID NO.14和SEQ ID NO.15所示序列的引物擴增的PCR產物混合,並使用它們作為模板;使用具有SEQ ID NO.14和SEQ ID NO.12所示序列的引物進行交叉PCR來擴增PS2啟動子、SlpA信號肽序列和成熟異麥芽糖葡聚糖酶的融合基因。在用限制性內切酶ScaI和BamHI消化這個PCR產物之後,通過瓊脂糖凝膠電泳回收約2.5kb的DNA片段,並將它插入到日本專利申請公開No.9-322774中描述的質粒pPK4中的ScaI-BamHI位點來構建成熟異麥芽糖葡聚糖酶的表達質粒pPKSIMD。
(A-3)使用來自產氨棒桿菌的細胞表層蛋白質SlpA的信號序列分泌IMD穀氨酸棒桿菌菌株YDK010(在WO 02/081694中描述)是鏈黴素(Sm)抗性菌株AJ12036破壞了細胞表層蛋白(PS2)的菌株,AJ12036本身來自穀氨酸棒桿菌ATCC13869,用構建的質粒pPKSIMD轉化穀氨酸棒桿菌菌株YDK010,挑選在含有25mg/l卡那黴素的CM2G瓊脂培養基(酵母提取物10g,胰蛋白腖10g,葡萄糖5g,NaCl5g,瓊脂15g,用水添加到1升體積)上生長的菌株。選擇的菌株在含有25mg/l卡那黴素的MM液體培養基中在30℃培養48小時。在完成培養之後,通過SDS-PAGE分析10μl培養物上清液。使用12.5%凝膠(Daiichi Pure Chemicals)進行SDS-PAGE,用考馬斯亮藍染色檢測蛋白質條帶。結果,在約65kDa檢測到極其微弱的條帶。此外,作為通過反相色譜分析定量蛋白質的結果,濃度被測定為約10mg/l。這證明了,與使用來自球形節桿菌的IMD信號序列的情況相比,分泌的蛋白質的量降低。反相層析的條件如下所示。
柱蛋白C4 214TP5410(Vydac)洗脫條件24-80%乙腈線性梯度/0.1%三氟乙酸流速1.0ml/min此外,根據Joumal of Bacteriology,176,7730-7734(1994)中描述的方法測量異麥芽糖葡聚糖酶的酶活性,證實分泌的蛋白實際上具有異麥芽糖葡聚糖酶的酶活性。
實施例2-使用來自球形節桿菌的IMD信號序列表達和分泌具有原體結構的蛋白-穀氨醯胺酶(2-1)從Chryseobacterium proteolyticum獲取蛋白穀氨醯胺酶基因早先已經測定了來自Chryseobacterium proteolyticum的蛋白-穀氨醯胺酶(EC.3.5.1)基因的序列(Eur.J.Biochem.268.1410-1421(2001))。參照這個序列,通過將密碼子轉換為穀氨酸棒桿菌中高度使用的那些密碼子來構建SEQ ID NO.3中所示的基因序列。這個序列含有編碼蛋白-穀氨醯胺酶的信號序列(前體區域)、原體區域和成熟蛋白-穀氨醯胺酶的區域。通過合成來製備這個完整的基因序列。
根據構建的SEQ ID NO.3的基因序列數據,合成具有SEQ ID NO.17(5′-CATGAAGAACCTTTTCCTGTC-3′)和 SEQ ID NO.18(5′-GTAAAAGGATCCATTAATTAAAATCC-3′)所示序列的引物。SEQ ID NO.17所示的引物含有蛋白-穀氨醯胺酶的信號序列的N-末端序列,而SEQ ID NO.18所示的引物含有成熟蛋白-穀氨醯胺酶的C-末端和BamHI識別序列。使用具有SEQID NO.3所示序列的DNA作為模板,使用具有SEQ ID NO.17和SEQ ID NO.18的序列的引物進行PCR來擴增編碼蛋白-穀氨醯胺酶的原體部分和成熟蛋白-穀氨醯胺酶的區域。將這個PCR片段插入到日本專利申請公開No.9-070291中描述的pVC7的SmaI位點中之後,將它導入大腸桿菌JM109(Takara)的感受態細胞中。獲得攜帶質粒的微生物菌株,所述質粒中克隆了蛋白-穀氨醯胺酶基因,並回收質粒。測定克隆到這個質粒中的片段的核苷酸序列,證實與SEQ ID NO.3所示序列相符。
(2-2)使用IMD信號序列構建用於分泌表達具有原體結構的蛋白-穀氨醯胺酶的質粒使用實施例1的(1-1)中描述的IMD表達質粒pPKI-IMD作為模板,使用具有SEQ ID NO.14和SEQ ID NO.21(5′-CCTGGTTGCCGTTGGAATCGGCCTGGG CGGAGCCTGCC-3′)所示序列的引物通過PCR擴增了編碼啟動子和信號肽的區域。擴增的區域含有編碼PS2啟動子和IMD信號肽的區域。此外,SEQ ID NO.21所示序列含有編碼具有原體結構的蛋白-穀氨醯胺酶基因的區域的5′末端序列。然後,使用其中克隆了蛋白-穀氨醯胺酶的質粒作為模板,使用具有SEQ ID NO.20(5′-GATTCCAACGGCAACCAGGA-3′)和SEQ ID NO.18的序列的引物通過PCR擴增編碼具有原體結構的蛋白-穀氨醯胺酶基因的區域。此外,將用具有SEQ ID NO.14和21的序列的引物獲得的PCR產物和用具有SEQ ID NO.20和SEQ ID NO.18的序列的引物獲得的PCR產物以1∶1的比例混合,然後使用它們作為模板,使用具有SEQ ID NO.14和SEQ ID NO.18所示序列的引物進行交叉PCR,來擴增含有PS2啟動子區域、IMD信號序列和編碼具有原體結構的蛋白-穀氨醯胺酶的基因的融合基因。在用限制性內切酶ScaI和BamHI消化這個交叉PCR產物之後,通過瓊脂糖凝膠電泳檢測到約1.6kbp的DNA片段。然後從瓊脂糖凝膠上切下這個DNA片段,使用EasyTrap Ver.2(Takara)來回收,通過將片段插入日本專利申請公開No.9-322774中描述的質粒pPK4的ScaI-BamHI位點中,來構建用於具有原體結構的蛋白-穀氨醯胺酶的表達質粒pPKI-PPG。作為測定插入到構建的質粒中的基因序列的核苷酸序列的結果,證實構建了預定的融合基因。
(2-3)使用IMD信號序列通過穀氨酸棒桿菌分泌具有原體結構的蛋白-穀氨醯胺酶菌株YDK010(在國際公開WO 02/081694中描述)是從來自穀氨酸棒桿菌的突變菌株YSr獲得的,在用構建的質粒pPKI-PPG轉化菌株YDK010之後,如實施例1的(1-3)所述選擇在含有25mg/l卡那黴素的CM2G瓊脂培養基上生長的微生物菌株。選擇的菌株在含有25mg/l卡那黴素的MM液體培養基中在30℃培養48小時。在完成培養之後,通過SDS-PAGE分析10μl的培養物上清液。使用4-20%梯度凝膠(Daiichi Pure Chemicals)進行SDS-PAGE,隨後用考馬斯亮藍進行蛋白質染色。結果,在約35kDa的預定分子量處檢測到條帶。作為通過反相HPLC分析100μl培養物上清液的結果,蛋白質濃度是約20mg/l。反相HPLC的條件如下所示。
柱CARCELL PAK C18 SG300,4.6×150mm(Shiseido)
洗脫條件32-48%乙腈線性梯度/0.1%三氟乙酸(15min)流速1.0ml/min此外,在使用Ultrafree(Millipore)對培養物上清液進行脫鹽和濃縮處理之後,用放線菌來源的蛋白酶SAM-P45(在國際公開WO 01/23591中描述)酶法消化蛋白質,以切斷蛋白穀氨醯胺酶的原體結構部分來獲得成熟蛋白質。根據日本專利申請公開No.2000-50887中描述的方法測量成熟蛋白質的活性,並證實分泌的蛋白質實際上具有蛋白-穀氨醯胺酶活性。
參考實施例B使用來自產氨棒桿菌的細胞表層蛋白SlpA的信號序列分泌和表達Chryseobacterium preteolyticum的蛋白-穀氨醯胺酶(B-1)來自Chryseobacterium preteolyticum蛋白-穀氨醯胺酶基因的獲取參考Chryseobacterium preteolyticum(Eur.J.Biochem.268,1410-1421(2001))的蛋白-穀氨醯胺酶(EC.3.5.1)的序列,通過將密碼子轉換為穀氨酸棒桿菌中高度使用的那些來產生SEQ ID NO.3所示的序列。這個序列含有編碼蛋白-穀氨醯胺酶的信號序列(前體部分)、原體部分和成熟蛋白-穀氨醯胺酶的區域。通過合成來製備含有這個完整基因序列的核酸分子。
根據製備的SEQ ID NO.3的基因序列數據合成具有SEQ ID NO.17和SEQ ID NO.18所示序列的引物。具有SEQ ID NO.17所示序列的引物含有蛋白-穀氨醯胺酶的信號序列的N-末端序列,而具有SEQ ID NO.18所示序列的引物含有成熟蛋白-穀氨醯胺酶的C-末端和BamHI識別序列。使用具有SEQID NO.3所示序列的DNA作為模板,使用具有SEQ ID NO.17和SEQ ID NO18的序列的引物進行PCR來擴增編碼蛋白-穀氨醯胺酶的原體部分和成熟蛋白-穀氨醯胺酶的區域。將這個PCR片段插入到日本專利申請公開No.9-070291中描述的pVC7的SmaI位點中之後,將它導入大腸桿菌JM109(Takara)的感受態細胞中。獲得攜帶質粒的微生物菌株,所述質粒中克隆了蛋白轉穀氨醯胺酶基因,並從該菌株中回收質粒。測定包含在這個質粒中的片段的克隆核苷酸序列,證實該序列與SEQ ID NO.3所示序列相符。
(B-2)使用SlpA信號序列構建用於通過穀氨酸棒桿菌分泌表達蛋白-穀氨醯胺酶的質粒使用WO 01/23591中描述的質粒pPKSPTG1作為模板,使用具有SEQ IDNO.14和SEQ ID NO.19(5′-TCCTGGTTGCCGTTGGAATCTGCCGTTGCCACAGGTGCGG-3′)所示序列的引物通過PCR擴增編碼啟動子和信號肽的區域。擴增的區域含有編碼PS2啟動子和SlpA信號肽的區域。SEQ ID NO.19所示序列含有編碼具有原體結構的蛋白-穀氨醯胺酶基因的區域的5′末端序列。
然後,使用在參考實施例B-1中獲得的其中克隆了蛋白-穀氨醯胺酶的質粒作為模板,使用具有SEQ ID NO.20和SEQ ID NO.18的序列的引物通過PCR來擴增編碼具有原體結構的蛋白-穀氨醯胺酶基因的區域。此外,將用具有SEQ ID NO.14和19所示序列的引物獲得的PCR產物和用具有SEQ ID NO.20和SEQ ID NO.18的序列的引物獲得的PCR產物以1∶1的比例混合,然後使用它們作為模板,使用具有SEQ ID NO.14和SEQ ID NO.18所示序列的引物進行交叉PCR,來擴增包括序列的融合基因,所述序列含有PS2啟動子區域、SlpA信號序列和編碼具有原體結構的蛋白-穀氨醯胺酶的基因。在用限制性內切酶ScaI和BamHI消化這個交叉PCR產物之後,通過瓊脂糖凝膠電泳檢測到約1.6kbp的DNA片段。然後從瓊脂糖凝膠上切下這個DNA片段,並使用EasyTrap Ver.2(Takara)來回收,通過將該片段插入日本專利申請公開No.9-322774中描述的質粒pPK4的ScaI-BamHI位點中,來構建用於具有原體結構的蛋白-穀氨醯胺酶的表達質粒pPKS-PPG。作為測定插入到構建的質粒中的基因序列的核苷酸序列的結果,證實構建了預定的融合基因。
(B-3)使用SlpA信號序列通過穀氨酸棒桿菌分泌具有原體結構的蛋白-穀氨醯胺酶在用構建的質粒pPKS-PPG轉化從源自穀氨酸棒桿菌的突變菌株獲得的菌株YDK010(描述於WO 02/081694中)之後,如在實施例1的(1-3)中所述選擇在含有25mg/l卡那黴素的CM2G瓊脂培養基上生長的微生物菌株。將選擇的菌株在含有25mg/l卡那黴素的MM液體培養基中在30℃培養48小時。在培養完成之後,通過SDS-PAGE分析10μl的培養物上清液。使用12.5%凝膠(Daiichi Pure Chemicals)進行SDS-PAGE,隨後用考馬斯亮藍和螢光染料SYPRO Orange(Molecular Probes)進行蛋白質染色。結果,通過兩種著色方法都沒有在預定的分子量位置附近檢測到條帶。
實施例3-使用來自大腸桿菌的TorA(三甲胺-N-氧化還原酶)信號序列分泌表達蛋白-穀氨醯胺酶(3-1)獲取編碼來自大腸桿菌的TorA信號肽的基因早先已經測定了含有來自大腸桿菌的TorA信號肽的TorA基因的序列(Mol.Microbiol.111169-1179(1994))。參考這個序列,合成SEQ ID NO.22(5′-ATGAACAATAACGATCTCTTTCAGG-3′)和SEQ ID NO.23(5′-CCGGATCCTGGTCATGATTTCACCTG-3′)所示序列的引物,使用根據普通方法(Saitoh和Miura的方法,(Biochim.Biophys Acta,72,619(1963))製備的大腸桿菌菌株W3110的染色體DNA,通過PCR來擴增一區域,所述區域含有編碼TorA和位於其上遊的信號序列的區域。使用Pyrobest DNA聚合酶(Takara)用於PCR反應,反應條件根據製造商建議的方案。SEQ ID NO.23的序列含有限制性內切酶BamHI識別序列。編碼TorA的信號序列的DNA序列在SEQ ID NO.7中示出。
(3-2)使用TorA信號序列構建用於分泌表達具有原體結構的蛋白-穀氨醯胺酶(PPG)的質粒使用WO 01/23591中描述的質粒pPKSPTG1作為模板,使用具有SEQ IDNO.14和SEQ ID NO.24(5′-AAGAGATCGTTATTGTTCATAGAGGCGAAGGCTCCTTGAATAG-3′)所示序列的引物通過PCR擴增編碼啟動子和信號肽的區域。SEQ ID NO.24的序列含有編碼TorA信號肽的基因的5′-末端序列。然後以1∶1的比例將這個PCR產物與含有基因序列及其上遊的信號序列的PCR產物混合,然後使用它們作為模板,用具有SEQ ID NO.14和SEQ IDNO.23所示序列的引物進行交叉PCR,所述基因序列是在實施例3的(3-1)中獲得的並編碼TorA以及其上遊的信號序列,所述TorA是用具有SEQ ID NO.22和SEQ ID NO.23所示序列的引物擴增的。結果,擴增了含有一區域的融合基因,所述區域含有PS2啟動子區域、TorA信號序列和編碼TorA的序列。在用限制性內切酶ScaI和BamHI消化這個交叉PCR產物之後,通過瓊脂糖凝膠電泳檢測到約3.1kbp的DNA片段。然後從瓊脂糖凝膠上切下這個DNA片段,並使用EasyTrap Ver.2(Takara)來回收,通過將該片段插入日本專利申請公開No.H9-322774中描述的質粒pPK4的ScaI-BamHI位點中,來獲得質粒pPKT-TorA。作為測定插入到這個質粒中的基因序列的核苷酸序列的結果,證實構建了預定的融合基因。然後使用這個質粒作為模板,使用具有SEQID NO.14和SEQ ID NO.25(5′-GATTTCCTGGTTGCCGTTGGAATCCGCAGTCGCACGTCGCGGCG-3′)所示序列的引物通過PCR擴增一種片段,所述片段含有PS2啟動子區域和編碼TorA信號肽的區域。然後使用這個PCR產物和具有SEQ ID NO.20和SEQ ID NO.18所示序列的引物,按照與實施例2的(2-2)相同的方式,通過PCR來擴增編碼具有原體結構的蛋白-穀氨醯胺酶的區域。然後以1∶1的比例混合這些PCR產物,並通過使用這些PCR產物作為模板,用具有SEQ ID NO.14和SEQ ID NO.18所示序列的引物進行交叉PCR。
在用限制性內切酶ScaI和BamHI消化這個PCR產物之後,通過進行瓊脂糖凝膠電泳檢測到約3.1kbp的DNA片段。然後從瓊脂糖凝膠上切下這個DNA片段,使用EasyTrap Ver.2(Takara)來回收,通過將該片段插入日本專利申請公開No.9-322774中描述的質粒pPK4的ScaI-BamHI位點中,來獲得質粒pPKT-PPG。作為測定質粒中這個插入序列的核苷酸序列的結果,證實構建了預定的融合基因。
(3-3)使用TorA信號序列通過穀氨酸棒桿菌分泌具有原體結構的蛋白-穀氨醯胺酶菌株YDK010(在WO 02/081694中描述)是從來自穀氨酸棒桿菌ATCC13869的鏈黴素(Sm)抗性菌株AJ12036獲得的,而穀氨酸棒桿菌ATCC13869是穀氨酸棒桿菌的突變菌株,用構建的質粒pPKT-PPG轉化菌株YDK010,並選擇在含有25mg/l卡那黴素的CM2G培養基上生長的微生物菌株。將選擇的微生物菌株在含有25mg/l卡那黴素的MM液體培養基中在30℃培養48小時。在培養完成之後,通過SDS-PAGE分析10μl的培養物上清液。使用4-20%梯度凝膠(Daiichi Pure Chemicals)進行SDS-PAGE,隨後用考馬斯亮藍進行蛋白質染色。結果,在約35kDa處檢測到條帶,其在預定分子量的附近。作為通過反相HPLC分析100μl培養物上清液的結果,蛋白質濃度是約20mg/l。
此外,在如實施例2的(2-2)所述用Ultrafree(Millipore)對培養物上清液進行處理之後,用源自放線菌的蛋白酶SAM-P45酶法消化蛋白質,以切斷蛋白-穀氨醯胺酶的原體結構區域以獲得成熟蛋白質。根據日本專利申請公開No.2000-50887中描述的方法測量成熟蛋白質的活性,證實分泌的蛋白質實際上具有蛋白-穀氨醯胺酶活性。
具有原體結構的蛋白-穀氨醯胺酶的胺基酸序列在SEQ ID NO.4中示出。
實施例4-製備TatC缺陷菌株(4-1)製備破壞了來源於穀氨酸棒桿菌AJ12036的tatC基因的菌株進行了研究來確定上述連接到IMD信號序列的異麥芽糖葡聚糖酶和連接到TorA信號序列的蛋白-穀氨醯胺酶是否分別由Tat系統分泌。
雖然已經清楚地證明了tatA(GENEBANK cg103060 1571065-1571382)、tatB(GENEBANK cg103060 1167110-1167580)、tatC(GENEBANK cg1030601569929-1570873)和tatE(gi41223046 emb CAF18991.1)作為棒狀桿菌型細菌的tat系統基因同源物的存在,但是它們的功能還有待鑑定。
因而,決定通過破壞tat基因來證實在以上的實施例中已被證實分泌的酶是否由Tat系統分泌。
使用如下所述的同源重組從菌株YDK010獲得TatC缺陷菌株。
使用根據Saitoh和Miura的方法(Biochim Biophys Acta.72,619(1963))製備的穀氨酸棒桿菌ATCC13869的染色體DNA作為模板,使用具有SEQ IDNO.26(5′-ggcggtaccgttaagcgccctcggcgagttatct-3′)和SEQ ID NO.27(5′-gcctctagactagagcacgtcaccgaagtcggcg-3′)所示序列的引物的組合進行PCR。
然後用KpnI和XbaI消化這個片段並插入到pHS4(美國專利No.5,616,480)的KpnI-XbaI位點中,來構建pHStatC,所述pHS4是來自質粒pHM1519的溫度敏感性質粒載體。用質粒pHS4轉化的大腸桿菌AJ12570已經於1990年10月11日作為FERM BP-3523保藏在工業技術院生命工學工業技術研究所(當前為國際專利生物保藏中心,國家先進工業科技研究所,Tsukuba Central 6,1-1-1 Higashi,Tsukuba,Ibaraki,Japan 305-8566)。
然後,用NdeI和ScaI消化pHStatC,通過除去約70bp的DNA片段刪除tatC基因的內部區域,使其重新環化以產生質粒pHSΔtatC。通過電穿孔將此質粒導入到YDK010中來通過如日本專利No.2763054中描述的同源重組獲得tatC缺陷菌株,YDK011。
(4-2)TatC缺陷菌株中的分泌和表達(4-2-1)比較用含有SlpA衍生的信號序列的異麥芽糖葡聚糖酶(IMD)分泌表達質粒pPKS-IMD轉化的菌株與用含有IMD信號序列的IMD分泌表達質粒pPKI-IMD轉化的菌株之間的IMD分泌用在參考實施例A中產生的pPKS-IMD轉化上述TatC缺陷菌株,所述pPKS-IMD是具有來自產氨棒桿菌的細胞表層蛋白SlpA的信號序列的異麥芽糖葡聚糖酶分泌和表達質粒,並選擇在含有25mg/l卡那黴素的CM2G瓊脂培養基上生長的微生物菌株,以獲得菌株YDK011/pPKS-IMD。此外,用實施例1中產生的pPKI-IMD類似地轉化TatC缺陷菌株YKD011來獲得菌株YKD011/pPKI-IMD,所述pPKI-IMD是具有IMD信號序列的IMD分泌和表達質粒。獲得的兩種菌株都在MM培養基中在30℃培養48小時,並比較分泌到培養物上清液中的IMD的量。通過施加到SDS-PAGE上來分析每個菌株的10μl培養物上清液,然後使用SYPRO Orange(Molecular Probes)進行蛋白質染色。結果,對於菌株YDK011/pPKS-IMD的培養物上清液,在IMD的分子量附近檢測到非常微弱的條帶,對於菌株YDK011/pPKI-IMD的培養物上清液在IMD的分子量附近沒有檢測到條帶。
(4-2-2)比較用含有IMD信號序列的蛋白-穀氨醯胺酶分泌表達質粒pPKI-PPG轉化的菌株和用含有TorA信號序列的蛋白-穀氨醯胺酶分泌表達質粒pPKT-PPG轉化的菌株之間的蛋白-穀氨醯胺酶分泌用實施例2中產生的含有IMD信號序列的IMD分泌和表達質粒pPKI-PPG轉化TatC缺陷菌株YDK011來獲得YDK011/pPKI-PPG。此外,用含有TorA信號的蛋白-穀氨醯胺酶(PPG)表達質粒pPKT-PPG(實施例3)轉化TatC缺陷菌株YDK011來獲得YDK011/pPKT-PPG,所述TorA信號是來自大腸桿菌的Tat系統信號。這樣獲得的轉化的菌株都在基本液體培養基中在30℃培養48小時,分析培養物上清液中的PPG的分泌量。
將菌株YOK011/pPKI-PPG和菌株YDK011/pPKT-PPG的10μl每種培養物上清液施加到SDS-PAGE上,然後用SYPRO Orange進行蛋白質染色。結果,在菌株YDK011/pPKI-PPG或菌株YDK011/pPKT-PPG的培養物上清液中都未能檢測到35kDa分子量附近的PPG條帶。
然後,通過用蛋白-穀氨醯胺酶免疫兔子來產生抗蛋白-穀氨醯胺酶多克隆抗體。作為使用這種多克隆抗體進行Western印跡的結果,雖然在實施例2和3中產生的兩種菌株YDK010/pPKI-PPG或YDK010/pPKT-PPG的培養物上清液檢測到了條帶,但在菌株YDK011/pPKI-PPG或菌株YDK011/pPKT-PPG的培養物上清液中都沒有檢測到PPG條帶。此外,在培養之後通過超聲處理破碎各自的細菌細胞,並通過SDS-PAGE分析細胞內的蛋白質。作為按照對培養物上清液所進行的相同的方式對每種轉化菌株的細胞中存在的蛋白進行Western印跡的結果,對於來自菌株YDK011/pPKI-PPG和菌株YDK011/pPKT-PPG的破碎細胞,在35kDa分子量附近檢測到了PPG條帶。
在使用IMD信號和TorA信號的情況下,PPG或IMD蛋白被分泌到具有正常TatC的每種轉化菌株的培養物上清液中,而PPG蛋白或IMD蛋白未被分泌到每種轉化的TatC缺陷菌株的培養物上清液中,以上的結果表明IMD信號和TorA信號涉及IMD或PPG通過Tat途徑的分泌。
實施例5-在穀氨酸棒桿菌ATCC13869中分泌表達蛋白-穀氨醯胺酶(5-1)使用TorA信號序列在穀氨酸棒桿菌中分泌具有原體結構的蛋白-穀氨醯胺酶YDK010(描述於WO 02/081694中)是從鏈黴素(Sm)-抗性菌株AJ12036獲得的,AJ12036本身是穀氨酸棒桿菌ATCC13869的突變菌株,用實施例3的(3-2)中構建的質粒pPKT-PPG轉化穀氨酸棒桿菌ATCC13869和YDK010,如實施例1的(1-3)中所述選擇在含25mg/l卡那黴素的CM2G瓊脂培養基中生長的細菌菌株。將選擇的微生物菌株在含有25mg/l卡那黴素的MM液體培養基中在30℃培養48小時。在培養完成之後,通過SDS-PAGE分析10μl的培養物上清液。使用4-20%梯度凝膠(Daiichi Pure Chemicals)進行SDS-PAGE,隨後用考馬斯亮藍進行蛋白質染色。結果,在兩種菌株的培養物上清液中在約35kDa預定分子量的位置都檢測到條帶。通過將100μl每種培養物上清液施加到反相HPLC上來分析蛋白質濃度,作為結果,在攜帶pPKT-PPG的穀氨酸棒桿菌菌株YDK010的培養物上清液中的蛋白質濃度為約20mg/l,而在攜帶相同的pPKT-PPG的穀氨酸棒桿菌菌株ATCC13869的培養物上清液中蛋白質濃度為約70mg/l。
此外,在如實施例2的(2-2)中所述使用Ultrafree(Millipore)對培養物上清液進行處理之後,用源自放線菌的蛋白酶SAM-P45酶法消化該蛋白質,以切斷蛋白-穀氨醯胺酶的原體結構區域以獲得成熟蛋白質。根據日本專利申請公開No.2000-50887中描述的方法測量這個成熟蛋白-穀氨醯胺酶的活性,並證實分泌的蛋白質實際上具有蛋白-穀氨醯胺酶活性。
實施例6Tat系統分泌元件的擴增對使用來自大腸桿菌的TorA信號序列的蛋白-穀氨醯胺酶的分泌量的影響(1)TatC表達質粒的構建編碼TatA的基因存在於編碼穀氨酸棒桿菌的TatC的基因序列5′上遊區域。通過PCR擴增含有TatA基因的上遊啟動子區域的基因序列。根據Saitoh和Miura的方法製備的穀氨酸棒桿菌ATCC13869的染色體DNA被用做模板;使用具有SEQ ID NO.33(5′-GCTTGATCATTCCTTTAAGG-3′)和SEQ IDNO.34(5′-ATGTGCTCAACAATGGACATGTGGTCTACTCCAAATTCAC-3′)所示序列的引物。SEQ ID NO.34含有tatC的5′-末端的序列。此外,通過參考穀氨酸棒桿菌ATCC13032中tatC(SEQ ID NO.35)的基因序列產生具有SEQ ID NO.36(5′-ATGTCCATTGTTGAGCACATC-3′)和SEQ ID NO.37(5′-CTAGAGCACGTCACCGAAGT-3′)所示序列的引物,通過PCR擴增編碼TatC的基因。此外,將用SEQ ID NO.33和SEQ ID NO.34擴增的PCR產物以及用SEQ ID NO.36和SEQ ID NO.37擴增的PCR產物以1∶1的比例混合,它們被用做模板用SEQ ID NO.33和SEQ ID NO.37來進行交叉PCR,以擴增含有tatA啟動子區域和編碼TatC的基因的融合基因。對這個PCR產物進行瓊脂糖凝膠電泳,並回收了約1.8kb的DNA片段。通過將回收的DNA片段插入到日本專利申請公開No.H9-070291中描述的質粒pVC7的SmaI位點中,構建了TatC表達質粒pVtatC。使用與實施例1中類似的方法證實構建的質粒含有插入位點的核苷酸序列。
(2)構建TatA和TatC表達質粒使用穀氨酸棒桿菌ATCC13869的染色體DNA作為模板,使用具有SEQID NO.33和SEQ ID NO.37所示序列的引物通過PCR擴增一區域,所述區域含有編碼TatA的基因序列和其5′上遊區域和編碼TatC的基因序列。通過對這個PCR產物進行瓊脂糖凝膠電泳回收了大約2.4kb的DNA片段。通過將回收的DNA片段插入到日本專利申請公開No.H9-070291中描述的質粒pVC7的SmaI位點中,構建了TatA和TatC表達質粒pVtatAC。使用與實施例1相同的方法證實了構建的質粒中插入的基因的核苷酸序列。結果,顯示了tatA的核苷酸序列稍微不同於穀氨酸棒桿菌ATCC13032中tatA的預計序列。編碼這個TatA的基因序列和其5′上遊區域,以及編碼TatC的基因序列,在SEQ ID NO.38中示出。
(3)構建TatA、TatB和TatC表達質粒通過使用具有以下SEQ ID NO.39(5′-GAGGCGCTGCCTGAAGATTA-3′)和SEQ ID NO.40(5′-GACAGGTGAAGAGGTCAAGG-3′)所示序列的引物通過PCR擴增一區域,所述區域含有編碼穀氨酸棒桿菌ATCC13032中預計的TatB的基因序列和其5′-上遊區域。通過瓊脂糖凝膠電泳從擴增的PCR產物回收大約1.7kb的DNA片段。通過將回收的DNA片段插入到日本專利申請公開No.9-070291中描述的質粒pVC7的SmaI位點中,構建了TatB表達質粒pVtatB。使用與實施例1相同的方法證實了構建的質粒的插入DNA片段的核苷酸序列。在SEQ ID NO.41中描述了編碼TatB的基因序列和其5′-上遊區域的基因序列。用限制性內切酶KpnI消化這個TatB表達質粒pVtatB,並通過瓊脂糖凝膠電泳回收大約1.5kb的DNA片段。這個DNA片段含有tatB啟動子區域和編碼TatB的基因序列。通過將這個片段插入到實施例6的(2)中產生的質粒pVtatAC的KpnI位點中,構建了表達TatA、TatB和TatC的質粒pVtatABC。
(4)通過已經擴增了Tat系統分泌元件的菌株分泌表達蛋白-穀氨醯胺酶用實施例3的(3-2)中產生的pPKT-PPG轉化穀氨酸棒桿菌ATCC13869來產生13869/pPKT-PPG,所述pPKT-PPG是具有原體結構的蛋白-穀氨醯胺酶的表達質粒。此外,選擇分別用上述質粒pVtatC、pVtatAC和pVtatABC轉化的在含有25mg/l的卡那黴素和5mg/l的氯黴素的CM2G瓊脂培養基上生長的微生物菌株,以分別獲得13869/pPKT-PPG/pVtatC、13869/pPKT-PPG/pVtatAC和13869/pPKT-PPG/pVtatABC。這些菌株在含有25mg/l卡那黴素和5mg/l氯黴素的MM培養基中在30℃培養48小時。在培養完成之後,作為使用實施例2的(2-3)中描述的方法通過SDS-PAGE分析10μl培養物上清液的結果,觀察到其中已經擴增了Tat系統分泌元件的13869/pPKT-PPG/pVtatC、13869/pPT-KPPG/pVtatAC和13869/pPKT-PPG/pVtatABC與擴增Tat系統分泌元件之前的菌株13869/pPKT-PPG相比顯示顯著更大量的分泌。作為在實施例2中描述的條件下通過反相HPLC分析每種上清液的結果,觀察到在13869/pPKT-PPG/pVtatC和13869/pPKT-PPG/pVtatAC中的分泌量是在13869/pPKT-PPG中的大約三倍,在13869/pPKT-PPG/pVtatABC中的分泌量是在13869/pPKT-PPG中的大約十倍。
實施例7-Tat系統分泌元件的擴增對使用來自球形節桿菌的IMD信號的轉穀氨醯胺酶的分泌量的影響(1)產生使用來自球形節桿菌的IMD信號的轉穀氨醯胺酶分泌表達質粒使用實施例1中製備的異麥芽糖葡聚糖酶分泌表達質粒pPKI-IMD作為模板,使用具有SEQ ID NO.14和SEQ ID NO.42(5′-GTCTCTTCCCCCGCGCCATTGTCGGCCTGGGCGGAGCCTGC-3′)所示序列的引物擴增含有IMD信號序列和其5′-上遊區域的CspB啟動子的區域。SEQ ID NO.42含有編碼IMD信號序列的C-末端側的基因序列和編碼轉穀氨醯胺酶的原體序列的N-末端側的基因序列。此外,使用pPKSPTG1(在WO01/23591中描述)作為模板,使用具有SEQ VID NO.43(5′-GACAATGGCGCGGGGGAAG-3′)和SEQ ID NO.44(5′-GACAATGGCGCGGGGGAAG-3′)所示序列的引物進行PCR,來擴增編碼具有原體結構的轉穀氨醯胺酶的基因序列。將用具有SEQ ID NO.14和SEQID NO.42所示序列的引物擴增的PCR產物以及用具有SEQ ID NO.43和SEQID NO.44所示序列的引物擴增的PCR產物以1∶1的比例混合,並用作模板,使用具有SEQ ID NO.14和SEQ ID NO.44所示序列的引物進行交叉PCR,來擴增含有CspB啟動子、IMD信號和編碼具有原體結構的轉穀氨醯胺酶的基因的融合基因。用限制性內切酶ScaI和EcoO65I切斷這個PCR產物,並通過瓊脂糖凝膠電泳回收大約700bp的基因片段。通過將回收的DNA片段插入到pPKSPTG1(在WO 01/23591中描述)的ScaI-EcoO65I位點中,來產生帶有原體結構的轉穀氨醯胺酶的表達質粒pPKI-PTG1。根據實施例1中描述的方法測定產生的質粒的核苷酸序列,並證實已經構建了預定的融合基因。
(2)在具有擴增的Tat系統分泌元件的菌株中使用IMD信號分泌表達轉穀氨醯胺酶通過用(1)中產生的質粒pPKI-PTG1轉化穀氨酸棒桿菌ATCC13869產生菌株13869/pPKIPTG1。在用實施例6的(3)中產生的表達Tat分泌元件TatA、TatB和TatC的表達質粒pVtatABC進一步轉化這個菌株之後,選擇在含有25mg/l卡那黴素和5mg/l氯黴素的GM2G瓊脂培養基上生長的微生物菌株,來獲得擴增了Tat系統分泌元件的菌株13869/pPKI-PTG1/pVtatABC。
將13869/pPKI-PTG1和13869/pPKI-PTG1/pVtatABC在含有25mg/l卡那黴素和5mg/l氯黴素的MM培養基中在30℃培養48小時。在完成培養之後,作為使用實施例2的(2-3)中描述的方法對培養物上清液進行SDS-PAGE的結果,與2256/pPKI-PTG1相比,在2256/pPKI-PTG1/pVtatABC中觀察到具有原體結構的轉穀氨醯胺酶的分泌量增加。此外,作為在參考實施例A-3中描述的條件下通過反相HPLC分析培養物上清液的結果,在Tat系統分泌元件增強的菌株中的分泌量大約高7倍。
實施例8-Tat系統分泌元件的擴增對使用來自大腸桿菌的TorA信號的轉穀氨醯胺酶的分泌量的影響(1)使用來自大腸桿菌的TorA信號構建轉穀氨醯胺酶的表達質粒使用根據實施例3的(3-2)生產的使用TorA信號的蛋白穀氨醯胺酶的分泌表達質粒pPKT-PPG作為模板,通過具有SEQ ID NO.14和SEQ ID NO.45(5′-CTTCCCCCGCGCCATTGTCCGCAGTCGCACGTCGCGGCG-3′)所示序列的引物來擴增含有TorA信號序列和其5′-上遊區域的CspB啟動子的區域。SEQ ID NO.45中描述的序列含有編碼TorA信號序列的C-末端的基因和編碼轉穀氨醯胺酶的原體序列的N-末端的基因。此外,使用pPKSPTG1(在WO 01/23591中描述)作為模板,使用具有SEQ ID NO.43和SEQ ID NO.44所示序列的引物進行PCR來擴增編碼具有原體結構的轉穀氨醯胺酶的基因序列。將用具有SEQ ID NO.14和SEQ ID NO.45所示序列的引物擴增的PCR產物以及用具有SEQ ID NO.43和SEQ ID NO.44所示序列的引物擴增的PCR產物以1∶1的比例混合,並用作模板,使用具有SEQ ID NO.14和SEQ IDNO.44所示序列的引物進行交叉PCR,來擴增含有CspB啟動子、TorA信號和編碼具有原體結構的轉穀氨醯胺酶的基因的融合基因。用限制性內切酶ScaI和EcoO65I切斷這個PCR產物,並通過瓊脂糖凝膠電泳回收大約700bp的基因片段。通過將這個回收的DNA片段插入到pPKSPTG1(在WO 01/23591中描述)的ScaI-EcoO65I位點中,來產生帶有原體結構的轉穀氨醯胺酶的表達質粒pPKT-PTG1。根據早先描述的方法測定產生的質粒的核苷酸序列,證實已經構建了預定的融合基因。
(2)在具有擴增的Tat系統分泌元件的菌株中使用TorA信號分泌表達轉穀氨醯胺酶通過用實施例8的(1)中產生的質粒pPKT-PTG1轉化穀氨酸棒桿菌ATCC13869來產生菌株13869/pPKT-PTG1。在用實施例8中產生的Tat分泌元件TatA、TatB和TatC的表達質粒pVtatABC進一步轉化這個菌株之後,選擇在含有25mg/l卡那黴素和5mg/l氯黴素的CM2G瓊脂培養基上生長的微生物菌株,來獲得增強了Tat系統分泌元件的菌株13869/pPKT-PTG1/pVtatABC。
13869/pPKI-PTG1和13869/pPKT-PTG1/PVtatABC在含有25mg/l卡那黴素和5mg/l氯黴素的MM培養基中在30℃培養48小時。在完成培養之後,作為使用實施例2的(2-3)中描述的方法對10μl培養物上清液進行SDS-PAGE的結果,與13869/pPKT-PTG1相比,在13869/pPKT-PTG1/PVtatABC中觀察到具有原體結構的轉穀氨醯胺酶的分泌量增加。此外,作為在參考實施例A-3中描述相同條件下通過反相HPLC分析培養物上清液的結果,在Tat系統分泌元件增強的菌株中分泌量大約高40倍。
實施例9-在使用TorA信號序列分泌生產蛋白-穀氨醯胺酶中改變原體序列的C-末端(1)改變蛋白-穀氨醯胺酶的原體序列的C-末端分析在實施例3和5中證實了活性的蛋白-穀氨醯胺酶的N-末端胺基酸序列,揭示了與天然存在的蛋白-穀氨醯胺酶相比,該序列(NKLASV)具有兩個額外的胺基酸。因此,改變原體序列的C-末端序列,使得該原體序列被切割後產生與天然存在的蛋白-穀氨醯胺酶的N-末端序列相同的N-末端序列。雖然天然存在的蛋白-穀氨醯胺酶的原體序列的C-末端序列是「QTNK」,它被改變成「FGPK」,預計其可以容易地被SAM-P45切斷,或改變成「FGPF」、「FAPF」、「FAPY」、「AHAY」、「AHAL」、「AAPF」、「AAPY」或「AAPM」,其預計可以用含有枯草桿菌蛋白酶作為其主要成分的Atkalase(Novozymes)容易地切斷。通過使用具有SEQ ID NO.50(CTT GGG GCC GAA GCC CTTGAC TTC TTT GGT CAG)和SEQ ID NO.51(TTC GGC CCC AAG TTG GCGTCC GTC ATT CCA GAT)所示序列的引物,進行向「FGPK」的改變。SEQ IDNO.50的序列是用於擴增原體序列區域的引物;而SEQ ID NO.51是用於擴增成熟區的引物。使用在實施例3的(3-2)中構建的質粒pPKT-PPG作為模板,使用具有SEQ ID NO.20和SEQ ID NO.50所示序列的引物來擴增蛋白-穀氨醯胺酶的原體序列區域,而使用具有SEQ ID NO.51和SEQ ID NO.18所示序列的引物來擴增蛋白-穀氨醯胺酶的成熟區域。此外,這些PCR產物以1∶1的比例混合,然後使用它們作為模板,使用具有SEQ ID NO.20和SEQID NO.18所示序列的引物進行交叉PCR,來擴增具有原體結構的蛋白-穀氨醯胺酶基因,其中原體序列的C-末端已經被改變成FGPK。
將交叉PCR產物克隆到pUC18的SmaI位點中(pUCPPG(FGPK)),並測序來證實該原體序列已經改變。然後,將pPKT-PPG的AatII-BstPI(大)片段和pUCPG(FGPK)的AatII-BstPI(小)片段連接產生pPKT-PPG(FGPK)。類似地,為了改變成「FGPF」,使用具有SEQ ID NO.52(GAA GGG GCC GAAGCC CTT GAC TTC TTT GGT CAG)和SEQ ID NO.53(TTC GGC CCC TTCTTG GCG TCC GTC ATT CCA GAT)所示序列的引物,為了改變成「FAPF」,使用具有SEQ ID NO.54(GAA GGG CGC GAA GCC CTT GAC TTC TTTGGT CAG)和SEQ ID NO.55(TTC GCG CCC TTC TTG GCG TCC GTC ATTCCA GAT)所示序列的引物,為了改變成「FAPY」,使用具有SEQ ID NO.56(GTA GGG CGC GAA GCC CTT GAC TTC TTT GGT CAG)和SEQ ID NO.57(TTC GCG CCC TAC TTG GCG TCC GTC ATT CCA GAT)所示序列的引物,為了改變成「AHAY」,使用具有SEQ ID NO.58(GTA CGC GTG CGC GCCCTT GAC TTC TTT GGT CAG)和SEQ ID NO.59(GCG CAC GCG TAC TTGGCG TCC GTC ATT CCA GAT)所示序列的引物,為了改變成「AHAL」使用具有SEQ ID NO.60(CAA CGC GTG CGC GCC CTT GAC TTC TTT GGTCAG)和SEQ ID NO.61(GCG CAC GCG TTG TTG GCG TCC GTC ATT CCAGAT)所示序列的引物,為了改變成「AAPF」使用具有SEQ ID NO.62(GAAGGG CGC CGC GCC CTT GAC TTC TTT GGT CAG)和SEQ ID NO.63(GCGGCG CCC TTC TTG GCG TCC GTC ATT CCA GAT)所示序列的引物,為了改變成「AAPY」使用具有SEQ ID NO.64(GTA GGG CGC CGC GCC CTTGAC TTC TTT GGT CAG)和SEQ ID NO.65(GCG GCG CCC TAC TTG GCGTCC GTC ATT CCA GAT)所示序列的引物,以及,為了改變成「AAPM」使用具有SEQ ID NO.66(CAT GGG CGC CGC GCC CTT GAC TTC TTT GGTCAG)和SEQ ID NO.67(GCG GCG CCC ATG TTG GCG TCC GTC ATT CCAGAT)所示序列的引物。SEQ ID NO.52、54、56、58、60、62、64和66的序列是用於擴增原體序列區域的引物,而SEQ ID NO.53、55、57、59、61、63、65和67是用於擴增成熟區的引物。使用在實施例3的(3-2)中構建的質粒pPKT-PPG作為模板,分別地,用具有SEQ ID NO.20和SEQ ID NO.52所示序列的引物來擴增蛋白-穀氨醯胺酶的原體序列區域,而用具有SEQ IDNO.53和SEQ ID NO.18所示序列的引物來擴增蛋白-穀氨醯胺酶的成熟區域。這些PCR產物以1∶1的比例混合,然後使用它們作為模板,使用具有SEQID NO.20和SEQ ID NO.18所示序列的引物進行交叉PCR,來擴增具有原體結構其中原體序列的C-末端已經被改變成FGPF的蛋白-穀氨醯胺酶基因。將交叉PCR產物克隆到pUC18的SmaI位點中(pUCPG(FGPF)),並測序來證實原體序列已經改變。然後,將pPKT-PPG的AatII-BstPI(大)片段和pUCPPG(FGPF)的AatII-BstPI(小)片段連接產生pPKT-PPG(FGPF)。根據類似的步驟,構建pPKT-PPG(FAPF)、pPKT-PPG(FAPY)、pPKT-PPG(AHAY)、pPKT-PPG(AHAL)、pPKT-PPG(AAPF)、pPKT-PPG(AAPY)和pPKT-PPG(AAPM)。
(2)分泌和表達其中原體序列C-末端已經改變成「FGPK」的蛋白-穀氨醯胺酶用構建的質粒pPKT-PPG(FGPK)轉化穀氨酸棒桿菌ATCC13869,選擇在含有25mg/l卡那黴素的CM2G瓊脂培養基上生長的微生物菌株。將選擇的菌株在含有25mg/l卡那黴素的MM液體培養基中在30℃培養48小時。在培養完成之後,通過SDS-PAGE分析10μl的培養物上清液。使用4-20%梯度凝膠(Daiichi Pure Chemicals)進行SDS-PAGE,隨後用考馬斯亮藍進行蛋白質染色。結果,在約35kDa附近檢測到條帶,其接近預定分子量。作為通過反相HPLC分析100μl培養物上清液的結果,發現蛋白質濃度為約20mg/l。
此外,在如實施例2的(2-2)所述使用Ultrafree(Millipore)對培養物上清液進行處理之後,用源自放線菌的蛋白酶SAM-P45酶法消化蛋白質,以切斷蛋白-穀氨醯胺酶的原體結構區域並獲得成熟蛋白質。使用日本專利申請公開No.2000-50887中描述的方法測量這個成熟蛋白質的活性,並證實分泌的蛋白質實際上具有蛋白-穀氨醯胺酶活性。此外,作為分析成熟蛋白質的N-末端胺基酸序列的結果,證實了N-末端是LASV,與天然存在的形式相同。此外,還證實了,當使用胰蛋白酶或蛋白酶M(Protease M)(Amano Enzyme)進行成熟化(maturation)時也獲得了與天然存在形式相同的N-末端。
(3)分泌表達具有改變的原體序列C-末端的蛋白-穀氨醯胺酶和它通過Alkalase的成熟化分別用構建的質粒pPKT-PPG(FGPF)、pPKT-PPG(FAPF)、pPKT-PPG(FAPY)、pPKT-PPG(AHAY)、pPKT-PPG(AHAL)、pPKT-PPG(AAPF)、pPKT-PPG(AAPY)和pPKT-PPG(AAPM)轉化穀氨酸棒桿菌ATCC13869,選擇在含有25mg/l卡那黴素的CM2G瓊脂培養基上生長的微生物菌株。將每個選擇的菌株在含有25mg/l卡那黴素的MM液體培養基中在30℃培養48小時。在完成培養之後,通過SDS-PAGE來分析10μl培養物上清液。使用4-20%梯度凝膠(Daiichi Pure Chemicals)進行SDS-PAGE,隨後用考馬斯亮藍進行蛋白質染色。結果,在約35kDa附近檢測到條帶,其接近預定分子量。作為通過反相HPLC分析100μl培養物上清液的結果,發現蛋白質濃度為約20mg/l。
此外,按照與實施例2的(2-2)相同的方式用Ultrafree(Millipore)對培養物上清液進行處理之後,用枯草桿菌蛋白酶(Sigma)或Alkalase(Novozymes)酶法消化蛋白質,以切斷蛋白-穀氨醯胺酶的原體結構區域並獲得成熟蛋白質。使用日本專利申請公開No.2000-50887中描述的方法測量這個成熟蛋白質的活性,並證實分泌的蛋白質實際上具有蛋白-穀氨醯胺酶活性。此外,作為分析成熟蛋白質的N-末端胺基酸序列的結果,證實了N-末端是LASV,與天然存在的形式相同。
根據本發明,通過棒狀桿菌型細菌中的蛋白質分泌途徑Sec系統很難分泌的工業上有用的異源蛋白質,例如異麥芽糖葡聚糖酶或蛋白-穀氨醯胺酶,可以有效地細胞外地生產並分泌(分泌和生產)。即,根據本發明,提供了有效地生產異源蛋白質的方法,所述異源蛋白質難以通過Sec系統分泌生產。
參考文獻1.美國專利No.49651972.日本國際專利申請公開No.6-5025483.日本國際專利申請公開No.H11-1691824.國際公開WO 02/816945.日本專利申請公開No.H6-1697806.日本專利申請公開No.H6-2770737.日本專利申請公開No.H11-1691828.日本專利申請公開No.H7-1079819.美國專利No.602295210.美國專利No.633517811.國際公開WO 02/2266712.Liebl W,Sinskey AJ,Schleifer KH,Expression,secretion,and processingof staphylococcal nuclease by Corynebacterium glutamicum,J.Bacteriology(1992)174,1854-186113.Billman-Jacobe H,Wang L,Kortt A,Stewart D,Radford A,Expressionand secretion of heterologous proteases by Corynebacterium glutamicum,AppliedEnvironmental Microbiology(1995)61,1610-161314.Salim K,Haedens V,Content J,Leblon G,Huygen K,Heterologousexpression of the Mycobacterium tuberculosis gene encoding antigen 85A inCorynebacterium glutamicum,Applied Environmental Microbiology,(1997),63,4392-440015.Kikuchi Y,Date M,Yokoyama K,Umezawa Y,Matsui H,Secretion ofactive-form Streptoverticillium mobaraense transglutaminase by Corynebacteriumglutamicumprocessing of the pro-transglutaminase by a cosecreted subtilisin-likeprotease from Streptomyces albogriseolus,Applied Environmental Microbiology,(2003),69,358-36616.Chaddock AM,Mant A,Karnnauchov I,Brink S,Herrmann RG,KlosgenRB,Robinson C,A new type of signal peptidecentral role of a twin-argininemotif in transfer signals for the delta pH-dependent thylakoidal protein translocase,EMBO Journal,(1995),14,2715-272217.Mark Settles,Ann Yonetani,Aimee Baron Daniel R.Bush-Kenneth Clineand Rob Martienssen,Sec-Independent Protein Translocation by the MaizeHcf106 Protein,Science(1997),278,1467-147018.Jongbloed JD,Martin U,Antelmann H,Hecker M,Tjalsma H,VenemaG,Bron S,van Dijl JM,Muller J,TatC is a specificity determinant for proteinsecretion via the twin-arginine translocation pathway,Journal of BiologicalChemistry,275,41350-4135719.Hynds PJ,Robinson D,Robinson C,The sec-independent twin-argininetranslocation system can transport both tightly folded and malfolded proteinsacross the thylakoid membrane.J.Biol Chem.(1998)25;273(52)34868-7420.Barrett,C.M.,N.Ray,J.D.Thomas,C.Robinson,and A.Bolhius,Quantitative export of a reporter protein,GFP,by the twin-arginine translocationpathway in Escherichia coil.(2003)Biochem.Biophys.Res.Commun.304279-284序列表自由本文(free text)
SEQ ID NO.11-27,33,34,36,37,39,40,42-45,和50-67合成的寡核苷酸序列表110味之素株式會社(Ajinomoto Co.,Inc.)120生產蛋白質的方法130OP06151150JP2004-1241961512004-04-20150JP2005-58961512005-01-1316067170PatentIn version3.221012111911212DNA213球形節桿菌220
221misc_feature223IMD酶;核苷酸序列4001atgatgaacc tgtcccgccg cacattgctc accaccggca gcgccgccac cctcgcctac 60gccttgggca tggcaggctc cgcccaggcc gccaccgccg tcaccgcccg cccgggcgtc 120cccgtcacgg ccgcgccgcc cttgcgcctg gccagccgga acagcgtgtt cacccgcagc 180ggtgccggcc cccggtactg gaacatctac ggctactcgt tcccgcacaa cgcccccatt 240ccggaaaacg agtggaaggc caacatcgac tggctggccg gaaacttcgc cgatttcggt 300tacgacatcg cctgcaccga cggctggatc gaaggctcca gccgcaccac cggcaacggc 360tacatcacca gctacaacga ttcctggcag cacgactggg cttactgggc aaactacctg 420gccgcgcgga agatgaagct gggtgtctac tacaaccccc tctgggtgca ccgggccgcc 480gtcgaagacg cttccaagac cgtcctgggc cggcccgacg tcaagatcgc ggacctggtg 540gtgcccgggg acttcttcgc ccgggacatc ggcggaaacc agctgtactg gctggacgtg 600accaagtccg gcgccaagga atacgtccag ggctacgtgc gctacttcaa ggacctcggc 660gttccctacc tgcggatcga cttcctctcc tggtacgagg acggaaggga cgcgaacatc 720gggcaggtca acgcaccgca cggccgggcc aactacgaac tcgccctctc ctggatcaac 780gaggccgccg gcgaggacat ggaagtttcg ctcgtaatgc cgcacatgtt ccaggacggt 840tccgcggaac tggccaacgg cgacctggtg cggatcaatg ccgacgccga caagggcggc 900tgggaccggc tgagcgggat gcgccagaac tggcaggacg cgtggcccaa ctgggccaac 960ccgttctgcg ggttcaccgg atggtcccac cgcaacggca ggggccagct gatcctggac1020ggcgacttca tgcgcgccag cacctttgcc agcgacgagg aacgcaagac catgatgaac1080ctgatggtcg cggccggatc acccttggcc atcgctgaca cctaccagca aatcggcaac1140aacgcctggg tttacaccaa caaggaagtc ctccagctca atgccgacgg cctggtgggc1200aagcccctct accggtccgc caccccgttc tccaaggacc ccggctcccg cgacaccgaa1260cgctgggccg ggcagcttcc ggacggttcg tggggcgttg cgctcttcaa ccgcagcgac1320actgaaacgg tcaccaagac catcgacttc gcaaaggacc tcggcctggc aaccggcggc1380aacgtccggg acctctggga gcacaggaac ctgggcatgg actcccgcgc cacggccgcg1440
ctggccccgc acgcctcggc catcttccgc gtcactccgc cgaagatgca cggcaccacc 1500cggtaccccg cggccttcgc agcctgggga ggcggggccg gcttcaacaa caaccacccc 1560gggtatgacg gcaacggctt cgtggacgga ctccaggcgg gctccggcag cgcggacccg 1620ctggtcacgt tcgcggtcca ggtgccgcac cgcggcagct acgccatccg ctaccggtat 1680gccaatgcca ccggcgatac cagcaccatg acggtcaccg ccgaaaaggc ggaccgttcc 1740accgtggacg gtccggtcca cgtcagcttc ccgggcctgg ccacctggga cacctggggc 1800gtggcggacg gcaccatcac gctcgatgcc ggcctgaacc tggtcaccat cggcaggggc 1860gccacggaca agggagccat caacctgaac tggatagagt tggacatgtg a 19112102211636212PRT213球形節桿菌220
221MISC_FEATURE223IMD酶;胺基酸序列4002Met Met Asn Leu Ser Arg Arg Thr Leu Leu Thr Thr Gly Ser Ala Ala1 5 10 15Thr Leu Ala Tyr Ala Leu Gly Met Ala Gly Ser Ala Gln Ala Ala Thr20 25 30Ala Val Thr Ala Arg Pro Gly Val Pro Val Thr Ala Ala Pro Pro Leu35 40 45Arg Leu Ala Ser Arg Asn Ser Val Phe Thr Arg Ser Gly Ala Gly Pro50 55 60Arg Tyr Trp Asn Ile Tyr Gly Tyr Ser Phe Pro His Asn Ala Pro Ile65 70 75 80Pro Glu Asn Glu Trp Lys Ala Asn Ile Asp Trp Leu Ala Gly Asn Phe85 90 95Ala Asp Phe Gly Tyr Asp Ile Ala Cys Thr Asp Gly Trp Ile Glu Gly100 105 110Ser Ser Arg Thr Thr Gly Asn Gly Tyr Ile Thr Ser Tyr Asn Asp Ser115 120 125Trp Gln His Asp Trp Ala Tyr Trp Ala Asn Tyr Leu Ala Ala Arg Lys130 135 140Met Lys Leu Gly Val Tyr Tyr Asn Pro Leu Trp Val His Arg Ala Ala145 150 155 160Val Glu Asp Ala Ser Lys Thr Val Leu Gly Arg Pro Asp Val Lys Ile165 170 175Ala Asp Leu Val Val Pro Gly Asp Phe Phe Ala Arg Asp Ile Gly Gly180 185 190Asn Gln Leu Tyr Trp Leu Asp Val Thr Lys Ser Gly Ala Lys Glu Tyr195 200 205Val Gln Gly Tyr Val Arg Tyr Phe Lys Asp Leu Gly Val Pro Tyr Leu210 215 220Arg Ile Asp Phe Leu Ser Trp Tyr Glu Asp Gly Arg Asp Ala Asn Ile225 230 235 240Gly Gln Val Asn Ala Pro His Gly Arg Ala Asn Tyr Glu Leu Ala Leu245 250 255
Ser Trp Ile Asn Glu Ala Ala Gly Glu Asp Met Glu Val Ser Leu Val260 265 270Met Pro His Met Phe Gln Asp Gly Ser Ala Glu Leu Ala Asn Gly Asp275 280 285Leu Val Arg Ile Asn Ala Asp Ala Asp Lys Gly Gly Trp Asp Arg Leu290 295 300Ser Gly Met Arg Gln Asn Trp Gln Asp Ala Trp Pro Asn Trp Ala Asn305 310 315 320Pro Phe Cys Gly Phe Thr Gly Trp Ser His Arg Asn Gly Arg Gly Gln325 330 335Leu Ile Leu Asp Gly Asp Phe Met Arg Ala Ser Thr Phe Ala Ser Asp340 345 350Glu Glu Arg Lys Thr Met Met Asn Leu Met Val Ala Ala Gly Ser Pro355 360 365Leu Ala Ile Ala Asp Thr Tyr Gln Gln Ile Gly Asn Asn Ala Trp Val370 375 380Tyr Thr Asn Lys Glu Val Leu Gln Leu Asn Ala Asp Gly Leu Val Gly385 390 395 400Lys Pro Leu Tyr Arg Ser Ala Thr Pro Phe Ser Lys Asp Pro Gly Ser405 410 415Arg Asp Thr Glu Arg Trp Ala Gly Gln Leu Pro Asp Gly Ser Trp Gly420 425 430Val Ala Leu Phe Asn Arg Ser Asp Thr Glu Thr Val Thr Lys Thr Ile435 440 445Asp Phe Ala Lys Asp Leu Gly Leu Ala Thr Gly Gly Asn Val Arg Asp450 455 460Leu Trp Glu His Arg Asn Leu Gly Met Asp Ser Arg Ala Thr Ala Ala465 470 475 480Leu Ala Pro His Ala Ser Ala Ile Phe Arg Val Thr Pro Pro Lys Met485 490 495His Gly Thr Thr Arg Tyr Pro Ala Ala Phe Ala Ala Trp Gly Gly Gly500 505 510Ala Gly Phe Asn Asn Asn His Pro Gly Tyr Asp Gly Asn Gly Phe Val515 520 525Asp Gly Leu Gln Ala Gly Ser Gly Ser Ala Asp Pro Leu Val Thr Phe530 535 540Ala Val Gln Val Pro His Arg Gly Ser Tyr Ala Ile Arg Tyr Arg Tyr545 550 555 560Ala Asn Ala Thr Gly Asp Thr Ser Thr Met Thr Val Thr Ala Glu Lys565 570 575Ala Asp Arg Ser Thr Val Asp Gly Pro Val His Val Ser Phe Pro Gly580 585 590Leu Ala Thr Trp Asp Thr Trp Gly Val Ala Asp Gly Thr Ile Thr Leu595 600 605Asp Ala Gly Leu Asn Leu Val Thr Ile Gly Arg Gly Ala Thr Asp Lys610 615 620Gly Ala Ile Asn Leu Asn Trp Ile Glu Leu Asp Met625 630 6352103211963212DNA213Chryseobacterium proteolyticum
220
221misc_feature223蛋白穀氨醯胺酶;核苷酸序列4003atgaagaacc ttttcctgtc catgatggcc ttcgtgaccg tcctcacctt caactcctgc 60gccgattcca acggcaacca ggaaatcaac ggcaaggaga agctttccgt taacgattct 120aagctgaagg atttcggcaa gaccgttccg gttggcatcg acgaagagaa cggcatgatc 180aaggtgtcct tcatgttgac tgcgcagttc tacgagatca agccaaccaa ggaaaacgag 240cagtacatcg gtatgcttcg ccaggctgtt aagaacgaat ctccagtcca cattttcctc 300aagccaaaca g1aatgaaat cggcaaggtg gagtctgcat ccccagagga cgtccgctac 360ttcaagacga tcctgaccaa agaagtcaag ggccagacca acaaattggc gtccgtcatt 420ccagatgtgg ctaccctcaa ctctctcttc aaccaaatca agaaccagtc ttgcggtacc 480tctacggcgt cctccccatg catcaccttc cgctacccag tcgacggctg ctacgcacgc 540gcccacaaga tgcgccagat cttgatgaac aacggctatg actgtgagaa gcaattcgtg 600tacggtaacc tcaaggcatc caccggcacc tgctgcgtgg cgtggagcta ccacgttgca 660atcttggtga gctacaaaaa cgcttccggc gtgacggaaa aacgcattat tgatccatcc 720cttttttcca gcggtcctgt gaccgatacc gcatggcgca acgcttgcgt taacacctct 780tgcggctctg catccgtttc ctcttacgct aacaccgcag gaaatgttta ttaccgctcc 840ccatccaatt cttacctgta tgacaacaat ctgatcaata ccaactgtgt cctgactaaa 900ttctccctgc tttccggctg ttctccttca cctgcaccgg atgtctccag ctgtggattt 960taa 9632104211320212PRT213Chyrseobacterium proteolyticum220
221MISC_FEATURE223蛋白穀氨醯胺酶;胺基酸序列4004Met Lys Asn Leu Phe Leu Ser Met Met Ala Phe Val Thr Val Leu Thr1 5 10 15Phe Asn Ser Cys Ala Asp Ser Asn Gly Asn Gln Glu Ile Asn Gly Lys20 25 30Glu Lys Leu Ser Val Asn Asp Ser Lys Leu Lys Asp Phe Gly Lys Thr35 40 45Val Pro Val Gly Ile Asp Glu Glu Asn Gly Met Ile Lys Val Ser Phe50 55 60Met Leu Thr Ala Gln Phe Tyr Glu Ile Lys Pro Thr Lys Glu Asn Glu65 70 75 80Gln Tyr Ile Gly Met Leu Arg Gln Ala Val Lys Asn Glu Ser Pro Val85 90 95His Ile Phe Leu Lys Pro Asn Ser Asn Glu Ile Gly Lys Val Glu Ser100 105 110Ala Ser Pro Glu Asp Val Arg Tyr Phe Lys Thr Ile Leu Thr Lys Glu115 120 125
Val Lys Gly Gln Thr Asn Lys Leu Ala Ser Val Ile Pro Asp Val Ala130 135 140Thr Leu Asn Ser Leu Phe Asn Gln Ile Lys Asn Gln Ser Cys Gly Thr145 150 155 160Ser Thr Ala Ser Ser Pro Cys Ile Thr Phe Arg Tyr Pro Val Asp Gly165 170 175Cys Tyr Ala Arg Ala His Lys Met Arg Gln Ile Leu Met Asn Asn Gly180 185 190Tyr Asp Cys Glu Lys Gln Phe Val Tyr Gly Asn Leu Lys Ala Ser Thr195 200 205Gly Thr Cys Cys Val Ala Trp Ser Tyr His Val Ala Ile Leu Val Ser210 215 220Tyr Lys Asn Ala Ser Gly Val Thr Glu Lys Arg Ile Ile Asp Pro Ser225 230 235 240Leu Phe Ser Ser Gly Pro Val Thr Asp Thr Ala Trp Arg Asn Ala Cys245 250 255Val Ash Thr Ser Cys Gly Ser Ala Ser Val Ser Ser Tyr Ala Asn Thr260 265 270Ala Gly Asn Val Tyr Tyr Arg Ser Pro Ser Asn Ser Tyr Leu Tyr Asp275 280 285Asn Asn Leu Ile Asn Thr Asn Cys Val Leu Thr Lys Phe Ser Leu Leu290 295 300Ser Gly Cys Ser Pro Ser Pro Ala Pro Asp Val Ser Ser Cys Gly Phe305 310 315 320210521190212DNA213球形節桿菌220
221misc_feature223IMD信號序列;核苷酸序列4005atgatgaacc tgtcccgccg cacattgctc accaccggca gcgccgccac cctcgcctac 60gccttgggca tggcaggctc cgcccaggcc 90210621130212PRT213球形節桿菌220
221MISC_FEATURE223IMD信號肽4006Met Met Asn Leu Ser Arg Arg Thr Leu Leu Thr Thr Gly Ser Ala Ala1 5 10 15Thr Leu Ala Tyr Ala Leu Gly Met Ala Gly Ser Ala Gln Ala20 25 302107211117212DNA213大腸桿菌
220
221misc_feature223TorA信號序列;核苷酸序列4007atgaacaata acgatctctt tcaggcatca cgtcggcgtt ttctggcaca actcggcggc 60ttaaccgtcg ccgggatgct ggggccgtca ttgttaacgc cgcgacgtgc gactgcg117210821139212PRT213大腸桿菌220
221MISC_FEATURE223TorA信號肽4008Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala1 5 10 15Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu20 25 30Thr Pro Arg Arg Ala Thr Ala352109211945212DNA213穀氨酸棒桿菌220
221misc_feature223tatC基因序列4009atgtccattg ttgagcacat caaagagttt cgacgccgac ttcttatcgc tctggcgggc 60atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120actttgggcg agctgctgag ggatccgtac tgttctctgc ctgctgaatc ccgctgggcc 180atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540ccactggtga tcggcatgct caacattgtg ggtatcttgc cttacgatgc cattaaagat 600aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtaga gcttgccctg 720cagttctgtcgt ttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945
21010211314212PRT213穀氨酸棒桿菌220
221MISC_FEATURE223tatC胺基酸序列40010Met Ser Ile Val Glu His Ile Lys Glu Phe Arg Arg Arg Leu Leu Ile1 5 10 15Ala Leu Ala Gly Ile Leu Val Gly Thr Ile Ile Gly Phe Ile Trp Tyr20 25 30Asp Phe Ser Phe Trp Gln Ile Pro Thr Leu Gly Glu Leu Leu Arg Asp35 40 45Pro Tyr Cys Ser Leu Pro Ala Glu Ser Arg Trp Ala Met Ser Asp Ser50 55 60Glu Glu Cys Arg Leu Leu Ala Thr Gly Pro Phe Asp Pro Phe Met Leu65 70 75 80Arg Leu Lys Val Ala Ala Leu Val Gly Met Val Leu Gly Ser Pro Val85 90 95Trp Leu Ser Gln Leu Trp Gly Phe Ile Thr Pro Gly Leu Met Lys Asn100 105 110Glu Arg Arg Tyr Thr Ala Ile Phe Val Thr Ile Ala Val Val Leu Phe115 120 125Val Gly Gly Ala Val Leu Ala Tyr Phe Val Val Ala Tyr Gly Leu Glu13O 135 140Phe Leu Leu Thr Ile Gly Gly Asp Thr Gln Ala Ala Ala Leu Thr Gly145 150 155 160Asp Lys Tyr Phe Gly Phe Leu Leu Ala Leu Leu Ala Ile Phe Gly Val165 170 175Ser Phe Glu Val Pro Leu Val Ile Gly Met Leu Asn Ile Val Gly Ile180 185 190Leu Pro Tyr Asp Ala Ile Lys Asp Lys Arg Arg Met Ile Ile Met Ile195 200 205Leu Phe Val Phe Ala Ala Phe Met Thr Pro Gly Gln Asp Pro Phe Thr210 215 220Met Leu Val Leu Ala Leu Ser Leu Thr Val Leu Val Glu Leu Ala Leu225 230 235 240Gln Phe Cys Arg Phe Asn Asp Lys Arg Arg Asp Lys Lys Arg Pro Glu245 250 255Trp Leu Asp Gly Asp Asp Leu Ser Ala Ser Pro Leu Asp Thr Ser Ala260 265 270Gly Gly Glu Asp Ala Pro Ser Pro Val Glu Thr Pro Glu Ala Val Glu275 280 285Pro Ser Arg Met Leu Asn Pro Ser Gly Glu Ala Ser Ile Ser Tyr Lys290 295 300Pro Gly Arg Ala Asp Phe Gly Asp Val Leu305 3102101121120212DNA
213人工序列220
223合成的寡核苷酸40011atgatgaacc tgtcccgccg 202101221123212DNA213人工序列220
223合成的寡核苷酸40012cgcggatccc tgagggcggg aac 232101321120212DNA213人工序列220
223合成的寡核苷酸40013gtccccgtca cggccgcgcc 202101421126212DNA213人工序列220
223合成的寡核苷酸40014aaattcctgt gaattagctg atttag 262101521146212DNA213人工序列220
223合成的寡核苷酸40015cccgggcggg cggtgacggc ggtggctgcc gttgccacag gtgcgg 462101621139212DNA213人工序列220
223合成的寡核苷酸40016ggcgggacag gttcatcata gaggcgaagg ctccttgaa 392101721121212DNA213人工序列220
223合成的寡核苷酸
40017catgaagaac cttttcctgt c212101821126212DNA213人工序列220
223合成的寡核苷酸40018gtaaaaggat ccattaatta aaatcc 262101921140212DNA213人工序列220
223合成的寡核苷酸40019tcctggtt gccgttggaatc tgccgttgcc acaggtgcgg402102021120212DNA213人工序列220
223合成的寡核苷酸40020gattccaacg gcaaccagga 202102121138212DNA213人工序列220
223合成的寡核苷酸40021cctggttgcc gttggaatcg gcctgggcgg agcctgcc 382102221125212DNA213人工序列220
223合成的寡核苷酸40022atgaacaata acgatctctt tcagg252102321126212DNA213人工序列220
223合成的寡核苷酸40023ccggatcctg gtcatgattt cacctg 2621024
21143212DNA213人工序列220
223合成的寡核苷酸40024aagagatcgt tattgttcat agaggcgaag gctccttgaa tag432102521144212DNA213人工序列220
223合成的寡核苷酸40025gatttcctgg ttgccgttgg aatccgcagt cgcacgtcgc ggcg 442102621134212DNA213人工序列220
223合成的寡核苷酸40026ggcggtaccg ttaagcgccc tcggcgagtt atct 342102721134212DNA213人工序列220
223合成的寡核苷酸40027gcctctagac tagagcacgt caccgaagtc ggcg 342102821127212PRT213大腸桿菌220
221MISC_FEATURE223SufI信號肽40028Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu1 5 10 15Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala20 252102921148212PRT213枯草芽孢桿菌220
221MISC_FEATURE223PhoD信號肽40029
Met Ala Tyr Asp Ser Arg Phe Asp Glu Trp Val Gln Lys Leu Lys Glu1 5 10 15Glu Ser Phe Gln Asn Asn Thr Phe Asp Arg Arg Lys Phe Ile Gln Gly20 25 30Ala Gly Lys Ile Ala Gly Leu Ser Leu Gly Leu Thr Ile Ala Gln Ser35 40 452103021134212PRT213枯草芽孢桿菌220
221MISC_FEATURE223LipA信號肽40030Met Lys Phe Val Lys Arg Arg Thr Thr Ala Leu Val Thr Thr Leu Met1 5 10 15Leu Ser Val Thr Ser Leu Phe Ala Leu Gln Pro Ser Ala Lys Ala Ala20 25 30Glu His210312116212PRT213人工序列220
223tatC依賴性信號肽基序220
221MISC_FEATURE222(1)..(1)223Ser或Thr220
221MISC_FEATURE222(3)..(3)223任何胺基酸40031Xaa Arg Xaa Phe Leu Lys1 5210322115212PRT213人工序列220
223tatC依賴性信號肽基序220
221MISC_FEATURE222(3)..(3)223任何胺基酸220
221MISC_FEATURE222(4)..(4)223疏水性胺基酸
220
221MISC_FEATURE222(5)..(5)223疏水性胺基酸40032Arg Arg Xaa Xaa Xaa1 52103321120212DNA213人工的220
223合成的寡核苷酸40033gcttgatcat tcctttaagg 202103421140212DNA213人工的220
223合成的寡核苷酸40034atgtgctcaa caatggacat gtggtctact ccaaattcac4021035211945212DNA213穀氨酸棒桿菌220
221misc_feature223tatC基因序列40035atgtccattg ttgagcacat caaagagttt cgacgccgac ttctcatcgc tctggcgggc 60atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120actttgggcg agctgctgag ggatccgtac tgttctttgc ctgctgaatc ccgctgggcc 180atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540ccactggtga tcggcatgct caacattgtg ggtatcttgc cctacgatgc cattaaagat 600aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtgga gcttgccctg 720cagttctgtc gcttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945
2103621121212DNA213人工的220
223合成的寡核苷酸40036atgtccattg ttgagcacat c212103721120212DNA213人工的220
223合成的寡核苷酸40037ctagagcacg tcaccgaagt 20210382112402212DNA213人工的220
223tatA+tatC40038gcttgatcat tcctttaagg aagtaaaaat ccacaatgct caaggcatgg ataaaccctt 60gcgcctcaca ccaactgaag ccggtgtttt gctgctgaca cttgaatccc tggaatccct 120ccccggtatt gcgaaacagg aagcggtcgt atctgctgcg aacaagctac gcgccatcat 180gggagagtat tcctcgactg ttttcgactc cactggagaa gacctcgacg ctgaagttct 240agagatcatc cgcgacgcca tggatttaca ccagcaggtc agttttgaat accactcgca 300cagatcagac aacaccagcc tgaggcaagt cagccctgct catatcttca cccatgaagg 360cgaaacctac atcaaagcct gggaagaagc tgtgaaacaa tggcggacgt ttaggcttga 420tcgcatccga agcattgtgc ttcttgacag caaagcagtg cacccggcgc gaggggtttc 480agtatccacg gacgatcctt ttgagttcgc aaaatcttcc gatattgcca cgttattgct 540acgtgaggac gcaatgtggt taggcaatta catggccatg gaggtggatg aaacggtgga 600accgattcgc gatagcgacg gattcagctg gcacacagtc cactttccgc tgctttctag 660ggattggttc gtccgattcg cgattggcca tgctgagcat ttgaaagtaa ctagtcccga 720agatcttcgg aaatgcataa agcaaaaggc tcttagtggt ttgtcagcgt atgatcatca 780cgtagagtaa cacccaagag taagacgcaa catcaatcaa tgtgcaaggg tttcatttct 840ggaaatcgtg gtcaccccac attcaccagt catggacaag cttgtttaat gtgaatttgg 900agtagaccac atgcccactc tcggaccatg ggaaatcgcg atcattgtcc tgctgatcat 960tctgctgttc ggcgcgaaga agctgcctga tgcagctcgt tccatcggcc gttccatgcg1020catcttcaag tctgaagtca aagaaatgaa caaggacggc gataccccag aacaacaaca1080gcagcagcct cagcagcagc agcagattgc gcccaaccag atcgaggctc ctcagccagt1140tcagcagcca gcgcaacagt caaactttga gcagcactac cagggccagc aggttcagca1200gcctcagaac cctcagaccc ctgactaccg tcagaactac gaggatccaa accgcacctc1260
ctaaagttgg gcagtttgca tctaaaaaat aaagtcatcg caccgtaaca gctacctttt1320gttgcggtgc gtcgtagtct gtacataaaa acgcaggtag gacgttcaag gaattggctg1380aatcaacaag cgccaaggtg gttaagcgcc ctcggcgagt tatctcagaa aagaagaaga1440agtctcctac gggagagatg tccattgttg agcacatcaa agagtttcga cgccgacttc1500tcatcgctct ggcgggcatc ctcgtgggca ccattatcgg ctttatttgg tacgatttct1560cattttggca gatccccact ttgggcgagc tgctgaggga tccgtactgt tctttgcctg1620ctgaatcccg ctgggccatg agcgactcag aggaatgtcg actgctcgca accggcccgt1680ttgatccatt catgcttcgc cttaaagtag cggcgttggt gggtatggtt cttggctcac1740ccgtgtggct gagccagctg tggggcttta tcaccccagg tttgatgaag aatgagcgcc1800gttacaccgc aatcttcgtc acgattgctg ttgtgctgtt tgtcggcggt gctgttcttg1860cgtacttcgt cgttgcatat ggtttggagt tcctccttac cattggtgga gacacccagg1920cagcggccct gactggtgat aagtacttcg gattcttgct cgcgttgttg gcgattttcg1980gcgtgagctt cgaagttcca ctggtgatcg gcatgctcaa cattgtgggt atcttgccct2040acgatgccat taaagataag cgacgcatga tcatcatgat tttgttcgtg ttcgctgctt2100tcatgacacc cggccaggat cctttcacca tgttggtgtt ggcgctttca ctcaccgttc2160tggtggagct tgccctgcag ttctgtcgct tcaacgacaa acgccgggac aagaagcgcc2220cagaatggct tgatggcgat gacctctctg catcaccact ggatacttct gctggtggag2280aagatgctcc aagcccagtc gaaaccccag aggcggtgga gccttcgcgg atgctgaacc2340caagtgggga ggcgtcgata agctataaac ccgggcgcgc cgacttcggt gacgtgctct2400ag 24022103921120212DNA213人工的220
223合成的寡核苷酸40039gaggcgctgc ctgaagatta 202104021120212DNA213人工的220
223合成的寡核苷酸40040gacaggtgaa gaggtcaagg 20210412111710212DNA213穀氨酸棒桿菌220
221misc_feature223tatB基因序列40041gaggcgctgc ctgaagatta tgagcgcgtt ccgggcaatg acatcacccc agagcaggca 60
tacaccgaag ctcaccttga cccagctctg caggcagccc tcgatgagtt gagcccagac 120ttccgcgtgg ccgtgatcct gtgtgacgtt gttggtatga gctatgacga aatcgcagag 180accctcggag tgaagatggg taccgtgcgt tcccgtattc accgtggacg cagccagctt 240cgtgcaagtt tggaagctgc agcaatgacc agcgaggaag tttctttgtt ggtcccaacc 300cactaaagct ggtgtgtttt ctgacacgac aaacgcaaat gtcgtgtcat ttttgcagct 360cagtgcatta ttttggggtt cgtggtgcgg acagggaact tatcgcaggc gacatccgtt 420ttgagtagta ggtatcttgg ataagaagtt acccacatcc ttgaaagtcg agacacagga 480ggtcatcgga agatatgttc aattccgaca ccaccgcgaa tctccaagct aaaagtcgag 540atcgtgcagg atctaaagca aagcgcagca ggccaagttt tgattcagta gcgcgggatg 600ttttggatgt tcgaacaaaa acagcacaag ttaaaaacaa ggctaaagag ttttcctctg 660ttgatcacct ttcagcagac gccgcagcca tgtttgtaga caatgaactg tcccgtggcg 720ccatgcatcg cgccaggctg cacattgtgc actgcgctga atgtagggaa gagattaacc 780gtcagcagga aaccgtcgat tatctccgct cagagtgcaa aaacgaagaa gtgtccgccc 840caatggacct caaagcacgg cttgccagcc tcgccactga gtgcatgcct ggccctggcg 900cagagaattt agcaatgcag cgcccagagt cttttgtggc taaagttgag tccgtagtgc 960gcgcagttcg taagaaccaa ggccgctaat ttttaatcct tatttacatt ttctgtgaca1020ttctctgaaa gaccggtctg atgttttcta gcgtgggttg gggagagatc ttcctcttag1080tcgttgtggg ccttgttgtc atcggcccgg aacggttgcc tcgtttgatc caggacgcac1140gcgctgcgct gctcgctgca cgtaccgcta tcgacaatgc aaagcagtcg ttggacagtg1200attttggttc ggaatttgat gaaatccgaa agccactaac ccaggttgca cagtacagcc1260ggatgagccc caagacggcc atcactaagg cgttgtttga taatgattcc tcgttcctgg1320atgactttga tccaaagaag atcatggccg aaggaacaga aggcgaagct cagcgccaca1380agcaggcagc tgacaacaat gcgaatgtgg tggaacgtcc agctgatggt tccaccgcac1440gcccaacgca aaacgatcca aaagacggcc cgaattactc aggcggcgtc tcttggaccg1500atattattta gcttttattt aacgccaagc ccaagcgttt tacccaccag cgataccttg1560cggtgggcta ggtgttcagc gatctcattg atcgctgcag cggttgggga gtgtggttca1620gaaatcgcaa taggatttcc cacatcgcca ccgatacgca ggttcggatc caatggaaca1680gatccgatga ccttgacctc ttcacctgtc 17102104221141212DNA213人工的220
223合成的寡核苷酸,引物40042gtctcttccc ccgcgccatt gtcggcctgg gcggagcctg c 412104321119212DNA213人工的220
223合成的寡核苷酸,引物
40043gacaatggcg cgggggaag 192104421128212DNA213人工的220
223合成的寡核苷酸,引物40044cgctcacatc acggccagcc ctgcttta 282104521139212DNA213人工的220
223引物40045cttcccccgc gccattgtcc gcagtcgcac gtcgcggcg 3921046211117212PRT213穀氨酸棒桿菌220
221MISC_FEATURE223tatA胺基酸序列40046Met Pro Thr Leu Gly Pro Trp Glu Ile Ala Ile Ile Val Leu Leu Ile1 5 10 15Ile Leu Leu Phe Gly Ala Lys Lys Leu Pro Asp Ala Ala Arg Ser Ile20 25 30Gly Arg Ser Met Arg Ile Phe Lys Ser Glu Val Lys Glu Met Asn Lys35 40 45Asp Gly Asp Thr Pro Glu Gln Gln Gln Gln Gln Pro Gln Gln Gln Gln50 55 60Gln Ile Ala Pro Asn Gln Ile Glu Ala Pro Gln Pro Val Gln Gln Pro65 70 75 80Ala Gln Gln Ser Asn Phe Glu Gln His Tyr Gln Gly Gln Gln Val Gln85 90 95Gln Pro Gln Asn Pro Gln Thr Pro Asp Tyr Arg Gln Asn Tyr Glu Asp100 105 110Pro Asn Arg Thr Ser11521047211157212PRT213穀氨酸棒桿菌220
221MISC_FEATURE223tatB胺基酸序列40047
Met Phe Ser Ser Val Gly Trp Gly Glu Ile Phe Leu Leu Val Val Val1 5 10 15Gly Leu Val Val Ile Gly Pro Glu Arg Leu Pro Arg Leu Ile Gln Asp20 25 30Ala Arg Ala Ala Leu Leu Ala Ala Arg Thr Ala Ile Asp Asn Ala Lys35 40 45Gln Ser Leu Asp Ser Asp Phe Gly Ser Glu Phe Asp Glu Ile Arg Lys50 55 60Pro Leu Thr Gln Val Ala Gln Tyr Ser Arg Met Ser Pro Lys Thr Ala65 70 75 80Ile Thr Lys Ala Leu Phe Asp Asn Asp Ser Ser Phe Leu Asp Asp Phe85 90 95Aso Pro Lys Lys Ile Met Ala Glu Gly Thr Glu Gly Glu Ala Gln Arg100 105 110His Lys Gln Ala Ala Asp Asn Asn Ala Asn Val Val Glu Arg Pro Ala115 120 125Asp Gly Ser Thr Ala Arg Pro Thr Gln Asn Asp Pro Lys Asp Gly Pro130 135 140Asn Tyr Ser Gly Gly Val Ser Trp Thr Asp Ile Ile Leu145 150 15521048211225212DNA213穀氨酸棒桿菌220
221misc_feature223tatE基因序列40048atgacgcctg caggtccagc acaattactc attgttgctc ttgtagtaat tgtcctcttt 60ggttctaata agttgcctga tgttgctcgg tccgttggcc gttcgatgcg cattttcaaa 120tctgagatca aagagatgaa caaggatcag atcgaaagct ccgatcagac cttgaagaac 180taaggttcct cgcatctaaa aaaaccgcct gccttctctg tttag 2252104921160212PRT213穀氨酸棒桿菌220
221MISC_FEATURE223tatE胺基酸序列40049Met Thr Pro Ala Gly Pro Ala Gln Leu Leu Ile Val Ala Leu Val Val1 5 10 15Ile Val Leu Phe Gly Ser Asn Lys Leu Pro Asp Val Ala Arg Ser Val20 25 30Gly Arg Ser Met Arg Ile Phe Lys Ser Glu Ile Lys Glu Met Asn Lys35 40 45Asp Gln Ile Glu Ser Ser Asp Gln Thr Leu Lys Asn50 55 60
2105021133212DNA213人工的220
223合成的寡核苷酸,引物,對於FGPK40050cttggggccg aagcccttga cttctttggt cag 332105121133212DNA213人工的220
223合成的寡核苷酸,引物,對於FGPK40051ttcggcccca agttggcgtc cgtcattcca gat 332105221133212DNA213人工的220
223合成的寡核苷酸,引物對於FGPF40052gaaggggccg aagcccttga cttctttggt cag 332105321133212DNA213人工的220
223合成的寡核苷酸,引物對於FGPF40053ttcggcccct tcttggcgtc cgtcattcca gat 332105421133212DNA213人工的220
223合成的寡核苷酸,引物對於FAPF40054gaagggcgcg aagcccttga cttctttggt cag 332105521133212DNA213人工的220
223合成的寡核苷酸, 引物對於FAPF40055ttcgcgccct tcttggcgtc cgtcattcca gat 332105621133212DNA213人工的
220
223合成的寡核苷酸,引物對於FAPY40056gtagggcgcg aagcccttga cttctttggt cag 332105721133212DNA213人工的220
223合成的寡核苷酸,引物對於FAPY40057ttcgcgccct acttggcgtc cgtcattcca gat 332105821133212DNA213人工的220
223合成的寡核苷酸,引物對於AHAY40058gtacgcgtgc gcgcccttga cttctttggt cag 332105921133212DNA213人工的220
223合成的寡核苷酸,引物對於AHAY40059gcgcacgcgt acttggcgtc cgtcattcca gat 332106021133212DNA213人工的220
223合成的寡核苷酸,引物對於AHAL40060caacgcgtgc gcgcccttga cttctttggt cag 332106121133212DNA213人工的220
223合成的寡核苷酸,引物對於AHAL40061gcgcacgcgt tgttggcgtc cgtcattcca gat 332106221133212DNA213人工的220
223合成的寡核苷酸,引物對於AAPF40062gaagggcgcc gcgcccttga cttctttggt cag 33
2106321133212DNA213人工的220
223合成的寡核苷酸,引物對於AAPF40063gcggcgccct tcttggcgtc cgtcattcca gat 332106421133212DNA213人工的220
223合成的寡核苷酸,引物對於AAPY40064gtagggcgcc gcgcccttga cttctttggt cag 332106521133212DNA213人工的220
223合成的寡核苷酸,引物對於AAPY40065gcggcgccct acttggcgtc cgtcattcca gat 332106621133212DNA213人工的220
223合成的寡核苷酸,引物對於AAPM40066catgggcgcc gcgcccttga cttctttggt cag 332106721133212DNA213人工的220
223合成的寡核苷酸,引物對於AAPM40067gcggcgccca tgttggcgtc cgtcattcca gat 3權利要求
1.生產異源蛋白質的方法,其包括培養攜帶表達基因構建體的棒狀桿菌型細菌並通過所述棒狀桿菌型細菌生產並分泌異源蛋白質,所述表達遺傳構建體在5′-端到3′-端方向上含有在棒狀桿菌型細菌中起作用的啟動子序列、編碼Tat系統依賴性信號肽區域的核酸序列和編碼異源蛋白質的核酸序列。
2.根據權利要求1的方法,其中所述信號肽含有SEQ ID NO.31或32所示的序列。
3.根據權利要求1的方法,其中所述信號肽含有SEQ ID NO.28到30中任一個所示的序列。
4.根據權利要求1的方法,其中所述信號肽是異麥芽糖葡聚糖酶的信號肽。
5.根據權利要求4的方法,其中所述異麥芽糖葡聚糖酶的信號肽是含有SEQ ID NO.6所示胺基酸序列的肽。
6.根據權利要求1的方法,其中所述信號肽是三甲胺-N-氧化物還原酶的信號肽。
7.根據權利要求6的方法,其中所述三甲胺-N-氧化物還原酶的信號肽是含有SEQ ID NO.8所示胺基酸序列的肽。
8.根據權利要求1到7中任一項的方法,其中所示異源蛋白質是蛋白-穀氨醯胺酶。
9.根據權利要求1到7中任一項的方法,其中所述異源蛋白質是異麥芽糖葡聚糖酶。
10.根據權利要求1到9中任一項的方法,其中所示棒狀桿菌型細菌是在其中擴增了編碼tat系統分泌元件的一個或多個基因的菌株。
11.根據權利要求10的方法,其中所述編碼tat系統分泌元件的基因選自由tatA、tatB、tatC和tatE組成的組。
全文摘要
本發明提供了通過使用棒狀桿菌型細菌有效地生產工業上有用的蛋白質的方法,更具體的,提供了有效地生產通過常規的蛋白質分泌途徑難以分泌的蛋白質的方法。更具體來說,本發明提供了有效地生產蛋白質的方法,其包括培養含有表達基因構建體的棒狀桿菌型細菌,然後使所述棒狀桿菌型細菌產生並分泌外源蛋白質,所述表達基因構建體在5′-端到3′-端方向上攜帶在棒狀桿菌型細菌中起作用的啟動子序列、編碼Tat系統依賴性信號肽區域的核酸序列和編碼外源蛋白質的核酸序列。
文檔編號C12N15/74GK1973046SQ200580020379
公開日2007年5月30日 申請日期2005年4月20日 優先權日2004年4月20日
發明者伊達雅代, 菊池慶實, 板屋寬, 中村奈巳 申請人:味之素株式會社