用於在真菌細胞中表達基因的啟動子的製作方法
2023-11-06 11:48:32 1
專利名稱:用於在真菌細胞中表達基因的啟動子的製作方法
背景技術:
發明領域本發明涉及製備多肽的方法。本發明還涉及分離的啟動子,以及含有與編碼多肽的核酸序列可操作連接的該啟動子的核酸結構、載體和宿主細胞。
相關領域的描述在真菌宿主細胞,尤其是絲狀真菌細胞例如麴黴屬(Aspergillus)中重組製備異源蛋白質可能為以商業上有意義的量生產蛋白質提供了更為理想的載體(vehicle)。
異源蛋白質的重組製備通過構建如下表達盒來實現,在該表達盒中編碼該蛋白質的DNA被置於適用於該宿主細胞的從被調節的基因中切下的啟動子的表達控制之下。通常通過質粒介導的轉化,將該表達盒導入該宿主細胞中。然後在該表達盒所含啟動子正常發揮功能所需的誘導條件下,通過培養該轉化宿主細胞實現該異源蛋白質的產生。
開發用於蛋白質重組製備的新真菌宿主細胞通常要獲得適於在該宿主細胞中控制蛋白質表達的啟動子。已經顯示,Fusarium venenatum可以作為一種新的宿主細胞用於該類表達(WO 96/00787,WO 97/26330)。而且,對於在Fusarium venenatum宿主細胞中表達異源基因有用的來自尖鐮孢(Fusarium oxysporum)胰蛋白酶樣蛋白酶基因的啟動子,也已有過描述(US 5,837,847)。
然而,在本領域中仍然需要用於控制異源基因表達的新啟動子。
本發明的目的是,提供用於在真菌宿主細胞中製備多肽的改良方法和用於該製備的新啟動子。
發明概述本發明涉及製備多肽的方法,包括(a)在有利於產生該多肽的培養基中培養真菌宿主細胞,其中該真菌宿主細胞含有編碼該多肽的第一核酸序列和與該第一核酸序列可操作地連接的、含有與第一核酸序列異源的啟動子的第二核酸序列,其中該啟動子含有選自下組的序列SEQ IDNO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ IDNO.3的第1-3060位核苷酸,及其子序列;和它們的突變、雜合及串聯啟動子;和(b)從該培養基分離該多肽。
本發明還涉及分離的啟動子序列,以及含有與編碼多肽的核酸序列可操作連接的一或多個該啟動子的結構、載體和真菌宿主細胞。
本發明還涉及獲得SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸的突變啟動子的方法。
本發明還涉及分離的核酸序列,其選自(a)編碼具有如下胺基酸序列的多肽的核酸序列,該胺基酸序列與SEQ ID NO.4第22-581位胺基酸有至少65%的一致性、與SEQ ID NO.5第19-200位胺基酸有至少65%的一致性、或與SEQ ID NO.6第1-187位胺基酸有至少65%的一致性;(b)與SEQ ID NO.1第4013-5743位核苷酸有至少65%的同源性、與SEQ ID NO.2第993-1593位核苷酸有至少65%的同源性、或與SEQ IDNO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)在極低、低、中等、中高、高或極高嚴緊條件下與以下序列雜交的核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100個核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互補鏈;(d)編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之胺基酸序列的多肽的變體的核酸序列,其中所述變體包含一或多個胺基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位變體;和(f)(a)、(b)、(c)或(e)的子序列。
本發明還涉及具有這些核酸序列的結構、載體、和重組宿主細胞。
附圖簡述
圖1A-F顯示Fusarium venenatum葡糖澱粉酶基因的基因組DNA序列和推導的胺基酸序列(分別是SEQ ID NOs.1和4)。
圖2A-C顯示命名為「Daria」的Fusarium venenatum基因的基因組DNA序列和推導的胺基酸序列(分別是SEQ ID NOs.2和5)。
圖3A-D顯示命名為「Quinn」的Fusarium venenatum基因的基因組DNA序列和推導的胺基酸序列(分別是SEQ ID NOs.3和6)。
圖4顯示pDM181的限制性圖譜。
圖5顯示pSheB1的限制性圖譜。
圖6顯示pDM194的限制性圖譜。
圖7顯示pJRoy35的限制性圖譜。
圖8顯示pDM218的限制性圖譜。
圖9顯示pEJG25A的限制性圖譜。
圖10顯示pMWR60的限制性圖譜。
圖11顯示pRaMB62的限制性圖譜。
圖12顯示pRaMB64的限制性圖譜。
圖13顯示pRaMB66的限制性圖譜。
圖14顯示在Fusarium Venenatum中處於Fusarium venenatum澱粉葡糖苷酶(pAMG)啟動子和尖鐮孢胰蛋白酶(pSP387)啟動子控制下的Humicola lanuginosa脂酶報導基因表達的比較。
發明詳述本發明涉及製備多肽的方法,包括(a)在有利於產生該多肽的培養基中培養真菌宿主細胞,其中該真菌宿主細胞含有編碼該多肽的第一核酸序列和與該第一核酸序列可操作地連接的、含有與第一核酸序列異源的啟動子的第二核酸序列,其中該啟動子含有選自下組的序列SEQ IDNO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它們的突變、雜合及串聯啟動子;和(b)從該培養基分離該多肽。
在本發明的製備方法中,採用本領域已知的方法在適於所述多肽產生的營養培養基中培養所述細胞。例如,可以在適當培養基中、在允許該多肽表達和/或分離的條件下通過搖瓶培養、實驗室或工業發酵罐中的小規模或大規模發酵(包括連續、批式、補料分批或固態發酵),來培養該細胞。該培養在含有碳和氮源以及無機鹽的適合營養培養基中採用本領域已知的程序進行。適合的培養基可從商業廠家獲得,也可根據(如美國典型培養物保藏中心目錄中的)公開的組成製備。如果該多肽分泌至營養培養基中,則可以直接從該培養基中回收該多肽。如果該多肽是不分泌的,則可以從細胞裂解物中進行回收。
該多肽可採用特異針對該多肽的本領域已知方法來檢測。這些檢測方法可以包括特異性抗體的使用、酶產物的形成、或酶底物消失。
所獲得的多肽可通過本領域已知的方法回收。例如,可通過傳統方法,包括但不限於離心、過濾、提取、噴霧乾燥、蒸發或沉澱,從營養培養基中回收所述多肽。
該多肽可以通過本領域已知的多種方法來純化,這些方法包括但不限於層析(如離子交換、親和、疏水、層析聚焦和大小排阻層析)、電泳方法(如製備型等電聚焦)、差異溶解度(如硫酸銨沉澱)、SDS-PAGE或抽提(見例如,蛋白質純化(Protein Purification),J.-C.Janson和Lars Ryden編著,VCH Publishers,紐約,1989)。啟動子術語「啟動子」在本文中定義為結合RNA聚合酶並指導該聚合酶到達編碼多肽的核酸序列的正確下遊轉錄起始位點以起始轉錄的DNA序列。RNA聚合酶有效地催化與編碼區適當DNA鏈互補的信使RNA的組裝。術語「啟動子」也應理解為包括在轉錄成mRNA之後用於翻譯的(啟動子和翻譯起始位點之間的)5』非編碼區、順式作用轉錄控制元件例如增強子、和其它能夠與轉錄因子相互作用的核苷酸序列。
術語「突變啟動子」在本文中定義為具有其中含有一或多個核苷酸替代、缺失和/或插入的親本啟動子核苷酸序列的啟動子,其中該突變啟動子比相應的親本啟動子具有較強或較弱的啟動子活性。術語「突變啟動子」也將包括自然變體,和採用經典誘變、定點誘變和DNA改組等本領域熟知的方法獲得的體外製備變體。
術語「雜合啟動子」在本文中定義為兩個或多個啟動子的部分,它們融合在一起形成兩個或更多個啟動子的融合物序列,該序列與編碼序列可操作地連接並介導該編碼序列轉錄成mRNA。
術語「串聯啟動子」在本文中定義為每一個均與一個編碼序列可操作地連接並介導該編碼序列轉錄成mRNA的兩個或多個啟動子序列。
術語「可操作地連接」在本文中定義為一種如下構象,在該構象中控制序列例如啟動子序列被適當地置於相對於編碼序列的一個位置上,以致該控制序列指導該編碼序列所編碼的多肽的產生。
術語「編碼序列」在本文中定義為當被置於適當控制序列的控制之下時,可以轉錄為能翻譯成多肽的mRNA的核酸序列。編碼序列的邊界一般由mRNA 5』端剛好位於該開放閱讀框上遊的ATG起始密碼子,和mRNA 3』端剛好位於該開放閱讀框下遊的轉錄終止序列來確定。編碼序列可以包括,但不限於基因組DNA、cDNA、半合成的、合成的、和重組的核酸序列。
在一個優選的實施方案中,所述啟動子具有SEQ ID NO.1第1-3949位核苷酸的核酸序列,或其子序列。該子序列優選含有至少大約2100個核苷酸,更優選至少大約2400個核苷酸,最優選至少大約2700個核苷酸。
在另一個優選實施方案中,所述啟動子具有SEQ ID NO.2第1-938位核苷酸的核酸序列,或其子序列。該子序列優選含有至少大約840個核苷酸,更優選至少大約870個核苷酸,最優選至少大約900個核苷酸。
在另一個優選實施方案中,所述啟動子具有SEQ ID NO.3第1-3060位核苷酸的核酸序列,或其子序列。該子序列優選含有至少大約2100個核苷酸,更優選至少大約2400個核苷酸,最優選至少大約2700個核苷酸。
在另一個優選實施方案中,所述啟動子是大腸桿菌(Escherichia coli)NRRL B-30067中的質粒pECO3所包含的核酸序列。在另一個優選實施方案中,該啟動子是大腸桿菌NRRL B-30071中的質粒pFAMG所包含的核酸序列。在另一個優選實施方案中,該啟動子是大腸桿菌NRRL B-30075中的質粒pQUINN所包含的核酸。
在本發明的方法中,所述啟動子還可以是在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸、或SEQ ID NO.3第1-3060位核苷酸的核酸序列中含有一或多個核苷酸替代、缺失、和/或插入的上述啟動子的突變體。
突變啟動子可以含有一或多個突變。每個突變均是獨立的核苷酸替代、缺失和/或插入。可以採用本領域已知的任何方法,例如經典誘變、定點誘變或DNA改組來實現向所述啟動子中引入核苷酸替代、缺失和/或插入。尤其有用的一種方法是利用帶有目的插入片段的超螺旋雙鏈DNA載體和兩個含有期望突變的合成引物來進行的。該寡核苷酸引物每一個均與該載體的相反鏈互補,在溫度循環中通過pfu DNA聚合物的作用延伸。一旦這兩個引物摻入後,就產生含有交錯切口的突變質粒。在溫度循環後,用對於甲基化和半甲基化DNA特異的DpnI處理該產物,以消化親本DNA模板並選出含有突變的合成DNA。也可以採用本領域已知的其它方法。
在一個優選實施方案中,所述啟動子是SEQ ID NO.1第1-3949位核苷酸的突變體。在另一個優選實施方案中,所述啟動子是SEQ ID NO.2第1-938位核苷酸的突變體。在另一個優選實施方案中,所述啟動子是SEQ ID NO.3第1-3060位核苷酸的突變體。
在本發明的方法中,所述啟動子還可以是雜合啟動子,其含有一或多個本發明啟動子的部分;一個本發明啟動子的部分和另一個啟動子的部分,例如一個啟動子的前導序列和來自另一個啟動子的轉錄起始位點;或一或多個本發明啟動子的部分和一或多個其它啟動子的部分。所述其它啟動子可以是在所選真菌宿主細胞中表現出轉錄活性的任何啟動子序列,包括突變的、截短的和雜合的啟動子,並且可以從編碼與該宿主細胞同源或異源的細胞外或細胞內多肽的基因獲得。該其它啟動子對於編碼所述多肽的核酸序列而言可以是自身的或外來的,並且對於該細胞而言也可以是自身的或外來的。
用於和本發明的啟動子一起構建雜合啟動子的其它啟動子的例子包括從米麴黴(Aspergillus oryzae)TAKA澱粉酶、Rhizomucor miehei天冬氨酸蛋白酶、黑麴黴(Aspergillus niger)中性α-澱粉酶、黑麴黴酸穩定性α-澱粉酶、黑麴黴或泡盛麴黴(Aspergillus awamori)葡糖澱粉酶(glaA)、Rhizomucor miehei脂肪酶、米麴黴鹼性蛋白酶、米麴黴丙糖磷酸異構酶、構巢麴黴(Aspergillus nidulans)乙醯胺酶和尖鐮孢胰蛋白酶樣蛋白酶(WO 96/00787)的基因獲得的啟動子,以及NA2-tpi啟動子(黑麴黴中性α-澱粉酶和米麴黴丙糖磷酸異構酶的基因啟動子的雜合物),和從釀酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)和釀酒酵母3-磷酸甘油酸激酶的基因獲得的啟動子,及這些啟動子的突變的、截短的和雜合的啟動子。用於酵母宿主細胞的其它有用啟動子描述於Romanos等,1992,酵母(Yeast)8423-488。
所述啟動子還可以是含有兩個或多個本發明啟動子或者是含有一或多個本發明啟動子和一或多個諸如以上所例舉的其它啟動子的串聯啟動子。該串聯啟動子的兩個或多個啟動子序列可以同時啟動所述核酸序列的轉錄。或者,該串聯啟動子的一或多個啟動子序列可以在細胞生長的不同階段啟動所述核酸序列的轉錄。
在本發明的方法中,該啟動子對於編碼目的多肽的核酸序列而言是異源的,但該啟動子或核酸序列對於該真菌宿主細胞而言可以是天然的。即使野生型啟動子對於編碼多肽的核酸序列而言是自身的,本發明的突變、雜合、或串聯啟動子也應理解為與該核酸序列異源。
本發明的突變、雜合或串聯啟動子具有SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸啟動子的啟動子活性的至少大約20%、優選至少大約40%、更優選至少大約60%、更優選至少大約80%、更優選至少大約90%、更優選至少大約100%、甚至更優選至少大約200%、最優選至少大約300%、甚至最優選至少大約400%。編碼多肽的核酸序列由所述核酸序列編碼的多肽對於目的真菌宿主細胞而言可以是自身的或異源的。
術語「多肽」在此並非旨在指特定長度的編碼產物,因此包括肽、寡肽和蛋白質。術語「異源多肽」在本文中定義為非該真菌細胞天然的多肽,已經過修飾改變了天然序列的天然多肽,或其表達由於重組DNA技術對宿主細胞的操作而在數量上改變的天然多肽。例如,天然多肽可以通過例如將編碼該多肽的基因置於本發明的啟動子控制之下重組產生以增強該多肽的表達、藉助信號序列促進目的天然多肽向細胞外運輸,和增加編碼細胞正常所產生的該多肽的基因的拷貝數。該真菌細胞可以含有一或多個拷貝的編碼該多肽的核酸序列。
優選地,該多肽是激素或其變體、酶、受體或其部分、抗體或其部分、或報導分子。在一個優選的實施方案中,該多肽是向細胞外分泌的。在一個更優選的實施方案中,該多肽是氧化還原酶、轉移酶、水解酶、裂合酶、異構酶或連接酶。在一個甚至更優選的實施方案中,該多肽是氨肽酶、澱粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖澱粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、轉化酶(invertase)、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果膠溶酶、過氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、穀氨醯胺轉移酶(transglutaminase)或木聚糖酶。
編碼目的多肽的核酸序列可以從任何原核、真核或其它來源獲得。為了本發明的目的,本文中與給定來源相連使用的術語「獲自」是指該多肽是由該來源或已插入了該來源的基因的細胞產生的。
用於分離或克隆編碼目的多肽的核酸序列的技術是本領域已知的,包括從基因組DNA分離,從cDNA製備,或它們的組合。從該基因組DNA克隆該核酸序列可以通過例如採用熟知的聚合酶鏈式反應(PCR)來實現。見例如,Innis等,1990,PCR操作方法和應用指南(PCR ProtocolsAGuide to Methods and Application),Academic Press,紐約。該克隆方法可能包括切割和分離含有編碼該多肽的核酸序列的期望核酸片段,將該片段插入載體分子中,並將該重組載體摻入可以複製出多個拷貝或克隆的該核酸序列的突變真菌細胞中。該核酸序列可以是基因組、cDNA、RNA、半合成、合成來源的或它們的任意組合。
在本發明方法中,所述多肽還可以包括其中在該多肽或其片段的N端或C端融合了另一個多肽的融合或雜合多肽。融合多肽是通過將編碼一個多肽的核酸序列(或其部分)與編碼另一個多肽的核酸序列(或其部分)融合在一起產生的。產生融合多肽的技術是本領域已知的,包括連接編碼這些多肽的編碼序列以使它們符合閱讀框,並且使該融合多肽的表達處於相同的一個或多個啟動子和相同的終止子的控制之下。所述雜合多肽可以含有從至少兩個不同多肽獲得的部分或完整多肽序列的組合,其中的一或多個多肽對於該突變真菌細胞可以是異源的。核酸結構本發明還涉及含有與本發明的啟動子和一個或多個控制序列可操作地連接的編碼多肽的核酸序列的核酸結構,其中所述控制序列可在適合的宿主細胞中在與該控制序列相容的條件下指導該編碼序列的表達。表達將理解為包括多肽產生所涉及到的任何步驟,包括但不限於轉錄、轉錄後修飾、翻譯、翻譯後修飾和分泌。
「核酸結構」在本文中定義為單鏈或雙鏈核酸分子,該核酸分子可以是從天然存在的基因分離的,或是已被修飾而含有以天然不存在的方式組合和並置在一起的核酸片段。當核酸結構含有編碼序列以及表達該編碼序列所必需的所有控制序列時,術語核酸結構與術語表達盒同義。
可以通過多種方式進一步操作編碼多肽的分離核酸序列,以為該多肽的表達作準備。依據表達載體,在核酸序列插入載體之前對其進行操作可能是期望的或是必需的。利用重組DNA方法修飾核酸序列的技術是本領域熟知的。
在本發明的方法中,核酸序列可以含有一個或多個天然控制序列,或可以用該核酸序列外源的一或多個控制序列來取代該一個或多個天然控制序列,以改善編碼序列在宿主細胞中的表達。
術語「控制序列」在本文中定義為包括所有對本發明多肽的表達而言必需或有利的成分。每個控制序列對於編碼該多肽的核酸序列而言可以是自身的或是外源的。這些控制序列包括但不限於前導序列、聚腺苷酸化序列、前肽序列、本發明的啟動子、信號肽序列和轉錄終止子。最少地,控制序列包括本發明的啟動子,以及轉錄和翻譯終止信號。控制序列可與接頭一起提供,以便引入特異的限制性位點,便於控制序列與編碼多肽的核酸序列編碼區連接。
控制序列可以是適合的轉錄終止子序列,即被宿主細胞識別以終止轉錄的序列。終止子序列與編碼所述多肽的核酸序列的3』末端可操作地連接。任何在所選宿主細胞中起作用的終止子都可用於本發明。
用於絲狀真菌宿主細胞的優選終止子可獲自米麴黴TAKA澱粉酶、黑麴黴葡糖澱粉酶、構巢麴黴鄰氨基苯甲酸合成酶、黑麴黴α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶的基因。
用於酵母宿主細胞的優選終止子可獲自釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYC1)和釀酒酵母甘油醛-3-磷酸脫氫酶的基因。用於酵母宿主細胞的其它有用的終止子描述於Romanos等,1992,同上。
控制序列也可以是適當的前導序列,即一種對宿主細胞翻譯重要的mRNA非翻譯區。前導序列與編碼所述多肽的核酸序列的5』端可操作地連接。任何在所選宿主細胞中有功能的前導序列都可用於本發明。
用於絲狀真菌宿主細胞的優選前導序列可從米麴黴TAKA澱粉酶和構巢麴黴丙糖磷酸異構酶的基因獲得。
適用於酵母宿主細胞的前導序列可從釀酒酵母烯醇化酶(ENO-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α-因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)的基因獲得。
控制序列也可以是聚腺苷酸化序列,即一種與所述核酸序列3』末端可操作地連接的、轉錄時被宿主細胞作為向轉錄的mRNA添加聚腺苷酸殘基(polyadenosine residues)的信號而識別的序列。任何在所選宿主細胞中有作用的聚腺苷酸化序列均可用於本發明。
用於絲狀真菌宿主細胞的優選聚腺苷酸化序列可從米麴黴TAKA澱粉酶、黑麴黴葡糖澱粉酶、構巢麴黴鄰氨基苯甲酸合成酶、尖鐮孢胰蛋白酶樣蛋白酶和黑麴黴α-葡糖苷酶的基因獲得。
用於酵母宿主細胞的有用聚腺苷酸化序列描述於Guo和Sherman,1995,分子細胞生物學(Molecular Cellular Biology)155983-5990。
控制序列還可以是編碼與多肽氨基末端連接的胺基酸序列、並指導該編碼多肽進入細胞分泌途徑的信號肽編碼區。所述核酸序列編碼區的5』末端本身可含有在翻譯閱讀框中天然與編碼該分泌多肽的編碼區片段連接的信號肽編碼區。或者,編碼序列的5』末端可含有對該編碼序列而言外源的信號肽編碼區。在編碼序列並不天然含有信號肽編碼區的時候可能需要外源信號肽編碼區。或者,為了增強多肽的分泌,可以簡單地用外源信號肽編碼區替代天然信號肽編碼區。然而,任何指導表達多肽進入所選宿主細胞分泌途徑的信號肽編碼區均可用於本發明。
用於絲狀真菌宿主細胞的有效信號肽編碼區是從米麴黴TAKA澱粉酶、黑麴黴中性澱粉酶、黑麴黴葡糖澱粉酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicola insolens纖維素酶和Humicola lanuginosa脂肪酶的基因獲得的信號肽編碼區。
用於酵母宿主細胞的有用信號肽可從釀酒酵母α-因子和釀酒酵母轉化酶(invertase)的基因獲得。其它有用的信號肽編碼區描述於Romanos等,1992,同上。
控制序列還可以是編碼位於多肽氨基端的胺基酸序列的前肽編碼區。所獲得的多肽被稱為酶原(proenzyme)和多肽原(有時也叫酶原(zymogen))。多肽原通常是無活性的,但能通過前肽的催化切割或自身催化切割從多肽原轉化成成熟活性多肽。前肽編碼區可從枯草芽孢桿菌(Bacillus subtilis)鹼性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α-因子、Rhizomucor miehei天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO 95/33836)的基因獲得。
當多肽的氨基端同時存在信號肽和前肽區時,前肽區緊接位於多肽的氨基端,而信號肽區緊接位於前肽區的氨基端。
也可以期望加入允許相對於宿主細胞生長調節所述多肽表達的調節序列。調節系統的例子是那些使基因表達響應化學或物理刺激包括調節化合物的存在而打開或關閉的系統。原核系統中的調節系統包括lac、tac和trp操縱子系統。在酵母中,可以使用ADH2系統或GAL1系統。在絲狀真菌中,可以使用TAKAα-澱粉酶啟動子、黑麴黴葡糖澱粉酶啟動子和米麴黴葡糖澱粉酶啟動子作為調節序列。調節序列的其它例子是那些允許基因擴增的序列。在真核系統中,這些包括在氨甲蝶呤存在時擴增的二氫葉酸還原酶基因和在重金屬存在時擴增的金屬硫蛋白基因。在這些情況中,編碼所述多肽的核酸序列將與調節序列可操作地連接。
本發明還涉及用於改變編碼多肽的宿主細胞內源性基因的表達的核酸結構。這些結構可以含有改變該內源基因表達所必需的最少成分。在一個實施方案中,這些核酸結構優選含有(a)導向序列,(b)本發明的啟動子,(c)外顯子,和(d)剪接供體位點。一旦該核酸結構導入細胞後,該結構即通過同源重組在內源基因位點插入細胞的基因組中。導向序列指導元件(a)-(d)整合至內源基因中,以使元件(b)-(d)與該內源基因可操作地連接。在另一個實施方案中,這些核酸結構含有(a)導向序列,(b)本發明的啟動子,(c)外顯子,(d)剪接供體位點,(e)內含子,和(f)剪接受體位點,其中該導向序列指導元件(a)-(f)的整合,以使元件(b)-(f)與內源基因可操作地連接。然而,這些結構還可以含有其它成分如選擇標記。
在這兩個實施方案中,這些成分的引入導致產生了改變內源基因表達的新轉錄單元。大體上,此新轉錄單元是通過這些導向結構引入的序列和內源基因的融合產物。在一個改變內源基因的實施方案中,該基因被激活。在該實施方案中,採用同源重組,通過插入使內源基因以比在相應的親本細胞中更高的水平表達的調節序列,替代、破壞或失效正常與親代細胞的該內源基因有關的調節區。採用本領域熟知的方法(見例如,美國專利5,641,670),通過在該結構中包含可擴增的選擇標記基因,可以進一步擴增該激活的基因。在另一個改變內源基因的實施方案中,該基因的表達被降低。
所述導向序列可位於所述內源基因內,緊鄰該基因,在上遊基因內,或在該內源基因的上遊並相隔一段距離。可使用一個或多個導向序列。例如,環狀質粒或DNA片段優選使用單個導向序列,而線性質粒或DNA片段優選使用兩個導向序列。
這些結構還含有所述內源基因的一個或多個外顯子。外顯子定義為可以被複製成RNA並在成熟mRNA分子中存在以致該外顯子序列與該內源基因的編碼區在閱讀框上相符合的DNA序列。外顯子可以任選地含有編碼一個或多個胺基酸和/或部分編碼胺基酸的DNA。另一種情況是,外顯子含有相應於5』非編碼區的DNA。當一個或多個外源外顯子編碼一個或多個胺基酸和/或部分編碼胺基酸時,設計該核酸結構,使得在轉錄和剪接後,該閱讀框與內源基因的編碼區在閱讀框上相符合,以便來自第二外顯子的mRNA部分的適當閱讀框不改變。
這些結構的剪接供體位點指導一個外顯子向另一個外顯子的剪接。典型地,第一外顯子位於第二外顯子的5』,而位於第一外顯子3』側翼並與之重疊的剪接供體位點識別位於第二外顯子5』側翼的剪接受體位點。象剪接供體位點一樣,剪接受體位點也是指導一個外顯子向另一個外顯子剪接的序列。剪接裝置聯合剪接供體位點一起作用,使用剪接受體位點實現內含子的去除。
本發明還涉及製備多肽的方法,包括(a)在有益於產生該多肽的條件下,培養其中已摻入了如下新轉錄單元的同源重組細胞,該新轉錄單元含有與編碼該多肽的內源核酸序列第二外顯子可操作地連接的本發明啟動子、外顯子和/或剪接供體位點;和(b)回收該多肽。該方法基於基因激活技術的使用,例如美國專利5,641,670所描述的技術。表達載體本發明還涉及包含本發明啟動子、編碼多肽的核酸序列以及轉錄和翻譯終止信號的重組表達載體。可將以上描述的各種核酸和控制序列連接在一起,產生可包括一個或多個方便的限制性位點以允許該啟動子和編碼多肽的核酸序列在這些位點插入或替代的重組表達載體。或者,可以通過將該核酸序列或含有該啟動子和/或序列的核酸結構插入適當的表達載體中來表達該核酸序列。在建立該表達載體時,將該編碼序列定位於該載體中,使得該編碼序列與本發明的啟動子和一或多個適當的表達控制序列可操作地連接。
重組表達載體可以是任何能方便地用於重組DNA程序並能使所述核酸序列表達的載體(如質粒或病毒)。典型地,載體的選擇取決於載體和載體將要導入的宿主細胞之間的相容性。該載體可以是線性或閉合環狀質粒。
該載體可以是自主複製型載體,即作為染色體外實體而存在、其複製獨立於染色體複製的載體,如質粒、染色體外因子、微型染色體或人工染色體。該載體可以含有任何保證自我複製的序列。或者,該載體可以是當導入宿主細胞後整合在基因組中並和它所整合的染色體一起複製的載體。而且,可使用單個載體或質粒,或一起含有待導入宿主細胞基因組的全部DNA的兩個或多個載體或質粒,或轉座子。
本發明的載體優選含有一個或多個允許方便地選擇轉化細胞的選擇標記。選擇標記是其產物提供殺生物劑或病毒抗性、重金屬抗性、相對營養缺陷型的原養型等的基因。用於酵母宿主細胞的適當標記是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用於絲狀真菌宿主細胞的選擇標記包括但不限於amdS(乙醯胺酶)、argB(鳥氨酸氨甲醯基轉移酶)、bar(膦絲菌素乙醯基轉移酶(phosphinothricin acetyltransferase))、hygB(潮黴素磷酸轉移酶)、niaD(硝酸還原酶)、pyrG(乳清酸核苷-5』-磷酸脫羧酶)、sC(硫酸腺苷醯轉移酶(sulfate adenyltransferase))、trpC(鄰氨基苯甲酸合成酶),以及它們的等同物。優選用於麴黴屬細胞的是構巢麴黴或米麴黴的amdS和pyrG基因以及吸水鏈黴菌(Streptomyces hygroscopicus)的bar基因。
本發明的載體優選包含允許該載體穩定整合至宿主細胞基因組中或允許該載體在該細胞中獨立於基因組而自主複製的一個或多個元件。
為了整合至宿主細胞基因組中,該載體可以依賴於編碼所述多肽的核酸序列或用於使該載體通過同源或非同源重組穩定整合至基因組中的任何其它載體元件。或者,該載體可含有用於通過同源重組指導向宿主細胞基因組中整合的額外核酸序列。這些額外核酸序列使得該載體可以在一條或多條染色體的一個或多個精確位置整合至宿主細胞基因組中。為了增加在精確位置整合的可能性,整合元件應優選含有足夠數目的與相應靶序列同源的核酸,如100-1,500個鹼基對,優選400-1,500個鹼基對,最優選800-1,500個鹼基對,以增強同源重組的可能性。整合元件可以是任何與宿主細胞基因組中的靶序列同源的序列。而且,該整合元件可以是非編碼或編碼核酸序列。另一方面,該載體可以通過非同源重組整合至宿主細胞的基因組中。
為了自主複製,該載體可進一步包含使載體能在所述宿主細胞中自主複製的複製起點。用於酵母宿主細胞中的複製起點的例子是2μ複製起點、ARS1、ARS4、ARS1和CEN3的組合以及ARS4和CEN6的組合。複製起點可以是含有使該複製起點功能在宿主細胞中具有溫度敏感性的突變的複製起點(見例如,Ehrlich,1978,美國國家科學院院刊(Proceedingsof the National Academy of Sciences USA)751433)。
可在宿主細胞中插入一個拷貝以上的編碼多肽的核酸序列,以增加基因產物的產量。該核酸序列拷貝數的增加可通過如下方法獲得在宿主細胞基因組中至少再整合一個額外拷貝的該序列;或在細胞中包括帶有該核酸序列的可擴增選擇標記基因,在適當選擇劑存在時培養這些細胞,能夠選出含有擴增拷貝的選擇標記基因、因此也含有額外拷貝的該核酸序列的細胞。
用於連接上述元件以構建本發明的重組表達載體的程序是本領域技術人員熟知的(見例如,Sambrook等,1989,同上)。宿主細胞本發明還涉及含有與編碼多肽的核酸序列可操作地連接的本發明啟動子的重組宿主細胞,這些細胞可以有利地用於該多肽的重組製備。將含有與編碼多肽的核酸序列可操作地連接的本發明啟動子的載體導入宿主細胞,以使該載體作為前面描述的染色體整合體或自我複製的染色體外載體而存在。術語「宿主細胞」包括任何由於複製過程中發生的突變而與親代細胞不同的親代細胞後代。宿主細胞的選擇在很大程度上取決於編碼所述多肽的基因及其來源。
宿主細胞可以是任何在本發明方法中有用的真菌細胞。本文所用「真菌」包括phyla Ascomycota,Basidiomycota,Chytridiomycota和Zygomycota(定義在Hawksworth等,Ainsworth and Bisby’s Dictionaryof The Fungi,第8版,1995,CAB International,University Press,Cabridge,UK中)和以及Oomycota(見Hawksworth等,1995,同上,第171頁)和所有有絲分裂孢子真菌(Hawksworth等,1995,見上)。
在一個優選的實施方案中,該真菌宿主細胞是酵母細胞。這裡所用「酵母」包括產子囊酵母(內孢黴目(Endomycetales))、產擔孢子(basidiosporogenous)酵母和屬於半知菌類(Fungi Imperfecti)(芽孢綱(Blastomycetes))的酵母。因為酵母的分類將來可能改變,為了本發明的目的,酵母應按《酵母的生物學和活動》(Biology and Activitiesof Yeast)(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.編著,Soc.App.Bacteriol.Symposium Series No.9,1980)中的描述來定義。
在一個更優選的實施方案中,酵母宿主細胞是假絲酵母屬(Candida)、漢遜酵母屬(Hansenula)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或Yarrowia細胞。
在一個最優選的實施方案中,該酵母宿主細胞是卡爾酵母(Saccharomyces carlsbergensis)、釀酒酵母、糖化酵母(Saccharomycesdiastaticus)、Saccharomyces douglasii、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomyces norbensis)或Saccharomycesoviformis細胞。在另一個最優選的實施方案中,該酵母宿主細胞是乳酸克魯維酵母(Kluyveromyces lactis)細胞。在另一個最優選的實施方案中,酵母宿主細胞是Yarrowia lipolytica細胞。
在另一個優選實施方案中,該真菌宿主細胞是絲狀真菌細胞。「絲狀真菌」包括真菌門(Eumycota)和Oomycota的所有絲狀類型(正如Hawksworth等,1995,見上,所定義的)。絲狀真菌的特徵在於由幾丁質、纖維素、葡聚糖、脫乙醯殼多糖、甘露聚糖和其它複合多糖構成的菌絲體壁。營養生長是通過菌絲延長來進行的,碳代謝為專性需氧的。相反,酵母如釀酒酵母的營養生長是通過單細胞菌體的出芽來進行的,而且碳代謝可以通過發酵進行。
在一個更優選的實施方案中,該絲狀真菌宿主細胞是但不限於Acremonium、麴黴屬(Aspergillus)、鐮孢黴屬(Fusarium)、腐質黴屬(Humicola)、毛黴屬(Mucor)、毀絲黴屬(Myceliophthora)、脈孢菌屬(Neurospora)、青黴屬(Penicillium)、梭孢殼屬(Thielavia)、Tolypocladium或木黴屬(Trichoderma)的種的細胞。
在一個最優選的實施方案中,該絲狀真菌宿主細胞是泡盛麴黴(Aspergillus awamori)、臭麴黴(Aspergillus foetidus)、日本麴黴(Aspergillus japonicus)、構巢麴黴(Aspergillus nidulans)、黑麴黴(Aspergillus niger)或米麴黴(Aspergillus oryzae)細胞。在另一個最優選的實施方案中,該絲狀真菌宿主細胞是杆孢狀鐮孢(Fusariumbactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀鐮孢(Fusarium culmorum)、禾本科鐮孢(Fusarium graminearum)、禾赤鐮孢(Fusarium graminum)、異孢鐮孢(Fusarium heterosporum)、合歡木鐮孢(Fusarium negundi)、尖鐮孢、多枝鐮孢(Fusarium reticularum)、粉紅鐮孢(Fusarium roseum)、接骨木鐮孢(Fusarium sambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬分枝孢鐮孢(Fusariumsporotrichioides)、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum細胞。在另一個最優選的實施方案中,該絲狀真菌宿主細胞是Humicola insolens、Humicolalanuginosa、米黑毛黴(Mucor miehei)、Myceliophthora thermophila、粗糙脈孢菌(Neurospora crassa)、產紫青黴(Penicilliumpurpurogenum)、Thielavia terrestris、Trichoderma harzianum、康寧木黴(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或綠色木黴(Trichodeerma viride)細胞。
在一個甚至最優選的實施方案中,Fusarium venenatum細胞是最初作為禾本科鐮孢(Fusarium graminearum)ATCC 20334保藏,最近由Yoder與Christianson(1998,真菌遺傳學和生物學(Fungal Genetics andBiology)2362-80)和O』Donnell等(1998,真菌遺傳學和生物學2357-67)重新劃分為Fusarium venenatum的Fusarium venenatum A3/5;以及Fusarium venenatum的分類學等同物,而無論它們目前被稱為何種種名。在另一個優選實施方案中,正如WO 97/26330中所公開的,Fusariumvenenatum細胞是Fusarium venenatum A3/5或Fusarium venenatum ATCC20334的形態學突變體。
可以通過涉及原生質體形成、原生質體轉化和細胞壁再生的方法以本質上已知的方式來轉化真菌細胞。用於轉化麴黴屬宿主細胞的適當程序描述於EP 238 023和Yelton等,1984,美國國家科學院院刊811470-1474。用於轉化鐮孢黴屬的種的適當方法描述於Malardier等,1989,基因(Gene)78147-156和WO 96/00787。酵母的轉化可採用Becker和Guarente,由Abelson,J.N.和Simon,M.I.編,酵母遺傳學和分子生物學指南(Guide to Yeast Genetics and Molecular Biology),酶學方法(Methods in Enzymology),第194卷,第182-187頁,Academic Press,Inc.,紐約;Ito等,1983,細菌學雜誌(Journal of Bacteriology)153163;和Hinnen等,1978,美國國家科學院院刊751920中描述方法來進行。獲得突變啟動子的方法本發明還涉及獲得突變啟動子的方法,包括(a)在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的序列中引入至少一個突變,其中該突變啟動子具有啟動子活性;和(b)分離該突變啟動子。
本發明還涉及通過以下步驟獲得突變啟動子的方法(a)在極低、低、中等、中高、高或極高的嚴緊條件下使DNA與(i)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3,(ii)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互補鏈雜交;和(b)從該DNA中分離出該突變啟動子。本文中對嚴緊性和洗滌條件作了定義。
該突變啟動子可以採用本領域已知的方法例如限制性酶消化或PCR擴增來分離。核酸序列本發明還涉及選自下組的分離核酸序列(a)編碼具有如下胺基酸序列的多肽的核酸序列,該胺基酸序列與SEQID NO.4第22-581位胺基酸有至少65%的一致性、與SEQ ID NO.5第19-200位胺基酸有至少65%的一致性、或與SEQ ID NO.6第1-187位胺基酸有至少65%的一致性;(b)與SEQ ID NO.1第4013-5743位核苷酸有至少65%的同源性、與SEQ ID NO.2第993-1593位核苷酸有至少65%的同源性、或與SEQ IDNO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)與(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸、或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100個核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互補鏈,在極低、低、中等、中高、高或極高嚴緊條件下雜交的核酸序列;(d)編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之胺基酸序列的多肽的變體的核酸序列,其中所述變體包含一或多個胺基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位變體;和(f)(a)、(b)、(c)或(e)的子序列。
本文所用術語「分離的核酸序列」是指基本不含有其它核酸序列的核酸序列,例如通過瓊脂糖電泳確定具有至少約20%的純度,優選至少約40%的純度,更優選至少約60%的純度,甚至更優選至少約80%的純度,最優選至少約90%的純度的核酸序列。例如,分離的核酸序列可以通過遺傳工程中使用的標準克隆程序將該核酸序列從其天然位置重新置於其將進行複製的不同位置上來獲得。該克隆程序可能涉及切割和分離包含編碼該多肽的核酸序列的期望核酸片段,將此片段插入載體分子中,和將該重組載體摻入可以複製出多個拷貝或克隆的該核酸序列的宿主細胞中。該核酸序列可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任意組合。
在第一個實施方案中,本發明涉及編碼具有與SEQ ID NO.4第22-581位胺基酸、SEQ ID NO.5第19-200位胺基酸或SEQ ID NO.6第1-187位胺基酸(即成熟多肽)有至少約65%、優選至少約70%、更優選至少約80%、甚至更優選至少約90%、最優選至少約95%,甚至最優選至少約97%一致性程度的胺基酸序列的多肽(以下稱為「同源多肽」)的分離核酸序列。在一個優選實施方案中,該同源多肽的胺基酸序列與SEQ IDNO.4第22-581位胺基酸、SEQ ID NO.5第19-200位胺基酸或SEQ ID NO.6第1-187位胺基酸有5個胺基酸不同,優選有4個胺基酸不同,更優選有3個胺基酸不同,甚至更優選有2個胺基酸不同,最優選有1個胺基酸不同。為了本發明的目的,兩個胺基酸序列之間的一致性程度採用Clustal法(Higgins,1989,CABIOS 5151-153)和LASERGENETMMEGALIGNTM軟體(DNASTAR公司,Madison,WI)並使用同一性表和下列多序列對比(multiple alignment)參數來確定空位罰分(gap penalty)為10,空位長度罰分為10。兩兩對比(Pairwise alignment)參數是Ktuple=1,空位罰分=3,窗口(windows)=5,對角線(diagonals)=5。
優選地,本發明多核苷酸序列編碼含有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的胺基酸序列;或其等位變體;或它們的片段的多肽。在一個更優選的實施方案中,本發明核酸序列編碼含有SEQ ID NO.4、SEQID NO.5或SEQ ID NO.6的胺基酸序列的多肽。在另一個優選實施方案中,本發明核酸序列編碼含有SEQ ID NO.4第22-581位胺基酸、SEQ IDNO.5第19-200位胺基酸或SEQ ID NO.6第1-187位胺基酸;或其等位變體;或它們的片段的多肽。在另一個優選實施方案中,本發明核酸序列編碼含有SEQ ID NO.4第22-581位胺基酸、SEQ ID NO.5第19-200位胺基酸或SEQ ID NO.6第1-187位胺基酸的多肽。在另一個優選實施方案中,本發明核酸序列編碼由SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的胺基酸序列;或其等位變體;或它們的片段組成的多肽。在另一個優選實施方案中,本發明核酸序列編碼由SEQ ID NO.4、SEQ ID NO.5或SEQID NO.6的胺基酸序列組成的多肽。在另一個優選實施方案中,本發明核酸序列編碼由SEQ ID NO.4第22-581位胺基酸、SEQ ID NO.5第19-200位胺基酸或SEQ ID NO.6第1-187位胺基酸;或其等位變體;或它們的片段組成的多肽。在另一個優選實施方案中,本發明核酸序列編碼由SEQ IDNO.4第22-581位胺基酸、SEQ ID NO.5第19-200位胺基酸或SEQ ID NO.6第1-187位胺基酸組成的多肽。
本發明還包括編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的胺基酸序列的多肽、但由於遺傳密碼簡併性的原因又分別不同於SEQ IDNO.1、SEQ ID NO.2或SEQ ID NO.3的核酸序列。本發明還涉及分別編碼SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的片段的SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的子序列。
子序列是SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3所包含的、已從5』和/或3』端缺失了一個或多個核苷酸的核酸序列。優選地,SEQ ID NO.1的子序列含有至少1410個核苷酸,更優選至少1500個核苷酸,最優選至少1590個核苷酸。優選地,SEQ ID NO.2的子序列含有至少450個核苷酸,更優選至少480個核苷酸,最優選至少510個核苷酸。優選地,SEQID NO.3的子序列含有至少465個核苷酸,更優選至少495個核苷酸,最優選至少525個核苷酸。SEQ ID NO.4、SEQ ID NO.6或SEQ ID NO.6的片段是從該胺基酸序列的氨基和/或羧基端缺失了一或多個胺基酸的多肽。優選地,SEQ ID NO.4的片段含有至少470個胺基酸殘基,更優選至少500個胺基酸殘基,最優選至少530個胺基酸殘基。優選地,SEQ ID NO.5的片段含有至少150個胺基酸殘基,更優選至少160個胺基酸殘基,最優選至少170個胺基酸殘基。優選地,SEQ ID NO.6的片段含有至少155個胺基酸殘基,更優選至少165個胺基酸殘基,最優選至少175個胺基酸殘基。
等位變體是指佔據相同染色體座位的一個基因的兩種或多種不同形式中的任意一種。等位變異通過突變自然發生,並可導致種群內的多態現象。基因突變可以是沉默的(在編碼的多肽中沒有變化),也可編碼具有改變的胺基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。
在第二個實施方案中,本發明涉及與SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第4013-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸(即成熟多肽編碼區)有至少約65%、優選約70%、優選約80%、更優選約90%、甚至更優選約95%、最優選約97%同源性程度的、編碼活性多肽的分離核酸序列;或其等位變體和子序列。為了本發明的目的,兩個核酸序列之間的同源性程度通過Wilbur-Lipman方法(Wilbur和Lipman,1983,美國國家科學院院刊(Proceedings of theNational Academy of Science USA)80726-730)採用LASERGENETMMEGALIGNTM軟體(DNASTAR,Inc.,Madison,WI)以及同一性表和下列多序列對比參數進行確定空位罰分10,空位長度罰分10。兩兩對比參數為Ktuple=3,空位罰分=3,窗口=20。
在第三個實施方案中,本發明涉及在極低嚴緊條件、優選低嚴緊條件、更優選中等嚴緊條件、更優選中高嚴緊條件、甚至更優選高嚴緊條件、最優選極高嚴緊條件下,和在相同條件下與下列序列雜交的核酸探針雜交的編碼多肽的分離核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互補鏈(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,分子克隆實驗室手冊(Molecular Cloning,A Laboratory Manual),第二版,Cold Spring Harbor,紐約)。SEQ ID NO.1、SEQ ID NO.2或SEQID NO.3的子序列可以是至少100個核苷酸,優選至少200個核苷酸。而且,該子序列可以編碼多肽片段。
根據本領域熟知的方法,可以利用SEQ ID NO.1、SEQ ID NO.2或SEQID NO.3的核酸序列或其子序列,以及SEQ ID NO.4、SEQ ID NO.5或SEQID NO.6的胺基酸序列或其片段,設計核酸探針以從不同屬或種的株系中鑑定和克隆編碼多肽的DNA。具體地,可以在標準Southern印跡程序之後,採用該探針與感興趣的屬或種的基因組或cDNA雜交,以鑑定和分離其中的相應基因。該探針可以比完整序列短得多,但應長至少15個,優選至少25個,更優選至少35個核苷酸。也可使用更長的探針。既可使用DNA探針,也可使用RNA探針。典型地,為了檢測相應基因對該探針進行標記(例如用32P、3H、35S、生物素或抗生物素蛋白進行標記)。該探針包括在本發明的範圍之內。
由此,可以篩選從這些其它生物製備的基因組DNA或cDNA文庫,以尋找與上述探針雜交並編碼多肽的DNA。來自這些其它生物的基因組或其它DNA可以通過瓊脂糖或聚丙烯醯胺凝膠電泳或其它分離技術分離。可以將來自這些文庫的DNA或該分離的DNA轉移並固定在硝酸纖維素或其它適當的載體材料上。為了鑑定與SEQ ID NO.1或其子序列同源的克隆或DNA,將該載體材料用於Southern印跡。為了本發明的目的,雜交是指核酸序列與相應於SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3所示核酸序列、它們的互補序列或其子序列的標記核酸探針在極低到極高的嚴緊條件下雜交。在這些條件下與該核酸探針雜交的分子用X光膠片檢測。
在一個優選實施方案中,該核酸探針是SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的核酸序列。在另一個優選實施方案中,該核酸探針是編碼SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6的多肽的核酸序列,或其子序列。在另一個優選實施方案中,該核酸探針是SEQ ID NO.1、SEQ IDNO.2或SEQ ID NO.3。在另一個優選實施方案中,該核酸探針是編碼成熟多肽的SEQ ID NO.1第4013-5743位核苷酸。在另一個優選實施方案中,該核酸探針是編碼成熟多肽的SEQ ID NO.2第993-5743位核苷酸。在另一個優選實施方案中,該核酸探針是編碼成熟多肽的SEQ ID NO.3第3061-3678位核苷酸。在另一個優選實施方案中,該核酸探針是大腸桿菌NRRL B-30067中的質粒pECO3所包含的所述核酸序列。在另一個優選實施方案中,該核酸探針是大腸桿菌NRRL B-30071中的質粒pFAMG所包含的所述核酸序列。在另一個優選實施方案中,該核酸探針是大腸桿菌NRRL B-30076中的質粒pQUINN所包含的所述核酸序列。在另一個優選實施方案中,該核酸探針是大腸桿菌NRRL B-30067中的質粒pECO3所包含的所述成熟多肽編碼區。在另一個優選實施方案中,該核酸探針是大腸桿菌NRRL B-30071中的質粒pFAMG所包含的所述成熟多肽編碼區。在另一個優選實施方案中,該核酸探針是大腸桿菌NRRL B-30076中的質粒pQUINN所包含的所述成熟多肽編碼區。
對於至少100個核苷酸長的長探針,極低到極高嚴緊條件定義為在標準Southern印跡程序之後,在5×SSPE、0.3%SDS、200μg/ml剪切的變性鮭精DNA和或者25%甲醯胺(對於極低和低嚴緊條件)或者35%甲醯胺(對於中等和中高嚴緊條件)或者50%甲醯胺(對於高和極高嚴緊條件)中於42℃進行預雜交和雜交。
對於至少100個核苷酸長的長探針,最後載體材料用2×SSC、0.2%SDS,優選至少在45℃(極低嚴緊條件),更優選至少在50℃(低嚴緊條件),更優選至少在55℃(中等嚴緊條件),更優選至少在60℃(中高嚴緊條件),甚至更優選至少在65℃(高嚴緊條件),最優選至少在70℃(極高嚴緊條件)洗滌三次,每次15分鐘。
對於長約15個核苷酸到約70個核苷酸的短探針,嚴緊條件定義為在標準Southern印跡程序之後,在使用Bolton和McCarthy(1962,美國國家科學院院刊481390)的計算方法計算的Tm值以下5℃-10℃,於0.9M NaCl、0.09M Tris-HCl pH7.6、6mM EDTA、0.5%NP-40、1×Denhardt’s溶液、1mM焦磷酸鈉、1mM磷酸二氫鈉(sodium monobasic phosphate)、0.1mM ATP和0.2mg酵母RNA/ml中進行預雜交、雜交和雜交後的洗滌。
對於長約15個核苷酸到約70個核苷酸的短探針,載體材料在計算的Tm以下5℃-10℃用6×SCC加0.1%SDS洗滌一次,時間15分鐘,用6×SSC洗滌兩次,每次15分鐘。
本發明還涉及通過如下步驟製備的分離核酸序列(a)在極低、低、中等、中高、高或極高的嚴緊條件下使DNA與(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸,(ii)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互補鏈雜交;和(b)從該DNA中分離出該核酸序列。該子序列優選是具有至少100個核苷酸的序列,例如編碼多肽片段的序列。
在第四個實施方案中,本發明涉及編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之胺基酸序列的多肽的變體的分離核酸序列,其中所述變體包含了一或多個胺基酸的替代、缺失和/或插入。
該多肽變體的胺基酸序列與SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6,或其成熟多肽的胺基酸序列的差別可以是一個或多個胺基酸殘基的插入或缺失和/或一個或多個胺基酸殘基被不同的胺基酸殘基替代。優選地,胺基酸的改變在性質上是較小的,即不顯著影響該蛋白質的摺疊和/或活性的保守胺基酸替換;小的缺失,典型的是1到約30個胺基酸的缺失;小的氨基或羧基末端突出,如氨基末端的甲硫氨酸殘基;不超過約20-25個殘基的小接頭肽;或通過改變淨電荷或其它功能便於純化的小突出,如聚組氨酸片段、抗原表位或結合域。
保守替代的實例是以下各組內的替代鹼性胺基酸組(精氨酸、賴氨酸和組氨酸),酸性胺基酸組(穀氨酸和天冬氨酸),極性胺基酸組(穀氨醯胺和天冬醯胺),疏水性胺基酸組(亮氨酸、異亮氨酸和纈氨酸),芳香族胺基酸組(苯丙氨酸、色氨酸和酪氨酸)和小胺基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性的胺基酸替代是本領域已知的,並描述於例如H.Neurath和R.L.Hill,1979,蛋白質(The Proteins),Academic Press,紐約。最常發生的交換是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly,以及它們的相反替代。
本發明的核酸序列可以獲自任何屬的微生物。為了本發明的目的,術語「獲自」按本文中定義的方式使用。在一個優選實施方案中,由本發明核酸序列編碼的多肽被分泌至細胞外。
本發明的核酸序列可以獲自真菌來源,更優選獲自酵母菌株,如假絲酵母屬、漢遜酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或Yarrowia菌株;或更優選獲自絲狀真菌菌株如Acremonium、麴黴屬、短梗黴屬(Aureobasidium)、隱球酵母屬(Cryptococcus)、Filibasidium、鐮孢黴屬、腐質黴屬、Magnaporthe、毛黴屬、毀絲黴屬(Myceliophthora)、Neocallimastix、脈孢菌屬、擬青黴屬(Paecilomyces)、青黴屬、Piromyces、裂褶菌屬(Schizophyllum)、Talaromyces、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬、Tolypocladium或木黴屬(Trichoderma)菌株。
在一個優選實施方案中,該核酸序列獲自卡爾酵母、釀酒酵母、糖化酵母、Saccharomyces douglasii、克魯弗酵母、諾地酵母或Saccharomyces oviformis菌株。
在另一個優選實施方案中,該核酸序列獲自棘孢麴黴(Aspergillusaculeatus)、泡盛麴黴、臭麴黴、日本麴黴、構巢麴黴、黑麴黴、米麴黴、Humicola insolens、Humicola lanuginosa、米黑毛黴、Myceliophthora thermophila、粗糙脈孢菌、產紫青黴、Trichodermaharzianum、康寧木黴、Trichoderma longibrachiatum、Trichodermareesei或綠色木黴菌株。
在另一個優選實施方案中,該核酸序列獲自杆孢狀鐮孢、Fusariumcerealis、Fusarium crookwellense、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、Fusarium sulphureum、Fusariumtorulosum、Fusarium trichothecioides或Fusarium venenatum菌株。
在一個更優選的實施方案中,該核酸序列獲自Fusarium venenatum,最優選獲自Fusarium venenatum ATCC 20334,例如SEQ ID NO.1、SEQ IDNO.2或SEQ ID NO.3中所示的核酸序列。在另一個更優選的實施方案中,SEQ ID NO.1的核酸序列是大腸桿菌NRRL B-30067中的質粒pECO3所包含的序列。在另一個更優選的實施方案中,SEQ ID NO.2的核酸序列是大腸桿菌NRRL B-30071中的質粒pFAMG所包含的序列。在另一個更優選的實施方案中,SEQ ID NO.3的核酸序列是大腸桿菌NRRL B-30076中的質粒pQUINN所包含的序列。在另一個優選實施方案中,該核酸序列是編碼成熟多肽的SEQ ID NO.1第4013-5743位核苷酸。在另一個優選實施方案中,該核酸序列是編碼成熟多肽的SEQ ID NO.2第993-1593位核苷酸。在另一個優選實施方案中,該核酸序列是編碼成熟多肽的SEQ ID NO.3第3061-3678位核苷酸。
應該理解,對於前面提及的種,本發明既包括完全和不完全階段,及其它的分類學等同物,例如無性型,而不論它們被稱為何種種名。本領域技術人員將容易識別出適合的等同物。
公眾可容易地從許多培養物保藏中心獲得這些種的菌株,這些培養物保藏中心例如美國典型培養物保藏中心(ATCC)、德意志微生物保藏中心(DSM)、真菌菌種保藏中心(CBS)和農業研究機構保藏中心(NRRL)。
而且,採用上述探針可從其它來源鑑定並獲得這類核酸序列,這些來源包括從自然環境(如土壤、堆肥、水等)分離的微生物。從自然生活環境中分離微生物的技術是本領域熟知的。然後可以通過對另一種微生物的基因組或cDNA文庫的相似篩選獲得核酸序列。一旦用探針檢測到編碼多肽的核酸序列,即可利用本領域普通技術人員已知的技術(見例如Sambrook等,1989,同上)分離或克隆該序列。
本發明還涉及在SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3的成熟多肽編碼序列中含有至少一個突變的突變核酸序列,其中該突變核酸序列編碼分別由SEQ ID NO.4第22-581位胺基酸、SEQ ID NO.5第19-200位胺基酸或SEQ ID NO.6第1-187位胺基酸組成的多肽。
用於分離或克隆編碼多肽的核酸序列的技術在本文中已有過描述。
本發明還涉及含有上述核苷酸序列的核酸結構、重組載體和宿主細胞。對於它們的構建可以採用前面描述的相同方法來進行。
本發明還涉及由上述核酸序列編碼的多肽,以及採用本文描述的方法產生該多肽的方法。
本發明通過如下實施例作進一步描述,這些實施例不應理解為是對本發明範圍的限制。
實施例用作緩衝液和底物的化學製品是至少試劑級別的商業產品。培養基和溶液COVE痕量金屬溶液每升由0.04g NaB4O7·10H2O、0.4g CuSO4·5H2O、1.2gFeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O組成。
50×COVE鹽溶液每升由26g KCl、26g MgSO4·7H2O、76g KH2PO4和50mlCOVE痕量金屬組成。
COVE培養基每升由342.3g蔗糖、20ml 50×COVE鹽溶液、10ml 1M乙醯胺、10ml 1.5M CsCl2和25g純淨瓊脂組成。
50×Vogels培養基每升由150g檸檬酸鈉、250g KH2PO4、10gMgSO4·7H2O、10g CaCl2·2H2O、2.5ml生物素貯存液和5.0ml AMG痕量金屬溶液組成。
痕量金屬溶液每升由14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、0.5g NiCl2、13.8g FeSO4、8.5g MnSO4和3.0g檸檬酸組成。
COVE頂層瓊脂每升由20ml 50×COVE鹽、0.8M蔗糖、1.5M氯化銫、1.0M乙醯胺和10g低熔點瓊脂糖組成,pH被調節至6.0。
BASTA頂層瓊脂由補加了10mg/ml除草劑BastaTM(Hoechst Schering,Rodovre,丹麥)的COVE頂層瓊脂組成。
RA孢子形成培養基每升由50g琥珀酸、12.1g NaNO3、1g蔗糖、20ml50×Vogels和0.5ml 10mg/ml NaMoSO4貯存液組成,pH被調節至6.0。
YEPG培養基每升由10g酵母提取物、20g蛋白腖和20g葡萄糖組成。
STC由0.8M山梨糖醇、25mM Tris pH8、25mM CaCl2組成。
SPTC由40%PEG 4000、0.8M山梨糖醇、25mM Tris pH8、25mM CaCl2組成。
M400Da培養基每升由50g麥芽糖糊精、2g MgSO4·7H2O、2g KH2PO4、4g檸檬酸、8g酵母提取物、2g尿素和1ml COVE痕量金屬溶液組成。實施例1Fusarium venenatum菌絲體組織的生產採用補料分批發酵方案,使用作為碳源的NUTRIOSETM(RoquetteFreres,S.A.,Beinheim,法國)和酵母提取物,將Fusarium venenatumATCC 20334的形態學突變體Fusarium venenatum CC1-3(Wiebe等,1991,Mycol.Research 951284-1288)培養在實驗室規模的兩升發酵罐中。pH維持在6-6.5,溫度保持在30℃,並含有活性溶解氧(positivedissolved oxygen)。
在接種後第2、4、6和8天收穫菌絲體樣品,並在液氮中迅速冷凍。在將其破碎用於RNA提取之前,將這些樣品保存在-80℃。實施例2cDNA文庫構建根據Timberlake和Barnard的方法(1981,細胞(Cell)2629-37)從實施例1中描述的菌絲體樣品中提取總細胞RNA,從1%甲醛-瓊脂糖凝膠上進行印跡之後通過Northern雜交分析該RNA樣品(Davis等,1986,分子生物學基本方法(Basic Methods in Molecular Biology),ElsevierScience Publishing Co.,Inc.,紐約)。使用mRNA分離試劑盒(mRNASeparator KitTM)(Clontech Laboratories,Inc.,Palo Alto,CA)根據廠商說明從總RNA分離聚腺苷酸化mRNA部分。除了使用NotI-(dT)18引物(Pharmacia Biotech,Inc.,Piscataway,NJ)起始第一鏈合成之外,根據Gubler和Hoffman的方法(1983,基因(Gene)25263-269)使用大約5μg poly(A)+mRNA合成雙鏈cDNA。用綠豆核酸酶(BoehringerMannheim Corporation,Indianapolis,IN)處理該cDNA,並用T4 DNA聚合酶(New England Biolabs,Beverly,MA)使末端平端化。
用NotI消化cDNA,通過瓊脂糖凝膠電泳按大小選擇片段(大約0.7-4.5kb),並與用NotI和EcoRV切割並經小牛小腸鹼性磷酸酶(Boehringer Mannheim Corporation,Indianapolis,IN)去酸化的pZEr0-2.1(Invitrogen Corporation,Carlsbad,CA)連接。使用該連接混合物轉化大腸桿菌TOP10感受態細胞(Invitrogen Corporation,Carlsbad,CA)。在含有50μg/ml終濃度卡那黴素的2YT瓊脂平板上篩選轉化體(Miller,1992,細菌遺傳學簡短教程。關於大腸桿菌和相關細菌的實驗室指南和手冊(A Short Course in Bacterial Genetics.Alaboratory Manual and Handbook for Escherichia coli and RelatedBacteria),Cold Spring Harbor Press,Cold Spring Harbor,紐約)。
使用質粒克隆載體pZEr0-2.1構建兩個獨立的定向(directional)cDNA文庫。文庫A使用第4天收穫的菌絲體的mRNA製備,文庫B使用從第6天時間點獲得的mRNA構建。為了檢驗細胞中基因表達譜的代表性「瞬態圖(snapshot)」,兩個cDNA文庫均沒有擴增。相反地,將文庫鋪板,標定滴度,並通過DNA測序分析每個文庫的獨立克隆。
文庫A(第4天的細胞)由大約7.5×104個獨立克隆組成,文庫B(第6天的細胞)由大約1.2×105個克隆組成。從每個文庫中的40個菌落分離小量製備的DNA(Miniprep DNA),並檢查cDNA插入片段的存在和大小。在該分析中,來自文庫A的40個菌落中有39個(97.5%)含有大小在600bp至2200bp之間(平均=1050bp)的插入片段。相似地,來自文庫B的40個菌落中39個(97.5%)含有大小在800bp至3600bp之間(平均=1380bp)的插入片段。實施例3模板的製備和核苷酸序列測定從實施例2中描述的每個cDNA文庫中,直接從轉化平板挑取1192個轉化體菌落至含有包含50μg/ml卡那黴素的200ul 2YT培養液(Miller,1992,見上)的96孔微量滴定板中。將微量滴定板在37℃不搖動孵育過夜。孵育之後,向每個孔加入100μl無菌的50%甘油。將轉化體複製到第二個深盤型(deep dish)96孔微量培養板(Advanced GeneticTechnologies Corporation,Gaithersburg,MD)中,該微量培養板的每孔中含有1ml補充了50μg/ml卡那黴素的MagnificentBrothTM(MacConnell Research,San Diego,CA)。原始的微量滴定板冷凍儲存在-80℃。第二個深盤型培養板於37℃旋轉搖床上劇烈振蕩(300rpm)孵育過夜。為防止濺出和交叉汙染,以及允許充分的通氣,用聚丙烯襯墊(Advanced Genetic Technologies Corporation,Gaithersburg,MD)和塑料微量滴定盤蓋覆蓋每個第二培養板。
使用Utterback等所修改的Advanced Genetic Technologies公司(Gaithersburg,MD)96孔小量製備試劑盒程序(1995,基因組科學技術(Genome Sci.Technol.)11-8),從每個孔分離DNA。使用Perkin-ElmerApplied Biosystems 377 XL型自動DNA測序儀(Perkin-Elmer AppliedBiosystems公司,Foster City,CA),採用染料終止物化學法(dye-terminator chemistry)(Giesecks等,1992,病毒學方法雜誌(Journalof Virology Methods)3847-60)以及反向lac測序引物進行單側(single-pass)DNA測序。實施例4DNA序列數據分析仔細檢查核苷酸序列數據的質量,給出少於或等於9.2的不適當間隔或超過3%的模糊水平的樣品被丟棄或進行重新測序。藉助於FACTURATM軟體(Perkin Elmer Applied Biosystems,Inc.,Foster City,CA)修剪載體序列。此外,當模糊鹼基信號數目增加時,在每個樣品的末端截短序列。使用TIGR Assembler軟體(Sutton,G.G.等,1995,基因組科學和技術(Genome Science and Technology)19019),將所有序列互相比較以構建重疊的毗連序列群,從而確定每個文庫中提供的各種cDNA種類的多重性。最後,按三種框架翻譯所有序列,並使用採用修改的Smith-Waterman算法的GeneAssistTM軟體(Perkin Elmer AppliedBiosystems,Inc.,Foster City,CA)對非冗餘資料庫(NRDB)進行搜索,其中所述算法使用閾值為70的BLOSUM 62距陣。NRDB是由Genpept、Swiss-Prot和PIR資料庫組合而來。實施例5葡糖澱粉酶cDNA克隆的鑑定通過使用Applied Biosystems 377 XL型自動DNA測序儀根據廠商說明進行隨機cDNA克隆的部分測序,並按照實施例4所述將推導的胺基酸序列與NRDB中的序列進行比較,鑑定推測的葡糖澱粉酶克隆。從分析的2000多個cDNA序列中,來自文庫A的2個克隆和來自文庫B的9個克隆表現出與來自其它真菌和酵母的葡糖澱粉酶蛋白質具有胺基酸序列同源性。在以此方式發現的幾個葡糖澱粉酶cDNA克隆中,基於其與粗糙脈孢菌(Geneseq蛋白質登錄號R71034)和Humicola grisea(Trembl登錄號Q12623)的葡糖澱粉酶胺基酸序列的比對,以及使用signal-P電腦程式(Nielsen等,1997,蛋白質工程(Protein Engineering)101-6)所檢測到的可能信號肽的存在,推測一個克隆是全長的。選擇含有質粒pFA0401、定名為大腸桿菌FA0401的克隆用作探針,以從Fusariumvenenatum克隆相應的葡糖澱粉酶基因組DNA序列(見實施例7)。實施例6構建Fusarium venenatum的基因組DNA文庫按照在Berka等(1998,Appl.Environ.Microbiol.64,4423-4427)的程序中詳述的方法,在λZipLox中構建基因組文庫。簡單地說,用Tsp509I部分消化Fusarium venenatum的總細胞DNA,並在1%瓊脂糖凝膠上進行大小分離。將在3-7kb大小範圍內遷移的DNA片段切下,並採用Prep-a-Gene試劑(BioRad,Hercules,CA)將DNA從瓊脂糖凝膠切塊中洗脫出來。將洗脫的DNA片段與EcoRI切割並經去磷酸化的λZipLox載體臂(Life Technologies,Gaithersburg,MD)連接,連接混合物採用商業包裝提取物(Stratagene,La Jolla,CA)進行包裝。採用標準方法將該包裝的DNA文庫鋪板,並在大腸桿菌Y1090ZL細胞上擴增,然後儲存於4℃(Davis,R.W.,Botstein,D.,和Roth.J.R.,1980,高級細菌遺傳學,遺傳工程手冊(Advanced Bacterial Genetics,A Manual for GeneticEngineering),Cold Spring Harbor Press,Cold Spring Harbor,NY)。實施例7編碼Fusarium venenatum葡糖澱粉酶的基因組DNA片段的分離,核苷酸測序和特性分析採用含有來自pFA0401(實施例5)的克隆cDNA插入片段的放射性標記探針片段,在高度嚴緊條件下(即,在50%甲醯胺、5×SSPE、0.3%SDS、200μg/ml剪切的變性鮭精DNA中45℃進行雜交;濾膜在含有0.1%SDS的0.2×SSPE中45℃洗滌一次,之後在無SDS的0.2×SSPE中於相同溫度下洗滌兩次),通過雜交(Davis等,1980,同上)篩選來自Fusariumvenenatum基因組DNA文庫(實施例6)的大約50,000噬菌斑。在大腸桿菌Y1090ZL細胞上兩次純化給出雜交信號的噬菌斑,隨後從λZipLox載體中切出單個克隆作為pZL1衍生物(D』Alessio等,1992,Focus1476)。DNA序列分析揭示,其中一個含有命名為pFAMG的質粒的克隆包含了完整的葡糖澱粉酶編碼區以及分別包括了啟動子和終止子區域的3.9kb 5』側翼DNA和0.3kb 3』側翼DNA(見
圖1)。
使用染料終止物化學法在Applied Biosystems 377 XL型自動DNA測序儀上對pFAMG中的克隆插入片段進行DNA序列測定。使用轉座子插入策略(Primer Island Transposition試劑盒,Perkin-Elmer/AppliedBiosysytems,Inc.,Foster City,CA)產生連續序列。對來自pFAMG的葡糖澱粉酶基因組克隆進行測序,達到平均冗餘4.2。
通過該基因組序列數據與葡糖澱粉酶cDNA序列的重疊群的比較,確定編碼Fusarium venenatum葡糖澱粉酶的基因組DNA片段含有一個1743bp的開放閱讀框,該閱讀框被一個51bp的內含子中斷並編碼具有581個胺基酸的多肽。該核苷酸序列(SEQ ID NO.1)和推導的胺基酸序列(SEQ IDNO.4)顯示在
圖1中。採用SignalP程序(Nielson等,1997,蛋白質工程101-6),預測了一個21個殘基的信號肽,並經該葡糖澱粉酶蛋白質氨基端測序獲得了證實(實施例8)。因此,成熟的葡糖澱粉酶由560個胺基酸組成。
使用LASERGENETMMEGALIGNTM軟體(DNASTAR,Inc.,Madison,WI)和Clustal方法(Higgins,1989,CABIOS 5151-153),採用同一性表和如下多序列比對參數進行真菌葡糖澱粉酶蛋白質序列的比較性對比空位罰分為10,空位長度罰分為10。兩兩對比參數是Ktuple=1、空位罰分=3、窗口=5和對角線=5。該對比顯示,Fusarium venenatum的葡糖澱粉酶與下列其它真菌的葡糖澱粉酶具有一致性(括弧內為一致殘基的百分數)粗糙脈孢黴[Swissprot P14804](47%)、黑麴黴[Swissprot P04064](46%)、Humicola grisea[Trembl Q12623](44%)、Hormoconis resinae[Swissprot Q03045](41%)、Corticium rolfsii[Q12596](41%)、Schizosaccharomyces pombe[Trembl 060087](31%)、和Rhizopus oryzae[Swissprot P07683](23%)。實施例8Fusarium venenatum葡糖澱粉酶的氨基端序列分析通過8-16%Tris-甘氨酸SDS-PAGE(Novex,San Diego,CA)分離Fusarium venenatum發酵培養液(實施例1)樣品中的蛋白質,然後採用10%甲醇(pH=11.0)中的10mM CAPS(3-[環己基氨基]-1-丙磺酸)25伏2小時將其電轉印至PVDF膜上(Novex,San Diego,CA)。用40%甲醇/1%乙酸中的0.1%考馬斯亮蘭R250染色該PVDF膜20秒,並在50%乙醇中脫色以觀察蛋白質條帶。
切下遷移在大約65kDa的主要多肽種類,並在帶有即時HPLC和液相三氟乙酸(TFA)遞送的Applied Biosystems 476A蛋白質測序儀(PerkinElmer/Applied Biosystems Division,Foster City,CA)上對其進行N端測序。測序試劑來自Perkin Elmer/Applied Biosystems Division(Foster City,CA)。採用含有溶於水的3.5%四氫呋喃的A緩衝液以及18ml含有乙酸、乙酸鈉和己磺酸鈉的Premix濃縮物(Perkin Elmer/AppliedBiosystems Division,Foster City,CA)和含有乙腈的緩衝液B,通過即時HPLC檢測乙內醯苯硫脲胺基酸。收集數據,並在Macintosh IIsi上採用Applied Biosystems 610數據分析軟體進行分析。對著光源觀察色譜以鑑定胺基酸,並由操作員確定。N-端分析產生蛋白質序列Ser-Pro-Ser-Lys-Asp-Asn-Ser-Leu-Glu-Arg-Phe-Ile-Asp-Lys-Gln-Ala-Asp-Ile-Ser(SEQ ID NO.4)。實施例9鑑定編碼推測的液泡相關蛋白質和未知的分泌基因產物的豐富cDNA克隆基於其在文庫A和B(實施例2)的克隆中的相對豐度,再選擇兩種cDNA種類。
含有pFA0035的克隆FA0035編碼具有18個胺基酸可能信號肽的200個胺基酸初級翻譯產物,其中該可能信號肽是採用Signal-P電腦程式(Nielsen等,1997,同上)檢測到的。克隆FA0035佔文庫A中cDNA克隆的大約1.9%,而佔文庫B中cDNA克隆的大約0.8%。按實施例4所述將克隆FA0035的推導胺基酸序列與NRDB中的序列進行比較,結果顯示與任何已知的蛋白質序列均沒有顯著的同源性,因此將其劃為未知開放閱讀框(ORF)。該克隆被任意命名為「Daria」。
含有pFA0759的克隆FA0759編碼與粗糙脈孢黴液泡相關蛋白質的推測亞基(Trembl登錄號P87252)有72%胺基酸序列一致性的具有187個胺基酸的多肽。由於採用Signal-P軟體沒有檢測到信號肽,所以該基因產物似乎並不是分泌蛋白。克隆FA0759佔文庫A中cDNA克隆的大約2.0%,而佔文庫B中cDNA克隆的大約1.5%。實施例10編碼未知基因「Daria」和推測的液泡相關蛋白質的基因組DNA片段的克隆和核苷酸序列分析通過篩選實施例6和7所述的λZipLox文庫分離編碼未知分泌蛋白質「Daria」和推測的液泡相關蛋白質的Fusarium venenatum基因組DNA片段。對來自質粒pFA0035和pFA0759的cDNA插入片段進行放射性標記,將其用作探針篩選文庫。將在實施例7的相同條件下與任一探針強雜交的噬菌斑在大腸桿菌Y1090ZL細胞上進行兩次純化,隨後從λZipLox載體中切下各個克隆作為pZL1衍生物(D』Alessio等,1992,同上)。
DNA序列分析揭示,其中一個含有命為pECO3的質粒的克隆含有完整的「Daria」編碼區以及分別包括了啟動子和終止子區域的0.9kb 5』側翼和0.9kb 3』側翼DNA。該核苷酸序列(SEQ ID NO.2)和推導的胺基酸序列(SEQID NO.5)顯示於圖2。該編碼區被一個55bp內含子打斷。
相似地,用來源於pFA0579 cDNA插入片段的放射性標記探針,通過篩選λZipLox文庫分離基因組DNA克隆。命名為pQUINN的基因組克隆編碼完整的液泡相關蛋白質亞基以及分別包含了啟動子和終止子區域的3.0kb 5』側翼和0.3kb 3』側翼DNA。該核苷酸序列(SEQ ID NO.3)和推導的胺基酸序列(SEQ ID NO.6)顯示於圖3。該基因組克隆和cDNA克隆之間的序列比較揭示,在該推測的液泡相關蛋白質亞基的5』非翻譯區中存在一個594bp的內含子。此外,該編碼還含有一個77bp的內含子。實施例11pDM181的構建採用拼接重疊延伸技術構建質粒pDM181,以將1.2kb尖鐮孢胰蛋白酶啟動子與1.1kb尖鐮孢胰蛋白酶終止子融合在一起。作為重疊PCR策略的一部分,將含有SwaI、KpnI和PacI限制性位點的多位點接頭插入該啟動子和終止子之間。在啟動子的5』末端添加一個XhoI位點,並保留天然的EcoRI位點。在終止子的3』末端,通過PCR反應引入EcoRI、HindIII和NsiI位點。
使用如下引物從質粒pJRoy20(Royer等,1995,生物技術(Biotechnology)131479-1483)產生含有尖鐮孢胰蛋白酶啟動子第-1208至-1位序列和25個鹼基對多位點接頭的PCR片段引物1(有義)5』-GAGCTCGAGGAATTCTTACAAACCTTCAAC-3』(SEQ ID NO.7)Xhol EcoRI引物2(反義)5』-TTAATTAAGGTACCTGAATTTAAATGGTGAAGAGATAGATATCCAAG-3』(SEQ ID NO.8PacI KpnI SwaI100μl PCR反應物含有10ng pJRoy20,每個引物各50pmol,1×Pwo緩衝液(Boehringer Mannheim,Indianapolis,IN),dATP、dCTP、dGTP和dTTP各200μM,和5單位Pwo DNA聚合酶(Boehringer Mannheim,Indianapolis,IN)。所用的PCR條件是95℃3分鐘,之後25個循環,每個循環包括95℃30秒、50℃1分鐘和72℃1分鐘。最後的延伸循環是72℃5分鐘。
使用相同的PCR條件和如下引物,從質粒pJRoy20產生含有尖鐮孢胰蛋白酶啟動子的第-5到-1位鹼基對、25個鹼基對的多位點接頭和尖鐮孢胰蛋白酶基因3』非翻譯區的1060個鹼基對(終止子區)的第二個PCR片段引物3(有義)5』-TCACCATTTAAATTCAGGTACCTTAATTAAATTCCTTGTTGGAAGCGTCGA-3』(SEQ IDNO.9)SwaI KpnI PacI引物4(反義)5』-TGGTATGCATAAGCTTGAATTCAGGTAAACAAGATATAATTT-3』(SEQ ID NO.10)NsiI HindIII EcoRI使用0.2μl第一次PCR(啟動子)反應產物和3μl第二次(終止子)反應產物作為模板,以及引物1和4,獲得含有尖鐮孢胰蛋白酶啟動子第-1208到-1位、25個鹼基對的多位點接頭和尖鐮孢胰蛋白酶終止子的1060個鹼基對的最終2.3kb重疊PCR片段。所用PCR條件是95℃3分鐘,之後30個循環,每個循環包括95℃30秒、62℃1分鐘和72℃3分鐘。最後的延伸循環是72℃5分鐘。該反應也使用Pwo DNA聚合酶。
將所獲的含有胰蛋白酶啟動子、多位點接頭和胰蛋白酶終止子的2.3kb片段用EcoRI消化,並連入EcoRI消化的含有bar基因的載體pMT1612(WO 97/26330)中產生pDM181(圖4)。實施例12質粒pSheB1的構建通過修飾pDM181產生Fusarium venenatum表達載體pSheB1(圖5)。修飾包括(a)去除pDM181序列中的兩個NcoI位點,和(b)重新恢復尖鐮孢胰蛋白酶啟動子的天然翻譯起始(在ATG起始密碼子處重新構建一個NcoI位點)。
使用QuikChangeTM定點誘變試劑盒(Stratagene Cloning Systems,LaJolla,CA),根據廠商說明使用如下誘變引物對實現pDM181序列中兩個NcoI位點的去除5』-dCAGTGAATTGGCCTCGATGGCCGCGGCCGCGAATT-3』(SEQ ID NO.11)和5』-dAATTCGCGGCCGCGGCCATCGAGGCCAATTCACTG-3』(SEQ ID NO.12)5』-dCACGAAGGAAAGACGATGGCTTTCACGGTGTCTG-3』(SEQ ID NO.13)和5』-dCAGACACCGTGAAAGCCATCGTCTTTCCTTCGTG-3』(SEQ ID NO.14)使用QuikChangeTM定點誘變試劑盒以及如下誘變引物對也實現了尖鐮孢胰蛋白酶啟動子天然翻譯起始的重新恢復5』-dCTATCTCTTCACCATGGTACCTTAATTAAATACCTTGTTGGAAGCG-3』(SEQ IDNO.11)和5』-dCGCTTCCAACAAGGTATTTAATTAAGGTACCATGGTGAAGAGATAG-3』(SEQ IDNO.12)所有定點改變均通過合適載體區的DNA序列分析確證。實施例13pDM194和pDM218的構建用於在Fusarium venenatum中獲得Thermomyces lanuginosus(原稱Humicola lanuginose)脂酶表達的7.8kb質粒pDM194(7.8kb)具有如下基因元件含有尖鐮孢胰蛋白酶基因啟動子(Royer等,1995,同上)的1.2kb DNA片段。
含有Thermomyces lanuginosus脂酶cDNA(EP 305 216)的0.9kb DNA片段。
含有尖鐮孢胰蛋白酶基因終止子(Royer等,1995,同上)的1.1kb DNA片段。
來自pMT1612(WO 98/11203)的含有2.8kb大腸桿菌載體pUC19和一個1.8kb片段的4.7kb DNA片段,其中所述1.8kb片段含有構巢麴黴amdS基因啟動子(Hynes等,1988,分子細胞生物學(Mol.Cell Biol.)82589-2596)、吸水鏈黴菌膦絲菌素乙醯轉移酶(bar)基因(Thompson等,1987,EMBO Journal 62519-2514)、和黑麴黴AMG終止子。
通過PCR產生SwaI/PacI脂酶片段。採用含有Thermomyceslanuginosus脂酶基因(EP 305 216)cDNA的質粒pMHan37作為模板。以下顯示的引物5和6用於在該脂酶編碼區的5』末端引入一個SwaI位點和在3』末端引入一個PacI位點。引物5(有義)5』-ATTTAAATGATGAGGAGCTCCCTTGTGCTG-3』(SEQ ID NO.17)SwaI引物6(反義)5』-TTAATTAACTAGAGTCGACCCAGCCGCGC-3』(SEQ ID NO.18)PacI100μl PCR反應物含有10ng pMHan37,每個引物各50pmol,1×PCR緩衝液(Perkin-Elmer Corp.,Branchburg,NJ),dATP、dCTP、dGTP和dTTP各250uM,和5單位Taq DNA聚合酶(Perkin-Elmer Corp.,Branchburg,NJ)。所用的PCR條件是95℃5分鐘一個循環,之後30個循環,每個循環包括95℃1分鐘、55℃1分鐘和72℃2分鐘。根據廠家說明將0.9kb PCR產物亞克隆在TA克隆試劑盒(Invitrogen,Carlsbad,CA)的pCRII中。採用Qiagen Maxiprep試劑盒(Qiagen,Santa Clarita,CA)分離質粒DNA,用SwaI和PacI消化,之後在1%瓊脂糖凝膠上100伏電泳1小時。切下該0.9kb片段,採用spinBind試劑盒(FMC,Rockland,ME)純化,並克隆至pBANe6(WO 98/11203)中,產生pBANe8。
用SwaI和PacI消化pBANe8,並將該0.9kb脂酶片段與SwaI/PacI消化的pDM181連接,產生脂酶表達質粒pDM194(圖6)。
從pJRoy35(圖7)構建pDM218。通過PCR在尖鐮孢胰蛋白酶啟動子5』末端引入NotI和PmeI限制性位點。採用pDM181作為模板,利用如下引物,製備含有該啟動子5』末端的362bp擴增子multi15』-ATAAGAATGCGGCCGCTAGTTTAAACTTACAAACCTTCAACAGTG-3』(SEQID NO.19)multi25』-TAGCATCTATCTCCGTCTT-3』(SEQ ID NO.20)100μl PCR反應物含有150ng 3kb EcoRI片段、每個引物各50pmol、1×Pwo緩衝液,dATP、dCTP、dGTP和dTTP各200uM,和5單位Pwo DNA聚合酶。所用的PCR條件是95℃3分鐘一個循環;之後30個循環,每個循環包括95℃1分鐘、50℃1分鐘和72℃1.5分鐘;之後72℃延伸5分鐘。將該擴增子亞克隆至pCR-Blunt載體(Invitrogen,Carlsbad,CA)中。在1%瓊脂糖凝膠上100伏電泳0.25kb NotI/BcuI片段1小時,將其切下並採用QIAquick凝膠提取試劑盒(Qiagen,Santa Clarita,CA)進行純化。
通過PCR在尖鐮孢胰蛋白酶終止子3』末端引入HpaI、SnaBI和PpuMI位點。採用該3kb EcoRI片段作為模板,利用如下引物,製備含有該胰蛋白酶終止子3』末端的714bp擴增子multi35』-GTGTGCAGTGACCCAGAAT-3』(SEQ ID NO.21),multi45』-GATTGGGTCCCTACGTAGTTAACACTATAGGCCATCGTTTAC-3』(SEQ IDNO.22)100μl PCR反應物含有每個引物各50pmol、150ng 3kb EcoRI片段、1×Pwo緩衝液,dATP、dCTP、dGTP和dTTP各200uM,和5單位Pwo DNA聚合酶。所用的PCR條件與上面列出的條件相同。將該擴增子亞克隆至pCR-Blunt載體中。按以上所述分離0.62kb NheI/PpuMI片段。
從pDM194分離含有尖鐮孢胰蛋白酶啟動子3』末端、Humicolalanuginosa脂酶基因(Geneseq核苷酸登錄號N91076)、和尖鐮孢胰蛋白酶終止子5』末端的2.3kb BcuI/NheI片段。
將該0.25kb NotI/BcuI片段、2.3kb BcuI/NheI片段和0.62kbNheI/PpuMI片段一起克隆在用NotI部分消化和用PpuMI完全消化的pDM194中,產生pDM218(圖8)。實施例14質粒pMWR60的構建質粒pMWR60來源於pEJG25A表達載體。pEJG25A是按如下步驟通過在pDM181(實施例11)中插入一段來自Peniophora lycii的肌醇六磷酸酶編碼序列(WO 98/28408)構建的首先,設計了兩個合成的寡核苷酸引物(顯示於下),從質粒pA1phy2(WO 98/28408)模板通過PCR擴增Peniophora lyci肌醇六磷酸酶編碼序列。正向引物5』-ATTTAAATATGGTTTCTTCGGCATTCGC-3』(SEQ ID NO.23)反向引物5』-TTAATTAACTATTCCGACGGAACAAAGC-3』(SEQ ID NO.24)(粗體字母表示編碼序列)每個100μl Pwo聚合酶反應含有每個引物各50pmol、lng模板DNA、2μl 10mM dNTPs,1×Pwo聚合酶緩衝液,和2.5單位Pwo聚合酶。在PerkinElmer 9600型熱循環儀中按如下程序孵育這些反應物94℃2分鐘、55℃30秒和72℃1分鐘,1個循環;94℃15秒、55℃30秒和72℃1分鐘,9個循環;94℃15秒、55℃30秒和72℃1分鐘,15個循環,每個循環延長20秒;最後一個循環,94℃15秒、55℃30秒和72℃7分鐘;之後為一個4℃保溫循環。在1%瓊脂糖凝膠上100伏電泳該反應產物1小時。切下1.3kb條帶,並採用Qiaex II純化。隨後將該純化的PCR產物克隆在質粒pCR2.1(Invitrogen,Carlsbad,CA)中,用於轉化大腸桿菌TOP10細菌(Invitrogen,Carlsbad,CA)。從幾個轉化菌落中分離質粒DNA,並通過DNA序列測定進行分析以確保在PCR期間沒有引入突變。隨後用限制性內切酶SwaI和PacI消化一個肌醇六磷酸酶克隆。在1%瓊脂糖凝膠上100伏電泳這些片段1小時,將其切下並採用QiaexII純化。將1.3kb肌醇六磷酸酶基因片段與預先經SwaI和PacI切割的pDM181(實施例11)連接,產生表達質粒pEJG25A(圖9)。
為了除去5』側翼DNA中的外源接頭序列,採用Quick-ChangeTM定點誘變試劑盒以及下列寡核苷酸引物誘變pEJG25A,獲得載體pMWR60-Int2引物A5』-CTCTTGGATATCTATCTCTTCACCATGGTTTCTTCGGCATTCGC-3』(SEQ IDNO.25)引物B5』-GCGAATGCCGAAGAAACCATGGTGAAGAGTAGATATCCAAGAG-3』(SEQ IDNO.26)通過DNA序列分析驗證了這些設計的核苷酸變化。
然後用SfuI和NheI消化pMWR60-Int2,在1%瓊脂糖凝膠上100伏電泳該1.8kb片段1小時,將其切下並採用QiaexII純化。將該分離的片段與pDM218的SfuI-NheI載體片段連接,產生一個新的中間物,稱為pMWR60-Int3。用NotI切割該中間物,按以上所述純化5.35kb片段。將該純化片段與預先經NotI消化過的pSheB1(描述於實施例12)連接。所獲中間物命名為pMWR60-Int4a。然後用BspLU11I和NheI切割pMWR60-Int4a,並按以上所述純化5.25kb片段。該分離的片段與也經BspLU11I和NheI消化、並按上述純化的pSheB1連接。所獲載體產物命名為pMWR60(
圖10)。實施例15脂酶報導基因的製備為了構建稱為LIPOLASETM的Humicola lanuginosa脂酶(Novo NordiskA/S,Bagsvard,丹麥)的變體,根據廠家說明使用Chameleon雙鏈定點誘變試劑盒。
從pAHL(WO 92/05249)獲得編碼該LIPOLASETM酶的基因。根據廠家說明,利用引物7258將pAHL氨苄青黴素基因的ScaI位點改變為MluI位點,由此改變氨苄青黴素抗性基因中ScaI位點並換為MluI切割位點。引物72585』-GAATGACTTGGTTGACGCGTCACCAGTCAC-3』(SEQ ID NO.27)然後將含有LIPOLASETM基因的pAHL載體作為模板,和寡聚物7258和7770一起用於DNA聚合酶擴增,由此改變LIPOLASETM基因中的ScaI位點,而又不改變胺基酸序列位置。引物77705』-TCTAGCCCAGAATACTGGATCAAATC-3』(SEQ ID NO.28)通過加入含有期望突變的適合寡聚物,在LIPOLASETM基因中引入期望突變(例如半胱氨酸的引入)。
使用上述的定點誘變和以下引物構建含有編碼LIPOLASETM變體1S,E239C,Q249R的基因的質粒以下顯示的引物106659用於引入E99N,N101S。引物1075815』-CTTAACTTTGACTTGAAAAACATATCTGACATTTGCTCC-3』(SEQ ID NO.29)以下顯示的引物101782用於引入SPPCGRRP(-E)。引物1017825』-GGACGGCCTTGGCTAGCCCTCCGTGCGGCCGCCGGCCGGTCTCGCAGGATCTGTTTAAC-3』(SEQ ID NO.30)以下顯示的引物9639用於引入E239C。引物96395』-ATATCGTGAAGATATGCGGCATTGATGCCACC-3』(SEQ ID NO.31)以下顯示的引物8829用於引入Q249R。引物88295』-GGCGGCAATAACCGGCCGAACATTCCGGATATCCC-3』(SEQ ID NO.32)通過對該完整基因測序驗證了這些突變。所獲質粒命名為pEVi1163。實施例16pRaMB60的構建通過來自pMWR60的6.5kb SfuI-NheI載體片段與來自pSheB1的0.5kbSfuI-NheI片段連接,構建質粒pRaMB60。通過瓊脂糖凝膠電泳分離所有片段,然後採用BioRad Prep-a-Gene試劑(BioRad Laboratories,Hercules,CA)從凝膠切塊中將其純化出來。實施例17含有葡糖澱粉酶啟動子的表達載體pRaMB62的構建採用以下引物和Quick-ChangTM誘變試劑盒,通過質粒pFAMG的定點誘變產生單一BspLU11I位點引物15』-dCACTGCTATCACCAACATGTTTACTCAAGTCC-3』(SEQ ID NO.33)引物25』-dGGACTTCAGTAAACATGTTGGTGATAGCAGTC-3』(SEQ ID NO.34)通過DNA序列測定驗證該定點改變,所獲質粒衍生物命名為pMWR62-Int1。
接著,採用質粒pEVi1163作為模板並利用下列引物,通過PCR擴增實施例15中所述的脂酶報導基因,所述引物在該脂酶編碼區的起始密碼子附近引入一個BspHI位點,在終止密碼子之後引入一個PacI位點正向引物5』-GACTCATGAGGAGCTCCCTTGTGCTGTTC-3』(SEQ ID NO.35)反向引物5』-TGATTAATTAACCTAAAGACATGTCCCAATTAAC-3』(SEQ IDNO.36)該PCR反應物由1μl模板DNA(10ng)、1μl正向引物(77pmol)、1μl反向引物(81pmol)、10μl 10×Pwo聚合酶緩衝液、16μl 1.25mM dNTP混合物、和1μl(2.5個單位)Pwo聚合酶組成。採用以下溫度設置在Perkin-Elmer 480型熱循環儀中孵育該反應物94℃5分鐘1個循環;95℃1分鐘、47℃1分鐘和68℃2分鐘,30個循環;以及4℃保溫循環。
然後用BspHI和PacI消化該擴增產物,通過瓊脂糖凝膠電泳純化(實施例16),之後和pRaMB60的5.8kb PmeI-NcoI片段以及pMWR62-Int1的2.1kb StuI-BspLU11I片段一起用於三部分連接。所獲載體命名為pRaMB62(
圖11),含有處於Fusarium venenatum葡糖澱粉酶啟動子控制下的脂酶報導基因。實施例18含有「Daria」啟動子的表達載體pRaMB64質粒的構建採用PCR和以下設計分別在啟動子片段的5』和3』末端引入SwaI和BspLU11I位點的引物對,擴增稱為「Daria」啟動子的pECO3啟動子區域(實施例10)引物15』-GCATTTAAATTACTACTGTGATGTG-3』(SEQ ID NO.37)引物25』-GATTGATGTGAAACACATGTTGATG-3』(SEQ ID NO.38)該PCR反應物由1μl pECO3(10ng)、1μl正向引物(50pmol)、1μl反向引物(50pmol)、10μl 10×Pwo聚合酶緩衝液、16μl 1.25mM dNTP混合物、和1μl(2.5個單位)Pwo聚合酶組成。採用以下溫度設置在Perkin-Elmer 480型熱循環儀中孵育該反應物95℃5分鐘1個循環;95℃1分鐘、47℃1分鐘和68℃2分鐘,30個循環;以及4℃保溫循環。
該0.9kb PCR產物在1%瓊脂糖凝膠上100伏電泳1小時,切下並採用Qiaex II純化。
將該擴增DNA片段亞克隆至pCR2.1(Invitrogen,Carlsbad,CA)中,然後通過SwaI、BspLU11I、EcoRI和XhoI限制性酶切割進行分析以驗證其正確性。以此方式產生的質粒命名為pECO4,用SwaI和BspLU11I消化之,並按實施例16所述方法通過凝膠電泳純化該0.9kb啟動子片段。將該純化片段與pRaMB60的5.8kb PmeI-NcoI片段以及編碼該脂酶報導基因的0.9kb BspHI-PacI片段混合進行三部分連接。該連接產物pRaMB64(
圖12)含有指導該脂酶報導基因表達的「Daria」啟動子。實施例19含有來源於液泡相關蛋白質基因的啟動子的表達載體pRaMB66質粒的構建採用下列引物通過PCR擴增來自編碼推測的液泡相關蛋白質的pQUINN(實施例10)的啟動子片段,所述引物在該啟動子的5』和3』末端分別引入SmaI位點和NcoI位點引物15』-dCGACCCGGGAATTAGAGAGGTTAGG-3』(SEQ ID NO.39)引物25』-dCGTATAACCCATGGTGGACTTGTCGGAC-3』(SEQ ID NO.40)該PCR反應物由1μl pQUINN(10ng)、1μl正向引物(50pmol)、1μl反向引物(50pmol)、10μl 10×Pwo聚合酶緩衝液、16μl 1.25mM dNTP混合物、和1μl(2.5個單位)Pwo聚合酶組成。採用以下溫度設置在Perkin-Elmer 480型熱循環儀中孵育該反應物95℃5分鐘1個循環;95℃1分鐘、47℃1分鐘和68℃2分鐘,30個循環;以及4℃保溫循環。
該3.1kb擴增DNA片段在1%瓊脂糖凝膠上100伏電泳1小時,切下並採用Qiaex II純化。
將該3.1kb擴增DNA片段亞克隆至pCR-Script(Stratagene,LaJolla,CA)中,產生中間質粒pQUINN-啟動子A。從該質粒分離兩個限制性片段一個2.4kb SmaI-NdeI片段,和一個0.7kb NdeI-NcoI片段(這兩個片段一起包括了該完整啟動子區域)。將該分離片段與pRaMB60的8kbPmeI-NcoI片段和前面實施例中所述編碼脂酶報導基因的0.9kb BspHI-PacI片段混合進行四部分連接。該連接產物pRaMB66(
圖13)含有處於推測的液泡相關蛋白質基因啟動子轉錄控制之下的脂酶報導基因。實施例20在Fusarium venenatum中表達位於AMG、「Daria」和液泡相關蛋白質的啟動子控制下的脂酶報導基因通過用從添加了2.5%葡萄糖和2.5mM硝酸鈉的1×Vogels培養基平板(2.5%純淨瓊脂)獲得的10個孢塞(plug)接種一個含有500ml RA孢子形成培養基的三角瓶中,28℃、150rpm孵育2-3天,產生Fusariumvenenatum CC1-3(MLY-3)的孢子。通過Miracloth(Calbiochem,San Diego,CA)收穫孢子,並在Sorvall RC-5B離心機(E.I.DuPont De Nemours andCo.,Wilmington,DE)內以7000rpm離心20分鐘。用無菌蒸餾水洗滌沉澱的孢子兩次,重懸在少量水中,然後採用血細胞計數器計數。
通過將4×107個Fusarium venenatum CC1-3孢子接種在100ml YEPG培養基中,於24℃、150rpm孵育16小時,製備原生質體。培養物在SorvallRT 6000D(E.I.DuPont De Nemours and Co.,Wilmington,DE)中以3500rpm離心7分鐘。用30ml 1M MgSO4洗滌沉澱兩次,並重懸在15ml含有5mg/mlNOVOZYME 234TM(batch PPM 4356,Novo Nordisk A/S,Bagsv rd,丹麥)的1M MgSO4中。培養物於24℃、150rpm孵育,直到原生質體形成。向原生質體消化物中加入35ml體積的2M山梨糖醇,該混合物以2500rpm離心10分鐘。重懸沉澱,用STC洗滌兩次,並以2000rpm離心10分鐘沉澱原生質體。用血細胞計數器計數原生質體,並將其重懸在8∶2∶0.1的STC∶SPTC∶DMSO溶液中至終濃度1.25×107個原生質體/ml。在NalgeneCryo 1℃冷凍箱(VWR Scientific,Inc.,San Francisco,CA)中控制速率地進行冷凍後,將該原生質體保存在-80℃。
在冰上融解冷凍的Fusarium venenatum CC1-3原生質體。在各個50ml無菌聚丙烯管中加入5-10μg pRaMB62、pRaMB64和pRaMB64(描述於實施例17-19中)以及5μl肝素(每ml STC含5mg).每管加入100μl原生質體,輕柔混合,並在冰上孵育30分鐘。加入1ml SPTC並在室溫孵育20分鐘。加入25ml 40℃COVE頂層瓊脂糖後,將每管中的混合物鋪在空的150mm直徑平板上,並於室溫孵育過夜。大約24小時後,在平板頂部再鋪上含有10mg BASTATM/ml的另外25ml 40℃ COVE頂層瓊脂糖,並在室溫孵育長達14天。除草劑BASTATM中的活性成分是膦絲菌素。BASTATM從AgrEvo(Hoechst Schering,Rodovre,丹麥)獲得,並在使用前用酚∶氯仿∶異戊醇(25∶24∶1)抽提兩次,用氯仿∶異戊醇(24∶1)抽提一次。
從篩選平板(COVE底層,COVE-BASTATM覆蓋層)直接挑取轉化體至含有25ml添加了1mM CaCl2和100μg/ml氨苄青黴素(防止細菌汙染)的M400Da培養基的125ml搖瓶中,並於28℃、200rpm在平臺搖床上孵育7天。還包括未轉化受體株作為陰性對照。
在第7天從搖瓶取樣。通過離心除去細胞,然後將每個上清樣品10μl與等體積Tris-甘氨酸樣品緩衝液(Novex Experimental Technology,San Diego,CA)一起加熱至95℃5分鐘。在10-20%Tris-甘氨酸梯度凝膠(Novex Experimental Technology,San Diego,CA)上分離變性的上清液蛋白,並用考馬斯蘭染色。SDS-PAGE分析顯示,產生脂酶的轉化體分泌一種表觀分子量為大約43kDa的主要多肽。
相似地,採用對硝基苯丁酸作為底物分析來自每個轉化體的無細胞培養液的脂酶活性(Royer等,1995,同上)。
結果顯示於表1,這些結果表明,採用存在於pRaMB62、pRaMB64和pRaMB66中的Fusarium venenatum啟動子元件表達並分泌了活性脂酶。
表1
實施例21比較處於Fusarium venenatum澱粉葡萄糖苷酶啟動子和尖鐮孢胰蛋白酶啟動子控制之下的Humicola lanuginosa脂酶報導基因的表達將按實施例20所述製備的含有pRamB64(實施例17)或pDM218(實施例18)的Fusarium venenatum CC1-3轉化體,於pH6.25含有適合碳源、氮源和痕量金屬源並補加了尿素或磷酸銨作為飼料的2升發酵罐中,29℃、1200rpm培養180小時。採用對硝基苯丁酸作為底物(Royer等,1995,同上)在180個小時內每隔18-24個小時分析每個發酵物的無細胞培養液的脂酶活性。
圖14顯示了在Fusarium venenatum中處於Fusarium venenatum澱粉葡萄糖苷酶(pAMG)啟動子或尖鐮孢胰蛋白酶(pSP387)啟動子控制下的Humicola lanuginosa脂酶報導基因表達的比較。結果說明,無論在飼料中採用尿素還是磷酸銨作為氮源,採用Fusarium venenatum澱粉葡萄糖苷酶啟動子比採用尖鐮孢胰蛋白酶啟動子可以獲得更高水平的脂酶活性。而且,當在飼料中採用磷酸銨時,觀察到更高的脂酶活性水平。
生物材料的保藏如下生物材料已根據布達佩斯條約保藏在農業研究機構保藏中心,1815 University Street,Peoria,Illinois,61640,並給予了如下保藏號保藏物 保藏號 保藏日期大腸桿菌TOP10(pECO3) NRRL B-300671998年10月27日大腸桿菌TOP10(pFAMG) NRRL B-300711998年10月27日大腸桿菌DH10B(pQUINN) NRRL B-300761998年10月27日大腸桿菌TOP10(pFB0346)NRRL B-300731998年10月27日這些菌株在如下條件下保藏,即確保在本專利申請未決期間由專利和商標局局長依照37 C.F.R.§1.14和35 U.S.C.§122授權的人可獲得該培養物。該保藏物代表該保藏菌株基本上純的培養物。如果在本主題申請的等同申請或其派生申請提出的國家該外國專利法要求,可以獲得該保藏物。但是,應當理解,可獲得保藏物並不構成以損失政府法令所授予專利權利而實施本主題發明的許可。
本文描述和要求保護的本發明的範圍並不被本文公開的具體實施方案限制,因為這些實施方案旨在用作本發明幾個方面的舉例說明。任何等同的實施方案都包括在本發明的範圍中。實際上,從前面的描述來看,除了本文給出和描述的之外本發明的各種修改將為本領域技術人員所明了。這些修改也包括在所附權利要求的範圍內。在衝突的情況下,包括定義在內的本公開將優先。
本文引用了各種參考文獻,它們的公開以參考文獻的方式完整地併入本文。
序列表110Randy M.BerkaMichael W.ReyKimberly Brown120用於在真菌細胞中表達基因的啟動子1305611.204-WO140等指定1412000-03-2215009/274,4491511999-03-2216040170FastSEQ for Windows Version 4.021012116050212DNA213鐮孢黴屬4001aatttcgtcg atagcgaggg actcctggcc ctcgaattta gttagcgtat cagtgtaaag 60tgctgggttc tccaggcgta agtaaattga accagatgtt agctcccaga tttcgccccg 120aagccggttg ggcagaccaa cgcggataag tttatggaaa gttggttggc ggatcaatgt 180aaagttcctg ccattgtcac gcagatactc ggcccaaaga cgcatctttg ccctatcgcg 240caactttttt gggtccccag gatatcggaa gagcattcct aagccagcat ctggtgggag 300atcgttcttc ttatcttcgg ttcttaaaag atgttcagag taacactcag cagcaactcg 360acgcaacttg gctacgttgc caacgcctgc tctaagaccc ttcttgaggc cgtcacagaa 420acgttcgcag gactgtctgg ttccagcgag atggattgtt atgcgttgtt ctcgggggtc 480tctcttgtct ttagaggtat cggcaagaag gccattccac gtagtcagag cgagtgcgaa 540ctataaccag gcaacgtcag aatttgtacc atgcaagatt tttataccac atacctggaa 600gttctggcta ttcaagcgct ctacccttcg tatagcacat aaaggaaatg tgaatccatt 660gccactgggt cctcctccgt gtgtctggcc ggtaaaagcg gtcgaggttg aaaggctagc 720agattgcaca aagctagtgg gtgttgttga gaagcacatg taatgctctg acaggtgtag 780cttgccagca taatgccatc ctcgatcgtg atccttatca ccgtgagtag cgttggaggg 840cgggatagta agctcggcgt tgatctcgta gaggggcgcc tgagaggcgg gcaagcgaaa 900ttggctctga aatagcgatg actttgaggg attccgatct gaactggata gattgagccc 960ctgggtagga tcgataagct gctgggcttt ttgaacgatg ttggtgaagt tcgaaaacat 1020gatttcggtc agcggcgcat gacgaggggg gttccggtcc aggagggagg tcgcggctga 1080gcttgaagga gatgcaagac acgaagcgaa agacacgaag agagcgcaag agtctgagta 1140tgtgcaacca ggctcgaata agtgcaaggc aggcagaagt acggaataga cgatagaatt 1200gagtatagaa aggctgaatg gaagatggag acgagttata ggacggtgga gatagagtgg 1260agttgaagtt gaacgaagct gcgtcaggtc cagatacggg agactggcca tcaactactg 1320gccaggtagc cagggcgcga tgggcgggtg ggcagggtcg cgggggggac ctcagggcat 1380tcctttctcc aagggccgct ggggctatgg acggggctgg ctgaactcca gccgtcatgg 1440gatagcggtg caagagatca ggtactaagt ctaccatgat aatttagggg gcagagaaaa 1500atgatatatt tgtttagtag taagcgggtt tttacagttg aggaaccaac cttcttcatt 1560tatttattct ttctttctct gcaattcagt cctttttctt aaatagaata tctaccaatg 1620gaacggcgtg gctgaagtgg ctgaagaata tagctcgagc tgtcaaaccg ctcatcctac 1680taccctaggt ataaagctgg gaactaagac tcatttctat ccaactcatc atattgggag 1740ttagtgtaga cctgtcggcc tagagaatat gtgtatctgc atactttcaa ataccctacg 1800tatacccact atgtttagca caatcattga cctctcaagg cctcacccat ctcaacacct 1860gtcgtgtgct cacttgacta cttctttgaa ccagctcgcc atcggactag tcgaacaagc 1920ttgtcgcccc catacagatg aatgtatgtt taaagctaca tgatcagcct gaaccgagca 1980taactcgagt gccgagactc ctctgatgta tatcgagatg aatgacaaac ctacgggtcc 2040gttcttgaga agtggcctga gatttctcac ttggtgagaa aaaggacggg cgagcgggag 2100cctgagtcag aagaaatacc tgtctccttg gatctcacat gacggtgttg tggaagagtg 2160catctattgt cattgctgga gtgacggcag agtaggggtc taaagaaacc catactgagt 2220agagatggag aagacaacaa aagcccaaga cgacagagac gacagaagat taaagctatc 2280agagcgagac tatatcacta ttcgaaacct gcgagtaatt taacaagaag tacacatcat 2340cattgttatc aattcgacga agacatggtc gaaaattctt gcggtgtata tgtctgttgt 2400atatgggcct gggcattgtt atttttcgcc gtctttatgt gtactaacac ttccattgat 2460accccagaac aaaagatgaa cgcttaaaca gcaccaaaat caggagaaga atggcgctgc 2520tctaggtatg cttctgggat aaaaagcgat gttgatacct ctcagaaaag aagtgatttg 2580aagttgaatc aaacaaatag ccgatggagc gatctgaagg ggtggcagac ctgctacgcg 2640catttaggca aggcatcaac tcggcagatg attaagaaag gttttgtagg ttcacgtgtt 2700gtgttgtgtt ccattataag tttataacct tgctaagatg caacgactct gacctcaggg 2760tgttagaaaa attgaccact aggagcataa gtgacgaaat tcggggatca agacaataga 2820tagtttcatt ttcatgtgct cctacgtctt ttcacgtaat gtttcttata aaaaaaaaga 2880tagcattgtc tctttggtga aaagagaaaa aaagatgtta cgacgtggcc ttgattcgaa 2940cagacgcctc cgaagagaat agatttctag tctatcgcgt tagaccactc cgccaccacg 3000ccttacgtaa tctgtgattg ttgaaagtta ctctcgtgtt acggtctata cgtgaagaat 3060ctacacttga cgagtctcga ggtctggggt cagttagacg gaaatgggag aacaaagaga 3120cttggtgaca ttgcaggcaa ccgggtagat gttgaggtca ttgatcggac aagattgttg 3180cttcaaaagt aacaggtatt ctttttttta atcaacagaa acgttccatg ttcatttgtt 3240aatccaatct atttgtgata gcgtttgatg acaaacaata ataatgatgg tctggcggct 3300agtgatcgtt tgtaatgacg tcgtcatata tcctatcact atacagttgc tttgcacacg 3360cactcacgtc cttcattcgt tgtcttcact atttgatggt gatttggttc aacaacctac 3420agaaataatg acctgtggtg ttctccgaat atggctagac caacacaagc ttgtaccgcg 3480gcattcaaat caccatgtga tgcccatcat cagatcatcc accaacccaa aaacagacca 3540actactcaca aaaaggcatc tcatcaagaa aaaacggcca actaacgtcc aaaaggcccg 3600aaaaacgtcc atcacgccgc agccgagact tcaatagact gcacaagaag gaccgatgag 3660atcgaccaga ctaaacccgg gagagtgtca aatatgcggg ggattgggga acttacccca 3720gaaaagagaa ggaggataaa ttccatgtct ggggttgacg tctctattgg ttagacacga 3780acgcctgctc tcggcgtaat ttataccata gcgccaatga gggcggaaac tcctgttttg 3840tcaagtcgtc attgttggtt gggtcatgat atatagccag taggtatccg tcttggtgat 3900tgaccagaca tatcgctcat cacagatcaa catcactgct atcaccaaca tgcttactca 3960agtcctttat ggcttggtag ccagtgccct ttggcaaggc caagtcgttg catcaccaag 4020caaggacaat tcactggagc gcttcattga caaacaagct gatatttcta tcaagggtgt 4080ccttgctaat attggcgctg atggaaaaag ggcacagggt gcagcgcctg gtgctgttgt 4140ggcaagtcca tcgaaagaag atcctgattg taagccagca tcctaccttg tccttgtccg 4200catgctaatg atggtctcag attggtacac ttggactcgt gactctgctt taacgtacaa 4260agtgctcgtt gagagattca tccacggcga caaatctctc caacgaaaga tagatgaata 4320tgtctccgca caagcgaaac tgcaagggac cacaaatcca tcgggcagcc cagagtcggg 4380cggtctcggc gagccaaagt tccatgtgaa tctcactgct ttcactggat cttggggtcg 4440gcctcagcgc gacggccctc cgcttcgggc taccgccttg actctgtatg cagaatggct 4500catttcccac ggcgaaagat ccaaggcttt gaacaaagtc tggccagtca tcgagaagga 4560ccttgcgtat actaccaagt tctggaatcg cactggctat gatctatggg aggaggttaa 4620tggatcttct ttctttacac tttcggcttc gcatcgtgct cttgtcgaag gtgccgctct 4680ggctaagaaa cttggcaaat cttgtcctga ctgtgtcacc aacgctcctc gcgttctgtg 4740cttccttcag actttctgga ctggtggcta cgttgactcc aacattaacg tcaaggatgg 4800tcgcaagggt ctcgatgtca actccatcct ctcgtccatt catacattcg atcccaactc 4860caagtgcacc gactcgacgt tccagccttg ttcacccaga gctcttgcga accacaaggc 4920ggtcgtcgat tctttcaggt caatctatgg tgtcaacaag aatagaggtc aaggcaaggc 4980cgcggctgtt ggtcgatata gcgaggacgt gtactatgat ggcaaccctt ggtacctggc 5040cactcttgct gctgcagaac aactctacgc tgcggtctac cagtgggata agcttggcgc 5100tgttactgtt gacgatgtat ctttgtcttt cttcaaggat atcgttccca aggtctccaa 5160aggcacttat gccaagaaga ccaagacata caaggagatc atcaaagcag ccaagactta 5220cgccgacggc tttgtcgctg tcgtgcagac atacactccc aaggacggct cactagctga 5280gcaatttgac aagtcaactg gagcccccaa gtccgctgtt cacctcacct ggtcctacgc 5340cgcctttgtc gccacaactg aacgtcgcga cggcatcatc tctccctcct ggggcgaaag 5400cagcgccaac aaggtccccg ccgtgtgtca agctgcccca gcatgtgaca caaccatcac 5460cttcagtgtc aagaacgtgc aagtttcatc cgaccaaaag gtttacgtgg ttggctcagt 5520gactgagctt tctaactggt cacctgatga tggcattgcg cttacgccat ctagttccgg 5580agtgtggagc gtcaaggtta agattccttc tgatacaagc tttgagtaca agtatatcaa 5640gaagactagc agtggggatg ttacgtggtt gagtgatccc aacaaccggg ctattacggg 5700tagcaagtgt ggaagtacaa gtactcttga tgatgagtgg aggtagtgga tgacagattt 5760atcaagctat gtagttttgt gaatatataa ttatccaaat tatcagggtt cggtaagaat 5820ataattcagt tcagcagtct gtacaagcaa gccatgattc acgcttcctt cgtttggaag 5880ataagggttc ctcgccaccg tcaagataat tttctcgtgc taatatcacg taatccatct 5940gcattaaacc cttgccggga aggtttcttc aacccagcaa ccccagagta actcggagat 6000agggaagtct atttgcctta tcctccgtga cgaattccct gaacccaatt60502102211200212PRT213鐮孢黴屬4002Met Arg Phe Thr Ser Ile Leu Ala Ala Gly Ala Phe Ala Thr Met Ala1 5 10 15Ala Ala Gln Ser Lys Thr Val Ser Leu Asp Pro Ala Gln Gln Ser Gln20 25 30Ala Asp Cys Leu Ser Asp Cys Glu Pro Gly Asp Val Lys Cys Gln Ser35 40 45Tyr Cys Ile Thr Val Pro Ser Pro Asp Glu Lys Asn Ile Glu Glu Thr50 55 60Thr Lys Cys Cys Leu Pro Pro Ala Pro Arg Ala Arg Ala Pro Lys Ala65 70 75 80Asp Thr Glu Lys Tyr Thr Val Cys Met Asn Glu Cys Ile Ala Asp Asn85 90 95Tyr Trp Lys Ser Val Asp Gly Thr Pro Arg Gly Thr Asp Val Pro Asp100 105 110Val Lys Ser Lys Ala Ser Glu Ala Ala Ser Ser Ala Ala Glu Lys Ala115 120 125Thr Ala Thr Gly Thr Ala Ala Glu Ser Asp Ala Thr Ala Thr Gly Ala130 135 140Ser Ala Thr Glu Ser Glu Ser Gly Ser Asp Ser Ser Ser Glu Glu Thr145 150 155 160Gly Ser Ala Ser Gly Thr Ala Thr Gly Thr Ala Ala Glu Val Ser Glu165 170 175Thr Gly Asn Ala Ala Ser Ser Leu Val Gly Gly Val Ser Phe Leu Gly180 185 190Leu Val Ala Ala Ile Phe Ala Leu195 2002103211581212PRT213鐮孢黴屬4003Met Leu Thr Gln Val Leu Tyr Gly Leu Val Ala Ser Ala Leu Trp Gln1 5 10 15Gly Gln Val Val Ala Ser Pro Ser Lys Asp Asn Ser Leu Glu Arg Phe20 25 30Ile Asp Lys Gln Ala Asp Ile Ser Ile Lys Gly Val Leu Ala Asn Ile35 40 45Gly Ala Asp Gly Lys Arg Ala Gln Gly Ala Ala Pro Gly Ala Val Val50 55 60Ala Ser Pro Ser Lys Glu Asp Pro Asp Tyr Trp Tyr Thr Trp Thr Arg65 70 75 80Asp Ser Ala Leu Thr Tyr Lys Val Leu Val Glu Arg Phe Ile His Gly
85 90 95Asp Lys Ser Leu Gln Arg Lys Ile Asp Glu Tyr Val Ser Ala Gln Ala100 105 110Lys Leu Gln Gly Thr Thr Asn Pro Ser Gly Ser Pro Glu Ser Gly Gly115 120 125Leu Gly Glu Pro Lys Phe His Val Asn Leu Thr Ala Phe Thr Gly Ser130 135 140Trp Gly Arg Pro Gln Arg Asp Gly Pro Pro Leu Arg Ala Thr Ala Leu145 150 155 160Thr Leu Tyr Ala Glu Trp Leu Ile Ser His Gly Glu Arg Ser Lys Ala165 170 175Leu Asn Lys Val Trp Pro Val Ile Glu Lys Asp Leu Ala Tyr Thr Thr180 185 190Lys Phe Trp Asn Arg Thr Gly Tyr Asp Leu Trp Glu Glu Val Asn Gly195 200 205Ser Ser Phe Phe Thr Leu Ser Ala Ser His Arg Ala Leu Val Glu Gly210 215 220Ala Ala Leu Ala Lys Lys Leu Gly Lys Ser Cys Pro Asp Cys Val Thr225 230 235 240Asn Ala Pro Arg Val Leu Cys Phe Leu Gln Thr Phe Trp Thr Gly Gly245 250 255Tyr Val Asp Ser Asn Ile Asn Val Lys Asp Gly Arg Lys Gly Leu Asp260 265 270Val Asn Ser Ile Leu Ser Ser Ile His Thr Phe Asp Pro Asn Ser Lys275 280 285Cys Thr Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg Ala Leu Ala Asn290 295 300His Lys Ala Val Val Asp Ser Phe Arg Ser Ile Tyr Gly Val Asn Lys305 310 315 320Asn Arg Gly Gln Gly Lys Ala Ala Ala Val Gly Arg Tyr Ser Glu Asp325 330 335Val Tyr Tyr Asp Gly Asn Pro Trp Tyr Leu Ala Thr Leu Ala Ala Ala340 345 350Glu Gln Leu Tyr Ala Ala Val Tyr Gln Trp Asp Lys Leu Gly Ala Val355 360 365Thr Val Asp Asp Val Ser Leu Ser Phe Phe Lys Asp Ile Val Pro Lys370 375 380Val Ser Lys Gly Thr Tyr Ala Lys Lys Thr Lys Thr Tyr Lys Glu Ile385 390 395 400Ile Lys Ala Ala Lys Thr Tyr Ala Asp Gly Phe Val Ala Val Val Gln405 410 415Thr Tyr Thr Pro Lys Asp Gly Ser Leu Ala Glu Gln Phe Asp Lys Ser420 425 430Thr Gly Ala Pro Lys Ser Ala Val His Leu Thr Trp Ser Tyr Ala Ala435 440 445Phe Val Ala Thr Thr Glu Arg Arg Asp Gly Ile Ile Ser Pro Ser Trp450 455 460Gly Glu Ser Ser Ala Asn Lys Val Pro Ala Val Cys Gln Ala Ala Pro465 470 475 480Ala Cys Asp Thr Thr Ile Thr Phe Ser Val Lys Asn Val Gln Val Ser485 490 495Ser Asp Gln Lys Val Tyr Val Val Gly Ser Val Thr Glu Leu Ser Asn500 505 510Trp Ser Pro Asp Asp Gly Ile Ala Leu Thr Pro Ser Ser Ser Gly Val515 520 525Trp Ser Val Lys Val Lys Ile Pro Ser Asp Thr Ser Phe Glu Tyr Lys530 535 540Tyr Ile Lys Lys Thr Ser Ser Gly Asp Val Thr Trp Leu Ser Asp Pro545 550 555 560Asn Asn Arg Ala Ile Thr Gly Ser Lys Cys Gly Ser Thr Ser Thr Leu
565 570 575Asp Asp Glu Trp Arg58021042114047212DNA213鐮孢黴屬4004aattagagag gttagggatt tcacatggcc accaatggga aggaggcaac catctgcacg 60agcccaccaa gtcatctcct caaactgtgc tgcgactaag aatttgattc cggttctggc 120ctggcctttg tatcagctag gtcattctcg actaccggag gccaggctga agcagtcagt 180cacgcattgt cactttatcg gtcctgtcct catacggata cactaggcgt caatgggctt 240caaacggaga tccagagatc tcatgaagag catcgacgat aaagtgagtg gttggggata 300ctgtgcggtg ccgaccccag cggcagccag gttccaccct tgattacatg gttgaaaagt 360ggcgttactg ggcgagatca aatttggcat gtatgttcgt ccaatgacgc gagctctcca 420tgttgctgcg agggtcagga acggaccagc atgggatcag tgaggtgaaa tccaaccgag 480ggagagcgag atctttgtgc tcatatccat gctgccatgc tacgtgccga acaggccaga 540tggcgttcaa ctcagtcgac caggtccgat gaacgcggag cggtgacgag atcgaagctt 600catctatcgc ttacggggtt atgttccact ttccattaac gtttgcgagt tgctgtttga 660gagccatgtc gaaagcatgg accgtgtcac atctttcaag gtaaatctgg aggtgggaag 720aagaattgcg aggaacagga tgggaggata gcaggctgac gcggaaagct aggtagctac 780ctggctgatt actggctaaa gctggagagc aactaggtaa tatcaggcaa agagctccaa 840gagctattgg gaggctggct gattgtctct ggctgagacg caggaggaag ggttaaaatg 900gccggcaggc caagaagggg ctgcaaaaca cggagtggat ggtggggcct cccacatacg 960ggattcgggc tgcggatcta acctcaattt ggcaagaggt aaataggacg acatgcaggc 1020cccctgacat gtaaacaaga caagtggtaa acaagccatc aacatcaaca agagcgaaca 1080atcgacacac ccatgggggt gagatatggt agtaaggcag agagagatca gggcagcata 1140cgtgggaaag ggctgggcaa gaaaggacac aacggatcaa cagaacgcag cgctaccgag 1200ggagcaacac aagtacagta accgctcaca gaggcacaac tcgtccaatc ctgcccccgt 1260cttcaaaagc ccagtttcgt tctgagtcct gtccggtccc tcttctcctc ctactccctc 1320caattatcgc catccacatc gacatcgtca attcacaacc tcacccagac aagaagaaaa 1380gaacgactga aggccttcgc tcgccatcac ccgattcttt tccattctct tcgacttttg 1440tttcgtagga acaagagcca gagaacttct tgtcatcctt tcgaatttcg gaaggttgta 1500tgagaagctt ctctcgcgcc agcaaaagtc gcaaatctgg actttgaggc acgcgtcccc 1560gttcccttca gcatcttccc atcgacatat cgggaatccg aatcccacac acagaccgtt 1620accgaaacaa agatacacga agaggttgag atcaaacccc aacagcccga agccggacgg 1680gaaggtgaaa tatcttctgt ctccgtcacc gccgaacagg tccctcctcc tcgtcaagag 1740caagagttta tcgaagaaga ggtccatatt acgcgtgaag aagaacatta ccaccgtccc 1800ggtgtccaaa aattcgagca cgaagacttt actatccgtg aagactcccg acggtacgtt 1860cgattttaca tttcctttca tctccattta ggtcgcatct ttttcgttac ttttttggtc 1920aattacacgg gggatacgat tttcccacgg tcggagaaag ccctgcttgc tctctatgcc 1980taggtctgta ttctctcatc cctctgcgct gatctggcca tggagacgtg tgagaacaag 2040actacaattc atcacatcat ttttcgctag gcgaaagcaa ttaccgttgt ccccgacctt 2100ctcccaacca tcagttttca ctttcccttt tcttggtctg gcttgccttg accattaccc 2160accgcgcacg gagcgcttca gtccccagcc atcccattct cacatcactt ctcatatcct 2220ctcttcacac gcctcacaca cccaccccct gcatgctacc atgccaaccc acttcagctt 2280ggctggatac ccaatttgct ttgcttcctc cccggctcac tagcgcctct aagcctgctg 2340gcctgagcaa ggcggtggag ctatctcagg ggccgccgcc tcccgttgcc atatgatacg 2400caaacgactt actatagaca tccatcagct aacccagaca aatctagacc tcaacctccc 2460tctcaatacc aaccttccca gtaccaccaa ccttcccact accaaccacc tcccaaattc 2520caaacttctc acactcacgt agagatcgac acccaccgtc atccctacta ctccaccccc 2580attgatctcg ctgaacgtga ataccgccag cgttaccgcc ctgcccaagc tttttccaca 2640gaagaccctt cttcccactc tcatcctcac taccaacctc aagacaactt caaagccaac 2700aactacaccg ttgaaggccg acccgctccc caattccatt cctctgagaa gactgaaatc 2760aacaagttta ctgttgacga acactcctct cgccctcagt acaaccacac cgagaagacc 2820gaattcaaca actacactgt tgacagccga tcttcccgtc ctcaatacaa cacctgtgag 2880aagactgaga tcaacaattt cactgttgac gcccgctctt cccagccacg gtaccgcgac 2940accaagacaa ctcaagtcaa cagctacgcc gttgacaagc ccgtttctcg tccatcttac 3000aagaaggacg tgagatttac tgaacaaacc gtcgaagctt caaagtccga caagtccaag 3060atgggttact acgacgacga gggtaagtga aatctgtcac ccagcgagcg ccatcaagct 3120ctctattcgt gacgcaattc aagctaaccc agtcaccagg ttctttccgc aacggcggca 3180tccacaagct cggtgacaag tcccgcgaca ttgaggttga cattcgcgag acttctcgtc 3240ctgccaatga ctgcgctccc aacaccgtca gcatcccctg ccaccacatc cgtctgggtg 3300atttcctcat gctccagggc cgcccctgcc aggtcatccg catctccacc tcctctgcca 3360ctggccagta ccgctacctt ggtgtcgacc tcttcaccaa gcagcttcat gaggagtctt 3420ctttcatctc caaccctgcc cccagcgttg tcgttcagtc catgctcggc cctgtcttca 3480agcagtaccg tgtcctcgat atgcaggagg gtcagatcgt tgccatgacc gagactggcg 3540acgtcaagca gggtctccct gtcattgacc agtccaacct ctactctcgc ctccacaacg 3600ctttcgagtc cggtcgtggc tctgttcgcg tcctcgtcct caacgacggt ggccgtgagc 3660ttgccgttga catgaaggtc atccacggct ctcgcctgta agcgtgttca actgttttct 3720gaattcgggc agccgcttgc aatgcgactt cttcccaatg tttaattgag tgaagggaca 3780gcactaccag tctcacctca actgtgggga gcgggtctgg gctgtctcta atcttacctg 3840tacaatgtca agtttcatag gggacctgtt gtgtcaagat ggttcgagtt ttgtttgtgt 3900caagattgga taaatgatat tggctagctg gaaatactgg agtcttttgt gtagatggga 3960gagttctgta catgaactat agtaattgac aattgattcc gcatctactt agcttttcat 4020tggtgctcta tgcccaacat gtgaatt 404721052112517212DNA213鐮孢黴屬4005aattactact gtgatgtgat cacacctaac taaataccta actcacccga tggatcgaca 60aggaaatctc acgcccttgt cgagtctcct ctttcgtctg tctcctgggc tcgctactgt 120ccgattgtaa ctctcgctct ccaacttgtt caactctaat aagtggtggc acaacgtgaa 180gatgtattgt tgtgtgaggc ggggggttgc gtggcattac caaagagacc aaaagtcccc 240ctatgtcgat ttgatggtgt tgcgttgcca tgatacggga ccccgaatat gttgtatgca 300tcatgcgtac agaaagctac tgttcaaaac gaacggcaaa gcggattgat caacccgtga 360aagaccatgg gtctctctca gtccacaatc ttctcttcct gatcaaattt atggatccaa 420gcggccacaa ttctagcgcc atcatgggtc cctttcctct tttcgctcac cccatgttcc 480ctgtcccacc tcattcagtg gacctgatgg atccctatcc cccgatgagc cggggggtgc 540agccttggcg ctctcttctt gttagtgtga cctactgttg atttcactca gcagtcctag 600agtccattta gttgggcctg gggtgatggg gtctgagact ttgcttcttg cctggtcttg 660tctagctcga atctgtgggt tgcctggcct ggcctggcct gacctgacct gaggggggtg 720cccctttgct ctgttctgca tatgttgcta ttagctacct actcgagaat tcataaaagg 780actgtccagc cccgtctctt actgacttct ttcctttccc tcttcaccct cgttgtcata 840tcaaatctgt cactcgttag accagactac cattcccact ttcgctttta aactacttta 900ctcaactaat tctaatacca actccaaaaa ccatcaacat gcgtttcaca tcaatcctcg 960ctgccggcgc tttcgccacc atggccgctg cccagagcaa gaccgtctcc ctcgaccctg 1020ctcagcagtc tcaggccgac tgcctctccg actgtgagcc tggcgatgtc aagtgccagt 1080cttactgcat cactgtatgt tacaacaacg attcccctgt catgtgtaga aaactaacaa 1140tcccaatagg ttccctctcc tgacgagaag aacatcgagg aaaccaccaa gtgttgtttg 1200ccgcctgccc caagggcaag ggctccgaag gccgacactg agaagtacac cgtttgcatg 1260aacgagtgta tcgccgacaa ctactggaag tccgttgatg gtaccccccg tggcaccgac 1320gtccccgatg tcaagagcaa ggcctccgag gctgcctcct ccgctgctga gaaggccacc 1380gccaccggta ctgctgctga gtctgatgct accgccactg gtgcctccgc tactgagtcc 1440gagtccggct ccgactccag ctccgaggag accggctctg cctctggcac tgccactggt 1500accgctgctg aggtctccga gactggtaac gccgcctctt ccctcgttgg tggtgtctcc 1560ttcctcggtc tcgttgccgc tatcttcgct ctgtaaattg ggtttcctgc tttaggataa 1620tctgatttgg catgacggag aaggatttaa tgggttttat tacagcggta atgattggag 1680tttggatttc aagatgtgac acgttggaca gcatgataag gcctacgggt ctgatcaatt 1740tcatggacaa attttgtttt tttgggtaat catttcgcgt tcacatatgg ctcggcatat 1800gagcatgaat acaatacctc ttttttgcgc ctcaattcat tccaatttct tgtgatctca 1860cagtgattca acttacaagt tgcggcgcga ccactgaggt cgtgtctgat gtgggtcttc 1920tgtttgtgat tggctcatga ttcccaatcg ggtgcttcaa acgttagttt gtaaacaagc 1980gaaatgaggg tcttaggatg catgttcaaa gcgcaaaacc caattgaatt caaatgttaa 2040agaatcatcg agaagagcga gttactgagg tgaatttgtg ctttcaactg tcaatacctc 2100cctcagaaca aatgaattga attattattc acactcaatg cccaatattc taaacatgtt2160cgttgtaaca gagttttaat tccttgacgc cacaatgttc cttggtaatt atcgcgcctg2220tcacatgaac tggctcctga acttaaacgt tggtgaccca gcaactcgtt tatcaggctt2280agggtagctg tcatacaaca aacaaacttg tacaattgat gttattgatg aatcatgtat2340agaagagcac aattgattta aacacagata aactggtcga accgatttta tcaggttgtg2400tgaacatgca ttgccgaatc agaaaccaga gtaagactat ctacagttcc atgaagacaa2460ttcacagact gccagaaagc aaggtactgg aagcacgaga gacaaaatta ttgaatt 25172106211187212PRT213鐮孢黴屬4006Met Gly Tyr Tyr Asp Asp Glu Gly Ser Phe Arg Asn Gly Gly Ile His1 5 10 15Lys Leu Gly Asp Lys Ser Arg Asp Ile Glu Val Asp Ile Arg Glu Thr20 25 30Ser Arg Pro Ala Asn Asp Cys Ala Pro Asn Thr Val Ser Ile Pro Cys35 40 45His His Ile Arg Leu Gly Asp Phe Leu Met Leu Gln Gly Arg Pro Cys50 55 60Gln Val Ile Arg Ile Ser Thr Ser Ser Ala Thr Gly Gln Tyr Arg Tyr65 70 75 80Leu Gly Val Asp Leu Phe Thr Lys Gln Leu His Glu Glu Ser Ser Phe85 90 95Ile Ser Asn Pro Ala Pro Ser Val Val Val Gln Ser Met Leu Gly Pro100 105 110Val Phe Lys Gln Tyr Arg Val Leu Asp Met Gln Glu Gly Gln Ile Val115 120 125Ala Met Thr Glu Thr Gly Asp Val Lys Gln Gly Leu Pro Val Ile Asp130 135 140Gln Ser Asn Leu Tyr Ser Arg Leu His Asn Ala Phe Glu Ser Gly Arg145 150 155 160Gly Ser Val Arg Val Leu Val Leu Asn Asp Gly Gly Arg Glu Leu Ala165 170 175Val Asp Met Lys Val Ile His Gly Ser Arg Leu180 185210721130212DNA213鐮孢黴屬4007gagctcgagg aattcttaca aaccttcaac 30210821147212DNA213鐮孢黴屬4008ttaattaagg tacctgaatt taaatggtga agagatagat atccaag47210921151212DNA213鐮孢黴屬4009tcaccattta aattcaggta ccttaattaa attccttgtt ggaagcgtcg a 512101021142212DNA213鐮孢黴屬40010tggtatgcat aagcttgaat tcaggtaaac aagatataat tt 422101121135212DNA213鐮孢黴屬40011cagtgaattg gcctcgatgg ccgcggccgc gaatt 352101221135212DNA213鐮孢黴屬40012aattcgcggc cgcggccatc gaggccaatt cactg 352101321134212DNA213鐮孢黴屬40013cacgaaggaa agacgatggc tttcacggtg tctg 342101421134212DNA213鐮孢黴屬40014cagacaccgt gaaagccatc gtctttcctt cgtg 342101521146212DNA213鐮孢黴屬40015ctatctcttc accatggtac cttaattaaa taccttgttg gaagcg 462101621146212DNA213鐮孢黴屬40016cgcttccaac aaggtattta attaaggtac catggtgaag agatag 462101721130212DNA213鐮孢黴屬40017atttaaatga tgaggagctc ccttgtgctg 302101821129212DNA213鐮孢黴屬40018ttaattaact agagtcgacc cagccgcgc 292101921145212DNA213鐮孢黴屬40019ataagaatgc ggccgctagt ttaaacttac aaaccttcaa cagtg452102021119212DNA213鐮孢黴屬40020tagcatctat ctccgtctt 192102121119212DNA213鐮孢黴屬40021gtgtgcagtg acccagaat 192102221142212DNA213鐮孢黴屬40022gattgggtcc ctacgtagtt aacactatag gccatcgttt ac 422102321128212DNA213鐮孢黴屬40023atttaaatat ggtttcttcg gcattcgc 282102421128212DNA213鐮孢黴屬40024ttaattaact attccgacgg aacaaagc 282102521144212DNA213鐮孢黴屬40025ctcttggata tctatctctt caccatggtt tcttcggcat tcgc 442102621143212DNA213鐮孢黴屬40026gcgaatgccg aagaaaccat ggtgaagagt agatatccaa gag 432102721130212DNA213鐮孢黴屬40027gaatgacttg gttgacgcgt caccagtcac 302102821126212DNA213鐮孢黴屬40028tctagcccag aatactggat caaatc 262102921139212DNA213鐮孢黴屬40029cttaactttg acttgaaaaa catatctgac atttgctcc 392103021159212DNA213鐮孢黴屬40030ggacggcctt ggctagccct ccgtgcggcc gccggccggt ctcgcaggat ctgtttaac 592103121132212DNA213鐮孢黴屬40031atatcgtgaa gatatgcggc attgatgcca cc 322103221135212DNA213鐮孢黴屬40032ggcggcaata accggccgaa cattccggat atccc 352103321132212DNA213鐮孢黴屬40033cactgctatc accaacatgt ttactcaagt cc 322103421132212DNA213鐮孢黴屬40034ggacttgagt aaacatgttg gtgatagcag tg 322103521129212DNA213鐮孢黴屬40035gactcatgag gagctccctt gtgctgttc 292103621134212DNA213鐮孢黴屬40036tgattaatta acctaaagac atgtcccaat taac342103721125212DNA213鐮孢黴屬40037gcatttaaat tactactgtg atgtg 252103821125212DNA213鐮孢黴屬40038gattgatgtg aaacacatgt tgatg 252103921125212DNA213鐮孢黴屬40039cgacccggga attagagagg ttagg 252104021128212DNA213鐮孢黴屬40040cgtataaccc atggtggact tgtcggac 28
權利要求
1.製備多肽的方法,包括(a)在有利於該多肽產生的培養基中培養真菌宿主細胞,其中該真菌宿主細胞含有編碼該多肽的第一核酸序列和與該第一核酸序列可操作地連接的、含有與第一核酸序列異源的啟動子的第二核酸序列,其中該啟動子含有選自下組的序列SEQ ID NO.1的第1-3949位核苷酸、SEQID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸,及其子序列;和它們的突變、雜合及串聯啟動子;和(b)從該培養基分離該多肽。
2.權利要求1的方法,其中該啟動子含有SEQ ID NO.1第1-3949位核苷酸或其突變、雜合或串聯啟動子的核酸序列。
3.權利要求2的方法,其中該啟動子含有SEQ ID NO.1第1-3949位核苷酸的核酸序列。
4.權利要求3的方法,其中該啟動子含有大腸桿菌NRRL B-30067中的質粒pECO3所包含的核酸序列。
5.權利要求1的方法,其中該啟動子含有SEQ ID NO.2第1-938位核苷酸或其突變、雜合或串聯啟動子的核酸序列。
6.權利要求5的方法,其中該啟動子含有SEQ ID NO.2第1-938位核苷酸的核酸序列。
7.權利要求6的方法,其中該啟動子含有大腸桿菌NRRL B-30071中的質粒pFAMG所包含的核酸序列。
8.權利要求1的方法,其中該啟動子含有SEQ ID NO.3第1-3060位核苷酸,其子序列;或其突變、雜合或串聯啟動子的核酸序列。
9.權利要求8的方法,其中該啟動子含有SEQ ID NO.3第1-3060位核苷酸的核酸序列。
10.權利要求9的方法,其中該啟動子含有大腸桿菌NRRL B-30075中的質粒pQUINN所包含的核酸序列。
11.權利要求1、2、5和8之任意一項的方法,其中該突變啟動子由含有一或多個核苷酸替代、缺失和/或插入的選自下組的啟動子組成SEQ IDNO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ IDNO.3的第1-3060位核苷酸,其中該突變啟動子比相應的啟動子具有較強或較弱的啟動子活性。
12.權利要求1、2、5和8之任意一項的方法,其中該雜合啟動子由兩個或更多個啟動子的部分組成。
13.權利要求12的方法,其中該雜合啟動子含有一或多個選自下組的部分SEQ ID NO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸。
14.權利要求13的方法,其中該雜合啟動子還含有另一啟動子的部分。
15.權利要求1的方法,其中該串聯啟動子由兩個或多個啟動子組成。
16.權利要求15的方法,其中該串聯啟動子含有兩個或更多個選自下組的啟動子SEQ ID NO.1的第1-3949位核苷酸、SEQ ID NO.2的第1-938位核苷酸和SEQ ID NO.3的第1-3060位核苷酸。
17.權利要求16的方法,其中該串聯啟動子還含有另一啟動子。
18.權利要求15的方法,其中該串聯啟動子的兩個或更多個啟動子同時啟動所述核酸序列的轉錄。
19.權利要求15的方法,其中該串聯啟動子的兩個或更多個啟動子中的一或多個在所述真菌宿主細胞的不同生長階段啟動所述核酸序列的轉錄。
20.權利要求1-19之任意一項的方法,其中該真菌宿主細胞含有一或多個拷貝的所述核酸序列。
21.權利要求1-19之任意一項的方法,其中該真菌宿主細胞含有一個拷貝的所述核酸序列。
22.權利要求1-21之任意一項的方法,其中所述核酸序列編碼與該真菌宿主細胞異源的多肽。
23.權利要求1-22之任意一項的方法,其中該多肽是激素或激素變體、酶、受體或其部分、抗體或其部分、或報導分子。
24.權利要求23的方法,其中該酶是氧化還原酶、轉移酶、水解酶、裂合酶、異構酶或連接酶。
25.權利要求23的方法,其中該酶是氨肽酶、澱粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖澱粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果膠溶酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、穀氨醯胺轉移酶或木聚糖酶。
26.權利要求1-25之任意一項的方法,其中該核酸序列包含在該真菌宿主細胞的染色體中。
27.權利要求1-25之任意一項的方法,其中該核酸序列包含在染色體外因子上。
28.權利要求1-27之任意一項的方法,其中該真菌宿主細胞是絲狀真菌或酵母細胞。
29.權利要求28的方法,其中該絲狀真菌細胞是Acremonium、麴黴屬、鐮孢黴屬、腐質黴屬、毛黴屬、毀絲黴屬、脈孢菌屬、青黴屬、梭孢殼屬、Tolypocladium或木黴屬的細胞。
30.權利要求28的方法,其中該酵母細胞是假絲酵母屬、漢遜酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或Yarrowia的細胞。
31.權利要求28的方法,其中該絲狀真菌宿主細胞是麴黴屬細胞。
32.權利要求28的方法,其中該絲狀真菌宿主細胞是鐮孢黴屬細胞。
33.分離的啟動子序列,其含有選自下組的核酸序列SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它們的突變、雜合和串聯啟動子。
34.權利要求33的啟動子序列,其含有SEQ ID NO.1第1-3949位核苷酸或其子序列;或其突變、雜合或串聯啟動子的核酸序列。
35.權利要求34的分離啟動子序列,其含有SEQ ID NO.1第1-3949位核苷酸的核酸序列。
36.權利要求35的分離啟動子序列,其含有大腸桿菌NRRL B-30067中的質粒pECO3所包含的核酸序列。
37.權利要求33的分離啟動子序列,其含有SEQ ID NO.2第1-938位核苷酸或其子序列;或其突變、雜合或串聯啟動子序列的核酸序列。
38.權利要求37的分離啟動子序列,其含有SEQ ID NO.2第1-938位核苷酸的核酸序列。
39.權利要求38的分離啟動子序列,其含有大腸桿菌NRRL B-30071中的質粒pFAMG所包含的核酸序列。
40.權利要求33的分離啟動子序列,其含有SEQ ID NO.3第1-3060位核苷酸或其子序列;或其突變、雜合或串聯啟動子序列的核酸序列。
41.權利要求40的分離啟動子序列,其含有SEQ ID NO.3第1-3060位核苷酸的核酸序列。
42.權利要求41的分離啟動子序列,其含有大腸桿菌NRRL B-30075中的質粒pQUINN所包含的核酸序列。
43.權利要求33-42之任意一項的分離啟動子序列,其具有SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸之序列的至少20%的啟動子活性。
44.與權利要求33-43之任意一項的啟動子序列具有相同啟動子活性的分離啟動子序列。
45.分離的啟動子序列,其含有在SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的序列中具有至少一個突變的核酸序列或其子序列;其中該突變啟動子具有啟動子活性。
46.核酸結構,其含有與權利要求33-45之任意一項的啟動子可操作地連接的編碼多肽的核酸序列。
47.含有權利要求46的核酸結構的重組表達載體。
48.含有權利要求46的核酸結構的重組宿主細胞。
49.製備多肽的方法,包括(a)在有利於該多肽產生的條件下,培養其中已摻入了如下新轉錄單元的同源重組細胞,該新轉錄單元含有與編碼該多肽的內源核酸序列第二外顯子可操作地連接的權利要求33-45之任意一項的啟動子、外顯子、和/或剪接供體位點;和(b)回收該多肽。
50.獲得突變啟動子的方法,包括(a)在低嚴緊條件下使DNA與含有如下序列的核酸序列雜交(i)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3,(ii)SEQ ID NO.1、SEQ ID NO.2或SEQ ID NO.3中所包含的cDNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的互補鏈;和(b)從該DNA中分離該突變啟動子。
51.獲得突變啟動子的方法,包括(a)將至少一個突變引入SEQ ID NO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸或SEQ ID NO.3第1-3060位核苷酸的啟動子中,其中該突變啟動子具有啟動子活性;和(b)分離該突變啟動子。
52.分離的核酸序列,其選自(a)編碼具有如下胺基酸序列的多肽的核酸序列,該胺基酸序列與SEQ ID NO.4第22-581位胺基酸、SEQ ID NO.5第19-200位胺基酸或SEQ ID NO.6第1-187位胺基酸有至少65%的一致性;(b)與SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸有至少65%的同源性的核酸序列;(c)在極低、低、中等、中高、高或極高嚴緊條件下與以下序列雜交的核酸序列(i)SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸;(ii)在SEQ ID NO.1第4013-5743位核苷酸、SEQ ID NO.2第993-1593位核苷酸或SEQ ID NO.3第3061-3678位核苷酸中包含的cDNA序列;(iii)具有至少100個核苷酸的(i)或(ii)的子序列;或(iv)(i)、(ii)或(iii)的互補鏈;(d)編碼具有SEQ ID NO.4、SEQ ID NO.5或SEQ ID NO.6之胺基酸序列的多肽的變體的核酸序列,其中所述變體包含一或多個胺基酸的替代、缺失和/或插入;(e)(a)、(b)或(c)的等位變體;和(f)(a)、(b)、(c)或(e)的子序列。
53.核酸結構,其含有與一或多個在適合表達宿主中指導所述多肽產生的控制序列可操作地連接的權利要求52的核酸序列。
54.含有權利要求53的核酸結構、啟動子、和轉錄及翻譯終止信號的重組表達載體。
55.含有權利要求53的核酸結構的重組宿主細胞。
56.由權利要求52的核酸序列編碼的多肽。
全文摘要
本發明涉及製備多肽的方法,包括:(a)在有利於產生該多肽的培養基中培養真菌宿主細胞,其中該真菌宿主細胞含有編碼該多肽的第一核酸序列和與該第一核酸序列可操作地連接的、含有與第一核酸序列異源的啟動子的第二核酸序列,其中該啟動子含有選自下組的序列:SEQ IDNO.1第1-3949位核苷酸、SEQ ID NO.2第1-938位核苷酸和SEQ ID NO.3第1-3060位核苷酸,及其子序列;和它們的突變、雜合及串聯啟動子;和(b)從該培養基分離該多肽。本發明還涉及該分離的啟動子序列、以及含有與編碼多肽的核酸序列可操作地連接的該啟動子序列的結構、載體和真菌宿主細胞。
文檔編號C12N15/80GK1367838SQ00805332
公開日2002年9月4日 申請日期2000年3月22日 優先權日1999年3月22日
發明者R·M·伯卡, M·W·雷伊, K·布朗, S·H·布朗 申請人:諾沃奇梅茲生物技術有限公司