新四季網

核酸組裝系統的製作方法

2023-05-25 22:10:41 2

核酸組裝系統的製作方法
【專利摘要】本發明涉及製備宿主細胞文庫的方法,其中多個所述宿主細胞包含在靶基因座處的組裝的多核苷酸,所述方法包括:(a)提供包含兩個或更多個多核苷酸亞組的多個多核苷酸,其中:(i)每個多核苷酸亞組中的多個多核苷酸包含編碼肽或多肽的序列和/或調節序列;(ii)每個多核苷酸亞組編碼的多個肽或多肽,或每個多核苷酸亞組中包含的多個調節序列共享活性和/或功能;(iii)至少一個多核苷酸亞組包含至少兩個不同的多核苷酸種類;(iv)每個多核苷酸亞組的多個多核苷酸包含能夠與來自一個或更多個其他多核苷酸亞組的多個多核苷酸同源重組的序列;和(v)兩個多核苷酸亞組中的多個多核苷酸包含能夠與宿主細胞中的靶基因座同源重組的核苷酸序列;和(b)通過在宿主細胞體內同源重組在靶基因座處組裝所述多個多核苷酸,從而產生宿主細胞文庫,所述宿主細胞文庫的多個包含在靶基因座處的組裝的多核苷酸。組裝的多核苷酸可被回收,從而製備核酸文庫。
【專利說明】核酸組裝系統
【技術領域】
[0001]本發明涉及製備宿主細胞文庫的方法。本發明還涉及製備核酸文庫的方法和涉及製備具有期望性質的宿主細胞的方法。本發明進一步涉及根據這些方法製備的宿主細胞文庫、核酸文庫和具有期望性質的宿主細胞。
【背景技術】
[0002]生物體尤其是微生物,可用於生產生物和化學產品,所述化學產品有時比使用化學合成或石油基化學品具有更少的花費和更小的環境影響。一些微生物提供容易被遺傳修飾的優勢。通過對天然的或修飾的代謝通路操作和通過引入新的通路,微生物可被改造為生產感興趣的產品。
[0003]在給定的通路中,很多多肽具有將底物經一系列中間產物轉化成產物的活性。許多微生物具有類似的通路——如果不是一樣的通路的話,但是當比較兩種不同的生物體時,可以或多或少的效率在通路的平行步驟中實現特定類型的活性。例如,對於共享共同通路的兩種生物體,對通路中平行活性負責的對應多肽可以不同的效率或不同的速度影響活性。因此,儘管相關的或不相關的生物體可具有類似的或相同的通路,不同微生物中每種活性受影響的效率或速度可能不同。 [0004]需要其中可利用這種天然變異和其他類型變異的方法。

【發明內容】

[0005]本文提供了用於優化經改造的微生物中一個或更多個通路的方法。特別是,該方法可通過經改造的微生物用於優化靶產物的生產。對於通路中的兩種或更多種活性或功能,本文的方法提供攜帶生物體中活性/功能的多肽(和控制那些多肽表達的調節序列)的不同組合。
[0006]這些中,可鑑定和選擇出能有效生產靶產物的組合,從而生產具有優化的靶產物生產的生物體。
[0007]關鍵地,這些組合在宿主細胞體內組裝,使得本發明的方法提供快速有效的策略,用於產生可容易地篩選期望性質的遺傳多樣性。本發明因此提供其中可針對期望性質對宿主細胞文庫進行篩選的方法。這種方法可包括測定由文庫中宿主細胞生產的靶產物的量。
[0008]本發明中,提供許多多核苷酸亞組。這些多核苷酸亞組使得亞組中的每個多核苷酸能夠與來自一個或更多個其他組的多核苷酸同源重組。另外,來自兩個組的多核苷酸能夠與宿主細胞中的靶位點同源重組。所以,本發明的方法允許產生組裝的多核苷酸,典型地每個所述多核苷酸包含來自每個亞組的多核苷酸並且所述多核苷酸通過同源重組在靶基因座處被併入宿主細胞。
[0009]變異可被引進一個或更多個多核苷酸亞組。也就是說,多核苷酸亞組可包含兩種或更多種不同的序列。因此,通過允許多核苷酸亞組經歷同源重組,可產生組裝的多核苷酸的變體。多核苷酸亞組在體內組裝,使得產生包含組裝的多核苷酸的變體的宿主細胞文庫。[0010]可篩選宿主細胞,以鑑定具有由含在該宿主細胞中的組裝的多核苷酸賦予的期望性質的宿主細胞。例如,組裝的多核苷酸可包含編碼各種通路成員的序列。該方法可因此用於鑑定通路成員的變體組合,所述通路引起例如靶產物的有效生產。
[0011]根據本發明,因此提供製備宿主細胞文庫的方法,其中多個所述宿主細胞包含在靶基因座處的組裝的多核苷酸,該方法包括:
[0012](a)提供包含兩個或更多個多核苷酸亞組的多個多核苷酸,其中:
[0013](i)每個多核苷酸亞組中的多個多核苷酸包含編碼肽或多肽的序列和/或調節序列;
[0014](ii)每個多核苷酸亞組編碼的多個肽或多肽,或每個多核苷酸亞組中包含的多個調節序列共享活性和/或功能;
[0015](iii)至少一個多核苷酸亞組包含至少兩個不同的多核苷酸種類(polynucleotide species);
[0016](iv)每個多核苷酸亞組的多個多核苷酸包含能夠與來自一個或更多個其他多核苷酸亞組的多個多核苷酸同源重組的序列;和
[0017](V)兩個多核苷酸亞組中的多個多核苷酸包含能夠與宿主細胞中的靶基因座同源重組的核苷酸序列;和
[0018](b)通過在宿主細胞體內同源重組,在靶基因座處組裝所述多個多核苷酸,
[0019]從而產生宿主細胞文庫,其中多個所述宿主細胞包含在靶基因座處的組裝的多核苷酸。
[0020]本發明還提供:
[0021]-製備組裝的多核苷酸的文庫的方法,該方法包括:
[0022]-根據本發明的方法製備宿主細胞文庫;和
[0023]-從宿主細胞文庫回收組裝的多核苷酸,
[0024]從而製備組裝的多核苷酸的文庫;
[0025]-製備具有期望性質的宿主細胞的方法,該方法包括:
[0026]-根據本發明的方法製備宿主細胞文庫;和
[0027]-篩選所述宿主細胞文庫,
[0028]從而鑑定具有期望性質的宿主細胞;
[0029]-製備具有期望性質的宿主細胞的方法,該方法包括:
[0030]-根據本發明的方法製備組裝的多核苷酸的文庫;
[0031]-將所述文庫轉移至宿主細胞;和
[0032]-篩選所得宿主細胞,
[0033]從而鑑定具有期望性質的宿主細胞;和
[0034]-表達篩選絲狀真菌轉化體的方法,包括:
[0035](a)分離通過根據本發明的方法製備的酵母宿主細胞文庫的單菌落轉化體;
[0036](b)由酵母轉化體的單菌落來製備DNA ;
[0037](C)將步驟(b)的製備物樣品引入絲狀真菌原生質體的分開的懸液中以獲得其轉化體,其中轉化體含有來自所述酵母宿主細胞文庫的一個或更多個拷貝的個體多核苷酸;
[0038](d)使步驟(C)的個體絲狀真菌轉化體在選擇性生長培養基上生長,從而允許所述絲狀真菌轉化體生長,同時抑制未轉化的絲狀真菌生長;和
[0039](e)測量由個體多核苷酸編碼的每種多肽的活性或性質
[0040]而且,本發明涉及根據本發明的方法製備的宿主細胞文庫、核酸文庫和具有期望性質的宿主細胞。
【專利附圖】

【附圖說明】
[0041]圖1顯示組裝變體核酸的例子,通過添加作為選擇的用於重組通路並且整合選擇性標記(在該情況下是KanMX)的多個片段,來將變異添加至通路,然後篩選從轉化獲得的所有菌株並且發現最佳組合和/或從所有獲得的結果中學習,以改進最終的通路。
[0042]圖2顯示測試通路。HIS3用作轉化後的選擇性標記,通路中的所有其他部分容易根據表型打分並且可因此用於表明將變異添加至通路的原理。
[0043]圖3顯示可經同源重組整合進入酵母基因組的實施例X的盒。每個盒邊緣上的淺灰色描繪用於體內同源重組的50-bp同源區域。
[0044]圖4顯示在凝膠上分析的PCR反應I和2的PCR反應。在每個條帶的數量指表2中的數量。
[0045]圖5顯示在凝膠上分析的PCR反應2的PCR反應。在每個條帶的數量指表2中的
數量。
[0046]圖6顯示在凝膠上分析的PCR反應3的PCR反應和PCR反應3的EcoRV切割。在每個條帶的數量指表2中的數量。
[0047]圖7顯示在凝膠上分析的EcoRV的PCR反應3切割。在每個條帶的數量指表2中
的數量。
[0048]序列表描沭
[0049]SEQ ID NO:1 至 SEQ ID NO:14 描述在表 I 中。
[0050]SEQ ID NO:15PCR展示與測試通路中的部分I (HIS3)具有同源性的片段「5,ADEl側翼」的核酸序列。
[0051]SEQ ID NO: 16展示與測試通路中的部分5 (URA3)具有同源性的PCR片段「3』ADE1側翼」的核酸序列。
[0052]SEQ ID NO:17展示HIS3表達盒的核酸序列。
[0053]SEQ ID NO: 18展示LEU2表達盒的核酸序列。
[0054]SEQ ID NO: 19展示Kanmx表達盒(G418抗性)的核酸序列。
[0055]SEQ ID NO:20展示ble表達盒(腐草黴素抗性)的核酸序列。
[0056]SEQ ID NO:21展示Natl表達盒(諾爾斯菌素抗性)的核酸序列。
[0057]SEQ ID NO:22展示潮黴素抗性表達盒的核酸序列。
[0058]SEQ ID NO:23展示TRPl表達盒的核酸序列。
[0059]SEQ ID NO:24展示URA3表達盒的核酸序列。
[0060]SEQ ID NOs:25至42展示用於擴增實施例2中的設計的盒和整合側翼的引物序列。
[0061]SEQ ID NOs:43至54展示用於形成實施例2中描述的通路變體的表達盒(啟動子、開放閱讀框和終止子)的序列。[0062]SEQ ID NOs:55和56展示用於測定實施例2中的盒120或盒121的存在性的PCR反應引物。
[0063]SEQ ID NOs:57至63展示用於測定實施例2中的各種盒的存在性的PCR反應引物。
【具體實施方式】
[0064]在本說明書和所附權利要求書的通篇中,詞語「包含」和「包括」("comprise","include" , " having")及其變體如「包含,,(" comprises" , " comprising")、「包括」("includes"和"including")應被解釋為開放性的。也就是說,在上下文允許時,這些詞語旨在表達可能包括未明確指出的其他要素或成分。
[0065]冠詞(「a」和「an」)在本文中被用於表示一個或多於一個(即一個或至少一個)所述冠詞的語法客體。例如,「要素」(「an element」)可表示一個要素或多於一個要素。
[0066]本發明提供了產生宿主細胞和核酸(尤其是組裝的多核苷酸)的文庫的方法。
[0067]這種文庫可用於鑑定,例如被優化用來生產期望的靶產物的微生物。也就是說,本發明提供了優化或改進經改造的微生物中的一個或更多個通路的方法,並且本發明可用來優化或改進經改造的微生物對靶產物的生產。
[0068]對於通路中的活性/功能,本文的方法提供編碼多肽的(攜帶生物體中的那些活性/功能的)多核苷酸的不同組合和/或控制由這些多核苷酸編碼的多肽表達的調節序列的不同組合。這些中,可鑑定並選擇引起靶產物的有效生產的組合,從而提供具有優化的期望靶產物生產的生物體。
[0069]本文描述的方法通過提供通路中至少一個位置的變異,來提供可能的通路的多種組合。這些方法可被稱為「組合方法」。因此,本文描述的方法可用來改進或優化在經改造的生物體中的靶產物形成。如本文所使用的,術語「改進」和「優化」和類似的術語,是指下述方法,其中使用天然存在的和/或合成的多核苷酸(例如,改造的遺傳多樣性),藉以改變代謝通路或其部分,以增加當與天然或參考活性比較時的期望終產物的速度、產率和/或生產效率。
[0070]對於這種改進或優化的本發明的方法,在本文中被進一步詳細地描述。尤其,產生下述多核苷酸的亞組,所述一個或更多個亞組可包含變異。可產生來自亞組的多核苷酸的組合,該組合在體內組裝並且在宿主細胞中表達。然後可對所得宿主細胞測試以測定哪種組合更有效或有力地生產靶產物。
[0071]如本文所使用的,術語「通路」,被寬泛地解釋,並且可指一系列同時的、相繼的或分開的化學反應,其通過將底物或起始元素經由一種或更多種中間產物轉化成最終化合物或期望的產品的活性來實現。在某些實施方式中,活性有時是底物向中間產物或產物的轉化(例如,通過酶的催化轉化),有時是分子或配體的結合。如本文所使用的,術語「相同的通路」指來自相關或不相關生物體、具有相同數量和類型的活性並且產生相同終產物的通路。如本文所使用的,術語「類似的通路」指來自相關或不相關生物體、具有下述的一種或更多種的通路:不同數量的活性、不同類型的活性、使用相同的起始或中間產物分子,和/或產生相同終產物。
[0072]通路改進和優化可例如通過利用天然存在的遺傳多樣性和/或經改造的遺傳多樣性來獲得。可通過測試來自不同生物體的亞組多核苷酸來利用天然存在的遺傳多樣性。可通過測試,例如已經被密碼子-優化的或突變的亞組多核苷酸,來利用經改造的遺傳多樣性。對於密碼子-優化的多樣性,胺基酸密碼子三聯體可替換為其他密碼子,和/或某些核苷酸序列可被添加、去除或替換。例如,天然密碼子可替換為或多或少的優選的密碼子。在某些實施方式中,可通過將相關或類似的活性替換為來自類似的但是不相同的通路的一個或更多個步驟,來優化通路。亞組中的多核苷酸還可被遺傳改變,使得當編碼時,實現與用作遺傳改變的起始材料的天然對等物的活性不同的活性。如本領域已知的,通過人的手動操作而改變的核酸和/或胺基酸序列可被稱為「改造的」遺傳多樣性。
[0073]代謝通路可視為將開始底物或元素轉化成終產物的一系列的反應步驟。每個步驟可通過一種或更多種活性催化。在其中底物A被轉化成終產物D的通路中,通過通路中的特異性活性,產生並轉化了中間產物B和C。通路的每種特異性活性可考慮活性亞組的種類,並且編碼該活性的多肽可考慮對應多肽亞組的種類。
[0074]任何肽、多肽或蛋白質,或由一種或更多種肽、多肽或蛋白質催化的活性可由多核苷酸亞組編碼。代表性的蛋白質包括酶(例如,部分或所有的代謝通路)、抗體、血清蛋白(例如,白蛋白)、膜結合蛋白、激素(例如,生長激素、紅細胞生成素、胰島素等)、細胞因子等,並且包括天然存在的和外源表達的多肽。代表性的活性(例如,功能上相關聯以在代謝通路中提供活性或活性組的酶或酶的組合)包括與期望的代謝通路相關的任何活性。如本文所使用的,術語「酶」可指下述蛋白質,其可用作催化劑來誘導其他化合物中的化學變化,從而從一種或更多種底物生產一種或更多種產品。
[0075]應當理解,本文列出的實施方式中描述的方法和組合物可用來:(i)優化生產期望的終產物的任 何代謝通路,和/或(ii)優化代謝通路的活性亞組中的亞結構域。如本文所使用的,術語「蛋白質」指具有通過肽鍵連接的胺基酸序列的分子。該術語包括天然的和重組的融合蛋白、寡肽、肽、環肽、多肽和多肽衍生物,並且還包括其片段、衍生物、同系物和變體。蛋白質或多肽有時是胞內起源的(例如,位於宿主細胞體內的細胞核、細胞溶膠或細胞間隙中)而有時是體內細胞膜蛋白。在(上述的,和在改造和改變方法部分中進一步詳細描述的)一些實施方式中,遺傳修飾可產生靶活性的修飾(例如,增加、基本上增加、減少或基本上減少)。
[0076]隨著生物體進化,在不同的環境中並且用不同的選擇性壓力,生物體的核酸和胺基酸序列也可進化並且偏離祖先類型。序列進化可產生可對具體環境中的具體的生物體天然優化的代謝通路,這有助於各自通路遺傳多樣性。核苷酸或胺基酸序列的改變有時可造成活性效率改變(例如,轉化數量或反應能量輸入/輸出的量的增加或減少)。改變可能由於造成趨異進化生物體的不同的選擇性壓力而出現。可針對下述改變的活性,選擇這些選擇性壓力,所述改變的活性使含有改變的序列的生物體在具體的環境中更好地發揮作用。這些改變增加類似的或相同的活性的遺傳多樣性。可通過來自具有類似或相同通路的生物體的相關活性的核酸和/或胺基酸序列比較,來鑑定類似或相同活性的進化改變。該進化驅動的遺傳多樣性在本文中被稱為「天然多樣性」。當與提供供體活性的生物體比較時,商業上有用的生物體可具有細胞機制(例如轉錄和/或例如翻譯機制)差異。對於選擇的宿主生物體可通過如下產生優化的代謝通路:組合來自不同的來源(例如,天然的或經改造的遺傳多樣性)的類似或相同活性,並且根據選擇的標準鑑定出顯示改進的那些組合(例如,反應速度的改變、反應產率的改變、反應的能量要求或反應效率的改變等等或其組合)。
[0077]除了代謝通路優化,本發明的方法也可用於優化個體亞組活性。因此,多肽表示的每個亞組活性可被進一步分成進一步的亞組。多肽結構域可表示所有或一部分的已知活性中心,接觸殘基等等。
[0078]還可合成和以各種組合組裝下述寡核苷酸,以進一步優化個體活性亞組,所述寡核苷酸編碼來自每一生物體的每個亞結構域的密碼子優化版本的胺基酸。例如,常規的重組DNA方法(例如,克隆、PCR、文庫構建等等)可用來產生每個活性亞組的多肽亞結構域文庫。通過使用本領域技術人員可用的重組DNA技術,或允許自組裝的具體的靶長度和結構的寡核苷酸,每種活性的各個區域可通過下述方法被進一步優化:將多肽亞結構域以各種組合方式組合在一起並且評估哪種亞結構域區域的組合產生期望的結果。
[0079]可例如針對其發酵過程中的商業效用或將被遺傳操作的能力,選擇宿主生物體。增加由商業上有用的生物體(例如,發酵過程中的微生物)生產的期望產物的生產效率可在起始材料轉化和收益性方面產生有益的收益。
[0080]因此,根據本發明,提供製備宿主細胞文庫的方法,所述宿主細胞文庫包含在靶基因座處的組裝的多核苷酸,所述方法包括:
[0081](a)提供包含兩個或更多個多核苷酸亞組的多個多核苷酸,其中:
[0082](i)每個多核苷酸亞組中的多個多核苷酸包含編碼肽或多肽的序列和/或調節序列;
[0083](ii)由每個多核苷酸亞組編碼的多個肽或多肽,或每個多核苷酸亞組中包含的多個調節序列共享活性和/或功能;
[0084](iii)至少一個多核苷酸亞組包含至少兩個不同的多核苷酸種類;
[0085](iv)每個多核苷酸亞組的多個多核苷酸包含能夠與來自一個或更多個其他多核苷酸亞組的多個多核苷酸同源重組的序列;和
[0086](V)兩個多核苷酸亞組中的多個多核苷酸包含能夠與宿主細胞中的靶基因座同源重組核苷酸序列;和
[0087](b)通過在宿主細胞體內同源重組在靶基因座處組裝多核苷酸,
[0088]從而產生包含在靶基因座處的組裝的多核苷酸的宿主細胞文庫。
[0089]本發明中,提供許多多核苷酸亞組。多核苷酸亞組是這樣的,其使得亞組中的多核苷酸能夠與來自一個或更多個其他組的多核苷酸同源重組。另外,來自兩個組的多核苷酸能夠與宿主細胞中的靶位點同源重組。所以,本發明的方法允許產生組裝的多核苷酸,每個所述組裝的多核苷酸典型地包含來自每個亞組的多核苷酸並且所述組裝的多核苷酸通過同源重組在靶基因座處被併入宿主細胞。關鍵地,組裝的多核苷酸在宿主細胞體內被組裝並且靶向靶基因座。典型地,任何亞組中沒有多核苷酸包含作為複製起點的序列。
[0090]「多個」旨在表示兩個或更多個。在本發明的方法中,下述是可能的:所有的多個多核苷酸能夠同源重組、多核苷酸亞組的每個成員包含編碼肽/多肽的序列或包含調節序列、亞組的每個成員共享活性/功能。但是,術語「多個」旨在表示可以是在多個多核苷酸中的不經歷同源重組並且不與相同亞組中的其他多核苷酸共享功能或活性的多核苷酸。
[0091]根據本發明的方法涉及多核苷酸彼此和多核苷酸與靶基因座的重組。「重組」指其中核酸分子斷裂並且接著連接成不同的核酸分子的過程。本發明的重組過程典型地涉及可來自相同或不同生物體的不同核酸分子的人工和有意的重組,從而創建重組核酸。
[0092]本發明的方法依靠同源重組和位點特異性重組的組合。
[0093]「同源重組」指具有含有類似核苷酸序列(即,同源序列)的、具有對應位點的核苷酸序列之間的反應,通過所述反應分子可相互作用(重組)以形成新的重組核酸序列。類似的核苷酸序列位點的每個在本文被稱為「同源序列」。一般而言,隨著同源序列長度增加,同源重組的頻率增加。因此,儘管同源重組可在較不相同的兩個核酸序列之間發生,但是隨著兩條序列之間的趨異增加,重組頻率(或效率)下降。
[0094]可在待組合的兩個分子的每個上使用一條同源序列,實現重組,從而產生「單交換」重組產物。或者,待重組的兩個分子的每個上可有兩條同源序列。供體上兩條同源序列與靶上兩條同源序列之間的重組產生「雙交叉」重組產物。
[0095]具有多核苷酸亞組的多核苷酸可包括互補DNA(cDNA)。多核苷酸可基本上由cDNA組成,其指多核苷酸包括編碼能編碼多肽的mRNA的DNA序列;並且可包括沒有啟動子或沒有調節由DNA編碼的多肽或mRNA的量的其他特定功能的一條或更多條非編碼核苷酸序列(例如,從克隆過程引入的一條或更多條側翼序列)。多核苷酸可由cDNA組成。一些實施方式中,互補DNA可以是來自生物體的天然的(即,野生型)多核苷酸,並且可以是密碼子-優化的或突變的多核苷酸。
[0096]本發明中的多核苷酸也可包括DNA或RNA類似物(例如,包含鹼基類似物、糖類似物和/或非天然骨架等等的)。應當理解,術語「核酸」不涉及或意指多核苷酸鏈的具體長度,因此多核苷酸和寡核苷酸也包括在該定義中。脫氧核糖核苷酸包括脫氧腺苷、脫氧胞苷,脫氧鳥苷和脫氧胸苷。對於RNA,尿嘧啶鹼基是尿苷。
[0097]典型地,適於用於本發明的多核苷酸亞組中的多核苷酸可通過本領域已知的任何擴增方法(例如,PCR、RT-PCR等等)產生。當使用典型地難以培養(例如,緩慢生長、需要專用培養條件等等)的生物體時,核酸擴增可尤其有益。如本文所使用的,術語「擴增(amplify、amplification、amplifying) 」或「擴增反應」,指用於繁殖核酸祀序列拷貝的任何體外過程。擴增有時指靶核酸的「指數」式增加。但是,如本文所使用的,「擴增」也可指核酸的選擇靶序列的數量的線性增加,但是不同於一次性單引物延伸步驟。在一些實施方式中,可進行也稱為預擴增的限制擴增反應。預擴增是下述方法,其中由於進行少量的循環,例如10個循環而發生限制量的擴增。預擴增可允許一些擴增,但是在指數期之前停止擴增,並且典型地生產大約500個拷貝的期望的(一條或多條)核苷酸序列。使用預擴增還可限制標準PCR反應中與耗盡的反應物相關聯的出錯。在一些實施方式中,擴增和/或PCR可用來給組合文庫中的核苷酸序列添加接頭或「粘性末端」以促進組合通路的組裝和/或促進將組裝的通路插入核酸反應物的表達構建中。在一些實施方式中,核酸反應物有時被穩定整合進入宿主生物體的染色體中,或在某些實施方式中(例如,遺傳修飾的生物體,其中宿主基因組的改變賦予選擇性地保留或優先保留攜帶遺傳修飾的期望生物體的能力),核酸反應物可缺失一部分宿主染色體。可針對它們引導生產期望的蛋白質或核酸分子的能力,選擇這種核酸反應物(例如,改變的基因組賦予生物體可選擇的特點的核酸或遺傳修飾生物體)。需要時,可改變核酸反應物使得密碼子編碼:(i)相同胺基酸,其使用與天然序列中指定的tRNA不同的tRNA ;或(ii)與正常胺基酸的不同的胺基酸,包括非常規的或非天然的胺基酸(包括可檢測標記的胺基酸)。如本文所描述,術語「天然序列」指如在其天然環境中發現的未修飾的核苷酸序列(例如,如在生物體中發現的核苷酸序列)。
[0098]變異可被引進一個或更多個多核苷酸亞組。也就是說多核苷酸亞組可包含兩條或更多條不同的序列。因此,通過使多核苷酸亞組經歷同源重組,可產生組裝的多核苷酸的變體。多核苷酸亞組在體內組裝使得產生包含組裝的多核苷酸的變體的宿主細胞文庫。
[0099]可篩選宿主細胞以鑑定具有由該宿主細胞包含的組裝的多核苷酸賦予的期望性質的宿主細胞。例如,組裝的多核苷酸可包含編碼各種通路成員的序列。該方法可因此用來鑑定引起例如靶產物有效生產的通路成員的變體組合。
[0100]亞組的數量是至少兩個,例如三個、四個、五個、六個、七個、八個、九個、十個、十五
個、二十個、二十五個、三十個、三十五個、四十個、四十五個或五十或更多個。但是,典型地,有約50個或更少,比如大約20個或更少的多核苷酸亞組。本發明的方法旨在產生包含多核苷酸的組裝的宿主細胞,所述多核苷酸包含基本上來自所有多核苷酸亞組的一個多核苷酸。
[0101]亞組種類組合的數量取決於給定通路中的活性的數量和可從其中分離所述通路的生物體的數量。例如,使用在三個生物體中發現的三個活性亞組通路,在該例子中數學組合排列的數量是3的3次冪,或3的立方(例如,33),或27。對於其中活性分離自四個供體生物體的三個活性通路,排列的數量可能是34或81個可能的文庫組合。
[0102]在某些實施方式中,文庫中可能組合的數量因此可由式子(Χ)y表示,其中X是活性亞組的數量和Y是從其中可以實現活性的形式(例如,種類)的數量。
[0103]可從下列非限制形式選擇亞組中的多核苷酸種類:例如,來自生物體種類的多核苷酸的密碼子-優化形式、來自生物體種類的多核苷酸的突變形式,和來自給定生物體種類的天然多核苷酸形式。
[0104]式子(X)yF總是表示文庫中可能組合的數量。不同的亞組可包括不同數量的可能成員(或「變體」)。例如,一個亞組可包括比另一個亞組更少的多核苷酸種類。例如,一個多核苷酸亞組可包括某些數量的來自不同生物體種類的天然多核苷酸和某些數量的經改造的多核苷酸(例如,突變、密碼子-優化的版本),而另一亞組可包括,例如更少或更大數量的每一種。
[0105]如上闡釋的,每個亞組包含核酸種群。多核苷酸亞組的至少一個包含至少兩種或更多種不同的核酸。也就是說,在本發明的方法中,至少兩個多核苷酸亞組中的至少兩種多核苷酸是不同的。
[0106]這樣,可引入變異使得可產生文庫。更典型地,至少兩個、三個、四個、五個或更多個多核苷酸亞組可包含至少兩種不同的多核苷酸。可實施該方法,其中所有的多核苷酸亞組包含至少兩種不同的多核苷酸。但是,更優選地,實施本發明的方法使得,除了包含能夠與靶基因座同源重組的序列的兩個多核苷酸亞組和包含編碼標記基因的序列的任何多核苷酸亞組之外,所有多核苷酸亞組中的至少兩個多核苷酸是不同的
[0107]兩個多核苷酸組包含(通過同源重組)允許組裝的多核苷酸在靶基因座處併入的序列。這通常導致在靶基因座處的一些序列被組裝的序列替換。靶基因座可以是染色體基因座,即在宿主細胞的基因組內的染色體基因座,或染色體外基因座,例如質粒或人工染色體。
[0108]包含允許在靶基因座處併入的序列的兩個多核苷酸亞組之一典型地包含下述多核苷酸,將所述多核苷酸設計成位於組裝的多核苷酸的5』端。因此,包括允許在靶基因座處併入的序列的兩個多核苷酸組的另一個通常包含下述多核苷酸,將所述多核苷酸設計成位於組裝的多核苷酸3』端。因此,這兩個亞組之一包含典型地能夠與靶基因座的「5』」序列同源重組的多核苷酸,且另一亞組包含典型地能夠與靶基因座的「3』」序列同源重組的多核苷酸。或者,這些序列可被稱為「上遊」 (5,)和「下遊」(3』 )序列。
[0109]包含旨在確保組裝的多核苷酸與靶基因座同源重組的序列的兩個亞組還包含允許與另一亞組的一個或更多個序列同源重組的序列。但是,典型地,對於確保在靶基因座處併入的兩個亞組中的多核苷酸來說不可能彼此重組。
[0110]包含旨在確保在靶基因座處同源重組的序列的兩個亞組,任選地還可包含額外的序列,例如編碼下述多肽的序列,所述多肽是使用本發明的方法將被優化的通路的成員。
[0111]典型地,旨在確保在靶基因座處併入的序列在亞組中不變。
[0112]本發明的方法中使用的每個亞組包含具有編碼肽或多肽的序列和/或包含調節序列。多核苷酸或所得的肽/多肽中包含的序列典型地是相關的。也就是說,每個多核苷酸可包括共享活性和/或功能的序列或編碼共享活性和/或功能的肽/多肽。例如,每個多核苷酸可編碼給定酶的一種或更多種變體。可選地,每個多核苷酸可編碼基本上具有相同功能的可選的多肽,例如,所編碼的多肽可以是可選的標記基因或包含可選版本的調節序列。例如,亞組可包含具有下述可選啟動子的多核苷酸,所述啟動子在序列同一性水平上不相關,但是仍具有啟動子的相同功能。
[0113]如上闡釋的,由具體的多核苷酸亞組的多核苷酸編碼的每種多肽可具有給定的活性或註解的活性。這種活性可以是將具體底物轉化成具體產物的能力。因此,由亞組中的多核苷酸編碼的一條多肽可以比其將第二底物轉化成第二產物更高的效率,將第一底物轉化成第一產物,但是其仍與在相同亞組中的下述另一多肽具有相同活性,所述另一多肽也將第二底物轉化成第二產物。例如,(i)亞組中的一種多肽可優先將六碳底物轉化成產物,但是以更低的效率也將五碳底物轉化成產物,和(ii)亞組中的另一多肽可優先將相同五碳底物轉化成相同的產物;這兩種多肽共享將相同的五碳底物轉化成相同產物的相同活性。活性可以是結合具體分子的能力。
[0114]如本文所使用的,術語「相同的活性」指基本上相同類型的活性(例如,將某些底物轉化成某些產物的能力)而不管活性水平或效率,只要活性對於兩種多核苷酸(或由那些多核苷酸編碼的多肽)而言是可探測的。
[0115]由具體亞組中的這些多核苷酸編碼的每種多肽可能夠結合具體的分子(例如,底物、配體等等)。
[0116]具體的亞組中的多核苷酸或由這些多核苷酸編碼的多肽可共享至少約60%的核酸或胺基酸序列同一性。即,具體多核苷酸亞組中的多核苷酸或由具體多核苷酸亞組編碼的多肽可共享大約61%或更多、62%或更多、63%或更多、64%或更多、65%或更多、66%或更多、67%或更多、68%或更多、69%或更多、70%或更多、71%或更多、72%或更多、73%或更多、74%或更多、75%或更多、76%或更多、77%或更多、78%或更多、79%或更多、80%或更多、81%或更多、82%或更多、83%或更多、84%或更多、85%或更多、86%或更多、87%或更多、88%或更多、89%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多、99%或更多的核酸或胺基酸序列同一I"生。
[0117]當每種由多核苷酸亞組編碼的多肽將不同的底物轉化成產物(例如,不同的或相同的產物),或將相同底物轉化成不同的產物時,這樣的兩種多肽可具有不同的活性。兩種多肽可結合不同的分子(例如,底物、配體)並且具有不同的活性。具有不同活性的兩種多肽典型地不共享相同的活性。
[0118]不同的亞組中的多核苷酸或由多核苷酸編碼的多肽可共享相同的活性。但是,更典型地,不同亞組中的多核苷酸/多肽不共享相同的活性。也就是說,由給定多核苷酸亞組編碼的肽或多肽或給定多核苷酸亞組中包含的調節序列可具有與所有其他多核苷酸亞組中的那些不同的活性和/或功能。
[0119]由不同的亞組中的多核苷酸編碼的多肽可共享相同的第二活性,例如待優化的通路中的相同活性或相同的副活性。
[0120]本發明在某種程度上可用來優化通路,其用於鑑定進行生物化學轉化的優化的活性,其中步驟的精確序列可以是已知的或未知的。例如,認為纖維素降解需要許多相關酶的活性。本發明的方法可用來確定這些相關酶的最佳組合。在該情況下,本發明使用的不同多核苷酸亞組可典型地編碼這些相關酶的變體。從由內切纖維素酶生產的暴露鏈的末端切割兩個至四個單元,產生四糖或二糖(比如纖維二糖)的外切纖維素酶在纖維素降解中是重要的。有兩種主要類型的外切纖維素酶[或纖維二糖水解酶(CBH)]——CBH1:從纖維素的還原末端持續作用:和CBHI1:從纖維素的非還原末端持續作用。就本發明的目的而言,例如,可考慮CBHI和CBHII具有不同的活性,即典型地將含在不同的多核苷酸亞組中,儘管它們都是外切纖維素酶。因此,本發明可用於鑑定CBHI和CBHII變體的更優的組合。但是,在鑑定外切纖維素酶與其他纖維素降解酶組合的情況下,單個多核苷酸亞組可包含編碼CBHI和CBHII變體的序列。
[0121]就本發明的目的而言,活性可歸因於,例如已知生物化學活性的基礎或基於生物信息學分析的註解。
[0122]每種活性可由多核苷酸編碼的多肽實施。本發明中使用的多核苷酸可包括互補DNA(CDNA)0本發明中使用的多核苷酸可基本上由cDNA組成。cDNA可編碼mRNA,其接著編碼多肽。因此,每個活性亞組可用編碼具有具體活性的多肽的多核苷酸亞組表示。任選地,肽或多肽的活性可僅僅在處理之後出現。例如,若干種酶僅僅當已發生進一步處理,比如切表1]、憐Ife化之後有功能。
[0123]在本發明的方法中,至少一個多核苷酸亞組中的每種多核苷酸可包含編碼標記基因的核苷酸序列。典型地,每種多核苷酸編碼相同的標記基因。但是,可實施這樣的方法,其中兩個或更多個不同的標記基因被亞組中的多核苷酸編碼。標記基因可用於鑑定已併入組裝的多核苷酸的那些宿主細胞。
[0124]可使用任何合適的標記基因並且這些基因是公知的可用於測定核酸是否包括在細胞中。根據本發明製備的組裝的多核苷酸可包含兩種或更多種標記基因,其中一種在一種生物體中有效地發揮作用並且另一種在另一生物體中有效地發揮作用。
[0125]標記基因的例子,包括但不限於(I)編碼對其它毒性化合物(例如,抗生素)提供抗性的產物的核酸區段;(2)編碼在感受態細胞中在其他方面缺乏的產物(例如,必需產品、tRNA基因、營養缺陷型標記)的核酸區段;(3)編碼抑制基因產物活性的產物的核酸區段;(4)編碼可被容易鑑定的產物的核酸區段(例如,表型標記,比如抗生素抗性標記物(例如,β -內醯胺酶)、β -半乳糖苷酶、螢光或其他顏色標記,比如綠色螢光蛋白(GFP)、黃色螢光蛋白(YFP)、紅色螢光蛋白(RFP)和青色螢光蛋白(CFP)和細胞表面蛋白);(5)結合在其他方面對細胞存活和/或功能有害的產物的核酸區段;(6)在其他方面抑制如上面1-5描述的任何一種核酸區段的活性的核酸區段(例如,反義寡核苷酸);(7)結合修飾底物的產物(例如,限制性內切酶)的核酸區段;(8)可用於分離或鑑定期望分子(例如,特異性蛋白結合位點)的核酸區段;(9)編碼在其他方面可能沒有功能的特異性核苷酸序列(例如,用於分子亞群的PCR擴增)的核酸區段(10)當缺乏時,直接或間接對具體化合物賦予抗性或敏感性的核酸區段;(11)在感受態細胞中編碼下述產物(例如,單純皰疹胸苷激酶、胞嘧啶脫氨酶)的核酸區段,所述產物有毒或將相對無毒的化合物轉化成有毒的化合物;(12)抑制包含它們的核酸分子的複製、分配或遺傳力的核酸區段;和/或(13)編碼條件性複製功能,例如,在某些宿主或宿主細胞菌株或在某些環境條件(例如,溫度、營養條件等等)下複製的核酸區段。
[0126]典型地,本發明的方法用來產生宿主細胞文庫,其中每個宿主細胞在一個或更多個靶基因座處具有至少一個組裝的多核苷酸。
[0127]多核苷酸亞組被引入宿主細胞從而產生這種文庫。可使用各種技術將多核苷酸亞組引入宿主細胞。用於將異源核酸引入各種生物體的非限制性例子包括:轉化、轉染、轉導、電穿孔、超聲介導的轉化、粒子轟擊等等。在一些情況下,雖然難以通過常規的方法轉化,但載體分子的添加典型地可增加細胞中DNA的攝入。技術人員容易獲得常規轉化方法。
[0128]該方法可用於產生宿主細胞文庫,其中文庫中至少約50%的宿主細胞包含組裝的多核苷酸,所述組裝的多核苷酸包含來自每個多核苷酸亞組的一個多核苷酸。該方法可用於產生宿主細胞文庫,其中至少約50%,例如至少約60%、至少約70%、至少約80%、至少約85%、至少約90%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%的宿主細胞在一個或更多個靶基因座處具有至少一個組裝的多核苷酸。
[0129]根據本發明產生的宿主細胞文庫可包括至少約20個至至少約1,000, 000個不同的組裝的多核苷酸,例如至少約100、至少約1,000、至少約10,000、至少約100,000、至少約500,000個組裝的多核苷酸的變體。
[0130]根據本發明的方法製備的文庫中,可能有許多拷貝數量的每種組裝的多核苷酸。一般而言,這種文庫中的個體宿主細胞可包括一個。但是,個體宿主細胞可包括兩個或更多個核酸種類。可針對靶產物生產,分離並且測試個體宿主細胞,並且個體宿主細胞可在分離之後和測試之前增殖。
[0131]根據本發明產生的宿主細胞文庫可包含基本上具有所有可能的亞組多核苷酸組合的組裝的多肽。本發明的方法可用來產生宿主細胞文庫,其包括至少約60%的所有可能的亞組多核苷酸組合(例如,大約61%或更多、62%或更多、63%或更多、64%或更多、65%或更多、66%或更多、67%或更多、68%或更多、69%或更多、70%或更多、71%或更多、72%或更多、73%或更多、74%或更多、75%或更多、76%或更多、77%或更多、78%或更多、79%或更多、80%或更多、81%或更多、82%或更多、83%或更多、84%或更多、85%或更多、86%或更多、87%或更多、88%或更多、89%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、95%或更多、96%或更多、97%或更多、98%或更多或99%或更多所有可能亞組種類組合)。
[0132]在本發明的方法中,通常至少一個組裝的多核苷酸包含生物通路的每個成員。優選地,生物通路確保在宿主細胞中生產感興趣的化合物。
[0133]在本發明的方法中,每種組裝的多核苷酸可包括來自多個多核苷酸亞組中每個的一個多核苷酸種類。每個組裝的多核苷酸可包括來自給定供體生物體的超過一個多核苷酸亞組。也就是說,在具有多種活性的通路中,優化的通路可包括來自給定供體生物體的大於一個多核苷酸亞組。多核苷酸亞組中的多核苷酸可來自不同的供體生物體類型,其中不同的「類型」可指,例如不同的屬、種或菌株。
[0134]每個組裝的多核苷酸可包括串聯連接的多核苷酸。這些多核苷酸可通過接頭彼此分開。
[0135]感興趣的化合物可以是初級代謝產物、次級代謝產物、肽或多肽或其可包括生物質(包含宿主細胞本身)。感興趣的化合物可以是選自葡萄糖二酸、葡糖酸、戊二酸、己二酸、琥珀酸、酒石酸、草酸、醋酸、乳酸、甲酸、蘋果酸、馬來酸、丙二酸、檸檬酸、富馬酸、衣康酸、乙醯丙酸、木質酸、烏頭酸、抗壞血酸、曲酸、comeric酸、胺基酸、多不飽和脂肪酸、乙醇、1,3_丙-二醇、乙烯、丙酸醇、木糖醇、胡蘿蔔素、蝦青素、番茄紅素和葉黃素的有機化合物。可選地,發酵產物可以是內醯胺抗生素,比如青黴素G或青黴素V和其發酵衍生物、頭孢菌素、環孢菌素或洛伐他汀。
[0136]感興趣的化合物可以是選自寡肽、多肽、(藥學上或工業上的)蛋白和酶的肽。在這些過程中,肽優選地從宿主細胞分泌,更優選地分泌進入培養基,使得例如通過離心或(超)過濾,可容易地通過分離宿主細胞生物質和包含肽的培養基來回收肽。
[0137]可用本發明的方法生產的具有工業上應用的蛋白質或(多)肽的例子包括酶,例如(例如,在去垢工業中使用的)脂酶、(尤其在去垢工業、釀造等等中使用的)蛋白酶、糖酶和細胞壁降解酶(比如,在水果處理、釀酒等等或在飼料中使用的澱粉酶、葡糖苷酶、纖維素酶、果膠酶、β-1,3/4_和β-1,6-葡聚糖酶、rhamnoga-lacturonases、甘露聚糖酶、木聚糖酶、支鏈澱粉酶、半乳聚糖酶、酯酶等等)、植酸酶、磷脂酶、糖苷酶(比如澱粉酶、β.-葡糖苷酶、阿拉伯呋喃糖酶、鼠李糖苷酶、apiosidases等等)、奶製品酶和產品(例如凝乳酶、酪蛋白)、多肽(例如聚賴氨酸等等、藻青素和其衍生物)。對哺乳動物,優選地人而言,具有治療的、化妝品或診斷應用的多肽,包括但不限於包括其片段的膠原和明膠、胰島素、血清白蛋白(HSA)、乳鐵蛋白和免疫球蛋白。多肽可以是抗體或其一部分、抗原、凝血因子、酶、激素或激素變體、受體或其部分、調節蛋白、結構蛋白、報導分子或轉運蛋白、參與分泌過程的蛋白、參與摺疊過程的蛋白、伴侶蛋白、肽胺基酸轉運蛋白、糖基化因子、轉錄因子、合成肽或寡肽、胞內蛋白。胞內蛋白可以是酶比如,蛋白酶、神經醯胺酶、環氧化物水解酶、氨基肽酶、醯基酶、醛縮酶、羥化酶、氨基肽酶、脂酶。
[0138]在本發明的方法中,一個或更多個多核苷酸亞組典型地包含具有編碼多肽變體的序列的多核苷酸或包含調節序列的變體。
[0139]變體可以是基因簇的成員。基因簇是用於編碼相同或類似產品的一組兩種或更多種基因。基因簇的例子是人β_珠蛋白基因簇,其包含編碼類似蛋白質的五個功能基因和一個非功能基因。血紅蛋白分子包含來自該基因簇的任何兩個相同的蛋白質,這取決於它們的特異性作用。[0140]變體可以是等位基因或多肽或調節序列的種類變體。
[0141]變體可以是人工變體。
[0142]變體可彼此共享至少約40%的序列同一性。但是,變體可共享至少約50%、至少約60%、至少約60%、至少約60%、至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約至少約95%、至少約96%、至少約97%、至少約98%或至少約99%的序列同一性。
[0143]序列同一性可在多核苷酸的水平上或在多核苷酸變體編碼的多肽水平上計算。本文描述了測定序列同一性的方法。這種同一性旨在橫跨所考慮的變體長度上進行測定,而不是對變體可能是其一部分的整個多核苷酸長度進行測定。
[0144]變體序列可通過分離或擴增從合適的來源製備,而沒有任何進一步的修飾。但是,典型地為了改變(例如,增加或減少)由多核苷酸編碼的多肽的活性,通過分離或擴增製備的多核苷酸可被遺傳修飾以產生額外的變體。
[0145]在一些實施方式中,用來給生物體添加活性的核酸有時被遺傳修飾,以優化編碼期望活性(例如,多肽或蛋白質)的異源多核苷酸序列。如本文所使用的,術語「優化」可指通過優選的密碼子使用來增加或增強表達的改變。術語優化也可指對胺基酸序列的修飾以增加多肽或蛋白質的活性,使得活性與多肽或蛋白質的「天然」版本相比展示更高的催化活性。
[0146]可使用本領域已知的方法對感興趣的核苷酸序列遺傳修飾。誘變技術尤其用於小規模(例如,1、2、5、10或更多核苷酸)的或大規模(例如,50、100、150、200、500或更多核苷酸)的遺傳修飾。誘變允許 技術人員以穩定的方式、天然地(例如,分離使用選擇和篩選)或實驗地通過使用化學品、輻射或錯誤DNA複製(例如,PCR誘變)來改變生物體的遺傳信息。在一些實施方式中,可使用天然核苷酸序列作為參考序列並且修飾可產生期望的活性改變的核苷酸,通過全規模合成(whole scale synthetic)的核酸合成,進行遺傳修飾。誘變方法有時是特異性的或靶向特異性區域或核苷酸(例如,位點定向誘變、基於PCR的位點定向誘變,和體外誘變技術,比如置換和體內寡核苷酸位點定向誘變)。誘變方法就遺傳修飾的布置(例如,化學誘變、插入元件(例如,插入或轉座子元件)和基於錯誤PCR的方法)而言有時是非特異性的或隨機的。
[0147]在一些實施方式中,有時對ORF核苷酸序列進行突變或修飾以改變用於編碼胺基酸的三聯體核苷酸序列(例如,胺基酸密碼子三聯體)。有時改變密碼子三聯體的ORF核苷酸序列的修飾用來改變最初序列中發現的密碼子,以更好地匹配其中表達ORF或核酸反應物的生物體的優選的密碼子使用。例如,密碼子使用,和因此由來自細菌的核苷酸序列編碼密碼子三聯體可與真核生物(比如,酵母或植物)的優選的密碼子使用不同。優選的密碼子使用在細菌種類之間也可不同。在某些實施方式中,有時ORF核苷酸序列被修飾,以消除密碼子對和/或消除mRNA 二級結構,所述mRNA 二級結構可造成由ORF核苷酸序列編碼的mRNA翻譯期間的暫停。有時當mRNA中存在核酸二級結構時發生翻譯暫停,有時由於存在通過造成核糖體暫停使翻譯速度變慢的密碼子對,發生翻譯暫停。在一些實施方式中,使用更低豐度密碼子三聯體可減少由於將裝載的tRNA負載進入核糖體翻譯機制所需要的暫停時間減少而導致的翻譯暫停。因此,為了增加細菌中的轉錄和翻譯效率(例如,其中轉錄和翻譯同時進行)或為了增加真核生物中的翻譯效率(例如,其中轉錄和翻譯在功能上是分開的),感興趣的核苷酸序列的核苷酸序列可被改變,以更好地適於宿主和/或遺傳修飾的微生物的轉錄和/或翻譯機制。在某些實施方式中,通過使用減慢或暫停核糖體的較低豐度密碼子減緩翻譯的速度,可導致期望產物的產率更高,這是由於正確摺疊的蛋白質增加和包涵體形成減少導致的。
[0148]通過測定核苷酸序列供體生物體的密碼子分布並將密碼子分布與受體或宿主生物體中密碼子分布比較,可根據給定生物體的優選使用而改變和優化密碼子。然後本文描述的技術(例如,位點定向誘變等等)可相應地用來改變密碼子。
[0149]可手動,或使用技術人員商購的核酸分析軟體進行密碼子使用的比較。ORF的核苷酸序列的修飾也可用於糾正在不同的生物體中已經趨異的密碼子三聯體序列。例如,某些酵母(例如,熱帶假絲酵母(C.tropicalis)和麥芽糖假絲酵母(C.maltosa))使用胺基酸三聯體CUG (例如,DNA序列中的CTG)編碼絲氨酸。CUG典型地在大部分生物體中編碼亮氨酸。為了保持所得多肽或蛋白質中的正確的胺基酸,必須改變CUG密碼子以反映其中將表達核酸反應物的生物體。因此,如果來自細菌供體的ORF在上面提到的假絲酵母菌株中表達,異源核苷酸序列必須首先被改變或修飾成適當的亮氨酸密碼子。因此,在一些實施方式中,ORF的核苷酸序列有時被改變或修飾以糾正在不同的生物體之間胺基酸密碼子三聯體進化中出現的差異。在一些實施方式中,如果編碼的胺基酸是保守的或當與初始編碼的胺基酸比較時為中性胺基酸改變,核苷酸序列可不改變具體的胺基酸密碼子。
[0150]位點定向誘變是其中DNA分子中的特定核苷酸或特定核苷酸被突變或改變的程序。典型地使用克隆進入環形質粒載體的感興趣的核苷酸序列進行位點定向誘變。位點定向誘變需要下述野生型序列,所述野生型序列是已知的並且用作遺傳改變的平臺。位點定向誘變有時被稱為寡核苷酸定向誘變,因為可使用併入感興趣的互補核苷酸序列中的具有期望的遺傳修飾的寡核苷酸,來實施該技術。允許野生型序列和改變的核苷酸雜交,並且使用DNA聚合酶擴展和複製雜交過的核酸。雙鏈核酸被引入宿主(例如,大腸桿菌)中並在體內進行另外數輪的複製。然後針對攜帶正確誘變處理的序列的那些細胞,選擇和/或篩選攜帶突變的核苷酸序列的轉化的細胞。盒誘變和基於PCR的位點定向誘變是位點定向誘變技術的進一步修飾。位點定向誘變也可在體內進行(例如,置換「突入突出(pop-1npop-out) 」、用合成的寡核苷酸的體內位點定向誘變等等)。
[0151]可用含有期望的(一個或多個)突變的寡核苷酸引物,使用PCR進行基於PCR的誘變。該技術以與標準位點定向誘變類似的方式發揮作用,不同之處是熱循環儀和PCR條件用於替換微生物宿主中克隆的複製和選擇。因為基於PCR的誘變也使用環形質粒載體,使用標準電泳程序,可在足夠輪數的熱循環儀擴增之後,將包含併入的遺傳修飾的擴增片段(例如,線性核酸分子)與包含模板序列的質粒分開。該方法的改進使用線性擴增方法和擴增整個質粒的一對誘變引物。程序利用大腸桿菌Dam甲基酶系統,所述系統使得體內複製的DNA對限制性內切酶Dpnl敏感。PCR合成的DNA沒有被甲基化並且因此對Dpnl是抗性的。該方法允許模板質粒被消化,使得遺傳修飾的PCR合成的質粒被分離並且被轉化進入宿主細菌中,用於DNA修復和複製,從而促進隨後的克隆和鑑定步驟。通過使用部分簡併的引物,某些量的無序性(randomness)可被添加至基於PCR的位點定向誘變。
[0152]化學誘變通常涉及化學品,比如在本文作為非限制性例子提供的甲基磺酸乙酯(EMS)、亞硝酸、絲裂黴素C、N-甲基-N-亞硝基脲(MNU)、二環氧丁烷(DEB)、1,2,7,8-二環氧辛烷(DEO)、甲磺酸甲酯(MMS)、N-甲基-N'-硝基-N-亞硝基胍(MNNG)、4_硝基喹啉1-氧(4-NQ0)、2_甲氧基-6-氯-9 (3-[乙基_氯乙基_氨基丙基氨基卩丫唳二鹽酸(ICR-170)、2-氨基嘌呤(2AP)和羥胺(HA)。這些化學品可造成鹼基對置換、移碼突變、缺失、顛換突變、轉換突變、錯誤複製等等。在一些實施方式中,誘變可在體內實施。有時誘變過程涉及使用宿主生物體DNA複製和修復機制,以併入和複製誘變處理的(一個或多個)喊基。
[0153]另一類型的化學誘變涉及鹼基類似物的使用。鹼基類似物的使用使得錯誤的鹼基配對,這在下一輪複製中被糾正成為較之起始序列的錯配的核苷酸。鹼基類似物誘變將少量的非無序性引入隨機誘變,因為可選擇可在起始序列的某些核苷酸處併入的特定鹼基類似物。錯誤配對的糾正典型地產生已知的替換。例如,溴-脫氧尿苷(BrdU)可併入DNA並且替換序列中的T。宿主DNA修復和複製機制有時可糾正缺陷,但是有時會用G錯誤匹配BrdU。然後下一輪的複製造成來自天然序列中最初A-T的G-C顛換。當UV光輻射兩個相鄰胸腺嘧啶殘基之間的化學鍵時,通過形成胸苷二聚體造成紫外線(UV)誘導的誘變。宿主生物體的切除修復機制糾正DNA的損傷,但是偶爾損傷不正確地修復,這典型地導致C至T的轉換。
[0154]DNA改組是使用來自突變體文庫成員的DNA片段並且隨機改組片段以產生新的突變體序列組合的方法。典型地使用DNasel,隨後隨機退火併使用自身引導的PCR再連接,來產生片段。來自隨機片段退火的DNA突出端提供用於PCR過程的「引物」序列。改組可應用於通過任何上述誘變方法產生的文庫。易錯PCR和其衍生的滾環易錯PCR使用增加的鎂和錳濃度結合限制量的一個或兩個核苷酸,以降低Taq聚合酶的保真度。當所得突變體序列與野生型起始序列相比時,在適當的條件下,錯誤速度可高至2%。擴增之後,突變體編碼序列的文庫必須克隆進合適的質粒。儘管點突變是易錯PCR中最常見的突變類型,但是缺失和移碼突變也是可能的。有 許多商購的易錯PCR試劑盒,包括來自Stratagene和Clontech的那些(例如,分別為全球資訊網地址strategene.com和全球資訊網地址clontech.com)。滾環易錯PCR是下述易錯PCR的變體,其中野生型序列首先克隆進入質粒,整個質粒然後在易錯條件下擴增。如上所述的,也可使用遺傳選擇並在選擇性培養基上篩選生物體或通過從獨特環境中鑑定天然存在的變體,來分離具有改變活性的生物體。例如,2-脫氧-D-葡萄糖是毒性葡萄糖類似物。在該物質上酵母的生長產生是解除葡萄糖調節的突變體。使用2-脫氧-D-葡萄糖已經分離了許多突變體,包括運輸突變體,和同時發酵葡萄糖和半乳糖,而不是首先發酵葡萄糖然後當葡萄糖耗盡時發酵半乳糖的突變體。類似的技術已經用於分離突變體微生物,所述突變體微生物可代謝實驗室環境中的或來自獨特環境的(例如,來自垃圾掩埋場的)塑料、(例如,來自浮油的)石油化學品等等。
[0155]因此,可通過修飾(例如通過點突變、缺失突變、插入突變、基於PCR的誘變等等來實現)編碼序列的核苷酸序列,以改變、增強或增加、減少、基本上減少或消除編碼的蛋白質或肽的活性,來改變多核苷酸的活性。有時,通過修飾的編碼序列編碼的蛋白質或肽以更低的量生產或可能以不可檢測的水平生產,並且在其他實施方式中,由修飾的編碼序列編碼的產物或蛋白質以更高的水平生產(例如,有時密碼子被修飾,從而它們與宿主生物體或經改造的生物體中優先使用的tRNA相容)。為了測定相對活性,來自突變ORF (或包含它的細胞)的產物的活性可與未修飾的ORF(或包含它的細胞)編碼的產物或蛋白質的活性相比較。
[0156]在本發明的方法中,每個多核苷酸亞組中的多個多核苷酸包含編碼肽或多肽的序列和/或調節序列。因此,亞組中的多核苷酸可包含下述元件的一個或更多個,例如:啟動子元件、增強子元件、5'非翻譯區域(5' UTR)或3'非翻譯區域(3' UTR)。這些元件可出現在沒有編碼序列的地方。或者,它們與也出現在多核苷酸中的編碼序列可操作地連接。
[0157]所以,多核苷酸亞組可包括調節元件和/或編碼序列。因此,本發明的方法可用於測定,例如,用於結合給定編碼序列的最佳啟動子。因此,一個多核苷酸亞組可包含啟動子並且「相鄰的」亞組(在組裝的多核苷酸中其與啟動子亞組直接3』連接)可包含編碼序列。這樣,可測定啟動子和編碼序列的最佳組合。該方法可進一步結合其他的亞組,其中多核苷酸包含,例如5,UTR和3,UTR0
[0158]啟動子元件典型地對DNA合成和/或RNA合成而言是需要的。啟動子元件通常包含下述DNA區域,該DNA區域可通過提供用於對應於基因的RNA合成的起始位點,來促進具體的基因轉錄。在一些實施方式中,啟動子一般位於它們調節的基因附近,位於基因的上遊(例如,基因的5'),並且在和基因的有義鏈相同的DNA鏈上。
[0159]5,UTR可包括對其所源自的核苷酸序列而言內源的一個或更多個元件,並且有時包括一個或更多個外源性元件。5' UTR可源自,例如來自任何合適的生物體(例如,病毒、細菌、酵母、真菌、植物、昆蟲或哺乳動物)的任何合適的核酸,比如基因組DNA、質粒DNA、RNA或mRNA。基於選擇表達系統(例如,選擇生物體中的表達,或無細胞系統中的表達),技術人員可選擇用於5' UTR的適當的元件。5' UTR有時包括對技術人員而言已知的下列元件的一個或更多個:增強子序列(例如,轉錄或翻譯)、轉錄起始位點、轉錄因子結合位點、翻譯調節位點、翻譯起始位點、翻譯因子結合位點、附加的蛋白結合位點、反饋調節試劑結合位點、Pribnow框、TATA框、-35元件、E-框(螺旋-環-螺旋結合元件)、核糖體結合位點、複製子、內部核糖體進入位點(IRES)、沉默基因元件等等。在一些實施方式中,啟動子元件可被分離,使得對於適當的條件性調節而言必須的所有5' UTR元件包含在啟動子元件片段中,或在啟動子元件片段的有功能的子序列中。
[0160]多核苷酸亞組中的5' UTR可包括翻譯增強子核苷酸序列。翻譯增強子核苷酸序列通常位於核酸反應物的啟動子和靶核苷酸序列之間。翻譯增強子序列通常結合核糖體,有時是18S rRNA-結合核糖核苷酸序列(即,40S核糖體結合序列)並且有時是內部核糖體進入序列(IRES)。IRES—般形成具有精確布置的RNA三級結構的RNA支架,所述RNA三級結構通過許多特定的分子間相互作用接觸40S核糖體亞單位。核糖體增強子序列的例子是已知的並且可由技術人員鑑定(例如,Mignone等,Nucleic Acids Research33:D141-D146(2005) ;Paulous 等,Nucleic Acids Research31:722-733 (2003) ;Akbergenov等,Nucleic Acids Research32:239-247 (2004) ;Mignone 等,Genome Biology3 (3):評述0004.1-0001.10(2002) ;GaIMe, Nucleic Acids Research30:3401-3411(2002) ;Shaloiko等,http 地址 www.1nterscience, wiley.com, DOI: 10.1002/bit.20267 ;和 Gallie 等,Nucleic Acids Researchl5:3257-3273 (1987))。翻譯增強子序列有時是真核序列,比如Kozak共享序列或其他序列(例如,螅體序列,GenBank登錄號U07128)。翻譯增強子序列有時是原核序列,比如Shine-Dalgarno共享序列。在某些實施方式中,翻譯增強子序列是病毒核苷酸序列。翻譯增強子序列有時來自植物病毒,例如比如菸草花葉病毒(TMV)、苜蓿花葉病毒(AMV);菸草蝕刻病毒(ETV) ;土醜病毒Y(PVY);蕪菁花葉病毒(poty)病毒和婉S.種傳花葉病毒的5' UTR0在某些實施方式中,來自TMV的大約67個鹼基長度的Ω序列包括在核酸反應物中,作為翻譯增強子序列(例如,沒有鳥苷核苷酸並且包括25核苷酸長尾部(CAA)中心區域)。
[0161]3' UTR可包括對其所源自的核苷酸序列而言內源的一個或更多個元件並且有時包括一個或更多個外源性元件。3' UTR可源自,例如來自任何合適的生物體(例如,病毒、細菌、酵母、真菌、植物、昆蟲或哺乳動物)的基因組DNA、質粒DNA、RNA或mRNA的任何合適的核酸,。基於選擇的表達系統(例如,在選擇的生物體中表達),技術人員可選擇適當的3' UTR元件。有時3' UTR包括對技術人員而言已知的下列元件的一個或更多個:轉錄調節位點、轉錄起始位點、轉錄終止位點、轉錄因子結合位點、翻譯調節位點、翻譯終止位點、翻譯起始位點、翻譯因子結合位點、核糖體結合位點、複製子、增強子元件、沉默基因元件和多腺苷尾巴。3' UTR通常包括多腺苷尾巴並且有時沒有,並且如果存在多腺苷尾巴,一個或更多個腺苷部分可被添加或從多腺苷尾巴中缺失(例如,大約5、大約10、大約15、大約20、大約25、大約30、大約35、大約40、大約45或大約50個腺苷部分可被添加或去除)。在一些實施方式中,5' UTR和/或3' UTR的修飾可用於改變(例如,增加、添加、減少或基本上消除)啟動子的活性。
[0162]在本發明的方法中,在編碼多肽的亞組中的每個多核苷酸可與啟動子可操作地連接。但是,相同亞組中的每個多核苷酸可能不必與相同啟動子操作連接。因此,亞組可包括具有不同啟動子的多核苷酸。
[0163]多核苷酸可因此可操作地連接一個或更多個啟動子。不同亞組中編碼多肽的多核苷酸可以可操作地連接分開的啟動子。因此,組裝的多核苷酸可包括對於每個多核苷酸亞組而言可操作的特定啟動子(例如,對於包含來自六個多核苷酸亞組每一個的多核苷酸的組裝的核酸,典型地存在六個啟動子,其中每個啟動子與組裝的多核苷酸的每個組成型多核苷酸可操作地連接)。在一些實施方式中,對於組裝的多核苷酸中表示的兩個或更多個多核苷酸亞組,與多核苷酸可操作地連接的啟動子可以相同或不同。例如,在包含來自六個多核苷酸亞組每一個的多核苷酸的組裝的多核苷酸中,可有六個啟動子,每個啟動子與多核苷酸可操作地連接,其中(i)所有啟動子相同,(ii)所有啟動子不同,(iii) 一些啟動子相同和一些啟動子不同(例如,2個啟動子相同和4個啟動子不同)。
[0164]在本發明的方法中,多核苷酸亞組中的多核苷酸長度可從約50bp至約IOkb。
[0165]在本發明的方法中,確保同源重組的序列長度可從約20bp至約500kb。
[0166]為了促進在靶基因座處的靶向整合併確保多核苷酸亞組的組裝:⑴每個多核苷酸亞組的每個多核苷酸包含能夠與來自一個或更多個其他多核苷酸亞組的每個多核苷酸同源重組的序列;和(ii)兩個多核苷酸亞組的每個多核苷酸包含能夠與宿主細胞中的靶序列同源重組的序列。
[0167]同源重組是下述一類遺傳重組,其中在兩個類似的或相同的DNA分子之間交換核苷酸序列。介導多核苷酸亞組之間的同源重組和與靶基因座的同源重組的序列長度可至少約20bp、至少約30bp、至少約50bp、至少約0.lkb、至少約0.2kb、至少約0.5kb、至少約Ikb或至少約2kb。
[0168] 如上闡釋的,在本發明的方法中,組裝的多核苷酸可在宿主細胞的基因組中的靶基因座處,例如在染色體位置處重組,或重組進入染色體外靶基因座。靶基因座可以是宿主細胞的基因組中的任何合適的基因座。染色體外靶基因座可以是質粒或人工染色體,比如酵母人工染色體,例如其中宿主細胞是酵母細胞。
[0169]組裝的多核苷酸在靶基因座處的重組可導致組裝的多核苷酸在靶基因座處插入,使得在該基因座處沒有遺傳材料丟失(但組裝的多核苷酸將打斷基因座)。但是,組裝的多核苷酸在靶基因座處的重組可替換在靶基因座處的遺傳材料。
[0170]一個或更多個多核苷酸亞組中的多核苷酸可包含一個或更多個位點特異性重組酶位點,例如,如此,可從宿主細胞回收組裝的多核苷酸。位點特異性重組酶插入位點是在參與整合/重組反應的核酸分子上的由重組蛋白,比如Cre重組酶識別的序列。通過Cre重組酶識別的位點是ΙοχΡ,其是34個鹼基對序列,所述34個鹼基對序列由在8個鹼基對核心序列側翼的兩個13個鹼基對反向重複序列(用作重組酶結合位點)組成。重組位點的其他例子包括attB、attP、attL和attR序列,和其突變體、片段、變體和其衍生物,所述重組位點被重組蛋白λ Int和輔助蛋白整合宿主因子(IHF)、FIS和切割酶(Xis)識別。
[0171]便利地,這些位點可位於包含能夠與靶基因座同源重組的序列的多核苷酸亞組中。這樣,整個組裝的多核苷酸可,便利地從宿主細胞中回收。
[0172]在本發明的方法中,宿主細胞典型地是適於遺傳操作且可以在用於工業生產靶產物的細胞密度下培養的那些生物體。合適的生物體可以是微生物,例如可在發酵設備中保持的生物體。
[0173]宿主細胞可以是原核、古細菌或真核生物體,或來自這種生物體的細胞。 [0174]適用於本發明的宿主細胞可包括下列特徵的一個或更多個:好氧、厭氧、絲狀、非絲狀、單倍體、二倍體、營養缺陷型和/或非營養缺陷型。
[0175]適用於本發明的宿主細胞可以是原核微生物(例如,細菌)或非原核微生物。合適的宿主細胞可以是真核微生物(例如,酵母、真菌、變形蟲和藻類)。合適的宿主細胞可來自非微生物來源,例如哺乳動物或昆蟲細胞。
[0176]「真菌」在本文中被定義為真核微生物並包括真菌亞門的所有物種(Alexopoulos,C.J., 1962, In:1ntroductory Mycology, John ffiley&Sons, Inc., New York)。術語「真菌」因此包括絲狀真菌和酵母二者。「絲狀真菌」在本文中被定義為包括真菌亞門和卵菌亞門的所有絲狀形式的真核微生物(如由Hawksworth等人,1995所定義的,上文)。絲狀真菌的特徵在於,菌絲壁由殼多糖、纖維素、葡聚糖、殼聚糖、甘露聚糖和其他複合多糖組成。營養性生長是菌絲延長且碳分解代謝是專性好氧的。絲狀真菌菌株包括但不限於下述菌株:Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、MyceIiophthora、NeocalIimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium 和 Trichoderma。
[0177]「酵母」在本文中被定義為真核微生物並且包括主要以單細胞形式生長的真菌亞門的所有物種。酵母可通過單細胞菌體出芽生長或可通過生物體的分裂生長。
[0178]根據本發明的宿主細胞優選地是真菌宿主細胞,其中真菌如本文上面所定義。優選的真菌宿主細胞是如下面描述的在用於生產發酵產品的工業發酵工藝中使用的真菌。各種絲狀真菌以及酵母用於這種工藝。優選的絲狀真菌宿主細胞可選自下列屬:Aspergillus、Trichoderma、Humicola、Acremonium、Fusarium、Rhizopus、Mortierella、Penici 11 ium、Mycel iophthora、Chrysospor ium、Mucor、Sordar ia、Neurospora、Podospora、Monascus、Agaricus、Pycnoporus、Schizophylum、Trametes 和 Phanerochaete。可用作宿主細胞(例如用作比較轉化的和未轉化的細胞的發酵特點的參考宿主細胞)的優選的真菌菌株包括,例如Aspergillus niger CBS120.49、CBS513.88、Aspergillus oryzae ATCC16868、ATCC20423、IF04177、ATCC1011、ATCC9576、ATCC14488-14491、ATCC11601、ATCC12892、Aspergillus fumigatus AF293 (CBS101355)、P.chrysogenum CBS455.95、Penicilliumcitrinum ATCC38065、Penicillium chrysogenum P2、Acremonium chrysogenumATCC36225、ATCC48272、Trichoderma reesei ATCC26921、ATCC56765、ATCC26921、Aspergillus sojae ATCCll906、Chrysosporium lucknowense ATCC44006 和所有這些菌株的衍生物。尤其優選Aspergillus nigeK:BS513.88和其衍生物作為絲狀真菌宿主細胞。
[0179]任何合適的酵母可選擇作為宿主細胞。優選的酵母宿主細胞可選自下列屬:Saccharomyces (例如,S.cerevisiae、S.bay anus Λ S.pastorianus、S.carlsbergensis)、Kluyveromyces、Candida (例如,C.revkauf1、C.pulcherrima、C.tropicalis、C.utilis)、Pichia(例如,P.pastoris)、Schizosaccharomyces、Hansenula、Kloeckera、Schwanniomyces 和 Yarrowia(例如,Y.1ipolytica(之前歸類為脂假絲酵母))。
[0180]任何合適的原核生物可選擇作為宿主細胞。可選擇革蘭氏陰性或革蘭氏陽性細菌。細菌的例子,包括但不限於杆細菌(例如,B.subtilis、B.megaterium)、不動桿菌、諾卡氏菌、黃色桿菌、埃希氏細菌(例如,大腸桿菌(例如,菌株DH10B、Stbl2、DH5-a、DB3、DB3.1)、DB4、DB5、JDP682 和 ccdA-over (例如,美國臨時號 09/518,188)))、鏈黴菌、Erwinia細菌、Klebsiella 細菌 、Serratia 細菌(例如,S.marcessans)、Pseudomonas 細菌(例如,P.aeruginosa)、Salmonella 細菌(例如,S.typhimurium、S.typhi)。細菌也包括但不限於光合成細菌(例如,綠色非硫細菌(例如,Choroflexus細菌(例如,C.aurantiacus)、Chloronema細菌(例如,C.gigateum))、綠色硫細菌(例如,Chlorobium細菌(例如,C.limicola)、Pelodictyon 細菌(例如,P.1uteolum)、紫色硫細菌(例如,Chromatium 細菌(例如,C.0kenii)),和紫色非硫細菌(例如,Rhodospirillum細菌(例如,R.rubrum)、Rhodobacter 細菌(例如,R.sphaeroides、R.capsulatus)和 Rhodomicrobium 細菌(例如,R.vanellii))。
[0181]來自非微生物生物體的細胞可用作宿主細胞。這種細胞的例子,包括但不限於昆蟲細胞(例如,果蠅(例如,D.melanogaster)、Spodoptera(例如,S.frugiperda Sf9 或Sf21細胞)和Trichoplusa (例如,High-Five細胞);線蟲細胞(例如,C.elegans細胞);鳥類細胞;兩棲類細胞(例如,非洲爪哇細胞);爬蟲類細胞;和哺乳動物細胞(例如,NIH3T3、293、CHO、COS、VERO、C127、BHK、Per_C6、Bowes 黑素瘤和 HeLa 細胞)。
[0182]適合用作本發明宿主細胞的微生物或細胞是可商購的。
[0183]真核細胞具有至少兩個獨立的路徑(一個經同源重組(HR)和一個經非同源重組(NHR)),通過其核酸(特別是DNA)可整合進宿主基因組。酵母Saccharomyces cerevisiae是偏好同源重組(HR)的生物體。該生物體非同源重組與同源重組(NHR/HR)的比可從約0.07 至 0.007 變化。
[0184]W002/052026公開了具有提高的靶向DNA序列進入其基因組的效率的S.cerevisiae的突變體。這種突變體菌株缺少參與NHR的基因(KU70)。
[0185]與S.cerevisiae相反,大部分高級真核生物,比如絲狀真菌細胞至哺乳動物細胞偏好NHR。絲狀真菌中,NHR/HR比的範圍在I和大於100之間。在這種生物體中,靶向整合頻率相當低。
[0186]因此,為了改進在靶基因座處的多核苷酸組裝的效率,優選地根據本發明方法中的宿主細胞中的同源重組(HR)的效率被提高。
[0187]因此,優選地,在根據本發明的方法中,優選地宿主細胞的同源重組(HR)效率提高,這優選地以誘導型方式進行。因為NHR和HR通路是互聯的,可通過調製一個或兩個通路增加HR的效率。HR組件表達的增加將提高HR的效率並且減小NHR/HR的比。NHR組件的表達的減少也將減小NHR/HR的比。根據本發明的載體-宿主系統的宿主細胞中HR效率的增加優選地描繪為NHR/HR比減小並且優選地相對於其中HR和/或NHR通路未經調控的親本宿主細胞計算。可通過本領域技術人員可用的各種方法測量HR和NHR 二者的效率。優選的方法包括測定單載體構建體在親本和經調控的宿主細胞二者中靶向整合和異位整合的效率。可然後為兩個細胞類型計算NHR/HR比。隨後,可計算NHR/HR比的減小值。W02005/095624中,廣泛描述了該優選的方法。
[0188]通過提高HR通路的效率和/或通過降低NHR通路的效率,修飾親本真核細胞,獲得與親本細胞相比具有降低的NHR/HR比的宿主細胞。優選地,NHR/HR比因而減小至少兩倍,優選地至少4倍,更優選地至少10倍。優選地,與親本宿主細胞相比,根據本發明的載體-宿主系統的宿主細胞中的NHR/HR比降低至少5%,更優選地至少10%,甚至更優選地至少20 %,甚至更優選地至少30 %,甚至更優選地至少40 %,甚至更優選地至少50 %,甚至更優選地至少60 %,甚 至更優選地至少70 %,甚至更優選地至少80 %,甚至更優選地至少90%和最優選地至少100%。
[0189]根據一種實施方式,通過提高HR組件的表達水平減少NHR/HR比。HR組件是本領域技術人員熟知的。「HR組件」在本文被定義為,參與控制多核苷酸進入宿主基因組的靶向整合的所有基因和元件,所述多核苷酸與整合靶向的宿主基因組的某預定位點具有一定同源性。
[0190]通過降低NHR組件的表達水平可減小NHR/HR比。「NHR組件」本文定義為,參與控制多核苷酸整合進入宿主基因組的所有基因和元件,而不管所述多核苷酸與宿主基因組序列的同源程度。NHR組件是本領域技術人員熟知的。優選的NHR組件是選自由用於參與NHR通路的酵母基因的根據本發明的載體-宿主系統的宿主細胞同系物或直向同源物組成的下述組的組分:KU70、KU80、RAD50、MRE11、XRS2、LIG4、LIF1、NEJ1 和 SIR4(van den Bosch等,2002,Biol.Chem.383:873-892 和 Allen 等,2003,Mol.Cancer Res.1:913-920)。最優選的是KU70、KU80和LIG4之一以及KU70和KU80 二者。可使用如本文描述的用於獲得必需基因的缺乏的方法實現NHR組件表達水平降低。
[0191]因為可能地降低參與NHR組件的表達可產生不利的表型效果,優選地在根據本發明的載體-宿主系統的宿主細胞中,同源重組效率的提高是誘導型的。這可通過本領域技術人員已知的方法,例如通過使用NHR組件誘導型方法(例如通過將NHR組件布置在誘導型啟動子之後)或通過使用NHR組件的瞬時破壞,或通過將編碼NHR組件的基因放回基因組來實現。[0192]本發明也涉及製備組裝的多核苷酸的文庫的方法,該方法包括:
[0193]-製備如本文描述的宿主細胞文庫;和
[0194]-從宿主細胞文庫回收組裝的核酸,
[0195]從而製備組裝的多核苷酸的文庫。
[0196]本發明也提供可從這種文庫獲得的組裝的多核苷酸。可使用任何合適的方式,例如使用溶胞作用,和任選地,本領域技術人員熟知的核酸純化程序或用商購的細胞裂解和DNA純化試劑和試劑盒,從宿主細胞分離組裝的核苷酸序列。組裝的多核苷酸序列可便利地通過擴增,比如PCR回收。回收可僅僅涉及溶胞作用,使得組裝的核酸製備物為天然細胞製備物形式。
[0197]典型地,這種製備物可接著用於製備宿主細胞的進一步文庫-也就是說,天然製備物可用於將組裝的核酸引入宿主細胞的進一步環境(例如與用於產生第一文庫的宿主細胞不同種類的宿主細胞)。組裝的多核苷酸可包含額外的序列,使得可與其他宿主細胞中的靶基因座進行同源重組。
[0198]但是,組裝的核酸可從樣品(例如,從感興趣的生物體或包含多個感興趣的生物體的培養物,如酵母或細菌)中提取、分離、純化或擴增。
[0199]如本文所使用的,術語「分離的」指核酸從其最初環境(例如,如果其是天然存在的,是天然環境,或如果是外源表達的,是宿主細胞)去除的核酸,並且因此「通過人工」從最初環境中改變。
[0200]一般以比來源樣品中存在的組分量更少的非核酸組分(例如,蛋白質、脂質),提供分離的核酸。包含分離的樣品核酸的組合物可基本上被分離(例如,大約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或大於99%的沒有非核酸組分)。如本文所使用的,術語「純化的」指所述提供的樣品核酸,所述樣品核酸比該樣品核酸所源自的樣品來源中的核酸包含更少核酸種類。包含樣品核酸的組合物可基本上是純化的(例如,大約90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或大於 99% 的沒有其他核酸種類)。這樣可製備核酸文庫。
[0201]本發明進一步提供製備具有期望性質的宿主細胞的方法,該方法包括:
[0202]-製備如本文描述的宿主細胞文庫;和
[0203]-篩選所述宿主細胞文庫,
[0204]從而鑑定具有期望性質的宿主細胞。
[0205]而且,本發明提供製備具有期望性質的宿主細胞的方法,該方法包括:
[0206]-製備如本文描述的組裝的多核苷酸的文庫;
[0207]-將所述文庫轉移至宿主細胞;和
[0208]-篩選所得宿主細胞,
[0209]從而鑑定具有期望性質的宿主細胞。
[0210]在這些方法中,在已經構建根據本發明的文庫之後,可選擇包含文庫中組裝的多肽的優化的宿主細胞。可篩選通過本發明的方法產生的初始宿主細胞文庫。可選地,可根據本發明產生核酸文庫並且所述核酸文庫被轉移進入宿主細胞中,所述宿主細胞接著被進一步篩選。
[0211]可使用任何合適的試驗系統,其包括評估例如由文庫種類產生的靶產物的相對的或實際量的系統。通常使用容易執行高-通量篩選的試驗系統,以選擇最有力地和/或有效地生產靶產物的文庫種類。可在一段時間段進行試驗,以測定最快生產產物的文庫種類,並且鑑定生產最大產物量的文庫種類。
[0212]可通過在優化靶分子產率的條件下培養宿主細胞,來篩選宿主細胞文庫。一般而言,可優化的條件包括碳源的類型和量、氮源的類型和量、碳氮比、氧水平、生長溫度、pH、生物質生產期的長度、靶產物積累期的長度和細胞收穫時間。
[0213]其中可進行篩選試驗的發酵條件可包括若干參數,包括但不限於溫度、氧含量、養分含量(例如,葡萄糖含量)、pH、攪動水平(例如,每分鐘的轉數)、氣流速度(例如,空氣、氧氣、氮氣)、氧化還原電位、細胞密度(例如,光密度)、細胞活力等等。發酵條件的改變(例如,轉換發酵條件)是一個或更多個發酵參數的改變、修飾或替換。例如,人們可通過升高或降低溫度、增加或減少PH(例如,添加或去除酸、鹼或二氧化碳)、增加或減少氧含量(例如,引入空氣、氧、二氧化碳、氮)和/或添加或去除養分(例如,一個或更多個糖或糖的來源、生物質、維生素等等),或前述的組合,改變發酵條件。適於具體靶產品和宿主細胞的發酵條件是本領域技術人員熟知的並且使用的精確發酵條件取決於具體的靶產物和靶細胞。
[0214]本發明的方法可用於鑑定具有期望性質的宿主細胞。典型地,這將是下述性質,所述性質是相對於宿主微生物而言在經改造的微生物中被增加或改進的活性(例如,添加、增加、減少、抑制或去除的活性)。
[0215]增加的活性可能是在宿主微生物中不可檢測的活性。增加的活性一般是與參考宿主細胞(例如包含與組裝的多核苷酸中包括的通路相同通路的宿主細胞)相比,使用本發明選擇的宿主細胞中增 加的活性。
[0216]對於靶產物的生產,活性可增加至任何合適的水平,包括但不限於小於與參考宿主細胞相比,大約2倍(例如,大約10%增加至約99%增加;大約20%、30%、40%、50%、60%、70%、80%、90%增加)、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍或10倍增加,或大於大約10倍增加。
[0217]降低的或抑制的活性一般是與參考宿主細胞相比在使用本發明選擇的宿主細胞中已被降低或抑制的,在宿主微生物中可檢測的的活性。在一些實施方式中,活性可被降低至不可檢測的水平或在某些實施方式中可被減少至可檢測的水平。對於靶產物的生產,活性可減少至任何合適的水平,包括但不限於小於2倍(例如,大約10%減少至約99%減少;大約 20%、30%、40%、50%、60%、70%、80%、90%減少)、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、或10倍、或大於大約10倍減少。
[0218]本發明進一步提供製備具有期望性質的宿主細胞的方法,該方法包括:
[0219]-製備如本文描述的宿主細胞文庫;和
[0220]-篩選所述宿主細胞文庫,
[0221]從而鑑定具有期望性質的宿主細胞。
[0222]而且,本發明提供製備具有期望性質的宿主細胞的方法,該方法包括:
[0223]-製備如本文描述的組裝的多核苷酸的文庫;
[0224]-將所述文庫轉移至宿主細胞;和
[0225]-篩選所得宿主細胞,[0226]從而鑑定具有期望性質的宿主細胞。
[0227]本發明也提供了根據本文描述的方法製備的宿主細胞文庫、核酸文庫和具有期望性質的宿主細胞。本發明進一步提供獲得自或衍生自這種宿主細胞的組裝的核酸。因此,本發明提供了鑑定賦予細胞改進性質的組裝的核酸的方法。改進的性質可以是生產期望的靶產物。
[0228]具有使用本發明的方法鑑定的期望性質的宿主細胞可接著用於生產靶產物。靶產物可在包含靶產物的培養的微生物中提供,並且培養的微生物可新鮮供應或冷凍在液體培養基中或可以是乾燥的。新鮮或冷凍微生物可包含在適當的防潮容器中,如果必要的話,所述容器也可以是控溫的。靶產物可在基本上無細胞的培養基中提供。在一些實施方式中,提供純化自微生物的靶產物或修飾的靶產物,並且靶產物有時以基本上純的形式提供。
[0229]當展示某種程度的相似性時,胺基酸或核苷酸序列被認為是同源的。同源的兩條序列表示相同的進化起源。不論是密切相關還是更遠相關,兩條同源序列通過或高或低的「同一性百分數」或「相似度百分數」表示。儘管有爭議,「同一性百分」或「相似度百分數」、「同源水平」或「同源百分數」經常交換使用。就本發明的目的而言,可使用數學算法實現兩條序列之間的序列比較和同一性百分數的確定。技術人員將意識到這樣的事實:數個不同的電腦程式可用於比對兩條序列並在兩條序列之間測定同源性(Kruskal,J.B.(1983)Anoverview of sequence comparison In D.Sankoff and J.B.Kruskal,(ed.),Time warps,string edits and macromolecules:the theory and practice of sequence comparison,pp.l_44Addison Wesley)。
[0230]兩個核酸或氨 基酸序列之間的百分比同一性可使用用於兩條序列比對的Needleman 和 Wunsch 算法測定。(Needleman, S.B.和 Wunsch, C.D.(1970) J.Mol.Biol.48,443-453)。算法比對胺基酸序列以及核苷酸序列。Needleman-Wunsch算法已經在電腦程式NEEDLE中實施。就本發明的目的而言,使用來自EMBOSS包的NeeDLE程序(版本2.8.0或更高,EMBOSS:歐洲分子生物學開放軟體套裝(2000) Rice, P.Longden, 1.和Bleasby,A.Trends in Genetics 16, (6) 276-277 頁,http: //emboss, bioinformatics, nl/)。對於蛋白質序列而言,使用EBL0SUM62用於替換矩陣。對於核苷酸序列而言,可使用EDNAFULL。可指定其他矩陣。用於比對胺基酸序列的任選的參數是10的缺口開放罰分和0.5的缺口延伸罰分。技術人員將意識到,所有這些不同的參數將產生稍微不同的結果,但是當使用不同的算法時,兩條序列的總體百分比同一性不顯著改變。
[0231]同源或同一性是在包括任何缺口或延伸的全部比對區域上兩條完整序列之間的相同匹配的百分數。兩個比對的序列之間的同源性或同一性可如下計算:兩條序列中顯示相同胺基酸或核酸殘基的比對中的相應位置的數目除以包括缺口的比對的總長度。本文定義的同一性可獲得自NEEDLE並且在程序輸出中標記為「IDENTITY」 (同一性)。
[0232]兩條比對的序列之間的同源性或同一性可如下計算:兩條序列中顯示相同胺基酸或核酸殘基的比對中的對應位置的數目除以減去比對中缺口總數之後的比對的總長度。本文定義的同一性可通過使用N0BRIEF選項獲得自NEEDLE並且在程序輸出中標記為「longest-1dentity」 (最長-同一性)。
[0233]也可通過在嚴格條件下進行的雜交試驗測定序列同一性。如本文所使用的,術語「嚴格條件」指雜交和洗滌的條件。本領域技術人員已知嚴格條件並且可在CurrentProtocols in Molecular Biology, John ffiley&Sons, N.Y., 6.3.1-6.3.6 (1989)中找到。水性和非水性方法描述在該參考文獻中並可被施用。嚴格雜交條件的例子是在6X氯化鈉/檸檬酸鈉(SSC)中大約45°C下雜交,隨後在0.2XSSC、0.1% SDS中50°C下洗滌一次或更多次。嚴格雜交條件的另一例子是在6X氯化鈉/檸檬酸鈉(SSC)中大約45°C下雜交,隨後在0.2X SSC、0.1% SDS中55°C下一個或更多個洗滌。嚴格雜交條件的其他例子是在6X氯化鈉/檸檬酸鈉(SSC)中大約45°C下雜交,隨後在0.2XSSC、0.1%SDS中60°C下洗滌一次或更多次。通常,嚴格雜交條件是在6洗滌氯化鈉/檸檬酸鈉(SSC)中在大約45°C下雜交,隨後在0.2洗滌SSC、0.1% SDS中65°C下洗滌一次或更多次。更通常地,嚴格條件是在
0.5M磷酸鈉、7% SDS中在65°C下,隨後在0.2XSSCU% SDS中在65°C下洗滌一次或更多次。
[0234]本文對作為現有技術給出的專利文檔或其他材料的參考並不表示承認該文檔或材料是已知的或其包含的信息是在任何權利要求的 優先權日:時的公知常識的一部分。
[0235]本文闡釋的每篇參考文獻的內容通過引用以它們的整體併入本文。
[0236]通過下列實施例進一步闡釋本發明:
[0237]實施例
[0238]應當理解,儘管這些實施例表示本發明的優選的實施方式,但僅僅通過示例的方式給出。從上面的討論和這些實施例中,本領域技術人員可獲知本發明的必需特徵,並且在不背離其精神和範圍的情況下,可對本發明做出各種改變和修飾以使其適應各種用途和條件。因此,除了本文顯示和描述的那些,從前述描述中,本發明的各種修飾對本領域技術人員是明顯的。這種修飾也旨在落在所附權利要求的範圍內。
[0239]實施例1
[0240]用體內核酸組裝整合通路
[0241]1.1體內核酸組裝的一般原則
[0242]體內核酸組裝是使用S.cerevisiae的體內同源重組系統來為通路/代謝途徑增加多樣性的技術。其是新的手段/方法,其能夠在一個步驟中實現某些代謝路徑/通路的組裝和優化。該技術保持需要連接的通路部分的同源性並且在必要時將多樣性添加至通路。在一個轉化中,製備具有多個通路變異的菌株集合。然後使該集合經歷有效的篩選方法,以檢測具有最佳通路變體的最佳性能菌株。在該實施例中,發明人描述所進行的實驗,來說明所述方法。一般的概念也示意性地顯示在圖1中。
[0243]1.2製備並純化用於轉化的PCR片段
[0244]體內同源重組用於將完整的測試通路組裝並整合進入Saccharomycescerevisiae CEN.PK2-1C 菌株(MATa ;ura3-52 ;trpl-289 ;leu2_3,112 ;his3 Δ I ;MAL2-8C ;SUC2)。在該實施例中,將在用於完整通路的重組的每個PCR-片段上的大概50bp的必要的同源序列,添加至用於擴增片段的引物(引物序列列舉在表1中,SEQ ID NOs:1至14,轉化的PCR產物列為SEQ ID NOs:15至24)。
[0245]完整整合的測試通路由重組進入基因組的7個分開的部分組成。通路邊緣上的兩個片段是5』和3』 ADEl缺失側翼(SEQ ID NOs:17和18),與測試通路具有重疊的同源性。這些對於經雙交換將通路整合進基因組有作用。中間的5個部分是4個表達盒,標記HIS3用於在轉化之後選擇轉化體。通路中從左(上遊)向右(下遊),第一部分是HIS3表達盒(用於選擇),第二部分是LEU2表達盒,第三部分作為表達盒的有4種選擇(賦予G418抗性的KanMX、Natl諾爾斯菌素抗性、腐草黴素抗性和Hgm潮黴素抗性),第四部分是TRPl表達盒和第五部分是URA3表達盒。同源重組事件以示意圖方式詳細顯示在圖2中。
[0246]根據手冊用Phusion聚合酶(Finnzymes)進行PCR反應。使用含有這些標記的標準質粒作為模板DNA擴增營養缺陷型(HIS3、LEU2、TRP1和URA3)和顯性標記(KanMX、Natl、腐草黴素和潮黴素)。使用分離自CenPK-1137d的染色體DNA擴增5』和3』 ADEl缺失側翼。用標準瓊脂糖電泳技術檢查PCR片段的大小。根據手冊用來自Qiagen的PCR純化試劑盒純化PCR擴增的DNA片段。使用A260/A280在Nanodrop ND-1000分光光度計上測量DNA濃度。
[0247]1.3 轉化至 S.cerevisiae
[0248]如Gietz 和 Woods 描述的(2002 ; Trans format ion of the yeast by theLiAc/SS carrier DNA/PEG method.Methods in Enzymology350:87-96),進行S.cerevisiae的轉化。用lug的經擴增且純化的每種PCR片段轉化CEN.PK113-7D (MATaURA3HIS3LEU2TRP1MAL2-8SUC2),但例外之處是在中間部分使用的片段具有多種選擇,這裡使用添加至總計Iug的等量的任選片段。將轉化混合物在YNB-瓊脂(每升67克的Difco?酵母氮基w/o胺基酸、每升20克的右旋糖(Sigma)、20克的瓊脂)上鋪平板,所述YNB—瓊脂包含每升20mg的腺嘌呤硫酸鹽(Sigma)、每升20mg的L-色氨酸(FLUKA)、每升IOOmg的L-亮氨酸(Fluka)、每毫升50mg的尿喃唳(Sigma)。在30 °C下孵育數天之後,平板上出現菌落,而陰性對照(即,轉化實驗中沒有添加DNA)產生空白平板。大部分菌落(大約80% -90% )顯示紅色表型,這表示在指定ADEl基因座處的成功整合。
[0249]1.4轉化體的分析 [0250]通過將轉化體影印接種(replica plating)至對通路的顯性標記有選擇性的平板,將轉化平板用於進一步分析。為了顯示片段在通路的第三部分中的分布,將轉化體影印接種至G418、諾爾斯菌素、腐草黴素和潮黴素選擇性平板。YEPD-瓊脂(蛋白腖10.0g/Ι、酵母提取物10.0g/Ι、氯化鈉5.0g/Ι、瓊脂15.0g/Ι和2%葡萄糖)平板用於影印接種,將特定抗生素添加至平板,所述抗生素是G418(100μg/ml)或諾爾斯菌素(lOOμg/ml)或腐草黴素(15μg/ml)或潮黴素B (200 μ g/ml)。平板在30°C下孵育2_3天,對菌落計數並且檢查它們在平板之一上的生長。
[0251]結果顯示轉化體中抗性標記的分布,大約24%能夠在G418選擇性平板上生長並且因此含有KanMX標記,大約14%能夠在諾爾斯菌素選擇性平板上生長並且因此含有Natl標記,31%能夠在腐草黴素選擇性平板上生長並且因此含有腐草黴素標記和23%能夠在潮黴素選擇性平板上生長並且因此含有潮黴素抗性標記。剩餘8%不能在所有平板上生長,從中發明人得出結論它們未正確整合通路。
[0252]1.5染色體DNA分離
[0253]將酵母細胞在旋轉搖床中於包含2%葡萄糖的YEP-培養基中(在30°C和280rpm下過夜)生長。將1.5ml的這些培養物轉移至Eppendorf管並且以最大速度離心I分鐘。輕輕倒出上清液並且將球團再懸浮在200μ I的YCPS(10mM Tris.HCl pH7.5中的0.1%SB3-14(Sigma Aldrich,荷蘭);lmM EDTA)和 I μ I 核糖核酸酶(RNase,來自牛胰腺的 20mg/ml核糖核酸酶A,Sigma,荷蘭)中。在65°C下將細胞懸液孵育10分鐘。將懸液在Eppendorf離心機中以TOOOrpm離心I分鐘。丟棄上清液。將球團小心地溶解在200 μ I CLS(25mMEDTA,2%SDS)和ΙμL核糖核酸酶A中。在65°C下孵育10分鐘之後,在冰上冷卻懸液。在添加70μ1 PPS(10M醋酸銨)之後,在Vortex混合器中徹底混合溶液。在離心(在以最大速度運行的Eppendorf離心機中5分鐘)之後,上清液與200 μ I冰冷的異丙醇混合。DNA容易沉澱並且通過離心(5分鐘,最大速度)產生球團。用400μ I冰冷的70%乙醇洗滌球團。在室溫下乾燥球團並且溶解在50 μ I TEdOmM Tris.HCl pH7.5,lmM EDTA)中。
[0254]表1:用於擴增轉化使用的片段的引物序列
[0255]
【權利要求】
1.製備宿主細胞文庫的方法,其中多個所述宿主細胞包含在靶基因座處的組裝的多核苷酸,所述方法包括: (a)提供包含兩個或更多個多核苷酸亞組的多個多核苷酸,其中: (i)每個多核苷酸亞組中的多個多核苷酸包含編碼肽或多肽的序列和/或調節序列; (?)每個多核苷酸亞組編碼的多個肽或多肽,或每個多核苷酸亞組中包含的多個調節序列共享活性和/或功能; (iii)至少一個多核苷酸亞組包含至少兩個不同的多核苷酸種類; (iv)每個多核苷酸亞組的多個多核苷酸包含能夠與來自一個或更多個其他多核苷酸亞組的多個多核苷酸同源重組的序列;和 (V)兩個多核苷酸亞組中的多個多核苷酸包含能夠與宿主細胞中的靶基因座同源重組的核苷酸序列;和 (b)通過在宿主細 中體內進行同源重組在所述靶基因座處組裝所述多個多核苷酸, 從而產生宿主細胞文庫,所述多個宿主細胞文庫包含在所述靶基因座處組裝的多核苷酸。
2.根據權利要求1所述的方法,其中有至少約四個多核苷酸亞組。
3.根據權利要求1或2所述的方法,其中有約20個或更少的多核苷酸亞組。
4.根據前述權利要求任一項所述的方法,其中在(V)中,所述兩個多核苷酸亞組之一中的多個多核苷酸能夠與所述靶基因座的5』序列同源重組並且所述兩個多核苷酸亞組中另一個亞組的多個多核苷酸能夠與所述靶基因座的3』序列同源重組。
5.根據前述權利要求任一項所述的方法,其中至少一個多核苷酸亞組中的多個多核苷酸包含編碼標記基因的序列,所述序列有或沒有(一條或多條)調節序列。
6.根據前述權利要求任一項所述的方法,其中至少兩個多核苷酸亞組中的至少兩個多核苷酸是不同的。
7.根據前述權利要求任一項所述的方法,其中除了包含能夠與靶基因座同源重組的序列的所述兩個多核苷酸亞組和包含編碼標記基因的序列的任何多核苷酸亞組之外,所有多核苷酸亞組中的至少兩個多核苷酸是不同的。
8.根據前述權利要求任一項所述的方法,其中文庫中至少約50%的宿主細胞在一個或更多個靶基因座處具有至少一個組裝的多核苷酸。
9.根據前述權利要求任一項所述的方法,其中所述文庫中至少約70%的所述宿主細胞具有至少一個組裝的多核苷酸,所述組裝的多核苷酸包含來自每個多核苷酸亞組的一個多核苷酸。
10.根據前述權利要求任一項所述的方法,其中所述宿主細胞文庫包括至少約1000個不同的組裝的多核苷酸。
11.根據前述權利要求任一項所述的方法,其中至少一個組裝的多核苷酸包含生物通路的每個成員。
12.根據權利要求11所述的方法,其中所述生物通路確保在宿主細胞中生產感興趣的化合物。
13.根據權利要求12所述的方法,其中所述感興趣的化合物是初級代謝產物、二級代謝產物、多肽或多肽的混合物。
14.根據前述權利要求任一項所述的方法,其中所述至少一個多核苷酸亞組編碼多肽的變體和/或包括調節序列的變體。
15.根據權利要求14所述的方法,其中所述變體包含基因簇的成員。
16.根據權利要求14或15所述的方法,其中所述變體是等位基因或多肽或調節序列的種類變體。
17.根據權利要求14至16任一項所述的方法,其中所述變體是人工變體。
18.根據權利要求14至17任一項所述的方法,其中所述變體彼此都共享至少約50%的序列同一'I"生。
19.根據前述權利要求任一項所述的方法,其中亞組中的編碼多肽的多個多核苷酸與啟動子可操作地連接。
20.根據權利要求19所述的方法,其中亞組中多個多核苷酸的每一個與一個啟動子可操作地連接並且其中所述亞組包含至少兩個不同的啟動子。
21.根據前述權利要求任一項所述的方法,其中包含兩個或更多個多核苷酸亞組的所述多個多核苷酸的每一 個的長度是從約50bp至約IOkbp。
22.根據前述權利要求任一項所述的方法,其中確保同源重組的所述序列的長度是從20bp 至 5kb。
23.根據前述權利要求任一項所述的方法,其中所述靶基因座是宿主細胞基因組中的基因座。
24.根據權利要求1至22任一項所述的方法,其中所述靶基因座是染色體外靶基因座。
25.根據權利要求24所述的方法,其中所述染色體外靶基因座是質粒或人工染色體。
26.根據前述權利要求任一項所述的方法,其中所述宿主細胞是原核或真核細胞。
27.根據權利要求26所述的方法,其中所述原核細胞是細菌細胞。
28.根據權利要求26所述的方法,其中所述真核宿主細胞是真菌細胞、酵母細胞、哺乳動物細胞或昆蟲細胞。
29.根據權利要求28所述的方法,其中所述酵母細胞是S.cerevisiae細胞。
30.製備組裝的多核苷酸的文庫的方法,所述方法包括: -根據權利要求1至29任一項所述的方法製備宿主細胞文庫;和 -從所述宿主細胞文庫回收所述組裝的多核苷酸, 從而製備組裝的多核苷酸的文庫。
31.鑑定具有期望性質的宿主細胞的方法,所述方法包括: -根據權利要求1至29任一項所述的方法製備宿主細胞文庫;和 -篩選所述宿主細胞文庫, 從而鑑定具有所述期望性質的宿主細胞。
32.製備具有期望性質的宿主細胞的方法,所述方法包括: -根據權利要求30製備組裝的多核苷酸的文庫; -將所述文庫轉移至宿主細胞;和 -篩選所得宿主細胞, 從而鑑定具有期望性質的宿主細胞。
33.根據權利要求1至29任一項所述的方法製備的宿主細胞文庫。
34.根據權利要求30所述的方法製備的組裝的多核苷酸的文庫。
35.根據權利要求31或32所述方法製備的具有期望性質的宿主細胞。
36.得自根據權利要求34的文庫或根據權利要求35的宿主細胞的組裝的核酸。
37.表達篩選絲狀真菌轉化體的方法,其包括: (a)分離根據權利要求1至29任一項所述的方法製備的酵母宿主細胞文庫的單菌落轉化體; (b)從酵母轉化體的所述單菌落製備DNA; (c)將步驟(b)的製備物樣品引入絲狀真菌原生質體的分開的懸液中以獲得其轉化體,其中轉化體含有來自所述酵母宿主細胞文庫的一個或更多個拷貝的個體多核苷酸; (d)使步驟(C)的所述個體絲狀真菌轉化體在選擇性生長培養基上生長,從而允許所述絲狀真菌轉化體生長,同時抑制未轉化的絲狀真菌的生長:和 (e)測量由所述個體 多核苷酸編碼的每種多肽的活性或性質。
【文檔編號】C12N15/52GK103975063SQ201280057858
【公開日】2014年8月6日 申請日期:2012年11月23日 優先權日:2011年11月23日
【發明者】約翰尼斯·安德列什·勞博斯, 伯納德·邁瑞克, 理察·克爾曼, 本·達爾克·登 申請人:帝斯曼智慧財產權資產管理有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀