新四季網

修剪式多位點組合裝配的製作方法

2023-07-03 22:43:56


專利名稱::修剪式多位點組合裝配的製作方法
技術領域:
:本發明總體上涉及修剪式多位點組合裝配(tailoredmulti-sitecombinatorialassembly,"TMCA")的方法,其作為產生多個子代多核苷酸和對基因進行特異變化以及在多個位點重裝配突變或變化的方法。在短寡核苷酸上設計併合成突變或變化。寡核苷酸與包括野生型基因的模板DNA退火。DNA聚合酶用於擴增全DNA。從宿主回收所產生的擴增的DNA。該方法的優勢在於速度、技術簡單以及控制裝配的能力。
背景技術:
:已公布的進行基因變化的方法採用,例如,易錯PCR、Invitrogen的GeneTailorsite-directedMutagenesisKit、Stratagene的QuickChangeMutagenesisKit、重疊PCR和基於PCR的連接/重組。對已知方法的研究表明這些方法往往面對一個主要困難在單個位點/臨近區域產生突變和/或修飾和/或這些方法在多個區域進行修飾是費力的。美國專利7,202,086(「'086專利」)要求保護誘變方法,其使用至少5個重疊或不重疊的寡核苷酸以及dsDNA(質粒)以產生突變基因的文庫,其中每個突變平均存在於文庫中1/5以下的基因中。『086專利描述了所公開的發明不同於現有技術,因為'086專利要求控制突變的頻率以避免在一個DNA分子中的「過量突變」(第5欄,28-45行)。所期望的是獲得各含有一個突變的突變體。為了達到該目的,每個突變體寡核苷酸的量與模板量之間的比例必須在0.01-100之間(第5欄,28-45行)。該特徵區別於現有技術,其中同時使用幾個寡核苷酸使得每條引物併入的水平大於75%(第5欄,28-45行)。『086專利要求控制突變的頻率以避免在一個DNA分子中的「過量突變」並產生各含有一個突變的突變體。美國專利7,132,265(「『265專利」)和美國專利公開2003/0064516要求保護將突變引入單鏈DNA(「ssDNA」)分子的方法,其包括退火引物、合成DNA鏈和消化DNA分子。TCMA方法使用雙鏈DNA(「dsDNA」)作為模板。丨265專利在使用ssDNA和dsDNA作為起始底物用於誘變方法之間進行了明確區分(參見,例如,第6欄,45-55行)。美國已公布的申請2003/0194807涉及文庫,其中蛋白質的突變體包括在確定的區域的一個或多個位置上的單個預定胺基酸,其中所述確定的區域是至少三個胺基酸。只允許在位置上的單個變化,即,排除具體胺基酸位置的簡併變化。美國已公布的申請2006/0051748、2006/0134624、2004/0248131和2002/0083488以及美國專利6,673,610,6,335,160和5,354,670中的每一個都要求連接合成的DNA以產生具有突變的子代環狀DNA。另外,美國已公布的申請2006/0051748要求使用瓣狀核酸內切酶並將所有引物與同一DNA鏈退火。美國已公布的申請2006/0134624要求依次(即,不在一個反應中)使用兩種引物。在美國已公布的申請2004/0248131中,引物與兩條鏈退火,其中所述引物必須包括2-4個互補鹼基對。美國專利6,673,610和美國已公布的申請2002/0083488要求使用通過親代DNA鏈消化產生的片段作為大引物(megaprimer)以獲得用於轉化的環狀DNA。美國專利6,335,160涉及來自重疊片段和產生重組文庫的基因裝配。最後,美國專利5,354,670要求兩個轉化步驟和採用限制性(restriction)進行的中間處理。美國專利7,176,004,6,713,285,6,391,548和5,932,419以及美國已公布的申請20040253729和20030032037中的每一個都要求兩種引物以與兩條不同的鏈退火,用於在相反的方向起始擴增(即,正向和反向引物)並要求具有互補區。美國專利7,078,389和5,935,830要求引物以包括誘變劑(例如,補骨脂素),其與模板相互作用以便形成三鏈分子。美國已公布的申請2006/0228786要求在兩個不同的反應中使用兩個不同的引物進行兩條鏈的聚合,然後將合成的ssDNA分子退火。美國已公布的申請2003/0077613涉及基因裝配和產生文庫的方法,其中裝配的基因(ssDNA)與支架DNA退火以填充間隙並產生dsDNA,其被亞克隆至載體。美國已公布的申請2004/0002057描述了在樣品中檢測不包括誘變的配體的方法。美國已公布的申請2004/0002057描述了通過使用誘變劑在培養的細胞中建立突變體大腸桿菌(E.coli)菌株的方法。美國已公布的申請2006/0199222描述了定向進化的一般方法,其中將突變的DNA轉化至具體的桿菌(Bacillus)菌株。仍然存在對更好的且更有效的方法的需要,所述方法有效且快速地產生特異的基因變體和組合基因文庫。
發明內容除非特別定義,所有用於本文的技術和科學術語具有本領域普通技術人員例如化學、生物化學、細胞生物學、分子生物學或醫學領域結合上下文來看所通常理解的含義。因此,本發明的一個目的是提供通過修剪式多位點組合裝配產生多個修飾的多核苷酸的方法,所述修飾的多核苷酸在多個位點具有各種突變的不同組合。本發明允許對基因進行特異變化並在所述基因的多個位點重裝配突變或變化。本發明的這些和其他目的——其與下列優選實施方式的詳細描述(單獨或其組合)結合而變得更加明顯——通過發現如下方法而得以滿足,所述方法包括(a)在單一反應混合物中將至少三種引物添加至雙鏈模板多核苷酸,其中所述至少三種引物不重疊,並且其中所述至少三種引物的每一種包括至少一個不同於其他引物的突變,其中至少一種引物是可與所述模板的負鏈退火的正向引物以及至少一種引物是可與所述模板的正鏈退火的反向引物,和(b)使所述反應混合物進行聚合酶延伸反應以從所述至少三種引物產生多個延伸的修飾的多核苷酸。在另一個實施方式中,產生多個包括感興趣突變的修飾的多核苷酸的方法包括(a)在單一反應混合物中將至少兩種引物添加至雙鏈模板多核苷酸,其中所述至少兩種引物不重疊,並且其中所述至少兩種引物的每一種包括至少一個不同於其他引物的突變,其中至少一種引物是可與所述模板的負鏈退火的正向引物以及至少一種引物是可與所述模板的正鏈退火的反向引物,(b)使所述反應混合物進行聚合酶延伸反應以從所述至少兩種引物產生多個延伸的修飾的多核苷酸,(c)用酶處理所述多個延伸的修飾的多核苷酸,從而破壞所述模板多核苷酸,(d)將所述處理的延伸的修飾的多核苷酸轉化入細胞,所述多核苷酸未用連接酶處理,(e)從所述細胞回收所述多個延伸的修飾的多核苷酸,和(f)選擇包括感興趣的突變的所述多個延伸的修飾的多核苷酸。本發明的一個或多個實施方式的細節在如下所附描述中闡述。雖然類似或等同於本文所述的任何方法和材料可用於本發明的實踐或測試,但是現描述優選的方法和材料。本發明的其他特徵、目的和優勢通過說明書和權利要求將變得明顯。在說明書和所附權利要求中,單數形式包括複數指代,除非上下文明確另外指出。除非上下文明確地另外說明,本文使用或考慮的技術是本領域普通技術人員熟知的標準方法。實施方式的實例僅用於說明目的。本發明的更完整的理解和其許多附隨優勢將易於獲得,因為當與附圖結合考慮時,參考下列詳述,它們得到更好的理解,其中圖1.GSSMsm的圖示。圖2.進化-GSSMsm方法流程的圖示。圖3.修剪式多位點組合裝配的圖示。圖4A-D.TMCA反應中的引物組合。圖5.六個突變裝配中引物退火的圖譜。圖6.具有六個突變位點的可能組合的分布。標準在理想狀態下計算的變體分布;IA採用大腸桿菌菌株XLl-Blue的反應條件1;7A採用大腸桿菌菌株XLl-Blue的反應條件2;13A採用大腸桿菌菌株XLl-Blue的反應條件3;總計來自1A、7A和13A組合的數據;Ox無突變;Ix單個突變;2x兩個突變;3x三個突變;4x四個突變;5x五個突變;6x六個突變。圖7.六突變裝配中統計計算與實驗數據。圖8.四突變裝配中引物退火的圖譜。圖9.具有四個突變位點的可能組合的分布。標準在理想狀態下計算的變體分布;2A採用大腸桿菌菌株XLl-Blue的反應條件1;8A採用大腸桿菌菌株XLl-Blue的反應條件2;14A採用大腸桿菌菌株XLl-Blue的反應條件3;總計來自2A、8A和14A組合的數據;Ox無突變;Ix單個突變;2x兩個突變;3x三個突變;4x四個突變。圖10.具有四個位點的可能組合的分布。標準在理想狀態下計算的變體分布;2B採用大腸桿菌菌株Stbl2的反應條件1;8B採用大腸桿菌菌株Stbl2的反應條件2;14B採用大腸桿菌菌株Stbl2的反應條件3;總計來自2B、8B和14B組合的數據;Ox無突變;Ix單個突變;2x兩個突變;3x三個突變;4x四個突變。圖11.三突變裝配中引物退火的圖譜。圖12.具有三個突變位點的可能組合的分布。標準在理想狀態下計算的變體分布;15A採用大腸桿菌菌株XLl-Blue的反應條件3;9B採用大腸桿菌菌株Stbl2的反應條件2;15B採用大腸桿菌菌株Stbl2的反應條件3;總計來自15A、9B和15B組合的數據;Ox無突變;Ix單個突變;2x兩個突變;3x三個突變。圖13.具有5個突變位點和13個突變體的引物退火圖譜。圖14A、B、C.五個突變位點和13個引物裝配的獨特變體組合。在TMCA第I輪中的變體破壞㈧、第II輪後的變體破壞⑶,引物退火圖譜(C)。優選實施方式詳述TMCA方法可高效快速地產生包括多個變化的特異基因變體或產生組合基因文庫;要求最低的財力和人力;並可以被修改來根據「需要」產生偏好的組合文庫。TMCA方法可不使用連接步驟而進行,因此簡化產生多個突變的方法。對具體文庫的「需要」隨實驗而變化。潛在突變位點——「需要」——例如,可以是1)合理設計的胺基酸變化或2)經驗性確定來產生所期望的對酶的作用的單獨胺基酸改變(由GSSMsm和篩選確定)。產生的每個文庫具有具體數目的潛在突變位點。可優選產生文庫,其偏好於在潛在突變位點具有更多或更少突變的子代。同樣,可優選產生文庫,其中更傾向於或更不傾向於具體突變或突變位點ο所有類似或等同於本文所述的方法和材料可用於本發明的實踐或測試,其中合適的方法和材料在本文進行了描述。本文提及的所有出版物、專利申請、專利和其他參考文獻通過引用全部併入本文。另外,材料、方法和實例僅是闡述性的並且不意圖是限制性的,除非另外說明。在該申請中,本發明人設計了在圖3中一般性示出的修剪式多位點組合裝配方法。作為比較,圖1和圖2圖解了進化-基因位點飽和誘變(GeneSiteSaturedMutagenesis,「GSSM」),其中對於不同胺基酸,每個突變位置可含有兩個或更多個突變。進化-GSSMsm可用於將核苷酸變化引入具體基因並每次對於一個殘基或更多個殘基將開放閱讀框的每個密碼子突變為所有其他胺基酸。因此,產生GSSMsm文庫,其中單個克隆包括具有一個變化的DNA,而由TMCA方法產生的文庫中的子代多肽可包括多個突變,優選兩個或更多個、更優選三個或更多個、更優選四個或更多個、五個或更多個、六個或更多個、八個或更多個、十個或更多個以及更優選十二個或更多個突變。使用GSSMsm技術,每次改變一個殘基以覆蓋所有20種胺基酸。篩選文庫並鑑定高表達突變型。設計TMCA反應,用於在一個分子的多個位點產生突變。TMCA反應可用於組合從GSSMsm文庫鑑定的高表達突變型。在TMCA反應條件下,預期形成多種PCR產物。該PCR產物不被預期轉化入細胞並得到擴增。在本發明的上下文中,如本文所用,術語「胺基酸」是指含有氨基(-NH2)和羧基(-C00H)的任何有機化合物;優選地作為自由基或可選地在縮合後作為肽鍵的一部分。「二十種天然發生的胺基酸」是本領域所理解的,其是指丙氨酸(ala或A)、精氨酸(arg或R)、天冬醯胺(asn或N)、天冬氨酸(asp或D)、半胱氨酸(cys或C)、穀氨酸(glu或E)、穀氨醯胺(gin或Q)、甘氨酸(gly或G)、組氨酸(his或H)、異亮氨酸(ile或I)、亮氨酸(leu或L)、賴氨酸(Iys或K)、甲硫氨酸(met或M)、苯丙氨酸(phe或F)、脯氨酸(pro或P)、絲氨酸(ser或S)、蘇氨酸(thr或T)、色氨酸(trp或W)、酪氨酸(tyr或Y)和纈氨酸(val或V)。術語「擴增」(「聚合酶延伸反應」)意思是多核苷酸拷貝數增加。術語「對應於」用於本文意思是多核苷酸序列與參考多核苷酸序列的全部或部分同源(即,相同,但不是嚴格進化相關),或多肽序列與參考多肽序列相同。作為對比,術語「互補於」用於本文意思是互補序列與參考多核苷酸序列的全部或部分同源。作為說明,核苷酸序列「TATAC」對應於參考「TATAC」並互補於參考序列「GTATA」。「引物」在本文定義為可與模板核酸退火併作為DNA擴增起點的核酸鏈。引物可完全或部分互補於模板多核苷酸的特定區域。非互補核苷酸在本文定義為錯配。錯配可位於引物內或在引物的一端。優選地,單個核苷酸錯配;更優選兩個,以及更優選地,三個或更多連續或不連續核苷酸錯配位於引物內。引物具有6至200個核苷酸,優選20至80個核苷酸,以及更優選43至65個核苷酸。更優選地,引物具有10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185或190個核苷酸。如本文所定義,「正向引物」是互補於模板多核苷酸負鏈的引物。如本文所定義,「反向引物」是互補於模板多核苷酸正鏈的引物。優選地,正向和反向引物不包括重疊核苷酸序列。如本文所定義,「不包括重疊核苷酸序列」意思是正向和反向引物分別不能與模板多核苷酸負鏈和正鏈區域退火,在所述區域中正鏈和負鏈互相互補。關於與模板多核苷酸的相同鏈退火的引物,「不包括重疊核苷酸序列」意思是引物不包括互補於模板多核苷酸相同鏈相同區域的序列。正鏈與有義鏈相同並也可稱為編碼鏈或非模板鏈。這是與mRNA具有相同序列的鏈(除了它具有T而不是U)。另一條鏈稱為模板鏈、負鏈或反義鏈,互補於mRNA。「覆蓋模板多核苷酸同一選擇區域的引物」在本文定義為一組簡併引物,各引物包括至少一個簡併位置,其中感興趣的突變是一系列在簡併位置的不同核苷酸;或定義為一組簡併引物,其包括至少一個簡併密碼子,該簡併密碼子對應於模板多核苷酸的至少一個密碼子;或者它們的組合。例如,用於三密碼子突變Y276F/S282L、H、P、R或C/L284F(參見例如,圖4、15或16)的所有可能組合的一組引物是覆蓋模板的同一區域的引物。「覆蓋模板多核苷酸同一選擇區域的引物」也可以是,例如,具體引物的組合。DNA「消化」是指用僅在DNA的某些序列上起作用的限制酶催化切割DNA。本文所用的各種限制酶是可購得的,並且它們的反應條件、輔因子和其他要求得以採用,如本領域普通技術人員所知的。用於分析目的,通常地1μg質粒或DNA片段在約20μ1緩衝溶液中與約2個單位的酶一起使用。用於分離用於質粒構建的DNA片段的目的,通常在更大體積中用20至250個單位的酶消化5至50μg的DNA。對具體限制酶的適當緩衝液和底物量由製造廠商規定。通常在37°C使用約1小時的溫育時間,但可根據供應商說明而變化。消化後,可以將反應物在凝膠上進行電泳。「重組」酶是指重組DNA技術產生的酶,即,由編碼所期望酶的外源DNA構建體轉化的細胞產生的酶。「合成」酶是由化學合成製備的酶。術語「限制位點,,是指識別序列,其對限制酶作用的發揮是必需的,並包括催化切割位點。可理解的是,切割位點可以包括在或可以不包括在限制位點的一部分中,該限制位點包括低兩可性序列(alowambiguitysequence)(即含有限制位點存在頻率的主要決定子的序列)。因此,在許多情況下,相關限制位點僅含有低兩可性序列,其具有內部切割位點(例如EcoRI位點中的G/AATTC)或直接相鄰切割位點(例如EcoRII位點中的/CCWGG)。在其他情況下,相關限制酶(例如Eco57I位點或CTGAAG(16/14))含有低兩可性序列(例如Eco57I位點中的CTGAAG序列),其具有外部切割位點(例如Eco57I位點中的N16部分)。當酶(例如限制酶)被稱為「切割」多核苷酸時,應理解的意思是該限制酶催化或促進多核苷酸的切割。限制位點中的「多義鹼基要求(ambiguitybaserequirement)」是指不是最完全程度上明確的核苷酸鹼基要求,即不是具體鹼基(例如,在非限制示例中,具體鹼基選自A、C、G和T),而可以是至少兩個或更多個鹼基中的任何一個。本領域以及本文用來表示鹼基多義性的通常可接受的縮寫包括下列1=6或六;¥=(或11;11=六或(;1(=6或11;5=G或C;W=A或T;H=A或C或T;B=G或T或C;V=G或C或A;D=G或A或T;N=A或C或G或Τ。「參考序列」是用作序列比較基礎的限定序列;參考序列可以是較大序列的亞群,例如,序列表中給定的全長cDNA或基因序列的片段,或可包括完整的cDNA或基因序列。通常,參考序列的長度為至少20個核苷酸,通常地長度為至少25個核苷酸,以及通常地長度為至少50個核苷酸。由於兩個多核苷酸可各自(1)包括兩個多核苷酸之間相似的序列(即,完整多核苷酸序列的一部分),以及(2)可進一步包括兩個多核苷酸之間不同的序列,兩個(或更多個)多核苷酸之間的序列比較通常通過在「比較窗」的範圍內比較兩個多核苷酸的序列來進行以鑑定並比較具有序列相似性的局部區域。「比較窗」如本文所用是指至少20個連續核苷酸位置的概念上的片段,其中多核苷酸序列可以與具有至少20個連續核苷酸的參考序列比較,並且其中對於兩個序列的最適比對,所述多核苷酸序列在比較窗中的部分相比於參考序列(其不包括插入或缺失)可包括百分之20以下的插入或缺失(即,缺口)。用於比對比較窗的序列最適比對可以通過Smith的局部同源算法(Smith和Waterman,AdvApplMath,1981;Smith禾口Waterman,JTeorBiol,1981;Smith和Waterman,JMolBiol,1981;Smith等,JMolEvol,1981)、Needleman的同源比對算法(Needleman和Wuncsch,1970)、Pearson的相似性檢索方法(Pearson和Lipman,1988)、這些算法的計算機執行(WisconsinGeneticsSoftwarePackageRelease7·O中的GAP、BESTFIT、FASTA禾口TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,Wis.)或通過目測來進行,並選擇由各種方法產生的最佳比對(即,在比較窗範圍內得到最高同源性百分比)。「保守胺基酸置換」是指具有類似側鏈的殘基的可交換性。例如,具有脂肪族側鏈的一組胺基酸是甘氨酸、丙氨酸、纈氨酸、亮氨酸和異亮氨酸;具有脂肪族_羥基側鏈的一組胺基酸是絲氨酸和蘇氨酸;具有含氨基側鏈的一組胺基酸是天冬醯胺和穀氨醯胺;具有芳香族側鏈的一組胺基酸是苯丙氨酸、酪氨酸和色氨酸;具有鹼性側鏈的一組胺基酸是賴氨酸、精氨酸和組氨酸;以及具有含硫側鏈的一組胺基酸是半胱氨酸和甲硫氨酸。優選的保守胺基酸置換組是纈氨酸_亮氨酸_異亮氨酸、苯丙氨酸_酪氨酸、賴氨酸_精氨酸、丙氨酸_纈氨酸以及天冬醯胺_穀氨醯胺。當提及參考多肽時,術語「片段」、「衍生物」和「類似物」包括多肽,其保持與參考多肽至少基本相同的至少一種生物功能或活性。另外,術語「片段」、「衍生物」或「類似物」由「前原-形式」分子示例,例如低活性前蛋白,其通過可切割修飾以產生具有明顯更高活性的成熟酶。術語「基因」意思是參與產生多肽鏈的DNA片段;它包括編碼區之前和之後的區域(前導區和非轉錄尾區)以及各編碼片段(外顯子)之間的插入序列(內含子)。術語「異源」意思是一個單鏈核酸序列不能與另一個單鏈核酸序列或它的互補鏈雜交。因此異源區意思是多核苷酸區或多核苷酸在它們的序列中具有不能與另一個核酸或多核苷酸雜交的區域或區。這些區域或區例如是突變區。術語「同源的」或「部分同源的」意思是一個單鏈核酸序列可與互補單鏈核酸序列雜交。雜交的程度可取決於許多因素,包括序列之間同一性的量以及雜交條件,例如如下所討論的溫度和鹽濃度。優選地,同一性區域大於約5bp,更優選地,同一性區域大於10bp。術語「相同」或「同一性」意思是兩個核酸序列具有相同序列或互補序列。因此,「同一性區」意思是多核苷酸的區域或區或全部多核苷酸與另一個多核苷酸的區或該多核苷酸相同或互補。術語「分離的」意思是材料從其原始環境(例如,自然環境,如果它是天然發生的)中去除。例如,活體動物中存在的天然發生的多核苷酸或酶不是分離的,但是從自然系統中一些或所有共存材料中分離的同一多核苷酸或酶則是分離的。這些多核苷酸可以是載體的一部分和/或這些多核苷酸或酶可以是組合物的一部分,以及仍可以是分離的,因為這些載體或組合物不是其自然環境的一部分。「分離的核酸」意思是核酸,例如DNA或RNA分子,其不與5'和3'側翼序列直接相鄰,當在所述核酸來源的生物體的天然發生的基因組中存在時,所述核酸通常與所述5'和3'側翼序列直接相鄰。因此該術語描述,例如,併入載體如質粒或病毒載體的核酸;併入異源細胞基因組(或同源細胞基因組,但在不同於其天然發生的位點)的核酸;以及作為分離的分子存在的核酸,例如PCR擴增或限制酶消化產生的DNA片段或體外轉錄產生的RNA分子。該術語還描述了重組核酸,其形成編碼另外的多肽序列的雜合基因的一部分,所述多肽序列可用於例如融合蛋白的產生。「連接」是指在核酸鏈之間形成磷酸二酯鍵的過程(Sambrook等,1982,p.146;Sambrook,1989)。DNA連接酶可將兩個具有單鏈斷裂(在DNA的兩個互補鏈中的斷裂)的DNA鏈連接在一起。可選的、雙-鏈斷裂使用互補鏈作為模板通過不同類型的DNA連接酶進行修復,但還需要DNA連接酶來產生最終的磷酸二酯鍵以完全修復DNA。除非另外提供,可使用已知緩衝液和條件,每0.5μg大概等摩爾量的待連接DNA片段用10個單位的T4DNA連接酶(「連接酶」)完成連接。「產物不被連接」是指在通過使用引物來擴增完整的環狀雙鏈模板多核苷酸而獲得的核酸末端之間不形成磷酸二酯鍵。術語「突變」被定義為野生型序列或親代核酸序列的變化或肽序列的變化。這些突變可以是點突變例如轉換或顛換。突變可以是一個或多個核苷酸或編碼的胺基酸序列的變化。突變可以是缺失、插入或複製。如本文所用,簡併「N,N,N」核苷酸序列表示三聯體,其中「N」可以是A、C、G或T。如本文所用,術語「天然發生」當應用於對象時是指對象可在自然界中發現這一事實。例如,存在於生物體(包括病毒)中,可從自然界來源中分離的並沒有經過實驗室人工刻意修飾的多肽或多核苷酸序列是天然發生的。通常,術語天然發生的是指存在於非病原(無疾病的)個體的對象,例如對該物種將具有典型性。如本文所用,「核酸分子」包括至少一個鹼基或一個鹼基對,其分別取決於它是單鏈或雙鏈。另外,核酸分子可以專有地或嵌合地屬於含核苷酸的分子的任何組,例如但不限於下列核酸分子組RNA、DNA、基因組核酸、非基因組核酸、天然發生的和非天然發生的核酸以及合成核酸。這包括——作為非限制實例——與任何細胞器例如線粒體相關的核酸、核糖體RNA和嵌合地包括與天然發生的成分非天然一起發生的一種或多種成分的核酸分子。另外,「核酸分子」可部分含有一個或多個非基於核苷酸-的組分,例如但不限於胺基酸和糖類。因此,作為實例而非限制,部分基於核苷酸-部分基於蛋白質的核酶被認為是「核酸分子」。另外,作為實例而非限制,用可檢測的部分標記(例如放射性標記或可選地非放射性標記的核酸分子)同樣被認為是「核酸分子」。術語「編碼特定蛋白質或多肽的核酸序列」或「編碼特定蛋白質或多肽的序列的DNA」或「編碼特定蛋白質或多肽的核苷酸序列」是指DNA序列,當被置於適當的調節序列的調控下時,其被轉錄並翻譯成蛋白質或多肽。「啟動子序列」是能夠在細胞中結合RNA聚合酶並啟動下遊(3'方向)編碼序列轉錄的DNA調節區域。啟動子是DNA序列的一部分。該序列區域在它的3'末端具有起始密碼子。啟動子序列包括最小數目的鹼基,其中元件是以高於背景的可檢測水平啟動轉錄必需的。但是,在RNA聚合酶結合序列並在起始密碼子(啟動子的3'末端)啟動轉錄後,轉錄以3'方向向下遊進行。在啟動子序列中,將發現轉錄起始位點(通過用核酸酶Sl作圖進行方便地確定)以及負責RNA聚合酶結合的蛋白結合結構域(共有序列)。術語「編碼蛋白質或肽的核酸」或「編碼蛋白質或肽的DNA」或「編碼蛋白質或肽的多核苷酸」和其他同義術語包括僅包含蛋白質或肽的編碼序列的多核苷酸,以及包括包含另外的編碼和/或非編碼序列的多核苷酸。因此,在非限制實施方式中,「核酸文庫」包括一個或多個核酸分子的基於載體的集合。在另一個優選的實施方式中,「核酸文庫」包括核酸分子的非基於載體的集合。還在另一個優選的實施方式中,「核酸文庫」包括部分基於載體和部分非基於載體的核酸分子的組合集合。優選地,組成文庫的分子集合是根據各核酸分子種類可檢索並可分離的。「寡核苷酸」(或同義為「寡聚體」)是指單鏈多脫氧核苷酸或兩個互補多脫氧核苷酸鏈,其可以是化學合成的。這些合成寡核苷酸可以具有或不具有5'磷酸。不具有5'磷酸的合成寡核苷酸在激酶存在的情況下,不添加磷酸與ATP,不能與另一個寡核苷酸連接。合成的寡核苷酸將連接至未去磷酸化的片段。如本文所用,術語「親代多核苷酸組」是包括一個或多個不同的多核苷酸種類的組。通常該術語用於指代子代多核苷酸組,其優選地通過親代組的誘變處理而獲得,其中術語「親代」、「起始」和「模板」可互換使用。如本文所用,術語「生理條件」是指溫度、pH、離子強度、粘度和與活生物體相容的和/或通常在活的培養的酵母細胞或哺乳動物細胞中胞內存在的類似生物化學參數。例如,在通常的實驗室培養條件下生長的酵母細胞的細胞內條件是生理條件。體外轉錄混合物的合適體外反應條件通常是生理條件。一般而言,體外生理條件包括50-200mMNaCl或KCl,pH6.5-8.5,20-45°C和0.OOl-IOmM二價陽離子(例如,Mg++、Ca++);優選約150mMNaCl或KC1,pH7.2-7.6,5mM二價陽離子並通常包括百分之0.01-1.0%非特異性蛋白質(例如,BSA)。非離子去汙劑(Tween,NP-40,TritonX-100)可一般以約0.001至2%,通常以0.05-0.2%(ν/ν)存在。具體水性條件可以由實踐者根據常規方法選擇。作為一般指導下列緩衝水性條件是可應用的10-250mMNaCl,5-50mMTris_HCl,pH5_8,任選添加二價陽離子(一種或多種)和/或金屬螯合劑和/或非離子去汙劑和/或膜組分和/或防泡劑和/或閃爍體。標準規則(5'至3')在本文用來描述雙鏈多核苷酸的序列。術語「相關多核苷酸」意思是多核苷酸的區域或區相同以及多核苷酸的區域或區異源。「特異雜交」在本文定義為在第一多核苷酸和第二多核苷酸(例如,與第一多核苷酸不同但基本相同的多核苷酸)之間形成雜交體,其中基本上不相關的多核苷酸序列在混合物中不形成雜交體。「嚴格雜交條件」意思是只有序列之間存在至少90%同一性,優選至少95%同一性以及最優選至少97%同一性時,才發生雜交。參見Sambrook等,1989,其通過引用於此全部併入。術語「野生型」意思是多核苷酸不包括任何突變。「野生型」蛋白意思是蛋白質以自然界中發現的活性水平具有活性,並包括自然界中發現的胺基酸序列。原始多核苷酸的來源可從單獨的生物體(「隔離群」)、已生長在確定成分培養基(「富集培養物」)中的生物體集合或最優選地未培養的生物體(「環境樣品」)中分離。使用不依賴培養的方法以從環境樣品中衍生出編碼新生物活性的多核苷酸是最優選的,原因在於它可獲得未被利用的生物多樣性資源。可從中製備多核苷酸的微生物包括原核微生物,例如真細菌和古細菌,以及低等真核微生物例如真菌、一些藻類和原生動物。多核苷酸可以從環境樣品中分離,在該情況下核酸可以在不培養生物體的情況下加以回收或從一種或多種培養的生物體加以回收。一方面,這些微生物可以是嗜極端生物,例如超嗜熱菌、嗜冷菌(psychrophiles)、嗜冷生物(psychrotrophs)、嗜鹽菌、嗜壓微生物和嗜酸微生物。將如上文所述選擇和分離的多核苷酸引入合適的宿主細胞。選擇的多核苷酸優選已經存在於包括適當的控制序列的載體中。宿主細胞可以是高等真核細胞例如哺乳動物細胞,或低等真核細胞例如酵母細胞,或者優選地,宿主細胞可以是原核細胞,例如細菌細胞。將構建體引入宿主細胞可通過磷酸鈣轉染、DEAE-Dextran介導的轉染或電穿孔來實現(Davis等,1986)。作為適當宿主的典型實例,可提及的是細菌細胞,例如大腸桿菌和螢光假單胞菌(Pseudomonasfluorescens);噬菌體;真菌細胞,例如酵母、畢赤酵母(Pichiapastoris)和黑麴黴(Aspergillusniger);昆蟲細胞,例如果蠅(Drosophila)S2和夜蛾(Spodoptera)Sf9;動物細胞,例如CH0、C0S或Bowes黑色素瘤;腺病毒;和植物細胞。TMCA文庫可例如以質粒形式在大腸桿菌細胞中產生,然後可進一步將文庫引入其他宿主。通過本文的教導,適當宿主的選擇被認為在本領域普通技術人員的範圍內。當具體提及各種可應用以表達重組蛋白的哺乳動物細胞培養系統時,哺乳動物表達系統的實例包括猴腎成纖維細胞的C0S-7系,描述為「SV40-轉化的猿猴細胞支持早期SV40突變體的複製」(Gluzman,1981),以及其他能夠表達相容性載體的細胞系,例如C127、3T3、CH0、HeLa和BHK細胞系。哺乳動物表達載體將包括複製起點、合適的啟動子和增強子,且還包括任何必需的核糖體結合位點、多聚腺苷化位點、剪接供體和受體位點、轉錄終止序列以及5'側翼非轉錄序列。源自SV40剪接的DNA序列和多聚腺苷化位點可用於提供所需的非轉錄基因元件。含有感興趣的多核苷酸的宿主細胞可在常規營養培養基中培養,該常規營養培養基被修飾為適合於激活啟動子、選擇轉化子或擴增基因。培養條件,例如溫度、PH等等是以往用於篩選表達的宿主細胞的那些條件,並且對本領域普通技術人員是明顯的。作為可使用的表達載體的代表性實例,可以提到病毒顆粒、杆狀病毒、噬菌體、質粒、噬菌粒、黏粒、F黏粒、細菌人工染色體、病毒DNA(例如牛痘病毒、腺病毒、口蹄疫病毒、狂犬病毒和SV40衍生物)、基於Pl的人工染色體、酵母質粒、酵母人工染色體和對感興趣的具體宿主(例如桿菌、麴黴菌和酵母)特異的任何其他載體。因此,例如,DNA可以包括在用於表達多肽的多個表達載體中的任何一個。這些載體包括染色體DNA序列、非染色體DNA序列和合成DNA序列。大量合適的載體是本領域普通技術人員所知的並可購得。下列載體作為實例提供;細菌PQE載體(Qiagen)、pBluescript質粒、pNH載體、(lambda-ZAP載體(Stratagene);ptrc99a、pKK223_3、pDR540、pRIT2T(Pharmacia);真核pXTl、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。但是,可使用任何其他質粒或其他載體,只要它們可在宿主中複製並存活。低拷貝數或高拷貝數載體可用於本發明。用於本發明的優選類型的載體含有f_因子起點複製。大腸桿菌中的f_因子(或致育因子)是在接合過程中實現高頻轉移並使其自身的細菌染色體低頻轉移的質粒。特別優選的實施方式是使用克隆載體,其被稱為「F黏粒」或細菌人工染色體(BAC)載體。這些源自大腸桿菌f-因子,其能夠穩定整合基因組DNA的大片段。當與來自混合的未培養的環境樣品的DNA整合時,這使得有可能獲得穩定「環境DNA文庫」形式的大基因組片段。用於本發明的另一個優選類型的載體是黏粒載體。黏粒載體最初設計來克隆並增殖基因組DNA的大片段。克隆至黏粒載體在「MolecularCloning:AlaboratoryManual」(Sambrook等,1989)中詳述。表達載體中的DNA序列被可操縱地連接至適當的表達控制序列(啟動子)以引導RNA合成。具體命名的細菌啟動子包括lacI、lacZ、T3、T7、gpt、XPioPl和trp。真核啟動子包括CMV即時早期、HSV胸苷激酶、早期和晚期SV40、來自逆轉錄病毒的LTR和小鼠金屬硫蛋白-I。適當的載體和啟動子的選擇完全在本領域普通技術人員水平之內。表達載體還含有用於翻譯起始的核糖體結合位點以及轉錄終止子。載體還可包括用於擴增表達的適當序列。啟動子區域可選自任何期望的基因,其使用CAT(氯黴素轉移酶)載體或具有可選擇標記的其他載體。另外,表達載體優選地含有一個或多個可選擇的標記基因以提供表型性狀用於篩選轉化的宿主細胞,例如用於真核細胞培養的二氫葉酸還原酶或新黴素抗性或例如在大腸桿菌中的四環素或氨苄青黴素抗性。通常,重組表達載體將包括複製起點和允許宿主細胞轉化的可選擇標記,例如大腸桿菌的氨苄青黴素抗性基因和釀酒酵母(S.cerevisiae)TRPl基因,以及源自高表達基因的啟動子以引導下遊結構序列轉錄。這些啟動子可源自操縱子,其編碼糖分解酶例如3-磷酸甘油酸酯激酶(PGK)、α-因子、酸性磷酸酶或熱休克蛋白等等。異源結構序列在適當的階段與翻譯起始和終止序列裝配,以及優選地與能夠引導翻譯的蛋白質分泌至外周胞質空間或細胞外培養基的前導序列裝配。該克隆策略允許通過載體驅動啟動子和內源啟動子進行表達;載體啟動可能對基因表達是重要的,該基因的內源啟動子在大腸桿菌中不發揮作用。在探測所選擇的DNA之前,分離自或源自微生物的DNA可優選地插入載體或質粒。這些載體或質粒優選地是那些含有表達調節序列——包括啟動子、增強子等——的載體或質粒。這些多核苷酸可以是載體和/或組合物的一部分並且仍可以是分離的,因為這些載體或組合物不是其天然環境的一部分。特別優選的噬菌體或質粒和用於引入並包裝至它們中的方法在本文描述的步驟中詳述。純化形式的任何來源的核酸可用作起始核酸(也定義為「模板多核苷酸」)。因此,該方法可利用DNA或RNA,包括信使RNA,該DNA或RNA可以是單鏈並優選是雙鏈。另外,含有各自一條鏈的DNA-RNA雜合體可以被利用。核酸序列可以具有各種長度,其取決於待突變的核酸序列的大小。優選地,具體核酸序列為50至50000個鹼基對,以及更優選50-11000個鹼基對。核酸可以從任何來源獲得,例如,從質粒獲得,例如pBR322,從克隆的DNA或RNA或從來自任何來源的天然DNA或RNA獲得,該任何來源包括細菌、酵母、病毒或高等生物例如植物或動物。DNA或RNA可以從血液或組織材料中提取。模板多核苷酸可以使用多核苷酸鏈式反應(PCR,參見美國專利號4,683,202和美國專利號4,683,195)通過擴增獲得。可選地,多核苷酸可存在於在細胞中存在的載體中,以及通過本領域已知方法培養細胞並從細胞提取核酸,可以獲得足夠的核酸。具有突變的具體核酸序列的起始較小群體可用大量不同方法產生。突變可由易錯PCR產生。易錯PCR使用低保真度聚合條件以在較長序列上隨機引入較低水平的點突變。可選地,突變可通過寡核苷酸定向誘變被引入模板多核苷酸。在寡核苷酸定向誘變中,使用限制酶消化將多核苷酸的較短序列從多核苷酸中去除並用合成的多核苷酸替代,在該合成的多核苷酸中各種鹼基已從原始序列改變。多核苷酸序列也可通過化學誘變改變。化學誘變劑包括例如亞硫酸氫鈉、亞硝酸、羥胺、胼或甲酸。其他試劑——其是核苷酸前體的類似物——包括亞硝基胍、5-溴尿嘧啶、2-氨基嘌呤或吖啶。通常,將這些試劑添加至PCR反應以替代核苷酸前體,從而突變序列。嵌入劑例如原黃素、吖啶黃、奎納克林等等也可使用。多核苷酸序列的隨機誘變可通過χ-射線或紫外光照射而實現。通常,如此誘變的質粒多核苷酸被引入大腸桿菌並增殖作為雜合質粒庫或文庫。可選地,具體核酸的較小混合群體可在自然界中發現,原因在於它們可由相同基因的不同等位基因或來自不同相關物種的相同基因(即,同源基因)組成。可選地,它們可以是在一個物種中發現的相關DNA序列,例如,免疫球蛋白基因。一旦產生具體核酸序列的混合群體,可直接使用多核苷酸或使用本領域熟知技術將多核苷酸插入適當的克隆載體。載體的選擇取決於多核苷酸序列的大小和在本發明方法中使用的宿主細胞。本發明模板可以是質粒、噬菌體、黏粒、噬菌粒、病毒(例如逆轉錄病毒、副流感病毒、皰疹病毒、呼腸病毒、副黏病毒等等)或其選擇的部分(例如,包被蛋白、突起糖蛋白、衣殼蛋白)。例如,當待突變的具體核酸序列較大時,黏粒和噬菌粒是優選的,原因在於這些載體能夠穩定地擴增大的多核苷酸。為簡便起見,本發明的TMCA方法將被解釋為意圖在六個不同位點裝配六個點突變。首先,設計六種引物併合成。與野生型序列相比,每種引物含有一個點突變。三個寡聚體被設計為正向引物,而三個寡聚體被設計為反向引物以與基因退火(圖5)。將所有六個寡聚體混合在一起並用於在實施例中詳述的條件下啟動TMCA反應。然後,通過瓊脂糖凝膠確認完成的TMCA反應以確定反應是否成功。將Dpnl限制酶添加至TMCA反應以破壞模板環狀DNA。為使Dpnl發揮作用,模板DNA必須來自可甲基化DNA的大腸桿菌宿主。將Dpnl-處理的反應物轉化入大腸桿菌細胞以回收具有期望突變的DNA。通過測序或期望的分析來篩選轉化體。本發明的方法不限於六個位點。可通過本方法裝配更多或更少數量的位置。還不限於在一個位置的單個變化。可設計多個引物以在相同位置覆蓋不同變化,其中在每個引物上具有單個變化。大腸桿菌已用於實證;但是,其他細菌宿主可用於本方法。本發明的方法不但可以引入點突變,而且可以用簡併引物產生缺失或插入或多個突變。TMCA反應可隨引物濃度、引物Tm(與模板的退火溫度)、DNA聚合酶、模板濃度、弓丨物組合以及控制如何裝配在不同位點的變化的不同宿主而變化。裝配可在體外或體內或二者的組合發生。圖5圖解了引物退火至基因的圖譜。本發明方法的主要用途是GSSMsm高表達突變型的組合重裝配。但是,本發明的方法也可用於例如以下所列的任何其他應用。1.TMCA可用於對基因進行特異變化,包括突變、缺失和插入。2.TMCA可用於產生基於野生型基因的特異基因變體。3.TMCA可用於組合突變、缺失或插入。4.TMCA可用於以可控制的方式產生突變、缺失或插入的組合文庫。5.TMCA可用於產生組合多位點GSSMsm文庫。—般而言,本發明提供產生多個子代多核苷酸的方法,所述子代多核苷酸在多個位點具有各種突變的不同組合。該方法可部分地通過下列步驟的至少一個或多個的組合來進行獲得多核苷酸(「第一」或「模板」)的序列信息。例如,序列可以是野生型、突變的野生型或非天然發生的序列。序列信息可以是完整的多核苷酸或感興趣的部分區域,例如編碼結合位點、結合特異性位點、催化位點或底物特異性位點的序列。多核苷酸可包括序列,例如開放閱讀框、基因、多肽編碼序列或酶編碼序列,其具有或不具有信號或分泌序列。沿著多核苷酸序列,鑑定三個或更多個感興趣的突變,例如在3、4、5、6、8、10、12、20或更多個位置的突變。突變可以在多核苷酸序列水平或對由多核苷酸序列例如密碼子編碼的胺基酸序列的突變。位置可由絕對位置或周圍殘基或同源性情況加以預先確定。突變位置任何一側的序列優選是已知的。例如對於不同胺基酸,每個突變位置可含有兩個或更多個突變。這些突變可以使用基因位點飽和誘變(GSSM)鑑定,如上所述以及美國專利號6,171,820,6,562,594或6,764,835中所述。相對於模板序列,提供包括感興趣突變的引物。引物可以是合成的寡核苷酸。優選地,對每個感興趣的突變提供引物。突變可以是一個或多個核苷酸或所編碼的胺基酸序列的變化、插入或缺失。因此,具有3個感興趣的突變的位置可在該位置使用3種引物。也可以含有簡併位置的引物庫提供引物,以使感興趣的突變處於任何核苷酸或天然發生的胺基酸的範圍內或該範圍的亞群中。例如,可提供引物庫,其偏好用於脂肪族胺基酸殘基的突變。引物可被製備為正向或反向引物,優選地至少一個正向引物和至少一個反向引物,而更優選每種引物具有相對平衡的數量(例如3種正向引物和4種反向引物)。3種正向引物可以選擇相對鄰近的,與類似鄰近的反向引物一致,例如1F、2F、3F、4R、5R、6R、7R。當突變緊密地布置在一起時,可以方便地使用這樣地引物,其含有多於一個位置的突變或在多個位置的突變的不同組合。提供含有模板多核苷酸的多核苷酸。多核苷酸優選地是環狀的,更優選地是超螺旋,例如用於克隆、測序或表達的質粒或載體。多核苷酸可以是單鏈(「ssDNA」)以及優選地雙鏈(「dsDNA」)。例如,TCMA方法將超螺旋(「叱」)(1勸嫩模板進行951Imin的加熱步驟,模板沒有變成ssDNA(參見Levy,NAR,28(12):e57(i_vii)(2000),其表明將scdsDNA加熱至95°C5min不能產生ssDNA分子並且如果在加熱後冷卻該分子則是可逆的(第ii_iii頁,圖2))。在使得引物與多核苷酸退火的條件下,在反應混合物中將引物添加至模板多核苷酸。優選地,在單一反應混合物中將引物添加至多核苷酸,但可根據實驗設計在多個反應中添加。進行引物的聚合酶延伸,優選地使得延伸沿環狀模板分子進行完全。延伸產物(如本文所定義,「子代」或「修飾的延伸的多核苷酸」)可通過常規方法擴增。可對產物進行長度、序列、所期望的核酸性質或多核苷酸和/或多肽表達分析。其他分析方法包括原位雜交、序列篩選或表達篩選。分析可包括一輪或多輪期望性質的篩選和選擇。產物也可轉化入細胞或其他表達系統,例如無細胞系統。無細胞系統可含有與DNA複製、修復、重組、轉錄或翻譯相關的酶。示例性宿主包括細菌、酵母、植物和動物細胞以及細胞系,並包括大腸桿菌、螢光假單胞菌、畢赤酵母和黑麴黴。例如,大腸桿菌的XLl-Blue或Stbl2菌株可用作宿主。當使用大腸桿菌與Dpnl(其可用於在反應後去除不期望的模板)時,模板DNA可來自可甲基化DNA的大腸桿菌宿主。細胞可用於子代多核苷酸的表達。多核苷酸或多肽表達產物可以從細胞中回收並分析長度、序列、所期望的核酸性質或表達多肽。分析可包括一輪或多輪期望性質的篩選和選擇。本發明的方法可在不同反應條件下與相同或不同引物一起使用,以促進具有不同組合或突變數量的產物,例如在實施例所述的條件1A、7A和13A下。通過進行上述方法,本發明還提供由該方法產生的一種或多種多核苷酸,其可被篩選或選擇所期望的性質。一種或多種子代多核苷酸可以表達為多肽,以及任選地被篩選或選擇期望的性質。因此,本發明提供通過本發明的方法產生的多核苷酸和多肽,以及這些多核苷酸和多肽的文庫。本發明進一步提供通過篩選或選擇文庫來篩選文庫以獲得一種或多種多核苷酸或多肽。在本發明的一個方面,產生多個修飾的多核苷酸的優選方法包括(a)在單一反應混合物中將至少三種引物添加至雙鏈模板多核苷酸,其中所述至少三種引物不重疊,並且其中所述至少三種引物的每一種包括至少一個不同於其他引物的突變,其中至少一種引物是可與所屬模板的負鏈退火的正向引物以及至少一種引物是可與所述模板的正鏈退火的反向引物,和(b)使所述反應混合物進行聚合酶延伸反應以從所述至少三種引物產生多個延伸的修飾的多核苷酸。在本發明的另一方面,用未經連接酶處理的所述多個延伸的產物轉化細胞。在本發明的另一方面,從所述細胞回收所述多個延伸的修飾的多核苷酸。在另一個實施方式中,分析所述回收的多個延伸的修飾的多核苷酸,例如,通過表達所述多個延伸的修飾的多核苷酸中的至少一個並分析其表達的多肽。在另一個實施方式中,選擇包括感興趣的突變的所述多個延伸的修飾的多核苷酸。在一個實施方式中,模板多核苷酸是環狀DNA,例如質粒或載體DNA。在另一個實施方式中,環狀DNA是超螺旋DNA。另一方面,可獲得關於模板多核苷酸的序列信息,以及沿著模板多核苷酸上可鑑定三個或更多個感興趣的突變。在另一個實施方式中,在將多個延伸的修飾的產物轉化入細胞之前,可分析聚合酶延伸獲得的產物。在本發明的另一方面,用酶,優選地用限制酶以及更優選地用DpnI限制酶處理通過聚合酶延伸獲得的產物,從而破壞模板多核苷酸序列。將處理的產物轉化入細胞,優選大腸桿菌細胞。在另一個實施方式中,可使用至少兩種,優選地至少三種,更優選地,至少四種、至少五種、至少六種、至少七種、至少八種、至少九種、至少十種、至少i^一種、至少十二種或更多種引物。在一個實施方式中,每種引物包括單點突變(圖4A)。在另一個實施方式中,兩種正向引物或兩種反向引物在模板多核苷酸的相同位置上包括不同變化(圖4B)。在本發明的另一方面,至少一種引物在模板多核苷酸的不同位置上包括至少兩個變化(圖4C)。還在另一個實施方式中,至少一種引物在模板多核苷酸的不同位置上包括至少兩個變化並且至少兩種正向或兩種反向引物在模板多核苷酸的相同位置上包括不同變化(圖4D)。在一個實施方式中,正向引物被分入正向組,而反向引物被分入反向組,並且正向組中的引物和反向組中的引物各自獨立地在相應組中被歸一化為相等濃度而不考慮模板多核苷酸的位置,並且其中在歸一化後,將相同量的正向和反向引物添加至反應中。在該歸一化方法中,可以偏好一些位置的組合。偏好可以歸因於例如,與含有多個引物的位置相比,含有單個引物的一個位置具有相對較低的引物濃度。「位置偏好」是指產生的多核苷酸顯示在它的正向或反向引物組中對於引物在單個位置的併入相對於其他位置具有強的偏好性。這產生修飾的多核苷酸組合,其可在單個引物位置中具有高的突變百分比,但是在正向或反向引物組中另一個位置具有較低的突變百分比。當TMCA的目標是產生包括模板變化的逝直可能組合的子代多核苷酸時,該偏好是不利的。可糾正該偏好,例如通過將引物歸一化成在每個位置都相同的庫。進行兩輪TMCA方法可提高所期望的子代多核苷酸產量,所述子代多核苷酸包括對模板的多個變化,其中第Π輪使用第I輪得到的一些變體。在另一個實施方式中,通過將所述引物編成多個組進行引物歸一化,這取決於它們在模板多核苷酸上的位置,其中覆蓋模板上的相同選擇區域的引物在一個組中;將每組中分入的引物歸一化至相等的濃度;將一組中的正向引物富集成正向組並將所述每一正向引物組之間的濃度歸一化至相等;將一組中的反向引物富集成反向組並將所述每一反向引物組之間的濃度歸一化至相等;以及將相等量的所富集的正向和反向引物添加至所述反應。對於位置組合,沒有觀察到偏好。在一個實施方式中,提供一組各包括簡併位置的簡併引物,其中感興趣的突變是一系列在簡併位置上的不同核苷酸。在另一個實施方式中,提供一組簡併引物,其包括對應於所述模板多核苷酸的至少一個密碼子的至少一個簡併密碼子以及與與所述模板多核苷酸序列的密碼子相鄰的序列同源的至少一個相鄰序列。在另一個實施方式中,簡併密碼子是N,N,N並編碼任何20種天然發生的胺基酸。在另一個實施方式中,簡併密碼子編碼小於20種天然發生的胺基酸。在不同實施方式中,產生包括感興趣突變的多個修飾的多核苷酸的優選方法包括(a)在單一反應混合物中將至少兩種引物添加至雙鏈模板多核苷酸,其中所述至少兩種引物不重疊,並且其中所述至少兩種引物的每一種包括至少一個不同於其他引物的突變,其中至少一種引物是可與所述模板的負鏈退火的正向引物以及至少一種引物是可與所述模板的正鏈退火的反向引物,(b)使所述反應混合物進行聚合酶延伸反應以從所述至少兩種引物產生多個延伸的修飾的多核苷酸,(c)用酶處理所述多個延伸的修飾的多核苷酸,從而破壞模板多核苷酸,(d)將所述處理的延伸的修飾的多核苷酸轉化入細胞,所述多核苷酸未用連接酶處理,(e)從所述細胞回收所述多個延伸的修飾的多核苷酸,以及(f)選擇包括感興趣的突變的所述多個延伸的修飾的多核苷酸。下列實施例表明,在模板或基因的多個位點上的單個突變可在簡單的單一反應混合物中成功地組合,這基於已知的產生突變的方法是預料不到的。來自實驗的所有可能組合的分布近似地反映統計計算的分布模式。反應可以被修改以根據需要產生偏好的組合。在GSSMsm技術下,TMCA技術不使用互補引物,該互補引物與模板多核苷酸正鏈和負鏈退火。根據含有對於該TMCA發明所描述的引物(在單個熱循環反應中正向和反向組)的熱循環延伸的合理期望將是由正向和反向引物的各個引物對確定的擴增線性多核苷酸的專門集合(exclusivecollection)。TMCA條件設置幾乎與標準PCR條件相同。預期在TMCA反應中產生多種PCR產物,其中每種產物比起在單個反應中使用地一組引物包括的整套突變更少的突變,例如,當使用6種引物並且每種引物包括1個突變時,小於6個突變。另夕卜,不期望PCR產物被轉化入細胞並得以擴增。令人驚訝地,TMCA方法可產生在一個分子中包括多個變化的特異基因變體,並可不使用連接步驟而進行,因此簡化了產生多個突變的過程。實施例實施例1.TMCA方法的示例性步驟顯示如下TMCA反應IDpnl處理I轉化入宿主ISS1.進行TMCA反應條件1PfuIOX緩衝液2·5μ1DMSO2.5μ1dNTP(IOmM)0.5μ1模板DNA(25ng/μ1)1μ1PfuTurbo0.5μ1/K14μ1正向引物(5μΜ)2μ1反向引物(5μΜ)2μ1總計25μ1條件2PfxAccu緩衝液5μ1模板DNA(25ng/μ1)1μ1PfxAccuprime0.4μ1/K37.6μ1正向引物(5μΜ)3μ1反向引物(5μΜ)3μ1總計50μ1條件3PfxAccu緩衝液2·5μ1模板DNA(25ng/μ1)1μ1PfxAccuprime0.2μ1/K17.3μ1正向引物(5μΜ)2μ1反向引物(5μΜ)2μ1總計25μ1循環RobocyclerPerkin-Elmer起始變性95°CImin95°C;3min變性95°C45sec95°C;45sec|退火50°CImin50°C;45sec|20個循環延伸68°C2min/kb68°C;2min/kbPolish(修補)68°C5min68°C5min4°C;無限期4°C;無限期2.在瓊脂糖凝膠上跑50的TMCA反應物,以測定反應是否成功。3.將10的Dpnl限制酶稀釋在3μ1水和1μ1緩衝液4(NewEnglandBiolab)中。將5μ1稀釋的酶添加至每個TMCA反應中。在37度溫育4-8小時。4.通過標準轉化方法將Dpnl-處理的反應物轉化入大腸桿菌細胞。5.通過測序或期望的分析篩選產生的克隆。實施例2.在第一個實驗中,選擇基因上的六個位點以組合(圖5)。對於三個位點,使用正向引物建立反應,而對於其餘三個位點,使用三個反向引物建立反應。通過測序鑑定來自所述反應的變體。存在六十四個不同的可能組合。在條件1下,更多具有較低突變位點數量的變體是優選的(圖6)。在條件2和3下,更多具有較高突變位點數量的變體是優選的(圖6)。來自組合數據(總計)的所有可能組合的分布與來自統計計算的分布模式類似(圖6)。當篩選零至六百個克隆時,圖7中的一條曲線顯示變體的期望覆蓋度(%),而另一條曲線顯示完全覆蓋度的可能性。期望覆蓋度(%)曲線上的圓形(8卩,78%、95%、99%和100%)顯示當篩選96、192、288或384個克隆時的期望覆蓋度。期望覆蓋度(%)曲線下部的方形(即,70%、91%、95%和98%)顯示來自實驗數據的實際覆蓋度。數據顯示期望覆蓋度與實際覆蓋度之間的近乎完美的匹配。表1.六突變裝配tableseeoriginaldocumentpage21實施例3.在第二個實驗中,選擇基因上的四個位點以組合(圖8)。對於兩個位點,使用正向引物建立反應,而對於其餘兩個位點,使用兩條反向引物建立反應。通過測序鑑定來自反應的變體。存在十六種不同的可能組合。與第一個實驗類似,條件1產生更多具有較低突變位點數量的變體,而條件2和3產生更多具有較高突變位點數量的變體(圖9和10)。來自組合數據(總計)的所有可能組合的分布與統計計算的分布模式類似(圖9和10)。表2.四突變裝配tableseeoriginaldocumentpage22實施例4.在第三個實驗中,選擇基因上的三個位點以組合(圖11)。對於兩個位點,使用正向引物建立反應,而對於第三個位點,使用反向引物建立反應。通過測序鑑定來自反應的變體。在這種情況下,存在八種不同的可能組合。在9B條件下,通過測序24個克隆,回收所有8種變體。參見圖12。實施例5.選擇13個GSSMsm高表達突變型(5個位點)以增加熱穩定性和提高脂酶的比活性(圖13)。將三個位點(m68S、N171E和M176W)分在一組並被包含在一個引物中。文庫大小是6X6X2X2X2=288。按下列方法進行反應將正向引物分入正向組並將反向引物分入反向組,並且正向組中的引物和反向組中的引物各自獨立地在相應組中被歸一化為相等濃度,而不考慮模板多核苷酸的位置,並且其中在歸一化後,將相同量的正向和反向引物添加至反應中。位置1和2的組合是偏好的(圖13和14A、B、C)。與位置1和3的組合或位置2和3的組合相比,對於位置1和2的組合獲得較低百分比的可能獨特變體(uniquevariant)。已進行兩輪TMCA反應。在第II輪中,使用第I輪得到的一些變體。在測序720個克隆後(文庫的2.5X覆蓋度),獲得第I輪中的288個獨特變體中的46%。IX覆蓋度測序意思是測序的變體(子代)數量等於可能的獨特變體的數量,因此,2.5X覆蓋度表明測序的變體(子代)數量等於獨特變體可能數量(288)的2.5倍。已進行兩輪TMCA反應。在第II輪中,使用第I輪得到的一些變體作為模板多核苷酸。將用於第II輪中每個TMCA反應的引物修剪,以獲得在第I輪未實現的變體。在第II輪後,獲得288個獨特變體的95.5%。篩選後從該文庫獲得十個高表達突變型(圖14A、B、C)。實施例顯示TMCA方法可高效產生組合文庫。突變體位置限定了一些限制,但可設計可選方案來克服這些限制。新的改進的修飾明顯降低偏好。可進行多輪TMCA反應,以克服某些偏好。TMCA方法顯示出對多種酶和載體系統有效。載體大小限制可以長至llkb。顯然,根據上述教導,本發明的眾多修改和變化是可能的。因此,應理解的是,在所附權利要求的範圍內,本發明可以不同於本文具體描述的方式進行實踐。權利要求一種產生多個修飾的多核苷酸的方法,其包括(a)在單一反應混合物中將至少三種引物添加至雙鏈模板多核苷酸,其中所述至少三種引物不重疊,並且其中所述至少三種引物的每一種包括至少一個不同於其他引物的突變,其中至少一種引物是可與所述模板的負鏈退火的正向引物以及至少一種引物是可與所述模板的正鏈退火的反向引物,和(b)使所述反應混合物進行聚合酶延伸反應以從所述至少三種引物產生多個延伸的修飾的多核苷酸。2.權利要求1的方法,其進一步包括用未經連接酶處理的所述多個延伸的產物轉化細胞。3.權利要求2的方法,其進一步包括從所述細胞回收所述多個延伸的修飾的多核苷酸。4.權利要求3的方法,其進一步包括分析所述多個延伸的修飾的多核苷酸。5.權利要求4的方法,其中分析包括表達所述多個延伸的修飾的多核苷酸中的至少一個並分析由其表達的多肽。6.權利要求5的方法,其進一步包括選擇包括感興趣的突變的所述多個延伸的修飾的多核苷酸。7.權利要求1的方法,其進一步包括在步驟(a)之前獲得所述模板多核苷酸的序列信息,並鑑定在所述模板多核苷酸上的三個或更多個感興趣的突變。8.權利要求1的方法,其進一步包括分析由所述聚合酶延伸產生的所述多個延伸的修飾的多核苷酸。9.權利要求1的方法,其進一步包括用酶處理所述多個延伸的修飾的多核苷酸,從而破壞所述模板多核苷酸,將經處理的延伸的修飾的多核苷酸轉化入細胞,從所述細胞回收所述多個延伸的修飾的多核苷酸,並選擇包括感興趣的突變的所述多個延伸的修飾的多核苷酸。10.權利要求9的方法,其中所述細胞是大腸桿菌細胞。11.權利要求9的方法,其中所述酶是限制酶。12.權利要求11的方法,其中所述限制酶是DpnI限制酶並且所述細胞是大腸桿菌細胞。13.權利要求1的方法,其中添加至少四種引物。14.權利要求1的方法,其中添加至少五種引物。15.權利要求1的方法,其中添加至少六種引物。16.權利要求1的方法,其中添加至少八種引物。17.權利要求1的方法,其中添加至少十二種引物。18.權利要求1的方法,其中每種引物包括單個點突變。19.權利要求1的方法,其中至少兩種正向引物在所述模板多核苷酸的相同位置上包括不同的變化。20.權利要求1的方法,其中至少兩種反向引物在所述模板多核苷酸的相同位置上包括不同的變化。21.權利要求1的方法,其中至少一種引物在所述模板多核苷酸的不同位置上包括至少兩個變化。22.權利要求1的方法,其中至少一種引物在所述模板多核苷酸的不同位置上包括至少兩個變化並且至少兩種正向或兩種反向引物在所述模板多核苷酸的相同位置上包括不同變化。23.權利要求1的方法,其中所述至少一個突變選自一個或多個核苷酸或所編碼的胺基酸序列的變化、插入和缺失。24.權利要求1的方法,其中所述模板多核苷酸是環狀雙鏈DNA。25.權利要求1的方法,其中至少一種引物是一組各包括簡併位置的簡併引物,其中所述感興趣的突變是一系列在所述簡併位置上的不同核苷酸。26.權利要求1的方法,其中至少一種引物是一組簡併引物,其包括對應於所述模板多核苷酸的至少一個密碼子的至少一個簡併密碼子以及與與所述模板多核苷酸的密碼子相鄰的序列同源的至少一個相鄰序列。27.權利要求26的方法,其中所述簡併密碼子是編碼天然發生的胺基酸的N,N,N。28.權利要求26的方法,其中所述簡併密碼子可編碼小於20種天然發生的胺基酸。29.權利要求1的方法,其中所述正向引物被分入正向組,而所述反向引物被分入反向組,並且所述正向組中的引物和所述反向組中的引物各自獨立地在相應組中被歸一化為相等濃度,而不考慮所述模板多核苷酸的位置,並且其中在歸一化後,將相同量的所述正向和反向引物添加至所述反應中。30.權利要求1的方法,其在步驟(b)之前進一步包括根據它們在所述模板多核苷酸上的位置,將所述引物編成多個組,其中覆蓋所述模板上的相同選擇區域的引物在一個組中,將每組中分入的引物歸一化至相等的濃度,將一組中的所述正向引物富集成正向組並將每一正向引物組之間的濃度歸一化至相寸,將一組中的所述反向引物富集成反向組並將每一反向引物組之間的濃度歸一化至相等,和將相等量的所富集的正向和反向引物添加至所述反應。31.權利要求1的方法,其進一步包括進行兩輪的步驟(a)至(b),並使用第一輪產生的多核苷酸作為第二輪的模板多核苷酸。32.產生包括感興趣的突變的多個修飾的多核苷酸的方法,其包括(a)在單一反應混合物中將至少兩種引物添加至雙鏈模板多核苷酸,其中所述至少兩種引物不重疊,並且其中所述至少兩種引物的每一種包括至少一個不同於其他引物的突變,其中至少一種引物是可與所述模板的負鏈退火的正向引物以及至少一種引物是可所述模板的正鏈退火的反向引物,(b)使所述反應混合物進行聚合酶延伸反應以從所述至少兩種引物產生多個延伸的修飾的多核苷酸,(c)用酶處理所述多個延伸的修飾的多核苷酸,從而破壞所述模板多核苷酸,(d)將所述處理的延伸的修飾的多核苷酸轉化入細胞,所述多核苷酸未用連接酶處理,(e)從所述細胞回收所述多個延伸的修飾的多核苷酸,以及(f)選擇包括感興趣的突變的所述多個延伸的修飾的多核苷酸。全文摘要本發明提供通過修剪式多位點組合裝配產生多個修飾的多核苷酸的新方法,所述修飾的多核苷酸在多個位點具有各種突變的不同組合,該方法包括在單一反應混合物中將至少兩種或至少三種引物添加至雙鏈模板多核苷酸,其中所述引物不重疊,並且其中所述引物的每一種包括至少一個不同於其他引物的突變,其中至少一種引物是可退火至所述模板的負鏈的正向引物以及至少一種引物是可退火至所述模板的正鏈的反向引物,並使所述反應混合物進行聚合酶延伸反應以從所述至少三種引物產生多個延伸的修飾的多核苷酸。該方法可在將延伸的修飾的多核苷酸轉化至細胞之前在不使用連接步驟的情況下進行。所述多個延伸的修飾的多核苷酸可用酶處理,以在轉化至細胞之前破壞模板多核苷酸。文檔編號C12P19/34GK101821402SQ200880101253公開日2010年9月1日申請日期2008年7月31日優先權日2007年7月31日發明者X·譚申請人:維萊尼姆公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀