新四季網

用於修飾核酸的轉座子末端組合物和方法

2023-07-17 12:51:16 2

專利名稱:用於修飾核酸的轉座子末端組合物和方法
技術領域:
本發明涉及使用轉座酶和轉座子末端組合物從靶DNA產生加標籤的DNA片段的文庫的方法、組合物和試劑盒。所產生的ssDNA片段可用作模板,例如用於多種應用,包括,例如高通量的、大規模平行的和/或多重的DNA測序。
背景技術:
存在多種方法和應用,對這些方法和應用而言,從雙鏈DNA (dsDNA)靶分子產生斷裂的且加標籤的DNA分子的文庫是令人期望的。通常,目的是從較大的dsDNA分子產生較小的單鏈DNA(ssDNA)分子(例如DNA片段)以用作DNA或RNA聚合酶反應中的模板(例如,用作DNA測序反應或DNA或RNA擴增反應中的模板,在這些擴增反應中引物與標籤退火併通過聚合酶延伸)。直到最近,使用桑格雙脫氧鏈終止測序法進行大多數的DNA測序,在該方法中,使用待測序的DNA作模板通過聚合酶延伸引物。進行四種反應,每種具有全部規範的核苷酸 (dATP、dCTP、dGTP、和dTTP)的混合物和四種鏈終止的雙脫氧核苷酸(ddATP、ddCTP、ddGTP 或ddTTP)之一,並且每種反應產生開始於引物且終止於雙脫氧核苷酸的一組嵌套的鏈終止的片段。當這些鏈終止的DNA分子在電泳後按大小分離時,摻入ddNTP的次序反映模板 DNA的序列。使用這些方法,可確定距引物位點數百鹼基或上千鹼基的序列。較大序列的確定需要由來自眾多克隆的重疊信息將較大序列拼接在一起。因為這些傳統方法需要大量DNA模板,並且因為如果大量非模板DNA存在那麼這些方法產生的結果不佳,所以通常使用克隆的或擴增的DNA進行桑格雙脫氧測序。例如,在正式開始於1990年並且在2000年以人類基因組序列『草圖』的完成宣告結束並且在2006 年公布最後一條人類染色體的序列的人類基因組計劃(Human Genome Project)過程中進行的大部分測序是基於使用由宿主細菌的群體構成的基因組文庫,每個宿主細菌攜帶被克隆到DNA載體中的DNA分子,以致各自攜帶一段基因組DNA的所有DNA克隆的集合代表整個基因組。這是枯燥的和高度反覆的過程,涉及大量DNA克隆(例如,BAC克隆)的構建和堆積,進而常常對這些DNA克隆進行亞克隆以產生用作測序模板的較小DNA克隆的文庫。通常,將這些方法中使用的引物設計成與載體退火,以致這些引物將在測序反應過程中延伸到未知的克隆DNA中。這種方法允許相同的引物組用於分析許多不同的克隆。為了降低人類基因組測序計劃所需亞克隆的量,有時使用的一種方法為「體外轉座」。體外轉座方法包括使用稱作轉座子的可移動遺傳元件來將小段已知序列的DNA插入未知DNA的中間。該方法包括將來自基因組文庫的DNA克隆與轉座子在發生轉座子單次插入DNA克隆中的條件下孵育,然後以體外轉座反應的等分部分轉化大腸桿菌細胞,並選擇包含由該轉座子所編碼的標誌物諸如抗生素抗性標誌物的細胞。因此,體外轉座反應從 DNA母克隆中產生「轉座子插入克隆」的文庫,每個轉座子插入克隆包含在該DNA克隆中的不同位置插入的轉座子。然後使用每種DNA鏈的不同引物從每個轉座子末端向外對每個插入克隆測序。如以上所述,通過重疊從不同插入克隆獲得的序列構建DNA母克隆的完整序列。使用人類基因組計劃的這種轉座子插入法的實例由Butterfield,YSN等人,Nucleic Acids Res 30 :2460_2468,2002 ;Shevchenko,Y 等人,Nucleic Acids Res 30:2469-2477, 2002 ;以及Haapa,S等人,Genome Res 9 :308_315,1999描述。人類基因組計劃的體外轉座方法的使用使基因組DNA克隆和由基因組DNA編碼的mRNA產生的cDNA克隆的完整測序變得容易。然而,這種體外轉座法的一個缺點是它並非完全在體外,因為它需要轉化大腸桿菌細胞、選擇包含轉座子插入的大腸桿菌菌落、以及隨後從用於測序的轉座子插入克隆中分離DNA的步驟。為了消除用等分部分的體外轉座反應轉化大腸桿菌並且在選擇性培養基上培養該大腸桿菌細胞以獲得轉座子插入克隆的要求,Teknanen等人(美國專利第6,593,113 號)開發了基於完全體外轉座子方法,包括體外轉座反應和選擇測序模板的PCR擴增反應。 根據Teknanen等人,在其方法中使用的檢驗的DNA或靶DNA可以在數個鹼基對到最多40 千鹼基對,不使用甚至更長的DNA片段作靶DNA的唯一限制因素是擴增反應諸如PCR不能擴增更長片段。因此,在使用這種方法產生測序模板的一些實施方案中,首先使至多約40Kb 的檢驗的DNA或靶DNA經歷體外轉座反應,然後使用與該靶DNA中的已知序列互補的固定引物或如果該靶DNA被克隆在載體中與該載體中的序列互補的固定引物作為第一 PCR引物,並使用與該靶DNA接合(join)的轉座子末端的序列互補的選擇性引物任選地加上在其 3'端具有已知身份的一至十個額外的核苷酸作為第二 PCR引物,進行PCR擴增。在另一個實施方案中,兩種選擇性引物用於PCR擴增步驟,它們中的至少一種在其3'端具有已知身份的一至十個額外的核苷酸。Teknanen等人的方法提供為桑格測序提供了某些益處,因為它們消除了使用大腸桿菌細胞來選擇具有轉座子插入的DNA分子的需要。然而,這些方法限於大小至多約40Kb的靶DNA,由於固定引物或選擇性引物的使用,這些方法選擇只表現出由該靶DNA表現出的序列的一部分的DNA分子。因此,儘管這些方法可用於桑格測序,但它們不適合於產生用於更新的「下一代」 DNA測序方法的測序模板,所述「下一代」 DNA測序方法能夠在使用大規模平行或多重形式的單次測序操作中從高達數百萬測序模板中產生序列數據。下一代測序平臺包括454 FLX 、或 454 TITANIUM (Roche)、S0LEXA 基因組分析儀(Illumina)、HELISC0PE 單分子測序儀(Helicos Biosciences)和 SOLID DNA 測序儀(Life Technologies/Applied Biosystems)儀器),以及仍處於由諸如 Intelligent Biosystems和I^acific Biosystems等公司研發之下的其他平臺。儘管產生序列信息的化學對於不同的下一代測序平臺而言是不同的,所有這些下一代測序平臺共有從極其大量的測序模板中產生序列數據的共同特徵,在這些測序模板上測序反應同時運行。一般來說,來自所有這些測序反應的數據使用掃描儀收集,然後使用計算機和強大的生物信息程序進行裝配並進行分析。測序反應以「大規模平行」或「多重」的方式執行、讀數、裝配並進行分析。 這些儀器的大規模平行的性質需要在思考以下問題上的轉變需要哪種測序模板和如何產生它們以便從這些強大的儀器獲得最大可能的測序數據量。因此,不需要大腸桿菌中的DNA克隆的基因組文庫,現在有必要考慮關於產生DNA片段文庫的體外系統,所述DNA片段文庫包括從樣品中的靶DNA產生的DNA片段的集合或群體,其中在該集合或群體中的全部DNA 片段的組合顯示的序列是產生這些DNA片段的靶DNA的序列的質量上和/或數量上的代表。實際上,在一些情況下,有必要考慮關於產生由多個基因組DNA片段文庫構成的DNA片段文庫,所述多個基因組DNA片段文庫中的每一個用不同的地址標籤或條碼標記以允許鑑定每個測序片段的來源。一般來說,這些下一代測序方法需要基因組DNA或雙鏈cDNA (由RNA製備)斷裂成更小的ssDNA片段並添加標籤到ssDNA片段的至少一條鏈或優選兩條鏈。在一些方法中, 這些標籤為使用DNA聚合酶的DNA測序提供了引發位點。在一些方法中,這些標籤還提供了用於將片段捕獲到表面諸如珠上的位點(例如,對於這些方法中的一些而言,在乳液PCR 擴增之前;例如,使用如美國專利第7,323,305號所述的方法)。在大多數情況下,用作下一代測序的模板的DNA片段文庫包含5'-和3'加標籤的DNA片段或「加雙標籤的DNA片段」。一般來說,目前用於產生下一代測序用的DNA片段文庫的方法包括使用超聲破碎器、 噴霧器或核酸酶斷裂期望測序的靶DNA (例如,包括基因組DNA或在RNA的反轉錄後的雙鏈 cDNA的靶DNA),並且接合(例如,通過連接)由銜接子或標籤構成的寡核苷酸到這些片段的5'和3'端。目前用於產生下一代測序模板的方法存在許多問題和低效率,如在世界最大的基因組中心之一威爾康信託桑格研究所(Wellcome Trust Sanger hstitute)所用的工作流程所闡明的(例如,在Quail,MA等人,Nature Methods 5 1005-1010,2008中所述)。例如,Quail等人發現用於測序的基因組DNA的霧化導致損失按質量計大約一半的DNA並且只有大約5%的起始DNA由使用Illumina基因組分析儀測序所期望的處於大約200_bp大小範圍內的片段構成。他們發現稱為「適應焦點聲學(adapted focused acoustics) 」的替代方法給出更高產率的斷裂DNA並且大約17%的起始DNA由期望的200_bp大小範圍內的片段構成,但即使是這種方法在樣品或靶DNA方面也是浪費的。更進一步,得到的DNA片段通常需要通過凝膠電泳選擇大小,以及對大小選擇的DNA片段進行加標籤的額外步驟,這是困難的、費力的、耗時的和昂貴的。因此,目前在用於對供下一代測序中使用的雙鏈DNA進行斷裂和加標籤的許多方法浪費DNA,需要昂貴的斷裂儀器,並且用於斷裂、加標籤和回收加標籤的DNA片段的程序是困難的、繁瑣的、費力的、耗時的、效率低、成本高,需要相對大量的樣品核酸。此外,這些方法中的許多方法產生的加標籤的DNA片段不完全代表它們從其中產生的樣品核酸中包含的序列。因此,本領域中需要的是克服目前方法的局限性的用於以大規模平行方式產生加雙標籤的DNA片段的文庫的方法。下一代測序方法中的一些方法在其測序過程中使用環狀ssDNA底物。例如,在各自通過引用併入本文的Drmanac等人的美國專利申請第20090011943號;20090005252 號;20080318796 號;20080234136 號;20080213771 號;20070099208 號;和 20070072208 公開了用於大規模平行的DNA測序的環狀ssDNA模板的產生。Gunderson和Meemers的美國專利的申請第20080242560號公開的方法包括製備數字DNA球(例如,在美國專利申請第20080242560號中的圖8);和/或DNA諸如基因組DNA的基因座特異性切割和擴增,對於擴增包括通過多重置換擴增或全基因組擴增(例如,該專利申請中的

圖17)或通過超分支RCA(例如,該專利申請中的圖18)以用於產生擴增的核酸陣列(例如,ILLUMINA BeadArrays ;ILLUMINA, San Diego CA, USA)。需要用於從生物樣品的DNA(例如,從基因組DNA或線粒體DNA或附加體DNA, 包括克隆在質粒、BAC、F黏粒或其他附加型載體中的DNA)製備加標籤的環狀ssDNA片段的改進的方法,組合物和試劑盒,所述加標籤的環狀ssDNA用於在擴增或DNA測序方法中使用(諸如在下述文獻中描述的方法=Drmanac等人的美國專利申請第20090011943號; 20090005252 號;20080318796 號;20080234136 號;20080213771 號;20070099208 號;以及 20070072208號;或在Gunderson和Steemersor的美國專利申請第20080242560號或由 Pacific Biosciences 的 Turner 等人在其網站 www. pacificbiosciences. com 上公告)。更進一步,用於擴增諸如全基因組擴增的一些方法也需要基因組DNA的斷裂和加標籤。這些方法中的一些綜述於通過引用併入本文的由Hughs和R. Lasken編輯的 Whole Genome Amplification (全基因組擴增),2005,Scion Publishing Ltd(在全球資訊網 scionpublishing. com 上)中。需要從靶DNA分子產生DNA片段的文庫的改進的方法以用於擴增,包括從一種生物(例如,從臨床樣品)或從多種生物(例如,來自環境樣品的宏基因組靶DNA)中擴增全基因組或部分基因組,用於進一步分析(例如,通過實時?0 、乳液PCR、比較基因組雜交 (CGH)、比較基因組程序(CGQ),或用於製備DNA特異性標記的探針(例如,染色體特異性探針,例如,染色體塗料(chromosome paints),或例如基因特異性探針,例如用於螢光原位雜交(FISH),用於各種目的(例如,用於研究目的、診斷目的和工業目的)。因此,本領域中需要用於從靶DNA中製備供核酸分析方法諸如下一代測序方法和擴增方法中使用的加標籤的DNA片段的文庫的方法。需要用於產生DNA片段文庫的方法,所述方法不需要專門儀器,並且所述方法更容易、快捷,需要更少的動手時間,可以用更小的 DNA樣品和更小的體積進行,有效地對片段的一端或兩端進行加標籤,並且產生的標籤DNA 片段是產生它們的樣品中的靶核酸的質量上和數量上的代表。發明概述本發明涉及用於處理核酸的方法、組合物和試劑盒,並且尤其是使用轉座子組合物將DNA斷裂和加標籤的方法和組合物。本發明的方法、組合物和試劑盒可用於例如產生供例如下一代測序方法、螢光原位雜交及類似方法中使用的加標籤的DNA片段的文庫。在一些優選的實施方案中,本發明涉及從來自任何來源的包含任何感興趣的dsDNA(包括由 RNA製備的雙鏈cDNA)的靶DNA製備線性ssDNA片段或加標籤的環狀ssDNA片段(以及其擴增產物),以用於基因組分析、亞基因組分析、轉錄組分析、或宏基因組分析、或RNA表達的分析。在一些實施方案中,本發明提供了用於產生靶DNA的加標籤的DNA片段的文庫的方法,所述方法包括將該靶DNA與轉座酶和轉座子末端或轉座子末端組合物一起孵育,所述轉座子末端或轉座子末端組合物包含在5'部分中具有標籤結構域的轉移鏈,所述孵育是在如下條件下進行其中轉座酶催化轉座反應,並且其中靶DNA斷裂產生多個靶DNA片段,並且所述轉座子末端或轉座子末端組合物的轉移鏈與所述多個靶DNA片段中的每一個片段的5'端接合,以產生多個5'加標籤的靶DNA片段。在一些實施方案中,所述方法還包括將所述多個5'加標籤的靶DNA片段與至少一種核酸修飾酶一起在如下條件下孵育其中3'標籤與所述5'加標籤的靶DNA片段的3'端接合以產生包含(comprising)加雙標籤的靶DNA片段。在一些實施方案中,本發明提供了將靶DNA的片段加標籤的方法,所述方法包括將靶DNA與轉座酶和轉座子末端或轉座子末端組合物一起孵育,所述轉座子末端或轉座子末端組合物包含在5'部分中含標籤結構域的轉移鏈,所述孵育是在如下條件下進行其中轉座酶催化轉座反應,其中所述靶DNA斷裂並且所述轉座子末端或轉座子末端組合物的轉移鏈與所述靶DNA的片段的5'端接合以產生5'加標籤的靶DNA片段。在一些優選的實施方案中,所述方法還包括將5'加標籤的靶DNA片段與核酸修飾酶一起在如下條件下孵育其中3'標籤與所述5'加標籤的靶DNA片段的3'端接合以產生加雙標籤的靶DNA片段。所述方法不限於使用任何具體的核酸修飾酶。例如,核酸修飾酶包括聚合酶、核酸酶、 連接酶以及類似核酸修飾酶。在一些優選的實施方案中,核酸修飾酶包括DNA聚合酶,並且 3'標籤是通過延伸5'加標籤的靶DNA片段的3'端而形成。在一些實施方案中,DNA聚合酶包括依賴模板的DNA聚合酶,並且在一些實施方案中,DNA聚合酶包括不依賴模板的DNA 聚合酶。在一些優選的實施方案中,DNA聚合酶為具有鏈置換和/或5'核酸酶活性的依賴模板的DNA聚合酶。在一些實施方案中,在本方法中使用的核酸修飾酶是連接酶,並且3 『標籤是通過寡核苷酸與5'加標籤的靶DNA片段的3'端的連接而形成。在一些實施方案中,連接酶包括依賴模板的連接酶,而在一些實施方案中,連接酶包括不依賴模板的連接酶。在一些實施方案中,轉移末端包括標籤結構域。在某些優選的實施方案中,標籤域包括限制性位點域、捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。在一些實施方案中,標籤域為包括選自以下的測序標籤或由選自以下的測序標籤構成的測序標籤域Roche 454A測序標籤和Roche 454B測序標籤,ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics 測序標籤。一些實施方案還包括擴增一種或多種5'加標籤的靶DNA片段和/或加雙標籤的靶DNA片段。在一些優選的實施方案中,擴增包括使用PCR擴增反應、鏈置換擴增反應、滾環擴增反應、連接酶鏈反應、轉錄介導的擴增反應或環介導的擴增反應中的一種或多種。在關於本發明的某些優選的實施方案中,擴增包括非選擇性擴增構成DNA片段文庫的5'加標籤的靶DNA片段或構成DNA片段文庫的加雙標籤的靶DNA片段。在本發明的一些實施方案中,對片段或文庫加標籤使用的轉座子末端組合物包含在核酸序列上具有至少一個核苷酸差異的多條轉移鏈,並且擴增包括基於5'端標籤或標籤域的核酸序列選擇性擴增加雙標籤的DNA片段。在其他實施方案中,擴增包括使用與加雙標籤的靶DNA片段的3'標籤互補的單個寡核苷酸引物的聚合酶鏈反應。在一些實施方案中,擴增包括使用單個寡核苷酸引物的鏈置換擴增反應,其中該寡核苷酸引物只由核糖核苷酸構成,或只由嘌呤核糖核苷酸和只由嘧啶2' -F-2'-脫氧核糖核苷酸構成,並且鏈置換擴增反應包括鏈置換DNA聚合酶和核糖核酸酶H。在一些實施方案中,擴增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶鏈反應,其中該第一 PCR引物的至少3'端部分與加雙標籤的靶DNA片段的3'標籤互補,並且其中該第二 PCR引物的至少3'端部分顯示加雙標籤的靶 DNA片段的5'標籤或標籤域的至少一部分的序列。在某些優選的實施方案中,所述第一寡核苷酸引物或第二寡核苷酸引物包括5'端部分,其中所述第一引物的至少5'端部分不與所述加雙標籤的靶DNA片段的3'標籤互補,或者其中所述第二引物的5'端部分不顯示所述加雙標籤的靶DNA片段的5'標籤或標籤域的至少一部分的序列。在特別優選的實施方案中,第一寡核苷酸引物和第二寡核苷酸引物各自包括5'端部分,其中所述第一 PCR引物的至少5'端部分不與所述加雙標籤的靶DNA片段的3'標籤互補,和/或其中所述第二 PCR引物的5'端部分不顯示所述加雙標籤的靶DNA片段的5'標籤域的至少一部分的序列。在一些實施方案中,本發明提供了從靶DNA產生加標籤的環狀單鏈DNA片段群體的方法。在某些實施方案中,這種方法包括將靶DNA與轉座酶和轉座子末端或轉座子末端組合物一起孵育,所述轉座子末端或轉座子末端組合物包含在5'部分中具有標籤結構域且在3'部分中具有轉座子末端的轉移鏈,所述孵育是在如下條件下進行其中轉座酶催化轉座反應,使得所述靶DNA斷裂產生多個靶DNA片段,並且所述轉座子末端或轉座子末端組合物的轉移鏈與所述多個靶DNA片段中的每一個片段的5'端接合以產生5'加標籤的靶DNA片段的群體。這些方法還包括如下步驟使5'加標籤的靶DNA片段變性產生單鏈的5'加標籤的靶DNA片段,並且將所述單鏈的5'加標籤的靶DNA片段與核酸連接酶一起在如下條件下孵育其中所述單鏈的5'加標籤的靶DNA片段以分子內方式連接形成加標籤的環狀單鏈DNA片段,這些加標籤的環狀單鏈DNA片段各自顯示所述轉移鏈的序列和所述靶DNA的一部分的序列。在一些實施方案中,切割這些環狀單鏈DNA是令人期望的。因此,在本發明的方法的一些實施方案中,標籤域顯示切割位點的序列或結構,並且所述方法還包括將加標籤的環狀單鏈DNA片段與構成切割酶組合物的至少一種酶一起孵育,其中所述切割酶組合物切割該加標籤的環狀單鏈DNA片段以產生加雙標籤的線性單鏈DNA片段。在某些優選的實施方案中,切割酶組合物包括限制性內切酶。在一些實施方案中,標籤域顯示限制性位點的序列,並且所述方法還包括對與該標籤域互補的加標籤的環狀單鏈DNA片段寡核苷酸退火, 並且將該加標籤的環狀單鏈DNA片段與識別該限制性位點的限制性內切核酸酶一起孵育, 其中該限制性內切酶切割該加標籤的環狀單鏈DNA片段產生加雙標籤的線性單鏈DNA片段。在一些實施方案中,擴增本發明片段和文庫是有用的。因此,一些實施方案還包括擴增加標籤的環狀單鏈DNA片段和/或加雙標籤的線性單鏈DNA片段中的一種或多種。在某些優選的實施方案中,擴增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶鏈反應,其中該第一 PCR引物的至少3'端部分與該加標籤的環狀單鏈DNA片段或該加雙標籤的線性單鏈DNA片段中的轉移鏈的序列的至少一部分互補,並且其中該第二 PCR引物的至少3'端部分與該加標籤的環狀單鏈DNA片段或該加雙標籤的線性單鏈DNA片段中的轉移鏈的互補序列(complement)的至少一部分互補。在擴增加標籤的環狀單鏈DNA片段或加雙標籤的線性單鏈DNA片段的一些實施方案中,所述第一寡核苷酸引物和第二寡核苷酸引物各自包括5'端部分,其中所述第一 PCR 引物的5'端部分不與該加標籤的環狀單鏈DNA片段或該加雙標籤的線性單鏈DNA片段中的轉移鏈的序列互補,並且其中所述第二 PCR引物的5'端部分不與該加標籤的環狀單鏈 DNA片段或該加雙標籤的線性單鏈DNA片段中的轉移鏈的互補序列互補。在一些實施方案中,本發明提供了從靶DNA中產生加標籤的環狀DNA片段的群體的方法,所述方法包括將靶DNA與轉錄酶和髮夾轉座子末端組合物一起孵育,所述髮夾轉座子末端組合物包含顯示在其5'端的非轉移鏈序列、在其3'端的轉移鏈序列以及包含標籤結構域的間插環序列的寡核苷酸,所述孵育是在如下條件下進行其中寡核苷酸可形成分子內莖-環,並且其中轉座酶催化轉座反應,使得該靶DNA斷裂產生多個靶DNA片段, 並且該髮夾轉座子末端組合物的寡核苷酸與所述多個靶DNA片段中的每一個片段的5'端接合以產生5'加標籤的靶DNA片段的群體。在一些實施方案中,所述方法還包括在這些片段分子中填充缺口和連接切口。在一些實施方案中,這種方法包括將5'加標籤的靶DNA片段的群體與依賴模板的連接酶和沒有5'到3'外切核酸酶、3'到5'外切核酸酶和鏈置換活性的DNA聚合酶或一種或多種大小的隨機序列寡核苷酸一起孵育,單獨或組合的所述寡核苷酸與轉座酶和髮夾轉座子末端組合物進行轉座反應後產生的5'加標籤的靶DNA片段中的單鏈缺口具有相同的長度,所述孵育在如下條件下進行其中該5'加標籤的靶DNA 片段中的單鏈缺口被填充並且每個5'加標籤的DNA片段的3'端與包含該靶DNA的互補部分的另一個5'加標籤的DNA片段的5'端接合,形成包含環結構中的標籤域和該靶DNA 的一部分的兩條鏈的加標籤的環狀DNA片段。在某些優選的實施方案中,填充和接合包括將該5'加標籤的DNA片段與DNA聚合酶一起在如下條件下孵育其中每個5'加標籤的 DNA片段的3'端被延伸形成5'加標籤的DNA片段延伸產物的群體;並且包括將該5'加標籤的DNA片段延伸產物與依賴模板的連接酶一起在如下條件下孵育其中該5'加標籤的DNA片段延伸產物被連接,由此產生所述加標籤的環狀DNA片段。在特別優選的實施方案中,DNA聚合酶和連接酶在混合物中提供,並且在單一反應混合物中進行填充和連接。在一些實施方案中,填充和連接步驟包括將該5'加標籤的DNA片段與一種或多種大小的隨機序列寡核苷酸以及依賴模板的連接酶一起在如下條件下孵育其中該隨機序列寡核苷酸退火併填充單鏈缺口,並且被彼此連接或與5'加標籤的DNA片段的相鄰端連接,形成加標籤的環狀DNA片段。在優選的實施方案中,所述方法還包括將加標籤的環狀DNA片段與線性DNA、未連接的隨機序列寡核苷酸和/或未與靶DNA接合的髮夾轉座子末端組合物分離。在特別優選的實施方案中,用T5外切核酸酶處理包含所述加標籤的環狀DNA片段的反應混合物以除去線性DNA,諸如未連接的片段和隨機序列寡核苷酸。在一些實施方案中,切割加標籤的環狀DNA分子是令人期望的。例如,在一些實施方案中,所述方法還包括如下步驟在環結構中切割加標籤的環狀DNA片段以產生扇尾形雙鏈DNA片段,該扇尾形雙鏈DNA片段的每條鏈在其5 『端上具有標籤的一部分並且在其3'端上具有標籤的一部分。因此,在本發明的方法的一些實施方案中,環結構中的標籤域顯示切割位點的序列和結構,並且所述方法還包括將加標籤的環狀單鏈DNA片段與構成切割酶組合物的至少一種酶一起孵育,其中所述切割酶組合物切割該加標籤的環狀單鏈 DNA片段以產生扇尾形雙鏈DNA片段。在一些實施方案中,切割酶組合物包括N-糖基化酶和AP內切核酸酶。在某些優選的實施方案中,切割酶是尿嘧啶-N-糖基化酶和AP內切核酸酶及FPG蛋白的N-糖基化酶,並且AP內切核酸酶選自大腸桿菌內切核酸酶III或內切核酸酶IV。在某些優選的實施方案中,切割酶組合物包括限制性內切酶。在一些實施方案中, 標籤域顯示限制性位點的序列,並且所述方法還包括對與該標籤域互補的加標籤的環狀單鏈DNA片段寡核苷酸退火,並且將該加標籤的環狀單鏈DNA片段與識別該限制性位點的限制性內切核酸酶一起孵育,其中該限制性內切酶切割該加標籤的環狀單鏈DNA片段產生扇尾形雙鏈DNA片段,該扇尾形雙鏈DNA片段的每條鏈在其5'端上具有該標籤的一部分並且在其3'上具有該標籤的一部分。一些實施方案包括另外包括使扇尾形雙鏈DNA片段變性產生加雙標籤的線性單鏈DNA片段。所述環狀和扇尾形實施方案在如下方法中找到用途所述方法包括使用DNA片段作為DNA測序法或擴增反應中的模板。因此,在一些實施方案中,本發明的方法還包括擴增加標籤的環狀DNA片段、扇尾形雙鏈DNA片段和/或加雙標籤的線性單鏈DNA片段。在優選的實施方案中,擴增包括使用PCR擴增反應、鏈置換擴增反應、滾環擴增反應、連接酶鏈反應、轉錄介導的擴增反應或環介導的擴增反應中的一種或多種。在特別優選的實施方案中, 擴增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶鏈反應,其中該第一 PCR引物的至少3'端部分與該標籤域的至少一部分互補,並且其中該第二 PCR引物的至少3'端部分顯示該標籤域的至少一部分的序列。在一些實施方案中,該第一寡核苷酸引物和第二寡核苷酸引物各自包含5'端部分,其中該第一PCR引物的5'端部分不與該標籤序列互補,並且其中該第二 PCR引物的5'端部分不顯示該標籤域的序列。上述任何一種PCR擴增的優選實施方案包括如下擴增其中該第一 PCR引物和/ 或該第二 PCR引物的5'端部分顯示標籤域。在更加優選的實施方案中,標籤域包括限制性位點域、捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。在本文所述的方法的特別優選的實施方案中,標籤域為測序標籤域,所述測序標籤域包括選自以下的測序標籤或由選自以下的測序標籤構成=Roche 454A測序標籤和 Roche 454B 測序標籤,ILLUMINA 301^14"1測序標籤、々 ?1丨6(1 Biosystems 的 SOLID 測序標籤、Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或Complete Genomics測序標籤。在一些實施方案中,本發明提供了將靶DNA的片段加標籤的方法,所述方法包括將靶DNA與轉座酶和轉座子末端或轉座子末端組合物一起孵育,所述轉座子末端或轉座子末端組合物包含在其5'部分中顯示不為轉座子末端的標籤域的序列,並且在其3'部分中顯示該轉移的轉座子末端的序列的轉移鏈,其中該靶DNA被斷裂並且該轉座子末端組合物的轉移鏈與該靶DNA的片段的5'端接合以產生5'加標籤的靶DNA片段。在一些實施方案中,本發明提供了產生5'加標籤的DNA片段文庫的方法,所述方法包括將靶DNA與轉座酶和轉座子末端組合物一起孵育,所述轉座子末端組合物包含在其 5'部分中顯示用於特定目的的一種或多種標籤域的序列,並且在其3'部分中顯示該轉移的轉座子末端的序列的轉移鏈,所述孵育在如下條件下進行其中轉座酶催化轉座反應,其中該靶DNA被斷裂,並且該轉座子末端組合物的轉移鏈與該靶DNA的片段的5'端接合產生 5'加標籤的靶DNA片段,使得該轉座反應產生多個5'加標籤的靶DNA片段,所述多個5'加標籤的靶DNA片段構成來自靶DNA的DNA片段文庫。本發明還提供了組合物。例如,在一些實施方案中,本發明提供了包含合成的核酸分子的組合物,所述合成的核酸分子具有含標籤域的5'部分和含轉座子末端的轉移鏈的 3'部分。在一些實施方案中,本發明提供了包含多種合成的核酸分子的組合物,其中所述核酸分子包含5'部分和3'部分,該5'部分包含具有至少一個核苷酸差異的標籤域,該 3'部分包含轉座子末端的轉移鏈。在上述組合物的一些實施方案中,核酸分子的至少3'部分是雙鏈DNA。在某些優選的實施方案中,轉座子末端是Tn5轉座子末端,而在其他實施方案中,轉座子末端是Mu轉座子末端。在一些實施方案中,核酸分子組合物的標籤域包括限制性位點域、捕獲標籤域、 測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。在特別優選的實施方案中,標籤域包括測序標籤,所述測序標籤包括選自以下的測序標籤或由選自以下的測序標籤構成Roche 454A測序標籤和Roche 454B測序標籤,ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics 測序標籤。在一些實施方案中,包含核酸分子的組合物還包括純化的轉座酶。在優選的實施方案中,轉座酶選自Tn5轉座酶和Mu轉座酶。在優選的實施方案中,核酸分子和轉座酶在混合物中提供。在特別優選的實施方案中,該混合物還包括非離子洗滌劑。在更加優選的實施方案中,該非離子洗滌劑包括Nonidet Ρ-40和/或吐溫-20。在一些實施方案中,本發明提供了包含上面或本文其他地方描述的任何組合物的試劑盒。在一些實施方案中,試劑盒還包括連接酶、聚合酶和/或用於擴增反應的試劑中的一種或多種。在特別優選的實施方案中,用於擴增反應的試劑包括用於聚合酶鏈反應的試劑。在優選的實施方案中,用於擴增反應和/或聚合酶鏈反應的試劑包括至少一種引物,並且在特別優選的實施方案中,這些試劑包括如下引物其中包含與核酸分子的5'部分的標籤域的互補序列互補的3'部分。在優選的實施方案中,標籤域包括限制性位點域、 捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種,並且在特別優選的實施方案中,標籤域包括測序標籤域,所述測序標籤域包括選自以下的測序標籤或由選自以下的測序標籤構成Roche 454A測序標籤和Roche 454B測序標籤、ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics 測序標籤。在一些實施方案中,本發明的試劑盒還包括用於DNA測序反應的試劑。在一些實施方案中,本發明包括包含雙鏈靶DNA和上述任何一種加標籤的轉座子末端核酸分子和/或轉座酶組合物的反應混合物。在一些實施方案中,本發明提供了包含純化的轉座酶和多個合成轉座子末端或轉座子末端組合物的組合物。在一些實施方案中,轉座子末端組合物包括髮夾轉座子末端, 而在一些實施方案中,合成的轉座子末端或轉座子末端組合物包括分開的轉移鏈和非轉移鏈。在一些優選的實施方案中,轉移鏈包括5'標籤域,例如包括限制性位點域、捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。在特別優選的實施方案中,標籤域包括測序標籤,所述測序標籤包括選自以下的測序標籤或由選自以下的測序標籤構成Roche 454A測序標籤和Roche 454B測序標籤,ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics 測序標籤。在一些實施方案中,包含純化的轉座酶的組合物包括多個合成的轉座子末端,所述轉座子末端包含至少兩條轉移鏈,這兩條轉移鏈彼此具有至少一個核苷酸差異,並且在優選的實施方案中,轉移鏈包括5'部分和3'部分,其中轉移鏈的至少兩個5'部分包括彼此具有至少一個核苷酸差異的標籤,並且其中轉移鏈的3'部分包括相同的轉座子末端序列。在一些實施方案中,轉座子末端包括Mu轉座子末端並且轉座酶是Mu轉座酶,並且在一些優選的實施方案中,轉移鏈的3'部分包括來自Mu轉座子末端的序列,並且其中轉移鏈的5'部分不是來自Mu轉座子。在一些實施方案中,轉座子末端包括Tn5轉座子末端並且轉座酶是Τη5轉座酶,並且在一些優選的實施方案中,轉移鏈的3'部分包括來自Τη5轉座子末端的序列,並且其中轉移鏈的5'部分不是來自Τη5轉座子。在一些實施方案中,本發明提供了包含DNA片段文庫的組合物,其中該DNA片段文庫包括靶DNA的片段,該片段具有包含來自轉座子末端或轉座子末端組合物的轉移鏈的序列的5'端。在優選的實施方案中,來自轉移鏈的序列包括5'標籤域,並且在更加優選的實施方案中,DNA片段文庫包括靶DNA的片段,該片段包含與轉座子末端或轉座子末端組合物的轉移鏈互補的3'標籤。在一些實施方案中,DNA片段文庫包括靶DNA的雙鏈片段。在一些實施方案中,本發明提供了包含靶DNA的加標籤的環狀DNA片段的組合物, 所述靶DNA的加標籤的環狀DNA片段包含如下部分該部分包含在其5'端的非轉移鏈、在其3'端的轉移鏈序列、包含標籤域的間插環序列、靶DNA的一部分的兩條鏈的序列。在一些實施方案中,本發明提供了包含靶DNA的加標籤的環狀單鏈DNA片段的組合物,所述靶DNA的加標籤的環狀單鏈DNA片段包含來自轉座子末端或轉座子末端組合物的轉移鏈以及來自靶DNA的單鏈部分。在優選的實施方案中,轉移鏈序列包括標籤域。在一些實施方案中,本發明提供了包含靶DNA的扇尾形雙鏈DNA片段的組合物,所述靶DNA的扇尾形雙鏈DNA片段包含靶DNA的雙鏈部分,其中每條鏈具有包含轉移鏈序列的至少一部分的5'端和包含非轉移鏈序列的至少一部分的3'端。在本概述中並且在下面的發明詳述中描述了本發明的實施方案,通過引用將發明詳述併入此處。儘管已結合具體實施方案對本發明進行描述,應理解要求保護的發明不應過多地限於這些具體實施方案。附圖簡述下面的圖形成本說明書的一部分並且被包括來進一步展示本發明的某些方面。通過結合本文提供的具體實施方案的詳述參考這些圖中的一個或多個,可以更好地理解本發明。圖1提供了顯示在轉座反應中轉座子插入靶DNA中的示意圖。圖2提供了顯示在轉座反應中通過插入轉座子末端使靶DNA斷裂和加標籤的示意圖。
圖3提供了兩次轉座酶催化的轉座子末端組合物插入事件的產物的示意圖。因此,在該圖的左側描繪的轉座酶催化的轉座子末端組合物插入的產物顯示如下轉座子末端方向其中該轉座子末端組合物的轉移鏈(即,其中轉移的轉座子末端顯示序列 5' AGATGTGTATAAGAGACAG 3' (SEQ ID NO :1),且其端 3'接合靶 DNA)在頂鏈中;並且在該圖的右側描繪的轉座酶催化的轉座子末端組合物插入的產物顯示如下轉座子末端方向 其中轉移鏈在底鏈中。非轉移鏈是SEQ ID NO :2。圖4圖解了用於產生加標籤的DNA片段的文庫的兩種不同的加標籤的轉座子末端的實例,每種加標籤的轉座子末端包含在5'部分中具有不同標籤的轉移鏈寡核苷酸以供中使用。使用例如具有5'核酸酶或鏈置換活性的DNA聚合酶延伸每條鏈的3'端,產生加雙標籤的ssDNA片段。顯示的轉移鏈序列是SEQ ID NO 1 ;非轉移鏈是SEQ ID NO :2。圖5顯示了瓊脂糖凝膠的圖像,該圖像示出使用不同的轉座體(transposome)濃度產生的5'加標籤的DNA片段轉座產物的大小範圍。圖6顯示了瓊脂糖凝膠的圖像,該圖像示出在存在或不存在二甲基甲醯胺(DMF) 的情況下在不同溫度下、具有不同反應緩衝液的五分鐘反應中產生的5'加標籤的DNA片段轉座產物的大小範圍。圖7圖解了以下方法的一個實例,所述方法使用具有鏈置換DNA聚合酶活性和/ 或具有5'-到-3'外切核酸酶活性的DNA聚合酶來接合轉移鏈的互補序列與來自體外轉座反應的5'加標籤的DNA片段,以產生包含加雙標籤的ssDNA片段的DNA片段的文庫。如所示出的,DNA聚合酶的鏈置換和/或5'-到-3'外切核酸酶活性置換或消化在DNA聚合酶延伸產物的下遊退火的DNA,並且DNA聚合酶進行的延伸接合第二標籤,該第二標籤包含與插入相反鏈中的第一標籤互補的DNA序列或由其構成。在一些實施方案中,使用與轉移鏈的互補序列互補的寡核苷酸對加雙標籤的DNA片段產物進行PCR擴增。顯示的轉移鏈序列是SEQ TD NO 1 ;非轉移鏈是SEQ ID NO :2。圖8圖解了以下方法的一個實例,所述方法使用具有鏈置換DNA聚合酶活性和/ 或具有5'-到-3'外切核酸酶活性的DNA聚合酶來接合第二標籤與來自體外轉座反應的 5'加標籤的DNA片段以產生包含加雙標籤的DNA片段的DNA片段的文庫。如所示出的,DNA 聚合酶的鏈置換和/或5'-到-3'外切核酸酶活性置換或消化在DNA聚合酶延伸產物的下遊退火的DNA,並且DNA聚合酶進行的延伸接合第二標籤,該第二標籤包含與插入相反鏈中的第一標籤互補的DNA序列或由其構成。在一些實施方案中,使用與相應的第一或第二標籤中的不同序列互補的寡核苷酸作為PCR引物對加雙標籤的ssDNA片段產物進行PCR擴增。顯示的轉移鏈序列是SEQ ID NO :1 ;非轉移鏈是SEQ ID NO :2。圖9提供了相比於使用噴霧產生的對照文庫,使用根據本發明的實施方案產生的 DNA片段文庫的單個重疊群的測序讀序長度(read length)、準確度和覆蓋率的比較。圖10提供了顯示通過在轉座反應中插入加標籤的轉座子末端、接著通過標籤特異性PCR+/-條碼使靶DNA斷裂和加標籤以產生Roche/4M相容的文庫的示意圖。圖11顯示了瓊脂糖凝膠的圖像,該圖像示出了用於製備如圖10所圖解的加條碼的Roche/454 FLX相容的測序文庫的輸入DNA(泳道幻、5『加標籤的DNA片段轉座產物的大小範圍(泳道3)、PCR反應產物的大小範圍(泳道4)、以及對照反應(泳道5)。圖12顯示了瓊脂糖凝膠的圖像,該圖像示出了用於以類似於圖10所圖解的方法由擴增子DNA製備Roche/454 FLX鈦相容的測序文庫的5 『加標籤的DNA片段轉座產物的大小範圍(泳道2)、PCR反應產物的大小範圍(泳道3)、以及對照反應(泳道5)。圖13提供了顯示通過在轉座反應中插入加標籤的轉座子末端、接著通過標籤特異性PCR+/-條碼使靶DNA斷裂和加標籤以產生Illumina/Solexa相容的文庫的示意圖。圖14顯示了瓊脂糖凝膠的圖像,該圖像示出了用於製備如圖13所圖解的加條碼的Illumina GAII相容的測序文庫的輸入DNA(泳道2)、5'加標籤的DNA片段轉座產物的大小範圍(泳道3)、PCR反應產物的大小範圍(泳道4)、以及對照反應(泳道5)。圖15比較了文庫製備的現有技術方法與根據本發明的實施方案的DNA片段文庫製備的過程和複雜性。圖16顯示在雙鏈靶DNA(例如,基因組DNA或雙鏈cDNA)的存在下在體外轉座酶反應中孵育轉座酶(例如,這裡的EZ-Tn5 轉座酶)和髮夾轉座子末端組合物(例如,這裡描繪的EZ-Tn5 「pMETS-N-MENTS」髮夾轉座子末端組合物)後本發明方法的產物的實例。圖17.用髮夾轉座子末端組合物對靶DNA進行斷裂和加標籤。圖17A顯示從髮夾轉座子末端組合物到靶DNA中的兩次轉座酶催化的插入事件產生的產物的示意圖。簡言之,在包含轉座酶和髮夾轉座子末端組合物(例如,EZ-Tn5 轉座酶和EZ-Tn5 髮夾轉座子末端組合物)的體外轉座酶反應中孵育靶DNA(例如,包含雙鏈基因組DNA或cDNA)。 每種插入的髮夾轉座子末端組合物的轉移末端序列經環結構與該轉座子末端的非轉移鏈序列接合。該環可具有任何任意的標籤域,諸如限制性位點域、捕獲標籤域、測序標籤域、 檢測標籤域、地址標籤域、轉錄啟動子域或擴增標籤域。例如,測序標籤域可顯示Roche 454A測序標籤或Roche 454B測序標籤的序列。例如,在該圖中,測序標籤域在互補的轉座子末端序列(莖)之間的環中顯示一個或多個序列。圖17B顯示使用0、0.5、1、2或 3 μ M的pMETS-N-MENTS髮夾轉座子末端組合物和等摩爾量的EZ_Tn5 轉座酶(EPICENTRE Biotechnologies,Madison, WI)在 33mM Tris 乙酸鹽 pH 7. 6、66mM KOAc 禾Π IOmM Mg(OAc)2 中在37°C孵育2小時後,1 μ g的Τ7 Dili基因組dsDNA的5'加標籤和斷裂的產物的STOR Gold染色的瓊脂糖電泳凝膠。圖18.5'加標籤的環狀DNA模板的產生。圖18A是所述方法的一個實施方案的示意圖。簡言之,通過髮夾轉座子末端組合物兩次插入靶DNA所產生的9個核苷酸的缺口通過如下方式填充使用缺乏5'-到-3'外切核酸酶和鏈置換活性的DNA聚合酶(例如, T4 DNA聚合酶)和作為模板的缺口區中的單鏈DNA延伸所產生的5'加標籤的DNA片段的3'端,然後使用依賴模板的連接酶(例如,大腸桿菌DNA連接酶)連接該5'加標籤的 DNA片段的DNA聚合酶延伸產物來產生加標籤的環狀DNA片段。該加標籤的環狀DNA片段對T5外切核酸酶具有抵抗力,在該圖的實施方案中使用該T5外切核酸酶來移除未連接的線性單鏈和雙鏈的DNA。圖18B顯示在存在或不存在T4 DNA聚合酶和/或大腸桿菌DNA連接酶的情況下產生的反應產物的STOR Gold染色的瓊脂糖電泳凝膠。如所顯示的,對 T5外切核酸酶的處理具有抵抗力的加標籤的環狀DNA片段只在T4 DNA聚合酶和大腸桿菌 DNA連接酶都存在的情況下產生。圖19圖解了使用末端轉移酶接合第二(3')標籤與5'加標籤的DNA片段,產生包含5'和3'加標籤的(「加雙標籤的」)的ssDNA片段的DNA片段的文庫。在這個圖解的實施方案中,使用依賴模板的DNA聚合酶添加包含測序標籤(SEQ)的測序標籤域。
圖20圖解了使用末端標籤寡核苷酸作為模板來添加第二(3')標籤至5'加標籤的ssDNA片段以產生包含加雙標籤的ssDNA片段的DNA片段的文庫。圖21圖解了一個實施方案,其中在DNA連接酶和包含5'部分及3'部分的連接加標籤寡核苷酸(ligation tagging oligonucleotide)的存在下孵育5『加標籤的DNA 片段,該5'部分在其5'端上具有磷酸基團並且顯示與單鏈DNA的9鹼基缺口或區域退火的隨機序列,該單鏈DNA由EZ-Tn5轉座酶催化的EZ-Tn5 ME轉座子末端插入靶DNA中而產生,該3'部分顯示第二標籤序列(標籤#2)。在該實例中,連接加標籤寡核苷酸具有顯示 6-核苷酸隨機序列的5'部分。該隨機序列與9-鹼基缺口區中的單鏈退火的靶DNA退火, 該9-鹼基缺口區由轉座子末端(例如,這裡的19-鹼基對EZ-Tn5嵌合末端或ME轉座子末端)插入雙鏈靶DNA中而產生。與缺口區中的單鏈靶DNA退火以使得5』 -磷酸化末端緊靠5'加標籤的DNA片段的3'端的那些連接加標籤寡核苷酸然後在依賴模板的連接反應中通過核酸連接酶而接合,由此產生第一標籤在5'端上並且第二標籤在3'端上的5'和 3'加標籤的DNA片段。因此,如果轉座子末端插入發生在靶DNA的兩條鏈的極接近處(例如,彼此在大約50Kb、大約40Kb、大約30Kb、大約20Kb、大約10Kb、大約5Kb、大約1Kb、大約 500bp或優選在大約150bp到大約500bp內的靶DNA中的位點),那麼該雙重加標籤的鏈可被純化、PCR擴增、任選地用可檢測的染料標記(例如,用作與例如用於表達分析的微陣列退火的靶),或首先被捕獲在表面上(例如,在珠子上;例如用於下一代測序的珠子),然後擴增(例如,使用乳液PCR,例如用作下一代測序模板;或使用有限循環PCR,例如在拷貝數變異(CNV)實驗中使用,例如通過微陣列上的比較基因組雜交)。圖22 (A)顯示使用本發明的方法的基因組DNA的DNA斷裂、加標籤和環化的實施方案的示意圖。黑線的尖頭方框代表p4M. IMEDS轉座子末端組合物。虛線代表T7 Dlll 基因組dsDNA片段。圖22 (B)顯示使用p454. IMEDS轉座子末端組合物和EZ_Tn5 轉座酶(EPICENTRE Biotechnologies)的T7 Dili基因組dsDNA的5,加標籤和斷裂的產物的瓊脂糖凝膠。如所示在存在或不存在EZ-Tn5轉座酶的情況下,將1 μ g的T7 Dlll基因組dsDNA在有或沒有0. 5 μ M的p454. IMEDS轉座子末端組合物時在33mM Tris乙酸鹽pH 7. 6、66mM KOAc和 IOmM Mg(OAc)2中在37°C下孵育1小時。通過在1 %瓊脂糖凝膠中電泳分辨5『加標籤的線性ssDNA反應產物並用STOR Gold染色。圖23 (A)顯示使用pMETS和p454. 1寡核苷酸作為PCR引物PCR擴增加標籤的環狀ssDNA片段的示意圖。圖23 (B)顯示在使用pMETS和pc454. 1寡核苷酸作為PCR引物通過PCR對使用本發明的方法獲得的加標籤的環狀ssDNA片段進行擴增時獲得的PCR擴增產物的瓊脂糖凝膠。首先,如圖22(B)中所示獲得的5'加標籤的斷裂的dsDNA通過95°C加熱3分鐘並迅速在冰上冷卻而變性。如實施例17中所示在存在或不存在400單位的CIRCLIGASE ssDNA 連接酶的情況下於60°C將得到的變性的5'加標籤的線性ssDNA片段的一部分在Tris乙酸鹽pH 7. 6、66mM KOAc,2. 5mM MnCl2和IM甜菜鹼中孵育2小時,以便使該5'加標籤的線性ssDNA片段環化。將反應產物與外切核酸酶I和外切核酸酶III 一起在37°C孵育1小時以便在PCR擴增前消化線性ssDNA片段。然後使用pMETS和pc454. 1寡核苷酸作為PCR 引物通過PCR擴增該加標籤的環狀ssDNA片段。通過1 %瓊脂糖電泳分辨PCR產物並通過SYBR Gold染色顯現。定義除非在本文別處具體限定或不同地描述,否則以下與本發明有關的術語和描述應按照下面給出的來理解。當本文使用術語「例如」、「如」、「諸如」、「包括」、「包含」或其變體時,這些術語將不
被認為是限制性術語,而將被解釋為表示「但不限於」或「不限於」。除非本文另外指明或根據上下文明顯矛盾,否則術語「一個」和「一種」以及「該」 和類似指稱物在描述本發明的上下文中(尤其在以下權利要求的上下文中)使用應被解釋成覆蓋單數和複數。如本文所用,術語「分離的」、「來分離」、「分離」、「純化的」、「來純化」、「純化」以及它
們的語法等同物在本文使用時,除非另外指明,否者是指從分離材料的樣品或來源(例如細胞)中減少至少一種汙染物(諸如蛋白和/或核酸序列)的量。因此純化導致「富集」, 即樣品中期望的蛋白和/或核酸序列的量的增加。如本文所用,「標籤(tag) 」是指向它所接合的核酸片段提供尋址手段的非靶核酸組分,一般為DNA。例如,在優選的實施方案中,標籤包括允許與其相連的DNA的鑑定、識別和/或分子操作或生物化學操作的核苷酸序列(例如,通過提供用於使寡核苷酸退火的位點,所述寡核苷酸諸如用於DNA聚合酶延伸的引物或者捕獲反應或連接反應的寡核苷酸)。 將標籤與DNA分子接合的過程有時在本文稱為「加標籤」並且經歷加標籤或含標籤的DNA稱為「加標籤的」(例如,「加標籤的DNA」)。如本文所用,術語「連接酶」是指催化核酸鏈的5'-磷酸和3'-羥基末端之間磷酸二酯鍵的分子內形成和分子間形成的核酸修飾酶。連接酶包括例如,可接合單鏈RNA 和DNA的末端的不依賴模板的連接酶諸如CIRCLIGASE ssDNA連接酶,以及在雙鏈DNA中密封切口的依賴模板的連接酶或同源連接酶(以下描述的實例)。如本文所用,「同源連接酶」或「依賴模板的連接酶」表示催化在與互補多核苷酸退火時彼此鄰近的DNA鏈的5'-磷酸與3'-羥基末端之間磷酸二酯鍵的分子內和分子間形成的DNA連接酶。分子內連接的一些實施方案產生環狀分子並稱為「環化」。與要連接的 DNA末端中的兩個末端鄰近地退火的多核苷酸在本文被稱為「連接模板」並且這種連接被稱為「同源連接」或「依賴模板的連接」。連接模板可以是生物樣品的基因組DNA或其他DNA中的互補DNA序列(在這種情況下,通常稱其為「靶序列」),或者連接模板可以是為了用於特定測定或方法而特別合成和/或提供的「橋接寡脫氧核糖核苷酸」或「連接夾板(ligation splint)寡脫氧核糖核苷酸」(或「連接夾板」)。同源DNA連接酶或依賴模板的DNA連接酶的實例包括NAD型DNA連接酶,諸如大腸桿菌DNA連接酶、Tth DNA連接酶、Tfl DNA連接酶和 AMPLIGASE DNA 連接酶(EPICENTRE Biotechnologies, Madison, WI,USA),它們只有在存在連接模板的情況下催化ssDNA分子的分子內連接;以及ATP型DNA連接酶,諸如T4 DNA連接酶或FASTLINK DNA連接酶(EPICENTRE Biotechnologies),儘管對於平端連接 ATP型DNA連接酶不需要連接模板,但它們更有效地催化依賴模板的連接。在一些優選的實施方案中,依賴模板的連接酶來自於嗜冷細菌或嗜冷噬菌體以使得連接可在較低溫度下進行(例如,當形成連接接點的寡核苷酸或多核苷酸的序列顯示較低Tm時)。選擇如下DNA連接酶以在該方法中使用所述DNA連接酶在用於接合的DNA分子(例如,5'加標籤的DNA片段延伸產物或5'加標籤的DNA片段與隨機序列寡核苷酸) 退火持續足以被連接酶連接的時間的溫度下是有活性的。在本發明的方法的實施方案中的一個重要步驟是使用體外轉座反應將靶DNA斷裂並加標籤以產生加標籤的DNA片段。體外轉座反應需要轉座酶、轉座子末端組合物以及適合的反應條件。「轉座酶」表示如下的酶該酶能夠與包含轉座子末端的組合物(例如,轉座子、轉座子末端、轉座子末端組合物)形成功能複合物並催化該包含轉座子末端的組合物插入或轉座進入在體外轉座反應中與該酶孵育的雙鏈靶DNA中。術語「轉座子末端」表示只顯示在體外轉座反應中與轉座酶或整合酶形成有功能的複合物所必需的核苷酸序列(「轉座子末端序列」)的雙鏈DNA。轉座子末端與識別並結合該轉座子末端的轉座酶或整合酶形成「複合物」或「聯合複合物(synaptic complex) 」或「轉座體複合物」或「轉座體組合物」,並且該複合物能夠將該轉座子末端插入或轉座進入在體外轉座反應中與其孵育的靶DNA中。轉座子末端顯示由「轉移的轉座子末端序列」或「轉移鏈」以及「非轉移的轉座子末端序列」或「非轉移鏈」構成的兩條互補序列。例如,與體外轉座反應中有活性的高活性Tn5轉座酶(例如,ΕΖ-Τη5 轉座酶,EPICENTRE Biotechnologies, Madison,WI,USA)形成複合物的一個轉座子末端包括顯示如下「轉移的轉座子末端序列」的轉移鏈5' AGATGTGTATAAGAGACAG 3' (SEQ ID NO 1),以及顯示如下「非轉移的轉座子末端序列」的非轉移鏈5' CTGTCT CTTATACACATCT 3' (SEQ ID NO 2) 在體外轉座反應中,轉移鏈的3'端與靶DNA接合或轉移至靶DNA。在體外轉座反應中,顯示與轉移的轉座子末端序列互補的轉座子末端序列的非轉移鏈不與靶DNA接合或不轉移至靶DNA。在一些實施方案中,轉移鏈和非轉移鏈是共價接合的。例如,在一些實施方案中, 在單個寡核苷酸上提供轉移鏈序列和非轉移鏈序列,例如在髮夾構型中。這樣,儘管非轉移鏈的游離端沒有通過轉座反應直接與靶DNA接合,但該非轉移鏈間接與DNA片段相連,因為該非轉移鏈通過髮夾結構的環與轉移鏈連接。「轉座子末端組合物」表示包含轉座子末端(即,能夠與轉座酶作用進行轉座反應的最小雙鏈DNA片段)任選地加上轉移的轉座子末端序列5'-的和/或非轉移的轉座子末端序列3'的另外的序列的組合物。例如,與標籤相連的轉座子末端為「轉座子末端組合物」。在一些實施方案中,轉座子末端組合物包括兩種轉座子末端寡核苷酸或由兩種轉座子末端寡核苷酸構成,所述轉座子末端寡核苷酸由聯合顯示轉座子末端的序列並且其中的一條或兩條鏈包括另外的序列的「轉移的轉座子末端寡核苷酸」或「轉移鏈」以及「非轉移鏈末端寡核苷酸」或「非轉移鏈」構成。術語「轉移的轉座子末端寡核苷酸」和「轉移鏈」可互換使用並且是指「轉座子末端」和「轉座子末端組合物」 二者的轉移部分,即不考慮轉座子末端是否與標籤或其他部分相連。類似地,術語「非轉移的轉座子末端寡核苷酸」和「非轉移鏈」可互換使用並且是指「轉座子末端,,和「轉座子末端組合物,,二者的非轉移部分。在一些實施方案中,轉座子末端組合物是「髮夾轉座子末端組合物」。如本文所用,「髮夾轉座子末端組合物」表示由單個寡脫氧核糖核苷酸構成的轉座子末端組合物,所述寡脫氧核糖核苷酸顯示在其5'端的非轉移鏈轉座子末端序列、在其3'端的轉移的轉座子末端序列以及足夠長的允許分子內莖-環形成的在該非轉移的轉座子末端序列與該轉移的轉座子末端序列之間的間插的任意序列, 以使得該轉座子末端部分能夠在轉座反應中發揮功能。在一些實施方案中,髮夾轉座子末端組合物的5'端在5'-核苷酸的5'位置具有磷酸基團。在一些實施方案中,在髮夾轉座子末端組合物的非轉移的轉座子末端序列與轉移的轉座子末端序列之間的間插的任意序列提供用於特定用途或應用的標籤(例如,包括一個或多個標籤域)。在一些實施方案中,本發明的方法產生加標籤的環狀ssDNA片段。在一些實施方案中,加標籤的環狀ss DNA片段僅顯示轉座子末端組合物的轉移鏈的序列,而加標籤的環狀ss DNA片段不顯示轉座子末端組合物的非轉移鏈的序列。在一些實施方案中,在本發明的方法中使用的轉座子末端組合物包括僅顯示與轉座酶或整合酶形成複合物並且為轉座反應所需的轉座子末端序列的轉座子末端寡核苷酸; 在這些實施方案中,使用該方法產生的加標籤的環狀ssDNA片段中的標籤僅顯示轉移的轉座子末端序列。然而,在一些實施方案中,轉座子末端組合物包括至少一種轉座子末端寡核苷酸或由其構成,所述轉座子末端寡核苷酸除了轉座子末端序列之外還顯示一種或多種其他的核苷酸序列。因此,在一些實施方案中,轉座子末端組合物包括顯示轉移的轉座子末端序列 5'的一種或多種其他核苷酸序列的轉移鏈,所述一種或多種其他核苷酸序列也由標籤顯示。因此,除了轉移的轉座子末端序列之外,標籤可具有一個或多個其他的標籤部分或標籤域。如本文所用,「標籤部分」或「標籤域」表示顯示用於期望的預定目的或應用的序列的標籤的部分或結構域。一種標籤部分或標籤域是「轉座子末端域」,該標籤部分或標籤域顯示轉移的轉座子末端序列。在其中轉移鏈也顯示轉移的轉座子末端序列5'的一種或多種其他核苷酸序列的一些實施方案中,標籤在所述5'部分中也具有一種或多種其他的「標籤域」,標籤域中的每一種為任何期望的目的而提供。例如,本發明的一些實施方案包括以下轉座子末端組合物或由其構成,所述轉座子末端組合物包括如下或由如下構成(i)顯示轉移的轉座子末端序列5'的一種或多種序列的轉移鏈,所述轉移的轉座子末端序列包括標籤域或由標籤域構成,所述標籤域選自限制性位點域、捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種;以及(ii)顯示非轉移的轉座子末端序列的非轉移鏈。本發明包括使用所述轉座子末端組合物中的任何一個或多個的方法的實施方案。如本文所用,「切割域」是指易感的核酸序列。如本文所用,「限制性位點域」表示顯示用於使利用限制性內切核酸酶的切割容易的目的的序列的標籤域。例如,在一些實施方案中,使用限制性位點域來產生加雙標籤的線性ssDNA片段。在一些實施方案中,使用限制性位點域在標籤域中產生相容的雙鏈的5' 端,以使得可使用依賴模板的DNA連接酶將這個末端連接至另一個DNA分子。在一些優選的實施方案中,在標籤中的限制性位點域顯示在靶DNA中如果有也只很少出現的限制性位點的序列(例如,稀有切割的限制性內切核酸酶諸如NotI或AscI的限制性位點)。在一些優選的實施方案中,在限制性位點域中的限制性位點是用於II型限制性內切核酸酶諸如FokI限制性內切核酸酶的限制性位點。在其中轉座子末端組合物的轉移鏈包括轉移的轉座子末端序列5'-的一個或多個限制性位點域的一些實施方案中,所述方法還包括使與加標籤的環狀ssDNA片段的單鏈限制性位點互補的寡脫氧核糖核苷酸退火,然後使用識別該限制性位點的限制性內切核酸酶在該限制性位點切割該加標籤的環狀ssDNA片段。因此,在一些實施方案中,所述方法包括使加標籤的環狀ssDNA片段線性化以產生加雙標籤的線性ssDNA片段。在其中轉座子末端組合物的轉移鏈包括轉移的轉座子末端序列5'-的一個或多個限制性位點域的一些其他的實施方案中,該轉座子末端組合物的轉移鏈包括含限制性位點的雙鏈髮夾,並且該方法還包括使用識別該限制性位點的限制性內切核酸酶在該限制性位點切割加標籤的線性ssDNA片段的步驟;然而,在一些實施方案中,這種方法不是優選的,因為雙鏈髮夾提供了 dsDNA的位點,轉座子末端組合物可被轉座酶或整合酶轉座進入該dsDNA的位點中。在包括以下的一些優選的實施方案中(i)通過與單鏈限制性位點互補的寡脫氧核糖核苷酸的退火或通過使用包含雙鏈髮夾的轉移鏈,產生雙鏈的限制性位點,並且(ii) 然後使用識別該雙鏈的限制性位點的限制性內切核酸酶切割該限制性位點,該方法還包括將限制性內切核酸酶切割的加標籤的線性ssDNA片段與具有相容的3'端的另一種DNA分子相連接的步驟。如本文所用,「捕獲標籤域」或「捕獲標籤」表示如下標籤域顯示用於使該標籤域接合的ssDNA片段的捕獲容易的目的的序列(例如,提供退火位點或親和標籤用於將加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段捕獲在珠子或其他表面上,例如,其中該標籤域序列的退火位點允許通過與表面上的特異性序列諸如在珠子或在微晶片或微陣列或在測序珠子上的探針退火來捕獲)。在該方法的一些實施方案中,在加標籤的環狀ssDNA 片段或加雙標籤的線性ssDNA片段通過與表面上的互補探針退火而被捕獲後,捕獲標籤域提供用於使用所述加標籤的環狀ssDNA片段或所述加雙標籤的線性ssDNA片段(或所述加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段的互補序列)作為模板引發DNA合成的位點。在一些其他的實施方案中,捕獲標籤域包括與化學基團或化學部分接合的轉移鏈的5'部分,所述化學基團或化學部分包括親和性結合分子或由其構成(例如,其中轉移鏈的5'部分與第一親和性結合分子諸如生物素、抗生蛋白鏈菌素、抗原或結合該抗原的抗體接合,所述第一親和性結合分子允許在第二親和性結合分子附連的表面上捕獲環狀加標籤的ssDNA片段或加雙標籤的線性ssDNA片段,所述第二親和性結合分子與所述第一親和性結合分子形成特異性結合對)。如本文所用,「測序標籤域」或「測序標籤」表示顯示用於如下目的的序列的標籤域使利用合成加標籤的環狀ssDNA片段的方法對該標籤接合的ssDNA片段的測序容易(例如,提供引發位點用於通過合成測序,或提供退火位點用於通過連接測序,或提供退火位點用於通過雜交測序)。例如,在一些實施方案中,測序標籤域提供了用於引發所述 ssDNA片段或所述ssDNA片段的互補序列的DNA合成的位點。如本文所用,「擴增標籤域」表示顯示用於如下目的的序列的標籤域使所述標籤附加的核酸的擴增容易。例如,在一些實施方案中,擴增標籤域提供用於使用DNA聚合酶的核酸擴增反應(例如,PCR擴增反應或鏈置換擴增反應或滾環擴增反應)的引發位點,或用於在核酸擴增反應(例如,連接鏈反應)中使用依賴模板的連接酶連接探針的連接模板。如本文所用,「檢測標籤域」或「檢測標籤」表示顯示用於如下目的的序列或可檢測的化學部分或生物化學部分的標籤域使加標籤的環狀ssDNA片段或加雙標籤的線性 ssDNA片段的檢測容易(例如,其中所述序列或化學部分包括可檢測的分子或與可檢測的分子接合;所述可檢測的分子諸如選自以下的可檢測分子可見的、螢光的、化學發光的或其他可檢測的染料;在存在底物的情況下可檢測的酶,例如鹼性磷酸酶與NBT加BCIP或過氧化物酶與適合的底物);可檢測的蛋白,例如,綠色螢光蛋白;以及與可檢測的部分結合或者可與另一種可檢測的親和性結合分子形成親和性結合對或特異性結合對的親和性結合分子;或本領域已知的許多其他可檢測分子或系統中的任何一種)。如本文所用,「地址標籤域」或「地址標籤」表示顯示允許特定樣品的鑑定的序列的標籤域(例如,其中轉移鏈具有對每種樣品顯示不同序列的不同地址標籤域)。如本文所用,「轉錄啟動子域」或「啟動子域」表示顯示用於RNA聚合酶啟動子的正義啟動子序列或反義啟動子序列的序列的標籤域。如本文所用,「正義啟動子序列」表示與充當RNA聚合酶轉錄的模板的DNA連結合的RNA聚合酶啟動子的序列,所述RNA聚合酶結合RNA聚合酶啟動子並且在適於轉錄的反應條件下從RNA聚合酶啟動子啟動轉錄。如本文所用,「反義啟動子序列」表示與正義啟動子序列互補的RNA聚合酶啟動子的序列。在一些實施方案中,由轉錄啟動子域顯示的正義啟動子序列用於結合單鏈的RNA聚合酶啟動子並自其啟動轉錄的RNA聚合酶,在這些實施方案中,正義啟動子序列足以作為RNA聚合酶啟動子發揮功能(例如,用於噬菌體N4 RNA聚合酶)。在一些實施方案中,正義啟動子序列用於結合雙鏈的RNA聚合酶啟動子並自其啟動轉錄的RNA聚合酶,在這些實施方案中,該方法包括在使用結合雙鏈RNA聚合酶啟動子並自其啟動轉錄的RNA聚合酶進行轉錄之前, 使RNA聚合酶啟動子變為雙鏈的(例如,通過正義啟動子序列與顯示與正義啟動子序列互補的反義啟動子序列的寡脫氧核糖核苷酸退火,或者通過使用加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段作為模板來合成包含正義啟動子序列或由正義啟動子序列構成的dsDNA)。在一些實施方案中,正義啟動子序列是用於T7型RNA聚合酶(例如,選自T7 RNA聚合酶、T3 RNA聚合酶和SP6 RNA聚合酶)的。顯示正義啟動子序列的轉錄啟動子域使得合成與使用該方法與轉座子末端組合物的轉移鏈相連接的單鏈靶RNA互補的RNA成為可能。使用包含如下轉移鏈的轉座子末端組合物產生的加標籤的環狀ssDNA片段不能被RNA 聚合酶轉錄所述轉移鏈具有顯示反義啟動子序列的轉錄啟動子域。然而,在一些實施方案中,通過延伸與加標籤的環狀ssDNA片段退火的引物而合成的dsDNA用於通過RNA聚合酶的轉錄,所述RNA聚合酶結合雙鏈RNA聚合酶啟動子並自其啟動轉錄;在這些實施方案中, 合成的RNA顯示與加標籤的環狀ssRNA片段相同的序列。不同的標籤域的名稱和描述是為了便利,這樣使得理解和討論不同實施方案中的標籤的不同部分或域的預定目的和應用更容易。然而,這些名稱和描述不旨在以任何方式限制標籤或其任何一種標籤域的使用或應用。因此,任何具體的標籤或標籤域可用於除了預定的或主要的目的或應用以外任何目的,或者代替預定的或主要的目的或應用的任何目的。同樣,一種標籤域可包括兩種或更多種其他標籤域(例如,測序標籤域可包括轉座子末端域和轉座子末端域5'-的另一種標籤域),或一種標籤域可提供兩種或更多種不同的標籤域的功能或目的或應用(例如,轉座子末端域可提供轉移的轉座子末端的目的並且還提供用於特定應用的測序標籤域和/或捕獲標籤域的功能或目的)。更進一步,不必按照一種或多種不同的域描述標籤以便用於任何特定的目的或應用或功能。如本文所用,在提到核酸或核酸反應時使用的術語「擴增」或「擴增的」、「擴增了,, 是指製備特定核酸諸如靶核酸或例如按照本發明的實施方案產生的加標籤的核酸的拷貝的體外方法。擴增核酸的許多方法是本領域已知的,並且擴增反應包括聚合酶鏈反應、連接酶鏈反應、鏈置換擴增反應、滾環擴增反應、轉錄介導的擴增方法諸如NASBA(例如,美國專利第5,409,818號)、環介導的擴增方法(例如,使用成環序列的「LAMP」擴增,例如,在美國專利第6,410,278號中所述)。擴增的核酸可以是包含DNA或RNA或DNA和RNA的混合物、 由DNA或RNA或DNA和RNA的混合物構成的、或者衍生自DNA或RNA或DNA和RNA的混合物的DNA,包括修飾的DNA和/或RNA。從核酸分子的擴增產生的產物(即「擴增產物」)可以是DNA或RNA,DNA和RNA核苷或核苷酸的混合物,而不論起始核酸是DNA、RNA或是DNA 和RNA 二者,或者這些產物可以包括修飾的DNA或RNA核苷或核苷酸。「拷貝」不必表示對靶序列的完美序列互補性或同一性。例如,拷貝可包括核苷酸類似物諸如脫氧肌苷或脫氧尿苷,有意的序列變更(諸如通過包含可與靶序列雜交但不互補的序列的引物,和/或擴增過程中出現的序列錯誤引入的序列變更。本文的「親和性結合物質」或「親和性結合分子」或「親和性分子」表示對於彼此具有親和力並且在稱為「結合條件」的某些條件下彼此「結合」形成「特異性結合對」的分子。例如,生物素和抗生蛋白鏈菌素,生物素和抗生物素蛋白,或者洋地黃毒苷和結合洋地黃毒苷的特異性抗體是「特異性結合對」的實例,其中每個特異性結合對的成員包括「親和性結合分子」或「親和性結合物質」或「親和性分子」。可使用本領域已知的方法將親和性結合分子(例如,生物素和/或抗生蛋白鏈菌素)與其他分子(例如,與RNA或DNA)或與固體表面共價地接合或軛合,或非共價地結合(例如,使用D. Mvage等人,Pierce Chemical Company, 1992 的 Avidin-Biotin Chemistry :A Handbook (抗生物素蛋白-生物素化學手冊)禾口在R. P. Hoagland,Molecular Probes, Inc.的Handbook of Fluorescent Probes and Research Products (螢光探針和研究產物手冊),第九版,以及在Academic Press, Inc., San Diego, CA, 1996 出版的 Greg Τ. Hermanson 的 BI0C0NJUGATE ^Techniques (生物軛合技術)中所述的試劑和方法)。與DNA和RNA軛合的親和性分子也可以使用寡核苷酸合成儀使用本領域中已知的試劑和方法來合成。根據本發明的術語「結合」表示由於非共價鍵造成的親和性分子和親和性結合物質之間的相互作用,所述非共價鍵諸如但不限於氫鍵、疏水相互作用、範德華鍵和離子鍵。 不希望受理論限制,在本領域中相信這些種類的非共價鍵導致結合,部分上是由於特異性結合對中包含的分子的互補形狀或結構。基於「結合」的定義和種類繁多的親和性結合分子或特異性結合對,很顯然結合條件對於不同的特異性結合對是不同的。本領域技術人員可容易地發現或確定樣品中在親和性結合分子之間發生結合所憑藉的條件。具體而言,本領域技術人員可容易地確定可使本領域中被認為是「特異性結合」的親和性結合分子之間的結合發生所憑藉的條件。如本領域中所了解的,這種特異性通常是由於在親和性結合分子之間的親和性比對樣品中的其他物質和組分(例如,容器壁、固體支持體)的親和性高。 在某些情況下,特異性還可能包括或可能由於,親和性結合分子的締合比與樣品中的其他物質或組分的締合顯著更快。
術語「使退火」或「使雜交」以及「退火」或「雜交」是指具有經由沃森-克裡克鹼基配對形成複合物的充分互補性的核苷酸序列之間形成複合物。就本發明來說,彼此之間 「對其互補」或「與之互補」或與其「雜交」或「退火」的核酸序列應該能形成或形成服務於預定目的的足夠穩定的「雜交體」或「複合物」。不要求由一個核酸分子顯示的序列內的每個核酸鹼基能夠與由第二核酸分子顯示的序列內的每個核酸鹼基進行鹼基配對或配對或複合,以便這兩個核酸分子或其中顯示的相應序列與彼此「互補」或「退火」或「雜交」。如本文所述,在提及按鹼基配對法則聯繫的核苷酸的序列時使用術語「互補的」或「互補性」。 例如,序列5' -A-G-T-3'與序列3' -T-C-A-5'互補。互補性可以是「部分的」,其中核酸鹼基中只有一些根據鹼基配對法則匹配。或者,在核酸之間可具有「完全的」或「全部的」互補性。核酸鏈之間的互補性的程度對核酸鏈之間的雜交的效率和強度具有顯著影響。這在擴增反應以及依賴於核酸的雜交的檢測方法中是特別重要的。術語「同源性」是指一條核酸序列與另一條核酸序列的互補性程度。可具有部分同源性或完全同源性(即,互補性)。 部分互補的序列是至少部分地抑制完全互補的序列與靶核酸的雜交的序列並且使用功能術語「基本上同源的」稱呼。完全互補的序列與靶序列的雜交的抑制可使用雜交測定(DNA 印跡或RNA印跡,溶液雜交等)在低嚴格度條件下來檢查。基本上同源的序列或探針將競爭或抑制完全同源的序列與靶在低嚴格度條件下的結合(即雜交)。這並不是說低嚴格度條件是允許非特異性結合的條件;低嚴格度條件要求兩條序列與彼此的結合是特異性(即選擇性)相互作用。非特異性結合的不存在可以通過使用缺乏互補性或只具有低互補性程度(例如,小於約30%的互補性)的第二靶來測試。在特異性結合很低或不存在的情況下, 探針將不與核酸靶雜交。當用於提及雙鏈核酸序列諸如cDNA或基因組克隆時,術語「基本上同源的」是指可在本文所述的低嚴格度條件下與雙鏈核酸序列的一條鏈或兩條鏈雜交的任何寡核苷酸或探針。如本文所用,在提及互補的核酸鏈的配對時使用術語「退火」或「雜交」。雜交和雜交強度(即,核酸鏈之間的締合強度)受本領域中公知的許多因素影響,包括核酸之間的互補性程度,包括受諸如鹽濃度影響的條件的嚴格度,形成的雜交體的Tm(解鏈溫度),其他組分的存在(例如,存在或不存在聚乙二醇或甜菜鹼),雜交鏈的摩爾濃度以及核酸鏈的G:C含量。一般來說,「cDNA」或「cDNA分子」是指使用感興趣的RNA分子的至少一部分作為模板通過RNA依賴性DNA聚合酶或反轉錄酶催化的與該感興趣的RNA分子退火的引物的延伸而合成的「互補的DNA」(該過程也稱為「反轉錄」)。所合成的cDNA分子與該模板的至少一部分「同源」或「鹼基配對」或「形成複合物」。如本文所用,「DNA片段的群體」是指例如來自靶DNA的DNA片段的大多數或集合。 在一些實施方案中,DNA片段群體包括DNA片段文庫,所述DNA片段文庫包含性質上和/或數量上代表靶DNA序列的序列,而在一些實施方案中,DNA片段的群體含DNA文庫的子集, 例如,該群體可不代表靶DNA的序列。如本文所用,「DNA片段文庫」或「DNA片段的文庫」表示從靶DNA產生的加標籤的 DNA片段(例如,加雙標籤的DNA片段或加標籤的環狀ssDNA片段)的集合或群體,其中在該集合或群體中加標籤的DNA片段的組合顯示在性質上和/或數量上代表從中產生加標籤的DNA片段的靶DNA的序列的序列,並且其中沒有通過有意使用基於該靶DNA的核苷酸或序列組成包括或排除加標籤的DNA片段的方法來選擇接受或選擇反對處於該集合或群體中加標籤的DNA片段出於各種原因,有可能DNA片段文庫可不包含代表由靶DNA顯示的每條序列的加標籤的DNA片段。例如,在一些實施方案中,加標籤的DNA片段文庫可不包含顯示包括線性 dsDNA的靶DNA的末端序列的加標籤的DNA片段(例如,由於兩個轉座子末端組合物低頻率插入靶DNA的末端部分)。一般地說,對於預定的目的或應用來說,可接受顯示靶DNA的某些部分或區域的序列的加標籤的DNA片段的低頻率或缺乏。然而,對於認為產生如下DNA 片段文庫對於特定目的或應用來說是重要的或令人期望的那些情形中,本發明還包括另外的方法實施方案在所述DNA片段文庫中,加標籤的DNA片段以較高的可能性顯示由產生這些片段的靶DNA所顯示的每條序列(例如,參見名為(「用於產生在靶DNA末端具有改進的序列代表性的DNA片段文庫的方法」)的說明書章節)。更進一步,在一些情況下,如果更多的靶DNA分子存在於所述方法的轉座反應步驟中,則DNA片段文庫將包含顯示靶DNA的每條序列的加標籤的DNA片段的可能性將會提高,從而使用所述方法產生更多的5'加標籤的DNA片段分子。因此,用於提高DNA片段文庫包含顯示靶DNA所顯示的每條序列的加標籤的DNA片段的可能性的另一種方法是擴增靶DNA,然後使用該擴增的靶DNA代替靶DNA以用於產生DNA片段文庫。又在其中靶DNA包括使用反轉錄反應從RNA製備的dsDNA的其他的實施方案中,在使用反轉錄步驟將RNA轉化成dsDNA之前,通過擴增RNA來擴增靶DNA的量。本文公開了可用於提供擴增的靶DNA的一些用於擴增RNA和DNA分子的方法。然而, 本發明不受用於擴增靶DNA的方法限制。在一些實施方案中,使用本文公開的方法之一擴增靶DNA,而在一些其他的實施方案中,使用本領域已知的另一種方法。如本文所用,術語「核酸修飾酶」是指作用於DNA來實現修飾的任何酶,所述修飾例如切割、連接、聚合、磷酸化等等。核酸修飾酶包括,例如聚合酶、核酸酶、轉移酶、連接酶、磷酸化酶、磷酸酶、甲基化酶、轉座酶等等。「DNA修飾酶」包括作用於DNA的任何酶,包括也作用於其他底物諸如RNA的酶。如本文所用,「DNA聚合酶」是指催化脫氧核糖核苷酸聚合成DNA鏈的酶。DNA聚合酶包括需要模板核酸來確定聚合物中添加脫氧核糖核酸的次序的「依賴模板的DNA聚合酶」,或者它們可以是「不依賴模板的」,以致它們催化聚合作用而不參考模板序列。「依賴DNA的DNA聚合酶」是通過延伸與DNA模板退火的引物來合成互補的 DNA ( 「cDNA」 )拷貝的酶。一些依賴DNA的DNA聚合酶還可以從RNA模板合成互補的DNA 拷貝,這一過程也稱為「反轉錄」。可反轉錄的DNA聚合酶也可以稱為「反轉錄酶」。除了合成DNA聚合物外,DNA聚合酶可包括其他特徵或活性。例如,可將DNA聚合酶表徵為具有或缺乏5'到3'外切核酸酶活性(也稱為5'外切核酸酶或5'核酸酶活性),3'到5'外切核酸酶活性,鏈置換活性,並且可以就它們可持續(processive)或可分布的程度對其進行表徵,如下面更詳細討論的。一些DNA聚合酶能夠將與模板鏈互補的鏈置換為由該聚合酶合成的新DNA鏈。這一過程稱為「鏈置換」並且具有這種活性的DNA聚合酶在本文稱為「鏈置換DNA聚合酶」。 用於鏈置換DNA合成的模板可以是線性或環狀的單鏈DNA(ssDNA)或雙鏈DNA(dsDNA)。如果DNA模板是單鏈環,那麼引發的DNA合成繞該環一圈又一圈進行,鏈的連續置換早於複製鏈,這一過程稱為「滾環複製」。滾環複製導致環狀模板的串聯拷貝的合成。一般來說, 優選的是,用於本發明的方法的DNA模板特異性DNA聚合酶有效率地合成具有適合長度的DNA用於預定目的而不從模板上「脫落」(或終止DNA的合成),這稱為酶的持續合成能力 (processivity)。DNA聚合酶的鏈置換能力可使用該聚合酶在由Fire和Xu(Proc. Natl. Acad. Sci. USA 92 :4641-4645,1995)所述的滾換複製測定中容易地確定。鏈置換和DNA聚合酶持續持續合成能力還可以使用Kong等人(J. Biol. Chem. 268 1965-1975,1993)描述的方法來測定。末端轉移酶在本文也被定義為DNA聚合酶,所述DNA聚合酶用作本發明的試劑盒和方法的一些實施方案中的組合物。末端轉移酶在一些實施方案中是優選的,因為它催化不依賴模板地添加dNTP到DNA的3'羥基末端。一些實施方案包括的方法使用具有釋放以可檢測的部分(例如,包含可見的、螢光的、化學發光的或其他可檢測的分子的部分)標記的核苷酸的5'到3'外切核酸酶活性的DNA聚合酶組合物作為測定DNA聚合併從而檢測和/或定量在樣品中充當模板的核酸分子的存在的手段(例如,用與Applied Biosystems, Inc.的TaqMan 測定類似的方式)。 在一些實施方案中,本發明包含缺乏5'到3'外切核酸酶活性的DNA聚合酶組合物。一些實施方案包括的方法使用缺乏5'到3'外切核酸酶活性的DNA聚合酶組合物。例如,在一些實施方案中,缺乏5'到3'外切核酸酶活性的DNA聚合酶組合物用於DNA 測序。例如,在一些其它實施方案中,缺乏5'到3'外切核酸酶活性的DNA聚合酶組合物用於全基因組擴增。在一些實施方案中,本發明包含具有5'到3'外切核酸酶活性的DNA聚合酶組合物。在一些優選的實施方案中(例如,其中除了依賴模板的連接酶之外,在本文所述方法的一種方法中使用DNA聚合酶用於接合),該方法使用缺乏5'核酸酶活性(包括5'到3' 外切核酸酶和依賴5'結構的核酸酶活性二者)的DNA聚合酶組合物。例如,在一些其他的實施方案中,缺乏5'到3'外切核酸酶活性的DNA聚合酶組合物用於填充缺口。因此,在方法或試劑盒的一些實施方案中中,本發明包括缺乏5'核酸酶活性的DNA聚合酶組合物。 然而,具有釋放以可檢測的部分(例如,包含可見的、螢光的、化學發光的或其他可檢測的分子的部分)標記的核苷酸或寡核苷酸的5'核酸酶活性的作為測定DNA聚合併從而檢測和/或定量在樣品中充當模板的核酸分子的存在的手段(例如,用與Applied Biosystems, Inc.的TaqMan 測定類似的方式)的DNA聚合酶組合物可用於定量使用本發明的方法產生的DNA分子。可使用的鏈置換DNA聚合酶的實例包括但不限於R印liPHI phi29 DNA聚合酶、 DisplaceAce DNA 聚合酶、rGka DNA 聚合酶、kquiTherm DNA 聚合酶、iTaq DNA 聚合酶、 Tfl DNA 聚合酶、和 MMLV 反轉錄酶(全部可從 EPICENTRE Biotechnologies, Madison, WI, USA獲得)。在一些實施方案中,缺乏3'到5'外切核酸酶校正活性的DNA聚合酶與具有這種活性的DNA聚合酶諸如FAILSAFE DNA聚合酶的摻合物用作鏈置換DNA聚合酶。酶摻合物在一些實施方案中是有用的,因為它在DNA合成過程中顯示改善的保真度(S卩,它合成具有較少的不與模板互補的核苷酸的DNA)。許多DNA聚合酶在特定條件下的保真度和/或錯誤率是已知的,測量保真度的方法(例如,通過測序)也是已知的。一般來說,在本發明的鏈置換擴增方法中期望該方法中使用的鏈置換DNA聚合酶的量儘可能高但不抑制或不利地影響反應。例如,REPLIPHI phi29 DNA聚合酶 (EPICENTRE)在20微升反應中能夠以大約一微克蛋白使用,並且DISPLACE DNA聚合酶 (EPICENTRE)在50微升反應中能夠以大約50單位到大約300單位使用。因為單位的定義對於不同的DNA聚合酶以及甚至對於不同賣家或來源的相似DNA聚合酶來說都是不同的, 並且還因為每種酶的活性在不同的溫度以及在不同的反應條件下是不同的,所以期望針對使用的每種DNA模板和引物優化鏈置換DNA聚合酶的量以及反應條件。鏈置換可通過使用鏈置換因子諸如解旋酶變得容易,但是因為各種DNA聚合酶可用於本發明,所以通常不需要這種鏈置換因子。認為可在存在鏈置換因子的情況下進行滾環複製的任何DNA聚合酶適合用在包括鏈置換的本發明的實施方案中,即使該DNA聚合酶在不存在這種因子的情況下不進行滾環複製。允許滾環複製的鏈置換因子包括但不限於 BMRFl 聚合酶輔助亞基(Tsurumi 等人,J. Virology, 67 :7648-7653,1993),腺病毒 DNA 結合蛋白(Zijderveld 和 van der Vliet, J. Virology,68 :1158_1164,1994),單純皰疹病毒蛋白 ICP8 (Boehmer 和 Lehman, J. Virology, 67 :711-715,1993) ;Skaliter 和 Lehman, Proc. Natl. Acad. Sci. USA, 91 :10,665-10,669,1994),單鏈 DNA 結合蛋白(SSB ;Rigler 和 Romano, J. Biol. Chem.,270 :8910-8919,1995),以及小牛胸腺解旋酶(Siegel 等人,J. Biol Chem.,267 :13,629-13,635,1992),全部這些文獻均通過引用併入本文。如本文所用的「單核苷」或「核苷」是指由共價連接至戊糖的嘌呤(鳥嘌呤(G)或腺嘌呤(A))或嘧啶(胸腺嘧啶(T)、尿嘧啶(U)或胞苷(C))鹼基構成的化合物,而「核苷酸」是指在戊糖的一個羥基基團處磷酸化的核苷。術語「規範的」用來指DNA中常見的四種常見的核酸鹼基腺嘌呤、胞嘧啶、鳥嘌呤和胸腺嘧啶,或指對應的包含規範的鹼基的脫氧核糖核苷、脫氧核糖核苷酸或2'-脫氧核糖核苷-5'-三磷酸。術語「非規範的」用來指DNA 中除了四種規範的鹼基之外的核酸鹼基或指對應的包含非規範鹼基的脫氧核糖核苷、脫氧核糖核苷酸或2'-脫氧核糖核苷-5'-三磷酸。例如,儘管尿嘧啶是RNA中的常見核酸鹼基,但尿嘧啶是DNA中的非規範鹼基。「非規範鹼基」見於由於非規範核苷酸的摻入(例如,通過使用寡核苷酸合成儀合成或通過使用DNA聚合酶合成)或由於現有鹼基(規範的或非規範的)的修飾產生的核酸。「核酸」或「多核苷酸」表示包含一系列也稱為「核苷」的「單核苷」的聚合物分子, 其中一個核苷的戊糖的3'位置通過核苷間連接諸如但不限於磷酸二酯鍵與下一個核苷的戊糖的5'位置相連接。與磷酸基團相連接的核苷稱為「核苷酸」。與該系列中的下一個核苷酸的5'位置連接的核苷酸稱為「5'的」或「5'核苷酸」,而與該5'核苷酸的3'位置連接的核苷酸稱為「3'的」或「3'核苷酸」。如本文所用,術語「5'-的」和「3'-的」是指在核酸單鏈內特定的化學基團、核苷酸、核苷酸的序列或遺傳元件(例如,RNA聚合酶啟動子序列)相對於另一個化學基團、核苷酸、核苷酸的序列或遺傳元件的位置或方向。如果在一條鏈上第一核酸序列是第二序列3'-的,那麼在互補鏈上該第一序列的互補序列將是第二序列的互補序列5'-的。本發明的描述將理解為根據特定的核酸鏈內序列或遺傳元件的相對5'或3'位置和方向。稱線性核酸分子具有「5'-末端」(5'端)和「3'-末端」(3'端),因為核酸的磷酸二酯鍵在取代的單核苷酸的糖部分的5'碳和3'碳處出現。新連接將與5'碳連接處的多核苷酸的末端是其5'末端核苷酸。新連接將與3'碳連接處的多核苷酸的末端是其 3'末端核苷酸。如本文所用的末端核苷酸是在3'末端或5'末端的端位置的核苷酸。核酸的戊糖可以是核糖,在這種情況下,核酸或多核苷酸被稱為「RNA」,或者核酸的戊糖可以是2'-脫氧核糖,在這種情況下,核酸或多核苷酸被稱為「DNA」。可選地,特別是如果核酸以化學方式合成,那麼核酸可由DNA單核苷酸和RNA單核苷酸組成。在RNA和 DNA中,每種戊糖被共價地連接至四種常見的或「規範的」核酸鹼基(每種也稱為「鹼基」) 之一。與糖連接的主要的天然存在的鹼基中的三種(腺嘌呤、胞苷和鳥嘌呤)對於DNA和 RNA是共同的,而一種鹼基是不同的;DNA具有額外的鹼基胸腺嘧啶,而RNA具有額外的鹼基尿苷。在一些情況下,尿苷可作為DNA中的鹼基存在。本領域技術人員通常將小的多核苷酸看作「寡核苷酸」。將如本文所用的術語「寡核苷酸」定義為包含兩個或更多個脫氧核糖核苷酸或核糖核苷酸、優選大約6到100個核苷酸的分子,但是對寡核苷酸的長度沒有確定的限制。確切大小取決於許多因素,而這些因素又取決於寡核苷酸的最終功能或用途。同樣,出於多種原因,本發明的核酸或多核苷酸可包括一種或多種修飾的核酸鹼基、糖部分或核苷間連接。通過舉例,使用包含修飾的鹼基、糖部分或核苷間連接的核酸或多核苷酸的一些原因包括但不限 於(I)Tm的改變;(2)改變多核苷酸對一種或多種核酸酶的易感性;(3)提供用於連接標記的部分;(4)提供標記或標記猝滅劑;或(5)提供用於連接溶液中或結合於表面的另一種分子的部分,諸如生物素。例如,在一些實施方案中,可將寡核苷酸諸如引物合成為使得隨機部分包含一種或多種構象受限制的核酸類似物,諸如但不限於其中的核糖環被連接2' -0原子與4' -C原子的亞甲基橋「鎖定」的一種或多種核糖核酸類似物(例如,可從Exiqon,Inc.的「LNA 」商標下獲得);這些修飾的核苷酸導致每個核苷酸單體的Tm或解鏈溫度提高大約2攝氏度到大約8攝氏度。如果Tm提高,有可能降低末端加標籤的寡核糖核苷酸的隨機3'部分中的隨機核苷酸數目。然而,必須確認修飾的核苷酸諸如LNA在為其預定目的的方法中發揮功能以及滿足該方法的其他標準。例如, 在其中使用包含核糖核苷酸的寡核苷酸引物的一些實施方案中,在該方法中使用修飾的核苷酸的一個指標可以是包含該修飾的核苷酸的寡核苷酸可以被單鏈特異性RNA酶消化。為了完成本發明的目標,通過舉例,在多核苷酸或寡核苷酸中的一個或多個位置的單核苷酸中的核酸鹼基可包括鳥嘌呤、腺嘌呤、尿嘧啶、胸腺嘧啶或胞苷,或者可選地,所述核酸鹼基中的一種或多種可包含修飾的鹼基,諸如但不限於黃嘌呤、烯丙氨基 (allyamino)-尿嘧啶、烯丙氨基-胸腺嘧啶核苷、次黃嘌呤、2-氨基腺嘌呤、5-丙炔基尿嘧啶、5-丙炔基胞嘧啶、4-硫尿嘧啶、6-硫鳥嘌呤、氮尿嘧啶和脫氮尿嘧啶、胸腺嘧啶核苷、胞嘧啶、腺嘌呤或鳥嘌呤。更進一步,它們可包含用如下部分衍生的核酸鹼基生物素部分、洋地黃毒苷部分、螢光部分或化學發光部分、猝滅部分或某種其他部分。本發明不限於列出的核酸鹼基;給出這份名單示出可用於方法中的特定目的的範圍廣泛的鹼基的實例。就本發明的核酸或多核苷酸來說,糖部分中的一個或多個可包括2'-脫氧核糖, 或者可選地,糖部分中的一個或多個可包括某種其他糖部分,諸如但不限於提供對一些核酸酶的抵抗力的核糖或2'-氟代-2'-脫氧核糖或2' -0-甲基-核糖,或可通過與可見的、螢光的、紅外螢光的或其他可檢測的染料或具有親電子的、光反應性的、炔基或其他反應性化學部分的化學物質進行反應而標記的2'-氨基2'-脫氧核糖或2'-疊氮基-2'-脫氧核糖。本發明的核酸或多核苷酸的核苷間連接可以是磷酸二酯鍵連接,或者可選地,核苷間連接中的一種或多種可包括修飾的連接,諸如但不限於硫代磷酸酯、二硫代磷酸酯、 硒代磷酸酯(phosphoroselenate)、或二硒代磷酸酯(phosphorodiselenate)連接,它們對一些核酸酶具有抵抗力。
當提及顯示「隨機序列」的寡核苷酸或寡核苷酸的部分時,我們表示,對於該隨機序列部分內的每個核苷酸位置而言,使用等量的所有四種規範的核苷酸鹼基(A、G、C以及 T或U)合成該寡核苷酸或其部分。這種方法導致包含(4到η次方)+1種不同寡核苷酸的寡核苷酸混合物的合成,其中「η」等於隨機序列部分內的核苷酸位置的數目。因此,在這些實施方案中,寡核苷酸包括代表隨機序列部分的所有可能序列的許多不同寡核苷酸的混合物。當提及顯示「半隨機序列」的寡核苷酸或寡核苷酸的部分時,我們表示合成半隨機寡核苷酸或部分(例如,使用寡核苷酸合成儀),其中使用等量的所有四種規範的核苷酸鹼基 (A、G、C以及T或U)合成一些核苷酸位置(即那些位置如以上所述是「隨機的」),但是只使用規範的鹼基核苷酸(即A、C、G以及T或U)中的一種、兩種或三種而不是所有四種來合成半隨機部分內的一個或多個其他位置。在一些實施方案中,寡核苷酸包括具有「簡併鹼基」 的一個或多個核苷酸,用「簡併鹼基」我們表示能夠與除根據A與T或U配對和G與C配對的標準鹼基配對法則之外的一種或多種核酸鹼基進行鹼基配對的核酸鹼基,並且「簡併核苷酸」是包含簡併鹼基的核苷酸。本文可互換使用的多核苷酸或寡核苷酸(包括引物)的 「部分」或「區域」是2個鹼基或更多個鹼基的連續序列。在其他實施方案中,區域或部分為至少約1個、2個、3個、5個、10個、15個、20個、25個、50個、75個或甚至更多連續的核苷酸中的任何一種。「引物」是可以被核酸聚合酶延伸的一般具有游離的3' -OH基團的寡核苷酸 (「oligo」)。對於依賴模板的聚合酶而言,一般至少引物寡核苷酸的3'部分與模板核酸的部分互補,該寡核苷酸通過氫鍵合和其他分子力與模板「結合」(或「複合」、「退火」或「雜交」)以給出引物/模板複合物用於啟動DNA聚合酶進行的合成,並且通過添加與DNA合成過程中的模板互補的在3'端連接的共價鍵合的鹼基延伸引物(即,「引物延伸的」)。結果是引物延伸產物。依賴模板的DNA聚合酶(包括反轉錄酶)一般需要寡核苷酸引物與單鏈模板的複合以啟動DNA合成(「引發」),但對於與DNA模板互補的RNA的合成(轉錄),RNA 聚合酶一般不需要引物。
「單鏈特異性DNA酶」表示特異性消化單鏈DNA但不消化單鏈RNA或與互補的RNA 或DNA退火或複合的RNA或DNA的DNA酶,不論所述互補的RNA或DNA是另外的核酸分子的一部分(例如,通過分子間鹼基配對)還是相同核酸分子的一部分(例如,通過分子內鹼基配對)。單鏈特異性DNA酶可以是內切核酸酶或外切核酸酶,只要它具有將單鏈DNA特異性消化為單體或短的寡脫氧核糖核苷酸的活性。在一些優選的實施方案中,將包括引物在內的寡脫氧核糖核苷酸在利用它們的方法的步驟之後通過用單鏈特異性DNA酶消化而從反應混合物中移除。外切核酸酶I、外切核酸酶VII和Rec J外切核酸酶是示例性單鏈特異性DNA酶。 本文的「T7型RNA聚合酶」(RNAP)表示T7 RNA聚合酶(例如,參見由Goeddel, DV, Academic Press,1990 編輯的 Methods in Enzymology (酶學方法),第 185 卷中的 Studier, FW等人,第60-89頁)或從「T7型」噬菌體獲得的RNAP,T7型噬菌體表示具有與噬菌體T7的遺傳結構相似的遺傳結構的噬菌體。已發現所有檢驗的T7型噬菌體的遺傳結構基本上與T7的遺傳結構相同。根據本發明的T7型噬菌體的實例包括但不限於大腸桿菌噬菌體 T3、phi I、phi II、W31、H、Y、Al、122、cro、C21、C22 和 C23 ;惡臭假單胞菌 (Pseudomonas putida)gh-1 ; ^^^Π Κ · (Salmonella typhimurium)SP6;粘質沙雷氏菌(Serratia marcescens)噬菌體IV ;檸檬酸桿菌屬(Citrobacter)噬菌體 ViIII ;以及 Klebsiella 噬菌體 11 號(Hausmann, Current Topics in Microbiology and Immunology75 :77_109,1976 ;Korsten 等人,J. Gen.Virol. 43:57_73,1975 ;Dunn,等人,Nature New Biology 230 :94_96,1971 ;Towle,等人,J. Biol. Chem. 250 :1723_1733, 1975 ;Butler 和 Chamberlin,J. Biol. Chem. 257 :5772_5778,1982),以及這種 RNAP 的突變體形式(例如,Sousa等人,美國專利第5, 849, 546號;Padilla, R和Sousa, R, Nucleic Acids Res. ,15 :el38,2002 ;Sousa, R ^P Mukher jee, S,Prog Nucleic Acid Res Mol Biol, 73 1-41,2003 ;Guillerez,J,等人,美國專利申請第20040091854號)。在本發明優選的實施方案中,所用的啟動子是被T7型RNA聚合酶識別的野生型或突變的啟動子序列。在一些實施方案中,啟動子可以是單鏈的,諸如假啟動子(例如,Ohmichi等人,Proc. Natl. Acad. Sci.USA 99 :54-59,2002)或N4 vRNAP啟動子,在這種情況下,利用包含N4 vRNAP (稱為 「小 vRNAP」,EPICENTRE Biotechnologies, Madison, WI, USA)的轉錄活性的 1,106_ 胺基酸結構域(對應於胺基酸998-2103)的截短的蛋白(Kazmierczak, K. Μ.,等人,EMBO J. ,21 5815-5823,2002)。如本文所用,「靶DNA」是指經歷轉座以例如產生加標籤的DNA片段(例如,5'或 3'加標籤的或加雙標籤的線性ssDNA或dsDNA片段或加標籤的環狀ssDNA片段)的文庫的任何感興趣的dsDNA。 「靶DNA」可以從任何體內或體外來源獲得,包括來自不論活的還是死的一種或多種細胞、組織、器官或生物,或來自任何生物來源或環境來源(例如,水、空氣、土壤)。例如, 在一些實施方案中,靶DNA包括真核dsDNA和/或原核dsDNA或由其構成,所述真核dsDNA 和/或原核dsDNA產生於或源自於人、動物、植物、真菌(例如,黴菌或酵母)、細菌、病毒、 類病毒、支原體或其他微生物。在一些實施方案中,靶DNA包括如下物質或由其構成基因組DNA,亞基因組DNA,染色體DNA (例如,來自分離的染色體或染色體的部分,如來自染色體的一個或多個基因或基因座),線粒體DNA,葉綠體DNA,質粒或其他附加體來源的DNA(或其中包含的重組DNA),或通過RNA的反轉錄製備的雙鏈cDNA,所述RNA的反轉錄使用依賴 RNA的DNA聚合酶或反轉錄酶產生第一鏈cDNA,然後延伸與該第一鏈cDNA退火的引物產生 dsDNA。在一些實施方案中,靶DNA包括核酸分子中或由核酸分子製備的多個dsDNA分子 (例如,在基因組DNA中由其製備的多個dsDNA分子或由RNA製備的cDNA),所述核酸分子處於或來自生物來源(例如,細胞、組織、器官、生物)或環境來源(例如,水、空氣、土壤、唾液、痰、尿、糞便)。在一些實施方案中,靶DNA來自體外來源。例如,在一些實施方案中,靶 DNA包括在體外從單鏈DNA (ssDNA)或從單鏈或雙鏈RNA中製備的dsDNA (例如,使用本領域公知的方法,諸如使用適合的依賴DNA和/或依賴RNA的DNA聚合酶(反轉錄酶)的引物延伸)或由其構成。在一些實施方案中,靶DNA包括使用任何本領域已知的方法從一種或多種雙鏈或單鏈的DNA或RNA分子的全部或部分製備的dsDNA或由其構成,所述本領域已知的方法包括如下方法DNA或RNA擴增(例如,PCR或反轉錄-PCR (RT-PCR)),轉錄介導的擴增方法,擴增一種或多種核酸分子的全部或部分);在質粒、F黏粒、BAC或其他載體中的一種或多種核酸分子的全部或部分的分子克隆,所述質粒、F黏粒、BAC或其他載體隨後在適合的宿主細胞中複製;或通過雜交捕獲一種或多種核酸分子,諸如通過與陣列或微陣列上的DNA探針雜交(例如,通過「序列捕獲」;例如,使用來自ROCHE NIMBLEGEN,AGILENT或FEBIT的試劑盒和/或陣列)。 在一些實施方案中,「靶DNA」表示在用於產生加標籤的DNA片段(例如,5'和3' 加標籤的或加雙標籤的線性ssDNA或dsDNA片段或加標籤的環狀ssDNA片段)的文庫之前製備或修飾的dsDNA。例如,本發明的發明人觀察到來自包括具有小於IOKb大小的dsDNA 分子的靶DNA的末端的下一代序列數據的代表性比來自該靶DNA的中間的序列數據的代表性低。不希望受理論束縛,對於這種觀察結果的一種可能的解釋是找到具有以相反方向插入線性dsDNA分子的末端的兩種轉座子末端組合物的DNA片段的可能性比找到具有以相反方向插入該線性dsDNA分子的中間的兩種轉座子末端組合物的DNA片段的可能性低。因此, 在一些實施方案中,為了產生更好地代表末端序列的加雙標籤的DNA片段或加標籤的環狀 DNA片段的文庫,所述方法還包括提供在該方法中使用的包括以下dsDNA的靶DNA (例如, 雙鏈基因組DNA或從RNA諸如mRNA製備的cDNA),所述dsDNA在5 『端和/或3 『端已具有標籤。例如,在一些實施方案中,靶DNA包括通過如下方式從RNA製備的雙鏈cDNA 通過延伸具有3'部分和5'部分的第一鏈cDNA合成引物合成第一鏈cDNA,其中該3'部分與 RNA的3'末端部分互補並且該5'部分包括第一標籤,然後使用本文別處描述的末端加標籤的寡核苷酸和DNA聚合酶將第二標籤與該第一鏈cDNA的3'末端接合,然後使用DNA聚合酶通過延伸與該第二標籤退火的第二鏈cDNA合成引物來合成雙鏈cDNA。可選地,在一些其他優選的實施方案中,為了產生更好地代表末端序列的加雙標籤的DNA片段的文庫,在用於產生加雙標籤的DNA片段或加標籤的環狀DNA片段的方法中使用的靶DNA包括通過線性dsDNA的分子內連接製備的環狀dsDNA (例如,其通過雙鏈基因組DNA或從RNA諸如mRNA 製備的雙鏈cDNA的分子內連接製備)。因此,在一些實施方案中,所述方法還包括使用連接酶(例如,T4DNA連接酶)連接線性dsDNA以產生用作該方法中的靶DNA的環狀dsDNA。 在包括通過連接線性dsDNA產生用作靶DNA的環狀dsDNA的方法的一些實施方案中,在連接步驟之前用T4DNA聚合酶和T4多核苷酸激酶(例如,使用END-It DNA末端修複試劑盒 (EPICENTRE Biotechnologies,Madison,WI,USA))處理線性 dsDNA 以便使末端變平並且使 5'端磷酸化。如本文所用,「DNA片段」表示從較長DNA分子上切割或釋放或斷裂以致不再與母體分子相連的靶DNA的部分或碎片或區段。DNA片段可以是雙鏈的(「dsDNA片段」)或單鏈的(「ssDNA片段」),並且從靶DNA產生DNA片段的過程稱為「斷裂」靴DNA。在一些優選的實施方案中,所述方法用於產生包含加標籤的DNA片段的集合或群體的「DNA片段文庫」。「模板」是被核酸聚合酶諸如DNA聚合酶拷貝的核酸分子。不論該核酸分子包含兩條鏈(即,為「雙鏈的」)還是只包含一條鏈(即,為「單鏈的」),用作指定由合成的核酸所顯示的核苷酸序列的所述核酸分子的鏈是「模板」或「模板鏈」。由該核酸聚合酶合成的核酸與該模板互補。RNA和DNA總是以5'到3'方向合成,開始於模板鏈的3'端,並且核酸雙鏈體的兩條鏈總是對齊使得這兩條鏈的5'端處於該雙鏈體的相對端(並且,必然地, 3'端也是如此)。RNA和DNA模板需要引物來啟動DNA聚合酶的合成,但是啟動依賴DNA 的RNA聚合酶的合成不需要引物,所述依賴DNA的RNA聚合酶通常被簡稱為「RNA聚合酶」。「末端轉移酶」也稱為「末端脫氧核糖核苷轉移酶」或「TdT」,是催化脫氧核糖核苷三磷酸(dNTP)或單個雙脫氧核糖核苷三磷酸不依賴模板地添加(或「加尾」)至DNA的 3'-羥基末端的DNA聚合酶。在本領域中使用的可商購獲得的常見末端轉移酶在表達來自小牛胸腺的重組基因的大腸桿菌菌株中產生。在一些實施方案中,本發明還包括將5' 加標籤的DNA片段在變性後與TdT和dNTP在一定條件下孵育並且持續足夠的時間,其中合成具有第二標籤的5'和3'加標籤的DNA片段,所述第二標籤包括同聚DNA尾。在一些實施方案中,同聚DNA尾還被用作合成雙鏈cDNA的引發位點。在一些實施方案中,用於合成 DNA的第二鏈的引物具有與包括同聚尾的第二標籤互補的3'部分,和顯示不與第一標籤、 靶DNA或包含同聚尾的第二標籤互補的任意期望序列的5'部分。例如,在一些實施方案中,引物的5'部分顯示RNA聚合酶啟動子的反義啟動子序列並且所述方法還包括將得到的雙鏈cDNA與RNA聚合酶在合成RNA的條件下孵育足夠時間。在一些實施方案中,在本發明的方法中使用的轉座子末端寡核苷酸只顯示轉座反應中所需的轉座子末端序列。然而,在一些實施方案中,轉座子末端寡核苷酸中的至少一種另外顯示轉座子末端序列5'-的一種或多種其他的核苷酸序列。因此,在一些實施方案中,所述方法或試劑盒使用具有3'部分和5'部分的轉移鏈,其中該3'部分顯示轉移的轉座子末端序列,而該5'部分顯示不參與形成與轉座酶的功能複合物的一種或多種另外的序列。對哪些另外的序列用於轉移鏈的5'部分中的一種或多種另外的序列沒有限制,這些序列可用來完成任何期望的目的。例如,在一些實施方案中,轉移鏈的5'部分顯示一種或多種另外的標籤序列(例如,允許通過與表面諸如珠子上的特異性序列或微晶片或陣列上的探針退火而捕獲的標籤序列;例如,用於在下一代測序的珠子上的捕獲;例如用於在使用Roche 454 Next-Gen測序儀測序的珠子上的捕獲的454A或454B標籤序列)或一種或多種用於本方法的產物的鑑定、檢測(例如,螢光檢測)或分選的序列。在一些其他實施方案中,轉移鏈的5'部分顯示一種或多種另外的核苷酸或序列或化學基團或化學部分,所述核苷酸或序列或化學基團或化學部分包括親和性結合(例如,允許通過與表面諸如珠子上的特異性序列或微晶片或陣列上的探針退火而捕獲的標籤序列)或由其構成。在一些優選的實施方案中,將轉移鏈的5'部分中的一種或多種另外的序列的大小最小化以便使該轉移鏈在體外轉座酶反應過程中插入到自身的可能性或頻率降到最低。例如,在一些實施方案中,轉移鏈的5'部分的大小小於大約150個核苷酸、小於大約100個核苷酸、小於大約 75個核苷酸、小於大約50個核苷酸、小於大約25個核苷酸或小於大約15個核苷酸。在一些實施方案中,轉移鏈的5'端具有5'-單磷酸基團。在一些實施方案中,轉移鏈和非轉移鏈都具有5'-單磷酸基團。在一些優選的實施方案中,只有非轉移鏈的5' 端具有5'-單磷酸基團。在一些其他的實施方案中,在轉移鏈的5'端上沒有5'-單磷酸基團。根據本發明的術語「轉座酶」旨在表示能夠與轉座反應中需要的轉座子末端或轉座子末端序列形成功能複合物的酶。本發明的轉座酶還包括來自反轉錄轉座子和反轉錄病毒的整合酶。「轉座反應」是其中一個或多個轉座子末端在隨機位點或幾乎隨機的位點插入靶DNA中的反應。在轉座反應中的必需組分是轉座酶和顯示轉座子末端的核苷酸序列的 DNA寡核苷酸,所述轉座子末端的核苷酸序列包括轉移的轉座子末端序列及其互補序列、 非轉移的轉座子末端序列以及形成功能性轉座複合物所需的其他組分。本發明的方法通過利用由高活性Tn5轉座酶和Τη5型轉座子末端(Goryshin,I.和Reznikoff,W. S., J.Biol. Chem.,273 =7367,1998)或由MuA轉座酶和包含Rl和R2末端序列的Mu轉座子末端(Mizuuchi, K.,Cell, 35 :785,1983 ;Savilahti, H,等人,EMBO J. , 14 :4893,1995)形成的轉座複合物來舉例說明。然而,在本發明中可使用任何能夠以隨機或幾乎隨機的方式並以足夠的效率為其預定目的將靶DNA 5'加標籤和斷裂而插入轉座子末端的轉座系統。 可用於本發明的方法評估的本領域已知的轉座系統的實例包括但不限於金黃色葡萄球菌(Staphylococcus aureus) Tn552 (Colegio OR 等人,J Bacterid.,183 :2384_8,2001 ; Kirby C 等人,Mol Microbiol, 43 173-86, 2002), Tyl(Devine SE, ^P Boeke JD.,Nucleic Acids Res. ,22 :3765_72,1994和國際專利申請第 WO 95/23875 號),轉座子Tn7 (Craig,NL, Science. 271 1512,1996 ;Craig, NL,綜述於Curr Top Microbiol Immunol, 204 27-48, 1996),TnlO 和 ISlO (Kleckner N,等人,Curr Top Microbiol Immunol,204 :49_82,1996), Mariner 轉座酶(Lampe DJ,等人,EMBO J.,15 :5470_9,1996),Tcl (Plasterk RH, Curr Top Microbiol Immunol, 204 125—43,1996),P 元件(Gloor, GB, Methods Mol Biol, 260 97-114,2004),Tn3(Ichikawa H,和 Ohtsubo Ε.,J Biol Chem. 265 18829-32,1990),細菌插入序列(Ohtsubo,F 和 Sekine,Y, Curr. Top. Microbiol. Immunol. 204 1-26,1996),反轉錄病毒(Brown P0,等人,Proc Natl Acad Sci USA,86 :2525_9,1989),和酵母的反轉錄轉座子(Boeke JD 和 Corces VG, Annu Rev Microbiol. 43 403-34,1989)。

用於將轉座子末端插入靶序列中的方法可使用任何適合的轉座子系統在體外進行,所述適合的轉座子系統是可利用的適合的體外轉座系統或者可基於本領域的知識開發。一般來說,本發明的方法中使用的適合的體外轉座系統在最低限度需要足夠純度、足夠濃度和足夠的體外轉座活性的轉座酶以及與該轉座酶形成功能性複合物的轉座子末端,所述功能性複合物具有能夠催化轉座反應的相應轉座酶。可用在本發明中的適合的轉座酶轉座子末端序列包括但不限於與轉座酶形成複合物的野生型、衍生的或突變的轉座子末端序列,所述轉座酶選自轉座酶的野生型形式、衍生形式或突變形式。已被申請人在本發明的方法中成功使用的示例性轉座酶包括Tn5轉座酶和MuA轉座酶的野生型形式或突變形式(儘管在本發明的方法中產生5'加標籤的DNA片段時ΕΖ-Τη5轉座酶比相等蛋白量的MuA轉座酶顯著更有效率),但已知或後來開發用於確定的轉座子末端的有效體外轉座的組合物和條件的任何其他轉座酶可用在本發明的方法中。由Τη5轉座酶或MuA轉座酶的野生型形式或突變形式識別的轉座子末端序列是優選的,並且當與轉座酶複合時產生最高轉座效率的那些轉座子末端序列連同與其複合的相應活性最佳的轉座酶一起對於本發明的實施方案而言是最優選的。優選地,選擇如下轉座子其中用於轉座的轉座酶所需的轉座酶末端序列不太大,並且轉座子末端序列具有可能的最小尺寸,該最小尺寸對於預定目的很好地發揮功能並且是使得同一序列只很少出現或優選根本不出現在靶DNA或樣品DNA中的足夠尺寸。通過舉例,Τη5來源的ΕΖ-Τη5 轉座子末端序列的轉座子末端序列只包含19個核苷酸, 而一些其他的轉座酶需要大得多的末端序列用於轉座(例如,MuA轉座酶需要約51個核苷酸的轉座子末端序列)。可用於將轉座子末端插入靶核酸中的適合的體外轉座系統包括但不限於使用可從EPICENTRE Technologies, Madison, WI獲得的EZ_Tn5 高活性Τη5轉座酶或來自 EPICENTRE 的 HyperMu 高活性 MuA 轉座酶或諸如可從 Finnzymes 0y, Espoo, Finland 獲得的另外的MuA轉座酶。顯示相應的轉座子末端的序列的轉座子末端寡核苷酸可利用寡核苷酸合成儀合成或者基於從相應賣家獲得的信息或利用本領域公知的信息從商業來源購買。例如,在實施例1中提供了 EZ-Tn5 轉座酶的高活性轉座子嵌合末端的核苷酸序列,並且有關EZ-Tn5 轉座酶的另外信息在公布的文獻中可用並且在來自EPICENTRE Biotechnologies, Madison, WI, USA 的 www. EpiBio. com 在線可用。在一些實施方案中,根據本發明將轉座子末端插入到靶DNA中也可以在體內進行。如果轉座在體內進行,那麼轉座到靶DNA中優選通過將轉座酶和適合的轉座子末端組合物的聯合複合物電穿孔進入宿主細胞中來實現,如在美國專利第6,159,736號(通過引用併入本文)中所述。這種轉座方法通過利用如下複合物舉例說明使用與(Goryshin, I.和Reznikoff,W. S. J. Biol. Chem.,273 =7367,1998)所述的方法類似的方法由高活性 Tn5轉座酶和適合的Τη5型轉座子末端組合物所形成的轉座複合物或由HyperMu 高活性 MuA轉座酶(EPICENTRE,Madison, WI)和顯示由該轉座酶識別的Rl和R2末端序列的適合的MuA轉座子末端組合物所形成的轉座複合物。轉座子末端組合物和轉座酶之間的適合的聯合複合物或Transposome 複合物(EPICENTRE)可按照美國專利第6,159,736號以及 Goryshin和Reznikoff的相關專利所述,或按照Tn5型EZ_Tn5 Transposome 複合物或來自 EPICENTRE Technologies, Madison, WI 的 HyperMu MuA Transposome 複合物的產品資料所述來製備,除外的是使用只顯示一種轉座子末端的寡核苷酸而不是通常在相應多核苷酸或寡核苷酸的每個末端處或附近具有兩種轉座子末端的多核苷酸或寡核苷酸。本發明還包括用於本發明的任何一種方法的試劑盒和單獨組合物。試劑盒是可用於執行本發明的方法的單獨組合物的組合,其中將這些組合物優化以在該方法中一起使用。組合物包括用於本發明的方法的至少一個步驟的單獨的組分或組分的摻合物。本發明包括可由本發明的任兩種組合物的組合組裝的任何試劑盒以及在本發明的試劑盒或方法中使用的任何新穎組合物。可選地,試劑盒可以由處於便利使用形式例如按單次使用部分預先等分的形式的單一組分或組合物組裝,並且可任選地包括一套使用該組分或組合物的說明書。發明描述引言本發明涉及用於處理核酸的方法和組合物和試劑盒,並且尤其是使用轉座子組合物將DNA斷裂和加標籤的方法和組合物。本發明的方法、組合物和試劑盒可用於從包含任何感興趣的dsDNA (包括從RNA製備的雙鏈cDNA)的來自任何來源的靶DNA中產生加雙標籤的線性ssDNA片段或加標籤的環狀ssDNA片段(及其擴增產物)的文庫,以用於基因組分析、亞基因組分析、轉錄組分析或宏基因組分析或RNA表達的分析(例如,用於製備標記的靶以用於微陣列分析;例如,用於拷貝數變異的分析,用於單核苷酸多態性的檢測和分析, 以及用於從環境樣品諸如土壤來源或水來源尋找基因)。這些方法可用於多種過程,包括但不限於用於以下的過程擴增一種或多種生物的全基因組(例如,全基因組擴增或WGA), 所述生物包括培養條件或生長條件未知的一種或多種微生物或環境生物;實時PCR ;乳液 PCR;比較基因組雜交(CGH);比較基因組測序(CGS);以及用於製備供應用如螢光原位雜交 (FISH)用的DNA特異性探針(例如,染色體特異性探針,例如染色體塗料,或例如基因特異性探針或基因座特異性探針)。在一些實施方案中,在一些實施方案中,這些方法還可用於產生大規模平行的DNA測序(所謂的「下一代測序」)的模板。這些過程或應用中的每一種可用於研究目的和分子診斷目的。
本發明提供了用於從包含在任何感興趣的樣品中的包括雙鏈DNA(dsDNA)的靶 DNA中產生加標籤的DNA片段的文庫的方法、組合物和試劑盒。這些方法更容易、快捷,需要更少的動手時間,可用更小的樣品和更小量的樣品核酸進行,在對片段兩個末端的加標籤中更有效率,並且產生的加雙標籤的DNA片段在性質上和/或數量上代表從中產生它們的樣品核酸。這些方法可容易地用手執行而無需儀器,而且容易適應高通量環境中的機器自動化。方法實施方案本文公開的本發明的方法的所有實施方案使用體外轉座反應同時將靶DNA碎成片段並將標籤接合至每個片段的5'端。因為所有的方法是相關的,所以除非另外具體說明是關於特定的實施方案,否則本文出現的關於一個實施方案的方法也可以用於本文所述的另一個實施方案。利用體外轉座反應的本文公開的方法的所有實施方案可通過裝配如下反應來執行所述反應利用單獨的轉座酶組合物和轉座子末端組合物或單一轉座體組合物,所述單一轉座體組合物包括在轉座酶和轉座子末端組合物之間形成的穩定複合物。因此,將理解描述使用轉座酶和轉座子末端組合物的任何方法也可以使用由轉座酶和轉座子末端組合物組成的轉座體組合物,並且描述使用轉座體組合物的任何方法也可以使用構成轉座體組合物的單獨的轉座酶和轉座子末端組合物。這通過下面本發明的一種一般方法的兩種描述來說明。本發明的一個實施方案是用於從包括任何感興趣的dsDNA的靶DNA產生加標籤的 DNA片段的文庫的方法(例如,用作下一代測序模板或擴增模板),該方法包括在體外轉座反應中將靶DNA與至少一種轉座酶以及與該轉座酶形成轉座複合物的轉座子末端組合物孵育,該轉座子末端組合物包含(i)顯示轉移的轉座子末端序列和任選的轉移的轉座子末端序列5'的另外的序列的轉移鏈,以及(ii)顯示與轉移的轉座子末端序列互補的序列的非轉移鏈,所述孵育在一定條件下進行並且持續足夠的時間,其中發生多次插入靶DNA中, 每次插入導致包括轉移鏈或由轉移鏈構成的第一標籤與靶DNA中的核苷酸的5'端接合, 從而斷裂靶DNA並產生退火的5'加標籤的DNA片段的群體,每個退火的5'加標籤的DNA 片段在5'端具有第一標籤;然後將5'加標籤的DNA片段的3'端與該第一標籤或與第二標籤接合,從而產生加標籤的DNA片段(例如,包括加標籤的環狀ssDNA片段或5'和3' 加標籤的DNA片段(或「加雙標籤的DNA片段」))的文庫。在一個優選的實施方案中,如最近的上文描述的,使用單獨的轉座酶和轉座子末端組合物執行該方法,而在一些其他優選的實施方案中,使用包含在轉座酶和轉座子末端組合物之間形成的複合物的轉座體組合物執行該方法。因此,本發明的一個優選的實施方案是用於從包括任何感興趣的dsDNA的體外轉座反應中的靶DNA產生加標籤的DNA片段的文庫的方法(例如,用作下一代測序模板或擴增模板),該方法包括將靶DNA與一種或多種轉座體組合物孵育,所述一種或多種轉座體組合物各自包含在轉座酶以及與該轉座酶形成轉座複合物的轉座子末端組合物之間的複合物,該轉座子末端組合物包含(i)顯示轉移的轉座子末端序列和任選的轉移的轉座子末端序列5'的另外的序列的轉移鏈,以及(ii)顯示與轉移的轉座子末端序列互補的序列的非轉移鏈,所述孵育在一定條件下進行並且持續足夠的時間,其中發生多次插入靶DNA中, 每次插入導致包括轉移鏈或由轉移鏈構成的第一標籤與靶DNA中的核苷酸的5'端接合,從而斷裂靶DNA並產生退火的5'加標籤的DNA片段的群體,每個退火的5'加標籤的DNA 片段在5'端具有第一標籤;然後將5'加標籤的DNA片段的3'端與該第一標籤或與第二標籤接合,從而產生加標籤的DNA片段(例如,包括加標籤的環狀ssDNA片段或5'和3' 加標籤的DNA片段(或「加雙標籤的DNA片段」))的文庫。
在本發明的任何方法的一些實施方案中,在體外轉座反應中使用的轉座酶和轉座子末端組合物的量或轉座體組合物的量在每50微升反應每50納克靶DNA大約1皮摩爾和大約25皮摩爾之間。在本發明的任何方法的一些優選的實施方案中,在體外轉座反應中使用的轉座酶和轉座子末端組合物的量或轉座體組合物的量在每50微升反應每50納克靶DNA大約5皮摩爾和大約50皮摩爾之間。在其中轉座酶是高活性Tn5轉座酶並且轉座子末端組合物包括MEDS轉座子末端組合物、或者其中轉座體組合物包括高活性Τη5轉座酶和包括MEDS轉座子末端的轉座子末端組合物的本發明的任何方法的一些優選的實施方案中,在體外轉座反應中使用的所述轉座酶和轉座子末端組合物或所述轉座體組合物的量在每50微升反應每50納克靶DNA大約5皮摩爾和大約25皮摩爾之間。在其中轉座酶是高活性Τη5轉座酶或MuA轉座酶的本發明的任何方法的一些優選的實施方案中,在體外轉座反應中使用的轉座酶和轉座子末端組合物的終濃度或轉座體組合物的終濃度為至少250ηΜ ; 在一些其他的實施方案中,高活性Τη5轉座酶或MuA轉座酶及其相應的轉座子末端組合物或轉座體組合物的終濃度為至少500ηΜ。在本發明的任何方法的一些實施方案中,體外轉座反應的反應時間是兩小時或更少,一小時或更少,30分鐘或更少,或15分鐘或更少。在本發明的任何方法的一些優選的實施方案中,體外轉座反應的反應時間是5分鐘或更少。在其中轉座酶組合物包括高活性Τη5 轉座酶和包括MEDS轉座子末端的轉座子末端組合物的本發明的任何方法的一些優選的實施方案中,體外轉座反應的反應時間是5分鐘或更少。在一些實施方案中,所述方法還包括使用熱穩定的DNA聚合酶和與第一標籤或第二標籤互補的至少一種引物非選擇性擴增包括加雙標籤的DNA片段或加標籤的環狀ssDNA 片段的加標籤的DNA片段的步驟。在只有一種轉座酶用於體外轉座反應的方法的一些優選的實施方案中,擴增加標籤的DNA片段的步驟包括使用顯示轉移鏈的至少一部分的序列的單一引物擴增加雙標籤的DNA片段或加標籤的環狀ssDNA片段。在一些實施方案中,使用單一引物擴增加標籤的DNA片段的步驟包括PCR或滾環複製反應。在一些實施方案中,用於擴增的引物的5'部分包括測序標籤域或由測序標籤域構成。在本發明的任何方法的一些優選的實施方案中,DNA片段的文庫用於提供DNA測序或核酸擴增的模板。本發明包括用於產生包括加雙標籤的DNA片段或加標籤的環狀ssDNA片段的加標籤的DNA片段的文庫的幾種實施方案,如以下所討論。使用具有鏈置換活性或5'核酸酶活性的DNA聚合酶產生包括加雙標籤的DNA片段的加標籤的DNA片段所述方法的一個優選實施方案包括將體外轉座反應中的靶DNA與至少一種轉座體在一定條件下孵育足夠的時間來產生退火的5'加標籤的DNA片段的群體;然後將退火的5'加標籤的DNA片段的群體與具有鏈置換活性或5'核酸酶活性的DNA聚合酶在沒有熱循環並且其中退火的5'加標籤的DNA片段不被變性的條件下孵育,其中DNA聚合酶使用互補鏈作為模板延伸退火的5'加標籤的DNA片段的每條鏈的3'端並且置換或消化非轉移鏈,從而產生包括加雙標籤的dsDNA片段的加標籤的DNA片段的文庫。所述方法的一個優選的實施方案包括將體外轉座反應中的靶DNA與至少一種轉座體孵育以產生退火的5'加標籤的DNA片段的群體;將退火的5'加標籤的DNA片段的群體與具有鏈置換活性或5'核酸酶活性的DNA聚合酶孵育以產生加雙標籤的dsDNA片段; 並且使該加雙標籤的dsDNA片段變性以產生包括加雙標籤的ssDNA片段的加標籤的DNA片段的文庫(例如,通過加熱到95°C並快速冷卻)。在所述方法的這個實施方案的一個優選的形式中,包括加雙標籤的ssDNA片段的加標籤的DNA片段的文庫從單個管中的靶DNA中產生而沒有進行任何介入純化步驟。在包括使用具有鏈置換活性或5'核酸酶活性的DNA聚合酶產生包括加雙標籤的 DNA片段的加標籤的DNA片段的文庫的方法的一些實施方案中,該方法還包括使用熱穩定的DNA聚合酶和與第二標籤互補的至少一種引物擴增包括加雙標籤的DNA片段的加標籤的 DNA片段的步驟。在該方法的一些優選的實施方案中,擴增包括加雙標籤的DNA片段的加標籤的DNA片段的文庫的步驟包括只使用顯示轉移鏈的至少一部分的序列的一種寡脫氧核糖核苷酸作為PCR引物以及加雙標籤的DNA片段作為模板通過PCR擴增加標籤的DNA片段的文庫。因此,該實施方案是對從靶DNA產生的包括加雙標籤的DNA片段的加標籤的DNA 片段的文庫進行單引物PCR擴增的方法。如果靶DNA包括生物的總基因組DNA,這個實施方案是非選擇性全基因擴增的方法。在其中在如下方法的體外轉座反應中使用單一轉座子末端組合物的一些優選的實施方案中所述方法包括使用具有鏈置換活性或5'核酸酶活性的DNA聚合酶產生包括加雙標籤的DNA片段的加標籤的DNA片段的文庫並且還通過PCR擴增產生的加雙標籤的 DNA片段,使用兩種不同的PCR引物,這些PCR引物的每一種顯示組成轉座子末端組合物的轉移的轉座子末端的至少一部分的序列。在一些優選的實施方案中,每種PCR引物包括3 『 部分和5'部分,其中該3'部分顯示相應的轉移的轉座子末端序列並且該5'部分顯示用於特定目的的相應標籤域的序列(例如,用於下一代測序或擴增的測序標籤域或擴增標籤域,以及任選的地址標籤域)。在如下任何方法的一些優選的實施方案中,體外轉座反應中的至少一種轉座體包括兩種不同的轉座體或由兩種不同的轉座體構成所述方法包括使用具有鏈置換活性或 5'核酸酶活性的DNA聚合酶產生包括加雙標籤的DNA片段的加標籤的DNA片段的文庫。在其中使用兩種不同的轉座體的一些優選的實施方案中,這兩種轉座體中的每一種包括相同的轉座酶但包括不同的轉座子末端組合物。在其中使用兩種不同的轉座體的一些優選的實施方案中,這兩種不同的轉座體各自包括相同的轉座酶並且轉座子末端組合物包含不同的轉移鏈。在其中使用兩種不同轉座體的一些優選的實施方案中,這兩種轉座體中的每一種包括不同的轉座酶和不同的轉座子末端組合物,這些轉座子末端組合物中的每一種與相應的轉座酶一起形成功能複合物。在如下方法的一些優選的實施方案中所述方法在體外轉座反應中使用兩種不同的轉座子末端組合物並且使用具有鏈置換活性或5'核酸酶活性的 DNA聚合酶產生包括加雙標籤的ssDNA片段的加標籤的DNA片段的文庫,第一標籤顯示一種轉座子末端組合物的轉移鏈的序列,並且第二標籤顯示另一種轉座子末端組合物的非轉移鏈的序列。
在如下方法的一些優選的實施方案中所述方法包括使用具有鏈置換活性或5' 核酸酶活性的DNA聚合酶產生包括加雙標籤的DNA片段的加標籤的DNA片段的文庫,其中在體外轉座反應中使用兩種不同的轉座子末端組合物,並且該方法還包括通過PCR擴增產生的加雙標籤的DNA片段的步驟,使用兩種不同的PCR引物,這些PCR引物中的一種顯示組成一種轉座子末端組合物的轉移鏈的至少一部分的序列並且這些PCR引物中的另一種顯示組成另一種轉座子末端組合物的轉移鏈的至少一部分的序列。在以下的一些優選的實施方案中其中組成每種相應的轉座子末端組合物的轉移鏈包括3'部分和5'部分,其中該 3'部分顯示相應的轉移的轉座子末端序列,並且每種相應的轉移鏈的5'部分顯示用於特定目的的包括標籤域的不同序列(例如,用於下一代測序或擴增的測序標籤域或擴增標籤域以及任選的地址標籤域),每種PCR引物顯示相應的轉移的轉座子寡核苷酸的標籤域的序列。#用末端轉產牛句,括力D雙標籤的DNA片段的力Dt示籤的DNA片段所述方法的另一種實施方案包括將體外轉座反應中的靶DNA與至少一種轉座體孵育以產生5'加標籤的dsDNA片段;使該5'加標籤的dsDNA片段變性以產生5'加標籤的ssDNA片段;並且將該5'加標籤的ssDNA片段與由末端轉移酶構成的DNA聚合酶和該末端轉移酶的至少一種dNTP底物在一定條件下孵育並且持續足夠的時間,其中該末端轉移酶接合由聚(dNMP)構成的第二標籤與該5'加標籤的DNA片段的3'端,從而產生包括加雙標籤的DNA片段的加標籤的DNA片段的文庫(例如,圖3)。在該方法的一些實施方案中,組成轉座體的轉座子末端組合物的非轉移的轉座子末端寡核苷酸的3'端被封閉(例如,通過使用具有雙脫氧核苷酸或3' -0-甲基-核苷酸作為3'末端核苷酸的非轉移的轉座子末端寡核苷酸),該封閉的3'核苷酸阻止由末端轉移酶添加聚(dNMP),由此阻止該非轉移的轉座子末端寡核苷酸的背景加標籤。所述方法的又另一種實施方案包括將體外轉座反應中的靶DNA與至少一種轉座體孵育以產生5'加標籤的DNA片段;不經預先的變性步驟,將該5'加標籤的DNA片段與由末端轉移酶構成的DNA聚合酶和該末端轉移酶的至少一種dNTP底物在一定條件下孵育並且持續足夠時間,其中該末端轉移酶接合由聚(dNMP)構成的第二標籤與該5'加標籤的 DNA片段的3'端,從而產生包括加雙標籤的DNA片段的加標籤的DNA片段的文庫。在該方法的一些實施方案中,組成轉座體的轉座子末端組合物的非轉移的轉座子末端寡核苷酸的 3'端被封閉(例如,通過使用具有雙脫氧核苷酸或3' -0-甲基-核苷酸作為3'末端核苷酸的非轉移的轉座子末端寡核苷酸)。DNAjg^SI禾Π末端力時示籤寡核苷Il產4^. 力D雙標籤的DNA片段的力時示籤白勺 DNA片段所述方法的又另一個實施方案包括將體外轉座反應中的靶DNA與至少一種轉座體孵育以產生5'加標籤的dsDNA片段;使該5'加標籤的dsDNA片段變性以產生5'加標籤的ssDNA片段(例如通過加熱到95°C並快速冷卻);並使用DNA聚合酶和末端加標籤寡核苷酸將第二標籤與該5'加標籤的ssDNA片段接合(例如,圖4),從而產生包括加雙標籤的DNA片段的加標籤的DNA片段的文庫。在一些優選的實施方案中,使用DNA聚合酶和末端加標籤寡核苷酸接合第二標籤與5'加標籤的DNA片段的3'端的步驟包括(1)提供包括5'部分和3'部分或由其構成的末端加標籤寡核苷酸,其中該5'部分顯示與期望與5'加標籤的ssDNA片段的3'末端接合的第二加標籤的序列互補的序列,並且該3'部分顯示隨機序列,該隨機序列包括三到八個(例如,3、4、5、6、7或8個) 隨機核苷酸或由其構成,在這些隨機寡核苷酸中,3'末端寡核苷酸被封閉以使得它不能被 DNA聚合酶延伸;(2)使該5'加標籤的ssDNA片段與該末端加標籤寡核苷酸在一定條件下接觸並且持續足夠的時間,其中該末端加標籤寡核苷酸與該5'加標籤的ssDNA片段退火;並且(3)使與該末端加標籤寡核苷酸退火的5'加標籤的ssDNA片段與反應混合物中的DNA聚合酶接觸並且處於DNA聚合條件下並且持續足夠的時間,其中使用該末端加標籤寡核苷酸作為模板延伸5'加標籤的ssDNA片段的3'末端,從而將該第二標籤接合至5' 加標籤的ssDNA片段的3'末端並且產生5'和3'加標籤的ssDNA片段。在一些實施方案中,使用半隨機序列代替末端加標籤寡核苷酸中的隨機序 列。在該實施方案的一些變體中,末端加標籤寡核苷酸包括脫氧核糖核苷酸或由脫氧核糖核苷酸構成。在該實施方案的一些變體中,末端加標籤寡核苷酸包括核糖核苷酸或由核糖核苷酸構成,在這些實施方案中DNA聚合酶為依賴RNA的DNA聚合酶。在一些優選的實施方案中,末端加標籤寡核苷酸的3'部分由七個隨機核苷酸構成。在如下方法的一些優選的實施方案中所述方法使用末端加標籤寡核苷酸來接合第二標籤與5'加標籤的ssDNA 片段,該第二標籤不與該第一標籤互補。細衣謝草_ (棚■)連漏禾口連·口fe糕浦■種伺龍力口雙fe· DNA片段的加標籤的DNA片段所述方法的一個優選的實施方案包括將體外轉座反應中的靶DNA與至少一種轉座體在一定條件下孵育並持續足夠的時間以產生退火的5'加標籤的DNA片段的群體;然後將退火的5'加標籤的dsDNA片段的群體與依賴模板的(或同源的)DNA連接酶以及包括 3'部分和5'部分或由3'部分和5'部分構成的連接加標籤寡脫氧核苷酸孵育,其中該 3'部分顯示第二標籤,該第二標籤顯示期望與退火的5'加標籤的DNA片段的群體的3' 端接合的任何序列(例如,任意序列),並且該5'部分具有5'-單磷酸基團並且顯示隨機序列,所述孵育是在一定條件下進行並且持續足夠的時間,其中該第二標籤與該退火的5' 加標籤的DNA片段接合,從而產生包括退火的加雙標籤的DNA片段的DNA片段的文庫。在一些優選的實施方案中,所述方法還包括使包括退火的加雙標籤的DNA片段的DNA片段的文庫變性的步驟(例如,通過加熱到95°C並且快速冷卻),從而產生包括加雙標籤的ssDNA 片段的DNA片段的文庫。在一些優選的實施方案中,連接加標籤寡核苷酸包括顯示由大約三個到大約八個核苷酸構成的隨機序列的5'部分。在一些優選的實施方案中,連接加標籤寡核苷酸包括顯示由四個核苷酸構成的隨機序列的5'部分。在一些優選的實施方案中,依賴模板的連接酶是大腸桿菌DNA連接酶。在所述方法的這個實施方案的一個優選的形式中,包括加雙標籤的ssDNA片段的加標籤的DNA片段的文庫從單個管中的靶DNA中產生而沒有進行任何介入純化步驟。髮夾轉座子末端組合4勿禾Π依IM草板的連接Sl產牛甸J舌力時示籤的環狀DNA片段、扇尾形dsDNA片段或加雙標籤的DNA片段的加標籤的DNA片段的文庫在用於從體外轉座反應的靶DNA中產生加標籤的DNA片段文庫的方法的一個優選實施方案中,該方法包括將靶DNA與一種或多種轉座體組合物孵育,每種轉座體組合物包括在轉座酶和與該轉座酶形成轉座複合物的髮夾轉座子末端組合物之間的複合物,該髮夾轉座子末端組合物包括含5』 -磷酸的寡核苷酸或由其構成,所述含5』 -磷酸的寡核苷酸顯示在5'端的非轉移的轉座子末端序列、在3'端的轉移的轉座子末端序列以及足夠長的允許分子內莖-環形成的在該非轉移的轉座子末端序列與該轉移的轉座子末端序列之間的間插的任意標籤序列;所述孵育在一定條件下進行並且持續足夠的時間,其中髮夾轉座子末端組合物插入靶DNA中產生退火的5'加標籤的DNA片段的群體;然後將退火的5'加標籤的DNA片段的群體與一種或多種隨機序列含5'-磷酸的寡核苷酸孵育,所述隨機序列含5'-磷酸的寡核苷酸單獨或組合在一起具有與體外轉座反應後產生的退火的5'加標籤的DNA片段中的單鏈缺口具有相同的長度,所述孵育在一定條件下進行並且持續足夠的時間,其中通過隨機序列寡核苷酸與靶DNA在單鏈缺口中的退火填充退火的5'加標籤的 DNA片段的群體中的單鏈缺口 ;然後,將單鏈缺口已填充的退火的5'加標籤的DNA片段的群體與依賴模板的連接酶在一定條件下孵育並且持續足夠的時間,其中將退火的隨機序列寡核苷酸彼此連接或與相鄰的5'加標籤的DNA片段的5'端連接,從而產生加標籤的環狀 DNA片段的文庫。在用於從體外轉座反應的靶DNA中產生加標籤的DNA片段文庫的方法的另一個優選實施方案中,該方法包括將該靶DNA與一種或多種轉座體組合物孵育,每種轉座體組合物包括在轉座酶和與該轉座酶形成轉座複合物的髮夾轉座子末端組合物之間的複合物,該髮夾轉座子末端組合物包括含5』 -磷酸的寡核苷酸或由其構成,所述含5』 -磷酸的寡核苷酸顯示在5'端的非轉移的轉座子末端序列、3'端的轉移的轉座子末端序列以及足夠長的允許分子內莖-環形成的在該非轉移的轉座子末端序列與該轉移的轉座子末端序列之間的間插的任意標籤序列;所述孵育在一定條件下進行並且持續足夠的時間,其中髮夾轉座子末端組合物插入靶DNA中產生退火的5'加標籤的DNA片段的群體;然後將退火的5'加標籤的DNA片段的群體與缺乏5'-到-3'外切核酸酶活性和依賴結構的5'核酸酶活性以及鏈置換活性的DNA聚合酶孵育,所述孵育在一定條件下進行並且持續足夠的時間,其中在體外轉座反應後存在於退火的5'加標籤的DNA片段的群體中的單鏈缺口通過DNA聚合酶對每個退火的5'加標籤的DNA片段的3'端的延伸來填充;然後,將單鏈缺口已填充的退火的5'加標籤的DNA片段的群體與依賴模板的連接酶在一定條件下孵育並且持續足夠的時間,其中將退火的DNA聚合酶延伸產物的3'端與相鄰退火的5'加標籤的DNA片段的5'端連接,從而產生加標籤的環狀DNA片段的文庫。在該方法的一些優選的實施方案中,DNA聚合酶和依賴模板的連接酶被提供在單一反應混合物中並且在該單一反應混合物中進行DNA聚合酶延伸和依賴模板的連接。在用於產生加標籤的環狀DNA片段的文庫的這些方法中的任何一種的一些實施方案中,該方法在用依賴模板的連接酶孵育產生加標籤的環狀DNA片段的文庫的步驟後面另外包括一個或多個除去未連接的線性ssDNA和dsDNA(例如,包括隨機序列寡核苷酸,線性靶DNA和/或沒有接合靶DNA的髮夾轉座子末端組合物)的步驟。在用於除去未連接的線性ssDNA和dsDNA的一個優選的實施方案中,所述方法另外包括用T5外切核酸酶處理含加標籤的環狀DNA片段的反應混合物。在用於產生加標籤的環狀DNA片段的文庫的這些方法中的任何一種的一些優選的實施方案中,所述方法另外包括在衍生自髮夾轉座子末端組合物的每個環結構中切割加標籤的環狀DNA片段以產生扇尾形dsDNA片段,該扇尾形dsDNA片段的每條鏈其5 『端上具有標籤的一部分以及在其3'端上具有標籤的一部分。在一些實施方案中,在每個環結構中切割加標籤的環狀DNA片段的步驟包括使該加標籤的環狀DNA片段與切割酶組合物在一定條件下接觸並持續足夠的時間,其中該加標籤的環狀DNA片段在切割位點被切割以產生扇尾形dsDNA片段。在一些實施方案中,在每個環結構中切割加標籤的環狀DNA片段的步驟包括使與標籤內的限制性位點吐火的寡脫氧核糖核苷酸與該加標籤的環狀DNA片段退火,然後與在雙鏈的限制性位點切割的限制性內切核酸酶在一定條件下孵育並且持續足夠時間以產生扇尾形dsDNA片段的文庫。在一些優選的實施方案中,在每個環結構中切割加標籤的環狀DNA片段的步驟包括使該加標籤的環狀DNA片段與DNA糖基化酶和AP內切核酸酶接觸,其中該DNA糖基化酶從存在於標籤內的非規範核苷酸(例如,dUMP或8-氧代-dGMP)中除去核酸鹼基,並且該AP內切核酸酶在得到的無鹼基位點處切割該加標籤的環狀ssDNA片段;在一些實施方案中,該DNA糖基化酶選自尿嘧啶-N-糖基化酶和FPG蛋白,並且AP內切核酸酶選自大腸桿菌內切核酸酶III或內切核酸酶IV。在用於產生扇尾形dsDNA片段的文庫的方法中的任何一種的一些優選的實施方案中,所述方法另外包括如下步驟使扇尾形dsDNA片段的文庫變性以產生加雙標籤的線性ssDNA片段的文庫。使用不依賴樽板的連接酶產牛包括加標籤的環狀ssDNA片段或加雙標籤的線件 ssDNA片段的加標籤的DNA片段所述方法的一個優選的實施方案包括將體外轉座反應中的靶DNA與至少一種轉座體孵育,其中構成轉座體的轉移鏈的5'端具有5』 -磷酸基團,所述孵育在一定條件下進行足夠時間以產生退火的5'加標籤的DNA片段的群體;然後使該退火的5'加標籤的 dsDNA片段變性以獲得5'加標籤的ssDNA片段(例如,通過加熱到95°C並快速冷卻);然後將連接反應中的5'加標籤的ssDNA片段與不依賴模板的(或非同源的)連接酶在一定條件下孵育並持續足夠的時間,其中5'加標籤的ssDNA片段被分子內連接以產生加標籤的環狀ssDNA片段的文庫,這些環狀ssDNA片段中的每一個顯示靶DNA的一部分的序列和標籤序列。在所述方法的這個實施方案的一個優選的形式中,包括加標籤的環狀ssDNA片段的加標籤的DNA片段的文庫從單個管中的靶DNA中產生而沒有進行任何介入純化步驟。在一個優選的實施方案中,不依賴模板的連接酶選自噬菌體TS2U6熱穩定的RNA連接酶和古細菌RNA連接酶(例如,嗜熱自養甲烷桿菌(Methanobacterium thermoautotrophicum) RNA 連接酶1)。在一些優選的實施方案中,提供腺苷酸化形式的依賴模板的連接酶並且在不向連接反應添加ATP或NAD的情況下進行孵育5'加標籤的ssDNA片段與不依賴模板的連接酶的步驟。在一些優選的實施方案中,所述方法還包括在標籤內的位點切割加標籤的環狀 ssDNA片段,從而產生包括加雙標籤的線性ssDNA片段的加標籤的DNA片段的文庫。在一些實施方案中,切割的步驟包括使與加標籤的環狀ssDNA片段的標籤內的單鏈限制性位點互補的寡脫氧核糖核苷酸退火,然後使用識別該限制性位點的限制性內切核酸酶在該限制性位點切割該加標籤的環狀ssDNA片段。在一些其他的實施方案中,切割的步驟包括使該加標籤的環狀ssDNA片段與DNA糖基化酶和內切核酸酶接觸,其中該DNA糖基化酶從存在於標籤內的非規範核苷酸(例如,dUMP或8-氧代-dGMP)中除去核酸鹼基,並且該內切核酸酶在得到的無鹼基位點處切割該加標籤的環狀ssDNA片段;在一些實施方案中,該DNA糖基化酶選自尿嘧啶-N-糖基化酶和FPG蛋白,並且AP內切核酸酶選自大腸桿菌內切核酸酶 III或內切核酸酶IV。在一些實施方案中,所述方法還包括擴增包括加標籤的環狀ssDNA片段或加雙標籤的ssDNA片段的加標籤的DNA片段的文庫的步驟,從而產生加標籤的DNA片段的擴增文庫。在一些優選的實施方案中,擴增加標籤的DNA片段的文庫的步驟包括進行聚合酶鏈反應(PCR),從而產生包括擴增的加雙標籤的DNA片段的加標籤的DNA片段的擴增文庫。在一些優選的實施方案中,使用第一 PCR引物和第二 PCR引物進行PCR反應,所述第一 PCR引物和第二 PCR引物各自具有3'部分和5'部分,其中該第一 PCR引物的3'部分與由加標籤的DNA片段中的標籤顯示的序列互補並且該第二 PCR引物的3'部分與對該標籤互補的序列互補,並且其中每個5'部分包括測序標籤域,所述測序標籤域包括允許使用所產生的擴增的加雙標籤的DNA片段作為利用特定的下一代測序平臺的下一代測序的模板的適當的測序標籤或由其構成(例如,Roche 454A和Roche 454B測序標籤,ILLUMINA S0LEXA 測序標籤 Applied Biosystems 的 SOLID 測序標籤,Pacific Biosciences 的 SMRT 測序標籤,Pollonator Polony 測序標籤,或 Complete Genomics 測序標籤)。■一輔革F, DNA歹丨丨代廉· DNA發明人觀察到某些測序數據,這些測序數據指示來自包括dsDNA分子的具有小於 IOKb大小的靶DNA的末端的下一代序列數據的代表性比來自該靶DNA的中間的序列數據的代表性低。不希望受理論束縛,對於這種觀察結果的一種可能的解釋是找到具有以相反方向插入在線性dsDNA分子的末端的兩種轉座子末端組合物的DNA片段的可能性比找到具有以相反方向插入在該線性dsDNA分子的中間的兩種轉座子末端組合物的DNA的可能性低。 為了解決這個問題,發明人開發了另外的用於產生DNA片段文庫的方法,其中存在對顯示構成靶DNA的dsDNA分子的末端的序列的DNA片段的更好的代表性。一個優選的實施方案是用於產生其中存在對顯示構成靶DNA的dsDNA分子的末端的序列的DNA片段的更好的代表性的DNA片段文庫的方法,所述方法包括在體外轉座反應中將靶DNA與包含至少一種轉座酶和與該轉座酶形成轉座複合物的至少一種轉座子末端組合物的至少一種轉座體組合物在一定條件下孵育並持續足夠的時間,所述轉座子末端組合物包括轉移鏈和非轉移鏈,其中該轉移鏈與該靶DNA接合,產生包括退火的5'加標籤的 ssDNA片段的5'加標籤的dsDNA片段,所述5'加標籤的dsDNA片段中的每一個在5 『端具有包括轉移鏈或由轉移鏈構成的第一標籤;使該5'加標籤的dsDNA片段變性以釋放5' 加標籤的ssDNA片段;然後通過用連接ssDNA的不依賴模板的連接酶(例如,噬菌體TS2U6 RNA 連接酶;例如,CIRCLIGASE 熱穩定的 ssDNA 連接酶,EPICENTRE, Madison, WI, USA)進行的分子內連接使5'加標籤的ssDNA片段環化,從而產生加標籤的環狀ssDNA片段的文庫。在一些實施方案中,將該至少一種轉座酶和至少一種轉座子末端組合物作為單獨的組分而不是作為包括轉座體組合物的單組分添加到反應中。在一些實施方案中,將加標籤的環狀ssDNA片段用作下一代測序模板,或者在標記後用作與陣列或微陣列上的探針退火的靶,或用於本文其他地方描述的其他應用。在一些其他的實施方案中,所述方法還包括在第一標籤內使加標籤的環狀ssDNA片段線性化的步驟,從而產生加雙標籤的線性ssDNA片段。 在包括使加標籤的環狀ssDNA片段線性化的任何這些實施方案中的一些實施方案中,第一標籤包括多個標籤域,其中使該第一標籤線性化的步驟導致該第一加標籤的一部分在5' 端上和該第一加標籤的另一部分在3'端上。例如,在一些實施方案中,轉移的轉座子末端組合物的轉移鏈顯示包括多個標籤域(例如,Roche 454A和Roche 454B測序標籤域)的第一標籤,在所述多個標籤域中,至少一個標籤域與從加標籤的環狀ssDNA片段的線性化步驟中產生的加雙標籤的ssDNA片段的3'端接合。例如,在一些實施方案中,使用包含以下轉移鏈的轉座子末端組合物產生5 『加標籤的DNA片段,所述轉移鏈包含允許在核苷酸的位點切割的一個或多個核苷酸,並且在標籤內使加標籤的環狀ssDNA片段線性化的步驟包括在所述一個或多個核苷酸處切割加標籤的環狀ssDNA片段。例如,在一些實施方案中, 轉移鏈包含一個或多個脫氧尿苷核苷酸或者一個或多個8-氧鳥嘌呤核苷酸(例如,使用寡核苷酸合成儀合成的),並且在標籤內使加標籤的環狀ssDNA片段線性化的步驟包括通過將該加標籤的環狀ssDNA片段分別與尿嘧啶-DNA糖基化酶或甲醯胺基嘧啶-DNA糖基化酶以及在無鹼基位點切割DNA的內切核酸酶(例如,內切核酸酶IV)孵育來切割該加標籤的環狀ssDNA片段。例如,在一些其他的實施方案中,通過如下方式使加標籤的環狀ssDNA片段在標籤內線性化使互補的寡核苷酸與該標籤退火併使用識別雙鏈標籤內的限制性位點的限制性內切核酸酶進行線性化。在包括使加標籤的環狀ssDNA片段線性化的任何實施方案中的一些實施方案中,所述方法還包括純化加雙標籤的ssDNA片段(例如,使用Qiagen PCR提純柱);在這些實施方案中的一些實施方案中,加雙標籤的ssDNA片段用作下一代測序模板或者在標記後用作與陣列或微陣列上的探針退火的靶,或者用於本文其他地方描述的其他應用加標籤的DNA片段的擴增和其他實施方案在用於產生加標籤的DNA片段的文庫的本發明的任何方法的一些實施方案中,所述方法還包括擴增包括加雙標籤的DNA片段、加標籤的環狀ssDNA片段或扇尾形DNA片段的加標籤的DNA片段的文庫。在這些方法中的任何一種方法的一些實施方案中,所述方法還包括如下步驟使用聚合酶鏈反應(PCR)擴增加雙標籤的線性ssDNA、加標籤的環狀DNA片段或扇尾形dsDNA 片段的文庫。因此,在一些實施方案中,所述方法還包括(a)提供(i)第一 PCR引物和第二 PCR引物,其中該第一 PCR引物的至少3'端與加標籤的環狀DNA片段的標籤序列的至少一部分互補或與接合扇尾形dsDNA片段的3'端的標籤序列的至少一部分互補或與接合線性ssDNA片段的3'端的標籤序列的至少一部分互補,並且其中該第二 PCR引物的至少 3'端與加標籤的環狀DNA片段的標籤序列的互補序列的至少一部分互補(S卩,其中該第二 PCR引物的至少3'端顯示與該標籤序列的至少一部分相同的序列),或者其中該第二 PCR 引物的至少3'端與接合扇尾形dsDNA片段或加雙標籤的線性ssDNA片段的5'端的標籤序列的互補序列的至少一部分互補(即,其中該第二 PCR引物的至少3'端顯示與接合扇尾形dsDNA片段或加雙標籤的線性ssDNA片段的5'端的標籤序列的至少一部分相同的序列),和(ii)可用於PCR的熱穩定的DNA聚合酶;以及(b)將加標籤的環狀DNA片段或扇尾形dsDNA片段或加雙標籤的線性ssDNA片段與相應的第一 PCR引物和第二 PCR引物以及熱穩定的DNA聚合酶在PCR擴增條件下孵育並持續足夠的時間,其中產生擴增的加雙標籤的線性dsDNA片段。在其中所述方法包括使用PCR擴增加標籤的環狀DNA片段的一些實施方案中,該第一 PCR引物與插入加標籤的環狀DNA片段的靶DNA中的髮夾轉座子末端組合物的環結構的至少一部分中的標籤序列互補和/或該第二 PCR引物顯示與插入加標籤的環狀DNA片段的靶DNA中的髮夾轉座子末端組合物的環結構的至少一部分相同的序列。在一些實施方案中,第一 PCR引物與轉移的轉座子末端序列或非轉移的轉座子末端序列的至少一部分互補,而第二 PCR引物與轉移的轉座子末端序列或非轉移的轉座子末端序列的至少一部分相同。在一些實施方案中,該第一 PCR引物的5'部分或該第二 PCR引物的5'部分或該第一 PCR引物和該第二 PCR引物二者的5 』部分分別包括第一測序標籤或第二測序標籤或者分別由第一測序標籤或第二測序標籤構成,以產生用於特定測序平臺的下一代測序的模板(例如,用於如下平臺的測序標籤R0CHE 454A或ROCHE 454B測序平臺;ILLUMINA SOLEXA 測序平臺;APPLIED BIOSYSTEMS SOLID 測序平臺;PACIFIC BIOSCIENCES 的 SMRT 測序平臺;P0LL0NAT0R POLONY測序平臺;HELIC0S測序平臺;COMPLETE GENOMICS測序平臺;INTELLIGENT BIOSYSTEMS測序平臺;或任何其他測序平臺)在一些實施方案中,該第一 PCR引物的5'部分或該第二PCR引物的5'部分另外包括地址標籤域或用於特定目的的另一種標籤域或者由其構成。在其他實施方案中,加標籤的環狀DNA片段的標籤包括用於使用特定平臺的下一代測序的測序標籤。在其中使用具有5'核酸酶活性或鏈置換活性的DNA聚合酶產生包括加雙標籤的 DNA片段的加標籤的DNA片段的文庫的方法的實施方案中,擴增該文庫的步驟包括只使用與第二標籤互補的單個寡脫氧核糖核苷酸引物來通過PCR擴增加標籤的DNA片段的文庫。 在一些實施方案中,用於PCR的單引物顯示轉移的轉座子末端序列的至少一部分。在一些其他的實施方案中,用於PCR的單引物顯示轉移的轉座子末端寡核苷酸的5'部分的序列的至少一部分。在一些其他優選的實施方案中,使用單個寡核苷酸引物擴增包括加雙標籤的DNA片段的加標籤的DNA片段的文庫的步驟包括提供與加標籤的DNA片段的3'端的第二標籤互補的單個寡核苷酸引物和適合於PCR的熱穩定的DNA聚合酶;並且將加標籤的 DNA片段的文庫與寡核苷酸引物和熱穩定的DNA聚合酶在PCR擴增條件下孵育足夠的時間, 其中加標籤的DNA片段的文庫被PCR擴增,產生擴增的加標籤的DNA片段的文庫。在其中包括加雙標籤的DNA片段的加標籤的DNA片段的文庫並非使用具有5『核酸酶活性或鏈置換活性的DNA聚合酶產生的一些其他的實施方案中,擴增該文庫的步驟包括進行聚合酶鏈反應(PCR),所述方法還包括(1)提供(a)第一 PCR引物和第二 PCR引物, 其中該第一 PCR引物的至少3'端與加雙標籤的DNA片段或扇尾形DNA片段的3'端的第一標籤的至少一部分互補或與加標籤的環狀ssDNA片段中的標籤的至少一部分互補,並且該第二 PCR引物的至少3'端與加雙標籤的DNA片段或扇尾形DNA片段的第二標籤的互補序列的至少一部分互補或與加標籤的環狀ssDNA片段中的標籤的互補序列的至少一部分互補,(b)適合於PCR的熱穩定的DNA聚合酶;以及(2)將加標籤的DNA片段的文庫與PCR 引物和熱穩定的DNA聚合酶在PCR擴增條件下孵育並持續足夠的時間,其中擴增加標籤的 DNA片段的文庫以產生擴增的加標籤的DNA片段的文庫。在一些實施方案中,第一 PCR引物或第二 PCR引物包括5'部分和3'部分,其中該5'部分不與加標籤的DNA片段中的相應的標籤或其互補序列中的序列互補,並且該3'部分與相應標籤或其互補序列的序列互補。在一些實施方案中,第一 PCR引物和第二 PCR引物的5'部分包括適當的第一測序標籤和第二測序標籤或者由其構成,所述適當的第一測序標籤和第二測序標籤允許使用它們來產生用於下一代測序的模板(例如,Roche 454A和Roche 454B測序標籤或用於另一測序平臺的適當的第一測序標籤和第二測序標籤;例如,不限於Illumina Solexa或Applied Biosystems Solid 平臺)。 廣泛種類的酶和試劑盒可用於通過PCR進行擴增反應。例如,在一些實施方案中, 使用來自 EPICENTRE Biotechnologies,Madison, WI 的 FAILSAFE PCR 系統或 MASTERAMP 超長PCR系統按製造商所述進行PCR擴增。這些系統允許對PCR反應條件的快速優化, 所述優化使用每個系統配有的一系列2XPCR PreMix來鑑定特定模板和引物對的優化的 PreMix。然而,本發明不限於使用用於擴增反應的那些產物或條件,並且可使用任何適宜的熱穩定DNA聚合酶和允許擴增在與靶序列退火的引物和與轉座子退火的引物之間的序列的反應混合物。本發明也不限於使用PCR來擴增加標籤的DNA片段文庫。擴增同一序列並產生適合的組成和量的擴增產物以用於預定目的的任何適宜的擴增方法(例如,滾環擴增、核糖核酸引物(riboprimer)擴增(例如,美國專利第7,413,857號)、ICAN、UCAN、ribospia、末端加標籤(美國專利申請第20050153333號)、EberWine型RNA擴增或鏈置換擴增)可用於本發明的實施方案中。例如,可以使用的一些鏈置換方法描述於=Takara Shuzo Company, Kyoto, Japan 的 PCT 專利公布第 WO 02/16639 號;WO 00/56877 號;和 AU 00/29742 號; Becton Dickinson and Company 的美國專利第 5,523,204 號;5,536,649 號;5,624,825 號; 5,631,147 號;5,648,211 號;5,733,752 號;5,744,311 號;5,756,702 號;和 5,916,779 號; Nanogen/Becton Dickinson Partnership 的美國專利第 6,238,868 號;6,309,833 號;和 6,326,173 號;Bio Merieux 的美國專利第 5,849,547 號;5,874,260 號;和 6,218,151 號; Gen-Probe, Inc.的美國專利第 5,786,183 號;6, 087, 133 號;和 6,214,587 號;Wick 等人的美國專利第 6,063,604 號;Kurn 的 6,251,639 ;Eiken Kagaku Kabushiki Kaishi, Tokyo, Japan的美國專利第6,410,278號;和PCT公布第WO 0(V28082號;Auerbach的美國專利第 5,591,609 號;5,614,389 號;5,773,733 號;5,834,202 號;和 6,448,017 號;以及 Lizardi 的美國專利第6,124,120號;和6,280,949號。在本發明的優選實施方案中,沒有必要按大小選擇在體外轉座反應中產生的5' 加標籤的DNA片段的文庫或加標籤的DNA片段的最終文庫。在大小選擇或純化對於某些應用而言是必要的情況下,可通過瓊脂糖凝膠電泳按大小選擇5'加標籤的DNA片段(例如, 使用適當瓊脂糖百分比的低熔解溫度非變性瓊脂糖凝膠用於期望大小範圍的DNA片段), 並純化它們(例如,除去未插入的轉座子末端寡核苷酸、其他反應產物和瓊脂糖凝膠;例如,通過用 EPICENTRE Biotechnologies, Madison, WI, USA 的 GELase 瓊脂糖凝膠消化酶消化含期望大小範圍的5'加標籤的DNA片段的瓊脂糖凝膠部分,接著是醇沉澱,以及根據 GEL酶產品說明書的其他提純步驟,或使用本領域已知的任何其他純化方法)。在一些實施方案中,包括聚乙二醇(PEG)沉澱的純化步驟用於沉澱加標籤的DNA片段的文庫而不沉澱汙染物質(例如,不限於,未連接的連接加標籤寡核苷酸或其他反應組分)。在一些實施方案中,使用旋轉柱(spin column)或本領域已知的任何其他純化方法。
在一些實施方案中,加標籤的環狀DNA片段用作DNA測序的模板。在一些實施方案中,加標籤的DNA片段用作DNA測序的模板。在一些實施方案中,加標籤的DNA片段的文庫用作擴增反應的模板(例如,使用與包括加雙標籤的DNA片段或扇尾形DNA片段的加標籤的DNA片段的第一標籤和第二標籤互補或者與包括加標籤的環狀ssDNA片段的加標籤的DNA片段的標籤的互補的PCR引物的 PCR擴增反應)。在一些優選的實施方案中,所擴增的加標籤的DNA片段的文庫包括由靶 DNA顯示的序列的大部分或近似全部。在其中靶DNA包括生物的基因組DNA的一些實施方案中,擴增反應是全基因組擴增反應。在包括擴增加標籤的DNA片段的方法的一些實施方案中,通過在擴增方法(例如, PCR擴增反應方法)的一個或多個步驟過程中摻入標記的核苷酸對擴增物進行標記。在一些實施方案中,包含標記的擴增的加標籤的DNA片段的文庫用於檢測或捕獲或者用於檢測和捕獲包含標記的擴增的加標籤的DNA片段用於特定應用。用於產生加標籤的DNA片段(例如,加雙標籤的DNA片段)的文庫的本發明的任何方法的一些實施方案包括產生「標記的」加標籤的DNA片段的文庫,所述「標記的」加標籤的 DNA片段包含允許在表面上捕獲標記的加標籤的DNA片段的一個或多個部分(例如,一個或多個親和性結合分子),或允許檢測標記的加標籤的DNA片段的一個或多個可檢測部分 (例如,它與互補DNA諸如染色體中的互補DNA退火)。同樣,包括還擴增加標籤的DNA片段的文庫的本發明的任何方法的一些實施方案包括產生「標記的」擴增的加標籤的DNA片段的文庫,所述「標記的」擴增的加標籤的DNA片段包含允許在表面上捕獲的一個或多個部分(例如,一個或多個親和性結合分子),或允許檢測標記的加標籤的DNA片段的一個或多個可檢測部分(例如,它與互補DNA諸如染色體中的互補DNA退火)。在一些實施方案中, 標記的加標籤的DNA片段或標記的擴增的加標籤的DNA片段的文庫是通過使用至少一種標記的寡核苷酸(例如,標記的轉移的轉座子末端寡核苷酸,標記的連接加標籤寡核苷酸,或至少一種標記的擴增引物,諸如至少一種(或多於一種)PCR引物)而產生。在一些其他的實施方案中,標記的擴增的加標籤的DNA片段的文庫是通過在擴增反應過程中包括摻入擴增產物中的標記的dNTP而產生。標記的dNTP可具有本領域已知的能夠用於產生標記的擴增的加標籤的DNA片段的任何標記,不論是通過直接加標記還是通過間接加標記。談及「直接標記」,我們表示捕獲部分或可檢測標記與擴增的加標籤的DNA片段直接相連而在該捕獲部分或可檢測部分與該加標籤的DNA片段或擴增的加標籤的DNA片段之間沒有任何其他部分。談及「間接加標記」,我們表示在捕獲部分或可檢測部分與加標籤的DNA片段或擴增的加標籤的DNA片段之間具有至少一個其他部分。直接標記的一個實例是將染料標記的核苷酸摻入加標籤的DNA片段中,而間接標記的一個實例是將生物素標記的核苷酸摻入加標籤的DNA片段中,然後通過與染料標記的抗生蛋白鏈菌素在一定條件下孵育用染料可檢測部分標記加標籤的DNA片段其中染料標記的抗生蛋白鏈菌素結合生物素標記的核苷酸。本發明包括使用任何合適的方法產生標記的加標籤的DNA片段或標記的擴增的加標籤的DNA 片段的文庫,其中該標記隨後用於捕獲或檢測。在一些其他的實施方案中,使用本發明的方法製備的文庫中的加標籤的DNA片段隨後通過如下方式被直接或間接地標記使加標籤的DNA片段的文庫與反應性染料分子 (例如,來自Molecular Probes, Eugene, OR的含N-羥基琥珀醯亞胺基或「NHS」酯的反應性螢光染料中的任何一種)或與反應性親和性結合分子(例如,反應性生物素化試劑,諸如來自Pierce Chemical Company,Rockford,IL的生物素-NHS化合物)接觸。例如,在一些實施方案中,標記的擴增的加標籤的DNA片段的文庫是通過以下產生在擴增反應過程中摻入含氨基烯丙基-基團的dNTP,然後使含氨基烯丙基-的擴增的加標籤的DNA片段的文庫與標記的螢光染料-NHS酯或生物素-NHS酯接觸分別產生螢光染料標記的擴增的加標籤的DNA片段或生物素標記的擴增的加標籤的DNA片段。具有本領域知識的技術人員將懂得或懂得如何尋找對擴增的加標籤的DNA片段的文庫進行標記的許多另外的具體方法和試劑,包括例如來自Molecular ftx)bes的試劑盒,以用於特定目的(例如,允許在表面上捕獲或檢測)。例如,實例包括具有以下的一種或多種修飾的核苷酸氨基烯丙基-基團、丙炔基-基團、生物素基團、螢光染料或其他可檢測染料或任何其他可檢測分子或本領域已知的分子的組合,包括量子點、酶(例如,磷酸酶、過氧化物酶或焦磷酸酶)或可檢測蛋白(例如,藻膽蛋白、藻紅蛋白)。在一些其他的實施方案中,標記的擴增的加標籤的DNA片段的文庫是通過在擴增反應過程中例如在PCR擴增反應過程中摻入用親和性結合分子或可檢測部分標記的一種或多種修飾的dNTP而產生,例如,通過摻入具有氨基烯丙基-基團、生物素基團、螢光染料或其他可檢測染料或允許直接或在用任何其他可檢測分子或本領域已知的分子的組合標記後間接被檢測的另一部分的一種或多種修飾的核苷酸,所述本領域已知的分子包括與親和性結合分子(例如,作為抗生蛋白鏈菌素,抗體)相連的量子點、或酶或可檢測蛋白(例如,藻膽蛋白、藻紅蛋白)。在一些實施方案中,加標籤的DNA片段(例如,加雙標籤的DNA片段)用於製備與附於表面的探針雜交的加標籤的DNA片段(例如,作為與陣列或微陣列上的DNA探針雜交的標記的靶DNA)。在一些實施方案中,加標籤的DNA片段(例如,包括加雙標籤的DNA片段)用於與固定的細胞切片或組織切片中的染色體或染色體部分雜交(例如,螢光原位雜交或FISH)。在一些實施方案中,所述方法包括產生標記的加標籤的DNA片段或標記的擴增的加標籤的DNA片段(例如,標記的加雙標籤的DNA片段或標記的擴增的加雙標籤的DNA片段)以用於與染色體雜交(例如,其中標記的加標籤的DNA片段是由包括來自一種或多種特定染色體的DNA的靶DNA而製備以用作「染色體塗料」(例如,用於與固定細胞切片或組織切片中的一種或多種染色體雜交,例如,使用螢光原位雜交或FISH以用於諸如染色體分型等應用,或用於研究、醫學診斷、鑑定生物的性別,或其他細胞生物學應用)。在一些實施方案中,所述方法包括從包括染色體部分的靶DNA中產生標記的加標籤的DNA片段或標記的擴增的加標籤的DNA片段(例如,其中加標籤的DNA片段是由編碼一種或多種染色體的一個或多個特定基因或基因座的DNA製備(例如,用於與固定細胞切片或組織切片中的一種或多種染色體雜交,例如,使用螢光原位雜交或FISH,或用作體外測定應用諸如分析物特異性測定或用於醫學、工業、環境或分子或細胞生物學研究應用的診斷測試中的基因特異性探針或基因座特異性探針)。在一些實施方案中,標記的加標籤的DNA片段與表面(例如,陣列或微陣列,浸漬條(dipstick),量子點,珠子,或微流體裝置中的微通道)上的探針的雜交用於檢測、定量、 確定相對數量、或表徵一種或多種DNA分子或其部分,所述DNA分子或部分處於或來自自然來源(例如,來自細胞的基因組DNA ;例如,用於評估拷貝數變異或「CNV」的人DNA,或來自為病原的致病的細菌、真菌、支原體、病毒或線蟲細胞的DNA),或來自體外來源(例如,通過 RNA諸如mRNA或非編碼RNA或病毒RNA的反轉錄製備的雙鏈cDNA,所述RNA從自然來源分離或者使用核酸擴增方法諸如DNA或RNA擴增方法從自然來源擴增)。在其中所述方法包括擴增加標籤的DNA片段的一些其他的實施方案中,所述方法包括通過在擴增反應過程中例如在PCR擴增反應過程中摻入具有親和性結合分子或可檢測部分的一種或多種修飾的dNTP而產生(例如,通過摻入具有氨基烯丙基-基團、生物素基團、螢光染料或其他可檢測染料或允許直接或在用任何其他可檢測分子或本領域已知的分子的組合標記後間接被檢測的另一部分的一種或多種修飾的dNTP,所述本領域已知的分子包括與親和性結合分子(例如,作為抗生蛋白鏈菌素,抗體)相連的量子點、或酶或可檢測蛋白(例如,藻膽蛋白、藻紅蛋白)。在一些其他的實施方案中,使用本發明的方法製備的加標籤的DNA片段或擴增的加標籤的DNA片段是標記的擴增的加標籤的DNA片段的文庫是通過在擴增反應過程中摻入具有親和性結合分子或可檢測部分的一種或多種修飾的dNTP而標記(例如,在相應的轉錄、RCR或PCR反應中,例如,通過摻入具有氨基烯丙基_基團、生物素基團、洋地黃毒苷基團、螢光染料或其他可檢測染料或允許直接或在用任何其他可檢測分子或本領域已知的分子的組合標記後間接被檢測的另一部分的一種或多種修飾的dNTP,所述本領域已知的分子包括與親和性結合分子(例如,作為抗生蛋白鏈菌素,抗體)相連的 量子點、或酶或可檢測蛋白(例如,藻膽蛋白、藻紅蛋白)。在一些實施方案中,相應的產物用於製備與附於表面的探針雜交的標記的核酸片段(例如,作為與陣列或微陣列上的DNA探針雜交的標記的靶核酸)。在一些實施方案中,相應的標記的產物用於與固定的細胞切片或組織切片中的染色體或染色體部分雜交(例如,螢光原位雜交或FISH)。在一些實施方案中,標記的產物與表面上的探針的雜交用於檢測、定量、確定相對數量或表徵靶DNA的一個或多個部分,所述靶 DNA來自自然來源(例如,來自細胞的基因組DNA;例如,用於評估拷貝數變異或「CNV」)或來自體外來源(例如,通過RNA諸如mRNA或非編碼RNA (ncRNA)的反轉錄製備的雙鏈cDNA, 所述雙鏈cDNA從自然來源分離或者使用RNA擴增方法從自然來源擴增)。在包括產生加標籤的環狀DNA片段的文庫的方法的一些實施方案中,轉移的轉座子末端寡核苷酸除了顯示在3'部分中的轉移的轉座子末端的序列之外還顯示在5'部分中的雙鏈RNA聚合酶啟動子的一條鏈的序列。在包括使用連接加標籤寡核苷酸和依賴模板的連接酶產生加雙標籤的DNA片段的文庫的方法的一些實施方案中,該連接加標籤寡核苷酸顯示在3'部分中的雙鏈RNA聚合酶啟動子的一條鏈的序列。在其中轉移的轉座子末端寡核苷酸或連接加標籤寡核苷酸不顯示RNA聚合酶啟動子序列的方法的一些實施方案中, 所述方法還包括使用至少一種PCR引物PCR擴增加雙標籤的DNA片段,所述PCR引物為「啟動子引物」。該啟動子引物具有不與加雙標籤的DNA片段退火併且顯示雙鏈的RNA聚合酶啟動子的一條鏈的序列的「5'-翼(5' -flap)」或「5'-尾」部分以及與5'和3'加標籤的DNA片段或其互補序列的第一標籤或第二標籤退火的3'部分。在其中轉移的轉座子末端寡核苷酸、連接加標籤寡核苷酸或PCR引物顯示RNA聚合酶啟動子序列的一些優選的實施方案中,該RNA聚合酶啟動子是T7型RNA聚合酶啟動子並且所述方法還包括使用識別該啟動子的T7型RNA聚合酶在體外轉錄5'和3'加標籤的 DNA片段的步驟。更優選地,從T7 RNAP、T3 RNAP和SP6 RNAP以及對應的同源啟動子中選擇RNA聚合酶和啟動子。然而,本發明的方法的轉錄步驟可使用如下任何RNAP 對於所述 RNAP而言允許具有高特異性的轉錄的適合的啟動子序列是已知的或者可被獲得。用於體外轉錄的試劑盒和酶從許多賣家可商購獲得並且用於執行包括體外轉錄的本發明的步驟的適當的反應混合物和條件可按製造商所述使用那些產品。例如,使用T7 RNAP的體外轉錄可按照產品資料所述使用來自 EPICENTRE Biotechnologies,Madison, WI 的 AMPLISCRIBE T7-FlaSh 轉錄試劑盒或AMPLISCRIBE T7高產量轉錄試劑盒。類似地,如果Τ3 RNAP或 SP6 RNAP在本發明的方法中用於體外轉錄,那麼AMPLISCRIBE T3-FlaSh 高產量轉錄試劑盒或 AMPLISCRIBE SP6 高產量轉錄試劑盒(EPICENTRE Biotechnologies,Madison, WI) 分別可按照所述使用。在一些實施方案中,轉移的轉座子末端寡核苷酸、連接加標籤寡核苷酸或PCR引物除了 RNA聚合酶啟動子序列以外還顯示用於翻譯的另外序列,諸如但不限於核糖體結合位點和翻譯起 始密碼子(也稱為「翻譯起始信號」),並且所述方法另外包括翻譯轉錄的 RNA0在這些實施方案中的一些實施方案中,所述方法還包括得到的RNA轉錄本的體外翻譯步驟。用於RNA轉錄本的體外翻譯的系統和試劑盒也可以從許多來源商購獲得並且可用於本發明。通過舉例但不限於,來自PROMEGA Corporation,Madison,WI的兔網織紅細胞裂解物、小麥胚芽提取物和大腸桿菌S30提取物系統可用於本發明。更進一步,體外轉錄和體外翻譯偶聯的試劑盒也可以商購獲得並且可被使用,諸如來自Promega的TNT 快速偶聯的轉錄/翻譯系統。在所述方法的一些優選的實施方案中,對從靶DNA產生的加雙標籤的DNA片段的文庫進行PCR擴增,所述靶DNA包括來自細胞或生物的全基因組的DNA樣品(即,所述方法包括用於全基因組擴增的方法或由其構成)。在一些實施方案中,使用全基因組擴增的方法來擴增來自單細胞的全基因組。在本文所述的全基因組擴增方法的一些優選的實施方案中,使用與第二標籤互補的單個寡核苷酸引物(或PCR引物)對從DNA樣品產生的加標籤的DNA片段的文庫進行PCR擴增,所述DNA樣品來自細胞或生物的全基因組。在一些實施方案中,使用本發明的方法產生的加標籤DNA片段是從靶DNA中產生, 所述靶DNA包括從存在於環境樣品中的所有生物(例如,多種生物)的RNA製備的基因組和/或雙鏈cDNA或由其構成(例如,用於宏基因組或宏轉錄組的應用,包括用於工業、醫療或研究應用)。在所述方法的一些其他的實施方案中,加標籤的DNA片段的文庫是從靶DNA產生, 所述靶DNA包括如下DNA 所述DNA包括單染色體或染色體的一部分或由其構成。在這些實施方案中的一些實施方案中,所述方法包括在一定條件下對從靶DNA產生的加標籤的DNA 片段的文庫進行PCR擴增,所述靶DNA包括單染色體或染色體的一部分的DNA或由其構成, 所述染色體的一部分包括含一個或多個基因或基因座的染色體的一部分,其中PCR擴增的產物用可檢測部分標記(例如,螢光的、紅外螢光的、化學發光的、可見的或其他可檢測染料;例如,在PCR中使用染料標記的dNTP。在一些實施方案中,用可檢測部分標記的PCR擴增的產物用於原位對固定細胞進行染色(例如,PCR擴增產物用作染色體塗料)。因此,在一些優選的實施方案中,所述方法包括用於製備染色體塗料或子染色體塗料或染色體標誌的方法或由其構成。在一些實施方案中,使用所述方法產生的加標籤的DNA片段或擴增的加標籤的DNA片段用作使用本發明的方法的第二輪斷裂和加標籤的靶DNA。在一些實施方案中,在所述方法的第一輪和第二輪中使用相同的轉座體。在一些實施方案中,另一不同的轉座酶和不同的轉座子末端用於第二輪。在一些實施方案中,將使用所述方法產生的加標籤的DNA片段或擴增的加標籤的DNA片段克隆在載體中(例如,在C0PYC0NTR0L F黏粒載體中,EPICENTRE Biotechnologies, Madison, WI,USA)。在其中所述方法還包括克隆加標籤的DNA片段或擴增的加標籤的DNA片段並且其中加標籤的DNA片段或擴增的加標籤的DNA片段(例如,PCR 擴增的加標籤的DNA片段)顯示RNA聚合酶啟動子的一些實施方案中,所述方法還包括對克隆的加標籤的DNA片段或擴增的加標籤的DNA片段的至少一條鏈進行轉錄。在一些實施方案中,使用識別RNA聚合酶啟動子的RNA聚合酶在體外對克隆的加標籤的DNA片段或擴增的加標籤的DNA片段進行轉錄。在一些實施方案中,在宿主細胞中對克隆的加標籤的DNA 片段或擴增的加標籤的DNA片段進行體內轉錄,所述宿主細胞能夠誘導表達識別RNA聚合酶啟動子的RNA聚合酶並然後對含RNA聚合酶結合的啟動子的DNA模板進行轉錄(例如, PET系統被廣泛用於由誘導的T7型RNA聚合酶在體內表達蛋白)。在一些優選的實施方案中,用於體外或體內表達的RNA聚合酶是T7型RNA聚合酶並且從相應的同源T7型RNAP啟動子啟動轉錄。在一些優選的實施方案中,T7型RNA聚合酶選自T7RNA聚合酶、T3 RNA聚合酶和SP6 RNA聚合酶。在所述方法的任何一種的一些實施方案中,轉移的轉座子末端寡核苷酸、連接加標籤寡核苷酸或PCR引物包含親和性分子或與親和性分子(例如,生物素或洋地黃毒苷) 接合,並且所述方法另外包括如下步驟提供用親和性結合物質共價或非共價包被的固體表面,所述親和性結合物質能夠與親和性分子(例如,用於結合生物素的抗生蛋白鏈菌素或抗生物素蛋白,或用於結合洋地黃毒苷的抗體)特異性結合併形成特異性結合對;以及, 在涉及其的步驟之前或之後,在一定條件下接觸使用與親和性分子共價接合的轉移的轉座子末端寡核苷酸、連接加標籤寡核苷酸或CPR引物產生的產物,其中親和性分子與接合該固體表面的親和性結合物質結合。本發明不限於特定的固體表面,它可以是有孔的或無孔的,以及具有適合於特定方法和應用的任何組成、大小或形狀。通過舉例,但不受限制,固體表面可以選自以下組成的組磁珠、包被的珠子、載玻片、微量滴定板的孔、管、以及由玻璃、塑料(例如膠乳或聚苯乙烯)、矽石、特氟隆或另外適合的材料構成的浸漬片。用親和性結合物質包被的固體表面的目的是允許與親和性分子接合的轉移的轉座子末端寡核苷酸、連接加標籤寡核苷酸或 PCR引物的操作(例如,捕獲或洗滌以便從反應混合物中的其他分子中除去)、分離和捕獲, 或者是允許5'加標籤的DNA片段、5'和3'加標籤的DNA片段或自其產生的PCR產物的操作、分離和捕獲。為了防止非特異性結合,在一些實施方案中,用選自以下組成的組的大量過剩物質處理固體支持體無DNA的tRNA ;蛋白(例如,BSA),多糖(例如,糖原、硫酸葡聚糖或肝素)。本發明還不限於特定親和性分子或親和性結合物質,只要它們能夠特異性結合併形成特異性結合對。因此,在一些實施方案中,加標籤的DNA片段或擴增的加標籤的DNA通過結合固體表面在另一方法中被捕獲、分離、純化或使用,所述方法包括如下步驟使包含親和性分子的加標籤的DNA片段或擴增的加標籤的DNA片段在存在試劑的情況下且在促進親和性分子與附於固體表面的親和性結合物質結合的條件下與固體表面接觸,其中加標籤的DNA片段或擴增的加標籤的DNA片段與該表面結合。在一些優選的實施方案中,親和性分子是生物素並且親和性結合物質是抗生物素蛋白或抗生蛋白鏈菌素,或者其中親和性分子是洋地黃毒苷並且親和性結合物質是特異性結合洋地黃毒苷的抗體。如本文所用,術語「轉座酶」和「DNA聚合酶」以及「連接酶」是指負責催化特異性化學反應和生物學反應的蛋白質分子或蛋白質分子聚集體。一般來說,本發明的方法、組合物或試劑盒不限於使用來自特定來源的特定的轉座酶或DNA聚合酶。反之,本發明的方法、 組合物或試劑盒包括與根據特定方法、組合物或試劑盒的本文公開的特定酶具有等同酶活性的來自任何來源的任何轉座酶或DNA聚合酶。更進一步,本發明的方法還包括如下實施方案其中在所述方法的步驟中提供和使用的任何一種特定的酶被兩種或多種酶的組合取代,所述兩種或多種酶在組合使用時,不論是以分步方式分別使用還是同時一起使用,反應混合物產生的結果與使用該一種特定的酶獲得的結果相同。本文提供的方法、緩衝液和反應條件,包括在實施例中的方法、緩衝液和反應條件目前對於本發明的方法、組合物和試劑盒的實施方案是優選的。然而,使用本發明的一些酶的其他的酶儲存緩衝液、反應緩衝液和反應條件是本領域已知的,其也可能適於在本發明中使用並且被包括在本文中。組合物和試劑盒實施方案本發明還包括用於本發明的方法的試劑盒和組合物。試劑盒是可用於執行本發明的方法的單獨組合物的組合,其中將這些組合物優化以在該方法中一起使用。組合物包括用於本發明的方法的至少一個步驟的單獨組分。本發明包括可由本發明的任兩種新穎組合物或試劑盒的組合或者從試劑盒中使用的任何新穎組合物組裝的任何試劑盒。在一些實施方案中,試劑盒或組合物包括處於任何適當的組合及出於任何理由的此處描述的任何試劑盒或組合物的子集由其構成,以提供使用者為特定目的或應用修改方法的靈活性,或允許使用者採用與包括該子集或由該子集構成的試劑盒或組合物一起的其他組合物。組合物實施方案本發明的組合物的一個實施方案是包括如下的轉座體組合物(i)具有顯示轉移的轉座子末端序列的3'部分和顯示標籤域的序列的5'部分的轉移鏈,以及(ii)只顯示非轉移的轉座子末端序列的含5'磷酸的非轉移鏈,其中轉座酶與轉座子末端組合物形成在體外轉座反應中有活性的複合物。在一些實施方案中,標籤域是在下一代測序或擴增中使用的標籤域。在一些實施方案中,標籤域選自限制性位點域、捕獲標籤域、測序標籤域、 檢測標籤域、地址標籤域、擴增標籤域和轉錄啟動子域。本發明的一種其他組合物是轉移的轉座子末端組合物,其中轉移鏈包括3'部分和5'部分,其中該3'部分顯示轉移的轉座子末端序列並且該5'部分包括顯示RNA聚合酶啟動子序列的轉錄啟動子域。本發明的另一種組合物是包括含5'-磷酸的寡核苷酸或由其構成的髮夾轉座子末端組合物,所述含5'-磷酸的寡核苷酸顯示在5'端的非轉移的轉座子末端序列、在3' 端的轉移的轉座子末端序列,以及足夠長的允許分子內莖-環形成的在該非轉移的轉座子末端序列與該轉移的轉座子末端序列之間的間插的任意標籤序列。在一些優選的實施方案中,髮夾轉座子末端組合物包括顯示高活性Tn5轉座酶的轉座子末端序列。在一些其他實施方案中,髮夾轉座子末端組合物在其5'端被腺苷酸化而不是具有5'-磷酸基團。本發明還包括用於執行所述方法的組合物。例如,本發明的一種組合物是包含3 『 部分和5'部分的寡核苷酸,其中該3'部分顯示轉移的轉座子末端序列並且該5'部分顯示限制性位點域(例如,針對稀有切割的限制性內切核酸酶諸如NotI或AscI的,或者針對 II型內切核酸酶諸如i^okl的)。例如,本發明的一種其他組合物是包含3'部分和5'部分的寡核苷酸,其中該3'部分顯示轉移的轉座子末端序列並且該5'部分顯示RNA聚合酶啟動子序列(例如,針對噬菌體T7、T3、SP6或N4 RNA聚合酶的)。在一些優選的實施方案中,RNA聚合酶啟動子序列是這些RNA聚合酶中的任何一種的正義啟動子序列。在一些其他的實施方案中,RNA聚合酶啟動子序列是這些RNA聚合酶中的任何一種的反義啟動子序列。本發明的一種其他組合物是包含3'部分和5'部分的寡核苷酸,其中該3'部分顯示轉移的轉座子末端序列並且該5'部分顯示標籤域,所述標籤域選自測序標籤域、擴增標籤域、捕獲標籤域、地址標籤域、檢測標籤域以及限制位點標籤域。在一些優選的實施方案中,轉移的轉座子末端序列是EZ-Tn5 轉座酶 (EPICENTRE)的MEDS或pMEDS轉移的轉座子末端組合物。在一些優選的實施方案中,序列標籤域顯示適合於以下測序平臺的測序標籤ROCHE妨4測序平臺、ILLUMINA S0LEXA 測序平臺、LIFE TECHNOLOGIES/APPLIED BI0SYSTEMS 的 SOLID 測序平臺、PACIFIC BIOSCIENCES 的 SMRT 測序平臺、P0LL0NAT0R Polony 測序平臺、COMPLETE GENOMICS 測序平臺、INTELLIGENT BI0SYSTEMS的測序平臺、或HELIC0S測序平臺。試劑盒實施方案本發明的一個實施方案是用於產生在下一代或核酸擴增的模板製備中使用的5 』 加標籤的DNA片段的文庫的試劑盒,所述試劑盒包括包含轉座酶和轉座子末端組合物的轉座體組合物,所述轉座子末端組合物包括(i)具有顯示轉移的轉座子末端序列的3'部分和顯示在下一代測序反應或擴增反應中使用的標籤域的序列的5'部分的轉移鏈,以及 ( )只顯示非轉移的轉座子末端序列的含5'-磷酸的非轉移鏈,其中轉座酶與轉座子末端組合物形成在體外轉座反應中有活性的複合物;和含有一定量二甲基甲醯胺的反應緩衝液,該量導致二甲基甲醯胺以10%的終濃度存在於體外轉座反應中。在一些實施方案中,試劑盒另外包括選自以下的至少一種另外的酶組分具有 5'核酸酶活性或鏈置換活性的DNA聚合酶;缺乏5'核酸酶活性、依賴模板的NAD連接酶、 以及不依賴模板的連接酶。在一些實施方案中,至少一種另外的酶組分選自FAILSAFE DNA聚合酶混合物;Taq DNA聚合酶、Tfl DNA聚合酶、T4 DNA聚合酶、大腸桿菌DNA連接酶、 噬菌體TS2U6熱穩定的RNA連接酶、Mth Rn 1熱穩定的RNA連接酶、以及CIRCLIGASE 熱穩定的ssDNA連接酶。在其中試劑盒中的至少一種酶是依賴模板的酶(例如,大腸桿菌DNA連接酶)的一些優選的實施方案中,高比例的連接酶分子被腺苷酸化並且在試劑盒中沒有提供ATP。在其中試劑盒中的至少一種酶是依賴模板的酶(例如,大腸桿菌DNA連接酶)的一些實施方案中,試劑盒另外包括連接加標籤寡核苷酸,所述連接加標籤寡核苷酸包含3'部分和5' 部分,其中該3'部分顯示標籤域的序列,而該5'部分顯示由大約三個到大約八個核苷酸構成的隨機序列。在一些優選的實施方案中,連接加標籤寡核苷酸包括顯示由四個核苷酸構成的隨機序列的5'部分。在其中試劑盒中的至少一種酶是依賴模板的酶的一些其他的實施方案中,試劑盒另外包括髮夾轉座子末端組合物。在其中髮夾轉座子末端組合物具有腺苷酸化的5'端的一些實施方案中,構成試劑盒中提供的依賴模板的核酸連接酶的分子的少於50%被腺苷酸化,並且在試劑盒中沒有提供ATP或NAD。在其中試劑盒中的至少一種酶是選自噬菌體TS2U6熱穩定的RNA連接酶、Mth Rn 1熱穩定的RNA連接酶以及CIRCLIGASE 熱穩定的ssDNA連接酶的不依賴模板的連接酶的一些優選的實施方案中,不依賴模板的連接酶以高腺苷酸化形式提供並且在試劑盒中沒有提供ATP。在試劑盒的一個優選的實施方案中,轉座體包括以如下濃度提供的野生型或高活性Tn5轉座酶或MuA轉座酶其中體外轉座反應中的轉座體的終濃度為至少250ηΜ。在一些其他的實施方案中,野生型或高活性Τη5轉座體或MuA轉座體的終濃度為至少500ηΜ。一個優選的實施方案是使用ΕΖ-Τη5 轉座酶和大腸桿菌DNA連接酶產生加標籤的環狀ssDNA片段的試劑盒,該試劑盒包括(1)Τη5轉座酶的野生型或突變形式(例如,ΕΖ-Τη5 轉座酶);(2)用於ΕΖ-Τη5轉座酶的由顯示轉移的轉座子末端序列的轉移鏈和顯示非轉移的轉座子末端序列的非轉移鏈構成的轉座子末端組合物;C3)EZ-Tn5反應緩衝液;以及(4)能夠在不存在連接模板的情況下催化ssDNA的分子內連接的不依賴模板的核酸連接酶(例如,選自熱噬菌體(therm0phage)TS2U6的RNA連接酶(美國專利第 7,303, 901 號);CIRCLIGASE 熱穩定的 ssDNA 連接酶(EPICENTRE Biotechnologies, Madison, WI,USA);以及Mth RNA連接酶1)。在一個優選的實施方案中,試劑盒中的轉座酶為Tn5轉座酶的野生型形式或突變形式(例如,ΕΖ-Τη5 轉座酶),其濃度大於或等於每微升約5單位;每微升約10-20單位;每微升約20-40單位;每微升約40-60單位;每微升約 60-80單位;或者每微升約80-100單位。在包括ΕΖ-Τη5 轉座酶和不依賴模板的連接酶的試劑盒的一個優選實施方案中,EZ-Tn5 pMEDS轉座子末端組合物包括具有5'-單磷酸基團的EZ-Tn5 pMEDS轉移鏈和具有5'-單磷酸基團的EZ_Tn5 pMENTS非轉移鏈。在一個優選的實施方案中,試劑盒中的轉座酶為Tn5轉座酶的野生型形式或突變形式(例如,ΕΖ-Τη5 轉座酶),其濃度大於或等於每微升約5單位;每微升約10-20單位; 每微升約20-40單位;每微升約40-60單位;每微升約60-80單位;或者每微升約80-100單位。在包括ΕΖ-Τη5 轉座酶和不依賴模板的核酸連接酶的試劑盒的一個優選實施方案中, EZ-Tn5 pMEDS轉座子末端組合物包括具有5 『-單磷酸基團的EZ_Tn5 METS轉移鏈和具有 5'-單磷酸基團的EZ-Tn5 pMENTS非轉移鏈。本發明的方法、組合物和試劑盒可用於從來自任何來源的靶DNA中產生加標籤的環狀DNA片段或扇尾形dsDNA片段或加雙標籤的線性ssDNA片段(及其擴增產物),以用於基因組分析、亞基因組分析、或宏基因組分析(例如,用於製備標記的靶以用於微陣列分析;例如,用於拷貝數變異的分析,用於單核苷酸多態性的檢測和分析,以及用於從環境樣品諸如土壤來源或水來源尋找基因)。這些方法可用於多種過程,包括用於以下的過程擴增一種或多種生物的全基因組(例如,全基因組擴增或WGA),所述生物包括培養條件或生長條件未知的一種或多種微生物或環境生物;實時PCR;乳液PCR;比較基因組雜交(CGH); 比較基因組測序(CGS);以及用於製備供應用如螢光原位雜交(FISH)用的DNA特異性探針 (例如,染色體特異性探針,例如染色體塗料)。在一些實施方案中,這些方法還可用於產生大規模平行的DNA測序(所謂的「下一代測序」)的模板。這些過程或應用中的每一種可用於研究目的和分子診斷目的。發明實施方案詳 述本發明的示例性實施方案的詳述在以下部分中提供I.使用轉座酶和DNA聚合酶使DNA斷裂並加雙標籤III.靶DNA的斷裂、加標籤和單引物擴增II.使用轉座酶和連接酶使DNA斷裂並加標籤IV.使用轉座酶和連接酶從Ds-靶DNA產生加標籤的環狀Ss-DNA片段V.通過髮夾轉座子末端組合物的體外轉座使Ds-DNA斷裂並加標籤I.使用轉座酶和DNA聚合酶使DNA斷裂並加雙標籤本發明包括使用轉座酶從包括一種或多種雙鏈(dsDNA)分子或由一種或多種雙鏈(dsDNA)分子構成的靶DNA中產生5'加標籤的片段,然後將顯示與第一標籤不同的DNA 序列的第二標籤與所述5'加標籤的DNA片段的3'端接合的方法、組合物和試劑盒。第一標籤顯示由轉座酶識別的轉座子末端的轉移鏈的序列,並且任選地還顯示所述轉移的轉座子末端的序列5'-的一種或多種其他序列。使用DNA聚合酶將第二標籤與5'加標籤的 DNA片段的3'端在體外接合而無需進行PCR擴增反應。本發明的一種方法包括將轉座酶和與其在體外轉座反應中形成轉座複合物的轉座子末端與靶DNA在一定條件下孵育並持續足夠的時間,其中轉移的轉座子末端與靶DNA 接合,產生在5'端具有第一標籤的5'加標籤的DNA片段;將該5'加標籤的DNA片段與 DNA聚合酶在DNA聚合條件下孵育足夠的時間,所述條件不包括熱循環,其中顯示不同於第一標籤的序列的第二標籤與5'加標籤的DNA片段的3'端接合,產生5'和3'加標籤的 DNA片段。在一些實施方案中,所述方法還包括使用DNA聚合酶和與第二標籤互補的至少一種引物擴增5'和3'加標籤的DNA片段的步驟。靶DNA可包括來自任何體內或體外來源的雙鏈DNA或由其構成,所述雙鏈DNA諸如基因組DNA、亞基因組DNA、質粒或其他附加體來源的DNA或其中的重組DNA,或通過RNA的反轉錄製備的雙鏈cDNA。基因組DNA可包括來自生物來源或環境來源的一種或多種基因組或由其構成。因此,本發明的方法、組合物和試劑盒可用於產生5'和3'加標籤的DNA片段並且任選地擴增由本領域已知的方法和應用中使用的來自任何來源的靶DNA產生的5'和3'加標籤的DNA片段以用於基因組分析、亞基因組分析或宏基因組分析(例如,用於拷貝數變異的分析、單核苷酸多態性或其他方法的基因組分析)。所述方法可用於多種過程,包括但不限於包括培養條件或生長條件未知的一種或多種微生物或環境生物的一種或多種生物的基因組的宏基因組分析,實時PCR,乳液PCR,比較基因組雜交(CGH),比較基因組測序(CGS)。所述方法尤其可用於產生一些大規模平行的DNA測序(所謂的「下一代測序」)類型的模板。使用鏈置換DNA聚合酶和/或具有5 『核酸酶活性的DNA聚合酶產生具有顯示不同的轉座子末端的序列的5'和3'標籤的DNA片段在一些優選的實施方案中,本發明提供了用於從包括一種或多種雙鏈(dsDNA)分子或由其構成的靶DNA中產生包括5'和3'加標籤的DNA片段的文庫的方法,所述方法包括提供1.包括一種或多種雙鏈(dsDNA)分子(例如,真核和/或原核基因組DNA或通過 RNA的反轉錄製備的雙鏈cDNA)或由其構成的靶DNA,
2.轉座酶(例如,野生型或突變的轉座酶;例如野生型或突變的Tn5轉座酶,例如,ΕΖ-Τη5 轉座酶,或例如 HYPERMU MuA 轉座酶,EPICENTRE Biotechnologies,Madison, WI,USA),以及3.在轉座反應中能夠與該轉座酶形成功能複合物的轉座子末端(例如,由野生型或突變的Tn5轉座酶例如由ΕΖ-Τη5 轉座酶識別的19_bp外端(「0E」)轉座子末端,內端 (「IE」)轉座子末端,或「嵌合端」(「ME」)轉座子末端,或者例如由HYPERMU MuA轉座酶識別的Rl和R2轉座子末端),所述轉座子末端包括由轉移鏈和非轉移鏈構成的雙鏈DNA, 所述轉移鏈和非轉移鏈聯合顯示雙鏈的轉座子末端的序列,其中該轉移鏈顯示第一標籤的序列;以及4. DNA聚合酶,所述DNA聚合酶鏈置換或消化與由所述DNA聚合酶延伸的DNA分子的3'端下遊的模板鏈退火的DNA(S卩,具有鏈置換活性和/或5'核酸酶活性的DNA 聚合酶;例如,iTaq DNA聚合酶,Tfl DNA聚合酶,FAILSAFE DNA聚合酶混合物;phU9 DNA聚合酶,大腸桿菌DNA聚合酶I和DISPLACEACE DNA聚合酶,全部可從EPICENTRE Biotechnologies, Madison, WI,USA 商購獲得);將靶DNA與轉座酶和轉座子末端在一定條件下進行孵育並持續足夠的時間,其中轉座酶催化的轉座子末端插入靶DNA的兩條鏈中產生5'加標籤的DNA片段,所述5'加標籤的DNA片段中的每一個在其5'端上具有第一標籤(例如,圖2);以及將體外轉座反應中產生的5'加標籤的DNA片段與DNA聚合酶在一定條件下孵育並持續足夠的時間,其中該DNA聚合酶延伸該5'加標籤的DNA片段,從而將顯示非轉移的轉座子末端序列的至少一部分的第二標籤與該5'加標籤的DNA片段接合併產生5'和3' 加標籤的DNA片段。在一些優選的實施方案中,轉移鏈只顯示轉移的轉座子末端序列,並且因此,存在於5'加標籤的DNA片段中的第一標籤只顯示轉移的轉座子末端序列。在一些其他的實施方案中,轉移鏈包括3'部分和5'部分或由其構成,其中該3'部分顯示轉移的轉座子末端的序列,並且該5'部分顯示任何其他期望的序列,在所述實施方案中,第一標籤包括 3'部分和5'部分或由其構成。在其中轉移鏈包括3'部分和5'部分或由其構成的實施方案中,非轉移鏈可能但不必顯示與轉移鏈的5'部分互補的序列。在其中轉移鏈包括3'部分和5'部分或由其構成的一些實施方案中,該5'部分顯示測序標籤(例如,Roche 454A測序標籤;如在例如圖10中所圖示的),並且該3'部分顯示轉座子末端的轉移鏈的序列。這產生具有第一標籤的5'加標籤的DNA片段,所述第一標籤包括測序標籤(例如,Roche 454A測序標籤)或由測序標籤構成。然後,DNA聚合酶用於將包括其他測序標籤(例如,Roche 454B測序標籤)或由其他測序標籤構成的第二標籤與5 『加標籤的DNA片段接合,從而產生包含帶有兩種測序標籤(例如,454A和454B ; 如在圖10中以示意圖顯示的)的5'和3'加標籤的DNA片段的DNA片段的文庫。在期望的大小範圍內的5'和3'加標籤的DNA片段用作使用Roche妨4基因組測序儀FLX系統的下一代測序的模板。在其他的實施方案中,用適合作為使用任何其他的測序平臺的下一代測序的測序標籤的第一標籤和第二標籤產生文庫中的5'和3'加標籤的DNA片段(例如,使用 ROCHE 454測序平臺、ILLUMINA S0LEXA 測序平臺、LIFE TECHNOLOGIES/APPLIED BI0SYSTEMS 的 SOLID 測序平臺、PACIFIC BIOSCIENCES 的 SMRT 測序平臺、P0LL0NAT0RPolony 測序平臺、COMPLETE GENOMICS 測序平臺、INTELLIGENT BI0SYSTEMS 的測序平臺、或 HELIC0S測序平臺)。在一些實施方案中,使用一種特定轉座酶的多個雙鏈轉座子末端或由不同的轉座酶識別的多個不同的轉座子末端。在其中使用鏈置換DNA聚合酶或具有5'核酸酶活性的DNA聚合酶的一些優選的實施方案中,兩種不同的轉座子末端彼此鄰近地插入靶DNA的相反鏈中,然後DNA聚合酶使用相反鏈作為模板延伸該5'加標籤的DNA片段的3'端,從而產生具有在3'端與5'端顯示不同的轉座子末端序列的標籤的5'和3'加標籤的DNA 片段(例如,其中第一轉座子末端的轉移鏈和第二轉座子末端的轉移鏈是不同的並且與靶 DNA的相反連結合(例如,圖7))。因此,在一些實施方案中,所述方法另外包括另外提供5.識別與第一轉座酶識別的轉座子末端(在該實施方案中稱為「第一轉座酶」識別的「第一轉座子末端」)不同的轉座子末端的第二轉座酶;以及6.能夠在轉座反應中與該第二轉座酶形成功能複合物的第二轉座子末端,所述轉座子末端包括轉移鏈和非轉移鏈,所述轉移鏈和非轉移鏈聯合顯示雙鏈的轉座子末端的序列,其中轉移鏈顯示與第二標籤顯示的序列互補的序列;以及將靶DNA與第一轉座酶和第一轉座子末端以及第二轉座酶和第二轉座子末端在一定條件下孵育並持續足夠的時間,其中該第一轉座酶和第二轉座酶催化的第一轉座子末端和第二轉座子末端插入靶DNA中產生DNA片段,所述DNA片段中的每一個顯示在5 『端上的第一轉座子末端或第二轉座子末端的轉移鏈的序列;以及將5 『加標籤的DNA片段與DNA聚合酶在DNA聚合條件下孵育並持續足夠的時間, 所述條件不包含dsDNA的變性或熱循環,其中DNA聚合酶延伸5'加標籤的DNA片段的3' 端,從而將第二標籤與5'加標籤的DNA片段接合併產生加標籤的DNA片段(例如,5'和 3'加標籤的DNA片段)的文庫而無需進行擴增反應。在一些實施方案中,所述方法包括在同一反應混合物中將靶DNA與第一轉座酶和第一轉座子末端寡核苷酸以及第二轉座酶和第二轉座子末端寡核苷酸同時孵育。在一些其他的實施方案中,所述方法通過如下方式按順序進行首先將靶DNA與第一轉座酶和第一轉座子末端寡核苷酸孵育,然後將來自該反應的產物與第二轉座酶和第二轉座子末端寡核苷酸孵育。在其中所述方法按順序進行的一些實施方案中,在將來自靶DNA與第一轉座酶和第一轉座子末端寡核苷酸的反應的產物與第二轉座酶和第二轉座子末端寡核苷酸孵育之前,將這些產物純化。在其中轉移鏈包括3'部分和5'部分或者由其構成的方法的一些實施方案中, 該5'部分顯示測序標籤(例如,第一 Roche妨4測序標籤,例如,Roche 454A)的序列並且該3'部分顯示轉座子末端的轉移鏈的序列。如本文所用的「測序標籤」表示與從靶DNA分子中產生的單鏈DNA片段的5'端或3'端接合的標籤,所述標籤為了促進所述DNA片段的測序的目的。例如,在一些實施方案中,測序標籤提供了用於在表面上捕獲所述DNA片段鏈和/或用於引發所述DNA片段和/或所述DNA片段的互補序列的DNA合成的位點(例如, 使用Roche妨4基因組測序儀FLX系統的Roche 454A和454B測序標籤)。因此,當轉移鏈的5'部分顯示測序標籤的序列時,5'加標籤的DNA片段具有包括該測序標籤(例如,Roche 454測序標籤)或由該測序標籤構成的第一標籤。然後,DNA聚合酶將包括第二測序標籤(例如,Roche 454B測序標籤)或由第二測序標籤構成的第二標籤與5'加標籤的DNA 片段接合,從而產生每端帶有測序標籤(例如,454A和454B測序標籤)的5'和3'加標籤的DNA片段的文庫。在期望的大小範圍內的文庫內的5'和3'加標籤的DNA片段用作使用Roche 454基因組測序儀FLX系統的下一代測序的模板。在其他的實施方案中,用為下一代測序的測序標籤的第一標籤和第二標籤產生5'和3'加標籤的DNA片段,所述下一代測序使用其他的測序平臺(例如,使用ROCHE 454測序平臺、ILLUMINA S0LEXA 測序平臺、 LIFE TECHNOLOGIES/APPLIED BI0SYSTEMS 的 SOLID 測序平臺、PACIFIC BIOSCIENCES 的 SMRT 測序平臺、P0LL0NAT0R Polony測序平臺、COMPLETE GENOMICS測序平臺、INTELLIGENT BIOSYSTEMS的測序平臺、或HELIC0S測序平臺)。
在一些實施方案中,不同的雙鏈轉座子末端的每一個都包含具有5'部分和3' 部分的不同的轉移鏈,其中每個不同的轉移鏈的5'部分顯示不同的期望的標籤序列並且該3'部分顯示相應的轉移的轉座子末端序列。在一些實施方案中,例如,在圖8提供的一個實例中所顯示的,文庫中的5'和3'加標籤的DNA片段具有在其5'端中的第一標籤和在其3'端中的第二標籤。圖8中顯示的不同的轉座子末端已在由同一轉座酶催化的分別的體外轉座事件過程中被插入在不同的位置中。然而,在一些其他的實施方案中, 使用與不同的轉座子末端形成功能轉座複合物的不同的轉座酶。在每個轉座子末端的轉移鏈的5'部分中的不同標籤能夠顯示用於任何期望目的的任何期望的序列。通過舉例, 在一些實施方案中,5'和3'加標籤的DNA片段的第一標籤和第二標籤顯示Roche 454A 和Roche 454B測序標籤的序列,並且在分離處於期望的大小範圍內的片段後,被用作使用Roche 454基因組測序儀FLX系統的下一代的模板。類似地,在其他的實施方案中,5 『 和3'加標籤的DNA片段,在分離處於期望大小範圍內的那些片段後,被用作使用另一測序平臺的下一代的模板(例如,使用ROCHE 454測序平臺、ILLUMINA S0LEXA 測序平臺、 LIFE TECHNOLOGIES/APPLIED BIOSYSTEMS 的 SOLID 測序平臺、PACIFIC BIOSCIENCES 的 SMRT 測序平臺、P0LL0NAT0R Polony測序平臺、COMPLETE GENOMICS測序平臺、INTELLIGENT BIOSYSTEMS的測序平臺、或HELIC0S測序平臺)。在一些優選的實施方案中,使用這種方法從包括細胞或生物的全基因組的靶DNA中產生5'和3'加標籤的DNA片段。在一些實施方案中,用親和性結合分子(例如,生物素)或用可檢測的分子(例如,螢光染料)對第一轉座子末端或第二轉座子末端的轉移鏈進行標記,所述親和性結合分子或可檢測的分子允許對5'端具有標籤的DNA片段進行捕獲(例如,使用抗生蛋白鏈菌素結合的表面捕獲生物素化的分子)或檢測,所述標籤帶有親和性結合分子或可檢測的分子。添加標籤域至5'和3'加標籤的DNA片段在一些實施方案中,使用DNA聚合酶和包括標籤域的模板的寡核苷酸來添加標籤域至加標籤的DNA片段的文庫中的5'和3' 加標籤的DNA片段的3'端(例如,圖19)。在一些實施方案中,用於添加標籤域的DNA聚合酶是熱穩定的DNA聚合酶並且寡核苷酸是PCR引物,並且通過進行PCR將標籤域與第二標籤接合。III.靶DNA的斷裂、加標籤和單引物擴增本發明的一種優選的方法包括在體外轉座反應中將由轉座酶和與其形成轉座複合物的轉座子末端構成的轉座體複合物與靶DNA在一定條件下孵育並持續足夠的時間,其中轉移的轉座子末端插入靶DNA的兩條鏈中的多個位點;將該體外轉座反應的產物與具有鏈置換活性和/或5'核酸酶活性的DNA聚合酶在一定條件下孵育並持續足夠的時間,其中使用靶DNA的相反鏈作為模板延伸具有接合其5'端的轉移的轉座子末端的靶DNA的每條鏈的3'端,其中每次所述DNA聚合酶催化的延伸置換或消化與接合靶DNA的相反鏈的下一個相鄰的轉移的轉座子末端退火的非轉移的轉座子末端,從而產生加雙標籤的DNA片段的文庫,所述加雙標籤的DNA片段各自包含具有在其5'端上的轉移鏈和在其3'端上的非轉移鏈的靶DNA的不同部分,其中所有的加雙標籤的DNA片段的群體基本上代表從中產生它們的靶DNA的序列;並且將加雙標籤的DNA片段的文庫與熱穩定的DNA聚合酶以及顯示轉移的轉座子末端序列的至少一部分的單引物在PCR熱循環條件下孵育,從而產生加雙標籤的DNA片段的擴增文庫。在一些優選的實施方案中,所述方法包括在存在用作熱穩定的DNA 聚合酶的底物的一種或多種標記的dNTP的條件下產生加雙標籤的DNA片段的擴增文庫,從而產生標記的加雙標籤的DNA片段的擴增文庫。因此,本發明的一個實施方案是用於從靶DNA產生的DNA片段的單引物擴增的體外方法,所述方法包括在存在靶DNA的情況下以及在存在由顯示轉移的轉座子末端序列的轉移鏈和顯示非轉移的轉座子末端序列的非轉移鏈構成的轉座子末端的情況下進行轉座反應,所述轉座反應導致包括使該轉移的轉座子末端與靶DNA的每條連結合的多次插入,從而產生對彼此退火的5'加標籤的DNA片段,這些片段中的每一個在其5'端具有顯示轉移的轉座子末端序列的第一標籤;用具有鏈置換活性和/或5'核酸酶活性的DNA聚合酶延伸5'加標籤的DNA片段的3'端,所述DNA聚合酶利用與5'加標籤的DNA片段退火的相反鏈作為模板;並且使用顯示轉移的轉座子末端序列的至少一部分的單引物、熱穩定的DNA聚合酶以及用作該熱穩定的DNA聚合酶的底物的至少一種標記的dNTP進行PCR 擴增反應,從而產生代表靶DNA的加雙標籤的DNA片段的擴增文庫。在一些優選的實施方案中,靶DNA選自真核和/或原核的基因組DNA或通過RNA 的反轉錄製備的雙鏈cDNA。在一些優選的實施方案中,轉座體是選自以下的轉座酶的野生型或高活性突變形式和與該轉座酶形成在轉座反應中有活性的複合物的轉座子末端的複合物Tn5轉座酶、 MuA轉座酶、睡美人轉座酶、Mariner轉座酶、Tn7轉座酶、TnlO轉座酶、Tyl轉座酶和Τη552 轉座酶。在一些優選的實施方案中,單種酶或酶混合物用作具有鏈置換和5'核酸酶活性的DNA聚合酶和熱穩定的DNA聚合酶,所述DNA聚合酶或混合物選自TAQ DNA聚合酶、Tfl DNA聚合酶、Tth DNA聚合酶和FAILSAFE DNA聚合酶混合物的野生型或重組形式。在一些優選的實施方案中,至少一種標記的dNTP包括如下標記例如,花菁(例如,Cy5. 5、Cy5、Cy3、Cy2),FITC,Alexa Fluor (例如,647、594),德克薩斯紅,J0E,5_FAM, 6-FAM,VIC, HEX,6-R0X,羅丹明,麗絲胺,Cyan 500,等等(參見,例如,通過引用併入本文的 Handbook of Molecular Probes (分子探針手冊),R. Haughland, Molecular Probe, Eugene, OR.)。在一些優選的實施方案中,使用這種方法產生的5'和3'加標籤的DNA片段的文庫或擴增文庫來自包括細胞或生物的全基因組或由細胞或生物的全基因組構成的靶DNA。在一些實施方案中,使用這種方法產生的加雙標籤的DNA片段的文庫或擴增文庫來自如下靶DNA 所述靶DNA包括來自存在於環境樣品(例如,用於宏基因組或宏轉錄組的研究或應用)中的所有生物(例如,多種生物)的基因組和/或雙鏈cDNA或由其構成。在所述方法的一些優選的實施方案中,轉移鏈只顯示轉移的轉座子末端序列,並且因此,存在於5'加標籤的DNA片段中的第一標籤只顯示轉移的轉座子末端序列。在一些其他的實施方案中,轉移鏈包括3'部分和5'部分或由其構成,其中該3'部分顯示轉移的轉座子末端序列,並且該5'部分顯示任何其他期望的核苷酸或核苷酸序列,在所述實施方案中,第一標籤包括3'部分和5'部分或由其構成。在其中轉移鏈包括3'部分和5' 部分或由其構成的實施方案中,非轉移鏈可能但不必顯示與轉移鏈的5'部分互補的序列。 在其中轉移鏈包括3'部分和5'部分或由其構成的一些優選的實施方案中,該5'部分顯示包括捕獲域的至少一種核苷酸(例如,包括可被結合於表面的抗生蛋白鏈菌素部分捕獲的生物素部分的核苷酸;或者,例如,另一親和性結合分子)。II.使用轉座酶和連接酶使DNA斷裂並加標籤本發明包括使用轉座酶從包括一種或多種雙鏈(dsDNA)分子或由一種或多種雙鏈(dsDNA)分子構成的靶DNA中產生5'加標籤的片段,然後將顯示與第一標籤不同的DNA 序列的第二標籤與所述5'加標籤的DNA片段的3'端接合的方法、組合物和試劑盒。第一標籤顯示由轉座酶識別的轉座子末端的轉移鏈的序列,並且任選地還顯示為所述轉移的轉座子末端的序列的5'-的一種或多種其他序列。使用核酸連接酶將第二標籤與5'加標籤的DNA片段的3'端在體外接合。本發明的一種方法包括將轉座酶和與其在體外轉座反應中形成轉座複合物的轉座子末端與靶DNA在一定條件下孵育並持續足夠的時間,其中轉移的轉座子末端與靶DNA 接合,產生在5'端具有第一標籤的5'加標籤的DNA片段;將該5'加標籤的DNA片段與核酸連接酶以及包括第二標籤或由第二標籤構成的連接加標籤寡核苷酸在一定條件下孵育並持續足夠的時間,其中該連接加標籤寡核苷酸與5'加標籤的DNA片段的3'端接合,產生5'和3'加標籤的DNA片段的文庫。在一些實施方案中,所述方法還包括使用DNA聚合酶和與第二標籤互補的至少一種引物擴增5'和3'加標籤的DNA片段的文庫的步驟。在一些實施方案中,使用DNA聚合酶擴增5'和3'加標籤的DNA片段的文庫的步驟包括使用熱穩定的DNA聚合酶、與第二標籤互補的第一 PCR引物以及顯示與第一標籤顯示的序列的至少一部分相同的序列的第二 PCR引物的PCR擴增。本發明的一個優選的實施方案是用於從包括一種或多種雙鏈(dsDNA)分子或由其構成的靶DNA中產生包括5'和3'加標籤的DNA片段的加標籤的DNA片段的文庫的方法,所述方法包括提供1.包括一種或多種雙鏈(dsDNA)分子(例如,真核和/或原核基因組DNA或通過 RNA的反轉錄製備的雙鏈cDNA)或由其構成的靶DNA,2.轉座酶(例如,野生型或突變的轉座酶;例如野生型或突變的Tn5轉座酶,例如,ΕΖ-Τη5 轉座酶,或例如 HYPERMU MuA 轉座酶,EPICENTRE Biotechnologies,Madison, WI,USA),以及3.在轉座反應中能夠與該轉座酶形成功能複合物的轉座子末端(例如,由野生型或突變的Tn5轉座酶例如由ΕΖ-Τη5 轉座酶識別的19_bp外端(「0E」)轉座子末端,內端(「IE」)轉座子末端,或「嵌合端」(「ME」)轉座子末端,或者例如由HYPERMU MuA轉座酶識別的Rl和R2轉座子末端),所述轉座子末端包括由轉移鏈和非轉移鏈構成的雙鏈DNA, 所述轉移鏈和非轉移鏈聯合顯示雙鏈的轉座子末端的序列,其中該轉移鏈顯示第一標籤的序列,4.具有能夠與DNA分子的3'羥基連接的5'端並顯示第二標籤的序列的連接加標籤寡核苷酸,以及5.核酸連接酶;將靶DNA與轉座酶和轉座子末端在一定條件下孵育並持續足夠的時間,其中轉座酶催化的轉座子末端插入靶DNA中產生5'加標籤的DNA片段,所述5'加標籤的DNA片段中的每一個在其5 』端上具有第一標籤;以及將該5 『加標籤的DNA片段與核酸連接酶和連接加標籤寡核苷酸在一定條件下孵育並持續足夠的時間,其中該第二標籤與5'加標籤的DNA片段的3'端接合併產生5'和 3'加標籤的DNA片段的文庫,這些加標籤的DNA片段中的每一個具有其5'端上的第一標籤以及其3'端上的第二標籤。在一些優選的實施方案中,轉移鏈只顯示轉移的轉座子末端序列,並且因此,存在於加標籤的DNA片段中的第一標籤只顯示轉移的轉座子末端序列。在一些其他的實施方案中,轉移鏈包括3'部分和5'部分或由其構成,其中該3'部分顯示轉移的轉座子末端序列,並且該5'部分顯示任何其他期望的序列,在所述實施方案中,第一標籤包括3'部分和5'部分或由其構成。在其中轉移鏈包括3'部分和5'部分或由其構成的實施方案中, 非轉移鏈可能但不必顯示與轉移鏈的5'部分互補的序列。在一些實施方案中,其中轉移鏈包括3'部分和5'部分或者由其構成,該5'部分顯示測序標籤(例如,第一 Roche妨4測序標籤,例如,Roche 454A)的序列並且該3'部分顯示轉座子末端的轉移鏈的序列。如本文所用的「測序標籤」表示與從靶DNA分子中產生的單鏈DNA片段的5'端或3'端接合的標籤,所述標籤為了促進所述DNA片段的測序的目的。例如,在一些實施方案中,測序標籤提供了用於在表面上捕獲所述DNA片段鏈和/或用於引發所述DNA片段或所述DNA片段的互補序列的DNA合成的位點(例如,使用Roche 454 基因組測序儀FLX系統的Roche 454A和454B測序標籤)。因此,當轉移鏈的5'部分顯示測序標籤的序列時,5'加標籤的DNA片段具有包括該測序標籤(例如,Roche 4 測序標籤)或由該測序標籤構成的第一標籤。然後,核酸連接酶將具有包括第二測序標籤(例如, Roche 454B測序標籤)或由第二測序標籤構成的第二標籤的連接加標籤寡核苷酸與5'加標籤的DNA片段連接,從而產生每端帶有測序標籤(例如,454A和Roche 454B測序標籤) 的5'和3'加標籤的DNA片段的文庫。產生具有期望的大小範圍的5'和3'加標籤的 DNA片段用作使用Roche 4 基因組測序儀FLX系統的下一代測序的模板。在其他的實施方案中,產生了包括一定大小的加標籤的DNA片段並且帶有適合作為下一代測序的測序標籤的第一標籤和第二標籤的5'和3'加標籤的DNA片段,所述下一代測序使用另一種測序平臺(例如,使用ROCHE妨4測序平臺、ILLUMINA S0LEXA 測序平臺、LIFE TECHNOLOGIES/ APPLIED BI0SYSTEMS 的 SOLID 測序平臺、PACIFIC BIOSCIENCES 的 SMRT 測序平臺、 P0LL0NAT0R Polony 測序平臺、COMPLETE GENOMICS 測序平臺、INTELLIGENT BI0SYSTEMS 的測序平臺、或HELIC0S測序平臺)。
第二標籤的依賴模板的連接在一些優選的實施方案中,所述方法包括提供包括3'部分和5'部分或由其構成的連接加標籤寡核苷酸,其中該3'部分顯示第二標籤並且該5'部分具有5'-單磷酸基團並在其5'端顯示隨機序列(例如,由大約三個到大約八個核苷酸構成的隨機序列), 所述第二標籤包括期望與5'加標籤的DNA片段的3'端接合的任何序列(即任意序列) 或由其構成。在一些優選的實施方案中,連接加標籤寡核苷酸具有顯示四個核苷酸的隨機序列的5'部分(例如,在本文所述的其中轉座酶是野生型或突變的Tn5轉座酶(例如, ΕΖ-Τη5 轉座酶,或例如,HYPERMU MuA 轉座酶,EPICENTRE Biotechnologies, Madison, WI, USA)並且核酸連接酶是大腸桿菌DNA連接酶的一些實施方案中)。本發明不限於具有顯示由大約三個到大約八個核苷酸構成的隨機序列的5'部分的連接加標籤寡核苷酸。例如,本發明還包括其中連接加標籤寡核苷酸具有以下5'部分的方法顯示只由兩個核苷酸構成的隨機序列;顯示由大於八個核苷酸構成的隨機序列;顯示半隨機序列而不是完全隨機序列;或者顯示包括一個或多個簡併核苷酸(例如,肌苷核苷酸)的序列而不是完全隨機序列。然而,具有顯示由大約三個到大約八個核苷酸構成的隨機序列的5'部分的連接加標籤寡核苷酸是優選的。在一些優選的實施方案中,連接加標籤寡核苷酸與5'加標籤的DNA片段的3' 端的連接只發生在存在DNA模板的情況下,所述DNA模板顯示與連接接點精確互補的序列;在這些實施方案中,與被連接的兩個核酸分子退火的模板在本文稱為「連接模板」並且該連接稱為「依賴模板的連接」。在其中連接只發生在存在連接模板的情況下的一些實施方案中,核酸連接酶為需要連接模板的DNA連接酶,並且在本文被稱為「依賴模板的連接酶」(例如,NAD型依賴模板的DNA連接酶,諸如但不限於大腸桿菌DNA連接酶、Tth DNA連接酶、Tfl DNA連接酶、或AMPLIGASE, DNA連接酶,它們可從EPICENTRE Biotechnologies, MadiSOn,WI,USA商購獲得)。在其中連接只發生在存在連接模板的情況下的一些其他的實施方案中,核酸連接酶為以下DNA連接酶,儘管該DNA連接酶不需要用於連接的連接模板, 但它在存在連接模板時比不存在連接模板時更有效地催化連接(例如,ATP型依賴模板的 DNA連接酶,諸如但不限於T4 DNA連接酶或FASTLINK DNA連接酶,它們可從EPICENTRE Biotechnologies, Madison, WI, USA商購獲得)。如果連接發生在連接模板上,那麼連接在本文被稱為「依賴模板的連接」,即使該連接酶還可以催化不依賴模板的連接。在優選的實施方案中,連接加標籤寡核苷酸的隨機序列是短的,在這些實施方案中,在較低溫度(例如,小於或等於大約40°C、小於或等於大約37°C、小於或等於大約30°C、小於或等於大約 25°C、或小於或等於大約20°C)催化依賴模板的連接酶的核酸是優選的。在一些優選的實施方案中,依賴模板的連接酶是大腸桿菌DNA連接酶。就所用的連接方法而言本發明不受限制,只是就包括依賴模板的連接的實施方案而言,連接應該在存在與連接加標籤寡核苷酸和5'加標籤的DNA片段連續地退火的靶序列的情況下有效地發生,並且連接在不存在靶序列的情況下應很少發生或根本不應發生。 如本文所用,「依賴模板的連接」是指用於分別接合連接加標籤的寡核苷酸以及5'加標籤的DNA片段的相鄰5'端和3'端的任何適合的方法,這些片段當與靶序列退火時相鄰或鄰接或彼此接近。轉座酶催化的轉座子末端插入靶DNA的兩條鏈中導致靶DNA的斷裂、轉移的轉座子末端與靶DNA的每條鏈的接合、以及轉移的轉座子末端的接合的位點3'的單鏈靶DNA 的9鹼基區域的產生,所述9鹼基區域的產生造成靶DNA相反鏈中的缺口區域(例如,圖 3)。轉移的轉座子末端下遊的靶DNA的單鏈區域可充當用於使連接加標籤寡核苷酸的隨機部分退火的連接模板。在由5'中顯示隨機序列的連接加標籤寡核苷酸所代表的所有序列 (其包括所有可能的序列)中,它們中的至少一個在其5'端顯示能夠與靶DNA中的每個單鏈區域退火的序列,以使得連接加標籤寡核苷酸的5'磷酸化末端與互補於5'加標籤的 DNA片段的靶DNA的3 『端相鄰和接近,在這種情況下,核酸連接酶之後可催化連接加標籤寡核苷酸與所述3'端的依賴模板的連接。在一些實施方案中,轉座子末端的轉移鏈在相對接近的兩個位置被插入靶DNA的相反鏈中,產生如圖2所示的兩個5'加標籤的DNA片段以及如圖7所示的兩個5'和3'加標籤的DNA片段。在這兩個5'和3'加標籤的DNA 片段變性後,它們可用於多種應用,包括用於擴增(例如,通過使用與第二標籤互補的第一 PCR引物和與第一標籤互補的第二 PCR引物的PCR)。在包括使用核酸連接酶和依賴模板的連接使第二標籤與5'加標籤的DNA片段接合的方法的一些實施方案中,5'和3'加標籤的DNA片段包括顯示轉座子末端序列的 5'第一標籤和不顯示轉座子末端序列的3'第二標籤(儘管連接加標籤寡核苷酸的3' 部分可包括第二標籤或由第二標籤構成,所述第二標籤顯示任何期望的序列,如果期望的話,包括轉座子末端序列)。例如,在一些實施方案中,連接加標籤寡核苷酸的3'部分顯示 Roche 454測序標籤的序列或用於另一種測序平臺的測序標籤的序列(例如,使用ROCHE 454 測序平臺、ILLUMINA S0LEXA 測序平臺、LIFE TECHNOLOGIES/APPLIED BI0SYSTEMS 的 SOLID 測序平臺、PACIFIC BIOSCIENCES 的 SMRT 測序平臺、P0LL0NAT0R Polony 測序平臺、COMPLETE GENOMICS 測序平臺、INTELLIGENT BIOSYSTEMS 的測序平臺、或 HELIC0S 測序平臺)。通過另外的實例,在一些實施方案中,連接加標籤寡核苷酸的3'部分中的第二標籤顯示RNA聚合酶啟動子(例如,T7型RNA聚合酶啟動子;例如,T7、T3、SP6或噬菌體N4 MINI-V RNA 聚合酶啟動子;EPICENTRE Biotechnologies, Madison, WI, USA)的序列;一般地,如果RNA聚合酶需要雙鏈RNA聚合酶啟動子,這些實施方案中的第二標籤顯示「正義 RNA聚合酶啟動子序列」,表示與由RNA聚合酶轉錄的模板DNA鏈的3 『端接合的RNA聚合酶啟動子的序列,在這些實施方案中,互補的「反義RNA聚合酶啟動子序列」還必須在方法的步驟過程中提供或合成,以產生將由RNA聚合酶識別的雙鏈RNA聚合酶啟動子。在一些實施方案中,連接加標籤寡核苷酸的3'部分中的第二標籤也顯示「地址標籤」的序列,表示允許識別特異性樣品的序列(例如,通過使用顯示對每個靶DNA樣品不同的序列的連接加標籤寡核苷酸中的地址標籤)。在一些實施方案中,連接加標籤寡核苷酸的3'部分還顯示所述方法中用於特定目的的一種或多種其他標籤的序列。在一些優選的實施方案中,連接加標籤寡核苷酸的5'部分是能夠與5'加標籤的DNA片段的單鏈部分退火的一定長度的隨機序列,所述5'加標籤的DNA片段由轉座酶催化的轉座子末端插入靶DNA的兩條鏈中而產生。在連接加標籤寡核苷酸的5'部分中的隨機序列與相鄰於5'加標籤的DNA片段的3'端的這種單鏈缺口區域退火,該隨機序列充當進行連接加標籤寡核苷酸與靶DNA的互補鏈的3'端的依賴模板的連接的連接模板。在使用EZ-Tn5 轉座酶的實施方案中,19-bp EZ-Tn5 轉座子末端寡核苷酸插入到靶DNA的兩條鏈中產生顯示9鹼基缺口的5 『加標籤的DNA片段,所述9鹼基缺口由與轉移的轉座子末端插入位點相反的單鏈區域構成。然而,其中連接加標籤寡核苷酸可與之退火的缺口的大小對於不同的轉座酶而言是可變的。例如,MuA轉座酶產生只有五個核苷酸的在轉移的轉座子末端的插入位點下遊的靶DNA的單鏈區域。在一些實施方案中,連接加標籤寡核苷酸的隨機序列包括大約三個至大約八個隨機核苷酸或由大約三個至大約八個隨機核苷酸構成。然而,根據所產生的單鏈區域的大小和其他因素,諸如與相應核酸連接酶最有效連接的隨機序列的長度和使用的連接條件,連接加標籤寡核苷酸的隨機序列部分的長度對於不同的轉座酶來說可以是不同的。例如,申請人觀察到,使用用EZ-Tn5 轉座酶產生的5'加標籤的DNA片段,具有由四個核苷酸的隨機序列構成的5'部分的連接加標籤的寡核苷酸用大腸桿菌DNA連接酶作為核酸連接酶產生良好產率的5'和3'加標籤的DNA片段。然而, 具有由四個核苷酸的隨機序列構成的5'部分的這種連接加標籤的寡核苷酸在類似連接條件下沒有被熱穩定的依賴DNA的連接酶諸如AMPLIGASE 熱穩定的連接酶有效連接。在優選的實施方案中,5'和3'加標籤的DNA片段包括從DNA樣品產生的所有DNA片段或由其構成。在一些實施方案中,用於依賴模板的連接的核酸連接酶是使用NAD作為輔因子的連接酶。在一些實施方案中,用於依賴模板的連接的核酸連接酶選自以下NAD型DNA連接酶大腸桿菌DNA連接酶、Tth DNA連接酶、TflDNA連接酶和Ampligase DNA連接酶 (全部購自 EPICENTRE Biotechnologies, Madison, WI, USA)以及 Tsc DNA 連接酶(Roche Applied Systems, Indianapolis, IN, USA)。在一些實施方案中,用於依賴模板的連接的核酸連接酶是ATP型DNA連接酶。在一些實施方案中,ATP型DNA連接酶選自T4 DNA連接酶和 FASTLINK DNA 連接酶(EPICENTRE Biotechnologies,Madison,WI,USA)。在一些優選的實施方案中,核酸連接酶選自大腸桿菌DNA連接酶或利用NAD作為輔因子的另一種嗜常溫細菌DNA連接酶。在一些優選的實施方案中,對大小選擇的5'加標籤的DNA片段進行大小選擇和純化以改善使用依賴DNA模板的DNA連接酶(例如,大腸桿菌DNA連接酶)將連接加標籤寡核苷酸與5'加標籤的DNA片段連接的效率。第二標籤的不依賴模板的連接在包括使用核酸連接酶使第二標籤與5'加標籤的DNA片段的3'端接合的方法的一些實施方案中,將顯示第二標籤的連接加標籤寡核苷酸直接與5'加標籤的DNA片段的3'端連接而無需使連接加標籤寡核苷酸與相鄰於5'加標籤的DNA片段的3'端的連接模板退火。在這些實施方案中,連接加標籤寡核苷酸不顯示隨機序列,而是只顯示期望與5'加標籤的DNA片段接合的第二標籤的序列。在這些實施方案中,將連接加標籤寡核苷酸直接與單鏈的5'加標籤的DNA片段的3'端連接而不使用連接模板。在所述方法的這些實施方案中,核酸連接酶是能夠在不存在與連接接點處的互補序列退火的情況下連接具有3'羥基基團的單鏈DNA分子與具有5'-單磷酸基團的單鏈DNA分子的核酸連接酶 (例如,選擇T4 RNA連接酶1,T4 RNA連接酶2,噬菌體TS2U6熱穩定的RNA連接酶,以及 CIRCLIGASE DNA 連接酶,EPICENTRE Biotechnologies, Madison, WI, USA);並且所述方法另外包括如下步驟使包括5'加標籤的DNA片段的dsDNA變性,之後將該5'加標籤的DNA 片段與核酸連接酶和連接加標籤寡核苷酸孵育。本發明不限於特定的核酸連接酶,並且將理解包括將5'加標籤的DNA片段與核酸連接酶在其中將第二標籤與5'加標籤的DNA片段的3'端接合併產生5'和3'加標籤的DNA片段的文庫的條件下孵育並持續足夠的時間的方法還包括使用其他組合物代替核酸連接酶以用於依賴模板或不依賴模板的接合。通過舉例,可使用其他連接方法,諸如但不限於包括拓撲異構酶部分的連接加標籤寡核苷酸的使用,其中連接包括拓撲異構酶介導的連接(例如,通過引用併入本文的美國專利第5,766,891號),儘管拓撲異構酶介導的連接在大多數實施方案中不是優選的。IV.使用轉座酶和連接酶從Ds-靶DNA產生加標籤的環狀&-DNA片段(30842)本發明包括用於從樣品中的靶DNA產生包括加標籤的環狀ssDNA片段的群體的文庫以用作DNA測序或核酸擴增反應中的模板的方法、組合物和試劑盒。一般地,文庫中的每個加標籤的環狀ssDNA片段顯示靶DNA的一部分的連續序列和標籤的連續序列。簡言之,在某些實施方案中,所述方法包括將一般為dsDNA的靶DNA與轉座酶和轉座子末端組合物在體外轉座反應中孵育以使該靶DNA同時斷裂並加標籤,從而產生加標籤的DNA片段的群體;然後使該加標籤的DNA片段變性以產生5'加標籤的ssDNA片段, 然後將該5'加標籤的ssDNA片段與能夠催化ssDNA的不依賴模板的分子內連接(即,環化)的不依賴模板的核酸連接酶或非同源的核酸連接酶孵育以產生加標籤的環狀ssDNA片段的文庫。在一些實施方案中,通過如下方式使加標籤的環狀ssDNA片段線性化使與標籤內的限制性位點退火的寡脫氧核糖核苷酸退火,然後用限制性內切核酸酶處理以產生在 5'端上具有標籤的一部分並且在3'端上具有標籤的剩餘部分的線性ssDNA片段(這些線性ssDNA片段在本文被稱為「加雙標籤的線性ssDNA片段」或簡稱為「加雙標籤的ssDNA 片段」)。在一些實施方案中,加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段用作核酸擴增和/或DNA測序反應中的DNA模板。在一些實施方案中,所述方法還包括對加標籤的環狀ssDNA片段進行擴增和/或測序的步驟(例如,來擴增或確定靶DNA的序列)。在一些實施方案中,所述方法還包括對通過擴增加標籤的環狀ssDNA片段或加雙標籤的線性 ssDNA片段獲得的與靶DNA互補的DNA進行測序的步驟。在一些實施方案中,使用DNA聚合酶和與標籤互補的至少一種引物對加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段的每一個中的靶DNA的至少一部分進行測序(例如,通過合成測序)。在一些實施方案中,使用依賴模板的連接酶連接與標籤互補的至少一種寡脫氧核糖核苷酸和與靶序列的部分退火的至少另一種寡脫氧核糖核苷酸,對加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA 片段中的每一個中的靶DNA的至少一部分進行測序(例如,通過連接測序)。在一些實施方案中,通過使與標籤以及與靶序列的一部分退火或雜交的寡脫氧核糖核苷酸退火,對加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段的每一個中的靶DNA的至少一部分進行測序(例如,通過雜交測序)。在一些實施方案中,利用通過合成測序、通過連接測序、或通過雜交測序,對與加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段互補的DNA進行測序。因此,本發明的一個優選的實施方案是用於從樣品中的靶DNA產生包括加標籤的環狀ssDNA片段的群體的文庫用作DNA測序或核酸擴增反應中的模板的方法,所述加標籤的環狀ssDNA片段的每一個顯示靶DNA的部分的序列以及與該靶序列的部分接合的標籤的序列,所述方法包括
提供1.包括一種或多種雙鏈(dsDNA)分子(例如,真核和/或原核基因組DNA或通過 RNA的反轉錄製備的雙鏈cDNA,所述RNA的反轉錄利用依賴RNA的DNA聚合酶或反轉錄酶產生第一鏈cDNA,然後延伸與該第一鏈cDNA退火的引物以產生dsDNA)或由其構成的靶DNA,2.轉座酶(例如,野生型或突變的轉座酶;例如野生型或突變的Tn5轉座酶,例如,ΕΖ-Τη5 轉座酶,例如 HYPERMU MuA 轉座酶,EPICENTRE Biotechnologies, Madison, WI,USA),以及3.在轉座反應中能夠與該轉座酶形成功能複合物的轉座子末端組合物(例如,包括由野生型或突變的Tn5轉座酶例如由EZ-Tn5 轉座酶識別的19_bp外端(「0E」)轉座子末端,19-bp內端(「IE」)轉座子末端,或19-bp 「嵌合端」(「ME」)轉座子末端或由其構成),所述轉座子末端組合物包括轉移鏈和非轉移鏈或由其構成,所述轉移鏈和非轉移鏈聯合顯示雙鏈的轉座子末端的序列,其中該轉移鏈顯示標籤的序列,4.能夠對具有5'-單磷酸和3'-羥基基團的ssDNA進行不依賴模板的分子內連接或環化的不依賴模板的或非同源的核酸連接酶(例如,噬菌體TS2126熱穩定的RNA連接酶,例如,其中高比例的RNA連接酶分子被腺苷酸化);將靶DNA與轉座酶和轉座子末端組合物在一定條件下孵育並持續足夠的時間,其中轉座酶催化的轉移鏈插入靶DNA中產生5'加標籤的DNA片段(例如,圖2);以及使包括5'加標籤的DNA片段的靶DNA變性以獲得5'加標籤的ssDNA片段;以及將5'加標籤的ssDNA片段與核酸連接酶在一定條件下孵育並持續足夠的時間, 其中該5'加標籤的ssDNA片段被分子內連接以產生加標籤的環狀ssDNA片段的文庫,所述加標籤的環狀ssDNA片段的每一個顯示靶DNA的一部分的序列和標籤的序列。在一些實施方案中,在連接步驟之前,所述方法另外包括除去在轉座反應過程中未加標籤的靶DNA和/或除去未與靶DNA接合的轉座子末端組合物的組分的一個或多個步馬聚ο在一些實施方案中,所述方法另外包括用外切核酸酶I處理包含加標籤的環狀 ssDNA片段的文庫以除去未連接的線性ssDNA。在一些實施方案中,所述方法另外包括用外切核酸酶I和外切核酸酶III (EPICENTRE Biotechnologies,Madison, WI)處理反應混合物以除去未連接的線性ssDNA的步驟。外切核酸酶III通過消化從分子內退火或分子間退火產生的線性ssDNA分子的雙鏈區域幫助除去一些線性ssDNA。在一些優選的實施方案中,所述方法另外包括用T5外切核酸酶(EPICENTRE Biotechnologies,Madison, WI)處理加標籤的環狀ssDNA片段的文庫以除去未連接的線性ssDNA和dsDNA (例如,有切口的和/或包含單鏈區域的DNA片段)。在一些實施方案中,所述方法還包括通過轉錄擴增加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段,所述方法包括(a)使顯示互補的反義啟動子序列的寡脫氧核糖核苷酸與正義啟動子序列退火,或者使加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA 片段和與其互補的引物退火,並且在其中合成雙鏈的RNA聚合酶啟動子的條件下用DNA聚合酶延伸該引物;以及(b)將dsDNA產物與結合RNA聚合酶啟動子的RNA聚合酶在其中合成RNA的條件下孵育。在其中轉移鏈或PCR引物顯示RNA聚合酶啟動子序列的一些優選的實施方案中,該RNA聚合酶啟動子是T7型RNA聚合酶啟動子並且所述方法還包括使用識別該啟動子的 T7型RNA聚合酶在體外轉錄加標籤的環狀ssDNA片段的步驟。更優選地,從T7 RNAP, T3 RNAP和SP6 RNAP以及對應的同源啟動子中選擇RNA聚合酶和啟動子。然而,本發明的方法的轉錄步驟可使用如下任何RNAP 對於所述RNAP而言允許具有高特異性的轉錄的適合的啟動子序列是已知的或者可被獲得。用於體外轉錄的試劑盒和酶從許多賣家可商購獲得並且用於執行包括體外轉錄的本發明的步驟的適當的反應混合物和條件可按製造商所述使用那些產品。例如,使用T7 RNAP的體外轉錄可按照產品資料所述使用來自EPICENTRE Biotechnologies, Madison, WI 的 AMPLISCRIBE T7-FLASH 轉錄試劑盒或 AMPLISCRIBE T7高產量轉錄試劑盒。類似地,如果Τ3 RNAP或SP6 RNAP在本發明的方法中用於體外轉錄,那麼AMPLISCRIBE T3-FLASH 高產量轉錄試劑盒或AMPLISCRIBE SP6高產量轉錄試劑盒(EPICENTRE Biotechnologies, Madison, WI)分別可按照所述使用。在一些實施方案中,轉移鏈、連接加標籤寡核苷酸或PCR引物除了 RNA聚合酶啟動子序列以外還顯示用於翻譯的另外序列,諸如但不限於核糖體結合位點和翻譯起始密碼子 (也稱為「翻譯起始信號」),並且所述方法另外包括翻譯轉錄的RNA。在這些實施方案中的一些實施方案中,所述方法還包括體外翻譯得到的RNA轉錄本的步驟。用於RNA轉錄本的體外翻譯的系統和試劑盒也可以從許多來源商購獲得並且可用於本發明。例如,來自Promega Corporation,Madison, WI的兔網織紅細胞裂解物、小麥胚芽提取物和大腸桿菌S30提取物系統可用於本發明。更進一步,體外轉錄和體外翻譯偶聯的試劑盒也可以商購獲得並且可被使用,諸如來自Promega的TNT⑧快速偶聯的轉錄/翻譯系統。在一些其他的實施方案中,所述方法還包括使用DNA聚合酶和與標籤互補的至少一種引物對加標籤的環狀ssDNA片段中的靶DNA進行擴增和/或測序的步驟。在一些實施方案中,使用DNA聚合酶擴增加標籤的環狀ssDNA片段的步驟包括滾環複製。在一些實施方案中,使用DNA聚合酶擴增加標籤的環狀ssDNA片段的步驟包括使用熱穩定的DNA聚合酶以及與標籤的至少一部分互補的第一 PCR引物和與標籤的互補序列的至少一部分互補的第二 PCR引物的PCR擴增。在一些實施方案中,所述方法還包括使用RNA聚合酶擴增加標籤的環狀ssDNA片段的步驟。因此,在一些其他的實施方案中,所述方法還包括通過滾環複製(RCR)擴增加標籤的環狀ssDNA片段的步驟,所述方法包括(a)使與加標籤的環狀ssDNA片段互補的引物退火;以及(b)使用鏈置換DNA聚合酶(例如,phi29 DNA聚合酶或rBst DNA聚合酶大片段 (EPICENTRE)或DISPLACEACE DNA聚合酶(EPICENTRE))延伸與加標籤的環狀ssDNA片段退火的引物。在這些實施方案中,RCR擴增產物是與加標籤的環狀ssDNA片段互補的多聯體 ssDNA分子。在其中加標籤的環狀ssDNA片段顯示反義啟動子序列的一些實施方案中,多聯體RCR擴增產物顯示正義啟動子序列,並且所述方法還包括使RNA聚合酶啟動子為雙鏈的 (例如,通過使顯示反義啟動子序列的互補寡脫氧核糖核苷酸與正義啟動子序列退火,然後使用結合雙鏈RNA聚合酶啟動子並自其啟動轉錄的RNA聚合酶轉錄該多聯體DNA。在一些優選的實施方案中,轉座子末端組合物包括只顯示轉移的轉座子末端序列的轉移鏈,並因此,標籤只顯示轉移的轉座子末端序列。在一些其他的實施方案中,轉座子末端組合物包括轉移鏈,所述轉移鏈包括3'部分和5'部分或由其構成,其中該3'部分顯示轉移的轉座子末端序列,並且該5'部分顯示任何其他期望的序列,在所述實施方案中,標籤包括3'部分和5'部分或由其構成。在其中轉座子末端組合物包括轉移鏈,所述轉移鏈包括3'部分和5'部分或由其構成的一些實施方案中,非轉移鏈顯示與轉移鏈的 5'部分互補的序列。然而,在轉座子末端組合物的一些優選的實施方案中,非轉移鏈不顯示與轉移鏈的5'部分互補的序列。在一些優選的實施方案中,非轉移鏈只顯示非轉移的轉座子末端序列。在一些優選的實施方案中,非轉移鏈顯示不與非轉移的轉座子末端序列 3'-的轉移鏈互補的序列。在以下任何方法的一些實施方案中,所述方法包括其中轉座子末端組合物包括轉移鏈,所述轉移鏈包括5'部分和3'部分或由5'部分和3'部分構成,該5'部分顯示測序標籤域或捕獲標籤域(例如,Roche 454基因組測序儀FLX系統的測序標籤域或捕獲標籤域,Roche 454A和Roche 454B標籤用於使用Roche 454基因組測序儀FLX系統測序) 的序列並且該3'部分顯示轉移的轉座子末端序列。因此,當轉座子末端組合物包括具有測序標籤域或捕獲標籤域的轉移鏈時,加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA 片段具有的標籤包括測序標籤域或捕獲標籤域(例如,用於利用Roche 454基因組測序儀 FLX系統測序的Roche 454A或Roche 454B標籤)。產生的具有期望的大小範圍的加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段用作利用Roche 454基因組測序儀FLX系統的下一代測序的模板。在其他的實施方案中,產生包括一個或多個限制性位點域、測序標籤域、捕獲標籤域、擴增標籤域、檢測標籤域和/或地址標籤域的加標籤的環狀ssDNA片段或加雙標籤的線性ssDNA片段以用於測序(例如,使用ROCHE 454測序平臺、ILLUMINA S0LEXA 測序平臺、LIFE TECHNOLOGIES/APPLIED BIOSYSTEMS 的 SOLID 測序平臺、PACIFIC BIOSCIENCES 的 SMRT 測序平臺、P0LL0NAT0R Polony 測序平臺、COMPLETE GENOMICS 測序平臺、INTELLIGENT BIOSYSTEMS的測序平臺、或HELIC0S測序平臺)。對哪些另外的序列用於轉移鏈的5'部分或非轉移鏈的3'部分中的一種或多種另外的序列沒有限制,這些序列可用來完成任何期望的目的。在一些實施方案中,轉移鏈的 5'部分或非轉移鏈的3'部分顯示一種或多種標籤域序列。在一些實施方案中,所述方法還包括如下步驟使用缺乏鏈置換和5'到3'外切核酸酶活性的DNA聚合酶(例如,T4 DNA聚合酶,EPICENTRE)延伸包括在轉座反應中產生的5'加標籤的DNA片段的轉移鏈,然後使用依賴模板的DNA連接酶(例如,大腸桿菌DNA 連接酶)利用相反鏈作為連接模板連接每個DNA延伸產物的3'端與包括加標籤的DNA片段的非轉移鏈的5'端;在這些實施方案中,轉座子末端組合物的非轉移鏈的5'端具有 5' _單磷酸基團。所述方法的這種實施方案產生加雙標籤的ssDNA片段。在本發明的實施方案的發展過程中開展的工作導致如下觀察在dsDNA中發生轉座。因此,在一些優選的實施方案中,轉座子末端組合物包括只顯示非轉移的轉座子末端序列的非轉移鏈或由其構成,以使得轉移鏈的5'部分為單鏈的(例如,為了使轉移鏈在體外轉座反應過程中插入本身的雙鏈部分中的可能性或頻率降到最低)。在其中非轉移鏈顯示與轉移鏈的5'部分互補的3'部分的優選的實施方案中,使轉移鏈的5'部分的大小最小化以使轉移鏈在體外轉座反應過程中插入本身中的可能性或頻率降到最低。例如,在一些實施方案中,轉移鏈的5'部分的大小(以及非轉移鏈的互補3'部分的大小)小於大約 150個核苷酸、小於大約100個核苷酸、小於大約75個核苷酸、小於大約50個核苷酸、小於大約25個核苷酸或小於大約15個核苷酸。
在一些優選的實施方案中,轉座子末端組合物的轉移鏈的5'端具有5' _單磷酸基團。在一些優選的實施方案中,非轉移鏈的5'端具有5' _單磷酸基團。在一些優選的實施方案中,轉移鏈和非轉移鏈都具有5' _單磷酸基團。在其中轉移鏈不具有5'-單磷酸基團的實施方案中,所述方法還包括在該方法的連接步驟之前使轉移的轉座子末端寡核苷酸的5'端磷酸化的步驟(例如,使用多核苷酸激酶;例如,T4多核苷酸激酶)。轉座酶催化的轉座子末端插入靶DNA中導致該轉移的轉座子末端與靶DNA的一條鏈的5'端的接合以及該鏈在該轉移的轉座子末端序列與該靶DNA的接合位點處的破裂或斷裂,伴隨產生由於在靶DNA的相反鏈中的9鹼基缺口區域所致的位於轉移的轉座子末端與靶DNA接合的位點的3'的單鏈靶DNA的9鹼基區域。例如,圖1顯示轉移的轉座子末端到靶DNA的相反鏈中的兩個獨立插入事件。如圖2所示,轉移的轉座子末端獨立插入到靶 DNA的相反鏈中有時發生在靶DNA中相對接近的位置,產生兩個5 『加標籤的DNA片段。在變性後,釋放兩個5'加標籤的ssDNA片段。5'加標籤的ssDNA片段的不依賴模板的連接在一些實施方案中,不依賴模板的或非同源的核酸連接酶(例如,其進行具有 3'-羥基和5'-單磷酸基團的ssDNA的分子內連接,S卩,環化)被用在使5'加標籤的線性ssDNA片段環化的本發明的方法中。在一些優選的實施方案中,核酸連接酶是熱穩定的RNA連接酶,例如,選自噬菌體TS2126熱穩定的RNA連接酶(美國專利第7,303,901 號和 Blondal 等人,Nucleic Acids Res 33 135-142,2005),CIRCLIGASE ssDNA 連接酶 (EPICENTRE Biotechnologies,Madison,WI,USA),以及古細菌RNA連接酶(例如,嗜熱自養甲烷桿菌 RNA 連接酶 1 或「MthRnl 」;Torchia,C 等人,Nucleic Acids Res. 36 :6218_6227, 2008)。提及「不依賴模板的連接酶」或「非同源連接酶」,它表示在不存在互補序列與將被接合或連接的ssDNA的末端退火的情況下導致ssDNA的連接的連接酶(即,兩個末端沒有與互補序列退火來保持這兩個末端在連接步驟過程中彼此相鄰)。在這些實施方案中,所述方法包括如下步驟通過將5'加標籤的線性ssDNA片段與核酸連接酶孵育使在體外轉座反應中產生的退火的5'加標籤的DNA片段變性。提及「分子內連接」,我們表示一個ssDNA 分子的兩個末端彼此連接產生環狀ssDNA片段,而不是與其他DNA分子的末端連接。在一些優選的實施方案中,非同源連接反應在「改進的連接反應混合物」中進行, 所述「改進的連接反應混合物」在本文表示包括如下的連接反應混合物a)加標籤的線性 ssDNA片段;b)保持pH的緩衝液;b)Mn2+陽離子;以及c)熱穩定的RNA連接酶分子組合物,其中高比例熱穩定的RNA連接酶分子被腺苷酸化;其中腺苷酸化的熱穩定的RNA連接酶分子的濃度至少等於線性ssDNA片段摩爾濃度,並且其中沒有向該連接反應混合物中添加 ATP或Mg2+陽離子。提及語句「高比例熱穩定RNA連接酶分子被腺苷酸化」,它表示在改進的連接反應混合物中所有熱穩定的RNA連接酶分子的至少約50%被腺苷酸化。在改進的連接反應混合物的一些實施方案中,所有熱穩定的RNA連接酶分子的大於約60%被腺苷酸化。在改進的連接反應混合物的一些實施方案中,所有熱穩定的RNA連接酶分子的大於約70%被腺苷酸化。在改進的連接反應混合物的一些實施方案中,所有熱穩定的RNA連接酶分子的大於約 80%被腺苷酸化。在改進的連接反應混合物的一些優選的實施方案中,所有熱穩定的RNA 連接酶分子的大於約90%被腺苷酸化。在改進的連接反應混合物的一些優選的實施方案中,所有熱穩定的RNA連接酶分子的大於約95%被腺苷酸化。在一些優選的實施方案中, 熱穩定的RNA連接酶被腺苷酸化來製備如下組合物其中通過在純化過程之中或之後將熱穩定的RNA連接酶分子與ATP孵育將該酶腺苷酸化。例如,可用於使熱穩定的RNA連接酶腺苷酸化的一個方案是在50°C下在包含50mM Tris-HCl,pH 8. 0、2mM MgCl2UOOmM NaCl以及0. 5mM ATP的溶液中孵育該酶15分鐘;然後通過添加EDTA至5mM的終濃度終止反應; 然後通過透析或凝膠過濾除去反應組分。腺苷酸化的熱穩定的RNA連接酶的百分比可通過 SDS-PAGE分析來估計。在一些優選的實施方案中,其中高比例熱穩定的RNA連接酶分子被腺苷酸化的熱穩定的RNA連接酶為噬菌體TS2U6熱穩定的RNA連接酶。在改進的連接反應混合物的一些實施方案中,緩衝液將PH保持在pH8.0之間。在改進的連接反
應混合物的一些優選的實施方案中,緩衝液將PH保持在pH 7.0和pH 8.0之間。在改進的連接反應混合物的一些優選的實施方案中,將PH保持在pH 7.0和pH 8.0之間的緩衝液是 Tris緩衝液。在改進的連接反應混合物的一些實施方案中,Mn2+陽離子的濃度在0. 5mM和 IOmM之間。在改進的連接反應混合物的一些實施方案中,Mn2+陽離子的濃度在ImM和IOmM 之間。在改進的連接反應混合物的一些實施方案中,Mn2+陽離子的濃度在ImM和5mM之間。 在改進的連接反應混合物的一些優選的實施方案中,Mn2+陽離子的濃度為2. 5mM。在改進的連接反應混合物的一些優選的實施方案中,Mn2+陽離子作為MnCl2而提供。在一些實施方案中,在改進的連接反應混合物中的腺苷酸化的熱穩定的RNA連接酶分子為線性ssDNA片段的摩爾濃度的至少兩倍。在一些實施方案中,在改進的連接反應混合物中的腺苷酸化的熱穩定的RNA連接酶分子為線性ssDNA片段的摩爾濃度的至少五倍。在一些實施方案中,在改進的連接反應混合物中的腺苷酸化的熱穩定的RNA連接酶分子為線性ssDNA片段的摩爾濃度的至少十倍。在一些優選的實施方案中,改進的連接反應混合物另外包括鹽,諸如氯化鉀或醋酸鉀(例如,濃度在大約50mM到大約IOOmM)。在一些優選的實施方案中,改進的連接反應混合物另外包括還原劑,諸如二硫蘇糖醇(DTT)(例如,濃度在大約0. 5mM或ImM)。 在一些實施方案中,改進的連接反應混合物另外包括濃度在0. 25M到5. 2M之間的兩性離子的三甲基甘氨酸(甜菜鹼)。在一些實施方案中,改進的連接反應混合物另外包括濃度在 0.5M到2M之間的兩性離子的三甲基甘氨酸(甜菜鹼)。在一些實施方案中,改進的連接反應混合物另外包括大約IM濃度的兩性離子的三甲基甘氨酸(甜菜鹼)。在一些優選的實施方案中,改進的連接反應混合物包括a)具有5'-磷醯基和和 3'-羥基基團的線性ssDNA片段(例如,0. 5微摩爾);b)pH 7. 8的33mMTRIS乙酸;b) 2. 5mM Mn2+陽離子;以及c)熱穩定的RNA連接酶分子的組合物,其中> 70%的熱穩定的RNA連接酶分子被腺苷酸化;其中腺苷酸化的熱穩定的RNA連接酶分子的濃度至少等於線性ssDNA 片段的摩爾濃度(例如,大約1微摩爾腺苷酸化的熱穩定的RNA連接酶用於0. 5微摩爾加標籤的線性ssDNA片段),並且其中沒有向該連接反應混合物中添加ATP或Mg2+陽離子。在一些優選的實施方案中,腺苷酸化的熱穩定的RNA連接酶分子的濃度為線性ssDNA片段的摩爾濃度的至少5倍、至少10倍或至少20倍(例如,大約2. 5微摩爾、大約5微摩爾或大約 10微摩爾的腺苷酸化的熱穩定的RNA連接酶用於0. 5微摩爾的加標籤的線性ssDNA片段)。 在一些優選的實施方案中,改進的連接反應混合物另外包括66mM醋酸鉀和0. 5mM DTT0在一些優選的實施方案中,改進的連接反應混合物另外包括IM甜菜鹼。在所述方法的一些優選的實施方案中,合成加標籤的環狀ssDNA片段的5'加標籤的線性ssDNA片段的分子內連接在大約40°C到大約70°C之間的溫度下在連接反應混合物中進行足夠的時間(例如,從大約1小時到大約72小時),其中合成加標籤的環狀ssDNA 片段。在一些優選的實施方案中,分子內連接在大約60°C的反應溫度下進行足夠的時間,其中合成了環狀ssDNA片段。本發明不僅限於本文所述的特定核酸連接酶。本領域技術人員將理解可使用具有與本文所述的活性相似的活性的任何核酸連接酶進行分子內連接,意味著該核酸連接酶導致具有3'-羥基和5' _單磷酸基團的ssDNA的非同源分子內連接。V.通過髮夾轉座子末端的體外轉座使Ds-DNA斷裂並加標籤(30963)簡言之,在一些實施方案中,所述方法包括將為dsDNA的靶DNA與轉座酶和髮夾轉座子末端組合物在體外轉座反應中孵育以使該靶DNA同時斷裂和加標籤,從而產生包括 5'加標籤的DNA片段的群體的文庫;然後使包括靶DNA的一條鏈的一部分的每個5'加標籤的DNA片段的3'端與包括互補部分(即,靶DNA的相反鏈)的另一個5'加標籤的DNA 片段的5'端接合,從而產生共價閉合的加標籤的環狀DNA片段(例如,其顯示單鏈環狀結構或啞鈴形結構)的文庫。在一些優選的實施方案中,接合的步驟包括用缺乏5'到3' 外切核酸酶(包括依賴結構的5'核酸酶)和鏈置換活性的DNA聚合酶延伸5'加標籤的 DNA片段的3'端以產生5'加標籤的DNA片段延伸產物,並且使用依賴模板的DNA連接酶 (例如,大腸桿菌DNA連接酶或來自嗜冷細菌或嗜冷噬菌體的依賴模板的DNA連接酶)連接所述5'加標籤的DNA片段延伸產物中的每一個的3'端與互補的5'加標籤的DNA片段延伸產物的5'端。在其他優選的實施方案中,接合的步驟包括將具有精確地填充從體外轉座反應產生的單鏈缺口的一種或多種適合的大小(例如,用於填充從使用EZ-Tn5 轉座酶的體外轉座中產生的單鏈缺口的包括隨機序列或半隨機序列9-mer或隨機序列4-mer以及隨機序列5-mer或者由其構成的5'-單磷酸化的隨機序列寡脫氧核糖核苷酸)的隨機序列寡脫氧核糖核苷酸(例如,5'-單磷酸化或5'-腺苷酸化的隨機序列或半隨機序列寡脫氧核糖核苷酸)和依賴模板的DNA連接酶(例如,大腸桿菌DNA連接酶或來自嗜冷細菌或嗜冷噬菌體的依賴模板的DNA連接酶)與5'加標籤的DNA片段在一定條件下孵育並持續足夠的時間,其中該隨機序列寡核苷酸退火以便填充5'加標籤的DNA片段中的單鏈缺口並且被連接,從而產生加標籤的環狀DNA分子的群體。因此,本發明的一個優選的實施方案是用於從雙鏈靶DNA產生包括加標籤的環狀 DNA片段的群體的文庫用作DNA測序或核酸擴增反應中的模板的方法,所述加標籤的環狀 DNA片段的每一個顯示靶DNA的部分的兩條鏈的序列以及與標籤的序列,所述方法包括提供1.包括一種或多種雙鏈(dsDNA)分子(例如,來自真核細胞的基因組dsDNA、線粒體dsDNA、葉綠體dsDNA或其他dsDNA和/或來自原核細胞的基因組DNA或附加體DNA,或通過來自真核細胞和/或原核細胞的RNA的反轉錄產生第一鏈cDNA,然後延伸與該第一鏈 cDNA退火的引物而製備的雙鏈cDNA)或由其構成的靶DNA ;2.轉座酶(例如,野生型或突變的轉座酶;例如野生型或突變的Tn5轉座酶,例如,ΕΖ-Τη5 轉座酶,例如 HYPERMU MuA 轉座酶,EPICENTRE Biotechnologies, Madison, WI,USA);以及3.能夠在轉座反應中與轉座酶形成功能複合物並且顯示標籤的序列的髮夾轉座子末端組合物,其中所述髮夾轉座子末端組合物包括含5'-磷酸的寡核苷酸或由其構成,所述含5'-磷酸的寡核苷酸顯示在其5'端的非轉移的轉座子末端序列(例如,就 EZ-Tn5 非轉移的轉座子末端序列而言本文稱為「MENTS」 )、在其3'端的轉移的轉座子末端序列(例如,就ΕΖ-Τη5 轉移的轉座子末端序列而言本文稱為「METS」)、以及足夠長的允許分子內莖-環形成的在該非轉移的轉座子末端序列與該轉移的轉座子末端序列之間的間插序列(例如,為任何期望的目的,諸如提供標籤),其中該莖顯示與轉座酶形成對於轉座有功能的複合物的雙鏈轉座子末端的序列(例如,其中該莖顯示由野生型或突變的Τη5 轉座酶例如由ΕΖ-Τη5 轉座酶識別的19-bp外端(「0E」)轉座子末端、19_bp內端(「IE」) 轉座子末端、或19-bp嵌合端(「ME」)轉座子末端)(或者,例如,對於MuA轉座酶而言的 Rl和R2 MuA轉座子末端)並且該環顯示可以為任意序列的間插序列;4. (a)缺乏5'核酸酶活性(包括外切核酸酶和依賴結構的5『核酸酶活性)和鏈置換活性的DNA聚合酶(例如,T4 DNA聚合酶);或(b) —種或多種大小的隨機序列寡核苷酸,它們單獨或聯合起來具有與在轉座酶和髮夾轉座子末端組合物的轉座反應後產生的 5'加標籤的DNA片段中的單鏈缺口相同的長度;以及5.依賴模板的連接酶(例如,大腸桿菌DNA連接酶或來自嗜冷細菌或嗜冷噬菌體的依賴模板的連接酶);將體外轉座反應中的靶DNA與轉座酶和髮夾轉座子末端組合物在一定條件下孵育並且持續足夠的時間,其中該髮夾轉座子末端組合物插入該靶DNA中產生5'加標籤的 DNA片段的群體(參見,例如,圖2和圖3);在一定條件下孵育該5'加標籤的DNA片段並且持續足夠的時間,其中DNA片段中的單鏈缺口被填充並且每個5'加標籤的DNA片段的3'端被延伸並接合包含該靶DNA的互補部分的另一 5'加標籤的DNA片段的5'端,從而產生加標籤的環狀DNA片段的文庫, 所述加標籤的環狀DNA片段中的每一個顯示該靶DNA的一部分的兩條鏈的序列和標籤的序列。在所述方法的一些優選的實施方案中(如在例如圖7和圖8中所圖示的),接合的步驟包括(1)將5'加標籤的DNA片段與缺乏5'核酸酶活性的DNA聚合酶在一定條件下孵育,其中每個5'加標籤的DNA片段的3'端被延伸產生5'加標籤的DNA片段延伸產物的群體;以及⑵將5'加標籤的DNA片段延伸產物與依賴模板的連接酶在一定條件下孵育並持續足夠的時間,其中該5'加標籤的DNA片段延伸產物被連接,從而產生加標籤的環狀DNA片段的文庫。在一些實施方案中,在混合物中提供了缺乏5'核酸酶和鏈置換活性的 DNA聚合酶和依賴模板的連接酶並且在單一反應混合物中進行接合步驟。在所述方法的一些其他優選的實施方案中,接合的步驟包括將5'加標籤的DNA 片段與一種或多種大小的隨機序列寡核苷酸和依賴模板的連接酶在一定條件下孵育並持續足夠的時間,其中該隨機序列寡核苷酸與5'加標籤的DNA片段中的單鏈缺口區域退火併填充它們並且其中所述退火的隨機序列寡核苷酸彼此連接或者與相鄰端的5'加標籤的 DNA片段連接,從而產生加標籤的環狀DNA片段。在一些實施方案中,所述方法在連接步驟後另外包括一個或多個除去隨機序列寡核苷酸、線性靶DNA和/或不與靶DNA接合的髮夾轉座子末端組合物。在一些優選的實施方案中,所述方法另外包括用T5外切核酸酶(EPICENTREBiotechnologies,Madison,WI)處理包含加標籤的環狀DNA片段的反應混合物以除去未連接的線性ssDNA和dsDNA (例如,有切口的和/或包含單鏈區域的DNA片段)。在一些實施方案中,所述方法另外包括在每個環結構中切割加標籤的環狀DNA 片段以產生線性雙鏈DNA片段,所述DNA片段中的每條鏈在其5 『端具有標籤的一部分並且在其3'端具有標籤的一部分(所述線性DNA片段在本文稱為「扇尾形加雙標籤的線性 dsDNA片段」或「扇尾形dsDNA片段」)。在一些實施方案中,切割的方法包括使與標籤內的限制性位點退火的寡脫氧核糖核苷酸與該加標籤的環狀DNA片段退火,然後與在該雙鏈限制性位點處切割的限制性內切核酸酶孵育產生扇尾形dsDNA片段。在一些其他的實施方案中,髮夾轉座子末端組合物具有可使用切割酶組合物切割的一個或多個可切割位點(例如,在環結構中)(例如,可使用包含尿嘧啶-N-糖基化酶和 AP內切核酸酶諸如大腸桿菌內切核酸酶III或內切核酸酶IV的切割酶組合物切割的由 dUMP殘基構成的可切割位點;或者,例如,可使用包含FPG蛋白士AP內切核酸酶諸如大腸桿菌內切核酸酶III或內切核酸酶IV的切割酶組合物切割的由8-氧代-鳥嘌呤-2'-脫氧核糖核苷-單磷酸殘基構成的可切割位點),並且切割方法包括將加標籤的環狀DNA片段與切割酶組合物在一定條件下孵育並持續足夠的時間,其中該加標籤的環狀DNA片段在切割位點處被切割產生扇尾形dsDNA片段。在所述方法的一些實施方案中,使用不同的非規範核苷酸來提供切割位點並且在切割酶組合物中使用不同的N-糖基化酶。合成髮夾轉座子末端組合物(例如,使用寡核苷酸合成儀)以便在期望切割文庫中的加標籤的環狀DNA 片段的一個或多個位點處(例如,其中期望切割加標籤的環狀DNA片段的位點是在插入加標籤的環狀DNA片段中的髮夾轉座子末端組合物的環結構內)包含由非規範的核苷酸代替規範的核苷酸(例如,當尿嘧啶-N-糖基化酶用作切割酶組合物的組分時dUMP為代替TMP 的非規範核苷酸,或者當FPG蛋白用作切割酶組合物的組分時8-氧代-GMP為代替GMP的非規範核苷酸)構成的切割位點。因此,在其中轉座子末端組合物具有一個或多個切割位點的一些優選的實施方案中,切割酶組合物使用N-糖基化酶(或「DNA糖基化酶」)產生無鹼基位點或無嘧啶位點/ 無嘌呤(AP)位點。如本文所用,「N-糖基化酶」是催化DNA的非規範核酸鹼基和糖之間的鍵水解產生無鹼基(AP)位點的酶。這些酶存在於許多物種中。來自大腸桿菌的一個實例是尿嘧啶N-糖基化酶(UNG),也稱為尿嘧啶-DNA糖基化酶(UDG)。UNG催化來自DNA中的糖脫氧核糖的鹼基尿嘧啶的切割(Lindahl, Prog. Nucl. Acid Res. Mol. Biol. 22 135-192, 1979),但是不催化來自游離dUTP、游離脫氧尿苷或RNA的尿嘧啶的切割(Duncan,在The Enzymes(酶),Boyer編,第565-586頁,1981中)。可用作切割酶的N-糖基化酶的其他實例由 Demple 和 Harison (Annu. Rev. Biochem. 63 :915-48,1994)以及由 Duncan ( 「 DNA Glycosylases (DNA 糖基化酶),〃在 The Enzymes,Boyer 編,第 565-586 頁,1981 中)描述。提及「N-糖基化酶」或「DNA-糖基化酶」我們表示具有N-糖基化酶活性的酶,不論該酶被正式地稱為糖基化酶還是具有與其他酶活性聯合的糖基化酶活性。糖基化酶有時被稱為「糖苷酶」,並且我們因此表示N-糖基化酶的定義覆蓋N-糖苷酶。例如,FPG蛋白也是如本文所定義的N糖基化酶。FPG蛋白(甲醯胺基嘧啶DNA N-糖基化酶)是一種鹼基切除修復酶,該酶識別不同的但結構上相關的修飾的核酸鹼基諸如8-羥基鳥嘌呤(也稱為7-氫-8-氧代鳥嘌呤或8-氧代鳥嘌呤,是指在生理PH下的有利的6,8- 二酮互變異構體)(Tchou,等人,Proc. Natl. Acad. Sci. USA 88 :4690_4694,1991)、分別稱為 4,6-二氨基-5-甲醯胺基嘧啶和2,6-二氨基-4-羥基-5-甲醯胺基嘧啶的腺嘌呤或鳥嘌呤的咪唑環打開的衍生物(Chetsanga,等人,Biochemistry 20 :5201-5207,1981 ;以及 Breimer,Nucl. Acids Res. 12 :6359-6367,1984)、N7-甲基甲醯胺基嘧啶、5-羥基尿嘧啶和5-羥基胞嘧啶 (Hatahet,等人,J. Biol. Chem. 269 18814-18820,1994)並且催化 DNA 中在修飾的鹼基與脫氧核糖-磷酸二酯骨架之間的N-糖基連接的切割,從而產生AP位點。此外,FPG蛋白還有用AP裂解酶活性。該酶的AP-裂解酶活性催化β、δ-消除反應,在DNA中留下單核苷酸缺口(Bailly,等人,Biochem. J.:707-713,1989) 已顯示 FPG 蛋白和 8-羥基腺嘌呤 DNA 糖基化酶是相同的(Chung,MH等人,Mutation Research 254 :1-12,1991) 用亞甲基藍加可見光(Floyd,等人,Arch Biohem Biophys 273:106-111,1989)或者用玫瑰紅加紫外光 (Friedmann 禾口 Brown,Nucleic Acids Research 5 :615-622,1978)處理 DNA 誘導可被 FPG 蛋白切割的鳥嘌呤特異性修飾。其他特異性N-糖基化酶將是本領域技術人員可用且已知的。為了確定N-糖基化酶是否適合於本發明,首先將非規範的核苷酸產入DNA中並且確定該非規範的鹼基是否能夠以與尿嘧啶或8-氧代-鳥嘌呤分別被UNG和FPG蛋白除去相似的方式被候選N-糖基化酶特定地除去。一旦創建無鹼基位點或AP位點,本領域已知多種方法切割該無鹼基位點。熱和/或鹼性的條件可用於在無鹼基位點處破壞DNA分子。例如, 可使用以下方案在70°C到95°C將除去非規範鹼基後的含有無鹼基(AP)位點的核酸在包含胺例如25mM Tris-HCl和1到5mM鎂離子的緩衝溶液中加熱持續10到30分鐘時間。可選地,以下處理可用於在無鹼基位點處破壞DNA 將1. OM的哌啶鹼基添加到已用乙醇沉澱並真空乾燥的DNA中。然後將溶液在90°C加熱30分鐘並凍幹以除去哌啶。在一些優選的實施方案中,利用本領域已知的無嘌呤/無嘧啶的內切核酸酶(AP內切核酸酶)的酶處理 (Lindahl,Prog. Nucl. Acid Res. MoI. Biol. 22 135—192,1979 ;Demple and Harison Annu. Rev. Biochem. 63 =915-48,1994)用於在無鹼基位點處破壞DNA聚合物。如本文所定義的, AP內切核酸酶是催化在無鹼基(AP)位點處破壞DNA的任何酶。這些酶存在於許多物種中。 來自大腸桿菌的AP內切核酸酶的實例包括但不限於內切核酸酶III和內切核酸酶IV。同樣,在存在鈣離子的情況下,大腸桿菌外切核酸酶是AP內切核酸酶。在本發明中有用的實例包括具有AP內切核酸酶樣活性的任何酶,不論它被命名為該名稱或是某個其他名稱。在一些優選的實施方案中,所述方法另外包括使扇尾形dsDNA片段變性產生加雙標籤的線性ssDNA片段的文庫(例如,以用作DNA測序或DNA擴增的模板)。在一些實施方案中,在使用所述方法產生的文庫中的加標籤的環狀DNA片段或加雙標籤的線性ssDNA片段用作核酸擴增和/或DNA測序反應中的DNA模板。在一些實施方案中,所述方法還包括對加標籤的環狀DNA片段或加雙標籤的線性ssDNA片段中的靶DNA 進行擴增和/或測序的步驟。在一些實施方案中,所述方法還包括對通過擴增加標籤的環狀DNA片段或加雙標籤的線性ssDNA片段獲得的與靶DNA互補的DNA測序的步驟。在一些實施方案中,使用DNA聚合酶和與標籤互補的至少一種引物對加標籤的環狀DNA片段或加雙標籤的線性ssDNA片段的每一個中的靶DNA的至少一部分測序(例如,通過合成測序)。 在一些實施方案中,使用依賴模板的連接酶連接與標籤互補的至少一種寡脫氧核糖核苷酸和與靶序列的部分退火的至少另一種寡脫氧核糖核苷酸,對加標籤的環狀DNA片段或加雙標籤的線性ssDNA片段中的每一個中的靶DNA的至少一部分測序(例如,通過連接測序)。 在一些實施方案中,通過使與標籤以及與靶序列的一部分退火或雜交的寡脫氧核糖核苷酸退火,對加標籤的環狀DNA片段或加雙標籤的線性ssDNA片段的每一個中的靶DNA的至少一部分進行測序(例如,通過雜交測序)。在一些實施方案中,利用通過合成測序、通過連接測序、或通過雜交測序,對與加標籤的環狀DNA片段或加雙標籤的線性ssDNA片段互補的 DNA進行測序。例如,在一些優選的實施方案中,由試劑盒中提供的或在本發明的方法中使用的髮夾轉座子末端組合物顯示的轉移的轉座子末端序列是由Tn5轉座酶識別的轉移的轉座子末端序列。在一些優選的實施方案中,轉移的轉座子末端序列是由ΕΖ-Τη5 轉座酶 (EPICENTRE Biotechnologies, Madison, WI, USA)識別的序列。一般來說,使用本發明的方法中的髮夾轉座子末端組合物產生的加標籤的環狀 DNA片段、扇尾形dsDNA片段以及加雙標籤的線性ssDNA片段顯示轉移的轉座子末端序列和非轉移的轉座子末端序列,以及包括或來源於髮夾轉座子末端組合物的非互補的環部分的另外的序列。因此,在一些實施方案中,髮夾轉座子末端組合物顯示轉移的轉座子末端序列 5'-的和非轉移的轉座子末端序列3'-的一種或多種其他核苷酸序列,所述一種或多種其他核苷酸序列也由標籤顯示。因此,除了轉座子末端序列之外,髮夾轉座子末端組合物的標籤可具有一個或多個其他的標籤部分或標籤域。在其中髮夾轉座子末端組合物包括一個或多個限制性位點域的一些實施方案中, 所述方法還包括使與加標籤的環狀DNA片段的單鏈限制性位點互補的寡脫氧核糖核苷酸退火,然後使用識別該限制性位點的限制性內切核酸酶在該限制性位點處切割該加標籤的環狀DNA片段。因此,在一些實施方案中,所述方法包括使加標籤的環狀DNA片段線性化以產生扇尾形dsDNA片段或變性後的加雙標籤的線性ssDNA片段。在一些實施方案中,所述方法還包括連接限制性內切核酸酶切割的加標籤的線性 ssDNA片段與一個或多個其他DNA分子的步驟(例如,用於接合標籤)。因此,在一些實施方案中,所述方法還包括通過轉錄擴增加標籤的環狀DNA片段或扇尾形dsDNA片段或加雙標籤的線性ssDNA片段,所述方法包括(a)使顯示互補的反義啟動子序列的寡脫氧核糖核苷酸與正義啟動子序列退火,或者使加標籤的環狀DNA片段或扇尾形dsDNA片段或加雙標籤的線性ssDNA片段和與其互補的引物退火,並且在其中合成包括雙鏈RNA聚合酶啟動子的dsDNA的條件下用DNA聚合酶延伸該引物;以及(b)將dsDNA 產物與結合RNA聚合酶啟動子的RNA聚合酶在其中合成RNA的條件下孵育。在其中髮夾轉座子末端組合物或PCR引物顯示RNA聚合酶啟動子序列的一些優選的實施方案中,該RNA聚合酶啟動子是T7型RNA聚合酶啟動子並且所述方法還包括使用識別該啟動子的T7型RNA聚合酶在體外轉錄加標籤的環狀DNA片段的步驟。更優選地,從T7 RNAP、T3 RNAP和SP6 RNAP以及對應的同源啟動子中選擇RNA聚合酶和啟動子。然而,本發明的方法的轉錄步驟可使用如下任何RNAP 對於所述RNAP而言允許具有高特異性的轉錄的適合的啟動子序列是已知的或者可被獲得。用於體外轉錄的試劑盒和酶從許多賣家可商購獲得並且用於執行包括體外轉錄的本發明的步驟的適當的反應混合物和條件可按製造商所述使用那些產品。通過舉例,但使用T7 RNAP的體外轉錄可按照產品資料所述使用來自 EPICENTRE Biotechnologies, Madison, WI 的 AMPLISCRIBE T7-FLASH 轉錄試劑盒或AMPLISCRIBE T7高產量轉錄試劑盒。類似地,如果T3 RNAP或SP6 RNAP在本發明的方法中用於體外轉錄,那麼AMPLISCRIBE T3-FLASH 高產量轉錄試劑盒或AMPLISCRIBE SP6 高產量轉錄試劑盒(EPICENTRE Biotechnologies, Madison, WI)分別可按照所述使用。在一些其他的實施方案中,所述方法還包括使用DNA聚合酶和與標籤互補的至少一種引物對加標籤的環狀DNA片段中的靶DNA進行擴增和/或測序的步驟。在一些實施方案中,所述方法另外包括使用鏈置換DNA聚合酶通過滾環複製對加標籤的環狀DNA片段進行擴增。在一些其他的實施方案中,所述方法另外包括使用熱穩定的DNA聚合酶、與標籤的至少一部分互補的第一 PCR引物以及與標籤的互補序列的至少一部分互補的第二 PCR引物通過PCR對加標籤的環狀DNA片段進行擴增。在一些實施方案中,所述方法還包括通過滾環複製(RCR)擴增加標籤的環狀DNA 片段,所述方法包括(a)使與加標籤的環狀DNA片段互補的引物退火;以及(b)使用鏈置換DNA聚合酶(例如,phi29 DNA聚合酶、rBst DNA聚合酶大片段或DISPLACEACE DNA聚合酶(EPICENTRE))延伸與加標籤的環狀DNA片段退火的引物。在這些實施方案中,RCR擴增產物是與加標籤的環狀DNA片段互補的多聯體ssDNA分子。在其中加標籤的環狀DNA片段顯示反義啟動子序列的一些實施方案中,多聯體RCR擴增產物顯示正義啟動子序列,並且所述方法還包括使RNA聚合酶啟動子為雙鏈的(例如,通過使顯示反義啟動子序列的互補寡脫氧核糖核苷酸與正義啟動子序列退火,然後使用結合雙鏈RNA聚合酶啟動子並自其啟動轉錄的RNA聚合酶轉錄該多聯體DNA)。在一些優選的實施方案中,髮夾啟動子末端組合物的莖部分只顯示轉移的和非轉移的轉座子某些序列並且環是單鏈的(例如,為了使髮夾轉座子末端組合物在體外轉座反應過程中插入本身的雙鏈部分中的可能性或頻率降到最低)。在一些其他的實施方案中,髮夾轉座子末端組合物的莖部分除了轉移的和非轉移的轉座子末端序列之外還顯示另外的序列,所述另外的序列緊接-轉移的轉座子末端序列的5'和緊接非轉移的轉座子末端序列的3'。然而,在這些實施方案中,將髮夾轉座子末端組合物的莖部分中的另外的序列的大小最小化以使該髮夾轉座子末端組合物在體外轉座反應過程中插入本身的可能性或頻率降到最低。例如,在一些實施方案中。髮夾轉座子末端組合物中的莖的長度為小於大約 75個核苷酸;小於大約50個核苷酸;或小於大約30個核苷酸。在一些實施方案中,髮夾轉座子末端組合物的環部分顯示測序標籤域或捕獲標籤域的序列(例如,Roche 454基因組測序儀FLX系統的測序標籤域和/或捕獲標籤域,例如其顯示用於使用Roche 454基因組測序儀FLX系統測序的Roche 454A和Roche 454B標籤的測序標籤域的序列)。在其中髮夾轉座子末端組合物具有測序標籤域或捕獲標籤域的一些實施方案中,加標籤的環狀DNA片段或扇尾形dsDNA片段或加雙標籤的線性ssDNA片段具有的標籤包括測序標籤域和/或捕獲標籤域(例如,用於利用Roche 454基因組測序儀FLX系統測序的Roche 454A或Roche 454B標籤)。在分離期望大小範圍內的加標籤的環狀DNA片段或扇尾形dsDNA片段或加雙標籤的線性ssDNA片段後,它們用作利用Roche A454基因組測序儀FLX系統的下一代測序的模板。在其他的實施方案中,產生的加標籤的環狀DNA片段或扇尾形dsDNA片段或加雙標籤的線性ssDNA片段具有一個或多個限制性位點域、測序標籤域、擴增標籤域、捕獲標籤域、檢測標籤域和/或地址標籤域以用於測序(例如,使用 ROCHE 454 測序平臺、ILLUMINA S0LEXA 測序平臺、LIFE TECHNOLOGIES/APPLIEDBI0SYSTEMS 的 SOLID 測序平臺、PACIFIC BIOSCIENCES 的 SMRT 測序平臺、P0LL0NAT0R Polony 測序平臺、COMPLETE GENOMICS 測序平臺、INTELLIGENT BIOSYSTEMS 的測序平臺、或 HELICOS測序平臺)。在一些實施方案中,髮夾轉座子末端組合物顯示一個或多個標籤域序列,所述序列可用來達成任何期望的目的。對哪些另外的序列用於髮夾轉座子末端組合物的環部分中的一種或多種另外的序列沒有限制。在一些優選的實施方案中,髮夾轉座子末端組合物的5'端具有5'-單磷酸基團。在其中髮夾轉座子末端組合物不具有5'-單磷酸基團的實施方案中,所述方法還包括在該方法的連接步驟之前使髮夾轉座子末端組合物的5'端磷酸化的步驟(例如,使用多核苷酸激酶;例如,T4多核苷酸激酶)。轉座酶催化的轉座子末端插入靶中導致該轉移的轉座子末端序列的3'端與靶 DNA的一條鏈中的核苷酸的5'位接合,導致該鏈在該轉移的轉座子末端序列與該靶DNA的接合位點處的破裂或斷裂,並且伴隨產生由於在靶DNA的相反鏈中的9鹼基缺口區域所致的位於轉移的轉座子末端與靶DNA接合的位點3'的單鏈靶DNA的9鹼基區域。例如,圖 16顯示髮夾轉座子末端組合物到靶DNA中的兩個獨立插入事件的一個可能結果。如圖16 所示,髮夾轉座子末端到靶DNA的相反鏈中的獨立插入有時發生在靶DNA中的部位,產生如圖16中所示的兩個5'加標籤的DNA片段。在接合後,產生了加標籤的環狀DNA片段。本發明不僅限於本文所述的特定核酸連接酶。本領域技術人員將理解具有與本文所述的酶相似的活性的任何依賴模板的核酸連接酶和使用這些酶用於依賴模板的連接的方法及條件是本領域已知且容易獲得的。實驗實施例在以下實施例中進一步定義了本發明。應當理解這些實施例雖然指出本發明的優選實施方案,但僅通過舉例說明方式給出。從以上討論和這些實施例,本領域熟練技術人員能夠確定本發明的必要特徵,並且在不背離本發明的精神和範圍的情況下能夠對本發明作出各種改變和變更以使其適合於各種運用和條件。使用的標準分子生物學技術是本領域公知的並且被Sambrook,J.,Fritsch, Ε. F.禾口 Maniatis,T. ,Molecular Cloning :A Laboratory Manual (分子克隆實驗指南), 第二版,Cold Spring Harbor Laboratory Press, Cold Spring Harbor,N. Y. (1989)描述。實施例中使用的定義、命名和縮寫「pMETS」是指顯示EZ-Tn5 轉座子末端序列的19鹼基的含5'-磷酸的單鏈轉座子末端寡核苷酸5' pAGA TGT GTA TAA GAG ACAG 3' (SEQ ID NO 1)「METS」是指顯示EZ-Tn5 轉座子末端序列的19鹼基的單鏈轉座子末端寡核苷酸5' AGA TGT GTA TAA GAG ACAG 3' (SEQ ID NO 1)「pMENS」是指顯示EZ-Tn5 轉座子末端序列的19鹼基的含5'-磷酸的單鏈轉座子末端寡核苷酸5' pCTG TCT CTT ATA CAC ATCT 3' (SEQ ID NO 2)「pMEDS」是指其中兩個5'端均包含磷酸的19鹼基對的雙鏈EZ-Tn5 轉座子末端5' pAGA TGT GTA TAA GAG ACAG 3' (SEQ ID NO 1)3' TCT ACA CAT ATT CTC TGTCp 5' (SEQ ID NO :2)通過使pMETS轉座子末端寡核苷酸與pMENTS轉座子末端寡核苷酸退火製備pMEDS EZ-Tn5 轉座子末端。「MEDS」是指其中只有非轉移鏈(pMENTQ包含5 『-磷酸的19鹼基對的雙鏈 EZ-Tn5 轉座子末端5' AGA TGT GTA TAA GAG ACAG 3' (SEQ ID NO 1)3' TCT ACA CAT ATT CTC TGTCp 5' (SEQ ID NO :2)通過使METS轉座子末端寡核苷酸與pMENTS轉座子末端寡核苷酸退火製備MEDS EZ-Tn5 轉座子末端。"p454. IMETS」是指具有由顯示以下序列的Roche 454測序標籤構成的5'部分的 36鹼基的含5'-磷酸的單鏈轉移鏈,所述Roche 4 測序標籤附加於標下劃線的19鹼基 EZ-Tn5 轉移的轉座子末端序列(pMETS)的5'端5' pGCC TTG CCA GCC CGC TCA GAT GTG TAT AAG AGA CAG 3' (SEQ ID NO 4)通過使p454. 1 METS 轉移鏈(SEQ ID NO 4)與 pMENTS 非轉移鏈(SEQ ID NO 2) 退火製備「p454. IMEDS 」EZ-Tn5 轉座子末端組合物5' pGCC TTG CCA GCC CGC TCA GAT GTG TAT AAG AGA CAG 3'3' T CTA CAC ATA TTC TCT GTCp 5'"pc454. 1」是指p4M. IMETS的5'部分互補並且具有以下序列的18鹼基的含 5'-磷酸的單鏈寡核苷酸5' pTGA GCG GGC TGG CAA GGC 3' (SEQ ID NO 5)「A-METS」是指具有由顯示以下序列的Roche妨4測序標籤構成的5'部分的38 鹼基的單鏈轉移鏈,所述Roche 4 測序標籤附加於標下劃線的19鹼基EZ-Tn5 轉移的轉座子末端序列(METS)的5'端5' GCC TCC CTC GCG CCA TCA GAG ATG TGT ATA AGA GAC AG 3' (SEQ ID NO 7)通過使A-METS轉移鏈(SEQ ID NO 7)與pMENTS非轉移鏈(SEQ ID NO 2)退火製備「 A-MEDS 」 EZ-Tn5 轉座子末端組合物5' GCC TCC CTC GCG CCA TCA GAG ATG TGT ATA AGA GAC AG 3'3' TC TAC ACA TAT TCT CTG TCp 5'「B-METS」是指具有由顯示以下序列的Roche妨4測序標籤構成的5'部分的38 鹼基的單鏈轉移鏈,所述Roche 4 測序標籤附加於標下劃線的19鹼基EZ-Tn5 轉移的轉座子末端序列(METS)的5'端5' GCC TTG CCA GCC CGC TCA GAG ATG TGT ATA AGA GAC AG 3' (SEQ ID NO 8)通過使B-METS轉移鏈(SEQ ID NO 8)與pMENTS非轉移鏈(SEQ ID NO 2)退火製備「B-IMEDS 」 EZ-Tn5 轉座子末端組合物5' GCC TTG CCA GCC CGC TCA GAG ATG TGT ATA AGA GAC AG 3'3' TC TAC ACA TAT TCT CTG TCp 5'「FLX-A」是指由顯示以下序列的Roche 454測序標籤構成的19鹼基的單鏈寡核苷酸5' GCC TCC CTC GCG CCA TCA G 3' (SEQ ID NO 9)「FLX-B」是指由顯示以下序列的Roche 454測序標籤構成的19鹼基的單鏈寡核苷酸5' GCC TTG CCA GCC CGC TCA G 3' (SEQ ID NO 10)「A-MID2-METS」是指具有由Roche妨4測序標籤和顯示以下序列的條碼序列 (MID2,斜體)構成的5'部分的48鹼基的單鏈轉移鏈,所述條碼序列附加於標下劃線的19 鹼基EZ-Tn5 轉移的轉座子末端序列(METQ的5'端5' GCC TCC CTC GCG CCA TCA G ΑΓ.ΠΓ.ΨΓ.Π Γ. AG ATG TGT ATA AGA GAC AG 3' (SEQ ID NO 11)「Ti A-METS」是指具有由顯示以下序列的Roche妨4測序標籤構成的5'部分的 49鹼基的單鏈轉移鏈,所述Roche 454測序標籤附加於標下劃線的19鹼基EZ-Tn5 轉移的轉座子末端序列(METS)的5'端5' CCA TCT CAT CCC TGC GTG TCT CCG ACT CAG AGA TGT GTATAA GAG ACA G 3' (SEQ ID NO 12)「Ti B-METS」是指具有由顯示以下序列的Roche妨4測序標籤構成的5'部分的 49鹼基的單鏈轉移鏈,所述Roche 454測序標籤附加於標下劃線的19鹼基EZ-Tn5 轉移的轉座子末端序列(METS)的5'端5' CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG AGA TGT GTA TAA GAG ACA G 3' (SEQ ID Ν0:13)「Ti Α」是指由顯示以下序列的Roche妨4測序標籤構成的沈鹼基的單鏈寡核苷酸5' CCA TCT CAT CCC TGC GTG TCT CCG AC 3' (SEQ ID NO :14)「Ti B」是指由顯示以下序列的Roche 454測序標籤構成的沈鹼基的單鏈寡核苷酸5' CCT ATC CCC TGT GTG CCT TGG CAG TC 3' (SEQ ID NO 15)「BP1-A」是指具有由顯示以下序列的Illumina橋PCR標籤構成的5'部分的48 鹼基的單鏈寡核苷酸,所述Illumina橋PCR標籤附加於FLX-A序列(下面標下劃線的)5' AAT GAT ACG GCG ACC ACC GAG ATC TAC ACG CCT CCC TCG CGC CAT CAG 3' (SEQ ID NO 16)「BP2-B」是指具有由顯示以下序列的Illumina橋PCR標籤構成的5'部分的49 鹼基的單鏈寡核苷酸,所述Illumina橋PCR標籤附加於FLX-B序列(下面標下劃線的) 5' CAA GCA GAA GAC GGC ATA CGA GAT CGG TCT GCC TTG CCA GCC CGC TCA G 3' (SEQ ID NO 17)「BP2-ID1-B」是指具有由Illumina橋PCR標籤和顯示以下序列的條碼序列(ID2, 斜體)構成的5'部分的49鹼基的單鏈寡核苷酸,所述Illumina橋PCR標籤附加於FLX-B 序列(下面標下劃線的)5' CAA GCA GAA GAC GGC ATA CGA GAT GCATGT CGG TCT GCCTTG CCA GCC CGC TCA G 3' (SEQ ID NO 18)
「BP 1」是指由顯示以下序列的Illumina bPCR銜接子標籤構成的20鹼基的單鏈寡
核苷酸5' AAT GAT ACG GCG ACC ACC GA 3' (SEQ ID NO 19)「BP2」是指由顯示以下序列的Illumina bPCR銜接子標籤構成的21鹼基的單鏈寡
核苷酸5' CAA GCA GAA GAC GGC ATA CGA 3' (SEQ ID NO 20)「pMETS-N-MENTS」是指包括如下組分或由其構成的髮夾轉座子末端組合物顯示 5'端的EZ-Tn5 非轉移的轉座子末端序列和3'端的EZ-Tn5 轉移的轉座子末端序列的含5'-磷酸的寡核苷酸,所述非轉移的轉座子末端序列和轉移的轉座子末端序列通過由 「(N) χ」代表的間插的任意序列連接。在METS和MENTS之間的間插序列由足夠數目的核苷酸構成以允許莖-環形成5' PCTGTCTCTTATACACATCT-(N)X-AGATGTGTATAAGAGACAG 3『 (SEQ ID NO 3)pMETS-N-MENTS內pMETS轉移的轉座子末端序列與pMENTS非轉移的轉座子末端序列的分子內退火製備髮夾EZ-Tn5 轉座子末端組合物。例如,如果χ = 6 ;NNN AGATGTGTATAAGAGACAG 3'N TCTACACATATTCTCTGTCp 5' (SEQ ID NO 3)NN「TSase,,是指在 50mM Tris 氯化物 pH 7. 5、50%甘油、0. ImM EDTAUmM DTT、500mM 氯化鈉、0. 5% ν/ν ΝΡ-40、0. 5% ν/ν 吐溫-20 中的高活性 ΕΖ_Τη5 Τη5 轉座酶(EPICENTRE Biotechnologies, Madison, WI, USA)。「轉座體」是指與雙鏈轉座子DNA在支持非共價複合物形成的條件下孵育的高活性 EZ-Tn5 Τη5 轉座酶(EPICENTRE Biotechnologies, Madison, WI, USA) 雙鏈的轉座子 DNA可由不限於Tn5 DNA、Tn5 DNA的部分、轉座子末端組合物、轉座子末端組合物的混合物或其他能夠與高活性EZ-Tn5 轉座酶相互作用的雙鏈DNA構成。
權利要求
1.一種用於產生靶DNA的加標籤的DNA片段的文庫的方法,所述方法包括i)將所述靶DNA與轉座酶和轉座子末端或轉座子末端組合物孵育,所述轉座子末端或轉座子末端組合物包含在其5'部分中具有標籤域的轉移鏈,所述孵育在其中所述轉座酶催化轉座反應的條件下進行,其中a)所述靶DNA被斷裂產生多個靶DNA片段;和b)所述轉座子末端或轉座子末端組合物的轉移鏈與多個所述靶DNA片段中的每一個片段的5'端接合產生多個5'加標籤的靶DNA片段;和 )將所述多個5'加標籤的靶DNA片段與至少一種核酸修飾酶孵育,所述孵育在其中 3'標籤與所述5'加標籤的靶DNA片段的3'端接合的條件下進行,以產生包含加雙標籤的靶DNA片段。
2.一種對靶DNA的片段加標籤的方法,所述方法包括i)將靶DNA與轉座酶和轉座子末端或轉座子末端組合物孵育,所述轉座子末端或轉座子末端組合物包含在其5'部分中包括標籤域的轉移鏈,所述孵育在其中所述轉座酶催化轉座反應的條件下進行,其中a)所述靶DNA被斷裂;和b)所述轉座子末端或轉座子末端組合物的所述轉移鏈與所述靶DNA的片段的5'端接合產生5'加標籤的靶DNA片段;和ii)將所述5'加標籤的靶DNA片段與核酸修飾酶孵育,所述孵育在其中3'標籤與所述5'加標籤的靶DNA片段的3'端接合的條件下進行,以產生加雙標籤的靶DNA片段。
3.如權利要求1所述的方法,其中所述核酸修飾酶為DNA聚合酶並且其中所述3'標籤是通過所述5'加標籤的靶DNA片段的所述3'端的延伸而形成,其中所述DNA聚合酶選自由依賴模板的DNA聚合酶和不依賴模板的DNA聚合酶組成的組。
4.如權利要求2所述的方法,其中所述依賴模板的DNA聚合酶具有鏈置換活性和/或 5'核酸酶活性。
5.如權利要求1或權利要求2所述的方法,其中所述核酸修飾酶為連接酶並且其中所述3'標籤是通過寡核苷酸與所述5'加標籤的靶DNA片段的所述3'端的連接而形成,並且其中所述連接酶選自由依賴模板的連接酶和不依賴模板的連接酶組成的組。
6.如權利要求1-5中任一項所述的方法,其中所述轉移的末端包含標籤域,所述標籤域包括限制性位點域、捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。
7.如權利要求6所述的方法,其中所述標籤域為測序標籤域,所述測序標籤域包括選自以下的測序標籤或由選自以下的測序標籤構成Roche 454A測序標籤和Roche 454B測序標籤、ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics 測序標籤。
8.如權利要求1-7中任一項所述的方法,所述方法還包括擴增一種或多種5'加標籤的靶DNA片段和/或加雙標籤的靶DNA片段。
9.如權利要求8所述的方法,其中所述擴增包括使用PCR擴增反應、鏈置換擴增反應、 滾環擴增反應、連接酶鏈反應、轉錄介導的擴增反應或環介導的擴增反應中的一種或多種。
10.如權利要求8所述的方法,其中所述擴增包括非選擇性擴增構成DNA片段文庫的 5'加標籤的靶DNA片段或構成DNA片段文庫的加雙標籤的靶DNA片段。
11.如權利要求8所述的方法,其中所述轉座子末端組合物包含在核酸序列上具有至少一個核苷酸差異的多條轉移鏈,並且其中所述擴增包括基於所述5'端標籤或標籤域的核酸序列選擇性擴增加雙標籤的DNA片段。
12.如權利要求11所述的方法,其中所述選擇性擴增包括選擇性擴增包括具有至少一個核苷酸差異的5'端標籤或標籤域的加雙標籤的DNA片段。
13.如權利要求8所述的方法,其中所述擴增包括使用與所述加雙標籤的靶DNA片段的所述3'標籤互補的單個寡核苷酸引物的聚合酶鏈反應。
14.如權利要求8所述的方法,其中所述擴增包括使用單個寡核苷酸引物的鏈置換擴增反應,其中所述寡核苷酸引物只由核糖核苷酸構成,或只由嘌呤核糖核苷酸和只由嘧啶 2' -F-2'-脫氧核糖核苷酸構成,其中所述鏈置換擴增反應包括鏈置換DNA聚合酶和核糖核酸酶H。
15.如權利要求8所述的方法,其中所述擴增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶鏈反應,其中所述第一 PCR引物的至少3'端部分與所述加雙標籤的靶DNA片段的所述3 『標籤互補,並且其中所述第二 PCR引物的至少3 『 端部分顯示所述加雙標籤的靶DNA片段的5'標籤或標籤域的至少一部分的序列。
16.如權利要求15所述的方法,其中所述第一寡核苷酸引物或第二寡核苷酸引物包括 5'端部分,其中所述第一引物的至少所述5'端部分不與所述加雙標籤的靶DNA片段的所述3'標籤互補,或者其中所述第二引物的所述5'部分不顯示所述加雙標籤的靶DNA片段的5'標籤或標籤域的至少一部分的序列。
17.如權利要求15所述的方法,其中所述第一寡核苷酸引物和第二寡核苷酸引物各自包括5'端部分,其中所述第一 PCR引物的至少所述5'端部分不與所述加雙標籤的靶DNA 片段的所述3'標籤互補,和/或其中所述第二 PCR引物的所述5'端部分不顯示所述加雙標籤的靶DNA片段的5'標籤域的至少一部分的序列。
18.—種從靶DNA產生加標籤的環狀單鏈DNA片段的群體的方法,所述方法包括i)將所述靶DNA與轉座酶和轉座子末端或轉座子末端組合物孵育,所述轉座子末端或轉座子末端組合物包含在其5'部分中具有標籤域且在其3'部分中具有轉座子末端的轉移鏈,所述孵育在其中所述轉座酶催化轉座反應的條件下進行,其中a)所述靶DNA被斷裂產生多個靶DNA片段;和b)所述轉座子末端或轉座子末端組合物的所述轉移鏈與所述多個所述靶DNA片段中的每一個片段的5'端接合產生5'加標籤的靶DNA片段的群體; )使所述5'加標籤的靶DNA片段變性產生單鏈的5'加標籤的靶DNA片段;iii)將所述單鏈的5'加標籤的靶DNA片段與核酸連接酶孵育,所述孵育在其中所述單鏈的5'加標籤的靶DNA片段被分子內連接的條件下進行,以形成加標籤的環狀單鏈DNA 片段,每個所述加標籤的環狀單鏈DNA片段顯示所述轉移鏈的序列和所述靶DNA的一部分的序列。
19.如權利要求18所述的方法,其中所述標籤域顯示切割位點的序列,並且所述方法還包括將所述加標籤的環狀單鏈DNA片段與構成切割酶組合物的至少一種酶孵育,其中所述切割酶組合物切割所述加標籤的環狀單鏈DNA片段以產生加雙標籤的線性單鏈DNA片段。
20.如權利要求18所述的方法,其中所述標籤域顯示限制性位點的序列,並且所述方法還包括iv)使與所述標籤域互補的寡核苷酸與所述加標籤的環狀單鏈DNA片段退火;ν)將所述加標籤的環狀單鏈DNA片段與識別所述限制性位點的限制性內切核酸酶孵育;其中所述限制性內切核酸酶切割所述加標籤的環狀單鏈DNA片段產生加雙標籤的線性單鏈DNA片段。
21.如權利要求18-20中任一項所述的方法,所述方法還包括擴增所述加標籤的環狀單鏈DNA片段和/或所述加雙標籤的線性單鏈DNA片段中的一種或多種。
22.如權利要求21所述的方法,其中所述擴增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶鏈反應,其中所述第一 PCR引物的至少3'端部分與所述加標籤的環狀單鏈DNA片段中或所述加雙標籤的線性單鏈DNA片段中的所述轉移鏈的所述序列的至少一部分互補,並且其中所述第二 PCR引物的至少3'端部分與所述加標籤的環狀單鏈DNA片段中或所述加雙標籤的線性單鏈DNA片段中的所述轉移鏈的互補序列的至少一部分互補。
23.如權利要求22所述的方法,其中所述第一寡核苷酸引物和第二寡核苷酸引物各自包含5'端部分,其中所述第一 PCR引物的所述5'端部分不與所述加標籤的環狀單鏈DNA 片段中或所述加雙標籤的線性單鏈DNA片段中的所述轉移鏈的所述序列互補,並且其中所述第二 PCR引物的5'端部分不與所述加標籤的環狀單鏈DNA片段中或所述加雙標籤的線性單鏈DNA片段中的所述轉移鏈的互補序列互補。
24.一種從靶DNA產生加標籤的環狀DNA片段的群體的方法,所述方法包括i)將靶DNA與轉座酶和髮夾轉座子末端組合物孵育,所述髮夾轉座子末端組合物包含顯示處於其5'端的非轉移鏈序列、處於其3'端的轉移鏈序列以及包含標籤域的間插環序列的寡核苷酸,所述孵育在其中所述寡核苷酸可形成分子內莖-環,並且其中所述轉座酶催化轉座反應的條件下進行,其中a)所述靶DNA被斷裂產生多個靶DNA片段;和b)所述髮夾轉座子末端組合物的所述寡核苷酸與所述多個靶DNA片段中的每一個片段的5'端接合產生5'加標籤的靶DNA片段的群體; )將所述5'加標籤的靶DNA片段的群體與依賴模板的連接酶以及以下一起孵育a)缺乏5'到3'外切核酸酶活性、3'到5'外切核酸酶活性以及鏈置換活性的DNA 聚合酶或b)一種或多種大小的隨機序列寡核苷酸,所述一種或多種大小的隨機序列寡核苷酸單獨或組合在一起具有與用所述轉座酶和所述髮夾轉座子末端組合物進行轉座反應後產生的5'加標籤的DNA片段中的單鏈缺口相同的長度;所述孵育在其中所述5'加標籤的靶DNA片段中的單鏈缺口被填充並且每個5'加標籤的DNA片段的3'端與包含所述靶DNA的互補部分的另一個5'加標籤的DNA片段的5' 端接合的條件下進行,形成包含環結構中的所述標籤域和所述靶DNA的一部分的兩條鏈的加標籤的環狀DNA 片段。
25.如權利要求M所述的方法,其中步驟ii)的所述接合包括I)將來自步驟i)的所述5'加標籤的DNA片段與所述DNA聚合酶孵育,所述孵育在其中每個5'加標籤的DNA片段的3'端被延伸的條件下進行,以形成5'加標籤的DNA片段延伸產物的群體;和II)將所述5'加標籤的DNA片段延伸產物與所述依賴模板的連接酶孵育,所述孵育在其中所述5'加標籤的DNA片段延伸產物被連接的條件下進行,從而產生所述加標籤的環狀DNA片段。
26.如權利要求25所述的方法,其中所述DNA聚合酶和所述連接酶在混合物中提供,並且其中步驟I)和步驟II)在單一反應混合物中進行。
27.如權利要求M所述的方法,其中步驟ii)的所述接合包括將來自步驟i)的所述 5'加標籤的DNA片段與所述一種或多種大小的隨機序列寡核苷酸以及所述依賴模板的連接酶孵育,所述孵育在其中所述隨機序列寡核苷酸退火併填充單鏈缺口,並且被彼此連接或與5'加標籤的DNA片段的相鄰端連接的條件下進行,形成加標籤的環狀DNA片段。
28.如權利要求M所述的方法,所述方法還包括將所述加標籤的環狀DNA片段與線性 DNA、未連接的隨機序列寡核苷酸和/或未與靶DNA接合的髮夾轉座子末端組合物分離。
29.如權利要求沈所述的方法,所述方法還包括用T5外切核酸酶處理包含所述加標籤的環狀DNA片段的反應混合物以除去線性DNA。
30.如權利要求M到四中任一項所述的方法,所述方法還包括如下步驟在每個所述環結構中切割所述加標籤的環狀DNA片段以產生扇尾形雙鏈DNA片段,該扇尾形雙鏈DNA 片段的每條鏈在其5'端上具有標籤的一部分並且在其3'端上具有標籤的一部分。
31.如權利要求30所述的方法,其中在所述環結構中的所述標籤序列包括限制性位點,並且所述方法還包括iv)使與所述標籤序列中的所述限制性位點互補的寡核苷酸與所述加標籤的環狀DNA 片段退火;ν)將所述加標籤的環狀DNA片段與識別所述限制性位點的限制性內切核酸酶孵育;其中所述限制性內切核酸酶切割所述加標籤的環狀DNA片段產生所述扇尾形雙鏈DNA 片段。
32.如權利要求30所述的方法,其中所述環結構中的所述標籤域包括可使用切割酶組合物切割的一個或多個位點,所述方法還包括將所述加標籤的環狀DNA片段與所述切割酶組合物孵育,所述孵育在其中所述加標籤的環狀DNA片段在所述切割位點處被切割的條件下進行,以產生所述扇尾形雙鏈DNA片段。
33.如權利要求19或權利要求32所述的方法,其中所述切割酶組合物包括N-糖基化酶和AP內切核酸酶。
34.如權利要求33所述的方法,其中所述N-糖基化酶選自尿嘧啶-N-糖基化酶和AP 內切核酸酶及FPG蛋白,並且所述AP內切核酸酶選自大腸桿菌(E.coli)內切核酸酶III 或大腸桿菌內切核酸酶IV。
35.如權利要求30到34中任一項所述的方法,所述方法另外包括使所述扇尾形雙鏈 DNA片段變性產生加雙標籤的線性單鏈DNA片段。
36.如權利要求M到35中任一項所述的方法,所述方法還包括在DNA測序方法或擴增反應中使用所述DNA片段作為模板。
37.如權利要求36所述的方法,所述方法還包括擴增加標籤的環狀DNA片段、扇尾形雙鏈DNA片段和/或加雙標籤的線性單鏈DNA片段。
38.如權利要求37所述的方法,其中所述擴增包括使用PCR擴增反應、鏈置換擴增反應、滾環擴增反應、連接酶鏈反應、轉錄介導的擴增反應或環介導的擴增反應中的一種或多種。
39.如權利要求38所述的方法,其中所述擴增包括使用各自包含3'端部分的第一寡核苷酸引物和第二寡核苷酸引物的聚合酶鏈反應,其中所述第一 PCR引物的至少3'端部分與所述標籤域的至少一部分互補,並且其中所述第二 PCR引物的至少3'端部分顯示所述標籤域的至少一部分的序列。
40.如權利要求39所述的方法,其中所述第一寡核苷酸引物和第二寡核苷酸引物各自包含5'端部分,其中所述第一 PCR引物的所述5'端部分不與所述標籤序列互補,並且其中所述第二 PCR引物的所述5'端部分不顯示所述標籤域的序列。
41.如權利要求16、17、23或40中任一項所述的方法,其中所述第一PCR引物和/或所述第二 PCR引物的所述5'端部分顯示標籤域。
42.如權利要求41所述的方法,其中所述標籤域包括限制性位點域、捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。
43.如權利要求20所述的方法,其中所述標籤域為測序標籤域,所述測序標籤域包括選自以下的測序標籤或由選自以下的測序標籤構成Roche 454A測序標籤和Roche 454B 測序標籤、ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、 Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics測序標籤。
44.一種對靶DNA的片段加標籤的方法,所述方法包括i)將靶DNA與轉座酶和轉座子末端組合物孵育,該轉座子末端組合物包含顯示處於其 5'部分中的不為轉座子末端的標籤域的序列以及處於其3'部分中的所述轉移的轉座子末端的序列的轉移鏈,其中a)所述靶DNA被斷裂;和b)所述轉座子末端組合物的所述轉移鏈與所述靶DNA的片段的5'端接合產生5'加標籤的靶DNA片段。
45.一種用於產生靶DNA的5'加標籤的片段的文庫的方法,所述方法包括i)將所述靶DNA與轉座酶和轉座子末端組合物孵育,該轉座子末端組合物包含顯示處於其5'部分中的一種或多種用於特定目的的標籤域的序列以及處於其3'部分中的轉移的轉座子末端的序列的轉移鏈,所述孵育在其中所述轉座酶催化轉座反應的條件下進行, 其中a)所述靶DNA被斷裂;和b)所述轉座子末端組合物的所述轉移鏈與所述靶DNA的片段的5'端接合產生5'加標籤的靶DNA片段;其中所述轉座反應從所述靶DNA產生構成DNA片段文庫的多個5'加標籤的靶DNA片段。
46.一種組合物,所述組合物包含合成的核酸分子,所述合成的核酸分子具有含標籤域的5'部分和含轉座子末端的轉移鏈的3'部分。
47.一種組合物,所述組合物包含多種合成的核酸分子,其中所述核酸分子含有包含具有至少一個核苷酸差異的標籤域的5'部分和包含轉座子末端的轉移鏈的3'部分。
48.如權利要求46所述的組合物,其中至少所述3'部分為雙鏈DNA。
49.如權利要求46所述的組合物,其中所述轉座子末端為Tn5轉座子末端。
50.如權利要求46所述的組合物,其中所述轉座子末端為Mu轉座子末端。
51.如權利要求46或權利要求47所述的組合物,其中所述標籤域包括限制性位點域、 捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。
52.如權利要求55所述的組合物,其中所述標籤域包括測序標籤,所述測序標籤包括選自以下的測序標籤或由選自以下的測序標籤構成Roche 454A測序標籤和Roche 454B 測序標籤、ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、 Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics測序標籤。
53.如權利要求46所述的組合物,所述組合物包含純化的轉座酶。
54.如權利要求46所述的組合物,其中所述轉座酶選自Tn5轉座酶和Mu轉座酶。
55.如權利要求53所述的組合物,其中所述核酸分子和所述轉座酶在混合物中提供。
56.如權利要求55所述的組合物,所述組合物還包含非離子洗滌劑。
57.如權利要求46所述的組合物,其中所述非離子洗滌劑包括NonidetΡ-40和/或吐溫—20 ο
58.一種試劑盒,所述試劑盒包含權利要求46-61中任一項所述的組合物。
59.如權利要求58所述的試劑盒,所述試劑盒還包含DNA連接酶。
60.如權利要求58所述的試劑盒,所述試劑盒還包含DNA聚合酶。
61.如權利要求58所述的試劑盒,所述試劑盒還包括用於擴增反應的試劑。
62.如權利要求61所述的試劑盒,其中所述擴增反應為聚合酶鏈反應。
63.如權利要求62所述的試劑盒,其中所述用於擴增反應的試劑包括至少一種引物。
64.如權利要求63所述的試劑盒,其中至少一種引物包括含與所述核酸分子的所述 5'部分的所述標籤域的互補序列互補的3'部分的引物。
65.如權利要求58所述的試劑盒,其中所述標籤域包括限制性位點域、捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。
66.如權利要求69所述的試劑盒,其中所述標籤域包括測序標籤域,所述測序標籤域包括選自以下的測序標籤或由選自以下的測序標籤構成Roche 454A測序標籤和Roche 454B 測序標籤、ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics測序標籤。
67.如權利要求65所述的試劑盒,所述試劑盒還包括用於DNA測序反應的試劑。
68.一種反應混合物,所述反應混合物包括雙鏈靶DNA和權利要求46-57中任一項所述的組合物。
69.一種組合物,所述組合物包含純化的轉座酶和多種合成的轉座子末端或轉座子末端組合物。
70.如權利要求70所述的組合物,其中所述轉座子末端組合物包含髮夾轉座子末端。
71.如權利要求70所述的組合物,其中所述合成的轉座子末端或轉座子末端組合物包括轉移鏈和非轉移鏈。
72.如權利要求70所述的組合物,其中所述轉移鏈包含5'標籤域。
73.如權利要求72所述的組合物,其中所述標籤域包括限制性位點域、捕獲標籤域、測序標籤域、擴增標籤域、檢測標籤域、地址標籤域和轉錄啟動子域中的一種或多種。
74.如權利要求73所述的組合物,其中所述標籤域包括測序標籤,所述測序標籤包括選自以下的測序標籤或由選自以下的測序標籤構成Roche 454A測序標籤和Roche 454B 測序標籤、ILLUMINA S0LEXA 測序標籤、Applied Biosystems 的 SOLID 測序標籤、 Pacific Biosciences 的 SMRT 測序標籤、Pollonator Polony 測序標籤、或 Complete Genomics測序標籤。
75.如權利要求71所述的組合物,其中所述多種合成的轉座子末端包括彼此具有至少一個核苷酸差異的至少兩條轉移鏈。
76.如權利要求71所述的組合物,其中所述轉移鏈包含5'部分和3'部分,其中所述轉移鏈的所述5'部分中的至少兩個包含彼此具有至少一個核苷酸差異的標籤,並且其中所述轉移鏈的所述3'部分包含相同的轉座子末端序列。
77.如權利要求69所述的組合物,其中所述轉座子末端包括Mu轉座子末端並且所述轉座酶為Mu轉座酶。
78.如權利要求75所述的組合物,其中所述轉移鏈的所述3'部分包括來自Mu轉座子末端的序列,並且其中所述轉移鏈的所述5'部分不是來自Mu轉座子。
79.如權利要求69所述的組合物,其中所述轉座子末端包括Tn5轉座子末端並且所述轉座酶為Τη5轉座酶。
80.如權利要求75所述的組合物,其中所述轉移鏈的所述3'部分包括來自Τη5轉座子末端的序列,並且其中所述轉移鏈的所述5'部分不是來自Τη5轉座子。
81.—種組合物,所述組合物包括DNA片段文庫,其中所述DNA片段文庫包括所述靶 DNA的片段,所述靶DNA的片段具有包含來自轉座子末端或轉座子末端組合物的轉移鏈的序列的5'端。
82.如權利要求81所述的組合物,其中來自所述轉移鏈的所述序列包含5'標籤域。
83.如權利要求82所述的組合物,其中所述DNA片段文庫包括所述靶DNA的雙鏈片段。
84.如權利要求81所述的組合物,其中所述DNA片段文庫包括含與轉座子末端或轉座子末端組合物的轉移鏈互補的3'標籤的靶DNA的片段。
85.一種組合物,所述組合物包括含如下部分的靶DNA的加標籤的環狀DNA片段所述部分包含處於所述部分的5'端的非轉移鏈序列、處於所述部分的3'端的轉移鏈序列、包含標籤序列的間插的環序列、靶DNA的一部分的兩條鏈的序列。
86.—種組合物,所述組合物包含靶DNA的加標籤的環狀單鏈DNA片段,所述加標籤的環狀單鏈DNA片段包含來自轉座子末端或轉座子末端組合物的轉移鏈序列以及靶DNA的單鏈部分。
87.如權利要求86所述的組合物,其中所述轉移鏈序列包括標籤域。
88.一種組合物,所述組合物包含靶DNA的扇尾形雙鏈DNA片段,所述扇尾形雙鏈DNA 片段包含靶DNA的雙鏈部分,其中每條鏈具有包含轉移鏈序列的至少一部分的5'端和包含非轉移鏈序列的至少一部分的3'端。
全文摘要
本發明提供了使用轉座酶和轉座子末端在體外產生雙鏈靶DNA的廣泛斷裂和5′加標籤、然後不經PCR擴增反應使用DNA聚合酶產生5′和3′加標籤的單鏈DNA片段的方法,組合物和試劑盒,其中5′端上的第一標籤顯示轉移的轉座子末端的序列以及任選的另外的任意序列,並且3′端上的第二標籤顯示與第一標籤顯示的序列不同的序列。所述方法可用於產生5′和3′加標籤的DNA片段以用於多種過程,包括用於環境樣品中的DNA的宏基因組分析、DNA的拷貝數變異(CNV)分析以及包括大規模平行DNA測序(所謂的「下一代測序」)在內的比較基因組測序(CGS)的過程。
文檔編號C07H21/00GK102264914SQ200980152461
公開日2011年11月30日 申請日期2009年10月24日 優先權日2008年10月24日
發明者加力·大鹿, 傑羅馬·箭之撒, 海纓·李·格魯內瓦德, 猊克拉士·鎧如酋 申請人:阿霹震中科技公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀