新四季網

對雜聚靶核酸序列測序的方法

2023-11-09 23:50:27

專利名稱:對雜聚靶核酸序列測序的方法
技術領域:
本發明涉及一種包括隨機傳感的對雜聚靶核酸序列測序的方法。本發明還涉及一種通過修飾用於對靶核酸序列測序的孔的一個或多個位點而改良所述孔的方法。
背景技術:
隨機檢測是一種依賴於對分析物分子和受體之間的各個結合事件的觀察結果的傳感方法。隨機傳感器可以通過如下方式形成將納米尺寸的單孔置於絕緣膜中,並且在存在分析物分子的情況下測量電壓驅動的穿過所述孔的離子轉運。電流波動的發生頻率揭示在所述孔中結合的分析物的濃度。通過其不同的電流特徵——特別是電流阻斷的持續時間
和程度-可揭示分析物的種類(Braha,0.,Walker, B.,Cheley, S.,Kasianowicz, J. J.,
Song, L. , Gouaux, J. Ε. , and Bayley, H. (1997) Chem. Biol. 4,497-505 ;禾口 Bayley, H. , and Cremer, P.S. (2001)Nature 413,226-230)。形成細菌孔的毒素α-溶血素(α-HL)的基因工程改造形式已經用於對許多類型的分子進行隨機傳感(Bayley,H.,and Cremer, P. S. (2001)Nature 413,226-230 ;Shin, S. , H. , Luchian, Τ. , Cheley, S. , Braha, 0. , and Bayley, H. (2002) Angew. Chem. Int. Ed. 41, 3707-3709 ;禾口 Guan,X.,Gu, L. -Q.,Cheley, S.,Braha, 0.,and Bayley, H. (2005) Chem. BioChem. 6,1875-1881)。在這些研究過程中,已發現,試圖將α-HL改造以直接結合小的有機分析物被證明是很費力的,且鮮有成功的例子(Guan and colleague,見上文)。幸運的是,已經發現有一種不同的策略,該策略利用了非共價連接的分子銜接體,特別是環糊精(Gu, L. -Q.,Braha, 0.,Conlan, S.,Cheley, S.,and Bayley, H. (1999) Nature 398, 686-690),還有環形肽(Sanchez-Quesada, J. , Ghadiri, Μ. R. , Bayley, H. , and Braha, 0. (2000) J. Am. Chem. Soc. 122,11758-11766)和葫蘆脲(cucurbituril) (Braha, 0.,Webb, J.,Gu, L. -Q.,Kim, K.,and Bayley, H. (2005) Chem. Phys. Chem 6,889-892)。環糊精可短暫地進入所述α-HL孔中,並產生很大程度但不完全的通道阻斷。有機分析物在環糊精的疏水內部結合,它們可加強這種阻斷,使得分析物可被檢測(Gu,L. -Q.,Braha, 0.,Conlan, S.,Cheley, S.,and Bayley, H. (1999)Nature 398,686-690)。現在在大範圍應用中需要快速且廉價的DNA或RNA測序技術。現有的技術速度較慢且價格昂貴,主要是因為它們依賴於擴增技術產生大量核酸並且需要大量專門的螢光化學物質進行信號檢測。隨機傳感有可能通過減少所需核苷酸和試劑的量提供快速且廉價的 DNA測序。轉移的同聚核酸序列可以被蛋白質納米孔區分(例如Branton,D.,Deamer,D. W., Marziali, A. , Bayley, H. , Benner, S. A. , Butler, Τ. , Di Ventra, Μ. , Garaj, S. , Hibbs, Α., Huang, Χ. , et al. (2008)Nature Biotechnology 26,1146-1153)。還可以觀察到轉移單鏈 RNA 巾胃 歹[JHl]白勺$1 (Akeson, Μ. , Branton, D. , Kasianowicz, J. J. , Brandin, Ε.,& Deamer,D. W. (1999)Biophys. J. 77,3227-3233)。在固定 DNA 鏈末端的各個鹼基對也可以在納米孔內被鑑定(Winters-Hilt,S.,Vercoutere, W.,DeGuzman, V. S.,Deamer,D.,Akeson, M.,& Haussler, D. (2003) Biophys. J. 84,967-976),但不清楚可以怎樣對此修飾使之適合測序。最近,已「在處理過程中(on the fly)」觀察到各個修飾的核苷酸鹼基 (Mitchell, N. & Howorka,S. (2008)Angew. Chem. Int. Ed. Engl. 47,5565-5568),但這些結構非常巨大。現在不知道使用納米孔對雜聚核酸序列測序的方法。

發明內容
本發明人出乎意料地證明了孔可以區分核酸序列中至少四種不同核苷酸。換句話說,本發明人出乎意料地證明了孔可以用於通過隨機傳感對完整的雜聚靶核酸序列測序。本發明人還出乎意料地證明,具有兩個或多個能夠區分不同核苷酸的不同位點的孔顯示出改良的核苷酸識別。這類孔可有利地用於對核酸序列測序。如下文更詳細描述的, 在孔中存在不止一個能夠區分不同核苷酸的位點不僅使得可以確定核酸序列的長度,而且使得可以更有效地確定核酸序列的序列。最後,發明人出乎意料地證明,用於對核酸測序的孔可以通過修飾至少一個能夠區分不同核苷酸的位點而改良。如果一個孔具有的能夠區分不同核苷酸的位點太少,那麼可以通過引入一個或多個另外的位點而對其進行改良。如果一個孔具有的能夠區分不同核苷酸的位點太多,那麼可以通過除去一個或多個所述位點而對其進行改良。孔還可以通過增強或降低一個或多個位點區分不同核苷酸的能力而得到改良。因此,本發明提供了一種用於對雜聚靶核酸序列測序的方法,包括(a)使所述靶序列通過跨膜孔,使得所述靶序列中的一部分核苷酸一次一個地與所述孔中至少一個能夠區分不同核苷酸的位點相互作用;並且 (b)測量在每個相互作用過程中通過所述孔的電流,從而確定所述靶序列的序列。本發明還提供了 -包含七個包含SEQID NO :4所示序列或其變體的亞基的跨膜蛋白孔用於對靶核酸序列測序的用途;-一種改良用於對靶核酸序列測序的跨膜孔的方法,包括(a)修飾包含一個能夠區分不同核苷酸的位點的跨膜孔;並且(b)確定所產生的孔是否包含兩個或多個能夠區分不同核苷酸的不同位點;-一種改良用於對靶核酸序列測序的跨膜孔的方法,包括(a)修飾包含多於兩個能夠區分不同核苷酸的不同位點的跨膜孔;並且(b)確定所產生的孔是否包含兩個能夠區分不同核苷酸的不同位點;-一種改良用於對靶核酸序列測序的跨膜孔的方法,包括(a)修飾包含多於一個能夠區分不同核苷酸的不同位點的跨膜孔;並且(b)確定所產生的孔是否包含一個能夠區分不同核苷酸的位點;-一種改良用於對靶核酸序列測序的跨膜孔的方法,包括(a)修飾包含兩個或多個能夠在其中一處區分不同核苷酸的不同位點的跨膜孔; 並且(b)確定其他不同位點中的一個或者多個區分不同核苷酸的能力是否被改變;以及-使用本發明的方法改良的孔。


圖1示出α -HL孔對固定的DNA同聚物的區分。㈧圖示為通過使用生物素(黃色)_鏈酶親和素(紅色)連接而固定在α-HL孔(灰色,橫斷面)內的同聚DNA寡核苷酸 (藍色圈,僅顯示60個核苷酸長的序列的前25個核苷酸)。所述α-HL孔可以分成每一半長大約5nm的兩半位於順側入口(cis entrance)和中央收縮區之間的上孔腔(upper vestibule),位於中央收縮區和反側出口(trans entrance)之間的14鏈跨膜反向平行的β桶。直徑1.4nm的中央收縮區由所有七個亞基的Glu-lll、Lys-147(綠色陰影)和 Met-113側鏈形成(B、C,左圖)。當固定的多聚(dC)和多聚(dA)寡核苷酸阻斷時,WT和 E111N/K147N孔的電流水平(B、C,右圖)。典型項(event)直方圖顯示由多聚(dC)和多聚 (dA)寡核苷酸阻斷WT和E111N/K147N孔引起的殘餘電流水平。通過對數據進行Gaussian 擬合確定每個寡核苷酸的平均殘餘電流水平。圖2示出了用A5寡核苷酸探測α -HL孔對DNA的識別。㈧在原本為多聚(dC) 鏈(胞嘧啶核苷酸顯示為藍色圈)中的不同位置處(從3'生物素標籤編號)含5個連續腺嘌呤核苷酸(A5,紅圈)的5種寡核苷酸(i-v)。僅示出該40個核苷酸長的序列的前25 個核苷酸。(B,左圖)當E111N/K147N孔被多聚(dC)寡核苷酸阻斷時,從開孔電流值(孔未被DNA阻斷)逐步減少至約37%的殘餘電流(Ikes)水平。(B,右圖)當孔被不同序列的寡核苷酸阻斷時的Ikes水平(顯示了寡聚物iv和多聚(dC))。(C)寡核苷酸i-v(子圖A) 和多聚(dC) 40對WT (綠色條)和E111N/K147N(橙色條)α-HL孔的阻斷之間的殘餘電流差(Δ Ikes) (AIees = Ike^v-Ikes-。指示了當固定於α -HL孔時每個寡核苷酸的腺嘌呤 (A5)片段的可能位置(右圖)。圖3示出α-HL對單腺嘌呤核苷酸的區分。曲線圖(中圖)指示,包含單腺嘌呤核苷酸的多聚(dC)寡核苷酸(每個寡核苷酸的序列顯示於左)引起的對WT(綠色)和ElllN/ K147N(橙色)α-HL孔的阻斷和多聚(dC) 40引起的對WT (綠色)和E111N/K147N(橙色) α-HL孔的阻斷之間的殘餘電流差(ΔΙΚΚ值)。R1^和R3代表所述α-HL納米孔中3個提出的識別位點。它們可能的位置指示於所述α-HL孔的β桶結構域的橫截面上(右圖)。圖4示出WT和Ε111Ν/Κ147Ν α-HL孔對所有4種DNA鹼基的識別。顯示了 WT (左圖)和Ε111Ν/Κ147Ν(右圖)孔的殘餘電流水平的直方圖。使用了 3組4種一組的多聚(dC) 寡核苷酸,每組在一個特定位置包含單G、A、T或C核苷酸。所有實驗均進行至少3次,圖中顯示的結果來自代表性實驗。(A)以SEQ ID NO :35-38測試WT和E111N/K147N孔。對每個峰進行Gaussian擬合,每種寡核苷酸的殘餘電流的平均值(和標準差)顯示於直方圖下的表中。(B)以 SEQ ID NO :39-42 測試 WT 和 E111N/K147N 孔。(C)以 SEQ ID NO 43-46 測試 WT 和 E111N/K147N 孔。圖5示出探測E111N/K147N α-HL孔對雜聚寡核苷酸中的單核苷酸的區分。以4 條僅一個位置不同(大的字母)的雜聚DNA鏈(中圖)測試Ε111Ν/Κ147Ν孔的殘餘電流水平的直方圖(上圖)。對每個峰進行Gaussian擬合,顯示了每種寡核苷酸的殘餘電流的平均值(和標準差)(下圖)。圖 6 示出在含 0. ImM EDTA 的 IM KCl,25mM Tris. HCl,pH 8. 0 中 WT(方塊)和 E111N/K147N(圓圈)α -HL孔的典型電流-電壓(IV)跡線。
6
圖7示出用於生物素化DNA寡核苷酸的3『末端的生物素-TEG連接體的化學結構。所述結構用ChemBioDraw Ultra 11產生。圖8示出多聚(dA)(方塊)或多聚(dC)(菱形)穿過的WT孔的Ikes電壓依賴性。 曲線圖的數據通過以下方式獲得對在不同施加電勢下每種寡核苷酸多次阻斷的殘餘電流水平直方圖進行Gaussian擬合,然後取平均值。顯示了與進行Gaussians擬合相關的標準差。圖9示出兩個探頭優於一個探頭。a)具有兩個讀取探頭R1和&的理論納米孔傳感器(綠色),它在原則上能夠比具有單個讀取探頭的裝置從DNA鏈(紅色)提取更多的序列信息。b)為了驗證該想法,發明人假定DNA的4種鹼基在讀取探頭R1可產生4個不同電流水平(如所示廣泛地分散)。所述水平每個可被所述第二讀取探頭&再分成4個水平 (為了顯示的目的,分散度較低),產生總共16個電流水平並提供有關DNA序列的冗餘信肩、ο圖10示出設計的α HL納米孔在札和&處的4鹼基區分。顯示了對於一個4種寡核苷酸的組(右圖),E111N/K147N/M113Y(NNY)孔的殘餘電流水平直方圖(左圖)。B代表3'生物素-TEG延伸片段。每個實驗均進行至少3次,圖中顯示的結果來自單次實驗。 當所述寡核苷酸被驅動進入所述α -HL孔時,所述取代的核苷酸位於R1 (紅)或& (綠)。 對所述直方圖中的每個峰進行Gaussian擬合。圖11示出當以可同時探測R1和&的寡核苷酸測試NNY孔時觀察到的預測和實驗殘餘電流水平差(AIees)0以16種寡核苷酸探測E111N/K147N/M113Y(NNY)孔,該寡核苷酸的序列是 5『 -CCCCCCCCCCCCCCCCCCCCCCCCCCNCCCCNCCCCCCCCB-3『,其中 N 是 A、T、G 或 C(N9N14,表5)。示出的直方圖顯示,不同寡核苷酸產生的阻斷相對於多聚(dC)產生的阻斷平均值的殘餘電流水平差。多聚(dC)的電流水平被設置為0。殘餘電流水平低於多聚(dC) 的阻斷的Δ Ikes值為負,殘餘電流水平高於多聚(dC)的阻斷的Δ Ikes值為正。灰色虛線顯示了基於表5中顯示的Δ Iees數據預測的殘餘電流水平(見實施例2、。1 示記的峰值來自非特異性阻斷,在此分析中不考慮。序列表說明SEQ ID NO=I示出編碼野生型α -溶血素(α -HL)的一個亞基的多核苷酸序列。SEQ ID NO :2示出了野生型α-HL的一個亞基的胺基酸序列。胺基酸2_6、 73-75,207-209,214-216 和 219-222 構成 a -螺旋。胺基酸 22-30、35-44、52-62、67_71、 76-91、98-103、112-123、137-148、154-159、165-172、229-235、243-261、266-271、285-286 和291-293構成β -鏈。所有其他非末端胺基酸,即7-21、31-34、45-51、63-66、72、92-97、 104-111、124-136、149-153、160-164、173-206、210-213、217、218、223-228、236-242、 262-265,272-274和287-290構成環區。胺基酸1和四4為末端胺基酸。SEQ ID NO :3示出了編碼a-HL E111N/K147N的一個亞基的多核苷酸序列。SEQ ID N0:4示出了 a-HL E111N/K147N的一個亞基的胺基酸序列。在野生型 a-HL中構成α-螺旋、β _鏈和環區的相同胺基酸在此亞基中構成相應的區域。SEQ ID NO 5示出了來源於大腸桿菌的sbcB基因的密碼子優化的多核苷酸序列。 其編碼大腸桿菌的核酸外切酶I (EcoExoI)。SEQ ID NO :6示出了大腸桿菌的核酸外切酶I (EcoExoI)的胺基酸序列。此酶以3,到5,方向從單鏈DNA(ssDNA)持續消化5,單磷酸核苷。胺基酸60-68、70-78、80_93、 107-119、124-128、137-148、165-172、182-211、213-221、234-241、268-286、313-324、 326-352、362-370、373-391、401-454 和 457-475 構成 α -螺旋。胺基酸 10-18,28-26, 47-50、97-101、133-136、229-232、243-251、258-263、298-302 和 308-311 構成 β-鏈。 所有其他非末端胺基酸 19-27、37-46、51-59、69、79、94-96、102-106、120-123、口9-132、 149-164、173-181、212、222-228、233、242、252-257、264-267、287-297、303-307、312、325、 353-361、371、372、392-400、455和456構成環。胺基酸1_9為末端胺基酸。所述酶的整體摺疊使得三個區域聯合形成字母C外形的分子,但無序分布在所述晶體結構中的殘基 355-358有效地將此C形轉化為類0形。氨基末端(1-206)可構成外切酶結構域並與DnaQ 超家族具有同源性,後面的殘基(202-354)構成SH3樣結構域並且羧基結構域(359-475) 伸出外切酶結構域,形成C形分子。EcoExoI的4個酸性殘基與DnaQ超家族的活性位點殘基是保守的(對應於D15、E17、D108和D186)。已經提出,單個金屬離子被殘基D15和108 結合。DNA的水解似乎通過以活性水分子攻擊易切斷的磷酸酯進行催化,H181為催化殘基並比對核苷酸底物。SEQ ID NO 7示出了來源於大腸桿菌的xthA基因的密碼子優化的多核苷酸序列。 其編碼大腸桿菌的核酸外切酶III。SEQ ID NO 8示出了大腸桿菌的核酸外切酶III的胺基酸序列。此酶以3』到5』 方向從雙鏈DNA(dsDNA)的一條鏈持續消化5』單磷酸核苷。酶在鏈上的啟動需要大約4個核苷酸的 5,突出。胺基酸 11-13、15-25、39-41、44-49、85-89、121-139、158-160、165-174、 181-194、198-202、219-222、235-240 和 248-252 構成 α -螺旋。胺基酸 2-7、29_33、53_57、 65-70、75-78、91-98、101-109、146-151、195-197、229-234和 241-246 構成 β -鏈。所有其他非末端胺基酸 8-10、洸-28、;34-38、42、43、50-52、58-64、71-74、79-84、90、99、100、110-120、 140-145、152-157、161-164、175_180、203-218、223_228、247 和 253-261 構成環。胺基酸 1 和 267和268為末端胺基酸。酶活性位點通過連接β「α 」 β 3- β 4、β 5- β 6、β m- Q1^iv-Q11 和 β ν_ β γι 的環區(分別由胺基酸 8-10、58-64、90、110-120、152-164、175-180,223-228 和 253-261構成)形成。單個二價金屬離子結合於殘基E34並幫助通過催化性和H259 組氨酸-天門冬氨酸對親核攻擊磷酸二酯鍵。SEQ ID NO 9示出了源於嗜熱棲熱菌(T. thermophilus)的recj基因的密碼子優化的多核苷酸序列。其編碼嗜熱棲熱菌的RecJ酶(TthRecJ-cd)。SEQ ID NO 10示出了嗜熱棲熱菌的RecJ酶(TthRecJ-cd)的胺基酸序列。此酶以5』到3』方向從單鏈DNA持續消化5』單磷酸核苷。酶在鏈上的啟動需要至少4個核苷酸。胺基酸 19-33、44-61、80-89、103-111、136-140、148-163、169-183、189-202、207-217、 223-240、242-252、254-287、302-318、338-350 和 365-382 形成 α -螺旋。胺基酸 36-40、 64-68、93-96、116-120、133-135、294-297、321-325、328-332、352-355 和 359-363 構成 β _ 鏈。所有其他非末端胺基酸 34、35、41-43、62、63、69-79、90-92、97-102、112-115、 121-132、141-147、164-168、184-188、203-206、218-222、241、253、288-293、298-301、319、 320、326、327、333-337、351-358 和 364 構成環。胺基酸 1-18 和 383-425 為末端胺基酸。 僅對嗜熱棲熱菌(Thermus thermophilus)的RecJ的核心結構域(殘基40-463)的晶體結構進行了解析。為確保所述RecJ核心結構域的翻譯和體內表達的啟動,在其氨基末端添加一個甲硫氨酸殘基,這不包含在晶體結構信息中。所解析的結構示出了由長α-螺旋 (254-287)連接的兩個結構域氨基區(2-25 和羧基區(觀8_46;3)。催化殘基(D46、D98、 H122和D18!3)與單個二價金屬離子配合以對磷酸二酯鍵進行親核攻擊。D46和H120被認為是催化對;然而,大腸桿菌的RecJ中這些保守殘基的任一個的突變均顯示會完全破壞活性。SEQ ID NO 11示出了來源於噬菌體λ的exo (redX)基因的密碼子優化的多核苷酸序列。其編碼噬菌體λ的核酸外切酶。SEQ ID Ν0:12示出噬菌體λ的核酸外切酶的胺基酸序列。該序列是裝配為三聚體的三個相同亞基之一。該酶以3』到5』方向高度持續消化dsDNA的一條鏈的核苷酸。 酶在鏈上的啟動優先需要大約4個具有5』磷酸的核苷酸的5』突出。胺基酸3-10、14-16、 22-26、34-40、52-67、75-95、135-149、152-165 和 193-216 構成 α-螺旋。胺基酸 100-101、 106-107、114-116、120-122、127-131、169-175 和 184-190 構成 β -鏈。所有其他非末端胺基酸 11-13、17-21、27-33、41-51、68-74、96-99、102-105、108-113、117-119、123-126、 132-134、150-151、166-168、176-183、191-192、217-222 構成環。胺基酸 1、2 和 226 為末端胺基酸。λ核酸外切酶是同源三聚體,其形成中間具有錐形通道的環狀體,所述通道明顯在一端足夠大允許dsDNA進入,並且在另一端只允許ssDNA離開。催化殘基未確定,但單個二價金屬離子似乎通過殘基D119、E129和L130結合在每個亞基上。SEQ ID NO :13-66示出了實施例中使用的寡核苷酸。在使用時,所有寡核苷酸均具有3'生物素-TEG標籤和連接體(圖7)。
具體實施例方式應理解,本文公開的產品和方法的不同應用可以根據本領域的具體需求而改變。 還應理解,本文中使用的術語僅僅是為了描述本發明的具體實施方案,不是意欲進行限制。此外,當在本說明書和所附權利要求中使用時,除非內容中另外清楚地指出,否則單數形式「a」、「an」和「the」也包括複數指代對象。因此,例如,提到「a nucleotide」時包括「nucleotides」,提到「a pore」時包括兩個或多個該孔,提到「an enzyme」時包括兩種或多種這樣的酶,等等。在本文的上文和下文中引用的所有出版物、專利和專利申請均通過引用的方式全文納入本文。核酸測序方法本發明提供一種對雜聚靶核酸序列測序的方法。所述方法包括(a)使所述靶序列通過跨膜孔,使得所述靶序列中的一部分核苷酸一次一個地與所述孔中至少一個能夠區分不同核苷酸的位點相互作用;並且(b)測量在每個相互作用過程中通過所述孔的電流,從而確定所述靶序列的序列。當核苷酸與所述孔中至少一個能夠區分不同核苷酸的位點相互作用時,它們一次一個地被依次鑑定。因此,所述方法包括,當核苷酸以連續方式通過跨膜孔的桶或通道時,對所述靶核酸序列中的一部分核苷酸進行隨機傳感,從而對所述靶序列測序。包含兩個或多個能夠區分不同核苷酸的不同位點的孔特別適用於該方法。為了對所述核酸有效測序,重要的是確保以連續方式鑑定所述靶核酸中的核苷酸。如下文中更詳細討論的,存在兩個或多個能夠區分不同核苷酸的不同位點可確保所述靶序列中的核苷酸被讀取至少兩次。這可提高所述測序的準確性。所述方法可使用任何合適的跨膜孔插入膜中的膜/跨膜孔體系進行。所述方法通常使用以下膜進行(i)包含跨膜孔的人工膜;(ii)分離的包含跨膜孔的天然膜;或者 (iii)表達跨膜孔的細胞。所述方法優選使用人工膜進行。除用於測序的跨膜孔之外,所述膜還可包含其他跨膜蛋白和/或膜內蛋白以及其他分子。所述膜形成離子流、核苷酸和核酸的障礙物。所述膜優選是脂質雙層。適合依照本發明使用的脂質雙層可使用本領域已知的方法製備。例如,脂質雙層膜可使用Montal和 Mueller (1972)的方法形成。脂質雙層還可使用國際專利申請PCT/GB08/000563和PCT/ GB08/002856描述的方法形成。本發明的方法可使用由任何膜脂構成的脂質雙層進行,所述膜脂質包括但不限於磷脂、糖脂、膽固醇及其混合物。可使用國際專利申請PCT/GB08/000563中描述的任一種脂質。將孔插入膜(例如脂質雙層)的方法為本領域所知。上文討論了這其中的一些方法。所述方法通常在體外進行。雜聚靶核酸序列可以使用本發明的方法對所述靶序列的全部或僅一部分測序。所述靶序列可以是任意長度。例如所述靶序列可以長至少10、至少50、至少100、至少150、至少200、至少250、 至少300、至少400或至少500個核苷酸。所述靶序列可以為較長核酸序列的一部分。例如,所述靶序列可以對應於較長核酸序列的一段,例如一半。所述序列在所述靶序列之外的其他部分不必根據本發明進行測序。本發明的方法中使用的靶序列是完整序列。換句話說,所述靶序列在根據本發明進行測序之前未經切割或消化來形成較短核苷酸序列或單個核苷酸。核酸是包含兩個或多個核苷酸的大分子。蛋白質結合的核酸可包含任何核苷酸的任意組合。核苷酸可以是天然存在的或者人工的。核苷酸通常包含核鹼基、糖和至少一個磷酸基。核鹼基一般是雜環。核鹼基包括但不限於嘌呤和嘧啶,並且更具體是腺嘌呤、鳥嘌呤、胸腺嘧啶和胞嘧啶。核鹼基還可以是5-甲基胞嘧啶或羥甲基胞嘧啶。糖通常是戊糖。 核苷酸糖包括但不限於核糖和脫氧核糖。核苷酸通常是核糖核苷酸或脫氧核糖核苷酸。核苷酸通常包含單磷酸、二磷酸或三磷酸。磷酸可以連接在核苷酸的5』側或3』側。核苷酸包括但不限於單磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、 單磷酸鳥苷(GMP)、二磷酸鳥苷(GDP)、三磷酸鳥苷(GTP)、單磷酸胸苷(TMP)、二磷酸胸苷 (TDP)、三磷酸胸苷(TTP)、單磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、單磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、環單磷酸腺苷(cAMP)、環單磷酸鳥苷(cGMP)、單磷酸脫氧腺苷(dAMP)、二磷酸脫氧腺苷(dADP)、三磷酸脫氧腺苷(dATP)、單磷酸脫氧鳥苷(dGMP)、二磷酸脫氧鳥苷(dGDP)、三磷酸脫氧鳥苷(dGTP)、單磷酸脫氧胸苷(dTMP)、二磷酸脫氧胸苷(dTDP)、三磷酸脫氧胸苷(dTTP)、單磷酸脫氧尿苷(dUMP)、二磷酸脫氧尿苷(dUDP)、三磷酸脫氧尿苷(dUTP)、單磷酸脫氧胞苷(dCMP)、二磷酸脫氧胞苷(dCDP)和三磷酸脫氧胞苷(dCTP)。所述核苷酸優選選自AMP、TMP、GMP、CMP、UMP, dAMP、 dTMP、dGMP 禾口 dCMP。靶序列中的核苷酸通常經磷酸二酯鍵連接在一起。所述靶核酸可以是脫氧核糖核酸(DNA)或核糖核酸(RNA)。所述靶核酸可以是現有技術中已知的任何合成核酸,例如肽核酸(PNA)、甘油核酸(GNA)、蘇糖核酸(TNA)、鎖核酸(LNA)或具有核苷酸側鏈的其他合成聚合物。所述靶序列可以是單鏈或雙鏈。如果所述靶序列是雙鏈,那麼所述方法優選包括使所述靶序列的僅一條鏈通過所述孔。許多孔(特別是跨膜蛋白孔)的桶或通道一般不足夠大從而無法使雙鏈核酸通過。用於從雙鏈靶序列分離出一條鏈並使之通過所述孔的方法在下文更詳細地討論。雜聚靶核酸序列包含兩個或多個(例如3、4、5、6或更多個)不同核苷酸。所述靶序列優選包含三個或更多個不同核苷酸。所述靶序列更優選包含四個不同核苷酸。所述四個不同核苷酸優選是組成DNA或RNA的四個不同核苷酸。具體而言,所述四個不同核苷酸優選獨立地包含核鹼基(a)腺嘌呤、(b)鳥嘌呤、(c)胸腺嘧啶或尿嘧啶和(d)胞嘧啶。所述靶序列更優選地包含5個不同核苷酸。所述五個不同核苷酸優選獨立地包含核鹼基(a) 腺嘌呤、(b)鳥嘌呤、(c)胸腺嘧啶或尿嘧啶、(d)胞嘧啶和(e)5-甲基胞嘧啶。所述方法一般使用序列未知的靶序列進行。或者,所述方法可以使用序列全部或部分已知或者全部或部分可預測的靶序列進行。所述靶序列可以是天然存在的或人工的。例如,所述方法可用於驗證製備的寡核苷酸的序列。所述方法一般使用獲自或提取自任何生物體或微生物體的靶序列進行。所述生物體或微生物體一般是原核生物、真核生物或古生物,並且一般屬於如下5個界中的一個界植物界(Plantae)、動物界(Animalia)、真菌界(Fungi)、原核生物界(Monera)和原生生物界(Protista)。所述方法一般可對獲自或提取自任何病毒的靶序列進行。一般而言,所述靶序列是人源的,但它或者可以來自另一哺乳動物,例如來自市售的農場動物如馬、牛、綿羊或豬,或者可以是寵物例如貓或狗。—般在進行所述方法前將所述靶序列進行處理,例如擴增、離心或者穿過可濾掉不需要的分子或細胞(如紅細胞)的濾膜。可在採集後立即使用所述靶序列。在進行所述方法之前,通常也可將所述靶序列進行保存,優選保存在低於-70°C下。使所述靶序列通過所述孔本發明的方法涉及使所述靶序列以受控且逐步的方式通過所述孔。所述靶序列一般被推過或拉過所述孔。可以使用使所述靶序列通過所述孔的任何方法。所述靶序列可以從順側至反側或者從反側至順側通過所述孔。所述靶序列可以順著或逆著施加電勢通過所述孑L優選使用核酸操作酶使所述靶序列通過所述孔。大部分DNA操作酶均適用於此用途,只要它們水解、聚合或加工核酸。所述酶可操作單鏈或雙鏈核酸。如果使用跨膜蛋白孔,那麼所述酶優選使所述靶序列的單鏈通過所述孔。如果所述靶序列是雙鏈,那麼這可以通過使用可分離雙鏈核酸的兩條鏈的酶實現。例如,進行性或持續性作用於雙鏈核酸的核酸外切酶可用在所述孔的順側上,以在施加電勢下送入剩下的單鏈,或者在反向電勢下從反側送入。同樣,還可以以類似的方式使用可解開雙鏈核酸的解螺旋酶。所述方法優選包括將所述靶序列與核酸操作酶接觸,使得所述靶序列以這樣的速 率通過孔,即使得所述靶序列的一部分核苷酸一次一個地與所述孔中至少ー個能夠區分不 同核苷酸的位點接觸。這樣做的方法是本領域中公知的。所述核酸操作酶發揮功能的速率 通過相對於野生型酶的突變進行改變。例如,可依照本發明使用具有降低或升高的最佳活 性速率的變體酶。核酸操作酶在本發明方法中的合適活性速率是每秒操作0. 5-1000個核 苷酸、毎秒操作0. 6-500個核苷酸、毎秒操作0. 7-200個核苷酸、毎秒操作0. 8-100個核苷 酸、毎秒操作0. 9-50個核苷酸或毎秒操作1-20或10個核苷酸。所述速率優選每秒1、10、 100,500或1000個核苷酸。所述酶還優選在0°C -100°c例如10°C -60°C的溫度下或者在室溫下保留有至少部 分活性。這使得可在包括室溫的多個溫度下對所述靶序列測序。核酸操作酶是能夠與核酸相互作用並改變其至少ー種性質的多肽。所述酶優選通 過確定所述核酸的方向至或使其移動至具體位置而改變所述核酸。所述核酸操作酶優選來源於溶核酶或核酸酶。用於酶構建體的核酸操作酶更 優選是酶分類(EC)組 3. 1. 11,3. 1. 13,3. 1. 14,3. 1. 15,3. 1. 16,3. 1. 21,3. 1. 22,3. 1. 25、 3. 1. 26,3. 1. 27,3. 1. 30和3. 1. 31的任一組的成員。所述核酸操作酶更優選來源於以下酶 的任ー種 3. 1. 11.-產生5』 -磷酸單酯的脫氧核糖核酸外切酶。O 3. 1. 11. 1脫氧核糖核酸外切酶I。O 3. 1. 11.2脫氧核糖核酸外切酶III。〇3. 1. 11. 3脫氧核糖核酸外切酶(人誘導的)。O 3. 1. 11.4脫氧核糖核酸外切酶(噬菌體SP3誘導的)。O 3. 1. 11.5脫氧核糖核酸外切酶V。O 3. 1. 11.6脫氧核糖核酸外切酶VII。
3. 1. 13.-產生5』 -磷酸單酯的核糖核酸外切酶。〇3. 1. 13. 1核糖核酸外切酶II。〇3. 1. 13. 2核糖核酸外切酶H。〇3. 1. 13. 3寡核苷酸酶。〇3. 1. 13. 4Poly(A)特異的核糖核酸酶。〇3. 1. 13. 5核糖核酸酶D0 3. 1. 14.-產生3』 -磷酸單酯的核糖核酸外切酶。〇3. 1. 14. 1酵母核糖核酸酶。
3. 1. 15.-產生5』 -磷酸單酯的對核糖核酸或脫氧核糖核酸具有活性的核酸外 切酶。〇 3. 1. 15. 1 毒液核酸外切酶(Venom exonuclease)。
3. 1. 16.-產生3』 -磷酸單酯的對核糖核酸或脫氧核糖核酸具有活性的核酸外 切酶。〇 3. 1. 16. 1 脾核酸外切酶(Spleen exonuclease)。
3. 1. 21.-產生5』 -磷酸單酯的脫氧核糖核酸內切酶。
O 3. 1.21. 1脫氧核糖核酸酶I。〇3. 1. 21. 2脫氧核糖核酸酶IV(噬菌體T(4)誘導的)。〇3. 1. 21. 31型位點特異的脫氧核糖核酸酶。〇3. 1. 21. 411型位點特異的脫氧核糖核酸酶。〇3. 1. 21. 5III型位點特異的脫氧核糖核酸酶。〇3. 1. 21. 6CC偏愛的脫氧核糖核酸內切酶。O 3. 1.21. 7脫氧核糖核酸酶V。
3. 1.22.-不產生5』 -磷酸單酯的脫氧核糖核酸內切酶。〇3. 1.22. 1脫氧核糖核酸酶II。O 3. 1.22.2 麴黴(Aspergillus)脫氧核糖核酸酶 K(I)。〇 3. 1. 22. 3 轉至條目3. 1. 21. 7。〇3. 1.22. 4交聯連接脫氧核糖核酸內切酶(crossover junction endodeoxyribonuclease)。〇3. 1.22. 5脫氧核糖核酸酶X。
3. 1. 25.-對改變的鹼基特異的位點特異性脫氧核糖核酸內切酶。〇3. 1. 25. 1脫氧核糖核酸酶(嘧啶ニ聚體)。〇 3. 1. 25. 2 轉至條目4. 2. 99. 18。^3.1. .-產生5』 -磷酸單酯的核糖核酸內切酶。〇 3. 1. 26. 1 多頭絨泡菌(Physarum polycephalum)核糖核酸酶。〇3. 1.沈.2核糖核酸酶a。〇3. 1.沈.3核糖核酸酶III。〇3. 1. 26. 4核糖核酸酶H。〇3. 1. 26. 5核糖核酸酶P。〇3. 1.沈.6核糖核酸酶IV。〇3. 1. 26. 7核糖核酸酶P4。〇3. 1.沈.8核糖核酸酶M5。〇3. 1. 26. 9核糖核酸酶(poly (U)特異的)。O 3. 1. 26. 10 核糖核酸酶 IX。O 3. 1. 26. 11 核糖核酸酶 Z。
3. 1. 27.-不產生5』 -磷酸單酯的核糖核酸內切酶。〇3. 1.27. 1核糖核酸酶バ2)。〇3. 1. 27. 2枯草芽胞桿菌(Bacillus subtilis)核糖核酸酶。〇3. 1.27. 3 核糖核酸酶 T(I)。〇3. 1.27. 4核糖核酸酶U O)。O 3. 1.27.5胰腺核糖核酸酶。〇 3. 1. 27. 6 腸桿菌(Enterbacter)核糖核酸酶。〇3. 1.27. 7核糖核酸酶F。〇3. 1. 27. 8核糖核酸酶V。〇3. 1. 27. 9tRNA-內含子核酸內切酶。
〇 3. 1. 27. IOrRNA 核酸內切酶。· 3. 1. 30.-產生5』 -磷酸單酯的對核糖核酸或脫氧核糖核酸具有活性的核糖核酸內切酶。〇3. 1.30. 1 麴黴核酸酶 S(I)。〇 3. 1. 30. 2 粘質沙雷氏菌(Serratia marcescens)核酸酶。· 3. 1. 31.-產生3』 -磷酸單酯的對核糖核酸或脫氧核糖核酸具有活性的核糖核酸內切酶。〇 3. 1. 31. 1 微球菌(micrococcal)核酸酶。所述酶最優選來源於核酸外切酶,例如脫氧核糖核酸外切酶,其切割核酸以形成單個核苷酸。脫氧核糖核酸外切酶的優點在於其對單鏈和雙鏈核酸均有活性並以5』 -3' 方向或3』 -5』方向水解鹼基。單個核苷酸是單核苷酸。核苷酸可以是上文詳述核苷酸的任一種。單個核苷酸是不通過任何鍵例如磷酸二酯鍵與另一個核苷酸或核酸結合的核苷酸。磷酸二酯鍵包括結合於另一個核苷酸的糖基的核苷酸的磷酸基團之一。單個核苷酸通常是不通過任何方式與另一個至少5、至少10、至少20、至少50、至少100、至少200、至少500、至少1000或至少5000 個核苷酸的核酸序列結合的核苷酸。優選的用於本發明的酶包括大腸桿菌的核酸外切酶I (SEQ ID NO 6)、大腸桿菌的核酸外切酶III (SEQ ID NO :8)、嗜熱棲熱菌的RecJ(SEQ ID NO 10)和噬菌體λ核酸外切酶(SEQ ID NO 12)及其變體。SEQ ID NO :12的3個相同亞基相互作用以形成三聚體核酸外切酶。所述酶最優選基於大腸桿菌的核酸外切酶I (SEQ ID NO :6)。所述核酸操作酶優選地包含SEQ ID NO :6、8、10和12所示的任一序列或其變體。 SEQ ID NO :6、8、10或12的變體是具有從SEQ IDNO :6、8、10或12變化而來但保留有其核酸操作能力的胺基酸序列的酶。可以使用本領域中已知的任何方法測定變體操作核酸的能力。例如,變體操作核酸的能力可以通過以下方式測定將所述酶與核酸接觸並測定其確定所述核酸的方向或使其移動至具體位置的能力。所述變體可包括有助於操作核酸和/或有助於其在高鹽濃度和/或室溫下的活性的修飾。所述酶可以是由生物體例如大腸桿菌表達的天然變體。變體還可包括通過重組技術產生的非天然變體。在SEQ ID NO :6、8、10或12的胺基酸序列的全長上,變體優選與該序列以胺基酸同一性計至少50%同源。更優選地,所述變體多肽可以與SEQ ID NO :6,8, 10或12的胺基酸序列在整個序列上以胺基酸同一性計至少55%、至少60%、至少65%、至少70 %、至少75 %、至少80 %、至少85 %、至少90 %並且更優選地至少95 %、97 %或99 %同源。對於200個或更多個例如230、250、270或280個或更多個連續胺基酸的片段,可存在至少80%例如至少85%、90%或95%的胺基酸同一性(「硬同源性(hard homology)」)。可以用本領域的標準方法確定同源性。例如UWGCG軟體包提供的BESTFIT程序可以用於計算同源性(例如使用它的默認設置)(Devereux et al (1984)Nucleic Acids Research 12,p387_395)。例如,如 Altschul S. F. (1993) J Mol Evol 36:290-300; Altschul, S, F et al(1990)J Mol Biol215 :403-10 中所述,可以使用 PILEUP 和 BLAST 算法計算同源性或者對序列進行比對(例如鑑定等價殘基或相應的序列(一般使用它們的默認設置))。進行BLAST分析的軟體公眾可以從美國國家生物技術信息中心(National Center for Biotechnology Information ) (http://www. ncbi. nlm. nih. gov/)獲得。所述算法涉及到首先鑑定高分值序列對(HSP),這個步驟是通過如下方式實現在查詢序列中鑑定長度為W的短欄位,所述短欄位當與資料庫序列中相同長度的欄位比對時匹配或者滿足某些正值的閾值分數Τ。T是指鄰近欄位分值閾值(Altschul et al,見上文)。將這些初始鄰近匹配欄位作為種子啟動檢索,以發現包含它們的HSP。在累積比對分值能夠增加期間,在每條序列的兩個方向進行匹配欄位延伸。匹配欄位在每個方向上的延伸停止的條件是所述累積比對分值從其所達到的最大值下降X量;由於一個或多個負得分殘基比對的累積, 所述累積分值降到0或小於0 ;或者達到任何一個序列的端點。所述BLAST算法的參數W、 T和X決定了比對的敏感度和速度。所述BLAST程序使用的默認欄位(W)為11,BL0SUM62 打分矩陣(見Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89:10915-10919) 比對⑶為50,期望值(E)為10,M = 5,N = 4,並且是進行雙鏈比較。所述BLAST算法可進行兩個序列之間的相似性的統計分析;參見例如Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90 :5873_5787。所述 BLAST 算法提供的一種相似性的量度是最小和概率(P(N)),所述最小和概率表示兩個胺基酸序列之間隨機出現匹配的概率。例如,如果一個序列與另一個序列比較中的最小和概率小於約1,優選小於約0. 1, 更優選小於約0. 01,並且最優選小於約0. 001,那麼第一序列被認為與第二序列相似。除上面討論的以外,還可對SEQ ID NO :6、8、10或12的胺基酸序列進行胺基酸置換,例如最多達1、2、3、4、5、10、20或30個置換。保守性置換可例如根據下表1進行。表1.保守性置換第二列同一格中的胺基酸,優選第三列同一行中的胺基酸可相互置換。
非芳香族非極性GAPILV極性、不帶電CSTMNQ極性、帶電DEHKR芳香族HFWY還可從上文描述的多肽中額外缺失SEQ ID NO :6、8、10或12的胺基酸序列的一個或多個胺基酸殘基。可以缺失最多達1、2、3、4、5、10、20或30個殘基,或者更多個。變體可為SEQ ID NO :6、8、10或12的片段。這類片段保留了核酸操作活性。片段長度可為至少50、100、200或250個胺基酸。片段優選地包含SEQ ID NO :6、8、10或12的核酸操作結構域。可將一個或多個胺基酸替代地或額外地加至上述的多肽上。在SEQ ID NO :6、8、 10或12或其變體或片段的胺基酸序列的氨基端或羧基端,可提供一段延長片段。所述延長片段可以非常短,例如長度為1-10個胺基酸。或者,所述延長片段可以較長,例如最多達 50或100個胺基酸。可將載體蛋白融合於亞基或變體。如上面所討論的,SEQ ID NO :6、8、10或12的變體是具有從SEQ ID N0:6、8、10或 12變化而來的胺基酸序列且保留了其操作核酸的能力的蛋白。變體一般包含SEQ ID NO 6、8、10或12中負責操作核酸的區域。SEQ ID NO :6、8、10或12的催化結構域在上文對序列表的說明中進行了詳細描述。SEQ ID NO :6、8、10或12的變體優選包含所述相關催化結構域。SEQ ID NO :6、8、10或12的變體一般在所述相關催化結構域外包括一個或多個修飾, 例如置換、插入或刪除。可對所述變體進行修飾,例如通過添加組氨酸或天冬氨酸殘基以幫助其鑑定或純化,或者添加信號序列以促進所述多肽從天然不含所述信號序列的細胞分泌。能夠使靶核酸序列通過所述孔的其他優選的酶包括聚合酶和解螺旋酶。所述核酸操作酶可以來源於這些類型的酶中的任一種。所述聚合酶優選為酶分類(EC)組2. 7. 7. 6、
2.7. 7. 7,2. 7. 7. 19,2. 7. 7. 48和2. 7. 7. 49的任一組的成員。所述聚合酶優選地是依賴DNA 的DNA聚合酶、依賴RNA的DNA聚合酶、依賴DNA的RNA聚合酶或依賴RNA的RNA聚合酶。 所述解螺旋酶優選地是酶分類(EC)組3. 6. 1.-和2. 7. 7.-的任一組的成員。所述解螺旋酶優選地是依賴ATP的DNA解螺旋酶(EC組3. 6. 1. 8)、依賴ATP的RNA解螺旋酶(EC組
3.6. 1. 8)或不依賴ATP的RNA解螺旋酶。可將所述核酸操作酶用顯示標記物(revealing label)標記。所述顯示標記物可以是使所述酶可被檢測的任何合適的標記物。合適的標記物包括但不限於螢光分子;放射性同位素例如125i、35s、14c ;酶;抗體;抗原;多核苷酸;以及配體例如生物素。所述核酸操作酶可分離自產生酶的生物體例如大腸桿菌、嗜熱棲熱菌或噬菌體, 或者可通過合成或通過重組方式製備。例如,所述核酸操作酶可通過體外翻譯和轉錄進行合成。可對所述核酸操作酶的胺基酸序列進行修飾,以包括非天然胺基酸或者以增加所述蛋白的穩定性。如果所述核酸操作酶通過合成方式產生,那麼這類胺基酸可以在產生過程中引入。所述核酸操作酶還可以在合成或重組產生後進行改變。所述核酸操作酶還可以使用D-胺基酸產生。例如,所述核酸操作酶可包含L-胺基酸和D-胺基酸的混合物。這類蛋白或肽的生產是本領域中常規的。所述核酸操作酶還可含有其他非特異性化學修飾,只要這些修飾不影響其操作核酸或結合於孔的能力。許多非特異性側鏈修飾是本領域中已知的,並且可對所述孔的側鏈進行這些修飾。例如,這類修飾包括對胺基酸的還原性烷基化(按照如下方式進行首先與醛反應,然後以妝8隊進行還原)、以甲基乙醯亞胺(methylacetimidate)進行脒基化 (amidination)或者以乙酸酐進行醯化。所述核酸操作酶可以使用本領域中已知的標準方法產生。編碼核酸操作酶的多核苷酸序列可以使用本領域中的標準方法分離和複製。這類序列在下文有更詳細的敘述。編碼核酸操作酶的多核苷酸序列可以使用本領域中的標準技術在細菌宿主細胞中表達。所述核酸操作酶可以通過在細胞中以重組表達載體原位表達所述多肽而產生。所述表達載體任選地攜帶誘導型啟動子以控制所述多肽的表達。多核苷酸序列可使用本領域中的標準方法分離和複製。可從產生酶的生物例如大腸桿菌、嗜熱棲熱菌或噬菌體提取染色體DNA。編碼所述酶的基因可以使用涉及特定引物的PCR來擴增。然後,可以將所擴增的序列納入至可複製的重組載體例如克隆載體中。所述載體可以用於在相容宿主細胞中複製所述多核苷酸。因此,可以通過如下方式製備編碼所述酶的多核苷酸序列將編碼所述酶的多核苷酸引入可複製載體中,將所述載體引入相容的宿主細胞中,並在引起所述載體複製的條件下培養所述宿主細胞。所述載體可以從所述宿主細胞回收。用於克隆多核苷酸的合適宿主細胞是本領域中已知的,並且將在下文中更詳細地敘述。可以將所述多核苷酸克隆至合適的表達載體中。在表達載體中,編碼構建體的多核苷酸序列一般有效連接於能夠使所述宿主細胞表達所述編碼序列的控制序列。這類表達載體可用於表達構建體。術語「有效連接」指一種並置關係,其中所描述的組件處於能使它們以預期的方式發揮功能的關係中。「有效連接」於編碼序列的控制序列以這樣的方式連接,即在與所述控制序列相適應的條件下可實現所述編碼序列的表達。可以將多拷貝的相同或不同的多核苷酸引入至所述載體中。然後,可以將所述表達載體引入至合適的宿主細胞中。因此,可以通過如下方式產生構建體將編碼構建體的多核苷酸序列插入表達載體中,將所述載體引入相容的細菌宿主細胞中,並在引起所述多核苷酸序列進行表達的條件下培養所述宿主細胞。重組表達的構建體可以自組裝為所述宿主細胞膜中的孔。或者,可以將以該方式產生的重組構建體從所述宿主細胞分離並插入至另一膜中。當產生包含本發明構建體與至少一種不同亞基的寡聚體孔時,可以將所述構建體與不同亞基分別在不同宿主細胞中表達(如上所述),從所述宿主細胞中取出並在另外的膜例如兔細胞膜中裝配為孔。所述載體可以是例如具有複製起點的質粒、病毒或噬菌體載體,其任選地具有用於表達所述多核苷酸序列的啟動子,還任選地具有所述啟動子的調控子。所述載體可以包含一種或多種篩選標記基因,例如氨苄青黴素抗性基因。可以選擇啟動子和其他表達調節信號,以使其與這樣的宿主細胞相容,即所述表達載體是為所述宿主細胞設計的。一般使用T7、trc、lac、ara或λ ^啟動子。所述宿主細胞一般以高水平表達所述構建體。選擇用編碼構建體的多核苷酸序列轉化的宿主細胞以與用於轉化所述細胞的表達載體相容。所述宿主細胞一般是細菌並優選是大腸桿菌。具有XDE3溶素原的任何細胞,例如C41(DE3)、 BL21 (DE3)、JM109(DE3)、B834(DE3)、TUNER、0rigami 和 Origami B 均可以表達包含 T7 啟動子的載體。核酸操作酶可通過如下方式大規模產生從產生孔的生物體或者在如下文所述的重組表達後通過任一種蛋白質液相色譜系統進行純化。一般的蛋白質液相色譜系統包括 FPLC、AKTA 系統、Bio-Cad 系統、Bio-fcid BioLogic 系統和 Gilson HPLC 系統。核苷酸和孔之間的相互作用所述靶序列通過所述跨膜孔,使得所述靶序列中的一部分核苷酸一次一個地(即依次地)與所述孔中至少一個能夠區分不同核苷酸的位點相互作用。所述靶序列的序列可以通過以下方式確定,即鑑定所述靶序列中至少80%,至少85%,至少90%,至少95%,至少98%或至少99%的核苷酸。優選地,所述靶序列中的所有核苷酸均與至少一個位點相互作用並被鑑定。 可以使所述靶序列在所述膜的任一側與所述孔接觸。可以將所述靶序列弓I入至在所述膜的任一側上的所述孔。如果如上文所討論的使用核酸操作酶,那麼所述靶序列通常與所述膜存在所述酶的一側接觸。這使得所述酶可在進行所述方法的過程中操作所述核酸。當所述靶核酸序列經所述孔的桶或通道穿過所述膜時,其一部分核苷酸會與所述孔中至少一個能夠區分不同核苷酸的位點相互作用。如下文更詳細討論的,一部分核苷酸優選與兩個或多個能夠區分不同核苷酸的不同位點相互作用。所述核苷酸一次一個地依次與一個或多個能夠區分不同核苷酸的位點相互作用。 這意味著,在任一時刻,一個能夠區分不同核苷酸的位點僅與所述靶序列中的一個核苷酸相互作用。如果所述孔包含兩個或多個能夠區分不同核苷酸的不同位點,那麼在任一時刻, 所述不同位點中的每一個位點都將與所述靶序列中的不同核苷酸相互作用。例如,如果所述孔包含兩個能夠區分不同核苷酸的不同位點,那麼在任一時刻,所述不同位點將與所述靶序列中的兩個不同核苷酸相互作用。所述靶序列一次一個核苷酸地通過所述孔,並且每個核苷酸依次被鑑定。因此,在一個時間點,所述能夠區分不同核苷酸的不同位點中的每一個位點都會與所述靶序列中的不同核苷酸相互作用。在下一時間點,再使所述靶序列的一個核苷酸通過所述孔,所述能夠區分不同核苷酸的不同位點中的每一個位點會與同其在前一時間點相互作用的核苷酸相鄰的核苷酸相互作用。如果所述孔中有兩個或多個不同位點,那麼在所述靶序列通過所述孔時其中選定的核苷酸將會依次與每個不同位點相互作用。在每次相互作用過程中測量通過所述孔的電流,這使得可以確定與所述一個或多個位點相互作用的核苷酸的類型。以連續的方式鑑定所述靶序列中的一部分核苷酸使得可以確定所述靶序列的序列。所述核苷酸可以以任何方式並在任何位點與所述孔相互作用。所述核苷酸優選與所述孔中一個或多個能夠區分不同核苷酸的位點可逆地結合。所述核苷酸最優選在經所述孔穿過所述膜時與所述孔中一個或多個位點可逆地結合。所述核苷酸可以經由銜接體或者與銜接體一起可逆地結合於一個或者多個所述位點,所述銜接體有利於所述孔和核苷酸之間的相互作用。然而,所述孔優選不包含有利於所述孔和核苷酸之間相互作用的分子銜接體。在核苷酸和所述能夠區分不同核苷酸的位點之間相互作用的過程中,所述核苷酸以對該核苷酸特異的方式影響流過所述孔的電流。例如,某一核苷酸將降低流經所述孔的電流至某一程度。換言之,流過所述孔的電流對於某一核苷酸和能夠區分不同核苷酸的位點之間的相互作用而言是獨特的。因此,當不同核苷酸以連續的方式移動通過所述孔並與所述孔相互作用時,流經所述孔的電流隨每次相互作用改變。如果兩個或多個能夠區分不同核苷酸的不同位點存在於所述孔中,那麼在任何時候通過所述孔的總電流將受到每個位點和位於每個位點的核苷酸之間的相互作用的影響。 存在多個能夠區分不同核苷酸的位點會增加觀測到的電流水平的數目,並因此可提供更多的序列信息。例如,具有單個位點的孔可以對四種不同核苷酸(為了描述之目,稱為A、B、C 和D)產生四個電流水平。與之不同,具有兩個位點的孔可以產生十六個水平當A在位點 1且A、B、C或D在位點2時的四個電流水平;當B在位點1且A、B、C或D在位點2時的四個電流水平;當C在位點1且A、B、C或D在位點2時的四個電流水平;以及當D在位點1且A、B、C或D在位點2時的四個電流水平。選擇的核苷酸在能夠區分不同核苷酸的位點的停留時間將通過所述靶序列通過所述孔的方式確定。例如,如果使用核酸操作酶,那麼選擇的核苷酸在能夠區分不同核苷酸的位點的停留時間將由所述酶將所述靶序列推過或拉過所述孔的速率確定。可以進行對照實驗來確定具體核酸序列對流經所述孔的電流的效應。然後,可以將對測試樣品進行本發明的方法得到的結果與從這類對照實驗得到的結果進行比較,以鑑定所述靶序列。一個或多個能夠區分不同核苷酸的位點如果所述孔中的位點能夠區分至少2種例如3種或4種不同核苷酸,那麼其能夠區分不同核苷酸。所述核苷酸可以是上文討論的核苷酸的任一種。所述孔中的每個位點優選能夠區分4種不同核苷酸。每個位點最優選能夠區分DNA或RNA的4種核苷酸。具體而言,每個位點優選能夠區分獨立包含以下核鹼基的4種不同核苷酸(a)腺嘌呤、(b)鳥嘌呤、(c)胸腺嘧啶或尿嘧啶和(d)胞嘧啶。每個位點更優選能夠區分獨立包含以下核鹼基的 5種不同核苷酸(a)腺嘌呤、(b)鳥嘌呤、(c)胸腺嘧啶或尿嘧啶、(d)胞嘧啶和(e)5-甲基胞嘧啶。由於位點可與核苷酸相互作用(優選可逆結合於核苷酸)並且所述核苷酸可以該核苷酸特異的方式影響流經所述孔的電流,因此該位點通常能夠區分不同核苷酸。位點與選擇的核苷酸相互作用的方式將取決於多個因素,包括所述位點的大小、所述位點的構象、 所述位點的電荷、所述位點形成氫鍵的能力以及所述位點形成其他分子間相互作用例如偶極子相互作用的能力。位點可以帶淨電荷。所述淨電荷可以為負,但一般為正。位點可以不帶淨電荷。如上文討論的,位點區分不同核苷酸的能力可以通過改變所述位點的大小、所述位點的構象和/或所述位點的電荷而改變。每個位點均優選存在於所述孔的桶或通道中。這使得位點和核苷酸之間的相互作用可影響流過所述孔的電流。跨膜蛋白孔中一個或多個能夠區分不同核苷酸的位點在下文中更詳細討論。所述孔包含至少1個例如2、3或4個能夠區分不同核苷酸的位點。所述孔優選包含2個或多個例如2、3或4或更多個能夠區分不同核苷酸的不同位點。因此,所述靶序列中的一部分核苷酸優選一次一個地與所述孔中兩個或多個能夠區分不同核苷酸的不同位點相互作用。所述孔最優選包含兩個能夠區分不同核苷酸的不同位點。因此,所述靶序列中的一部分核苷酸最優選與所述孔中兩個能夠區分不同核苷酸的不同位點相互作用。所述靶序列中的每個核苷酸優選一次一個地與每個位點特定位點相互作用。如果位點彼此分開的距離足以使選擇的核苷酸與每個位點的相互作用可如本文所述區分開,那麼所述位點是不同的。不同位點一般彼此分開至少10、至少20、至少30、至少40或至少50埃。不同位點優選彼此分開約20至約30埃。優選地,所述兩個或多個不同位點各自以不同方式區分不同核苷酸。這使得有可能區分所選擇的核苷酸何時與所述兩個或多個位點的每一個位點相互作用。所述兩個或多個位點的差異在於,它們可以任何方式區分不同核苷酸的方式。一些位點可基於與每個所述核苷酸不同的空間相互作用來區分不同核苷酸。這類相互作用一般依賴於所述位點的大小和/或構象。其他具有淨電荷的位點可基於與每個所述核苷酸不同的離子相互作用來區
19分不同核苷酸。一般而言,所述兩個或多個位點中的每個位點的差異在於,其與所述不同核苷酸的相互作用影響流過所述孔的電流的方式。優選地,選擇的核苷酸與所述兩個或多個不同位點中的每一個位點的相互作用可導致不同電流流過所述孔。例如,含腺嘌呤的核苷酸與所述兩個或多個不同位點中的每一個位點的相互作用可導致不同電流流過所述孔。更優選地,不同核苷酸與所述兩個或多個不同位點中的每個位點的相互作用可導致差異電流流過所述孔,並且所述差異電流的平均值之間的間隔在所述兩個或多個不同位點中的每個位點之間不同。這顯示於圖4中。在所述孔中存在兩個或多個能夠以不同方式區分不同核苷酸的不同位點可提供兩項優點。第一,它使得可對所述靶序列中的核苷酸數目進行計數。如果已知所述兩個或多個位點之間的距離以及所述靶序列通過所述孔的速率,那麼有可能在選擇的核苷酸從一個位點移動至另一個位點時對通過所述孔的核苷酸數目進行計數。這特別有助於確定所述靶序列中具體核苷酸的連續片段的長度。使用僅具有單個能夠區分不同核苷酸的位點的孔, 當5個相同核苷酸各自依次與所述位點相互作用時,所述5個核苷酸的連續片段將不產生任何電流水平的變化。將需要基於所述靶序列通過所述孔的速率來試圖預測多少個核苷酸與所述位點相互作用。然而,如果所述孔具有兩個能夠區分不同核苷酸的位點,那麼當所述連續片段中的5個相同核苷酸各自依次與所述第一位點相互作用時,下遊核苷酸依次與所述第二位點相互作用將改變流經所述孔的電流水平。這使得可以對依次與所述第一位點相互作用的相同核苷酸的數目進行計數。第二且更重要地,所述孔中存在兩個或多個能夠區分不同核苷酸的不同位點使得所述靶核酸的序列可被更有效地確定。具有兩個可以以不同方式區分不同核苷酸的不同位點可確保,當對所述靶序列測序時,每個核苷酸不是只被觀測一次,而是實際上被測試兩次。這可更加確定所述靶序列中的每個位置均被觀測到,並且兩個核苷酸在每個位置合計訪問的質量分值高於單次觀測可能得到的質量分值。換句話說,本發明的優選方法的關鍵優點是,它使得靶序列的每個核苷酸位置可被有效測試兩次,而不必重複所述方法。這因此確保了產生的序列的質量非常高,並且減少了錯誤鑑定核苷酸訪問或者完全遺漏核苷酸的可能。所述一個或多個位點的修飾所述方法優選包括使用已被修飾以改變至少一個位點例如2個或3個位點的能力的孔來區分不同核苷酸。所述孔可以被修飾以引入一個或多個例如2個能夠區分不同核苷酸的不同位點。這可增加所述孔中能夠區分不同核苷酸的不同位點的數目。所述孔可以被修飾以消除一個或多個例如2個能夠區分不同核苷酸的不同位點。這可減少所述孔中能夠區分不同核苷酸的不同位點的數目。然而,必須保留所述孔可用的至少一個例如2個或3 個能夠區分不同核苷酸的位點。所述孔可以被修飾以增強或降低一個或多個不同位點區分不同核苷酸的能力。例如,一個位點區分不同核苷酸的能力可以被增強,而另一個不同位點區分不同核苷酸的能力可以被降低。這使得所述孔可被「微調」,用於對特異性靶核酸序列測序。所述孔可以以任何方式被修飾,以改變至少一個位點區分不同核苷酸的能力。可以進行一個或多個例如2、3、4或5個或者更多個修飾。所述一個或多個修飾優選會改變當選擇的核苷酸與所述至少一個位點相互作用時流過所述孔的電流。所述一個或多個修飾可改變所述至少一個位點的大小和/或構象,從而改變它與不同核苷酸的空間相互作用。所述一個或多個修飾可以改變所述至少一個位點的淨電荷。 從而改變它與不同核苷酸的離子相互作用。所述至少一個位點的淨電荷可以通過以下方式改變(1)引入正電荷或負電荷,⑵除去正電荷或負電荷而不是替換它,⑶以正電荷代替中性電荷或負電荷以及/或者以負電荷代替中性電荷或正電荷。所述一個或多個修飾不能以這樣的方式改變所述淨電荷,即這種改變會干擾所述靶序列通過所述孔的移位。例如,將太多正電荷引入所述孔的桶或通道可能會降低流過所述孔的電流,從而妨礙對不同核苷酸的區分。或者,將太多負電荷引入所述孔的桶或通道可能會阻止所述靶序列進入所述孑L本發明人還出乎意料地發現,如果孔包含兩個或多個能夠區分不同核苷酸的不同位點,那麼修飾一個不同位點可改變另一個或其他不同位點區分不同核苷酸的能力。因此, 在一個優選的實施方案中,所述孔在所述兩個或多個不同位點之一處被修飾,並且這會改變所述其他兩個或多個不同位點中的至少一個區分不同核苷酸的能力。在另一個優選實施方案中,所述孔在所述兩個或多個不同位點之一處被修飾,並且這會改變所有所述其他不同位點區分不同核苷酸的能力。在另一個優選實施方案中,所述孔在所述兩個或多個不同位點之一處被修飾,並且這會改變所有所述不同位點區分不同核苷酸的能力。上文描述的任何修飾均可以使用。最優選地,所述孔在所述兩個或多個不同位點之一處被修飾,以增加當選擇的核苷酸與所述兩個或多個不同位點的每一個相互作用時通過所述孔的電流之間的差異。必須平衡在所述兩個或多個不同位點的每一個處進行修飾的效應。例如,改變一個位點的淨電荷可以降低當所述位點與核苷酸相互作用時流過所述孔的電流,從而使得更不容易在所述另一個或其他更遠端位點處區分不同核苷酸。或者,修飾一個位點以增加流經所述孔的電流可以提高在所述另一個或其他更遠端位點對不同核苷酸的區分。這一點將在下文參考跨膜蛋白孔進行更詳細的討論。?L所述方法包括使所述靶序列通過跨膜孔。跨膜孔是這樣的孔,即該孔使得由施加電勢驅動的離子可從膜的一側流到所述膜的另一側。所述孔使得核酸例如DNA或RNA可通過所述孔。所述孔優選是跨膜蛋白孔。跨膜蛋白孔是這樣的多肽或多肽集合,即該多肽或多肽集合使得由施加電勢驅動的離子可從膜的一側流到所述膜的另一側。所述孔可以是分離的、基本上分離的、純化的或基本上純化的。如果孔完全不含任何其他組分如脂質或其他孔,則該孔是分離的或純化的。如果孔與不幹擾其預期用途的載體或稀釋劑混合,則所述孔是基本分離的。例如,如果孔以包含小於10%、小於5%、小於 2%或小於的其他組分(如脂質或其他孔)的形式存在,則所述孔是基本分離或基本純化的。所述孔一般存在於脂質雙層中。所述孔可以是單體或寡聚體。所述孔優選由幾個重複亞基例如6、7或8個亞基構成。所述孔更優選為七聚體孔。所述孔通常包含離子可從中流過的桶或通道。所述孔的亞基通常環繞一個中心軸,並為跨膜β桶或通道或者跨膜α-螺旋束或通道提供鏈。
所述孔包含至少一個能夠區分不同核苷酸的位點。所述位點優選在所述孔的桶或通道中。每個位點一般包含數個例如10、20或30個有利於與核苷酸相互作用的胺基酸。如果所述孔是寡聚體,那麼每個單體可以對每個位點貢獻一個或多個例如2、3或4個胺基酸。 這些胺基酸優選位於所述桶或通道的收縮區附近。每個位點一般包含一個或多個帶正電的胺基酸例如精氨酸、賴氨酸或組氨酸。這些胺基酸一般有利於所述位點和所述核苷酸之間的相互作用。根據本發明使用的孔可以是桶孔、α-螺旋束孔或固態(solid state) 孔。桶孔包含由鏈構成的桶或通道。合適的桶孔包括但不限於毒素例如 α-溶血素、炭疽毒素和殺白細胞素,細菌的外膜蛋白/孔蛋白(porin)例如恥垢分枝桿菌 (Mycobacterium smegmatis)孔蛋白 A(MspA)、外膜孔蛋白 F(OmpF)、外膜孔蛋白 G(OmpG)、 外膜磷酸酯酶A和奈瑟球菌屬(Neisseria)自轉運脂蛋白(NalP)。α-螺旋束孔包含由 α-螺旋構成的桶或通道。合適的α-螺旋束孔包括但不限於內膜蛋白和α外膜蛋白例如 Wza0所述孔可以是固態孔。合適的固態孔包括但不限於氮化矽孔、二氧化矽孔和石墨烯孔。其他合適的固態孔和生產所述固態孔的方法記載於美國專利No. 6,464,842、WO 03/003446、WO 2005/061373、美國專利 No. 7,258,838、美國專利 No. 7,466,069、美國專利 No. 7,468,271 和美國專利 No. 7,253,434。所述孔優選來源於α -溶血素(α -HL)。野生型α -HL孔由7個相同的單體或亞基構成(即,其是七聚體)。α-溶血素的一個野生型單體或亞基的序列示於SEQ ID NO 2。所述孔優選包含七個包含SEQ ID NO :2中所示的序列或其變體的亞基。所述孔可以是包含七個SEQ ID NO :2或其變體的相同亞基的同七聚體。或者,所述孔可以是包含兩種或多種例如2、3、4、5、6或7種不同亞基的雜七聚體。所述雜七聚體中的每個亞基都可以包含 SEQ ID NO 2或其變體。SEQ ID NO :2 的胺基酸 1、7-21、31-34、45-51、63-66、72、92_97、104-111、124-136、 149-153、160-164、173-206、210-213、217、218、223-228、236-242、262-265、272-274、 287-290和294構成環區。SEQ ID NO 2的殘基111、113和147形成α -HL的桶或通道的收縮區的一部分。SEQ ID NO 2的變體是具有從SEQ ID NO :2變化而來但保留有其孔形成能力的胺基酸序列的亞基。變體形成孔的能力可使用本領域中已知的任何方法進行測定。例如,可將所述變體與其他合適的亞基一塊插入膜中,並且可以確定它寡聚體化以形成孔的能力。 本領域中已知將亞基插入膜例如脂雙層的方法。例如,變體可以以純化形式懸浮於包含脂雙層的溶液中,使得它分散於所述脂雙層中,並且通過結合於所述脂質雙層並裝配為功能狀態而插入。或者,可以使用 Μ. A. Holden, H. Bayley. J. Am. Chem. Soc. 2005,127,6502-6503 和國際申請PCT/GB2006/001057(
發明者A·J·郝倫, D·斯託達特, G·瑪格裡亞, J·H·P·貝利 申請人:Isis創新有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀