突變胞溶素孔的製作方法
2023-05-28 08:44:56 5
突變胞溶素孔的製作方法
【專利摘要】本發明涉及胞溶素的突變體形式。本發明還涉及使用胞溶素來表徵分析物。
【專利說明】突變胞溶素孔
【技術領域】
[0001] 本發明涉及的胞溶素(Iysenin)的突變體形式。本發明還涉及使用胞溶素的突變 體形式進行的分析物表徵。
【背景技術】
[0002] 納米孔感測是一種依靠對分析物分子和受體之間的單個結合或相互作用事件的 觀察進行檢測的方法。納米孔傳感器可以通過在絕緣膜中放置納米尺寸的單個孔並在分析 物分子存在下測量在電壓驅動下穿過孔進行離子傳輸而建立。分析物的相似性(identity) 是通過其獨特的電流信號而揭示,特別是電流模塊(current block)的持續時間和程度以 及電流水平的變化。
[0003] 目前需要能在廣泛範圍內應用的快速且廉價的核酸(例如DNA或RNA)測序技術。 現有的技術緩慢且昂貴,主要是因為它們依賴於擴增技術來生產大體積核酸並需要大量專 門的螢光化學物質進行信號檢測。納米孔感測具有能夠通過減少所需的核苷酸和試劑的量 來提供快速且廉價的核酸測序的潛力。
[0004] 使用納米孔感測測序核酸的兩個主要要素為(1)控制核酸穿過孔的運動和(2)隨 著核酸聚合物運動穿過所述孔識別核苷酸。在過去,為了實現對核苷酸的識別,使核酸穿過 溶血素的突變體。這提供的電流信號經證明具有序列依賴性。其還證明了,當使用溶血素 孔時,需要大量的核苷酸以使觀察到的電流增加,這使得對所觀察的電流與多核苷酸之間 的直接相關性受到質疑。
[0005] 雖然用於核苷酸識別的電流範圍已通過溶血素孔的突變得到改進,但是如果核苷 酸之間的電流差異能夠被進一步改善的話,測序系統將具有更高的性能。此外,已觀察到, 當核酸移動穿過孔時,一些電流狀態顯示較高的差異。還表明,一些溶血素孔突變體比其他 溶血素孔突變體具有更高的差異。雖然這些狀態的差異可能包含序列的特異性信息,但是 希望的是能產生具有較低差異的孔以簡化系統。還希望減少使觀察到的電流增加的核苷酸 的數量。
[0006] 胞溶素(也被稱為efLl)是一種來自蚯蚓赤子愛勝蚓(Eisenia fetida)的體腔 液的經純化的孔形成毒素(pore-forming toxin)。其特異性結合到鞘磷脂,從而抑制胞溶 素誘導的溶血作用(Yamaji等人,J. Biol. Chem. 1998 ;273 (9) :5300-6)。胞溶素的晶體結構 在 De Colbis 等人,Structure, 2012 ;20:1498 - 1507 中有公開。
【發明內容】
[0007] 出人意料地,本發明人識別出了胞溶素單體內的一個區域,該區域可被修飾為用 以改變該單體和多核苷酸之間的相互作用。該區域對應於SEQ IDN0:2的約44位點到約 126位點。本發明涉及這樣的突變體單體:在其中對所述識別出的區域進行一個或多個修 飾以改善所述突變體單體與多核苷酸相互作用的能力。出人意料地,本發明人還證實了,含 有該新的突變體單體的孔具有增強的與多核苷酸相互作用的能力,並因此顯示出提高的用 以評估多核苷酸特徵如序列特徵的性能。出人意料地,所述突變體孔顯示出提高的核苷酸 識別能力。特別是,出人意料地,所述突變體孔顯示出增加的電流範圍,這使得更容易區分 不同核苷酸,並且顯示出減少的狀態變化,這提高了信噪比。此外,減少了在多核苷酸移動 穿過孔時使電流增加的核苷酸的數目。這使得更容易確定多核苷酸移動穿過所述孔時所觀 察到的電流與所述多核苷酸之間的直接關係。
[0008] 因此,本發明提供了一種包含SEQ ID NO:2中所示序列的變體的突變體胞溶素單 體,其中所述單體能夠形成孔並且其中所述變體在SEQ ID NO: 2的約44位點到約126位點 的區域內包含一個或多個修飾,所述修飾能改變所述單體與多核苷酸相互作用的能力。
[0009] 本發明還提供:
[0010] -一種構造,包含兩個或多個共價連接的源自胞溶素的單體,其中所述單體中的至 少一個為本發明的突變體胞溶素單體;
[0011] - 一種多核苷酸,其編碼本發明的突變體胞溶素單體或本發明的基因融合的構造 (genetically fused construct);
[0012] -一個源自胞溶素的同源寡聚孔,包含足夠數目的本發明的突變體胞溶素單體;
[0013] -一個源自胞溶素的異源寡聚孔,包含至少一個本發明的突變體胞溶素單體;
[0014] - 一種孔,包含至少一個本發明的構造;
[0015] - 一種表徵目標分析物的方法,包括:(a)使目標多核苷酸與本發明的孔接觸,使 得目標多核苷酸移動穿過所述孔;和(b)在分析物相對於所述孔移動時獲取一個或多個 測量值,其中所述測量值表示所述目標分析物的一個或多個特徵並由此表徵所述目標分析 物;
[0016] --種形成表徵目標多核苷酸用傳感器的方法,包括在本發明的孔和多核苷酸結 合蛋白之間形成複合體,並由此形成用於表徵目標多核苷酸的傳感器;
[0017] --種用於表徵目標多核苷酸的傳感器,包括在本發明的孔和多核苷酸結合蛋白 之間的複合體;
[0018] -本發明的孔在表徵目標分析物中的應用;
[0019] -用於表徵目標多核苷酸的試劑盒,包括(a)本發明的孔和(b)多核苷酸結合蛋 白;
[0020] --種用於表徵樣本中目標多核苷酸的設備,包括(a)多個本發明的孔和(b)多個 多核苷酸結合蛋白;
[0021] -一種提高含SEQ ID N0:2中所示序列的胞溶素單體用於表徵多核苷酸的能力的 方法,包括在SEQ ID NO: 2的約44位點到約126位點的區域內進行一個或多個修飾,所述修 飾會改變所述單體與多核苷酸相互作用的能力並且不影響所述單體用於形成孔的能力;
[0022] --種製備本發明的構造的方法,包括將至少一個本發明的突變體胞溶素單體共 價連接到一個或多個源自胞溶素的單體;和
[0023] --種形成本發明孔的方法,包括使至少一個本發明突變體單體或至少一個本發 明構造與足夠數目的本發明單體、本發明構造或源自胞溶素的單體進行寡聚用以形成孔。
【專利附圖】
【附圖說明】
[0024] 圖1顯示了使用解旋酶(標記為A)控制DNA移動穿過胞溶素納米孔(標記為B) 的示例圖。1)將單鏈DNA底物與含有膽固醇標籤(標記為D)的退火引物添加到雙分子層 (標記為C)的順側(標記為X)。所述膽固醇標籤結合到所述雙分子層,使所述底物富集在 所述雙分子層表面處。2)被加成到順側隔室(compartment)的解旋酶結合到所述DNA。在 二價金屬離子和NTP底物的存在下,所述解旋酶沿著所述DNA運動(灰色箭頭)。3)在施加 的電壓下,納米孔通過DNA上的前導區部分捕獲所述DNA底物。在施加的電勢的力的作用 下,所述DNA被牽拉穿過所述孔直到結合在所述DNA上的解旋酶與所述孔的頂部接觸,防止 進一步的不受控的DNA移位。在該過程中,雙鏈DNA部分(例如引物)被去除。所述解旋酶 沿著所述DNA以3'到5'的方向運動並逆著所施加的電場將螺旋狀(threaded)DNA(DNA的 運動方向用黑色箭頭示出)牽拉出所述孔。4)所述解旋酶將所述DNA牽拉出所述納米孔, 從而將所述DNA供回到所述順式隔室。穿過所述納米孔的DNA的最後部分為所述5' -前 導區。5)當所述解旋酶將所述DNA移出所述納米孔後,所述解旋酶被釋放回所述順側隔室 中。替代地,如果所述DNA 3'端被捕獲,則所述DNA將在3' -5'解旋酶的控制下從順側移 動穿過所述孔到達反側(標記為Y),從而最終在雙分子層的反側上離開。
[0025] 圖2顯示了實施例1,2, 3, 4, 5和6中所使用的DNA底物設計。所述DNA底物由 PhiX(SEQ ID NO: 13,標記為A)中單鏈DNA的一 400鹼基部分與一 50T 5'-前導區(由鏈 A虛線區域表示)組成。在50T前導區後退火到該鏈的是含有3'膽固醇標籤(標記為C) 的引物(標記為B),以使使DNA富集在所述雙分子層的表面上並由此提高捕獲效率。
[0026] 圖3顯示了插入到DPhPC雙分子層中的野生型胞溶素孔的電流軌跡(對於A和B, y軸=電流(pA),x軸=時間(min))。A)顯示了在不存在DNA和解旋酶的情況下在+120mV 下觀察到約+280pA的穩定開孔(open-pore)電流(625mM KCl, IOOmM Hepes (4-輕乙基哌 嗪乙磺酸),pH 8.0, 75mM亞鐵氰化鉀(II),25mM鐵氰化鉀(III) ,IOmM MgCl2,野生型胞溶 素 (SEQ ID勵:2))。抝顯示了在添加 DNA、解旋酶和ATP的情況下(0. 3nM 400mer DNA(SEQ IDN0:13和14),Hel308Mbu,(100nM,SEQIDN0:15),lmMATP),沒有明顯的DNA捕獲,並且 沒有解旋酶控制的DNA移動穿過所述納米孔。
[0027] 圖4顯示了 Hel308Mbu(SEQ ID N0:15)能夠以受控的方式移動DNA穿過胞溶素納 米孔(胞溶素-E84D/E85K,具有突變E84D/E85K的SEQ ID NO: 2),從而隨著所述DNA移動 穿過所述納米孔電流產生逐步的變化。A)顯示了 DNA捕獲和Hel308Mbu控制的400merDNA 運動的示例性電流軌跡(y軸=電流(pA), X軸=時間(min)),從?400pA的開孔水平觀察 到較低的在?200pA下的電流模塊(180mV,625mM KCl,100mM H印es pH 8.0,75mM亞鐵氰化 鉀(II),25mM鐵氰化鉀,0·3nM 400merDNA(SEQIDN0:13和14),100nMHel308Mbu(SEQID N0:15), ImM ATP, IOmM MgCl2,胞溶素-E84D/E85K (具有突變 E84D/E85K 的 SEQ ID N0:2))。 圖中星號表示解旋酶控制的DNA移動。在施加的電勢下,結合有解旋酶的DNA被胞溶素納 米孔捕獲。這得到從開孔水平(?400pA)到DNA水平(?220pA)的電流模塊。B)顯示 了上圖軌跡中所述解旋酶控制的DNA移動的放大圖(y軸=電流(pA), X軸=時間(min))。 所述DNA水平顯示出隨著所述酶移動DNA穿過所述孔電流是逐步變化的。
[0028] 圖5顯示了 Hel308Mbu(SEQ ID N0:15)能以受控方式移動DNA穿過胞溶素納米 孔(胞溶素-E92N/E94N/E97N/D121N/D126N,具有突變 E92N/E94N/E97N/D121N/D126N 的 SEQ ID N0:2),從而在隨著DNA移動穿過所述納米孔電流產生逐步變化。A)顯示了典型 的Hel308Mbu控制400mer DNA移動的示例電流軌跡(y軸=電流(pA),x軸=時間(min)) (120mV,625mM KCl,100mM H印es pH 8.0,75mM 亞鐵氰化鉀(II),25mM 鐵氰化鉀,0·3ηΜ 400merDNA(SEQIDN0:13和14),100nMHel308Mbu(SEQIDN0:15),lmMATP,10mMMgCl 2, 胞溶素-E92N/E94N/E97N/D121N/D126N(具有突變E92N/E94N/E97N/D121N/D126N的SEQID NO: 2))。在施加的電勢下,DNA被胞溶素納米孔捕獲。該胞溶素突變體顯示出高水平的DNA 捕獲vs. WT胞溶素。在所述孔中被捕獲的DNA產生從開孔水平(?280pA)到DNA水平(? IlOpA)的電流模塊。結合有解旋酶的DNA在所述酶移動DNA穿過所述孔時顯示出逐步變化 的電流。將解旋酶控制的DNA移動由星號標出。B)為上圖軌跡中典型的解旋酶控制的DNA 移動中的一個的放大圖(y軸=電流(pA), X軸=時間(min))。所述DNA水平顯示出隨著所 述酶移動DNA穿過所述孔電流是逐步變化的。
[0029] 圖6顯示了 Hel308Mbu(SEQ ID NO: 15)能以受控方式移動DNA穿過胞溶素納米孔 (胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A,具有突變 E84Q/E85K/E92Q/E97S/D126G/ E167A的SEQ ID NO: 2),從而在隨著DNA移動穿過所述納米孔電流產生逐步變化。A)顯示 了典型的He 1308Mbu控制的DNA移動的示例電流軌跡(y軸=電流(pA),X軸=時間(min)) (180mV, 625mM KCl, IOOmM H印es pH 8. 0, 75mM 亞鐵氰化鉀(II),25mM 鐵氰化鉀,0· 6nM 400merDNA(SEQIDN0:13和14),100nMHel308Mbu(SEQIDN0:15),lmMATP,10mMMgCl 2, 胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A (具有突變 E84Q/E85K/E92Q/E97S/D126G/ E167A的SEQ ID N0:2))。在施加的電勢下,DNA被胞溶素納米孔捕獲。該胞溶素突變體顯示 出高水平的DNA捕獲vs. WT胞溶素。在所述孔中被捕獲的DNA產生從開孔水平(?390pA) 到DNA水平(?200pA)的電流模塊。結合有解旋酶的DNA顯示出隨著所述酶移動DNA穿 過所述孔電流是逐步變化的。將解旋酶控制的DNA移動由星號標出。B)為上圖軌跡中典型 的解旋酶控制DNA移動中的一個的放大圖(y軸=電流(pA), X軸=時間(min))。所述DNA 水平顯示出隨著所述酶移動DNA穿過所述孔電流是逐步變化的。
[0030] 圖7顯示出Hel308Mbu(SEQ ID N0:15)能以受控方式移動DNA穿過胞溶素納米 孔(胞溶素-E76S/E84Q/E85K/E92Q/E97S/D126G/E167A,具有突變 E76S/E84Q/E85K/E92Q/ E97S/D126G/E167A的SEQIDN0:2),從而在隨著DNA移動穿過所述納米孔電流產生逐步 變化。A)顯示了典型的Hel308 Mbu控制的DNA移動的示例電流軌跡(y軸=電流(pA),x 軸=時間(s))(+180mV,625mM KCl,100mM H印es pH 8.0,75mM 亞鐵氰化鉀(II),25mM 鐵氰化鉀(III),pH 8.0,lmM ATP,10mM MgCl2,0.6nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQ ID N0:15),胞溶素-E76S/E84Q/E85K/E92Q/E97S/D126G/E167A,具有突變 E76S/E84Q/E85K/E92Q/E97S/D126G/E167A 的 SEQ ID N0:2)hB)顯示了上圖軌跡中解旋酶 控制的DNA移動的一放大圖(y軸=電流(pA), X軸=時間(S))。所述DNA水平顯示出隨著 所述酶移動DNA穿過所述孔電流是逐步變化的。
[0031] 圖8顯示出Hel308Mbu(SEQ ID N0:15)能以受控方式移動DNA穿過胞溶素納米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/E50S,具有突變 E84Q/E85K/E92Q/E97S/ D126G/E167A/E50S的SEQIDN0:2),從而在隨著DNA移動穿過所述納米孔電流產生逐步 變化。A)顯示了典型的Hel308Mbu控制的DNA移動的示例電流軌跡(y軸=電流(pA),x 軸=時間(s))(+120mV,625mM KCl,100mM H 印 es pH 8.0,75mM 亞鐵氰化鉀(II),25mM 鐵氰化鉀(III),pH 8.0,lmM ATP,10mM MgCl2,0.3nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQIDN0:15),胞溶素 -E84Q/E85K/E92Q/E97S/D126G/E167A/E50S,具有突變 E84Q/E85K/E92Q/E97S/D126G/E167A/E50S 的 SEQ ID N0:2)hB)顯示了上圖軌跡中解旋酶 控制的DNA移動的一放大圖(y軸=電流(pA), X軸=時間(S))。所述DNA水平顯示出隨著 所述酶移動DNA穿過所述孔電流是逐步變化的。
[0032] 圖9顯示了 Hel308Mbu(SEQ ID N0:15)能以受控方式移動DNA穿過胞溶素納米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/E71S,具有突變 E84Q/E85K/E92Q/E97S/ D126G/E167A/E71S的SEQIDN0:2),從而在隨著DNA移動穿過所述納米孔電流產生逐步 變化。A)顯示了典型的Hel308Mbu控制的DNA移動的示例電流軌跡(y軸=電流(pA),x 軸=時間(min))(+180mV,625mM KCl,100mM H印es pH 8.0,75mM 亞鐵氰化鉀(II),25mM 鐵氰化鉀(III),pH 8.0,lmM ATP,10mM MgCl2,0.3nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQ ID N0:15),胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/E71S,具有突變 E84Q/E85K/E92Q/E97S/D126G/E167A/E71S 的 SEQ ID N0:2).B)顯示了上圖軌跡中解旋酶控 制的DNA移動的一放大圖(y軸=電流(pA), X軸=時間(S))。所述DNA水平顯示出隨著所 述酶移動DNA穿過所述孔電流是逐步變化的。
[0033] 圖10顯示了 Hel308Mbu(SEQ ID NO: 15)能以受控方式移動DNA穿過胞溶素納米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/E128S,具有突變 E84Q/E85K/E92Q/E97S/ D126G/E167A/E128S的SEQ ID N0:2),從而在隨著DNA移動穿過所述納米孔電流產生逐步 變化。A)顯示了典型的Hel308Mbu控制的DNA移動的示例電流軌跡(y軸=電流(pA),x 軸=時間(s))(+180mV,625mM KCl,100mM H印es pH 8.0,75mM 亞鐵氰化鉀(II),25mM 鐵氰化鉀(III),pH 8.0,lmM ATP,10mM MgCl2,0.6nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQIDN0:15),胞溶素 -E84Q/E85K/E92Q/E97S/D126G/E167A/E128S,具有突變 E84Q/E85K/E92Q/E97S/D126G/E167A/E128S 的 SEQ ID 勵:2)。抝顯示了上圖軌跡中解旋酶 控制的DNA移動的一放大圖(y軸=電流(pA), X軸=時間(s))。所述DNA水平顯示出隨著 所述酶移動DNA穿過所述孔電流是逐步變化的。
[0034] 圖11顯示了 Hel308Mbu(SEQ ID NO: 15)能以受控方式移動DNA穿過胞溶素納米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/D68S,具有突變 E84Q/E85K/E92Q/E97S/ D126G/E167A/D68S的SEQ ID N0:2),從而在隨著DNA移動穿過所述納米孔電流產生逐步 變化。A)顯示了典型的Hel308 Mbu控制的DNA移動的示例電流軌跡(y軸=電流(pA),x 軸=時間(min))(+120mV,625mM KCl,100mM H印es pH 8.0,75mM 亞鐵氰化鉀(II),25mM 鐵氰化鉀(III),pH 8.0,lmM ATP,10mM MgCl2,0.3nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQIDN0:15),胞溶素 -E84Q/E85K/E92Q/E97S/D126G/E167A/D68S,具有突變 E84Q/E85K/E92Q/E97S/D126G/E167A/D68S 的 SEQ ID N0:2)。B)顯示了上圖軌跡中解旋酶 控制的DNA移動的一放大圖(y軸=電流(pA), x軸=時間(s))。所述DNA水平顯示出隨著 所述酶移動DNA穿過所述孔電流是逐步變化的。
[0035] 圖12顯示了 Hel308Mbu(SEQ ID NO: 15)能以受控方式移動DNA穿過胞溶素納米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/D121S,具有突變 E84Q/E85K/E92Q/E97S/ D126G/E167A/D121S的SEQ ID N0:2),從而在隨著DNA移動穿過所述納米孔電流產生逐步 變化。A)顯示了典型的Hel308Mbu控制的DNA移動的示例電流軌跡(y軸=電流(pA),x 軸=時間(s))(+120mV,625mM KCl,100mM H印es pH 8.0,75mM 亞鐵氰化鉀(II),25mM 鐵氰化鉀(III),pH 8.0,lmM ATP,10mM MgCl2,0.6nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQIDN0:15),胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/D121S,具有突變 E84Q/E85K/E92Q/E97S/D126G/E167A/D121S 的 SEQ ID 勵:2)。抝顯示了上圖軌跡中解旋酶 控制的DNA移動的一放大圖(y軸=電流(pA), X軸=時間(S))。所述DNA水平顯示出隨著 所述酶移動DNA穿過所述孔電流是逐步變化的。
[0036] 序列表說明
[0037] SEQ ID N0:1示出了編碼胞溶素單體的多核苷酸序列。
[0038] SEQ ID NO:2示出了胞溶素單體的胺基酸序列。
[0039] SEQ ID NO: 3示出了編碼Phi29DNA聚合酶的多核苷酸序列。
[0040] SEQ ID N0:4示出了 Phi29DNA聚合酶的胺基酸序列。
[0041] SEQ ID N0:5示出了源自大腸桿菌(E. coli)的SbcB基因的密碼子優化的多核苷 酸序列。其編碼大腸桿菌的核酸外切酶I (EcoExo I)。
[0042] SEQ ID NO:6示出了大腸桿菌的核酸外切酶I (EcoExo I)的胺基酸序列。
[0043] SEQ ID NO: 7示出了源自大腸桿菌的XthA基因的密碼子優化的多核苷酸序列。其 編碼大腸桿菌的核酸外切酶III。
[0044] SEQ ID N0:8示出了大腸桿菌的核酸外切酶III的胺基酸序列。該酶從雙鏈 DNA(dsDNA)中的一條鏈沿3' -5'方向執行對5'單磷酸核苷的分配酶解(distributive digestion)。酶在鏈上的引發需要約4個核苷酸的5'突出。
[0045] SEQ ID N0:9示出了源自極端嗜熱菌(T. thermophilus)的recj基因的密碼子優 化的多核苷酸序列。其編碼極端嗜熱菌的RecJ酶(TthRecJ-cd)。
[0046] SEQ ID NO: 10示出了極端嗜熱菌的RecJ酶(TthRecJ-cd)的胺基酸序列。該酶 從單鏈DNA沿5' - 3'方向執行對5'單磷酸核苷的進行性酶解(processive digestion)。 酶在鏈上的引發需要至少4個核苷酸。
[0047] SEQ ID NO: 11 不出 了源自噬菌體 λ 核酸外切酶(bacteriophage lambda exo) (redX)基因的密碼子優化的多核苷酸序列。其編碼噬菌體λ核酸外切酶。
[0048] SEQ ID Ν0:12示出了噬菌體λ核酸外切酶的胺基酸序列。該序列是組裝成三聚 體的三個相同亞基中的一個。所述酶從雙鏈DNA中的一條鏈沿5'-3'方向執行對核苷酸的 高進行性酶解(http://www. neb. com/nebecomm/products/productM0262. asp)。酶在鏈上 的引發優先需要約4個具有5'磷酸的核苷酸的5'突出。
[0049] SEQ ID NO: 13和14示出了在實施例1,2, 3, 4, 5和6中使用的單鏈DNA的多核苷 酸序列。SEQ ID NO: 14具有3'-膽固醇標籤。
[0050] SEQ ID NO: 15 示出了 Hel308Mbu 的胺基酸序列。
[0051] SEQ ID NO: 16示出了胞溶素相關蛋白質(LRP)I的胺基酸序列。
[0052] SEQ ID N0:17示出了胞溶素相關蛋白質(LRP)I的胺基酸序列。
[0053] SEQ ID NO: 18示出了胞溶素相關蛋白質(LRP)I的胺基酸序列。
[0054] SEQ ID N0:19示出了抗癌晶體蛋白-2(parasporin-2)的活性變體的胺基酸序列。 該全長蛋白在其氨基和羧基末端裂開從而形成能夠形成孔的活性變體。
【具體實施方式】
[0055] 應理解的是,所公開的產品和方法的不同應用可以根據本領域的具體需求進行調 整。還應理解的是,本文中使用的術語僅僅是為了描述本發明的具體實施方案,不意欲進行 限制。
[0056] 另外,如在本說明書和所附權利要求書中使用的,單數形式的"一個"、"所述"包括 複數指代物,除非文中另有明確說明。因此,例如,涉及"一個突變體單體"時包括"多個突 變體單體",涉及"一個取代"時包括兩個或多個這樣的取代,涉及"一個孔"時包括兩個或多 個這樣的孔,涉及"一個多核苷酸"時包括兩個或多個這樣的多核苷酸,等。
[0057] 所有在本文中引用的出版物、專利和專利申請,無論在前文或後文,均以全文引用 的方式納入本文中。
[0058] 突奪體朐溶素單體
[0059] 本發明提供了突變體胞溶素單體。所述突變體胞溶素單體可用於形成本發明的 孔。突變體胞溶素單體為其序列由野生型胞溶素單體的序列(即SEQ ID N0:2)變化而來且 在本發明其他單體或者胞溶素的或源自胞溶素的其他單體存在下保持有形成孔的能力的 單體。用於確定突變體單體形成孔的能力的方法是本領域公知的且將在下文更詳細論述。 例如,所述突變體單體形成孔的能力可按實施例1中所述確定。
[0060] 所述突變體單體具有改變的與多核苷酸相互作用的能力。因此,含有一個或多個 突變體單體的孔具有提高的核苷酸讀取性能,例如顯示出(1)提高的多核苷酸捕獲和(2) 提高的多核苷酸識別或區分能力。特別地,由所述突變體單體構造的孔能比野生型的能更 容易地捕獲核苷酸和多核苷酸。此外,由所述突變體單體構造的孔顯示出增加的電流範圍, 這使得更容易區分不同的核苷酸,且顯示出降低的狀態變化,這提高了信噪比。此外,在多 核苷酸移動穿過由所述突變體構造的孔時使電流增加的核苷酸的數目減少了。這使得更容 易確定多核苷酸移動穿過所述孔時所觀察到的電流與所述多核苷酸之間的直接關係。所述 突變體的提高的核苷酸讀取性能通過五種主要機制實現,即可通過改變下述而實現:
[0061] ?空間位阻(teric)(增加或減小胺基酸殘基的尺寸);
[0062] ?電荷(例如引入或去除-ve電荷和/或引入或去除+ve電荷);
[0063] ?氫鍵合(例如引入可將氫鍵合至鹼基對的胺基酸);
[0064] · π-堆積(例如引入通過離域電子Ji體系而相互作用的胺基酸);和/或 [0065].改變所述孔的結構(例如引入能增加桶狀結構或通道的尺寸的胺基酸)。
[0066] 上述五種機制中的任何一種或多種是本發明突變體單體形成的孔的性能得以提 高的原因。例如,含有本發明突變體單體的孔可由於改變的空間位阻、改變的氫鍵合和改變 的結構而顯示出提高的核苷酸讀取性能。
[0067] 本發明突變體單體含有SEQ ID NO:2中所示序列的變體。SEQ ID NO:2為胞溶素 單體的野生型序列。SEQ ID N0:2的變體為具有由SEQ ID N0:2的胺基酸序列變化而來的 胺基酸序列且保持有其形成孔的能力的多肽。
[0068] 出人意料地,本發明人識別出了胞溶素單體內的一個區域,該區域可被修飾用以 改變所述單體和多核苷酸之間的相互作用,例如當使用納米孔通過含所述單體的孔感測表 徵所述多核苷酸時。所述區域為SEQ ID N0:2的約44位點到約126位點。通常至少該區 域的一部分為胞溶素的跨膜區域。通常至少該區域的一部分為胞溶素的桶狀結構或通道。 通常至少該區域的一部分為胞溶素的內壁或內膜(lining)。
[0069] 胞溶素的跨膜區域經鑑定為SEQ ID N0:2的44位點至67位點(De Colbis等 人,Structure, 2012 ;20:1498 - 1507)。
[0070] 根據本發明,所述變體包含位於SEQ ID N0:2的從約44位點到約126位點的區域 內的一個或多個修飾,所述修飾能改變所述單體或優選地所述區域與多核苷酸相互作用的 能力。所述單體與多核苷酸之間的相互作用可被增加或減小。所述單體與多核苷酸之間的 相互作用增加將例如有助於通過含所述突變體單體的孔對所述多核苷酸的捕獲。所述區域 與多核苷酸之間的相互作用減小將例如提高對所述多核苷酸的識別或區分。對所述多核苷 酸的識別或區分可通過以下方式提高,通過減小含有突變體單體的孔的狀態的變化(這將 提高信噪比)和/或減小在所述多核苷酸移動穿過含有所述突變體單體的孔時使電流增加 的所述多核苷酸中核苷酸的數目。
[0071] 因此,本發明提供了含有SEQ ID N0:2中所示序列的變體的突變體胞溶素單體,其 中所述單體能夠形成孔並且其中所述變體包括SEQ ID NO: 2的從約44位點到約126位點 的一個或多個修飾,所述修飾能改變所述單體與多核苷酸相互作用的能力。
[0072] 所述單體與多核苷酸相互作用的能力可使用本領域公知的方法確定。所述單體可 與多核苷酸以任何方式相互作用,例如通過非共價相互作用如疏水性相互作用、氫鍵合、範 德華力(Van der Waal's force)、pi〇)-陽離子相互作用或靜電力。例如,所述區域與 多核苷酸結合的能力可使用常規結合試驗測得。合適的試驗包括但不限於,基於螢光的結 合試驗、核磁共振(NMR)、等溫滴定量熱法(ITC)和電子自旋共振(ESR)光譜法。替代地,包 含一個或多個所述突變體單體的孔與多核苷酸相互作用的能力可使用上下文中所述的任 一方法確定。優選的試驗在實施例中有描述。
[0073] 所述一個或多個修飾位於SEQ ID NO: 2的約44位點到約126位點的區域中。所述 一個或多個修飾優選位於以下區域中的任一個中:約40位點至約125位點、約50位點至約 120位點、約60位點至約110位點和約70位點至約100位點。如果進行所述一個或多個修 飾是為了提高對多核苷酸的捕獲,則更優選在以下區域中的任一個中進行所述修飾:約44 位點至約103位點、約68位點至約103位點、約84位點至約103位點、約44位點至約位點 97、約68位點至約97位點或約84位點至約97位點。如果進行所述一個或多個修飾是為 了提高對多核苷酸的識別或區分,則更優選在以下區域中的任一個中進行所述修飾:約44 位點至約109位點、約44位點至約97位點或約48位點至約88位點。所述區域優選為SEQ ID NO:2的約44位點至約67位點。
[0074] 如果所述一個或多個修飾是用於提高對多核苷酸的識別或區分,則優選在進行用 於提高多核苷酸捕獲的一個或多個修飾之外進行修飾。這使得由突變體單體形成的孔能有 效捕獲多核苷酸然後表徵該多核苷酸,例如按如下所述評估其序列。
[0075] 對蛋白質納米孔的修飾--用以改變其與多核苷酸相互作用的能力,特別是提高 其捕獲和/或識別或區分多核苷酸的能力--在本領域中有充分的文獻記載。例如,WO 2010/034018和WO 2010/055307中公開了所述修飾。根據本發明,可對胞溶素單體進行類 似的修飾。
[0076] 可進行任何數目的修飾,如1,2, 5, 10, 15, 20, 30個或更多的修飾。可進行任何修 飾,只要能改變所述單體與多核苷酸相互作用的能力即可。合適的修飾包括,但不限於,氨 基酸取代、胺基酸添加和胺基酸缺失。所述一個或多個修飾優選為一個或多個取代。這在 下文有更詳細論述。
[0077] 所述一個或多個修飾優選地(a)改變所述單體的空間位阻效應或優選地改變所 述區域的空間位阻效應,(b)改變所述單體的淨電荷或優選地改變所述區域的淨電荷,(C) 改變所述單體與所述多核苷酸進行氫鍵合的能力,或優選地改變所述區域與所述多核苷酸 進行氫鍵合的能力,(d)引入或去除通過離域電子π體系進行相互作用的化學基團,和/ 或(e)改變所述單體的結構,或優選地改變所述區域的結構。所述一個或多個修飾更優選 地進行(a)至(e)的任意組合,例如(a)和(b) ; (a)和(c) ; (a)和(d) ; (a)和(e) ; (b)和 (c) ; (b)和(d) ; (b)和(e) ; (c)和(d) ; (c)和(e) ; (d)和(e),(a),(b)和(c) ; (a),(b) 和(d) ; (a),(b)和(e) ; (a),(c)和(d) ; (a),(c)和(e) ; (a),(d)和(e) ; (b),(c)和(d); (b),(c)和(e) ; (b),(d)和(e) ; (c),(d)和(e) ; (a),(b),(c) and d) ; (a),(b),(c)和(e); (a),(b),(d)和(e) ; (a),(c),(d)和(e) ; (b),(c),(d)和(e) ; (a),(b),(c)和(d)。
[0078] 對於(a),可增加或減小所述單體的空間位阻效應。根據本發明可以使用改變所 述空間位阻效應的任何方法。引入大體積的(bulky)殘基,例如苯丙氨酸(F),色氨酸(W), 酪氨酸(Y)或組氨酸(H),可增加所述單體的空間位阻。所述一個或多個修飾優選地是引 入F、W、Y和H中的一個或多個。可以引入F、W、Y和H的任意組合。所述F、W、Y和H中的 一個或多個可通過添加而引入。所述F、W、Y和H中的一個或多個優選地通過取代而引入。 適於引入這類殘基的位置在下面更詳細地論述。
[0079] 相反地,去除大體積的殘基,例如苯丙氨酸(F)、色氨酸(W)、酪氨酸(Y)或組氨酸 (H),能減少所述單體的空間位阻。所述一個或多個修飾優選地是去除F、W、Y和H中的一個 或多個。可以去除F、W、Y和H的任意組合。所述F、W、Y和H中的一個或多個可通過缺失 而去除。所述F、W、Y和H中的一個或多個優選地通過用具有較小側基的殘基,例如例如絲 氨酸(S)、蘇氨酸(T)、丙氨酸(A)和纈氨酸(V)進行取代而去除。
[0080] 對於(b),可用任何方法改變所述淨電荷。優選地增加或減少淨正電荷。可用任何 方式增加淨正電荷。優選地,通過引入、優選通過取代一個或多個帶正電的胺基酸和/或通 過中和、優選通過取代一個或多個負電荷而增加淨正電荷。
[0081] 優選地,通過引入一個或多個帶正電的胺基酸來增加淨正電荷。所述一個或多個 帶正電的胺基酸可通過添加而引入。所述一個或多個帶正電的胺基酸優選地通過取代而引 入。帶正電的胺基酸為帶淨正電荷的胺基酸。所述帶正電的胺基酸可以是天然存在的或非 天然存在的。所述帶正電的胺基酸可以是合成的或經修飾的。例如,可以專門設計經修飾 的帶淨正電荷的胺基酸而用於本發明中。對胺基酸的許多不同類型的修飾均是本領域中公 知的。
[0082] 優選的天然存在的帶正電的胺基酸包括,但不限於,組氨酸(H)、賴氨酸(K)和精 氨酸(R)。所述一個或多個修飾優選為引入H,K和R中的一個或多個。可以引入任意數目 和任意組合的H,K和R。所述H,K和R中的一個或多個可通過添加而引入。所述H,K和R 中的一個或多個優選地通過取代而引入。適於引入這類殘基的位置在下文更詳細論述。
[0083] 添加或取代天然存在的胺基酸的方法是本領域公知的。例如,甲硫氨酸(M)可 以用精氨酸(R)取代,通過在編碼所述單體的多核苷酸相關位置通過用精氨酸的密碼子 (AGA)替換甲硫氨酸的密碼子(ATG)而進行。然後所述多核苷酸可按如下所述進行表達。 [0084] 添加或取代非天然存在的胺基酸的方法也是本領域公知的。例如,非天然存在的 胺基酸可以通過將合成氨醯基-tRNA包含到用於表達所述孔的IVTT系統中而引入。替代 地,通過在特定胺基酸的合成(即非天然存在的)類似物存在下,在針對該特定胺基酸為營 養缺陷型的大腸桿菌中表達所述單體,來引入非天然存在的胺基酸。在使用部分肽合成來 產生所述孔的情況下,它們還可以通過裸露連接(naked ligation)而產生。
[0085] 任何胺基酸均可用帶正電的胺基酸取代。一個或多個不帶電胺基酸、非極性氨基 酸和/或芳香族胺基酸可以用一個或多個帶正電的胺基酸取代。不帶電的胺基酸沒有淨電 荷。適宜的不帶電的胺基酸包括,但不限於,半胱氨酸(C)、絲氨酸(S)、蘇氨酸(T)、甲硫氨 酸(M)、天冬醯胺(N)和穀氨醯胺(Q)。非極性胺基酸具有非極性側鏈。適宜的非極性氨基 酸包括,但不限於,甘氨酸(G)、丙氨酸(A)、脯氨酸(P)、異亮氨酸(I)、亮氨酸(L)和纈氨酸 (V)。芳香族胺基酸具有芳香族側鏈。適宜的芳香族胺基酸包括,但不限於,組氨酸(H)、苯 丙氨酸(F)、色氨酸(W)和酪氨酸(Y)。優選地,一個或多個帶負電的胺基酸用一個或多個 帶正電的胺基酸取代。適宜的帶負電的胺基酸包括,但不限於,天冬氨酸(D)和穀氨酸(E)。
[0086] 優選的引入包括,但不限於,以下取代:用K取代E,用R取代M,用H取代M,用K取 代M,用R取代D,用H取代D,用K取代D,用R取代E,用H取代E,用R取代N,用R取代T, 用R取代G。最優選地用K取代E。
[0087] 可以引入或取代任何數目的帶正電的胺基酸。例如,可以引入或取代 1,2, 5, 10, 15, 20, 25, 30個或更多帶正電的胺基酸。
[0088] 更優選地通過中和一個或多個負電荷來增加淨正電荷。所述一個或多個負電荷可 以通過用一個或多個不帶電的胺基酸、非極性胺基酸和/或芳香族胺基酸取代一個或多個 帶負電的胺基酸而進行替代來中和。去除負電荷能增加淨正電荷。所述不帶電的胺基酸、 非極性胺基酸和/或芳香族胺基酸可以是天然存在的或非天然存在的。它們可以是合成的 或經修飾的。適宜的不帶電的胺基酸、非極性胺基酸和芳香族胺基酸如上文所述。優選的 取代包括,但不限於,用Q取代E,用S取代E,用A取代E,用Q取代D,用N取代E,用N取代 D,用G取代D,用S取代D。
[0089] 可以取代任意數目和任意組合的不帶電的胺基酸、非極性胺基酸和/或芳香族氨 基酸。例如,可以取代1,2, 5, 10, 15, 20, 25或30個或者更多不帶電的胺基酸、非極性氨基 酸和/或芳香族胺基酸。帶負電的胺基酸可以用下述胺基酸取代:(1)不帶電的胺基酸; (2)非極性胺基酸;(3)芳香族胺基酸;(4)不帶電的胺基酸和非極性胺基酸;(5)不帶電的 胺基酸和芳香族胺基酸;和(5)非極性胺基酸和芳香族胺基酸;或(6)不帶電的胺基酸、非 極性胺基酸和芳香族胺基酸。
[0090] 所述一個或多個負電荷可以通過在一個或多個帶負電的胺基酸附近例如1,2, 3 或4個胺基酸範圍內或在一個或多個帶負電的胺基酸相鄰處引入一個或多個帶正電的氨 基酸而中和。帶正電和帶負電的胺基酸的實例如上文所述。所述帶正電的胺基酸可以用上 文所述的任何方式引入,例如通過取代而引入。
[0091] 優選地,通過引入一個或多個帶負電的胺基酸和/或中和一個或多個正電荷來減 少淨正電荷。可以減少淨正電荷的方法將從上文關於增加淨正電荷的描述中清楚得知。上 文描述的關於增加淨正電荷的任何事實方案同樣適用於減少淨正電荷的情況,不同在於, 電荷正好相反。特別地,所述一個或多個正電荷優選地通過用一個或多個不帶電的胺基酸、 非極性胺基酸和/或芳香族胺基酸取代一個或多個帶正電的胺基酸而中和或者通過在一 個或多個帶正電的胺基酸附近例如1,2, 3或4個胺基酸範圍內或在一個或多個帶正電的氨 基酸相鄰處引入一個或多個帶負電的胺基酸而中和。
[0092] 優選地增加或減少淨負電荷。上文描述的關於增加或減少淨正電荷的任何實施方 案同樣分別適用於減少或增加淨負電荷的情況。
[0093] 對於(C),可用任何方式改變所述單體進行氫鍵合的能力。引入絲氨酸(S),蘇氨 酸(T),天冬醯胺(N),穀氨醯胺(Q),酪氨酸(Y)或組氨酸(H),可增加所述單體的氫鍵 合能力。優選地,所述一個或多個修飾為引入S,T,N,Q,Y和H中的一個或多個。可以引入 3,1^,〇,¥和!1的任意組合。所述5,1^,〇,¥和!1中的一個或多個可通過添加而引入。所 述S,T,N,Q,Y和H中的一個或多個優選通過取代而引入。適於引入這類殘基的位置在下文 更詳細論述。
[0094] 去除絲氨酸(S),蘇氨酸(T),天冬醯胺(N),穀氨醯胺(Q),酪氨酸(Y)或組氨酸 (H),可減少所述單體的氫鍵合能力。優選地,所述一個或多個修飾為去除S,T,N,Q,Y和H 中的一個或多個。可去除S,T,N,Q,Y和H的任意組合。所述S,T,N,Q,Y和H中的一個或多 個可通過缺失而去除。所述S,T,N,Q,Y和H中的一個或多個優選地通過用氫鍵合能力較差 的其他胺基酸例如丙氨酸(A),纈氨酸(V),異亮氨酸(I)和亮氨酸(L)進行取代而去除。
[0095] 對於(d),引入芳香族殘基,例如苯丙氨酸(F),色氨酸(W),酪氨酸(Y)或組氨酸 (H),也可增加所述單體中的π-堆積。去除芳香族殘基,例如苯丙氨酸(F),色氨酸(W), 酪氨酸(Y)或組氨酸(Η),也可增加所述單體中的π-堆積。這類胺基酸可參照上文( a)中 的論述而引入或去除。
[0096] 對於(e),根據本發明進行一個或多個修飾來改變所述單體的結構。例如,可去除、 縮短或擴展一個或多個環形區域。這通常有利於多核苷酸進入或離開所述孔。所述一個或 多個環形區域可以在所述孔的順側、所述孔的反側或位於所述孔的兩側。替代地,所述孔的 氨基末端和/或羧基末端的一個或多個區域可以擴展或刪除。這通常會改變所述孔的尺寸 和/或電荷。
[0097] 從上文論述中清楚的是,引入某些胺基酸將增加所述單體與多核苷酸通過多於一 種的機制進行相互作用的能力。例如,用H取代E將不僅依照(b)增加淨正電荷(通過中 和負電荷)而且將依照(c)增加所述單體進行氫鍵合的能力。
[0098] 所述變體優選地包括在SEQ ID NO: 2的下述位置中的一個或多個處的取代:M44, N 46, N48, E50, R52, H58, D68, F70, E71, S74, E76, S78, Y79, S80, H81, S82, E84, E85, S86, Q87, S8 9, M90, E92, E94, E97, E102, H103, T104, T106, R115, Q117, N119, D121 和 D126。所述變體優選 地包括在這些位置中的 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31,32, 33或34位的取代。所述變體優選地包括在SEQ ID NO: 2 的下述位置中的一個或多個處的取代:D68, E71,S74, E76, S78, S80, S82, E84, E85, S86, Q87, S89, E92, E102, T104, T106, R115, Q117, N119和D121。所述變體優選地包括在這些位置中的 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11,12, 13, 14, 15, 16, 17, 18, 19 或 20 位的取代。經取代進入所述變 體的胺基酸可以是天然存在的胺基酸或其非天然存在的衍生物。經取代進入所述變體的氨 基酸可以是D-胺基酸。上文所列的每個位置均可用天冬醯胺(N),絲氨酸(S),穀氨醯胺 (Q),精氨酸(R),甘氨酸(G),酪氨酸(Y),天冬氨酸(D),亮氨酸(L),賴氨酸(K)或丙氨 酸㈧進行取代。
[0099] 所述變體優選地包括SEQ ID NO:2的以下突變中的至少一個:
[0100] (a) 44位點處的絲氨酸(S);
[0101] (b) 46位點處的絲氨酸(S);
[0102] (c) 48位點處的絲氨酸(S);
[0103] (d) 52位點處的絲氨酸(S);
[0104] (e) 58位點處的絲氨酸(S);
[0105] (f) 68位點處的絲氨酸(S);
[0106] (g) 70位點處的絲氨酸(S);
[0107] (h) 71位點處的絲氨酸(S);
[0108] ⑴76位點處的絲氨酸(S);
[0109] (j) 79位點處的絲氨酸(S);
[0110] (k) 81位點處的絲氨酸(S);
[0111] (1)84位點處的絲氨酸(S),天冬氨酸(D)或穀氨醯胺(Q);
[0112] (m) 85位點處的絲氨酸(S)或賴氨酸(K);
[0113] (η) 87位點處的絲氨酸(S);
[0114] (〇) 90位點處的絲氨酸(S);
[0115] (P) 92位點處的天冬醯胺(N)或穀氨醯胺(Q);
[0116] (q) 94位點處的絲氨酸(S)或天冬醯胺(N);
[0117] (r) 97位點處的絲氨酸(S)或天冬醯胺(N);
[0118] (s) 102位點處的絲氨酸(S);
[0119] ⑴103位點處的絲氨酸(S);
[0120] (U) 121位點處的天冬醯胺(N)或絲氨酸⑶;
[0121] (V) 50位點處的絲氨酸(S);
[0122] (w) 94位點處的天冬醯胺(N)或絲氨酸(S);
[0123] (X) 97位點處的天冬醯胺(N)或絲氨酸(S);
[0124] (y) 121位點處的絲氨酸⑶或天冬醯胺(N);
[0125] (z) 126位點處的天冬醯胺(N)或穀氨醯胺(Q)或甘氨酸(G);和
[0126] (aa) 128位點處的絲氨酸⑶或天冬醯胺(N)。
[0127] 所述變體可以包括任何數目的突變(a)至(aa),例如1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26 或 27 個所述突變。所述突變的優選組 合見下文所述。被引入到所述變體中的胺基酸可以是天然存在的胺基酸或其非天然存在的 衍生物。被引入到所述變體中的胺基酸可以是D-胺基酸。
[0128] 所述變體優選包含SEQ ID NO:2的以下突變中的至少一個:
[0129] (a) 68位點處的絲氨酸(S);
[0130] (b) 71位點處的絲氨酸(S);
[0131] (c) 76位點處的絲氨酸(S);
[0132] (d) 84位點處的天冬氨酸(D)或穀氨醯胺(Q);
[0133] (e) 85位點處的賴氨酸(K);
[0134] (f) 92位點處的天冬醯胺(N)或穀氨醯胺(Q);
[0135] (g) 102位點處的絲氨酸(S);
[0136] (h) 121位點處的天冬醯胺(N)或絲氨酸⑶;
[0137] ⑴50位點處的絲氨酸(S);
[0138] (j) 94位點處的天冬醯胺(N)或絲氨酸(S);
[0139] (k) 97位點處的天冬醯胺(N)或絲氨酸(S);和
[0140] (1) 126位點處的天冬醯胺(N)或穀氨醯胺(Q)或甘氨酸(G)。
[0141] 所述變體可以包括任何數目的突變(a)至(1),例如1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11或 12個所述突變。所述突變的優選組合見下文所述。被引入到所述變體中的胺基酸可以是天 然存在的胺基酸或其非天然存在的衍生物。被引入到所述變體中的胺基酸可以是D-氨基 酸。
[0142] 所述變體可以包括在SEQ ID NO:2的約44位點到約126位點的區域外部的一個 或多個額外修飾,所述額外修飾與上述區域內的修飾結合用於提高多核苷酸捕獲和/或提 高多核苷酸識別或區分。適宜的修飾包括,但不限於,在D35, E128, E135, E134和E167中的 一個或多個處進行取代。特別地,通過在128, 135, 134和167位點中的一個或多個處的取 代E來去除負電荷,可以提高多核苷酸捕獲。在這些位點中的一個或多個處的E可以用上 文所述的任何方式進行取代。優選地,E128, E135, E134和E167全部按上文所述進行取代。 優選用A取代E。換言之,所述變體優選包含E128A,E135A,E134A和E167A中的一個或多個 或者全部。另一優選的取代為D35Q。
[0143] 在一優選的實施方案中,所述變體包含SEQ ID NO:2中的以下取代:
[0144] i. E84D和E85K中的一個或多個,例如兩個;
[0145] ii. E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一個或多個,例如 2, 3, 4, 5 或 6 個;
[0146] iii. E92N, E94N, E97N, D121N 和 D126N 中的一個或多個,例如 2, 3, 4 或 5 個;
[0147] iv. E92N, E94N, E97N, D121N, D126N 和 E128N 中的一個或多個,例如 2, 3, 4, 5 或 6 個;
[0148] V. E76S, E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一個或多個,例如 2, 3, 4, 5, 6 或7個;
[0149] vi. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E50S 中的一個或多個,例如 2, 3, 4, 5, 6 或7個;
[0150] vii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E71S 中的一個或多個,例如 2.3.4.5.6 或 7個;
[0151] viii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E94S 中的一個或多個,例如 2.3.4.5.6 或 7個;
[0152] ix.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E102S 中的一個或多個,例如 2.3.4.5.6 或 7個;
[0153] X. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E128S 中的一個或多個,例如 2, 3, 4, 5, 6 或7個;
[0154] xLE84Q,E85K,E92Q,E97S,D126G,E167A 和 E135S 中的一個或多個,例如 2.3.4.5.6 或 7個;
[0155] xii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 D68S 中的一個或多個,例如 2.3.4.5.6 或 7個;
[0156] xiii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D121S 中的一個或多個,例如 2.3.4.5.6 或 7個;
[0157] xiv.E84Q,E85K,E92Q,E97S,D126G,E167A 和 D134S 中的一個或多個,例如 2.3.4.5.6 或 7個;
[0158] XV. E84D, E85K和E92Q中的一個或多個,例如2或3個;
[0159] xvi. E84Q, E85K, E92Q, E97S, D126G 和 E135S 中的一個或多個,例如 1,2, 3, 4, 5 或 6 個;
[0160] 義¥丨^851(392〇39453975和01266中的一個或多個,例如1,2,3,4或5個;
[0161] 義¥^^7653851(392〇3975和01266中的一個或多個,例如1,2,3,4或5個;
[0162] xix. E71S, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4 或 5 個;
[0163] XX. D68S, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4 或 5 個;
[0164] xxi. E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3 或 4 個;
[0165] xxii. E84Q, E85K, E92Q, E97S, H103S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6個;
[0166] xxiii. E84Q, E85K, M90S, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6個;
[0167] xxiv. E84Q, Q87S, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6 個;
[0168] XXV. E84Q, E85S, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4 或 5 個;
[0169] xxvi. E84S, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4 或 5 個;
[0170] xxvii. H81S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6個;
[0171] xxviii. Y79S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6個;
[0172] xxix. F70S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6 個;
[0173] XXX. H58S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6 個;
[0174] xxxi. R52S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6 個;
[0175] xxxii. N48S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6個;
[0176] xxxiii. N46S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6個;
[0177] xxxiv. M44S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4, 5 或 6個;
[0178] XXXV. E92Q和E97S中的一個或多個,例如兩個;
[0179] xxxvi. E84Q, E85K, E92Q 和 E97S 中的一個或多個,例如 1,2, 3 或 4 個;
[0180] xxxvii. E84Q和E85K中的一個或多個,例如兩個;
[0181] xxxviii. E84Q, E85K 和 D126G 中的一個或多個,例如 1,2 或 3 個;
[0182] xxxix. E84Q, E85K, D126G 和 E167A 中的一個或多個,例如 1,2, 3 或 4 個;
[0183] xl.E92Q,E97S和D126G中的一個或多個,例如1,2或3個;
[0184] xli. E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個,例如 1,2, 3, 4 或 5 個;
[0185] xlii·E84Q,E85K,E92Q,E97S和E167A中的一個或多個,例如l,2,3,4或5個;
[0186] xliii.E84Q,E85K,E92Q,D126G和E167A中的一個或多個,例如l,2,3,4或5個;
[0187] xliv·E84Q,E85K,E97S,D126G和E167A中的一個或多個,例如l,2,3,4或5個;
[0188] xlv.E84Q,E92Q,E97S,D126G和E167A中的一個或多個,例如l,2,3,4或5個;
[0189] xlvi·E85K,E92Q,E97S,D126G和E167A中的一個或多個,例如l,2,3,4或5個;
[0190] xlvii. E84D, E85K和E92Q中的一個或多個,例如1,2或3個;
[0191] xlviii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D121S 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0192] xlix.E84Q,E85K,E92Q,E97S,D126G,E167A 和 D68S 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0193] l.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E135S 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0194] li.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E128S 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0195] lii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E102S 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0196] liii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E94S 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0197] liv.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E71S 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0198] lv. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E50S 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0199] lvi.E76S,E84Q,E85K,E92Q,E97S,D126G 和 E167A 中的一個或多個,例如 1,2,3,4,5,6 或 7個;
[0200] lvii. E92N, E94N, E97N, D121N, D126N和 E128N 中的一個或多個,例如 1,2, 3, 4, 5 或 6個;
[0201] lviii. E92N, E94N, E97N, D121N 和 D126N 中的一個或多個,例如 1,2, 3, 4
[0202] 或5個;或
[0203] lix. E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一個或多個,例如 1,2, 3, 4, 5 或 6〇
[0204] 在上述中,第一個字母是指SEQ ID NO:2中被替代的胺基酸,數字是指在SEQ ID N0:2中的位置,第二個字母是指替換第一個字母所代表的胺基酸的胺基酸。因此,E84D是 指84位點處的穀氨酸(E)被天冬氨酸⑶取代。
[0205] 所述變體可以包括i至Iix的任一個中的任意數目的取代,例如1,2, 3, 4, 5, 6或 7個。所述變體優選包括上述i至Iix的任一個中所示的所有取代。
[0206] 在一優選的實施方案種,所述變體包括上述i至XV的任一個中的取代。所述變體 可以包括i至XV的任一個中的任意數目的取代,例如1,2, 3, 4, 5, 6或7個。所述變體優選 包括上述i至XV的任一個中所示的所有取代。
[0207] 如果所述一個或多個修飾是用於提高所述單體識別或區分多核苷酸的能力, 則優選在進行上述用於提高多核苷酸捕獲的修飾之外進行所述一個或多個修飾,例如 E84Q,E85K, E92Q, E97S, D126G 和 E167A。
[0208] 對所識別區域進行的一個或多個修飾可以是指,用在胞溶素的同源物或旁系同源 物(paralogue)的相應位置存在的胺基酸取代所述區域中的一個或多個胺基酸。胞溶素的 同源物的四個實例在SEQ ID NO: 16至19中示出。這類取代的優點是,它們可能導致突變 體單體形成孔,因為其同源單體也能形成孔。
[0209] 除了上面所討論的特定的突變外,所述變體可包括其他的突變。這些突變不一定 提高所述單體與多核苷酸相互作用的能力。所述突變可以利於例如表達和/或純化。基於 胺基酸的相似性,變體與SEQ ID N0:2的整個長度的胺基酸序列具有至少50%同源性。更 優選地,基於胺基酸的相似性,所述變體與SEQ ID NO: 2的整個長度的胺基酸序列具有至少 55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90% 同源性,更優選地至少95% ,97%或99%同源性。在100或更長,例如125, 150, 175或200 或更長的連續胺基酸的長度上,可以具有至少80%,例如至少85%,90%或95%的胺基酸 相似性("嚴格同源性(hard homology)")。
[0210] 可使用本領域的標準方法測定同源性。例如UWGCG包提供了 BESTFIT程序,該 程序可用於計算同源性,例如使用其默認設置(Devereux等人(1984)核酸s Research 12, p387-395)。PILEUP算法和BLAST算法可用於計算同源性或比對序列(line up sequence)(例如識別等價殘基或對應序列(通常基於其默認設置)),例如Altschul S.F. (1993) J Mol Evol 36:290-300 ;Altschul,S. F等人(1990) J Mol Biol 215:403-10 中 所描述的。
[0211] 進行BLAST分析的軟體可通過國家生物技術信息中心(National Center for Biotechnology Information) (http://www. ncbi. nlm. nih. gov/)而公開獲得。這一算法包 括,首先通過識別查詢序列中W長度的短字(short words)來識別高得分序列對(HSP),所 述查詢序列中W長度的字在與資料庫序列中相同長度的字比對(align with)時能匹配或 滿足一些為正值的閾值評分T。T指的是鄰近字的得分閾值(Altschul等人,supra)。這 些初始鄰近字的匹配記錄(hits)用作開啟檢索以尋找包含它們的HSP的種子。該字匹配 記錄沿著每個序列向兩個方向擴展到,直到累積比對得分(cumulative alignment score) 增加為止。所述字匹配記錄在每個方向的擴展在以下的時候停止:累積比對得分從其取得 的最大值下降X量時;由於一個或多個負得分殘基比對的積累而是累積得分趨於零或低於 零時;或任一序列結束時。BLAST算法參數W、T和X決定比對的靈敏度和速度。BLAST程序 使用默認設置:字長(W)為11,BL0SUM62得分矩陣(參見Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89:10915-10919)比對值(B)為 50、期望值(E)為 10, M = 5, N =4,以及兩條鏈的比較值。
[0212] BLAST算法對兩個序列進行相似性的統計分析;參見例如Karlin and Altschul (1993)Proc. Natl. Acad. Sci. USA 90:5873-5787。由 BLAST 算法提供的相似性的 一個量度為最小和概率(P (N)),該最小和概率表示兩個胺基酸序列偶然發生配對的概率。 例如,如果在一個序列與另一個序列相比,最小和概率小於約1,優選小於約0. 1,更優選地 小於約0. 01,最優選地小於約0. 001,則上述第一個序列被認為與上述第二個序列相似。
[0213] 可以對SEQ ID N0:2的除了上述那些胺基酸序列之外的胺基酸序列進行胺基酸取 代,例如多達1,2, 3, 4, 5, 10, 20或30個取代。保守取代是將胺基酸用相似化學結構、相似 化學性能或相似側鏈體積的其他胺基酸進行替換。被引入的胺基酸可以具有與它們所替代 的胺基酸相似的極性、親水性、疏水性、鹼性、酸性、中性或電荷。替代地,所述保守取代可以 在之前存在芳香族或脂肪族胺基酸的地方引入另外的芳香族或脂肪族胺基酸。保守的氨 基酸改變是本領域公知的,並且可以根據下表1中所限定的20個主要胺基酸的性質進行 選擇。如果胺基酸具有相似的極性,則這還可以通過參照表2中胺基酸側鏈的親水性大小 (hydropathy scale)來石角定。
[0214] 表1 -胺基酸的化學性質
【權利要求】
1. 一種突變體胞溶素單體,含有SEQ ID N0:2中所示序列的變體,其中所述單體能夠形 成孔並且其中所述變體含有位於SEQ ID NO:2的約44位點到約126位點的區域內的一個 或多個修飾,所述修飾能改變所述單體與多核苷酸相互作用的能力。
2. 根據權利要求1所述的突變體胞溶素單體,其中所述一個或多個修飾(a)改變所述 單體的空間位阻效應,(b)改變所述單體的淨電荷,(c)改變所述單體與所述多核苷酸氫鍵 合的能力,(d)引入或除去通過離域電子體系進行相互作用的化學基團,和/或(e)改 變所述單體的結構。
3. 根據權利要求2所述的突變體胞溶素單體,其中所述一個或多個修飾增加或降低了 淨正電荷。
4. 根據權利要求3所述的突變體胞溶素單體,其中所述淨正電荷通過引入一個或多個 帶正電的胺基酸和/或中和一個或多個負電荷而增加。
5. 根據權利要求4所述的突變體胞溶素單體,其中所述一個或多個負電荷通過用一個 或多個不帶電的胺基酸、非極性胺基酸和/或芳香族胺基酸取代一個或多個帶負電的氨基 酸或者通過在一個或多個帶負電的胺基酸鄰近處引入一個或多個帶正電的胺基酸進行中 和。
6. 根據前述權利要求中任一項所述的突變體胞溶素單體,其中所述變體在SEQ ID NO: 2的以下位點中的一個或多個處含有一個取代:M44, N46, N48, E50, R52, H58, D68, F70, E 71, S74, E76, S78, Y79, S80, H81, S82, E84, E85, S86, Q87, S89, M90, E92, E94, E97, E102, H103, T104, T106, R115, Q117, N119, D121和 D126。
7. 根據權利要求6所述的突變體胞溶素單體,其中經取代而進入所述變體的胺基酸選 自天冬醯胺(N)、絲氨酸(S)、穀氨醯胺(Q)、精氨酸(R)、甘氨酸(G)、酪氨酸(Y)、天冬氨酸 (D)、亮氨酸(L)、賴氨酸(K)或丙氨酸(a)。
8. 根據前述權利要求中任一項所述的突變體胞溶素單體,其中所述變體含有以下突變 中的至少一個: (a) 44位點處的絲氨酸(S); (b) 46位點處的絲氨酸(S); (c) 48位點處的絲氨酸(S); (d) 52位點處的絲氨酸(S); (e) 58位點處的絲氨酸(S); (f) 68位點處的絲氨酸(S); (g) 70位點處的絲氨酸(S); (h) 71位點處的絲氨酸(S); (i) 76位點處的絲氨酸(S); (j) 79位點處的絲氨酸(S); (k) 81位點處的絲氨酸(S); (l) 84位點處的絲氨酸(S),天冬氨酸(D)或穀氨醯胺(Q); (m) 85位點處的絲氨酸(S)或賴氨酸(K); (n) 87位點處的絲氨酸(S); (〇)90位點處的絲氨酸(S); (P) 92位點處的天冬醯胺(N)或穀氨醯胺(Q); (q) 94位點處的絲氨酸(S)或天冬醯胺(N); (r) 97位點處的絲氨酸(S)或天冬醯胺(N); (s) 102位點處的絲氨酸(S); (t) 103位點處的絲氨酸(S); (u) 121位點處的天冬醯胺(N)或絲氨酸(S); (v) 50位點處的絲氨酸(S); (w) 94位點處的天冬醯胺(N)或絲氨酸(S); (x) 97位點處的天冬醯胺(N)或絲氨酸(S); (y) 121位點處的絲氨酸(S)或天冬醯胺(N); (z) 126位點處的天冬醯胺(N)或穀氨醯胺(Q)或甘氨酸(G);和 (aa) 128位點處的絲氨酸(S)或天冬醯胺(N)。
9.根據權利要求8所述的突變體胞溶素單體,其中所述變體含有以下取代: i. E84D和E85K中的一個或多個; ii. E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一個或多個; iii. E92N,E94N,E97N,D121N 和 D126N 中的一個或多個; iv. E92N, E94N, E97N, D121N, D126N 和 E128N 中的一個或多個; v. E76S, E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一個或多個; vi. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E50S 中的一個或多個; vii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E71S 中的一個或多個; viii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E94S 中的一個或多個; ix. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E102S 中的一個或多個; x. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E128S 中的一個或多個; xi. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E135S 中的一個或多個; xii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D68S 中的一個或多個; xiii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D121S 中的一個或多個; xiv. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D134S 中的一個或多個; 或 XV. E84D, E85K和E92Q中的一個或多個; xvi. E84Q, E85K, E92Q, E97S, D126G 和 E135S 中的一個或多個; xvii. E85K, E92Q, E94S, E97S 和 D126G 中的一個或多個; xviii. E76S, E85K, E92Q, E97S 和 D126G 中的一個或多個; xix. E71S, E85K, E92Q, E97S 和 D126G 中的一個或多個; XX. D68S, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxi. E85K, E92Q, E97S 和 D126G 中的一個或多個; xxii. E84Q, E85K, E92Q, E97S, H103S 和 D126G 中的一個或多個; 叉叉1^.£84〇3851(,]\1905392〇,£975和01266中的一個或多個; xxiv. E84Q, Q87S, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxv. E84Q, E85S, E92Q, E97S 和 D126G 中的一個或多個; xxvi. E84S, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxvii. H81S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxviii. Y79S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxix. F70S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxx. H58S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxxi. R52S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxxii. N48S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxxiii. N46S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxxiv. M44S, E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xxxv. E92Q和E97S中的一個或多個; xxxvi. E84Q, E85K, E92Q 和 E97S 中的一個或多個; xxxvii. E84Q和E85K中的一個或多個; xxxviii. E84Q, E85K 和 D126G 中的一個或多個; xxxix. E84Q, E85K, D126G 和 E167A 中的一個或多個; xl. E92Q, E97S和D126G中的一個或多個; xli. E84Q, E85K, E92Q, E97S 和 D126G 中的一個或多個; xlii. E84Q, E85K, E92Q, E97S 和 E167A 中的一個或多個; xliii. E84Q, E85K, E92Q, D126G 和 E167A 中的一個或多個; xliv. E84Q, E85K, E97S, D126G 和 E167A 中的一個或多個; xlv. E84Q, E92Q, E97S, D126G 和 E167A 中的一個或多個; xlvi. E85K, E92Q, E97S, D126G 和 E167A 中的一個或多個; xlvii. E84D, E85K和E92Q中的一個或多個; xlviii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D121S 中的一個或多個; xlix. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D68S 中的一個或多個; I. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E135S 中的一個或多個; li. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E128S 中的一個或多個; lii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E102S 中的一個或多個; liii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E94S 中的一個或多個; liv. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E71S 中的一個或多個; lv. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E50S 中的一個或多個; lvi. E76S, E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一個或多個; lvii.E92N,E94N,E97N,D121N,D126N 和 E128N 中的一個或多個; lviii.E92N,E94N,E97N,D121N 和 D126N 中的一個或多個;或 lix. E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一個或多個。
10.根據權利要求9所述的突變體胞溶素單體,其中所述變體包含i至lix的任一個中 的所有取代。 II. 根據前述權利要求中任一項所述的突變體胞溶素單體,其中所述突變體是經化學 修飾的。
12.根據權利要求11所述的突變體胞溶素單體,其中所述突變體通過下述進行化學修 飾:將分子連接到一個或多個半胱氨酸、將分子連接到一個或多個賴氨酸、將分子連接到一 個或多個非天然胺基酸、表位的酶修飾或末端修飾。
13. 根據權利要求12所述的突變體胞溶素單體,其中所述一個或多個半胱氨酸或一個 或多個非天然胺基酸已通過取代被引入到所述突變體。
14. 根據權利要求12或13所述的突變體胞溶素單體,其中所述分子為(a)能促進含所 述單體的孔和目標分析物、目標核苷酸或目標多核苷酸之間的相互作用的分子適配體,或 (b)多核苷酸結合蛋白。
15. 根據權利要求12至14中任一項所述的突變體胞溶素單體,其中所述連接是通過連 接體而實現。
16. 根據權利要求12至15中任一項所述的突變體胞溶素單體,其中所述分子被連接到 所述變體中的一個或多個位點,所述位點對應於SEQ ID NO: 2的位點1至約位點43和約位 點127至約位點297。
17. -種構造,含有兩個或多個共價連接的源自胞溶素的單體,其中所述單體中的至少 一個為權利要求1-16中任一項限定的突變體胞溶素單體。
18. 根據權利要求17所述的構造,其中所述兩個或多個單體是相同的或不同的。
19. 根據權利要求17或18所述的構造,其中至少一個單體包含SEQ ID NO: 2中所示的 序列。
20. 根據權利要求17至19中任一項所述的構造,其中所述構造包含兩個單體。
21. 根據權利要求17至20中任一項所述的構造,其中所述單體是基因融合的。
22. 根據權利要求17至21中任一項所述的構造,其中所述單體通過連接體而連接。
23. -種多核苷酸,其編碼權利要求1至10中任一項所述的突變體胞溶素單體或權利 要求21所述的構造。
24. -種源自胞溶素的同源寡聚孔,包含足夠數目的權利要求1至10中任一項所述的 突變體胞溶素單體。
25. -種源自胞溶素的異源寡聚孔,包含至少一個權利要求1至10中任一項所述的突 變體胞溶素單體。
26. 根據權利要求25所述的異源寡聚孔,其中所述孔包含至少一個單體,所述單體包 含SEQ ID N0:2中所示序列或其旁系同源物、同源物或變體。
27. 根據權利要求25或26所述的異源寡聚孔,其中所述孔含有(a) -個權利要求1-9 中任一項所述的突變體胞溶素單體,和(b)足夠數目的用以形成所述孔的相同單體,其中 (a)中的突變體單體不同於(b)中的所述相同單體。
28. 根據權利要求25至27中任一項所述的異源寡聚孔,其中所述孔僅包含一個權利要 求1-10中任一項所述的突變體胞溶素單體。
29. 根據權利要求24至28中任一項所述的異源寡聚孔,其中所述突變體胞溶素單體中 的至少一個如權利要求10-15中所述進行化學修飾。
30. -種孔,包含至少一個權利要求17至22中任一項所述的構造。
31. 根據權利要求30所述的孔,其包含(a)權利要求18中所限定的一個構造,和(b) 足夠數目的用以形成所述孔的單體,每個單體包含(i) SEQ ID NO: 2中所示的序列,或(ii) 權利要求1-10中任一項所限定的SEQ ID NO:2的變體。
32. 根據權利要求24-32中任一項所述的孔,其中所述構造中的至少一個如權利要求 11-16中所限定進行化學修飾。
33. -種表徵目標分析物的方法,包括: (a) 使所述目標多核苷酸與權利要求24-32中任一項所述的孔接觸,使得所述目標多 核苷酸移動穿過所述孔;和 (b) 在分析物相對於所述孔移動時獲取一個或多個測量值,其中所述測量值表示所述 目標分析物的一個或多個特徵並由此表徵所述目標分析物。
34. 根據權利要求33所述的方法,其中所述目標分析物為金屬離子、無機鹽、聚合物、 胺基酸、肽、多肽、蛋白質、核苷酸、寡核苷酸、多核苷酸、染料、漂白劑、藥物、診斷劑、消遣性 藥物、爆炸性汙染物或環境汙染物。
35. 根據權利要求34所述的方法,其中所述目標分析物為目標多核苷酸。
36. 根據權利要求35所述的方法,其中步驟(a)包括括使所述目標多核苷酸與所述孔 和多核苷酸結合蛋白接觸,並且所述蛋白控制所述目標多核苷酸穿過所述孔的運動。
37. 根據權利要求35或36所述的方法,其中對所述目標多核苷酸的表徵包括評估所述 目標多核苷酸的序列或測序所述目標多核苷酸。
38. -種形成用於表徵目標多核苷酸的傳感器的方法,包括在權利要求24-32中任一 項所述的孔和多核苷酸結合蛋白之間形成複合體,並由此形成用於表徵所述目標多核苷酸 的傳感器。
39. 根據權利要求38所述的方法,其中所述複合體通過下述而形成:(a)使所述孔和所 述多核苷酸結合蛋白在所述目標多核苷酸的存在下相接觸,和(b)跨所述孔施加電勢。
40. 根據權利要求39所述的方法,其中所述電勢為電壓電勢或化學電勢。
41. 根據權利要求38所述的方法,其中所述複合體通過將所述孔共價連接到所述蛋白 而形成。
42. -種用於表徵目標多核苷酸的傳感器,包含在權利要求24-32中任一項所述的孔 和多核苷酸結合蛋白之間的複合體。
43. 權利要求24-32中任一項所述的孔在表徵目標分析物中的應用。
44. 一種試劑盒,用於表徵目標多核苷酸,所述試劑盒包含(a)權利要求24-32中任一 項所述的孔,和(b)多核苷酸結合蛋白。
45. 根據權利要求44所述的試劑盒,其中所述試劑盒還包含晶片,所述晶片包含兩性 分子層。
46. -種用於表徵樣本中目標多核苷酸的設備,包含(a)多個根據權利要求24-32中任 一項所述的孔,和(b)多個多核苷酸結合蛋白。
47. 根據權利要求46所述的設備,其中所述設備包含: 傳感器裝置,能支撐多個孔並能可操作地使用所述孔和蛋白來實施多核苷酸的表徵; 至少一個存儲器,用於容納實施所述表徵的材料; 流體學系統,配置成從所述至少一個存儲器可控地向所述傳感器裝置供應材料;和 多個容器,用於接收各樣本,所述流體學系統被配置成選擇性地從所述容器向所述傳 感器裝置供應所述樣本。
48. -種提高含SEQ ID NO:2中所述序列的胞溶素單體用於表徵多核苷酸的能力的方 法,包括在SEQ ID NO:2的約44位點到約126位點的區域內進行一個或多個修飾,所述修 飾能改變所述單體與多核苷酸相互作用的能力並且不影響所述單體用於形成孔的能力。
49. 一種製備權利要求17-22中任一項所述構造的方法,包括將至少一個權利要求 1-16中任一項所述的突變體胞溶素單體共價連接到一個或多個源自胞溶素的單體。
50. -種形成權利要求24-32中任一項所述孔的方法,包括使至少一個權利要求卜16 中任一項所述的突變體單體或至少一個權利要求17-22中任一項所述的構造與足夠數目 的權利要求1-16中任一項所述的單體、權利要求17-22中任一項所述的構造或源自胞溶素 的單體進行寡聚,以形成孔。
【文檔編號】C12Q1/00GK104350067SQ201380030527
【公開日】2015年2月11日 申請日期:2013年3月15日 優先權日:2012年4月10日
【發明者】馬克·布魯斯, 詹姆斯·克拉克, 安德魯·海倫, 拉科馬·賈亞辛格, 傑恩·華萊士 申請人:牛津納米孔技術公司