新四季網

使用放大標記的測序方法

2023-05-25 12:05:51

專利名稱:使用放大標記的測序方法
技術領域:
本發明涉及新的測序方法,其中每個鹼基所包含的信息被有效地放大,本發明還涉及特別適於測定長核酸分子之序列的方法,其中綜合了該序列某些部分的序列信息和有關所述部分在整個序列中所處位置的細節,本發明還涉及實施這些方法所用的試劑盒。
自從Watson和Crick於1953年闡明DNA分子的結構以來,遺傳學研究人員一直想尋找快速而經濟的,測定各個DNA分子之序列的方法。Sanger/Barrell和Maxam/Gilbert在1975年至1977年間開發出兩種新的DNA測序法,它們代表著測序技術的主要突破。目前廣泛使用的所有方法都基於Sanger/Barrell的方法,其後23年DNA測序的發展或多或少是對此方法的改進。
然而,1988年,DNA測序技術獲得了全新的關注。由美國牽頭,18個國家共同參與了可能是科學史上最大的單項計劃,即對3×109bp的完整人類基因組進行測序(人類基因組計劃,也稱為HGP),另外還對幾個其它較小基因組進行測序。目前看來,該計劃將在2003年完成。儘管該計劃牽扯到很多的科研人員,並耗費了大量資金,但人們認為該計劃的成果非常重要,足以證明其物有所值。
該計劃的重要部分是開發新的DNA測序法,與目前使用的技術相比,新方法的花費應更加合理,速度應更快。原則上,可將這些方法分成基於凝膠的(主要是Sanger/Barrell方法的新變法)和不基於凝膠的技術。不基於凝膠的技術可能具有更大的潛力,目前正在試驗的一些方法是質譜法,流式細胞術,和使用與小DNA分子雜交的基因晶片。比現行方法好得多的方法對基因研究和現代醫學而言都是一場變革,因為它們可為深入檢測患者基因提供機會,並且在鑑定和開發藥物方面起重要作用。這些方法的經濟效益自然很大。
已證實,使用目前已知的測序技術難以延伸每個測序反應所能讀出的序列長度,目前使用的大多數方法局限於每個測序反應僅讀出約7-800個鹼基對。目前廣泛使用的方法也無法在一個測序反應中對一個以上的序列進行測序。
為了測序多個序列或長序列,一般必需進行很多平行測序反應(例如為了測定長為6萬億個鹼基對的二倍體人類基因組序列,必需進行幾百萬個平行測序反應)。這是很影響測序進程的一個環節,因為工序的總數,酶和試劑的使用,所需獨特引物的數目等經常與需進行的測序反應的數目直接成比例。另外,經常需要耗費人力物力來測定重疊序列。此外,必須進行不同類型的組織工作,例如建立和分選DNA文庫。如果在其它序列中發現可能的靶序列,還必須花費人力物力來分離該靶序列。
為了闡明限制測序反應長度的主要問題,可以將目前使用的和處於開發中的測序方法適當地分成兩大組(也有個別方法不在此分類範圍內,但它們僅為極少數)。第一組方法基於多核苷酸的大小範圍。起點是製備一個或多個多核苷酸序列梯,其中所有分子都具有一個共有的和一個任意的末端。例如,經典的Sanger和Maxam-Gilbert測序方法基於4個序列梯,它們各代表4個鹼基A,C,G和T。
有關可讀的測序反應長度的限制因素是人們必須能區分僅有一個單體差異的多核苷酸。序列梯中的多核苷酸越長,多核苷酸之間的大小相對差異越小。因此,測定分子大小的大多數方法很快就受到限制,此時已不能區分兩個相鄰的多核苷酸。
另一組方法基於不同的原理。通過鑑定靶分子中存在的序列短片段,可利用序列片段之間的重疊重構靶序列。
因此,在很多測序方法中,將靶分子裂解成較小的片段,推定每個片段的組成,通過發現重疊序列來組建原始序列。例如,已產生了具有65,536個地址的微列陣,其中每個地址含有獨特的八聚體。因此覆蓋了所有的八聚體排列(48=65,536)。隨後,如果用螢光標記靶分子,並使靶分子與八聚體雜交,通過登記已被螢光標記的地址,即可得到有關靶序列中存在何種序列片段的信息。
有關可讀的測序反應長度的重要限制因素是下列組合問題。為了能夠重構靶序列,所進行的測序反應越長,序列片段也應越長。然而,需檢測的排列數目隨待鑑定序列片段的長度的增加而呈指數增加。這樣就相應地增加了對微列陣上獨特地址的需求。
微列陣的另一種用途是通過例如篩選群體中的基因突變來重新測序已知的序列。為此,需要為已知序列調整寡核苷酸,以使所需的地址數減少,待鑑定的序列片段的長度增加。然而,設計特殊用途的微列陣需要耗費很多人力物力財力,目前,僅有少數DNA序列有微列陣。由於人類基因組大約由100-140,000個基因組成,所以按照這種方式大規模地對人類基因組進行測序需要耗費很多人力物力。
使用微列陣的另一個缺點是現行作圖技術(如照相平板印刷術)的限制使得無法產生小於約10×10微米的像素。因此,僅利用了螢光掃描儀的部分分辨能力。目前使用的螢光掃描僅能夠區分0.1×0.1微米的像素,這意味著微列陣能包含的信息可比目前所含的多10,000倍。
因此,開發能避免上述組合問題的,鑑定長序列片段的新方法/原理是有利的。類似地,開發能測序長的靶序列,而不會使需鑑定的序列片段的長度隨靶序列長度的增加而呈指數增加的新方法/原理也是有利的。
另一種基於鑑定序列片段的測序方法(例如美國專利申請號5,714,330所述的方法)包括將片段化的靶DNA廣泛分布於閱讀平板中。隨後,處理靶DNA以使螢光信號固定於靶DNA上,所述螢光信號代表最初的一個或幾個鹼基對。讀出每個位置處的螢光信號,然後對靶DNA中的後續鹼基對重複上述處理過程。當DNA分子在閱讀平板上具有固定的位置時,通過運行幾輪循環就可以用序列信息作圖較長的片段。
由於所需獨特螢光信號的數目隨鹼基對數目的增加而呈指數增加,因此在每輪循環中讀出多個鹼基對的能力受到限制。為了讀出一個鹼基對,需要4種顏色,兩個鹼基對需要16種顏色,3個需要64種顏色等。不能確定現行的技術是否能區分64種不同的螢光顏色。無論如何,隨著多種顏色的使用,所需閱讀時間和花費也會大大增加。解決問題的辦法是進行很多輪循環。這反過來意味著酶促步驟和螢光讀數次數的增加。
即使可以用上述策略鑑定相對較長的序列片段,在重構過程中也會遇到重要的問題。生物DNA在其組成上非常有序。在「宏觀的」和「顯微的」水平上,短的和長的序列經常在多處重複。重構具有重複DNA序列的區域是非常困難的。這些經常具有生物學意義,例如三核苷酸「重複」的長度。
目前,已開發出能克服上述問題的新方法。人們驚奇地發現如果獲得與位置信息(即某序列在靶序列中的位置信息)相關聯的序列信息,即可精確地鑑定長序列。另外,本發明提供了新的測序方法,所述方法可以與或不與位置信息一起使用,在所述方法中,與一個或多個鹼基相關聯的信號被擴增,本文稱之為放大。
因此,根據第一方面,本發明提供了測序靶核酸分子的全部或部分的方法,所述方法至少包括下列步驟a)測定所述核酸分子的一部分的序列;b)測定所述部分在所述核酸分子內的位置;和c)組合步驟a)和b)中獲得的信息以得到所述分子的序列。
可以方便地測定多個部分的序列和位置,並將這些信息組合在一起。
本文所用的靶核酸分子指任何天然或合成的多核苷酸分子,例如DNA(如基因組DNA或cDNA),RNA(如mRNA),PNA及它們的類似物,適當時,它們可以是單鏈,雙鏈或三鏈。待測序的部分優選含有完整靶分子,但可以例如小於完整的分子,如為4個鹼基至1kb,如為4至100個鹼基。
優選被測序的部分具有4個或更多個鹼基,和/或以小於1kb的準確度(即分辨能力小於1kb)測定所述部分在所述靶分子中的位置,特別優選準確度小於100個鹼基,尤其優選小於10個鹼基。當分辨能力為幾kb或更高時,通常不需要得到通過本文所述的方法可容易地獲得的,長於8-10個鹼基之片段的序列信息。
可以任何合適的方式得到序列信息,可以適當地獲得一個或多個鹼基,特別優選2個或多個鹼基,如2個至20個鹼基,合適地為4個至10個鹼基的序列信息。應懂得,依賴於將序列部分安置於靶分子內的上述測序技術很有必要保留位置信息,可以同時或分開評估所述位置信息與序列信息。下文將描述多種適當的技術。
類似地,可以用多種合適的方法獲得位置信息,下文中將描述這些方法。
如上所述,在本發明的此方面,得到的序列信息必須與該序列在靶序列中的位置信息相關聯。通過多種方法可以達到此目的,例如通過測序核酸分子的末端或內部區域,參照位置指示物確定其位置,所述位置指示物可以是例如分子的大小(如長度或體積),所產生信號的強度或與位置標記或錨的距離。通過進行一輪或多輪測序反應循環即可得到序列信息。
如上所述,測序長分子的一個困難是當分子變得更長時,區分僅有單個鹼基差異的不同分子的相對大小將會變得更加困難。在一個實施方案中,本發明通過「放大」分子之間大小,強度,長度或信號的差異而克服了這一特殊的難題。因此,在優選的方面,本發明提供了測序靶核酸分子的全部或部分序列的方法,其中每輪測序循環測序2個或多個鹼基(例如3個或多個,優選4個或多個鹼基),和/或與每個鹼基相關聯的信號被放大。
本文所用的測序「循環」指的是實施一系列導致終產物的步驟,所述終產物經處理,例如通過產生或讀出終產物信號即可得到序列信息。優選地,在本文所述的放大和測序反應中,需進行一輪以上的循環,例如2或更多輪循環,特別優選進行4輪以上的循環,例如10輪循環。
「放大」與鹼基相關聯的信號指的是增強與單個鹼基相關聯的信號,或增強歸因於單個鹼基的信號。例如,它可以是大小(其中信號是鹼基的大小)的增加,或者是新信號的產生,例如在該鹼基上添加或結合標記(label)或其它能產生信號的工具(means)。
增加待鑑定的序列部分的長度可以補償大小測定的低精確性。因此,在使用目前尚不夠精確的大小測定方法,如流式細胞計量術,DNA伸展等的同時,可以利用質譜分析法,凝膠分選和類似的方法的潛力。
可以用多種方法放大分子之間的差異。首先,每輪循環對幾個鹼基(如4個或更多個)進行測序,使所得分子的長度有2個或多個鹼基的差異,從而能在測序梯中被辨別,所述序列梯同時能提供位置信息(例見實施例17)。或者,可以放大每個鹼基所包含的信息,從而使辨別變得更加容易。下文將描述這些不同技術的例子。
可通過任何合適的技術在每輪循環對幾個鹼基(如4個)進行測序。在依賴於位置信息的測序方法中,可以使用任何技術,只要所得序列信息反過來與鹼基在靶分子中的位置相關即可。例如,在這種情況下,可以利用與互補探針(如承載於固體支持物上的互補探針)的雜交,其中與靶分子結合的探針的鑑定特徵可以指示靶分子的末端序列。例如,可以使用承載有與所有2-鹼基排列互補的探針,即承載有16種不同探針的固體支持物。類似地,可將與所有4-鹼基排列互補的探針,即256種不同的探針結合於固體支持物上以捕獲具有互補序列的靶分子。
在例舉的方法中,末端不是AAAA的所有靶分子(此時探針的末端為TTTT)都不會結合,因此可以被除去。類似地,在其它地址處,具有特定末端序列的靶分子會選擇性地結合。靶分子可以是雙鏈(具有單鏈突出端)或單鏈,以分別在末端或內部結合和鑑定序列。如果將PNA用作互補探針,由於該分子能結合雙鏈形式,因而也可以結合雙鏈形式的內部序列。本文將這種技術籠統地稱為基於一個或幾個末端鹼基對的分選,可以在一輪或多輪循環中進行該項技術。該技術可以與本文所述的其它技術聯合使用。
與上述技術相反,也可以通過將單鏈靶DNA固定於固體底物上來進行測序。然後可以將靶DNA與例如16-片段銜接子混合和雜交。銜接子將在下文中描述,但一般指的是能將靶序列銜接為信號-增強或放大的靶序列的分子。然後從溶液中洗去未雜交的銜接子。僅留下具有與單鏈DNA互補之突出端的銜接子。藉助於例如本文所述的分析方法,人們可以測定何種銜接子保留在溶液中,繼而可以確定DNA中含有哪些16個鹼基對的序列片段。
當該測序技術與位置信息聯合被實施時,或者當其僅僅被用作測序技術時,它可以代表本發明的優選特徵。在此方法中,通過例如擴增單個鹼基或用能產生信號的放大標記物(tag)取代或增強該鹼基,可以放大該鹼基攜有的信息(在某些情況下,本文所稱的放大也被稱為「轉變」)。
通過一次或多次擴增,如雙倍增加靶分子或其含有待測序部分的部分即可放大靶核酸分子。應懂得,檢測例如10和11個鹼基的分子之間的差異比檢測320和352個鹼基(擴增了5倍)的放大分子之間的差異更加困難。因此,可以使用雙倍增加的原理以改良大多數的DNA分析方法。實施例11中描述了一個能達到此目的的適當技術。也可以使用其它適當的技術。
因此,該方法可用於改良大多數基於檢測核酸分子之間的大小差異的方法,例如基於凝膠或不基於凝膠的技術。該策略也可以利用不能足夠敏感地區分幾個鹼基對的差異的技術來分析核酸物質。例如,改良的Maxam-Gilbert方法是可以的,其中單鏈核酸分子(如具有5』-生物素)與攜有鏈黴親和素的平板結合。然後進行測序,洗平板,使所得核酸分子倍增,例如增加10倍,導致1024個鹼基對的步驟。通過下文所述分析技術中的一種可以測定這些長度。
因此,從另一個方面看,本發明提供了按本文所述測序靶分子全部或部分的方法,其中與每個鹼基(或一個以上的鹼基)相關聯的信號通過所述鹼基在所述序列中出現次數的增加而被放大。
本文所用的歸因於特定鹼基(或一個以上的鹼基)的「信號」指的是直接或間接利用特性來檢測所述鹼基(或鹼基集合)的可能性。因此,信號指的是可以直接或間接被檢測的,或者可通過使所述鹼基與一種或多種能直接或間接產生信號的其它分子(如標記組分)結合而被檢測的鹼基特性,例如鹼基的大小,電荷或空間構型。因此,本發明提供能直接被檢測的信號,或者提供能產生信號的信號產生工具。信號可以對一個以上的鹼基是獨特的,即信號可以指示或代表一對鹼基,例如可以使用針對AA的信號,該信號不同於針對AT等的信號。下文將詳細描述結合所述分子的不同機理和所產生的信號。
進一步優選的放大技術包括使一種或多種獨特的信號(或產生所述信號的物質)與序列中的一個或多個鹼基相關聯。當所述信號與一個以上的鹼基相關聯時,使用一系列各自對應於一個或多個鹼基的信號(或產生信號的工具)或獨特於兩個或多個鹼基的單個信號(或產生信號的工具)即可達到上述目的。可以方便地使放大標記物攜有這些信號,所述標記物可以通過銜接分子與序列結合。本文所用的「相關聯」指的是用所述信號(或產生信號的工具)取代所述鹼基(或一個以上的鹼基),或者在所述鹼基(或一個以上的鹼基)上添加所述信號(或產生信號的工具)以使它們共存。信號(或產生信號的工具)不必直接結合(或特異性取代)與之相關聯的鹼基(或一個以上的鹼基),結合可以是間接的,例如通過一種或多種其它分子的中介作用而結合。可以通過任何適當的化學相互作用,如疏水的,離子的,共價的相互作用等來進行結合,但優選通過與靶核酸分子或相關分子的共價相互作用進行結合。
本文所用的「相應的」指的是鹼基和信號之間的關係,例如,所述信號可由放大標記物提供,並可被讀成特定鹼基存在的指示物。或者,在作圖過程的上下文中,「相應的」指的是核酸酶和信號之間的關係,所述信號可用作標誌(marker),指示被所述核酸酶裂解。
本文所用的「放大標記物」是單個分子,或是含有標記物部分的分子複合物,所述標記物部分可提供產生一種或多種信號的工具,例如攜有標記(label)或可結合標記(label)的位點。當需要除序列信息以外的信息時,可以摻入能產生一種或多種信號的工具,以作為與靶分子或所用裂解方法相關之信息的指示物。例如,當放大標記物是多核苷酸時,它本身可以攜有另一個與一個或多個核苷酸鹼基特異性相關連的部分。在這種情況下,可以認為標記物另外還含有如本文所述的銜接子。或者,放大標記物可以結合,或含有用於結合銜接子的工具,所述銜接子能與靶序列結合。
下文一般性描述了上述方法的例子。靶核酸物質中的鹼基對與4種不同的標記物(下文稱之為放大標記物)相關連,所述標記物分別代表4種鹼基,即腺嘌呤,胞嘧啶,鳥嘌呤和胸腺嘧啶。因此,當存在A-T鹼基對時,「放大標記物A」與之相連,C-G與「放大標記物C」相連,以此類推。當原始鹼基順序,如ACGTT被「放大標記物A」-「放大標記物C」-「放大標記物G」等放大時,就產生了新的DNA分子。每种放大標記物都提供了一種產生信號的工具,在優選的特徵中,所述標記物是多核苷酸分子。此時,根據需求,4種標記物的長度可以有2個鹼基對至幾百個kbp(或必要時為更多個鹼基對)的差異。相應地,DNA片段可含有報導基因和其它生物學信息,或者僅由生物學功能未知的序列組成。
可以使用任何合適的放大標記物,當然,為了測序的目的,必須存在至少4種針對每個鹼基的獨特的標記物。當然,所用標記物取決於測序技術,當進行測序時,所用標記物取決於提取位置信息所用的方法。
可以用多種其它形式提供標記物。標記物通過產生獨特信號可直接或間接進行檢測,即標記物含有一種或多種能產生信號的工具。螢光,輻射,磁性,順磁性,電荷,大小和體積是特性的例子,可以使放大標記物顆粒配備有這些特性,從而能檢測它們並將它們互相區分開。這些特性可以存在於放大標記物上的一種或多種標記上,可以直接或間接檢測其發出的信號。適當的標記是那些能夠直接或間接被檢測和/或通過產生信號使放大標記物直接或間接被測定的標記。所述標記包括例如放射性標記,化學標記物(例如EtBr,TOTO,YOYO和其它染料),生色團或螢光團(例如染料,如螢光素和羅丹明),或高電子密度的試劑,如鐵蛋白,血藍蛋白或膠體金。或者,標記可以是酶,例如過氧化物酶或鹼性磷酸酶,其中可以通過酶與適當實體,例如底物的相互作用來觀察酶的存在。標記物也可以構成能產生信號的配對物的一部分,其中可以在很靠近的位置導入所述配對物的另一成員,例如,可以使用螢光化合物和淬滅螢光底物。
也可以在不同的實體上提供標記,所述實體如抗體,該抗體能識別放大標記物的至少一個區域,如放大標記物的肽組分。如果放大標記物是多核苷酸,導入標記物的一種方法是例如結合適當的攜有標記的結合配對物,例如經螢光標記的探針或與DNA結合蛋白。因此,標記物也可以攜有能結合標記物的分子,或者憑藉其序列其自身就是這種分子。標記可以作為單個分子或者以微粒,納米顆粒,脂質體或其它適當形式的載體形式被結合。
在優選的方面,放大標記物自身是核酸序列,其長度至少為2個鹼基,例如30至1000個鹼基,優選6至100個鹼基,尤其優選10至30個鹼基。通過例如使用能產生一種或多種信號的螢光探針,蛋白質和與這些序列互補的序列,可在這些序列上結合一種或多種標記。或者,蛋白質分子可含有標記物,或者與標記物結合,或者能被免疫試劑或另一種適當的結合配對物,如DNADNA-結合蛋白識別。也可以檢查這種標記物分子的其它特性,例如裂解模式(被限制性酶或蛋白酶裂解的模式),電荷,大小,形狀等。
憑藉其可用於產生信號的序列,放大標記物也可含有信息。因此,另一種策略是產生含有報導基因,順式-調節元件等的鏈。然後將所述鏈轉染/轉化至細胞中,在該細胞中,報導基因或順式-調節元件的組分被轉變為一種或幾種信號。儘管該技術需要轉化/轉染步驟,但細胞可以按程序進行完整的測序反應,包括轉變步驟(即添加放大標記物)。例如,可使用表達螢光蛋白或能被螢光標記的膜-蛋白的基因,表達抗生素抗性的基因等,產生大量的,含所有組分的信號。除了隨時間的變化和其它特性外,還可以探察信號的質,量和位置以顯示序列中特定鹼基的存在。
在這些方法中使用單細胞(solitary cell)較方便,但也可以使用多細胞生物或結構。非-存活的細胞等同物也可用於產生標記或信號,例如可使用納米技術達到此目的。適當時,利用不同的啟動子可以使產生的信號針對不同的鑑定位置。實施例18將用例子說明該技術是如何進行的。
如上所述,可以方便地使用特異於每種核苷酸鹼基的4种放大標記物,但適當時,可以使用能用於產生一種以上鹼基所特有之信號的放大標記物。因此,例如,對於可使用16種不同螢光團的閱讀方法而言,可以適當地使用16種不同的標記物,所述標記物可用於產生16種不同的信號,所述信號代表了2個鹼基對的所有排列。
在其它情況下,可以適當地使用少於4種的不同標記物。例如,僅使用兩种放大標記物,其中一種用於A/T,而另一種用於C/G。另一種可替代的方法是使用少於4種的獨特信號事件,以產生4种放大標記物,所述放大標記物利用所述信號事件的特定組合可以產生4種獨特的信號(當各個鹼基被標記時)。例如,測序信息可被轉變為二進位系統。在此系統中,腺嘌呤被轉變為一系列信號事件「0」+「0」,胞嘧啶被轉變為「0」+「1」,鳥嘌呤被轉變為「1」+「0」,胸腺嘧啶被轉變為「1」+「1」。原則上,這足以出現一種或可能是兩種顏色或獨特的信號,從而能讀出測序信息。因為此時讀數比使用數種信號時更快,這反過來意味著可以同時使用花費較少的螢光掃描儀。本發明優選的方面是使用單個能產生信號的工具,在空間上按一定的方式排布所述工具,使其能提供至少4種獨特的放大標記物,例如可產生二進位類型的讀數,也即所述信號含有由單個信號事件組成的模式,所述信號事件能在所述放大標記物上產生獨特的信號。此時,信號事件指的是可測信號,例如由單個分子或其它這類標記發出的螢光。當使用多种放大標記物,優選20至100種標記物時,優選使這些標記物線性相連例如成為較長的DNA片段,以使必要時能保存位置信息。
連接標記物(儘管不必直接相連,例如可以通過銜接子來連接)與它所代表的鹼基(或一個以上的鹼基)依賴於利用例如鹼基-鹼基互補性的特異性鹼基識別。然而,本文所述的互補性包括Watson-Crick鹼基-配對中的核苷酸配對,還包括核苷類似物的配對,所述類似物包括例如能與靶核酸分子中的鹼基特異性雜交的脫氧肌苷,和能導致這種特異性雜交的其它類似物,如PNA,RNA,DNA及其類似物。
因此,可以使用例如由DNA,RNA或PNA序列或其雜合體組成的探針,例如長度為4至20個鹼基,優選6至12個鹼基的寡核苷酸,所述寡核苷酸能與靶分子(其中存在互補序列)的特定區域結合,並且能與放大標記物,或一系列標記物結合,其中每種標記物代表一種或多種與該探針結合的核苷酸鹼基。此時,探針可作為銜接分子便於標記物與靶序列的結合。或者,可以使用簡併探針的混合物,所述探針僅在特定位置處具有一個或多個特定的不變鹼基,例如NNNNAA。優選出現的放大標記物的數目對應於它們所附著並已經結合的探針的特定鹼基數目。然而,如果獨特的標記物是為2個或多個鹼基排列準備的,相應地,只需要較少的標記物。
可使用該技術鑑定靶分子的不連續部分,或者得到完整或基本上完整的靶分子序列。
然而,另一種更好的測序方法是產生鄰接的放大標記物鏈,讀出該鏈發出的信號即可得到序列。儘管其它方法也可以達到這種效果,但最方便的技術包括將放大標記物插入靶分子。尤其優選循環進行該反應,以造成轉變,隨後讀出一系列鹼基的序列。
為了將放大標記物插入與待放大的鹼基(或一個以上的鹼基)相關聯的靶分子,必須使用與該鹼基(或一個以上的鹼基)和周圍鹼基的互補性,或者使用對這些鹼基的識別。這種互補性可用於直接導入放大標記物,或用於啟動最終能導入與該鹼基相對應之標記物的過程(見實施例4)。
通過在能與放大標記物連接的靶核酸分子中產生突出端(即單鏈區域)即可方便地達到上述目的。(然而,當標記物分子或其介體,例如其銜接子可以識別並結合雙鏈形式,例如為PNA時,不必要產生所述突出端)。一種方法是連接靶分子的末端與短DNA分子,所述DNA分子含有限制性酶的結合位點,所述酶能在其自身識別序列的外部進行裂解,例如IP或IIS類限制性酶。這些酶未表現出對已切割序列的特異性,因此,它們能產生所有鹼基類型的突出端。設置結合位點,使得當實際的靶分子(如DNA)與所述限制性酶保溫時,DNA分子的內部會形成突出端。實踐中,可優選能產生3-4個鹼基對長的突出端的酶(見實施例19,其中顯示了在靶分子上產生這種突出端的一般方法,所述靶分子已被擴增並結合至固體支持物上)。
已鑑定出超過70種IIS類限制性內切核酸酶,它們的底物特異性和裂解模式都有很大的不同。另外,已證實這些酶能較好地適用於「組件交換」實驗,使得人們能生產出新的能滿足特定需求的酶(Huang-B等,蛋白質化學雜誌,1996,15(5)481-9,Bickle,T.A;1993,核酸酶(第2版),Kim-YG等,PNAS 1994,91883-887)。因此,根據本文所述的原理,可以使用這些酶的很多種組合和變體。
IIS類限制性內切核酸酶已被用於幾種不同的目的。例如,可用作能在幾乎任何預定位點裂解單鏈底物的通用限制性內切核酸酶(Podhajska,A.J.,Szybalski,W;基因1985,40175-182,Podhajska,A.J.,Kim,S.C.,Szybalski,W;酶學方法;1992,216303-309,Szybalski,W;基因1985,40169-173)。
在測序中,它們已被用於先前所述的美國專利申請5,714,330中所述的方法。然而,在這些方法中,未考慮導入多種與靶分子保持連接的放大標記物。
用IIS酶裂解會產生多種長度的突出端,例如長度為從-5至+6鹼基的突出端。一旦產生了突出端,可使放大標記物與該突出端結合,所述放大標記物可以由銜接子攜帶,它對應於突出端中的一個或多個鹼基。
下文將描述多種不同的方法,其中可使用IIS系統或類似的系統摻入放大標記物。
首先描述的技術涉及使用銜接子,該銜接子攜有一種或多种放大標記物,並具有與靶核酸分子互補的突出端,所述靶核酸分子已通過修飾產生了單鏈區域,即突出端。銜接子自身也攜有另一種IIS酶的識別位點,這種IIS酶可以與用於產生突出端的酶相同或不同。實施例1中闡明了該技術的例子。
簡單地說,將靶序列連接至載體中,所述載體本身攜有與插入點鄰近的IIS位點,或者對靶序列進行基因工程改造以使其含有該位點。然後使用適當的IIS酶裂解IIS位點,當IIS位點放置的位置合適時,即可在靶序列中產生突出端。在一個實施方案中,通過使用與IIS鄰近的另一個限制性酶位點,使切割載體的至少一個末端成為平端。
然後可以使用適當的銜接子結合併從而放大突出端的一個或多個鹼基。當進行單個鹼基放大時,可以分別使用具有針對4鹼基突出端ANNN,TNNN,CNNN和GNNN的單鏈部分的簡併銜接子和放大標記物A,T,C和G。或者,銜接子可攜有一個以上的放大標記物,它們對應於一個以上的所述突出端鹼基,例如具有ATGC突出端,適當時,針對一個或多個所述鹼基的相應放大標記物以線性方式結合。
一旦銜接子的突出端和經裂解的載體已被雜交,即可連接這些分子。當獲得沿著整個突出端的完全互補性,並且該互補性有助於該反應的特異性時,才能達到上述目的。然後進行平端連接以使銜接子的另一端與載體相連。通過適當放置與先前使用的酶相同或不同的另一個IIS位點(或另一個適當的限制性酶位點),即可進行裂解以在靶序列中,第一個銜接子所針對的序列的下遊產生突出端。通過這種方法,相鄰的或重疊的序列可被連續轉變為攜有放大標記物的序列,隨後,可通過下文所述的方法讀出放大標記物發出的信號以測定該序列。測序重疊序列可以有效地校對先前的循環中讀出的序列,從而驗證序列。
實施例2中顯示了對此技術的少許改動,其中不產生平端,取而代之的是,一旦產生載體,並用IIS或類似的酶裂解之後,即可使用另一種限制性酶,該酶所產生的突出端與載體中所插入的所有銜接子的末端均可互補。類似地,這也可以將銜接子,繼而將放大標記物連接至載體中。
實施例3中闡明了類似的但更詳細的例子。此時,產生了對應於一段鄰接的DNA序列的非-互補突出端。它們都與已結合了適當放大標記物的銜接子雜交。僅有一種銜接子含有下一輪循環所用的限制性酶位點,使得測序只能單向進行。顯然,為了結合具有這些不同特性的銜接子,鄰接DNA序列的突出端必須是可區分的,例如長度有所不同。通過使用能導致不同突出端長度的不同限制性酶即可達到此目的。有意使兩種不同類型的銜接子的末端互補,從而使它們能夠雜交並連接形成載體。適當放置銜接子中的限制性位點,以使該裂解位點也被轉移到靶序列中,從而測序相鄰的位點。
因此,例如,如果產生了5+4的突出端,該裂解位點的4個鹼基被轉移至靶序列中,當接下去的9個鹼基被轉變為突出端,並且隨後與放大標記物相連時,在先前的循環中,這些鹼基中的5個已與放大標記物相連。當讀出序列時,即可驗證前5個鹼基的鑑定特徵,因此導入了校對機制。
使用IIS系統的其它技術包括使用DNA聚合酶的Klenow片段,並依賴於以下事實,即大多數DNA連接酶不能連接不同大小的突出端。例如,實施例5中顯示了這一點。在該技術中,產生的突出端長於銜接子的突出端。在一種類型的核苷酸存在下,通過Klenow減少(reduce)靶突出端。僅有已用一個鹼基適當延伸的靶能結合銜接子,從而鑑定出利用該銜接子結合的相應放大標記物而導入的鹼基。
實施例4-7中闡明的其它技術包括使攜有放大標記物的銜接子與單鏈靶雜交,然後使所述銜接子與所述靶連接。再將銜接子用作聚合酶延伸反應的引物以形成雙鏈分子。另一種可替代的方法是使用分選銜接子(此時不必要與放大標記物相連,可簡單地用於分選),其中銜接子與固體支持物結合,所述支持物具有的突出端超過靶分子上所產生的突出端。因此,例如,銜接子可具有8-10個鹼基長的突出端。如果(雙鏈形式的)DNA片段具有4-鹼基突出端,僅當鹼基與突出端最裡面的鹼基一一互補時,這些分子才能連接。然後進行聚合酶延伸。成功的聚合酶延伸反應的先決條件是銜接子突出端的其餘部分與DNA片段互補,使得它可用作引物。在此方法中,聚合酶延伸僅當靶分子的末端序列與銜接子突出端互補時才會發生。
或者,僅使用雜交,可將與相鄰的多段序列相連的放大標記物方便地連接在一起。
另一種可替代的方法依賴於代謝酶對其識別位點的特異性。在使用限制性酶的實施例中闡明了該技術。然而,也可以使用多種其它的酶,例如轉座酶等。在此方法中,待測序的靶分子用4種不同的標準限制性酶裂解以產生平端並連接至4種不同的DNA分子上,每種DNA分子的末端具有4種不同限制性酶之一(其通過裂解能產生突出端)的部分限制性位點。然後將它們連接至靶分子上。當靶分子末端的鹼基能提供限制性位點的其餘鹼基時,會產生限制性識別位點。通過用該限制性酶裂解可以確定所述位點。只有具有完整形式的識別位點的那些分子才能被裂解。為了識別已被裂解的那些分子,可以使用與所述突出端互補的銜接子。然後,這些銜接子可攜有一種或多種適當的放大標記物,這取決於靶分子提供的用於完成限制性位點的鹼基數目。然後使分子環化以重複循環。適當時,銜接子的序列內可具有能產生平端和突出端的限制性酶的,被適當放置的限制性位點,使得通過導入對應於鄰接的或重疊的靶序列區域的放大標記物,而重複進行循環。
因此,本發明的一個方面涉及鑑定靶核酸分子的一部分的方法,其中銜接分子結合或取代所述部分,所述銜接分子含有能識別和結合所述部分的組分和含一種或多种放大標記物的組分,優選代表所述部分中的鹼基的所述標記物鏈。
因此,從優選的方面看,本發明提供了放大靶核酸分子全部或部分序列的方法,其中一種或多种放大標記物與該靶序列中的一個或多個鹼基相關聯,其中所述標記物對應於所述靶序列中的一個或多個鹼基。優選所述放大標記物合在一起對應於至少兩個,優選至少4個鹼基。優選所述放大標記物各對應於至少兩個,優選至少4個鹼基。在另一個實施方案中,每個放大標記物對應於1個鹼基,可使用合在一起對應於至少4個鹼基,例如,8至20個鹼基的放大標記物鏈。例如,通過進行多輪循環,每輪循環添加單個放大標記物,或者通過使用在單輪循環中相連的標記物鏈即可達到上述目的。
優選所述方法至少包括下列步驟a)將所述靶序列的至少一部分轉變為適於結合銜接分子的形式,優選轉變為單鏈形式;b)使步驟a)產生的,適於結合銜接分子的所述區域的至少一部分,優選所述單鏈區域與銜接分子結合,所述銜接分子含有一種或多种放大標記物,或含有能結合一種或多种放大標記物的工具,所述標記物對應於所述靶序列的一個或多個鹼基,優選對應於適於結合所述銜接分子的所述區域中的一個或多個鹼基,所述區域優選所述單鏈區域,所述銜接分子與所述區域結合,或與所述區域鄰近;c)任選連接所述靶分子與所述銜接分子,使得至少所述放大標記物能與所述靶分子保持相連;d)任選重複步驟a),其中所產生的適於結合所述銜接子的所述區域,優選所述單鏈區域包括一個或多個不與根據步驟b)的放大標記物相連的鹼基;e)任選重複步驟b)至d),所述銜接分子結合所述靶分子中與先前循環中銜接分子結合區相鄰或重疊的區域。
在一些技術中,例如,當通過聯合使用放大和分選進行測序時,步驟e)可以省略,使得僅進行一輪放大循環。
僅當靶分子的形式不合適時,才需要「轉變」成適於結合銜接分子的形式。因此,結合PNA分子時,不必要使雙鏈靶分子轉變。類似地,如果分子是單鏈,為了結合寡核苷酸形式的銜接子,也不必要進行轉變。然而,在一些情況下,需要進行轉變,例如通過解鏈DNA片段來轉變,以便特異性地和選擇性地結合銜接子。不必要將整個分子都轉變為另一種形式,適當時,僅需要轉變其中的一部分。該部分應至少含有銜接子結合部分的長度,因此,優選其長度為4至500個鹼基,例如6至30個鹼基。本文中提及一種形式至另一種形式的轉變不應與提及放大時所用的轉變一詞相混淆。
本文所用的「銜接分子」是銜接靶序列與信號-增強或放大的靶序列的分子。本文所用的銜接分子是單鏈分子,或相同或不同類型的分子的複合物。銜接序列含有與所述靶序列結合的結合組分,例如識別特定鹼基序列的蛋白質,或更優選與靶序列中一個或多個鹼基互補的多核苷酸序列。優選結合序列的長度為3至30個鹼基,優選4至10個鹼基。銜接分子另外還可含有一種或多种放大標記物或結合所述標記物的工具,例如互補序列或結合配對物的序列。
優選銜接子含有一個或核酸酶識別位點,尤其優選含有能在其識別位點的外部進行裂解的核酸酶的限制性位點(或至少識別位點),尤其優選含有IIS酶或其類似物,特別是FokI和本文所述的其它酶的限制性位點。優選其它限制性酶的位點不在銜接子中。
銜接分子只含有符合下列要求的核酸分子較為合適,即在所述核酸分子中,銜接子的多種特性由銜接子的不同區域提供。然而,如上所述,放大標記物可採取多種形式,包括諸如蛋白質等標記。因此,除了提供與靶結合的區域外,銜接子還可提供能與放大標記物結合的分子,例如提供適當的結合配對物。
在步驟c)中,提到「至少」所述放大標記物保持相連。因此,可以設想,能除去銜接子或其部分。
本文所用的放大標記物「鏈」指的是在放大循環之前就已經相連並與一個銜接子結合,或者在每輪循環結束時連接在一起的標記物,或者它們的組合。可以通過任何適當的方法進行連接,但優選通過共價方式結合。
優選在本發明的測序方法中使用上述方法,所述方法包括上述步驟,還包括通過鑑定由所述靶序列所結合的放大標記物產生的信號,來測定所述靶分子的序列。為了鑑定放大標記物,這些放大標記物必須能產生可讀信號。放大標記物可以固有地存在信號,例如當標記物攜有具有某種特性的標記(如放射性標記)時,或者需要其它步驟使放大標記物產生信號,例如添加其它分子(如攜有標記的結合配對物本身),或者將放大標記物處理成可讀形式(例如通過表達報導基因轉變為可讀信號,其中被讀的信號是表達的蛋白質)。
因此,在優選的方面,本發明提供了測序靶核酸分子的全部或部分的方法,其中所述靶核酸分子的至少一部分序列被放大,優選使用與靶序列中的一個或多個鹼基相關聯的一種或多种放大標記物進行放大,其中所述經放大的序列任選被轉變為可讀信號,通過評估產生的信號來測定所述序列。
本文所用的「評估」指的是可在絕對或相對意義上進行測定的定性和定量評估。
可以用化學方法,或使用適當的天然連接酶或其變體進行連接。儘管連接僅表示本發明的優選特徵,但可以便利地使用連接來增加特異性。與雜交相比,如果連接基於T4 DNA連接酶,特異性將會增加到10倍。這一點很重要,因為在很多情況下,基於雜交的測序方法與不能被人接受的高錯誤率相關。另外,通過使用熱穩定的連接酶,例如Pfu,Taq和TTH DNA連接酶,能改善特異性,同時使效力顯著增加,從而使得保溫時間縮短。
這種使用放大標記物的測序方法能提供很多優於已知測序方法的好處。在每輪循環中可以轉變或放大一個以上的鹼基,從而減少了測序特定長度的靶分子所需的循環數。根據所選擇的放大標記物和它們產生的信號,可以產生簡單化的讀數信號,例如信號可以是二進位的讀數形式,即通過適當的組合產生單個信號的事件(如螢光)的線性或位置安排,產生針對一個或多個鹼基的獨特信號。這樣可以減少所需的產生獨特信號之事件的數目。因此,例如,無需為每個2鹼基組合準備16種不同的標記,或者為每個3鹼基組合準備64種不同的標記,在本發明中,通過在每种放大標記物上提供產生單個信號事件的工具模式,例如提供結合螢光探針的位點模式,即可產生16或64或更多種獨特的信號。
信號信息可被密集包裝。標記物並不僅僅局限於經標記的核苷酸,允許所用放大標記物的類型和產生的信號有較大的靈活性。在一些實施方案中,甚至當不進行循環反應時,可通過下列方法測序序列的大部分,所述方法是使用針對所述部分的放大標記物鏈,從而避免涉及重複循環的複雜反應,也無需將每輪循環所得的信息與特定靶序列相關聯,例如,使用固定於閱讀平板上的靶分子,這樣可限制讀取信號的方式(例如,無法使用微/納米孔或流式細胞計量術)。
在本發明優選的方面,通過使用單鏈分子,或者通過產生突出端,例如通過使用具有不同於其識別位點的裂解位點的適當核酸酶,如IIS酶,即可將靶分子轉變成至少部分為單鏈的形式。
優選地,當循環地進行反應時,可通過例如連接,例如通過產生含有它們的單鏈而將每輪循環的放大標記物連接在一起。另外,連接所述靶分子與所述銜接分子之後,優選使所得分子環化。通過將靶分子導入載體(或者通過使靶分子的一部分與支持物結合,在分子內部進行裂解之後自由進行相互作用,見實施例22),並在導入所述銜接分子之後使用適當的裂解和連接步驟,即可方便地達到上述目的。或者,可將產生的放大標記物鏈轉移或拷貝至靶分子上較遠處的位點,而無需進行有效的環化。實施例9中闡明了實現此目的的適當方法。
另一種不必重複循環反應的合適技術包括雜交較小的經轉變片段,即結合有放大標記物的核酸分子。這些片段自身已經受了一輪或多輪轉變循環,然後,可通過與未轉變序列或放大標記物所攜帶信息,例如標記物的核苷酸序列的互補性來連接這些片段(見實施例10)。
為了進行循環反應,必須控制反應中所用的特定酶。可根據所用的酶的不同通過不同的方法達到此目的。因此,可使用甲基化防止在限制性位點的結合和/或裂解。通過控制末端鹼基的磷酸化狀態,例如通過適當使用激酶或磷酸酶,可以防止或允許連接。也可適當使用大體積以避免分子間的連接。在限制性反應過程中,優選使用小體積以增加效力。
優選地,在每輪放大循環(或本文所述的測序)中,至少轉變2個鹼基,優選每輪循環轉變3至100個鹼基,尤其優選轉變4至20個鹼基。在每輪循環中,一個以上的放大標記物可以方便地與一個或多個鹼基相連。例如,在優選的實施方案中,導入了標記物的集合(例如線性系列或鏈),其中每個標記物對應於一個或多個鹼基,它們合起來對應於所述序列的一部分。例如導入了多種標記物,如對應於4至12個鄰接鹼基的4種以上的標記物。所述標記物可以方便地與針對一個以上鹼基的這些標記物(如針對每對鹼基的獨特標記物)自身相連接。
如優選實施方案中的實施例1所述,可使用具有上述特性的核酸酶來產生突出端。另外,所述載體還含有限制性酶位點,以在由核酸酶裂解產生的一個末端產生平端裂解,從而產生突出端。或者,可使用不同於產生原始突出端的酶的限制性酶,所述限制性酶能產生與該反應中所用的所有銜接子的一個末端精確互補的突出端。
為了進行實施例3的方法,可以方便地使用能產生與突出端相鄰或重疊的區域的核酸酶位點。優選這些位點位於所用的銜接子中。在每輪循環中,使用了兩種銜接子,利用與靶序列單鏈部分結合之區域的末端的互補突出端,可以方便地將這兩種銜接子連接在一起。因此,在本發明優選的方面,特別允許所用校對銜接子含有2種或多種核酸酶的識別位點,所述核酸酶的裂解位點與其識別位點是分開的,其中用所述核酸酶裂解可產生相鄰或重疊的單鏈區域。本文所用的「重疊」指的是具有共同鹼基的序列,或與相應鏈上的這種序列互補的序列。因此,為了獲得重疊區域,可以使用雙鏈靶的每條鏈,可測序重疊但互補的區域。為了方便地達到此效果,在每輪循環中將一個以上的銜接子結合於靶分子上。如果測序重疊區域,該方法允許校對,因為結合了對應於特定鹼基或鹼基集合的一個以上的放大標記物,可以產生針對該鹼基的重複信號。應懂得,根據本發明,不需要每個鹼基使用一種標記物,因此,可重複使用針對一對鹼基的標記物。
在進行涉及Klenow片段的使用的實施方案中,步驟a)中產生的單鏈區域比銜接子上存在的核酸單鏈區域長一個或多個鹼基。另外,在步驟b)之後還需要一個步驟,其中通過聚合化延伸反應縮短靶分子單鏈區域的長度。
為了進行涉及單鏈靶分子的技術,循環反應適當包括產生雙鏈分子,優選通過在聚合酶延伸反應中使用銜接子作為引物來產生雙鏈分子。
使識別位點完整以鑑定具有完成該位點所必需之末端鹼基的分子的方法是一種與以上一般性描述的方法稍有不同的技術,因為銜接子與突出端結合,但攜有標記物,所述標記物可以不必對應於與銜接分子結合的單鏈區域的一個或多個鹼基。單鏈區域由裂解限制性位點所產生的突出端構成,所述突出端含有靶序列的一些鹼基。然而,根據裂解位點,那些鹼基可以是,也可以不是單鏈的形式,例如,突出端可以完全由非-靶分子鹼基組成。不添加適當標記物依賴於以下事實,即銜接子僅在限制性位點已經完成之處才能結合。因此,步驟b)包括參考對應於所述單鏈區域或所述區域附近,例如與所述區域相鄰的一個或多個鹼基的標記物。另外,在此方法中,在步驟a)之前,使含有代謝酶的部分識別位點的接頭DNA片段與所述靶分子結合,接著使用所述酶,例如核酸酶來產生步驟a)的單鏈形式。
如上所述,可以在分選的基礎上進行測序。該方法可以獨立使用,或者與上述放大技術聯合使用。例如,測序方案可以是在4個鹼基對的基礎上分選靶核酸分子,隨後,轉變相鄰的鹼基對以便測定它們的序列。例如,分選策略可包括如上所述用靶核酸分子中的4個鹼基產生突出端。然後,將它們分布於256個孔中,所有孔中都覆蓋了短的DNA分子,即分選銜接子(這些銜接子不必攜有放大標記物)。分選銜接子被固定在孔壁上,並具有4鹼基突出端,其能互補靶DNA上已產生的突出端。另外,分選銜接子可含有IIS酶或其它適當核酸酶的結合位點。結合位點分布的位置使得各個IIS酶能產生突出端,所述突出端具有的鹼基對位於靶DNA中產生的第一個突出端旁邊。為了用分選銜接子增加表面積,另一種方法是將它們固定在固體支持物上,例如固定於順磁珠或類似物上。
孔1中的DNA分子具有AAAA突出端,而孔2中的DNA分子具有AAAC突出端,以此類推。因此,256個孔覆蓋了4鹼基突出端的所有排列。當靶DNA與連接酶一起被加入孔中時,具有TTTT突出端的DNA分子自身會與孔1結合,具有TTTG突出端的靶DNA會與孔2結合,以此類推。洗下未與分選銜接子連接的靶DNA分子之後,加入IIS酶,使得在產生新突出端的同時能釋放靶DNA分子,所述新突出端代表靶序列中接下去的4個鹼基對。然後將此突出端用作新一輪分選的起點,或者可以進行轉變/放大。
洗去DNA分子的分選策略包括DNA分子的相對較大損失。然而,本專利申請中建議的大多數測序方案基於對單個分子的分析,這意味著僅需要很少的DNA分子。因此,99.9%或更高的損失也很少成問題。
替代使用不同的孔的另一種方法是使用「微列陣」上的不同位置。在地址1處,僅固定有以TTTT結尾的DNA分子,在地址2處,固定有以TTTG結尾的DNA分子,以此類推。其它方法有在不同的時間使具有不同末端的DNA分子結合/轉變,使用凝膠分選等。
例如,可以使用具有256種不同分選銜接子的策略,所述銜接子分布於「微列陣」上的256個方格中。在方格1中,有具有AAAA突出端的分選銜接子,在方格2中,有具有AAAC突出端的分選銜接子,等等。因此,靶DNA分子將被分選,以使具有TTTT突出端的靶DNA分子與方格1結合,具有GTTT突出端的與方格2結合等。另外,通過例如用生物素/鏈黴親和素將DNA片段的另一末端固定在底物上,可以繼續進行下一個轉變/放大步驟,而不會使DNA分子離開它們在閱讀平板上的位置。另一種防止DNA分子離開它們的位置的策略是使用被分成256個孔/空間的閱讀平板。
還必須指出當然可以用少於或多於256的排列進行分選。也可以進行幾輪分選。例如,如果使用具有65,536個不同方格的「微列陣」,就可以僅通過雜交進行分選,來鑑定8bp。對於為了進行成功重構的很多應用而言,這就足夠了。因此,分選本身也可用作測序方法,而不必再使用轉變或放大。
也可以使用不基於連接酶的策略進行分選。原則上,可以使用任何適於識別鹼基對的方法,包括提及的與放大相關聯的所有方法。
應該指出的是可通過將相同的分選方法重複一次或幾次,而針對大多數目的調整分選方法的特異性。也適於使用競爭性探針/突出端來增加特異性。
因此,在優選的方面,本發明提供了按本文所述測序靶分子的方法,其中通過用至少包括下列步驟的方法評估所述分子的一部分的互補性來測定所述序列a)將至少所述靶序列的一部分轉變為適於結合互補探針的形式,所述探針與固體支持物結合,或者攜有能結合固體支持物的工具,優選轉變為單鏈形式;b)使所述互補探針與步驟a)產生的,適於結合互補探針的所述區域,優選所述單鏈區域的至少一部分,優選4至12個鹼基相結合;c)任選重複步驟a)和b),所述互補探針結合所述靶分子中與先前循環中互補探針結合區相鄰或重疊的區域;和d)通過鑑定與所述靶序列結合的互補探針,來測定所述靶序列的序列。
本文所用「探針」指適當的核酸分子,例如寡核苷酸或PNA分子。
也可包括其它步驟,例如互補探針可用作引物,在這種情況下,必要時也可以進行聚合酶反應。
如上所述,優選使用多個互補探針進行這種分選技術,優選每輪循環可鑑定2至8個,尤其優選4個鹼基,但是只有在完成測序反應時才能收集到該信息。特別優選具有2至8個,優選4個獨特的不變鹼基的互補探針與所述固體支持物上不同的不連續位點結合。在第二輪和隨後的循環中,將與所述探針結合的靶分子轉移至一個或多個其它的固體支持物上,所述支持物攜有針對所述靶分子的相鄰或重疊區域之序列的互補探針。為了達到此目的,可以按照與所述放大方法相似的方法進行步驟a),即探針自身可含有核酸酶(如IIS酶)的限制性位點,所述酶在其識別位點的外部裂解,從而產生適當的突出端。
上述方法可以與放大方法聯合使用,從而聯合分選和放大進行測序,例如,在步驟b)之後,可以按上文所述產生突出端,並用攜有適當放大標記物的銜接子結合所述突出端。然後通過讀出放大標記物發出的信號和鑑定靶分子所結合的探針來測定序列。因此,在優選的特徵中,本發明提供了按本文所述進行測序的方法,其中通過本文所述的放大方法測定所述序列的一部分,使用本文所述的互補探針測定相鄰的或重疊的部分。
在大多數情況下,被選定用於確定序列部分的位置的技術取決於測序所用的靶DNA是如何產生的,例如,如果它從共同的起點開始,或者如果它是通過片段化產生並因此導致靶分子從不同的點開始。
可以通過不同的方法產生測序所用的核酸分子。通過用DNA酶,超聲,渦旋或類似的技術處理少量DNA,可以將核酸分子裂解成片段。所述技術是本領域眾所周知的,例見http//dnal.chem.ou.edu/protocol book/protocol partII.html,其中描述了產生隨機亞克隆的方法。通過調整這些技術的參數,可以調整靶DNA片段的平均大小(原則上,最好具有幾百個鹼基對的平均大小)。當所述方法用於切割/裂解DNA分子時,也應該是相對非-特異性的方法,以使在統計學上,所得DNA片段是在原始序列的大多數位置處被切割/裂解的。
研究表明片段化DNA分子的末端由平端和1-2個鹼基的短突出端組成。必要時,可處理突出端以使它們成為平端(Klenow補平等)。
為了方便地進行依賴於產生單鏈突出端的本發明優選方法,可通過能產生所述突出端的方法使核酸分子片段化。如上所述,超聲處理,渦旋和DNA酶I可產生短的突出端。也可使用非-特異性裂解的限制性酶。幾種研究表明IIS酶特別適用於結構域交換試驗,在所述試驗中,DNA結合結構域可被取代。因此,可產生新的IIS酶,其中切割結構域與非特異性結合DNA的DNA結合結構域緊密相連。
通過已知IIS酶產生的突出端在-5至+6鹼基上有差異。如果需要長為6個鹼基以上的突出端,可以適當使用其它系統/策略。一種可能性是使用切口酶(nicking enzyme),該酶可以在dsDNA中在其自身結合位點的外部產生切口。這種切口酶的兩個結合位點的內部距離超過6個鹼基對,並且位於雙螺旋的兩側,它們應該產生長為6個鹼基對以上的突出端。除了現存的切口酶外,還可以例如通過突變IP和IIS限制性酶來產生新的切口酶。
作為另一種片段化的方法,也可以選擇以下策略,其中藉助於PCR或類似的方法產生靶序列的片段。例如,可以由靶DNA上的已知序列開始,然後在聚合酶延伸中將該區域用作引物的模板。如果使用在任意位點終止聚合酶延伸反應的方法,可以產生DNA序列梯,其中有很多不同長度的DNA分子,但它們都具有一個共同的末端。或者,可使用短的隨機化引物,從而由靶序列產生所有可能的片段組合。然而,使用聚合酶延伸時的限制因素是多種聚合酶的延伸長度。
也可使放大技術與本文所述的分選和轉變技術相結合。例如,當與單鏈靶結合時,可將銜接子用作引物。聚合酶反應可進一步提供確定銜接子和靶序列之間是否存在互補性的工具。
在本發明的一個優選實施方案中,靶分子固定於固體支持物上。可以用多種不同的方法達到此目的。可設計靶分子,使其與一種或多種能使所述分子與固體支持物結合的組分結合,例如,可由結合對的一個配對物提供末端(或幾個內部位點),例如,用生物素提供末端,所述生物素然後可結合到攜有-鏈黴親和素的固體支持物上。
可使用多種已知的方法對靶分子進行改造以使其攜有這種結合組分。例如,可通過使用經適當標記的引物進行PCR反應以導入結合組分(例見實施例17)。或者,使靶核酸與結合組分連接,例如通過用限制性酶裂解靶核酸分子,然後將其連接至銜接子/接頭,所述銜接子/接頭的末端已被結合組分標記。如果使用的是能形成非-回文突出端的IIS限制性酶,這種策略特別合適。另一種方法是將靶分子克隆至載體,所述載體已攜有結合組分,或者含有便於導入這種組分的序列。也可類似地使用這種方法導入位置標誌,詳見下文。
或者,在核酸分子自身是結合對的一個配對物的情況下,核酸分子可與固體支持物結合,而不必與結合組分結合。因此,例如,可使用與固體支持物結合的短PNA分子。PNA分子能雜交和結合雙鏈DNA,因此,可用此策略使未溶解的核酸物質與固體支持物結合。類似地,可使用寡核苷酸探針將互補序列結合至固體支持物上。按下文所述,也可使用這種技術,通過將特定的核酸分子結合到固體支持物上的特定位置來開始測序。
適於用作結合靶分子的固定化組分的適當固體支持物是本領域眾所周知的,並且在文獻中有廣泛的描述,一般說來,固體支持物可以是目前在化學或生物化學方法中被廣泛使用或被建議用於固定化,分離等的,任何眾所周知的支持物或基質。因此,例如,固定化的組分可採取以下形式珠,顆粒,片,凝膠,濾紙,膜,微纖維條,試管或平板,纖維或毛細管,它們由例如聚合材料製成,所述聚合材料如瓊脂糖,纖維素,藻酸鹽,特氟龍,乳膠或聚苯乙烯。一般優選使用顆粒材料,如珠。固定化組分可適當含有磁性顆粒,如超級順磁顆粒。在另一個優選的實施方案中,使用平板或片以線性排列固定分子。平板也可含有與平板垂直的壁,分子可結合在壁上。
可以直接或間接結合到固體支持物上,所用技術取決於被結合的分子是鑑定靶分子的探針,還是靶分子本身。為了結合靶分子,可方便地使用核酸分子和/或固體支持物上攜有的結合組分間接地進行結合。因此,例如,可使用一對親和結合配對物,例如親和素,鏈黴親和素或生物素,DNA或DNA結合蛋白(如lac I阻抑蛋白或它所結合的lac操縱基因序列),抗體(可以是單-或多克隆的抗體),抗體片段或抗體表位或抗體的半抗原。在這些情況下,結合對的一個配對物與固體支持物結合,或者是固體支持物固有的一部分,另一配對物與核酸分子結合,或者是核酸分子固有的一部分。可使用其它直接結合的技術,例如,如果使用濾紙,可通過UV-誘導的交聯進行結合。當結合DNA片段時,也可使用DNA天生喜好粘附玻璃的特性。
通過本領域眾所周知的方法,可以使適當的功能基團結合到固體支持物上,所述方法包括例如經由羥基,羧基,醛或氨基進行結合,通過處理固體支持物以提供適當的表層包被即可提供這些基團。通過連接可使適當的功能基團與本發明的核酸分子結合,或者可在合成或擴增的過程中導入所述結合,例如可使用攜有適當組分,如生物素或特定捕獲序列的引物。
如本文所述,靶分子可以方便地與結合於固體支持物上的互補探針結合。
在使用多個不連續互補探針的技術中,與這些不同探針結合的固體支持物可以方便地物理相連,但必須分別檢測由靶分子與每個探針的結合所產生的信號。因此,例如,具有多個孔的平板可用作固體支持物,其中在不同的孔中放置不同的探針,或者固體支持物區域可含有不同的地址,例如不同的探針可與濾紙上的不連續位點結合。
可以在產生核酸分子片段之前或之後與固體支持物結合。例如,攜有結合組分的靶核酸分子可以與固體支持物結合,然後,用DNA酶I或其類似物處理所述核酸分子。或者進行裂解,然後使片段與支持物結合。
在很多情況下,目的是測序存在於其它序列內部,或與其它序列共存的一個或幾個序列。例如,據認為僅有5-10%的人類基因組序列具有直接的生物學意義。因此,為了大規模地篩選人類基因組,能避免測序沒什麼生物學意義的區域將是有用的。
因此,可以使用的一個策略是將與待分離的靶序列互補的多核苷酸固定於固體支持物(孔的內壁,單個-分散的球體,微列陣等)上。通過使序列庫中的多核苷酸與固體支持物上的聚合物雜交,洗去不合乎需要的多核苷酸,然後進入測序階段。必要時,通過進行幾輪雜交和洗滌循環,可以增加特異性。即使對於各個應用是有利的,也不依賴於互補的多核苷酸是否以規則的模式被固定。基於連接,PNA雜交等的類似策略也是可以的。
例如,為了分離特異性的mRNA/cDNA分子,可將互補的cDNA/mRNA分子固定於順磁球等。然後在試管中將順磁球與含有靶序列的溶液混合。當mRNA/cDNA分子已與固定於球上的mRNA/cDNA雜交時,在用磁鐵或類似物將順磁球保留在試管中的同時,洗去不合乎需要的分子。然後通過增加溫度,改變pH,或通過使用另一種能溶解雜交分子的方法,釋放合乎需要的靶分子。
可用於在閱讀平板上進行測序方案的類似策略是將特定的靶序列固定於確定的地址上。例如,單鏈靶DNA可與固定於不同地址的引物雜交。必要時,可將引物用作聚合物延伸的模板。通過調整針對靶序列的引物,而將其定位於合適的地址。
相應的策略是將PNA分子固定於不同的地址。已知PNA分子能識別dsDNA中的特定序列,因此,該策略可用於通過使用PNA分子來確定dsDNA的地址,所述PNA分子能識別人們想固定的序列。
如上所述,可將被測序的分子分成兩類。即具有一個共同的末端和一個任意末端的分子和具有兩個任意末端的分子。可以用不同的方法由這些不同類型的分子得到位置信息。
如果所有的靶分子都具有共同的末端,每個靶分子的長度將與共同末端相對於其它任意末端的間距成比例。類似地,通過計算共同末端與序列信息位點之間的距離,來確定靶分子特定部分產生的序列信息的位置。當序列信息與靶分子的末端相關時,可以方便地由整個分子的長度/大小測定其位置。
如果核酸片段不是由共同的末端開始的,可以用不同的方法得到位置信息。一種方法是產生或鑑定序列與序列之間各不相同的特徵性指紋。因此,通過登記與其相關的是何種指紋,和它在指紋中所處的位置如何,即可得到序列片段的位置。可以考慮使用很多種技術來產生特徵性模式。例如,可藉助於「光學作圖」或類似的方法登記DNA序列中的限制性酶裂解模式。
已知的「光學作圖」方法的一個缺點是所用限制性酶的切割位點不是總能切割。類似地,也會發生不正確的裂解,有一些與DNA片段的長度測定相關的不確定性。因此,必須基於對很多相同DNA分子的分析,產生每個部分圖的平均圖。問題是很難知道何種DNA分子是相同的。
現行的光學作圖方法的另一個問題是為了觀察DNA片段的內部放置情況,必須在DNA分子已經展開之後才能用限制性酶等進行處理。這會降低DNA分子作為酶促製品的可利用性。除了位置放置外,還提供了末端測序的本發明克服了這些問題,例見實施例23描述的技術。
也可以使用能產生特徵性模式的螢光探針/標記。這是所謂「DIRVISH」技術的原理。類似的策略是使用原子力顯微術(AFM),微米-/納米孔,或其它登記以特徵性模式結合的蛋白質的大小和位置的方法。
也可使用上文所討論的細胞銜接子。例如,如果將經放大的靶DNA轉化/轉染至細胞中,可以趁機利用以下事實,即報導基因的轉錄頻率隨著與順式-調節元件的距離而變化。如果在一個末端具有增強子,在其它末端具有一種或多種由報導基因組成的放大標記物,可使用報導蛋白的相對量計算位置值。
也可以使用可用於得到位置值的元件標記或摻入靶序列。例如,如果難以區分兩個很類似的序列的指紋,這種策略將是有利的。例如,如果希望測序姐妹染色體,可以整合大量能被任意整合的插入元件(轉座子等)。然後,如果擴增染色體並使用插入元件作為位置標誌,每個姐妹染色體將有一種或幾種特徵性模式。
另一種可以使用的,能導入位置標誌並能鑑定該位點的序列的策略包括使用銜接子作為PCR反應的引物。每個PCR反應的結果是產生兩個相連的銜接子,其中兩個銜接子之間的距離對應於靶DNA上銜接子序列的距離,同時還提供了位置信息。
靶分子的序列可提供能產生無需修飾的位置標誌的必需工具。例如,如果一些序列信息是已知的,可使用探針與隨後可提供位置標誌的序列雜交。或者,將適當的位置標誌置於靶分子中,例如將不同的位置標誌以規則的間隔置於基因組中。為了區分不同的位置標誌,可通過那些標誌提供不同的信號,例如,它們具有可以探查到的不同的序列或長度。實施例21描述了一種使用位置標誌的方法。
因此,從優選的方面看,本發明提供了完整地或部分地測序核酸分子的方法,所述方法至少包括下列步驟a)測定所述核酸分子的一部分的序列;b)參照位置指示物,優選位置標誌測定所述部分在所述核酸分子中的位置;和c)組合步驟a)和b)中得到的信息以獲得所述分子的序列。
如上所述,優選測定多個序列及其位置。
如本文所述,位置指示物可以如上所述是分子的大小,所產生信號的強度,或與位置標誌,錨或指紋的距離。
以下將描述進行這些方法的多種不同技術以闡明本發明。
原則上,可使用能測定聚合物大小的每一種方法。然而,待鑑定的序列片段的長度必須根據大小測定的精確度進行調節,精確度越低,所需序列片段的長度越長。
本領域存在多種用於大小分選的方法;凝膠分選,微-毛細管分選,測定在閱讀平板上展開的聚合物的長度,(藉助於流式細胞計量儀,螢光顯微鏡等)測定未經特異性標記的聚合物的螢光強度(或其它),質譜術,聚合物封閉微米或納米孔所用的時間等。可以在讀出信號之前或之後進行這些方法以測定序列,例如當使用凝膠電泳時,可對凝膠上分離的樣品或從凝膠中洗脫的樣品進行信號讀數。
也可根據以下原理測定核酸分子的長度,即DNA分子被(DNA酶I,超聲等)裂解的機會與DNA分子的長度成比例。例如,在具有有限量DNA酶I的溶液中,200個鹼基對的DNA分子被切割的次數是100個鹼基對的DNA分子的2倍。通過例如末端標記不同的分子,使它們被裂解,然後監測經單次和雙次標記的分子相對於經類似標記的已知長度的標準物而言的量,即可達到上述目的。
為了測定DNA分子的長度或者離固定點的距離,可以方便地延伸或展開DNA分子。一種展開DNA分子的方法是使它們與大大過量的小玻璃珠(它們天生能結合DNA分子)混合,以使它們以1∶1的比例結合DNA分子。在液流中,DNA分子具有的阻力小於玻璃珠,使得它們傾向於互相分開,直至DNA分子伸展開來。如果液流較強,或者玻璃珠較大,使得DNA分子和玻璃珠之間的阻力差異較大,DNA分子會撕裂。然而,通過降低流動速度或通過使用較小的玻璃珠,就可以避免這一問題。如果DNA分子被規則地排布,使得每個單位面積的序列信息的量增加,該方法會特別有效。一個方法是用生物素標記DNA分子,然後將它們固定於具有規則鏈黴親和素模式的平板上。或者,使用雷射束,即所謂的雷射捕捉進行固定。
除了使用液流來展開DNA分子,還可以使用能將帶負電的DNA分子拉向一個方向的正電荷。通過使用此策略可能會增加閱讀效力。原則上,最容易的方法是將正或負點電荷置於閱讀平板的前方。根據Coulomb規則,DNA分子上電荷的力與距離成反比。與較下方的那些相比,離電荷最近的DNA分子將以較大的力被展開。對所有DNA分子而言,為了在讀數時受到同等影響,因此必需與讀數單元步調一致地移動點電荷。也可將點電荷置於閱讀平板下方較遠處,以使平板上力的差異降低。另一種可替代的方法是以弧形排布電荷,使得弧中心直線內的力矢量同樣大。然後,僅當旁路(sideway)移動讀數單元時才需要移動電荷。
或者,為了降低分子錨上的力,可使用另一種技術。可將兩個帶電的平板置於閱讀平板的下方,靶分子在所述閱讀平板上展開。上方(top)的平板具有弱負電荷,而下方(bottom)的平板具有相對較強的正電荷。如果剛好將帶負電的顆粒(如DNA)置於帶負電平板的上方,其產生的斥力將大於帶正電平板產生的吸引力。然後顆粒會受到向上的推力。然而,遠離平板的現象將會被逆轉。帶正電平板的吸引力大於帶負電平板的斥力。通過調整平板的電荷,在閱讀平板上方的給定高度,斥力和吸引力之間達到平衡。靶分子將會被推進該平衡平面。在此方法中,只要DNA分子位於平衡平面內,該DNA分子上的淨力就等於零。這會減少裂開的機會。
除了兩個帶電的平板外,也可以在閱讀平板的左邊使用正電荷,這會在此方向上產生淨力。通過使兩個帶電的平板相互傾斜,並且相對於閱讀平板傾斜,就可以做到這一點。
如果在通過流式細胞儀或類似的裝置展開靶分子的同時移動該靶分子,可使用帶負電的試管。通過使用這種技術,靶分子會朝著試管的中間被推進,此位置處的斥力最弱。
另一種可替代的展開技術由機械展開提供。例如,在此方法中,可使用兩個相鄰的平板,所述平板結合了與靶分子的任一末端互補的寡核苷酸。一旦靶分子與這些探針雜交,可使平板分開直至分子在它們之間被展開。
可以根據所產生的信號和獲得位置信息的方式,用多種方法讀出上述方法中產生的信號。例如,為了定位與靶DNA結合的螢光DNA探針,可按上文所述展開DNA。例如,可使用Weier等(人類分子遺傳學,1995,Vo1.4(10),p1903-1910)開發的,已知為分子梳的方法。在此方法中,將含靶DNA的溶液置於平的玻璃表面,所述玻璃被製備成能使DNA分子以一個末端與玻璃平板結合。然後通過使用液流展開DNA分子。然後,藉助於螢光顯微鏡,可以觀察到與展開的DNA分子結合的探針的相對位置。
在本發明中,通過例如使用4個經不同螢光團標記的探針和身為一段獨特的DNA序列的放大標記物,探針可以對準所述標記物,使得它們能與代表A,C,G和T的4种放大標記物雜交,即,使用上文所述的DIRVISH技術。然後可以用螢光顯微鏡直接讀出序列的順序。如上所述,根據放大標記物的構建方式,可以使用更多或較少種探針,例如,可使用單個探針,其中所述探針與每种放大標記物的結合均產生一個獨特的信號,例如產生二進位密碼。或者,可使用4種以上的探針,其中放大標記物對應於2個或多個鹼基。通過開發導致顯微鏡掃描玻璃平板的軟體,而同時自動分析序列順序,可以很快速地讀出鹼基對。
另一種可替代的快速讀數的方法是可使用流式細胞儀讀出螢光探針。這樣做的前提條件是DNA分子以展開的方式通過流式細胞儀的讀數單元,使得代表A,C,G和T的放大標記物依次通過。通過使用上文所述的技術可以做到這一點。或者,針對這一特定的實施方案而言,可使用電場或磁場來替代液流,從而推動顆粒通過螢光檢測器。通過利用以下事實可以做到這一點,即玻璃珠帶正電,而DNA分子帶負電,或者可以使用超級順磁珠來替代玻璃。然後,珠會將DNA分子推到它們的後面,象長繩一樣排列。
該策略中一項嚴格的參數是流式細胞儀的螢光檢測下限。幾個研究小組試圖通過降低流速來檢測各個螢光團分子。然而,使用分析速度為20-30,000個顆粒/秒的常規流式細胞儀時,必須使用較長的探針,以使每個探針上固定有很多螢光團。
目前最快速的流式細胞儀每秒能分析約200,000個螢光顆粒,但這些流式細胞儀是買不到的。另外,仍不能確定展開形式的DNA分子在斷裂之前的高速耐受性如何。然而,實際上可以假定DNA分子會耐受能夠極快讀數的速度。
另一種可替代的方法是以規則的方式將DNA分子固定於固體支持物,如包被有鏈黴親和素的平板。通過將小檢測器插入閱讀平板來讀出序列(由一系列放大標記物產生的信號)。這些檢測器可由例如固定在片段上的放大標記物上的報導分子滅活或激活,例如可通過與固體支持物上的傳感器結合以斷開或接通電路,從而滅活或激活檢測器。例如,報導分子和閱讀平板上的組件之間可形成強鍵。在後一種情況下,組件的形狀使得如果DNA分子離開閱讀平板,組件也可以從閱讀平板上鬆開。當組件鬆開時,它們以登記何種組件已從閱讀平板上消失的方式斷開電路。為了增加成功結合的機會,可以在片段上的相同位置固定幾個報導分子。可以使用4種各針對鹼基A,C,G和T的不同的報導分子,或者使用位於片段上的4個不同位置處的相同報導分子。使用多路平行傳輸的計算機輸入信號和其它現代電子學,據信每秒可以登記幾百萬個信號,從而可以快速測序。
在優選的實施方案中,這些方法可以適當地與本文所述的放大技術聯合使用,即通過一個或多個放大標記物,優選放大標記物鏈的存在來測定所述靶核酸分子的一部分的序列。然而,當不進行放大時,也可以使用這些方法。為了替代對DNA分子放大,可以結合使用傳感器能登記的,與鹼基的不同結合。
一旦已積累了信號信息,可使用電腦程式將序列片段裝配成最終的序列。此步驟中出現錯誤的可能性主要取決於5個參數被測序的DNA分子的長度,DNA序列的鹼基對組成是如何隨機化的,被讀信號的DNA片段的長度,被讀信號的DNA片段的數目,和測序反應的錯誤率。
發明人已編制了電腦程式,用於分析上述參數的重要性。根據已被測序的人類基因組DNA,分析表明如果DNA片段長度為30個片段,要讀出6×108個DNA片段,測序反應的錯誤率為10%(考慮到點突變)的話,可在單次測序反應中讀出人類基因組,並且具有很少的點突變/缺失。然而,一個例外是十分非-隨機化的區域(衛星DNA和其它重複區域),必須增加所述區域的DNA片段長度。然而,相對於編碼序列和順式-調節元件而言,這些區域的生物信息顯得不太重要。
數據分析還表明當多次讀取DNA片段時,可以補償測序反應中甚至很高的錯誤率。例如,通過10次讀取相當於序列長度的鹼基對數目,會消除大多數缺失和點突變,甚至可消除測序反應中的高錯誤率。
根據測序所用的技術,在確定的情況下,可以在異源樣品上進行測序,例如,進行平行測序。進行這種測序的方法構成了本發明的優選方面。這種技術需要能區分不同靶分子發出的信號。通過多種方法可以達到此目的,例如通過限制到特定的位置,包含,或鑑定能指示特定靶分子的標誌等。例如,可使用與靶核酸分子的區域互補的固體支持物來分離和保留特定的分子。通過以下方法可以做到這一點,即可以藉助於對序列的至少一部分的知識,即將特定的分子結合到特定的位點上,或者不使用該知識,而使用基本上隨機的結合探針,所述探針上會結合不同的分子,然後可以通過利用使序列與該分子相關聯的一種或多種技術,例如通過地址或位置標誌來平行測序所述分子。本文所述的技術特別有用,因為它們可以使各個分子能被測序,因此進一步有助於平行測序反應的方便進行。
可使用本文所述的多種技術測序靶分子的僅僅一部分,或者繪製指紋,進行分布圖分析或作圖,即鑑定分子的不連續部分和不同的部分,例如分析RNA表達(可首先將RNA轉變為cDNA以供分析)。例如,如實施例23所述,可用限制性酶消化靶樣品,所述酶可產生特定的突出端,該突出端可結合放大標記物(優選結合放大標記物鏈)。除了攜有序列相關信息外,該標記物另外還攜有與導致裂解的酶的相關信息,即作為由裂解產生的片段的標誌。可同時使用一種以上限制性酶,條件是這些酶能產生不同長度的突出端,所述突出端能結合不同的銜接子。或者,可以連續的循環使用不同的限制性酶。
然後,可利用例如與互補突出端結合的擴增標記物,例如利用反映該互補性的標記物,例如其中標記物本身由核苷酸鹼基組成,來排列所得的片段。如實施例23所述,由此可建立限制性圖譜。因此,另一方面,本發明提供了產生靶序列圖譜的方法,所述方法包括除了按本文所述得到所述序列的不連續部分的位置信息外,還應按本文所述得到所述部分的序列信息。
在優選的特徵中,通過得到所述序列的不連續部分的序列信息來產生所述圖譜,其中所述部分含有一種或多種核酸酶的所有或部分裂解位點,和/或所述核酸酶的所有或部分限制性位點,通過比較用所述核酸酶消化之後,所述靶核酸分子片段的末端序列來測定所述序列的位置。
優選按以下方法獲得序列信息,即按本文所述通過用一種或多種核酸酶裂解所述靶分子,優選產生互補的單鏈區域,使銜接分子與所述靶分子區域(優選位於,或鄰接於裂解位點)結合,其中所述銜接分子攜有一種或多種如本文所述的放大標記物,其中所述標記物含有能產生信號的組分,該組分對應於與所述銜接分子結合的所述區域的一個或多個鹼基,所述標記物另外還含有另一個能產生信號的組分,該組分對應於裂解所用的核酸酶。在使用足夠的核酸酶的情況下,可使用該方法作為測序方法。
例如,可按下列方法鑑定細菌。可裂解細菌,分離DNA。然後用II類限制性內切核酸酶或本文所述的其它諸如此類的核酸酶切割DNA分子。然後使DNA分子與銜接子結合以鑑定突出端。然後將DNA分子固定於閱讀平板上並展開。通過用螢光掃描儀掃描閱讀平板,可得到所述分子末端的限制性長度的信息或特徵性模式。涉及這种放大的技術可以利用其末端序列區分相同大小的分子。因此,在本發明的另一個特徵中,本發明提供了得到靶DNA分子的指紋的方法,所述方法包括除了按本文所述得到位置信息外,還使用本文所述的一種或多種測序技術。
在本發明優選的特徵中,通過參照所述靶分子的特徵性限制圖譜得到位置信息。另一個優選的特徵包括使用限制性作圖來鑑定一種或多种放大標記物,並使用能被流式細胞儀或納米/微米孔分析有效讀出的標記物。
使用本專利申請中介紹的原理和方法,通過在測序/分選反應中和讀信號時使用校對技術,可以降低錯誤率。
如果使用了分選,可以將相同的序列片段分選幾次。例如,將所有以AAAA開始的靶DNA分選至孔1。然後重複相同的方案,其中洗去了不是以AAAA結束的被錯誤分選的DNA分子。理論上,可以重複該方案直至得到合乎需要的錯誤百分比。
如果使用了放大/轉變,可以將靶分子上相同的序列片段轉變幾次,以得到重複的放大標記物鏈(信號鏈)。當重複的轉變產物不相象時,即可發現大多數的錯誤轉變。也可以用相同的方式拷貝被用於得到位置信息的靶分子部分。
另外,由於被分析的靶分子的數目可能極大,每個序列片段可以被讀很多次。
進行本文所述的測序或放大方法的試劑盒形成本發明的優選方面。因此,從另一方面看,本發明提供了放大靶核酸分子的一個或多個鹼基的試劑盒,所述試劑盒包括如上文所述的至少一個或多個銜接子,所述銜接子任選與一個或多個固體支持物結合,優選含有一種或多种放大標記物,所述標記物自身含有能產生信號的工具。
任選試劑盒可含有其它適當的成分,所述成分選自反應中使用的限制性酶,連接靶分子的載體,連接酶,滅活和激活限制位點或連接位點所必需的酶,擴增引物和/或適當的酶,緩衝液和溶液。進行本文所述測序反應的其它方面的試劑盒也包括在本發明的範圍內。因此,例如,進行分選反應的試劑盒可至少包括攜有一種或多種互補探針的固體支持物,所述探針優選一系列與該固體支持物,或另一固體支持物上不同地址的探針彼此錯配一個或多個鹼基的不連續探針。所述試劑盒中也可包括適當的標記工具。
使用這種試劑盒放大靶核酸分子或者進行測序形成了本發明的其它方面。
以下僅利用闡明的方式給出實施例,其中


如下圖1顯示了使用兩種限制性酶,雜交和連接將放大標記物導入靶序列的方法;圖2顯示了使用攜有2個限制性位點的載體和也含有所述限制性位點的銜接子將放大標記物導入靶序列的方法,其中所述限制性位點都能產生突出端;圖2A顯示了包括靶DNA的基礎載體,圖2B顯示了可以使用的銜接子,圖2C顯示了4個用於放大每個鹼基的酶促步驟;圖3顯示了具有校對機制的,每輪循環測序9個鹼基的方法,圖3A顯示了可以使用的銜接子,圖3B顯示了用於放大每個鹼基的酶促步驟;圖4顯示了包括補足限制性位點以鑑定靶分子的末端鹼基的測序方法,其中A)顯示了可用於此方法的銜接子,B)顯示了含有該限制性位點的一部分的接頭分子,C)顯示了與靶DNA結合以補足限制性位點的接頭分子;圖5顯示了使用與雜交和連接相結合的Klenow補平反應的測序方法,其中A)顯示了其中已連接靶分子的基礎載體;B)顯示了循環1,3,5等所用的銜接子的結構;C)顯示了取決於是否已產生大小相當的突出端的不成功和成功的連接;圖6顯示了使用銜接子的測序方法,所述銜接子當與單鏈靶分子結合時可用作引物,其中A)顯示了可用作引物以結合靶分子的銜接子,B)顯示了與靶分子結合的銜接子;圖7顯示了相鄰排列的銜接子,所述銜接子攜有放大標記物,並能與靶雜交和自我-雜交;圖8顯示了製備銜接子的方法,所述銜接子含有對應於一個以上鹼基的放大標記物;圖9顯示了基於髮夾銜接子的使用的轉變方法,其中在靶分子的兩端拷貝了放大標記物;圖10顯示了基於轉變的DNA片段之間的相互連接的轉變方法;圖11顯示了雙倍增加核酸分子的方法;圖12顯示了使用基於引物的分選策略進行DNA測序的方法,其中A)闡明了總方案,其中使測序引物與固體支持物結合(步驟1),所述引物再與靶分子結合(步驟2),通過聚合酶延伸反應使靶分子延伸(步驟3),然後結合攜有不同信號的引物(步驟4),使鏈延伸(步驟5),然後釋放所得延伸產物以進行分選(步驟6);B)顯示了孔1所用的代表性引物,所述引物上結合有不同的信號;C)顯示了所得到的16孔中的每一個的螢光信息;圖13顯示了使用基於雜交的分選策略進行DNA測序的方法和所得到的結果,其中A)顯示了經螢光標記的單鏈靶分子與固體表面多個地址處的八聚體探針的結合,然後所述靶分子被展開;B)顯示了掃描表面的一個切面,其闡明了螢光信號對應於每個地址處的不同長度而進行的直線分布方式;C)顯示了一個地址上的螢光強度;圖14顯示了DNA測序方法,其中靶DNA分子與固定的參照點結合,其中A)顯示了由PNA組成的轉變銜接子,和具有相應組成的放大標記物鏈(在本文中被鑑定為信號鏈);B)闡明了靶DNA與固體支持物的結合,與PNA銜接子的結合和展開;C)顯示了分子展開之後,掃描表面的外觀;
圖15顯示了進行納米孔測序之前的二進位末端轉變方法,其中顯示了產生含有轉變銜接子的靶分子的方法,還顯示了所得的由位置和序列信息以及方向標記組成的信號。
圖16顯示了如何使用細胞來產生能反映鹼基序列的信號,其中A)顯示了如何在靶分子中添加增強子,隨後,與引物結合,所述引物攜有報導基因形式的放大標記物;和B)顯示了闡明信號分布的直方圖;圖17顯示了通過產生測序梯進行測序的方法,所述測序梯各相差3個經放大的鹼基,其中結合的靶分子被非-特異性地裂解,並與銜接子結合,使所述銜接子裂解,產生可結合放大標記物的突出端;圖18顯示了通過沿著DNA分子的長度產生固定點來進行測序的方法,所述DNA分子與固體支持物結合,片段化DNA的末端被放大;圖19顯示了使一行放大標記物依次附著於固體支持物的測序方法,其中使用了含有DNA接頭的銜接子,所述接頭隔開被測序的DNA發出的信號,可除去所述銜接子以接近在下一輪循環中被測序的分子;圖20顯示了在含有待測序片段的分子中導入位置標誌的方法,所述測序藉助於銜接子來進行;圖21顯示了分選方法,其中靶分子與固體支持物上存在的銜接子結合,然後使該分子的末端與所述固體支持物結合,釋放另一末端以轉變相鄰的DNA鏈。(4)顯示了展開後所得的DNA。
圖22顯示了作圖法所用靶分子的製備方法,其中使用了幾種限制性酶,所述限制性酶能產生長度和方向(3』或5』突出端)都不同的突出端,然後,所述突出端可與放大標記物鏈連接;圖23顯示了放大的一般原理,其中通過與放大標記物鏈的連接反應來放大靶DNA分子的4個最靠外的鹼基。可使用靶DNA分子未被放大的部分得到位置信息,如圖所示,在這種情況下,可通過用基於光學作圖的策略讀信號來實現此目的;圖24顯示了本文所述的在微列陣上進行的分選方法,其中將靶DNA中的4鹼基突出端與具有256個地址的微列陣混合併連接。地址1含有AAAA突出端,因此與具有TTTT突出端的靶分子結合;和圖25顯示了如何使用信號鏈得到序列信息(左邊)和位置信息(右邊)的例子,其中A)顯示了基於DIRVISH的方法,該方法使用了經螢光標記的探針,所述探針能以特徵性模式與靶分子結合,B)顯示了基於光學作圖的方法,其中使用限制性模式給出序列的位置,C)顯示了登記DNA結合蛋白穿過微米/納米孔時的特徵性模式的方法,和D)顯示了使用經螢光標記的探針,蛋白質等的方法,當所述探針,蛋白質等穿過螢光檢測器時即被登記。
實施例1通過使用兩種限制性酶導入放大標記物進行測序,其中的一種酶產生突出端,另一種酶產生平端方法1.以非特異性的方式切割/裂解由待測序的DNA序列組成的純DNA群體,以形成由原始序列的片段(下文稱之為DNA片段)組成的DNA分子群體。
2.用各代表4種鹼基,腺嘌呤,胞嘧啶,鳥嘌呤和胸腺嘧啶的4種不同的DNA序列(下文稱之為對應於放大標記物的DNA片段)替代DNA片段中的鹼基對。因此,在有A-T鹼基對的地方插入「片段A」,用「片段C」替代C-G等。從而產生新的DNA分子,其中如ACGTT的原始鹼基次序被片段A-片段C-片段G等替代。理論上,根據需要,這4種DNA片段的長度可以有2個鹼基對至幾百個kbp(或必要時可以更多)的差異。相應地,DNA片段可含有報導基因和其它生物信息,或僅由不具有已知生物學功能的序列組成。
3.讀出針對各個DNA分子的4種類型DNA片段的順序,從而測定出原始DNA片段的鹼基順序。
4.電腦程式利用DNA片段之間的重疊將步驟3得到的,在起點使用的DNA序列的信息匯總在一起。
圖1闡明了進行步驟2的一種方法,所述方法基於限制性酶,該酶在自身DNA結合位點的外部進行切割。按下述進行所述方法1)將步驟1得到的DNA片段連接至質粒中,所述質粒具有能產生平端切口的限制性酶(Enz1)的結合位點,以及能在其自身DNA結合位點的外部切割並產生1個鹼基對突出端的限制性酶(Enz2)的結合位點。另外,可在質粒中摻入生物素鹼基,使其能附著經鏈黴親和素處理的試管,反應就在此試管中進行。
2)洗滌試管,加入含有Enz1和Enz2的新的反應混合物並保溫,從而形成一個平端和一個末端,在該末端中,DNA片段的第一個鹼基構成突出端。
3)再次洗滌試管,加入含有4種不同DNA片段以及熱穩定性DNA連接酶(如Pfu或Taq DNA連接酶)的反應混合物並保溫。熱穩定性DNA連接酶的優點是它們能非常特異性地連接,而同時它們不連接平端。因此,當存在腺嘌呤突出端時,就會連接「片段A」,當存在胞嘧啶突出端時,就會連接「片段C」等。
4)再次洗滌試管,加入含有T4連接酶的反應混合物並保溫,從而連接平端。由於插入的片段與最初的質粒一樣,也具有Enz1和Enz2的位點,我們回到起點,以使下一個鹼基被新一輪循環中的DNA片段所替代。實施例2通過使用兩種限制性酶導入放大標記物進行測序,這兩種酶都產生突出端該方法的起點是用BspMI-甲基化酶處理待轉變的所有靶DNA片段,使得所有BspMI位點被滅活。然後如圖2a所述,將它們連接至基礎載體中,圖中表明,基礎載體中連接有DNA片段,並被固定於鏈黴親和素底物上。基礎載體含有BspMI位點,所述位點可用於裂解用實心線表示的DNA片段。此實施例中產生的突出端的內部具有「T」,使得僅有A銜接子能與該突出端連接。在銜接子A已與用BspMI產生的突出端連接之後,使用AatII位點環化基礎載體。基礎載體也含有經生物素標記的鹼基,使得它們能被固定於覆蓋有鏈黴親和素的底物上。
圖2b顯示了所用的銜接子。銜接子A1(上方)和A2(下方)的唯一區別是AatII位點/突出端的位置被PstI位點/突出端取代。可在每兩輪循環中依次使用A1和A2銜接子,使得在第1,3,5等輪循環中使用A1,而在第2,4,6等輪循環中使用A2。5』突出端沿著5』方向由3個通用的核苷酸加上腺嘌呤組成。因此,這些突出端將與在突出端的內部(沿著3』方向)具有胸腺嘧啶的其它5』突出端連接。下方銜接子的5』突出端外部的黑粗線表示在銜接子已與DNA片段連接之後,可通過BspMI裂解產生的突出端。除了A銜接子外,必須製備C,G和T的銜接子。
當DNA片段已連接到基礎載體中,可將它們固定於鏈黴親和素底物,如順磁球上。通過使用Dynabead的千鹼基BINDER試劑盒,可得到很強的生物素-鏈黴親和素結合,使得反應溶液能被快速而有效地改變,甚至在很多輪循環中,都只有最少的DNA損失(分子生物學中的生物磁技術,第3版,p158-60,由Dynal AS發行)。該方法的其餘部分包含4步酶促反應的一個循環,其中每輪循環轉變一個鹼基(圖2C)。
在此方法中,通過用BspMI切割啟動循環,使得DNA片段的第一個鹼基位於5』突出端的內部。在這種情況下,該鹼基是胸腺嘧啶。隨後,加入大大過量的銜接子A1,C1,G1和T1。這些銜接子被設計成銜接子A1與在內部具有胸腺嘧啶的突出端連接,C1與在內部具有鳥嘌呤的突出端連接等。還用磷酸酶(例如鹼性磷酸酶,如牛小腸AP,Promega)處理銜接子,使得銜接子之間不能連接。通過使用熱穩定性的連接酶,在此步驟中得到高特異性。在第三步中,用AatII進行裂解,從而產生突出端,在最後的步驟中,所述突出端可用於環化載體。這樣就完成了方案,我們又回到起點。僅有的區別是BspMI位點的位置前進了1個鹼基對,從而產生突出端,其中DNA片段的第二個鹼基位於內部。也用PstI位點替代AatII位點,使得在下一輪循環中,必須使用具有PstI突出端的銜接子。(每隔2次依次使用AatII/PstI銜接子的原因是為了防止銜接子在載體被環化之前再次被切下來。)實施例3通過使用兩種限制性酶導入放大標記物以進行測序,所述酶能在靶DNA的相鄰區域產生突出端以便校對此變體方法的起點是具有4鹼基突出端的所有組合的256個銜接子,和具有5鹼基突出端的所有組合的1024個銜接子(圖3A)。在上面的銜接子類型中,必須產生1024個變體,而下面的銜接子類型必須產生256個變體。片段的相對大小大於圖中所示的大小。應指出的是兩種銜接子都具有PstI突出端,這樣可以使它們互相連接。然而,應該用磷酸酶處理突出端以使銜接子之間直到被激酶處理之後才會發生連接。
與第一個變體方法中所用的基礎載體(圖2)相比,在本方法的基礎載體中,BspMI和PstI位點被HgaI和SfaNI位點所取代。
該方法的其餘部分包括4個酶促反應的一個循環,其中每輪循環轉變9個鹼基(圖3B)。在轉變結束時,載體被環化,使反應重又回到起點。僅有的區別是HgaI和SfaNI位點往DNA片段內部又前進了4個鹼基對。因此,在下一輪循環中,產生了4個新的鹼基對,同時,在此循環中,還轉變了5個鹼基對。通過證實在兩輪循環中以相同的方式轉變了後面提到的4個鹼基對,可以檢查是否出現一個或幾個不正確的轉變。
方法1)用DNA酶I或其類似物使靶DNA分子片段化,以形成幾百個鹼基對的片段。處理這些片段以甲基化HgaI和SfaNI位點。然後將片段連接至與順磁珠結合的基礎載體。
2)進行HgaI裂解。
3)進行SfaNI裂解。
4)用HgaI和SfaNI甲基化酶或其它能滅活HgaI和SfaNI位點的甲基化酶進行甲基化。
5)加入大大過量的銜接子,並使用例如Pfu或Taq與步驟2)和3)中由HgaI和SfaNI形成的突出端連接。在此步驟中,PstI突出端不會被連接,因為它們已被磷酸酶處理過。
6)使銜接子的PstI突出端磷酸化,然後用例如T4 DNA連接酶連接以環化載體。
7)通過由步驟2)重新開始,將循環重複合乎需要的次數。
8)通過用基礎載體中側翼於所連接的靶分子的限制性裂解位點進行裂解,從基礎載體上釋放經轉變的靶分子。必須事先滅活可能出現在放大標記物中的任何切割位點。
9)使經轉變的DNA分子變成單鏈,並與螢光探針雜交。
10)將經轉變的DNA分子錨著於掃描表面,展開,用螢光掃描儀或類似的儀器(例如使用DIRVISH)掃描螢光探針。
11)使用適當的軟體進行圖像識別並重構靶序列。
實施上述方案的一種方法如下,其中計算了除珠體積以外的所有體積1)按上文所述將隨機的片段克隆至基礎載體中,所述載體結合於順磁珠上。
2)使用磁力使珠沉降下來,用大約100μl 1×NE緩衝液1洗滌試管。
3)加入10μl 10×NE緩衝液1,4個單位HgaI/μg DNA和水,至終體積為100μl。置於37℃保溫1小時。
4)於65℃將HgaI酶滅活20分鐘。
5)使用磁力使殊沉降下來,用1×NE緩衝液3洗滌試管。
6)加入10μl 10×NE緩衝液3,2個單位SfaNI/μg DNA和水,至終體積為100ul。置於37℃保溫1小時。
7)使SfaNI和HgaI位點甲基化。
8)使用磁力使珠沉降下來,用1×連接酶緩衝液洗滌試管。
9)加入含有轉變銜接子的溶液。靶DNA分子和轉變銜接子的比例為1∶50。加入100μl 10×連接酶緩衝液,10μl T4 DNA連接酶(400U/μl,NEB#202)和水,至終體積為1ml。置於16℃保溫12-16個小時。
10)使用磁力使珠沉降下來,用1×激酶緩衝液洗滌試管。
11)加入2μl 10mM rATP,10μl 10×激酶緩衝液,2μl T4多核苷酸激酶(30U/μl)和水,至終體積為100μl。置於37℃保溫10至30分鐘。(T4多核苷酸激酶(70031)得自美國Biochemicals公司。)12)使用磁力使珠沉降下來,用1×連接酶緩衝液洗滌試管。
13)加入100μl 10×連接酶緩衝液,10μl T4 DNA連接酶(400U/μl,NEB#202)和水,至終體積為1ml。置於16℃保溫12-16個小時。
14)將步驟2)-13)重複1次或幾次。
例如,如果使用Bensimon的方法(Michalet等,1997,科學,277,p1518-1523)展開DNA分子,每個掃描表面可展開約1百萬個500kb的DNA分子。如果每個信號約為5kb,這意味著每個500kb的DNA分子提供了約100個鹼基對的序列信息。這意味著一個掃描表面能提供約1億個鹼基對的信息。然而,能否成功重構靶序列取決於序列片段互相重疊,使得很多鹼基對不得不至少被掃描兩次。實施例4包括補足限制性位點以鑑定靶分子的末端鹼基的測序方法該方法基於很多具有DNA代謝活性的酶識別底物時的高特異性。以下將用限制性酶闡明該方法,但也可以使用多種其它DNA代謝酶,如位點特異性限制性酶,轉座酶等。對大多數限制性酶而言,突變裂解位點的一個鹼基對一般足以防止被酶進一步裂解。在此方法中,靶分子與僅含有限制性位點的一部分的接頭連接。當該位點被靶DNA補足時,就可以進行裂解,隨後,可結合互補的銜接子,顯示出那些完成位點因此表現出特定末端鹼基的分子。圖4中顯示了針對腺嘌呤的此方法。
方法1)用四種不同的標準限制性酶(EnzA,EnzC,EnzG和EnzT)切割待測序的DNA分子。
2)然後將這些分子與4種不同的DNA接頭分子(分子A,C,G和T)連接。運些分子中的每一個的末端分別具有幾乎完整的EnzA,C,G和T的位點,僅僅缺乏一個鹼基對(分別為A,C,G和T)就能獲得完整的鹼基對。圖4B中顯示了一個這種接頭分子的例子。在此分子中,有一個缺乏A/T鹼基對的HindIII位點。如果該接頭與不具有A/T鹼基對的DNA片段連接,可使用MnII從該DNA片段中除去該分子。圖4C顯示了接頭分子A,該分子的末端與具有A/T鹼基對的DNA片段連接,從而產生完整的HindIII位點。在使用HindIII進行切割的下一步中,會產生能與銜接子A連接的HindIII突出端。
3)在溶液中加入4種限制性酶以進行裂解。只有每個接頭分子A,C,G和T已與末端具有缺失的鹼基對(對分子A,C,G或T而言分別為A,C,G或T)的DNA分子連接時,才是完整的切割位點。
4)加入銜接子,所述銜接子具有與用限制性酶產生的那些突出端互補的突出端,連接銜接子以使銜接子固定在正確的DNA片段上。圖4A中顯示了適當的銜接子。圖上方的銜接子是第1,3,5等輪循環使用的,而下方的銜接子是第2,4,6等輪循環使用的。銜接子具有與用HindIII產生的突出端互補的突出端。使用圖上方的銜接子中的AatII突出端將銜接子的另一端連接至基礎載體中,以使它能被環化。MnlI位點將在DNA片段上產生平端,以開始新的循環。在下一輪循環中使用PstI位點連接新的銜接子,在該輪循環中使用了具有PstI突出端的銜接子。
5)通過用例如AatII切割,使得銜接子的另一端能與基礎載體連接,從而用DNA片段/銜接子環化基礎載體。在未產生HindIII位點的情況下,將具有PstI位點的小片段連接至基礎載體的AatII突出端。
6)用能在DNA片段上產生新的平端的限制性酶進行裂解,以開始新的循環。實施例5使用與雜交和連接相結合的Klenow補平反應的測序方法該方法基於DNA聚合酶的Klenow部分摻入核苷酸的很高特異性,以及大多數DNA連接酶不能連接不同大小的突出端這一事實。圖5顯示了該方法,其中在靶分子中製備突出端,該突出端長子銜接分子中的突出端。只有經適當延伸後包括正確的其它鹼基以縮短突出端的那些靶分子能與銜接子連接。圖5闡明了針對腺嘌呤的方法。
方法1)將DNA片段連接至如圖5A所示的基礎載體中。除了能將分子固定在鏈黴親和素底物(例如Dynal公司的M280覆蓋有鏈黴親和素的磁球)上的生物素外,基礎載體還含有能在多核苷酸內部切割的限制性酶(如HgaI)位點,以及標準的限制性酶(如EcoRI)位點。
2)用HgaI切割載體,從而由多核苷酸形成具有5個鹼基對的突出端。
3)然後,加入例如鹼基A以及Klenow,使得以「T」開始的突出端被縮短成4個鹼基對的突出端。
4)然後用含連接酶和具有4鹼基對突出端的基因片段(銜接子)的溶液替代反應溶液。突出端由通用的核苷酸或4鹼基對突出端所有可能的組成的組合構成。具有通用核苷酸的突出端能連接所有組合中的4鹼基5』突出端。基因片段也含有能在多核苷酸內部切割的限制性酶(如HgaI)位點,標準的限制性酶(如EcoRI)位點,和含有信號「T」的序列(可用作探針等的序列)(圖5B)。AatII突出端和PstI位點具有與在EX4.1中相同的功能。由於具有5鹼基對突出端的多核苷酸不能與具有4鹼基對突出端的基因片段連接,只有那些原先具有一個最靠裡面的「T」的多核苷酸才能與基因片段連接。圖5C顯示了成功和不成功的連接。由於突出端的內部未摻入鹼基,圖上方的DNA片段不能與銜接子A連接。由於只有內部具有「A」的突出端摻入了一個鹼基,因此如圖下方所示,只有這些突出端能與銜接子A連接。DNA片段中最上方的線表示將由HgaI切割形成的突出端。然後用鹼基C,G並T重複相同的過程。
5)最後,通過用EcoRI切割和連接而用DNA片段/銜接子環化基礎載體。
6)然後用HgaI進行裂解,在DNA片段中產生新的突出端,使反應循環重新開始。
當連續的鹼基相同時,可使用具有不同大小突出端的銜接子,例如3個鹼基的突出端允許Klenow補平2個鹼基。實施例6使用銜接子的測序方法,所述銜接子當與單鏈靶分平結合時可用作引物方法1)圖6A中闡明了該方法中所用的銜接子,所述銜接子具有對應於片段組成的突出端。標出了對應於突出端中的鹼基組成的片段組成。必須構建對應於所有片段組合的DNA銜接子。
2)將靶DNA片段製成單鏈片段,藉助於RNA連接酶使3』末端連接至銜接子,5』末端連接至引物模板(圖6B)。銜接子和DNA片段之間成功連接的先決條件是銜接子的突出端互補DNA片段的5』末端。這樣可以確保正確的片段與DNA片段連接。
3)使靶DNA片段與銜接子雜交,然後使分子互相連接。再進行一輪或幾輪PCR循環。成功PCR循環的先決條件是ssDNA片段已被雜交並與銜接子連接。
4)使用EcoRI位點環化銜接子和DNA片段之間連接之後產生的DNA分子。然後使用HgaI位點在DNA片段中產生新的切口,從而開始下一輪循環。為了減少用EcoRI切割之後分子之間的連接,可以有利地將分子固定於底物,例如覆蓋有鏈黴親和素的球上。實施例7使用自我-雜交的銜接平的測序方法該方法的起點是單鏈DNA或RNA銜接子,所述銜接子能與待測序的DNA分子雜交,而同時攜有對應於除了自我-雜交的區域以外它們所雜交的鹼基的片段(放大標記物)(圖7)。通過使這種銜接子具有所有可能的片段組合,並且通過使它們與待測序的DNA分子雜交,而使多個銜接子一個接一個地排列(見圖7)。如果銜接子被正確排列,即前兩個銜接子沒有錯配的話,可以使它們互相連接,以使它們形成較長的鏈。實施例8構建對應於一個以上鹼基的銜接子的方法構建銜接子的一個策略是使用與構建DNA晶片相類似的原理。在該方法中,按照與構建DNA晶片相同的方法,在不同的地址處製備不同的寡核苷酸。然後使用相同的原理,按照與將鹼基對固定在不斷變長的寡核苷酸上相同的方法,將DNA片段固定在寡核苷酸上。最後,鬆開DNA分子,得到銜接子溶液。
該實施例還提供了另一種製備銜接子的方法,圖8中闡明了該方法。按圖8所示,使用8種各具有一個標記物的不同的銜接子製備16種各具有兩個標記物的不同的銜接子。由8種其它的1-標記物銜接子開始,可以製備出16種新的兩-標記物銜接子,這些新的銜接子反過來與前面16種銜接子組合,可產生256種不同的4-標記物銜接子。通過這種方式,可以產生銜接子混合物,其中只有適合進入溶液的不同分子的數目能限制排列的數目。起初需要的不同的1-標記物銜接子數等於每個銜接子中標記物數的4倍。例如,如果想製備16-標記物的銜接子(4.29×109種排列),最初需要16×4個不同的1-標記物銜接子。
方法1)如圖8所示,使用8種不同的1-標記物銜接子。左邊的銜接子由EcoRI突出端,特異於分子中很靠右的鹼基的標記物和BseMI切割位點組成。BseMI在其自身位點的外部進行切割,在分子右側鹼基的右邊產生平端切口。也用磷酸酶處理銜接子,使得這些銜接子之間的連接減少。右邊的銜接子由對應於分子中很靠左的鹼基的標記物和EcoRI切割位點組成。也將銜接子固定於底物上,以防止這些銜接子之間的連接。
2)通過混合和連接兩個銜接子群體來啟動此方法。這會產生16種不同的DNA分子,它們對應於具有2種標記物的所有排列。
3)使用EcoRI進行裂解,然後進行連接以環化所述分子。
4)最後,用BseMI進行裂解,這會產生具有16種不同的2-標記物銜接子的群體。實施例9基於髮夾銜接子的轉變方法幾種前述的轉變方法的關鍵點是鹼基對轉變之後,DNA片段被轉移到正被轉變的DNA分子的另一端,這樣會釋放正被轉變的末端,使得下一輪循環得以進行,而同時也節省了DNA片段。下文描述了另一種將多個DNA片段轉移至該DNA片段的另一端的策略。
起點是,很多種連接酶,包括T4 DNA連接酶,可使dsDNA上的突出端與ssDNA的末端連接。由圖9所示的方法可以實現此目的。
方法1)將靶DNA轉變成單鏈形式。
2)加入轉變銜接子並與DNA片段的3』末端連接。
3)進行聚合酶延伸。
4)加入髮夾銜接子並連接。事先處理轉變銜接子的末端,使得它不能與髮夾銜接子連接(例如用磷酸酶處理)。
5)使DNA分子解鏈。
6)使單鏈DNA分子與補足這些片段的DNA分子雜交。互補的DNA分子也具有突出端,所述突出端具有能與靶DNA中最前面的鹼基雜交的通用鹼基。
7)藉助於酶的切割位點,準備好DNA供下一輪轉變循環使用,所述酶在其自身識別序列的外部形成突出端。
在上述每一輪循環中,每次循環準備兩份放大標記物以進行校對。實施例10基於連接轉變的DNA分子的轉變方法很多前述的轉變方法基於在循環過程中發生的轉變。因此,每一個放大標記物鏈(或信號鏈)上轉變鹼基對的數目隨著循環數目的增加呈線性增加。另一種可替換的策略是將轉變的DNA片段連接至長鏈。根據此原理,有很多種可能的方法,下文將建議一種方法,該方法示於圖10方法該方法由切割和根據大小分選靶DNA開始。然後從該方案中除去特定長度(例如30個鹼基對)的DNA片段。
1)使用上述方法轉變DNA片段的末端。
2)環化已轉變的DNA分子。
3)加入IIS酶,該酶使用位於轉變銜接子末端的裂解位點。該酶如圖10所示切割DNA片段。
4)使DNA分子解鏈,並與補足這些片段的DNA分子,如經螢光標記的探針雜交。
5)最後,雜交並連接已轉變的DNA片段,必要時在溶液中進行反應。
由於上述實施例中具有靶DNA的突出端尋求互補的突出端,每個轉變的DNA片段會與遇到的DNA片段雜交/連接。這樣就產生了放大標記物鏈(信號鏈),所述鏈可提供被22個未知鹼基(如AGCTGTGA N22AGTCTGCA N22 TGAC)中斷的8個鹼基對的序列片段的信息。通過用DNA片段的原始長度減去每個DNA片段中轉變的鹼基對數目即可測定未知鹼基對的數目。根據信號鏈之間的重疊,可以重構靶序列,甚至可以在具有重複序列的區域中重構靶序列。實施例11雙倍增加DNA的方法如圖11所示,使單鏈DNA分子經受兩輪倍增循環。通過將髮夾銜接子與分子的3』末端連接以開始倍增。按照例如與逆轉錄酶使用3』髮夾環作為引物相同的方式,將銜接子用作延伸分子的聚合酶所用的引物。最後,溶解(dissolve)DNA分子,重新回到起點。藉助於ybp長的銜接子,使用此方法倍增xbp長的DNA分子n次,DNA的長度將是1)x·2n+(2n-1)y那麼,倍增前分別為x和x+1bp長的兩個DNA分子之間的差異將是2)(x+1)·2n+(2n-1)y-x·2n+(2n-1)y=2n因此,兩個經倍增的DNA分子之間長度的差異僅通過它們在倍增前的絕對長度差異而不是相對長度差異即可測定。實施例12利用基於引物的分選策略的DNA測序方法該實施例闡明了如何製備256個測序梯,使用16次獨立的凝膠分離和16種不同的標記,如螢光團可將這些序列梯互相分開。與僅使用4個測序梯的方法相比,測序反應的長度大大增加。因此當測序較長的序列時,可以特別地用於減少分選的工作量,所需的引物數目等。在此實施例中使用了16個測序梯和16種螢光團,但顯然可以改變測序梯和螢光團的數目以適合大多數需求和可使用的儀器。所用的測序梯和螢光團越多,測序反應越長。
方法圖12A舉例概述了所用方法。
1)將靶DNA溶液分放在16個含有測序引物的孔中,所述引物錨著於孔的底物上。這些引物決定了聚合酶反應的固定起點,因此,共有的起點使所產生的最終產物的大小成為末端序列與該起點之間距離的指示物。
2)進行聚合酶延伸反應,加熱DNA分子以導致解鏈,然後洗滌孔。
3)然後如圖12B所示,在16個孔中的每一個中加入16種不同的引物(總共256種不同的引物)。除了3』末端的鹼基3和4外,每個孔中所加的所有引物都相同。在此位置具有AA的引物與信號1相連,在此位置具有AC的引物與信號2相連等。除了例如3』末端以AC替代AA開始外,孔2中的引物也是相同的,而孔3中的引物以AG開始。因此,總共有256種不同的引物,覆蓋3』末端所有256種4-鹼基排列。使獨特的螢光信號與16種不同引物的每一種結合。然後再次進行聚合酶延伸反應。
4)然後,在解鏈DNA分子之前洗滌孔。再用16次獨立的凝膠分離(每次針對一個孔),根據大小分選釋放的單鏈DNA分子。
5)記錄螢光信號,用適當的軟體重構靶序列。
結果結果示於圖12C。每個螢光信號提供了有關4鹼基序列片段的信息。參照從中讀出螢光信號的孔,可得到前兩個鹼基的信息,而根據存在的特定信號可測定後兩個鹼基。實施例13利用基於雜交的分選策略的DNA測序方法在此方法中,利用與掃描表面上的八聚體雜交,將靶DNA分子定位在所述表面的不同位點上。然後展開分子,評估螢光信號與垂直的錨著線之間的距離,以提供有關八聚體在靶序列中的位置的信息。圖13中顯示了總方案。
方法
1)起點是由65,536個地址組成的掃描表面。具有單鏈八聚體的垂直錨著線與每個地址結合。AAAAAAAA八聚體錨著在平板的地址1處,AAAAAAAC八聚體錨著在平板的地址2處等,使得所有65,536種八聚體排列各具有其自己的地址。
2)然後在掃描表面上混合一端或兩端具有螢光標記的單鏈靶DNA分子,使得它們能與八聚體雜交(圖13A)。
3)必要時,通過將分子暴露於UV照射,以八聚體為引物進行聚合酶延伸,或通過其它方法以加強八聚體/靶DNA之間的結合力。
4)然後洗滌掃描平面,展開DNA分子(圖13B)。
5)使用螢光掃描儀掃描表面,以將每個地址處的螢光強度記錄為與錨著線的距離的函數,並使用適當的軟體重構靶序列。
結果圖13C顯示了所得結果。在所示的地址處,有7種不同長度的DNA分子,約為150,300,500,550,780,870和1040kb(如果DNA分子被展開成每微米為2kb)。實施例14使用基於連接酶的分選法的DNA測序方法該實施例根據基於連接酶的分選法,其中將65,536個測序梯分選在65,536個地址。與利用4個各代表1個鹼基的測序梯的其它方法相反,在此方法中,65,536個測序梯中的每一個都代表8鹼基的序列片段。相對於僅使用4個測序梯的方法而言,此方法降低了對通過大小進行分選的精確度要求。因此,測序反應的長度可增加,也可以利用很多種方法來通過大小分選聚合物。
在此實施例中,通過測定展開的DNA分子長度的方法闡明基於大小的分選。然而,其它變動也是可以想像到的,其中直接在掃描表面上進行基於大小的分選,例如,在使用標記法之後測定DNA分子的信號強度,從而使DNA分子的信號強度與長度成比例等。也可以想像出下述變動,其中使測序梯保持物理分離,在不同的時間從底物上釋放等,從而可以使用流式細胞儀,質譜法,納米孔分析,凝膠分選等來分別分析65,536個測序梯中的每一個。
方法1)由按本文所述製備的如1Mb的靶序列開始產生測序梯。
2)使靶DNA甲基化以使步驟3)和6)所用的限制性酶裂解位點被滅活。
3)如本文所述,在靶DNA的任意末端產生4-鹼基突出端。DNA分子的任意末端可以例如與DNA接頭連接,所述接頭含有IIS酶的結合位點,其能製備出4鹼基對突出端。定位結合位點以在實際的靶DNA中製備突出端。然後用IIS酶裂解分子。
4)然後按實施例12所述,通過在256個孔之間分配溶液來分選靶DNA。孔壁上覆蓋了具有4-鹼基突出端的分選銜接子,所述突出端能補足步驟3)中產生的突出端。分選銜接子也含有IIS限制性酶,如FokI的結合位點,所述位點所處的位置使得可形成突出端,所述突出端含有位於在步驟5中被切割的突出端旁邊的4個鹼基對。
5)使靶DNA與分選銜接子連接,然後洗滌試管以除去未被連接的DNA。
6)用IIS酶進行裂解,使得靶DNA鬆開,形成新的4-鹼基突出端。
7)如實施例12所述,將256個孔中的靶DNA分布在256個微列陣中。所有微列陣都是類似的,都由256個具有分選銜接子的地址組成,所述銜接子具有4-鹼基突出端,這些突出端能補足步驟6)中產生的突出端。在地址1處,分選銜接子具有AAAA突出端,在地址2處,分選銜接子具有AAAC突出端等。
8)加入連接酶,並保溫混合物。在地址1處,有具有TTTT突出端的靶DNA,在地址2處,有具有TTTG突出端的靶DNA等。
9)洗滌掃描平面,確定DNA分子的地址,並使用TOTO-1,YOYO-1或類似物使分子染色。
10)使用CCD照相機等拍下這些地址的照片,可將CCD照相機設置成例如每個地址拍一張照片。
11)使用適當的軟體識別螢光DNA分子,測定它們的長度,然後重構實際的靶序列。
可以實現上述目的的一種方法如下1)在每個孔中加入1等份含有任意4-鹼基突出端的靶DNA分子,10μl10×連接酶緩衝液,1μl T4 DNA連接酶(400U/μl,NEB#202)和水,至終體積為100μl。於16℃保溫12-16小時。
2)除去液體,用1×NE緩衝液4將孔洗滌1次或幾次。
3)加入10μl 10×NE緩衝液4,4個單位FokI(New England Biolabs,#109)/μgDNA,並加入水至終體積為100μl。37℃保溫1小時。
4)於65℃滅活20分鐘。
5)在獨立的試管中用乙醇沉澱每個孔中的DNA分子。
6)溶解沉澱物,加入10μl 10×連接酶緩衝液,1μl T4 DNA連接酶(400U/μl,NEB#202)和水,至終體積為100μl。於16℃與微列陣一起保溫12-16小時。
7)展開,標記和分析這些分子。
結果特定地址處分子的存在與否和大小既表示序列信息也表示其位置。因此,如果微列陣1的地址1含有100微米的DNA分子,這表示+200kb處存在與用於(儘管通過2步分選)結合該分子的八聚體相對應的序列(例如TTTTTTTT)。類似地,2個不同大小的分子的存在表示特定序列的重複。特定地址處不存在任何分子表示靶序列中缺乏與固定的八聚體互補的序列。
上述實施例中錯誤分選的潛在來源是粗-分選銜接子也可以用作細-分選銜接子。然而,通過使粗-分選銜接子中具有另一個限制性內切核酸酶的切割位點,使得粗-分選銜接子在掃描之前就被切下,就可以避免上述問題。儘管在上述實施例中未提及,但終止未與粗-分選銜接子結合的DNA片段末端也很重要。通過例如Klenow補平可以做到這一點。
如果在上述方法中使用Bensimon方法(Michalet等,1997,文獻同上)展開DNA分子,可在尺寸為1.28×1.28cm的掃描平面上展開1-2百萬個DNA分子。256個地址中的每一個含有約4-8,000個展開的DNA分子。由於每65,536個鹼基對中有一個8鹼基對的序列片段會重複,因此,如果靶序列為1Mb,每個地址處將平均有15個不同的長度(1,000,000/65,536=15.2)。因此,每個長度平均將被測定260-520次(4-8,000/15.2=260-520)。實施例15靶DNA分子被錨著於固定參考點的DNA測序方法在此方法中,使攜有線性排列的放大標記物(信號鏈)的PNA八聚體與固定在掃描平面上的靶DNA雜交,然後進行掃描,並測定靶序列中與八聚體互補的區域的位置。圖14顯示了總方案。
方法1)該方法的起點是按本文所述,將雙鏈靶DNA分子錨著於掃描平面上的固定參考點,例如錨著於與掃描平板垂直的錨著線上。
2)然後加入65,536種不同的轉變銜接子(即攜有放大標記物的銜接子)排列,所述銜接子由與信號鏈結合的PNA八聚體組成,所述信號鏈上具有與八聚體相對應的組分。信號可以是經螢光標記的球,珠或攜有其它適當的標記。因此,PNA分子能與靶DNA分子雜交。
3)展開分子,記錄它們的位置以及信號鏈的組成。
4)使用適當的軟體重構靶序列。
結果結果示於圖14。信號鏈和固定的錨著點之間的距離提供了靶序列中每個序列片段的位置信息。實施例16基於分選或與轉變相結合的分選的測序和光學作圖法此方法可以在作圖或測序反應中作圖或測序十分長的DNA序列,如基因組。該方法可以僅用於光學作圖,或者用於作圖加測序。重要的是應指出該方法可以在同一測序反應中測序很多不同的靶序列。
方法(僅進行分選)按照實施例14的方法,但與該方法中的步驟1不同的是,用DNA酶I或類似物切割靶DNA,以形成幾百個鹼基對的片段。按實施例14所述進行步驟2至8。然後洗滌掃描平面,展開DNA分子。再進行光學作圖法或類似的方法。用螢光掃描儀或類似的儀器對掃描平面進行掃描,使用適當的軟體重構序列。
方法(分選加轉變)
步驟1至6按上述光學作圖方法的相應步驟進行,然後7)加入256種轉變銜接子,並與步驟6)形成的突出端連接。轉變銜接子可以例如具有二進位的信號鏈,其中1-信號是含有針對一種特定限制性酶的很多裂解位點的DNA序列,而0-信號是不合有任何所述位點的DNA序列。
8)將每個孔中經轉變的DNA分子轉移至其自身掃描平面,用在1信號中具有切割位點的限制性酶進行光學作圖。
9)用螢光掃描儀或類似的儀器對掃描平面進行掃描,使用適當的軟體重構序列。實施例17基於二進位末端轉變和納米孔分析的DNA測序方法已證實電場可驅動單鏈RNA和DNA分子穿過脂質膜的離子通道。分子的穿過可被測定為離子電流的瞬時降低。已證實可以根據大小差異區分嘌呤和嘧啶。由此暗示可使用該方法進行快速測序。然而,已證實難以區分不同的嘌呤(腺嘌呤或鳥嘌呤)和不同的嘧啶(胞嘧啶,胸腺嘧啶或尿嘧啶),因為它們之間只有很小的大小差異。在此實施例中,可證實通過將靶DNA轉變為由嘌呤/嘧啶信號組成的二進位密碼能解決上述問題。
方法1)通過用DNA酶I或類似的酶進行裂解,產生靶DNA的片段,處理這些片段以產生平端。
2)使靶DNA分子與接頭連接,所述接頭含有一個或多個IIS限制性酶(例如FokI)結合位點。
3)通過用IIS限制性酶裂解,在靶DNA中產生突出端。
4)用磷酸酶處理突出端。
5)使突出端與轉變銜接子連接,所述銜接子也含有方向標記,使得軟體分析變得更加容易。
6)通過納米孔分析讀出嘌呤/嘧啶的組成。使用未被轉變的靶DNA部分得到位置信息。
7)使用適當的軟體程序重構靶序列。將轉變銜接子和靶DNA之間的突出端區域與序列片段信息相比較以作為校對機制。
結果信號由二進位的嘌呤/嘧啶密碼組成,其中A=嘌呤+嘌呤,C=嘌呤+嘧啶等。圖15中有所說明。實施例18在測序反應中使用細胞產生信號此實施例闡明了使用細胞產生信號,而細胞自身也可用作放大標記物,指示測序反應中的特殊鹼基。
方法A)在此方法中,將報導基因用作放大標記物,將其表達後的相對信號強度用於指示特定鹼基在序列中的相對位置。圖16中顯示了所用的技術和所得的結果。
1)如圖16所示,使用作為模板的靶DNA和測序引物進行聚合酶延伸反應,所述引物與具有增強子和報導基因的單鏈或雙鏈結合。使用測序引物結合靶DNA中的已知序列,指示將被測序的序列由此開始。
2)用由4種不同引物組成的引物混合物進行聚合酶延伸。每種引物由通用鹼基(U)或隨機鹼基(N)組成,但最靠3』端的鹼基是A,C,G或T。引物與4種不同的報導基因結合。最靠3』端的位置具有A的引物與報導基因A結合,以此類推。該步驟中所用的轉變引物隨機結合靶DNA,但最靠3』端的鹼基對成功的聚合酶延伸至關重要。
3)用與步驟1和2中所用引物的5』末端互補的引物進行一次或多次聚合酶延伸反應。
4)將轉變的DNA分子轉化/轉染至適當的細胞。
5)在允許報導基因表達的條件下培養細胞。
6)用流式細胞儀分析報導基因的表達,使用適當的軟體重構序列。
B)在此方法中,與不同鹼基相關聯的信號被導入細胞或其它結構內的不同位置,以指示它們在信號鏈中的位置。
1)用DNA酶I或通過類似的技術使靶DNA片段化。
2)將每個靶DNA分子中的16個鹼基對轉變為信號鏈。使用4種信號指示各個鹼基A,C,G或T。每種信號由與啟動子相連接的報導基因A,C,G或T組成,所述報導基因將在不同的位置表達每種信號,即對16個鹼基對而言,通過16種不同的啟動子將信號導入16個不同的位置。位置可以是一個細胞或多細胞生物中的細胞群體。也可以是細胞上的位置(例如外膜的一部分)。將信號鏈轉化/轉染至產生生物/結構的細胞。
3)在允許生物/結構產生的條件下培養細胞。
4)登記4種不同的信號在每個生物/結構中的不同位置的分布,繪圖,圖中的鹼基在沿著產生信號鏈所用序列的位置處出現。
結果A)可檢查特定位置處產生的信號強度。這一點在圖16中有所闡明。由於信號強度與增強子和報導基因之間的距離成反比,因此可以確定特定信號(因而是鹼基)相對於起始鹼基的位置。
理想地,為了有助於區分所產生的不同分子,起初根據其末端序列分選靶核酸分子,以使延伸產物有一個以上鹼基的差異。實施例19通過產生各相差3個放大鹼基的測序梯的測序方法此方法描述了測序梯的形成,其中在相同的固體支持物上進行轉變(即放大)和讀出序列。這些方法的重點是除了得到短區域(6-9bp或更長,以3個鹼基遞增)的鹼基組成外,也得到有關它們在較長DNA分子(長達幾kb)中的內部位置的信息。這對重構序列信息至關重要,例如,可使用該方法補充通過上述方法得到的序列信息。圖17闡明了測序9個鹼基對長的多核苷酸的原理。
方法1)通過PCR擴增待測序的DNA序列。用生物素標記其中一個引物的一端,以使DNA分子能固定於鏈黴親和素底物上。鏈黴親和素以細線排列,使得DNA分子彼此相鄰被固定成一行。
2)用DNA酶I(或類似的酶)處理這些分子以產生隨機切口(圖17的步驟1)。
3)使切口的末端與含有II類限制性內切核酸酶結合位點的多核苷酸相連接,所述酶在其自身結合位點的外部進行切割(此時為EarI)(圖17中的步驟2)。
4)然後加入限制性內切核酸酶,在多核苷酸中產生突出端(圖17中的步驟3)。
5)加入能識別和特異性連接多核苷酸突出端的銜接子(圖17中的步驟4)。從而使圖上方具有AGC突出端的多核苷酸與具有AGC片段組合的銜接子連接等。
6)藉助於液流,電場或類似的技術使DNA分子伸直,使得用螢光掃描儀可讀出經螢光標記的銜接子。
7)通過比對具有序列信息的片段來重構序列。
應說明的是每個銜接子的相對位置根據DNA酶I在何處切割多核苷酸而變化。在此方法中,可以給出每個含序列信息的片段在多核苷酸上的相對位置,這樣會使重構序列變得更加容易。
最後,應該強調的是在相同的閱讀平板上讀出幾個不同的DNA序列(圖17)可以增加讀信號的效力。例如,藉助於PCR,可以用基因特異性引物擴增較大數目的基因。然後在經擴增的基因序列上製備獨特的突出端。通過例如在最後一輪循環中使用很長的引物,並且插入很少切割的限制性內切核酸酶的切割位點等即可做到這一點。籍此可以使基因與DNA晶片雜交,所述晶片的每個方格由特異於多個基因的寡核苷酸組成。對應於基因A的DNA分子可以與方格A雜交,對應於基因B的DNA分子可以與方格B雜交等。當該方法可以挑選出基因組中的那些具有醫學價值的特定區域時,特別適於大規模篩選個體基因組。
通過使用基因特異性引物進行擴增也可以平行測序不同的基因。然後可產生特異於每個基因的突出端,隨後,基因與DNA晶片上的寡核苷酸雜交。構建DNA晶片,使得與不同基因互補的寡核苷酸具有不同的位點。現實中可以在相同的閱讀平板上產生幾千個不同的地址,使得可以平行測序幾千個基因。
如圖18所示,另一種方法是得到二維位置信息。
1)該方法的起點是將待測序的DNA分子切割成幾kb或更長的分子。然後將生物素摻入DNA分子,使得平均間隔幾百個鹼基(鹼基的多或少取決於實際需要)就有含生物素的鹼基出現。然後將DNA分子的一個末端固定於覆蓋有鏈黴親和素的平板上。末端固定機制應該不是鏈黴親和素/生物素。
2)藉助於液流,電場或其它方式伸直分子。通過加入反應溶液將DNA分子錨著在底物上,所述溶液能產生生物素-鏈黴親和素結合。
3)然後用DNA酶I或其它方式切割DNA分子,再將游離末端連接至前銜接子上,所述前銜接子含有IIS型限制性內切核酸酶的結合位點(未顯示)。然後通過用相應內切核酸酶切割,產生突出端,所述突出端與含序列信息的銜接子連接。
4)然後使具有ACGT片段組合的銜接子與ACGT突出端連接,等等。
5)使用液流,電場或類似方法在與待測序的DNA分子垂直的方向上伸直DNA銜接子,然後用生物素/鏈黴親和素系統錨著所述銜接子。當所有DNA分子已錨著在底物上時,重複上述過程直至已轉變/放大所需的鹼基對數目。應指出的是銜接子之間的相對距離對應於待測序的DNA分子中序列片段的內部距離。應指出,當然可以在一個閱讀平板上平行測序很多個DNA分子。實施例20使用具有接頭的銜接子的測序方法,所述接頭可以將經放大的部分與靶分子間隔開下文所述的方法闡明了一項技術,其中可實現一輪以上的測序循環。在此方法中,所產生的放大標記物與固體支持物結合。隨後,除去將標記物與其所對應的序列間隔開的接頭,然後放大靶序列的鄰接部分。圖19中顯示了方法。
方法1)將待測序的DNA分子ACGTGAGCT的一端固定在覆蓋有鏈黴親和素的平板上。固定機制應該是除鏈黴親和素/生物素以外的機制。
2)使DNA分子與多核苷酸相連接,所述多核苷酸含有II型限制性內切核酸酶的結合位點,所述酶的切割位點位於結合位點的外部(例如圖19所示的BspMI)。
3)在下一步中,加入所述限制性內切核酸酶,裂解形成突出端,所述突出端具有來自待測序的DNA分子的鹼基。
4)然後加入含有多種銜接子和連接酶的溶液。圖19顯示了已識別並結合ACGT突出端的銜接子。除了對應於ACGT突出端的,經螢光標記的片段外,兩個或多個生物素分子已摻入銜接子中。
5)藉助於液流或電場伸直DNA分子,如圖所示將片段固定於底物上。(DNA接頭區域的功能是將片段與待測序的DNA分子間隔開,這樣可以給下一步中的新銜接子留下空間。)6)用SmaI和BspMI進行裂解,使得除去DNA接頭的同時形成新的突出端,所述突出端由DNA分子上接下來的4個鹼基對組成。這樣就可以使新的銜接子與經螢光標記的片段相連接。僅有的差異是該銜接子不含有DNA接頭。然後將經螢光標記的銜接子固定於鏈黴親和素底物上的新位置。通過使用不同長度的DNA接頭,可以進行多個連續的轉變循環。實施例21在測序方法中使用位置標誌在此方法中,將位置標誌與待測序的分子相連,以有助於定位所得到的序列信息。
方法圖20中闡明了所用的方法。起點是例如100kb的環形靶DNA分子。該分子含有兩個被淺灰和深灰標記的序列(圖20),它們可用作位置標誌。
1)用Bst71I甲基化酶使DNA分子甲基化。
2)用DNA酶I或類似的酶使這些分子線性化,然後通過連接加入含有Bst71I裂解位點的銜接子。(切割位點所處的位置使得它們可被用於製備突出端,所述突出端具有靶DNA分子的前4個鹼基。因此,2個4bp的突出端能提供8bp連續序列的信息。)3)用Bst71I進行裂解,加入片段銜接子並連接。
4)將DNA分子轉變成單鏈形式,然後利用分子梳,電場或類似的方法將所述分子錨著並展開於載玻片上,同時與螢光探針雜交,所述探針能識別片段和位置標誌。也可以用YOYO-1或類似物染色DNA分子。
5)然後使用螢光顯微鏡/掃描儀掃描序列片段,測定與已結合至位置標誌的探針之間的距離。這樣就可以推斷出每個8bp序列片段在待測序的DNA分子上的大致位置。實施例22包括分選,接著放大的測序方法在此方法中,利用片段末端的4個鹼基,在固體支持物上分選片段,然後將分子的末端結合於固體支持物上。然後通過放大評估相鄰的4個鹼基。圖21中顯示了該方法的例子。
方法使用被分成256個地址的DNA晶片。每個地址含有分選銜接子,突出端,IIS類限制性內切核酸酶的結合位點和能產生平端切口的限制性內切核酸酶的結合位點。地址與地址之間的突出端各不相同,使得地址1中的分選銜接子具有AAAA突出端,地址2具有AAAC突出端等。另外,所有的地址都被具有結合特性的分子,如鏈黴親和素所覆蓋。
1)通過將靶DNA切割成片段,並處理DNA片段的末端以形成4-鹼基突出端來開始分選。
2)將片段導入攜有分選銜接子的固體支持物,所述銜接子與固體支持物連接。具有TTTT突出端的DNA片段將與地址1連接,該地址1中的分選銜接子具有互補突出端AAAA,具有GTTT突出端的DNA片段將與地址2連接等。
3)處理DNA片段上的另一個突出端,使得該末端可錨著於下層。例如,通過Klenow補平反應用生物素標記末端,使末端與經生物素標記的通用銜接子連接等即可實現上述目的。
4)用IIS和平端酶進行裂解(此時用FokI和DraI舉例說明)。在此方法中,在代表接下來的4個鹼基的DNA片段中得到新的突出端。
5)加入轉變銜接子以將這些鹼基轉變為信號鏈。
6)展開DNA分子,使用例如螢光掃描儀進行掃描。DNA分子的一個末端的位置為我們提供了有關4個鹼基的信息,另一端的信號鏈提供了接下來的4個鹼基的信息。實施例23製備作圖法,分布圖分析等所用靶分子的方法此方法背後的原理是用一種或幾種核酸酶消化靶DNA,所述核酸酶優先在其自身識別序列的外部進行切割,例如IIS酶,但也可以使用其它類型的核酸酶,例如來產生範圍為-5至+5的突出端。然後將突出端與信號鏈連接,所述信號鏈由一個含有序列信息的部分和一個含有突出端的特徵信息(即該突出端由哪一種限制性酶製備)的部分組成。從而將每個經消化的分子轉變為末端的信號組成和末端之間的長度有所不同的特徵性分子(signature)。通過比對末端與互補序列(例如比對與消化產生的互補突出端相連的一個或多個放大標記物),可以使用信息繪製限制性圖譜。也可以使用特徵性分子鑑定異源DNA群體中的靶序列。圖22中顯示了使用FokI的原理。
如果想作圖靶DNA中的FokI位點,所述靶DNA是溶解於水的100kbBAC克隆,我們可使用下列方法1)加入1個單位FokI(New England Biolabs#109),2.5μl 10×NE緩衝液4,1μgBAC DNA和水,至終體積為25ul。
2)於37℃保溫1小時。
3)於65℃熱滅活20分鐘。
4)用乙醇沉澱DNA。
5)將沉澱物溶解於水,並加入經磷酸酶處理的轉變銜接子(轉變銜接子和靶DNA之間的摩爾比應該至少為50∶1),200個單位T4 DNA連接酶(NewEngland Biolabs#202),2.5μl 10×T4 DNA連接酶反應緩衝液。終體積為25μl。
6)於16℃保溫4至16個小時。
現在就可以進行分析。然而,優選除去未連接的銜接子,例如7)加入1.5-2×108Dynabeads M-280鏈黴親和素(Dynal#112.05或#112.06),其上包被有銜接子,所述銜接子的5』端含有4鹼基突出端的所有排列,還加入2000個單位的T4 DNA連接酶(New England Biolabs#202),22.5μl 10×T4 DNA連接酶反應緩衝液和水,至終體積為250μl。
8)於16℃保溫4-16小時。
9)按「分子生物學中的生物磁技術」,第3版(由Dynal AS,Norway發行)中所述,用磁力沉澱珠,並取出上清液。
10)用乙醇沉澱上清液中的DNA分子。
11)將DNA分子溶解於適當的溶液和體積中。
此方法中所用的轉變銜接子可代表所有256種突出端排列,僅代表256個突出端的一個亞集,或具有一個或多個簡併鹼基的突出端。如果將用光學作圖策略分析分子,信號可以例如由不含EcoRI位點的0-信號和含有大量EcoRI位點的1-信號組成。
也可以用其它套限制性酶和信號鏈將上述方法重複一次或多次,然後再分析分子。然而必須指出與第一輪中產生的突出端連接的信號鏈必須受到保護以免受第二輪中所用酶的消化。通過使用不含第二輪中所用限制性酶的結合位點的信號鏈,甲基化該位點等即可實現上述目的。
也可結合分選法或其它能增加每次結束時所得的序列-長度的方法來進行此方法。
部分通過鑑定所得靶DNA片段另一端存在的限制性位點,部分通過鑑定其它含有互補突出端的靶片段和與這些片段連接的限制性位點,可以測定哪些限制性位點側翼於特定的限制性位點,從而測定靶序列內的限制性位點位置。不必測定每個片段的長度,因為利用足夠的限制性酶即可十分精確地測定位置。
與常規的光學作圖方法相比,該方法具有幾個重要的,有利的特徵1)解析度更高可以區分僅有幾個鹼基對差異的限制性位點,而常規的技術需要至少幾百個鹼基對。
2)使得用多個限制性酶繪製限制性圖譜變得更加容易。
3)重構的統計學問題大大減少,因為是在信號鏈組成的基礎上進行比對,而不是不確定地測定僅被部分切割的限制性位點之間的DNA長度。
4)當使用在其識別位點的外部進行裂解的酶時,圖譜中的每個位置基於結合位點的長度加上突出端的長度(通常為9個或更多個鹼基)。因此,可以在結合位點的序列和它產生的突出端的基礎上鑑定限制性位點。與常規的用不常見的裂解酶(8個鹼基)繪製的基因組圖譜相比,該方法是有利的。
權利要求
1.放大靶核酸分子的全部或部分序列的方法,其中一種或多种放大標記物與靶序列中的一個或多個鹼基相連,其中所述標記物對應於所述靶序列中的一個或多個鹼基。
2.權利要求1所述的方法,至少含有下列步驟a)將所述靶序列的至少一部分轉變為適於結合銜接分子的形式,優選轉變為單鏈形式;b)使步驟a)產生的,適於結合銜接分子的所述區域的至少一部分,優選所述單鏈區域與銜接分子結合,所述銜接分子含有一種或多种放大標記物,或含有能結合一種或多种放大標記物的工具,所述標記物對應於所述靶序列的一個或多個鹼基,優選對應於適於結合所述銜接分子的所述區域中的一個或多個鹼基,所述區域優選所述單鏈區域,所述銜接分子與所述區域結合,或與所述區域鄰近;c)任選連接所述靶分子與所述銜接分子,使得至少所述放大標記物能與所述靶分子保持相連;d)任選重複步驟a),其中所產生的適於結合所述銜接子的所述區域,優選所述單鏈區域包括一個或多個不與根據步驟b)的放大標記物相連的鹼基;e)任選重複步驟b)至d),所述銜接分子結合所述靶分子中與前一輪循環中銜接分子結合區相鄰或重疊的區域。
3.權利要求1或2所述的方法,其中每個放大標記物對應於至少2個鹼基。
4.權利要求1至3中任一項所述的方法,其中所述放大標記物合起來對應於至少2個鹼基,優選至少4個鹼基。
5.權利要求1至4中任一項所述的方法,其中放大標記物鏈與所述分子相連,優選其含有對應於至少4個連續鹼基的4個或更多個放大標記物。
6.權利要求1至5中任一項所述的方法,其中放大標記物是長度至少為2個鹼基,優選10至30個鹼基的核酸序列。
7.權利要求2至6中任一項所述的方法,其中將每輪步驟a)至c)循環的所述放大標記物連接在一起。
8.權利要求2至7中任一項所述的方法,其中所述銜接子含有核酸酶的識別位點,所述核酸酶具有的裂解位點與其識別位點是分開的。
9.權利要求2至8中任一項所述的方法,其中所述銜接子含有兩種或多種核酸酶的識別位點,所述核酸酶具有的裂解位點與其識別位點是分開的,其中用所述核酸酶裂解會產生相鄰或重疊的單鏈區域。
10.權利要求2至9中任一項所述的方法,其中一種以上的銜接子在步驟b)中優選與所述部分的重疊或相鄰區域結合。
11.權利要求10所述的方法,其中所述銜接子與所述序列的重疊區域結合,從而可以使一種以上放大標記物與每個鹼基相連。
12.權利要求2至11中任一項所述的方法,其中進行步驟c)和e)。
13.測序靶核酸分子的全部或部分的方法,其中每輪測序循環測序2個或更多個鹼基,優選4個或更多個鹼基,和/或將與每個鹼基,或一個以上的鹼基相連的信號放大。
14.權利要求13所述的測序方法,其中通過增加所述鹼基在所述序列中出現的次數來放大與每個鹼基相連的信號。
15.權利要求13或14所述的測序方法,其中如權利要求1至12中任一項所述,放大所述靶核酸分子序列的至少一部分,其中所述經放大的序列任選被轉變為可讀的信號,並通過評估產生的信號來測定所述序列。
16.權利要求15所述的方法,其中每個所述信號含有由單個信號事件組成的模式,所述事件能在每個放大標記物上產生獨特的信號。
17.測序靶核酸分子的全部或部分的方法,其至少含有下列步驟a)測定所述核酸分子的一部分的序列;b)測定所述部分在所述核酸分子內的位置;和c)組合步驟a)和b)中獲得的信息,得到所述分子的序列。
18.權利要求17所述的方法,其中通過參照位置標誌來測定所述位置。
19.權利要求17或18所述的方法,其中通過參照所述靶分子的限制性圖譜來測定所述位置。
20.權利要求17至19中任一項所述的測序方法,其中被測序的部分具有4個或更多個鹼基和/或以低於1kb的精確度測定所述部分在所述靶分子中的位置。
21.權利要求17至20中任一項所述的測序方法,其中通過權利要求13至16中任一項所述的方法測序所述部分。
22.權利要求17至20中任一項所述的測序方法,其中通過用至少包括下列步驟的方法評估所述分子之部分的互補性來測定所述序列a)將所述靶序列的至少部分轉變為適於結合互補探針的形式,所述探針與固體支持物結合,或者攜有能結合固體支持物的工具,優選轉變為單鏈形式;b)使所述互補探針與步驟a)產生的,適於結合互補探針的所述區域的至少一部分,優選長度為4至12個鹼基相結合,所述區域優選所述單鏈區域;c)任選重複步驟a)和b),其中所述互補探針結合所述靶分子中與先前循環中互補探針的結合區相鄰或重疊的區域;和d)通過鑑定與所述靶序列結合的互補探針,來測定所述靶序列的序列。
23.權利要求17至22中任一項所述的測序方法,其中通過基於權利要求13至16中任一項所述的放大的測序方法測定所述序列的一部分,並如權利要求22所述測定相鄰或重疊的部分。
24.放大靶核酸分子的一個或多個鹼基的試劑盒,其含有至少一種或多種如權利要求2至12中任一項所述的銜接子,所述銜接子任選與一個或多個固體支持物結合。
25.權利要求1至24中任一項所述的放大或測序方法,其中對異源樣品進行所述方法。
26.產生靶核酸分子的圖譜的方法,所述方法包括通過用一種或多種核酸酶,優選裂解位點與其識別位點分開的核酸酶裂解所述靶分子,優選產生互補的單鏈區域,使銜接分子與所述靶分子的區域結合,其中所述銜接分子攜有一種或多種如權利要求2至11中任一項所述的放大標記物,其中所述標記物含有對應於與所述銜接分子結合的所述區域的一個或多個鹼基的,能產生信號的組分,另外還含有另一個對應於裂解所用核酸酶的,能產生信號的組分,其中所述部分含有所述核酸酶的全部或部分裂解位點,和/或所述核酸酶的全部或部分限制性位點,並測定所述部分在所述靶序列中的位置,以得到所述序列部分的序列信息。
全文摘要
本發明提供了通過測定靶核酸分子的一部分的序列,以及關於所述部分的位置的信息,來對靶核酸分子的全部或部分測序的方法,本發明特別地提供了包括放大所述鹼基的一個或多個鹼基以有助於鑑定的新的測序方法。
文檔編號C12N15/09GK1334879SQ9981610
公開日2002年2月6日 申請日期1999年12月23日 優先權日1998年12月23日
發明者普雷本·萊克索 申請人:普雷本·萊克索

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀