新四季網

基因組分布分析:一種檢測複雜生物樣品中多種類型生物的存在的快速方法

2024-04-04 13:06:05 1

專利名稱:基因組分布分析:一種檢測複雜生物樣品中多種類型生物的存在的快速方法
背景技術:
本發明涉及從複雜生物樣品如機體樣品(如血液、尿、痰和糞便)中獲取遺傳信息。在醫學上,鑑定所述樣品中的傳染性生物對於感染的最佳治療和保持公共衛生是重要的。確定患者是否患有遺傳性疾病和法醫鑑定也極大依賴於對機體樣品的遺傳信息的分析。
雖然目前用於診斷傳染因子的程序包括整套複雜的幾百種測試,但很大一部分傳染性生物常常沒有被檢測出來。例如,在鑑定肺炎患者體內的傳染因子的嘗試中,成功率僅約一半,而肺炎是美國由傳染病引起的死亡的最常見的死因。
許多疾病如肺炎、腦膜炎和急性胃腸疾病的特徵在於可以由多種傳染因子引起的一組症狀(「表現(presentation)」)。還不存在掃描所有通常引起這樣的疾病的病原體的單一測試。(我稱這樣的測試為「表現特異性測試」。)目前的程序常常僅測試一種類型致病生物的存在。這中間存在問題,因為常常必須對一個樣品進行許多不同的測試,這增加了費用、鑑定所需時間以及錯誤的可能性。
另外,許多程序對於日常應用來說太昂貴。例如,可能需要幾百美元來對一種特定病毒進行測試。衛生保健提供者必須權衡這種費用,尤其是考慮到鑑定傳染因子可能需要多項測試。
大多數目前的診斷測試需要培養傳染因子以獲得大量的生物。不幸的是,許多類型的生物無法在醫院實驗室內進行常規培養。大多數病毒和寄生蟲以及許多細菌屬於這種類型。對於可以培養的生物,培養可能需要的幾天或甚至幾周,這就浪費了寶貴的時間。因此,患有例如細菌性腦膜炎的患者的生命非常依賴於立即治療,但最佳的治療可能需要由於培養而引起的耗時和威脅生命的延遲。其它傳染因子,如導致肺結核的細菌,一般需要幾周以在培養物中生長。在鑑定(以及最佳治療)上的延遲可能導致患有肺結核的患者將這種高度傳染性的疾病傳染給許多其他人。
目前在醫院中實行的診斷測試僅產生在樣品中存在的生物種類的粗略鑑定。在許多情況下,很難將一種致病生物與一種密切相關的非病原體區別開來。
此外,為鑑定一種病原體,一個樣品可能需要在幾個不同的實驗室由幾組人員進行許多測試,而每一組人員都接受不同類型的專業訓練。配備必要專業人員所需的費用是診斷學實驗室的預算的一項主要支出。同時,在不同實驗室之間分配樣品引入了另一個誤差源,另外,如果測試需要病原體存活,那麼運輸可能成為問題。
因此,需要一種新類型的測試,所述測試是表現特異性的(即全面的)、有效率地檢測來自各種不同類群的大量生物的存在、能夠在相當短的時間內進行(例如幾個小時)、使用單一測試的形式、並導致高解析度的病原體鑑定。
從生物樣品中獲取精確的遺傳信息可以提供關於在所述樣品中存在的生物的身份和醫學上的相關屬性的信息。這是因為由於進化趨異,每一種類型的生物都具有獨特的基因組DNA序列。DNA序列隨時間的流逝發生變化的原因包括宇宙射線的衝擊、化學誘變劑的修飾、正常DNA複製中的錯誤、遺傳重組引起的重排、以及病毒、質粒和轉座遺傳因子的入侵。結果,單個鹼基的改變積累,序列區段缺失,序列區段插入,並且染色體重排。因此,基因組是保守序列(即對於不同分類單位是共同的序列)以及作為上文枚舉的改變類型的結果的趨異序列的嵌合體。因此,測試獨特基因組筆跡(genomic signature)或基因組指紋的方法對於鑑定生物是有用的。
已經發展了多種方法以獲得傳染性生物的DNA指紋。這些方法包括限制性片段長度多態性(RFLP)分析、擴增片段長度多態性(AFLP)分析、脈衝電場凝膠電泳、任意引物聚合酶鏈式反應(AR-PCR)、基於重複序列的PCR、ribotyping和比較性核酸測序。這些方法一般太慢、太昂貴、無可重複性、並且對技術過分要求,以致於不能在大多數診斷環境中使用。所有上面提到的方法一般要求使用麻煩的凝膠電泳步驟,需要在培養物中培養病原體,需要純化病原體的基因組DNA,以及要求所述樣品不包含多於一種類型的生物(這排除了直接測試複雜醫學樣品的可能性)。最近發展的依賴樣品與高密度微陣列(microarray)進行雜交的高解析度株鑑定法(Salazar等,Nucleic Acids Res.245056-5057,1996;Troesch等,J.Clin.Microbiol.3749-55,1999;Lashkari等,Proc.Natl.Acad.Sci.U.S.A.9413057-13062,1997)也具有相同的限制(除了對凝膠電泳的需要外)。此外,這些新的雜交方法可能對技術過分要求,因為它們一般要求將與小寡核苷酸的雜交和不同程度的錯配區分開來。基於更大DNA序列的存在與否的方法將提供更健全(robust)、並因此在臨床上更有用的診斷測定。採用DNA指紋形式的精確的基於遺傳學的鑑定對於追蹤和控制在地區和在醫院中的傳染病爆發是至關重要的。在治療上,指紋分析,尤其是當能夠以快速、不依賴於培養的測試提供指紋分析時,就能夠通過比目前的實踐更快地確定給予何種抗生素而挽救生命。
也已經發展了一次測試樣品中幾種不同類型生物的存在的方法。注意到目前這樣的方法一般尚不適用於指紋分析,也就是說,不適用於在一個物種內的密切相關的生物之間進行區分。不需要培養而一次測試幾種生物的存在的方法是多重PCR。多重PCR和其它多重擴增方法的一個主要問題在於很難同時擴增許多序列(當包括更多引物序列時,擴增假象(amplification artifact)開始積累)。由於可以使用多重PCR測試的序列數目的限制,很難建立健全的多重測試,檢測在多種不同類型生物中出現的多種不同序列。因此,應用多重PCR同時測試在系統發生上全異的生物的最好的例子之一僅檢查九個序列,這遠不足以提供表現特異性的測試(Grondahl等,J.Clin.Microbiol.371-7,1999)。此外,由於可以使用的診斷探針的數量的限制(僅測試每種類型生物的一種序列),該測試缺乏冗餘性(這對於可重複性是重要的),僅提供傳染因子的粗略鑑定。多重PCR還對於在大多數醫學樣品中存在的抑制劑敏感,需要對技術過分要求的樣品處理以獲得健全的結果。
在遺傳上鑑定生物的一種方法涉及測試對於特定類型生物獨特的序列(或序列組)的存在。這樣的序列稱為標識(ID)序列。例如,為檢測人類免疫缺陷病毒的存在,人們測試在該病毒類群的成員中獨特存在的DNA序列的存在。在另一個例子中,一個大腸埃希氏菌(Escherichia coli)菌株當存在於人類胃腸道中時可能是無害的,而另一個大腸埃希氏菌菌株的存在可能是威脅生命的。雖然這樣的菌株非常密切相關,但可以通過檢測在它們的DNA序列中的變異而將它們區分開來。
為將一種生物與其密切相關的親緣生物區分開來,測試在來自每個類群的每個株中以獨特組合出現的一組DNA序列的成員的存在是有用的。這樣的序列稱為基因組差異序列,已經在文獻中描述,如在Straus(「基因組扣除」,在PCR Strategies,Innes等編輯,第220-236頁(Academic Press Inc.,San Diego,1995)),該文獻特此通過引用結合到本文中。基因組差異序列是與一種生物的基因組雜交,但不與另一種不同但密切相關的生物的基因組雜交的DNA序列。如在Straus(1995,見上文)中所述,例如,可以通過用兩種不同生物的基因組進行扣除雜交,製備基因組差異序列。得到的基因組差異序列組成一組核酸序列,該組序列在一種基因組扣除樣品中存在,但在另一組基因組扣除樣品中不存在。例如,在一個大腸埃希氏菌病原株和一個大腸埃希氏菌非病原株的基因組之間進行扣除,分離出一組基因組差異序列,該組差異序列中的每一種序列都與所述致病株的核酸雜交,但不與所述非致病株的核酸雜交。
已經將多種不同的基因組扣除方法應用於成對的相關株,以分離病原體特異性基因組差異序列(例如,Mahairas等,Journal ofBacteriology 1781274-1282,1996;Tinsley等,Proc.Natl.Acad.Sci.U.S.A.9311109-11114,1996)。已經應用這樣的序列作為診斷標記以鑑定其它密切相關的株和對所述株進行指紋分析(見,例如,Darrasse等,Applied and Environmental Microbiology 60298-306,1994)。簡要地說,應用基因組扣除於兩個相關株的基因組DNA,並分離基因組差異序列。將一組基因組差異序列與來自同一類群的其它株的基因組雜交(每種序列的雜交都在單獨的雜交反應中進行)。與所述基因組雜交的基因組差異序列亞組在株與株之間各不相同,並因此構成鑑定指紋。雖然已經顯示這種方法是鑑定一個生物類群內密切相關的成員的有力方法,但該方法對技術過分要求、耗時、麻煩,而無法在臨床設置中執行。此外,在這些實驗中的基因組差異序列通常來自單一的病原株,因此僅適用於對單一類群內的非常密切相關的株進行分型。因此,現有技術不能利用基因組差異序列在一個表現特異性測試中同時測試來自不同生物的多種序列。
這對於將一種生物鑑定為更大的生物類群的成員也是有用的。例如,可能重要的是確定下呼吸道感染是否是由於物種百日咳博德特氏菌(Bordetella pertussis)的任一成員引起的。在這種情況下,人們可以通過核酸雜交,測試在該物種的所有菌株中出現、但不在任何其它物種出現的序列的存在。這樣的將一個類群的成員與其它類群的成員區分開來的ID序列稱為類群特異性序列。
許多最具有醫學意義和在診斷上最有用的遺傳變異是單核苷酸多態性(SNP)。例如,在珠蛋白基因上的單鹼基對改變是鐮狀細胞貧血的原因。結核分枝桿菌(Mycobacterium tuberculosis)中RNA聚合酶基因的單個鹼基對改變是利福平抗性的原因,其中利福平是用於治療肺結核的最重要的抗生素。已經發展出一次檢測許多SNP的基於雜交的方法,但這些方法一般由於難以區分完全匹配和包含單個核苷酸錯配的匹配而缺乏健全性(Gingeras等,Genome Res.8435-438,1998;Wan等,Science 2801077-1082,1998)。一些用於辨別SNP的基因型的方法僅測試在單個基因上的突變(Gingeras等,1998,見上文)。其它方法依賴於,不具有可重現性的多重PCR法。因此,需要利用健全的雜交和擴增方法學一次辨別許多SNP的基因型的方法。
因此,為鑑定生物,測試ID序列的存在是有用的,所述ID序列可以包括基因組差異序列和/或類群特異性序列。不用培養醫學樣品而測試ID序列需要檢測少量基因組(如100-1000個基因組)的方法。已經發展出依賴於核酸擴增的靈敏方法,但一般地說,如同上文關於多重PCR所描述的,這些方法僅能可靠地一次應用於非常少量的序列。因此,已經批准用於臨床使用的基於擴增的靈敏方法一次僅測試一種或二種病原體。這些測試比在臨床實驗室中進行的標準微生物測試昂貴得多(通常是約100倍)。因此,基於擴增的測定的商業化發展一直局限於一個小亞組的導致常見和嚴重的感染、並且不能在培養物中容易地生長的生物(如HIV、結核分枝桿菌、和沙眼衣原體(Chlamydiatrachomatis))。需要擴展這種技術對於日常診斷的能力和靈敏度。
最後,定量生物樣品中的病原體數量常常是重要的。例如,用於診斷下呼吸道感染(如肺炎)的樣品常常受到來自上呼吸道的正常共生菌群的汙染。許多在上呼吸道無害的物種在破壞呼吸系統的正常防禦後可能成為下呼吸道感染的原因,這進一步增加了診斷複雜性。在這種情況下,關於在下呼吸道樣品中的生物數量的知識對於區別上呼吸道汙染和下呼吸道感染是重要的。
假如能夠培養所述生物,那麼定量分析臨床樣品中的病原體是相對簡單的。然而,許多在醫學上重要的生物難以或不可能培養(如大多數病毒、寄生蟲、衣原體和厭氧性細菌)。此外,定量培養通常需要幾天,在某些情況下需要一個月以上,如培養引起肺結核的結核分枝桿菌。在有限的情況下,通過不需要培養的方法可以獲得定量數據,例如直接免疫螢光測定。用於定量分析病原體的新的分子生物學方法,如定量聚合酶鏈式反應(PCR)已經對於監測AIDS患者體內的病毒水平非常重要。然而,定量擴增方法極其難於正確設計,可能是沒有重複性的,目前一次僅能應用於單個物種。
因此,需要測定生物樣品或臨床樣品中病原體數量的方法。這樣的方法最好是快速而普遍適用的,即該方法不需要培養並且可以定量在樣品中可能存在的多種類型生物。
總的來說,需要健全而靈敏的鑑定方法,快速而準確地測試未經培養的樣品中大量病原體特異性序列(基因組差異序列和類群特異性序列和單核苷酸多態性),所述病原體特異性序列是可以引起特定表現(如肺炎)的一組不同傳染因子的鑑別。也需要這樣一種測試以提供關於該樣品所來自的個體的醫學和法醫信息。
因此,本發明的一個方面是從可能包含靶核酸分子的生物樣品中獲取遺傳信息的方法,該方法包括(a)提供這樣的核酸分子,即(i)樣品中的靶核酸分子,或(ii)與樣品中靶核酸分子雜交的探針,或(iii)(i)或(ii)的擴增產物,或(iv)(i)的基因組代表(genomic representation);(b)通過將(a)的核酸分子與最小基因組起源(genomic derivation)大於5(如大於11)並且包括能夠檢測靶核酸分子的檢測序列的一個檢測集合(ensemble)相接觸或比較,檢測靶核酸分子。該方法還可以包括步驟(c)鑑定在步驟(b)中檢測到的核酸分子。
在優選的實施方案中,步驟(a)的核酸分子在步驟(a)之前並不作為以大小分級的片段固定化在基質或固相支持體上;所述擴增步驟使用少於四對(如一對)擴增序列進行,如果靶核酸分子在所述樣品中存在,則將產生擴增產物;以及通過原位雜交用所述方法定量在生物樣品中的靶生物。
在下面實施例2中作為例子展示的該方法的優選形式涉及在步驟(a)之前,使所述樣品的核酸分子同時與用於產生上面步驟(a)(ii)的探針的ID探針集合雜交的步驟。
步驟(a)(ii)的探針最好包括(i)能夠與靶核酸分子雜交的第一個區,和(ii)擴增序列。可以進行雜交,以便使步驟(a)中的所有核酸分子都處於液相中,或者使得步驟(a)中的至少一部分核酸分子固定到固相支持體上。此外,至少步驟(a)的一些核酸分子可以包括一個或多個寡核苷酸標記。
至少步驟(a)(ii)的一些探針可以包括(i)在與靶核酸分子雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴增序列。
在另一實施方案中,所述核酸探針集合的至少50%的探針能夠與在所述樣品或所述樣品的基因組代表中可能存在的預定的基因組差異序列雜交。
在一個優選的實施方案中,如上面所述可以與另一寡核苷酸連接的寡核苷酸是SNP探針。至少部分所述SNP探針可以包括標記序列,所述標記序列能夠與包含標記序列集合的檢測集合中的一種標記序列雜交。在這些實施方案中所述檢測集合的最小基因組起源可以是,例如,大於二十(如大於五十)。
在一些優選實施方案中,所述檢測集合的檢測序列作為兩維的點或作為平行帶(strip)在固相支持體上排列。
在另一實施方案中,通過使用不多於四對的擴增序列擴增步驟(a)(i)的靶核酸分子,產生步驟(a)(iv)的擴增產物,所述擴增序列如指導使用Alu特異性引物擴增處於Alu重複序列間的序列的擴增序列。在這些實施方案中,(b)的檢測集合可以包括與在步驟(a)(iv)中可能擴增的ID探針相應的ID位點。
本發明可以用於檢測和定量任何類型的生物。例如,在一個優選實施方案中,ID探針集合包括與來自分別屬於不同屬的至少十種不同的病毒、每種病毒至少兩種不同核酸分子雜交的探針。
本發明可以連同許多類型的生物樣品使用,所述生物樣品包括臨床樣品。在一個實施例中,所述生物樣品是來自人類胃腸道的樣品,並且使用本發明的方法所獲得的遺傳信息可以鑑定所述樣品中來自六種或更多種以下生物的核酸分子大腸埃希氏菌、沙門氏菌屬(Salmonella)、志賀氏菌屬(Shigella)、小腸結腸炎耶爾森氏菌(Yersiniaenterocolitica)、霍亂弧菌(Vibrio cholera)、糞彎曲桿菌(Campylobacterfecalis)、艱難梭菌(Clostridium difficile)、輪狀病毒屬(Rotavirus)、諾沃克病毒(Norwalk virus)、星狀病毒屬(Astrovirus)、腺病毒屬(Adenovirus)、冠狀病毒屬(Coronavirus)、蘭氏賈第鞭毛蟲(Giardialamblia)、溶組織內阿米巴(Entamoeba histolytica)、人酵母菌(Blastocystishominis)、隱孢子蟲屬(Cryptosporidium)、Microsporidium、美洲板口線蟲(Necator americanus)、人蛔蟲(Ascaris lumbricoides)、毛首鞭蟲(Trichuris trichiura)、蟯蟲(Enterobius vermicularis)、糞類圓線蟲(Strongyloides stercoralis)、麝後睪吸蟲(Opsthorchis viverrini)、華支睪吸蟲(Clonorchis sinensis)和短膜殼絛蟲(Hymenoplepis nana)。
在另一實施方案中,所述生物樣品是呼吸道樣品,並且所述遺傳信息可以鑑定來自以下六種或更多種生物的核酸分子白喉棒桿菌(Cornybacterium diphtheriae)、結核分枝桿菌(Mycobacteriumtuberculosis)、肺炎支原體(Mycoplasma pneumoniae)、沙眼衣原體(Chlamydia trachomatis)、肺炎衣原體(Chlamydia pneumoniae)、百日咳博德特氏菌(Bordetella pertussis)、軍團菌(Legionella spp.)、諾卡氏菌(Nocardia spp.)、肺炎鏈球菌(Streptococcus pneumoniae)、流感嗜血菌(Haemophilus influenzae)、鸚鵡熱衣原體(Chlamydia psittaci)、銅綠假單胞菌(Pseudomonas aeruginosa)、金黃色葡萄球菌(Staphylococcusaureus)、莢膜組織胞漿菌(Histoplasma capsulatum)、Coccidoidesimmitis、新型隱球酵母(Cryptococcus neoformans)、皮炎芽生菌(Blastomyces dermatitidis)、卡氏肺囊蟲(Pneumocystis carinii)、呼吸道合胞病毒、腺病毒屬(Adenovirus)、單純皰疹病毒、流感病毒、副流感病毒和鼻病毒屬(Rhinovirus)。
另一種可以根據本發明測試的生物樣品是血液樣品,其中鑑定來自至少六種以下生物的核酸分子凝固酶陰性葡萄球菌、金黃色葡萄球菌、Viridans streptococci、腸球菌屬(Enterococcus spp.)、β溶血性鏈球菌、肺炎鏈球菌、埃希氏菌(Escherichia spp.)、克雷伯氏菌(Klebsiellaspp.)、假單胞菌(Pseudomonas spp.)、腸桿菌(Enterbater spp.)、變形蟲(Proteus spp.)、擬桿菌(Bacteroides spp.)、梭菌(Clostridium spp.)、銅綠假單胞菌、棒桿菌(Comybacterium spp.)、瘧原蟲(Plasmodium spp.)、杜氏利什曼原蟲(Leishmania donovani)、弓形蟲(Toxoplasma spp.)、微絲蚴(Microfilariae)、真菌、莢膜組織胞漿菌、Coccidoides immitis、新型隱球酵母、假絲酵母(Candida spp.)、HIV、單純皰疹病毒、C型肝炎病毒、B型肝炎病毒、巨細胞病毒屬(Cytomegalovirus)和EB病毒。
本發明還可用於鑑定在任何類型生物樣品中的核酸分子,其中所鑑定的核酸分子是以下生物中的六種或更多種的核酸分子柯薩奇病毒A、單純皰疹病毒、聖·路易腦炎病毒、EB病毒、粘液病毒、JC病毒、柯薩奇病毒B、披膜病毒、麻疹病毒、肝炎病毒、副粘病毒、艾可病毒、布尼亞病毒、巨細胞病毒、水痘-帶狀皰疹病毒、HIV、腮腺炎病毒、馬腦炎病毒、淋巴細胞性脈絡叢腦膜炎病毒、狂犬病病毒和BK病毒。
本發明還包括用於從可能包含靶核酸分子的生物樣品獲取遺傳信息的方法,所述方法包括(a)提供最小基因組起源大於五的核酸探針集合;(b)使所述探針集合同時與所述樣品的核酸分子接觸;(c)檢測在所述探針和所述樣品中任何靶核酸分子間的雜交;和(d)鑑定在步驟(c)中檢測到的核酸分子。
本發明還包括用於從生物樣品中獲取遺傳信息的試劑盒,所述試劑盒包括(a)多種ID探針和/或SNP探針;和(b)包括與(a)的探針相應的檢測序列並且最小基因組起源大於五(如大於十一)的檢測集合。
在優選實施方案中,(a)的探針包括多於十種(如多於五十種或多於兩百五十種)不同的可擴增探針;(a)的至少50%的探針包括來自至少三種不同物種的基因組差異序列;(a)的探針包括多於五個家族的可擴增探針;並且(a)的探針對於至少兩個不同分類單位、兩個不同物種、兩個不同屬或兩個不同界是特異性的。
在其它優選實施方案中,(a)的探針包括包含以下的探針(i)在與靶核酸分子的ID序列雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴增序列。
在其它實施方案中,(a)的探針和/或(b)的檢測序列物理性附著到固相支持體的不同位點。在這些實施方案中,檢測集合的檢測序列可以在所述支持物上彼此相鄰定位,其中所述檢測序列檢測(i)分類群的成員(ii)密切相關的分類群。
本發明還包括用於從生物樣品中獲取遺傳信息的試劑盒,所述試劑盒包括(a)能夠引發生物樣品中的靶基因組DNA中由重複序列(如人類Alu重複序列)鄰接的DNA序列的擴增以產生四探針的多種核酸引物(如Alu特異性引物);和(b)檢測集合,所述檢測集合包括與使用(a)的引物可能擴增的ID探針相應的檢測序列,所述檢測集合的最小基因組起源大於5(如大於二十)。
本發明還包括ID探針集合,所述ID探針集合可以使用少於四對擴增序列擴增,包括多於三個(如多於十個或多於二十五個)ID探針家族以及多於十種(如多於五十種或多於兩百五十種)不同的ID探針。
在優選實施方案中,多於兩個可擴增探針家族對於不重疊的分類單位、不同物種、不同屬或不同界具有特異性。至少50%的所述探針可以包括來自至少三個不同物種的基因組差異序列。
在其它優選實施方案中,(a)的探針包括包含以下的探針(i)在與靶核酸分子的ID序列雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴增序列。
在其它優選實施方案中,檢測集合中包括的檢測序列在支持物上相互鄰接定位,其中所述檢測序列檢測(i)一個分類群內的成員和(ii)密切相關的分類群。
在本發明中使用的程序和試劑是通用的,即一組試劑可以用於鑑定許多不同類型的生物。所述測試是快速的,並且可以簡單地加入陽性內部對照和陰性內部對照。本發明的方法可以產生高解析度遺傳指紋,鑑定用常規方法無法分辨的株。所述方法適合於自動化形式,並且不需大量人員培訓就可進行。
本發明具有廣泛的應用性,包括對微生物(如細菌、真菌和原生動物)分型;鑑定高等生物(包括人類)的基因型;以及在流行病學中,監測醫院和地理遙遠地區的傳染病爆發(infection outbreak)。本發明的方法還可用於環境測試、農業(以進行家畜育種和分析)以及如在種子產業中進行植物分型。人類法醫學代表著本發明的又一個應用。
本發明的一個關鍵特徵在於其能夠在一次測定中,測試可用於鑑定複雜生物樣品中的生物的ID序列集合。該組ID序列包含多種區分一個分類群內的成員(如不同的大腸埃希氏菌株)的基因組差異序列,以及在不同分類群(如不同物種或屬)之間進行區分的多種類群特異性序列。這樣,每個集合可以包括非常大的一系列不同ID序列,所有這些ID序列都可以在一個快速、不基於凝膠的測定中同時使用。不需要培養樣品的事實增強了所述測試的快速性。
根據下面的詳細描述、附圖和權利要求書,本發明的其它方面和好處將變得顯而易見。定義「基因組」是指在一種生物中作為該生物可遺傳遺傳信息的最終來源的核酸分子。對於大多數生物,基因組主要由染色體DNA組成,但基因組也可以包括質粒、線粒體DNA等等。對於一些生物如RNA病毒,基因組由RNA組成。
「核酸」是指DNA、RNA或其它可以包括相似部分的取代的相關物質組合物。例如,核酸可以包括不在DNA或RNA中發現的鹼基,所述鹼基包括但不限於DNA中的黃嘌呤、肌苷、尿嘧啶,RNA中的胸腺嘧啶,次黃嘌呤等等。核酸還可以包括磷酸或糖部分的化學修飾,可以引入所述化學修飾以改善穩定性、對酶降解的抗性、或一些其它有用的特性。
「寡核苷酸」或「寡核苷酸序列」是指長度從6個鹼基到150個鹼基的核酸。寡核苷酸一般但不一定在體外合成。6個鹼基到150個鹼基長、並且是更大序列的亞序列的核酸區段也可稱為寡核苷酸序列。
「靶序列」或「靶核酸序列」是所指設計的探針所要檢測的核酸序列。對於ID探針,靶序列可以是ID序列中的ID位點。對於SNP探針,靶序列可以是單核苷酸多態性。
「靶生物」或「靶類群」是指診斷測試所設計要檢測的一類生物或生物類群(分類單位)。
「雜交」是指由鹼基對的氫鍵介導的核酸分子非共價結合。
「有意義的雜交」是指一種探針分子或多種探針分子與所述探針所設計檢測的核酸序列的雜交,其中所述雜交導致檢測出信號。
「比較雜交條件」是指如國際系統細菌學委員會(InternationalCommittee on Systematic Bacteriology)所推薦的,用於將物種相互區分開的條件(Wayne等,Internat.J.System.Bacteriol.37463-464,1987)。比較雜交條件在本文中是指由Hartford等(Int.J.Syst.Bacteriol.4326-31,1993)使用的條件。
「扣除雜交條件」是指在嚴格性上等同於如下反應的嚴格性的條件所述反應在65℃下,在由10mM EPPS,pH 8.0和1M NaCl組成的緩衝液中進行。
「發現於」、「存在於」、「出現於」、「對應於」、「雜交於」或「處於」另一核酸序列、核酸分子、寡核苷酸、探針或基因組的核酸序列、核酸分子、寡核苷酸或探針,是指可以與另一序列、寡核苷酸、探針或基因組形成雜交體的序列、寡核苷酸或探針,並且與由進行比較的兩種核酸分子中較短的一種核酸分子與其完全互補物在由10mM EPPS,pH8.0和1M NaCl構成的緩衝液中組成的雙鏈DNA片段相比,所述雜交體的解鏈溫度(Tm)比所述雙鏈DNA片段的Tm低20℃(對於大於30bp的序列)、12℃(對於15bp到20bp的序列)或8℃(對於8bp到14bp的序列)。「不存在於」另一核酸序列、核酸分子、寡核苷酸、探針或基因組的核酸序列、核酸分子、寡核苷酸或探針,是指沒有在另一核酸序列、核酸分子、寡核苷酸、探針或基因組中發現的核酸序列、核酸分子、寡核苷酸或探針。
「ID序列」或「鑑定序列」是指這樣一種核酸序列當在基因組或富集的基因組(見下文)中,通過雜交使用如上文定義所述的長度特異性解鏈溫度標準測定所述核酸序列的存在時,所述核酸序列是特定生物或生物類群的診斷性序列。ID序列對應於基因組或富集的基因組中長度大於等於30bp、可用於將一種類型生物與另一類型生物區分開來的序列。例如,當重要的是將密切相關的類群的成員相互區分開來時,基因組差異序列可以用作ID序列。「類群特異性序列」是可用於將一個類群的所有成員與其它類群區分開來的一種類型的ID序列。
「基因組差異序列」是指在一種生物的基因組(或富集的基因組)中發現、而未在密切相關的生物的基因組(或富集的基因組)中發現的核酸序列或核酸序列集合體。通過雜交/扣除技術、通過使用計算機比較基因組序列、或通過多種其它技術中的任何一種,可以發現基因組差異序列。比較基因組(或富集基因組)的生物必須是密切相關的。如果一對生物是同一屬的成員,或者如果它們的基因組滿足下面特定的雜交標準(請注意國際系統細菌學委員會推薦使用比較雜交建立相關性(Wayne等,1987,見上文)),就認為它們是「密切相關的」。假如使用Hartford等(1993,見上文)描述的方法,在比較雜交條件下,一對生物的多於70%的基因組DNA片段(在具有RNA基因組的病毒的情況下,是基因組cDNA片段)可以相互雜交,那麼就認為它們是「密切相關的」。基因組差異序列的長度大於等於30bp。基因組差異序列的一個例子是出現在大腸埃希氏菌O157H7的一個致病株、但不出現在大腸埃希氏菌O157H7的另相應病株中的DNA片段。
「類群特異性序列」是指這樣的核酸序列或核酸序列集合體當在比較雜交條件下進行雜交時,所述核酸序列或核酸序列集合體是一個系統發生類群中生物的基因組的特徵,而不是另一個分類單位或系統發生類群的基因組的特徵。類群特異性序列的長度大於等於30bp。例如,在大腸埃希氏菌O157H7類群的99%以上的分離物中出現、但不在99%以上的沙門氏菌屬分離物中出現的片段是類群特異性序列。相似地,在99%以上的輪狀病毒分離物中出現(如在比較雜交條件下所鑑定)、但不在於99%以上的人免疫缺陷病毒分離物中出現的片段是類群特異性序列。類群特異性序列可以用於鑑定更低水平的分類群,如亞種或通過世代相關聯的雜種繁殖群體(如人類)的成員。注意為了診斷目的,類群特異性序列在出現於一個分類群內,而不出現於相似分類學水平的姐妹類群(sister group)內時最有用。
類群特異性序列的一個例子是在腸沙門氏菌鼠傷寒血清型(Salmonella enterica serotype Typhimurium)的基本所有分離物中發現、但基本在腸沙門氏菌乙型副傷寒血清型(Salmonella enterica serotypeParatyphi B)的分離物中未發現的序列(見圖6)。請注意,類群特異性序列也可以是基因組差異序列(也就是說,該組類群特異性序列與該組基因組差異序列重疊)。例如,在所有大腸埃希氏菌O157H7菌株中出現、但在大腸埃希氏菌的非O157H7菌株中未發現的序列既是基因組差異序列,也是類群特異性序列。
「保守序列」是指這樣的核酸序列或核酸序列集合體按照雜交標準,所述核酸序列或核酸序列集合體是跨越同一分類學水平上多個獨立分類群的生物的基因組的特徵。保守序列的長度大於等於30bp。因此,編碼人類RNA聚合酶的基因的許多片段的序列是保守序列,因為它們可以在比較雜交條件下與黑猩猩基因組雜交。保守序列不可用於區分帶有所述保守序列的類群的成員。
「ID探針」是指用於與生物樣品中的ID序列雜交的寡核苷酸或一對寡核苷酸或一組寡核苷酸。為進行雜交,所述探針寡核苷酸的一部分必須能夠與對應的ID序列進行鹼基配對。所述探針的該部分通常長度在8個鹼基到120個鹼基之間。ID探針也可以具有其它部分,所述部分包括擴增位點(例如,對應於用於PCR擴增的引物結合位點的序列)和作為檢測時的標記的序列(見下文)。
「基因組差異探針」是指與基因組差異序列對應、即與其雜交的ID探針。
「類群特異性探針」是指與基因組差異序列對應、即與其雜交的ID探針。
「ID探針位點」或「探針位點」是指ID序列中在序列上對應於ID探針的部分。
「ID序列家族」是指可以與一種(非重組)生物的基因組雜交(在比較雜交條件下)的包含2個或更多成員的一組ID序列。在所述家族的ID序列中,至少2種ID序列在它們天然和通常出現的基因組中在圖譜中距離大於3,000鹼基。一個ID序列家族可以包括類群特異性序列和基因組差異序列的組合,可以僅包括類群特異性序列,或可以僅包括基因組差異序列。
例如,考慮可用於追蹤傳染性大腸埃希氏菌O157H7的爆發的ID序列家族。該ID序列家族可以包括所有下面類型的有診斷用途的ID序列物種大腸埃希氏菌的所有成員所共有並且限於該物種所有成員的多種類群特異性序列;僅包含大腸埃希氏菌O157H7菌株的系統發生類群的所有成員所共有並且限於所述系統發生類群所有成員的多種類群特異性序列;僅包含大腸埃希氏菌O157H7的系統發生類群的所有成員所共有並且限於所述系統發生類群所有成員的多種類群特異性序列,其中所述大腸埃希氏菌O157H7經多酶電泳分析發現具有電泳型3(DEC3類群;Whittam等,Infect.Immun.611619-1629,1993);以及在大腸埃希氏菌O157H7參考菌株DEC3B中存在,但在大腸埃希氏菌O157H7參考菌株DEC4C中不存在的多種基因組差異序列。
請注意,在上面的例子中,所述ID序列家族都可以在比較雜交條件下與一種生物即大腸埃希氏菌O157H7參考菌株DEC3B的基因組雜交。這是表達方式「ID序列家族」的定義方面。
「寡核苷酸家族」或「探針家族」是指對應於ID序列家族的寡核苷酸或探針的集合體。在寡核苷酸或探針家族中的所有寡核苷酸或探針序列對應於特定ID序列家族中所有或部分成員的序列。
「多態性探針」或「單核苷酸多態性探針」或「SNP探針」是指這樣一組寡核苷酸當該組寡核苷酸與基因組雜交時,鄰接一個多態性位點,並且該組寡核苷酸具有在該位點與一段特定的在該位點出現的基因組序列發生精確鹼基配對的序列。當一組這樣的寡核苷酸鄰近地與基因組雜交時,只有在靶位點的等位基因或基因型符合所述多態性探針的寡核苷酸的鄰接序列時,這些寡核苷酸才可以相互連接。SNP探針的結構和應用顯示於

圖10。一般地說,合成一組多態性探針以使其對應於特定位點的每個等位基因。多態性探針可以包含ID探針所包含的同樣部分(如擴增位點和標記)。具有標記序列的多態性探針的集合可用於產生包含差異的富集的基因組樣本,其中所述差異可以通過與包含標記集合的檢測集合雜交而檢測出。
多態性探針或「單核苷酸多態性探針」或「SNP探針」「家族」的定義與ID序列家族和ID探針家族的定義類似,只是在這種情況下,探針和基因組DNA之間的對應性在於成對半邊探針(probe-half)與多態性基因組位點(如單鹼基對多態性)雜交並且與所述位點精確鄰接的能力,而不是基於針對ID序列使用的雜交標準(見圖10)。為了定義SNP探針家族,僅考慮用每種SNP探針測試的一個等位基因。僅考慮用具有最小等位基因頻率的特定SNP探針測試的SNP等位基因。該等位基因定義為「最罕見的SNP等位基因靶」。「等位基因頻率」是在一個物種的群體中,針對基因組中在特定基因座的特定等位基因定義。等位基因頻率是在群體中,在該基因座的所有等位基因中特定等位基因所佔的分數(King,等人,A dictionary of genetics(OxfordUniversity Press,New York,1990)。用於確定等位基因頻率的群體樣本必須包括至少100個(不是純系相關的(non-clonally related))個體。SNP探針家族是一組SNP探針,該組SNP探針中最罕見的SNP等位基因靶都出現在一個個體的基因組中。
「標記」或「標記序列」是指可以摻入更大寡核苷酸或探針中的非生物的寡核苷酸序列。標記序列可以用作檢測序列。例如,在檢測陣列中的標記序列可以用於通過雜交而檢測在所擴增的探針中的(互補)標記序列。當不同的診斷序列不能用其它方法通過雜交進行區分時(如SNP探針;見下文),可以使用標記序列通過雜交將探針相互區分開來。
同樣,「標記序列家族」或「標記家族」是指對應於一個探針家族的一組標記序列。例如,在下面的實施例5中,將多態性探針或SNP探針的集合與人類基因組DNA樣品雜交。可以被連接和擴增的SNP探針集合的亞組是一個SNP探針家族。由於一個SNP探針家族對應於一個人類個體的基因型,因此該家族的定義與ID探針家族相似。所述SNP探針家族包含一個標記序列家族(一般構建SNP探針時加入識別標記序列)。因此,該SNP探針家族與所述標記探針家族相應,並且可以通過與在檢測集合中的相應標記序列家族雜交而鑑定。
相應的序列組是指在各組的元件之間存在一一對應。例如,考慮與一個ID序列集合相應的ID探針集合。每種ID探針包含位於一種ID序列中的一個ID位點,而每種ID序列對應於一種ID探針。或者,考慮由與一個多態性探針集合相應的標記集合組成的檢測集合。在該檢測集合中的每種標記對應於在所述多態性探針集合中一種多態性探針中的一種標記。相似的,一個標記序列家族可以與一個多態性探針家族相應。
「最小基因組起源」是指一組序列、探針、寡核苷酸或標記可以雜交的不同基因組的最小數目(或不同基因組代表的最小數目)。例如,一組ID序列的最小基因組起源等同於由一組ID序列可以構建的家族的最小數目。因此,例如,一組ID序列,該組中每種序列對應於一種不同人類基因的一個蛋白編碼區段,該組ID序列的最小基因組起源是一,因為整組序列可以與一個人的基因組雜交。作為另一個例子,考慮由一對類群特異性腺病毒序列和一對類群特異性呼吸道合胞病毒序列組成的一組序列。這樣一組序列的最小基因組起源是2,因為2個基因組的序列,即腺病毒和呼吸道合胞病毒的序列是在比較雜交條件下足以與所有4種序列雜交的最小基因組數目。該組4種ID序列組成2個ID序列家族,只要每對病毒ID序列在來源的基因組中被分開大於等於3000bp(見上面「家族」的定義)。
考慮在表1中舉例說明的一個更複雜的例子也是有幫助的,在該例子中,一組ID序列可以用於測試患有急性胃腸疾病的患者中某些病原體的存在。注意在表1每個格子中的序列組可以與單個個體的基因組DNA雜交。(在表1中有9個這樣的格子。)同時,注意不可能使表1所述9個格子中包含的所有序列與少於9個個體的基因組DNA雜交。因此,表1中ID序列組的最小基因組起源是9。表1.一個最小基因組起源為9的ID序列集合。下表中的每個格子包括一個ID序列「家族」(即可以與一個基因組雜交的一組序列)。
應用於SNP探針集合和標記序列集合的最小基因組起源的定義如下文所定義。一個SNP探針的集合包括多個SNP探針家族,並且每個SNP探針家族對應於一個個體的基因型。然而,與ID序列集合不同,一個SNP探針集合的最小基因組起源一般是一。這是因為SNP探針一般可以與任何靶物種的基因組以不多於一個鹼基對錯配進行雜交。
現在考慮一個人類SNP探針集合,所述SNP探針集合的每種探針都包括一種獨特的標記序列部分。同時,考慮包含與所述SNP探針集合中的標記序列相應的一個標記集合的檢測陣列。所述SNP探針集合的最小基因組起源一般是一,因為所有成員都可以與任何特定人類基因組雜交。然而注意與此不同,對應的標記集合可能具有大的最小基因組起源。為理解這一明顯自相矛盾的說法,認識到以下事實是有幫助的所述SNP探針集合由多個SNP探針家族組成,其中每一個SNP探針家族對應於一個個體的基因型。在SNP探針家族中的標記序列組是標記序列的對應家族。在所述檢測陣列中的對應標記序列家族可以與這樣一個SNP探針家族雜交。然而,在所述標記集合中的其它標記序列不能與該SNP探針家族雜交。因此,與一個SNP探針集合相應的一個標記序列集合的最小基因組起源等於所述SNP探針組合中的家族數目,即使所述SNP探針組合本身的最小基因組起源是1。
最小基因組起源的定義在應用於標記集合時依賴於下面的定義。回憶針對特定SNP探針的「最罕見SNP等位基因靶」的定義(見上面「SNP探針家族」的定義)。我以相似方式定義「最常見SNP等位基因靶」。因此,對於用特定SNP探針測試的等位基因靶,一個等位基因被確認在一個物種內是最罕見的,而一個等位基因被確認是最普遍的。一種SNP探針的「平均等位基因頻率」定義為最常見的等位基因靶和最罕見的等位基因靶的等位基因頻率的平均值。例如,假如用一種SNP探針可以檢測到的等位基因以0.85、.06和0.002的頻率出現,那麼平均等位基因頻率就是0.426(即,(0.85+0.002)÷2))。「平均等位基因頻率的乘積」(P)定義為在所述SNP集合中所有SNP的等位基因頻率的乘積。因此,例如,考慮一個假設的測試,其中用SNP探針測試36個人類疾病突變,每個人類疾病突變都以0.001的等位基因頻率出現,並且所述每個突變都與一個以0.999的等位基因頻率出現的正常等位基因相關。對於所述36種SNP中的每一種來說,平均等位基因頻率是0.5(即,(0.001+0.999)÷2))。因此,平均等位基因頻率的乘積(P)是0.536=1.46×10-11。(注意對於實際的SNP探針集合來說,等位基因頻率和平均等位基因頻率的值將隨著不同探針而各不相同。此外,注意一種SNP探針的等位基因頻率不一定要加到1.0,因為並不是所有出現的等位基因都要用SNP探針進行測定)。
由於在實踐中可能難以確定對於一個特定物種的包含一組SNP探針的最小家族數,我以下面方式定義與一個SNP探針集合相應的標記集合的最小基因組起源。一個標記集合的最小基因組起源定義為(10-10)(P)-1,其中P是平均等位基因頻率的乘積。因此,在前面的例子中,對應於人類疾病突變SNP探針集合的標記集合的最小基因組起源是(10-10)(1.46×10-11)-1=6.9。與此不同,如上文所解釋的,對應SNP探針集合的最小基因組起源是一。
我提供下面的例子,幫助理解與一組SNP探針相應的一組標記的最小基因組起源的定義的生物學解釋。考慮一個33種標記的組,該組標記與一組非連接的人類SNP探針相應,其中每種SNP探針檢測兩個等位基因,這兩個等位基因的等位基因頻率都是0.5。該組標記的最小基因組起源是(10-10)(P)-1=(10-10)(0.533)-1=0.85,接近於一。注意最有可能發現的基因型是在這33個SNP基因座中的每一個都是雜合的個體(在這樣一個基因座上雜合的概率是0.5)。發現具有最有可能的基因型的個體的概率是0.533=1.2×10-10。預期這樣一個個體出現的概率稍稍小於在2000年總人口中出現一個(約6×109)。
檢測集合可以包含與包括ID探針和SNP探針的探針集合相應的檢測序列(即所述檢測集合具有ID位點序列和標記序列)。這樣一個集合的最小基因組起源是所述ID位點的最小基因組起源加上所述標記序列的最小基因組起源的總和。假如所述標記集合覆蓋多於一種的物種,那麼所述集合的最小基因組起源是對應於每個物種的最小基因組起源的總和。
「ID序列集合」是指對應於多個ID序列家族的一組ID序列。也就是說,一個ID序列集合的最小基因組起源大於1。此外,由於每個家族最少包含2種(完全分離的)ID序列,故一個ID序列集合最少具有4個ID序列成員。一個ID序列集合的特徵是一種生物的基因組不足以給出與所有個別ID序列的陽性雜交信號。ID序列集合不一定與樣品在物理上分開。而且可以僅僅將這樣一個集合概念化,以方便設計ID探針用於構建探針集合(見下文)。圖1圖示了在表1中描述的最小基因組起源為9的ID序列集合。
「ID寡核苷酸集合」或「ID探針集合」是指寡核苷酸或探針的集合體,其中每種寡核苷酸或探針對應於一個特定ID序列集合中一種ID序列的全部或部分的核苷酸序列。這樣的集合設計用於通過雜交,檢測在樣品中存在的對應於兩種或更多種不同基因組的核酸序列(見下文)。最好在探針集合中,探針的序列和/或探針在水溶液中的濃度是已知的。
「SNP探針集合」或「單核苷酸多態性探針集合」或「多態性探針集合」是指包含多於一個SNP探針家族的一組SNP探針。
「標記序列集合」或「標記集合」是指與一個探針集合相應的一組標記序列。也就是說,在一個標記序列集合中每種標記序列與一個探針集合的一種標記序列(或與一種標記序列的反向互補物)互補。標記序列集合可用於在基因組分布分析中將單核苷酸多態性基因型(難以通過雜交檢測)轉變為健全的雜交基因型(見下面的實施例5)。
某些物理特性或化學特性的「集合」是指與核酸序列集合相應、涉及所述物理特性或化學特性的一組值。例如,存在與一個ID探針集合的分子量一一對應的一個分子量集合。這樣一個分子量集合可以用作檢測集合或檢測數列,以確定一個ID探針集合中樣品選擇的亞組的元件的身份。可以通過質譜,分析所述探針亞組,並將觀察到的分子量與所述分子量集合(即原始ID探針集合的分子量)比較。
「檢測集合」或「檢測序列的集合」是指稱為「檢測序列」的序列集合體,其中所述序列集合體中的所有序列都對應於一個序列、探針、寡核苷酸或標記的集合(如一個ID探針集合或SNP探針集合)的所有或部分成員。也就是說,檢測集合與序列集合、探針集合、寡核苷酸集合或標記集合相應。這樣的集合設計用於檢測(通常是通過雜交,但不一定通過雜交)下列集合中在診斷上能提供信息的亞組ID探針集合、ID序列集合、多態性探針集合或其它包含在診斷上有用序列的基因組代表的集合。如下文所提到的,檢測集合的成分(即檢測序列)可以排列成為二維陣列,以利於診斷探針(如,已經與樣品的核酸分子內的ID序列雜交的ID探針)的鑑定。或者,所述檢測集合的元件可以與診斷探針在液體中接觸。如下文所提到的,可以在接觸檢測集合之前,擴增已經與樣品的核酸分子內的ID序列雜交的ID探針。
檢測集合也可以是與序列集合、探針集合、寡核苷酸集合或標記集合一一對應(即與之相應)的一組物理或化學特性的值。例如,ID探針集合的成員的分子量表或分子量數列是一種類型的檢測集合。這樣一個檢測集合可以用於質譜分析鑑定ID探針集合的特定亞組。可以使用質譜確定臨床樣品所選擇的ID探針家族的分子量。然後將該ID探針家族的分子量與分子量檢測集合(即原始未經選擇的ID探針集合的分子量)相比較。用這種方法,鑑定選定的ID探針,這進而導致鑑定所述臨床樣品中的基因組。或者,如下面的實施例3所述,可以通過與一個寡核苷酸檢測集合的雜交檢測探針家族。然後可以通過確定所述寡核苷酸的分子量,並將所述分子量與另一個檢測集合相比較,鑑定所述探針選定的檢測寡核苷酸亞組,所述檢測集合是所述寡核苷酸檢測集合的元件的分子量數列。
「二維檢測陣列」是指ID序列、ID寡核苷酸、ID探針或檢測序列的集合,所述ID序列、ID寡核苷酸、ID探針或檢測序列已經通過非電泳方法排列到基本上兩維的(即平面的)固相支持體上,例如尼龍濾膜或聚賴氨酸包被的玻璃載玻片上。
「基因組分布分析測定」是指本發明的某些方法。
「基因組分布分析指紋」或「指紋」是指根據通過基因組分布分析擴增和檢測的診斷探針,推測在生物樣品中存在的診斷序列(如ID探針或SNP探針)亞組。
「分類單位」或「系統發生類群」是指單系群的集體成員,所述單系群是從一種共同祖先生物類型(或者是已知的,或者是假設的)遺傳下來並且包括所述共同祖先生物類型的生物類型類群。注意為本發明的目的,分類單位以並不暗示任何分類學水平的一般意義使用。因此,例如,分類單位在亞種等級上定義,也在屬、綱、門等的等級上定義。
「獨立分類群」或「獨立分類單位」是指沒有重疊成員的分類單位。因此,細菌腸桿菌屬和沙門氏菌屬是獨立分類單位。然而,腸桿菌屬和由大腸埃希氏菌O157H7病原體組成的分類群不是獨立的分類單位,因為該致病菌株的所有成員也都是該屬的成員。
「分類學等級」是指一個分類單位在系統發生等級體系中的位置。術語分離物、生態型、亞種、物種、屬、科、綱、目、門、界和超界是分類學等級的例子。
生物的「界「是指下面列舉的其中一種病毒、細菌、古細菌、真菌、原生動物、植物和動物。
「獨特基因組」是指具有與所有其它基因組的核酸序列(除了遺傳上相同的生物的基因組的核酸序列)不同的特定核酸序列的基因組。具有獨特基因組的不同生物可以是不相關或密切相關的。認為純系親緣體(clonal relatives)具有相同的獨特基因組,所述純系親屬如在一個細菌菌落內在遺傳上同源的生物,。
「樣品」是指由其製備核酸並測試特定核酸序列的存在的材料集合體。例如,樣品可以是糞便樣品、尿樣品、血液樣品或痰樣品,或者可以是其它這樣的在醫院內常規收集的樣品。或者,樣品可以是在培養皿中培養的微生物單個菌落。樣品也可以是人類法醫學樣品、食品樣品、環境樣品或純核酸。
「擴增方法學」或「擴增方法」是指用於線性或指數增加核酸分子拷貝數的技術。擴增方法的例子包括連接酶鏈式反應、PCR、依賴於連接的PCR、轉錄介導的擴增、鏈置換擴增、自身支持性序列擴增、Qβ-複製酶介導的擴增、滾環擴增等等。
「擴增產物」是指應用擴增方法得到的核酸分子。
「擴增位點」或「擴增序列」是指在一種擴增方法中,介導複製或複製需要的核酸分子區。擴增位點對的例子是在PCR反應的特異性引發過程中寡核苷酸引物所結合的DNA片段或染色體上的位點對。在某些擴增方法中使用的針對RNA聚合酶如Qβ-複製酶或噬菌體T7聚合酶的啟動子序列,構成另一種類型的擴增位點。
「基因組扣除」是指導致分離基因組差異序列的方法。例如這樣的雜交方法其中「+」DNA基因組差異樣品(見下文)與「-」DNA基因組差異樣品退火,隨後分離出剩餘的非退火「+」序列。另外一個例子是使用計算機比較兩個序列組,找到在第一個序列組存在但在第二個序列組不存在的序列。假如所述「+」樣品中的一段序列(30個鹼基長)不能在扣除雜交條件下與所述「-」樣品雜交,那麼就認為該段序列在所述「-」樣品中不存在。也就是說,在扣除雜交條件下,該序列不能與所述「-」樣品中的序列形成解鏈溫度(Tm)比所述扣除雜交條件的溫度減5℃要高的的雜交體。可以根據試驗確定雜交,或者可以根據已知序列預測雜交。
「基因組差異樣品對」是指用於發現基因組差異序列、對應於基因組DNA或RNA的兩組核酸序列。例如,在基因組扣除實驗中,「+」DNA樣品和「-」DNA樣品是基因組差異樣品。當通過計算機分析比較兩個基因組時,每個基因組就是一個基因組差異樣品。基因組差異樣品可以來自於一種生物或來自於一個生物類群;基因組差異樣品可以包含已擴增或未擴增的核酸,例如聚合酶鏈式反應(PCR)擴增的DNA;基因組差異樣品可以由已經分級分離的核酸,例如大小級分或擴增級分組成;基因組差異樣品可以是推導的核酸序列,如來自完全測序或幾乎完全測序的基因組的序列的計算機代表;而且基因組差異樣品可以由RNA、DNA或任何其它密切相關的核酸分子組成。只有在所述「+」樣品中的許多但不是所有序列也在所述「-」樣品中存在時,基因組差異樣品才有意義。
「富集的基因組」、「富集的基因組級分」、「富集的基因組差異樣品」或「基因組代表」是指經過一個富集程序的基因組、基因組級分或基因組差異樣品,所述富集程序產生原始基因組或基因組差異樣品的選定部分。為基因組分布分析的目的,富集的基因組具有兩個重要特性(1)它們提供健全的基於雜交的診斷學(與通過雜交檢測SNP的方法相比),以及(2)通過擴增產生的富集的基因組級分是從小樣品(例如法醫樣品)產生材料的有效途徑。例如,可以通過基因組分布分析,測試通過Alu-PCR產生的在富集的基因組中位於Alu重複序列之間的大量多態性序列(見實施例4),從而鑑定法醫頭髮樣品的來源。所述基因組富集可以基於大小分級分離、差異擴增(如Alu-PCR或SNP探針的差異擴增)、或任何其它分級分離方法。表2.基因組代表的例子和它們用於檢測序列的用途
附圖簡述圖1是最小基因組起源為9的ID序列集合的示意性說明。
圖2A是一個系統樹的示意性說明,展示了一個假設的、但典型的菌株類群的祖先關係,其中所述菌株類群包括致病菌株(如菌株1)和非致病菌株(如菌株8)。
圖2B是本發明一種方法的示意性說明,其中使用一個相關菌株類群內兩種生物(如菌株1和菌株8)的基因組扣除,產生可以用於該類群內任何菌株(如菌株2-7)的指紋分析的基因組差異序列。
圖2C是本發明的一種方法的示意性說明,其中通過從幾種生物匯集基因組核酸分子而產生基因組差異序列。例如,匯集幾種病原體的基因組核酸分子可以產生「+」樣品,匯集幾種非病原體的基因組核酸分子可以產生「-」樣品。通過該扣除實驗獲得的基因組差異序列包含至少在一種致病(「+」)菌株中出現但不在任何一種非致病(「-」)菌株中出現的序列。
圖3是一種能夠用於本發明方法的二元ID探針的示意性說明。在與染色體ID序列雜交後,將左半邊ID探針和右半邊ID探針相互連接。然後使用對應於引物位點L和引物位點R的引物擴增所述連接產物。隨後通過與包含所述ID探針或標記序列的檢測陣列的雜交,鑑定所擴增的ID探針產物。
圖4是不同類型檢測陣列的例子的示意性說明。
圖5是本發明一種方法的示意性說明,在所述方法中,使用樣品對ID探針的選擇,通過基因組分布分析掃描臨床樣品中的多種病原體。在該方法中,將來自樣品的DNA澱積在固相支持體如尼龍濾膜上。隨後使多對半邊探針與結合的樣品DNA雜交,然後連接正確雜交的探針,將探針從所述濾膜上洗脫下來,擴增以在檢測陣列中進行檢測。
圖6是用於從腸沙門氏菌獲得基因組差異序列的基因組扣除策略的示意性說明。在該策略中,將腸沙門氏菌的亞種分為兩個亞群,即X群和Y群。進行交互扣除,獲得每一群的基因組差異序列。
圖7A是大腸埃希氏菌類群的部分系統樹的示意性說明。病原體標為黑色,非病原體標為白色。
圖7B是用於獲得大腸埃希氏菌O157H7的基因組差異序列的策略的示意性說明,其中在大腸埃希氏菌O157H7(「+」基因組差異樣品)和非致病菌株(「-」基因組差異樣品)之間進行基因組扣除。
圖7C是用於獲得弗氏志賀氏菌(Shigella flexneri)的基因組差異序列的策略的示意性說明,其中在弗氏志賀氏菌(「+」基因組差異樣品)和非致病菌株(「-」基因組差異樣品)之間進行基因組扣除。
圖8A是用於滾環擴增的一種ID探針(包含一種帶缺口的環狀探針和一種缺口探針)的示意性說明。
圖8B是在對連接的滾環模板進行滾環擴增時使用的成對引物(一種生物素化滾環引物和一種生物素化分支引物)的示意性說明。
圖8C是使用圖8B舉例說明的引物和連接的滾環模板進行高分支滾環擴增(hyperbranched rolling circle amplification)的示意性說明。
圖9A是一對生物素化DNA捕獲探針、一對擴增探針以及一種缺口探針的示意性說明,如所指出的,所述每種探針都與一種ID序列雜交。
圖9B是使用一對生物素化引物擴增三聯連接的探針的示意性說明。
圖9C是在一種缺口探針序列和一種用於質譜檢測的寡核苷酸之間雜交的示意性說明。
圖10是SNP探針雜交選擇的示意性說明,其中連接和擴增依賴於在SNP位點的匹配。
圖11是本發明三類一般性基因組分布分析方法的共有特徵的示意性說明。
發明詳述基因組分布分析是用於鑑定生物和對生物分型的方法,與現有技術相比,該方法提供幾個顯著的好處。在醫學診斷學中,該方法可以在臨床診斷設置中實施,提供了治療的好處和流行病學的好處。可以同時、快速並且靈敏地掃描複雜生物樣品中大量病原體特異性序列的存在。基因組分布分析產生高解析度的遺傳指紋,使得能夠用該方法區分非常相似的菌株。這對於在病原體和密切相關的非病原體之間進行區分、在涉及疾病分別爆發(separate outbreak)的相似病原體之間進行區分、在相同病原體的抗生素敏感菌株和抗生素抗性菌株之間進行區分是重要的。對於掃描患者體內多種遺傳標記的應用和在遺傳鑑定中的應用而言,本發明掃描許多診斷序列的能力是重要的。
基因組分布分析使得能夠進行一種新型的表現特異性測試,檢測患者樣品中全面的致病病原體組。例如,基因組分布分析使得可以為患有呼吸系統症狀(respiratory symptom)的個體提供快速掃描所有常見呼吸系統病原體存在的單一測試,所述常見呼吸系統病原體包括不同病原體如細菌、病毒和真菌。
目前用於對生物分型的方法常常涉及培養所述生物,這需要使所述生物生長的時間,需要不同的培養條件,並且在醫院設置中對於許多生物(包括一些細菌、大多數病毒和真核寄生蟲)可能是不可行的。由於所述新方法不需要培養,該方法使得能夠在幾小時內獲得結果(而不是目前方法所需的幾天和有時幾周)。
基因組分布分析的其它好處有該方法需要最少的臨床樣品處理、產生以前未鑑定生物的指紋、簡單地實現陽性內部對照和陰性內部對照、不需要凝膠電泳以及該方法適用於自動化的形式。
基因組分布分析將高度平行、基於雜交的篩選與靈敏的核酸擴增方法結合起來,使得能夠在一次測定中鑑定廣泛範圍的生物類型。一次測試可以掃描生物樣品中一類有用的DNA序列多態性,即ID序列的存在。ID序列是特定類群內生物基因組所特有的核酸序列。一次測試也可以同時掃描多種單核苷酸多態性(SNP),即另外一種類型的基因組變異。此外,基因組分布分析可以在一次測試中檢測ID序列和SNP的混合物。
兩類ID序列可以用於鑑定生物類群特異性序列和基因組差異序列。在相關生物類群的所有成員中存在的ID序列稱為類群特異性序列。類群特異性序列可用於確定某個類群的成員是否存在於生物樣品中。例如,HIV類群特異性序列的存在指出HIV類群中一種病毒的存在。可以通過基因組資料庫的計算機比較,或通過用於分離保守序列的分子方法如符合克隆(coincidence cloning),可以分離類群特異性序列。
僅在一個相關生物類群的某些成員中存在的ID序列稱為基因組差異序列。基因組差異序列組對於獲得生物的高解析度指紋尤其有用。因此,這種類型的ID序列有利於將一個類群中的一個成員與該類群內的另一個成員區分開來。對生物進行指紋分析對於流行病學、法醫學、以及快速確定細菌是否可能對某種抗生素有抗性是重要的。基因組差異序列可以如下製備例如,用兩種不同生物的基因組進行扣除雜交程序,或對兩組不同生物的匯集的基因組進行扣除雜交(見下文)。
基因組分布分析掃描複雜生物樣品中的ID序列,ID序列是DNA片段,其存在是特定類型生物的指示。兩種類型ID序列可以用於確定一種生物的存在。類群特異性序列是特定分類群中(即在成員通過譜系密切相關的生物類群中)基本所有生物都共有的。與此不同,基因組差異序列將特定分類群內的生物區分開來。一個基因組差異序列家族有用的診斷屬性在於在一個類群中的密切相關菌株的基因組中存在該家族成員的獨特亞組。
基因組分布分析的診斷能力部分是由於它能夠測試ID序列的複雜混合物,所述ID序列是龐大並且不同組生物類型所特徵性擁有的。因此,擴展這樣的診斷ID序列組的早前提出的定義是有用的。
ID序列「家族」是可用於鑑定特定生物類群的成員的一組類群特異性序列和/或基因組差異序列。在一個家族內ID序列組的定義特性在於所有的成員都能夠與一個「獨特基因組」雜交(見表1和上文的定義)。例如,一個ID序列家族可以由100個ID序列組成,其中包括80個鑑別大腸埃希氏菌O157H7病原體類群的菌株(來源於菌株DEC3B的菌株除外)的基因組差異序列、18個存在於所有大腸埃希氏菌O157H7菌株中的類群特異性序列、以及2個存在於大腸埃希氏菌所有菌株中的類群特異性序列。注意雖然這些序列可用於專門鑑定大腸埃希氏菌O157H7類群中的病原體,但所有這些序列都可以與一個獨特基因組,即大腸埃希氏菌O157H7 DEC3B菌株的基因組雜交。
基因組分布分析的獨特特徵是該方法可以用於一次掃描樣品中許多不同家族的存在。由多於一個家族組成的一組ID序列稱為一個ID序列「集合」。一個集合中家族的數量反映出該集合可以測試的不同生物類群的數量。一個集合內的家族數量又可以用稱為集合「最小基因組起源」的數量來準確定義。「最小基因組起源」是組成該集合的所有序列可以雜交的「獨特基因組」的最小數量。例如,基因組分布分析可以用最小基因組起源為5的一個集合同時測試痰樣品中結核分枝桿菌、軍團菌、Coccidoides immitus、流感病毒和呼吸道合胞病毒的存在。因此,基因組分布分析在一次測試中鑑定廣泛範圍生物的能力是該方法掃描樣品中具有大「最小基因組起源」集合的ID序列存在的能力的結果。
相似的,在非傳染病的應用例如人類遺傳篩選和法醫學中,可以使用基因組分布分析掃描樣品中單核苷酸多態性的集合。與ID序列集合的定義相似,SNP集合定義為一組多家族SNP。一個SNP家族就如一個ID序列家族一樣,反映一個個體的基因型。注意ID序列家族根據成員ID序列與單個個體的基因組雜交的能力來定義,而SNP家族則是根據與單個生物的基因型的對應來定義。
應用基因組分布分析進行基因型分析(genotyping)的一個好處是可以使用健全的雜交測定來檢測SNP。在一些大規模SNP基因型分析應用中,檢測區分形成完全配對雙鏈體(perfect duplex)的寡核苷酸雜交體和形成帶有單鹼基對錯配的雙鏈體的寡核苷酸雜交體的SNP基因型。與此不同,基因組分布分析可以測試寡核苷酸標記序列的存在或不存在,這是一個更容易的工作。為完成這種更健全的雜交測試,可以將獨特的非生物學標記序列摻入每種SNP探針。因此,這樣的SNP探針集合與標記序列集合相應,並且每個SNP家族與一個標記序列家族相應。在基因組分布分析測定的檢測步驟中,可以使用由一個標記序列集合構成的一個檢測集合,檢測一個對應於從單個個體分離的基因組DNA樣品的基因型的擴增的SNP探針家族(包括對應的標記序列家族)(見圖3)。
優選的基因組分布分析方法通用設置包括以下步驟步驟1指定一個包括基因組差異序列和類群特異性序列的ID序列集合,其中將在給定測試中探測所述集合。該步驟涉及選擇需要檢測的生物和選擇診斷ID序列的家族。
步驟2設計和製備一個對應於要在生物樣品中檢測的ID序列集合的探針集合。同時設計和製備對照探針。
步驟3設計和製備一個對應於所述ID探針集合的檢測集合。同時設計和製備對應於對照探針的對照序列。在一個優選的實施方案中,製備兩維的檢測陣列。
步驟4製備生物樣品。該步驟涉及裂解樣品中的生物,以便所述生物的核酸分子能夠進行雜交。例如,處理樣品如大便樣品或呼吸系統樣品,以便來自所述樣品中的生物的核酸分子結合到固相支持體上。
步驟5從所述ID探針組合中選出與所製備樣品中的基因組序列雜交(結合)的ID探針。然後通過洗滌除去未雜交、未結合的探針。
步驟6擴增與所述樣品中的基因組序列結合的ID探針。
步驟7通過所擴增的探針序列與檢測集合的雜交,鑑定樣品選定的ID探針。
步驟8通過所述樣品選定的ID探針與所述生物樣品的原位雜交,定量所述生物樣品中的靶生物。
(注意為了簡單化,優選通用設置的步驟根據使用ID序列的基因組分布分析描述。對於用於使用SNP的基因組分布分析的該方法的修改,見實施例5)這些步驟的每一個步驟如下更詳細描述。
步驟1指定一個包括基因組差異序列和類群特異性序列的ID序列集合,其中將在給定測試中探測所述集合。該步驟涉及選擇需要檢測的生物和選擇診斷ID序列的家族。
基因組分布分析的第一個步驟涉及選擇需要檢測的生物類型。例如,對於醫學應用,可以選擇人類病原體;為檢測食物腐敗,可以選擇導致食物毒性的細菌;為法醫學目的,可以選擇多個人類個體等等。為特定測試選擇的生物可以在它們的遺傳組成上相差極大,例如不同界的成員(即病毒、細菌、古細菌、真菌、原生動物、植物和動物);或者,所選擇的生物可以是一個更小的類群如一個種的成員。基因組分布分析的一個重要的應用是檢測人類體液樣品中或大便中的病原體,所述人類體液樣品如血液、尿、腦脊液或痰。(本方法對於應用於多種其它組織樣品也是重要的。)根據組織樣品的來源以及患者的症狀,決定需要鑑定的重要生物類型。例如,可以選擇檢測通常是肺炎的病因的病毒、細菌和真核寄生蟲。
一旦決定了需要通過基因組分布分析測定鑑定的生物類型,就為該測定選擇一個ID序列集合。由多個ID序列家族組裝所述集合,其中每個ID序列家族都是在所述測定中需要檢測的一種生物類型的診斷性序列。所述ID序列集合不一定在物理上是分離的。當然,可以僅僅將這樣一個集合概念化,以利於設計用於構建探針集合的ID探針(見下文)。
如上文所述,所述ID序列集合包括兩種有用的序列類型基因組差異序列和類群特異性序列。對於任何特定靶生物類型來說,是否包括類群特異性序列、基因組差異序列或二者都包括的選擇取決於與所述特定生物類型相關的診斷用組織。
當重要的是需要知道一個生物類群的任一成員是否存在於樣品中時,類群特異性序列在診斷上是最有用的。例如,如果重要的是需要知道腸沙門氏菌類群的任一成員是否存在於胃腸樣品中,則類群特異性樣品是有幫助的。當測試病毒如C型肝炎病毒時,也可能選擇類群特異性樣品。
與類群特異性樣品不同,當需要在一個類群內區分密切相關的菌株時,基因組差異序列尤其有用。例如,當重要的病原體(如大腸埃希氏菌O157H7)與出現在同一組織中的菌株(如共生的大腸埃希氏菌)密切相關時,就是這種情況。當需要傳染因子的指紋時,基因組差異序列也是有價值的。指紋分析或高解析度菌株鑑定是追蹤和遏制傳染病爆發(包括基於醫院的感染)的有力流行病學工具。在治療上,指紋分析,尤其是在快速、不依賴於培養的測試中的指紋分析,提供了比目前實踐快得多地確定需要給予何種抗生素的可能救命的機會。
對於需要在基因組分布分析測定中檢測的每一種生物類型,使用標準方法選擇包含類群特異性序列和/或基因組差異序列的ID序列家族,所述標準方法如在下文和在實施例中描述的那些方法。假如新分離出的ID序列的序列還是未知的,就通過標準方法測定該序列。然後將對應於不同並且可能不相關的生物類型的各種ID序列家族組織成為一個集合。
然後使用商業化可得的寡核苷酸合成方法或服務,通過從質粒合成重組DNA,或通過用於產生足量純DNA分子的任何其它方法,設計併合成對應於所選擇的ID序列的探針集合。給定ID序列的探針可以包括一個、兩個或幾個寡核苷酸以及用於檢測的附加部分。至少所述探針的一部分即ID位點設計用於與來自測試生物的ID序列核酸分子雜交。
使用基因組扣除分離基因組差異序列。基因組差異序列用於將一個菌株與一個密切相關的菌株區分開來。基因組差異序列家族具有這樣的特性該家族中不同序列亞組存在於不同菌株中。基因組分布分析可以確定在臨床樣品中出現的基因組差異序列家族的亞組。這樣就準確鑑定了在樣品中存在的一個菌株。基因組分布分析優於現有測定的一個好處是可以同時調查許多不同家族,其中每個家族都能夠對一個特定生物類群進行指紋分析。
可以通過對致病菌株和相關的非致病菌株進行基因組扣除而分離可用於臨床診斷的基因組差異序列。一些基因組差異序列具有重大的臨床重要性。例如,近年來逐漸了解致病細菌常常帶有「致病性島(pathogenicity island)」,即包含致病性所需的多個毒性基因的連續DNA序列段。密切相關的非致病菌株一般缺乏致病性島。因此,致病性島是有用的基因組差異序列。其它(可能大多數)基因組差異序列沒有臨床重要性,但對於菌株鑑定仍然是非常有價值的。值得注意的是在類群特異性序列和基因組差異序列間的區別有時是不清楚的。例如,可以將大腸埃希氏菌O157H7致病性島看作基因組差異序列,因為它出現在大腸埃希氏菌的一些菌株中,但不出現在其它菌株中。或者,同一序列可以看作是類群特異性序列,因為它出現在由大腸埃希氏菌O157H7菌株組成的分類單位的所有成員中。不考慮有時出現的不明確性,這些序列是有用的診斷ID序列。
可以通過使用幾種基因組扣除方法中的一種,分離基因組差異序列家族(如Straus,1995,見上文;Diatchenko等,Proc.Natl.Acad.Sci.U.SA.936025-6030,1996;Tinsley等,Proc.Natl.Acad.Sci.U.S.A.9311109-11114,1996)。基因組扣除分離在一個菌株(「+」菌株)的基因組中出現,但不在相關菌株(「-」菌株)的基因組中出現的DNA序列。基因組扣除的產物是基因組差異序列家族整個組與所述「+」菌株雜交,沒有一個序列與所述「-」菌株雜交,並且獨特的亞組與密切相關的菌株雜交。基因組差異序列家族的一個普遍特性是在與用於製造所述基因組差異樣品的菌株(即用於基因組扣除的菌株)密切相關的菌株的基因組中,所述成員以不同組合出現。該基因組差異序列家族的存在於個別菌株內的獨特亞組構成了高解析度指紋。但是,注意來自基因組扣除的整個基因組差異序列家族可以與一個菌株雜交,即用於製造「+」基因組扣除樣品的菌株。(在使用多於一個菌株製造所述「+」基因組差異樣品的情況下,扣除的產物可以構成多於一個家族。)基因組扣除一般使用扣除雜交和親和層析,從「+」和「-」基因組差異樣品中純化基因組差異序列(Straus,1995,見上文)。首先製備來自兩個相關菌株(「+」菌株和「-」菌株)的基因組DNA。用限制酶切割來自所述「+」菌株的DNA,隨機剪切來自所述「-」菌株的DNA並用生物素修飾,生物素是親和性標記,允許通過與其配體抗生物素蛋白的結合而隨後除去所述「-」菌株DNA。通過使來自所述「+」菌株和所述「-」菌株的變性DNA片段復性,完成對基因組差異樣品的富集。復性後,通過與抗生物蛋白包被的珠粒的結合,取出生物素化序列以及所有已經與所述生物素化序列雜交的序列。然後重複該扣除過程幾次。在每一個循環中,來自前一輪扣除的來自所述「+」菌株的未結合DNA與新鮮的來自所述「-」菌株的生物素化DNA雜交。將來自最後一個循環的來自所述「+」菌株的未結合DNA連接到連接物上,並在聚合酶鏈式反應中通過使用所述連接物的一條鏈作為引物進行擴增。然後可以克隆所擴增的序列。注意進行交互扣除(即轉換「+」菌株和「-」菌株)產生一組不同的基因組差異序列。這樣的可以用於產生基因組差異序列的扣除方法是重組DNA技術領域內一般技術人員已知的,並且這樣的方法已經廣泛發表。在下面的實施例中提供其它細節。
基因組扣除的全面評述在圖2中圖解說明。圖2A顯示了具有共同祖先的一個生物類群(「分類單位」)的假設的系統樹。其中一些生物是病原體,而另一些是非病原體。圖2B圖解說明了用於分離基因組差異序列的一種策略。可以選擇一個相關菌株類群中的兩種生物(如菌株1和菌株8)製備基因組差異序列。病原體菌株1用於製備「+」基因組差異樣品,而非病原體菌株8用於製造「-」基因組差異樣品。所述扣除(圖2B)的產物是出現在菌株1中、但不出現於菌株8中的基因組差異序列。這些基因組差異序列可以用於對該類群內的任何菌株(即包括菌株2-7)進行指紋分析。使用菌株1和菌株8的基因組扣除(圖2A)可以從菌株1產生數百種不出現於菌株8中的序列。菌株2具有這些基因組差異序列中的一些,但缺乏其它的基因組差異序列。菌株5攜帶有所述基因組差異序列的一個獨特亞組,菌株7也一樣,依此類推。重要並且普遍性的發現是當應用基因組扣除於一個類群內的兩個菌株(圖2中的菌株1和菌株8以及本文描述的實施例)時,相關菌株(如菌株2和菌株5)攜帶有所得基因組扣除產物的不同亞組。
如圖2C所舉例說明的,也可以通過從幾種生物匯集基因組核酸而產生基因組差異序列。例如,可以通過匯集幾種病原體而產生「+」樣品,可以通過匯集幾種非病原體而產生「-」樣品(圖2C)。在這種情況下,通過基因組扣除分離的基因組差異序列是在所述「+」基因組差異樣品的至少一種病原體基因組中出現、但不在任何一種所述「-」基因組差異樣品的非病原體基因組中出現的序列。
不用扣除雜交,而可以使用計算機和序列比較軟體比較兩種生物或兩組生物的基因組,並因此產生基因組差異序列。例如,當靶生物基因組的序列完成或基本完成時,該方法是實用的。例如,已經報導了其序列最近已經完成的幽門螺桿菌(Helicobacter pylori)的相關菌株的基於計算機的比較(Alm等,Nature 397176-180,1999)。已經公開的分析和公眾可獲得的數據提供了對於一種或另一種菌株獨特的多種基因組差異序列。則這種分析構成了一種類型的「虛擬(virtual)」基因組扣除分析,由所述分析確定了基因組差異序列。
分離類群特異性序列。當重要的是僅僅確定某個類群的任一成員是否存在於生物樣品中時(與確定來自某個類群的哪種個別菌株不同),在通過基因組分布分析測定評估的ID序列集合中包括類群特異性序列。可以用多種方法分離類群特異性序列,包括通過基因組扣除和通過分析公共資料庫。例如,基因組扣除使用來自作為「+」基因組差異樣品的致病性結核分枝桿菌菌株的DNA,以及來自作為「-」菌株的非致病性分枝桿菌菌株的DNA,所述基因組扣除產生類群特異性序列,其中包括在所有致病性肺炎分枝桿菌菌株中共有的毒性基因。這些類群特異性序列對於測試引起肺結核的菌株的存在的是價值的ID序列。作為另一個例子,可以通過在公共資料庫如GenBank中掃描病毒基因組DNA序列,篩選在所有單純皰疹病毒的已知分離物中出現、但不在該資料庫其它類型病毒中出現的序列,從而分離針對單純皰疹病毒的類群特異性序列。
步驟2設計和製備對應於要在生物樣品中檢測的ID序列集合的ID探針集合。同時設計和製備對照探針。
在基因組分布分析的第二個步驟中,設計ID探針集合,以便該集合中的ID探針可以與步驟1中選定用於基因組分布分析的ID序列集合的成員雜交。一個ID探針可以包括單個寡核苷酸,或者在優選的實施方案中,ID探針可以包括兩個或更多個寡核苷酸。ID探針和任何其組成寡核苷酸可以包含一個或多個功能部分。
一種ID探針的一個部分即ID位點對應於一種ID序列。在本方法優選的實施方案中,ID探針集合包含多功能ID探針,其中探針序列的第一個部分對應於在步驟1中組裝的ID序列集合中的一個序列。因此,如下文所述,一個這樣的ID探針包括對應於一個ID序列的一部分的一個序列或一組序列,並且所述ID探針可以與包括所述ID序列在內的核酸分子雜交。該部分稱為ID位點。例如,這樣一種ID探針可以包含對應於一種基因組差異序列或一種類群特異性序列的ID位點。
對應於擴增序列的ID探針的部分。基因組分布分析的一個重大好處是它能夠一次完成許多序列的健全的無假象擴增的能力。通過使用非常少量的擴增序列指導大量獨特ID探針的擴增,基因組分布分析測定避免了在多重擴增中通常出現的擴增假象。為此,所述ID探針的第二個部分(除所述第一個部分外,對應於一種ID序列)可以包括一個或多個擴增序列。例如,該第二部分可以對應於一個或多個引物結合位點,或對應於核酸聚合酶如Qβ複製酶的結合位點。所述擴增部分是該集合內(包括對照序列)要擴增的大多數或所有探針所共有的。因此,可以在同一反應中有效擴增的包括ID探針和對照序列的集合(見下文)的探針組。所述探針可選的第三個部分可以包括用於檢測所擴增探針的標記序列。標記的使用在下面的步驟3中討論。
對照序列。在ID探針集合中可以包括陽性對照和陰性對照。在所述集合中可以包括並不對應於實際基因組中的序列、而對應於在樣品製備過程中加入所述樣品中的對照核酸分子的陽性對照序列。在基因組分布分析測定中,檢測到陽性對照序列指示整個測定工作正確。(當在樣品中沒有檢測到ID序列時,重要的是知道所述樣品中是否確實不存在ID序列,或者是否測試由於某種原因失敗。)在所述ID序列探針集合中也可以包括陰性對照序列。這些陰性對照序列並不對應於天然出現的序列,並且與陽性對照序列不同,這些陰性對照序列並不加入所述生物樣品中。通過基因組分布分析測定檢測到的陰性對照序列的水平指示出在所述測定中,由於不依賴於ID序列的選擇和ID探針的擴增而產生的背景水平。
二元探針(半邊探針)。在一個實施方案中,一個ID探針由一對寡核苷酸組成,即左半邊ID探針和右半邊ID探針(圖3)。每個左半邊探針和右半邊探針的內部部分包括對應於一種ID序列的鄰近部分的序列,所述ID序列如基因組差異序列或類群特異性序列。當所述半邊探針與變性ID序列雜交時,可以通過核酸連接酶連接各探針部分。如下文所描述的,半邊探針的依賴於樣品的連接導致形成可以擴增和檢測的更大分子。
在本實施方案中,每個半邊探針的外部部分包括一個擴增序列,所述擴增序列例如對應於用於聚合酶鏈式反應的引物結合位點的位點。在這樣的ID探針集合中,每個探針具有一個獨特ID序列和標記序列,但具有一對共有的引物結合位點。假如存在標記序列,則該標記序列位於其中一個半邊探針的內部部分和外部部分之間。
圖3圖解說明了一個實施方案,該實施方案使用了半邊探針、依賴於ID序列的連接、標記、以及PCR擴增與樣品雜交的半邊探針。在這個實施例中,PCR的左引物與引物位點-L序列相同,而右引物是引物位點-R序列的反向互補物。在該檢測陣列中可以包括四種不同的標記序列(tag-R、tag-R』、tag-L和tag-L』)(見下文)。所述四種標記序列與兩種互補序列雜交,所述互補序列每一個都包含在所擴增的ID探針中的兩種標記序列。
ID探針的合成和濃縮。通過標準核酸合成技術製備ID探針。確定所述ID探針的序列和所述ID探針在水溶液中的濃度。根據需要,所述ID探針在水溶液中的濃度可以不同。例如,在一個ID探針集合中,每種寡核苷酸可以以等摩爾量存在。在一個可替代的實施方案中,ID探針存在的量與包含所述對應生物的典型生物樣品中其對應ID序列的預期豐度負相關。例如,假如一個人同時受到輪狀病毒和寄生性線蟲的胃腸感染,則在大便樣品中的輪狀病毒基因組拷貝數可能比所述大便樣品中的線蟲基因組拷貝數更多。因此,使針對輪狀病毒序列的探針以有限量存在是有用的。
步驟3設計和製備對應於所述ID探針集合的檢測集合。同時設計和製備對應於對照探針的對照序列。在一個優選的實施方案中,製備二維檢測陣列。
檢測集合的作用是檢測和鑑定通過與生物樣品中的ID序列雜交而選定的ID探針集合亞組。所述檢測集合包含對應於在步驟2中組裝的ID探針集合的序列(以及對應於對於該測試中不同類型生物的存在是診斷性的ID序列的序列)。換句話說,所述檢測集合與所述ID探針集合相應。所述檢測集合中也包括對應於所述對照探針的對照序列。
所述檢測集合由可以用於檢測探針-樣品雜交事件的核酸分子組成。所述檢測集合可以包括對應於ID序列或所述探針內序列標記的序列。在基因組分布分析方法的一個實施方案中,使所述檢測集合的DNA序列變性並固定到固相支持體上,以便所述檢測集合的DNA序列可以與所加入的ID探針雜交。當在平面固相支持體上構建所述檢測集合時,該檢測集合稱為二維檢測陣列。將所述檢測序列DNA置於所述支持物上的不同位置。將DNA分子以這種方式固定到固相支持體上的方法是基因組學領域內的技術人員已知的。例如,在實施例中提到的方法可以用於該目的。或者,可以在液相中進行所述樣品選定的ID探針與所述檢測陣列的雜交,如在下面的實施例3所述。
在陣列設計的一個優選實施方案中,對應於一個類群或相關類群的檢測序列在所述陣列上相互相臨排列。這樣,檢測序列家族,即那些對給定類型生物(例如,在大腸埃希氏菌O157H7類群中的病原體)特異性的檢測序列家族就作為一組相鄰點放置在一起。此外,將對應於密切相關家族(例如大腸埃希氏菌O157H7和志賀氏菌屬)的檢測序列家族放置在所述陣列的同一區。這種組織方便了雜交結果的讀取。
所述ID探針集合所包括的陽性對照序列和陰性對照序列(見上文)也可以摻入所述檢測集合中。如上文所討論的,也將所述陽性對照序列與所述生物樣品混合,並用於指示所述測定的正確運行。所述陽性對照探針序列與所述生物樣品中的靶對照序列雜交,擴增所述陽性對照探針序列,然後使所述陽性對照探針序列與所述檢測陣列中的對應對照序列雜交。
陰性對照序列是所述測定中不依賴於病原體的背景信號的有用量度(即,儘管在所述生物樣品中不存在對應病原體,但仍被擴增的ID探針的量的量度)。與陽性對照序列不同,陰性對照序列並不與所述生物樣品混合。這樣,陰性對照序列在所述生物樣品中沒有要雜交的靶序列。所述陰性對照序列與所述生物樣品或樣品基質的非特異性結合,使得這些序列隨後被擴增並與所述檢測陣列中的對應序列雜交。
構建包含一個檢測序列集合的陣列。可以使用各種類型的檢測陣列來檢測診斷序列。圖4圖解說明了用於下文描述的實施例的檢測陣列的一些設計。
已經描述了多種用於構建核酸分子陣列的方法。用於本發明的一種優選方法是這樣一種方法其中核酸分子以高密度放置在聚賴氨酸處理過的玻璃載玻片上(見,如,Schena等,Science 270467-470,1995)。對應於ID序列的檢測序列可以作為克隆DNA(如作為質粒載體中的插入片段)、作為擴增的DNA(如由克隆序列的擴增得到的PCR產物)或作為合成寡核苷酸放置在所述陣列中。
或者,所述檢測集合可以包括一組可尋址的合成寡核苷酸標記,而不是ID序列。在這種情況下,所述標記對應於所述ID探針(如下文所述)或SNP探針(如在實施例5中所述)中的標記元件。所述陣列中的每種可尋址標記對應於在接受雜交選擇的探針集合中與特定探針序列結合的標記(見下文)。在陣列元件和探針集合之間的一一對應關係使得有可能通過觀察哪些寡核苷酸標記陣列元件與混合物中的分子雜交,鑑定所述混合物中的所述ID序列。該方法的好處是可以使用預製的陣列,因為包含同一組可尋址標記的陣列可以用於不同組探針。例如,用於檢測呼吸系統病原體的一組探針和用於檢測胃腸病原體的一組探針可以使用同一組標記。這樣,可以使用一種陣列檢測呼吸系統樣品或胃腸道樣品中的病原體。
或者,所述檢測陣列可以是在液體中與所述樣品或探針雜交的檢測序列組。檢測陣列也可以是診斷產物所比較的一組物理特性,如分子量。
步驟4製備生物樣品。該步驟涉及裂解樣品中的生物,以便所述生物的核酸分子可以用於雜交。例如,處理樣品如大便樣品或呼吸系統樣品,使得來自所述樣品中生物的核酸分子結合到固相支持體上。
通過下面的樣品製備策略達到的目標是(a)將來自廣泛來源(如培養物、菌落、痰、血液、尿和糞便)的樣品轉化成為與所述測定的隨後步驟相匹配的共有形式。裂解生物,並使它們的基因組核酸分子可以用於雜交。
(b)濃縮所述樣品,因此增加所述測定在測試稀形式的生物(如在尿樣品或血液樣品的情況下)時的靈敏度。
(c)通過去除或固定化抑制性物質,除去或減弱所述樣品中酶抑制劑的效應。
可以使用幾種樣品製備方法中的任何一種製備用於本方法中的樣品。樣品製備的一般概念是使核酸分子釋放和變性,以及除去可能干擾隨後步驟的汙染蛋白質和其它物質。可以可選地用樣品製備方法選擇性保留DNA、RNA或同時保留二者。
在製備前,可以通過標準過濾裝置過濾,濃縮稀的樣品類型如尿樣品。假如樣品來源包含大於目標生物的顆粒性物質,那麼在執行樣品濃縮步驟前,通過使所述樣品過濾通過孔徑大於目標生物的濾膜,從所述樣品中除去所述顆粒。當測試微生物時,例如,通過用平均孔徑為20到30微米的膜預過濾,將微生物與大顆粒分離開來。
或者,可以使用離心步驟將微生物與具有不同大小或密度的材料分離開來。例如,可以通過離心步驟,以導致大顆粒而不是微生物沉積在沉澱中的速度,將大顆粒物質與微生物分離開來。如在培養的微生物樣品的情況下,可選地通過離心由液相分離微生物。使用過濾和離心的組合來濃縮和富集懷疑的測試生物。然後進一步製備從通過離心處理的樣品回收的沉澱。過濾和離心都有潛在的缺點病毒可能從樣品中丟失。該步驟也可以包括其它富集方法,如親和層析、細胞分選和基於抗原的富集。
在一個優選的實施方案中,將實驗樣品(通過過濾或離心獲得的,以及有高含量微生物的粗製樣品如糞便樣品)澱積並固定到固相支持體上,所述固相支持體如尼龍濾膜、顆粒性基質或珠粒(圖5)。使用固相支持體提供了優於其它方法的幾種好處。將樣品DNA固定到固相支持體上並使其變性,準備與單鏈核酸分子探針雜交。通過固定和洗滌粗製DNA樣品,酶促步驟(如連接和擴增)的抑制劑或者被固定到基質上,或者從包含結合DNA的濾膜上洗滌下來。這是一個重要的好處,因為對臨床樣品的PCR測試有時由於樣品成分的抑制而缺乏靈敏度。最後,包括內部對照以檢測假陰性結果是簡單的。
優選的支持物是尼龍濾膜,尼龍濾膜耐用但柔韌,廣泛用於固定包含核酸分子的樣品以進行雜交測定(Church等,Proc.Natl.Acad.Sci.USA 811991-1995,1984)。將粗製樣品如痰樣品或糞便樣品塗抹到固相支持體上,如同目前當使用「抗酸塗片」測定(Koneman等,Color Atlasand Textbook of Diagnostic Microbiology(Lippincott-Raven,Philadelphia,1997))來測試痰樣品中的結核分枝桿菌時的實踐一樣。相似的,可以將在培養皿的半固體培養基上生長的細菌或真菌菌落「轉移」到尼龍濾膜上,或從培養皿塗抹到濾膜上塗抹到固相支持體上。
在一個優選的實施方案中,隨後使用破開樣品中的細胞並變性任何雙鏈DNA的程序,將樣品固定到固相支持體上。已經發展了用於破開細胞的多種方法。這些方法包括機械破碎和用鹼、離液劑、熱以及有機溶劑處理。本發明的該步驟可以加入一個或多個這樣的方法以破碎細胞。一種涉及鹼處理以及隨後的中和及洗滌的簡單方法是將樣品中的變性DNA固定到固相支持體上的優選方法(Hanahan等,MethodsEnzymol.100333-42,1983;Grunstein等,Proc.Natl.Acad.Sci.USA 723961-3965,1975;Ausubel,1987,見上文)。
假如測定產生了陰性結果,重要的是知道所述樣品是否確實不含有來自測試微生物的基因組DNA,或者是否所述測試本身失敗,即該結果是否是假陰性。由於實驗樣品中阻斷所述測定中一個酶促步驟的抑制劑的存在,可能出現假陰性。
為鑑定假陰性結果,可以在所述實驗樣品中加入一個或多個陽性對照DNA樣品。所述陽性對照DNA樣品包含不在所測試的生物範圍內出現的DNA序列。在所述探針集合中包括對應於所述陽性對照DNA樣品的探針。這些探針將在所有的測定中被擴增和檢測到,除非一個或多個測定步驟是不成功的。不能檢測到來自陽性對照的信號將由此可以指示假陰性結果。
圖5圖解說明了樣品製備、雜交-選擇、擴增以及檢測所選定的探針。在該實施方案中,通過將樣品裂解到尼龍濾膜上而製備樣品,以便使所述樣品的核酸分子變性並結合到所述濾膜上。陽性對照DNA樣品也結合到所述濾膜上。然後使可連接的半邊探針與結合的核酸分子雜交。假如一種探針的兩半都結合到一種ID序列上,則它們被連接起來以產生全長的探針,因為在所述全長探針的每個末端存在引物結合位點,所以所述全長探針可以用PCR擴增。不正確結合的半邊探針不能通過PCR擴增。
步驟5從與所製備樣品中的基因組序列雜交(結合)的ID探針集合中選擇ID探針。通過洗滌除去未雜交、未結合的探針。
使所述探針集合與已固定的樣品雜交的目的是選擇對應於所述已固定樣品中的基因組DNA、並因此能夠用於鑑定所述基因組DNA的探針,以及將這些雜交探針與非雜交探針分離開來。各種靶生物的基因組DNA與所述ID探針的獨特亞組雜交。因此,選定的ID探針特定亞組構成特定生物的基因組的指紋。所述ID探針雜交步驟設計是快速、特異性、並用來測試廣泛範圍的生物。包括陽性對照和陰性對照便利了確定所述雜交是否如所需要地起作用。
在該步驟中,使ID探針集合與變性的核酸樣品雜交。如上所述,雜交可以在水溶液中完成,或者可以用固定化在固相支持體上的核酸分子完成。通過將探針集合與所製備的生物樣品混合,並最好溫育直到至少度過一個Cot1/2時間,進行雜交。隨後洗滌、稀釋或用其它方法處理所述探針/樣品混合物,以便從已雜交的探針和所述樣品中分離出未雜交或非特異性雜交的探針分子。可以對已雜交的探針進行酶處理,如連接或核酸聚合。最後,如下一個步驟所述,從樣品核酸分子中分離已雜交的探針並進行擴增。
在一個優選的實施方案中,將樣品(包括陽性對照核酸分子)固定到固相支持體上(圖5)。使該樣品與探針集合雜交,所述探針集合包括ID探針和陽性及陰性對照。所述探針由與ID序列的相鄰部分雜交的成對寡核苷酸組成。洗滌已雜交的樣品以除去未結合的探針,然後用核酸分子連接酶處理已雜交的樣品,連接左半探針和右半探針。最後,從所述樣品中取出連接的左半探針和右半探針,並進行擴增。下面是該優選實施方案的特定版本的描述。i.將所述ID探針雜交混合物置於所述實驗樣品上,所述實驗樣品固定在固相支持體如玻璃載玻片或尼龍濾膜上。所述優選的雜交混合物包括a)一個ID探針集合,其中包括基因組差異序列和/或類群特異性序列探針。在這種情況下,所述ID探針是由兩個可連接半邊探針組成的成對寡核苷酸。在優選的體積10-100μl中,每個半探針的優選濃度是1-10nM。在優選的復性條件下,該探針濃度導致幾分鐘內與所固定的樣品的可接受水平的雜交(Britten等,Meth.Enzym.XXIX363-418,1972)。
b)一對或更多對陽性對照半邊探針,其濃度與所述ID序列的濃度相當。這些探針的序列對應於固定到固相支持體上的陽性對照DNA(固相支持體上面還結合了所述生物樣品)。
c)一對或更多對陰性對照半邊探針,其濃度與所述ID序列的濃度相當。這些探針序列在已固定的DNA樣品中沒有對應物。
d)1M NaCl/10mM EPPS/1mM EDTA,pH8.0。用標準雜交溶液取代也是可接受的(Ausubel,1987,見上文;Church,1984,見上文)。ii用玻璃蓋玻片覆蓋所述雜交混合物,最好用墊片(如CenegatorTM,目錄號#009917,BioWorld Fine ResearchChemicals)將所述玻璃蓋玻片與所述樣品分離開來。iii在約65℃溫育5-30分鐘。iv.洗掉未結合的探針。這可以通過除去蓋玻片並在嚴格條件下洗滌所述固定的樣品而完成,使得僅有無錯配或僅少數錯配而復性的ID探針保持與固定化的互補基因組DNA結合。所選擇的條件依賴於幾個因素,包括所述探針中ID序列的長度以及錯配可以接受的程度。
v.連接退火的成對半邊探針。使用T4DNA連接酶(如來自NewEngland Biolabs)連接已經退火到所固定的實驗樣品中互補基因組DNA上的相鄰半邊探針。按照廠家的指示進行連接。
vi.從所述實驗樣品取出已連接的半邊探針。通過在變性條件下的短暫溫育,從所述樣品中洗脫已經退火到所固定的實驗樣品中互補基因組序列的探針。釋放已結合的探針的優選方法是應用10mM EPPS/1mM EDTA,蓋上蓋玻片並短暫加熱到100℃。
步驟6擴增結合到樣品中基因組序列的ID探針。
該擴增步驟是基因組分布分析測定的高靈敏度的基礎。(然而,並不是在所有的應用中都需要擴增。)在取出(通過熱變性或化學變性)任何已經與所述生物樣品雜交的ID探針後,使用核酸聚合酶以及核酸分子前體擴增所述ID探針。可以使用在所述探針中存在的引物結合位點,用引物驅動擴增。或者,擴增可以是由特異性核酸聚合酶(如Qβ複製酶或T7 RNA聚合酶)結合到摻入所述探針的特異性結合位點而驅動的。可以使用幾種擴增方法中的任何一種,包括連接酶鏈式反應、PCR、依賴於連接的PCR、轉錄介導的擴增、鏈置換擴增、自身支持性序列複製、滾環擴增等。
可以在擴增期間標記所述擴增產物。例如,可以或者通過使用經合成帶有化學標記(如生物素或鹼性磷酸酶)或螢光標記的引物,或者通過使用標記的dNTP前體,標記所述擴增產物。一種特別有用的方法是使用合成的帶有生物素末端標記的引物。
在包括連接的本方法的一個優選實施方案中(圖3和圖5),存在左引物和右引物,這兩種引物對應著所述探針寡核苷酸的外部部分。所述左引物與所述左半邊探針的外部部分相同,而所述右引物是所述右半邊探針的外部部分的反向互補物。在反應混合物中未連接的半邊探針並不擴增到顯著程度。(所述探針對的未連接的左半部分沒有互補的引物,不被擴增;所述探針對的未連接的右半部分被線性擴增。)步驟7鑑定所述樣品選擇的ID探針使所擴增的探針序列與檢測集合雜交。
為產生在所述實驗樣品中存在的基因組的代表性指紋,必須鑑定所述樣品選定的擴增的ID探針。通過與由對應於(與之相應)原始未經選擇的探針混合物中ID探針的ID序列或ID寡核苷酸或標記的集合的雜交,推導所選定ID探針的身份。所述集合中的序列可以對應於ID序列的部分或對應於摻入探針內部部分和外部部分之間的標記序列。上文的步驟3描述了檢測集合的設計和構建。
可以使用多種方法中的任何一種進行所擴增的ID探針的鑑定。在一個實施方案中,使用擴增的ID探針,通過在液體介質中雜交而選擇檢測集合的成員。隨後通過使用質譜確定分子量,鑑定所選定的檢測集合成員。然後通過與完整檢測序列集合的分子量表相比較,鑑定所選定的序列。在一個優選的實施方案中,通過與二維檢測陣列的雜交,鑑定標記的擴增ID探針(見上文的步驟3)。使用標準程序雜交和檢測核酸分子(Ausubel等,1987,見上文)。用於鑑定所擴增的ID探針的方法在下面的實施例中進一步描述。
步驟8通過樣品選定的ID探針與所述生物樣品的原位雜交,定量所述生物樣品中的靶生物。
定量生物樣品中的靶生物常常是重要的。在醫藥領域中,例如,關於人類免疫缺陷病毒在血液中濃度的知識(也稱為病毒載量,或滴度)對於估計疾病階段以及對治療的反應是重要的。當在樣品的意外汙染和真實感染之間進行區分時,對樣品中靶生物的數量的了解也是重要的。
在步驟7中使用的標記ID探針可以用於通過使用原位雜交方法,定量所述生物樣品中的靶生物數量。使一部分經標記、擴增的、樣品所選定的ID探針混合物變性,並用於與已固定的(可選已染色的)生物樣品雜交。或者,可以使用前面步驟檢測到的對於要檢測的生物類型具有特異性的任何類群特異性序列作為探針。對於原位雜交,優選使用靈敏並且易於實施的方法(如Huang等,Modern Pathology 11971-977,1998),所述靈敏的方法如使用催化的報導分子沉積的方法,該方法足以使用單一拷貝序列檢測單一細胞/病毒。所述固定的樣品可以是在步驟4中使用的同樣的樣品,或者可以通過熟悉本領域的人員已知的其它標準方法製備(如Nuovo等,見上文)。
這些方法在下面的實施例中描述實施例1測試胃腸樣品中病原體的存在腸胃炎。腸胃疾病是主要的國際健康問題。每年在兒童中出現約十億病例,導致約五百萬人死亡。該疾病的某些類型在症狀出現的幾小時內可能是致命的。很多種病原體引起胃腸疾病,其中包括細菌、病毒和原生動物。快速而準確地鑑定引起胃腸疾病的病原體對於選擇合適的抗微生物療法、鑑定醫院獲得性感染以及追蹤食物傳染的病原體的爆發是重要的,其中所述食物傳染的病原體如新出現的病原體大腸埃希氏菌O157H7。
目前診斷胃腸疾病的方法還遠遠不夠理想。由於可能的病原體(如病毒病原體、細菌病原體和寄生病原體)的數量和範圍,確定感染因子的身份常常是困難、耗時(通常需要至少幾天,有時甚至是幾周)並且昂貴的。在正常消化道中不同微生物的存在加劇了鑑定腸胃炎的病因的難度。測試原生動物感染、病毒感染和細菌感染,以及檢查樣品中特徵性人類細胞的存在,需要不同的專業化實驗室設備。此外,進行這些測試必須僱傭高度訓練有素的人員。
目標和好處。在本實施例中,我使用單一的基因組分布分析測定來測試來自患有胃腸疾病的患者的樣品中,廣泛範圍胃腸病原體的存在。通過同時並且快速地(如幾小時)測試常見的細菌病原體、病毒病原體和原生動物病原體,以及測試特徵性人類細胞的存在,本方法提供了優於目前實踐的顯著改進。本測試幫助確定合適並且及時的治療。此外,由於基因組分布分析能夠產生高解析度指紋,因此該方法是用於流行病學分析的強有力的工具。
注意在本實施例中描述的用於測試臨床樣品中胃腸病原體的基因組分布分析,對於食品檢驗工業也是有價值的工具。檢驗食物中的胃腸病原體對於預防胃腸疾病是重要的。
本實施例的總結。發展了一種基因組分布分析測定,所述測定在一次測試中,掃描胃腸樣品中一組廣泛的胃腸病原體的存在。我從各種胃腸病原體中分離了一個ID序列集合。對於細菌病原體和寄生蟲,使用基因組扣除分離基因組差異序列和類群特異性序列。使用計算機分析來分離用於鑑定胃腸病毒的類群特異性序列。在給定病原體的DNA中存在的所述ID序列集合的亞組,構成了所述病原體的基因組分布分析指紋。通過確定在來自每一胃腸病原體類群的代表性菌株中存在的基因組差異序列亞組,構建指紋資料庫。通過將臨床樣品中的基因組分布分析指紋與所述指紋資料庫相比較,確定所述臨床樣品中病原體的身份。
在本實施例中使用的方法的總結。我使用了Straus等(Proc.Natl.Acad.Sci.USA 871889-1893,1990)的基因組扣除方法的改變形式,鑑定引起胃腸疾病的細菌和寄生蟲的病原體特異性ID序列。可以使用其它可選的方法分離基因組差異序列,因此這些方法可以替代下面概述的扣除技術。對於引起胃腸疾病的病毒,我使用對序列資料庫的計算機搜索,鑑定了類群特異性序列。通過使ID探針集合與已固定的特定樣品的基因組DNA雜交,鑑定所述樣品中的ID序列。一個ID探針亞組將與所述已固定的基因組DNA雜交,並因此被所述固定的基因組DNA保留下來。使用依賴於連接的PCR策略擴增已雜交的ID探針。通過使擴增的ID探針與檢測集合雜交,鑑定它們的身份,在這種情況下,所述檢測集合是完整的、未經選擇的ID序列組的有序兩維陣列。在所述陣列上可見的雜交信號模式構成了基因組分布分析指紋。
從引起胃腸疾病的細菌中分離基因組差異序列用於從細菌中分離ID序列的策略。為診斷胃腸疾病,最有用的診斷ID序列是那些在消化道病原體中存在、但在幾百種居住在健康腸中的物種中不存在的ID序列。對於許多細菌性胃腸病原體來說,可以使用基因組扣除有效地分離這樣的ID序列。如上文所討論的(在詳細描述部分的步驟2),所使用的基因組扣除策略取決於特定的病原體。本部分舉例說明用於分離代表性胃腸病原體腸沙門氏菌和大腸埃希氏菌的基因組差異序列的兩種不同策略。
從腸沙門氏菌分離基因組差異序列的策略。99%以上的沙門氏菌屬臨床分離物是腸沙門氏菌亞種的成員。腸沙門氏菌的所有菌株都被認為是人類病原體。因此,該類群是那些分類單位(生物學上相關的類群)的代表對於那些分類單位來說,診斷目標是鑑定該類群的任一成員並將該類群的任一成員與該類群的任何其它成員區分開來。有許多使用現有的菌株分離用於高解析度鑑定的標記的方法;本實施例使用在圖6中圖解說明的策略。
對於這種方法,將腸沙門氏菌的亞種分為兩個亞群,即X群和Y群。匯集來自每個亞群的代表性成員的DNA,構建X群的基因組差異序列和Y群的基因組差異序列。從SARB參考物保藏中心(SARBreference collection)獲得來自每個分支的菌株(Boyd等,J.Gen.Microbiol.1391125-1132,1993)。進行使用所述基因組差異樣品的交互扣除。在一次扣除中,使用所述X基因組差異樣品作為「+」樣品,所述Y基因組差異樣品作為「-」樣品。該扣除的產物是在X群的至少一個成員中發現、但未在Y群的任何成員中發現的序列。在交互扣除實驗中,使用所述Y基因組差異樣品作為「+」樣品,所述X基因組差異樣品作為「-」樣品。該扣除的產物是在Y群的至少一個成員中發現、但未在X群的任何成員中發現的序列。
通過該基因組扣除策略分離的基因組差異序列構成一個或多個家族。一般地說,該策略產生多於一個的家族,即一般不是所有的ID序列扣除產物都能與任何單個基因組雜交。因此,對匯集的生物的基因組扣除是從一個相關生物類群產生多個ID序列家族的有效方法。
從大腸埃希氏菌分離基因組差異序列的策略。圖7A顯示了大腸埃希氏菌類群的部分系統樹。注意該類群中的病原體(黑色)(大腸埃希氏菌O157H7和弗氏志賀氏菌)具有非常密切相關的非致病性胞親分類單位(sibling taxa)(白色)。對於未在該圖中顯示的大腸埃希氏菌系統樹部分來說,這也是普遍的情況。在健康個體的消化道中多種非致病性或共生性大腸埃希氏菌的存在可能混淆對大腸埃希氏菌致病菌株的診斷。大腸埃希氏菌代表了在人體內發現的包含病原體和非病原體的生物類群。
為分離對這樣的類群進行指紋分析的基因組差異序列,應用在圖7B和圖7C中描述的策略。匯集來自非致病分類單位(分支)的代表性菌株,用它們的DNA製備「-」基因組差異樣品。匯集來自致病分類單位(分支)的代表性菌株,用它們的DNA製備「+」基因組差異樣品。
基因組扣除的產物是至少在病原體類群的至少一個成員(或者大腸埃希氏菌,或者弗氏志賀氏菌)中發現,但未在所述扣除的任何非致病菌株中發現的序列。注意該基因組扣除將分離基因組差異序列,其中一些基因組差異序列也是類群特異性序列,因為它們出現在一個類群(如大腸埃希氏菌O157H7)的所有成員中,但不出現在相關類群的成員中。出現在致病性大腸埃希氏菌中(但不出現在非致病性大腸埃希氏菌中)的毒性基因(即涉及感染過程的那些基因)屬於這一類產物。
用於本實驗的菌株來自Thomas Whittman博士(Penn.StateUniversiy)提供的ECOR(非致病性)和DEC(致病性)菌株保藏物。
表3.引起急性胃腸疾病的病原體。
引起胃腸疾病的細菌病原體。表3列出了引起胃腸疾病的常見細菌類群。由某些這些病原體(包括霍亂弧菌和腸出血性大腸埃希氏菌(如大腸埃希氏菌O157H7))引起的感染甚至在健康個體中都可能是致命的。快速診斷是實現合適治療和抑制爆發的關鍵。為從表3列出的細菌類群中分離ID序列家族,我使用上文所述應用於大腸埃希氏菌和沙門氏菌屬的策略。
製備基因組DNA用於扣除。為製備DNA以製造基因組扣除樣品,將表3所列出的菌株在液體培養基(500ml)中培養直至飽和,並製備基因組DNA(Ausubel等,1987,見上文)。通過上文關於大腸埃希氏菌和沙門氏菌屬的同樣考慮來選擇「+」菌株和「-」菌株。混合來自每個「+」菌株的DNA(50μg)(此後稱為「+」DNA)。相似地混合來自所述「-」基因組差異樣品菌株的DNA(50μg)(此後稱為「-」DNA)。
製備基因組差異樣品。為製備「-」基因組扣除樣品,如以前所述(Straus,1995,見上文),剪切「-」DNA,使其與乙酸光生物素反應,然後以2.5mg/ml重懸浮。如下製備「+」基因組扣除樣品用限制酶Sau3A切割「+」DNA(2μg),產生具有粘性末端的片段。用乙醇沉澱後,將所述DNA片段以0.1μg/μl重懸浮於10mMEPPS/1mM EDTA,pH8.0(EE)(Straus,1995,見上文)。
基因組扣除。如以前所述(Straus,1995,見上文)進行基因組扣除。為分離病原體特異性DNA片段,使用來自致病菌株的「+」基因組扣除樣品和來自非致病菌株的生物素化「-」基因組扣除樣品進行基因組扣除實驗。三個扣除雜交循環純化了病原體特異性基因組差異序列。
克隆所述基因組差異序列。在將連接物連接到所述基因組差異序列後,使用PCR對它們進行擴增(Straus,1995,見上文;Straus等,1990,見上文)。然後通過用Sau3A切割,從所擴增的基因組差異序列中除去所述連接物。將所述樣品溶於0.3M醋酸鈉(NaOAc),用苯酚/氯仿(1∶1)提取,然後用乙醇沉澱。將部分樣品(20ng)連接到用BamH I消化、去磷酸化的載體pBluescript II KS+(100ng;Stratagene),並將連接後的產物轉化進大腸埃希氏菌中(Ausubel等,1987,見上文)。
對所述基因組差異產物進行測序。使用ABI DNA合成儀,按照生產廠家的建議(Perkin-Elmer),通過循環測序法,對單個克隆的插入片段進行測序。
從引起胃腸疾病的細菌分離基因組差異序列集合。通過對由表3列出的細菌類群中的生物製備的基因組差異樣品進行如上文所概述的基因組扣除,從通常引起胃腸疾病的不同病原體類群分離基因組差異序列。每次扣除產生一個菌株類群內的病原體所特有的大量基因組差異序列。例如,在致病性大腸埃希氏菌菌株和非致病性大腸埃希氏菌菌株之間的一次扣除產生了幾百種基因組差異序列(Juang,「取樣調查大腸埃希氏菌K1分離物和K2分離物之間的基因組差異(SamplingGenomic Differences Between Escherichia coli K1 and K2 isolates),」Harvard University,1990)。
使用DNA序列資料庫的基因組扣除。基因組扣除一般意義指掃描整個基因組尋找基因組差異序列,但也可以通過將已經完全測序(或近乎完全測序)的基因組的DNA序列與另一基因組(或另外多個基因組)的全部或部分進行比較而完成基因組扣除(見,例如,Alm等,1999,見上文)。
製備對應於所述基因組差異序列的探針集合和檢測集合用如上文所述通過基因組扣除鑑定的病原體特異性ID序列集合,確定用於基因組分布分析的ID探針的結構。合成兩個ID寡核苷酸集合。一個組成所述ID探針(或半邊ID探針)的集合與生物樣品雜交。連接與實驗樣品中的病原體基因組退火的半邊ID探針,將其擴增並進行標記。另一個ID寡核苷酸集合構成一個檢測集合。所述檢測集合中的ID寡核苷酸對應於所述ID探針集合中的序列。也就是說,所述檢測集合與所述ID探針集合相應。將所述檢測集合寡核苷酸澱積到固相支持體上,構成一個可尋址陣列。通過與所述可尋址寡核苷酸陣列的雜交,鑑定與所述臨床樣品中的病原體基因組雜交的已標記、擴增的探針。
合成對應於所述ID序列的ID探針。從計劃包括在基因組分布分析測定中的每個ID序列、人mRNA(見下文)和對照序列中選出約30個鹼基長的序列,該序列稱為ID探針位點。合成對應於每種30個鹼基ID探針位點的兩個半邊ID探針(圖3)。所述左半邊ID探針包含所述ID探針位點的左邊15個鹼基和一個引物位點,即引物位點-L(「左」引物位點)。所述右半邊ID探針包含所述ID探針位點的右邊15個鹼基和一個引物位點,即引物位點-R(「右」引物位點)。所述引物位點是對應於為PCR擴增所需要使用的引物類型的擴增位點。
所述引物位點-L(「左」引物位點)具有序列5』-GACACTCTC-GAGACATCACCGTCC-3』。所述引物位點-R(「右」引物位點)具有序列5』-GTTGGTTTAAGGCGCAAGAATT-3』。因此,對於在上面部分鑑定的每種30個鹼基序列,合成兩個半邊ID探針一個半邊探針具有序列5』-GACACTCTCGAGACATCACCGTCC-ID探針位點1-15-3』,一個半邊探針具有序列5』-ID探針位點16-30-GTTGGTTTAAGGCGCAAGAATT-3』。設計所述半邊ID探針,使得當它們退火到包含所述30bp ID探針位點的模板時相互鄰接。當以這種方式退火時,可以連接所述半邊探針,並因此轉化為可以用引物L(5』-GACACTCTCGAGACATCACCGTCC-3』和引物R(5』-AATTCTTGCGCCTTAAACCAAC-3』)擴增的形式,其中所述引物L和引物R分別對應於所述左引物位點和所述右引物位點。
構建用於基因組分布分析的檢測陣列。為檢測哪些半邊探針與臨床樣品雜交,可以通過雜交查詢一個可尋址的ID序列檢測集合。該集合的元件是對應於所述ID探針集合中的ID探針位點的合成ID序列寡核苷酸。也就是說,每種檢測寡核苷酸約30個鹼基長,並且與通過連接和擴增一對半邊ID探針得到的ID探針位點序列的一條鏈互補。
在本實施例中,我按照DiRisi等(Science 278680-686,1997)的程序,使用一臺帶有列印頭的陣列形成機器(arraying machine)將每個寡核苷酸點樣(Shalon等,Genome Res.6639-645,1996),構建了一個二維檢測陣列。將每種約30個鹼基長的寡核苷酸約2.5ng點樣到已經用聚L-絲氨酸包被的40片載玻片的每一片上,其中在相鄰寡核苷酸點之間的距離是500μm(Schena等,1995,見上文)。
構建指紋的基因組分布分析資料庫基因組分布分析通過將患者樣品的基因組分布分析指紋與包含已知生物的指紋的資料庫相比較,鑑定所述樣品中的病原體。(一種指紋對應於與特定類型生物雜交的ID探針集合的亞組)。構建指紋資料庫需要從每個靶類群的一組參考菌株獲取基因組分布分析指紋。
最好根據靶類群所屬的兩個診斷類別考慮構建所述資料庫。大多數鑑定計劃分為兩類(根據靶類群)簡單測試在一個類群中的成員資格的鑑定計劃,以及測試在一個類群中的成員資格並且將一個類群中的成員相互區分的鑑定計劃。
將主要由類群特異性序列組成的指紋輸入所述指紋資料庫。當在一個類群中的成員資格是主要的考慮時,我在選定用於鑑定靶生物的ID序列家族中主要包括類群特異性序列。當一個類群的一個成員的存在幾乎總是與疾病相關,並且當流行病學信息不具有很大價值時,測試作為該類群的成員的病原體的存在(不用在該類群的成員之間進行區分)常常是最佳的診斷策略。例如,為鑑定危險並且致病力強的胃腸病原體霍亂弧菌,該病原體引起危及生命的疾病霍亂,可以在所述集合中包括大部分由類群特異性序列組成的一個ID序列家族。注意可以通過基因組扣除分離類群特異性序列,在所述基因組扣除中「+」菌株是病原體,「-」菌株是非病原體。這樣的ID序列既是基因組差異序列,也是類群特異性序列。測試可能的類群特異性序列的特異性使每一序列與來自該類群內代表性成員的基因組DNA雜交,並使每一序列與廣譜的其它類群的成員雜交(見,例如,美國專利第5,714,321號)。這樣,假如實驗樣品產生由對應於類群特異性ID序列的陽性信號組成的基因組分布分析指紋,則指示出在所述樣品中存在靶類群的成員。將這樣的指紋包括在指紋資料庫中。
將主要由基因組差異序列組成的指紋輸入所述指紋資料庫。對於某些類型生物而言,診斷目標可能是鑑定作為一個類群的成員的一個菌株,同時將該菌株與該類群中的其它菌株區分開來。例如,在追蹤醫院獲得性感染的爆發和食物傳染的病原體的爆發時,這樣的亞菌株鑑定是重要的。這種類型的高解析度鑑定需要比僅僅鑑定作為靶類群成員的病原體(如在前面的段落描述)更為詳細的指紋。通過基因組扣除分離的基因組差異序列是用於獲得高解析度指紋最有用的ID序列。
為從靶類群構建指紋資料庫,我從該類群代表性的一組參考菌株獲得指紋。為產生指紋,對包含單個參考菌株的基因組的樣品(常常是單個細菌菌落)應用基因組分布分析測定。掃描所述基因組中該靶類群特徵性的一個或多個ID序列家族的成員(通常是對應於基因組扣除產物的基因組差異序列)的存在。將所獲得的指紋儲存在所述資料庫中。根據所述指紋,使用標準分析建立所述參考菌株的系統發生關係(Hillis等,Molecular Systematics(Sinauer Associates,Sunderland,1996))。
構建用於對食物傳染的病原體(如大腸埃希氏菌O157H7)進行高解析度指紋分析的資料庫是用於追蹤爆發的重要工具。例如,我通過獲取大腸埃希氏菌和志賀氏菌屬菌菌株的參考保藏物的基因組分布分析指紋,建立了代表大腸埃希氏菌/志賀氏菌屬類群中生物範圍的指紋資料庫。從疾病控制中心和美國典型培養物保藏中心可以獲得大量這樣的菌株。使用所述指紋作為特徵組,構建該類群的系統發生(相關性的進化樹)。該方法的一個強有力特徵是當使用在臨床樣品中發現的相關病原體的新指紋更新該類群的指紋資料庫時,該資料庫逐漸變得更加完全。
製備用於使用基因組分布分析測定進行指紋分析的細菌菌菌株。為獲得指紋,我首先將細菌菌落固定在尼龍濾膜上,並使用簡單和標準的方法(Grunstein等,1975,見上文),使所述菌落的基因組DNA能夠用於雜交。將所述菌落塗布在尼龍濾膜(1cm2)上,使其乾燥,然後用0.5M NaOH,1M Tris,pH 8/3M NaCl,1M Tris,pH8順序處理(每種處理5分鐘)。將固定在所述尼龍濾膜上的樣品在1M NaCl中於65℃振蕩下洗滌3次,每次5分鐘,以除去未固定的化學製劑和顆粒性物質。在鹼處理前,用特定的酶或化學製劑預處理所述塗布的生物,可以增強某些細菌(和其它生物)的有效裂解。例如,通過用包含磷脂酶和溶菌酶的溶液處理濾膜,幫助裂解革蘭氏陽性細菌(Graves,L.等(1993),「通用細菌DNA分離程序,」載於Diagnostic MolecularMicrobiology,Principles and Applications,D.Persing等編輯(Washington,D.C.ASM Press),第617-621頁)。
選擇與一種細菌菌株的DNA雜交的基因組差異序列亞組。基因組分布分析測定選擇與結合於尼龍濾膜的基因組DNA雜交的病原體特異性ID探針亞組。相比之下,可以容易地從濾膜上除去在已固定的細菌DNA中沒有對應物的基因組差異探針。在隨後的連接步驟中,任何通過與濾膜或樣品的非特異性相互作用而保持附著於所述濾膜的殘餘半邊ID探針將是不可擴增的。
在36℃下(或在比在1M NaCl中所有半邊探針的最低Tm低5℃的溫度下),在0.5ml雜交緩衝液(1M NaCl/50mM EPPS/2mM EDTA,pH8)中,使對應於來自特定細菌類群的病原體特異性基因組差異序列的一組半邊探針(每種半邊探針1nM)與所述濾膜雜交。將所述雜交反應物溫育30分鐘,然後通過在2ml洗滌緩衝液(1M NaCl/50mM EPPS/2mMEDTA,pH8)中於36℃(或在比在1M NaCl中所有半邊探針的最低Tm低5℃的溫度下)伴隨振蕩的五個洗滌步驟,每個洗滌步驟30秒鐘,除去未結合的半邊探針。隨後用1ml連接緩衝液(10mM MgCl2/50mMTris-HCl/10mM二硫蘇糖醇/1mMATP/25μg/μl牛血清白蛋白),在30℃下連續洗滌所述濾膜3次。在連接步驟前,除去所述濾膜上的多餘液體。在各步驟之間不能使所述濾膜乾燥。
連接與所述細菌樣品雜交的成對半邊探針。消除由於非特異性結合的探針分子引起的背景對於基因組分布分析是至關重要的,尤其是當應用於臨床樣品時更是如此,因為如在下面的部分所述,在這樣的樣品中檢測未經培養的病原體需要高度的靈敏度。回想起要求連接鄰近結合的半邊探針是有效的方法,保證僅有的可以被擴增的探針是那些已經與所述樣品中的病原體基因組雜交的探針。
通過加入含1,600粘性末端單位(等於25 Weiss單位)的T4 DNA連接酶(New England Biolabs)的200μl連接酶緩衝液(10mM MgCl2/50mM Tris-HCl/10mM二硫蘇糖醇/1mM ATP/25μg/μl牛血清白蛋白),連接與所述固定樣品雜交的半邊探針。使所述連接反應在30℃進行1小時。
擴增與所述細菌樣品雜交的基因組差異序列。通過加熱,從所述濾膜釋放與所述細菌樣品中的基因組雜交的成對已連接的半邊探針。然後使用聚合酶鏈式反應和對應於在所述已連接探針分子末端的引物結合位點的引物,擴增所述已連接的半邊探針。
在連接所述半邊探針後,用2ml 10mM EPPS/1mM EDTA,pH8.0洗滌濾膜,從所述濾膜上除去液體,然後在所述濾膜加上500μl 10mMEPPS/1mM EDTA,pH8.0,隨後在100℃溫育5分鐘。在將溶液與濾膜分離開後,加入50μl 3M醋酸鈉和20μg酵母tRNA。通過乙醇沉澱純化核酸將1ml乙醇與所述樣品混合,然後將所述樣品在12,000g離心5分鐘。用100%乙醇洗滌所述核酸沉澱,乾燥,並重懸浮於10μl 10mM EPPS/1mM EDTA,pH8.0中。
使用10X PCR緩衝液(Boehringer Mannheim)、200μM每種dNTP(dATP、TTP、dCTP和dGTP)、1μM生物素化寡核苷酸引物L(5』-(生物素-dX)GACACTCTCGAGACATCACCGTCC-3』)(Midland CertifiedReagent)、1μM生物素化寡核苷酸引物R(5』-(生物素-dX)AATTCTTGCGCCTTAAACCAAC-3』)和0.1單位/μl Taq聚合酶(Promega),將一半(5μl)包含所洗脫探針的樣品溶於總反應體積為50μl的1X PCR緩衝液中。使用如下PCR模式擴增所述所洗脫的探針30個循環(94℃30秒鐘,55℃30秒鐘,72℃1分鐘),然後是72℃10分鐘。
一個菌株的基因組分布分析指紋通過與一個陣列的雜交,鑑定擴增的細菌DNA所選定的探針分子。鑑定通過與所述菌株的固定化DNA雜交而選定的ID探針,建立菌株的指紋。在本實施例中,我通過使擴增的選定ID探針與檢測陣列雜交,鑑定了由細菌基因組DNA選定的ID探針。該陣列是一個二維的可尋址序列陣列,與用於與所述生物樣品雜交的ID探針集合相應。這樣,該集合中的每種ID探針都可以與在該檢測陣列確定位點的DNA序列雜交。通過與所述陣列的雜交,鑑定通過與所述細菌樣品的結合而選定的探針。只有選定探針通過與所述陣列上的對應點結合,產生信號(圖5)。
通過在100℃加熱1分鐘,我使得代表與所述細菌樣品雜交的序列的擴增探針變性。將所述已變性的探針加入25ml 2X雜交緩衝液(2M NaCl/100mM EPPS,pH8/10mM EDTA/0.2%十二烷基硫酸鈉)中。將所述探針/雜交混合物置於所述陣列上,用玻璃蓋玻片覆蓋,並在50℃溫育20分鐘(如Schena等,1995(見上文)所述)。通過在2ml洗滌緩衝液(0.4M NaCl/50mM EPPS/2mM EDTA,pH8)中於50℃伴隨振蕩的五個各30秒鐘的洗滌步驟,除去未結合的探針。
並如已公開的報導所述(DiRisi等,1997,見上文;Schena等,1995,見上文),用雷射螢光掃描儀掃描微陣列,並處理和記錄信號。將每個菌株的指紋記錄為1和0的二進位字符串,每個數字代表在微陣列上的一種基因組差異序列。假如在該微陣列的一個位點獲得信號,一個「1」就出現在代表該基因組分布分析指紋的字符串中的對應數字。
使用基因組分布分析指紋和系統發生分析對類群中的菌株分型。可以使用針對類群中代表性菌株的指紋資料庫鑑定未知菌株。如上文所述編制指紋資料庫,並如Hillis等(見上文)所述,使用標準方法進行所述指紋的系統發生分析。通過將未知指紋與以系統發生排序的指紋資料庫相比較(使用Hillis等(見上文)所述的方法),確定未知病原體如在患者樣品中未知病原體的身份。
從引起胃腸疾病的寄生蟲分離ID序列引起胃腸疾病的寄生蟲。根據地理位置、氣候、社會經濟因素和免疫活性,在患者體內發現的腸寄生蟲範圍有所不同。表3列出了北美洲通常在患有胃腸疾病的患者體內發現的原生動物和蠕蟲類群。目前準確診斷腸寄生蟲的方法按最好來說也是困難的。基因組分布分析極大改善了胃腸寄生蟲的檢測。
從引起胃腸疾病的寄生蟲分離ID序列。為分離表3中每一種寄生蟲所獨有的ID序列組,我使用了在上文概述的針對細菌病原體的相同策略和方法,只有下面一些小的改動。因為寄生蟲一般與在消化道中通常發現的生物不相關,所以從來自目的分類單位內隔開最遠的兩個菌株的基因組DNA構建基因組差異樣品常常就足夠了。進行交互雜交,即每一個菌株在一個扣除中作為「+」菌株,但在另一個扣除中作為「-」菌株。與細菌扣除的溫育時間相比,增加扣除雜交反應的溫育時間對於補償真核生物基因組複雜性的增加是必要的。我使用的復性時間是一半單拷貝序列重退火所需時間的四十到五十倍(Straus,1995,見上文)。
構建寄生蟲指紋的資料庫。如上文關於細菌病原體的指紋分析所述,使用寄生蟲ID序列構建用於鑑定表3所列出的生物的ID探針家族。也如針對細菌病原體所述,進行對參考菌株的指紋分析和構建指紋資料庫。
鑑定引起胃腸疾病的病毒的類群特異性序列引起胃腸疾病的病毒。據認為病毒性腸胃炎是美國第二最常見的疾病病因。兒童和免疫妥協患者尤其易感。診斷病毒引起的胃腸疾病是有問題的,因為大多數常見因子不能培養並且很少特徵鑑定。已經發展出的測試一般非常昂貴。由於可用測試的費用、嚴重併發症的不常見性、普通支持性治療、以及缺乏抗病毒治療,一般不進行診斷測試。然而,對病毒全面並且不昂貴的測試對流行病學、對排除其它病因、對排除抗生素的使用以及對指示恰當地給予新型抗病毒治療是有用的。表3列出了通常引起胃腸疾病的病毒病原體。
鑑定來自引起胃腸疾病的病毒的類群特異性序列。對於引起胃腸疾病的病毒,從已公開的DNA序列數據推導出類群特異性序列。在一些情況下,病毒類群特異性序列已經在文獻中描述。在其它情況下,在將公共資料庫中的病毒基因組序列與所述資料庫中其它病毒的序列比較後,從所述病毒基因組序列選出序列。使用標準方法進行序列比較(Ausubel等,1987,見上文)。選擇至少30bp長的病毒類群特異性序列作為測試探針的靶。
構建病毒指紋的資料庫。如上文針對細菌病原體的指紋分析所述,使用寄生蟲ID序列構建用於鑑定表3中的病毒的ID探針家族。除樣品製備外,對參考病毒株的指紋分析和構建病毒指紋資料庫也如上文針對細菌病原體所述進行。對於包含RNA基因組的病毒,樣品製備必須保證RNA的完整性。我通過高壓滅菌處理濾膜(Allday等,Nucleic Acids Res.1510592,1987)或將濾膜放在微波爐中烘烤(Buluwela等,Nucleic Acids Res.17452,1989),使核酸變性,將其固定到濾膜上,並使其可以接觸探針。
用於診斷胃腸疾病的人類序列基因組分布分析測定的一個好處是可以在篩選病原體的同一測試中測定在診斷上有用的人類細胞類型。例如,在胃腸疾病中,重要的是知道白細胞和紅細胞是否在臨床樣品中過高。為測試特定細胞類型,獲得細胞類型特異性mRNA的序列(通常得自已公開的報告或遺傳資料庫)。表4指出了已知的在某些細胞類型中表達並且在診斷胃腸疾病中重要的序列的細胞類型特異性mRNA。
合成與ID探針類似的探針(即作為帶有擴增位點的二元半邊探針),並將所述探針包括在用於接觸所製備的生物樣品的雜交混合物中。對應的檢測序列包括在檢測陣列中。
表4.用於對診斷胃腸疾病重要的人類細胞的探針
可用於評估基因組分布分析測定的內部對照序列內部對照。在基因組分布分析測定中包括內部對照改善了測試結果的置信度並允許進行有效的故障檢查。對照探針、寡核苷酸和檢測序列包含非生物學序列。
假如技術起作用的話,陽性對照序列在每個實驗中都給出陽性信號。假如,例如,其中一種試劑不正常作用,將缺乏來自陽性對照的預期信號。缺乏來自所述陽性對照的信號保證避免了由於技術失敗引起的假陰性。
包括陰性對照,以監測所述探針中不在所述臨床樣品中的序列是否在所述診斷檢測測定中導致信號。設計所述基因組分布分析測定,以便只有當所述ID探針集合中的ID探針對應於所述臨床樣品中的ID序列時,才能在所述檢測陣列上獲得信號。陰性對照的使用與陽性對照相似,只是沒有將對應序列與所述臨床樣品一起點樣(即它與所述ID探針集合一起包括在所述雜交混合物中,並且是所述檢測陣列的元件)。這樣,陰性對照序列應該不能被所述固定的樣品選擇,並且不能被連接和擴增。來自檢測陣列中陰性對照序列的陽性信號,指示選擇ID探針與靶序列的雜交的步驟並未適當地運作。
我在所述測定中包括了另一種對照探針,所述探針允許監測連接酶反應。該探針不作為半邊探針合成,而是作為以左連接物和右連接物標記的連續序列合成。另外,將該序列與陽性對照探針一樣使用(即將其與所述臨床樣品平行點樣,其包括於所述探針中,並且是所述檢測陣列的元件)。假如所述檢測陣列的陽性對照元件是陰性的,但該檢測陣列的連接酶對照元件是陽性的,那麼所述測定中的連接酶步驟是值得懷疑的。
表5.用於基因組分布分析測定的內部對照。
鑑定在臨床樣品中存在的病原體製備臨床樣品。為使基因組分布分析在臨床設置中最有效,優選一種用於製備臨床樣品以與半邊探針雜交的簡單方法。為了實驗室工作人員的安全,患者樣品的製備最好也應當快速中和所述樣品中存在的病原體,並且樣品的製備應當有效除去隨後酶促反應如探針擴增的抑制劑。
我使用一種普遍用於製備用於雜交的在生化上複雜的生物樣品的簡單、通用但有有效的方法(Grunstein等,1975,見上文),固定所述臨床樣品、將核酸分子變性並中和任何病原體。在尼龍濾膜(1cm2)上塗抹胃腸樣品(0.5ml液體糞便樣品、成形的大便樣品、或直腸藥籤樣品),使其乾燥,並如上文關於製備病毒樣品所述進行處理。將所述固定在尼龍濾膜上的樣品在65℃下振蕩洗滌幾次,以除去未固定的化學製劑和顆粒性物質。
通過雜交掃描臨床樣品中基因組差異序列的存在。通過使所述ID探針集合、人類診斷序列和對照序列與胃腸樣品雜交,我掃描了所述樣品中廣泛的相關病原體組。該方法與用於對參考菌株進行指紋分析以建立細菌指紋資料庫的方法基本相同(見上文),不同之處在於所述ID探針集合的廣泛組成以及使用臨床樣品(如前面的段落所述製備)作為生物樣品。
獲得臨床樣品的基因組分布分析指紋。根據如上文針對細菌所詳細描述的相同方法(見「構建指紋的基因組分布分析資料庫」),進行連接、擴增和指紋顯示(陣列檢測),與該方法的不同之處在於所述陣列包含代表表3指出的所有病原體的檢測集合。所述檢測陣列中的檢測序列對應於與所述臨床樣品雜交的所述ID探針集合、人類診斷序列和對照序列。
定量分析所述臨床樣品中的病原體滴度是多少?基因組分布分析測定的一個強有力特徵是能夠定量生物樣品中的病原體。一旦已經通過指紋鑑定了靶生物,就可以通過與根據標準方法(如Huang等,Modern Pathology 11971-977,1998)製備的一部分原始生物樣品進行原位雜交,定量它們的存在。我使用一種足以檢測單個生物中的核酸序列的單個分子的靈敏但簡單的方法(Huang等,見上文,1998)。該方法與用於與所述檢測陣列雜交的標記探針一起使用。或者,可以使用任何所述生物特徵性的、可以通過與所述陣列的雜交而檢測的類群特異性探針進行原位雜交。實施例2.檢測呼吸系統樣品中病原體的存在肺炎。肺炎是美國由於傳染病死亡的最常見的死因。該疾病的病因學依賴於年齡和免疫狀況。病毒引起大部分的兒童肺炎,而細菌病原體是引起成人肺炎的最常見病原體。在免疫妥協寄主中引起肺炎的病原體譜變化很大,並且對於癌症影響免疫系統或保護性表面(黏膜表面或皮膚)的患者、移植物受體和HIV感染患者有所不同。
為成功治療肺炎,最基本的是快速鑑定病原體。但是,所有確定肺炎病因的診斷努力幾乎有一半不能鑑定病因因子。(這還不包括沒有嘗試鑑定病原體的大部分病例。)引起下呼吸道感染的許多細菌病原體和所有病毒病原體不能通過常規微生物培養方法鑑定。例如,鑑定引起肺結核、百日咳、軍團病和支原體引起的肺炎的病原體需要特殊方法。患有下呼吸道感染的患者使用了美國處方開出的75%的抗生素。由於目前的診斷不能鑑定大多數下呼吸道感染中的病原體,故每年約10億美元浪費在無用的抗生素上。因此,對於測試廣泛的下呼吸道病原體組的單次診斷測定有極大的需求。
目的和好處。在本實施例中,我使用一次基因組分布分析測定,檢測來自表現出下呼吸道疾病症狀的患者的樣品中呼吸系統病原體的存在。通過同時並快速地(如在幾小時內)測試常見的細菌病原體、病毒病原體和原生動物病原體,本方法提供了比目前實踐顯著的改進。所述測試幫助確定合適和及時的治療。此外,由於基因組分布分析測定能產生高解析度指紋,因此它是用於流行病學分析的有力工具。
本實施例概述。在細菌病原體和寄生蟲的情況下,我使用基因組扣除從各種下呼吸道病原體分離ID序列,或者在病毒的情況下,我使用計算機分析分離ID序列。在給定菌株的DNA中存在的基因組差異序列亞組構成了其基因組分布分析指紋。通過確定在每個呼吸系統病原體類群的代表株中存在的ID序列亞組,構建指紋資料庫。通過將臨床樣品的基因組分布分析指紋與指紋資料庫相比較,確定所述臨床樣品中的病原體身份。
在本實施例中使用的方法概述。在本實施例中,我使用抑制扣除雜交來分離病原體特異性基因組差異序列,而不使用在實施例1中使用的基因組扣除。如前面實施例所述,通過使用特定樣品的基因組DNA通過雜交來選擇一組ID探針,鑑定所述樣品中ID序列的身份。隨後使用高分支滾環擴增方法(hRCA)(Lizardi等,Nat.Genet.19225-232,1998),擴增所選定的ID探針。通過使用與實施例1中所述不同的檢測陣列技術,我確定了由所述樣品選定的ID探針的身份。
從引起下呼吸系統疾病的病原體分離ID序列。表6列出了一些引起下呼吸道感染的常見病原體。使用得自Clontech的抑制扣除雜交試劑盒(Diatchenko等,Proc.Natl.Acad.Sci.USA 936025-6030,1996),根據廠家推薦的方法,從非病毒(即細菌和真菌)病原體分離ID序列。如實施例1中一樣,選擇用於從不同類群分離ID序列的扣除計劃(如,選擇使用匯集的基因組差異樣品或者單菌株基因組差異樣品)。如實施例1中所述,表6中列出的特定類群的「+」基因組差異樣品由來自該類群的一種或多種代表性病原體的DNA組成,而「-」菌株由來自一種或多種密切相關的非致病性生物的DNA組成。(對於所有已知代表都是病原體的類群,所述「+」和「-」樣品包括來自致病菌株亞類群的匯集的DNA。)對通過基因組扣除分離的基因組差異序列進行測序,以準備用於合成滾環擴增探針和引物(見下文)。
對於引起下呼吸道疾病的病毒,從已公開的DNA序列數據推導出類群特異性序列。合成對應於在一個病毒類群內保守、但未在其它病毒類群中發現的序列的ID探針。我通過將可能的類群特異性序列與病毒序列資料庫(如Genbank)相比較,選出符合所述比較標準的序列。
表6.引起下呼吸道疾病的病原體。
可用於判斷呼吸系統樣品質量的組織特異性序列。眾所周知呼吸系統樣品的質量不均一。方便並且非侵襲性收集的痰樣品常常由於受到上呼吸道生物的汙染而被丟棄。已經根據顯微鏡觀察到的扁平上皮細胞與多形核白細胞的比例,發展出判斷樣本質量的系統。在我的呼吸系統測定中,我包括了一種基於內部雜交的測試,以根據這兩種細胞類型的相對豐度判斷下呼吸道樣品的質量。通過測試來自多形核白細胞的細胞類型特異性轉錄物(編碼蛋白LCA和CD45)和來自扁平上皮細胞的細胞類型特異性轉錄物(編碼蛋白spr 1)的轉錄物相對水平,完成這一工作。
使用用於構建對應於ID序列的ID探針的同樣方法,合成具有對應於所述組織特異性序列的探針位點的組織特異性序列探針,不同之處在於從GenBank資料庫獲得所述序列。這些探針與所述ID探針集合一起包括在所述雜交混合物中,並且這些探針包括在所述檢測陣列上。
還包括用於定量所述組織特異性mRNA的代表的對照序列。所述對照序列是以不同量加入所述生物樣品中的一系列獨特非生物的RNA序列。在所述雜交混合物和檢測陣列中包括對應的探針和檢測序列。通過在具有已知數量的扁平上皮細胞和多形核白細胞的樣品上進行所述測定,完成這些定量對照的校準。
用於滾環擴增的ID探針和引物。對於所述呼吸系統基因組分布分析測定中的每一ID序列,合成一對ID探針(圖8A)和一對引物(圖8B)。ID探針和引物基於Lizardi等(1998,見上文)的缺口寡核苷酸方法的那些探針和引物。然而,所述缺口ID探針(約15個鹼基)和所述帶有缺口的環狀ID探針(約15個鹼基)對應於一個ID序列。同時,在本實施例中,我使用5』生物素化引物以用於滾環擴增(圖8C)。相似地,合成對應於實施例1中所述的實驗對照序列的ID探針和對應於組織特異性RNA的ID探針。
構建用於基因組分布分析測定的兩維檢測陣列。為確定哪些ID探針與樣品雜交,我使擴增的選定ID探針與一個檢測陣列(包含一個檢測序列的集合的可尋址陣列)雜交。該陣列的元件包括對應於滾環擴增探針對的缺口探針部分的寡核苷酸和對應於實驗對照序列的寡核苷酸。在本實施例中,我使用光刻法,如以前所述構建微陣列(Chee等,Science 274610-614,1996;Lockhart等,Nat.Biotech.141675-1680,1996)。
對呼吸系統病原體進行指紋分析為鑑定引起下呼吸道感染的病原體,我將臨床樣品的基因組分布分析指紋與來自以前特徵鑑定的生物的指紋資料庫相比較。如在涉及胃腸基因組分布分析測定的實施例1中一樣,我首先從來自每個病原體類群的參考菌株的基因組分布分析指紋組裝了指紋資料庫。然後將臨床樣品的指紋與該資料庫相比較,確定所述樣品中病原體的身份。
獲得參考菌株的指紋並組裝資料庫。樣品製備、與所述ID序列集合的雜交以及洗滌步驟與實施例1中描述的那些步驟相同,不同之處在於所述ID探針集合的組成和結構。當與已固定的樣品中的DNA退火的成對帶缺口環狀ID探針和缺口ID探針相互連接時,就產生了用於高分支滾環擴增(HRCA)的模板。如圖8圖解並如以前所述(Lizardi等,1998,見上文),進行連接和HRCA。如以前所述(Lockhart等,1996,見上文)完成與微陣列的雜交、用鏈黴抗生物素-藻紅蛋白染色、以及掃描。從所述微陣列數據獲得指紋,並使用實施例1中所述的方法,組裝和分析由每一呼吸系統病原體類群獲得的指紋資料庫。
鑑定在臨床樣品中存在的病原體。使用實施例1中所述的方法,將各種類型和質量的呼吸系統樣品(如痰樣品、支氣管肺泡灌洗樣品和支氣管刷緣樣品)加樣並固定到尼龍濾膜上。如實施例1一樣,對臨床樣品以及參考菌株進行指紋分析,不同之處在於所述雜交反應中包括來自表6中所有呼吸系統病原體類群的ID探針。通過將獲得的指紋與參考菌株的指紋資料庫中的指紋相比較,鑑定在臨床樣品中存在的病原體。實施例3-測試血液樣品中的病原體血流感染。心血管系統的致病性侵襲是最嚴重的傳染病之一。在美國每年發生的約200,000例血流感染中,20%到50%是致命的。尤其危險的是免疫妥協患者、太幼小的兒童和太老的老人、患有皮膚或軟組織感染和帶有傷口的患者、以及侵入性醫療程序的接受者。所有主要病原體類型都可以感染血流,其中包括細菌、病毒、真菌和寄生蟲。快速鑑定血流感染中的病原體對於制定合適的(可能是救命的)治療是至關重要的。
目前的方法一般是病原體特異性的。因此,確定感染來源可能需要許多測試和大量費用。存在對於快速確定廣泛範圍常見血流病原體的身份的單次測試的需求。
目標和好處。在本實施例中,我使用單次基因組分布分析測定來測試在臨床樣品中廣泛範圍的血流病原體的存在。通過同時並且快速地(如在幾小時內)測試常見細菌病原體、病毒病原體和原生動物病原體,本方法提供了比目前實踐顯著的改進。該測試的快速性使得其對於快速診斷血流病原體以及制定合適和及時治療的關鍵任務特別有用。此外,由於基因組分布分析測定能夠產生高解析度指紋,因此它是進行流行病學分析的強有力工具。
本實施例概述。我使用基因組扣除(細菌病原體和寄生蟲)或計算機分析(病毒)從各種血流病原體分離ID序列。在給定株的DNA中存在的ID序列亞組構成該株的基因組分布分析指紋。通過確定在每個血流病原體類群的代表株中存在的ID序列亞組,構建指紋資料庫。通過將臨床血流樣品的基因組分布分析指紋與指紋資料庫相比較,確定該臨床樣品中病原體的身份。
在本實施例中使用的方法的概述。在本實施例中,我使用Tinsley等(Proc.Natl.Acad.Sci.USA 9311109-11114,1996)的改良的表現度差異分析(representational difference analysis)基因組扣除方法,分離病原體特異性ID序列,而不是在以前實施例中使用的方法。如前面實施例所述,通過使用特定樣品中的基因組DNA通過雜交選擇一組ID探針,確定在所述樣品中的ID序列的身份。然而,在本實施例中,通過液相雜交-捕獲方法,分離所選定的探針。同時,在本實施例中,我使用質譜法鑑定所選定的擴增ID探針,而不是使用前面實施例中所述的微陣列方法。
從引起血流感染的病原體分離ID序列。表7列出了一些引起血流感染的常見病原體。使用Tinsley等(1996,見上文)所改良的表現度差異分離方法,從所述非病毒(即細菌、真菌和寄生蟲)病原體分離ID序列。如在實施例1中所述,針對表7中列出的特定類群的「+」基因組差異樣品由來自該類群的代表性病原體的DNA組成,而「-」基因組差異樣品由來自密切相關的非致病性生物的DNA組成。(對於其中所有已知代表都是病原體的類群,所述「+」和「-」樣品包括由致病菌株亞類群匯集的DNA。)對於引起血流感染的病毒,如在前面的實施例所述,從已公開的DNA序列數據推導出ID序列。
表7.引起血流感染的病原體。
用於捕獲ID序列的ID探針、擴增和質譜檢測。對於所述血流基因組分布分析測定中的每個ID序列,合成一對DNA捕獲ID探針、兩種擴增ID探針、一種缺口ID探針和一種質譜檢測寡核苷酸(圖9A-9C)。每種捕獲ID探針具有兩個部分一個生物素化臂(約10個鹼基長)和對應於一種ID序列的一部分的一個臂(約15鹼基長)。所述左擴增探針和右擴增探針也具有兩個部分一個部分包含對應於擴增探針的序列(約20鹼基長),一個部分與一種ID序列互補(約15個鹼基長)。合成在5』末端生物素化的引物,以便可以擴增已連接的三聯探針(圖9B)並進行親和純化。所述缺口ID探針(約20個鹼基長)與一種ID序列互補,並且當所述缺口ID探針退火至對應的ID探針時,它與所述左擴增ID探針和所述右擴增ID探針相鄰。與實施例1中描述的那些方法相似地合成陽性對照探針和陰性對照探針並使用它們,不同之處在於本實施例中的樣品溶液包括實施例1中與所述濾膜結合的陽性對照探針。
為確定哪些ID探針與樣品雜交,我使擴增的選定ID探針與對應於需要測定的ID探針集合的質譜檢測寡核苷酸雜交。每種質譜檢測寡核苷酸約8-15個核苷酸長(質譜獲得小寡核苷酸的非常高解析度的區別),並且每種質譜檢測寡核苷酸與一種探針的缺口探針部分互補(圖9C)。在該集合中的各種質譜檢測寡核苷酸應當都具有獨特的分子量,以便可以通過質譜鑑定它們的身份。為增強具有相似分子量的寡核苷酸間的分子量區別,在某些情況下,包括化學修飾的寡核苷酸是有用的。具有各種各樣的化學修飾以及具有最少改變的復性特徵的寡核苷酸是商業化可得的。
對血流病原體進行指紋分析如前面實施例所述,為鑑定引起血流感染的病原體,我將臨床樣品的基因組分布分析指紋與來自以前特徵鑑定的生物的指紋資料庫相比較。如以前所述,我首先從來自表7列出的每個血流病原體類群的參考菌株的基因組分布分析指紋組裝指紋資料庫。然後將臨床血液樣品的指紋與該資料庫相比較,確定在所述樣品中任何病原體的身份。
捕獲和擴增與參考菌株的DNA雜交的ID探針。在本實施例中,我使用液相雜交-捕獲方法(Hsuih等,J.Clin.Microbiol.34501-507,1996)來親和純化在一個參考菌株的核酸分子中存在的病原體特異性ID序列。通過在5M硫氰酸胍中溫育(在90℃5分鐘,然後在65℃10分鐘)並短時間渦旋混合,裂解生物並使該生物的核酸分子可以用於雜交。根據要檢測的生物,可以如下修改所述程序,例如,包括在更高溫度的熱處理、酶處理(如用溶菌酶、幾丁質酶或磷脂酶)、用去垢劑(如CTAB或SDS)處理或有機提取(如用苯酚或氯仿)。然後我根據Hsuih等(1996,見上文)的方法,進行用探針(捕獲探針、擴增探針和缺口探針)的雜交、親和純化、連接和擴增所述三聯連接的擴增/缺口探針(圖9B)(Hsuih等,1996,見上文)。
純化對應於擴增的ID探針的質譜檢測寡核苷酸。擴增的探針對應於所述參考菌株中病原體特異性的ID序列。對於這些序列的基於質譜的鑑定,我使用生物素化的擴增產物來親和純化對應的質譜檢測寡核苷酸(圖9C)。使擴增反應物(50μl)溶於10mM EDTA,並與在10mMEPPS,pH8.0/1mM EDTA中包含10ng每種質譜檢測寡核苷酸的10μl溶液混合,然後在100℃變性2分鐘。在加入15μl 5M NaCl並在30℃溫育15分鐘後,加入30μl鏈黴抗生物素包被的順磁珠(Promega),並如以前所述進行親和層析(Hsuih等,1996,見上文)。所述珠用500μl10mM EPPS,pH8.0/1mM EDTA洗3次。通過在100μl 10mM EPPS,pH 8.0/1mM EDTA中加熱所述溶液到50℃(或比在1M NaCl中所述檢測寡核苷酸的最高Tm高10℃),回收親和純化的質譜檢測寡核苷酸。從所述磁珠取出包含所述質譜檢測寡核苷酸的上清液,而用磁鐵將所述磁珠保留在管中。
構建一個病原體類群的指紋資料庫使用質譜來鑑定所選定的質譜檢測寡核苷酸。制各樣品並且使用儀器(PerSeptive Biosystems)和以前描述的方法(Roskey等,Proc.Natl.Acad.Sci.USA 934724-4729,1996),通過基質輔助雷射解吸電離飛行時間質譜(延遲提取)(MALDI-TOF(DE))製備和分析樣品。將親和純化的寡核苷酸的質量與以前確定的整個質譜檢測寡核苷酸集合的元件的質量相比較。這樣,鑑定了選定的質譜檢測寡核苷酸,該選定的質譜檢測寡核苷酸進而又指出在受測試的參考菌株中ID序列的身份。
在所述參考菌株中存在的ID序列亞組構成其基因組分布分析指紋。收集在表7列出的每個類群中參考菌株的指紋資料庫。
鑑定在血液樣品中存在的病原體。如上文針對參考菌株所述,裂解血液樣品並進行指紋分析,不同之處在於所述雜交反應中包括來自表7所有血流病原體類群的ID探針。通過將所獲得的指紋與那些參考菌株的指紋資料庫中的指紋相比較,鑑定在血液樣品中存在的病原體。實施例4.使用基因組分布分析測定的法醫學鑑定法醫學鑑定的概述。鑑定細胞樣品的來源是現代法醫分析的一個重要方面。法醫學樣品的遺傳鑑定需要擴增常常僅以微觀量可得的細胞材料中的DNA,並將所述DNA與其他個體的DNA相比較。目前遺傳鑑定的方法一般要求分析型凝膠電泳,該步驟極其消耗時間,並且在技術上對於許多法醫學實驗室是不合適的。本實施例提供了使用基因組分布分析進行法醫學鑑定的快速、簡單並且健全的方法。
本實施例概述。我使用富集的基因組差異樣品,分離了可用於鑑定人類法醫學樣品的來源的ID序列集合。在本實施例中,所述富集的基因組樣品是經擴增的人類基因組亞組,根據擴增過程的本質,所述人類基因組亞組包含一些可重現地從某些個體的基因組中擴增、但不從其他個體的基因組擴增的序列。這些差異擴增的序列構成基因組差異序列它們在一個富集的基因組差異樣品中存在,但不在另一個富集的基因組差異樣品中存在。在來自某一個體的DNA中存在的這樣的序列集合的亞組構成一個基因組分布分析指紋。通過將所述樣品指紋與其他個體的樣品指紋相比較,獲得所述樣品來源的身份。
在本實施例中使用的方法的概述。本實施例與前面的實施例在幾個方面有所不同。通過選擇性擴增人類基因組DNA,構建用於獲得人類ID序列集合的富集的基因組差異樣品。本實施例使用Alu-PCR選擇性擴增人類DNA,但也可以使用其它方法進行選擇性擴增,如用於擴增根據大小分級分離的DNA的AFLP方法(Lisitsyn等,Mol.Gen.Microbiol.Virus.326-29,1993;Rosenberg等,Proc.Natl.Acad.Sci.USA 916113-6117,1994),或在實施例5中描述的方法。進行多次基因組扣除以產生多個人類ID序列家族。用對應於基因組扣除產物的檢測序列構建一個檢測陣列。為鑑定人類法醫學樣品,使用選擇性擴增(在這種情況下是Alu-PCR)來擴增樣品DNA。得到的人類基因組DNA在所述樣品中的「代表」由標記的擴增產物組成。通過與所述檢測陣列雜交,測試所述產物中特徵性ID序列的存在。不同人類個體的基因組將產生不同的基因組分布分析指紋。
使用Alu-PCR選擇性擴增人類DNA。Alu-PCR方法擴增在Alu重複序列之間的DNA,所述Alu重複序列頻繁出現於人類基因組中(平均每幾千個鹼基一個)。由於Alu重複序列具有多態性,一些擴增的片段存在於一個人體內,而不存在於另一個人體內(Stoneking等,GenomeRes.71061-1071,1997;Zietkiewicz等,Proc.Natl.Acad.Sci.USA 898448-8451,1992)。
通過標準方法(Ausubel等,1987,見上文)純化用於製備基因組扣除樣品的人類基因組DNA。如以前所詳述(Lincoln等,「法醫DNA分布分析方法,」載於Methods in Molecular Biology(Humana Press,Totowa,New Jersey)1998),通過應用適於該樣品類型的方法,製備法醫學樣品以進行擴增。使用Zietkiewicz等(1992,見上文)的方法,進行Alu-PCR反應,改動之處在於PCR擴增用作「+」基因組差異樣品的DNA,並且使用5』-末端生物素化的寡核苷酸引物,對法醫學樣品進行PCR擴增。
分離ID序列並構建檢測集合陣列。通過基因組扣除(Straus等,1990,見上文),分離上文所述的通過富集的基因組差異序列定義的一個人類ID序列家族。如上所述,使用來自個體的樣品或通過匯集來自幾個個體的Alu-PCR產物,製備富集的基因組差異樣品(所述樣品可以根據遺傳和/或地區標準分組)。對所述基因組差異序列進行克隆、測序、並如以前所述擴增(Rosenberg等,1994,見上文;Straus等,1990,見上文)。為構建所述檢測集合陣列,使用Maier等(J.Biotechnol.35191-203,1994)的基於機器人的方法,將擴增的扣除產品,即基因組差異序列在尼龍膜上排成陣列。
對法醫學樣品進行指紋分析。通過以前描述的方法(Lincoln,1998,見上文),製備法醫學樣品以進行指紋分析。通過使法醫學樣品的生物素化Alu-PCR擴增產物與所述檢測集合陣列雜交,獲得所述法醫學樣品中人類DNA的指紋。在通常少於1ml的體積中,在65℃進行所述雜交反應(1M NaCl/50mM EPPS/2mM EDTA,pH8)30分鐘。通過在65℃的2ml洗滌緩衝液(50mM NaCl/50mM EPPS/2mM EDTA,pH8)中五個30秒鐘洗滌步驟(伴隨振蕩),除去未結合的擴增產物。使用Phototope-Star檢測系統(New England Biolabs),根據廠家的建議,使所述指紋(雜交模式)顯現。實施例5.掃描樣品中的多種人類遺傳標記現代醫學遺傳學和藥物基因組學(pharmacogenomics)的一個重要目標是快速獲得患者的基因組分布。遺傳標記可以作為疾病(如乳腺癌和亨廷頓舞蹈病)的早期警報,或可以指示患者可能對哪種藥療法有利地反應。本實施例展示了在一個快速的基於雜交的測試中,使用基因組分布分析測定來調查大量人類遺傳標記的基因型。
本實施例概述。在本實施例中,同時調查一個人類基因組在多個多態位點的基因型。如在前三個實施例中所述,使一個探針(在這種情況下是SNP探針)集合與基因組DNA雜交。如以前所述,所述探針集合的選擇性擴增產生了該集合的一個診斷信息亞組。然後通過與檢測陣列的雜交,鑑定所擴增亞組的成員。在本實施例中,與以前的實施例不同,根據在樣品基因組中存在的特定SNP等位基因,選擇性連接半邊SNP探針,從而完成選擇性擴增。使用SNP探針進行基因組分型的方法圖解於圖10。
合成多態性探針集合和檢測集合。在本實施例中,使用已知的人類DNA多態性設計多態性探針。當所述多態性探針退火於包含等位基因的一個版本的基因組DNA時,可以連接所述多態性探針,但當基因組包含所述基因的不同版本時,就不能連接所述多態性探針。等位基因特異性SNP探針連接的使用圖解於圖10。所靶向的DNA多態性可以是對應於用於對人類基因組進行作圖的標記的單核苷酸多態性(SNP)(如,Landegren等,Genome Res.8769-776,1998)或對應於具有醫學重要性的突變的單核苷酸多態性(如引起遺傳病鐮狀細胞貧血的單鹼基對突變)。在所述測定中也可以包括任何其它類型的核酸序列多態性(包括插入、缺失和重排)。
一旦選擇了所述DNA多態性,則可以基本如實施例1中製造ID探針一樣合成多態性探針。SNP探針的優選設計利用T4 DNA連接酶的能力以鑑別在要連接的3』末端的單鹼基對錯配。然而,在本實施例中,設計所述半邊多態性探針,以便成對的探針在所述DNA多態性位點鄰接。一般合成對應於每個靶DNA多態性的兩種多態性探針一種探針檢測在所述多態性位點的一種基因型,而另一種探針檢測另一種可能的基因型。對於出現幾種基因型的基因座,合成另外的多態性探針。
因此,對於每個要進行基因組分型的SNP,SNP探針包含幾種半邊探針。一種半邊探針(圖10中的右半邊探針)是不變的。在所述測定中也包括了左半邊SNP探針的幾種版本。每個版本在所述基因組SNP位點具有對應於所述等位基因的不同3』末端核苷酸。只有在所述3』位點與所述基因組等位基因匹配的左半邊探針才被連接並隨後擴增。如前面的實施例,可以通過在擴增反應中使用生物素化引物而標記擴增產物。
因為每種獨特的左半邊探針都具有一種獨特的標記(見圖10),所以有可能通過使所述標記的擴增SNP探針與包含標記集合的檢測陣列雜交,檢測哪些等位基因已經被連接並成功地擴增,其中所述標記集合對應於SNP探針原始集合。也就是說,所述陣列中的每一種標記對應於所述原始SNP探針集合中其中一種左半邊SNP探針中的標記(或其互補物)。
如實施例1構建所述檢測陣列,不同之處在於,在這種情況下,所述陣列的元件是對應於所述多態性探針集合的標記序列。
選擇性擴增人類DNA多態性並進行指紋分析。如實施例4製備包含人類DNA的樣品。假如使用純化的DNA,就簡單地將其點樣在0.5M NaOH中的尼龍濾膜上,使其風乾,並用紫外光使其交聯到濾膜上(使用來自Stratagene的Stratalinker儀器,按照廠家的說明書)。注意對於法醫學樣品,預擴增DNA樣品,即製備基因組代表可能是有用的。例如,可以使用實施例4中描述的Alu-PCR方法,從單個人類毛囊擴增DNA。當使用代表作為樣品測試SNP多態性時,設計所述SNP探針,使其對應於從所有樣品擴增的區段中的多態性。(注意這與前面的實施例不同,在前面的實施例中在診斷上有用的序列是差異擴增的序列,即ID探針)。
如實施例1所述(關於該實施例的ID探針),使所述多態性探針集合與所述樣品雜交、洗滌、連接、擴增、標記、與檢測陣列雜交、並使指紋顯現。與所述檢測陣列的雜交模式指出了通過所述多態性探針集合的調查,在所述樣品的基因組DNA中在每個多態性位點呈現的等位基因。實施例6.掃描腦脊液樣品中的大量病毒本實施例概述。中樞神經系統(CNS)的感染被認為是醫療急症。快速診斷傳染因子對於最佳的治療效果是至關重要的。診斷病毒感染尤其存在問題,並且常常是昂貴的。本實施例描述的方法可以用於同時測試腦脊液(CSF)樣品中各種類型病毒的存在。通過用ID探針集合進行液相雜交捕獲,然後擴增樣品選定的ID探針,選定在CSF樣品中的病毒特異性ID序列。使用所擴增的ID探針探測檢測集合陣列,以確定存在哪些病毒(假如存在的話)。本實施例描述了針對CSF中的病毒的測試,但採用合適的樣品製備,可以對其它類型樣品進行類似測試,所述樣品包括血液樣品和固體組織樣品。
組裝病毒特異性ID序列、探針和引物。選擇對於表8列出的病毒表中每個病毒類群特異性的類群特異性序列。在某些情況下,文獻中已經描述了病毒特異性ID序列。在其它情況下,在將公共資料庫中的病毒基因組序列與該資料庫中的其他病毒相比較,選定序列。使用標準方法進行序列比較(Ausubel等,1987,見上文)。選擇至少30個鹼基長的病毒特異性序列,並如實施例3(血流病原體測定)所述,如圖9A-9C所示,合成對應的ID探針集合和引物集合。然而,我合成了與所述缺口探針互補的更長的(約20個鹼基)檢測集合寡核苷酸,而不是圖9C所示的小質譜檢測寡核苷酸。如實施例2所述,通過光刻法構建檢測集合陣列。如實施例3所述合成和使用陽性對照探針和陰性對照探針。
表8.引起CNS感染的病毒
掃描樣品尋找所述病毒組的成員。如實施例3所述製備CSF樣品、與探針集合雜交、通過磁力分離純化靶序列、連接所選定的探針、以及擴增。然後如實施例4所述,使所述生物素化的擴增產物與所述病毒檢測集合陣列雜交並使其顯現。
其它實施方案包括在下面的權利要求書中。
權利要求
1.一種從可能含有靶核酸分子的生物樣品獲取遺傳信息的方法,所述方法包括下列步驟a)提供下列核酸分子(i)在所述樣品中的靶核酸分子,或(ii)與所述樣品中的靶核酸分子雜交的探針,或(iii)(i)或(ii)的擴增產物,或(iv)(i)的基因組代表;然後b)通過將(a)的核酸分子與最小基因組起源大於5的檢測集合相接觸或比較,檢測靶核酸分子,其中所述檢測集合包括能夠檢測靶核酸分子的檢測序列。
2.權利要求1的方法,所述方法還包括步驟(c)鑑定在步驟(b)檢測到的核酸分子。
3.權利要求1的方法,其中所述檢測集合的最小基因組起源大於11。
4.權利要求1的方法,其中步驟(a)的核酸分子並不作為根據大小分級分離的片段固定化到基質或固相支持體上。
5.權利要求1的方法,所述方法還包括下列步驟假如在所述樣品中存在靶核酸分子,就使用少於四對的擴增序列來產生擴增產物。
6.權利要求5的方法,其中使用一對擴增序列進行擴增。
7.權利要求1的方法,其中使用所述方法通過原位雜交來定量所述生物樣品中的靶生物。
8.權利要求1的方法,其中在步驟(a)之前,使所述樣品的核酸分子與一個ID探針集合同時雜交以產生步驟(a)(ii)的探針。
9.權利要求1的方法,其中步驟(a)(ii)的探針包括(i)能夠與靶核酸分子雜交的第一個區,和(ii)擴增序列。
10.權利要求1的方法,其中將所述樣品的所述核酸分子固定到固相支持體上。
11.權利要求1的方法,其中步驟(a)的所述核酸分子處於液相中。
12.權利要求1的方法,其中步驟(a)的至少一些核酸分子包含一種或多種寡核苷酸標記。
13.權利要求1的方法,其中步驟(a)(ii)的至少一些探針包含(i)當與靶核酸分子雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴增序列。
14.權利要求1的方法,其中所述檢測集合的所述檢測序列在固相支持體上作為以兩維的點排列或作為平行帶排列。
15.權利要求8的方法,其中所述ID探針集合包括探針,所述探針與來自至少十種不同病毒的每一種的至少兩種不同核酸分子雜交,其中所述病毒的每一種都屬於不同的屬。
16.權利要求1的方法,其中所述生物樣品是胃腸道樣品,並且所述遺傳信息是對所述樣品中來自6種或更多種以下生物的核酸分子的鑑定大腸埃希氏菌(Escherichia coli)、沙門氏菌屬(Salmonella)、志賀氏菌屬(Shigella)、小腸結腸炎耶爾森氏菌(Yersiniaenterocolitica)、霍亂弧菌(Vibrio cholera)、糞彎曲桿菌(Campylobacterfecalis)、艱難梭菌(Clostridium difficile)、輪狀病毒屬(Rotavirus)、諾沃克病毒(Norwalk virus)、星狀病毒屬(Astrovirus)、腺病毒屬(Adenovirus)、冠狀病毒屬(Coronavirus)、蘭氏賈第鞭毛蟲(Giardialamblia)、溶組織內阿米巴(Entamoeba histolytica)、人酵母菌(Blastocystis hominis)、隱孢子蟲屬(Cryptosporidium)、Microsporidium、美洲板口線蟲(Necator americanus)、人蛔蟲(Ascaris lumbricoides)、毛首鞭蟲(Trichuris trichiura)、蟯蟲(Enterobius vermicularis)、糞類圓線蟲(Strongyloides stercoralis)、麝後睪吸蟲(Opsthorchis viverrini)、華支睪吸蟲(Clonorchis sinensis)和短膜殼絛蟲(Hymenoplepis nana)。
17.權利要求1的方法,其中所述生物樣品是呼吸道樣品,並且所述遺傳信息是對所述樣品中來自6種或更多種以下生物的核酸分子的鑑定白喉棒桿菌(Cornybacterium diphtheriae)、結核分枝桿菌(Mycobacterium tuberculosis)、肺炎支原體(Mycoplasmapneumoniae)、沙眼衣原體(Chlamydia trachomatis)、肺炎衣原體(Chlamydia pneumoniae)、百日咳博德特氏菌(Bordetella pertussis)、軍團菌(Legionella spp.)、諾卡氏菌(Nocardia spp.)、肺炎鏈球菌(Streptococcus pneumoniae)、流感嗜血菌(Haemophilus influenzae)、鸚鵡熱衣原體(Chlamydia psittaci)、銅綠假單胞菌(Pseudomonasaeruginosa)、金黃色葡萄球菌(Staphylococcus aureus)、莢膜組織胞漿菌(Histoplasma capsulatum)、Coccidoides immitis、新型隱球酵母(Cryptococcus neoformans)、皮炎芽生菌(Blastomyces dermatitidis)、卡氏肺囊蟲(Pneumocystis carinii)、呼吸道合胞病毒、腺病毒屬、單純皰疹病毒、流感病毒、副流感病毒和鼻病毒屬(Rhinovirus)。
18.權利要求1的方法,其中所述生物樣品是血液樣品,並且所述遺傳信息是對所述樣品中來自6種或更多種以下生物的核酸分子的鑑定凝固酶陰性葡萄球菌、金黃色葡萄球菌、Viridansstreptococci、腸球菌(Enterococcus spp.)、β溶血性鏈球菌、肺炎鏈球菌、埃希氏菌(Escherichia spp.)、克雷伯氏菌(Klebsiella spp.)、假單胞菌(Pseudomonas spp.)、腸桿菌(Enterbater spp.)、變形蟲(Proteus spp.)、擬桿菌(Bacteroides spp.)、梭菌(Clostridium spp.)、銅綠假單胞菌、棒桿菌(Cornybacterium spp.)、瘧原蟲(Plasmodium spp.)、杜氏利什曼原蟲(Leishmania donovani)、弓形蟲(Toxoplasma spp.)、微絲蚴(Microfilariae)、真菌、莢膜組織胞漿菌、Coccidoides immitis、新型隱球酵母、假絲酵母(Candida spp.)、HIV、單純皰疹病毒、C型肝炎病毒、B型肝炎病毒、巨細胞病毒屬(Cytomegalovirus)和EB病毒。
19.權利要求1的方法,其中所述遺傳信息是對所述樣品中來自6種或更多種以下生物的核酸分子的鑑定柯薩奇病毒A、單純皰疹病毒、聖·路易腦炎病毒、EB病毒、粘液病毒、JC病毒、柯薩奇病毒B、披膜病毒、麻疹病毒、肝炎病毒、副粘病毒、艾可病毒、布尼亞病毒、巨細胞病毒、水痘-帶狀皰疹病毒、HIV、腮腺炎病毒、馬腦炎病毒、淋巴細胞性脈絡叢腦膜炎病毒、狂犬病病毒和BK病毒。
20.權利要求8的方法,其中至少50%的組成所述核酸探針集合的探針能夠與可能存在於所述樣品中或存在於所述樣品的基因組代表中的預先確定的基因組差異序列雜交。
21.一種用於從生物樣品獲取遺傳信息的試劑盒,所述試劑盒包含a)多種ID探針和/或SNP探針;和b)一個包含與(a)的探針相應的檢測序列的檢測集合,其中所述檢測集合的最小基因組起源大於五。
22.權利要求21的試劑盒,其中(a)包含多於十種的不同的可擴增探針。
23.權利要求22的試劑盒,其中(a)包含多於五十種的不同的可擴增探針。
24.權利要求23的試劑盒,其中(a)包含多於二百五十種的不同的可擴增探針。
25.權利要求21的試劑盒,其中所述檢測集合的最小基因組起源大於11。
26.權利要求21的試劑盒,其中(a)包含多於五個的可擴增探針家族。
27.權利要求21的試劑盒,其中(a)的探針對於至少兩個不同的分類單位具有特異性。
28.權利要求27的試劑盒,其中(a)的探針對於至少兩個不同的物種具有特異性。
29.權利要求27的試劑盒,其中(a)的探針對於至少兩個不同的屬具有特異性。
30.權利要求27的試劑盒,其中(a)的探針對於至少兩個不同的界具有特異性。
31.權利要求21的試劑盒,其中(a)的探針包括包含以下的探針(i)當與靶核酸分子的ID序列雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴增序列。
32.權利要求21的試劑盒,其中(a)的探針和/或(b)的檢測序列物理結合於固相支持體上的不同位置。
33.權利要求21的試劑盒,其中至少50%的(a)的探針包含來自至少三個不同物種的基因組差異序列。
34.權利要求32的試劑盒,其中檢測(i)一個分類群的成員和(ii)密切相關的分類群的所述檢測集合所包含的檢測序列在所述支持物上相互鄰近定位。
35.一個ID探針集合,所述ID探針集合可以使用少於四對的擴增序列擴增,並且包含多於三個的ID探針家族和多於十種的不同的ID探針。
36.權利要求35的集合,所述集合包含多於五十種的不同的可擴增ID探針。
37.權利要求36的集合,所述集合包含多於兩百五十種的不同的可擴增ID探針。
38.權利要求35的集合,所述集合包含多於十個的可擴增ID探針家族。
39.權利要求35的集合,所述集合包含多於二十五個的可擴增ID探針家族。
40.權利要求35的集合,其中所述可擴增探針家族中多於兩個的家族對於非重疊的分類單位具有特異性。
41.權利要求35的集合,其中所述可擴增探針家族中多於兩個的家族對於不同物種具有特異性。
42.權利要求35的集合,其中所述可擴增探針家族中多於兩個的家族對於不同屬具有特異性。
43.權利要求35的集合,其中所述可擴增探針家族中多於兩個的家族對於不同界具有特異性。
44.權利要求35的集合,其中(a)的探針包括包含以下的探針(i)當與靶核酸分子的ID序列雜交時可以相互連接的兩種或更多種寡核苷酸,和(ii)擴增序列。
45.權利要求35的集合,其中至少50%的所述探針包含來自三個不同物種的基因組差異序列。
46.權利要求35的試劑盒,其中檢測(i)一個分類群的成員和(ii)密切相關的分類群的所述檢測集合所包含的檢測序列在支持物上相互鄰近定位。
47.一種從可能含有靶核酸分子的生物樣品獲得遺傳信息的方法,所述方法包括下列步驟a)提供最小基因組起源大於五的核酸探針集合;b)使所述探針集合同時與所述樣品的核酸分子接觸;c)檢測在所述探針和所述樣品的任何靶核酸分子之間的雜交;以及d)鑑定在步驟(c)中檢測到的核酸分子。
48.權利要求13的方法,其中所述可以連接的寡核苷酸是SNP探針。
49.權利要求48的方法,其中至少某些所述SNP探針包含可以與檢測集合中標記序列雜交的標記序列,其中所述檢測集合包含與所述SNP探針相應的標記序列集合。
50.權利要求48的方法,其中所述檢測集合的最小基因組起源大於20。
51.權利要求50的方法,其中所述檢測集合的最小基因組變異大於50。
52.權利要求1的方法,其中通過使用不多於四對的擴增序列來擴增步驟(a)(i)的靶核酸分子,產生步驟(a)(iv)的擴增產物。
53.權利要求52的方法,其中所述擴增序列指導使用Alu特異性引物的對位於Alu重複序列之間的序列的擴增。
54.權利要求52的方法,其中(b)的檢測集合包含與可能在步驟(a)(iv)中擴增的ID探針相應的ID位點。
55.一種用於從生物樣品中獲取遺傳信息的試劑盒,所述試劑盒包括a)多種核酸引物,所述核酸引物能夠在生物樣品中引發靶基因組DNA中與重複序列鄰接的DNA序列的擴增,產生ID探針;以及b)一個包含檢測序列的檢測集合,所述檢測與使用(a)的引物可能擴增出的ID探針相應,其中所述檢測集合的最小基因組起源大於五。
56.權利要求55的試劑盒,其中所述檢測集合的最小基因組起源大於20。
57.權利要求55的試劑盒,其中所述重複序列是人Alu重複序列,並且所述引物是Alu特異性引物。
全文摘要
本發明提供了稱為基因組分布分析的一種方法,該方法同時掃描複雜的生物樣品中多種不同類型生物特徵性的核酸序列(包括基因組差異序列、類群特異性序列和DNA多態性)的存在。本發明還包括用於本發明的方法中的探針、檢測集合和相關分子。
文檔編號G01N33/53GK1370242SQ00811616
公開日2002年9月18日 申請日期2000年6月15日 優先權日1999年6月15日
發明者D·史特勞斯 申請人:基因描繪系統有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀