新四季網

用於DNA譜系分析的方法及組合物與流程

2023-04-26 18:29:46 4

本申請要求2015年1月14日提交的美國臨時申請號62/103,524、2014年8月28日提交的美國臨時申請號62/043,060和2014年2月18日提交的美國臨時申請號61/940,942的優先權,這些申請的內容通過引用以其整體併入本文。序列表、表格或電腦程式列表的引用本申請與電子格式的序列表一起提交。序列表作為命名為ILLINC276WO_Sequence_Listing.TXT的文件提供,創建日期為2015年2月13日,該序列表大小為55Kb。該電子格式的序列表中的信息通過引用以其整體併入本文。公開內容的領域本文提供的實施方案涉及用於DNA譜系分析(DNAprofiling)的方法及組合物。一些實施方案涉及在單個反應中擴增不同尺寸的靶序列,隨後進行文庫的後續測序的方法。公開內容的背景在歷史上,在人類基因組中的標誌物的子集的使用已被用來確定個體的個人身份或DNA指紋或譜。這些標誌物包括短串聯重複序列(STR)和中度串聯重複序列(ITR)的位置或基因座,它們組合起來在從基因水平上鑑定一個個體與另一個個體中是有用的。這些標誌物的分析已在犯罪現場發現的DNA的分析中變得標準化。例如,在美國,這些重複序列中的許多已被組合,以創建聯合DNA索引系統(CombinedDNAIndexSystem,CODIS),聯合DNA索引系統(CODIS)在刑事案件中用作用於DNA譜系分析的實驗室標準。其他國家同樣也採用了用於DNA譜系分析的標準系統。這些系統也被用來確定親子鑑定和家庭關係。然而,目前的系統都基於這些重複的基因座在電泳系統上的尺寸分離,並因此受到可在此類系統中區分的基因座數目的限制。例如,由於電泳檢測方法的限制,用於法醫學目的的DNA譜系分析的一些目前的商業系統僅區分16個標誌物。公開內容的概述實施方案涉及不受含量限制,並且使有關個體的遺傳信息的不同碎片(pieces)匯集在一起,以提供個體的全面的、更完整的DNA譜的系統和方法。本公開內容描述了使個體的該譜成為可能,從而推進個人和法醫基因組學領域的方法及組合物。DNA譜系分析目前使用選擇的生物標誌物以用於確定DNA樣品身份。例如,用於確定DNA譜的最常用的分析是確定在生物體的基因組中發現的許多短串聯重複(STR)序列的譜。分析由以下組成:擴增定義的STR序列,該定義的STR序列可多達400bp長,可通過在電泳凝膠上的尺寸或通過使用毛細管電泳(CE)來區分。電泳用來檢測由於在給定基因座處的重複的STR的數目差異以及因此的PCR擴增子的長度差異帶來的尺寸變化,這對於CE系統在50-500bp之間。為了幫助克服由尺寸區分方法產生的限制(即,具有重疊擴增子尺寸的STR不能被區分),DNA譜系分析的目前的方法利用標記的引物的不同集合,使得尺寸重疊的擴增子可用不同的螢光染料標記,在激發後,所述不同的螢光染料上的發射光譜不同,從而允許使用染料激發和發射光譜的差異來區分重疊的擴增子。使用差異化標記,目前的方法允許在一個DNA譜系分析運行中使用6種不同的可檢測的染料使得24個不同的STR基因座多重複用(multiplexing)。目前的DNA譜系分析方法存在許多限制。如先前提及的,尺寸區分系統限制可在給定時間離散地確定的基因座的數目。用於DNA譜系分析的已建立方法的另一個限制是,待分析的DNA常常降解,且一些標誌物的尺寸範圍不容納降解的DNA,例如,擴增子可大於降解的DNA的片段的尺寸。對於降解的DNA,400bp的擴增子被認為是非常長的,並且可導致那些更長基因座的擴增的損失。當DNA分析者擴增降解的DNA樣品以鑑定它們的STR譜,例如,在犯罪現場發現的樣品時,通常他們不能檢測到所有的基因座,導致部分譜,這可使犯罪現場中的犯罪嫌疑人與犯罪樣品難以或不可能匹配。默認對於此類樣品(Asadefaultwithsuchsamples),DNA分析者幾乎沒有選擇,且如果任何樣品有剩餘(leftover),需要進行另外的測定,以鑑定可能給出關於個體身份的線索的其他標誌物,諸如單核苷酸多態性(SNP)、微-STR或線粒體DNA(mtDNA)分析。然而,珍貴的樣品必須被耗費在每一次測定上,而並不具有最終鑑定個體的成功的確定性。圖1A示出了DNA鑑定的潛在的不同路徑,它們全部是單獨的工作流程並要求珍貴樣品的等分試樣。當一個或更多個簡單的工作流程需要被組合併可能重複多次時,則所得的過程不再簡單或有效使用珍貴的樣品。在本申請中描述的實施方案提供了用於通過下一代測序(NGS)確定個體或有機體的DNA譜的方法、組合物及系統,從而提供對DNA譜系分析的目前方法的問題和限制的解決方案。圖1B示出了在一個實施方案中,公開的方法的示例性工作流程。本文公開了用於將大量法醫相關的標誌物組合進一個測定的方法及組合物,所述法醫相關的標誌物包括,但不限於,短串聯重複(STR)、中度串聯重複(ITR)、身份信息單核苷酸多態性(iSNP)、祖先信息單核苷酸多態性(aSNP)以及表型信息單核苷酸多態性(pSNP)。本公開內容描述了克服DNA譜系分析的目前方法的限制的測定。公開的實施方案提供了用於在單個多重反應中從一個核酸樣品多重擴增、文庫製備及測序組合的STR、ITR、iSNP、aSNP和pSNP的方法及組合物。公開的方法在具有最小樣品處理的一個實驗測定中使用低量的包含降解的DNA的樣品DNA分析多個標誌物。一些描述的實施方案可被用於資料庫分析(databanking)DNA譜和/或可用於刑事案件的DNA譜。一些實施方案提供了被開發為足夠靈敏的以檢測亞納克量的DNA的PCR方法及組合物。此外,非常規的引物設計參數允許高度多重複用的PCR以用於在一個多重反應中鑑定STR、ITR和SNP。對於刑事案件,本發明的方法及組合物摻入獨特分子標識符(UMI),該獨特分子標識符(UMI)有助於從測序結果去除,例如,PCR和測序誤差、掃描殘跡(stutter)等。參見Kivioja等,Nat.Meth.9,72–74(2012)。同樣,來自本文公開的方法及組合物的結果與現有的資料庫兼容。因此,本文公開的實施方案提供了用於構建DNA譜的方法,所述方法包括:提供核酸樣品,在多重反應中用多種引物擴增該核酸樣品以生成擴增產物,所述多種引物與包含單核苷酸多態性(SNP)的至少一種靶序列和包含串聯重複的至少一種靶序列特異性雜交,並且確定在該擴增產物中的至少一種SNP和至少一種串聯重複的基因型,從而構建該核酸樣品的DNA譜。在一些實施方案中,該方法包括從擴增產物生成核酸文庫。在一些實施方案中,該方法包括確定核酸文庫的序列。在一些實施方案中,核酸樣品來自人類。在一些實施方案中,核酸樣品來自環境樣品、植物、非人類動物、細菌、古細菌(archaea)、真菌或病毒。在一些實施方案中,DNA譜被用於疾病診斷或預後、癌症生物標誌物鑑定、遺傳異常鑑定或遺傳多樣性分析的一種或更多種。在一些實施方案中,DNA譜被用於資料庫分析、法醫、刑事案件工作、親子鑑定或個人鑑定的一種或更多種。在一些實施方案中,至少一種SNP指示核酸樣品的來源的祖先或表型特徵。在一些實施方案中,多種引物的每種具有低的解鏈溫度和/或具有至少24個核苷酸的長度。在一些實施方案中,多種引物的每種具有小於60℃的解鏈溫度。在一些實施方案中,多種引物的每種具有為約50℃至約60℃的解鏈溫度。在一些實施方案中,多種引物的每種具有至少24個核苷酸的長度。在一些實施方案中,多種引物的每種具有約24個核苷酸至約38個核苷酸的長度。在一些實施方案中,多種引物的每種包含同聚物核苷酸序列。在一些實施方案中,核酸樣品通過聚合酶鏈式反應(PCR)擴增。在一些實施方案中,在具有相比於連同常規設計的引物一起使用的擴增緩衝液的鹽濃度增加的鹽濃度的擴增緩衝液中擴增核酸樣品。在一些實施方案中,鹽包括KCl、LiCl、NaCl或其組合。在一些實施方案中,鹽包括KCl。在一些實施方案中,擴增緩衝液中的KCl的濃度為約100mM至約200mM。在一些實施方案中,擴增緩衝液中的KCl的濃度小於約150mM。在一些實施方案中,擴增緩衝液中的KCl的濃度為約145mM。在一些實施方案中,SNP是祖先SNP、表型SNP、身份SNP或其組合。在一些實施方案中,多種引物與至少30種SNP特異性雜交。在一些實施方案中,多種引物與至少50種SNP特異性雜交。在一些實施方案中,串聯重複是短串聯重複(STR)、中度串聯重複(ITR)或其變體。在一些實施方案中,多種引物與至少24種串聯重複序列特異性雜交。在一些實施方案中,多種引物與至少60種串聯重複序列特異性雜交。在一些實施方案中,核酸樣品包含約100pg至約100ngDNA。在一些實施方案中,核酸樣品包含約10pg至約100pgDNA。在一些實施方案中,核酸樣品包含約5pg至約10pgDNA。在一些實施方案中,核酸樣品包括基因組DNA。在一些實施方案中,基因組DNA來自法醫樣品。在一些實施方案中,基因組DNA包含降解的DNA。在一些實施方案中,至少一種SNP和至少一種串聯重複的基因型的至少50%被確定。在一些實施方案中,至少一種SNP和至少一種串聯重複的基因型的至少80%被確定。在一些實施方案中,至少一種SNP和至少一種串聯重複的基因型的至少90%被確定。在一些實施方案中,至少一種SNP和至少一種串聯重複的基因型的至少95%被確定。在一些實施方案中,多種引物的每種包含一種或更多種標籤序列。在一些實施方案中,一種或更多種標籤序列包括引物標籤、捕獲標籤、測序標籤、獨特分子標識符標籤或其組合。在一些實施方案中,一種或更多種標籤序列包括引物標籤。在一些實施方案中,一種或更多種標籤序列包括獨特分子標識符標籤。本文公開的實施方案提供了構建核酸文庫的方法,所述方法包括:提供核酸樣品,以及在多重反應中用多種引物擴增核酸樣品以生成擴增產物,所述多種引物與包含單核苷酸多態性(SNP)的至少一種靶序列和包含串聯重複序列的至少一種靶序列特異性雜交。在一些實施方案中,在擴增之前,核酸樣品不被片段化。在一些實施方案中,在擴增之前,靶序列不被富集。在一些實施方案中,至少一種SNP指示核酸樣品的來源的祖先或表型特徵。在一些實施方案中,多種引物的每種包含一種或更多種標籤序列。在一些實施方案中,一種或更多種標籤序列包括引物標籤、捕獲標籤、測序標籤、或獨特分子標識符標籤或其組合。在一些實施方案中,該方法包括用第二多種引物擴增所述擴增產物。在一些實施方案中,第二多種引物的每種包含對應於多種引物的引物標籤的部分和一種或更多種標籤序列。在一些實施方案中,第二多種引物的一種或更多種標籤序列包括捕獲標籤或測序標籤或其組合。在一些實施方案中,該方法包括將單鏈結合蛋白(SSB)添加至擴增產物。在一些實施方案中,核酸樣品和/或擴增產物通過聚合酶鏈式反應(PCR)擴增。在一些實施方案中,在具有相比於連同常規設計的引物一起使用的擴增緩衝液的鹽濃度增加的鹽濃度的擴增緩衝液中擴增核酸樣品和/或擴增產物。在一些實施方案中,鹽包括KCl、LiCl、NaCl或其組合。在一些實施方案中,鹽包括KCl。在一些實施方案中,擴增緩衝液中的KCl的濃度為約100mM至約200mM。在一些實施方案中,擴增緩衝液中的KCl的濃度小於約150mM。在一些實施方案中,擴增緩衝液中的KCl的濃度為約145mM。本文公開的實施方案提供了一種核酸文庫,所述核酸文庫包含多種核酸分子,其中該多種核酸分子包括側翼為第一對標籤序列的至少一種串聯重複序列和側翼為第二對標籤序列的至少一種單核苷酸多態性(SNP)序列。還提供了使用本文公開的方法及組合物構建的核酸文庫。在一些實施方案中,至少一種SNP指示多個核酸分子的來源的祖先或表型特徵。本文公開的實施方案提供了多種引物,該多種引物與核酸樣品中的至少一種短靶序列和至少一種長靶序列特異性雜交,其中在單個多重反應中使用多種引物擴增核酸樣品產生至少一種短擴增產物和至少一種長擴增產物,其中多種引物的每種包含一種或更多種標籤序列。在一些實施方案中,短靶序列包含單核苷酸多態性(SNP)且長靶序列包含串聯重複。在一些實施方案中,一種或更多種標籤序列包括引物標籤、捕獲標籤、測序標籤、獨特分子標識符標籤或其組合。在一些實施方案中,多種引物的每種具有低的解鏈溫度和/或具有至少24個核苷酸的長度。在一些實施方案中,多種引物的每種具有小於60℃的解鏈溫度。在一些實施方案中,多種引物的每種具有為約50℃至約60℃的解鏈溫度。在一些實施方案中,多種引物的每種具有至少24個核苷酸的長度。在一些實施方案中,多種引物的每種具有約24個核苷酸至約38個核苷酸的長度。在一些實施方案中,多種引物的每種包含同聚物核苷酸序列。在一些實施方案中,核酸樣品通過聚合酶鏈式反應(PCR)擴增。在一些實施方案中,SNP是祖先SNP、表型SNP、身份SNP或其組合。在一些實施方案中,多種引物與至少30種SNP特異性雜交。在一些實施方案中,多種引物與至少50種SNP特異性雜交。在一些實施方案中,串聯重複是短串聯重複(STR)、中度串聯重複(ITR)或其變體。在一些實施方案中,多種引物與至少24種串聯重複序列特異性雜交。在一些實施方案中,多種引物與至少60種串聯重複序列特異性雜交。本文公開的實施方案提供了試劑盒,所述試劑盒包含至少一種容器裝置(means),其中該至少一種容器裝置包含本文公開的多種引物。在一些實施方案中,試劑盒包含用於擴增反應的試劑。在一些實施方案中,試劑是用於聚合酶鏈式反應(PCR)的擴增緩衝液。在一些實施方案中,擴增緩衝液包括相比於連同常規設計的引物一起使用的擴增緩衝液的鹽濃度增加的鹽濃度。在一些實施方案中,鹽包括KCl、LiCl、NaCl或其組合。在一些實施方案中,鹽包括KCl。在一些實施方案中,擴增緩衝液中的KCl的濃度為約100mM至約200mM。在一些實施方案中,擴增緩衝液中的KCl的濃度小於約150mM。在一些實施方案中,擴增緩衝液中的KCl的濃度為約145mM。附圖簡述圖1A和圖1B示出了A)用於DNA譜系分析的目前的工作流程對B)本公開內容的一個示例性實施方案的工作流程的差異。圖2示出了用於創建對DNA譜系分析有用的文庫的方法的一個示例性實施方案。圖3示出了用於創建對DNA譜系分析有用的文庫的方法的另一個示例性實施方案。圖4A、圖4B、圖4C和圖4D是顯示如下的電泳圖結果的線形圖:通過傳統方法和遵循已建立的PCR引物設計方案及限制設計的引物對當與遵循本發明公開內容的方法設計的引物組合時可如何引起基因組靶的非特異性擴增、以及期望的擴增子檢測的遮蔽(obscuration);A)針對SNP基因座通過本公開內容的方法設計的10對引物對,B)和D)所述10對引物加上通過傳統方法設計的另外的引物對,顯示在擴增期間所述另外的引物對幹擾所述10對引物對,和C)所述10對引物對加上另外的引物對,其中所述另外的引物對也通過遵循本公開內容的方法設計,導致所有靶向的SNP的成功擴增。X-軸是文庫片段的尺寸(bp),且Y軸是擴增的片段的擴增峰的螢光單位(FU)。圖5A、圖5B、圖5C、圖5D和圖5E是箱形圖,顯示遵循圖2中概述的工作流程的實驗的示例性結果,該實驗被用來在多重擴增和測序反應中從樣品鑑定56個STR的組和75個身份信息SNP(iSNP)、祖先信息SNP(aSNP)和表型信息SNP(pSNP)的混合物。報導了顯示來自組的STR基因座的成功擴增和測序的重複的結果;A)顯示來自組的25個雜合STR的基因座內平衡的箱形圖,B)顯示對於56個STR基因座的大多數的低掃描殘跡的箱形圖,C)顯示STR基因座的測序覆蓋(sequencingcoverage)的箱形圖,D)顯示SNP的序列覆蓋的箱形圖,且E)顯示對於來自組的22個雜合SNP的平衡的箱形圖。下部誤差棒指示最小值,上部誤差棒指示最大值,下部箱報導第25個百分位,且上部箱報導第75個百分位,而平均值是在下部箱和上部箱之間的交叉處。圖6示出了顯示來自圖5的實驗的示例性STR基因座繪圖(plot)的一系列柱狀圖。該繪圖顯示圖5的組中的STR的不同等位基因調用。圖7A、圖7B、圖7C、圖7D和圖7E是箱形圖,顯示遵循圖3中概述的工作流程的實驗的示例性結果,該實驗被用來在多重擴增和測序反應中從樣品鑑定26個STR的組和94個iSNP、aSNP和pSNP的混合物。報導了顯示來自組的STR的成功擴增和測序的重複的結果;A)顯示來自組的21個雜合STR基因座的基因座內平衡的箱形圖,B)顯示對於26個STR基因座的低掃描殘跡的箱形圖(26個基因座的47個等位基因中的39個未顯示掃描殘跡),C)顯示STR基因座的測序覆蓋的箱形圖(使用UMI歸一化讀段數(readnumbers)),D)顯示SNP的序列覆蓋的箱形圖,且E)顯示對於來自組的21個雜合iSNP的平衡的箱形圖。下部誤差棒指示最小值,上部誤差棒指示最大值,下部箱報導第25個百分位,且上部箱報導第75個百分位,其中平均值是在下部箱和上部箱之間的交叉處。圖8示出了顯示來自圖7的實驗的示例性STR基因座繪圖(plot)的一系列柱狀圖。該繪圖顯示圖7的組中的STR的不同等位基因調用。圖9示出了未用UMI和用UMI分析的樣品的柱狀圖。各組的左圖代表未用UMI分析的樣品,且各組的右圖代表用UMI分析的樣品。X軸標出STR的重複數,且Y軸標出特定等位基因的計數數值。柱內的誤差線分離STR序列內的測序誤差(棒的上部)與正確序列(棒的下部)。圖10A和圖10B示出了來自實驗的示例性結果,其中DNA比率為90:10的雌性:雄性。A)當使用目前的毛細管電泳DNA譜系分析方法時,STR基因座的STR基因座調用結果的子集,以及B)當使用本申請的方法時,數個STR基因座的數個STR基因座調用結果。CE方法和本申請的方法兩者確實檢測到低水平的雄性DNA汙染。圖11示出了顯示在圖9的實驗中檢測到對Y染色體特異的STR基因座的柱狀圖,還示出了本申請能夠檢測到汙染性的雄性DNA和來自該雄性DNA的特定STR基因座,而用目前的CE方法將需要運行兩個實驗來做到這些圖12是示出來自使用12個樣品個體和1個參考個體的實驗的示例性高水平測序結果,顯示在兩個重複之間的STR和SNP調用的一致性的表。圖13是示出來自圖12中顯示的實驗的示例性群體統計信息的表。圖14是示出基於來自圖12中顯示的實驗的pSNP的基因型的示例性表型預測的表。圖15是顯示基於來自圖12中顯示的實驗的aSNP的基因型的示例性祖先映射的圖。圖16A、圖16B、圖16C、圖16D和圖16E是顯示來自圖12的實驗的示例性STR基因座繪圖的柱狀圖。圖17A和圖17B是顯示來自圖12的實驗的示例性SNP繪圖的柱狀圖。圖18A和圖18B示出了顯示來自圖12的實驗的示例性STR和SNP基因座的基因座內平衡的箱形圖。圖19A和圖19B是顯示來自圖12的實驗的示例性STR基因座的掃描殘跡分析的圖。圖20是示出來自圖12的實驗的STR基因座中的示例性等距雜合子(isometricheterozygotes)的表。圖21是顯示基於來自圖12的實驗的STRD8S1179內的變體的示例性遺傳繪圖的框圖。圖22是顯示基於來自圖12的實驗的STRD13S317內的變體的示例性遺傳繪圖的框圖。圖23是示出使用降解的DNA的示例性基因分型結果的表。圖24A和圖24B示出了在不同DNA輸入下的示例性STR基因分型結果和基因座內平衡。圖25A和圖25B示出了在不同DNA輸入下的示例性SNP基因分型結果和基因座內平衡。詳述定義本文提及的所有專利、申請、公布的申請及其他出版物通過對所引用的材料的引用並以其整體併入。如果術語或措辭以與通過引用併入本文的專利、申請、公布的申請及其他出版物中陳述的定義相反或以其他方式不一致的方式在本文使用,則本文的使用優先於通過引用併入本文的定義。如本文使用的,單數形式「一個(a)」、「一個(an)」和「該(the)」包括複數指代物,除非清楚或上下文另外指示。例如,「一個」二聚體包括一個或更多個二聚體,除非另外明示或根據上下文指示。如本文使用的,術語「DNA譜」、「遺傳指紋」和「基因型譜」在本文可互換使用,以指多態基因座的集合中的等位基因變異,諸如串聯重複、單核苷酸多態性(SNP),等等。DNA譜在用於基於核酸樣品鑑定個體的法醫學中是有用的。如本文使用的DNA譜還可被用於其他應用,諸如,包括癌症的疾病的診斷和預後、癌症生物標誌物鑑定、遺傳分析、遺傳多樣性分析、遺傳異常鑑定、資料庫分析、法醫、刑事案件工作、親子鑑定、個人鑑定等等。術語「多核苷酸」、「寡核苷酸」、「核酸」和「核酸分子」在本文可互換使用,以指任何長度的核苷酸的聚合形式,並且可包括核糖核苷酸、脫氧核糖核苷酸、其類似物或其混合物。該術語僅指分子的一級結構。因此,該術語包括三鏈、雙鏈和單鏈的脫氧核糖核酸(「DNA」),以及三鏈、雙鏈和單鏈的核糖核酸(「RNA」)。如本文使用的,在兩個核苷酸序列的上下文中的「序列同一性」或「同一性」或「同源性」包括提及兩個序列中當在指定的比較窗上為了最大對應性比對時相同的殘基。核苷酸序列在比較窗中的部分與參考序列相比可包括添加或缺失(即,缺口),以用於兩條序列的最佳比對。百分比通過如下計算:確定兩個序列中出現相同的核酸鹼基殘基的位置的數目,以產生匹配位置的數目,將匹配位置的數目除以比較窗中位置的總數目,並將結果乘以100以得到序列同一性的百分比。如本文使用的,「基本上互補或基本上匹配」意指,兩個核酸序列具有至少90%序列同一性。優選地,兩個核酸序列具有至少95%、96%、97%、98%、99%或100%的序列同一性。可選地,「基本上互補或基本上匹配」意指,兩個核酸序列可在高嚴格條件下雜交。可以理解的是,本文描述的發明的各方面和實施方案包括由各方面和實施方案「組成」和/或「主要組成」。本發明的其他目的、優勢和特徵從結合附圖考慮的以下描述將變得明顯。用於構建DNA譜的方法用於確定DNA譜的已建立方法在許多方面受到限制。例如,目前的方法檢測由於在DNA樣品中發現的串聯重複序列的長度改變而不同的擴增的基因座的尺寸改變。為了多重STR擴增可視化,擴增必須被設計成在電泳系統的尺寸分離限值內隔開(space)不同的擴增子尺寸,電泳系統的尺寸分離限值對於CE為從約50-500bp。因此,僅有限數目的重複序列可在一個測定中被可視化。例如,GLOBALFILERPCR擴增試劑盒(APPLIEDBIOSYSTEMS)據報導能夠通過使用6種不同的染料區分24個STR基因座。此外,當樣品DNA被降解時(如來自犯罪現場的DNA樣品常見的),此類方法就有問題,使得較長的擴增產物是不可能的,產生不完整的DNA譜。對於檢測微量的汙染性DNA,目前的方法還常常不是足夠靈敏的,所以可使混合的樣品未被檢測到且未被報告,這可能對刑事案件是關鍵的。因此,目前的方法可導致不完整的結果,這導致不確定的結果,這可能對DNA譜系分析是有害的。另外,目前的靶不包括關於樣品祖先、表型性狀諸如可能的眼睛顏色的信息以及其他個性化樣品信息。一些測序方法已嘗試包括STR和SNP檢測兩者。例如,已嘗試文庫製備隨後是對於STR和SNP的定製富集,然而不是所有的STR完全被覆蓋,由於文庫製備方法通常包括可能消除靶向的序列的樣品剪切。此外,已建立的引物設計方法和方案可提供用於擴增長序列(例如,STR)或短序列(例如,SNP)的引物組,但兩者在一個反應中的組合還未成功。本公開內容描述了對目前的DNA譜系分析系統的問題和限制的解決方案。本文描述的方法及組合物允許使用PCR將STR和SNP組合進一個測定,以擴增靶並產生用於測序的文庫。當開發本發明的測定時,意外地發現,例如,當利用非常規和違反直覺的引物設計時,STR和SNP兩者可在一個反應中被擴增,這允許確定所有靶向基因座的序列。出人意料地,當使用與目前的有關引物設計的教義相反的參數設計擴增引物時,創建了以幾乎平衡的方式允許更長的STR區域被擴增和短SNP區域被擴增,從而允許STR和SNP兩者被一起多重擴增的引物。在DNA譜系分析之外,每當擴增子的不同大小的集合被期望來自一個擴增反應時,可使用本文公開的用於確定生物體的DNA譜的方法及組合物。例如,如果對於PCR感興趣的靶包括大基因區域和短SNP區域兩者,這可分別導致尺寸從數百個至數千個鹼基對變化的擴增子和(versus)小於100個鹼基對的擴增子,則本文描述的方法及組合物可允許成功同時擴增基因和SNP靶,不實踐本文公開的方法這將是不可能的。此外,本文公開的方法及組合物可應用於任何生物體,例如人類,非人類靈長類、動物、植物、病毒、細菌、真菌等。因此,本發明的方法及組合物不僅對DNA譜系分析(例如,法醫、親子鑑定、個體鑑定等等)以及人類作為靶基因組是有用的,而且還可用於其他靶諸如癌症和疾病標誌物、遺傳異常標誌物和/或當靶基因組不是基於人類時。因此,本文公開的實施方案提供了用於構建DNA譜的方法,所述方法包括:提供核酸樣品,用多種引物擴增該核酸樣品,所述多種引物與包含單核苷酸多態性(SNP)的至少一種靶序列和包含串聯重複的至少一種靶序列特異性雜交,並且確定在擴增產物中的至少一種SNP和至少一種串聯重複的基因型,從而構建該核酸樣品的DNA譜。本領域技術人員將理解,任何適合的技術可在確定靶序列的基因型中被使用,任何適合的技術包括,但不限於,基於陣列的雜交、測序等。因此,在一些實施方案中,本文公開的方法可包括從擴增產物生成核酸文庫,諸如測序文庫,以及確定核酸文庫的序列。在一些實施方案中,本公開內容提供了用於DNA譜系分析的方法及組合物,所述方法及組合物包括,例如用於在群體或個人資料庫分析中同時鑑定STR和iSNP。在此類資料庫中,由於個體通常是已知的,不一定需要個人數據。然而,如果期望另外的信息,則另外的信息目標可被添加用於同時鑑定。短串聯重複在本領域是熟知的,並且由重複的二或三核苷酸序列組成。中度串聯重複通常被認為是在4個至7個核苷酸序列之間的重複序列。本文採用的SNP可呈可能提供對個人的身體特徵的深刻理解的任何形式。本文例示的那些是提供用於祖先或遺傳性的線索的SNP(aSNP)、以及提供用於表型特徵(表型信息SNP)的線索的那些。在本文描述的方法中,DNA譜測定可能包括與STR和ITR基因座確定組合的任何數目的這些SNP。例如,本公開內容提供了另外的方法及組合物,其中連同STR和iSNP一起的另外的靶被包括。如果期望有關個體的更多信息,例如,當樣品屬於未知個體或個體的群體(如對於刑事案件可能的情形)時,其他信息標誌物可被添加至STR和iSNP,諸如涉及祖先的SNP(aSNP)以及涉及表型變體的SNP(表型信息SNP)。然後,可使用另外的信息以例如,通過提供對未知個體的遺傳性、眼睛顏色、發色等的深刻理解幫助調查員。如此,所有組合的信息的添加可提供先前使用DNA譜系分析的目前方法未知的個體的更完整的DNA譜。本文公開的方法及組合物被設計成是足夠靈敏的以檢測亞納克量的核酸分子。此外,本文公開的方法及組合物可對擴增核酸樣品是有用的,該核酸樣品由具有低質量的核酸分子,諸如來自法醫樣品的降解的和/或片段化的基因組DNA構成。核酸樣品可以是純化的樣品或含粗製DNA的裂解物,例如來源於口腔拭子、紙、纖維或可被唾液、血液或其他體液浸漬的其他物質。如此,在一些實施方案中,核酸樣品可包含低量的或片段化部分的DNA,諸如基因組DNA。例如,核酸樣品可包含如下的量的核酸(例如,基因組DNA),該量為、為約或小於1pg、2pg、3pg、4pg、5pg、6pg、7pg、8pg、9pg、10pg、11pg、12pg、13pg、14pg、15pg、16pg、17pg、18pg、19pg、20pg、30pg、40pg、50pg、60pg、70pg、80pg、90pg、100pg、200pg、300pg、400pg、500pg、600pg、700pg、800pg、900pg、1ng、10ng、100ng,或者在這些值的任何兩個限定的範圍內,例如,10pg至100pg、10pg至1ng、100pg至1ng、1ng至10ng、10ng至100ng,等等。在一些實施方案中,核酸樣品可包含為約100pg至約1ng的量的核酸(例如,基因組DNA)。在一些實施方案中,核酸樣品可包含多於約62.5pg的量的核酸(例如,基因組DNA)。在一些實施方案中,另外的片段化步驟,諸如超聲處理或內切核酸酶消化,不被包括在片段化程序中。在一些實施方案中,本文公開的方法及組合物能夠甚至用亞納克量的和/或降解的核酸樣品成功地確定一個或更多個的靶序列的基因型,例如,SNP、STR等等。例如,本文公開的方法及組合物能夠成功地確定為、為約或多於以下的靶序列的基因型:10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、100%、或在以上值的任何兩個之間的範圍。在一些實施方案中,本文公開的方法及組合物能夠成功地確定多於約50%、80%、90%、95%、98%或更多的靶序列的基因型。在一些實施方案中,本文公開的方法及組合物能夠實現多於以下的靶序列的基因座內平衡:約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、100%,或在以上值的任何兩個之間的範圍。對於法醫調查,多種引物可摻入獨特分子標識符(UMI),該獨特分子標識符(UMI)有助於從測序結果去除,例如,PCR和測序誤差、掃描殘跡等。參見Kivioja等,同上。如在本公開內容別處進一步詳細討論的,引物中UMI的包含還允許鑑定在串聯重複基因座內的變體,進一步增強本發明方法及組合物用於DNA譜系分析及其他目的諸如遺傳分析的有用性。因此,在一些實施方案中,如本文中公開的串聯重複序列的基因型可包括在串聯重複基因座內的序列變體。因此,使用傳統方法時的串聯重複的純合子(例如,對於D9S1122的13,13)可基於在串聯重複內的序列變體被鑑定為等距雜合子。如將被本領域技術人員所理解的,考慮到基因座內序列變體將大大增強本文公開的方法,例如,對於遺傳分析的有用性。用於構建核酸文庫的方法本文公開的實施方案提供了構建核酸文庫的方法,所述方法包括:提供核酸樣品,以及用多種引物擴增核酸樣品,所述多種引物與包含單核苷酸多態性(SNP)的至少一種靶序列和包含串聯重複序列的至少一種靶序列特異性雜交。本文公開的方法及組合物被設計成是足夠靈敏的以檢測亞納克量的核酸分子。此外,本文公開的方法及組合物可對擴增核酸樣品是有用的,該核酸樣品由低質量的核酸分子,諸如來自法醫樣品的降解的和/或片段化的基因組DNA組成。核酸樣品可以是純化的或含粗製DNA的裂解物,例如來源於口腔拭子、紙、纖維或可被唾液、血液或其他體液浸漬的其他物質。因此,在一些實施方案中,核酸樣品可包含低量的或片段化的DNA,諸如基因組DNA。例如,核酸樣品可包含如下的量的核酸(例如,基因組DNA),該量為、為約或小於1pg、2pg、3pg、4pg、5pg、6pg、7pg、8pg、9pg、10pg、11pg、12pg、13pg、14pg、15pg、16pg、17pg、18pg、19pg、20pg、30pg、40pg、50pg、60pg、70pg、80pg、90pg、100pg、200pg、300pg、400pg、500pg、600pg、700pg、800pg、900pg、1ng、10ng、100ng,或者在這些值的任何兩個限定的範圍內,例如,10pg至100pg、10pg至1ng、100pg至1ng、1ng至10ng、10ng至100ng,等等。在一些實施方案中,核酸樣品可包含為約100pg至約1ng的量的核酸(例如,基因組DNA)。在一些實施方案中,核酸樣品可包含多於約62.5pg的量的核酸(例如,基因組DNA)。在一些實施方案中,另外的片段化步驟,諸如超聲處理或內切核酸酶消化不被包括。在一些實施方案中,預期到下遊並行測序,本文公開的方法包括擴增和文庫製備。測定可包括兩種PCR主混合物(mastermix)、兩種熱穩定聚合酶、兩種引物混合物及文庫銜接子。在一些實施方案中,DNA樣品可通過使用包含靶特異性區域和非靶特異性標籤區域的第一組擴增引物和第一PCR主混合物被擴增許多個循環。標籤區域可以是任何序列,諸如通用標籤區域、捕獲標籤區域、擴增標籤區域、測序標籤區域、UMI標籤區域等。例如,標籤區域可以是用於在第二或隨後輪的擴增,例如,用於文庫製備中採用的擴增引物的模板。在一些實施方案中,該方法包括將單鏈結合蛋白(SSB)添加至第一擴增產物。第一擴增樣品的等分試樣可被取出並使用第二組擴增引物和第一PCR主混合物或第二PCR主混合物進行第二次擴增,該第二組擴增引物特異於第一擴增引物的標籤區域,例如,通用標籤區域或擴增標籤區域,該第二組擴增引物可包含一個或更多個另外的標籤序列,諸如對一個或更多個下遊測序工作流程特異的序列標籤。如此,原始DNA樣品的文庫準備用於測序。可選的方法可包括,在小體積(例如,15ul)中進行第一擴增,且代替將等分試樣轉移至用於第二輪擴增的新位置,可將另外的試劑添加至該管以進行第二輪擴增。在文庫被創建之後,該文庫可被純化和定量。在一些實例中,純化可通過經由用來純化DNA片段以與反應組分分開的基底諸如AMPUREXP珠(BeckmanCoulter)處理樣品來進行。另一種方法可以是將純化部分,諸如半抗原部分摻入進第二組擴增引物中。例如,如果生物素被摻入進第二擴增引物組的一個引物中,則文庫片段可使用例如在珠上的鏈黴親和素部分來捕獲。採用捕獲策略,文庫還可使用基於珠的歸一化(BeadBasedNormalization,BBN)被歸一化並定量。然而,如果多個反應被進行,文庫可被純化並定量,或匯集並定量,而不使用BBN。例如,文庫還可通過如本領域已知的凝膠電泳方法、BioAnalyzer、qPCR、分光光度法、定量試劑盒(例如,PicoGreen等等)等來定量。在定量後,文庫然後可通過並行測序來測序。在一些實施方案中,提供了第一組擴增引物,該第一組擴增引物用來以如此有限的濃度擴增靶DNA,使得當第一擴增反應的等分試樣被添加至新管且來自第二擴增反應的試劑被添加時,存在由第一組擴增引物產生的極小的到檢測不到的(minimaltoundetectable)遺留擴增,並且不需要在第一擴增反應和第二擴增反應之間的清理步驟。在一些實例中,用於第一PCR的擴增引物的濃度為、為約或小於0.5nM、0.6nM、0.7nM、0.8nM、0.9nM、1.0nM、1.5nM、2.0nM、3.0nM、4.0nM、5.0nM、6.0nM、7.0nM、8.0nM、9.0nm10.0nM、11.0nM、12.0nM或者在任何這些值之間的範圍,例如,0.5nM至1.0nM、1.0nM至12nM、0.8nM至1.5nM等等。在一些實施方案中,用於第一PCR的擴增引物的濃度為約0.9nM至約10nM。圖2示出了在一個實施方案中,本發明公開的方法的示例性工作流程。靶基因組DNA序列使用第一組引物來擴增,該第一組引物包含在靶序列側翼的區域和擴增標籤區域(其可以是相同的或不同的),導致包含靶序列和在兩個末端上的標籤的擴增子。來自第一PCR的擴增子的等分試樣使用第二組引物來進一步擴增,該第二組引物特異於還包含測序引物序列(i5和i7銜接子序列)的第一標籤序列,從而生成包含側翼為並行測序中使用的序列的靶DNA序列的文庫,在該情況下,通過Illumina,Inc.推廣的合成方法在序列中採用i5和i7序列。用於確定來自樣品的DNA譜的可選的工作流程的實例被描述於圖3中。在該實例中,DNA靶用第一引物對來擴增,該第一引物對包含在靶序列側翼的序列、非靶標籤序列(相同或不同的)以及包括隨機鹼基的另外的獨特分子標識符序列或UMI。可使用UMI,例如,以在生物信息學上減少或消除在文庫製備過程期間發生的誤差(例如,PCR假象(artifact)或錯誤摻入,等等)。UMI的使用對DNA譜系分析可以是重要的,但對用於輔助消除當樣品用於刑事案件測序時的誤差是特別重要的。在該實例中,第一輪擴增進行2個循環,隨後添加單鏈結合蛋白(SSB)並在37℃孵育15分,隨後是95℃/5分滅活,這有效猝滅第一組擴增引物在第二輪擴增期間的另外的擴增。儘管機制是未知的,預期添加SSB不可逆地結合單鏈第一擴增引物,並阻止它們參與隨後的擴增反應。在SSB孵育後,包含序列標籤的第二組引物和第二PCR混合物被添加,產生測序文庫。核酸文庫本文公開的實施方案提供了核酸文庫,該核酸文庫可被用於測序。在一些實施方案中,本文公開的核酸文庫可包含多個核酸分子,其中該多個核酸分子包含側翼為第一對標籤序列的至少一種串聯重複序列和側翼為第二對標籤序列的至少一種單核苷酸多態性(SNP)序列。如本文概述的,使用本文公開的方法及組合物,核酸分子的尺寸可有很大變化。本領域技術人員將理解,從包含串聯重複(例如,STR)的靶序列擴增的核酸分子可具有大尺寸,而從包含SNP的靶序列擴增的核酸分子可具有小尺寸。例如,核酸分子可包括從少於一百個核苷酸至數百個或甚至數千個核苷酸。因此,核酸分子的尺寸可具有在以下的任何兩個值之間的範圍:約50bp、約60bp、約70bp、約80bp、約90bp、約100bp、約110bp、約120bp、約130bp、約140bp、約150bp、約200bp、約300bp、約400bp、約500bp、約600bp、約700bp、約800bp、約900bp、約1kb或更多。在一些實施方案中,核酸分子的最小尺寸可以是為、為約或少於50bp、60bp、70bp、80bp、90bp或100bp的長度。在一些實施方案中,核酸分子的最大尺寸可以是為、為約或多於100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp或1kb的長度。對於簇生成,文庫片段被固定化在基底,例如,載玻片上,其包含用於捕獲和固定DNA文庫片段的同源寡核苷酸序列。固定化的DNA文庫片段使用簇擴增方法來擴增,如由美國專利號7,985,565和7,115,400的公開內容所例示的,其每個的內容通過引用以全文併入本文。美國專利號7,985,565和7,115,400的併入的材料描述了固相核酸擴增的方法,其允許擴增產物被固定在固體支持物上,以形成包括固定的核酸分子的簇或「集群」的陣列。在如此陣列上的每個簇或集群從多個相同的固定的多核苷酸鏈和多個相同的固定的互補多核苷酸鏈形成。如此形成的陣列通常被稱為「成簇的陣列」。固相擴增反應的產物諸如在美國專利號7,985,565和7,115,400中描述的那些是通過固定化的多核苷酸鏈和固定化的互補的鏈的對的退火形成的所謂的「橋接的」結構,兩種鏈在5'末端被固定在固體支持物上,優選地經由共價附接。簇擴增方法是其中固定化的核酸模板被用來產生固定化的擴增子的方法的實例。其他適合的方法也可被用來從根據本文提供的方法產生的固定化的DNA片段產生固定化的擴增子。例如一個或更多個簇或集群可經由固相PCR來形成,每對擴增引物中的一個或兩個引物是被固定化的。然而,本文描述的方法不限於任何特定的測序製備方法或測序平臺,並且可服從於其他並行測序平臺製備方法及相關的測序平臺。引物本文公開的實施方案提供了多種引物,該多種引物與核酸樣品中的至少一種短靶序列和至少一種長靶序列特異性雜交,其中在單個多重反應中使用多種引物擴增核酸樣品產生至少一種短擴增產物和至少一種長擴增產物,其中多種引物的每種包含一種或更多種標籤序列。本文還公開了多種引物,該多種引物具有表1-2中列出的序列。對於大的靶序列(例如,STR、ITR)和小的靶序列(例如,SNP)的多重擴增,引物被設計為將允許跨越所有的靶類型的平衡擴增。本文公開的方法及組合物可被用來在單個多重反應中擴增多種串聯重複靶序列。例如,多種引物可與為、為約或多於以下的許多串聯重複序列特異性雜交:4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100、或者在任何兩個值之間的範圍,諸如4至12、10至24、30至100等等。在一些實施方案中,多種引物可與至少24種串聯重複序列特異性雜交。在一些實施方案中,多種引物可與至少60種串聯重複序列特異性雜交。本文公開的方法及組合物可被用來在單個反應中擴增多種SNP靶序列。例如,多種引物可與為、為約或多於以下的許多SNP序列特異性雜交:4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100或者在任何兩個值之間的範圍,諸如4至12、10至24、30至100等等。在一些實施方案中,多種引物可與至少30種SNP序列特異性雜交。在一些實施方案中,多種引物可與至少50種SNP序列特異性雜交。在實驗期間發現,當使用遵循用於成功的引物設計的已建立的標準和智慧設計的引物時,相比於較長的STR靶序列,短SNP靶序列被優先擴增。此外,至少在合成測序(sequencebysynthesis)工作流程中,其中簇被生成且簇被自身測序(例如,當按照合成測序(本文別處公開的SBS)與Illumina,Inc.測序儀聯合時),還發生較短文庫SNP片段的優先簇擴增。為了克服這兩個偏差,需要引物設計的新策略,其將允許短SNP靶序列和長STR靶序列之間的平衡擴增。策略之一包括設計用於STR擴增的引物。對於STR,重複序列常常被嵌入在較大的重複區域;因此設計用於STR擴增的特異性引物可能是有問題的。此外,STR及它們的側翼區域往往是AT豐富的。在一種情況下,使用不同於常規和已良好建立的PCR設計標準的設計策略針對有問題的區域設計引物。用於PCR引物設計的已建立標準以及其他標準規定,1)對於引物的最佳長度為18-22個核苷酸,2)Tm應該在55℃-58℃的範圍內,3)GC含量應該在約40%-60%,4)且應該避免重複的AT二核苷酸區域,其中<4的二核苷酸AT重複是最大的。設計以下引物:該引物長於典型的PCR引物,例如23-35個核苷酸長而不是18-22個核苷酸,它們具有低的解鏈溫度(Tm),例如約54℃而不是約58℃,且該引物是AT豐富的,這三個參數是常規已建立的PCR標準教導對於最佳的引物設計應該避免的。事實上,非最佳的引物被設計。出人意料地,發現,這些長的、AT豐富的、低Tm的引物事實上比短的、高Tm的、含低AT的引物更好地使STR多重複用。不束縛於任何理論,預期了,遵循已建立的PCR設計標準設計的較短的引物可能形成具有高解鏈溫度的二聚體以及因此在標準PCR條件下有效形成二聚體,而較長的、低Tm引物可能在實際上低的Tm下形成二聚體並因此將對於二聚體形成是不穩定的,從而與短的、高Tm引物(例如,18-22個核苷酸、60℃的Tm、50%GC含量)相比,允許較長的、低Tm引物在正常擴增條件下的增加的參與。用於STR擴增的較長的、低Tm的、AT豐富的引物然後用靶向SNP的常規設計的、高Tm的較短的引物來多重擴增。然而,在一個多重反應中提供STR和SNP兩者的平衡擴增的方面,多重擴增反應再次不成功。預期了,也許將非常規引物設計應用於擴增沒有問題的靶,例如,擴增SNP靶,可能產生成功的多重擴增。如此,設計用於STR的非最佳引物使用的同一標準被應用於SNP的引物設計(長的、低Tm、AT豐富的)。出人意料地,新設計的引物導致在多重反應中的STR和SNP的擴增之間的更好的平衡。圖4示出了多重反應中的常規和非常規設計的引物之間的相互影響的實例。在圖4A中,10種SNP靶的多重反應顯示在用於文庫的約200-350bp的期望範圍內的預期擴增。用來多重地擴增10種SNP的引物被設計成是更長的,具有更低的Tm且是更AT豐富的,這是被已建立的PCR引物設計標準建議的。當第11種引物對使用已建立的PCR設計標準(即,引物是短的,具有高的Tm且不是AT豐富的)來設計並被添加至10對時,所得的多重複用顯示靶DNA的非特異性擴增。如在圖4B和4D中所見,第11種常規設計的引物對的添加幹擾10種非常規引物對並導致靶向的SNP的不成功的多重擴增。然而,也是遵循與10種引物對相同標準非常規設計的第11種引物對的添加導致SNP靶的成功擴增(圖4C)。因此,在一些實施方案中,多種引物的每種具有低的解鏈溫度,例如,小於60℃或約50℃至約60℃,和/或具有至少24個核苷酸的長度,例如,約24個核苷酸至約38個核苷酸。在一些實施方案中,多種引物的每種包含同聚物核苷酸序列。在一些實例中,非常規設計的引物包含在靶向的STR和SNP側翼的序列以及另外的非模板序列。另外的序列可以是,例如,在文庫製備或測序方法期間服務一定目的的標籤序列。例如,標籤序列可以是捕獲序列,諸如可通過用於純化文庫片段的固定化伴侶部分捕獲的半抗原部分。半抗原部分的實例是可通過用於從反應組分等分離文庫片段的鏈黴親和素捕獲的生物素。標籤序列還可以是擴增序列,例如,該擴增序列與擴增引物互補並被用於一個或更多個擴增反應。圖2和3示出了在第一輪擴增後的第二輪擴增中使用的標籤序列的實例。標籤序列也可以是序列標籤。圖2和3還示出了序列標籤的實例,在測序中,i5銜接子和i7銜接子被用作如本文描述的合成測序反應期間的雜交、簇生成和測序引物。標籤序列的另一個實例是獨特分子標識符或UMI,如圖3中所示。UMI包含可在測序期間被使用以校正PCR和測序誤差的隨機核苷酸段,從而將另外層次的誤差校正添加至測序結果。UMI可為從,例如,3-10個核苷酸長,然而數目將取決於輸入DNA的量。例如,如果使用1ngDNA以靶向約250個位點,則預期將需要約350個拷貝x250個靶,所以約90,000個不同的UMI。如果採用更多的DNA,例如,10ng,則可能需要約1百萬個不同的UMI。來自同一PCR反應的所有PCR重複將具有相同的UMI序列,因此,可將重複進行比較,且序列中的任何誤差,諸如單個鹼基取代、缺失、插入(即,PCR中的掃描殘跡)可經生物信息學從測序結果中排除。獨特分子標識符也可被用於混合的樣品的分析中。混合的樣品,例如,被雄性DNA汙染的雌性DNA樣品,可使用UMI序列被解卷積以報告雌性DNA和雄性DNA貢獻兩者。例如,對於兩種混合的DNA,可存在總計四種不同的重複數目;然而,如果兩種樣品的混合物共享在特定基因座處的等位基因,則可存在少於四種。可使用用於確定DNA分子的初始群體中的不同等位基因的數目的UMI區分這些共享的等位基因並確定近似百分比。例如,初始分子可被計數,並且如果較少貢獻者以,例如,5%存在,則5%的UMI將鑑定一種基因型,且95%將鑑定第二基因型。在PCR之後,如果在擴增後等位基因中的一個(或也許更多個)是偏倚的,則將觀察不到5:95的比率。然而,在使用UMI檢測和校正精簡PCR重複之後,可使用UMI校正偏比。當試圖區分來自PCR的掃描殘跡假象和真正的較小貢獻者時,這是重要的。本發明方法的引物可包含一種或更多種標籤序列。標籤序列可以是與靶序列不同源的一個或更多個引物序列,但例如可被用作用於一個或更多個擴增反應的模板。標籤序列可以是捕獲序列,例如半抗原序列諸如可被用來純化擴增子以與反應組分分開的生物素。標籤序列可以是諸如銜接子序列的序列,該銜接子序列有利於捕獲在基底上的文庫擴增子,例如,用於如本文描述的合成測序技術的預期中的橋式擴增。此外,標籤序列可以是通常在,例如3-10個核苷酸之間的,構成可在文庫製備和/或測序方法期間被用於誤差校正的隨機核苷酸段的獨特分子標識符標籤。另外,對於多重PCR反應,包含寡核苷酸引物以將基本上所有的靶一起匯集成一種混合物是有利的。然而,如本文公開的,寡核苷酸一反常態地長於使用傳統參數設計的引物。標籤序列至引物的進一步添加,諸如附加基因靶特異性序列的UMI的添加創建仍更長的引物序列。在一些實施方案中,可將甘氨酸甜菜鹼(約1.5M)添加至多種引物。例如,在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含如下的甜菜鹼濃度,該甜菜鹼濃度為、為約或多於100mM、200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1M、1.2M、1.3M、1.4M、1.5M、1.6M、1.7M、1.8M、1.9M、2M、3M、4M、5M、6M、7M、8M、9M、10M、或在這些值的任何兩個之間的範圍,例如,從500mM至2M、從1M至1.5M等等。因此,當實踐本公開內容的方法時,如本文描述的用例如,以約1.5M甜菜鹼補充的引物混合物將是有利的。在一些實施方案中,可將甜菜鹼添加至多種引物。例如,在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含如下的甘油濃度,該甘油濃度為、為約或多於100mM、200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1M、1.2M、1.3M、1.4M、1.5M、1.6M、1.7M、1.8M、1.9M、2M、3M、4M、5M、6M、7M、8M、9M、10M,或在這些值的任何兩個之間的範圍,例如,從500mM至2M、從1M至1.5M等等。因此,當實踐本公開內容的方法時,如本文描述的用例如,以約1.5M甘油補充的引物混合物將是有利的。在一些實施方案中,還可修改與在本公開內容的擴增方法中使用的非常規引物設計相關的緩衝液。例如,在一些實施方案中,與連同常規設計的引物一起使用的擴增緩衝液的鹽濃度相比,擴增緩衝液的鹽濃度,諸如KCl、LiCl、NaCl或其組合增加。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含以下KCl濃度,該KCl濃度為、為約或多於60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mM、或在這些值的任何兩個之間的範圍,例如,從60mM至200mM、從100mM至250mM,等等。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含為約145mM的KCl濃度。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含以下LiCl濃度,該LiCl濃度為、為約或多於60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mM、或在這些值的任何兩個之間的範圍,例如,從60mM至200mM、從100mM至250mM,等等。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含為約145mM的LiCl濃度。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含以下NaCl濃度,該NaCl濃度為、為約或多於60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mM,或在這些值的任何兩個之間的範圍,例如,從60mM至200mM、從100mM至250mM,等等。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含為約145mM的NaCl濃度。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液可包含MgSO4、MgCl2或其組合。試劑盒本文公開的實施方案提供了試劑盒,所述試劑盒包含至少一種容器裝置,其中該至少一種容器裝置包含如本文公開的多種引物。在一些實施方案中,容器裝置可以是管、孔、微量滴定板等等。在一些實施方案中,多種引物可與為、為約或多於以下的許多串聯重複序列特異性雜交:4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100,或者在任何兩個值之間的範圍,諸如4至12、10至24、30至100,等等。在一些實施方案中,多種引物可與至少24種串聯重複序列特異性雜交。在一些實施方案中,多種引物可與至少60種串聯重複序列特異性雜交。本文公開的方法及組合物可被用來在單個反應中擴增多種SNP靶序列。例如,多種引物可與為、為約或多於以下的許多SNP序列特異性雜交:4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100或者在任何兩個值之間的範圍,諸如4至12、10至24、30至100,等等。在一些實施方案中,多種引物可與至少30種SNP序列特異性雜交。在一些實施方案中,多種引物可與至少50種SNP序列特異性雜交。在一些實施方案中,至少一個容器裝置包含擴增緩衝液。在一些實施方案中,還可修改與在本公開內容的擴增方法中使用的非常規引物設計相關的緩衝液。例如,在一些實施方案中,與連同常規設計的引物一起使用的擴增緩衝液的鹽濃度相比,擴增緩衝液的鹽濃度,諸如KCl、LiCl、NaCl或其組合增加。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含以下KCl、NaCl或LiCl濃度,該KCl、NaCl或LiCl濃度為、為約或多於60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mM,或在這些值的任何兩個之間的範圍,例如,從60mM至200mM、從100mM至250mM,等等。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液包含為約145mM的KCl、NaCl或LiCl濃度。在一些實施方案中,在用如本文公開的非常規引物的擴增反應中使用的擴增緩衝液可包含MgSO4、MgCl2或其組合。測序方法本發明方法不限於任何特定的測序平臺,然而,本文關於SBS或合成測序例示了並行測序的類型。特別可適用的技術是以下的那些:其中核酸被附加在陣列中的固定位置處,使得它們的相對位置不改變且其中陣列被反覆成像。其中以不同顏色通道獲得圖像的實例是特別可適用的,所述不同顏色通道例如,與用於區分一種核苷酸鹼基類型與另一種的不同標記物相符。SBS技術通常包括通過迭代添加針對模板鏈的核苷酸來酶促延伸新生核酸鏈。在傳統的SBS方法中,在每個遞送中在聚合酶的存在下,可提供針對靶核苷酸的單個核苷酸單體。然而,在本文描述的方法中,在每個遞送中在聚合酶的存在下,可提供針對靶核酸的多於一種類型的核苷酸單體。SBS技術可採用具有標記物部分的核苷酸單體或缺失標記物部分的那些。因此,摻入事件可基於以下來檢測:標記物的特性,諸如標記物的螢光;核苷酸單體的特性,諸如分子量或電荷;摻入核苷酸的副產物,諸如釋放的焦磷酸鹽;等。在其中兩個或更多個不同的核苷酸存在於測序試劑中的一些實例中,不同的核苷酸可以是彼此可區分的,或可選地,兩個或更多個不同的標記物可在使用的檢測技術下是難區分的。例如,存在於測序試劑中的不同的核苷酸可具有不同的標記物,並且它們可使用適當的光學器件來區分,如通過由Solexa(現為Illumina,Inc.)開發的測序方法例示的。一些實例包括焦磷酸測序技術。焦磷酸測序檢測隨特定核苷酸被摻入到新生鏈釋放的無機焦磷酸(PPi)(Ronaghi,M.,Karamohamed,S.,Pettersson,B.,Uhlen,M.和Nyren,P.(1996)"Real-timeDNAsequencingusingdetectionofpyrophosphaterelease."AnalyticalBiochemistry242(1),84-9;Ronaghi,M.(2001)"PyrosequencingshedslightonDNAsequencing."GenomeRes.11(1),3-11;Ronaghi,M.,Uhlen,M.andNyren,P.(1998)"Asequencingmethodbasedonreal-timepyrophosphate."Science281(5375),363;美國專利號6,210,891;美國專利號6,258,568以及美國專利號6,274,320,其公開內容通過引用以其整體併入本文)。在焦磷酸測序中,釋放的PPi可通過立即被ATP硫酸化酶轉化成腺苷三磷酸(ATP)來檢測,並且產生的ATP的水平經由螢光素酶產生的質子來檢測。待測序的核酸可被附連至在陣列中的特徵,並且可將陣列成像以捕獲由於核苷酸在陣列的特徵處的摻入產生的化學發光信號。在陣列用特定核苷酸類型(例如,A、T、C或G)處理之後,可獲得圖像。在添加每個核苷酸類型之後獲得的圖像將在陣列中哪個特徵被檢測到的方面不同。圖像中的這些差異反映陣列上的特徵的不同序列內容。然而,每個特徵的相對位置將在圖像中保持不變。圖像可使用本文陳述的方法來儲存、處理並分析。例如,在用每種不同核苷酸類型處理陣列之後獲得的圖像可以以與本文例示的用於從基於可逆終止子的測序方法的不同檢測通道獲得的圖像相同的方式來處理。在SBS的另一個實例中,循環測序通過逐步添加包含以下的可逆終止子核苷酸來完成:例如,如,例如,在WO04/018497和美國專利號7,057,026中描述的可切割或可光漂白的染料標記物,其公開內容通過引用併入本文。該方法被Solexa(現為IlluminaInc.)商業化,並且被描述於WO91/06678和WO07/123,744中,其中的每個通過引用併入本文。其中終止可被翻轉且螢光標記物被切割的螢光標記的終止子的可用性促進高效循環可逆終止(cyclicreversibletermination,CRT)測序。聚合酶還可被共工程化,以高效摻入並延伸這些修飾的核苷酸。可與本文描述的方法和系統一起使用的另外的示例性SBS系統和方法被描述於美國專利申請公布號2007/0166705、美國專利申請公布號2006/0188901、美國專利號7,057,026、美國專利申請公布號2006/0240439、美國專利申請公布號2006/0281109、PCT公布號WO05/065814、美國專利申請公布號2005/0100900、PCT公布號WO06/064199、PCT公布號WO07/010,251、美國專利申請公布號2012/0270305以及美國專利申請公布號2013/0260372中,其公開內容通過引用以其整體併入本文。一些實例可採用使用少於四種不同標記物檢測四種不同的核苷酸。例如,SBS可採用在美國專利申請公布號2013/0079232的併入的材料中描述的方法和系統來進行。作為第一實例,一對核苷酸類型可在相同波長進行檢測,但基於對該對的一個成員相比於另一個的強度差異,或基於該對的一個成員的變化(例如,經由化學修飾、光化學修飾或物理修飾)進行區分,該變化引起相比於該對的另一個成員檢測的信號的明顯信號出現或消失。作為第二實例,可在特定條件下檢測四種不同核苷酸類型中的三種,同時第四種核苷酸類型缺乏在那些條件下可被檢測到的標記物,或在那些條件下被最低限度檢測到(例如,由於背景螢光的最低限度檢測(minimaldetection)等等)。前三種核苷酸類型向核酸的摻入可基於它們各自信號的存在來確定,且第四核苷酸類型向核酸的摻入可基於任何信號的不存在或最低限度檢測來確定。作為第三實例,一種核苷酸類型可包括在兩個不同通道中被檢測到的標記物,而其他核苷酸類型在這些通道的不超過一個通道中被檢測到。前述提及的三種示例性構型不被視為是相互排斥的,且可以以多種組合一起使用。將所有三個實例組合的示例性實施方案是基於螢光的SBS方法,該基於螢光的SBS方法使用在第一通道被檢測到的第一核苷酸類型(例如dATP具有當被第一激發波長激發時在第一通道被檢測到的標記物)、在第二通道被檢測到的第二核苷酸類型(例如dCTP具有當被第二激發波長激發時在第二通道被檢測到的標記物)、在第一通道和第二通道兩者中被檢測到的第三核苷酸類型(例如dTTP具有當被第一和/或第二激發波長激發時在兩個通道中被檢測到的至少一個標記物)、以及在任一通道未被檢測到或最低限度被檢測到的缺乏標記物的第四核苷酸類型(例如dGTP不具有標記物)。此外,如在美國專利申請公布號2013/0079232的併入的材料中描述的,測序數據可使用單個通道來獲得。在此類所謂的單染料(one-dye)測序方法中,第一核苷酸類型被標記但標記物在第一圖像生成之後被去除,且第二核苷酸類型僅在第一圖像生成之後被標記。第三核苷酸類型在第一和第二圖像兩者中均保留其標記物,且第四核苷酸類型在兩個圖像中保持未被標記。一些實例可採用連接測序技術。此類技術採用DNA連接酶以摻入寡核苷酸並鑑定此類寡核苷酸的摻入。寡核苷酸通常具有與該寡核苷酸雜交的序列中的特定核苷酸的身份相關的不同的標記物。如同其他SBS方法,可在用標記的測序試劑處理核酸特徵的陣列之後獲得圖像。每個圖像將顯示具有摻入的特定類型的標記物的核酸特徵。由於每個特徵的不同的序列內容,不同的特徵將存在於或不存在於不同的圖像中,但特徵的相對位置將在圖像中保持不變。由基於連接的測序方法獲得的圖像可如本文陳述來儲存、處理和分析。可與本文描述的方法和系統一起採用的示例性SBS系統和方法被描述於美國專利號6,969,488、美國專利號6,172,218以及美國專利號6,306,597,其公開內容通過引用以其整體併入本文。一些實例可採用納米孔測序(Deamer,D.W.&Akeson,M."Nanoporesandnucleicacids:prospectsforultrarapidsequencing."TrendsBiotechnol.18,147-151(2000);Deamer,D.和D.Branton,"Characterizationofnucleicacidsbynanoporeanalysis".Acc.Chem.Res.35:817-825(2002);Li,J.,M.Gershow,D.Stein,E.Brandin,和J.A.Golovchenko,"DNAmoleculesandconfigurationsinasolid-statenanoporemicroscope"Nat.Mater.2:611-615(2003),其公開內容通過引用以其整體併入本文)。在此類實施方案中,靶核酸通過納米孔。納米孔可以是合成的孔或生物膜蛋白,諸如α-溶血素。當靶核酸通過納米孔時,每個鹼基對可通過測量孔的電導率的波動來鑑定。(美國專利號7,001,792;Soni,G.V.&Meller,"A.ProgresstowardultrafastDNAsequencingusingsolid-statenanopores."Clin.Chem.53,1996-2001(2007);Healy,K."Nanopore-basedsingle-moleculeDNAanalysis."Nanomed.2,459-481(2007);Cockroft,S.L.,Chu,J.,Amorin,M.&Ghadiri,M.R."Asingle-moleculenanoporedevicedetectsDNApolymeraseactivitywithsingle-nucleotideresolution."J.Am.Chem.Soc.130,818-820(2008),其公開內容通過引用以其整體併入本文)。從納米孔測序獲得的數據可如本文陳述來儲存、處理和分析。特別地,可根據本文陳述的光學圖像和其他圖像的示例性處理,將數據處理為圖像。一些實例可採用包括DNA聚合酶活性的實時監測的方法。核苷酸摻入可通過如被描述於,例如,美國專利號7,329,492和美國專利號7,211,414(其中的每一個通過引用併入本文)中的載有螢光團的聚合酶和γ-磷酸標記的核苷酸之間的螢光共振能量轉移(FRET)相互作用來檢測,或者核苷酸摻入可用如被描述於,例如,美國專利號7,315,019(其通過引用併入本文)中的零模波導以及使用如被描述於,例如,美國專利號7,405,281及美國專利申請公布號2008/0108082(其中的每一個通過引用併入本文)的螢光核苷酸類似物和工程化聚合酶來檢測。光照可被限制於在表面栓系的(surface-tethered)聚合酶周圍的仄升(zeptoliter)-規模體積,使得螢光標記的核苷酸的摻入可以以低背景來觀察(Levene,M.J.等"Zero-modewaveguidesforsingle-moleculeanalysisathighconcentrations."Science299,682-686(2003);Lundquist,P.M.等"Parallelconfocaldetectionofsinglemoleculesinrealtime."Opt.Lett.33,1026-1028(2008);Korlach,J.等"SelectivealuminumpassivationfortargetedimmobilizationofsingleDNApolymerasemoleculesinzero-modewaveguidenanostructures."Proc.Natl.Acad.Sci.USA105,1176–1181(2008),其公開內容通過引用以其整體併入本文)。由此類方法獲得的圖像可如本文陳述來儲存、處理和分析。一些SBS實施方案包括檢測將核苷酸摻入延伸產物後釋放的質子。例如,基於檢測釋放的質子的測序可使用電子檢測器和從IonTorrent(Guilford,CT,aLifeTechnologiessubsidiary)商業可得的相關技術,或在US2009/0026082A1;US2009/0127589A1;US2010/0137143A1;或US2010/0282617A1中描述的測序方法和系統,其中的每一個通過引用併入本文。本文陳述的用於使用動力學排除擴增靶核酸的方法可容易地應用於被用來檢測質子的基底。更具體地,本文陳述的方法可被用來產生用來檢測質子的擴增子的克隆群體。以上的SBS方法可以以使多種不同的靶核酸同時操作的多重格式有利地進行。在特定的實施方案中,不同的靶核酸可以在共同反應容器中或在特定基底的表面上被處理。這允許以多重方式便利遞送測序試劑、去除未反應的試劑以及檢測摻入事件。在使用表面結合的靶核酸的實施方案中,靶核酸可呈陣列格式。在陣列格式中,靶核酸可通常以空間上可區分的方式與表面結合。靶核酸可通過直接共價附連、與珠或其他顆粒附連或者與被附連至表面的聚合酶或其他分子結合來結合。陣列可包括在每個位點(還稱為特徵)處的單拷貝的靶核酸或者具有相同序列的多個拷貝可存在於每個位點或特徵處。多個拷貝可通過擴增方法,諸如,如在下文進一步詳細描述的橋式擴增或乳液PCR來產生。本公開內容的方法採用Illumina,Inc.技術,以用於測序通過實踐本文描述的方法創建的DNA譜文庫。MiSeq測序儀被用於本文描述的實例的成簇和測序。然而,如先前陳述的和如本領域技術人員理解的,本發明方法不受使用的測序平臺的類型限制。實施例以下實施例公開了用於DNA譜系分析的數種方法及材料。可對這些方法及材料進行修改,同時保持本發明的精神和範圍。依據本公開內容的考慮或本文公開的方法的實踐,此類修改對本領域技術人員將變得明顯。因此,不意圖這些方法或材料被限制於本文公開的具體實施例,但它覆蓋落入本公開內容的範圍和精神內的所有修改和可選方案。實施例1-非常規引物設計來自Illumina,Inc.(SanDiego,CA)的計算機設計程序DesignStudio被修改並用於引物設計。當然,本領域技術人員將理解,還可使用可選的引物設計程序諸如Primer3,並且將預設參數重置以模仿修改參數用於引物設計的意圖。設置通常在軟體自帶的config.xml文件中被重置,然而,當使用不同的軟體時這可不同,且典型的做法是諮詢具體材料以訪問每個軟體的預設參數。以下參數可在引物設計軟體中被重置:1)期望的最小長度的擴增子重置為>60120360576051283825<(預設為22)對於設計SNP引物,用於引物的3』末端的靶的範圍設置為「小的」,以保持引物距離靶向的SNP約1bp。在所有的參數重置後,可對序列運行引物設計程序,以確定落入新參數下的引物對候選者。例如,軟體的使用者可生成靶列表,其告訴軟體訪問基因組哪裡,以用於設計引物。在本實施例中,靶向的區域被拷貝並粘貼到DesignStudio軟體用來定位和靶向引物設計的圖形用戶界面應用程式。在將靶向的區域輸入進程序後,程序指導創建Design文件以啟動工具並創建引物設計。在本實施例中,主要的輸出是.txt文件,該.txt文件包括引物序列和/或一些包含失敗且是「不可設計(undesignable)」的區域,在該點靶向的序列需要被重新定義並重新運行。在本實驗中使用的軟體提供映射到被指定為靶向的區域的序列上的設計的引物。遵循重置的參數,設計用於擴增的不遵循常規引物設計標準的引物;然而,這允許長STR和短SNP的多重擴增。在本文公開的方法中有利的設計的STR靶向的引物的實例包括在表1中列出的那些。在本文公開的方法中有利的SNP靶向的引物的實例包括在表2中列出的那些。表1-無標籤的STR靶向的引物及擴增子尺寸表2-SNP靶向的引物實施例2-用於資料庫分析的DNA譜系分析本實施例描述遵循圖2的工作流程的實驗。由於可假定,獲得的樣品來自其身份已知的個體,本實施例不採用UMI。對於該實驗,STR用如在表3中發現的iSNP多重複用。表3-身份信息SNP和STR常染色體STR當然,另外的SNP和STR可被添加至以上的列表。其他潛在靶的實例包括,但不限於,在表4中發現的那些標誌物。表4-用於多重複用的另外的STR和SNP的實例引物被設計成包含在3』末端處的基因特異的PCR引物序列和在5』末端處的銜接子標籤序列。在該實驗中,正向引物包含用於TruSeqCustom擴增子i5銜接子的標籤序列,且反向引物包含用於TruSeq小RNA試劑盒i7銜接子的標籤序列。標籤可被用作擴增引物位點,以及測序引物位點。連接物i5標籤序列5』TACACGACGCTCTTCCGATCT3』(SEQIDNO:403)連接物i7標籤序列5』CTTGGCACCCGAGAATTCCA3』(SEQIDNO:404)為平衡在多重中的STR和SNP之間的擴增,如在實施例1中描述的修改SNP的引物設計參數。使用Illumina的DesignStudio設計的原始集合的SNP引物是典型的PCR引物-具有高解鏈溫度且幾乎沒有二級結構的短序列。DesignStudio被用來設計TruSeqCustom擴增子探針並創建下遊探針的反向互補物,以製備反向PCR引物。然而,這些引物不能良好地多重複用,且一個劣質引物可能將測定從好的轉為劣質的(例如,全部為引物二聚體及無產物)(圖4)。在創建用於多重複用的更好引物的嘗試中,使用包含錯誤引發文庫特徵的Primer3(共享軟體)。發現Primer3設計的引物比DesignStudio引物在多重測定中表現得甚至更差。出人意料地,生成的數據顯示,STR引物是多重複用良好的。觀察到,針對STR靶不良設計的引物對沒有像SNP引物那樣引起多重複用失敗。與被稱為「良好」的引物不同,STR引物是長的、AT豐富的,並具有低的解鏈溫度。SNP引物遵循實施例1的參數被重新設計。將用於所有靶的引物混合在一起。對於本實施例,將用於56種STR的引物對與用於75種iSNP、aSNP及表型信息SNP的引物對混合。將聚合酶(在本實施例中為熱啟動PhusionII)添加至PCR所需的所有組分的主混合物,並添加引物。將混合物用移液器吸取進PCR板的孔中,但,擴增還可在管等中進行。將DNA以在15微升體積中的純化的DNA添加至板,然而,還可使用來自拭子或未處理的濾紙的血液或口腔樣品或者直接來自FTA卡上的血液或口腔樣品等的裂解提取物。對於該實驗,純化的對照2800MDNA以1ng和100pg來使用。使反應物經歷按照以下方案的確定數目循環(在本實施例的情況下,25個循環)的PCR:在循環之後,將板從熱循環儀中取出。用以下使反應物至50微升:聚合酶(KapaHiFi,KapaBiosystems)、包含PCR所需的所有組分的PCR主混合物以及一對銜接子(一個為i7銜接子且一個為i5銜接子)。將第二輪PCR進行按照以下方案的確定數目的循環(在本實施例的情況下為10個循環),以生成測序文庫:在循環之後,將包含完成的文庫的板從熱循環儀中取出。這時,可將樣品以體積匯集並使用例如磁珠(SPRI)進行純化為單一樣品。樣品還可被單獨地純化。池(pool)或單獨的文庫可通過使用基於qPCR的方法、通過使用片段分析儀(FragmentAnalyzer)或BioAnalyzer或通過使用PicoGreen和板閱讀器(如在本實施例的情況一樣)進行定量。熟練的技術人員將知道許多用於文庫定量的選項。如果文庫被單獨地純化,它們可被歸一化至每個濃度2nM,並以體積匯集。將純化的文庫的池變性、稀釋、成簇並以350個循環測序運行及兩個索引讀段(indexread)在MiSeq測序儀上測序。在測序之後,使樣品根據銜接子序列解多重複用,並通過取證基因組管道(ForensicsGenomicspipeline)(Illumina,Inc.)進行分析。將STR讀段與SNP讀段分離,並獨立地進行分析。STR使用在先專利申請(PCT/US2013/30867,通過引用以其整體併入本文)中描述的算法進行分析。重複數目和任何序列變異連同讀段數目一起被報告。SNP使用清單(manifest)進行分析,且調用連同讀段數目一起被報告。計算STR基因座的等位基因之間的相對平衡(最小/最大%)、基因座之間的平衡(%CV)、誤差率以及掃描殘跡率。初始資料庫分析多重中的STR的結果示於圖5A-C中。平衡(平均平衡80%)、掃描殘跡(~3%)及誤差率(小於5%)滿足針對被包括在本實施例中的基因座的設計輸入要求。%CV(~142%)使用所有56個基因座來計算。儘管所用的引物顯示基因座間平衡,預期了另外的引物優化以改進基因座間平衡。對於已知基因座的調用匹配對於2800M的發表結果。對於SNP的結果示於圖5D-E中。對於在大的多重中的56個STR基因座的覆蓋、等位基因調用及其他假象示於圖6中。這些圖模擬由CE技術產生的電泳圖。柱類似於對於指定的等位基因的峰(X軸),且讀段計數(Y軸)類似於RFU。取決於SNP,對於SNP的覆蓋是從10-2500X的任何處,然而,被多重複用的每個SNP被計數並提供準確調用。實施例3-用於刑事案件的DNA譜系分析本實施例描述遵循圖3的工作流程的實驗。由於可假定獲得的樣品來自其身份尚未知曉的個體,本實施例將UMI摻入引物。對於該實驗,STR用如見於表5中的iSNP、aSNP及表型信息SNP多重複用。表5-案件工作STR和SNP本實施例將UMI摻入STR引物。對於這些實例,僅STR引物包含UMI,然而,如果需要,STR引物和SNP引物兩者可包括UMI,且實踐中不排除該選項。然而,對於本實施例,出於證實的目的,僅STR引物摻入UMI。在兩個循環的PCR期間,引入獨特分子標識符(圖3)。首先,如同對於實施例2,PCR引物包含在3』末端處的基因特異性PCR引物序列和在5』末端處的銜接子標籤序列,與在實施例2中對於i5和i7序列使用的標籤序列相同。在該實驗中,UMI被放置在基因特異性引物序列和標籤序列之間。在本實施例的情況下,存在用於針對正向引物和反向引物兩者上的UMI的五種隨機鹼基。將對於所有靶的引物混合在一起。引物混合物包括26種常染色體STR引物對和86種SNP引物對(覆蓋92種SNP)。將聚合酶(在本實施例中為熱啟動PhusionII)添加至PCR所需的所有組分的主混合物,並添加引物。將混合物用移液器吸取進PCR板的孔。DNA以純化的DNA,最佳地1ng被添加至板。如在實施例2中一樣,來自2800M對照的純化的DNA以1ng來測試。使多重反應混合物經歷按照以下方案的兩個循環的PCR:在循環之後,將樣品從熱循環儀中取出,並將大腸桿菌(E.coli)單鏈DNA結合蛋白(SSB)添加至反應。預期,SSB通過未使用的加標籤的基因特異性引物減少引物二聚體,並阻止來自這些引物的任何更多的擴增。將SSB與樣品在冰上孵育,可選地還可使用RT或37C孵育。在該孵育之後,將聚合酶(在本實施例中為熱啟動PhusionII)添加至PCR所需的所有組分的主混合物,且將主混合物與一對銜接子(i7和i5銜接子)添加至樣品,並按照以下方案循環確定數目的循環(在該實驗中為34個循環):95C3分95C30秒66C30秒72C1分72C5分10C保持樣品用SPRI珠純化,且單獨的文庫可通過使用基於qPCR的方法、通過使用片段分析儀(如在本實施例的情況一樣)或BioAnalyzer或通過使用PicoGreen和板閱讀器進行定量。文庫被歸一化至每個濃度2nM,並以體積匯集。將純化的文庫的池變性、稀釋、成簇並以350x100個循環測序運行及兩個索引讀段使用MiSeq測序儀測序。在測序之後,數據如在實施例2中報告的來確定。然而,由於引物包含UMI,使用UMI以通過使用PCR重複瓦解(collapse)數據,以去除測序和PCR誤差及假象。SNP使用清單(manifest)進行分析,且調用連同讀段數目一起被報告。計算等位基因之間的相對平衡(最小/最大%)、基因座之間的平衡(%CV)、誤差率以及掃描殘跡率(僅對於STR)。對於初始案件工作多重複用的結果示於圖7A-E中。對於在大的多重中的26個STR基因座的覆蓋、等位基因調用及其他假象示於圖8中。這些圖模擬由CE產生的電泳圖。柱類似於峰,且讀段計數類似於RFU。取決於SNP,對於SNP的覆蓋是從10-5500X的任何處,然而,被多重複用的每個SNP被計數並提供有用的結果。由這些研究產生的一個結果是,掃描殘跡被顯示為PCR假象。這已被許多研究者假設(且聚合酶滑移已在人結腸癌中被指示),但這尚未對取證測定證實。UMI可被用來顯示掃描殘跡確實是PCR假象。具有n+1或n-1個重複的產物具有與具有正確數目重複的產物相同的UMI(圖9)。與進行UMI校正的圖9B相比,在圖9A中,每個基因座顯示沒有UMI校正的結果。如顯示的,沒有UMI校正,在等位基因之間的平衡沒有進行UMI校正時那麼好。此外,沒有UMI校正時,存在明顯的相當多的掃描殘跡。柱間線以上的柱的部分代表測序誤差,而在線的下部代表在STR序列內的正確序列。使用UMI校正,誤差被大大減少。例如,SE33基因座具有用UMI校正去除的誤差。誤差校正可對於為刑事案件提供可能的最準確的DNA譜系分析是非常重要的。實施例4-使用12個樣品個體的DNA譜系分析方法和材料遵循圖3的工作流程,測試來自12個樣品個體的DNA(樣品編號:1、3、4、5、6、7、10、13、14、15、16、17)和一個參考基因組(2800M)。該實驗將UMI摻入進STR引物中,如在實施例3中描述的。每個樣品的兩個重複用ForenSeqDNA籤名文庫製備試劑盒在MiSeq測序儀上進行分析。1ngDNA被用於每個重複,使用DNA引物混合物B:收集的樣品混合物,其包含用於61種STR加上牙釉蛋白、95種身份信息SNP、56種祖先信息SNP、22種表型信息SNP(2種祖先SNP還被用於表型預測)的引物。預設設置STR:分析閾值=6.5%;解釋閾值=15%。SNP:分析閾值=3%;解釋閾值=15%。12個樣品個體的DNA譜系分析的高水平測序調用,諸如覆蓋和調用的基因座示於圖12中。如可觀察到的,在兩個重複中,每個基因座被至少100,000個讀段覆蓋。僅兩個樣品產生失敗的STR調用(61個中的一個)。在兩個重複中,在所有個體中,所有173種SNP被成功調用。兩個樣品個體的樣品STR調用示於圖16中。兩個樣品個體的樣品SNP調用示於圖17中。圖13示出了群體統計,諸如美國國家標準與技術研究所(NationalInstituteofStandardsandTechnology)(NIST)常染色體STR(auto-STR)的隨機匹配概率(RMP)、NISTY-STR的95%置信單倍型頻率、dbSNPiSNP的RMP、以及來自美國Y-STR資料庫的STR的RMP。12個樣品個體和參考個體的表型,諸如眼睛顏色和頭髮顏色基於實驗中pSNP的基因型進行預測,並與自報告的表型進行比較(圖14)。觀察到在預測的和報告的表型之間的高度相關性。12個樣品個體的祖先使用實驗中的56種aSNP的基因型進行預測。對每個樣品個體的PCA1和PCA3評分進行計算,並針對參考樣品繪製在祖先圖上。如圖15中示出的,樣品個體的祖先可基於祖先圖上的位置進行預測。十四個質心點(centroidpoint)被包括在祖先圖(圓圈)中。基於最近的質心點預測每個樣品個體的祖先。DNA譜系分析實驗還顯示在STR基因座和SNP基因座兩者內的高水平的基因座內平衡(如可在圖18中所見的),及低水平的掃描殘跡(如可在圖19中所見的)。12個個體中的六個加上2800M具有至少一個等距雜合子基因座,這示於圖20中。等距雜合子基因座被定義為具有相同重複數、是同樣平衡的兩個不同序列的STR。使用關於STRD8S1179中的變體的信息,樣品15的13個等位基因被追溯至祖母樣品17(圖21)。STRD13S317中的類似變體信息被用來追溯樣品15的等位基因。然而,在該情況下,不能確定任一等位基因的起源(圖22)。實施例5-用於研究、法醫或親子鑑定用途的DNA譜系分析本實施例是基於在ForenSeqTMDNA籤名製備指南(Illumina,SanDiego,CA)中描述的工作流程,其內容在此通過引用以其整體併入。純化的DNA或粗製裂解物可被用於本實施例。對於純化的DNA,各自1ng樣品用不含核酸酶的水稀釋至0.2ng/μl。對於粗製裂解物,將各自2μl樣品用3μl不含核酸酶的水稀釋。主混合物被設置為用於八個或更多個反應。對於每個反應,將5.4μlForenSeqPCR1反應混合物、0.4μlForenSeq酶混合物和5.8μlDNA引物混合物(A或B)添加進1.5ml微量離心管中。將10μl主混合物轉移至PCR板的每個孔中,並添加DNA或裂解物。使多重反應混合物經歷按照以下方案的PCR:98℃持續3分。以下的8個循環:96℃持續45秒80℃持續30秒以指定的斜坡模式(rampingmode),54℃持續2分以指定的斜坡模式,68℃持續2分以下的10個循環:96℃持續30秒以指定的斜坡模式68℃持續3分68℃持續10分。在10℃保持。在循環之後,將樣品從熱循環儀中取出。將ForenSeqPCR2反應混合物與一對銜接子(i7和i5銜接子)添加至樣品,並按照以下方案循環15個循環:98℃持續30秒。以下的15個循環:98℃持續20秒66℃持續30秒68℃持續90秒68℃持續10分在10℃保持。樣品用樣品純化珠來純化,且文庫以體積歸一化和匯集。匯集的文庫在雜交緩衝液(HT1)中稀釋,添加人類測序對照(HSC),並且熱變性以準備用於測序。實施例6-對降解的DNA的基因分型圖23示出了使用代表降解的DNA的剪切和/或DNA酶處理的DNA的基因分型結果。如圖顯示的,對於剪切的DNA,多於50%STR和SNP基因座被正確調用。對於少於100bp的DNA,實現了10-19的隨機匹配概率(RMP)。還使用降解的DNA預測了正確的祖先。實施例7-基因分型靈敏度圖24和25示出了在從7.82pg至1ng的亞納克DNA輸入水平的基因分型靈敏度結果。如顯示的,對於STR和SNP兩者,在125ng輸入DNA下,100%等位基因成功調用。在低至7.82pg輸入DNA下,多於50%的等位基因成功調用。對於大部分基因座,在1ng輸入DNA下,基因座內平衡大於70%。在說明書中使用的表示成分、反應條件等的數量的所有數字在所有情況下被理解為由術語「約」修飾。因此,除非相反指示,否則在其中陳述的數值參數是近似值,該近似值可取決於試圖獲得的期望性能而變化。至少且不是為了試圖限制將等同原則應用於在要求本申請的優先權的任何申請的任何權利要求的範圍,每個數值參數應根據有效數字的數目和普通的修約方法來解釋。本文引用的所有參考文獻,包括但不限於公布和未公布的申請、專利及著作參考文獻通過引用以其整體併入本文,且在此構成本說明書的一部分。在某種程度上,通過引用併入的出版物及專利或專利申請與被包含在本說明書中的公開內容牴觸時,本說明書旨在取代和/或優先於任何此類矛盾的材料。以上出版物或文件的引用不被理解為任何前述是相關現有技術的承認,其也不構成作為這些出版物或文件的內容或日期的任何承認。儘管本發明已結合其實施方案參考附圖被充分地描述,應該注意,多種變化和修改將對本領域技術人員變得明顯。此類變化和修改被理解為被包括在本發明的範圍內。本發明的多種實施方案應該被理解為,它們僅通過示例的方式而非通過限制的方式來呈現。同樣地,多種圖表可描繪用於本發明的示例性結構或其他配置,這樣做是為了有助於理解可被包括在本發明中的特徵和功能。本發明不限於說明的示例性結構或配置,而是可使用多種可選的結構及配置來實施。另外,儘管以上根據多種示例性實施方案和實施來描述本發明,應該理解,在一個或更多個單獨的實施方案中描述的多種特徵及功能在它們的適用性方面不限於用它們來描述的特定實施方案。反而,它們可單獨地或以一些組合被應用於本發明的一個或更多個其他實施方案,不管此類實施方案是否被描述,且不管此類特徵是否被呈現為是描述的實施方案的一部分。因此,本發明的寬度和範圍不應該受到任何以上描述的示例性實施方案的限制。除非另外明確指明,在該文件中使用的術語和措辭以及其實施方案應被理解為是開放式的,而非限制性的。作為前述的實例:術語「包括(including)」應該被讀為意指「包括,但不限於」等;術語「實例(example)」被用來提供討論的項目的示例性實例,而非其窮舉或有限的列表;且形容詞諸如「常規的(conventional)」、「傳統的(traditional)」、「正常的(normal)」、「標準的(standard)」、「已知的(known)」以及類似含義的術語不應該被解釋為將所描述的項目限制於給定的時間段或在給定的時間時可用的項目。而且相反地,這些術語應該被讀為包括可以是現在或在將來的任何時候可用、知曉的常規的、傳統的、正常的或標準的技術。同樣地,與連詞「和(and)」連接的一組項目不應該被讀為要求那些項目的每個及每一個存在於該組內,而(butrather)應該被讀為「和/或」,除非從上下文明顯或另外明確指明。類似地,與連詞「或(or)」連接的一組項目不應該被讀為要求該組之中相互排他性,而應該被讀為「和/或」,除非它從上下文明顯或另外明確指明。此外,儘管本發明的項目、要素或組分可以以單數來描述或要求保護,複數也被預期在其範圍內,除非明確指明限制為單數。例如,「至少一種」可指單數或複數,並且不限於任一種。擴展詞和措辭諸如「一種或更多種」、「至少」、「但不限於」或其他類似的措辭在一些情況的存在不應被讀為意指,在此類擴展措辭可以不存在的情況下意圖或要求較窄的情況。當前第1頁1&nbsp2&nbsp3&nbsp當前第1頁1&nbsp2&nbsp3&nbsp

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀