新四季網

由母本生物樣品進行胎兒基因組的分析的製作方法

2023-07-19 11:14:21

專利名稱:由母本生物樣品進行胎兒基因組的分析的製作方法
由母本生物樣品進行胎兒基因組的分析相關申請的交叉引用本申請要求2009年11月5日提交的題目為「Fetal Genomic Analysis (胎兒基因組分析)」的美國臨時申請第61/258567號、2009年11月6日提交的題目為「FetalGenomic Analysis from a Maternal Biological Sample (由母本生物樣品進行胎兒基因組的分析)」的美國臨時申請第61/259075號和2010年9月10日提交的題目為「FetalGenomic Analysis from a Maternal Biological Sample (由母本生物樣品進行胎兒基因組的分析)」的美國臨時申請第61/381854號的權益,並且是這些臨時申請的非臨時申請,通過引用將這些臨時申請的全部內容併入本文,用於所有目的。本申請還涉及2008年7月23日提交的題目為「Diagnosing Fetal ChromosomalAneuploidy Using Massively Parallel Genomic Sequencing(利用大規模平行基因組測序診斷胎兒染色體的非整倍性)」的美國申請第12/178,181號(代理人案 號 016285-005220US)、題目為「Diagnosing Fetal Chromosomal Aneuploidy UsingGenomic Sequencing With Enrichment (利用基因組測序與富集診斷胎兒染色體的非整倍性)」的美國申請第12/614350號(代理人案號016285-005221US)和同時提交的題目為「Size-Based Genomic Analysis (基於大小的基因組分析)」的美國申請(代理人案號016285-006610US),通過引用將這些申請的全部內容併入本文,用於所有目的。
背景技術:
本發明通常涉及基於母本樣品分析胎兒基因組,更具體而言,涉及基於母本樣品中基因片段的分析確定全部或部分胎兒基因組。1997年,母本血漿中無細胞胎兒核酸的發現已為非侵入性產前診斷開啟了新的可能性(Lo YMD et al Lancet 1997; 350:485-487;和美國專利 6,258,540)。這項技術被快速轉化於臨床應用,用於檢測胎兒來源的、從父系遺傳的基因或序列,例如用於胎兒性別確定、胎兒RhD狀態確定和確定胎兒是否遺傳了父系遺傳性突變(AmicucciP et al Clin Chem 2000; 46:301-302; Saito H et al Lancet 2000; 356:1170;以及Chiu RffK et al Lancet2002; 360:998-1000)。最近在該領域內的進展已經能夠由母本血漿核酸分析進行胎兒染色體非整倍性如三體性21的產前診斷(Lo YMD et al NatMed 2007; 13:218-223; Tong YK et al Clin Chem 2006; 52:2194-2202;美國專利申請2006/0252071;Lo YMD et al Proc Natl Acad Sci USA 2007; 104:131 16-13121;ChiuRffK et al Proc Natl Acad Sci USA 2008;105:20458-20463; Fan HC et al Proc NatlAcad Sci 2008; 105:16266-16271;美國專利申請2007/0202525;以及美國專利申請2009/0029377)。有意義的近期進展的另一方面是利用單分子計數法如數字PCR進行單基因疾病的非侵入性產前診斷,在所述單基因疾病中,母親和父親二人均攜帶同一突變。這已經通過母本血漿中的相對突變劑量(RMD)分析得到實現(美國專利申請2009/0087847; Lun FMFet al Proc Natl Acad Sci USA 2008;105:19920-19925;以及Chiu RffK et al. Trends基因 t 2009;25:324-331)。
然而,這些方法利用可能突變的現有知識來分析基因組的特定部分,因而不可能鑑定出潛在的或罕見的突變或遺傳疾病。因此,期望提供能夠利用非侵入性技術鑑定全部或部分胎兒基因組的新方法、系統和裝置。發明概述本發明的某些實施方案提供了確定懷孕女性的未出生胎兒的基因組的至少一部分的方法、系統和裝置。利用含有胎兒和母本遺傳材料的樣品(例如,來自懷孕母親的血液樣品)可以在產前構建胎兒的全基因組或所選基因組區域的基因圖譜。基因圖譜可以是胎兒從其父母二人或者僅從其父母之一遺傳來的序列的圖譜。基於一個或數個這樣的基因圖譜,可以確定胎兒患遺傳疾病或易患遺傳疾病或其他疾病或遺傳性狀的風險。本文還描述了實施方案的其他應用。在一個實施方案中,可以分析來自母本樣品(含有母本和胎兒DNA)的DNA片段,以鑑定某些指定基因座(界標)處的等位基因。然後,可以綜合分析這些基因座處各等位 基因的DNA片段的量,以確定這些基因座的單倍型的相對量,進而確定胎兒從母本和/或父本基因組遺傳了哪種單倍型。通過鑑定胎兒單倍型,可以確定包括指定基因座的相應基因組區域內的單個基因座處的胎兒基因型。在各種實施方案中,以確定胎兒基因組的區域的方式分析親本為純合和雜合的特定組合的基因座。在一項應用中,使用代表群體中常見單倍型的參照單倍型,同時分析母本樣品的DNA片段,以確定母本和父本基因組。還提供了其他實施方案,諸如確定突變,確定母本樣品中的部分胎兒濃度和確定母本樣品測序覆蓋度的比例。本發明的其他實施方案涉及與本文所述方法相關的系統、裝置和計算機可讀介質。在一個實施方案中,計算機可讀介質含有接收數據和分析數據的指令,而不是指導儀器產生數據(例如,測序核酸分子)的指令。在另一個實施方案中,計算機可讀介質含有指導儀器產生數據的指令。在一個實施方案中,電腦程式產品包含存儲多個指令的計算機可讀介質,所述指令用於控制處理器執行本文所描述的方法的操作。實施方案還涉及經設置執行本文所述任何方法的步驟的計算機系統,可能有不同的組件執行各個步驟或各組步驟。參照說明書的其餘部分,包括附圖和權利要求書,將會理解本發明實施方案的其他特徵和優點。下面結合附圖詳述本發明各實施方案的其他特徵和優點以及結構和操作。在附圖中,相似的參考編號可以表示相同的或功能上相似的元件。


圖I是按照本發明的實施方案確定懷孕女性的未出生胎兒的基因組的至少一部分的方法100的流程圖。圖2示出了按照本發明的實施方案,針對父母各自的基因組密碼的具體節段的父親的兩個單倍型和母親的兩個單倍型。圖3示出了按照本發明的實施方案,圖2的親本單倍型中的兩種類型的SNP。圖4A和4B示出了按照本發明的實施方案,確定兩種類型SNP的胎兒單倍型的分析。圖5A和5B示出了按照本發明的實施方案比較每個基因座片段的相對量(例如,計數)的分析以及所述比較的結果是否能將特定的單倍型歸為遺傳的或非遺傳的。圖6示出了按照本發明的實施方案改變SPRT分類的似然比(likelihood ratio)的影響。圖7是按照本發明的實施方案確定懷孕女性的未出生胎兒從父親遺傳的基因組的至少一部分的方法700的流程圖。圖8是按照本發明的實施方案確定母親和父親均為雜合的區域內未出生胎兒的基因組的至少一部分的方法800的流程圖。圖9示出了按照本發明的實施方案在特定基因組區域內均為雜合的父親和母親的單倍型。圖10是按照本發明的實施方案顯示確定母本樣品中胎兒材料的部分濃度的方法1000的流程圖。 圖11是按照本發明的實施方案確定基因座是否為信息性的方法的流程圖。圖12A和12B分別示出了,按照本發明的實施方案,假設部分胎兒DNA濃度分別為20%和5%,三種情況下等位基因T (情況(a)和(C)下等位基因豐度較低)計數的預測分布。圖13A、13B和14示出了,按照本發明的實施方案,對於部分胎兒DNA濃度為20%,較低豐度的等位基因計數的預測分布,不同的分子總計數的每一分布都對應於SNP。圖15A和15B示出了按照本發明的實施方案參照單倍型、採自參照單倍型的親本單倍型以及得到的胎兒單倍型的實例。圖16是按照本發明的實施方案,一組參照單倍型已知,但親本單倍型未知時,確定胎兒基因組的至少一部分的方法1600的流程圖。圖17示出了按照本發明的實施方案根據母本樣品的DNA片段分析確定信息性基因座的實例。圖18示出了三個參照單倍型(Hap A、Hap B和Hap C)和父本等位基因。圖19示出了按照本發明的實施方案由父本等位基因確定親本單倍型。圖20示出了按照本發明的實施方案根據母本樣品分析推導母本基因型。圖21示出了按照本發明的實施方案由母本基因型和參照單倍型確定母本單倍型的一個實施方案。圖22示出了按照本發明的實施方案確定的母本單倍型和父系遺傳的單倍型。圖23示出了按照本發明的實施方案相對於父本單倍型的母本單倍型的不同類型的基因座(a (A)和β⑶)。圖24是顯示鑑定懷孕女性的未出生胎兒的基因組中新生突變的方法2400的流程圖。圖25Α示出了按照本發明的實施方案表示父親、母親和胎兒(CVS)的不同基因型組合的SNP的絕對數量和百分比。圖25Β示出了列出前20個流通池的比對統計數據的表格。圖26是示出按照本發明的實施方案通過兩個方法計算出的SNP的胎兒DNA的部分濃度的表格。圖27Α的圖示出了在該子集中觀察到的SNP百分比,其中對於所分析的前20個流通池可以從測序數據看到胎兒等位基因。圖27B的圖示出了按照本發明的實施方案覆蓋度對比讀取(read)的數量。圖28A和28B分別示出了按照本發明的實施方案父系遺傳的等位基因的覆蓋度與可作圖的序列讀取的數量和流通池序列的數量之間的相互關係的圖。圖29A示出了假陽性率與測序的流通池數量之間的相互關係,圖29B示出了按照本發明的實施方案假陽性率與測序的流通池數量之間的相互關係。
圖30示出了按照本發明的實施方案所分析的不同數量的流通池的胎兒特異性SNP的覆蓋度。圖31示出了按照本發明的實施方案,當使用來自10個流通池的數據時A型分析的精度。圖32示出了按照本發明的實施方案,當使用來自10個流通池的數據時B型分析的精度。圖33示出了按照本發明的實施方案,當使用來自20個流通池的數據時A型分析的精度。圖34示出了按照本發明的實施方案,當使用來自20個流通池的數據時B型分析的精度。圖35A和35B示出了按照本發明的實施方案,在密碼子41/42處具有突變和野生型序列的讀取。圖36示出了按照本發明的實施方案A型RHDO分析的表格,而B型RHDO分析的表如圖37所示。圖38A和38B示出了以病例PW226為實例的SPRT分類結果。圖39示出了按照本發明的實施方案總結了 5個病例的RHDO分析結果的表格。圖40示出了按照本發明的實施方案測序深度與測序的流通池數量相比的圖。圖41示出了全基因組的胎兒序列和總序列的大小,圖42A-42C示出了按照本發明的實施方案每條染色體單獨的相似的圖。圖43示出了可與本發明實施方案的系統和方法一起使用的示例性計算機系統4300的框圖。定義本文所用術語「生物樣品」指從個體(如諸如孕婦的人)採集的含有一種或多種目的核酸分子的任何樣品。術語「核酸」或「多核苷酸」指單鏈或雙鏈形式的脫氧核糖核酸(DNA)或核糖核酸(RNA)和其多聚體。除非另有限制,該術語包括含有天然核苷酸的已知類似物的核酸,所述類似物具有與參照核酸類似的結合特性,並且以與天然存在的核苷酸類似的方式代謝。除非另有說明,特定的核酸序列還隱含地包括其保守修飾的變體(如簡併密碼子取代)、等位基因、直系同源物(orthologs)、SNP和互補序列以及明確表示的序列。具體來說,簡併密碼子的取代可以通過產生如下的序列實現其中一個或多個選擇的(或全部)密碼子的第三位被混合鹼基和/或脫氧次黃苷殘基取代(Batzer et al. , NucleicAcid Res. 19:5081(1991);Ohtsuka etal. , J. Biol. Chem. 260:2605-2608(1985);以及Rossolini et al. ,Mol. Cell. Probes 8:91-98(1994))。術語核酸與基因、cDNA、mRNA、小非編碼RNA、微RNA (miRNA) ,Piwi-相互作用RNA和基因或基因座編碼的短髮夾RNA (shRNA)交換地使用。術語「基因」意指參與產生多肽鏈或轉錄的RNA產物的DNA的節段。其可以包括編碼區之前和之後的區域(前導區和非轉錄尾區),以及單獨的編碼節段(外顯子)間的間插序列(內含子)。本文所用術語「臨床相關核酸序列」( 也稱為靶序列或染色體)可以指對應於潛在的失衡正被檢測的更大的基因組序列節段的多核苷酸序列,或指更大的基因組序列本身。一實例是21號染色體的序列。其他的實例包括18號、13號、X和Y染色體。除此以外的其他實例包括,胎兒從其父母之一或兩者遺傳的突變的基因序列或基因多態性或拷貝數變異,或者作為胎兒中新生突變。在某些實施方案中,多種臨床相關核酸序列,或臨床相關核酸序列等同的多種標記,可用於提供用來檢測失衡的數據。例如,來自21號染色體的5個不連續序列的數據,能夠以加成方式(additive fashion)用於確定可能的21號染色體失衡,從而將所需的樣品體積有效地減少至1/5。本文所用術語「基於」意指「至少部分地基於」,並指確定另一值所用的一個值(或結果),如存在於方法的輸入和該方法的輸出的關係中的值。本文所用術語「獲得」也指方法的輸入和該方法的輸出的關係,如該當獲得是公式的計算時存在的關係。本文所用術語「參數」意指,表徵定量數據集和/或定量數據集之間數值關係的數值。例如,第一核酸序列的第一量和第二核酸序列的第二量之間的比值(或比值函數)是參數。本文所用術語「基因座(locus) 」或其複數形式「基因座(loci) 」是在基因組間有變化的任何長度的核苷酸(或鹼基對)的位置或地址。本文所用術語「序列失衡」意指,與參考量的任何顯著偏差,其是由臨床相關核酸序列的量中的至少一個截止值所限定的。序列失衡可以包括染色體劑量失衡、等位基因失衡、突變劑量失衡、單倍型劑量失衡和其他相似的失衡。舉例來說,當胎兒具有不同於母親的基因型時,能夠發生等位基因或突變劑量失衡,從而在樣品的具體基因座處產生失衡。本文所用術語「染色體非整倍性」意指,染色體的定量數量與二倍體基因組的染色體數量的變化。這種變化可以是增加或丟失。該變化可以包括一個染色體的全部或染色體的區域。本文所用的術語「單倍型」指在同一染色體或染色體區域上共同傳遞的多個基因座處的等位基因的組合。單倍型可以指少至一對基因座或者是指染色體區域,或者是指整個染色體。術語」等位基因」指處於同一物理基因組基因座處的兩個DNA序列之一,它們可能導致不同的表型性狀或可能不導致不同的表型性狀。在任何具體二倍體生物中,每條染色體具有兩個拷貝(除了雄性人個體中的性染色體),每個基因的基因型包括該基因座處存在的等位基因對,所述等位基因對在純合子中是相同的,在雜合子中是不同的。生物群體或生物物種通常包括處於不同個體中的每個基因座處的多個等位基因。在群體中存在多於一個等位基因的基因組基因座被稱為多態位性點。可以將一個基因座處的等位基因變化測量為所存在的等位基因的數量(即多態性的程度)、群體中雜合子的比例(即雜合率)。本文所用的術語「多態性」指人類基因組中任何個體間的變化,與其頻率無關。這類變化的實例包括但不限於,單核苷酸多態性、簡單串聯重複多態性、插入-缺失多態性、突變(其可能會引起疾病)和拷貝數變化。詳細描述未出生胎兒的部分基因圖譜或全基因組序列的構建可以基於其父母的多態性序列的單倍型而提供。本文所用的術語「單倍型」指在同一染色體或染色體區域上共同傳遞的多個基因座處的等位基因的組合。例如,實施方案可以分析來自母本樣品(含有母本和胎兒DNA)的DNA片段,以鑑定某些指定基因座(界標)處的等位基因。然後,可以綜合分析這些基因座處的各等位基因的DNA片段的量,以確定這些基因座的單倍型的相對量,進而確定胎兒從母本和/或父本基因組遺傳了哪種單倍型。通過鑑定胎兒單倍型,可以確定包括指定的基因座的相應基因組區域內的單個基因座處的胎兒基因型。在各種實施方案中,可以以確定胎兒基因組的區域的方式,分析父母為純合和雜合的特定組合的基因座。在一種實施中,使用代表群體中常見單倍型的參考單倍型,同時分析母本樣品的DNA片段,以確定母本和父本基因組。
用於確定胎兒基因組的至少一部分的實施方案的應用實例為通過將推斷的胎兒基因型或單倍型與疑父的基因型或單倍型進行比較而用於親子鑑定(paternitytesting)。另一實例是檢測胎兒已經獲得的一種或多種新生突變或檢測從其父母產生配子期間就已經發生的減數分裂重組事件。這些是已經受精的配子,並且得到的受精卵已發育成胎兒。此外,一些實施方案還允許以任何所需的解析度確定未出生胎兒的基因組序列。例如,在某些應用中,實施方案可允許確定胎兒的完整或接近完整的基因組序列。在一個實施方案中,可被確定的胎兒基因組序列的解析度取決於所了解的父親和母親基因組的解析度,以及來自含有胎兒核酸的母本生物樣品的測序信息。如果已知父親和母親的完整或接近完整的基因組序列,則可以推導出未出生胎兒的完整或接近完整的基因組序列。在其他實施方案中,只闡述基因組內所選區域的基因組序列,例如,用於所選的遺傳、後生(諸如印記失誤)或染色體病症的產前診斷。實施方案可應用的遺傳病症的實例包括血紅蛋白病(諸如地中海貧血、α-地中海貧血、鐮狀細胞貧血、血紅蛋白E病)、囊性纖維化和性連鎖病症(諸如血友病和杜興氏肌營養不良)。可利用實施方案檢測的突變的其他實例可參見在線人類孟德爾遺傳(Online Mendelian Inheritance in Man, www.ncbi. nlm. nih. rov/omim/Retmorbid. cri)。—些實施方案還可以用於確定胎兒DNA的部分濃度(fractionalconcentration),這可以在沒有父母具體基因組的任何現有知識的情況下進行。相似的分析還可以用於確定對於胎兒基因組的精確確定所需的覆蓋深度。因此,該覆蓋度確定可用於估計為獲得精確結果需要分析多少數據。I.引言當將母本樣品(例如,血漿或血清)用作闡述胎兒單倍型的材料時,可能面臨兩個主要的挑戰。第一個挑戰是母本血漿或血清由胎兒DNA和母本DNA的混合物組成,並且胎兒DNA佔很小的比例。已經確定的是,在妊娠的前兩三個月,胎兒DNA所代表的平均/中值濃度為母本血漿總 DNA 的約 5% 至 10% (Lo YMD et al Am J Hum Genet 1998; 62:768-775; LunFMF et al Clin Chem 2008;54:1664-1672)。由於DNA是在血液凝固過程中由母本血細胞釋放的,所以母本血清中胎兒DNA的部分濃度甚至比母本血漿中的濃度低。因此,在一些實施方案中,母本血漿優於母本血清。第二個挑戰是母本血漿中的胎兒DNA和母本DNA由短片段組成(Chan KCA et alClin Chem 2004;50:88-92)。的確,在母本血漿中,胎兒來源的DNA通常短於母本來源的DNA。母本血漿中大多數胎兒DNA的長度小於200bp。單獨利用如此短的血漿DNA片段,來構建長基因組距離上的基因多態性的單倍型是有挑戰性的。母本血漿和血清的上述挑戰同樣適用於母本尿液中胎兒 DNA 的檢測(Botezatu I et al Clin Chem 2000;46:1078-1084)。胎兒DNA僅代表孕婦尿液DNA的較小一部分,並且母本尿液中的胎兒DNA同樣由短DNA片段組成。A.母本樣品的測序與分析一些實施方案所採用的用來解決第一個挑戰的方法是,利用允許對獲自母本生物樣品的核酸進行高精度的定量基因分型的方法。在該方法的一個實施方案中,通過分析大量的(例如,數百萬或數億計的)核酸分子來實現該精度。此外,通過分析單個核酸分子或單個核酸分子的克隆擴增可以提高該精度。一個實施方案利用大規模平行DNA測序,例如但 不限於,通過以下所進行的測序Illumina基因組分析儀平臺(Bentley DR et al. Nature2008;456:53-59)、Roche 454 平臺(Margulies M et al. Nature 2005;437:376-380) >ABI SOLiD 平臺(McKernan KJ et al. Genome Res 2009; 19:1527-1541)、Helicos 單分子測序平臺(Harris TD et al. Science 2008; 320:106-109)、利用單個聚合酶分子的實時測序(Science 2009; 323:133-138)和納米孔測序(Clarke J et al. NatNanotechnol. 2009;4:265-70)。在一個實施方案中,對生物樣品的核酸分子的隨機子集進行大規模平行測序。在一些實施方案中,從每個分子獲得儘可能長的序列讀取可能是有益的。對可以實現的測序讀取長度的一個限制是母本生物樣品中核酸分子的性質。例如,已知母本血漿中的大多數DNA分子由短片段組成(Chan CA et al Clin Chem 2004; 50:88-92)。此外,在長讀取長度時,讀取長度必須與測序系統的保真度相平衡。對於上述系統中的一些系統,從分子兩端獲得序列即所謂的雙末端測序可能是更好。舉例來說,一個方法是從DNA分子的每端進行50bp的測序,因而產生每分子總共IOObp的序列。在另一個實施方案中,可以從DNA分子的每端進行75bp的測序,因而產生每分子總共150bp的序列。測序之後,然後將序列與參照人基因組進行比對。由於實施方案闡明未出生胎兒從其父母遺傳的基因組變異,因此比對算法能夠處理序列變異。這種軟體包的一個實例是Illumina開發的核苷酸資料庫的高效大規模比對(Efficient Large-Scale Alignmentof Nucleotide Databases) (ELAND)。這種軟體包的另一個實例是SOAP(短寡核苷酸比對程序)和 S0AP2 軟體(Li R et al. Bioinformatics 2008; 24:713-714; Li R etal. Bioinformatics 2009;25:1966-1967)。可能需要進行的DNA測序的量可以取決於需要構建的胎兒基因圖譜或胎兒基因組序列的解析度。通常,測序的分子越多,解析度越高。在給定水平或深度的DNA測序的胎兒基因圖譜或胎兒基因組序列解析度的另一決定因素是母本生物樣品中胎兒DNA的部分濃度。通常,部分胎兒DNA濃度越高,在給定水平的DNA測序可以闡述的胎兒基因圖譜或胎兒基因組序列的解析度越高。由於母本血漿中胎兒DNA的部分濃度高於母本血清中部分濃度,所以對於某些實施方案而言,相對於母本血清,母本血漿是更優選的母本生物樣品類型。在使用索引(indexing)或條形碼(barcoding)的情況下,可以增加基於上述測序的方法的通量。因此,可以將樣品或患者特異性索引或條形碼添加到特定核酸測序庫的核酸片段中。然後,將許多這樣的庫混合起來並一起測序,每個庫都具有樣品或患者特異性索引或條形碼。測序反應之後,可以基於索引或條形碼由每個樣品或患者收集測序數據。這種策略可以增加本發明實施方案的通量以及因此增加成本效益。在一個實施方案中,可以在進行定量基因分型(例如,測序)之前選擇生物樣品中的核酸分子或對其分級。在一個變型中,用與來自基因組中選擇的基因座(例如,染色體7上含有CFTR基因的區域)的核酸分子優先結合的裝置(例如,微陣列)處理核酸分子。然後,對由所述裝置捕獲的核酸分子優先進行測序。該方案允許將測序靶向目的基因組區域。在該方案的一個實施方案中,可以使用NimbleRen序列捕獲系統(www. nimbleRen.com/products/seacap/index, html)或 Agilent SureSelect 革巴標富集系統(AgilentSure Select Target Enrichment System, www. opengenomics. com/SureSelect TargetEnrichment System)或相似的平臺。在一些實施方案中,對來自基因組所選區域的核酸分子進行隨機測序。 在另一個實施方案中,可以首先通過一組或多組擴增弓I物擴增生物樣品中的目的基因組區域。然後,對所擴增的產物進行定量基因分型,例如測序。在該方案的一項實施中,可以使用 RainDance (www. raindancetech. com/technology/pcr-genomics-research. asp)系統。在一些實施方案中,對所擴增的核酸分子進行隨機測序。還可以在生物樣品中的核酸分子上進行大小分級步驟。因為已知母本血漿中胎兒DNA短於母本DNA (Li et al Clin Chem 2004; 50:1002-1011;美國專利申請20050164241;美國專利申請20070202525),因此可以收集分子大小較小的部分,然後用於定量基因分型,例如測序。這一部分將比原始生物樣品含有較高的胎兒DNA部分濃度。因此,胎兒DNA富集的部分的測序可允許在特定的分析水平(例如,測序深度)上以比使用非富集的樣品時更高的解析度構建胎兒基因圖譜或推導出胎兒基因組序列。因此,這使得該項技術成本效益更高。作為大小分級方法的實例,可以使用(i)凝膠電泳,隨後從具體凝膠部分提取核酸分子;(ii)對不同大小的核酸分子具有差別親和力的核酸結合基質對不同大小的核酸分子具有差別截留的過濾系統。在另一個實施方案中,在核酸測序之後可以優先分析特定大小或大小範圍的分子。例如,可以進行對DNA分子的兩端進行測序的雙末端測序。然後,可以將這些兩端的基因組坐標定位回參照人類基因組。然後通過減去兩端的基因組坐標可以推導出分子的大小。進行這種雙末端測序的一種方法是使用Illumina Genome Analyzer的雙末端測序方案。推導DNA分子大小的另一方法是對整個DNA分子進行測序。這最容易通過讀取長度相對長的測序平臺進行,例如Roche 454平臺(Marguelis et al Nature2005;437:376-380)和 Pacific Biosciences 單分子、實時(SMRT )技術(Eid et alScience 2009; 323:133-138)。推導出核酸分子的大小之後,可以選擇將隨後的分析集中在小於特定截止大小的分子上,進而富集胎兒DNA的部分濃度。與沒有進行該方案相比,大小選擇之後,這種分子子集的分析可以允許用較少的分析分子推導出胎兒基因圖譜或胎兒基因組序列。在一個實施方案中,使用300bp的截止大小。在其他實施方案中,可以使用250bp、200bp、180bp、150bp、125bp、IOObp 或 75bp 的截止大小。B.利用親本基因組作為框架(Scaffold)為了解決第二個挑戰,一些實施方案可以利用母親染色體的單倍型作為『框架』。還可以使用父親染色體的單倍型作為另一個『框架』。該框架可以與獲自含有胎兒DNA的母本樣品的胎兒的遺傳信息進行比較。該胎兒遺傳信息可以用於確定母親和/或父親的框架是如何在胎兒基因組中建立的,進而利用框架的組成部分確定得到的胎兒基因組。可以由父親和母親的基因組DNA以及家族其他成員(例如,當前處於孕期的胎兒的兄弟姐妹)的基因組DNA構建親本單倍型,鑑於基因組測序成本的降低,親本單倍型的有 效性可能正變得越來越平常。在一種情況中,如果父母一方或雙方的基因組已被測序,且他們在一個或多個染色體區域上的單倍型已被確定,那麼該信息可以用作上文提到的框架。可以使用能夠探尋基因組中的序列變異的本領域技術人員已知的任何基因分型平臺,包括DNA測序、微陣列、雜交探針、基於螢光的技術、光學技術、分子條形碼和單分子成像(Geiss GK et al. Nat Biotechnol 2008; 26:317-325)、單分子分析、PCR、數字PCR、質譜技術(例如Sequenom MassARRAY平臺)等。作為更極端的實例,可以通過利用大規模平行測序方法的全基因組DNA測序(例如,Bentley DR et al. Nature2008; 456:53-59;McKernan KJ et al. Genome Res 2009; 19:1527-1541)確定父親和母親的DNA序列。可能感興趣的序列變異的一個實例是單核苷酸多態性(SNP)。用於確定親本基因型的特別優選的方法是,通過對基因組範圍上或所選的基因組區域的SNP的微陣列分析,所選的基因組區域例如含有突變能導致遺傳疾病(例如β珠蛋白簇中的基因或囊性纖維化跨膜傳導調節因子(CFTR)基因)的基因的那些區域。除了序列變異之外,還可以使用拷貝數變化。序列變異和拷貝數變化均被稱為多態遺傳特徵(PMF)。一方面,可以將目的染色體或染色體區域上的母本基因型構建成單倍型。構建單倍型的一個方式是,通過分析與母親相關的其他家族成員,例如,母親的兒子或女兒、父母、兄弟姐妹等。能夠構建單倍型的另一方式是,通過上文提到的本領域技術人員公知的其他方法。然後,通過與來自其他家族成員例如當前處於孕期的胎兒的兄弟姐妹或來自祖父母的基因型等的基因型信息進行比較,基因型信息可以被擴展成父母的單倍型信息。還可以通過本領域技術人員公知的其他方法構建父母的單倍型。這類方法的實例包括基於單分子分析的方法如數字PCR(Ding C and Cantor CR. Proc Natl Acad Sci USA2003;100:7449-7453;Ruano G et al. Proc Natl Acad Sci USA 1990;87:6296-6300)、精子單倍型分析(Lien S et al. Curr Protoc Hum Genet 2002; Chapter I :Unit I. 6)和成像技術(Xiao M et al. Hum Mutat 2007;28:913-921)。其他方法包括基於等位基因特異性 PCR 的方法(Michalatos-Beloin S et al. Nucleic Acids Res 1996; 24:4841-4843; LoYMD et al. Nucleic Acids Res 1991;Nucleic Acids Res 19:3561-3567)、克隆和限制性酶消化(Smirnova AS et al. Immunogenetics 2007;59:93-8)等。其他方法基於群體中單倍型域的分布和連鎖不平衡結構,其允許根據統計學評價推知母本單倍型(Clark AG. MolBiol Evol 1990;7:111-22;10:13-9;Salem RM et al. Hum Genomics 2005;2:39-66)。C.利用母本樣品的基因組信息組建框架在一個實施方案中,為了研究母本染色體的哪條染色體已傳遞給胎兒,使用相對單倍型劑量(RHDO)方法。該方法的一般原理如下,以母親對於基因多態性的每一個都是雜合的為例。因此,有兩個單倍型,這些單倍型的相對劑量為1:1。然而,在母本樣品中,小t匕例胎兒DNA的存在可能改變相對單倍型劑量。這是因為胎兒的單倍型互補物的一半遺傳自母親,而另一半遺傳自父親。此外,對於每條染色體,胎兒可能已經遺傳了源自父母一方的一個或另一個同源染色體的單倍型的『拼湊物(patchwor) 』,這取決於減數分裂重組的存在。所有這些因素都可能使母本組成型DNA中的相對單倍型劑量偏離1:1的比值。因此,對於給定的染色體或染色體區域,這些單倍型的組成型等位基因可以根據母本樣品所產生的分析數據(例如,測序數據)尋找。然後,可以進行統計學程序以確定相對單倍型劑量,或者確定這些單倍型中的一個是否相對於另一個單倍型被過多表現。可以根據部分胎兒DNA濃度調整該統計學程序的分類閾值。通常,較高的部分胎兒DNA濃度可以允許所述閾值以較少的分子獲得。還可以根據希望在目的基因組或基因組區域上實現的成功分類的片段的數量調整所述分類閾值。在一個實施方案中,可以使用序貫概率比檢驗(SPRT)。在一個實施方案中,可以使用美國專利申請2009/0087847中所描述的相對突變 劑量(RMD)來確定母親具體多態性處等位基因的相對量。這些相對量可用於確定胎兒的單倍型(例如,當多態性位於連續或連鎖的基因座時)。該靶向方法的一項實施是使用聚合酶鏈式反應(PCR)從基因組的所選部分擴增具體序列,用於RMD分析。為了使該RMD方法擴展至能確定在大基因組區域或全基因組上的胎兒遺傳,需要大量母本樣品。在利用隨機測序的一個實施方案中,沒有特異性地靶向目的基因組區域。因此,在目的基因組區域中所獲得的序列的數量可能不會像靶向方法中一樣多(除非進行很深的測序)。然而,可以將計數匯總成跨越很多連鎖多態性的計數,以實現診斷目的必要的統計學功效。利用該測序實施方案的實際含義在於,其可以通過避免需要過深測序而節約成本。與基於數字PCR的方法相比,其也需要輸入較少量的母本樣品。此外,在區段中適合進行這種RHDO分析。換句話而言,可以分析每條染色體的一個區段,優選多於一個區段。一方面,後者可能允許觀察減數分裂重組。例如,胎兒具體染色體節段的單倍型似乎來自母本同源染色體之一,而同一胎兒染色體的另一節段似乎具有來自另一母本同源染色體的單倍型。SPRT分析可以允許進行這種節段化。例如,可以在鄰近的SNP上進行SPRT分析,所述鄰近的SNP顯示從染色體的一端開始的所需的親本基因型構型(即父親是純合的而母親是雜合的)。這將繼續,直到SPRT分析已經表明,母本單倍型之一在母本血漿分析數據(例如,測序數據)中是主要的。然後,SPRT分析可以『重置(reset)』,並從顯示所需的親本基因型構型的下一個鄰近的SNP重新開始。再次繼續,直到SPRT分析再一次表明,母本單倍型之一在母本血漿分析數據(例如,測序數據)中是主要的。繼續該過程直到所述染色體上最後選擇的SNP。然後,可以將染色體上這些多種SPRT決定的單倍型節段與母親基因組的兩條同源染色體的單倍型進行比較。當胎兒的單倍型節段似乎已經從一個母本同源染色體轉換到另一個時,觀察到減數分裂重組。即使每條染色體有多於一處減數分裂重組,該系統也能工作。如後文所描述的,對於組成型基因多態性父親和母親均為雜合的基因組區域也可以實施RHDO分析。該方案尤其適用於父親和母親共有同一祖先來源的疾病基因的突變拷貝的情況,例如當他們有血緣時或當疾病的顯性突變是由於大的奠基者效應(即具有突變的大多數個體從群體的共同祖先奠基者遺傳了相同的單倍型)。因此,父親和母親在該區域的單倍型可用於推導胎兒單倍型。II.由母本基因組構建胎兒基因組以下描述利用對親本基因組的明確了解來構建胎兒基因圖譜或闡明胎兒基因組序列。A.方法圖I是確定懷孕女性的未出生胎兒的基因組的至少一部分的方法100的流程圖。胎兒有父親和身為懷孕女性的母親。父親的父本基因組具有兩個單倍型,母親的母本基因組具有兩個單倍型。方法100分析獲自懷孕女性的生物樣品的核酸分子(片段),以確定胎兒的基因組。方法100主要描述在多個基因座處父親為純合的而母親為雜合的時的情況, 而其他實例描述其他實施方案。方法100和本文所述的任何方法可以完全或部分地用包括處理器的計算機系統進行,所述計算機系統被設置成能夠進行這些步驟。因此,實施方案涉及被設置成能進行任何本文所述方法的步驟的計算機系統,可能有不同組件執行各個步驟或各組步驟。儘管以編號的步驟呈現,但是本文方法的步驟可以同時或以不同的順序進行。此外,這些步驟的一部分可以其他方法的其他步驟的一部分一起使用。同樣,步驟的全部或部分可以是任選的。此外,任何方法的任何步驟可以用進行這些步驟的模塊、電路或其他手段進行。在步驟110中,鑑定母本基因組為雜合的多個第一基因座。在一個實施方案中,在基因組範圍水平或在選擇的目的基因組基因座處在父親和母親的一部分基因分型上進行 該確定。在其他實施方案中,可以在分析母本樣品的過程中進行多個第一基因座的確定,這將在後面的章節描述。在步驟120中,確定覆蓋所述多個第一基因座的兩個母本單倍型中的每一個。如上文提到的,可以由直接測序獲得母本基因組。在其他實施方案中,可以在多個基因座處進行基因分型,然後使用預期具有相似基因組的某人的已知圖譜的基因組,例如,來自家族成員或來自相同或相似群體中共有的參照基因組。在一個實施方案中,可以首先對母本基因組的全部或部分進行步驟120,然後可以研究母本基因組以找到母親為雜合的基因座。一方面,沒有必要構建父親染色體的單倍型。然而,如果構建了父本單倍型,則可以根據測序結果獲得其他信息。一種這類其他信息包括這樣的事實可以對父母均為雜合的區域進行相對單倍型劑量分析。如果可獲得父本單倍型,則可獲得的另一種其他信息是涉及參與一條或多條父本染色體的減數分裂重組的信息,以及確定與這類多態性相關的疾病等位基因是否已傳遞給胎兒。在步驟130中,確定胎兒在所述多個第一基因座處從父親遺傳的等位基因。一些實施方案使用對父親為純合而對母親為雜合的基因組基因座(如步驟110中所提到的)。因此如果父親在該基因座處為純合的,則從父親遺傳的等位基因是已知的。確定父親為純合的基因座的父親的基因分型可以以本文所述的任何方式來確定。在一個實施方案中,多個第一基因座的確定可以基於父親和母親的基因分型來確定,以便找到父親為純合而母親為雜合的基因座。在另一個實施方案中,可以使用父本基因組的、為雜合的多個第二基因座,以確定在父親為純合的多個第一基因座處由胎兒遺傳的父本單倍型。例如,如果母本基因組在所述多個第二基因座處為純合的,則可以鑑定出在父本基因組中於所述多個第二基因座中的每一個處存在而在母本基因組中不存在的等位基因。然後,遺傳的父本單倍型可以被鑑定為具有所鑑定的等位基因的單倍型,並用於確定在所述多個第一基因座處從父親遺傳的等位基因。這些確定父親單倍型的方面將在下文進行更為詳細的討論。在步驟140中,分析獲自懷孕女性的生物樣品的多個核酸分子。所述樣品含有母本核酸和胎兒核酸的混合物。可以採集和接收母本生物樣品,用於分析。在一個實施方案中,使用母本血漿和血清。在其他實施方案中,可以使用母本血液、母本尿液、母本唾液、子宮灌洗液或從母本血液獲得的胎兒細胞。在一個實施方案中,分析核酸分子包括鑑定所述核酸分子在人類基因組中的位置,以及確定所述核酸分子在各個基因座處的等位基因。因此,一個實施方案可以利用從同一基因座確定的核酸分子的等位基因進行定量基因分型。可以使用允許確定核酸分子在母本生物樣品中的基因組位置和等位基因(用於基因型分型的信息)的任何方法。這類方法有一些描述於美國申請12/178,181和12/614350以及題目為「Size-Based Genomic Analysis (基於大小的基因組分析)」的申請中。在步驟150中,基於核酸分子的確定的等位基因,確定所述多個第一基因座中每一個的各自等位基因的量。在一個實施方案中,所述量可以是第一基因座處每種類型的等位基因的數量。例如,6個A和4個T。在另一個實施方案中,量可以是具有特定等位基因的核酸分子的大小分布。例如,相對量還可以包括具有特定基因型的片段的大小分布,所述基因型能夠傳達相對量的某長度的片段。這種相對量還可以提供關於胎兒基因組中存在哪種基因型的信息,因為胎兒片段傾向小於母本片段。量和方法的一些實例描述於美國申請12/178,181 和 12/614350 以及申請名稱為「Size-Based Genomic Analysis (基於大小的基因組分析)」的申請中。在一個實施方案中,某基因座的等位基因的相對量能夠提供關於胎兒遺傳了哪種基因型的信息(例如,在資料集達到足夠的統計學強度後)。例如,相對量可用於確定相對於某基因座處母親的基因型是否發生了序列失衡。上文引用的相關專利申請提供了檢測具體基因座或區域處的序列失衡的實施方案的實例。在步驟160中,比較所述多個第一基因座中多於一個基因座處的核酸分子的各自等位基因的相對量。在一些實施方案中,在比較之前,匯總在所述多個第一基因座的每個基因座處包含單倍型的每個等位基因的量。然後,可以將匯總的親本單倍型的量進行比較,以確定單倍型是過多表現、均等表現還是表現不足。在其他實施方案中,比較某基因座處等位基因的量,並使用多個基因座處的比較。例如,可以匯總分離值(例如,差異或比值),其可用於與截止值進行比較。這些實施方案的每一個都適用於本文所描述的任何比較步驟,在各種實施方案中,相對量可以是在具體基因座處具有具體等位基因的每個片段的數量的計數,來自具體單倍型上的任何基因座(或區域內的任何基因座)的片段的數量的計數,以及具體基因座或具體單倍型的計數(例如平均值)的統計值。因此,在一個實施方案中,所述比較可以是確定每個基因座處一個等位基因與另一個等位基因相比較的分離值(例如,不同或比值)。在步驟170中,基於所述比較,可以確定在由所述多個第一基因座覆蓋的基因組的一部分處未出生胎兒從母親遺傳的單倍型。在一個實施方案中,為研究哪條母本染色體被傳遞給胎兒,使用例如如上文提到的相對單倍型劑量(RHDO)方法。因為母親對所述第一基因座的每一個都是雜合的,所以所述第一基因座對應於第一基因座的基因組區域的兩個單倍型。如果樣品僅來自母親,則這些單倍型的相對劑量為1:1。偏離該比值或缺少從該比值的偏離可用於確定胎兒從母親(以及父親,這在下文有詳述)遺傳的單倍型。因此,對於給定的染色體或染色體區域,可以根據步驟130中產生的分析數據(例如,測序數據)尋找這些單倍型的組成型等位基因。由於分析了多個基因座並將其與母親的單倍型進行比較,所以基因座之間的序列可被歸於具體的單倍型。在一個實施方案中,如果數個基因座匹配一個具體的單倍型,則基因座之間的序列節段可被假定為與母本單倍型的序列節段相同。由於減數分裂重組的發生,由胎兒遺傳的最終單倍型可能由來源於這兩個同源染色體之一的『單倍型節段』的拼湊物組成。實施方案能夠檢測這種重組。可以檢測這類重組的解析度依賴已在父親和母親的組成型DNA中確定的遺傳標誌物的數量和分布,以及在隨後的生物信息學分析(利用例如SPRT)中使用的閾值。例如, 如果所述比較提示在第一組連續的基因座的每一個處從母親遺傳的等位基因對應於第一單倍型,則所述第一單倍型被確定為是針對對應於第一組基因座的基因組位置而遺傳的。如果第二組連續基因座提示遺傳了第二單倍型,則第二單倍型被確定為是針對對應於第二組基因座的基因組位置而遺傳的。在一個實施方案中,當分析多個基因座時,可以以更高的精度確定單倍型。例如,一個基因座的統計學數據可能無法確定,但是當與其他基因座的統計學數據組合時,可以確定遺傳了哪種單倍型。在另一個實施方案中,可以獨立地分析每個基因座,以進行分類,然後可以分析分類以提供針對給定區域遺傳了哪種單倍型的確定。在一個實施方案中,可以進行統計學步驟以確定相對單倍型劑量(例如,如果這些單倍型中的一個相對於另一個單倍型過多表現)。可以根據部分胎兒DNA濃度調整該統計學步驟的分類閾值。通常,較高的部分胎兒DNA濃度可以允許用較少的分子達到所述閾值。還可以根據希望在目的基因組或基因組區域上實現的成功分類的節段的數量調整所述分類閾值。返回參見圖1,在步驟180中,可以分析突變的胎兒基因組。例如,實施方案可用來搜索在具體群體中引起遺傳疾病的一組突變。可利用實施方案檢測的突變的實例可參見在線人類孟德爾遺傳(www. ncbi. nlm. nih. rov/omim/Retmorbid. cri)這些突變可以在步驟140-160中搜索或作為本文所述的單獨的步驟。例如,在父親是母親中不存在的一個或多個突變的攜帶者的家族中,那麼能夠根據母本生物樣品的分析數據(例如,測序數據)搜索到所述突變。除了檢測實際的突變之外,還可以尋找與父親或母親的突變體或野生型等位基因相關的多態性遺傳標誌物。例如,RHDO分析可以揭示,胎兒已從母親遺傳了已知攜帶疾病突變的單倍型。本發明的實施方案還可以用於非侵入性產前診斷由染色體區域缺失所引起的疾病,例如,東南亞(Southeast Asian)缺失引起的α-地中海貧血。在父親和母親都是缺失攜帶者的情況下,如果胎兒對於所述缺失是純合的,且如果對母本血漿DNA進行大規模平行測序,那麼母本血漿中來源於所述缺失區域的DNA序列的頻率應該有所下降。B.實例
這部分描述應用於母親為雜合的單核苷酸多態性(SNP)的(例如,方法100的)實施方案的實例。同一染色體上的SNP等位基因形成單倍型,由於母親的每條染色體都具有同源的一對,因此有兩個單倍型。為了說明如何進行這樣一種確定,考慮例如如圖2所顯示的3號染色體的一個節段。圖2示出了針對父母各自基因組密碼的具體節段的父親的兩個單倍型和母親的兩個單倍型。在該節段內發現5個SNP,其中對於這些SNP中的所有5個,父親和母親分別為純合的和雜合的。父親的兩個同源染色體具有相同的單倍型(Hap),即A-G-A-A-G(圖2中從上到下)。為了簡單起見,將父本單倍型稱為Hap I和Hap II,記住這兩個單倍型對於該5個SNP組是相同的。對母親而言,觀察到兩個單倍型,即Hap III,A-A-A-G-G和HapIV,G-G-G-A-A0該實例中的SNP可進一步分成兩種類型。圖3示出了本發明實施方案的兩種類型的SNP。A型由這樣的SNP組成其中父本等位基因與母本單倍型III上的等位基因相同。B型由這樣的SNP組成其中父本等位基因與母本單倍型IV上的等位基因相同。
這兩種類型的SNP可能需要略微不同的數學處理。因此,在A型情況下,胎兒遺傳單倍型III將導致母本血漿中單倍型III相對於單倍型IV的過多表現(圖4A)。例如,為了方便討論,僅查看一種SNP 410,從父親遺傳了等位基因A,並且如果從母親遺傳了 HapIII,則胎兒將向樣品貢獻兩個A等位基因,這將會導致A的過多表現。如果胎兒遺傳了單倍型IV,則不會觀察到過多表現,因為在A和G位於該基因座的情況下,胎兒在該基因座處也是雜合的。另一方面,在B型情況下,胎兒遺傳單倍型III將導致母本血漿中單倍型III和單倍型IV的均等表現(圖4B)。例如,查看SNP 420,從父親遺傳了 G且A作為Hap III的一部分將導致胎兒在SNP 420處貢獻等量的A和G,如同母親一樣。如果胎兒遺傳了單倍型IV,則如同上文的討論所表明的,將觀察到過多表現。圖5A和5B示出了比較每個基因座片段的相對量(例如,計數)的分析,以及比較的結果是否將具體單倍型歸為遺傳的還是非遺傳的。其中有匹配父親和母親的這些基因型構型(例如,A型或B型情況)之一的SNP的任何基因組位置可用於該實例。根據母本血漿測序數據,可以集中於對應於SNP具體等位基因的測序分子的數量。SPRT分析(或其他比較法)可用於確定在這些等位基因間是否有任何等位基因失衡(Lo Y D et al Proc NatlAcad Sci USA 2007;104:13116-13121)。圖5A示出了對A型SNP的分析。如圖所示,對於每個SNP,相對量(例如,如分離值所限定的)與截止值的SPRT比較提供了分類。在一個實施方案中,如果達到SPRT的分類閾值,則可斷定胎兒遺傳了具體母本單倍型。然後可以重置SPRT分析的計數。接著,分析可以從端粒至著絲粒的方向或著絲粒至端粒的方向移動至與所需基因型構型匹配的鄰近SNP上。並且新的SPRT分析可從該下一個SNP開始。另一方面,在一個實施方案中,如果SPRT分類沒有用SNP到達,那麼我們也可以以相似的方式移動至鄰近的SNP,然後再次進行SPRT,除了下一個SNP的計數被加到之前的SNP之外。該過程可以繼續直到達到分類閾值。圖5A和圖5B示出了對A型和B型分析運行該過程。在一個實施方案中,將分類匯總分析以組成區域的總分類。例如,如果獲得了第一組SNP和下一組SNP的分類,則可以比較兩組的分類,以查看分類是否一致。
圖6不出了改變SPRT分類似然比的影響(Zhou W et al. Nat Biotechnol2001; 19:78-81;Karoui NE et al. Statist Med 2006;25:3124-33)。通常,較低的分類似然比,比如8,可以允許更容易地進行分類。這能在基因組內產生更大數量的分類區域。然而,預期很多這樣的區域可能被錯分。另一方面,較高的分類似然比,比如1200,可能僅允許當已對較多的SNP進行評分時進行分類。這能在基因組內產生較小數量的分類區域。當與使用較低分類閾值的情況相比時,預期錯分區域的數量和比例會更低。在一個實施方案中,只有當兩個連續的SPRT分類導致相同的單倍型(稱為「二連續域(two consecutive blocks) 」算法)時才進行分類。一方面,「二連續域」算法可以增加分類的精度。在一些實施方案中,對於任何一段序列,實施方案可以首先進行A型SNP的SPRT分析,然後進行B型SNP的另一 SPRT分析。在一個實施方案中,可以考慮這樣一段序列的情況,對該段序列而言,A型和B型SNP形成兩交錯的基因界標組(例如,SNP)。在使用「二連續域」算法的實施方案中,兩域可以為不同的類型。來自A型和B型分析的SPRT結果可以允許核對其分類結果的一致性或不一致性。為了提高分類精度,一個實施方案(「交錯法」)只有當給定的基因組區域的A型和B型分析能夠產生一致的結果時才進行分類。如果兩種類型分析產生不一致的結果,我們可以查看緊鄰該區域的兩個連續分類區域的分類結果,一個區域位於端粒端,另一個區域位於著絲粒端。如果這兩個連續的區域產生一致的結果,那麼我們可以將第一區域分類為具有這兩個區域的連續單倍型。如果這兩個連續的區域沒有產生一致的結果,那麼我們可以移動到下兩個連續的區域直到觀察到一致性。該方案的一個變型是僅在一個方向移動,並將下一個或兩個或甚至更多個連續區域的分類結果作為所關注的最初區域的結果。一般原則是使用鄰近基因組區域的分類結果來證實具體區域的分類結果。III.胎兒遺傳的父本等位基因的確定圖7是確定懷孕女性的未出生胎兒從父親遺傳的基因組的至少一部分的方法700的流程圖。方法700分析獲自懷孕女性的生物樣品的核酸分子(片段),以確定胎兒的基因組。所述樣品含有母本核酸和胎兒核酸的混合物。在步驟710中,分析來自生物樣品的多個核酸分子的每一個,以鑑定所述核酸分子在人類基因組中的位置,並確定所述核酸分子的等位基因類型。因此,在一個實施方案中,可以確定具體位置(基因座)處的核酸分子的基因型。上文和其他地方所描述任何一種方法都可以用於該分析。在步驟720中,確定多個第一基因座,在所述基因座處,父本基因組為雜合的而母本基因組為純合的。在一個實施方案中,通過確定父本和母本基因組獲得所述多個第一基因座。可採集基因組中父親為雜合的而母親為純合的基因組基因座。在步驟730中,基於所述多個第一基因座處的確定的基因型,確定在由所述多個第一基因座覆蓋的基因組的一部分處未出生胎兒從父親遺傳的單倍型。在一個實施方案中,在分析數據(例如,測序數據)中尋找父親具有而母親的基因組中卻沒有的這些基因座中每一個基因座的等位基因。這些等位基因的組合可以指示胎兒從父親遺傳的染色體的單倍型。在另一個實施方案中,如果父親基因組中的每個目的染色體或染色體區域的單倍型是已知的,則還可以確定父親精子發生過程中減數分裂重組發生的地方。因此,在胎兒和父親之間,當父系遺傳的染色體中的一段DNA的單倍型不同時,則可以觀察到父本減數分裂重組。當分析數據(例如,測序數據)用於通過與基因多態性的連鎖分析(linkageanalysis)進行遺傳疾病的產前診斷時,包含這種重組信息可能是有用的。IV.父親和母親對於某一基因組區域均為雜合的實施方案可以解決這樣的情況,其中父親和母親對於某一基因組區域均為雜合的。這種情況在父親和母親有血緣的家族中尤其相關。當疾病與已產生的顯性突變相關時,大的奠基者效應可能也是相關的。在這種情況下,預期如果未出生胎兒的父親和母親均是突變基因的攜帶者,那麼攜帶突變拷貝的基因的染色體的單倍型必然是相同的,除非發生減數分裂重組事件。這種類型的分析尤其適用於常染色體隱性疾病,諸如囊性纖維化、β -地中海貧血、鐮狀細胞貧血和血紅蛋白E病。圖8是按照本發明的實施方案確定母親和父親均為雜合的區域內未出生胎兒的基因組的至少一部分的方法800的流程圖。
在步驟810中,確定多個第一基因座,在所述基因座處,父親和母親均為雜合的。在一個實施方案中,可以通過本文提到的任何方法確定所述第一基因座。例如,可以對親本基因組的全部或區域進行測序,或者對不同的部分進行基因分型以找到第一基因座。因此,在所述第一多個基因座處的兩個父本單倍型的每一個和兩個母本單倍型的每一個都是已知的。舉例來說,圖9示出了父親和母親的、在具體基因組區域均為雜合的單倍型。如圖所示,父母在區域I內均具有突變基因(等位基因)。具體而言,父親的Hap I和母親的HapIII具有突變基因。還如圖所示,父親和母親每人都具有攜帶野生型基因拷貝的其他染色體拷貝。具體而言,父親的Hap II和母親的Hap IV具有野生型基因。因此,本實例在確定胎兒是否遺傳了突變基因中具有相關性。父親和母親的攜帶野生型基因的染色體在緊鄰該基因處具有相同的單倍型,但是在離該基因更遠一點的位置可能具有不同的單倍型。由於該染色體可能具有不同的祖先來源,所以該染色體在父親和母親之間的整個染色體中不大可能具有相同的單倍型。在步驟820中,確定多個第二基因座,在所述基因座處,父親為雜合的而母親為純合的。如圖所示,所述多個第一和第二基因座位於同一染色體上。區域2示出了這樣的第二基因座。可以選擇區域2,使得對於該區域內的一個或多個SNP而言,父親是雜合的,而在該區域內母親為純合的。在步驟830中,可以分析來自懷孕女性樣品的片段,以鑑定在人類基因組中的位置和基因型。所述位置可用於確定片段(核酸分子)是否包括所述第一基因座中的一個或多個或所述第二基因座中的一個或多個。然後,該信息可用於確定從父親遺傳的單倍型和從母親遺傳的單倍型。在步驟840中,通過分析所述第二基因座中的至少一個基因座處的來自生物樣品的多個核酸分子的確定的基因型,來確定胎兒遺傳了兩個父本單倍型的哪一個。例如,可以根據母本生物樣品的分析數據(例如,從步驟710產生的位置和基因型)找到僅存在於父未基因組而不存在於母未基因組中的SNP等位基因,諸如圖9中由*標記的等位基因T和由+標記的等位基因Α。如同方法700可以進行的,如果從母本血漿檢測到由*標記的等位基因Τ,那麼這表示,胎兒從父親遺傳了單倍型II (Hap II)。相反,如果從母本血漿檢測到由+標記的等位基因A,那麼這表示,胎兒從父親遺傳了 Hap I。在步驟850中,比較所述多個第一基因座中的多於一個基因座處的確定的核酸分子基因型的相對量。在一個實施方案中,匯總每一基因座處的量,並比較母本單倍型的相對量。相對量可以指計算的數量、大小分布以及可以傳達有關哪個基因型位於胎兒基因組中具體基因座處信息的任何其他參數。在步驟860中,基於確定為由胎兒遺傳的父親單倍型,且基於相對量的比較,確定在由所述多個第一基因座所覆蓋的基因組的一部分處,未出生胎兒從母親遺傳的單倍型。因此,考慮到區域2中由胎兒遺傳的父本單倍型,可以根據母本生物樣品的分析數據對區域I中的SNP進行RHDO分析(例如,如上文所描述的),以確定胎兒遺傳了兩個母本單倍型中的哪一個。在一個實施方案中,假設當這些區域從父母傳遞給胎兒時,區域I和2之間沒有重組。例如,考慮當通過區域2分析胎兒已被確定已經從父親遺傳了 Hap I的情況。貝U 胎兒從母親遺傳了 Hap III (其在區域I與Hap I相同)將導致母本血漿中Hap III相對於Hap IV過多表現。相反地,如果胎兒從母親遺傳了 Hap IV,則在母本血漿中將觀察到HapIII和Hap IV的均等表現。作為另一個實例,考慮當通過區域2分析胎兒已被確定已經從父親遺傳了 Hap II的情況。則胎兒從母親遺傳了 Hap IV(其在區域I與Hap II相同)將導致母本血漿中HapIV相對於Hap III過多表現。相反地,如果胎兒從母親遺傳了 Hap III,則在母本血漿中將觀察到Hap III和Hap IV的均等表現。在以前的部分中,我們利用從母本血漿DNA測序獲得的數據以及胎兒父母的基因型信息推導出胎兒基因組和部分胎兒DNA濃度。在下面的部分中,我們描述在沒有母本和父本基因型/單倍型現有信息的情況下推導部分胎兒DNA濃度和胎兒基因型的實施方案。V.部分胎兒DNA濃度的確定在一些實施方案中,任選的步驟是確定部分胎兒DNA濃度。在各種方面中,該部分濃度可以指導分析的量(例如,所需的測序量)或允許對給定的數據量(例如,基因組測序覆蓋深度)估計分析的精度。部分胎兒DNA濃度的確定還可以用於確定截止值,從而確定遺傳的單倍型和/或基因型的分類。在一個實施方案中,可以通過採集對父親和母親而言均為純合但具有不同的等位基因的基因座的分析數據(例如,如在步驟140和710中可以獲得的)來確定部分胎兒DNA濃度。例如,對於具有兩個等位基因即A和G的SNP,父親可以為AA,母親可以為GG,反之亦然。對於這樣的基因座,胎兒應是肯定雜合子。在上文的一個實例中,胎兒基因型應是AG,母本樣品中等位基因A的比例可用於確定部分胎兒DNA濃度。在另一個實施方案中,可以進行統計學分析,以確定母親為純合的而胎兒為雜合的基因座。以這種方式,無需關於母本基因組或父本基因組的現有信息。作為採集分析數據的備選方案,還可以在一組多態性遺傳標誌物上通過另一種方法如PCR測定的使用、數字PCR測定或基於質譜的測定來確定部分胎兒DNA濃度(Lun FMF et al Clin Chem 2008;54:1664-1672)。另一備選方案是利用在胎兒和母親之間表現出不同DNA甲基化的一個或多個基因組基因座(Poon LLM et al. Clin Chem2002;48:35-41;Chan KCA et al. Clin Chem 2006;52:2211-2218;美國專利 6,927,028)。另一備選方案是利用從參照群體如相似妊娠期確定的近似的部分胎兒DNA濃度。然而,由於部分胎兒DNA濃度在樣品與樣品之間不同,所以該後面的方法的精度預期比具體測量受試樣品的濃度低。A.確定肯定雜合子的部分濃度在胎兒是肯定雜合子的實施方案中,可以利用一系列下述計算(例如,利用大規模平行測序)確定部分胎兒DNA濃度。P為母本基因組缺乏的胎兒等位基因的計數。q為其他等位基因即母本和胎兒基因組共有的等位基因的計數。通過以下方程給出部分胎兒DNA濃度
權利要求
1.確定懷孕女性的未出生胎兒的基因組的至少一部分的方法,所述胎兒有父親和身為所述懷孕女性的母親,並且所述父親的父本基因組具有父本單倍型,所述母親的母本基因組具有母本單倍型,所述方法包括 分析獲自所述懷孕女性的生物樣品的多個核酸分子,其中所述生物樣品含有母本核酸和胎兒核酸的混合物,其中分析核酸分子包括 鑑定所述核酸分子在人類基因組中的位置;以及 確定所述核酸分子的各自的等位基因; 確定在多個第一基因座中的每一個處所述胎兒從所述父親遺傳的父本等位基因,其中所述母本基因組在所述多個第一基因座處為雜合的; 確定所述多個第一基因座的兩個母本單倍型中的每一個; 基於所述核酸分子的確定的等位基因,計算機系統確定在所述多個第一基因座中的每一個處的各自等位基因的量; 比較在所述多個第一基因座中的多於一個基因座處的所述核酸分子的各自等位基因的相對量;以及 基於所述比較,確定在由所述多個第一基因座所覆蓋的基因組的一部分處所述未出生胎兒從所述母親遺傳了兩種母本單倍型中的哪一種。
2.如權利要求I所述的方法,其中所述相對量包括所述核酸分子的大小分布。
3.如權利要求I所述的方法,其中基於所述來自生物樣品的多個核酸分子的分析,確定所述多個第一基因座的兩個母本單倍型中的每一個。
4.如權利要求I所述的方法,其中確定在所述多個第一基因座中的每一個處從父親遺傳的等位基因包括 確定所述父本基因組的、為雜合的多個第二基因座,其中所述母本基因組在所述多個第二基因座處為純合的; 鑑定所述多個核酸分子中在所述父本基因組中於所述多個第二基因座中的各個基因座處存在而在所述母本基因組中不存在的等位基因; 將遺傳的父本單倍型鑑定為具有鑑定的等位基因的單倍型;以及 利用所述遺傳的父本單倍型確定在所述多個第一基因座處從所述父親遺傳的等位基因。
5.如權利要求I所述的方法,其中確定所述多個第一基因座的兩個母本單倍型中的每一個包括 基於各自基因座處所述核酸分子的確定的各自等位基因的量,鑑定在所述多個第一基因座中的一個或多個處所述母本基因組的等位基因; 鑑定多個參照單倍型;以及 將所鑑定的所述母本基因組的等位基因與所述多個參照單倍型的相應基因座中的等位基因進行比較,以鑑定所述兩個母本單倍型。
6.如權利要求5所述的方法,其中確定所述多個第一基因座的兩個母本單倍型中的每一個還包括 將所鑑定的所述母本基因組的等位基因與所述多個參照單倍型反覆進行比較,直到唯一鑑定出所述兩個母本單倍型中的每一個。
7.如權利要求I所述的方法,其中基於所述來自生物樣品的多個核酸分子的分析,確定在所述多個第一基因座中的每一個處從所述父親遺傳的等位基因,並且其中確定在所述多個第一基因座中的每一個處從父親遺傳的等位基因包括 確定所述胎兒基因組為雜合的而所述母本基因組為純合的多個第二基因座; 通過以下方式確定在所述多個第二基因座中的每一個處從所述父親遺傳的等位基因 確定在所述多個第二基因座的各個基因座處所述核酸分子的確定的各自等位基因的相對量;以及 將具有最小相對量的等位基因鑑定為在所述各個基因座處遺傳的等位基因; 鑑定多個參照單倍型; 利用在所述多個第二基因座中的每一個處從所述父親遺傳的等位基因來確定從父親遺傳了哪種參照單倍型,確定的單倍型包括所述多個第一基因座;以及 根據確定為從所述父親遺傳的單倍型確定在所述多個第一基因座處從所述父親遺傳的等位基因。
8.如權利要求7所述的方法,其中確定從所述父親遺傳了哪種參照單倍型包括 將確定為在所述多個第二基因座中的每一個處從所述父親遺傳的等位基因與所述多個參照單倍型的相應基因座中的等位基因反覆進行比較,直到唯一鑑定出從所述父親遺傳的參照單倍型。
9.如權利要求7所述的方法,其中將具體基因座確定為所述多個第二基因座中的一個基因座,在所述一個基因座處,所述胎兒基因組為雜合的而所述母本基因組為純合的,包括 確定所述具體基因座處等位基因的預測計數數量的截止值,所述截止值預測所述母本基因組是否為純合的以及所述胎兒基因組是否為雜合的,其中基於所述具體基因座處純合性和雜合性的不同組合的計數數量的統計學分布確定所述截止值; 基於所述來自生物樣品的核酸分子的分析,檢測所述具體基因座處的第一等位基因和第二等位基因; 基於所述來自生物樣品的多個核酸分子的測序,確定所述第一等位基因的實際計數的數量;以及 當所述實際計數的數量小於所述截止值時,確定所述胎兒基因組對於所述第一等位基因和第二等位基因是雜合的,並且所述母本基因組對於所述第二等位基因是純合的。
10.如權利要求9所述的方法,其中所述統計學分布依賴於來源於所述胎兒的生物樣品的核酸分子的部分濃度。
11.如權利要求10所述的方法,其中所述統計學分布還依賴於對應於所述具體基因座的所述多個核酸分子的數量。
12.如權利要求I所述的方法,其中確定在所述多個第一基因座中的每一個處從所述父親遺傳的等位基因包括 通過分析所述父本基因組確定所述父本基因組的、為純合的多個第二基因座,其中所述多個第一基因座是所述多個第二基因座; 確定在所述多個第一基因座中的每一個處所述父本基因組的等位基因;以及將所述多個第一基因座處的各自等位基因指定為從所述父親遺傳的等位基因。
13.如權利要求I所述的方法,其中分析核酸分子包括對所述核酸分子的至少一部分實施至少一項選自以下的技術大規模平行測序、微陣列、雜交、PCR、數字PCR和質譜。
14.如權利要求I所述的方法,還包括 對於所述多個第一基因座的鄰近基因座第一子集中的每一個,確定對於包括所述鄰近基因座第一子集的第一基因組部分而言,所述未出生胎兒從所述母親遺傳了哪種單倍型,其中確定哪種單倍型包括 (a)確定與所述連續基因座第一子集的兩個母本單倍型之一匹配的所述核酸分子的確定的各自等位基因的第一量; (b)確定與所述連續基因座第一子集的兩個母本單倍型中的另一個匹配的所述核酸分子的確定的各自等位基因的第二量;以及 (c)基於所述第一量與所述第二量的比較確定遺傳的所述第一基因組部分的單倍型。
15.如權利要求14所述的方法,其中所述第一量與所述第二量的比較利用序貫概率比檢驗。
16.如權利要求14所述的方法,其中確定所述第一量與所述第二量均相對於所述鄰近基因座第一子集的位置相繼進行。
17.如權利要求14所述的方法,其中所述鄰近基因座第一子集被進一步分成兩個亞組,其中所述第一亞組由所述父親的基因型與所述母親的第一單倍型的組成型基因型匹配的基因座組成,且所述第二亞組由所述父親的基因型與所述母親的第二單倍型的組成型基因型匹配的基因座組成,並且其中對所述兩個亞組單獨進行(a)-(c),所述方法還包括 基於這兩個亞組的(C)結果確定遺傳的所述第一基因組部分的單倍型。
18.如權利要求I所述的方法,還包括 通過以下確定所述胎兒從所述母親遺傳了突變 分析所述胎兒遺傳的所述母親的單倍型;以及 鑑定所述遺傳的單倍型中的突變。
19.如權利要求I所述的方法,其中分析所述來自生物樣品的多個核酸分子包括 富集所述生物樣品的基因組靶區域內的核酸,和/或 優先對所述靶區域內的核酸進行測序,並且其中多個第一基因座位於所述靶區域內。
20.如權利要求19所述的方法,其中所述靶區域被鑑定為含有大量的信息性基因座。
21.如權利要求19所述的方法,其中所述測序僅對所述靶區域內的.核酸進行測序。
22.確定懷孕女性的未出生胎兒的基因組的至少一部分的方法,所述胎兒有父親和身為所述懷孕女性的母親,所述父親的父本基因組具有父本單倍型,所述母親的母本基因組具有母本單倍型,所述方法包括 分析獲自所述懷孕女性的生物樣品的多個核酸分子,其中所述生物樣品含有母本核酸和胎兒核酸的混合物,並且其中分析核酸分子包括 鑑定所述核酸分子在人類基因組中的位置;以及 確定所述核酸分子的各自的等位基因; 確定所述父本基因組的、為雜合的多個第一基因座,其中所述父本基因組獲自所述未出生胎兒的所述父親,並且其中所述母本基因組在所述多個第一基因座處為純合的;以及基於在所述多個第一基因座處的確定的各自的等位基因,計算機系統確定在由所述多個第一基因座所覆蓋的基因組的一部分處所述未出生胎兒從所述父親遺傳的單倍型。
23.如權利要求22所述的方法,其中確定所述未出生胎兒從所述父親遺傳的單倍型包括 鑑定所述多個核酸分子中在所述父本基因組中於所述多個第一基因座中的各個基因座處存在而在所述母本基因組中不存在的等位基因;以及 將遺傳的父本單倍型鑑定為具有鑑定的等位基因的單倍型。
24.如權利要求I所述的方法,還包括 通過以下確定所述胎兒從所述父親遺傳的突變 分析所述胎兒遺傳的所述父親的單倍型;以及 鑑定遺傳的單倍型中的突變。
25.確定懷孕女性的未出生胎兒的基因組的至少一部分的方法,所述胎兒有父親和身為所述懷孕女性的母親,所述父親的父本基因組具有父本單倍型,所述母親的母本基因組具有母本單倍型,所述方法包括 確定所述父本基因組的、為雜合的多個第一基因座,其中所述父本基因組獲自所述未出生胎兒的所述父親,並且其中所述母本基因組獲自所述未出生胎兒的母親,並在所述多個第一基因座處也為雜合的,並且其中在所述多個第一基因座處兩個父本單倍型中的每一個和兩個母本單倍型中的每一個都是已知的; 確定父本基因組的、為雜合的一個或多個第二多個基因座,其中所述母本基因組在所述第二基因座處為純合的;並且其中所述多個第一基因座和所述第二基因座位於同一染色體上; 分析獲自所述懷孕女性的生物樣品的多個核酸分子,其中所述生物樣品含有母本核酸和胎兒核酸的混合物,並且其中分析核酸分子包括 鑑定所述核酸分子在人類基因組中的位置;以及 確定所述核酸分子的各自的等位基因; 通過分析在所述第二基因座中的至少一個處的所述來自生物樣品的多個核酸分子的確定的各自等位基因,來確定所述胎兒遺傳了兩個父本單倍型的哪一個; 計算機系統比較在所述第一多個基因座中多於一個基因座處的所述核酸分子的確定的各自等位基因的相對量;以及 基於確定為由所述胎兒遺傳的父本單倍型並基於所述相對量的比較,確定在由所述多個第一基因座所覆蓋的基因組的一部分處所述未出生胎兒從所母親遺傳的單倍型。
26.確定懷孕女性的未出生胎兒的基因組的至少一部分的方法,所述胎兒有父親和身為所述懷孕女性的母親,所述父親的父本基因組具有父本單倍型,所述母親的母本基因組具有母本單倍型,所述方法包括 分析獲自所述懷孕女性的生物樣品的多個核酸分子,其中所述生物樣品含有母本核酸和胎兒核酸的混合物,並且其中分析核酸分子包括 鑑定所述核酸分子在人類基因組中的位置;以及 確定所述核酸分子的各自的等位基因; 確定所述胎兒基因組為雜合的而所述母本基因組為純合的多個第一基因座;通過以下方式,計算機系統確定在所述多個第一基因座中的每一個處從所述父親遺傳的等位基因 確定所述第二基因座的各個基因座處所述核酸分子的確定的各自等位基因的相對量;以及 將具有最小相對量的等位基因鑑定為在所述各個基因座處遺傳的等位基因; 鑑定多個參照單倍型;以及 利用在所述多個第一基因座中的每一個處從所述父親遺傳的等位基因來確定在由所述多個第一基因座所覆蓋的基因組的一部分處從所述父親遺傳了哪種參照單倍型。
27.如權利要求26所述的方法,其中確定從所述父親遺傳了哪種參照單倍型包括 將確定為在所述多個第二基因座種的每一個處從所述父親遺傳的等位基因與所述多個參照單倍型的相應基因座中的等位基因反覆進行比較,直到唯一鑑定出從父親遺傳的參照單倍型。
28.如權利要求26所述的方法,其中將具體基因座確定為所述胎兒基因組為雜合的而所述母本基因組為純合的所述多個第一基因座之一包括 確定所述具體基因座處等位基因的預測計數數量的截止值,所述截止值預測所述母本基因組是否為純合的以及所述胎兒基因組是否為雜合的,其中基於所述具體基因座處純合性和雜合性的不同組合的計數數量的統計學分布確定所述截止值; 基於來自所述生物樣品的所述核酸分子的分析,檢測所述具體基因座處的第一等位基因和第~■等位基因; 基於來自所述生物樣品的所述多個核酸分子的測序,確定第一等位基因的實際計數的數量;以及 當所述實際計數的數量小於所述截止值時,確定所述胎兒基因組對於所述第一等位基因和第二等位基因是雜合的,並且所述母本基因組對於所述第二等位基因是純合的。
29.鑑定懷孕女性的未出生胎兒的基因組中的新生突變的方法,所述胎兒有父親和身為所述懷孕女性的母親,所述方法包括 接受獲自所述懷孕女性的生物樣品的多個核酸分子測序的測序結果,其中所述生物樣品含有母本核酸和胎兒核酸的混合物。
鑑定所述測序的核酸分子中的每一個在人類基因組中的位置; 對於所述位置的至少一部分的每一個,確定所述位置處的母本序列和父本序列; 計算機系統鑑定所述多個核酸分子中在確定的母本或父本序列中不存在的第一序列; 確定所述生物樣品中所述第一序列的第一部分濃度; 利用所述胎兒從其父親遺傳的、存在於所述父本基因組中但不存在於所述母親基因組中的第二序列,確定所述生物樣品中胎兒核酸的第二部分濃度;以及 如果所述第一和第二部分濃度大致相同,則將所述第一序列歸為新生突變。
30.如權利要求29所述的方法,其中所述第二序列存在於Y染色體上,或者是基因多態性,或者是單核苷酸多態性,或者是插入-缺失多態性。
31.鑑定懷孕女性的未出生胎兒的基因組中的新生突變的方法,所述胎兒有父親和身為所述懷孕女性的母親,所述方法包括接受獲自所述懷孕女性的生物樣品的多個核酸分子測序的測序結果,其中所述生物樣品含有母本核酸和胎兒核酸的混合物。
鑑定所述測序的核酸分子中的每一個在人類基因組中的位置; 對於所述位置的至少一部分的每一個,確定所述位置處的母本序列和父本序列; 計算機系統鑑定所述多個核酸分子中在確定的母本或父本序列中不存在的第一序列; 確定所述生物樣品中所述第一序列的第一部分濃度; 利用在所述生物樣品中胎兒來源的和母系來源的核酸之間表現出不同的後生狀態的核酸分子,確定所述生物樣品中胎兒核酸的第二部分濃度;以及 如果所述第一和第二部分濃度大致相同,則將所述第一序列歸為新生突變。
32.如權利要求31所述的方法,其中所述不同的後生狀態由不同的DNA甲基化模式反映。
33.如權利要求32所述的方法,其中所述不同的DNA甲基化模式包括RAS相關結構域家族lA(RASSFlA)或羧化全酶合成酶(生物素(丙醯輔酶A羧化酶(ATP水解))連接酶(HLCS)基因。
34.確定採自懷孕女性的生物樣品中胎兒DNA的部分濃度的方法,所述胎兒有父親和身為所述懷孕女性的母親,其中所述生物樣品含有母本核酸和胎兒核酸的混合物,所述方法包括 分析來自所述生物樣品的多個核酸分子,其中分析核酸分子包括 鑑定所述核酸分子在人類基因組中的位置;以及 確定所述核酸分子的各自的等位基因; 計算機系統確定一個或多個第一基因座,其中所述胎兒基因組在每一個第一基因座處均為雜合的,使得所述胎兒基因組在所述第一基因座處具有各自的第一和第二等位基因,並且其中母本基因組在每一個第一基因座處均為純合的,使得所述母本基因組在所述第一基因座處具有兩個各自的第二等位基因,所述第一等位基因不同於所述第二等位基因,其中將具體基因座確定為一個或多個第一基因座之一包括 確定所述具體基因座處各自第一等位基因的預測計數數量的截止值,所述截止值預測所述母本基因組是否為純合的以及所述胎兒基因組是否為雜合的,其中基於所述具體基因座處純合性和雜合性的不同組合的計數數量的統計學分布確定所述截止值; 基於所述多個核酸分子的分析,檢測所述具體基因座處的各自的第一等位基因和各自的第二等位基因; 基於來自所述生物樣品的所述多個核酸分子的分析,確定所述各自的第一等位基因的實際計數的數量;以及 當所述實際計數的數量小於所述截止值時,確定所述具體基因座為所述第一基因座之 對於所述第一基因座中的至少一個 確定所述各自的第一等位基因計數的第一數量P和所述各自的第二等位基因計數的第二數量Q ;以及 基於所述第一和第二數量計算所述部分濃度。
35.如權利要求34所述的方法,其中所述部分濃度被確定為2xp/(p+q)。
36.如權利要求34所述的方法,其中為多個第一基因座確定P和Q,並且其中所述部分濃度f被確定為
37.如權利要求34所述的方法,其中確定所述截止值包括確定最大和最小部分濃度的統計學分布。
38.確定已從採自懷孕女性的生物樣品測序的胎兒基因組比例的方法,所述胎兒有父親和身為所述懷孕女性的母親,其中所述生物樣品含有母本核酸和胎兒核酸的混合物,所述方法包括 接受獲自所述懷孕女性的所述生物樣品的多個核酸分子測序的測序結果; 分析所述測序結果,分析核酸分子包括 鑑定所述核酸分子在人類基因組中的位置;以及 確定所述核酸分子的各自的等位基因; 確定多個第一基因座,其中所述胎兒基因組在所述多個第一基因座中的每一個處均為雜合的,使得所述胎兒基因組在所述基因座處具有各自的第一和第二等位基因,並且其中母本基因組在所述多個第一基因座中的每一個處均為純合的,使得母本基因組在所述基因座處具有兩個各自的第二等位基因,所述第一等位基因不同於所述第二等位基因; 計算機系統確定所述多個第一基因座中從所述測序結果檢測到各自第一等位基因的基因座的比例,以及 基於該比例,確定已從所述生物樣品測序的所述胎兒基因組的比例。
39.如權利要求38所述的方法,其中確定所述多個第一基因座包括 確定所述父本基因組對於在所述多個第一基因座中的每一個處的所述各自的第一等位基因為純合的,以及確定所述母本基因組對於在同一基因座處的所述各自的第二等位基因為純合的。
40.如權利要求38所述的方法,其中將具體基因座確定為所述多個第一基因座之一包括 確定所述具體基因座處各自的第一等位基因的預測計數數量的截止值,所述截止值預測所述母本基因組是否為純合的以及所述胎兒基因組是否為雜合的,其中基於所述具體基因座處純合性和雜合性的不同組合的計數數量的預期分布確定所述截止值; 基於所述測序結果的分析,檢測所述具體基因座處的各自的第一和第二等位基因; 基於來自所述生物樣品的所述多個核酸分子的測序,確定所述各自的第一等位基因的實際計數的數量;以及 當所述實際計數的數量小於所述截止值時,確定所述胎兒基因組對於所述各自的第一和第二等位基因是雜合的,並且所述母本基因組對所述各自的第二等位基因是純合的。
41.如權利要求38所述的方法,其中至少兩個基因座的所述第一等位基因彼此不同。
42.確定採自懷孕女性的生物樣品中胎兒DNA的部分濃度的方法,所述胎兒有父親和身為所述懷孕女性的母親,其中所述生物樣品含有母本核酸和胎兒核酸的混合物,所述方法包括 富集獲自所述懷孕女性的所述生物樣品的靶區域內的核酸分子; 對所述富集的生物樣品的多個核酸分子進行測序,所述測序對所述靶區域是特異性的,其中分析所述測序結果以 鑑定所述核酸分子在人類基因組靶區域中的位置;以及 確定所述核酸分子的各自的等位基因; 確定一個或多個第一基因座,其中所述胎兒基因組在每一個第一基因座處均為雜合的,使得所述胎兒基因組在所述第一基因座處具有各自的第一和第二等位基因,並且其中母本基因組在每一個第一基因座處均為純合的,使得所述母本基因組在所述第一基因座處具有兩個各自的第二等位基因,所述第一等位基因不同於所述第二等位基因; 對於所述第一基因座中的至少一個 確定所述各自的第一等位基因計數的第一數量P和所述各自的第二等位基因計數的第二數量Q ;以及 基於所述第一和第二數量確定所述部分濃度。
43.如權利要求42所述的方法,其中確定所述一個或多個第一基因座包括 確定所述父本基因組對於在所述多個第一基因座中的每一個處的所述各自的第一等位基因為純合的,以及確定所述母本基因組對於在同一基因座處的所述各自的第二等位基因為純合的。
44.如權利要求42所述的方法,其中將具體基因座確定為一個或多個第一基因座包括 確定所述具體基因座處所述各自的第一等位基因的預測計數數量的截止值,所述截止值預測所述母本基因組是否為純合的以及所述胎兒基因組是否為雜合的,其中基於所述具體基因座處純合性和雜合性的不同組合的計數數量的統計學分布確定所述截止值; 基於所述測序結果的分析,檢測所述具體基因座處的所述各自的第一和第二等位基因; 基於來自所述生物樣品的所述多個核酸分子的測序,確定所述各自的第一等位基因的實際計數的數量;以及 當所述實際計數的數量小於所述截止值時,確定所述具體基因座為所述第一基因座之O
全文摘要
提供了確定胎兒基因組的至少一部分的系統、方法和裝置。可以分析來自母本樣品(母本和胎兒DNA)的DNA片段以鑑定某些基因座處的等位基因。綜合分析這些基因座處各自等位基因的DNA片段的量,以確定這些基因座的單倍型的相對量,並確定從親本基因組遺傳了哪種單倍型。可以分析親本為純合和雜合的特定組合的基因座,以確定胎兒基因組的區域。可以使用群體中共有的參照單倍型,同時分析母體樣品的DNA片段,以確定母本和父本基因組。還提供了突變、母本樣品中部分胎兒DNA濃度以及母本樣品測序覆蓋度比例的確定。
文檔編號C12Q1/68GK102770558SQ201080059486
公開日2012年11月7日 申請日期2010年11月5日 優先權日2009年11月5日
發明者盧煜明, 查爾斯·坎特, 趙慧君, 陳君賜 申請人:塞昆納姆股份有限公司, 香港中文大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀