新四季網

通過克隆性測序的高解析度、高通量hla基因分型的製作方法

2023-04-29 02:45:56 2

專利名稱:通過克隆性測序的高解析度、高通量hla基因分型的製作方法
通過克隆性測序的高解析度、高通量HLA基因分型
背景技術:
I類和II類HLA基因座是人類基因組中最為多態性的基因,拼綴多態性的複雜模 式主要定位於II類基因的外顯子2中以及I類基因的外顯子2和3中。對於當前的HLA 分型方法,對於造血幹細胞移植是臨床上重要的HLA等位基因的等位基因水平分辨,在技 術上是挑戰性的。幾項大規模的研究展現了,通過降低急性和慢性移植物抗宿主疾病的發 生率和嚴重度以及改善成功的植入的比率,在供體和患者之間精確的、等位基因水平的HLA 匹配顯著地改善了總體移植存活率。例如,當8個最顯著的HLA基因座中的8個匹配時,與 8個中的6個對比,移植後的存活率在12個月後提高60%。當前的實踐是維持骨髓供體登記,其中數百萬潛在的供體在低-中解析度下被 HLA分型為A、B、以及在許多情況下的DRBl基因座。根據這種初步的分型,選擇多個潛在匹 配的不相關的供體,然後在這些和其他基因座的等位基因水平的解析度下分型以鑑定與接 受者最佳匹配的供體。迄今為止,最高解析度的HLA分型是使用利用毛細血管電泳的、螢光的、基於 Sanger的DNA測序獲得的。然而,在HLA分型數據中的模糊性可能由於當兩種等位基因被 一起擴增和測序時等位基因之間的多種多態性、以及產生的相位模糊性而被保留。分辨這 種模糊性需要費時間的方法,例如,單獨地擴增然後分析兩個等位基因。下一代的測序方法克隆性地並行增殖數百萬的單獨DNA分子,其然後也被並行 地測序。近來,通過這種下一代的焦磷酸測序(pyrosequencing)測序方法GM Life Sciences, Inc.)可獲得的閱讀長度提高到> 250個核苷酸。本發明提供了改進的HLA基 因分型方法,其基於這樣的發現,克隆性測序可以用於設置外顯子之內連鎖的多態性的相, 使得每個HLA等位基因的序列的明確的測定成為可能。發明概述本發明部分地基於這樣的發現,S卩,8-基因座HLA基因分型可以對獲自多個受試 者的樣品在單次測序運行中進行。在某些實施方式中,因而本發明提供了並行地測定超過 一個個體的 HLA 基因 HLA-A、HLA-B、HLA-C、DRB1、DQA1、DQB1、DPAl 和 DPBl 的 HLA 基因型的 方法,所述方法包括(a)對於每個個體,擴增包含多態性位點的HLA-A、HLA-B、HLA-C、DRB1、DQA1、 DQBU DPAl和DPBl基因的外顯子,來獲得每個個體的HLA-A、HLA-B, HLA-C, DRBU DQAU DQBUDPA1和DPBl擴增子,其中每個擴增反應用正向引物和反向引物進行來擴增HLA基因 外顯子,其中(i)所述正向引物從5'到3'包含以下序列銜接頭序列、分子識別序列和HLA 序列;和(ii)所述反向引物從5'到3'包含以下序列銜接頭序列、分子識別序列和HLA 序列;(b)集中來自超過一個個體的HLA擴增子,並進行乳劑PCR;(c)利用焦磷酸測序並行地測定每個個體的HLA-A、HLA-B, HLA-C, DRBU DQAUDQBU DPAl和DPBl擴增子的序列;和(d)通過將HLA擴增子的序列與已知的HLA序列比較以確定哪些HLA等位基因存 在於個體中,為每個個體指定HLA等位基因。在根據本發明的優選的實施方式中,用於擴增 HLA擴增子的正向或反向引物具有表1中列出的引物的HLA雜交區域的序列。這樣的引物 可以另外包含表1的引物的銜接頭區域的序列。在進一步優選的實施方式中,所述引物還 可以包含表1中列出的引物的個體識別標籤。在特別優選的實施方式中,所述引物具有表 1中所列的引物的序列。此外,本發明提供了包含用於獲得HLA擴增子的引物對的試劑盒,來並行地測定 超過一個個體的 HLA 基因 HLA-A、HLA-B, HLA-C, DRBl、DQAl、DQBl、DPAl 和 DPBl 的 HLA 基 因型,其中所述引物對包含正向引物和反向引物來擴增HLA基因外顯子,其中(i)所述正 向引物從5'到3'包含以下序列銜接頭序列、分子識別序列和HLA序列;和(ii)所述反 向引物從5'到3'包含以下序列銜接頭序列、分子識別序列和HLA序列。在優選的實施 方式中,所述試劑盒包含表1中所列的一種或更多種正向和反向引物。在其他優選的實施 方式中,所述試劑盒包含擴增外顯子的引物對,用於對HLA基因HLA-A、HLA-B、HLA-C、DRB1、 DQAU DQBU DPAl和DPBl基因分型,其中每種引物對選自表1中所列的引物。本發明另外提供了包含一種或更多種引物對的試劑盒,其中每種引物對包含用於 獲得HLA擴增子的正向引物,其具有表1中所列的引物的HLA雜交區域的序列;以及用於獲 得HLA擴增子的反向引物,其具有表1中所列的引物的HLA雜交區域的序列。這樣的引物 另外包含具有表1中所列序列的銜接頭區域。在進一步優選的實施方式中,所述引物具有 表1中列出的引物的個體識別標籤。在特別優選的實施方式中,所述正向引物具有表1中 所列的引物的序列,所述反向引物具有表1中所列的引物的序列。此外,本發明提供了試劑盒,其中所述試劑盒包含十五種HLA引物對,其中所述引 物對擴增HLA-A的外顯子2、外顯子3和外顯子4 ;HLA-B的外顯子2、外顯子3和外顯子4 ; HLA-C的外顯子2、外顯子3和外顯子4 ;DRBl的外顯子2、DPBl的外顯子2、DPAl的外顯子 2、DQA1的外顯子2 JPDQBl的外顯子2和外顯子3。在優選的實施方式中,本發明提供了包 含至少六種引物對、或至少八、九、十、十一、十二、十三或十四種引物對的試劑盒。優選的, 所述引物對選自表1中所列的引物。此外,本發明提供了試劑盒,其中所述試劑盒對擴增HLA-A的外顯子2、外顯子3和 外顯子4 ;HLA-B的外顯子2、外顯子3和外顯子4 ;HLA-C的外顯子2、外顯子3和外顯子4 ; DRBl的外顯子2、DPBl的外顯子2、DPAl的外顯子2、DQAl的外顯子2 ;和DQBl的外顯子2 和外顯子3的每種引物對包含多種引物對,其中擴增單獨的感興趣的外顯子區域的所述多 種引物對具有相同的HLA雜交區域和相同的銜接頭區域,但是具有不同的識別標籤。在優 選的實施方式中,對於每個感興趣的外顯子區域存在著12種或更多的多種引物對,其中所 述引物對具有不同的多種識別標籤。附圖的簡要描述附

圖1提供了本發明的正向和反向融合物引物的示意性的描繪。附圖2提供了閱讀長度的直方圖。附圖3顯示了全部正向和反向閱讀的閱讀深度。發明的詳細說明
如在此使用的,術語「等位基因」是指基因的序列變體。一個或更多個遺傳學差異 可以構成等位基因。對於HLA等位基因,一般地多個遺傳學差異構成等位基因。HLA等位 基因序列的實例在Masonand Parham(1998)Tissue Antigens 51 :417-66 中闡述了,其列出 了 HLA-A、HLA-B 和 HLA-C 等位基因,以及在 Marsh et al. (1992) Hum. Immunol. 35 :1 中闡述 了,其列出了 DRA、DRB、DQAl、DQBl、DPAl 和 DPBl 的 II 類 HLA 等位基因。如在此使用的,術語「多態的,,和「多態性,,是指一種情況,其中特定基因組序列、 或編碼的胺基酸序列的兩種或更多種變體可以在群體中找到。多態性位置是指在核酸中發 生區分變體的核苷酸差異的位置。如在此使用的,「單核苷酸多態性」或SNP,是指由單個核 苷酸位置組成的多態性位點。術語「基因型」是指在個體或樣品中所含的單個基因或複數個基因的等位基因的 描述。如在此使用的,在個體的基因型和來自所述個體的樣品的基因型之間不進行區分。如在此使用的,「確定」HLA基因的「基因型」是指確定受試者的個體等位基因中存 在的HLA多態性。在本發明中,「確定HLA-A基因的基因型」是指鑑定在至少外顯子2和外 顯子3、以及一般地外顯子4中在HLA-A基因等位基因的等位決定簇的位置中存在的多態 的殘基。在本發明中,「確定HLA-B基因的基因型」是指鑑定在至少外顯子2和外顯子3以 及一般地外顯子4中在HLA-B基因等位基因的等位決定簇的位置中存在的多態的殘基;和 「確定HLA-C基因的基因型"是指鑑定在至少外顯子2和外顯子3以及一般地外顯子4中在 HLA-C基因的等位決定簇的位置中存在的多態的殘基。類似地,在本發明中,「確定」DRB1、 DPBl、DPAl或DQAl基因的「基因型」是指鑑定外顯子2中在所述基因的等位決定簇的位置 中存在的多態的殘基,以及是指在外顯子2和外顯子3中在DQBl等位基因的等位決定簇的 位置中存在的多態的殘基。在此使用的,「等位決定簇f指變異的存在引起HLA抗原中的變異的多態性位點。術語「目標區域」是指核酸的區域,在本發明中是指HLA基因的區域,其要被分析 多態性位點的存在。「寡核苷酸」是指由共價地連接在一起的超過2個核苷酸亞基組成的單鏈的核苷酸 聚合物。在此使用的寡核苷酸引物一般長度在約10和100個核苷酸之間,通常長度是20到 60個核苷酸。核苷酸亞基的糖基團可以是核糖、脫氧核糖或其修飾的衍生物,例如,ο-甲基 核糖。寡核苷酸的核苷酸亞基可以通過磷酸二酯鍵、硫代磷酸酯鍵、膦酸甲酯鍵或通過不阻 礙寡核苷酸的雜交的其他鍵,包括但不限於罕有的、或非天然存在的鍵來連接。此外,寡核 苷酸可以具有非常見核苷酸或非核苷酸部分。在此定義的寡核苷酸是核酸,優選的DNA,但 可以是RNA,或具有共價連接的核糖核苷酸或脫氧核糖核苷酸的組合。規定序列的寡核苷酸 可以通過本領域普通技術人員已知的技術來產生,例如,通過化學或生物化學合成,和通過 從重組的核酸分子體外或體內表達。術語「引物」是指在一定條件下作為DNA合成的起始點的寡核苷酸,在所述條件中 與核酸鏈互補的引物延伸產物的合成在合適的緩衝液中和在適合的溫度下被誘導。引物優 選的是單鏈的寡脫氧核糖核苷酸。在本發明中,引物包括與感興趣的HLA序列精確地或基 本上互補的「HLA結合區域」或「HLA雜交區域」。引物的這個區域長度一般是約15到約25、 30、35或40個核苷酸。如在此使用的,引物的「銜接頭區域」是指處在5'末端的引物序列的區域,其對於根據在此描述的操作獲得的HLA擴增子是通用的,並提供了與用於乳劑PCR的微粒或其他 固體表面上存在的寡核苷酸退火的序列。「銜接頭區域」可以進一步充當測序引物結合的位 點。銜接頭區域一般長度從15到30個核苷酸。術語「個體的標識符標籤」、「條型碼」、「識別標籤」、「多重識別標籤」、「分子識別標 籤」或「MID」在此可互換地使用,是指引物中存在的、充當獲自特定受試者的DNA的標記物 的核苷酸序列。如在此使用的,術語「核酸」、「多核苷酸」和「寡核苷酸」是指引物和寡聚體片段。 該術語不受長度的限制,對於多聚脫氧核苷酸(含有2-脫氧-D-核糖)、多核糖核苷酸(含 有D-核糖)和任何其他嘌呤或嘧啶鹼基、或修飾的嘌呤或嘧啶鹼基的N-糖苷的線型聚合 物是通用的。這些術語包括雙鏈和單鏈的DNA,以及雙鏈和單鏈的RNA。核酸、多核苷酸或寡核苷酸可以包含磷酸二酯鍵或修飾的鍵,包括但不限於,磷酸 三酯、氨基磷酸酯、矽氧烷、碳酸酯、羧甲基酯、乙醯胺酯(acetamidate)、氨基甲酸酯、硫醚、 橋接的氨基磷酸酯、橋接的亞甲基膦酸酯、硫代磷酸酯、甲基膦酸酯、二硫代磷酸酯、橋接的 硫代磷酸酯或碸鍵,以及這樣的鍵的組合。核酸、多核苷酸或寡核苷酸可以包含五種生物學上存在的鹼基(腺嘌呤、鳥嘌呤、 胸腺嘧啶、胞嘧啶和尿嘧啶)和/或除了這五種生物學上存在的鹼基之外的鹼基。這些鹼 基可以適用於許多目的,例如,來使雜交穩定或不穩定;促進或抑制探針降解;或作為可檢 測部分或淬滅劑部分的附著點。例如,本發明的多核苷酸可以含有一個或更多個修飾的、非 標準的、或衍生的鹼基部分,包括但不限於,N6-甲基-腺嘌呤、N6-叔-丁基-苯甲基-腺 嘌呤、咪唑、取代的咪唑、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黃嘌呤、 黃嘌呤、4-乙醯胞密啶、5(羧基羥基甲基)尿嘧啶、5羧基甲基氨基甲基-2-硫尿核苷、5 羧基甲基氨基甲基尿嘧啶、二氫尿嘧啶、β -D-半乳糖基queosine、肌苷、N6異戊烯基腺嘌 呤、1-甲基鳥嘌呤、1-甲基肌苷、2,2-二甲基鳥嘌呤、2-甲基腺嘌呤、2-甲基鳥嘌呤、3-甲 基胞嘧啶、5-甲基胞嘧啶、N6-甲基腺嘌呤、7-甲基鳥嘌呤、5-甲基氨甲基尿嘧啶、5-甲氧 基氨甲基-2-硫尿嘧啶、0-0甘露糖基91^0&116、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿 嘧啶、2-甲硫基-N6-異戊烯基腺嘌呤、尿嘧啶-5-氧乙酸(ν)、wybutoxosine、偽尿嘧啶、 queosine、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4_硫尿嘧啶、5-甲基尿嘧啶、尿 嘧啶-5-氧乙酸甲基酯、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)W、2,6-二氨基嘌呤和 5-丙炔基嘧啶。修飾的非標準的或衍生的鹼基部分的實例可以在美國專利NO. 6,001,611 ; 5,955,589 ;5,844,106 ;5,789,562 ;5,750,343 ;5,728,525 和 5,679,785 中找到。此外,核 酸、多核苷酸或寡核苷酸可以包含一個或更多個修飾的糖部分,包括但不限於,阿拉伯糖、 2-氟阿拉伯糖、木酮糖和己糖。術語「擴增條件」是指擴增反應(例如,PCR擴增)中的條件,其容許可延伸的多 核苷酸(例如,引物)與目標核苷酸的雜交,以及所述可延伸的多核苷酸的模板依賴性延 伸。如在此使用的,足以擴增目標核酸的「擴增條件」或條件是本領域公知的。參見,例 如,PCRPrimer :A Laboratory Manual,by Dieffenbach and Dveksler, eds.,2003,Cold Spring Harbor Press ;禾口 PCR Protocols,Bartlett and Stirling,eds.,2003,Humana Press0如在核酸擴增反應的上下文中使用的術語「擴增」是指一種反應,其提高核酸模板,例如,目標核酸序列的拷貝。引言本發明提供了 HLA基因分型的方法,基於這樣的發現,多重的、並行的克隆性測序 分析可以同時用於基因分型多個個體的至少3個、一般地至少6個、優選的至少8個HLA基 因座。下一代的測序方法克隆性地並行增殖數百萬的單獨DNA分子,其然後也被並行地測 序。近來,通過這種下一代的測序方法GM Life Sciences,he.)可獲得的閱讀長度提高 到> 250個核苷酸。這些克隆閱讀長度使得設置外顯子之內連鎖的多態性的相成為可能, 因而每個HLA等位基因的序列的明確的測定成為可能。在本發明中,所述系統是足夠高通 量的,以允許利用在此描述的焦磷酸測序平臺對多個個體,例如,M或48個受試者在單次 測序運行中的完整的、8-基因座HLA分型。本發明的高度多重化的擴增子測序採用了引物中的樣品特異性內部序列標籤 (條型碼標籤或MID),其容許樣品的集中而維持了將序列指定於特定的個體的能力。在本 發明中,至少八個基因座(HLA-A、B、C、DRB1、DQA1、DQB1、DPA1、DPB1)以及 DRB3、4 和 5 的 HLA基因型可以從測序產生的數據獲得。這種HLA測序系統還可以檢測嵌合的混合物,例 如,檢測在SCID患者的血液中存在的、罕有的非傳播的(transmitted)母體等位基因。HLA 基因人白細胞抗原系統(HLA)複合物跨越了染色體6的短臂上大約3百50萬個鹼基 對。主要的區域是I類和II類區域。主要的I類抗原是HLA-A、HLA-B和HLA-C,主要的II 類抗原是 HLA-DP、HLA-DQ 和 HLA-DR。HLA-DP、HLA-DQ 和 HLA-DR 基因座編碼 HLA-DR、DP 和 DQ抗原的α和β鏈。HLA基因是最為多態性的基因之一。在HLA抗原中表達的多態性 (因而為了移植的分型是非常感興趣的)主要定位於II類基因的外顯子2中,和I類基因 的外顯子2和3中。在本發明中,此處描述的HLA基因的基因分型是指確定該HLA基因中存在的多態 性。對於HLA-A,外顯子2和外顯子3中存在的多態性通過對從個體PCR產生的擴增子測序 來確定。在典型的實施方式中,還測定外顯子4的序列。外顯子2、外顯子3和外顯子4,或 其包含等位決定簇的區域,在單獨的PCR反應中各自擴增來獲得擴增子。類似地,對個體的 HLA-B和HLA-C等位基因的外顯子2和外顯子3、在某些實施方式中外顯子4獲得擴增子。 對於對II類HLA等位基因基因分型,對DRBl、DPBl、DPAl、DQAl的外顯子2,DQBl的外顯子 2和3獲得擴增子。通過以來自任一末端的閱讀之間足夠的重疊來測序兩條鏈,可以完全地 測序每個外顯子,從而可以明確地指定具體的HLA等位基因。來自個體的每個樣品,利用用於擴增的、靶向感興趣的外顯子或感興趣的外顯子 的多態性區域的引物,在每個外顯子處單獨地擴增。在擴增反應中採用的引物包括其他序 列用於乳劑PCR的銜接頭序列和充當來自單個個體的DNA的標記物的識別序列。擴增引物本發明採用了擴增引物,其擴增HLA基因的感興趣的外顯子。一般地,引物被設計 以確保獲得外顯子的全部多態性部分。在本發明中,本發明的多重擴增的引物序列被設計來包括可以用於促成克隆性測 序和分析的序列。因而本發明的擴增引物(在此還稱為「融合引物」)包括以下的成分銜 接頭、獨特的識別標籤和與感興趣的HLA基因雜交以在擴增反應中使用來獲得HLA擴增子的序列。附圖1提供了顯示本發明的融合引物的示意圖。引物序列的銜接頭部分存在於擴增子融合引物的5'末端。銜接頭區域包含一些 序列,其充當測序反應的引物的退火的位點、以及還相應於珠子或固體表面上存在的序列 從而擴增子可以與用於乳劑PCR的表面退火。用於擴增HLA外顯子的正向引物包括處在 5'末端的銜接頭序列,在此稱為銜接頭區域A。反向引物包含一區域,其在5'末端含有銜 接頭序列,在此稱為銜接頭區域B。注意的是,在銜接頭區域和它們的互補物中存在的序列 容許擴增子與用於乳劑PCR的珠子退火。任選地,銜接頭可以進一步包括由非重複核苷酸 序列(即,ACGT、CAGT,等等)組成的獨特的鑑別鑰匙序列。這種鑰匙序列一般被包括以辨 別用於HLA基因分型的擴增子和被包括在反應中的對照序列。例如,在W0/2004/069849和 W02005/073410中描述了這樣的序列。例如,在W0/2006/110855中提供了用於配置銜接頭 引物的另外的指導。在某些實施方式中,用於本發明的銜接頭序列是454 GS-FLX4M測序系統(Roche Diagnostics)的引物 A 和引物 B 序列。引物 A 序列是 5' GCCTCCCTCGCGCCA 3' (SEQ ID NO :1)。引物 B 序列是 5' GCCTTGCCAGCCCGC 3' (SEQ ID NO :2)。如上所述,引物一般含 有另外的「鑰匙」序列,其提供了識別測序來辨別擴增子和對照序列。用於本發明的HLA基因分型方法的PCR引物進一步包含個體標識符標籤。這些個 體標識符標籤被用於標記來自被測試的每個個體的HLA擴增子。感興趣的HLA序列從來自 要被基因分型的受試者的核酸樣品中擴增。如上文解釋的,包含作為等位決定簇的多態性 的HLA外顯子或外顯子的區域被單獨地擴增。從受試者獲得的擴增子用相同的識別標籤來 標記。標籤被包括在融合引物中,所述融合引物被用於擴增該受試者的每個擴增子。因而, 識別標籤也在測序反應中被測序。ID標籤存在於用於獲得HLA擴增子的融合引物中銜接頭 區域和融合引物的HLA引發(priming)區域之間。識別標籤可以在長度上不同。一般地,標籤長度是至少4或5個核苷酸。在某些 應用中,可能希望的是具有更長的識別序列,例如,長度6、8或10個或更多個核苷酸。這樣 的序列的使用是本領域公知的。(參見,例如Thomas, et al. Nat. Med.,12 =852-855,2006 ; Parameswaran et al, . Nucl. Acids Res. ,35:el30,2007 ;Hofmann et al. , Nucl. Acids Res. 35 :e91,2007)。在本發明的大多數實施方式中,識別標籤是長度4到10個核苷酸。個體標識符序列可以考慮某些參數來設計。例如,在設計4-殘基ID標籤時,希望 的是考慮測序反應中核苷酸的流動循環來選擇4個鹼基。例如,如果核苷酸按照順序T、A、 C和G添加,一般希望的是設計標籤序列,從而正的殘基繼之以負的殘基。因而,在這個實例 中,如果標籤序列以「A」殘基開始,從而在測序反應中摻入的核苷酸是T,標籤序列中的第 二個殘基將是使得不會摻入A的核苷酸。此外,希望的是避免形成標籤序列內的同聚物,或 通過根據銜接頭區域的最後的鹼基或融合引物的HLA-特異性區域的第一個鹼基創造它們 來避免形成同聚物。融合引物的HLA引發區域(在此也稱為HLA結合區域,或HLA雜交區域)是引物 的區域,其雜交於感興趣的HLA序列來擴增期望的外顯子(或在某些實施方式中,外顯子的 區域)。一般地,融合引物的HLA區域雜交於鄰近於要擴增的外顯子的內含子序列以獲得整 個外顯子序列。優選地選擇HLA序列以選擇性地擴增感興趣的HLA外顯子,而在某些實施 方式中,引物對也可以擴增相關的HLA基因的高度相似的區域。例如,以下的實施例小節中描述的DRBl的外顯子2的引物也可以擴增DRB3、DRB4和DRB5基因座。選擇引物,從而外 顯子以足夠的特異性被擴增,以容許根據序列的HLA基因型的明確的鑑定。HLA基因和等位基因的序列是已知的和可通過各種資料庫獲得的,包括GenBank 和其他基因資料庫,並已經被公開(參見,例如,Mason and Parham(1998)Tissue Antigens 51 :417-66, listing HLA-A, HLA-B, and HLA-C alleles ;Marsh et al. (1992)Hum. Immunol. 35 :1, listing HLA Class II alleles—DRA,DRB,DQAl,DQBl,DPAl,andDPBl)。PCR引物可以根據本領域已知的原則來設計。引物設計的策略可以在科學文獻中 找到,例如,Rubin,E. and A. A. Levy, Nucleic AcidsRes,1996. 24 (18) :p. 3538—45 ;禾口 Buck et al. , Biotechniques, 1999. 27 (3) :p. 528-360 例如,引物的 HLA 特異性區域一般是長度 約20個核苷酸或更長,例如,20到35個核苷酸。考慮的其他參數是G/C含量、避免內部二 級結構的設計考慮、以及防止引物二聚體的形成,以及熔解溫度(Tm)。本發明中使用的引物的實例在表1中提供。在表1中,正向引物具有處在5 『末端 的4M測序系統「A」引物序列,然後是四個核苷酸鑰匙(TCAG),其一起包含銜接頭區域;隨 後是標識符標籤0核苷酸,除非另作說明);其然後是與標明的HLA基因雜交的區域。反 向引物具有處在5'末端的4M測序系統「B引物序列,然後是四個核苷酸鑰匙「TCAG」,其 一起包含銜接頭區域,之後是標識符標籤區域,之後是HLA-特異性區域。本發明的方法中使用的引物可以包含表1中所列的引物的HLA雜交區域。在其他 實施方式中,這樣的引物可以包含基本上相同於表1中所列HLA雜交區域的序列的部分。因 而,例如,本發明的引物可以包含表1中所列的引物的HLA雜交區域的至少10、15或20個 或更多個連續核苷酸。要HLA基因分型的每個受試者的HLA擴增可以單獨地進行。來自單獨的受試者的 擴增子然後被集中用於隨後的乳劑PCR和序列分析。用於擴增感興趣的HLA擴增子的模板核酸一般來自分離自要基因分型的受試者 的基因組DNA。在當前的方法中,超過一個受試者在並行的反應中被HLA基因分型。在本發 明中,至少12個受試者,一般至少16、20、M、30、36或48個受試者被HLA基因分型。HLA擴增子可以使用任何類型的擴增反應獲得。在本發明中,多重擴增子一般通過 使用此處描述的引物對的PCR來產生。一般希望的是使用具有低差錯率的聚合酶,例如,高 1 ] Taq(RocheDiagnostics)。PCR條件可以被優化來確定從受試者獲得HLA擴增子的適合的條件。每個HLA擴 增子可以在獨立的PCR反應中單獨地擴增。在某些實施方式中,受試者的HLA擴增子可以 在一個或更多個多重反應中獲得,所述多重反應包含引物對來擴增個體的擴增子。乳劑PCRHLA擴增子附著到珠子上並經歷乳劑PCR。乳劑PCR是本領域已知的(參見,例如, W0/2004/069849、W02005/073410、美國專利申請公開 NO. 20050130173, W0/2007/086935 和 TO/2008/076842)。在乳劑PCR中,通過將要擴增的模板,在本發明中為HLA擴增子,附著到 固相支持物上,優選的以一般球形珠子形式的固相支持物上,來進行擴增。通過經由銜接頭區域將擴增子與附著於珠子的引物退火,將HLA擴增子附著到珠 子上。因而,珠子連接到大量的、在銜接頭部分與HLA擴增子互補的單一的引物種類上。珠 子懸浮在水性的反應混合物中,然後包封在油包水乳劑中。乳劑由不連續的水相微滴組成,所述水相微滴例如,直徑約60到200 μ m,被熱穩定的油相包圍。添加油,形成乳滴,從而平 均起來乳劑僅包含一個目標核酸和一個珠子。優選地,每個微滴含有擴增反應溶液(即,核 酸擴增所必需的試劑,例如,聚合酶、鹽和合適的引物,例如與銜接頭區域相應的引物)。在本發明中,乳劑PCR —般用兩種珠子的群體進行,因為HLA擴增子在兩個方向上 測序。在一種珠子群體中,在反向引物上存在的與銜接頭序列相應的第一引物附著到珠子 上。在第二種群體中,在正向引物上存在的與銜接頭序列相應的第二引物附著到珠子上。因 而,在乳劑擴增反應中使用的引物一般具有銜接頭區域的序列,沒有額外的序列如「鑰匙」 序列。乳劑擴增反應一般不對稱地進行。例如,PCR引物可以以8 1或16 1的比例 (即,8或16個一種引物比1個第二種引物)存在來進行不對稱PCR。在乳劑擴增之後,具有單鏈的HLA擴增子模板的珠子被分離,例如,通過在乳劑 PCR期間存在於擴增引物上的部分例如生物素,使用DNA測序技術對模板測序,所述DNA測 序技術基於通過焦磷酸鹽的釋放和同時的酶學核苷酸降解的鹼基摻入的檢測(例如,在美 國專利 Nos. 6,274,320,6, 258,568 和 6,210,891 中描述的)。克隆的擴增子利用測序引物(例如,引物A或引物B),並添加經歷聚合酶反應的四 種不同的dNIPs或ddNIPs來測序。在每個dNTP或ddNTP添加到引物延伸產物時,焦磷酸 鹽分子被釋放。焦磷酸鹽釋放可以酶學地檢測,例如,通過螢光素酶-螢光素反應中光線的 產生。另外,核苷酸降解酶,例如,三磷酸腺苷雙磷酸酶(apyrase)可以在反應期間存在,以 降解非摻入的核苷酸(參見,例如,美國專利No. 6258568)。在其他實施方式中,反應可以在 存在測序引物、聚合酶、核苷酸降解酶、脫氧核苷酸三磷酸鹽和包含ATP硫酸化酶和螢光素 酶的焦磷酸鹽檢測系統的情況下進行(參見,例如,美國專利NO. 6258568)。一旦對個體DNA分子的序列獲得了測序數據,明確的外顯子序列可以通過將這 些序列文件與兩種HLA等位基因的HLA序列資料庫比較來確定。GSFLX系統GM Life Sciences)實現的閱讀長度(平均=250bp)容許每個外顯子的這種測定的足夠的重疊。例 如,通過Conexio Genomics所開發的軟體,可以進行基於外顯子序列數據文件的每個基因 座處基因型的指定。軟體的重要的方面是濾出通過引物與目標序列一起被共同擴增出的相 關的序列閱讀(假基因和其他不希望的HLA基因)的能力。試劑盒在此描述的組合物和試劑可以被包裝到試劑盒中。本發明的試劑盒一般包含在此 描述的、適合於擴增HLA等位基因中的感興趣的區域的多種引物對。引物對包含正向引物 和反向引物,正向引物包含銜接頭區域、個體識別標籤和HLA雜交區域;反向引物包含銜接 頭區域、個體識別標籤和HLA雜交區域。本發明的試劑盒常常包含引物對來擴增擴增子,用 於確定多個受試者的對於至少HLA-A、HLA-B和DRBl的基因型。通常,本發明的試劑盒包含 足夠的弓I物對來測定多個個體,例如12個或更多個體的HLA-A、HLA-B、HLA-C、DRB1、DQA1、 DQBl、DPAl和DPBl基因的基因型。在某些實施方式中,試劑盒可以另外包含一種或更多種珠子的群體,所述珠子具 有與可用於乳劑PCR中的銜接頭區域相應的、附著的引物。在某些實施方式中,試劑盒可以 包含一個或更多個反應區室,所述反應區室包含按醫師的判斷所選定的適合於進行反應的 試劑。例如,在某些實施方式中,試劑盒可以包含一個或更多個反應區室,所述反應區室包 含一種或更多種測序試劑。
在試劑盒中包括的各種成分一般容納在獨立的容器中,然而,在某些實施方式中, 一種或更多種成分可以存在於同一容器中。另外,試劑盒可以包含此處描述的組合物和試 劑的任何組合。在某些實施方式中,試劑盒可以包含其他試劑,所述試劑對於進行所公開的 方法是必需的或可選的。這樣的試劑包括但不限於,緩衝液、對照多核苷酸,等等。在本申請中,單數的使用包含了複數,除非另外特別指出了。在此使用的小節標題 僅用於組織的目的,無論如何不被看作是限制所描述的主題。雖然結合各種實施例描述了 當前的教導,不意味著當前的教導限於這樣的實施方式。
實施例多重焦磷酸測序通過向PCR引物中摻入分子ID(MID)標籤,方便了單次妨4運行中多個樣品的多 個HLA基因座的分析。表1顯示了具有銜接頭序列(用於珠子捕獲)和4-鹼基MID標籤 的454HLA-特異性融合引物的序列。提供了給出5-鹼基MID標籤的其他序列。在初步的實驗中,分析了具有已知的HLA基因型(表2)的對個細胞系。在隨後 的實驗中,分析了 48份樣品。對HLA-A、B和C基因座的外顯子2、3和4,DRBU DPBU DPAU DQAl的外顯子2, 以及DQBl的外顯子2和3,設計了十五種引物對。對於每個目標序列設計了具有十二種不 同MID標籤的引物,總共180種(15X12)。DRBl的外顯子2的引物也擴增DRB3、DRB4和 DRB5基因座,它們是在特定的DRBl單元型上存在的基因。在各種樣品的擴增之後,通過 BioAnalyzer分析來定量PCR產物,稀釋到合適的濃度,集中用於乳劑PCR。分別利用2個 或4個picotitre平板區域,實現了 M和48個個體的焦磷酸測序運行。所有擴增子的閱 讀長度的分布在附圖2中示出。平均長度是250bp。這個長度對於正向和反向序列閱讀的 重疊是足夠的,容許序列明確地指定為每種外顯子,最終,指定為每種等位基因。每個個體 的每個外顯子的閱讀的數目在附圖3中示出。基因分型軟體為了方便根據這些複雜的序列數據文件的基因型指定,開發了軟體程序(Conexio Genomics),其將來自每個外顯子的正向和反向序列閱讀結果與HLA序列資料庫比較。數據 庫還含有HLA假基因和相關的基因的序列,容許濾出從假基因產生的、或從非經典的HLA I 類基因(例如,HLA-E, F、G和H)產生的序列。根據探針雜交HLA分型和Sanger測序,已知HLA型的二十四個細胞系衍生的DNA 樣品在所有8個基因座處測序(HLA-A、-B、-C、-DRBU -DQAU -DQBU DPAU DPB1)。還鑑定 了通過DRB引物對產生的擴增子中的DRB3、DRB4和DRB5的外顯子2序列。隨後,48份樣 品(M份細胞系DNA和M份提取自血液樣品的DNA)的運行在同一基因座處測序,根據序 列數據通過Conexio ATF軟體產生基因型指定。軟體的基因型認定和早先測定的HLA型的 一致性是99. 4%。嵌合混合物的分析(罕有變體檢測)在典型的GSFLX運行中產生的序列閱讀的非常高的數量(η = 300-350Κ)使得檢 測樣品中存在的罕有變體序列成為可能。為了估計檢測這種序列的敏感性,我們製備了按 照各種比例(1/1,1/10,1/100,1/1000)的、來自兩份HLA純合子樣品的HLA-A和HLA-B的外顯子2和3以及DRBl的外顯子2的PCR產物的混合物。1/00的混合物中存在的罕有變 體可以可再現地檢測。某些個體的血液是嵌合的,在兒童的循環中以極低水平存在殘餘的母體細胞,或 在母親的循環中維持的罕有的胎兒細胞(ref.)。SCID患者常常以極低的水平保留了母體 細胞。當這樣的患者是造血幹細胞移植的接受者時,表徵這種潛在的嵌合性的水平是臨床 上重要的。為了模擬SCIDS情況,其中母體細胞可能存在於兒童中,我們製備了兩種雜合的 樣品的混合物,其以各種比例共有等位基因。在這個實驗中,可以檢測到罕有的變體。還分析作為HST移植的接受者的兩位SCIDS患者,以及他們的雙親。在每種情況 下,可以檢測到非傳播的母體等位基因的存在。克隆性測序,從個體的擴增的DNA分子、隨後從HLA外顯子產生的擴增子的分析 容許明確的外顯子序列測定,並且,通過將這些序列文件與HLA序列資料庫比較,容許兩種 HLA等位基因的測定。GSFLX系統(454 Life Sciences)實現的閱讀長度(平均= 250bp) 容許每個外顯子的這種測定的足夠的重疊。在本實施例中,通過ConexioGenomics所開發 的軟體(ATF),可以進行基於外顯子序列數據文件的每個基因座處基因型的指定。軟體的重 要的方面是濾出通過引物與目標序列一起被共同擴增出的相關的序列閱讀(假基因和其 他不希望的HLA基因)的能力。軟體還濾出非常罕有的序列閱讀,其可能是由來自基因組 DNA的目標序列的起始PCR擴增中的誤差、乳劑PCR中的誤差、或焦磷酸測序誤差產生的。 焦磷酸測序誤差的一個充分記載的類別是在同聚物段的長度測定上。例如,我們觀察到,當 大多數序列閱讀含有-Gs的正確運行時,罕有的序列閱讀含有的運行。單次GSFLX運行的成本是相當大的。為了使得這種系統對於高解析度臨床HLA 分型是低成本的,在單次運行中在多個基因座處分析多個樣品。如這些實施例中描述的, Picotitre平板的MID標籤和多個區域的使用使得在8個基因座處運行M份或48份分析 的樣品成為可能。並行地產生了非常大數量的序列閱讀,這容許了在多個基因座處多個個體的這種 多重分析。還提供了檢測罕有的變體序列的能力。在來自兩個不同的基因組DNA樣品的 PCR產物的混合物中,以1/100存在的HLA外顯子序列被可靠地檢出。相關的但是不需要的 序列、以及含有誤差的罕有的序列也被濾出。(大多數HLA等位基因相互不同在於多個多態 性,而含有誤差的序列一般與正確的序列不同僅一個核苷酸。)儘管已經為了理解的清楚性的目的通過例示和舉例詳細描述了前述發明,根據本 發明的教導,對於本領域普通技術人員明顯的是,可對其作出某些改變和修飾而不偏離所 附權利要求的精神或範圍。本說明書中引用的所有出版物,專利,登錄號,和專利申請通過援引併入本文,如 同每個單獨的出版物或專利申請被特別地和單獨地指示通過援引併入一樣。
權利要求
1.一種並行地測定超過一個個體的HLA基因HLA-A、HLA-B、HLA-C、DRBl、DQAl、DQBl、 DPAl和DPBl的HLA基因型的方法,所述方法包括(a)對於每個個體,擴增包含多態性位點的HLA-A、HLA-B,HLA-C, DRBU DQAU DQBU DPA1 和 DPB1 基因的外顯子,來獲得每個個體的 HLA-A、HLA-B、HLA-C、DRB1、DQA1、DQB1、DPA1 和DPB1擴增子,其中每個擴增反應用正向引物和反向引物進行來擴增HLA基因外顯子,其 中⑴正向引物包含以下序列,從5'到3'銜接頭序列、分子識別序列和HLA雜交序列;和(ii)所述反向引物包含以下序列,從5'到3'銜接頭序列、分子識別序列和HLA雜 交序列;(b)集中來自超過一個個體的HLA擴增子,並進行乳劑PCR;(c)利用焦磷酸測序並行地測定每個個體的HLA-A、HLA-B,HLA-C, DRBl、DQAl、DQBl、 DPAl和DPBl擴增子的序列;和(d)通過將HLA擴增子的序列與已知的HLA序列比較以確定哪些HLA等位基因存在於 個體中,為每個個體指定HLA等位基因。
2.權利要求1的方法,其中用於獲得HLA擴增子的正向引物具有表1中所列的引物的 HLA結合區域的序列。
3.權利要求2的方法,其中所述正向引物具有表1中所列的引物的序列。
4.權利要求1的方法,其中用於獲得HLA擴增子的反向引物具有表1中所列的引物的 HLA結合區域的序列。
5.權利要求4的方法,其中所述反向引物具有表1中所列的引物的序列。
6.權利要求1的方法,其中用於獲得HLA擴增子的正向引物具有表1中所列的引物的 HLA雜交區域的序列;用於獲得HLA擴增子的反向引物具有表1中所列的引物的HLA雜交 區域的序列。
7.權利要求6的方法,其中所述正向引物具有表1中所列的引物的銜接頭區域;所述 反向引物具有表1中所列的引物的銜接頭區域。
8.權利要求1的方法,其中所述正向引物具有表1中所列的引物的個體識別標籤,所述 反向引物具有表1中所列的引物的個體識別標籤。
9.權利要求8的方法,其中所述正向引物具有表1中所列的引物序列並且所述反向引 物具有表1中所列的引物序列。
10.一種包含用於獲得HLA擴增子f的引物對的試劑盒,來並行地測定超過一個個體的 HLA 基因 HLA-A、HLA-B, HLA-C, DRBU DQAl、DQBl、DPAl 和 DPBl 的 HLA 基因型,其中所述引 物對包含正向引物和反向引物來擴增HLA基因外顯子,其中(i)正向引物包含以下序列, 從5'到3'銜接頭序列、分子識別序列和HLA序列;和(ii)所述反向引物包含以下序列, 從5'到3'銜接頭序列、分子識別序列和HLA序列。
11.權利要求10的試劑盒,其中所述引物對包含表1中所列的正向和反向引物。
12.一種包含一種或更多種引物對的試劑盒,其中每種引物對包含用於獲得HLA擴增 子的正向引物,其具有表1中所列的引物的HLA結合區域的序列;以及用於獲得HLA擴增子 的反向引物,其具有表1中所列的引物的HLA結合區域的序列。
13.權利要求12的試劑盒,其中所述正向引物具有表1中所列的引物的序列,並且所述 反向引物具有表1中所列的引物的序列。
14.權利要求12的試劑盒,其中所述試劑盒包含十五種HLA引物對,其中所述引物對擴 增HLA-A的外顯子2、外顯子3和外顯子4 ;HLA-B的外顯子2、外顯子3和外顯子4 ;HLA-C 的外顯子2、外顯子3和外顯子4 ;DRBl的外顯子2、DPB1的外顯子2、DPA1的外顯子2、DQA1 的外顯子2 ;和DQBl的外顯子2和外顯子3。
全文摘要
本發明提供了利用克隆性測序在單次測序運行中對多個個體進行完全的、多基因座的HLA基因分型的方法和試劑。
文檔編號C12Q1/68GK102124125SQ200880120658
公開日2011年7月13日 申請日期2008年10月16日 優先權日2007年10月16日
發明者G·本特利, H·A·埃利克, R·G·希古奇 申請人:霍夫曼-拉羅奇有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀