基於SLAFseq技術的大規模樣品基因分型方法
2023-05-21 09:06:51
專利名稱:基於SLAFseq技術的大規模樣品基因分型方法
技術領域:
本發明提供一種基於SLAF-seq技術的大規模樣品基因分型方法,其核心技術是利用SLAF-seq技術降低基因組複雜度並進行高通量測序,進行標記開發、遺傳圖譜繪製及全基因組關聯分析。
背景技術:
隨著具有高通量、低成本、測序錯誤率低、測序讀長短特點的新一代測序技術和生物信息學的發展,使得該測序技術進行高通量標記開發成為可能。SLAF-seq (SpecificLength Amplified Fragments sequencing)是一種簡化基因組深度測序技術,在高通量測序技術的基礎上,利用生物信息學方法對目標物種的參考基因組或已知BAC序列進行系統分析,根據基因組的GC含量、重複序列情況和基因組特點等信息,設計標記開發方案,以保證SLAF標籤密度、均勻性、效率和分析的準確性。根據基因組特性,利用SLAF-seq技術對大規模樣品進行研究,通過數學算法解決傳統方法通量低和準確性不高的問題,提高生物學分析的準確性,降低成本,提高效率。目前還未見利用SLAF-seq技術對大規模樣品進行基因分型的報導。
發明內容
本發明的目的是利用SLAF-seq技術降低基因組複雜度並進行高通量測序的方法,對大規模樣品進行研究,通過數學算法解決傳統方法通量低和準確性不高的問題,提高生物學分析的準確性,降低成本,提高效率。為了實現本發明目的,本發明提供基於測序和SLAFseq技術的大規模樣品基因分型方法,其基於SLAFseq技術降低基因組複雜度並進行高通量測序,對大規模樣品進行標記開發、遺傳圖譜圖譜、單體型圖譜繪製及性狀關聯分析,包括如下步驟:I)對經性狀鑑定的各樣品的DNA進行檢測;2)對樣品基因組的複雜性進行降低處理,獲得複雜性降低的DNA樣品;3 )利用二級引物庫中的引物對複雜性降低後的樣品DNA進行PCR擴增,使特異性長度片段擴增前后豐度一致;4)將擴增後的特異性長度片段連接標準測序接頭,利用高通量測序技術進行測序;5)對於各樣品的測序結果進行比較分析,獲得SLAF標記,獲得各樣品的有效序列;進行遺傳圖譜繪製或全基因組關聯 分析。其中步驟I)通過瓊脂糖電泳檢測各樣品DNA主帶是否清晰,有無降解和汙染,通過微量分光光度計如Nanodrop 2000檢測DNA的濃度及純度。其中步驟5)是對上述SLAF標籤進行多態性分析,對存在多態性的標籤中的所有樣品進行基因分型,並使用自主研發打分體系進行打分,設置閾值,最終獲得SLAF標記;通過上述步驟獲得的SLAF標記,可用於遺傳圖譜繪製、全基因組關聯分析。
前述的基於測序和SLAFseq技術的大規模樣品基因分型方法,其中所述大規模樣品是植物、動物或微生物。前述的基於測序和SLAFseq技術的大規模樣品基因分型方法,其中所述大規模樣品為自然群體、遺傳分離群體;所述遺傳分離群體為經鑑定的性狀分離群體,包括F2、BCUDH等目標性狀分離的群體。DNA複雜性降低方法是任何有選擇性的減少基因組複雜度的方法,包括限制性內切酶酶切產物PCR擴增或酶切產物選擇性吸附。其中最佳酶切方案需滿足以下條件:a)保證序列標籤在基因組上分布儘可能均勻山)選擇特定長度的酶切片段能夠保證序列標籤的數量;c)選擇特定長度的酶切片段避免落在基因組高度重複區。其中最佳酶切方案確定需進行預實驗,步驟及滿足條件如下:1)通過生物信息學模擬,獲得廣3套候選方案;2)對樣品進行酶切連接、PCR擴增及瓊脂糖凝膠電泳;3)電泳結果各樣品目標範圍內無特異條帶,且通過BMP圖片解析軟體如bmp2txt獲得電泳膠圖上各位點灰度值,利用灰度值模擬模板量進行擴增倍率分析,模板範圍擴增倍率一致性高者即為最佳方案。前述的基於測序和SLAFseq技術的大規模樣品基因分型方法,其中所述步驟3)二級引物庫是為了利用高通量測序特點,節約測序成本,特為大樣本量項目設計的擴增引物,後文中稱二級引物,所述二級引物差異序列長度為:T7bp,通過生物信息學方法對ATCG組合進行相似性評估,剔除相似度高序列,保 障組合內序列完全識別。所述的二級引物庫中的引物序列如SEQ ID NO 4 112所示。前述的基於測序和SLAFseq技術的大規模樣品基因分型方法,其中所述二級引物結合Solexa高通量測序標準引物,測序樣品數量將以乘積形式增加,如=Solexa引物用12個,二級引物用96個,即可實現I次1152個樣品的測序和數據分類需求;前述的基於測序和SLAFseq技術的大規模樣品基因分型方法,其中所述步驟4)中Solexa技術是一種基於邊合成邊測序技術(Sequencing-By-Synthesis, SBS)的新型測序方法。通過利用單分子陣列實現在小型晶片(FlowCell)上進行橋式PCR反應。由於新的可逆阻斷技術可以實現每次只合成一個鹼基,並標記螢光基團,再利用相應的雷射激發螢光基團,捕獲激發光,從而讀取鹼基信息。前述的基於測序和SLAFseq技術的大規模樣品基因分型方法,其中所述步驟4)中雙端測序的優勢如下:a)相對於單端測序,雙端測序序列有效長度增倍,標記比對、定位更為準確;b) _■級引物序列測序重複I次,提聞喊基準確性,喊基錯誤率由0.01降低到
0.0001。前述步驟4)的標準測序接頭為:5,-GATCGGAAGAGCACACGTCT-3,5』-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3』 前述的基於測序和 SLAFseq 技術的大規模樣品基因分型方法,其中打分體系對SLAF標記分型結果給出基於SNP和深度觀測的條件錯誤率,錯誤率的計算使用貝葉斯公式,具體方法如下:1)假設某一標記位點有m個等位基因,記為{Al,A2,…Am},則對特定個體而言,在該位點所有可能的分型種類有mX (m+1)/2種,每種基因型的先驗概率為該基因型出現的理論頻率,因此純合基因型先驗概率為1/πΓ2,雜合基因型先驗概率為2/πΓ2;對於二倍體物種,單次測序雜合基因型兩個等位基因Ai,Aj間因測序錯誤產生交換的概率計算如下:
權利要求
1.於SLAFseq的大規模樣品基因分型方法,其基於SLAFseq技術降低基因組複雜度並進行高通量測序,對大規模樣品進行標記開發及遺傳圖譜繪製、全基因組關聯分析,包括如下步驟: 1)對經性狀鑑定的各樣品的DNA進行檢測; 2)對樣品基因組的複雜性進行降低處理,獲得複雜性降低的DNA樣品; 3)利用二級引物庫中的引物對複雜性降低後的樣品DNA進行PCR擴增,使特異性長度片段擴增前后豐度一致; 4)將擴增後的特異性長度片段連接標準測序接頭,利用高通量測序方式進行測序; 5)比較測序結果,獲得SLAF標記,進行遺傳圖譜繪製或全基因組關聯分析。
2.權利要求1所述的方法,其特徵在於,大規模樣品來自動物、植物或微生物。
3.權利要求1所述的方法,其特徵在於,所述樣品為自然群體或遺傳分離群體;所述遺傳分離群體為經鑑定的性狀分離群體,包括F2、BCl、DH等目標性狀分離的群體。
4.權利要求1所述的方法,其特徵在於,步驟2)中DNA複雜性降低方法是任何有選擇性的減少基因組複雜度的方法,包括限制性內切酶酶切產物PCR擴增或酶切產物選擇性吸附。
5.權利要求4所述的方法, 其特徵在於,酶切方法滿足以下條件: a)保證序列標籤在基因組上分布均勻; b)選擇特定長度的酶切片段能夠保證序列標籤的數量; c)選擇特定長度的酶切片段避免落在基因組高度重複區。
6.權利要求4所述的方法,其特徵在於,酶切方法的確定需進行預實驗,包括如下步驟: 1)通過生物信息學模擬,獲得廣3套候選方案; 2)對樣品進行酶切、二級引物連接、PCR擴增及瓊脂糖凝膠電泳; 3)電泳結果各樣品目標範圍內無特異條帶,且通過圖片解析軟體獲得電泳膠圖上各位點灰度值,利用灰度值模擬模板量進行擴增倍率分析,模板範圍擴增倍率一致性高者即為可用的酶切方法。
7.權利要求1所述的方法,其特徵在於,所述步驟3)二級引物庫序列如SEQ IDN0.4 112所示。
8.權利要求1中所述的方法,其特徵在於,所述步驟4)的高通量測序方式為Solexa雙端測序。
9.權利要求1中所述的方法,其特徵在於,所述步驟5)的比較測序結果包括特異性長度片段多態性和單核苷酸多態性分子標記。
10.利要求1-9任一所述的方法在遺傳圖譜繪製或全基因組關聯分析中的應用。
全文摘要
本發明提供一種基於SLAF-seq技術進行大規模樣品基因分型的方法,其是利用SLAF-seq技術降低基因組的複雜度,並對大規模樣品進行基因分型。利用該技術對基因組進行高通量測序,對樣品進行標記開發、遺傳圖譜繪製及全基因組關聯分析。該方法與傳統的方法相比優點在於通量大幅度提高,成本大幅度降低。該方法主要應用於標記開發、遺傳圖譜繪製及全基因組關聯分析。
文檔編號C12Q1/68GK103088120SQ20121050112
公開日2013年5月8日 申請日期2012年11月29日 優先權日2012年11月29日
發明者鄭洪坤 申請人:北京百邁客生物科技有限公司