新四季網

大豆微衛星標記位點開發方法與微衛星標記位點內的微衛星標記的長度檢測方法與流程

2023-10-11 18:11:59 2

本發明涉及生物技術領域,特別涉及一種大豆微衛星標記位點開發方法與微衛星標記位點內的微衛星標記的長度檢測方法。



背景技術:

微衛星標記又稱短串聯重複序列(short tandem repeats,STR)或簡單重複序列(simple sequence repeats,SSR),指由2個以上核苷酸為重複單元串聯重複構成。微衛星標記位點指的是在基因組上含有微衛星標記的座位,微衛星標記位點在基因組上數量豐富且均勻分布,微衛星標記位點的開發指的是尋找基因組上的微衛星標記位點的過程。不同樣本中,同一個微衛星標記位點內的微衛星標記的重複單元的重複次數可能不同,在樣本間存在長度變異,因此微衛星標記位點的多態性主要指同一個微衛星標記位點的不同微衛星標記的長度多態性。微衛星標記檢測技術指的是檢測微衛星標記位點中的微衛星標記的長度的技術。不同樣本的微衛星標記的長度多態性可以用來對樣本的身份進行鑑定,因此,微衛星標記技術的應用十分廣泛,包括生物多樣性鑑定、動植物品種指紋身份證鑑定等等。

傳統的大豆微衛星標記位點的開發與檢測包括以下步驟:基因組提取、基因組片段化、連接接頭、擴增、與簡單重複序列雜交、純化雜交產物、雜交產物克隆、克隆產物大腸桿菌轉化、挑取單克隆、對每一個單克隆的目標位點進行一代測序、分析測序結果獲得微衛星標記位點、在多個大豆樣本中檢驗微衛星標記位點的多態性、開發出多態性高的微衛星標記位點、逐一擴增並電泳檢測每一個待檢測的樣品中的每一個待檢測的微衛星標記位點中的微衛星標記。

在實現本發明的過程中,發明人發現現有技術至少存在以下問題:

大豆微衛星標記位點的開發與檢測流程複雜、通量低、極其耗時費力;其次,微衛星標記位點的電泳檢測的解析度低,檢測結果不準確,準確的結果需要參考樣本等進行校正。由此派生的問題包括:開發出來的微衛星標記位點少,通常200個以內,佔基因組上所有微衛星標記位點的1%左右;用於檢驗微衛星標記位點多態性的大豆樣本也少,通常在數十個左右,因此多態性檢證結果不準確;微衛星標記位點的側翼序列保守性未知,影響擴增微衛星標記位點的引物的通用性;檢測的微衛星標記位點的數量有限,一般在一個待檢測的樣品中檢測數十個微衛星標記位點,導致建立的樣本的DNA身份證信息不完整、不準確。



技術實現要素:

為了解決現有技術的問題,本發明實施例提供了一種大豆微衛星標記位點開發方法與微衛星標記位點內的微衛星標記的長度檢測方法。所述技術方案如下:

一方面,本發明實施例提供了一種大豆微衛星標記位點開發方法,所述方法包括:

將n個具有多態性的大豆樣本等質量混合,獲得混合樣本,其中n>1;

提取所述混合樣本的基因組;

將所述混合樣本的基因組片段化,獲得基因組片段;

將多個具有簡單重複序列的探針作為探針組,利用所述探針組中的每個探針分別與所述基因組片段進行雜交,獲得多個雜交溶液,對多個所述雜交溶液中成功雜交的基因組片段分別進行純化,得到多個純化的雜交基因組片段;

將多個所述純化的雜交基因組片段等質量混合後,利用高通量測序檢測混合後的所述純化的雜交基因組片段,獲得第一高通量測序片段;

從所述第一高通量測序片段中,篩選有效的所述高通量測序片段,所述有效的高通量測序片段包括微衛星標記位點內的微衛星標記;

根據所述有效的高通量測序片段中的微衛星標記的兩側序列的同源性對所述有效的高通量測序片段進行分類,同一類的所述有效的高通量測序片段為同一個微衛星標記位點的所述有效的高通量測序片段,若同一個所述微衛星標記位點的所述有效的高通量測序片段的條數≥α1,則成功開發一個所述微衛星標記位點,其中,α1為第一判定閾值且α1≥(高通測序深度×有效的高通量測序片段的比例/基因組上能檢測到的微衛星標記位點數)×概率保證。

通常,為了便於純化所述雜交溶液中成功雜交的基因組片段,可以對探針進行功能化標記,例如可以

利用生物素標記的具有簡單重複序列的探針與所述基因組片段進行雜交,獲得雜交溶液;

利用鏈黴親和素磁珠純化所述雜交溶液中成功雜交的基因組片段,獲得純化的基因組片段。

在上述步驟中由於探針具有生物素標記,使得成功雜交的基因組片段也被生物素標記,從而可以利用鏈黴親和素磁珠從所述雜交溶液中純化出來。所述利用生物素標記和鏈黴親和素磁珠純化的技術為公知技術。

具體地,α1≥20。

具體地,所述微衛星標記指由≥2個鹼基組成的重複單元串聯重複構成的序列。

具體地,所述有效的高通量測序片段中的所述微衛星標記的兩側序列的鹼基數均≥1個,且所述有效的高通量測序片段中的所述微衛星標記中至少有一側的序列的鹼基數≥10個。

具體地,選擇所述n個具有多態性的大豆樣本的方法包括:選擇外部形態不同的大豆樣本、生物分類不同的大豆樣本、標記互不相同的大豆樣本或不同生態區域的野生資源的大豆樣本。

具體地,所述探針的數量為12個,每個所述探針的簡單重複序列中的重複單元為CT、GA、TG、AC、TA、TGT、CCA、ATC、CCT、AGA、ATG或CAA,每個所述探針的簡單重複序列的重複次數為6~20,優選為6~15,例如重複次數為8或12。

具體地,所述探針的序列如序列表中SEQ IN NO:1-SEQ IN NO:12所示。

另一方面,本發明實施例提供了一種上述開發方法成功開發的微衛星標記位點內的微衛星標記的長度檢測方法,所述檢測方法包括:

從成功開發的所述微衛星標記位點中,選擇待檢測的微衛星標記位點;

利用多重擴增引物擴增所述待檢測的微衛星標記位點內的微衛星標記,得到擴增產物,將所述擴增產物進行高通量測序,得到第二高通量測序片段,通過分析所述第二高通量測序片段,獲得所述微衛星標記位點內的微衛星標記的長度。

具體地,所述從成功開發的所述微衛星標記位點中,選擇所述待檢測的微衛星標記位點的方法包括:

選擇所述待檢測的微衛星標記位點的標準為H值最大的所述微衛星標記位點,其中,H值為所述微衛星標記位點的多態性指數,其中,i為按所述微衛星標記位點的所述有效的高通量測序片段中的微衛星標記的長度進行分類時,第i個類別,i為自然數;ai為第i個類別的有效的所述高通量測序片段的數目佔總的有效的所述高通量測序片段的數目的比例。

具體地,製備所述多重擴增引物的方法包括:

從選擇的所述待檢測的微衛星標記位點的所有所述有效的高通量測序片段中,提取所述微衛星標記並挑選出最長的所述微衛星標記作為多重擴增引物的模版序列的微衛星標記;

從選擇的所述待檢測的微衛星標記位點的所有所述有效的高通量測序片段中,提取所述微衛星標記的左側序列並挑出長度大於α2個鹼基的所有序列,從挑選出的所述所有序列中,挑選出頻率最高的序列,以所述頻率最高的序列作為參考序列,將所述參考序列與所有的所述微衛星標記的左側序列進行比對,在所述頻率最高的序列中獲得每一個鹼基的覆蓋倍數和變異頻率;在所述頻率最高的序列中,將所述覆蓋倍數≤1/α3或所述變異頻率≥α3的鹼基變為N後作為所述多重擴增引物的模板序列的左側序列,其中,N為A、T、C和G四種鹼基中任意一種及以上的鹼基;α2為第二判定閾值,α2=(所述第一高通量測序片段的平均長度-所述多重擴增引物的微衛星標記位點的長度)÷2;α3為第三判定閾值,α3≥5×(1-所述第一高通量測序片段的準確度);

按照與所述多重擴增引物的模板序列的左側序列相同的方法,獲得多重擴增引物序列的模板序列的右側序列;

將所述多重擴增引物的模板序列的左側序列、所述多重擴增引物的模板序列的微衛星標記和所述多重擴增引物的模板序列的右側序列依次連接,得到所述微衛星標記位點的多重擴增引物的模板序列,利用所述微衛星標記位點的多重擴增引物的模板序列,獲得所述多重擴增引物。

具體地,獲得所述微衛星標記位點內的所述微衛星標記的長度的方法為:去除所述第二高通量測序片段中的所述微衛星標記後,獲得所述第二高通量測序片段的左邊界序列和所述第二高通量測序片段的右邊界序列;利用所述左邊界序列和所述右邊界序列將所述第二高通量測序片段中的每個片段比對到所述待檢測的微衛星標記位點上;截取每一個所述待檢測的微衛星標記位點的所述第二高通量測序片段中的所述微衛星標記;將獲得的所述微衛星標記按長度進行分類,並計算第i個類別的真實度Ri=Ni/Nmax,其中,i為按所述微衛星標記位點的所述有效的高通量測序片段中的微衛星標記的長度進行分類時,第i個類別,Ni為所述第i個類別的所述第二高通量測序片段的數量,Nmax為所有類別的所述第二高通量測序片段的數量的最大值;若所述真實度Ri≥α4,則所述第i個類別的所述微衛星標記的長度為所述微衛星標記位點內的所述微衛星標記的長度,若所述真實度Ri<α4,則所述第i個類別的微衛星標記的長度不為所述微衛星標記位點內的所述微衛星標記的長度,其中,α4為第四判定閾值且α4=0.6。

具體地,將所述混合樣本的基因組片段化的方法為機械打斷或酶切。

本發明實施例提供的技術方案帶來的有益效果是:本發明提供的大豆微衛星標記位點的開發與檢測技術簡單、快捷、高通量、全面且準確。時間消耗由1~2年縮短到1~2天;開發出的微衛星標記位點數量由基因組中所有微衛星標記位點的1%左右提高到接近100%;檢驗微衛星標記位點的多態性的大豆樣本的數量由數十個提升到不受限制,多態性結果檢驗的準確性大為提高;可獲得微衛星標記位點的側翼序列的保守性,確保了擴增微衛星標記位點的引物的通用性;將多個微衛星標記位點作為一個位點檢測,而不是逐一檢測,多個待檢測的大豆樣本只進行一次檢測,而不是多次檢測,極大地減少了微衛星標記位點檢測的工作量,因此,檢測的微衛星標記位點的數量幾乎不受限制。微衛星標記位點檢測的結果為鹼基,正確率接近100%;微衛星標記位點檢測解析度提升至最高分率:單鹼基;不再需要參照品種對檢測結果進行校正。

具體實施方式

為使本發明的目的、技術方案和優點更加清楚,下面將對本發明實施方式作進一步地詳細描述。

本發明實施例中未註明或詳細描述的操作流程或操作規範均為普通分子生物學技術人員所熟知的操作。本發明實施例中未註明的試劑或生物材料均為市場上銷售的常用試劑或生物材料,均為普通分子生物學技術人員所熟知的,且可以在市場上購買到。

實施例

大豆微衛星標記位點的開發方法:

將n個具有多態性的大豆樣本等質量混合,獲得混合樣本,其中n>1。

具有多態性的大豆樣本包括:外部形態不同的大豆樣本(形態多態性)、生物分類(如不同變種或品種)不同的大豆樣本、標記(如蛋白質標記)互不相同的大豆樣本或不同生態區域的野生資源大豆樣本,其中,所選擇的大豆樣本越多(n值越大),多態性越豐富,所開發出的微衛星標記位點的適用性越廣。本實施例中,待開發的微衛星標記位點的物種為大豆,所選擇的大豆為不同的大豆品種,它們分別是:科豐14、平99016、菏豆19號、東豆339、中黃13、克山1號、遼豆24、臨豆10號、中黃57、天隆一號、合農61號、中黃39、齊黃33、齊黃34、合豐53、中黃35、華疆3號、臨豆九號、中黃30、中豆37、徐豆14、冀豆17、墾豐25號、南農32、鄭196、吉育95號、南農31、東生3號、奎豐1號、合豆5號、湘春豆26、北豆20、九農35、吉育94號、華夏1號和周豆19號,共36個品種,這些大豆品種是中國廣泛使用的品種,公開且公知,於市場上採購獲得。其中,微衛星標記指由≥2個鹼基組成的重複單元串聯重複構成的序列。

取以上36個大豆品種的等質量葉片並混合,提取混合樣本的基因組,提取方法按照天根生化科技(北京)有限公司的貨號為DP320的新型植物基因組提取試劑盒的操作手冊進行。在本實施例中所選的大豆樣本為葉片,作為公知常識,該大豆樣本還可以取自種子等部位。

將混合樣本的基因組片段化,獲得基因組片段。具體地,將混合樣本的基因組片段化的方法包括:機械打斷或酶切。基因組片段化的長度控制在高通量測序時可檢測的片段長度範圍內。本實施例中,高通量測序採用PROTON高通量測序儀的PI晶片,其檢測長度約為200bp,因此,獲取的基因組片段的長度的峰值也儘量控制在200bp附近。本實施例採用自動聲波聚焦破碎儀Covaris S220(美國Covaris生產,型號為S220)破碎混合樣本的基因組,破碎方法按該儀器的操作手冊《DNA Shearing with S220/E220Focused-ultrasonicator》(版本號:010308Rev G)中所記載的獲取200bp(峰值)目標片段的方法進行,破碎後即獲得混合樣本的基因組片段,採用美國Quawell公司生產的Q5000分光光度計按其雙鏈DNA的程序對基因組片段進行檢測後,將濃度稀釋或濃縮到100ng/μL,獲得基因組片段。

將多個生物素標記的具有簡單重複序列的探針作為探針組,利用探針組與基因組片段進行雜交,獲得雜交溶液。具有簡單重複序列的探針中的重複單元的鹼基數≥2個。具體地,探針的簡單重複序列中的重複單元為CT、GA、TG、AC、TA、TGT、CCA、ATC、CCT、AGA、ATG或CAA,這12個探針可以與所有可能的2鹼基和3鹼基為重複單元的微衛星標記進行雜交,因此,可以用於所有物種中的基因組片段中的微衛星標記的釣取。前期實驗中,我們檢測了不同探針長度鉤取微衛星標記的效率,發現探針的簡單重複序列的重複次數為6~20時,效率較高,優選的重複次數為6~15,例如8或12。在本實施例中,該探針組包括12個探針,這12個探針的序列分別如序列表中SEQ IN NO:1-SEQ IN NO:12所示。以上探針均由北京擎科新業生物技術有限公司合成並進行5』端生物素標記。前期的實驗表明,將不同探針分別釣取基因組片段中的微衛星標記的效率優於將所有探針混合後釣取基因組片段中的微衛星標記的效率,因此,在本實施例中利用不同探針分別釣取基因組片段中的微衛星標記,具體地,將以上每個探針分別用無酶水溶解為等摩爾濃度(10pM/μL)的溶液,取以上探針組中的12個探針各1μL分別與5μg混合樣本的基因組片段混勻後雜交,分別獲得12種雜交溶液。雜交的程序為:95℃10分鐘,65℃10分鐘,37℃10分鐘。

利用鏈黴親和素磁珠純化雜交溶液中成功雜交的基因組片段,獲得純化的基因組片段。具體地,利用鏈黴親和素磁珠分別純化12種雜交溶液,其純化過程為:將獲得的12種中的1種雜交溶液置於磁力架(美國Invitrogen公司生產)上,至雜交溶液澄清後,吸去溶液,用無酶水清洗磁珠2次,取10μL無酶水與鏈黴親和素磁珠混合,於PCR儀中95℃加熱5分鐘,迅速置於磁力架上,獲得的溶液即為第一個探針的純化的雜交基因組片段。按與獲取的第一個探針的純化的雜交基因組片段相同的方法,依次獲取所有12個純化的雜交基因組片段,將它們混合在一起,即最終獲得所有探針的純化的雜交基因組片段。為了能夠成功純化雜交基因組片段,在本實施例中,採用生物素標記的具有簡單重複序列的探針配合鏈黴親和素磁珠的方式,在其它實施例中,也可以採用其它的方式進行基因組片段的雜交和純化。

利用二代高通量測序檢測純化的雜交基因組片段,獲得第一高通量測序片段。利用DNA文庫製備試劑盒(由英國NEB公司生產,貨號為E6270L)並按該試劑盒的操作手冊構建二代高通量測序文庫,利用獲得的二代高通量測序文庫和試劑盒Ion PI Template OT2 200Kit v2(美國invirtrigen公司生產,貨號為4485146)進行測序前的ePCR(Emulsion PCR,乳化聚合酶鏈反應)擴增,操作方法按該試劑盒的操作手冊進行,獲得ePCR擴增產物。利用ePCR擴增產物和試劑盒Ion PI Sequencing 200Kit v2(美國invirtrigen公司生產,貨號為4485149)在Proton二代高通量測序儀上進行高通量測序,操作方法按該試劑盒的操作手冊進行。在本實施例中,高通量測序量設置為10M測序片段(1M=100萬),測序長度設置為500cycle(循環),測序結束後,獲得第一高通量測序片段。

從第一高通量測序片段中,篩選有效的高通量測序片段。其中,有效的高通量測序片段包括微衛星標記位點內的微衛星標記,有效的高通量測序片段中的微衛星標記的兩側序列的鹼基數均≥1個,且有效的高通量測序片段中的微衛星標記中至少有一側的序列的鹼基數≥10個。分析第一高通量測序片段中的每一條片段是否含有微衛星標記,去掉不含有微衛星標記的第一高通量測序片段。在保留下來的第一高通量測序片段中,分析微衛星標記的兩側序列的鹼基數是否均≥1個,如果是,則表明微衛星標記在第一高通量測序片段中是完整的,這一點是必要的,因為微衛星標記的多態性是指微衛星標記的長度多態性,只有確保微衛星標記是完整的,才能正確獲得微衛星標記的長度多態性,以便正確地進行後續分析。微衛星標記的兩側序列均小於10個鹼基的第一高通量測序片段無法準確地進行後續的同源性分析,會因為序列過短而引入誤差,因此,進一步去掉微衛星標記的兩側序列均小於10個鹼基的第一高通量測序片段。經過以上流程,最終保留下來的第一高通測序片段即為有效的高通量測序片段。

其中,在分析第一高通量測序片段中的每一條片段是否含有微衛星標記時,可以採用現有技術中常用的分析軟體進行分子,也可以簡單的通過人工對每個第一高通量測序片段進行判斷。

根據有效的高通量測序片段中的微衛星標記的兩側序列的同源性對有效的高通量測序片段進行分類,同一類的有效的高通量測序片段為同一個微衛星標記位點的有效的高通量測序片段,若同一個微衛星標記位點的有效的高通量測序片段的條數≥α1,則成功開發一個微衛星標記位點,其中,α1為第一判定閾值且α1≥(高通測序深度×有效的高通量測序片段的比例/基因組上能檢測到的微衛星標記位點數)×概率保證。α1的具體取值可根據高通量測序的深度進行調整。將有效的高通量測序片段中的微衛星標記去掉,將剩餘的兩側序列合併成一條完整的序列,採用軟體Megablast(版本2.2.26)在合併後的完整的序列間進行成對的比對分析,比對的各參數設置為:參數-e設置為1e-5;參數-p設置為0;參數–v設置為5000;參數-m設置為1。將具有同源性(同源性指在DNA序列上相似)的有效的高通量測序片段歸為同一類,同時計算類別內包含的有效的高通量測序片段的數量,若包含的有效的高通量測序片段的數量≥α1條時,則該類別的有效的高通量測序片段為一個成功開發的微衛星標記位點的高通量測序片段。其具體原理如下:基因組上同一個微衛星標記位點在高通量測序過程中,可能被檢測到多次,由於高通量測序的對象為包含了多個具有多態性的樣本的混合樣本,因此,同一個微衛星標記位點中的微衛星標記的長度存在多態性變異,微衛星標記位點的兩側序列也存在變異,因此,不能要求同一個微衛星標記位點的所有有效的高通量測序片段的序列完全相同,只能根據高通量測序片段的同源性來判定是否為同一微衛星標記位點,其中,高通量測序片段包括微衛星標記與微衛星標記的兩側序列,因此,高通量測序片段的同源性可以是微衛星標記的同源性或者微衛星標記的兩側序列的同源性。不同的微衛星標記位點中的微衛星標記可能相同,因此,不能根據微衛星標記的同源性判定有效的高通量測序片段是否屬於同一微衛星標記位點,只能根據微衛星標記位點的兩側序列的同源性判定有效的高通量測序片段是否屬於同一微衛星標記位點。之所以要求同一個微衛星標記位點的有效的高通量測序片段的數量≥α1是為了防止諸如樣本被汙染等難以控制的因素造成的假陽性。α1≥3是生物信息學中確認一個片段真實存在時,一般採用的閾值,α1的具體取值可根據高通量測序的深度進行調整,可按以下公式計算:α1≥(高通測序深度×有效的高通量測序片段的比例/基因組上的能檢測到的微衛星標記位點數)×概率保證,其中,在統計上,概率保證一般取值為5%或1%。本實施例中,高通量測序的深度為1000萬條,有效的高通量測序片段的比例一般為40%左右,一般基因組上的能檢測到的微衛星標記位點為1萬個左右,因此,平均每個微衛星標記位點包含的有效的高通量測序片段為400條,實際的微衛星標記位點的測序深度呈現正態分布,所以,一般低於平均有效的高通量測序片段數1/20(5%)的分布較少。因此,本實施例中,α1取值為20條。按以上流程和標準,本實施例中,共成功開發出18002個微衛星標記位點。

選擇待檢測的微衛星標記位點的標準為H值最大的微衛星標記位點,其中,H值為微衛星標記位點的多態性指數,其中,i為按微衛星標記位點的有效的高通量測序片段中的微衛星標記的長度進行分類時,第i個類別,i為自然數;ai為第i個類別的有效的高通量測序片段的數目佔總的有效的高通量測序片段的數目的比例。如表1的假定的微衛星標記位點按有效的高通量測序片段中的微衛星標記的長度進行分類,共有3種:(TG)20、(TG)21和(TG)22,因此S=3;該微衛星標記位點的總的有效的高通量測序片段的數目為40,其中,第1種微衛星標記(TG)20的數目為3條,因此a1=3/40=7.50%,同樣計算a2=32/40=80%,a3=5/40=12.50%。將以上值代入H的計算公式獲得該微衛星標記位點的H值為0.98。

按與表1的假定的微衛星標記位點相同的計算方法,計算本實施例中所有成功開發出的所有微衛星標記位點的H值,所有獲得的微衛星標記位點的H值由大到小排列,選擇排序前50位的微衛星標記位點為本實施中待檢測的樣本中需要檢測的微衛星標記位點。參數50根據實際需要定,例如,在大豆純度鑑定時,1個微衛星標記位點即可,在大豆指紋圖譜構建時,一般選擇50個左右的微衛星標記位點,在品種間實質性派生關係分析時,則要求選擇大概300個微衛星標記位點才能滿足要求。之所以選擇H值最大的微衛星標記位點,是因為它們的區分能力最強,用最少的微衛星標記位點可以儘可能區分更多的樣本並提供儘可能多的信息,而區分樣本是微衛星標記技術最核心的任務。

提取微衛星標記位點的所有有效的高通量測序片段中的微衛星標記,如表1所列的假定的微衛星標記位點內的微衛星標記為3條(TG)20、32條(TG)21和5條(TG)22的集合。提取微衛星標記位點的所有有效高通量測序片段中的微衛星標記的左側序列組成微衛星標記位點的左側序列,如表1的假定的微衛星標記位點的左側序列為3條(A)2G(A)2、5條(A)87G(A)3、27條(A)86G(A)3和5條(A)81G(A)4的集合。同樣的方法,獲得微衛星標記位點的右側序列,如表1的假定的微衛星標記的右側序列為3條(A)4G(A)80、5條(A)3G(A)2、27條(A)3G(A)81和5條2G(A)85的集合。

大豆微衛星標記位點內的微衛星標記的長度的檢測方法:

從成功開發的微衛星標記位點中,選擇待檢測的微衛星標記位點,設計擴增待檢測的微衛星標記位點的多重擴增引物。下面以表1中的假定的微衛星標記位點為例,介紹如何選擇微衛星標記位點並設計多重擴增引物。

設計擴增選擇的微衛星標記位點的多重擴增引物的方法包括:從選擇的微衛星標記位點的所有有效的高通量測序片段中,提取微衛星標記,從中挑選出最長的微衛星標記,作為多重擴增引物設計的微衛星標記;如表1的假定的微衛星標記位點中,(TG)22為最長的微衛星標記,因此,(TG)22為該微衛星標記位點的多重擴增引物設計的模板序列的微衛星標記。之所以選擇最長的微衛星標記是保證所設計的多重擴增引物所擴增的微衛星位點的長度不會超過多重PCR的擴增能力,從而減少微衛星檢測時的數據缺失。

從選擇的微衛星標記位點的所有有效的高通量測序片段中,提取微衛星標記的左側序列,從中挑出長度大於α2個鹼基的所有序列,α2為第二判定閾值,α2=(二代高通量測序技術所能檢測的第一高通量測序片段的平均長度-多重擴增引物的微衛星標記位點的長度)÷2。本實施例中,第一高通量測序片段的平均長度為200bp,多重擴增引物設計的微衛星標記的長度為44(TG重複22次,長度為44),因此α2=78bp。因此,微衛星標記的左側序列中,挑出的長度大於α2的所有序列為5條(A)87G(A)3、27條(A)86G(A)3和5條(A)81G(A)4的集合。從挑選出的所有序列中,挑選出頻率最高的序列,例如上述挑出的長度大於α2的所有序列中,頻率最高的序列為(A)86G(A)3。以頻率最高的序列作為參考序列與所有的微衛星標記的左側序列進行比對,獲得頻率最高的序列中每一個鹼基的覆蓋倍數和變異頻率。例如,表1的假定的微衛星標記位點中,應該以(A)86G(A)3為參考序列與所有的左側序列進行比對,比對時,參考序列(A)86G(A)3的5』端的第1個鹼基為A,其被覆蓋了5+27=32倍,由於該位置全是A,因此,變異頻率為0,(A)86G(A)3的5』端的第87個鹼基為G,其同樣被覆蓋了5+27=32倍,其中,不為G的鹼基有5個(在5條(A)81G(A)4中),因此變異頻率為5÷(5+27+5)=0.175,按以上方法,計算獲得(A)86G(A)3中每一個鹼基的覆蓋倍數和變異頻率。將頻率最高的序列中的覆蓋倍數≤1/α3或變異頻率≥α3的鹼基變為N後作為多重擴增引物設計的左側序列,其中,N為A、T、C和G四種鹼基中任意一種及以上的鹼基;α3為第三判定閾值,α3≥5×(1-第一高通量測序片段的準確度),α3的具體值根據多重擴增引物的通用性的要求的嚴格程度和高通量測序的深度進行調整,要求通用性越強或高通量測序深度越深,則α3的值越小。在本實施例中,高通量測序的準確度為99%,因此α3≥5×(1-99%)=5%,本實施例要求所設計的多重擴增引物的通用性強,因此,α3取值為5%。因此,在表1的假定的微衛星標記位點中,將出頻率最高的序列((A)86G(A)3)中的覆蓋倍數≤1/5%=20或變異頻率≥0.05的鹼基記為變為N後作為多重擴增引物的模板序列的左側序列。對於(A)86G(A)3第1個鹼基,其被覆蓋了32倍且變異頻率為0,因此,不改變為N,對於(A)86G(A)3第86個鹼基,其覆蓋倍數32倍但變異頻率為0.175≥0.05,因此,將該鹼基變為N,按此規則,在表1的假定的微衛星標記位點中,多重擴增引物的模板序列的左側序列為(A)85NNN(A)2。變異頻率高的鹼基混合樣本中變異度大,因此,所設計的多重擴增引物通用性差,覆蓋倍數低的鹼基誤差大,把它們都變成N後,在後續的多重引物設計流程中,就可以避開這些鹼基位點,以確保設計出來的多重擴增引物可以在不同樣本間通用。傳統的微衛星標記開發由於工作量的限制,一個微衛星標記的邊界序列往往只能被檢測到一次或少數幾次,不能獲得並避開引物設計區的變異鹼基,難以保障擴增引物的通用性,易造成數據缺失。

按與多重擴增引物的模板序列的左側序列完全相同的方法,獲得多重擴增引物的模板序列的右側序列。在表1的假定的微衛星標記位點中,多重擴增引物的模板序列的右側序列為(A)2NNN(A)80。將多重擴增引物的模板序列的左側序列、多重擴增引物的模板序列的微衛星標記和多重擴增引物的模板序列的右側序列依次連接,得到微衛星標記位點的多重擴增引物的模板序列,利用微衛星標記位點的多重擴增引物的模板序列,獲得多重擴增引物。表1中的假定的微衛星標記位點的多重擴增引物的模板序列為(A)85NNN(A)2(TG)22(A)2NNN(A)80。

按與上述相同的方法與參數,獲得本實施中最終選擇的50個微衛星標記位點的多重擴增引物的模板序列。

表1一個假定的微衛星標記位點的第一高通量測序片段

表1所示的第一高通量測序片段類型中,帶下劃線的部分代表微衛星標記,括號內的字母表示微衛星標記的重複單元,括號後的數字代表重複單元的重複次數。

利用所有微衛星標記位點的多重擴增引物的模板序列設計擴增選擇的微衛星標記位點的多重擴增引物。具體方法如下:將獲得的50個微衛星標記位點的多重擴增引物的模板序列用100個N連接起來,構建成一個人工參考基因組。登錄多重PCR引物在線設計網頁https://ampliseq.com/,在「Application type」選項選擇「DNA Hotspot designs(single-pool)」。並在「Select the genome you wish to use」選項中選擇「Custom」後,上傳構建人工參考基因組。「DNA Type」選項選擇「Standard DNA」。在「Add Hotspot」選項中,填入構建的人工參考基因組中每一個微衛星標記的起始位置與終止位置,最後點擊「Submit targets」按鈕提交並獲得多重擴增引物的序列。本實施例中,所選擇的50個微衛星標記位點中,成功設計了多重擴增引物的微衛星標記位點為46個,這個46個微衛星標記位點即為待檢測的微衛星標記位點。本實施例採用美國賽默飛世爾公司提供的多重PCR技術,其能夠同時擴增多至12000個測試區域,因此,本發明有能力一次性檢測12000個微衛星標記位點,這是傳統的微衛星標記位點檢測能力的12000倍。

通過多重擴增引物擴增待檢測的微衛星標記位點內的微衛星標記,得到擴增產物,將擴增產物進行高通量測序,得到第二高通量測序片段。本實施例中,待檢測的樣本為武漢開發區大豆田中取的100株大豆葉片,將100株大豆葉片等量混合後獲得混合樣本,利用植物基因組DNA提取試劑盒(貨號:DP305,生產公司:天根生化科技(北京)有限公司)按其操作手冊提供的方法提取獲得混合樣本的基因組DNA。採用所設計的46對多重擴增引物和文庫構建試劑盒2.0(由美國LifeTechnology公司生產,貨號為4475345)並按該試劑盒的操作手冊對混合樣本的基因組DNA進行擴增,構建高通量測序文庫,利用獲得的高通量測序文庫和試劑盒Ion PI Template OT2 200Kit v2(美國invirtrigen公司生產,貨號為4485146)進行測序前的ePCR(Emulsion PCR,乳化聚合酶鏈反應)擴增,操作方法按該試劑盒的操作手冊進行,獲得ePCR產物。利用ePCR產物和試劑盒Ion PI Sequencing 200Kit v2(美國invirtrigen公司生產,貨號為4485149)在Proton二代高通量測序儀上進行高通量測序,操作方法按該試劑盒的操作手冊進行。在本實施例中,高通量測序量設置為1M測序片段(1M=100萬),高通量測序長度設置為500cycle(循環),測序結束後,獲得第二高通量測序產物。

通過分析第二高通量測序產物,獲得微衛星標記位點內的微衛星標記的長度。具體方法為:去除第二高通量測序片段中的微衛星標記後,獲得第二高通量測序片段的左邊界序列和第二高通量測序片段的右邊界序列;利用左邊界序列和右邊界序列將第二高通量測序片段中的每個片段比對到待檢測的微衛星標記位點上;截取每一個待檢測的微衛星標記位點的第二高通量測序片段中的微衛星標記;將獲得的微衛星標記按長度進行分類,並計算第i個類別的真實度Ri=Ni/Nmax,其中,Ni為第i個類別的第二高通量測序片段的數量,Nmax為所有類別的第二高通量測序片段的數量的最大值;若真實度Ri≥α4,則第i個類別的微衛星標記的長度為微衛星標記位點內的微衛星標記的長度,若真實度Ri<α4,則第i個類別的微衛星標記的長度不為微衛星標記位點內的微衛星標記的長度,其中,α4為第四判定閾值。微衛星標記位點內的微衛星標記的多態性是由於微衛星標記中的簡單重複序列的重複次數不一致造成的長度多態性,因此,微衛星標記位點的檢測主要是指檢測微衛星標記位點內的微衛星標記的長度。一般的物種為二倍體,如果樣本是純合的,那麼,同一個微衛星標記位點內應該只包含一種微衛星標記的等位位點,如果樣本是雜合的,則同一個微衛星標記位點有2個不同微衛星標記的等位位點。如果樣本是多倍體,如小麥和棉花,則判定標準也應該做相應調整。微衛星標記位點在進行多重擴增時,微衛星標記擴增可能會產生滑動,因此,在第二高通量測序片段中,部分由於滑動產生的微衛星標記的長度與混合樣本中的真實的微衛星標記的長度不相同,從而形成幹擾噪音,真實度Ri可以反應了幹擾噪音的強弱,Ri值越大,則幹擾越小。因此,需要設定一個真實度的判定閾值α4以確定第i種類別中的微衛星標記是否真實存在。在缺乏已有參考資料的情況下且為純合體(一個位點只可能有一種基因型)時,α4一般取值為0.6;若為雜合體時,則可利用0.6/X作為α4的值,其中,X為待檢測物種的倍性水平,例如若為4倍體,則α4的值為0.6/4=0.15。若已知的滑動產生的微衛星標記幹擾的大小,則可以制定更具體的標準。例如,當已知某個微衛星標記位點在100次檢測中,有95次以上的滑動產生的幹擾微衛星標記的比例均小於0.3,那麼,我們可以將α4的取值確定為0.3,那麼,我們有95%的置信度保障我們獲得的第i個類別的微衛星標記的基因型是真實存在的。值得一提的是,若α4取值較大,則判定微衛星標記真實存在時犯錯的概率就較低,但可能將部分真實存在的微衛星標記誤判為不存在;相反,若α4取值較小,則更多真實存在的微衛星標記將被判斷出來,但判定微衛星標記真實存在時犯錯的概率就較高。因此,本實施例中α4的取值只是其中一種方式,需要根據實際需要或者已有的研究結果進行調整。在本實施例子中,因為缺乏參考資料確定α4的值且待測樣本為二倍體,為純合體,所以,α4取值為0.6。由於滑動產生的虛假的微衛星標記與真實的微衛星標記的擴增產物長度差異不大,而且傳統的微衛星標記的檢測方法多為電泳,無法區分較小的長度差異,即使能夠區分,也無法準確定量,因此,傳統的微衛星標記檢測時,無法計算或無法準確計算Ri的值,造成大量的不準確甚至錯誤的結論。

下面再次假定表1為一個檢測到的微衛星標記位點,說明如何檢測混合樣本中待檢測的微衛星標記位點。在表1中假定的微衛星標記位點的第二高通量測序片段中,截取的微衛星標記為3條(TG)20、32條(TG)21和5條(TG)22的集合,將截取的微衛星標記按重複單元分類,均為TG,保留出現頻率最高的重複單元的微衛星標記,它們為3條(TG)20、32條(TG)21和5條(TG)22的集合;將保留下來的微衛星標記進一步按長度進行分類,共獲得3個類別,分別為(TG)20、(TG)21和(TG)22。在這3個類別中,佔有最多的第二高通量測序片段的數量的類別為第2個類別(TG)21,即Nmax=N2=32。第1個類別(TG)20佔有的第二高通量測序片段的數量為3條,即N1=3,那麼,R1=3/32<α4=0.6,因此,判定第1個類別(TG)20並不是真實存在的,是由滑動引起的。同樣,計算R2=1,R3=5/32,根據同樣的標準,判定,第2個類別是真實存在的,第3個類別不是真實存在的。因此,混合樣本中待檢測的微衛星標記位點內的微衛星標記的長度為類別2的微衛星標記的長度,即表1中假定的待檢測的微衛星標記位點內的微衛星標記的長度為42bp(TG重複21次,因此其長度為21×2bp=42bp)。

按與上述假定的實施例中相同的方法和參數再次進行檢測,成功檢測了本實施例中,46個待檢測的微衛星標記位點內的微衛星標記的長度。

本發明實施例提供的微衛星標記位點的開發方法與檢測方法快捷、簡單、全面、準確。傳統的微衛星標記位點的開發方法,由於工作量大,只能發現基因組中大約1%左右的微衛星標記位點,也只能在小於100個樣本中驗證微衛星標記位點的多態性。對於本發明來說,理論上可以發現基因組上所有微衛星標記位點,針對大豆的微衛星開發的實施例中,發現了1萬多個微衛星標記位點,大致為大豆所有微衛星標記位點的50%,因此,在微衛星標記位點的發現能力上,提高了50倍,如果增加高通量的測序量(這是很容易辦到的),則可以將微衛星標記位點的發現能力提高到80倍甚至接近100倍,都是比較容易實現的。本發明實施例是將微衛星標記位點的開發(發現)與多態性檢測合二為一,並沒有付出額外的工作,但對於傳統的微衛星標記位點的多態性檢測工作來說,是耗時且難以實現的,如在36個大豆品種中檢測18002個微衛星標記位點的多態性,相當於傳統的檢測中做了36*18002=648072次PCR擴增與電泳,這個工作量是不可想像的。除此之外,傳統的微衛星標記位點的開發技術由於工作量大,沒有能力檢測同一個微衛星標記位點的多個序列,所以,不能分析多重擴增引物的保守性,導致開發出來的微衛星標記的多重擴增引物的通用性差,而本發明實施例解決了這一問題。以本發明的大豆微衛星標記位點內的微衛星標記的長度的檢測方法中一次檢測了46個微衛星標記位點為例,對於傳統的檢測方法來說,則需要46次PCR擴增和電泳。對於本發明來說,即使是檢測1萬個微衛星標記位點,其工作量也不會增加,但對於傳統的檢測方法來說,工作量則增加了1萬倍。傳統的檢測方法是通過電泳判定微衛星標記的長度,但電泳是存在誤差的,因此,需要參照品種進行對比,從而增加了檢測的工作量,而且,很少有實驗室能夠有一套完整的參照品種,而本發明實施例採用的是高通量測序,獲得的是鹼基序列,由於所得結果是絕對值,所以沒有誤差,因此,不再需要參照品種。此外,電泳檢測無法分辨不同單株,比如,本發明在大豆檢測中的樣本是100個單株的混合,在電泳結果中,無法準確計算同一個微衛星標記位點的不同微衛星標記的比例,因此,無法分辨單株,從而無法計算雜株率等重要指標。

以上所述僅為本發明的較佳實施例,並不用以限制本發明,凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護範圍之內。

序列表

江漢大學

大豆微衛星標記位點開發方法與微衛星標記位點內的微衛星標記的長度檢測方法

12

PatentIn version 3.4

1

24

DNA

人工序列

1

ctctctctct ctctctctct ctct 24

2

24

DNA

人工序列

2

gagagagaga gagagagaga gaga 24

3

24

DNA

人工序列

3

tgtgtgtgtg tgtgtgtgtg tgtg 24

4

24

DNA

人工序列

4

acacacacac acacacacac acac 24

5

24

DNA

人工序列

5

tatatatata tatatatata tata 24

6

24

DNA

人工序列

6

tgttgttgtt gttgttgttg ttgt 24

7

24

DNA

人工序列

7

ccaccaccac caccaccacc acca 24

8

24

DNA

人工序列

8

atcatcatca tcatcatcat catc 24

9

24

DNA

人工序列

9

cctcctcctc ctcctcctcc tcct 24

10

24

DNA

人工序列

10

agaagaagaa gaagaagaag aaga 24

11

24

DNA

人工序列

11

atgatgatga tgatgatgat gatg 24

12

24

DNA

人工序列

12

caacaacaac aacaacaaca acaa 24

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀