新四季網

一種快速和高效質檢文庫的引物序列組及方法與流程

2023-09-22 06:48:55

本發明屬於高通量測序領域,更具體涉及一種快速和高效對文庫進行質控的引物序列組及方法。
背景技術:
:隨著二代測序技術的發展,常規的液相捕獲流程分為:打斷、建庫和捕獲。此過程從基因組的打斷、捕獲和上機測序和數據分析至少需要6-7天時間,目前除了qbit和2100分別對文庫濃度和片段大小進行質控外,沒有一種有效快速的方法可以對建庫結果的好壞進行評判。而文庫質量的好壞對測序結果具有至關重要的作用,為了對文庫質量進行效地判斷,從而節約時間和測序成本,因此本領域急需快速質檢文庫的技術。技術實現要素:針對本領域中存在的問題。本發明人通過對基因組的gc含量為高、中和低三個區域設計3對引物,以基因組作為對照組,對建好的文庫和基因組進行qpcr實驗,根據低gc擴增倍數/中gc擴增倍數的比值與1的關係對文庫的質量好壞進行判斷。因此,在第一方面,本發明提供了一種快速對文庫進行質控的方法,所述方法包括:1)通過ngs-lqc-l1、ngs-lqc-m1和ngs-lqc-h1這3對引物打斷的對參照dna和待測文庫進行qpcr實驗,檢測每對引物對應於參照dna和待測文庫的6個ct值ct1-ct6,其中:ct1是指ngs-lqc-l1這對引物對參照dna進行qpcr擴增之後的ct值;ct4是指ngs-lqc-l1這對引物對待測文庫進行qpcr擴增之後的ct值;ct2是指ngs-lqc-m1這對引物對參照dna進行qpcr擴增之後的ct值;ct5是指ngs-lqc-m1這對引物對要檢測文庫進行qpcr擴增之後的ct值;ct3是指ngs-lqc-h1這對引物對參照dna進行qpcr擴增之後的ct值;ct6是指ngs-lqc-h1這對引物對要檢測文庫進行qpcr擴增之後的ct值;2)計算m=低gc擴增倍數/中gc擴增倍數低,n=高gc擴增倍數/中gc擴增倍數的值,計算公式為m=2(ct1-ct4)/2(ct2-ct5),n=2(ct3-ct6)/2(ct2-ct5),3)待測文庫均一性判斷:m值在0.3以上,優選在0.37以上,並且越接近1,表示待測文庫的均一性越好;同時n>1。在一個實施方案中,參照dna優選是基因組dna。在一個實施方案中,打斷的對參照dna打斷後的片段大小為150bp-200bp。在第二方面,本發明提供了一種快速對文庫進行質控的方法,所述方法包括:1)通過ngs-lqc-l1、ngs-lqc-m1和ngs-lqc-h1這3對待測文庫進行qpcr實驗,檢測每對引物對應於待測文庫的3個ct值ct4-ct6,ct4是指ngs-lqc-l1這對引物對待測文庫進行qpcr擴增之後的ct值;ct5是指ngs-lqc-m1這對引物對要檢測文庫進行qpcr擴增之後的ct值;ct6是指ngs-lqc-h1這對引物對要檢測文庫進行qpcr擴增之後的ct值;;2)計算m=低gc擴增倍數/中gc擴增倍數低,n=高gc擴增倍數/中gc擴增倍數的值,計算公式為m=2(ct1-ct4)/2(ct2-ct5),n=2(ct3-ct6)/2(ct2-ct5),其中ct1、ct2和ct3分別是約21、約21和約18,3)待測文庫均一性判斷:m值在0.37以上,越接近1,均一性越好;同時n>1。在一個實施方案中,待測文庫的建庫片段大小為150bp-200bp。在第三方面,本發明還提供了一種快速和高效質檢文庫的引物序列組:ngs-lqc-l1-f,ngs-lqc-l1-r;ngs-lqc-m1-f,ngs-lqc-m1-r;ngs-lqc-h1-f,ngs-lqc-h1-r。本發明的方法和引物序列組的優點:1)設計低gc的含量為20%,中gc含量為50%,高gc含量為80%,通過對基因組上每隔100個鹼基的gc含量進行分析,對高、中和低三個區域分別設計100對引物,通過序列比對發現,高中低各有3對引物擴增產物單一,通過實驗發現ngs-lqc-l1-f、ngs-lqc-l1-r;ngs-lqc-m1-f、ngs-lqc-m1-r;和ngs-lqc-h1-f、ngs-lqc-h1-r引物具有較好的特異性。2)巧妙地設計了文庫質量評判標準公式,m值越接近於1,說明文庫的均一性越好。具體實施方式在本發明中,優選使用本發明第一方面的方法,將參照dna與待測文庫進行qpcr實驗,這樣能夠有效避免實驗的偏差。在出於節約原因或出於其他原因不包括參照dna的情況,也可以使用發明人長期實驗獲得的經驗參照dna的ct值,即ct1、ct2和ct3分別是約21、約21和約18,這裡的「約」是指基準值上下浮動5%。本發明人研發出一種快速質檢文庫的方法,通過對基因組、文庫均一性在20%以上和20%以下的高中低3個區域分別設計3對引物,然後進行實時定量pcr實驗,分別計算出高中低3個區域相對於基因組ct值而言的擴增倍數之後,計算出m和n的大小,實驗結果發現對於均一性在20%以上的文庫來說,m大小在0.37以上,而對於基因組而言,比值大約為1,而n>1,其原因在於,qpcr聚合酶對高gc區域的擴增具有偏好性,很難找到規律。因此通過比較m與1的關係,來對文庫質量進行質控。實施例1)進行如下的引物篩選:對基因組gc含量分別為20%,50%和80%的三個區域進行引物設計100對引物,然後通過序列比對發現這3個區域各有3對引物擴增產物單一(所述9對引物見表1),分別用這9對引物進行pcr實驗,結果發現,ngs-lqc-l1-f,ngs-lqc-l1-r;ngs-lqc-m1-f,ngs-lqc-m1-r;和ngs-lqc-h1-f,ngs-lqc-h1-r引物具有較好的特異性。表1:9對引物形成三個引物序列表組:(1)seqidno.1和seqidno.4;seqidno.2和seqidno.5;seqidno.3和seqidno.6;(2)seqidno.7和seqidno.10;seqidno.11和seqidno.5;seqidno.9和seqidno.12;(3)seqidno.13和seqidno.16;seqidno.17和seqidno.5;seqidno.15和seqidno.18。2)通過ngs-lqc-l1(即seqidno.1和seqidno.4)、ngs-lqc-m1(即seqidno.2和seqidno.5)和ngs-lqc-h1(即seqidno.3和seqidno.6)這3對引物對基因組gdna、117r01129、117r01134和文庫117r01128-lib、117r01129-lib和117r01134-lib進行qpcr實驗。基因組gdna、117r01129和117r01134通過基因提取、打斷,通過超聲打斷儀bioruptorpico,待冷循環儀溫度降至4℃後,設置參數on30s,off30s為1個循環,每10循環為一輪,共進行3輪,每組結束後將樣品置于振蕩器上充分混勻,短暫離心後進行下一輪打斷,打斷後的片段大小為150bp-200bp。待測文庫117r01128-lib、117r01129-lib和117r01134-lib的建庫過程如下:通過基因提取、打斷,通過超聲打斷儀bioruptorpico,待冷循環儀溫度降至4℃後,設置參數on30s,off30s為1個循環,每10循環為一輪,共進行3輪,每組結束後將樣品置于振蕩器上充分混勻,短暫離心後進行下一輪打斷,打斷後的片段大小為150bp-200bp、對打斷片段進行末端修復和加a、連接、pcr擴增、捕獲117r01128-lib、117r01129-lib和117r01134-lib這3個文庫。本實施例的具體設計方案如下:分別配置3管含有ngs-lqc-l1、ngs-lqc-m1和ngs-lqc-h1這3對引物,2×itaqtmuniversalsybrgreensupermix的60份混合物,混勻之後,把這3管混合物分別加入到qpcr板中,每孔加入18ul,每管加入18個孔,共54個孔,之後把2ul,濃度為5ng/ul的gdna、117r01129、117r01134和文庫117r01128-lib、117r01129-lib和117r01134-lib這個6個模板分別加入到含有ngs-lqc-l1、ngs-lqc-m1和ngs-lqc-h1這3對引物的孔中,同一個模板對應的同一對引物,需要做3個復孔,重複實驗的結果在後文中使用的是平均值。3)根據每個孔內加入的樣品,設置qpcr反應程序,進行每個孔的ct值檢測,對同一個樣品中的對應同一對引物的3個不同的ct值求平均值,即為6個樣品對應於ngs-lqc-l1、ngs-lqc-m1和ngs-lqc-h1這3對引物的ct值。4)數據分析:m=2(ct低gc基因組-ct低gc待測樣品)/2(ct中gc基因組-ct中gc待測樣品),n=2(ct高基因組-ct高gc待測樣品)/2(ct中gc基因組-ct中gc待測樣品)ct值:指在基線上方可產生可檢測的統計學上顯著的螢光發射時所對應的pcr循環數。基線範圍從第3個循環起到ct值前3個循環結束,基線範圍內螢光強度標準差的10倍即為閾值,而閾值所在的橫線與pcr擴增曲線的交點就是ct值,一般取3-15個循環之間,ct值與起始模板的關係研究表明,每個模板的ct值與該模板的起始拷貝數的對數存在線性關係,起始拷貝數越多,ct值越小。ct低gc基因組是指ngs-lqc-l1這對引物對基因組進行qpcr擴增之後的ct值;ct低gc待測文庫是指ngs-lqc-l1這對引物對待測樣品進行qpcr擴增之後的ct值;ct中gc基因組是指ngs-lqc-m1這對引物對基因組進行qpcr擴增之後的ct值;ct中gc待測文庫是指ngs-lqc-m1這對引物對要檢測樣品進行qpcr擴增之後的ct值;ct高gc基因組是指ngs-lqc-h1這對引物對基因組進行qpcr擴增之後的ct值;ct高gc待測文庫是指ngs-lqc-h1這對引物對要檢測樣品進行qpcr擴增之後的ct值;基因組指的是gdna,gdna是通過購買於promega公司的標準品。待測樣品是指基因組117r01129、117r01134和對應文庫117r01129-lib,117r01134-lib和單獨文庫117r01128-lib這5個樣品;117r01129、117r01134、117r01128-lib、117r01129-lib和117r01134-lib均來自於不同健康志願者的白細胞基因組,通過按前文提供的方法製備得到。對基因組gdna、117r01129、117r01134和對應文庫117r01129-lib、117r01134-lib單獨文庫117r01128-lib,通過ngs-lqc-l1、ngs-lqc-m1和ngs-lqc-h1這3對引物對這個6個樣本分別進行qpcr實驗,復孔數為3。對h1、m1和l1這3對引物配置為混合物,體系按照樣本數量×3+2=20。反應體系如下:進行qpcr擴增,反應程序如下:95℃3min40個循環:95℃5s62℃30s讀取螢光信號反應結束後,導出ct值進行統計分析。文庫信息:編號平均深度兩側10%深度的目標區域比率117r01128-lib32.98%117r01129-lib23.5%117r01134-lib7.53%平均深度兩側10%深度的目標區域比率:代表測序數據的均一性,比值越高,說明文庫的均一性越高,說明文庫裡含有多種不同種類的片段。通過上表可以看出,117r01134-lib文庫的平均深度兩側10%深度的目標區域比率為7.53%,屬於不合格文庫,即為差文庫。這個比率一般至少要求在15%以上,才屬於合格文庫,更嚴格取>約20%的值。通過實驗結果發現對於測序均一性在23.5%以上的文庫來說,m在0.369078601-1之內,而n>1,這是由於itaqtmuniversalsybrgreensupermix對高gc區域的擴增具有偏好性,規律不明顯。所以可以以m作為文庫好壞判斷的依據,當比值越接近1,說明文庫的均一性越高,測序質量越高。基於上述,m值在約0.37對應於23.5%的均一性。對於>約20%的均一性值,取m值大於約0.3。sequencelisting艾吉泰康生物科技(北京)有限公司一種快速和高效質檢文庫的引物序列組及方法cp2017065118patentinversion3.5154dna人工序列1atcagtggaaaaatagcctcaattcttaccgcctgaaaaagtaagtatgaagag54225dna人工序列2ggtaatttctggtgctctcccttat25318dna人工序列3gactccgcactcacctgc18430dna人工序列4acatcatgttcaataccttaaatatagaca30522dna人工序列5agtacaggagaagtggtccaca22615dna人工序列6cccagggccttgcgc15730dna人工序列7ataatctcttctaggtgatatgatgacatt30825dna人工序列8ctctgcataactcccttcttctgaa25917dna人工序列9ccatcccatcccggcca171029dna人工序列10catattacccatcctttaagttttagcaa291123dna人工序列11gaagttccaagtctcctcacctc231217dna人工序列12ccatcccatcccggcca171330dna人工序列13ggaaattgagttacataacatagcaattga301426dna人工序列14ctgattcatctgtgacaaaggtgatg261515dna人工序列15cgcgggcgccatgaa151630dna人工序列16agttttgcttttatcaaacaataattcaca301722dna人工序列17gacagagaagaacatggcccat221816dna人工序列18gcgccaggtagagcag16當前第1頁12

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀