群體突發病毒性疫情快速pcr檢測引物文庫及篩查系統的製作方法
2023-10-19 02:07:57 1
專利名稱:群體突發病毒性疫情快速pcr檢測引物文庫及篩查系統的製作方法
技術領域:
本發明是一種病毒引物設計及評測系統,它屬於生物學和計算機資料庫技術相結合的領域。
背景技術:
聚合酶鏈式反應(Polymerase Chain Reaction, PCR)是一種體外快速擴增DNA的方法,用於放大特定的DNA片段,數小時內可使目的基因片段擴增到數百萬個拷貝的分子生物學技術。PCR技術的基本原理類似於DNA的天然複製過程,其特異性依賴於與靶序列兩端互補的寡核苷酸引物。PCR由變性一退火一延伸三個基本反應步驟構成①模板DNA 的變性模板DNA經加熱至93°C左右一定時間後,使模板DNA雙鏈或經PCR擴增形成的雙鏈DNA解離,使之成為單鏈,以便它與引物結合,為下輪反應作準備;②模板DNA與引物的退火(復性)模板DNA經加熱變性成單鏈後,溫度降至55°C左右,引物與模板DNA單鏈的互補序列配對結合;③引物的延伸DNA模板一引物結合物在TaqDNA聚合酶的作用下,以 dNTP為反應原料,靶序列為模板,按鹼基互補配對與半保留複製原理,合成一條新的與模板 DNA鏈互補的半保留複製鏈,重複循環變性一退火一延伸三過程就可獲得更多的「半保留複製鏈」,而且這種新鏈又可成為下次循環的模板。每完成一個循環需2 4分鐘,2 3小時就能將待擴目的基因擴增放大幾百萬倍。PCR技術作為常用的分子生物學技術之一在生命科學研究、醫學科研及臨床醫學診斷、環境保護、農業等各個領域有著廣泛的應用。引物設計是PCR反應中至關重要的一步,無法設計出合理的引物就不能擴增出目標序列。引物設計需要注意的地方很多,在大多數情況下,我們都是在知道已知模板序列時進行PCR擴增的。在某些情況比如構建文庫的時候也會在不知道模板序列的情況下進行設計。這個時候隨機核苷酸序列就與模板不是完全匹配。我們通常指的設計引物都是在已知模板序列的情況下進行。引物設計除了要考慮與模板正確匹配外,還要考慮到引物的特異性及熱動力學參數等。在實際中,病毒的引物設計與其他物種的引物設計相比具有其自身的複雜性。病毒的變異速率極快,其自身的編碼DNA或RNA的突變速率要遠遠高於其他生物,因此不斷地有新的亞型產生,引物設計者要不斷查找並更新當前病毒序列資料庫的信息。此外對於某一種疾病來說,可能會有多個病毒共同作用導致發病,因此在知道具體的病毒種類之前也無法設計出合適的引物來擴增病毒序列,故常規的引物設計方法無法很好地滿足病毒引物設計的需要。我們開發了一種全新的引物設計及評測系統,它能夠快捷簡便地自動更新病毒資料庫信息及針對病種設計出適用的引物來用於病毒的臨床檢測。
發明內容
本發明主要由臨床病毒學資料庫模塊、病毒序列資料庫模塊、病毒序列自動提取模塊、病毒變異序列的功能預測、病毒種屬特異性序列和病毒亞型特異性序列的篩選、引物生成和評價模塊以及擴增產物注釋模塊七個部分組成。旨在能夠實現第一,根據目標基因序列設計最佳PCR擴增的病毒引物序列;第二,保證引物的特異性和準確性;第三,預測擴增片斷在未經測序的狀況下,與目標病毒的匹配程度;第四,根據PCR引物的擴增序列預測病毒的臨床背景資料和參考治療方案。
圖1是軟體整體結構圖。圖2是臨床病毒學資料庫結構圖。圖3是批量化自動提取基因組序列,軟體左側為序列資料庫。圖4是批量化序列搜索與比對模塊。界面右側為序列資料庫,界面上方為Blast 搜索方法。
具體實施例方式一、臨床病毒學資料庫模塊臨床病毒資料庫包含了常見病毒性疾病的臨床信息、治療信息和病毒基本信息。 利用該資料庫,通過臨床信息,可獲取所有可能的病毒源,為下一步調取病毒基因組信息提供數據源。此外,對於新病毒種屬或已知病毒新亞型導致的疾病,也將在疾病發布同時,將最全面的臨床信息數據整合入本資料庫。二、病毒序列資料庫模塊下載測序完成並公布的客戶指定的病毒基因組序列,並構建序列資料庫,序列資料庫主要來源於GenBank、EMBL。序列資料庫存儲格式為i^asta格式。通過對已經公開報導的來源2235個病毒基因組的3309條參考序列和來源於類病毒的39條參考序列的整合,構建客戶指定的與腹灣,非細菌性胃腸炎,呼吸道症狀,肺炎,夏季感冒,手足口病,神經症狀, 腦炎,心肌炎,出血,腎病,視網膜炎,肝炎,皮膚、黏膜損害,禽類15種49個病毒基因組。所有物種的序列均需與GenBank、EMBL同步更新。此外,非常重要的是,對於新病毒種屬和已知病毒種屬的未知亞型,在已有測序結果的情況下,所有序列信息也將在公布同時裝載入病毒序列資料庫。三、病毒序列自動提取模塊客戶只需輸入病毒序列的GenBank Accession Number和GI編號,通過本模塊(嵌套其明公司自主開發的BlastDesk系統)即可批量化獲得病毒基因組序列。序列為!^asta 格式,供引物生成和評價模塊設計備選引物。四、病毒變異序列的功能預測1、密碼子偏好資料庫遺傳密碼有64種,但是絕大多數生物傾向於利用這些密碼子中的一部分。那些被最頻繁利用的稱為最佳密碼子(optimal codons),那些不被經常利用的稱為稀有或利用率低的密碼子(rare or low-usage codons)。禾[I用偏愛密碼子(preferred codons)並避免利用率低的或稀有的密碼子,可以在不知道目的基因的編碼序列的狀況下,預測目的基因的胺基酸序列,為病毒基因功能以及特定宿主系統的選擇提供參考。為此,我們應用密碼子偏好資料庫對新病毒種屬或已知病毒新亞型的核酸序列進行翻譯,此資料庫根據 GenBank35779個物種的3027973個完整蛋白編碼區(自起始密碼子至終止密碼子)進行的密碼子使用頻率的統計而成。所以這個資料庫中的結果基本可以反應各物種對密碼子使用的偏向性。2、病毒變異的功能變化預測通過密碼子分析,獲得新病毒種屬或病毒新亞型的胺基酸序列。通過分析胺基酸序列的結構域,預測胺基酸序列的功能組成;或利用blastp與蛋白結構資料庫進行比對, 確定結構相似的已知蛋白,從而確定病毒變異序列的功能。3、校正臨床病毒資料庫的校正若病毒變異造成功能變化(病毒發生有義突變),導致臨床病毒資料庫中相應指標變化以及藥物作用效果變化,則病毒變異的新病毒種屬或病毒新亞型對於的臨床特徵作用新特點增加如臨床病毒資料庫。五、病毒種屬特異性序列和病毒亞型特異性序列的篩選1、篩選病毒種屬特異性序列同一種疾病可能伴有多種不同屬病毒感染,在病毒特異性引物設計時,必須獲取病毒種屬特異性序列作為引物設計的依據。通過49X49次病毒基因組多序列分析,並經過交叉驗證,獲得發現每個種屬病毒特異性的基因組序列。2、篩選病毒亞型特異性序列同種屬病毒包括多種亞型,在特定病毒性疾病中,可能由多種屬病毒的特定亞型致病,因此,為了精確定位病毒亞型,必須對獲取各種屬病毒亞型特異性序列作為引物設計的依據。六、引物生成和評價模塊根據病毒基因特異性序列,使用引物設計模塊獲取目標序列多條備選引物,而後使用熱力學參數評價引物的質量引物Tm值、GC比、簡併性鹼基、3』端穩定性、引物的穩定性、重複序列、二聚體/發卡結構和與模板之間的錯配情況。所有參數基本狀態為默認參數,若客戶需要修改,可進入參數配置頁面修改。軟體首先根據熱力學參數從極高嚴謹性到極低嚴謹性設計多條備選引物,而後對備選引物自動搜索,篩選符合設定引物長度的寡核苷酸都被視為進一步候選引物。最終,用於PCR檢測的是候選引物中檢測病毒特異性、嚴謹度最高的前3對特異性引物。七、擴增產物注釋模塊經過引物生成和評價模塊後生成的若干條單對引物,儘管在熱力學參數上已經獲得了優化,但其中仍有一些不能擴增目標片段的引物,理論上可以不用實驗操作,篩除不能擴增目標片段的引物而選出能夠擴增目標片段的引物。擴增產物注釋模塊可把單引物對檢驗設置成為多重引物組合,然後將這些組合與前期已構建的病毒基因組序列資料庫進行 blastn比對,批量化搜索所有引物擴增產物中最佳匹配的目標基因序列及其病毒種屬。
權利要求
1.一種病毒引物設計及評測系統,包括臨床病毒學資料庫模塊、病毒序列資料庫模塊、 病毒序列自動提取模塊、病毒變異序列的功能預測、病毒種屬特異性序列和病毒亞型特異性序列的篩選、引物生成和評價模塊以及擴增產物注釋模塊七個部分。其特徵在於根據目標基因序列設計最佳PCR擴增的病毒引物序列,保證引物的特異性和準確性。
2.根據權利要求1所述的臨床病毒學資料庫模塊,其特徵在於包含了常見病毒性疾病的臨床信息、治療信息和病毒基本信息,為下一步調取病毒基因組信息提供數據源。
3.根據權利要求1所述的病毒序列資料庫模塊,其特徵在於下載測序完成並公布的客戶指定的病毒基因組序列,並構建序列資料庫。對於新病毒種屬和已知病毒種屬的未知亞型,在已有測序結果的情況下,所有序列信息也將在公布同時裝載入病毒序列資料庫。
4.根據權利要求1所述的病毒序列自動提取模塊,其特徵在於只需輸入病毒序列的 GenBankAccession Number和GI編號,通過本模塊即可批量化獲得病毒基因組序列。序列 Siesta格式,供引物生成和評價模塊設計備選引物。
5.根據權利要求1所述的病毒變異序列的功能預測,其特徵在於通過密碼子分析,獲得新病毒種屬或病毒新亞型的胺基酸序列。通過分析胺基酸序列的結構域,預測胺基酸序列的功能組成;或利用blastp與蛋白結構資料庫進行比對,確定結構相似的已知蛋白,從而確定病毒變異序列的功能。
6.根據權利要求1所述的引物生成和評價模塊,其特徵在於根據病毒基因特異性序列,使用引物設計模塊獲取目標序列多條備選引物,而後使用熱力學參數評價引物的質量。
7.根據權利要求1所述的擴增產物注釋模塊,其特徵在於可把單引物對檢驗設置成為多重引物組合,然後將這些組合與前期已構建的病毒基因組序列資料庫進行blastn比對, 批量化搜索所有引物擴增產物中最佳匹配的目標基因序列及其病毒種屬。
全文摘要
本發明涉及一種群體突發病毒性疫情快速PCR檢測引物文庫及篩查系統。本發明是一種病毒引物設計及評測系統,它屬於生物學和計算機資料庫技術相結合的領域。主要由臨床病毒學資料庫模塊、病毒序列資料庫模塊、病毒序列自動提取模塊、病毒變異序列的功能預測、病毒種屬特異性序列和病毒亞型特異性序列的篩選、引物生成和評價模塊以及擴增產物注釋模塊七個部分組成。旨在能夠實現第一,根據目標基因序列設計最佳PCR擴增的病毒引物序列;第二,保證引物的特異性和準確性;第三,預測擴增片斷在未經測序的狀況下,與目標病毒的匹配程度;第四,根據PCR引物的擴增序列預測病毒的臨床背景資料和參考治療方案。
文檔編號G06F19/28GK102243697SQ20101017123
公開日2011年11月16日 申請日期2010年5月11日 優先權日2010年5月11日
發明者張永強, 戚楊, 李伯安, 李林, 程雲, 蘇峰, 遲淑萍, 韓晉 申請人:上海其明信息技術有限公司, 解放軍第三○二醫院