新四季網

一種基於聚合酶鏈式反應產物測序序列分型的實現方法和系統的製作方法

2023-12-09 09:10:21

專利名稱:一種基於聚合酶鏈式反應產物測序序列分型的實現方法和系統的製作方法
技術領域:
本發明涉及等位基因分型技術,尤其涉及一種基於聚合酶鏈式反應產物測序序列 分型(Polymerase Chain Reaction Seq uencing-basedTyping,PCR-SBT)的實現方法禾口系 統。
背景技術:
HLA(Human Leucocyte Antigen,人類白細胞抗原)是迄今為止發現的多態性最 高的基因系統之一,是調控人體特異性免疫應答和決定疾病易感性個體差異的主要基因系 統,HLA與同種異體器官移植的排斥反應密切相關。目前國際標準的 HLA 分型技術為 PCR-SSP (Polymerase ChainReaction Sequence-Specific Primers,序列特異引物聚合酶鏈式反應),PCR-SSO (Polymerase Chain Reaction equence—SpecificOligonucleotide Probe Hybridization, 聚合酶鏈式反應寡核苷酸探針雜交)和PCR-SBT (Polymerase Chain Reaction Sequencing-basedTyping,基於聚合酶鏈式反應產物測序序列分型)。PCR-SSO的原理是設計HLA型別特異的寡核苷酸序列作為探針,把PCR產物標記, 以PCR產物(待檢測基因DNA)與探針雜交,通過檢測螢光信號判斷HLA基因型別。缺點是 不能檢測新的等位基因,解析度不夠高;檢測信號是模擬信號。PCR-SSP方法通過設計出一整套等位基因組特異性引物,藉助PCR技術獲得HLA型 別特異的擴增產物,通過電泳直接分析帶型決定HLA型別。其缺點是不易自動化;不能檢測 新的等位基因;試劑盒需不斷升級;檢測信號是模擬信號。PCR-SBT的原理是用引物對HLA基因多態性的區域進行PCR擴增,然後對擴增產物 進行DNA測序,在計算機輔助下確定HLA等位基因型別。對於基因結構的分析,SBT是比較 直觀、準確的方法。用PCR-SSP或PCR-SSO方法鑑別出新的等位基因,通常通過測序加以證實。SBT技術中,利用擴增產物對DNA測序後,需要通過軟體將測序所得結果與國際組 織IMGT資料庫(http://WWW. ebi. ac. uk/imgt/)中公布的HLA分型中的標準序列進行比 對;通過比對得出樣品序列與標準序列的匹配率;根據匹配率高低得出樣品序列的分型結 論。但是,PCR-SBT方法的設備要求高,時間和費用的消耗大,現有技術進行大範圍候 選型別篩查檢索時,速度慢,效率低。此外,人工輔助分型階段,分型人員進行峰圖查看時, 序列無法同步和峰圖對應,而且無法通過對峰圖的調節來進行查看。同時,無法實現數據結 果的備份和恢復,容易造成數據的丟失。

發明內容
本發明要解決的一個技術問題是提供一種基於聚合酶鏈式反應產物測序序列分型的實現方法和系統,特別是一種HLA基於聚合酶鏈式反應產物測序序列分型的實現方法 和系統,可以提高分型速度和效率。本發明提供一種基於聚合酶鏈式反應產物測序序列分型的實現方法,包括步驟 通過電腦程式根據測序結果判讀雜合子位點和待分型鹼基序列;將含有雜合子的待分型 鹼基序列比對到對應位點的分型資料庫,識別待分型鹼基序列和分型資料庫的參考序列的 聯配位置關係;根據待分型鹼基序列和分型資料庫的參考序列的聯配位置關係檢索分型數 據庫中的等位基因型,根據定序策略獲得分型資料庫中的等位基因型的罰分值;根據分型 資料庫中的等位基因型的罰分值獲得候選型別組合集。進一步,根據所述待分型鹼基序列和所述分型資料庫的參考序列的聯配位置關係 檢索所述分型資料庫中的等位基因型的步驟包括從待分型鹼基序列中取出變異鹼基對應位置上的鹼基符號,順序排列,然後遍歷 預先建立的所述分型資料庫中等位基因型中變異鹼基的鹼基符號形成的哈希數組,進行打 分,獲得各個等位基因型的罰分值。根據本發明的方法的一個實施例,定序策略以DNA測序鹼基質量為單位、按不同 錯配類型加權後的分值累加和作為罰分值。根據本發明的分型方法的一個實施例,還包括步驟將測序結果文件的峰形 化顯示輸出,進行峰圖形態縮放調節和/或序列峰圖連動查看,以便於分型人員修改和/或 確認分型結果。本發明還提供一種基於聚合酶鏈式反應產物測序序列分型系統,包括鹼基序列 判斷子系統,用於接收測序結果,根據測序結果判讀雜合子位點和待分型鹼基序列;聯配位 置識別子系統,用於接收來自鹼基序列判斷子系統的待分型鹼基序列,將待分型鹼基序列 比對到對應位點的分型資料庫,識別待分型鹼基序列和分型資料庫的參考序列的聯配位置 關係;罰分值確定子系統,用於根據待分型鹼基序列和分型資料庫的參考序列的聯配位置 關係檢索所述分型資料庫中的等位基因型,根據定序策略獲得分型資料庫中的等位基因型 的罰分值;候選型別確定子系統,用於根據分型資料庫中的等位基因型的罰分值獲得候選 型別組合集。根據本發明的分析系統的一個實施例,還包括索引預處理子系統,用於預先建立 所述分型資料庫的參考序列,以及所述參考序列和所述分型資料庫的等位基因型序列之間 的位置對應關係;根據所述分型資料庫的等位基因型中可變鹼基位上的鹼基符號序列形成 的哈希數組;罰分值確定子系統從待分型鹼基序列中取出變異鹼基對應位置上的鹼基符號,順 序排列,然後遍歷該分型資料庫的哈希數組,進行打分。根據本發明的分型系統的一個實施例,還包括圖形化顯示子系統,用於將測序結 果文件的峰形化顯示輸出,進行峰圖形態縮放調節和/或序列峰圖連動查看,以便於 分型人員修改和/或確認分型結果。本發明提供的基於聚合酶鏈式反應產物測序序列分型方法和系統,可以通過計算 機等設備實現候選基因型的自動識別,處理速度快,提高了分型效率。進一步,通過圖形化顯示界面等技術手段為分型人員的分型確認和修改提供方 便,提供了分型準確率以及分型效率。


圖1示出本發明實施例的一種PCR-SBT分型的實現方法的流程圖;圖2示出本發明實施例的另一種PCR-SBT分型的實現方法的流程圖;圖3示出本發明的一個應用例的數據圖形化輸出界面的截圖;圖4示出本發明實施例的一種PCR-SBT分型系統的結構圖;圖5示出本發明實施例的另一種PCR-SBT分型系統的結構圖。
具體實施例方式下面參照附圖對本發明進行更全面的描述,其中說明本發明的示例性實施例。在 附圖中,相同的標號表示相同或者相似的組件或者元素。圖1示出本發明一種基於聚合酶鏈式反應產物測序序列分型的實現方法的一 個實施例的流程圖,以下將基於聚合酶鏈式反應產物測序序列分型的實現方法簡稱為 PCR-SBT分型方法。如圖1所示,在步驟102,通過電腦程式根據測序結果判讀雜合子和待分型鹼基 序列。例如,測序結果包括時域下定長間隔的螢光信號強度讀數信息,根據螢光信號強度讀 數確定信號峰值,從而確定鹼基或雜合子。在步驟104,將含有雜合子的待分型鹼基序列比對到對應位點的分型資料庫, 識別待分型鹼基序列和對應位點的分型資料庫的參考序列的聯配位置關係。PCR擴增 試驗中靶位點是已知的,待分型鹼基序列對應的目標位點也是已知的。根據待分型鹼基 序列的目標位點信息比對到對應位點的分型資料庫中。每個分型資料庫包括參考序列 (ReferenceSequence)、以及參考序列和分型資料庫中各個等位基因型的位置對應關係。例 如通過動態規划算法(Dynamic Programming)或點矩陣(Dot Matrix)方法實現待分型鹼 基序列和對應位點的分型資料庫的參考序列的聯配位置關係的識別。在步驟106,結合待分型鹼基序列和分型資料庫的參考序列的聯配位置關係,檢索 分型資料庫中的各個等位基因型,根據定序策略獲得分型資料庫中的各個等位基因型的罰 分值。遍歷分型資料庫中的等位基因型,根據待分型鹼基序列和參考序列的聯配位置關係、 參考序列和等位基因型的位置對應關係,獲得待分型鹼基序列和等位基因型序列的位置對 應關係,然後結合定序策略獲得各個等位基因型的罰分值。定序策略可以按待分型鹼基序 列與比較的等位基因型(標的等位基因型)之間的錯配位置上的錯配類型、待分型鹼基序 列在該位置的質量值罰分的累加和作為定序依據在步驟108,根據分型資料庫中的等位基因型的罰分值獲得候選型別組合集。例 如,根據設定的罰分閾值選取TopN個候選型別組合集;或者選取第一個候選型別作為確定 的等位基因分型。本發明實施例的PCR-SBT分型的實現方法,通過計算設備等自動完成待分型基因 序列的分型,特別是對於大範圍候選型別篩查搜索時,速度快,效率高。根據本發明的PCR-SBT分型的實現方法的一個實施例,預先對分型資料庫中的等 位基因型序列信息進行預處理,將對應的等位基因型中的有變異的鹼基(簡稱變異鹼基) 對應的位置上的鹼基符號取出,將變異鹼基符號順序排列、編碼,形成哈希數組。例如,哈希
6數組的存儲格式為鍵值_對資料庫中各個型別在所有可變鹼基位置上對應的鹼基符號序 列按規則編碼成2進位碼後的值。對於待分型鹼基序列,取出變異鹼基對應位置上的鹼基 符號,順序排列,然後根據哈希數組的鍵值(key)遍歷等位基因型的哈希數組,對待分型鹼 基序列和分型資料庫中的等位基因型序列進行打分,根據定序策略獲得各個等位基因型的 罰分值,然後根據罰分閾值得到TopN個候選型。預先進行建庫處理形成分型資料庫的等位基因型的變異鹼基的哈希數組,哈希數 組建好後可以駐留內存,可以多次重複對不同的待分型鹼基序列進行處理,檢索速度快,大 大提高了檢索效率,從而提高了本發明整個分型方法的速度和效率。根據本發明的PCR-SBT分型的實現方法的一個實施例,在分型結果的篩選定序中 採用以DNA測序鹼基質量為單位、按不同錯配類型加權後的分值累加和作為罰分值,並以 該罰分由小到大的規則定序輸出,獲得候選基因型列表。例如,定序策略採用如下規則設 錯配位點的質量值為q,待分型鹼基序列Q與標的基因型T,則(1)缺失位,+1 ;(2)非缺失位錯配,基礎罰分為+q ;(3)非缺失位錯配,如果Q為純合子,且不為T中對應位置的簡併鹼基所包含,則 +2q;(4)非缺失位錯配,如果Q為雜合子,且為T中對應位置的鹼基所包含,則+2q ;(5)非缺失位錯配,如果Q為雜合子,且不被T中對應位置的簡併鹼基所包含,則 +3q。本領域的技術人員根據本發明的上述例子,能夠設計出多種相似或者等同的定序 策略,同樣屬於本發明的保護範圍。通常鹼基質量值代表該鹼基Base Calling結果出錯的概率,該值越高,出錯的概 率越高,所以,以鹼基質量作為罰分的基礎值(或者參考值),可以提高分型的準確性。本發 明實施例的分型方法,相較於現有的僅以錯配鹼基數量為考量因子定序的方法,更加有效 地將最接近真實基因型的候選結果放置在候選列表的最優先位置,從而提高了分型效率。圖2示出本發明一種PCR-SBT分型的實現方法的另一個實施例的流程圖。如圖2所示,在步驟202,輸入測序結果文件。例如,測序結果文件的內容和格式可 以參見http//www.appliedbiοsystems, com/support/software_community/ABIF_ File_Format. pdf;在步驟204,根據測序結果文件自動判讀雜合子位點和鹼基序列。例如,通過 Reference-Based Base Calling (有參考序列的鹼基識別)方法通過計算機自動進行鹼基 及雜合子判讀。在步驟206,待分型鹼基序列和對應位點的分型資料庫的參考序列的自動聯配及 自動插入/刪除識別。例如,在參考文獻中「AlgorithmicBioinformatics,Daniel Huson, 25,0ktober,2005」中介紹了多種比對算法(Alignment Algorithm)。可以採用有界的全局 比對算法(BandedGlobal Alignment algorithm)進行自動聯配。在步驟208,檢索已經建立好索引的分型資料庫,搜集候選等位基因型別組合集。在步驟210,根據罰分大小自動定序的候選等位基因型列表;
7
在步驟212,數據圖形化顯示輸出。測序結果文件中記錄時域下定長間隔的螢光信 號強度讀數,與測序過程時域相對應;螢光信號有四種顏色,分別對應四種鹼基,通過按特 定步長和曲線擬合公式,可以繪製出螢光信號在整個時域內的變化過程。這樣的圖由計算 機程序解析測序結果後繪製並顯示。將測序結果中的峰圖信號波形圖與對應的鹼基判讀和 雜合子識別結果,以及由測序結果中通過自動判讀得到的鹼基序列,連同目標位點的選定 候選基因型序列按照聯配位置關係整體顯示在同一視圖窗體中。在步驟214,峰圖形態縮放調節及序列峰圖連動查看。對峰圖的顯示支持單維度放 大縮小功能,提供更佳的可用性。通過待分型鹼基序列和候選基因型序列比對,整理得到的 序列異同信息,將錯配位置繪製成位點整體的概覽視圖,並支持在這些位置之間於各個窗 體視圖上的同步跳轉。具體實現如下序列峰圖連動查看通過程序將多個測序結果文件對應的峰圖在面板上顯示出來 後,將根據每個測序結果文件獲得的待分型的鹼基序列和分型資料庫中參考序列經過比對 得到的各個待分型鹼基序列和參考序列的位置對應關係為基礎,從而得到各個待分型鹼基 序列之間的位置對應關係。不同待分型鹼基序列上鹼基之間的位置是相對的,每一次觸發 一個鹼基,程序首先會根據該鹼基去查找它對應其他序列上對應的鹼基位置,加上鹼基的 偏移值,並且重新畫出完整的峰圖。每次觸發後,確保本次觸發的鹼基是對齊的,其他位置 上的序列和峰圖只保證大體上對齊即可。峰圖形態縮放調節峰圖的放大和縮小可以根據重繪圖時修改峰圖的參數每次來 設置峰圖放大和縮小的比例以實現峰圖的放大和縮小。峰圖的拉升和擠壓可以根據設置峰 圖在橫向的參數來實現峰圖的拉升和擠壓。在步驟216,獲得分型結果及數據備份。分型人員的工作包括參考峰圖排查假純 合及確認或修改計算機自動識別出的雜合位點,並通過參考罕見型別列表,對當前待分型 序列做修改和最終確認。這部分目前需要受過專業培訓的有經驗的專業人員的人眼識別和 把握尺度。分型人員還需要在疑似新基因的結果(高質量位出現與當前資料庫無匹配的 情況)出現時,做出確認;在模糊結果(可能是A基因型,也符合B基因型)出現時,給出 GSSP引物,以備應用SSP分型技術做附加確認。另外新基因的發現也是需要人去整理確認 的。對於數據備份,在分型人員保存文件的同時,軟體會將該分型文件拷貝到軟體指定的文 件夾下,保存分型文件的同時在該文件夾下產生一個臨時文件,主要是記錄分型人員分型 時的信息,如在某一個位置對某一個鹼基做了修改,截取的峰圖有效範圍,分型的結果等。 這樣當用戶下次想再查看之前校正後的峰圖文件時,可以直接打開分型歷史記錄面板,根 據日期來查看校正後的文件。多個測序結果對應的峰圖序列文件打開後,軟體可以根據算法實現特定鹼基和序 列之間的對齊和聯動,並且在選擇峰圖時,序列能保證同步和峰圖對應。實現了序列的自動 對齊,不用人工進行矯正,縮短了用人眼去辨別序列位置的時間,大大的提高了分型工作者 的效率。通過實現峰圖的放大,縮小以及峰值放大和縮小,當上下峰圖對齊的效果不是很模 糊的時候,可以通過對峰圖的放大和縮小來調整峰圖的大小,便於分型人員查看峰圖,提高 了分型效率。每一個峰圖文件分型結果的備份和恢復機制。當分型人員通過修改鹼基,屏蔽序 列分型完後,根據修改後的文件產生新分型的結果,將保存在一個臨時文件夾裡,主要是方
8便分型人員對已閱峰圖的核對或是查看等。圖3示出本發明的一個應用例的數據圖形化輸出界面的截圖。如圖3所示,該應 用例中SBT分型軟體主界面分為四部分左上部分31,右上部分32,左下部分33,右下部分 34。其中,左上部分31為分型文件的選擇部分。分型者選擇的分型文件,都會在該部分以樹 形結構的形式來展現,方便用戶來選擇分型文件。左下部分33根據選擇的分型文件的文件 名稱,識別該分型文件的比對位點,根據分型的位點選擇比對的分型資料庫,並根據候選型 別罰分由小到大的定序規則排序,即得出左下角的所有配型列表。右上部分32為選擇分型 文件序列的顯示部分。其中,第一行Consensus行為位點的比對庫全序列;第二行Forward 行為選擇分型文件的正向序列;Reverse為選擇分型文件的反向序列;第三行Pattern行為 正反向序列的匹配序列結果;最下面的2條序列為從左下角得來的選擇列表。右下部分34 為峰圖和序列文件的顯示部分。峰圖上方為該峰圖對應的序列。每個波峰都對應了一個鹼 基,上下峰圖的對應是根據分型文件和資料庫的比對結果來對應的,峰圖的上下的波峰和 波峰,峰圖的上下的鹼基和鹼基,都是對應的。圖4示出本發明實施例的一種PCR-SBT分型系統的結構圖。如圖4所示,該實施例 的分型系統包括鹼基序列判斷子系統41、聯配位置識別子系統42、罰分值確定子系統43和 候選型別確定子系統44。其中,鹼基序列判斷子系統41用於接收測序結果,根據測序結果 判讀雜合子位點和待分型鹼基序列。聯配位置識別子系統42用於接收來自鹼基序列判斷 子系統41的待分型鹼基序列,將待分型鹼基序列比對到對應位點的分型資料庫中,識別待 分型鹼基序列和對應位點的分型資料庫的參考序列之間的聯配位置關係。例如,聯配位置 識別子系統42通過動態規划算法或者點矩陣方法識別待分型鹼基序列和分型資料庫的參 考序列的聯配位置關係。罰分值確定子系統43用於根據所述聯配位置識別子系統42識別 的待分型鹼基序列和分型資料庫的參考序列的聯配位置關係檢索分型資料庫中的等位基 因型,根據定序策略獲得分型資料庫中的各個等位基因型的罰分值。例如,定序策略以DNA 測序鹼基質量為單位、按不同錯配類型加權後的分值累加和作為罰分。候選型別確定子系 統44,用於根據分型資料庫中的各個等位基因型的罰分值獲得候選型別組合集。根據本發明的一個實施例,分型系統還可選地包括索引預處理子系統45。索引預 處理子系統45用於預先建立分型資料庫的參考序列,以及分型資料庫的參考序列和分型 資料庫的各個等位基因型序列之間的位置對應關係;此外,索引預處理子系統45還將分型 資料庫中的等位基因型中的有變異的鹼基(簡稱變異鹼基)對應的位置上的鹼基符號取 出,將變異鹼基符號順序排列、編碼,形成哈希數組,即根據分型資料庫的等位基因型中變 異鹼基的鹼基符號形成的哈希數組。罰分值確定子系統43從待分型鹼基序列中取出變異 鹼基對應位置上的鹼基符號,順序排列,然後遍歷該分型資料庫的哈希數組,進行聯配。圖5示出本發明實施例的另一種PCR-SBT分型系統的結構圖。如圖5所示,該實 施例的分型系統包括鹼基序列判斷子系統51、聯配位置識別子系統52、罰分值確定子系統 53、候選型別確定子系統54、索引預處理子系統55、圖形化顯示子系統56和數據備份系統 57。其中,鹼基序列判斷子系統51、聯配位置識別子系統52、罰分值確定子系統53、候選型 別確定子系統54和索引預處理子系統55可以參見上文實施例中對應子系統的描述,為簡 潔起見在此不再詳細描述。圖形化顯示子系統56用於將測序結果文件的峰形化顯示 輸出,進行峰圖形態縮放調節和/或序列峰圖連動查看,以便於分型人員修改和/或確認分
9型結果。圖形化顯示子系統56將測序結果中的峰圖信號波形圖與對應的鹼基判讀和雜合 子識別結果,以及由測序結果中通過自動判讀得到的鹼基序列,連同目標位點的選定候選 基因型序列按照聯配位置關係整體顯示在同一視圖窗體中。數據備份系統57用於存儲和 備份確認的分型結果,以及分型人員所作的修改等信息。對於數據備份,在分型人員保存文 件的同時,軟體會將該分型文件拷貝到軟體指定的文件夾下,保存分型文件的同時在該文 件夾下產生一個臨時文件,主要是記錄分型人員分型時的信息,如在某一個位置對某一個 鹼基做了修改,截取的峰圖有效範圍,分型的結果等。需要指出,本發明實施例中的各個子系統,可以作為單獨的設備或者裝置存在,通 過相互配合和協作一起構成分型系統,例如各個子系統以分布式的方式存在;也可以多個 或者所有的子系統集成在同一設備上。現有軟體分析速度一般為10個/小時,本發明的方案可以達到15個/小時,現有 軟體準確率一般為90%,本發明的方案可以達到92%。與現有技術的其他廠家同類產品比 較,本發明的方法和系統在單位時間內分型速度可以提高50%,鹼基識別的準確率可以提
尚2 % ο本發明提供的SBT分型方法和系統,可以通過計算機等設備實現候選基因型的自 動識別,從而提高了分型效率;通過圖形化顯示界面等技術手段為分型人員的分型確認和 修改提供方便,提供了分型準確率以及分型效率。需要指出,本發明的SBT分型方法和系統,不僅可以應用於HLA分型,同樣可以應 用於 HPV(Human papillomavirus,人乳頭瘤病毒)、HBV(h印atitis B virus,B型肝炎病 毒)等其他分型的實現。理論上,在有分型資料庫支持的條件下,本發明可以應用到任何有 分型需求的物種上的。本發明的描述是為了示例和描述起見而給出的,而並不是無遺漏的或者將本發明 限於所公開的形式。很多修改和變化對於本領域的普通技術人員而言是顯然的。選擇和描 述實施例是為了更好說明本發明的原理和實際應用,並且使本領域的普通技術人員能夠理 解本發明從而設計適於特定用途的帶有各種修改的各種實施例。
權利要求
一種基於聚合酶鏈式反應產物測序序列分型的實現方法,其特徵在於,包括通過電腦程式根據測序結果判讀雜合子位點和待分型鹼基序列;將含有雜合子的所述待分型鹼基序列比對到對應位點的分型資料庫,識別所述待分型鹼基序列和所述分型資料庫的參考序列的聯配位置關係;根據所述待分型鹼基序列和所述分型資料庫的參考序列的聯配位置關係檢索所述分型資料庫中的等位基因型,根據定序策略獲得所述分型資料庫中的等位基因型的罰分值;根據所述分型資料庫中的等位基因型的罰分值獲得候選型別組合集。
2.根據權利要求1所述的實現方法,其特徵在於,根據所述待分型鹼基序列和所述分 型資料庫的參考序列的聯配位置關係檢索所述分型資料庫中的等位基因型的步驟包括從待分型鹼基序列中取出變異鹼基對應位置上的鹼基符號,順序排列,然後遍歷預先 建立的所述分型資料庫中等位基因型中變異鹼基的鹼基符號形成的哈希數組,進行打分。
3.根據權利要求1所述的實現方法,其特徵在於,所述定序策略以DNA測序鹼基質量為 單位、按不同錯配類型加權後的分值累加和作為罰分。
4.根據權利要求1所述的實現方法,其特徵在於,所述定序策略為 假定錯配位點的質量值為q,待測序列Q與標的基因型T,則(1)缺失位,+1;(2)非缺失位錯配,基礎罰分為+q;(3)非缺失位錯配,如果Q為純合子,且不為T中對應位置的簡併鹼基所包含,則+2q;(4)非缺失位錯配,如果Q為雜合子,且為T中對應位置的鹼基所包含,則+2q;(5)非缺失位錯配,如果Q為雜合子,且不被T中對應位置的簡併鹼基所包含,則+3q。
5.根據權利要求1所述的實現方法,其特徵在於,通過動態規划算法或者點矩陣方法 識別所述待分型鹼基序列和所述分型資料庫的參考序列的聯配位置關係。
6.根據權利要求1所述的實現方法,其特徵在於,還包括步驟將測序結果文件的峰形化顯示輸出,進行峰圖形態縮放調節和/或序列峰圖連動 查看。
7.根據權利要求6所述的實現方法,其特徵在於,還包括步驟 自動存儲分型人員的修改和/或分型結果。
8.一種基於聚合酶鏈式反應產物測序序列分型系統,其特徵在於,包括鹼基序列判斷子系統,用於接收測序結果,根據所述測序結果判讀雜合子位點和待分 型鹼基序列;聯配位置識別子系統,用於接收來自所述鹼基序列判斷子系統的待分型鹼基序列,將 所述待分型鹼基序列比對到對應位點的分型資料庫,識別所述待分型鹼基序列和所述分型 資料庫的參考序列的聯配位置關係;罰分值確定子系統,用於根據所述待分型鹼基序列和所述分型資料庫的參考序列的聯 配位置關係檢索所述分型資料庫中的等位基因型,根據定序策略獲得所述分型資料庫中的 等位基因型的罰分值;候選型別確定子系統,用於根據所述分型資料庫中的等位基因型的罰分值獲得候選型 別組合集。
9.根據權利要求8所述的分型系統,其特徵在於,還包括索引預處理子系統,用於預先建立所述分型資料庫的參考序列,以及所述參考序列和 所述分型資料庫的等位基因型序列之間的位置對應關係;根據所述分型資料庫的等位基因 型中變異鹼基的鹼基符號形成的哈希數組;所述罰分值確定子系統從待分型鹼基序列中取出變異鹼基對應位置上的鹼基符號,順 序排列,然後遍歷所述分型資料庫的哈希數組,進行打分。
10.根據權利要求8或9所述的分型系統,其特徵在於,所述定序策略以DNA測序鹼基 質量為單位、按不同錯配類型加權後的分值累加和作為罰分值。
11.根據權利要求8所述的分型系統,其特徵在於,聯配位置識別子系統通過動態規劃 算法或者點矩陣方法識別所述待分型鹼基序列和所述分型資料庫的參考序列的聯配位置 關係。
12.根據權利要求8所述的分型系統,其特徵在於,還包括圖形化顯示子系統,用於將測序結果文件的峰形化顯示輸出,進行峰圖形態縮放 調節和/或序列峰圖連動查看。
全文摘要
本發明公開一種PCR-SBT分型方法和系統,該方法包括通過電腦程式根據測序結果判讀雜合子位點和待分型鹼基序列;將待分型鹼基序列比對到對應位點的分型資料庫,識別待分型鹼基序列和分型資料庫的參考序列的聯配位置關係;檢索分型資料庫中的等位基因型,根據定序策略獲得分型資料庫中的等位基因型的罰分值;根據分型資料庫中的等位基因型的罰分值獲得候選型別組合集。本發明提供的SBT分型方法和系統,可以通過計算機等設備實現候選基因型的自動識別,從而提高了分型效率;通過圖形化顯示界面等技術手段為分型人員的分型確認和修改提供方便,提供了分型準確率以及分型效率。
文檔編號G06F19/00GK101984445SQ20101011770
公開日2011年3月9日 申請日期2010年3月4日 優先權日2010年3月4日
發明者劉濤, 樊清華 申請人:深圳華大基因科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀