新四季網

考慮重複性的鹼基序列重組系統及方法

2023-06-27 00:22:06

考慮重複性的鹼基序列重組系統及方法
【專利摘要】本發明公開一種考慮重複性的鹼基序列重組系統及方法。根據本發明一個實施例的鹼基序列重組系統包括:片段序列生成單元,用於由短片段(read)生成多個片段(fragment)序列;片段序列長度調整單元,從生成的所述多個片段序列當中選擇對象鹼基序列上的映射重複數超過設定基準值的片段序列,並調整選擇的片段序列的長度,直到所述選擇的片段序列的映射重複數達到所述基準值以下;比對單元,利用長度得到調整的所述片段序列執行全局比對(Global?alignment)。
【專利說明】考慮重複性的鹼基序列重組系統及方法
【技術領域】
[0001]本發明的實施例涉及一種用於分析基因組的鹼基序列的技術。
【背景技術】
[0002]用於生產高容量短序列的第二代測序方式(NGS:Next Generation Sequencing)因其低廉的成本和迅速生成數據的能力而正在迅速地替代傳統的桑格(Sanger)測序方式。並且,開發出了多種聚焦於準確度的NGS序列重組程序。然而,近來隨著第二代測序技術的發展,製作片段序列的費用降低為過去的一半以下,隨之可用數據的量增加,因此需要開發一種能夠在短時間內準確地處理高容量短序列的技術。
[0003]序列重組的第一個步驟為通過鹼基序列比對(alignment)算法而將短片段(read)映射(mapping)於參考序列的正確位置上。其中的問題在於即使是同種個體,也可能因多種遺傳性變異而導致基因組序列上的差異。而且,測序過程中的誤差也可能導致鹼基序列上的差異。因此,喊基序列重組算法必須有效考慮這種差異和變異而提聞映射準確度。
[0004]總而言之,為了對基因組信息進行分析,需要儘量多而準確的所有基因組信息數據。而且,為了達到這一目的,首先是要開發出具有很高的準確度和較大處理量的鹼基序列重組算法。然而,現有技術中的方法在滿足這些需求條件方面存在局限性。

【發明內容】

[0005]本發明實施例的目的在於提供一種可在確保映射準確度的同時通過改善映射時的複雜度而提高處理速度的鹼基序列重組方案。
[0006]根據本發明一個實施例的鹼基序列重組系統包括:片段序列生成單元,用於由短片段生成多個片段(fragment)序列;片段序列長度調整單元,從生成的所述多個片段序列當中選擇對象鹼基序列上的映射重複數超過設定基準值的片段序列,並調整選擇的片段序列的長度,直到所述選擇的片段序列的映射重複數達到所述基準值以下;比對單元,利用所述片段序列執行全局比對(Global alignment)。
[0007]另外,根據本發明另一實施例的鹼基序列重組系統包括:片段序列生成單元,用於由短片段生成多個片段(fragment)序列;篩選單元,用於從生成的所述多個片段序列中除去對象鹼基序列上的映射重複數超過設定上限值的片段序列;比對單元,利用除了被除去的所述片段序列以外的其餘片段序列而執行全局比對(Global alignment)。
[0008]另外,根據本發明一個實施例的鹼基序列重組方法包括如下步驟:在片段序列生成單元中,由短片段生成多個片段(fragment)序列;在片段序列長度調整單元中,從生成的所述多個片段序列當中選擇對象鹼基序列上的映射重複數超過設定基準值的片段序列,並調整選擇的片段序列的長度,直到所述選擇的片段序列的映射重複數達到所述基準值以下;在比對單元中,利用所述片段序列執行全局比對(Global alignment)。
[0009]另外,根據本發明另一實施例的鹼基序列重組方法包括如下步驟:在片段序列生成單元中,由短片段生成多個片段(fragment)序列;在篩選單元中,從生成的所述多個片段序列中除去對象鹼基序列上的映射重複數超過設定上限值的片段序列;在比對單元中,利用除了被除去的所述片段序列以外的其餘片段序列而執行全局比對(Globalalignment)。
[0010]根據本發明的實施例,並不固定由短片段生成的片段序列的長度,而是根據各片段序列在對象鹼基序列內的映射重複數而適當地擴增其長度,或者除去重複數過多的片段序列,從而具有可以提聞映射準確度的同時也能提聞速度的效果。
【專利附圖】

【附圖說明】
[0011]圖1為用於說明根據本發明一個實施例的鹼基序列重組方法的圖。
[0012]圖2為用於舉例表示根據本發明一個實施例的鹼基序列重組方法中的最小誤差估計值(MEB)e計算過程的圖。
[0013]圖3為用於說明根據本發明一個實施例的鹼基序列重組方法中的片段序列提取過程示例的圖。
[0014]圖4為根據本發明一個實施例的鹼基序列重組系統400的模塊圖。
[0015]圖5為根據本發明另一實施例的鹼基序列重組系統500的模塊圖。
[0016]符號說明:
[0017]400、500:鹼基序列重組系統 402、502:片段序列生成單元
[0018]404:片段序列長度調整單元 406、506:比對單元
[0019]408、504:篩選單元
【具體實施方式】
[0020]以下,參照【專利附圖】

【附圖說明】本發明的【具體實施方式】。然而這僅僅是示例,本發明並不局限於此。
[0021]在對本發明進行說明時,如果遇到對有關本發明的公知技術的具體說明有可能不必要地幹擾本發明的主旨的情況,則省略其詳細說明。並且,後述的術語均為考慮本發明中的功能而進行定義的,其可能因使用者、運用人員的意圖或習慣等而有所不同。因此,要以整個說明書的內容為基礎對其進行定義。
[0022]本發明的技術思想由權利要求書確定,以下的實施例只是為了將本發明的技術思想有效地傳遞給本發明所屬【技術領域】中具有普通知識的人員而採用的一種手段。
[0023]在對本發明的實施例進行具體說明之前,首先對本發明中使用的術語進行如下說明。
[0024]首先,「短片段(read)序列」(或者簡稱為「短片段」)是指基因組測序儀(genomesequencer)中輸出的短鹼基序列數據。短片段的長度因基因組測序儀的種類而不同,通常構成為35?500bp(base pair)範圍的多種長度,在DNA鹼基的情況下,通常用字母A、C、G、T表示。
[0025]「對象鹼基序列」指可對利用所述短片段形成整個鹼基序列提供參考的鹼基序列(reference sequence)。在鹼基序列分析中,通過參考對象鹼基序列而將基因組測序儀所輸出的大量短片段進行映射來完成整個鹼基序列。在本發明中,所述對象鹼基序列既可以是鹼基序列分析時預先設定的序列(例如人類的整個鹼基序列等),或者也可以將基因組測序儀中產生的鹼基序列使用為對象鹼基序列。
[0026]「鹼基(base)」為構成對象鹼基序列及短片段的最小單位。如前所述,構成DNA的鹼基可由A、C、G、T等四個字母表示,將這些分別稱為鹼基。換言之,對於DNA而言,可用四種喊基表不,短片段也是如此。
[0027]「片段(fragment)序列」(或者簡稱為「片段」)指為了短片段的映射而作為比較短片段與對象鹼基序列時的單位的序列。從理論上講,為了將短片段映射於對象鹼基序列,需要把整個短片段從對象鹼基序列的最前端部分開始依次比較的同時計算短片段的映射位置。然而,由於這種方法在映射一個短片段時消耗過多的時間並要求過高的計算能力,因此實際上要先把短片段的一部分所構成的片即片段序列映射於對象鹼基序列而找出整個短片段的映射候選位置,然後將整個短片段映射於對應候選位置(Global Alignment)。
[0028]圖1為用於說明根據本發明一個實施例的鹼基序列重組方法100的圖。在本發明的實施例中,鹼基序列重組方法100指通過將基因組測序儀(genome sequencer)中輸出的短片段與對象鹼基序列進行比較而確定短片段在所述對象鹼基序列中的映射(或比對)位置,從而完成整個序列的一系列過程。
[0029]首先,如果從基因組測序儀(genome sequencer)接收到短片段(步驟102),則嘗試整個短片段與所述對象鹼基序列之間的精確匹配(exact matching)(步驟104)。進行所述嘗試的結果,如果針對整個短片段的精確匹配成功,則不執行後續的比對步驟而判斷為比對成功(步驟106)。將人類的鹼基序列作為對象進行實驗的結果顯示,如果將基因組測序儀中輸出的100萬個短片段精確匹配於人類的鹼基序列,則在總共200萬次的比對中(正向序列100萬次,反向互補(reverse complement)方向序列100萬次)出現231,564次的精確匹配。因此,執行所述步驟104的結果約可以減少11.6%的比對量。
[0030]然而,如果與之相反,即在所述步驟106中判斷為對應短片段並不精確匹配的情況下,則是計算將對應短片段比對於所述對象鹼基序列時的最小誤差估計值(MEB:MinimumError Bound) e (步驟 108)。
[0031]圖2為用於舉例說明所述步驟108中的最小誤差估計值e計算過程的圖。如圖所示,首先將初始最小誤差估計值設定為O (e=0),並從短片段的第一個鹼基向右逐個移動的同時嘗試精確匹配。此時,假定從所述短片段的特定鹼基(圖中的左側第一個箭頭處)開始無法再實現匹配,則這種情況說明從短片段的匹配起始位置到當前位置之間的區間中的某處出現了誤差。因此,在這種情況下將最小誤差估計值增加I (e=l)之後在下一個位置上重新開始精確匹配。如果在以後又遇到判斷為無法精確匹配的情況,則是說明從重新開始精確匹配的位置到當前位置之間的區間某處又出現了誤差,因此又將最小誤差估計值增加I (e=2)之後在下一個位置上重新開始精確匹配。通過這樣的過程,到達短片段末尾時的最小誤差估計值(圖中為e=3)將成為可能在對應短片段中出現的誤差的個數。其中,之所以將所述e的值作為最小誤差估計值,是因為並沒有對短片段中可能出現誤差的所有誤差數量進行分析,而是通過如果在特定部分中出現誤差便從該部分以後起重新進行精確匹配的方式而只對對象序列的某一位置(position)進行了檢查。即,所述e值可以作為在對應短片段中可能出現的誤差的最小值,而在對象序列的其他位置上可能出現更多的誤差。
[0032]若通過上述過程計算出了短片段的最小誤差估計值,則判斷計算出的最小誤差估計值是否超過預先設定的最大誤差允許值(maxError)(步驟110),判斷結果如果超過,則判斷為對應短片段的比對失敗並終止比對。在前述的將人類的鹼基序列作為對象的實驗中,將最大誤差允許值(maxEiror)設定為3而計算剩餘短片段的最小誤差估計值的結果顯示,共有844,891次實驗的短片段超過所述最大誤差允許值。即,執行所述步驟108的結果,約能減少42.2%的比對工作量。
[0033]相反地,如果在所述步驟110中判斷的結果,計算出的最小誤差估計值為所述最大誤差允許值以下,則將通過如下過程執行對應短片段的比對。
[0034]首先,由所述短片段生成多個片段(fragment)序列(步驟112),並執行從生成的所述多個片段序列中除去在對象鹼基序列上的映射重複數超過設定上限值的片段序列的篩選過程(步驟114)。然後,從片段序列中選擇在對象鹼基序列上的映射重複數超過設定基準值的片段序列,並調整選擇的片段序列的長度,直到所述選擇的片段序列的映射重複數達到所述基準值以下(步驟116)。此時,所述步驟114和步驟116既可以共同執行,也可以只執行兩個中的一個。
[0035]然後,利用所述片段序列而執行針對所述短片段的全局比對(global alignment)(步驟118)。此時,在所述步驟118中執行全局比對的所述片段序列當中不僅包含已在所述步驟116中調整了長度的片段序列,而且還一併包含未經調整長度的片段序列,即由於映射重複數在當初已是基準值以下而無需調整長度的片段序列。執行所述全局比對的結果,當短片段的誤差個數超過預先設定的最大誤差允許值(maxError)時判定為比對失敗,否則判定為比對成功(步驟120)。
[0036]以下便詳細說明所述步驟112至步驟116的具體過程。
[0037]由短片段生成多個片段序列(步驟112)
[0038]本步驟是為了正式執行短片段的比對而由短片段生成多個作為小片的片段序列的步驟。在本步驟中將通過考慮所述短片段的一部分或整體而生成多個片段序列。例如,可通過將短片段的整體或特定區間劃分為多個片而生成片段序列,或者可以將被劃分的片進行組合而生成片段序列。在這種情況下,生成的片段序列可以連續性地相連,然而並非一定要如此,也可以通過短片段內相互分離的片的組合構成片段序列。並且,生成的片段序列並非一定要具有相同的長度,也可以在一個短片段內生成具有多種長度的片段序列。總而言之,本發明中的由短片段生成片段序列的方法並不特別受限,從短片段的一部分或整體中提取片段序列的各種算法均可不加限制地使用。
[0039]篩選生成的片段序列(步驟114)
[0040]若通過如上所述的過程生成了片段序列,接著便執行計算生成的片段序列在對象鹼基序列中的映射重複數並除去計算出的映射重複數超過預先設定的上限值的片段序列的篩選過程。其中,所述映射重複數是指將片段序列映射於對象鹼基序列時發生精確匹配(exact matching)的次數。
[0041]通常,對象鹼基序列(例如人類的基因組)包含多個重複序列(repeat sequence)。由於這種重複序列分布於對象鹼基序列的多個位置上,且重複性地包含了相同的鹼基序列,因此對於有些片段序列而言,在與對象鹼基序列之間進行映射時將在多個位置上發生精確匹配,而在這種情況下,將對發生精確匹配的每一個位置執行全局比對,從而確定準確的映射位置。然而在這樣的映射重複數過多的情況下,將發生很多不必要的全局比對,由此對整個序列重組算法的複雜度及準確度產生不利影響,因此在所述重複數超過預先設定的上限值時,通過除去有關片段序列而防止序列重組算法的執行速度及複雜度過高。
[0042]此時,可通過考慮對象鹼基序列的種類及片段序列的長度等而確定所述上限值,實驗結果顯示,在片段序列的長度為15bp時,將所述上限值設定為10,000是恰當的,會提高鹼基序列重組的準確度及執行速度。
[0043]調整片段序列的長度(步驟116)
[0044]另外,即使如前所述地將映射重複數過大(即超過上限值)的片段序列除去,與對象鹼基序列之間的映射重複數相對較高的一些片段序列仍將對整個比對算法的複雜度及準確度產生不利影響。因此,有必要利用適當的方法減少片段序列的映射重複數。
[0045]為此,在本步驟中從候選片段序列當中選擇在所述對象鹼基序列上的映射位置的個數超過預先設定的基準值的片段序列,並針對選擇的片段序列調整(擴增)對應片段序列的大小,直到所述映射位置的個數成為所述設定值以下。
[0046]具體而言,在本步驟中計算生成的所述候選片段序列各自在所述對象鹼基序列上的映射位置的個數,並選擇計算出的所述映射位置的個數超過設定值的片段序列,然後擴增選擇的片段序列的大小,直到所述對象鹼基序列上的映射位置的個數成為所述設定值以下。
[0047]此時,可通過在所述選擇的片段序列上附加構成所述短片段的一部分的一個以上的鹼基而實現所述選擇的片段序列的大小的擴增。此時,被擴增的鹼基並非一定要與所述片段序列連接。例如,如圖3所示,為了擴增從短片段的5?19位置提取的片段序列,也可以增加從短片段的21?24位置提取的片。
[0048]並且,可通過在所述選擇的片段序列的起始端或末端上增加對應於相應位置的所述短片段上的鹼基而實現所述選擇的片段序列的大小的擴增。對此舉例說明如下。例如,假定如下地由短片段生成了片段序列。
[0049]短片段:ATTGCCTCAGT
[0050]片段序列:TTGC (短片段中帶有下劃線的部分)
[0051]如果對所述片段序列執行映射的結果,在對象鹼基序列上的映射位置的個數為65個,且設定的基準值為50,則如下地以Ibp為單位逐步擴增所述片段序列的長度,直到所述映射位置的個數減少為基準值以下。
[0052]TTGC (映射位置65個)
[0053]TTGCC (映射位置54個)
[0054]TTGCCT (映射位置 27 個)
[0055]對於上面的示例而言,由於在參考短片段而增加兩個鹼基的情況下映射位置的個數減少為基準值以下,因此最終片段序列將是相比於最初生成的值擴增了 2bp的TTGCCT。另外,如同前述的其他示例,所述基準值也是可以根據對象鹼基序列、短片段、片段序列的特性等而適當設定的值,本發明的權利範圍並不局限於特定的設定值。
[0056]另外,在如上所述地擴增片段序列長度的過程中,如果擴增的片段序列未被映射於對象鹼基序列,即,擴增的片段序列的映射位置個數為0,則對應片段序列將被除去。例如,假定如下地擴增片段序列的長度。
[0057]ACGG (映射位置270個)[0058]ACGGl (映射位置55個)
[0059]ACGGTA (映射位置O個)
[0060]對於所述片段序列而言,在原片段序列(ACGG)上擴增一個鹼基的片段序列在對象鹼基序列上的映射位置的個數為超過基準值的55個,而如果擴增兩個鹼基則根本不能被映射於對象鹼基序列。即在這種情況下,如果只擴增一個鹼基則會使映射位置過多,而如果擴增兩個鹼基則不能與對象鹼基序列之間發生映射,於是對應片段序列在之後的全局比對過程中將被除去而不會被使用。
[0061]在以人類的鹼基序列為對象的實驗中,在100萬個短片段中以15bp的片段序列長度、4bp的移動間距生成片段序列之後將生成的片段序列映射於對象鹼基序列的情況下,如果將基準值設定為50,則顯示在一共15,547,856個片段序列中約有77%的片段序列具有50個以下的映射位置。即實驗結果顯示,在以50作為基準值的情況下,77%的片段序列可以直接利用,而其餘23%的片段序列需要進行根據前述方法的片段序列的擴增。
[0062]圖4為根據本發明一個實施例的鹼基序列重組系統400的模塊圖。根據本發明一個實施例的鹼基序列重組系統400為用於執行前述鹼基序列重組方法的裝置,包括片段序列生成單元402、片段序列長度調整單元404、以及比對單元406,且可以根據需要而再包括篩選單元408。
[0063]片段序列生成單元402由通過基因組測序儀獲得的短片段生成多個片段(fragment)序列。
[0064]片段序列長度調整單元404從生成的所述多個片段序列中選擇在對象鹼基序列上的映射重複數超過設定基準值的片段序列,並調整選擇的片段序列的長度,直到所述選擇的片段序列的映射重複數達到所述基準值以下。此時,片段序列長度調整單元404可通過在所述選擇的片段序列上附加構成所述短片段的一部分的一個以上的鹼基而調整所述選擇的片段序列的長度。並且,在這種情況下,片段序列長度調整單元404可通過在所述選擇的片段序列的起始端或末端上增加對應於相應位置的所述短片段上的鹼基而調整所述選擇的片段序列的長度。
[0065]比對單元406利用所述片段序列而執行所述短片段對所述對象鹼基序列的全局比對(Global alignment)。此時,在比對單元406中執行全局比對的所述片段序列當中不僅包含已在片段序列長度調整單元404中調整了長度的片段序列,而且還一併包含未經調整長度的片段序列,即由於映射重複數在當初已是基準值以下而無需調整長度的片段序列。
[0066]篩選單元408在遇到由片段序列生成單元402生成的所述多個片段序列中存在對象鹼基序列上的映射重複數超過設定上限值的片段序列的情況時,除去對應片段序列。此時,所述上限值可以是如前所述的10,000。
[0067]圖5為根據本發明另一實施例的喊基序列重組系統500的|旲塊圖。如圖所不,根據本實施例的鹼基序列重組系統500包括片段序列生成單元502、篩選單元504、以及比對單元506。
[0068]片段序列生成單元502由通過基因組測序儀獲得的短片段生成多個片段(fragment)序列。
[0069]篩選單元504在遇到由片段序列生成單元402生成的所述多個片段序列中存在對象鹼基序列上的映射重複數超過設定上限值的片段序列的情況時,除去對應片段序列。此時,所述上限值可以是如前所述的10,000。
[0070]比對單元506利用通過篩選單元504篩選過的片段序列執行所述短片段對所述對象鹼基序列的全局比對(Global alignment)。
[0071]另外,本發明的實施例中可以包括記錄有用於將本說明書中記載的方法在計算機上執行的程序的計算機可讀記錄介質。所述計算機可讀記錄介質可將程序命令、本地數據文件、本地數據結構等單獨或組合而包括在內。所述介質既可以是為了本發明而特別設計並構成的,也可以是計算機軟體領域中具有普通知識的人員所公知和常用的。計算機可讀記錄介質的實例中包括硬碟、軟盤、磁帶等磁介質;只讀光碟(CD-ROM)、DVD等光記錄介質;軟盤等磁光介質;只讀存儲器、隨機存儲器、快閃記憶體等為了存儲並執行程序命令而特意構成的硬體裝置。程序命令的實例中不僅包括通過編譯器(Compiler)製作的機器語言代碼,而且還可以包括藉助於解釋器(Interpreter)等而能夠在計算機上執行的高級語言代碼。
[0072]以上通過代表性的實施例對本發明進行了詳細說明,然而本發明所屬【技術領域】中具有普通知識的人員即可明白在不脫離本發明範圍的條件下對上述實施例能夠進行多種多樣的變形。
[0073]因此不能局限於上述實施例而確定本發明的權利範圍,本發明的範圍應當由權利要求書及其等價內容確定。
【權利要求】
1.一種喊基序列重組系統,包括: 片段序列生成單元,用於由短片段生成多個片段序列; 片段序列長度調整單元,從生成的所述多個片段序列當中選擇對象鹼基序列上的映射重複數超過設定基準值的片段序列,並調整選擇的片段序列的長度,直到所述選擇的片段序列的映射重複數達到所述基準值以下; 比對單元,利用所述片段序列執行全局比對。
2.如權利要求1所述的鹼基序列重組系統,其中,所述片段序列長度調整單元在所述選擇的片段序列上附加構成所述短片段的一部分的一個以上的鹼基。
3.如權利要求2所述的鹼基序列重組系統,其中,所述片段序列長度調整單元在所述選擇的片段序列的起始端或末端上增加對應於相應位置的所述短片段上的鹼基。
4.如權利要求1所述的鹼基序列重組系統,其中,所述片段序列長度調整單元在長度得到調整的片段序列沒有被映射於所述對象鹼基序列的情況下,除去所述長度得到調整的片段序列。
5.如權利要求1所述的鹼基序列重組系統,還包括篩選單元,用於當生成的所述多個片段序列中存在對象鹼基序列上的映射重複數超過設定上限值的片段序列時,除去對應片段序列。
6.如權利要求5所述的鹼基序列重組系統,其中,所述上限值為10000。
7.—種喊基序列重組系統,包括: 片段序列生成單元,用於由短片段生成多個片段序列; 篩選單元,用於從生成的所述多`個片段序列中除去對象鹼基序列上的映射重複數超過設定上限值的片段序列; 比對單元,利用除了被除去的所述片段序列以外的其餘片段序列而執行全局比對。
8.如權利要求7所述的鹼基序列重組系統,其中,所述上限值為10000。
9.一種鹼基序列重組方法,包括如下步驟: 在片段序列生成單元中,由短片段生成多個片段序列; 在片段序列長度調整單元中,從生成的所述多個片段序列當中選擇對象鹼基序列上的映射重複數超過設定基準值的片段序列,並調整選擇的片段序列的長度,直到所述選擇的片段序列的映射重複數達到所述基準值以下; 在比對單元中,利用所述片段序列執行全局比對。
10.如權利要求9所述的鹼基序列重組方法,其中,在調整所述片段序列的長度的步驟中,在所述選擇的片段序列上附加構成所述短片段的一部分的一個以上的鹼基。
11.如權利要求10所述的鹼基序列重組方法,其中,在調整所述片段序列的長度的步驟中,在所述選擇的片段序列的起始端或末端上增加對應於相應位置的所述短片段上的鹼基。
12.如權利要求9所述的鹼基序列重組方法,其中,在調整所述片段序列的長度的步驟中,在長度得到調整的片段序列沒有被映射於所述對象鹼基序列的情況下,除去所述長度得到調整的片段序列。
13.如權利要求9所述的鹼基序列重組方法,其中在執行生成所述片段序列的步驟之後還包括如下的篩選步驟:如果在生成的所述多個片段序列中存在對象鹼基序列上的映射重複數超過設定上限值的片段序列,則除去對應的片段序列。
14.如權利要求13所述的鹼基序列重組方法,其中,所述上限值為10000。
15.一種鹼基序列重組方法,包括如下步驟: 在片段序列生成單元中,由短片段生成多個片段序列; 在篩選單元中,從生成的所述多個片段序列中除去對象鹼基序列上的映射重複數超過設定上限值的片段序列; 在比對單元中,利用除了被除去的所述片段序列以外的其餘片段序列而執行全局比對。
16.如權利要求15所述的鹼基序列重組方法,其中,所述上限值為10000。
【文檔編號】G06F19/18GK103793624SQ201310373186
【公開日】2014年5月14日 申請日期:2013年8月23日 優先權日:2012年10月29日
【發明者】樸旻胥 申請人:三星Sds株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀