新四季網

試樣數據可靠性評價方法和試樣數據可靠性評價裝置的製作方法

2023-10-08 18:13:34 2

專利名稱:試樣數據可靠性評價方法和試樣數據可靠性評價裝置的製作方法
技術領域:
本發明涉及用於區分i^的i,數據的可靠性im和i^數據的品質管理。
背景技術:
在取自生物的試樣的多態分析中,根據試樣濃度和有無阻礙物質等,每賴 樣進行多態識別反應的進行速度不同。因此就在多態分析中得到分布很廣的多態 性維
以往,對Ti辦的信號都i頓統計學方法和遺傳學方法進行多絲析。 但是,特別是在關於基因多態性的多態分析中,由於具有在數百is式樣中僅
存在幾^i式樣這樣的頻率少的多態性,因此,禾偶以前的統計學方法統計出的統
計量有時並沒有意義。
因此,在關於基因多態性的多態分析時, 一般都是利用哈代溫伯格平衡來在
遺傳統計學上iWr該多態分析中得到的多態性數據的可靠性。此外,作為評價在
關於基因多態性的多態分析中得到的多態性數據的可靠性的技術,非專利文獻i
已予以公開。具體地說,在非專利文獻l中公開的i,指標"CSS"中利用旨組
的統計值。
但是,在這些現有的評價方法中,其前提都是將從已進行了隨機交配的群體 中採樣的試樣中得到的多態性數據來作為im對象,因此,從例如家族系譜試樣
和患者i,等偏於一方抽樣的試樣中得到的多態1iic據,就不適合作為評價,。 此外,在如圖10所示的例如將基因型"BB"只有1個的多晶型多態'ia據作為
i憤鄉的情況下,由於不能得到與基因"BB"的組相對應的分散和平均,因此,
在,的現有iwr方法中^隹以計算出im值。
艮口,在未進行隨機交配的群體或者有關基因多態性的多態分析中得到了包含
有頻率少的多態性的多態性數據的情況下,用現有的評價方法難以評i^種多態
性 的可靠性。
因此,在現有技術中就依靠熟練的操作人員主觀地i刊介包含有頻率少的多態性的多態性數據的可靠性,然後再決定鶴離的抽出和分類型的閾值。
非專利文獻l: Kevin L Gunderson, Frank J Steemers, Grace Lee , Leo G Mendoza, and Mark S Chee, "A genome—wide scalable SNP genotyping assay using microarray technology" , NATURE GENETICS, VOLUME37, NUMBER5, MAY, 200
發明內容
但是,在現有技術中是操作人員主觀地i憤多態性數據的可靠性,因此會產 生如下問題,即,不論是否將相同的多態性數據作為評價對象,若操作人員不同, 其i啊介結果也就不同。
本發明鑑於上述問題點,其目的在於提供一種試樣數據可靠性評價方法和試 樣數據可靠性評價裝置,該試樣數據可靠性評價方法和試樣數據可靠性評價裝置 即使在特別是有關基因多態性的多態分析中得到了包含有頻率少的多態性的多態
性數據的情況下,也能夠客觀地iW^種多態性i^的可靠性。
為了解決上述問題,達到戰目的,本發明涉及的技術方案1中記載的微
數據可靠性刑介方法的特徵在於,包括基於以有關已分組試樣的多1^#數據 為要素的試樣 集合,計算上述試樣和與該^#所屬的組屬於相同的上述組的
上述試樣之間的典型距離,即相同組試樣間典型距離的工序;基於上述試樣薩
集合,計算上述試樣和與該試樣所屬的上述組屬於不同的戰組的上述試樣之間
的典型距離即不同組試樣間典型距離的工序;基於在上述工序中計算出的上述相 同組試樣間典型距離和上述不同組試樣間典型距離,計算用於i啊條個上述試樣 數據的可靠性的指標即可靠性im指標的工序;基於在上述工序中計算出的上述 可靠性評價指標,評價上述試樣 集合的部分集合或者上述試樣數據集合的全 #*合的±^可靠性的工序。
此外,本發明涉及的技術方案2中記載的,,可靠性im方法的特徵在
於,在技術方案i中記載的,i^可靠性iWr方法中,上述相同組試樣間典型
距離^i:述試樣和與該試樣所屬的上述組屬於相同的上述組的上述試樣之間的平 均距離,,不同組試樣間典型距離^i:述,和與該試樣所屬的上述組屬於不 同的,組的上述試樣之間的最小距離,上述可靠性評價指標處述相同組試樣 間典型距離與,不同組WW司典型距離的比或者該比的平均。此外,本發明涉及的技術方案3中記載的i,i^可靠性i判介方法的特徵在 於,在技術方案i或2中記載的辦i^可靠性im方法中,戶;f^h^i維娜 集合的,部分集合或者上述試樣i^集合全體的,可靠性的,iWr, M 述可靠性低的戰試樣數據集合的上述部分集合或者上述試樣數據集合全體的抽 出、或者在,分組中^ffi的算法的,可靠性的Ji^im。
此外,本發明涉及的技術方案4中記載的i^fi^可靠性i刊介方法的特徵在 於,在技術方案1至3的任一項中記載的試樣繊可靠性粥介方法中,進一步包 括輸出:^±3£工序中計算出的上述可靠性i刊介指標的工序。
此外,本發明還涉及K^數據可靠性ifi^置,技術方案5中記載的試樣數
據可靠性評價裝置的特徵在於,具有基於以有關已分組試樣的多^樣數據為 要素的試樣數據集合,計算上述試樣和與該,所屬的組屬於相同的上述組的上
述試樣之間的典型距離,艮湘同組試樣間典型距離的裝置;基於上述試樣數據集
合,計算上述試樣和與該試樣所屬的上述組屬於不同的戰組的上述試樣之間的
典型距離,即不同組試樣間典型距離的裝置;基於在上述裝置中計算出的上述相
同組試樣間典型距離和上述不同組試樣間典型距離,計算用於im上述試樣數據
的可靠性的指標即可靠性評價指標的裝置;基於在,裝置中計算出的上述可靠 性評價指標,刑介上述,數據集合的部分集合或者,試樣數據集合的集合全 體的,可靠性的,。
此外,本發明涉及的技術方案6中記載的試樣i^可靠性i刊,置的特徵在
於,在技術方案5中記載的i辦l^可靠性iW^置中,上述相同組試樣間典型 距離^ll述試樣和與該試樣所屬的上述組屬於相同的上述組的J^試樣之間的平 均距離,上述不同組試樣間典型距離^Jl述試樣和與該i^f所屬的上述組屬於不 同的上述組的上述試樣之間的最小距離,上述可靠性im指標^Jl^相同組試樣 間典型距離與上述不同組i,間典型距離的比或者該比的平均。
此外,本發明涉及的技術方案7中記載的,M可靠性評J皿置的特徵在 於,在技術方案5或6中記載的i辦,可靠性iW^S中,上述i辦數據集合 的上述部分集合或者上述試樣數據集合全體的上述可靠性的上述評價,^Jl述可 靠性低的上述試樣M集合的上述部分集合或者上述試樣數據集合全體的抽出、
或者^j^分組中^^的算法的,可靠性的,im。
It[^卜,本發明涉及的技術方案8中記載的試祥數據可靠性iTO^置的特徵在於,在技術方案5至7的任一項中記載的離i^可靠性im^g中,進一步具
有輸出在上,置中計算出的,可靠性荊介指標的^a。
根據本發明,由於基於以有關已分組試樣的多個試樣數據為要素的 試樣數據集合,計算試樣和與該試樣所屬的組屬於相同組的試樣之間的 典型距離即相同組試樣間典型距離,基於試樣數據集合,計算試樣和與 該試樣所屬的組屬於不同組的試樣之間的典型距離即不同組試樣間典 型距離,基於計算出的相同組試樣間典型距離和不同組試樣間典型距 離,計算用於評價試樣數據集合的部分集合即試樣數據部分集合(例如, 具有i個試樣數據作為要素的試樣數據部分集合、具有屬於相同組的多 個試樣數據作為要素的試樣數據部分集合、具有全部試樣數據作為要素 的試樣數據部分集合等)的可靠性的指標即可靠性評價指標(例如,用 於評價試樣數據可靠性的指標即試樣可靠性評價指標、試樣可靠性評價 指標的平均等),基於計算出的可靠性評價指標,評價試樣數據部分集 合的可靠性,因此,起到了即使在特別是有關基因多態性的多態分析中 得到了包含有頻率少的多態性的多態性數據的情況下,也能夠客觀地評 價這種多態性數據的可靠性等的效果。


圖i是示出本發明的基本原理的原理結構圖。
圖2是示出i辦娜可靠性ififr體ioo的結構的框圖。
圖3是示出試樣i[^集合文件106a中存儲的信息的一個例子的圖。 圖4是示出關注,關ra據文件106b中存儲的信息的一個例子的圖。 圖5是示出在試樣翻可靠性i^f^置100的控制部102中進行的主處理的 一個例子的流程圖。
圖6是示出對*實驗單位計算出的QVavg。的一個例子的圖。
圖7是示出錯誤,的抽出例的圖。
圖8是示出QVavg,的直方圖的一個例子的圖。
圖9是示出與在圖8中具有平均的輸入,品質的實驗相對應的QV^。的圖。 圖10歸出在現有技術中難以iTO的頻率少的多態性,的一個例子的圖。 附圖iH己的說明ioo辦M可靠性iW^置
102控制部
102a i辦娜集合取得部
102b關注i,設定部
102c相同組試樣間典型距離計算部
102d不同組i,間典型距離計算部
102e可靠性扁旨標計算部
證可靠性iW部
102g結果輸出部 104通信接口部 106存儲部
馳i辦娜集合文件
勵關注i辦關ra^文件
106c i啊介結果l^文件 108輸入輸出接口部 110輸A^g 112輸出裝置 200外部系統 300網絡
具體實施例方式
以下,基於附圖詳細地說明本發明涉及的試樣 可靠性#^方法和試樣數 據可靠性評i條置的實施方式。另外,本發明不限定於本實施方式。以下對本發 明的概要進行說明,之後再對本發明的結構和處理等詳細:tfciS行說明。
下面,參照圖2至圖4,對本實施方式涉及的i辦,可靠性刑^g 100 的結構進行說明。圖2是示出試祥,可靠性iW^置100的結構的框圖,該圖
在示意上示出了該結構中的只與本發明有關係的部分。
試樣娜可靠性ifi^置100由控制部102、通信接口部104、存儲部106和 輸入輸出接口部108構成,戶腿控制部102是總鵬制該i辦薩可靠性if^ 置的CPU (Central Processing Unit:中央處理器)等,B^3I信接口部104通31^各 由器等通信體和專用線等有線頓線的通信線路,與網絡300可通信±鵬接著 該i辦自可靠性iW^g,戶腿存儲部106存儲各種 庫和表及文件等,所 述輸入輸出接口部108與輸A^置110和輸出裝置112連接,這些部分S31任意 的通信線路可通信鵬接著。
存儲部106是存f,置,可以使用例如RAM (RandomAccessMemoty:隨機 存取存儲器)和ROM (Read Only Memory:只讀存儲器)難儲器裝置、HD (Hard Disk:石鵬)這樣的固定盤體、軟盤、光碟等。然後,存儲部106如圖所^t也 存儲有試樣 集合文件106a、關注i辦關^g文件106b、 ifj介結果f^文件 106c。再有,存儲部106除了存儲各種文件(i辦i^集合文件106a iWr結果 數據文件106c)以外,還存儲用於在控制部102中執行的各種處理中所i頓各種 的禾蹄、表、文件、,庫和網頁用文件等。
i辦娜集合文件106a存衞辦i^集合。 匕參照圖3,對i辦M集 合文件106a中存儲的信息的一個例子進行說明。圖3是示出試樣娜集合文件 106a中存儲的信息的一個例子的圖。如圖3所示,離,集合文件106a相互關 膨也存儲著作為用於唯一地識別]^#的^#識別數據的,nx作為用於唯一地 識別組(例如多態性的類型等)的組識別織的組ID、從i辦的測定得到的信號雖
返回到圖2,關注^#關 ^文件106b存儲與在後述的關注i辦設定部102 中設定的所關注的試樣即關注,相關聯的數據。 Sjt匕參照圖4,對在關注 關微據文件106b中存儲的信息的一個例預行說明。圖4是示出在關注辦關 ra據文件106b中存儲的信息的一個例子的圖。如圖4所示,關注^f關^i^ 文件106b相互關聯地存儲著與關注試樣相對應的i式樣ID、相同組,間典型距 離、不同組i辦間典型距離和辦可靠性iTO指標。
返回到圖2,評價結果i^文件106c對每個關注試樣iC^集合存儲著與後述 的可靠性i刊介部102f中的i憤結果有關的,。關注微繊集合相當於本發明 中的i辦數據部分集合,以1個以上的關注^# (與關注i^f相對應的i^ 數據)為要素。
通信接口部104媒^f 可靠性荊介體100與網絡300(或者路由器等 通信裝置)之間的通信。艮口,通信接口部104具有通艦信線路與其他終端通信 的功能。
輸入輸出接口部108與輸A^置110和輸出裝置112連接。在此,輸出^g 112除了監視器(包括家庭用電視機)之外,可以使用揚聲器和印表機(再有,以 下有時將輸出裝置m記載為監視器)。此外,輸A^置110除了鍵盤和滑鼠及 麥克風之外,還可以使用與滑鼠協作實現定點設備功能的監視器。
控制部102具有用於存儲OS (Opemting System:作業系統)等的控制禾辨、
規定了各種處理過程等的禾蹄禾哳需數據的內部存儲器,基於這些禾驕進行用於 執行各種各樣處理的信息處理。然後,控制部102如圖所示地大致具有i辦, 集合取得部102a、關注試樣設定部102b、相同組試樣間典型距離計算部102c、不 同組試樣間典型距離計算部102d、可靠性ififT指標計算部102e、可靠性ififr部102f 和結果輸出部102g。
i辦數據集合取得部102a取得i辦娜集合,將取得的辦翻集合存儲在 說羊數據集合文件106a的規定存儲區域中。
關注i辦設定部102b從在i辦,集合取得部102a中取得的, 集合 中設定關注試樣。
相同組辦間典,巨離計算部102c基於在試樣繊集合取得部102a中取得 的試樣數據集合,計算出與在關注試樣設定部102b中設定的關注^#相對應的相同組試樣間典型距離(具體的是關注i辦和與該關注試樣所屬的組屬於相同組的 試樣之間的典型距離),將計算出的相同組試樣間典型距離存儲在關注試樣關聯
數據文件106b的規定存儲區域中。
不同組i辦間典型距離計算部102d基於在i辦,集合取得部102a中取得 的試樣 集合,計算與在關注試樣設定部102b中設定的關注說羊相對應的不同 組試樣間典型距離(具體的是關注試樣和與該關注試樣所屬的組屬於不同組的試 樣之間的典型距離),將計算出的不同組試樣間典型距離存儲在關注試樣關 據文件106b的規定存儲區域中。
可靠性粥介指標計算部102e基於在相同組i辦間典型距離計算部102c中計 算出的相同組試樣間典型距離和在不同組i^f間典型距離計算部102d中計算出的 不同組試樣間典型距離的1個以上的組(換言之,是相同組試樣間典型距離和不 同組試樣間典型距離的每個關注試樣的組),對每個關注試樣數據計算試樣可靠
性im指標作為可靠性w^指標,將計算出的i個以上的試樣可靠性im指標存
儲在關注i^關M^文件106b的規定存儲區域中。此外,可靠性i啊介指標計算 部102e對每個關注,i^集^i十算Ji^計算出的1個以上的試樣可靠性iff介指 標的平均,作為可靠性i刊介指標。
可靠性評價部102f基於在可靠性iTO指標計算部102e中計算出的1個以上的 可靠性評價指標(試樣可靠性評價指標、試樣可靠性im指標的平均),對每個 該試樣數據集^i平價關注試樣繊集合的可靠性,將與該i,結果有關的數據存 儲在1¥#結果 文件106c的規定存儲區域中。
結果輸出部102g向輸出裝置112輸出在可靠性im指^i十算部102e中計算 出的可靠性im指標和可靠性i刊介部102f中的iff介結果。
外部系統200 Mil網絡300與i,i[^可靠性iW^置100相互可通信i皿 接,具有提供例如與試樣數據集合等有關的外部資料庫禾,於執行各種處理的外 部禾i)^等的功能。 ,夕卜部系統200也可以構成為WEB月艮務器和ASP月艮務器 等,其硬體也可以用普通銷售的工作站和個人計穀幾等信息處理驢禾唭附屬裝 置來構成。此外,用外部系統200的硬體結構中的CPU、盤裝置、存儲器裝置、 輸A^fi、輸出裝置和通信控制裝置等和控制這些體的禾將來實5^卜部系統200 的各功能。
網絡300具有相互連接試樣I^可靠性iW^置100和外部系統200的功能,(包括有線/無線)、van、個人計^nm信
網、公用電話網(包括模擬/數字)、專用線路網(包括模擬/數字)、CATV 網、IMT2000方式、GSM方式或者PDC/PDC—P方式等的可攜式線路交換網/ 可攜式包交換網、無線呼叫網、Bluetooth (註冊商標)等局概線網、PHS網、 CS、 BS或者ISDB等衛星通信網等中的某一種。這樣,i対羊數據可靠性刑^g 100就能夠通過不論有線還是無線的任意網絡來收發各種數據。 [系統的處理J
下面,參照圖5說明離繊可靠性iWT^置100的控制部102戶腿行的主 處理的一個例子。圖5是示出辦 可靠啦靴體100的控制部102戶艦行 的主處理的一個例子的流程圖。再有,在此,關於對應於1個實驗的試樣 集 合的處 行說明。
首先,控制部102根^i辦,集合取得部102a的處理,il31網絡300,從 外部系統200取得1 集合,將取得的1 集合存儲在^#|^集合文 件106a的規定存儲區域中(步驟SA—1)。
接著,控制部102根據關注辦設定部102b的處理,從在步驟SA-1中取得 的試樣娜集合中設定關注i辦(步驟SA—2)。
接著,控制部102根據相同組辦間典型距離計算部102c的處理,基^# 數據集合文件106a中存儲的i^f自集合,計算與在步驟SA—2中設定的關注試 樣相對應的相同組試樣間平均距離,將計算出的相同組i^W司平均距離存儲在關 注i辦關^l^文件106b的規定存儲區域中(步驟SA—3)。
在此,也可以在步驟SA—3中基於下述數學式1計算出相同組試樣間平均距
離。 + /-i-
傲學式u 1^"—"》+(^—~)
"1=-^-…(數學式l)
在數學式1中,A是相同組離間平均距離,(3i, bi)是關注辦i本身的
信號數據,(巧,bj)是與和關注^#所屬的組屬於相同組的試樣相對應的 數 據中包含的信號數據,n是關注i^f所屬的組中包含的試樣的總數。再有,即使是 同一組中包含的,,d,也根^i,而不同。
此外,控制部102與步驟SA—3並行,根據不同組辦間典型距離計算部102d 的處理,基B辦麵集合文件106a中存儲的i辦I^集合,計算與在步驟SA—2中設定的關注i辦相對應的不同組i辦間最小距離,將計算出的不同組試樣間 最小距離存儲在關注i辦關m^文件106b的規定存儲區域中(步驟SA—4)。 在此,在步驟SA—4中,也可以基於下述數學式2計算不同組i辦間最小距離。 _
"2 = min[ q)2+( -~)2]…(數學式2)
在數學式2中,d2是不同組i辦間最小距離,",bj)是關注辦i本身的
信號數據,",bk)是與和關注i辦所屬的組屬於不同組的試樣相對應的i^f數
據中包含的信號數據。再有,即使是同一組中包含的試樣,d2也根^gi式樣而不同。
接著,控制部102對i辦娜集合文件106a中存儲的辦繊集合的全部試 樣,確認步驟SA—2到步驟SA—4是否已結束了,在該確認結果不是"已結束" 的情況下(步驟SA-5:否),使各處理部執行步驟SA—2到步驟SA—4,在該 確認結果是"已結束"的情況下(步驟SA—5:是),使可靠性刑介指標計算部 102e執行後述的步驟SA—6。
接著,控制部102根據可靠性im指標計算部102e的處理,基於在步驟SA 一3中計算出的相同組試樣間平均距離和在步驟SA—4中計算出的不同組i^f間 最小距離的每個關注試樣的組,對*關注試樣數據計算出相同組試樣間平均距 離與不同組試樣間最小距離的比,作為試樣可靠性iTO指標,將計算出的多個試 樣可靠性im指標存儲在關注^f關ra^文件106b的規定存儲區域中,計算上 述已計算出的多個i辦可靠性im指標的平均(步驟SA—6)。
在此,在步驟SA—6中,也可以基於下述數學式3計算出i辦M可靠性評
價指標c
…(數學式3)
在數學式3中,QV是關注i辦i中的試樣娜可靠性iW指標,d,處述數 學式1中示出的相同組i,間平均距離,d2^i^數學式2中示出的不同組i^f 間最小距離。
接著,控制部102根據可靠性i憤部102f的處理,基於在步驟SA—6中計算 出的多^樣可靠性im指標,對每個該關注試樣i^iTO關注微數據的可靠 性,並且,基於在步驟SA—6中計算出的多lH辦可靠性iTO指標的平均,對每個關注試樣數據集^i平價關注試樣數據集合的可靠性,將與這些i憤結果有關的
數據存儲在評價結果數據文件106c的規定存儲區域中(步驟SA—7)。
^!t:結束了關TO樣i^可靠性i刊^g ioo的控制部102戶,行的組處理 的一個例子的說明。
如以上說明地,根據本實施方式,取得試樣 集合,從試樣mig集合中設 定關注試樣,關於設定的關注試樣,計算出相同組試樣間平均距離和不同組試樣 間最小距離,關於試樣數據集合的全部試樣,反覆進行關注試樣的設定、相同組 試樣間平均距離的計算和不同組試樣間最小距離的計算,基於計算出的相同組試 樣間平均距離和不同組試樣間最小距離的每個關注試樣的組,對每個關注試樣數 據計算出相同組試樣間平均距離與不同組試樣間最小距離的比,作為試樣可靠性 評價指標,並且,對每個關注試樣數據集合計算試樣可靠性評價指標的平均,基 於計算出的多^K樣數據可靠性評價指標,對每個該關注試樣數據評價關注試樣 數據的可靠性,並且,基於計算出的多個平均,對每個關注試樣數據集合i啊介關 注試樣 集合的可靠性。這樣,即使在特別是有皿因多態性的多態分析中得 到了包含有頻率少的多態性的多態性數據的情況下,也能夠客觀地評,種多態 性數據的可靠性。 匕在本實施方式中,作為一個例子,基於數學式i計算出 了相同組試樣間平均距離作為典型距離,但作為典型距離,除了平均距離以外, 也可以是例如除去中間值、最頻值、最大值和最小it^計算出平均值,或者也可
以除去距離平均值離開有分散的2倍以上的i^後重i i十算出平均值。
形卜,根據本實施方式,關注i辦i^集合可以具有i個關注i辦,作為
要素,也可以具有屬於相同組的多個關注試樣 作為要素,也可以具有全部關 注試樣數據作為要素。這樣就能夠按照試樣單位、組單位或者全部試樣單位(具 體的說是實驗單位)計算出可靠性荊介指標,其結果,會,按照試樣單位、組單
位或者^p試樣單位(具體的說是實驗單位)來荊介關注說羊i^集合的可靠性。 此外,本發明除了上逸的實施方式以外,也可以在權利請求範圍書中記載的 技術思想範圍內按照各種各樣不同的實施方式進行實施。例如,離聽可靠性
粥介裝置100也可以構成為按照來自由不同於該試樣數據可靠性刑條置的另外 的殼體構成的客戶機終端的請求 行處理,將其處理結果返33^合該客戶機終端。 此外,在本實施方式中說明的各處理中,也可以手動i鵬行上述說明為自動進行的處理的全部或者一部分,或者用公開的方法自動地進行上述說明為手動進行的 處理的全部或者一部分。除此以外,關於上述說明書中和附圖中示出的處理過程、 控制過程、具體名稱、包括各種登記 和檢索斜牛等的參數的信息、畫面例、
資料庫結構,除了特殊情況以外,旨^^壬意變更。
此外,有關i辦l^可靠性刑條置100,圖示的各結構要素是功能示意性的, 不一定需要物恥如圖所示地構成。例如,關iH辦,可靠性iH^S 100的 各部分或者各體所具有的處理功能、特別是由控帝嘟102進行的各處理功能, 可以由CPU和在該CPU中解釋執行的程序來實現其全部或者一部分,或者也可 以實現為禾IJ用布線邏輯的硬體。再有,該禾聘被記錄在後述的記錄介質中,根據 需要被辦 可靠性1^^置100機械性地讀取。即,在ROM或者HD等存儲 部106等中記錄著用於與OS協作對CPU給予命令並進行各種處理的計#|幾禾歸。 M將該計^ll禾i^載入到RAM等中來執行該計 1禾1]%與CPU協作構成控 制部102。此外,該計,禾驕也可以被記錄在通過任意的網絡300與i辦數據可 靠性i憤體100連接的應用禾蹄伺服器中,也可以根據需要下載其全部或者一 部分。
此外,也可以將戰禾聘存儲在計^m可讀取的記錄介質中。 匕戶誠"記 錄介質"包括鄉、光磁碟、ROM、 EPROM、 EEPROM、 CD—ROM、 MO、 DVD 等任意的"可移動的物理介質"和內裝在各種計^m系統中的ROM、 RAM、 HD 等任意的"固定用的物理介質"、或者^iM:以LAN、 WAN、網際網路為代表的網 絡發送,將時的通信線路和載波這樣的短期保持f驕的"通信介質"等。此外, 所述是用任意語言和描述方法描述的 處理方法,不論原始碼和二進 制代碼等的形式。再有,"程序"不一定限於單一構成的程序,也包括分散構成 為多個模塊和庫的fM^以及與以OS為代表的個別f驕協作達成其功能的,旨。再 有,在實施方式中示出的各裝置中,關於用於讀取記錄介質的具體結構、讀取過 程、或新賣取後的安驗程等,可以4頓公開的結構和過程。
此外,也可以通過與已知的個人計算機、工作站等信息處理終端等的信息處 理裝置連接印表機、監視器和掃描儀等外圍設備,在該信息處理裝置中安裝實現 本發明涉及的試樣翻可靠性i憤方法的軟體(包括禾聘、數據等),來實現試 樣數據可靠性iW^g亂
另外,微繊可靠性iW^置100的分散或統一的具體實施方式
不限於圖任意單位,功能性或者物理性地分散或統一構 麟全部或者一部分。例如,可以^^構成各資料庫來作為獨立的資料庫裝置,
此外,也可以使用CGI (Common Gateway Interface:公共網關接口)來實現處理 的一部分。 實施例
在此示出在i^實施方式涉及的試樣m^可靠性iw^置ioo中計算出的可
靠性im指標(具體的說^h述實施方式涉及的QV和QV的平均(QVavg,)等) 的具體一個例子。
首先,按照SSPCE—FCS (參照"Current Pharaiaceutical Biotechnology, 2003, 4, 447—484")定型人的一鹼價多態性,用1好螢光測定驢(MF10S、 Olympus 公司制)領啶關於各1H辦的與各等位基因(Allele)相對應的信號,按類型將其 測定結果分組。然後,將分組後的試樣的i言號數據作為上述試樣數據可靠性評價 裝置100的輸入鵬
圖6中示出對^實驗單位計算出的可靠性ifj介指標(QVavg. ) o該QVavg。 是關於用96wdl極板實施的實驗中包含的80個試樣,對^^樣計算出的80個 QV的平均。如圖6所示,分組的狀況按照實驗A (Exp.A)、實驗B (Exp.B)、 實驗C (Exp.C)柳頃序而錢。然後,對應於分組狀況錢,QVavg。的值也體 為8.44、 4.00、 1.42。因此,QV,的fl^應於按照實驗單位的分組狀況的變化。
接著,使用對每^i辦求得的可靠性im指標(QV),試著抽出分離差的試 樣(定型不良試樣、錯誤試樣)。圖7中示出其結果。在圖7中,在QV值低於1 的i辦上標己著箭頭。戶腿QV低於1是指與相同類型的平均距離,大於與最近 的其他類型的距離。然後,如圖7所示,QV低於l的i辦集中在組的邊界P(銜。 因此,能夠按照QV值抽出分離不明顯的i辦。
接著,圖8中示出關於大約600個實驗(1個實驗由80 構成),對每 個實^i十算出的大約600個的QVm。的直方圖。由於QV與辦的分離狀況相關, 因此,通過比較實驗間的QVavg.,就售,知道輸入娜的品質。通過用直方圖示 出對每個實驗計算出的QV^.,就能夠將與當前著眼的實驗相對應的輸入數據的 品質與其他實驗的輸入數據的品質客觀i,行比較。此外,圖9中示出對應於在
圖8中具有平均輸入數據品質的實驗的QV^。。大約600個的,實驗中的QVavg. 的平均是3.47,圖9中示出與,於其平均的3.35的QV^。相對應的實驗G的散布圖。
以上示出了將QV和QVavg。作為用於評價定型結果的可靠性的指標而十分有
用的情況。此外,通過艦圖8中示出的QV^。的直方圖,能夠關於多個實驗向 第三者客觀地示出其可靠性。Jl^卜,倉嫩根據QV實現錯誤試樣的自動抽出。從 而,在戰的離繊可靠性iW^S 100中執行的離娜可靠性i憤方法, 就能夠被用作錯誤試樣的自動抽出算法。
:nik實用性
如上所述,本發明涉及的試樣數據可靠性評價方法和i式樣i^可靠性評價裝 置,即使是在現有技術中可靠性評價困難的頻率少的多態性數據,也能夠不取決 於操作人員的主觀而客觀地評價其可靠性,能夠在生物、製藥、醫療等各種各樣 工業領域中最微也艦。
權利要求
1、一種試樣數據可靠性評價方法,其特徵在於,包括基於以有關被分組的試樣的多個試樣數據為要素的試樣數據集合,計算出上述試樣和與該試樣所屬的組屬於相同的上述組的上述試樣之間的典型距離即相同組試樣間典型距離的工序;基於上述試樣數據集合,計算出上述試樣和與該試樣所屬的上述組屬於不同的上述組的上述試樣之間的典型距離即不同組試樣間典型距離的工序;基於在上述工序中計算出的上述相同組試樣間典型距離和上述不同組試樣間典型距離,計算出用於評價上述試樣數據的可靠性的指標即可靠性評價指標的工序;以及基於在上述工序中計算出的上述可靠性評價指標,評價上述試樣數據集合的部分集合或者上述試樣數據集合的全體的上述可靠性的工序。
2、 如權利要求1所述的i^f數據可靠性im方法,其特徵在於, 上述相同組試樣間典型距離^±述試樣和與該試樣所屬的上述組屬於相同上述組的上述試樣之間的平均距離,上述不同組試樣間典型距離^Jl述試樣和與該試樣所屬的上述組屬於不同的,組的J:^i^之間的最小距離,上述可靠性tm指標紅述相同組試樣間典型距離與上述不同組試樣間典型距離的比或者該比的平均。
3、 如權利要求l或2戶臓的i^fl^可靠性im方法,^#徵在於, 上述試樣 集合的上述部分集合或者±^試樣數據集合全體的上述可靠性的戰評價,^JlM可靠性低的上述試樣娜集合的上述部分集合或者上述試樣 數據集合全體的抽出、或者在上述分組中JOT的算法的,可靠性的上述iTO。
4、 如權利要求1至3的任一項戶腿的i辦i^可靠性i憤方法,其特徵在於,進一步包括輸出^ji^x序中計算出的,可靠性im指標的工序。
5、 —種辦娜可靠性iW^g,其特徵在於,具有基於以有關被分組的試樣的多^樣數據為要素的試樣ic^集合,計算出上述試樣和與該i,所屬的組屬於相同的上述組的上述試樣之間的典型距離即相同 組,間典型距離的^g;基於上述試樣數據集合,計算出上述試樣和與該試樣所屬的上述組屬於不同 的上述組的,試樣之間的典型距離即不同組試樣間典型距離的裝置;基於在上述裝置中計算出的上述相同組試樣間典型距離和上述不同組試樣間 典型距離,計算出用於評價上述試樣數據的可靠性附旨標即可靠性評價指標的裝 置;以及基於在上述裝置中計算出的上述可靠性評價指標,評價上述試樣數據集合的 部分集合或者±^^# 集合的全體的±^可靠性的,。
6、 如權利要求5戶,的U1fM可靠性im裝置,其特徵在於,上述相同組試樣間典型距離^Jl述試樣和與該試樣所屬的上述組屬於相同的 ,組的±^試樣之間的平均距離,上述不同組試樣間典型距離^il述試樣和與該試樣所屬的上述組屬於不同的 上述組的上述試樣之間的最小距離,述可靠性評價指標壯述相同組試樣間典型距離與上述不同組試樣間典型 距離的比或者該比的平均。
7、 如權利要求5或6戶腿的i辦數據可靠性iW^g,其牛寺徵在於,上述試樣ic^集合的上述部分集合或者J^i辦數據集合全體的上述可靠性的上述評價,^M可靠性低的J^試樣M集合的,部分集合或者上述試樣數據集合全體的抽出、或者^Ji^分組中使用的算法的,可靠性的Ji^im。
8、 如權利要求5至7的任一項戶;M的i辦i^可靠性if^置,其特徵在於,進一步具有輸出在ji^置中計算出的,可靠性im指標的裝置。
全文摘要
本發明在於提供一種即使在特別是有關基因多態性的多態分析中得到了包含有頻率少的多態性的多態性數據的情況下,也能夠客觀地評價這種多態性數據的可靠性的試樣數據可靠性評價方法和試樣數據可靠性評價裝置。本發明基於試樣數據集合,對每個試樣數據計算相同組試樣間典型距離和不同組試樣間典型距離,基於計算出的相同組試樣間典型距離和不同組試樣間典型距離的1個以上的組,對每個試樣數據集合的部分集合即試樣數據部分集合,計算用於評價試樣數據部分集合的可靠性的指標即可靠性評價指標,基於計算出的1個以上的可靠性評價指標,對每個該試樣數據部分集合,評價試樣數據部分集合的可靠性。
文檔編號G06F19/24GK101517580SQ200780034080
公開日2009年8月26日 申請日期2007年9月14日 優先權日2006年9月14日
發明者田邊哲也, 荻原真也 申請人:奧林巴斯株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀