新四季網

用於收集與生物分子和疾病之間的關係相關的證據的系統和方法

2023-06-01 04:48:06

專利名稱:用於收集與生物分子和疾病之間的關係相關的證據的系統和方法
技術領域:
本發明總體上涉及生物信息領域,尤其涉及用於收集與生物分子和 疾病或其他臨床條件之間的關係相關的證據的系統和方法。
背景技術:
人類肺瘤中的分子變化特性的發展給生物醫學研究組織帶來主要的 挑戰。這些"分子籤名"意圖重新定義腫瘤分類,以從基於形態學的 分類方案轉到基於分子的分類方案。結果,研究者已利用大量的、有關 生物分子以及它們與疾病的關係的信息來豐富生物醫學文獻。生物分子 是自然地存在於活的有機體中的分子。已知使用統計學方法(例如,神經網絡)來識別可能與某種疾病有 關的潛在生物分子組。為了驗證(或檢查合理性)統計模式發現試驗的 結果, 一般進行文獻搜索來確定哪些其他研究者了解生物分子和具體疾 病之間的潛在關係。PCT專利公布W0 02/099725公開了用於處理生物資料庫和/或化學 資料庫的系統、方法和電腦程式。根據此公布,通過獲得每個生物/ 化學資料庫的實體關係模型來集成生物/化學資料庫,並且識別至少兩 個生物/化學資料庫中的實體關係模型中的相關實體。連結所識別的相 關實體中的至少兩個,以便創建集成多個生物資料庫的實體關係模型。 集成生物/化學資料庫的實體關係模型提供了集成由獨立的生物/化學 資料庫代表的不同本體(ontology)的本體網絡。通過響應於查詢而瀏覽實體關係模型,可獲得生物分子和疾病或其他臨床條件之間的關係。本體是形式性和聲明性的表示方式,其包括用於指示主體領域中 的術語的詞彙(或名稱);以及描述術語是什麼、它們如何相互關聯以 及它們如何能相互關聯或不關聯的邏輯語句。本體提供了用於表示和交 流關於某些主體的知識的詞彙,以及在詞彙中的術語之間所保留的關係 集,例如層次、網絡或一些其他關係。與執行在W0 02/099725中公開的搜索相關聯的一個問題是搜索限 於具有可獲得的實體關係模型的資料庫。該搜索的另一缺陷是將新數據 庫添加到"發現空間,,中需要應用集成新舊資料庫的算法。結果,需 要專家來實現集成資料庫的算法。諸如醫學文獻的資料庫之類的資料庫的人工搜索是耗時且煩悶的。對執行人工搜索的煩悶的一種解決方法是使用Infobot (信息爬蟲)來 進行搜索。Infobot連接到網際網路中繼聊天(IRC)伺服器,潛在地加入 某些通道併集聚被認為是事實的東西(factoid),即,在雜誌或報紙中 出現之前還未存在的事實、或真實但經常無價值或不重要的信息小片 斷。在網際網路上,Infobot是用於搜索的程序(即,網絡蜘蛛(spider) 或爬蟲(crawler))。它們訪問網站、檢索文檔並跟隨它們中的所有 超連結,並生成由搜尋引擎訪問的目錄。對於執行搜索,必須清晰地定 義由Infobot所使用的搜索/查詢準則。否則,Infobot將檢索到大量 不相關的參考信息,而繞過許多相關的參考信息。發明內容本發明是用於收集與生物分子和疾病或其他醫學條件之間的關係相 關的證據的系統和方法。生物分子的存在指示人對於特定疾病的患病傾 向。執行分析以識別出具體的生物分子組,用來確定患者是否具有特定 疾病。訪問公共可用本體的資料庫來生成主體的單獨本體。查詢公共可用 本體來生成生物分子本體,其包含生物分子表達式的網絡。本體是形式 性和聲明性的表示方式,其包括用於指示主體區域中的術語的詞彙(或 名稱);以及描述術語是什麼、它們如何相互關聯以及它們如何能相互 關聯或不關聯的邏輯語句。本體提供了用於表示和交流關於某些主體的 知識的詞彙,以及在詞彙中的術語之間保留的關係集,例如層次、網絡 或一些其他關係。通過查詢公共可用的本體來生成疾病、病症、症候群、異常或其他 醫學問題的本體。疾病的本體可包括表現方式的層次和這些表現方式的 同義詞。生成了用於生物分子和疾病之間的謂體(即,關係)的本體。用於 謂體的本體提供了對可以存在於"賓體"和"賓體"團體之間的概念和關係的描述。在此情況下,賓體是正被研究的具體疾病。謂體處理收
集證據(即,與疾病相關聯的生物分子)的原因。謂體可對因果關係進 行編碼,或對記栽生物分子和具體疾病之間的關聯的連結關係進行編 碼。經編碼的關係對於在已斷定因果關係時收集證據是^f艮有用的,而經 編碼的連結關係在未完全理解該關係時是4艮有用的。一旦開發了三個本體(即,三元組),則將該三元組用於對醫學文 獻資料庫執行自然語言解析,以定位與手頭的主體(即,生物分子-疾病關係)有關的文章的位置。
一旦定位和聚集了相關的醫學文章,則將結果提供給研究者,研究者利用已知的圖形用戶界面(GUI)來輔助解釋 所生成的結果。本發明消除了對人工確定醫學文章與具體疾病的生物關係的需要。系。此外r防l研究者繼續那些提供不確定結果的方向。結果,增加了 整體效率。根據結合附圖考慮的以下詳細描述,本發明的其他目的和特徵將變 得更清楚。然而,應理解,附圖僅僅被設計為例示目的,而不是對本發 明的界限的限定,本發明的界限應參照所附的權利要求。還應理解,附 圖不必繪製為按比例的,並且除非另外指明,否則它們僅僅是意圖概念 性地例示在此描述的結構和過程。


根據下面參照附圖給出的本發明的優選實施例的詳細描述,本發明 的前述和其他優點及特徵將變得更清楚,附圖中圖1是說明根據本發明的方法導出的、在生物分子和疾病之間的關 系的示例圖;圖2是說明根據本發明、用於收集與生物分子和疾病之間的關係相 關的證據的系統的示意框圖;圖3是說明根據本發明得到的搜索的不同視圖的示意框圖; 圖4是根據本發明方法的三元組的圖示;圖5是說明用於對由圖4的方法獲得的結果進行進一步限定 (refining)的步驟的流程圖;以及圖6是用於實現本發明方法的通用計算機的示意框圖。
具體實施例本發明是用於收集與生物分子和疾病或其他臨床條件之間的關係相 關的證據的系統和方法。根據本發明,使用統計分析(如在此通過引用併入的美國專利No. 6601503中描述的神經網絡)來識別與疾病相關聯 的生物分子。向分子診斷學領域中的研究者和醫學工作者提供了用於驗 證統計預測(如例如模式識別功能)的生物證據。使用統計方法來預測 特定生物分子組的出現是否指示特定疾病。使用此預測導出生物分子和 疾病之間的關係,並使用該關係來進行資料庫搜索,以定位與該特定生 物分子-疾病關係有關的文章。圖1是根據本發明導出的生物分子和疾病之間的關係的示例圖。示 出了生物分子BRCA1。此生物分子指示人發展為癌症的傾向,其中卵巢 癌還與生物分子Bl相關聯。CA125是卵巢癌的特定生物標記。識別出 被用來識別患者是否有具體疾病的具體生物分子組。圖2是說明根據本發明、用於收集與生物分子和疾病之間關係相關 的證據的系統200的示意框圖。訪問公共可用的本體資料庫210或220 以生成主體的單獨本體,即,生物分子本體230。本體是形式性和聲明 性的表示方式,其包括用於指示主體區域中的術語的詞彙(或名稱); 以及描述術語是什麼、它們如何相互關聯以及它們如何能相互關聯或不 關聯的邏輯語句。本體提供了用於表示和交流關於某些主體的知識的詞 匯,以及在詞彙中的術語之間保留的關係集,例如層次、網絡或一些其 他關係。生物分子本體230包含生物分子表達式(expression)的網絡,i者如 RNA級別的表達式、遵循蛋白質翻譯的表達式、突變、DNA刪除、DM 擴增、DNA表觀遺傳變化、以及/或後翻譯修改。查詢公共可用的本體 以生成生物分子本體230。公共可用的本體是Gene Ontology (基因本 體;G0)或在Bertone P.等人的"SPINE: An Integrated Tracking Database and Data Mining Approach for Identifying Feasible Targets in High—Throughout Structural Proteomics. ,, Nucleic Acids Res. 2001, 29: 2884-2898中闡述的結構性類蛋白體。可查詢其他本體 來獲得用於生物分子的本體。通過查詢本體250來生成疾病、病症(disorder)、症〗吳群、或異常 的本體240,如在統一醫學語言系統(UMLS)中找到的那些。疾病本體包 含問題表現方式(manifestation)的層次以及疾病、病症、症候群、或 異常的這些表現方式的同義詞。生成生物分子和疾病之間的謂體270 (即,關係)的本體。謂體270 的本體提供對可存在於"賓體"和"賓體"團體之間的概念和關係的 描述。在此情況下,賓體是所識別的具體疾病。謂體270處理收集證 據(即,與疾病相關聯的生物分子)的動機。謂體可對因果關係進行編 碼,或對記載生物分子和具體疾病之間的關聯的連結關係進行編碼。經 編碼的關係有利地用於在已斷定因果關係時收集證據,而經編碼的連結 關係在未完全理解該關係時是^f艮有用的。一旦開發了三個本體(即,包括主體、謂體和賓體的三元組),則 使用該三元組來在醫學文獻資料庫260上執行自然語言解析,以定位 與手頭的主體(即,生物分子)有關的文章。 一旦定位和聚集了相關的 醫學文章,則將結果提供給研究者,研究者利用已知的可視化工具來輔 助解釋所生成的結果,這樣的可視工具包括在計算機上運行的圖形用戶 界面。圖3是說明根據本發明、用於收集與生物分子(至少一個主體)和 疾病(賓體)之間的關係相關的證據的方法中的步驟的流程圖。首先, 如步驟310所示,識別、選擇與疾病相關聯的生物分子,或相反使得 所述生物分子可用於處理,例如,通過統計方法進行識別。接著,如步驟320所示,生成用於生物分子和疾病之間的謂體(即, 關係)的本體。用於謂體的本體提供對可以存在於"賓體"和"賓體" 團體之間的概念和關係的描述。在此情況下,賓體是正被研究的具體疾 病。謂體270處理收集證據(即,與疾病相關聯的生物分子)的動機。 謂體可對因果關係進行編碼,或對記載生物分子和具體疾病之間的關聯 的連結關係進行編碼。經編碼的關係有利地用於在已斷定因果關係時收 集證據,而經編碼的連結關係在未完全理解該關係時是^f艮有用的。接著,如步驟320所示,生成用於每個生物分子的本體。優選還生 成生物分子組合的本體。用於生物分子的本體包含生物分子表達式的網 絡,諸如RNA級別的表達式、遵循蛋白質翻譯的表達式、突變、DNA刪 除、DNA擴增、DNA表觀遺傳變化、以及/或後翻譯^奮改。這裡,查詢 公共可用的本體以生成用於主體生物分子的本體。公共可用的本體優選 是Gene Ontology (基因本體,G0)或在Bertone P.等的"SP匿An Integrated Tracking Database and Data Mining Approach for Identifying Feasible Targets in High—Throughout Structural Proteomics. ,, Nucleic Acids Res. 2001, 29: 2884—2898中闡述的結 構性類蛋白體。還可以或可替代地查詢其他本體來獲得生物分子的本 體。儘管不是必要的,有時候優選為,如步驟330所示,進一步限定生 物分子的本體。這個步驟允許研究者查看所生成的本體,並進一步限定 對生物分子的搜索範圍。使用可視化工具或用戶界面來以已知的方式來 輔助該進一步限定的執行。接著,如步驟340所示,生成賓體的本體。賓體是疾病、病症、症 候群、異常或其他醫學問題。賓體的本體包含問題表現方式 (manifestation)的層次以及賓體的這些表現方式的同義詞。優選地, 通過在本體中執行諸如在統一醫學語言系統(UMLS)中找到的那些那樣 的查詢來構建本體。儘管不是必要的,有時候優選為,如步驟350所示,人工地進一步 限定賓體的本體。人工地對賓體的本體進行進一步限定允許研究者查看 所生成的本體,並進一步限定對賓體的搜索範圍。優選使用已知的可視 化工具或已知的用戶界面來幫助進一步限定賓體。如步驟370所示,構造用於每個生物分子(或主體本體元素)的三 元組。根據優選實施例,三元組包括主體、謂體和賓體。首先,賓體(疾 病)和主體(生物分子或派生物)之間的謂體或關係的本體必須可用, 而不管其被導入、生成或導出以與賓體和主體本體一起使用。由步驟360 指示這個可用性。圖4是可以根據本發明形成的三個不同三元組的說明。使用資源描 述框架(RDF)視圖來形成三元組400a。該三元組包括主體410a、謂體、 以及連結到醫學資料庫中的參考文獻400a的賓體"0a。當以抽象視圖 生成三元組時,三元組400將包括生物分子410b、關係、以及連結到 Medline參考文獻430b的疾病420b。當以實際^L圖生成三元組400時, 其包括BRCA2 410c、關係、以及連結到具體URL 430c的乳癌420c。 三個三元組主體/生物分子/BRCA2 ( 400a)、謂體/關係/原因(400b)、 以及賓體/疾病/乳癌(400c)是同一三元組概念的等價表示。在優選 實施例中,使用資源描述框架(RDF)來形成三元組。接著,使用三元組來執行自然語言解析(對相關數據可用池的搜 索),例如,相關醫學文獻,以提取數據相關三元組,例如,與手頭的 主體有關的文章。對於相關,應該理解為意味著如三元組集所限定的、據、及其任何i型:例如 如步驟所示,與生物分j(以及二生物)和疾病之間的關係有關的任何文章。應注意到,在解析生物分子的三元組之前,識別可用證據(例如,醫學文獻)池(pool)。重複步驟390,直到將每個單獨的生物分子和派 生物(即,包括所生成的主體本體的每個單元)處理為具有謂體和賓體 本體單元的三元組為止。 一旦處理了每個生物分子,則如步驟360所 示,向研究者提供處理結果。如圖1所示,生成作為生物分子-關係-疾病-參考文獻的結果。此時,研究者可使用已知的可視化工具來幫助 解釋所生成結果的結果,例如,使用諸如運行軟體程序的計算機之類的 已知圖形用戶界面來幫助解釋所生成結果的結果。圖5是說明用於進一步限定由圖3的方法獲得的結果的示例方法中 的步驟的流程圖。如步驟510所示,通過獲得先前生成的搜索結果來 實現結果的增強。接著,如步驟520所示,對包含搜索結果的參考文 獻進行分組。這裡,根據領域、專業、出版物種類、證據強度等來對參 考文獻進行分組。在本發明的一個實施例中,使用文檔集群(clustering) 工具來對參考文獻進行分組。如步驟530所示,向研究者呈現搜索結果,並且標註由研究者訪問/閱讀/研究的具體參考文獻。如步驟540所示,調整和存儲在步驟370生成的三元組。結果,通 過此增強來影響研究者進行的後續搜索。在替代實施例中,使用三元組 來向本體中不同的單元添加"權重,,。在另外的實施例中,在呈現步驟530中實現學習功能,並且調整步 驟540還進一步限定搜索結果。例如,當分析大量目標文獻時,允許 研究者明確指示更感興趣的區域、或者研究者認為可能在搜索中已經錯 過了的主體區域。通過以與瀏覽或編輯文檔相關聯的方式來標註或高亮 顯示(例如,雙擊)相關主體區域來實現此指示。可以按照多種不同的方式來使用增強型查詢。在優選實施例中,以 至少兩種方式來使用增強型查詢。例如,如果研究者懷疑原來的查詢可
能已經錯過了大量現有文獻(即,放寬查詢),則可立即重新運行增強 型查詢。另一方面,如果搜索的覆蓋範圍足夠,但進一步限定會使搜索 更精確(例如,縮窄查詢)的話,則因為研究者可能已經擁有最相關的 文獻,所以立即重新運行搜索可能沒什麼價值。然而,如果搜索結果少 於預期,並且已知研究領域是非常活躍的,這暗示可能在不久的將來會公布或可得到新的信息,則可向"Infobot"提供增強型搜索,以供未 來使用。結果,將在更新和可能更相關的醫學文獻被公布時發現它們。可使用傳統的通用數字計算機和適當編程的微處理器來實現本發 明。本發明包括作為存儲介質的電腦程式產品,其包括指令可用於對 計算機編程以實現本發明。存儲介質可包括但不限於適合於存儲電子 指令的任何類型的盤,包括軟盤、光碟、CD-ROM和磁光碟,DVD、 R0M、 RAM、 EPR0M、 EEPR0M,磁卡或光卡,或包括硬驅動器在內的任何類型 介質。圖6是用於實現本發明的通用計算機600的示意框圖。計算機600 包括顯示設備602 (如具有觸控螢幕接口的觸控螢幕監視器)、鍵盤604、 定點設備606、滑鼠墊板或數位化墊板608、硬碟610、或使用合適的 設備總線(如SCSI總線、增強型IDE總線、PCI總線等)連接的其他 固定的高密度介質驅動器、軟碟機612、具有磁帶或CD介質616的磁帶 或CD ROM驅動器614、或者其他可拆卸介質裝置(如磁光介質等)、 以及主板618。主板618包^舌例如處理器620、 RAM 622、以及ROM 624、 用來耦接到圖形獲取設備(未示出)的1/0埠 626、以及用於執行專 用硬體/軟體功能(如聲音處理、圖像處理、信號處理、神經網絡處理 等)的可選專用硬體628、麥克風630、以及一個或多個揚聲器640。在上述存儲介質(計算機可讀介質)的任一個上存儲了用於控制計 算機600的硬體並用於使得計算機600能夠與人類用戶進行交互的適 當程序。這樣的程序可包括但不限於用於實現設備驅動的軟體、操作 系統、以及用戶應用。這樣的計算機可讀介質還包括用來引導通用計算 機600執行根據本發明的任務的程序或軟體指令。因此,儘管已示出並描述和指出了應用於本發明的優選實施例的、 本發明的基本新穎性特徵,但將理解,本領域技術人員可對所例示的設 備的形式和細節及其操作進行各種省略、替換和改變而不會脫離本發明 的精神。例如,顯然,那些以基本相同的方式實現基本相同的功能、以 達到相同結果的單元和/或方法步驟的任意組合包括在本發明的範圍 內。此外,應意識到,可將結合本發明的任何公開形式和實施例示出和建議形式或實施例,作為設計選擇的一般主題。因此,僅僅希望由所附 權利要求的範圍來指示限制。
權利要求
1、一種用於從可用證據群中收集相關證據用以支持研究和驗證主體和賓體之間的可能關係的方法,該方法包括如下步驟選擇包括與賓體的可能關聯的至少一個主體;生成主體性元素的層次結構,其捕捉所述至少一個主體的不同表現或特性;生成賓體性元素的層次結構,其捕捉賓體的不同表現或特性;利用謂體層次來處理所述主體性元素以生成用於每個賓體性元素的謂體關係,從而構建賓體/主體/謂體三元組的集合;利用所述三元組的集合來搜索所述證據群以提取所述相關證據;以及輸出所述相關證據。
2、 如權利要求1所迷的方法,其中所述輸出步驟包括顯示所述 相關證據,以供用戶查看。
3、 如權利要求1所述的方法,其中所述輸出步驟包括以結構化 數據格式來存儲所述相關證據。
4、 如權利要求l所述的方法,其中選擇至少一個主體的步驟包括 使用統計方法。
5、 如權利要求4所述的方法,其中所述統計方法包括質譜分析。
6、 如權利要求1所述的方法,還包括步驟標識目標文獻群以限 定所述可用證據群。
7、 如權利要求1所述的方法,其中生成賓體性元素的層次結構的 步驟包括對所述賓體性元素的層次結構進行自適應進一步限定。
8、 如權利要求7所述的方法,其中所述自適應進一步限定包括對 所述賓體性元素的層次結構的人工進一步限定。
9、 如權利要求1所述的方法,其中生成所述主體性元素的層次結 構的步驟包括對所述主體性元素的層次結構的自適應進一步限定。
10、 如權利要求9所述的方法,其中所述自適應進一步限定包括對 所述主體性元素的層次結構的人工進一步限定。
11、 如權利要求l所述的方法,其中所述處理步驟包括生成所述謂 體層次。
12、 如權利要求l所述的方法,其中所述賓體是正在研究的疾病、 病症、症候群、或異常。
13、 如權利要求l所述的方法,其中每個層次結構包括描述符集合、 描述符同義詞集合、以及描述符派生物集合中的至少一個集合,該集合 組合地定義了所述主體、賓體或謂體表示的本體表示。
14、 如權利要求l所述的方法,其中所述生成賓體性元素的層次結 構的步驟包括查詢統一醫學語言系統的層次。
15、 如權利要求l所述的方法,其中所述處理步驟還包括步驟生 成主體性元素的層次結構的組合。
16、 如權利要求l所述的方法,其中所述至少一個主體是生物分子。
17、 如權利要求l所述的方法,其中所述主體性元素的層次結構包 括主體表達式的網絡。
18、 如權利要求17所述的方法,其中所述主體表達式為以下中的 至少一個RNA級別的表達式、遵循蛋白質翻譯的表達式、突變、DNA 刪除、DNA擴增、DM表觀遺傳變化、以及後翻譯修改。
19、 如權利要求17所述的方法,其中所述搜索證據群的步驟包括 查詢公共和/或私人可用的信息池。
20、 如權利要求l所述的方法,其中生成主體性元素的層次結構的 步驟包括搜索基因本體(GO)和/或結構性類蛋白體集合。
21、 如權利要求l所述的方法,其中使用資源描述框架來構建所述 三元組。
22、 如權利要求l所述的方法,其中根據領域和專業之一來構造所 述相關證據的內容。
23、 如權利要求22所述的方法,其中根據文檔集群工具來構造所 述相關i正據。
24、 如權利要求l所述的方法,其中所述選擇步驟包括利用神經 網絡、或遺傳算法與學習分類器系統的組合(例如,神經網絡、幼稚 Bayesian分類器、k-最近鄰居分類器、自組織映射、支持向量機等)。
25、 如權利要求l所述的方法,其中使用RDF標註來構建所述三元組。
26、 如權利要求l所述的方法,其中所述搜索步驟利用所述三元組 來實現自然語言解析處理,以搜索可用的生物醫學文獻池。
27、 如權利要求7所述的方法,其中所述自適應進一步限定包括如 下步驟選擇性地對所提取的相關證據進行分組;提供選擇性分組的結果以便用戶可以訪問、閱讀和/或學習,其中 在由用戶選擇了特定分組以進行訪問、閱讀或學習時,生成標識符並將 該標識符歸屬於所述特定分組;以及基於一個或多個所述標識符來調整所述三元組。
28、 如權利要求27所述的方法,其中所述調整步驟包括利用經 調整的所述三元組來進一步搜索所述證據群。
29、 如權利要求2所述的方法,其中,如果所述輸出相關證據的步 驟未找到相關證據,則進一步進行分析以推斷出是否為缺少與所述三元 組有關的相關證據,還是所述三元組對於想要的收集而言是不準確的,
30、 一種計算機可讀介質,包括可在通用計算機上實現以便執行權 利要求1的方法的一組指令。
31、 一種用於從證據池中收集相關證據的系統,其中根據將主體和 賓體連結起來的謂體關係來將所述證據證明為相關證據,所述系統包 括選擇器,用於至少將主體定義發送到所述系統中;主體資料庫,其包括主體層次,所述主體層次包括主體性元素,所 述主體性元素表示所述至少一個主體的可變和派生特性;賓體資料庫,其包括賓體層次,所述賓體層次包括賓體性元素,所 述賓體性元素表示所述賓體的可變、派生、和/或同義表示;關係資料庫,其包括檢測所述主體性元素和賓體性元素之間任何數 目的因果或連結關係、並且基於所述檢測來對多個主體/謂體/賓體三 元組進行編碼的可操作性;處理器,其利用所述三元組來實現對證據池的自然語言解析處理, 以便提取所述相關證據。
32、 如權利要求31所述的系統,其中所述至少一個主體是生物分 子,且所述賓體是疾病、病症、症候群或異常。
33、 如權利要求31所述的系統,其中所述主體、賓體和關係數據 庫包含主體、賓體和關係本體。
34、 如權利要求31所述的系統,其中所述選擇器、主體資料庫、賓體資料庫、關係資料庫和處理器構成分布式網絡。
35、 如權利要求31所述的系統,其中所述選擇器利用統計處理來 識別所述至少 一 個主體。
36、 如權利要求31所述的系統,其中所述處理器具有以生物分子/ 關係/疾病/參考文獻的格式來提供每個相關數據的能力。
37、 如權利要求31所述的系統,還包括文檔集群工具,其中可用 證據池是文檔化的,並且集群工具根據以下中的至少一個來對相關文檔 進行分組領域、專業、出版物類型、證據強度、以及相似分組證明。
38、 如權利要求31所述的系統,其中所述處理器識別並將屬性賦 予所訪問的文檔,根據所述屬性來進一步限定由關係資料庫執行的編碼 以生成經進一步限定的三元組,並且利用所述進一步限定的三元組來使 得重新解析證據。
全文摘要
一種用於收集與生物分子和疾病或其他醫學條件之間的關係相關的證據的系統和方法,其中生成(或輸入到處理系統)與所識別的疾病或條件相關聯的生物分子、以及與生物分子、疾病或條件、以及它們之間的謂體關係有關的本體。通過處理這些本體來構建三元組即主體/謂體/賓體,其例如為,生物分子/關係/疾病。使用三元組來搜索相關證據群,以基於三元組從相關數據群中提取相關數據。使用本發明的系統和方法來向分子診斷領域的研究者提供生物證據以用於或反對統計預測。
文檔編號G06F19/00GK101151615SQ200680010361
公開日2008年3月26日 申請日期2006年3月27日 優先權日2005年3月31日
發明者J·D·沙弗, Y·H·阿爾薩法迪 申請人:皇家飛利浦電子股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀