利用醫藥語義網絡提高異構系統之間匹配精度的方法
2023-10-08 20:13:09 1
專利名稱:利用醫藥語義網絡提高異構系統之間匹配精度的方法
技術領域:
本發明涉及信息技術領域,尤其涉及一種建立數據倉儲的方法。
背景技術:
兩個或多個不同醫藥製造企業併購過程中,信息系統異構數據源導致各個醫藥製造企業的數據無法有效整合,大大降低了企業信息系統整合效果,對併購過程和併購後的工作產生很多難題。目前解決這一問題都是通過手工匹配完成。對此,以前所作的研究大都集中在資料庫系統方面,特別是資料庫不同模式之間的轉換和匹配方面。然而,隨著INTERNET的發展,目前很多系統的數據都是在網絡上發布, 存在大數據量,數據動態等問題。除去結構化數據之外,很多數據都是半結構化或無結構地,而且數據量極為龐大。傳統的啟發式的,手動的模式匹配方式無論是在效率或是精度方面都無法滿足目前應用對數據集成的要求。數據模式的自動匹配一直是提高系統智能化的一個難點。尤其是醫藥行業,目前信息化程度較弱,匹配的精度很難提高。因此,提高異構系統之間匹配精度,利用計算機系統對異構數據源進行匹配整合, 從而實現信息系統的有效整合是當前存在並急需解決的問題。
發明內容
為彌補現有技術的不足,本發明目的是提供一種利用醫藥語義網絡提高異構系統之間匹配精度的方法,提供靈活多變、安全穩定的遊戲環境。為了實現上述目的,本發明的技術方案如下一種利用醫藥語義網絡提高異構系統之間匹配精度的方法,其特徵在於包含如下步驟建立醫藥行業的語義網絡,該建立醫藥行業的語義網絡的方法為將第一語義和第二語義轉換為標準模式的語義,建立語義對應關係;對於給定的第一語義,按照對應關係給出匹配的第二語義。所述對應關係包括標準模式與第一語義的對應關係,標準模式與第二語義的對應關係。所述將第一語義和第二語義轉換為標準模式的語義的過程為利用語義網絡,採用由上而下的,配以剪枝的方法儘快得到候選匹配結果列表。所述結果列表的排序按照匹配度的值從高到低排列。本發明的有益效果應用本發明可以使不同醫藥企業的不同信息系統異構數據有效整合。
以下結合附圖和具體實施方式
來進一步說明本發明。
圖1為本發明方法流程示意圖;圖2為本發明建立醫藥行業的語義網絡的具體流程圖。
具體實施例方式為了使本發明實現的技術手段、創作特徵、達成目的與功效易於明白了解,下面結合具體圖示,進一步闡述本發明。某個製藥企業的語義我們稱為第一語義,另外一個製藥企業的語義我們稱為第二語義,本發明的目標是提高第一語義和第二語義的匹配精度與速度。此處為了描述與理解本發明簡單化,僅以兩家製藥企業的兩種語義為例,更多語義採用相同的原理與方法。參見圖1,本發明一種利用醫藥語義網絡提高異構系統之間匹配精度的方法,包含步驟101,建立醫藥行業的語義網絡,存儲在資料庫中。因為醫藥行業的特點是專用術語數目龐大,但內容單一,所以建立語義網絡非常重要且可行。建立語義網絡的詳細方法為步驟a,將第一語義和第二語義轉換為標準模式的語義。本發明提供一個模式標準, 所有不同模式的(例如兩個不同的製藥企業的兩個模式。為了描述簡單化,我們僅用兩個模式為例。更多模式採用同樣的原理與方法。)語義均對應並轉換成同一個標準模式。步驟 b,建立語義對應關係,對應關係包括標準模式與第一語義的對應關係、標準模式與第二語義的對應關係。在轉換過程中,利用語義網絡,採用由上而下的,並配以剪枝的方法來儘快得到候選匹配結果列表,列表的排序按照匹配度的值從高到低排列。可以在人工的幫助下或是通過機器學習的方法來進一步提高轉化的自動化程度和精度。步驟102,對於給定的第一語義,按照對應關係給出匹配的第二語義。應用本發明可以使不同醫藥企業的不同信息系統異構數據有效整合,大大提高了企業信息系統的整合效果,對併購過程和併購後的工作順利展開提供支撐。
權利要求
1.一種利用醫藥語義網絡提高異構系統之間匹配精度的方法,其特徵在於包含如下步驟建立醫藥行業的語義網絡,該建立醫藥行業的語義網絡的方法為將第一語義和第二語義轉換為標準模式的語義,建立語義對應關係;對於給定的第一語義,按照對應關係給出匹配的第二語義。
2.根據權利要求1所述的一種利用醫藥語義網絡提高異構系統之間匹配精度的方法, 其特徵在於,所述對應關係包括標準模式與第一語義的對應關係,標準模式與第二語義的對應關係。
3.根據權利要求2所述的一種利用醫藥語義網絡提高異構系統之間匹配精度的方法, 其特徵在於,所述將第一語義和第二語義轉換為標準模式的語義的過程為利用語義網絡, 採用由上而下的,配以剪枝的方法儘快得到候選匹配結果列表。
4.根據權利要求3所述的一種利用醫藥語義網絡提高異構系統之間匹配精度的方法, 其特徵在於,所述結果列表的排序按照匹配度的值從高到低排列。
5.根據權利要求1所述的一種利用醫藥語義網絡提高異構系統之間匹配精度的方法, 其特徵在於,還包含在人工的幫助下或是通過機器學習的方法來進一步提高轉化的自動化程度和精度。
全文摘要
本發明公開的是一種利用醫藥語義網絡提高異構系統之間匹配精度的方法,其包括建立醫藥行業的語義網絡,將第一語義和第二語義轉換為標準模式的語義並建立語義對應關係;對於給定的第一語義,按照對應關係給出匹配的第二語義。本發明提供了使不同醫藥企業的不同信息系統異構數據有效整合的方法,大大提高了企業信息系統的整合效果,對企業併購過程和併購後的工作順利展開提供了有力支撐。
文檔編號G06F17/30GK102236671SQ20101016410
公開日2011年11月9日 申請日期2010年4月29日 優先權日2010年4月29日
發明者劉卉, 王軼彤, 陸明偉 申請人:劉卉, 王軼彤, 陸明偉