新四季網

在特定上下文內自動精細化本體的系統和方法

2023-05-14 21:01:31

專利名稱:在特定上下文內自動精細化本體的系統和方法
技術領域:
本發明涉及語義技術領域,特別涉及基於各種應用數據內的上下文的本體精細化。
背景技術:
隨著信息技術的快速發展,信息集成不可避免地已經成為重要任務之一。 此外,異構數據源上"鬆耦合"的信息集成由於大大降低了部署成本以及能 夠更加快速地響應變化的商業需求而使企業獲益。為了支持信息系統的互搡作性和集成,顯式地使數據附有語義已經成為一種共識。本體(Ontology)作為 用於描述領域的術語的分級結構化集合,目前被認為是最通用的向數據附加 語義的方案。實際上,全球資訊網聯盟(W3C)最近推薦了資源描述框架(RDF)作為 核心數據模型,並且推薦了網絡本體語言(OWL)作為語義網中的本體表示語諸如資源描述框架大綱(RDFS )是一種由領域專家歸納的共享領域知識。 一般而言,它可以廣泛地應用到特定應用領域內的各種數據中,或者可以由 其填充。例如,圖1示出了證券業中的簡單本體示例。該圖的上部表示語義 網中的本體大綱或RDFS,其描述在領域內使用的術語以及它們之間的分級 結構(或分類)。下部表徵數據填充本體大綱的一般示例。然而,並不能保證領域專家所歸納的本體大綱可以完全滿足特定領域內 的各種應用需求。假定一個應用場景需要查詢交易股票的時間以及這些交易 所涉及的金額,則將接觸到與上面一般示例不同的數據。圖2示出了證券業 領域內在共享本體大綱和應用數據之間發生的衝突。在姓名為"David Johnson"的持股者"ID1"和名稱為"IBM"的上市公司"ID2"之間存在3 個獨立的股票交易。雖然這3個交易中的每一個確實都代表由"ID1"擁有的 一種"持股"關係,但是它們不能用完備的上下文填充本體大綱。這一特性 是本體所固有的,這是因為它僅允許在本體大綱中定義的類包含其屬性。因 此,不能用各種數據實例填充屬性本身。 應用數據之間的衝突,例如,圖2中在"ID 1" 和"ID2"之間發生的場景,直觀地將考慮僅僅三種方式。第一種方式是完全忽略本體大綱,並且完全依賴數據大綱。已經存在一 些數據集成工具用來從關係資料庫、可擴展標記語言(XML)等的數據大綱提 取RDFS。通過它們,我們完全可以從資料庫提取本體大綱,這可能與領域 內的公知本體大綱相差很大。對於該方法,已經發現了很多限制。例如,數 據大綱必須組織得非常好,從而適於應用需求,以防提取冗餘和錯誤的類和 屬性。然而,在大多數情況下,該要求太嚴厲而不能得到滿足。此外,那些 公知的本體大綱已經經歷了領域內的嚴格訓練和錘鍊。即使它們不能完全覆 蓋特定應用中的所有需求,但是仍然應當繼續使用和擴展而非取代它們。第二種方式是忽略包含在數據內的、諸如交易時間和金額的詳細信息。 它與現有的本體大綱是兼容的。我們可能只是構建本體大綱中的"持股,,屬 性與實際系統中從存儲持股者信息的表到記錄上市公司的表的連接操作的表達式之間的映射。將不會額外花功夫來消除衝突。然而, 一些特定應用需求, 例如,查詢股票交易時間,將不能被現有的本體大綱支持。與前兩種方式不同,第三種方式是通過用詳細信息增強語義來重建或精 細化本體大綱。通過以包含在應用數據中的特性豐富化本體大綱,上述一些 已存的應用需求,例如,查詢股票交易時間,可能繼續在基於本體的應用環 境中得到滿足。圖3示出了通過將"持股"屬性變換成"交易"類的精細化本體大綱示 例,其中"交易,,類可以包含諸如交易時間和金額的屬性。在本例中,數據 內的語義內容毫無丟失地填充精細化本體大綱。按照上述的本體內在特性, "ID1"和"ID2"之間的每個交易關係被引用為新的"交易"類而非舊本體 大綱中的"持股"屬性的實例。從"持股者"指向到"上市公司"的屬性"持 股"被變換成一種間接關係,其中類用來定義在語義上包含在關係數據內的 屬性。通過這種方式,在此可能進行不被第二種方式支持的查詢。圖3所示的基於上下文的本體大綱精細化方法已經公認為最直觀和常用 的方式來消除這樣的沖突,即被定義為兩個類之間的關係的屬性太籠統而不 能生動地表徵它所包含的各種語義。遺憾的是,大部分的精細化工作是手工 進行的。在這種情形下,精細化的本體大綱是否適於應用由用戶所掌握的知 識和經驗所決定。這對於實現目標無疑是代價高的。
除了設計時的巨大成本之外,在運行時動態監視不一致性更加困難。隨 著數據的演變,即使數據大綱是穩定的或者具有很少修改,數據內容也將有 可能引起本體大綱的變化。例如,公司的所有執行長(CEO)最初在任何兩 個任期內都不同,因此在應用中,用戶可以僅簡單地定義一個擔任屬性去描述CEO和公司之間的關係。然而,自從某時以後,過去擔當公司CEO的人 又回來繼續擔當CEO。該場景不會損害數據大綱,但是損害以前定義的本體 大綱。它必須完全依賴於在運行時自動精細化本體的工具。為了節省成本,期盼開發一種智能代理來完成該工作。即使自動精細化 的本體大綱不是用戶期望採用的最終本體大綱,這也沒有關係,因為大部分 特性已被發現。用戶可以僅僅通過對自動精細化的本體大綱進行較小的修改 來設計他們所期望的本體大綱。本發明所要解決的就是基於隱藏在數據內的 上下文而自動地精細化本體大綱。發明內容本發明解決了本技術領域內關於手工本體精細化的缺點,並且提供了 一 種新穎且非顯而易見的、用於基於各種應用數據內的上下文而自動精細化本 體的方法和系統。根據本發明,可以自動發現比應用數據被映射到的本體大綱更豐富的上 下文,並且將其進一步應用於本體本身,以增強其對應用的適合性。更豐富 的上下文(以下也被稱作"富上下文")主要是指隱藏在數據內的關係類,而該 關係類在以前的本體大綱中被標記為其它類的屬性。在通過將屬性"升級" 成新的關係類來豐富化本體之後,它可以支持涉及新類的各種應用需求。根據本發明的一方面,提供了一種用於在特定上下文內自動精細化本體 的系統,其包括富上下文提取器,用於發現存在於原始本體大綱和應用數 據之間的語義關係衝突;以及本體大綱和映射精細化器,用於根據由所述富 上下文提取器發現的所述語義關係沖突來精細化所述原始本體大綱,並且在 精細化後的本體大綱和所述應用數據的數據大綱之間創建新的映射。在本發明的一個實施例中,所述富上下文提取器通過在所述原始本體大 綱內提取與所述應用數據內的語義關係發生衝突的關係屬性,發現存在於所 述原始本體大綱和所述應用數據之間的衝突,並且所述本體大綱和映射精細 化器通過將由所述富上下文提取器提取的所述發生衝突的關係屬性變換成新 的關係類來精細化所述原始本體大綱。在本發明的另一實施例中,所述本體大綱和映射精細化器在將所述發生 衝突的關係屬性變換成所述新的關係類之後,還用路徑表達式表現所述原始 本體大綱內受到影響的子屬性關係,其中所述路徑表達式通過組合所述發生 衝突的關係屬性所橋接的類與所述新關係類之間的關係屬性而得到。根據本發明的另一方面,提供了一種用於在特定上下文內自動精細化本體的方法,其包括以下步驟a)發現存在於原始本體大綱和應用數據之間的 語義關係衝突;以及b)根據所發現的所述語義關係衝突來精細化所述原始本 體大綱,並且在精細化後的本體大綱和所述應用數據的數據大綱之間創建新 的映射。在本發明的一個實施例中,通過在所述原始本體大綱內提取與所述應用 數據內的語義關係發生沖突的關係屬性,發現存在於所述原始本體大綱和所 述應用數據之間的衝突,並且通過將所提取的所述發生沖突的關係屬性變換 成新的關係類來精細化所述原始本體大綱。在本發明的另 一實施例中,在將所述發生衝突的關係屬性變換成所述新 的關係類之後,還用路徑表達式表現所述原始本體大綱內受到影響的子屬性 關係,其中所述路徑表達式通過組合所述發生衝突的關係屬性所橋接的類與 所述新關係類之間的關係屬性而得到。根據本發明,由於基於應用數據內的上下文而自動精細化本體大綱,因 此用戶可以節省大量手工精細化工作。另外,根據本發明,由於用路徑表達式表現本體大綱內受到影響的子屬 性關係,因此改進了表示本體大綱內父屬性和子屬性之間的繼承關係的能力。


通過結合附圖對本發明的優選實施例進行詳細描述,本發明的上述和其 它目的、特性、優點將會變得更加清楚,其中圖1示出了由證券業的專家預定義的本體的示例。圖2示出了在預定義的本體和數據之間存在的衝突的示例。圖3示出了根據現有技術的、用於消除衝突的方案的示例。圖4示出了應用於本發明的系統的框圖。圖5示出了應用於本發明的方法的示例性流程圖。圖6示出了與關係數據相映射的本體的初始處理之後的示例圖。 圖7示出了將衝突屬性變換成關係類的處理之後的示例圖。 圖8示出了重建RDFS中的"subpropertyof(子屬性關係)"關係的處理之 後的示例圖。
具體實施方式
本發明涉及一種用於在上下文內自動精細化本體的系統和方法。根據本 發明,將逐一地檢查本體大綱內兩個類之間的屬性。 一旦發現與數據內的語 義關係不一致,則將收集它們,並且進一步發現它們依賴於數據內的哪些屬 性欄位。在將所有這些衝突屬性變換成新類並且引用數據內的其所依賴的字 段作為這些類的屬性之後,可以繼續重新組織"subpropertyof,,其中用路徑 表達式代替作為屬性的賓語。這樣,生成精細化的本體大綱,並且還將新類 中的這些屬性映射到對應的數據大綱中。下面參考附圖來詳細描述根據本發明的本體自動精細化系統和方法。需 要注意的是,為了便於說明起見,在下文中選擇了 RDF模型用於本體表示, 並且選擇了關係資料庫中的關係表用於數據存儲。但是,本領域的技術人員 應當清楚,本體表示模型和數據存儲格式不限於此。例如,本體表示模型還 可以是OWL模型等,並且數據存儲格式還可以是XML等。圖4示出了4艮據本發明的系統100的框圖。如圖4所示,才艮據本發明的 系統100為用虛線包圍的矩形部分,並且兩個橢圓部分分別是本系統100的 輸入和輸出。通過最近的數據集成工具,可以用相同領域內的現有數據填充 本體大綱,其中本體大綱例如為RDFS格式,而現有數據例如存儲在關係數 據庫中。 一般方式是構建RDFS和數據大綱之間的映射圖。通過本系統100, 將用來自應用數據的更豐富上下文精細化RDFS,並且還將生成精細化RDFS 和原始數據大綱之間的新映射圖。本系統100主要包括兩個功能模塊,即富上下文提取器110和RDFS和 映射精細化器120。富上下文提取器110用於發現在RDFS中的關係屬性和 數據內的實際依賴關係之間存在的、已經在背景技術部分中說明的類型的語 義關係衝突。這種衝突體現了不能僅僅從RDFS表達中精確地說明隱藏在實 際數據內的語義或規則。RDFS和映射精細化器120用於根據前面提取的結 果來更新RDFS,並且在RDFS和數據大綱之間創建新的映射。
具體地說,富上下文才是取器IIO用於找出RDFS中指向到其它類的那些 屬性,其不能完全描述應用數據內的語義。換句話說,當屬性具有全都相同 的多個值時,本體不能生動地區分它們。在這種情形下,除非可以忽略這種 語義,否則必須重新組織RDFS來支持此功能性。通過富上下文才是取器110, 收集了 RDFS中的屬性和對應的數據大綱。RDFS和映射精細化器120主要用來通過將所發現的屬性變換成具有從 對應數據大綱提取的新屬性的新類來重新組織RDFS。此外,RDFS和映射精 細化器120最後還構建精細化RDFS和原始數據大綱之間的新映射。下面根據圖5所示的示例性流程圖詳細說明了本發明的本體自動精細化 方法。顯然地,根據本發明的本體自動精細化方法不局限於圖5所示的示例 性方法,並且根據此處的教導,本領域的技術人員可以針對具體情況設計出 不同的實現方式。參照圖5,本示例性方法對應於圖4的系統100,其中步驟S210-S270 對應於富上下文提取器110的過程,而步驟S310-S350對應於RDFS和映射 精細化器120的過程。富上下文提取器110的過程遞歸地嘗試檢查在其中存在屬性的兩個類之 間發生的實例關係。這樣,首先要做的是在步驟S210,構建候選列表L,其 中每個項目是橋接兩個類的屬性,並且可以容易地從RDFS中檢索得到。在 RDF模型中,將數據有序地存儲為三元組的集合,其中每個三元組為"(主語, 屬性,賓語)"。當"主語"和"賓語"是一種類或者具有類標籤時,將把"屬性"添加到列表L中作為候選屬性。在掃描了整個RDFS表之後,可以收集 所有可能的候選屬性。接下來,在步驟S220,富上下文提取器IIO的過程進入循環。只有當列 表L為空時,該過程才將結束。結束條件表示已經檢查了所有可能候選屬性。 假定從列表L的剩餘部分中選擇了候選屬性P以便檢查,則需要在步驟S230 從映射表中找出對應的列(即,屬性欄位)信息,其中映射表記錄在RDFS中描 述的術語和數據大綱之間的每個映射關係。對應列信息意味著屬性P本身和 P所橋接的兩個類的列信息。通過掃描映射表,可以方便地發現對應列。為了快速檢查在當前循環內是否發生上述沖突,需要在步驟S240創建臨 時表T,其包括前面發現的對應列。另外,通過一系列連接和投影操作,不 同表中的原始數據將填入到表T。特別地,還可以對與P所橋接的兩個類內
的標識屬性相關的列組建立索引。其優點是加速檢查衝突的工作。在數據在表T中準備就緒之後,該過程將繼續在步驟S250按照代表P 所橋接的兩個類的列對它們進行分組,並且對每組的記錄進行計數。然後, 在步驟S260,判斷是否存在至少一個其記錄計數超過一的組。只有當存在至 少一個其記錄計數超過一的組時,才能證實發生了沖突。如果在當前循環中 沒有檢查到沖突,則該過程將把屬性P移出列表L,並且返回到步驟S220進 入下一循環。否則,它必須在步驟S270將屬性P標記為將在RDFS中應用的 關係類。另外,還將把與屬性P相對應的信息存儲到表中。同時,還將更新 列表R,其表示要被發現的關係類的集合。最後,該過程將把屬性P移出列 表L,並且返回到步驟S220進入下一循環。通過富上下文提取器110的遞歸過程,可以發現在各個屬性P及其對應 數據之間發生的所有沖突。從而,需要進一步將這些發現體現到本體大綱中。 圖5中的RDFS和映射精細化器120的過程起到這樣的作用。首先,精細化器120的過程在步驟S310掃描在第一過程中發現的列表R, 並且記錄在RDFS中精細化所需的所有屬性,並且檢查在其中是否剩有項目 I。只有當列表R不為空時,才將遞歸性地採取下列步驟來用關係類更新 RDFS。這裡,R中的每個項目I表示在RDFS中發現的屬性,並且還與數據 大綱中的一組列相連結。這些列出現在起到在原始RDFS中屬性I所橋接的兩個類之間連接的作 用的那些表中。它們將是要應用在新關係類中的屬性的候選集合。很直觀的 是,將所有屬性都包含到類中。然而,如果存在太多列,則還可以選擇它們 中的一些作為屬性。在這樣的情形下,作為表中的鍵的列是必選的,而其它 列是可選的。在步驟S320,在將映射到所選列的那些屬性包含到新關係類中 之後,可以用RDFS中的新關係類替換屬性I。注意,還應當新建分別橋接新 類與P在原始RDFS中所橋接的兩個舊類的兩個屬性。然後,在步驟S330, 用RDFS中的新關係類更新原始RDFS。整個循環將不結束,直至如上處理 了在原始RDFS中發現的所有屬性。在從屬性到關係類的這一系列變換之後,該過程將繼續在步驟S340更新 屬性和變換類之間的"subpropertyof'。由於RDFS中的部分屬性已被變換成 類,因此其上的"subpropertyof,關係將會受到影響。為了保證RDFS上下文 中的完整性,必須應用新方法來解決這一問題。這裡,我們依賴於路徑表達式的思想來表現關係。在兩個場景中將發生RDFS中的"subpropertyof'。 一 個場景是傳統地在兩個屬性之間發生。另一個場景是在屬性和路徑表達式之 間發生。簡單地,路徑表達式包括兩個屬性。 一個屬性來自所變換的屬性所 依賴的類,並且另 一個屬性來自新關係類。通過組合這兩個屬性,可以在RDFS 中按照傳統由被變換的屬性連結的兩個類之間建立間接關係。按照該間接關 系,該過程將允許將"subpropertyof,的表現從屬性變成路徑表達式。例如, 最初是"(主語子屬性賓語)"。"主語"和"賓語"都引用兩個類中的屬性。 假定"賓語"屬性已被變換成類,則應當將其表示為"賓語等於路徑"的路 徑表達式。這兩個屬性的複合將是諸如"節點1是屬性A"和"節點2是屬 性B"的路徑。另外,必須標記路徑內的包含,例如"路徑具有節點1"和"路 徑具有節點2"。通過對所有"subpropertyof,關係的更新,該過程將完成RDFS精細化 的過程,並且繼續在步驟S350重建RDFS術語和數據大綱中的列之間的新映 射。該部分主要用於在新類中為在上述處理中生成的屬性創建新映射。從列 自動地提取屬性。其映射實際上已經記錄在列表R中。因此,可以僅僅拷貝 R中的對應項目,作為精細化RDFS的映射信息。通過富上下文提取器110以及RDFS和映射精細化器120這兩個主要部 分,該過程可以生成正如圖5的左下部示出的精細化本體。為了便於說明該處理,作為示例,我們將提供下面場景。圖3描述了在 RDFS和真實數據之間發生的沖突將被消除的示例圖。借用這一情況,我們 將描述對RDFS的變換和精細化處理。圖6示出了本發明的過程在本例中的輸入。為了清楚起見,數據已被存 儲在表中,並且還包括了其實體關係(ER)模型。通過數據集成工具進行了數 據和本體大綱(或RDFS)之間的映射。首先,該過程將通過掃描"交易"表來 找出在RDFS中的"持股"關係與數據之間發生的衝突。這裡,該過程將記 錄對應的信息,以便對沖突進行進一步的處理。在遞歸發現了這種衝突之後,該過程將逐一地解決它們。它將為每個衝 突屬性創建新關係類。如圖7所示,已經構建了 "交易"類,並且該類還包 含兩個新屬性"年"和"月",這兩個屬性都是從"交易"表中的數據列提取 的。此外,創建了關係"做"和"與",以橋接最初由"持股"屬性連結的兩 個類"人,,和"公司"。在此注意,上述沖突已被消除。"交易"表中的每個 i己錄可以是RDFS中的"交易"類的實例。由於將新類注入到RDFS中,因此RDFS中的原始上下文將可能沒有意 義。例如,"持股"屬性是"人"和"公司"之間的一種"控制"關係。在將 屬性變換成"交易"類時,因為新類"交易"的每個新屬性不能在語義上獨 立地代替"持股,,屬性,所以原始上下文將會丟失。因此,必須在下一步解 決圖7所示的新衝突。為了避免RDFS中的語義的丟失,我們將路徑表達式的新格式採用到 RDF模型中。例如,如圖8所示,原始屬性"持股"可以用從"董事,,類的 新屬性"做"經由新屬性"與"到"上市公司"類的路徑代替。將屬性"做" 和"與"分別映射到"交易"表內的列"PID"和"CID"中。借用基於"PID" 和"CID"列的、表"人"、"交易,,和"公司"之間的連接表達式,可以描 述"董事"和"上市公司',類之間的"持股"內部關係。這裡,操作符G)表 示圖8中的"做"和"與"屬性的路徑表達式。最後,基於精細化的本體,將構建這些新屬性與數據大綱中的列的映射。 圖3示出了作為輸出的本體的最終邏輯型式。本領域的技術人員知道,本發明的本體自動精細化系統和方法可以通過 僅軟體、僅硬體和/或軟體與硬體相結合的方式來實現,因此,其實現方式不 對本發明的技術範圍構成限制。另外,本發明的方法不限於按照說明書中所描述的時間順序來執行,也 可以按照其它的時間順序,或並行或獨立地執行,因此,本發明中描述的方 法的執行順序不對本發明的技術範圍構成限制。儘管以上參照具體實施例對本發明進行了詳細的描述,但是本領域的技 術人員知道,在不脫離本發明的精神和範圍的情況下,可以對本發明的實施 例做出各種修改、替換和變更。
權利要求
1. 一種用於在特定上下文內自動精細化本體的系統,包括富上下文提取器,用於發現存在於原始本體大綱和應用數據之間的語義 關係衝突;以及本體大綱和映射精細化器,用於根據由所述富上下文提取器發現的所述 語義關係衝突來精細化所述原始本體大綱,並且在精細化後的本體大綱和所 述應用數據的數據大綱之間創建新的映射。
2. 如權利要求l所述的系統,其中所述富上下文提取器通過在所述原始本體大綱內提取與所述應用數據內 的語義關係發生沖突的關係屬性,發現存在於所述原始本體大綱和所述應用 數據之間的衝突,以及所述本體大綱和映射精細化器通過將由所述富上下文提取器提取的所述 發生衝突的關係屬性變換成新的關係類來精細化所述原始本體大綱。
3. 如權利要求2所述的系統,其中除了提取所述發生沖突的關係屬性之外,所述富上下文提取器還提取與 所述發生衝突的關係屬性相對應的數據大綱,以及所述本體大綱和映射精細化器在將所述發生衝突的關係屬性變換成所述 新的關係類之後,還引用與所述發生沖突的關係屬性相對應的數據大綱作為 所述新關係類的屬性。
4. 如權利要求2所述的系統,其中所述本體大綱和映射精細化器在將所 述發生沖突的關係屬性變換成所述新的關係類之後,還用路徑表達式表現所 述原始本體大綱內受到影響的子屬性關係,其中所述路徑表達式通過組合所 述發生沖突的關係屬性所橋接的類與所述新關係類之間的關係屬性而得到。
5. 如權利要求3所述的系統,其中所述本體大綱和映射精細化器通過將 所述新關係類的所述屬性映射到所述與所述發生沖突的關係屬性相對應的數 據大綱中,在所述精細化後的本體大綱和所述應用數據的數據大綱之間創建 新的映射。
6. 如權利要求l所述的系統,其中所述本體的表示模型為資源描述框架 模型或網絡本體語言模型。
7. 如權利要求1所述的系統,其中所述應用數據的存儲格式是關係數據 庫中的關係表或可擴展標記語言。
8. —種用於在特定上下文內自動精細化本體的方法,包括以下步驟a) 發現存在於原始本體大綱和應用數據之間的語義關係衝突;以及b) 根據所發現的所述語義關係衝突來精細化所述原始本體大綱,並且在 精細化後的本體大綱和所述應用數據的數據大綱之間創建新的映射。
9. 如權利要求8所述的方法,其中在步驟a)中,通過在所述原始本體大綱內提取與所述應用數據內的語義 關係發生衝突的關係屬性,發現存在於所述原始本體大綱和所述應用數據之 間的衝突,以及在步驟b)中,通過將所提取的所述發生沖突的關係屬性變換成新的關係 類來精細化所述原始本體大綱。
10. 如權利要求9所述的方法,其中在步驟a)中,除了提取所述發生衝突的關係屬性之外,還提取與所述發 生衝突的關係屬性相對應的數據大綱,以及在步驟b)中,在將所述發生沖突的關係屬性變換成所述新的關係類之後, 還引用與所述發生沖突的關係屬性相對應的數據大綱作為所述新關係類的屬性。
11. 如權利要求9所述的方法,其中在步驟b)中,在將所述發生沖突的關係屬性變換成所述新的關係類之後, 還用路徑表達式表現所述原始本體大綱內受到影響的子屬性關係,其中所述 路徑表達式通過組合所述發生沖突的關係屬性所橋接的類與所述新關係類之 間的關係屬性而得到。
12. 如權利要求IO所述的方法,其中在步驟b)中,通過將所述新關係類的所述屬性映射到所述與所述發生衝 突的關係屬性相對應的數據大綱中,在所述精細化後的本體大綱和所述應用 數據的數據大綱之間創建新的映射。
13. 如權利要求8所述的方法,其中所述本體的表示模型為資源描述框 架模型或網絡本體語言模型。
14. 如權利要求8所述的方法,其中所述應用數據的存儲格式是關係數 據庫中的關係表或可擴展標記語言。
全文摘要
本發明提供了一種用於在特定上下文內自動精細化本體的系統和方法,其中該系統包括富上下文提取器,用於發現存在於原始本體大綱和應用數據之間的語義關係衝突;以及本體大綱和映射精細化器,用於根據由所述富上下文提取器發現的所述語義關係衝突來精細化所述原始本體大綱,並且在精細化後的本體大綱和所述應用數據的數據大綱之間創建新的映射。根據本發明,由於基於應用數據內的上下文而自動精細化本體大綱,因此用戶可以節省大量手工精細化工作。
文檔編號G06F17/30GK101145152SQ20061015370
公開日2008年3月19日 申請日期2006年9月14日 優先權日2006年9月14日
發明者越 潘, 晨 王, 力 馬 申請人:國際商業機器公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀