新四季網

一種異構資料庫環境下語義集成過程的並行計算方法

2023-07-21 09:42:31

專利名稱:一種異構資料庫環境下語義集成過程的並行計算方法
技術領域:
本發明涉及一種異構資料庫環境下語義集成過程的並行計算方法。是一種能提高系統性能並且不降低查準率和查全率計算方法。
背景技術:
在異構資料庫環境下能夠區分出相同和不相同的屬性是實現資料庫互操作的一個重要前提條件。許多參考文獻討論了如何區分異構資料庫中相同屬性的問題。但這些方法不能區分出現實世界中存在的不相同(似)的數據類型描述的同一屬性(後面給出數據類型之間相同(似)性的定義)O例如,關係模式:Student (Sno, Shame, Sage.Sdept)假如描述屬性Sno的數據類型是整型,則用於區分屬性的特徵向量類似為:(data type, length, key or not, value constraints, aver-age, rain, max)特徵向量的具體取值為:(int,4,key,notnull,95030,95001。95059)1假如描述屬性Sno的數據類型是字符型,則用於區分屬性的特徵向量類似為:(data type, length, key or not, value constraints, theratio of the number ofnumerical characters to the totalnumber of characters,the ratio of white—spacecharac-ters tO total characters, statistics on length)。特徵向量的具體取值為:(char,5, key, not null, 1,0,5)2顯然,由於用不相同(似)數據類型描述同一屬性時特徵向量的巨大差異性,目前通過比較描述屬性的特徵向量信息不能夠區分出不相同(似)的數據類型描述的同一屬性(如⑴和⑵).
既然用描述屬性的特徵向量信息不能區分出不相同(似)的數據類型描述的同一屬性,我們認為在不相同(似)的數據類型描述的屬性中進行相似屬性的確定是無實際意義的.所以,本文提出一種基於數據類型的方法來實現異構數據環境下相同屬性的確定。該方法要求首先對各個資料庫中的數據根據數據類型分類,然後在資料庫之間具有相同數據類型描述的屬性內部進行屬性是否相同的確定。由於屬性根據數據類型進行了分類,從而可以實現不同數據類型內確定相同屬性過程的並行計算(在第3部分理論上分析了該方法並行計算的可行性),同時,該方法也明顯地減少了語義集成過程中屬性的比較次數。實驗結果顯示我們提出的方法能明顯提高系統的運行效率,並且不降低語義集成中數據的查準率和查全率。

發明內容
基於上述情況,特此發明一種異構資料庫環境下語義集成過程的並行計算方法;該方法根據屬性的元數據信息排除了大部分不相等的屬性對,從而解決了文[10,11]中確定屬性關係時比較費時的問題。但是,該方法僅使用屬性的元數據信息,並未使用數據內容信息,使用文[9]中的規則。則具有相同元數據信息描述的不同屬性不能被區分開。同時,該方法不能實現相同屬性確定過程的並行計算。我們認為為了提高數據的查準率和查全率,描述屬性的特徵向量中應增加描述數據內容方面的信息,通過計算模式信息和數據內容與統計信息的概率值來確定相同屬性。1.在數值型屬性間進行相同屬性的確定;首先,進行數值型屬性間相同屬性的確定。我們把描述數值型屬性特徵的信息分為三類:模式信息、數據限制和數據內容。(I)模式信息:包括數據類型、長度、是否為鍵屬性;(2)數據限制:包括外鍵信息、屬性取值範圍限制、是否允許為空;(3)數據內容:包括最大值、最小值、平均值、標準差;2.在字符型屬性間進行相同屬性的確定;其中模式信息、數據限制如數值型屬性,數據內容部分包括:字符型屬性的具體取值中數字字符佔整個字符的比率,空白字符佔整個字符的比率,字符所佔空間的統計長度。其中,:字符所佔空間的統計長度是指實際用來存儲字符的長度,而不是事先分配的存儲空問的長度。
權利要求
1.一種異構資料庫環境下語義集成過程的並行計算方法:該方法是是易於實現語義集成過程的並行計算。
2.根據權利要求1的基於一種異構資料庫環境下語義集成過程的並行計算方法,此方法的分為三大部分:在數值型屬性間進行相同屬性的確定、在宇符型屬性間進行相同屬性的確定、在稀有型屬性間進行相同屬性的確定。
全文摘要
一種異構資料庫環境下語義集成過程的並行計算方法區分相同屬性是異構資料庫環境下語義集成中的一個重要環節,主要的方法是用特徵描述屬性來評估屬性之間的相似性。雖然這種方法具有較高自動化和易於實現的特點,但它將花費更多的時間來比較所有的屬性且不能在語義集成中實現並行計算。本文提出了一種基於數據類型的方法來實現異構數據環境下相同屬性的確定,這種方法具有在描述比較時間的同時實現語義集成的並行計算的特點。
文檔編號G06F17/30GK103092868SQ201110344888
公開日2013年5月8日 申請日期2011年11月1日 優先權日2011年11月1日
發明者楊際榮 申請人:鎮江華揚信息科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀