新四季網

基於小世界特性的工程信息組織方法

2023-06-08 23:21:16

專利名稱:基於小世界特性的工程信息組織方法
技術領域:
本發明涉及計算機網絡智能信息檢索技術領域,尤其是一種基於小世界特性的工 程信息組織方法。
背景技術:
隨著計算機和網絡技術的飛速發展,信息量的增長遠遠超出了人們對信息獲取能 力的增長。原始和無序的信息不但不產生價值,還會加劇信息增長和利用之間的矛盾,造成 信息超載而知識缺乏的社會困境。因此,海量信息資源的有序存儲和利用越來越受到世界 各國的關注。對於工程信息的存儲和利用,特別是對生產製造領域的工程信息的保存和利 用,仍然是一個頗具挑戰性的問題。小世界現象存在於社會關係網絡中,即世界上任何人之間都可以通過很短的社會 關係聯繫起來。社會關係鏈的長度一般不超過六,被稱之為「六度分隔理論」。六度分隔理 論的提出,極大地激發了人們對於小世界現象的全面研究,人們發現類似的小世界現象廣 泛存在於電力網、計算機網際網路、食物鏈網、演員關係網、科學家合作網等實際網絡中。最近 幾年,小世界現象在銷售業、人力資源管理、傳播學、傳染疾病預防、網絡安全等領域得到了 廣泛的應用。人們對工程信息的保存和利用主要是針對國防工程、軍事科技、航空、汽車、造船 等領域中的設計與製造,研究如何長期保存產品的原始設計數據和生產過程中的工程信 息,以滿足產品的維修、故障排除、改型等需求。目前,工程信息的保存和利用主要基於以下 方法(1)基於傳統圖紙形式的電子文檔、微縮膠片、穿孔卡片等,這種方法所保留的信息 資源容易老化或損壞,不便於在網絡上調用和傳輸,無法記錄和保留後續對產品的改進等 信息;(2)基於STEP ISO 10303標準的融入設計和製造信息的三維CAD模型,由於生成這 些信息的CAD系統壽命比多數產品的壽命要短得多,在今後利用時將會產生數據和系統之 間的兼容問題。另外,研究工程信息的生成方法以及對數位化工程信息實行長期保存並保 證數據的可靠性,以滿足今後不同時期和不同用戶的多方面需求,然而要確保其長期的安 全保存和數據可靠性,就必須對這些信息資源進行定期檢查、移存和轉化,這些定期的處理 過程不但有前面提及的兼容問題,還將遇到信息處理的時間和效率問題。

發明內容
本發明要解決的技術問題是提供一種基於小世界特性的工程信息組織方法,該方 法能夠以靈活的方式組織工程信息,提供快速的工程信息檢索、有效地信息擴展及便利的 信息維護。為解決上述技術問題,本發明所採取的技術方案是一種基於小世界特性的工程 信息組織方法,其方法步驟如下
(1)工程信息文件的特徵數據描述,其步驟包括
(1.1)確定需要長期保存和利用的工程信息文件,並將其數位化;(1.2)選擇統一的元數據標準對所述工程信息文件進行特徵描述,形成特徵向量,該特 徵向量的維數就是所述工程信息文件的信息特徵數;
(2)建立具有小世界特性的網絡拓撲結構,其步驟包括
(2. 1)採用一維聚類方法對每個工程信息文件所對應特徵向量的同一分量進行聚類分 析,獲取聚類模型;
(2. 2)記錄上述分量的數值化分類信息,該分類信息標誌該分量歸屬於不同類別的相 似程度;
(2. 3)所述每個工程信息文件作為一個節點,所述每個節點在上述步驟的基礎上獲得 其自身特徵描述的數值化分類信息,同時設定一個隸屬於該節點的用於描述其特徵向量各 個分量重要程度的權值向量;
(2. 4)以所述權值向量為依據,兩兩比較計算出每個節點與其他所有節點之間的相似
度;
(2. 5)計算每個節點與其他所有節點之間的相似度期望值,並將該節點與相似度不小 於所述期望值的所有其他節點進行連結,對於相似度小於期望值的所有其他節點,將該節 點以一定概率與其相連結;
(3)在建立具有小世界特性的網絡拓撲結構的基礎上,對新增工程信息文件進行保存, 其步驟包括
(3. 1)獲取新增工程信息文件的特徵向量;
(3. 2)比較新增工程信息文件特徵向量中各個分量與已有工程信息文件特徵向量各個 分量之間的關係,當新增工程信息文件特徵向量中存在新的特徵維時,全局性特徵向量的 維數也做出相應增加,當新增工程信息文件特徵向量在新增維數上與已有工程信息文件特 徵向量不存在隸屬關係時,對這些新增維數不進行任何信息記錄;
(3. 3)比較新增工程信息文件特徵向量中各個分量與該分量現有分類之間的關係,當 新增工程信息文件特徵向量中某個分量與現有分類之間的相似度為0或較低時,將該分量 獨立出來成為新增分量類型,同時該分量的分類個數做出相應增加;
(3. 4)設定用於描述新增工程信息文件特徵向量中各個分量重要程度的權值向量; (3. 5)每個新增工程信息文件作為一個節點,計算所述新增節點與其他所有節點之間 的相似度期望值,並將該新增節點與相似度不小於所述期望值的所有其他節點進行連結, 對於相似度小於期望值的所有其他節點,將該節點以一定概率與其相連結;
(4)在建立具有小世界特徵的網絡拓撲結構基礎上,進行工程信息文件檢索,其步驟包

(4. 1)依據現有工程信息文件特徵向量中的各個分量特性,確定檢索目標節點特徵向 量的分量,並給出這些分量隸屬於其現有分量類型的相似度及權值;
(4. 2)隨機選擇未被訪問過的節點,發出查詢請求,當不存在未被訪問過的節點時,執 行步驟(4. 5);
(4. 3)計算檢索目標節點與被訪問節點之間的相似度,當相似度超過給定閾值時,進一 步計算出檢索目標節點與被訪問節點的每個短連結節點之間的相似度,返回被訪問節點及 其短連結節點中相似度最大的節點,執行步驟(4. 5);否則,將被訪問節點標記為已訪問,執 行步驟(4. 4);(4. 4)將查詢請求發送給被訪問節點的未被訪問過的長連結節點,執行步驟(4. 3),當 被訪問節點的每一長連結節點都被訪問過時,執行步驟(4. 2); (4. 5)結束查詢;
(5)在建立具有小世界特性的網絡拓撲結構基礎上,進行工程信息文件的維護,其步驟 包括
(5. 1)依據步驟(4)查詢得到需要維護的工程信息文件;
(5. 2)保持原有節點及其網絡拓撲關係不變,構建一個新的原有節點的複製節點,並對 該複製節點進行維護工作;
(5. 3)抽取所述複製節點在進行維護工作之後的特徵向量的分量,計算出這些分量隸 屬於其現有分量類型的相似度及權值;
(5. 4)計算出進行維護工作之後的複製節點與其他所有節點之間的相似度期望值,並 將該複製節點與相似度不小於所述期望值的所有其他節點進行連結,對於相似度小於所述 期望值的所有其他節點,將該複製節點以一定概率與其相連結。針對工程信息文件的組織方法以及數位化工程信息實行長期保存、保證數據可靠 性、檢索效率及後期維護,本發明結合元數據描述、一維聚類以及小世界網絡拓撲結構特 性,提供了一種適用於工程信息文件的存儲、檢索以及後期維護的方法。該方法將數位化的 工程信息文件進行統一描述,並利用小世界網絡的拓撲特性,在減少信息傳遞的前提下,提 高信息查全率和查詢效率,實現數位化工程信息文件的長久保存和後期維護過程中的兼容 性;該方法能夠快速路由到目標,而不是傳統的盲目路由,從而提高信息查詢效率;該方法 充分利用小世界網絡中的長連結,使得查詢過程能夠被很快地傳遞到網絡中其他部分,根 據小世界網絡具有較短的網絡平均距離可知這一查詢過程能夠在較少的長鏈轉移之後找 到目標所在網絡範圍,從而提高信息查詢的查全率及後期維護效率。本發明的有益效果如下
(1)採用統一的元數據標準對數位化的工程信息文件進行特徵描述,為實現信息長期 保存、信息擴展及後期維護提供有效支持;
(2)利用一維聚類方法進行工程信息文件的聚類分析,為計算不同工程信息文件之間 的相似度提供細粒度比較,提高了信息查詢的精度和準確度;
(3)將相似度高於期望值的工程信息文件之間進行互連,其餘採用長連結方式形成小 世界拓撲結構,使得查詢信息能夠很快到達相關節點,提高查詢速度,根據需要將相似度高 於給定閾值的節點輸出,進一步提高信息查詢和維護的準確性及靈活性。


下面結合附圖和具體實施方式
對本發明作進一步詳細的說明。圖1是工程信息文件特徵數據描述流程圖2是建立具有小世界特性的網絡拓撲結構流程圖; 圖3是對新增工程信息文件進行保存的流程圖; 圖4是對工程信息文件進行檢索的流程圖; 圖5是對工程信息文件進行維護的流程圖。
具體實施例方式由圖1-圖5所示的實施例可知,本發明包括五個主要步驟,即工程信息文件特徵 數據描述;建立具有小世界特性的網絡拓撲結構;在建立具有小世界特性的網絡拓撲結構 基礎上,對新增工程信息進行保存;在建立具有小世界特性的網絡拓撲結構基礎上,進行工 程信息文件檢索;在建立具有小世界特性的網絡拓撲結構基礎上,進行工程信息文件維護。 具體方法如下
(1)工程信息文件的特徵數據描述,如圖1所示,其包括如下步驟
(1.1)確定需要長期保存和利用的工程信息文件,並將其數位化,其中工程信息文件由 具體應用決定,如機械製造行業某產品的生產過程,其工程信息文件包括生產線上的所有 信息記錄、製造機械、生產日期、檢驗員等生產過程相關的重要信息;再如軟體工程領域某 軟體項目開發過程,其工程信息文件包括開發過程中的開發環境版本、硬體條件、日期、開 發團隊、測試、兼容性等相關信息;
(1.2)為確保工程信息文件特徵描述的統一性和兼容性,選擇統一的元數據標 準對其進行特徵描述,形成特徵向量,對於給定的工程信息文件i,其特徵向量Ti為
rZi:,ζ^ 二),其中m為向量Ti的維數,每一工程信息文件特徵向量中各個分量的確
定由具體情況決定,不同工程信息文件特徵向量既有共同分量,也有不同分量,不同的分量 分別對應不同的向量維數,當工程信息文件特徵向量不存在某一分量時,為節省數據存儲 空間,對這些特徵向量上不存在隸屬關係的分量將不進行任何信息記錄,在後續的相似度 計算中處理為0值。(2)建立具有小世界特性的網絡拓撲結構,如圖2所示,其步驟包括
(2.1)以步驟(1)中所確定的工程信息文件i的特徵向量Ti的第j個分量、為進一 步分析的基礎,採用一維聚類方法對每個工程信息文件所對應特徵向量的第j個分量進行 聚類分析,獲取第j個分量的聚類模型。具體過程如下
將工程信息文件特徵向量中同一分量存在明顯差異的劃分為不同的類型,並依據專業 的經驗知識確定每一類型中的代表性工程信息文件作為初始聚類中心,而對於所有剩下的 其它工程信息文件,則根據它們與這些聚類中心的相似度大小,分別將它們分配給與其最 相似的聚類;然後再計算每個所獲新聚類的聚類中心;不斷重複這一過程直到均方差值開 始收斂為止。最終的聚類結果特徵顯著,即各聚類本身儘可能地緊湊,而各聚類之間則盡可 能地分開。(2. 2)對所有工程信息文件特徵向量的同一分量獲得以上聚類模型後,記錄該分 量的數值化分類信息,該分類信息標誌該分量歸屬於不同類別的相似程度,其中分類信息 的定義如下
設定所有工程信息文件特徵向量的第j個分量被分為~種不同的類型,用分類向量 Vij表示工程信息文件i的特徵向量Ti的第j個分量隸屬於不同類別的相似程度,其中
Γ:=(νΓ% υΛ vf; Ji :0, 1 , r=l. 2 ., s; .,0 表示分量、與第 r 種類型沒有
相關性,1表示完全相同,而介於0和1之間的值越大表示分量隸屬於第r種類型的相 似度越高。
(2.3)所述每個工程信息文件作為一個節點,所述每個節點在上述步驟 的基礎上獲得其自身特徵描述的數值化分類信息,同時設定一個隸屬於該節點的 權值向量Pi,用於描述工程信息文件i的特徵向量Ti各個分量的重要程度,其中
權利要求
1. 一種基於小世界特性的工程信息組織方法,其特徵在於其方法步驟如下(1)工程信息文件的特徵數據描述,其步驟包括(1.1)確定需要長期保存和利用的工程信息文件,並將其數位化;(1.2)選擇統一的元數據標準對所述工程信息文件進行特徵描述,形成特徵向量,該特 徵向量的維數就是所述工程信息文件的信息特徵數;(2)建立具有小世界特性的網絡拓撲結構,其步驟包括(2. 1)採用一維聚類方法對每個工程信息文件所對應特徵向量的同一分量進行聚類分 析,獲取聚類模型;(2. 2)記錄上述分量的數值化分類信息,該分類信息標誌該分量歸屬於不同類別的相 似程度;(2. 3)所述每個工程信息文件作為一個節點,所述每個節點在上述步驟的基礎上獲得 其自身特徵描述的數值化分類信息,同時設定一個隸屬於該節點的用於描述其特徵向量各 個分量重要程度的權值向量;(2. 4)以所述權值向量為依據,兩兩比較計算出每個節點與其他所有節點之間的相似度;(2. 5)計算每個節點與其他所有節點之間的相似度期望值,並將該節點與相似度不小 於所述期望值的所有其他節點進行連結,對於相似度小於期望值的所有其他節點,將該節 點以一定概率與其相連結;(3)在建立具有小世界特性的網絡拓撲結構的基礎上,對新增工程信息文件進行保存, 其步驟包括(3. 1)獲取新增工程信息文件的特徵向量;(3. 2)比較新增工程信息文件特徵向量中各個分量與已有工程信息文件特徵向量各個 分量之間的關係,當新增工程信息文件特徵向量中存在新的特徵維時,全局性特徵向量的 維數也做出相應增加,當新增工程信息文件特徵向量在新增維數上與已有工程信息文件特 徵向量不存在隸屬關係時,對這些新增維數不進行任何信息記錄;(3. 3)比較新增工程信息文件特徵向量中各個分量與該分量現有分類之間的關係,當 新增工程信息文件特徵向量中某個分量與現有分類之間的相似度為0或較低時,將該分量 獨立出來成為新增分量類型,同時該分量的分類個數做出相應增加;(3. 4)設定用於描述新增工程信息文件特徵向量中各個分量重要程度的權值向量; (3. 5)每個新增工程信息文件作為一個節點,計算所述新增節點與其他所有節點之間 的相似度期望值,並將該新增節點與相似度不小於所述期望值的所有其他節點進行連結, 對於相似度小於期望值的所有其他節點,將該節點以一定概率與其相連結;(4)在建立具有小世界特徵的網絡拓撲結構基礎上,進行工程信息文件檢索,其步驟包括(4. 1)依據現有工程信息文件特徵向量中的各個分量特性,確定檢索目標節點特徵向 量的分量,並給出這些分量隸屬於其現有分量類型的相似度及權值;(4.2)隨機選擇未被訪問過的節點,發出查詢請求,當不存在未被訪問過的節點時,執 行步驟(4. 5);(4. 3)計算檢索目標節點與被訪問節點之間的相似度,當相似度超過給定閾值時,進一步計算出檢索目標節點與被訪問節點的每個短連結節點之間的相似度,返回被訪問節點及 其短連結節點中相似度最大的節點,執行步驟(4. 5);否則,將被訪問節點標記為已訪問,執 行步驟(4. 4);(4. 4)將查詢請求發送給被訪問節點的未被訪問過的長連結節點,執行步驟(4. 3),當 被訪問節點的每一長連結節點都被訪問過時,執行步驟(4. 2);(4. 5)結束查詢;(5)在建立具有小世界特性的網絡拓撲結構基礎上,進行工程信息文件的維護,其步驟 包括(5. 1)依據步驟(4)查詢得到需要維護的工程信息文件;(5. 2)保持原有節點及其網絡拓撲關係不變,構建一個新的原有節點的複製節點,並對 該複製節點進行維護工作;(5. 3)抽取所述複製節點在進行維護工作之後的特徵向量的分量,計算出這些分量隸 屬於其現有分量類型的相似度及權值;(5. 4)計算出進行維護工作之後的複製節點與其他所有節點之間的相似度期望值,並 將該複製節點與相似度不小於所述期望值的所有其他節點進行連結,對於相似度小於所述 期望值的所有其他節點,將該複製節點以一定概率與其相連結。
全文摘要
本發明公開了一種基於小世界特性的工程信息組織方法,首先對工程信息文件進行特徵數據描述,形成特徵向量;然後建立具有小世界特性的網絡拓撲結構;然後在此基礎上對新增工程信息文件進行保存、檢索及維護。本發明為實現信息長期保存、信息擴展以及後期維護提供有效支持,為計算不同工程信息節點之間的相似度提供細粒度比較,提高信息查詢的精度和準確度。
文檔編號G06F17/30GK102136007SQ201110080080
公開日2011年7月27日 申請日期2011年3月31日 優先權日2011年3月31日
發明者劉展威, 封筠, 綦朝暉, 趙正旭 申請人:石家莊鐵道大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀