新四季網

天然氣與管道技術標準本體庫構建方法

2023-10-21 03:23:32 2

天然氣與管道技術標準本體庫構建方法
【專利摘要】本發明是一種天然氣與管道技術標準本體庫構建方法,涉及數字數據處理裝置和管道系統【技術領域】。其流程為:(1)確定本體的領域與範圍;(2)領域信息的收集和分析;(3)概念的確定;概念的確定中,要補充同義詞;(4)建立本體框架;(5)本體自定義集成,包括現有本體的引用,以及新本體的集成;(6)確定概念邏輯關係;確定概念邏輯關係時,要結合現有本體;(7)建立完整的本體表;(8)確認與評價;(9)進化;進化後參與(3)概念的確定和(6)確定概念邏輯關係;(10)完成本體建立。本發明所建立的本體庫能夠實現從「基本欄位信息」到「重要技術指標」的高效的標準信息檢索。
【專利說明】天然氣與管道技術標準本體庫構建方法
【技術領域】
[0001]本發明是一種天然氣與管道技術標準本體庫構建方法,涉及數字數據處理裝置和管道系統【技術領域】。
【背景技術】
[0002]隨著信息技術與網絡技術的發展,信息共享系統已經在各個行業廣泛應用,大大提高了各行業工作勞動效率與便捷性,天然氣與管道行業在信息化技術應用方面一直走在行業前列,隨著業務、技術的進一步發展,僅僅提供文獻級別的檢索、瀏覽等功能已經不能滿足用戶的需求,必須進行更深一步的挖掘與服務,以滿足用戶需求。目前常用的標準檢索方式為「基本欄位信息」檢索,一般僅能通過對標準名稱、主題詞進行檢索進而實現全文檢索,不能實現對技術指標的精確定位與檢索、不同標準中同一技術指標的對比。概括起來,傳統檢索方式對技術標準的使用效果有以下幾方面的局限性。
[0003](I)不能對技術標準內容進行精確檢索
[0004]傳統資料庫檢索方式是通過分類、標題、摘要及敘詞等手段對標準文獻進行題錄數據加工,來實現對技術標準與技術法規的檢索。但是技術指標一般會分散在不同技術標準與技術法規中,傳統的檢索方式只能通過題錄資料庫檢索到相關標準,逐一閱讀原文技術指標的內容。但是這樣的方法很浪費時間,並且難以保障查全率。
[0005](2)不能同時檢索到不同標準的技術指標,並實現不同標準的同一技術指標的對比。
[0006]在檢索過程中,經常會出現同一產品的技術指標同時存在國際標準、國家標準、行業標準、地方標準和企業標準等不同的標準中,用戶經常需要對不同標準中的相同產品的技術指標進行對比研究,這是傳統檢索方式所不能滿足的。
[0007]標準內容提取與展示系統是標準信息檢索的最新發展方向。這種新型的檢索方式通過對標準技術指標的系統提取和有效組織,能夠實現從「基本欄位信息」到「重要技術指標」的高效的標準信息檢索。對於負責油氣管道工程建設的工程項目管理人員、實施人員,可以實現利用關鍵指標控制管道設計和施工建設;對於油氣管道運行操作人員、管理人員,可以實現查詢、對比操作參數、方法;對於科研人員,可以實現國內外標準關鍵指標差異分析、判斷技術差異,分析體系內各標準間的協調性。
[0008]CN102591878A公開了一種技術標準內容提取與展示系統的建立方法,《石油規劃設計》2011年第22卷第6期「天然氣與管道標準信息管理系統開發方案研究」公開了一種天然氣與管道標準信息管理系統的開發方案,但該系統僅能進行標準全文檢索,無法實現標準內容的提取與展示,也並未公開建立天然氣與管道標準本體庫的構建方法,其技術並不完善。
[0009]標準內容提取與展示技術是一種新的標準檢索技術,目前國外未見以此技術開發的商業資料庫。在國內,只有中國標準化研究院將標準內容提取與展示技術初步應用在食品、農產品的國家標準、行業標準中,並建設了相應的提取與展示系統平臺,實現對標準內容指標的提取與展示。目前國內外未見到天然氣與管道技術標準內容提取與展示系統的建立方法。
[0010]油氣管道標準本體庫就是標準化對象,能夠涵蓋天然氣與管道標準中出現的所有有效檢索對象,並可通過本體庫界定不同本體對象的位置以及他們之間的所屬關係,可以對標準內容指標的檢索起到支撐作用。
[0011]要實現天然氣與管道標準技術內容提取與展示就必須對技術標準中的標準對象進行歸納並明確各對象間的關係,進而形成統一的檢索規則以及能夠實現精確定位的有效檢索點集合。此外隨著天然氣與管道技術標準對業務的支撐作用越來越強以及標準是適用範圍越來越廣,建立統一、規範、完整的標準化對象即本體庫的成為用戶的迫切需求,並且將在天然氣與管道領域信息共享和集成過程中起到重要的作用。然而目前尚沒有現成的本體庫可用,且經檢索也沒有提取標準對象從而建立本體庫的有效的方法。
[0012]因此對天然氣與管道標準進行分解和核心標準對象的提取進而構建本體庫是實現標準內容提取與展示的基礎。

【發明內容】

[0013]本發明的目的是發明一種實現從「基本欄位信息」到「重要技術指標」的高效的標準信息檢索、簡單易懂可行、能有效的分解、提取天然氣與管道標準對象、構建統一、完整的天然氣與管道技術標準本體庫構建方法。
[0014]本發明是天然氣與管道技術標準內容提取與展示系統中本體庫的構建方法,天然氣與管道技術標準內容提取與展示系統的建立方法如圖1所示,主要包括以下步驟:
[0015](I)使用光學字符識別(OCR)工具對天然氣與管道標準文獻全文進行數位化加工,使標準文獻數位化;
[0016](2)建立天然氣與管道標準本體庫、體例庫、題錄資料庫;
[0017](3)建立天然氣與管道標準內容資料庫;
[0018](4)開發天然氣與管道標準內容提取與展示系統平臺,用於標準內容提取、展示與對比。
[0019]具體建立步驟為:
[0020](I)按照標準文獻數位化規範,對確定的天然氣與管道標準進行全文數位化後,同時包括對文獻內容識別與質量審校,使標準可編輯,滿足提取與展示需求;
[0021](2)建立天然氣與管道標準本體庫、天然氣與管道標準題錄資料庫、天然氣與管道標準體例庫,這三個資料庫的建立為並列過程,互不幹擾;
[0022]①建立天然氣與管道標準本體庫:對天然氣與管道標準主題概念進行分析歸納,針對主體類別的概念內涵,根據對專業知識的查詢結果和標準文獻中枚舉的標準化對象之間的從屬關係進行本體概念分析,明確標準中發生的概念體系及其層次關係,建立天然氣與管道標準本體庫;
[0023]②建立天然氣與管道體例庫:對天然氣與管道標準文獻進行分類,歸納標準的結構化信息;按照相同結構的標準文獻開展標準文獻體例分析,抽象出其中的核心概念及其特徵描述術語,建立體例庫;
[0024]③天然氣與管道標準題錄資料庫:針對天然氣與管道技術標準進行標準技術指標分析歸納、對技術指標體系進行術語學與概念關係研究,進行技術指標概念的規範化及體系構建與標引,進行標準文獻技術指標標引,進行體例元素的分類與標示,建立標準技術指標資料庫,建立量與單位等輔助資料庫;以標準文本中的中文標準名稱、英文標準名稱、標準號、標準類型、【技術領域】技術方向、採用關係、代替關係、被代替關係、引用文獻、標準狀態、立項日期、發布日期、實施日期、確認日期、重要程度分級、歸口單位、起草單位、摘要、中文主題詞、英文主題詞、譯文、備註、正文等信息為基礎,建立標準題錄資料庫;
[0025](3)建立天然氣與管道標準內容資料庫
[0026]原有的標準體系表同步驟(2 )所建立本體庫、題錄資料庫、體例庫三個資料庫,形成天然氣與管道標準內容資料庫;
[0027](4)開發天然氣與管道標準內容提取與展示系統平臺,該系統除一般檢索系統功能外,如基本檢索功能、管理功能、在線反饋功能、幫助功能等功能,而且還應具有標準內容指標檢索功能、標準指標加工功能。
[0028]所述天然氣與管道標準本體庫構建流程如圖2所示,為:
[0029](I)確定本體的領域與範圍;
[0030](2)領域信息的收集和分析;
[0031](3)概念的確定;概念的確定中,要補充同義詞;
[0032](4)建立本體框架;
[0033](5)本體自定義集成,包括現有本體的引用,以及新本體的集成;
[0034](6)確定概念邏輯關係;確定概念邏輯關係時,要結合現有本體;
[0035]( 7 )建立完整的本體表;
[0036](8)確認與評價;
[0037](9)進化;進化後參與(3)概念的確定和(6)確定概念邏輯關係;
[0038]( 10)完成本體建立。
[0039]所述天然氣與管道標準本體庫構建流程具體為:
[0040](I)確定本體庫的領域與範圍:要明確構建的本體庫將覆蓋的專業領域、本體的目的、作用以及應用對象;
[0041](2)領域信息的收集和分析:通過收集石油天然氣管道領域信息充分了解該領域知識;信息來源包括專家、書籍、標準、網絡以及其它的本體;
[0042](3)概念的確定:在充分了解天然氣與管道領域知識之後,確定該領域中概念和概念之間的關係,用精確的術語表達出來,經領域專家的確認,作為領域本體的核心概念集。基本應該滿足的要求有:
[0043]①確定的概念及關係一定是領域相關的;領域的邊界往往是模糊的,需根據實際需求確定邊界包含的概念;
[0044]②採用的術語要精確,含義應具有唯一性;
[0045]③對每個術語有相應的自然語言描述和同義詞補充;
[0046](4)建立本體庫框架;對於步驟(3)中整理的領域中大量的概念,要按照一定的邏輯規則把它們進行分組,形成不同的小專業領域,在同一小工作領域的概念,其相關性應該比較強;另外,對其中的每一個概念的重要性要進行評估,選出關鍵性術語,摒棄那些不必要或者超出領域範圍的概念,儘可能準確而精簡的表達出領域的知識;[0047](5)本體庫自定義集成;在創建本體庫可以自定義,也可以是領域中現存的本體庫的重用;重用本體庫時,需要注意查看元本體庫,選擇和自己概念模型中的語義和實現一致的術語定義;其中涉及的關鍵技術是本體的映射;針對每個集成的本體庫,應確定其元本體庫、術語集、形式化的本體庫描述、以及集成在自己本體庫中的位置等屬性;
[0048](6)確定概念邏輯關係;主要以專業知識的與科學分類為基礎,根據分類學中的主題法和分類法,確定概念的邏輯關係;
[0049](7)建立完整的本體庫;將天然氣與管道標準本體庫與標準文獻有效檢索點結合,從而形成一個領域知識的框架體系,得到領域本體庫的框架結構;
[0050]建立天然氣與管道本體庫時,本體劃分應遵循以下基本規則:a)各子項的外延之和應等於母項的外延;b)劃分的各子項,其外延宜相互排斥;c)每次劃分應按同一原則進行;d)劃分應按層次逐級、由高到低、由簡到繁進行,宜結合天然氣與管道主營業務粗細結合;e)應持續更新補充;
[0051]類目的劃分與設置應突出主營業務,將內容相關性較大的類目,應儘量臨近設置;對於一些無專屬的類,且具有普遍指導意義的綜合性基礎標準可根據內容分別單獨設置類;上一層次類目的技術要求下層類目都要滿足;
[0052](8)確認與評價:本體庫應具有正確性、一致性、可擴展性和有效性;
[0053](9)進化:在使用過程中需要對本體庫不斷更新,本體庫進化的方式可以是集成新的本體庫或定義新的概念和關係;
[0054]( 10)完成本體庫建立。
[0055]本發明的有益效果:
[0056]本發明為天然氣與管道標準本體庫的構建方法取得了以下有益效果:
[0057](I)本發明簡單易懂可行,可以有效的分解、提取天然氣與管道標準對象,構建統一、完整的本體庫;
[0058](2)本發明構建的本體庫應用於天然氣與管道標準內容提取與展示系統可以作為有效檢索點的集合實現技術標準內容的精確定位和檢索,實現從「基本欄位信息」到「重要技術指標」的高效的標準信息檢索;
[0059](3)本發明提取的本體精確、唯一、科學,可作為術語資料庫一部分,對天然氣與管道領域的信息共享與交流有重要作用。
【專利附圖】

【附圖說明】
[0060]圖1天然氣與管道標準內容提取與展示系統建立流程圖
[0061]圖2本體庫構建流程圖
【具體實施方式】
[0062]實施例.本例是一實驗方法,其流程如圖2所不。
[0063]本例主要包括以下步驟:
[0064](I)確定本體的領域與範圍;
[0065](2)領域信息的收集和分析;
[0066](3)概念的確定;概念的確定中,要補充同義詞;[0067](4)建立本體框架;
[0068](5)本體自定義集成,包括現有本體的引用,以及新本體的集成;
[0069](6)確定概念邏輯關係;確定概念邏輯關係時,要結合現有本體;
[0070]( 7 )建立完整的本體表;
[0071](8)確認與評價;
[0072](9)進化;進化後參與(3)概念的確定和(6)確定概念邏輯關係;
[0073](10)完成本體建立。
[0074]本例的體系表如下表:
[0075]表1本體表樣例
[0076]
【權利要求】
1.一種天然氣與管道技術標準本體庫構建方法,其特徵是流程為: (1)確定本體的領域與範圍; (2)領域信息的收集和分析; (3)概念的確定;概念的確定中,要補充同義詞; (4)建立本體框架; (5)本體自定義集成,包括現有本體的引用,以及新本體的集成; (6)確定概念邏輯關係;確定概念邏輯關係時,要結合現有本體; (7)建立完整的本體表; (8)確認與評價; (9)進化;進化後參與(3)概念的確定和(6)確定概念邏輯關係; (10)完成本體建立。
2.根據權利要求1所述的天然氣與管道技術標準本體庫構建方法,其特徵是構建流程具體為: (1)確定本體庫的領域與範圍:要明確構建的本體庫將覆蓋的專業領域、本體的目的、作用以及應用對象; (2)領域信息的收集和分析:通過收集石油天然氣管道領域信息充分了解該領域知識;信息來源包括專家、書籍、標準、網絡以及其它的本體; (3)概念的確定:在充分了解天然氣與管道領域知識之後,確定該領域中概念和概念之間的關係,用精確的術語表達出來,經領域專家的確認,作為領域本體的核心概念集。基本應該滿足的要求有: ①確定的概念及關係一定是領域相關的;領域的邊界往往是模糊的,需根據實際需求確定邊界包含的概念; ②採用的術語要精確,含義應具有唯一性; ③對每個術語有相應的自然語言描述和同義詞補充; (4)建立本體庫框架;對於步驟(3)中整理的領域中大量的概念,要按照一定的邏輯規則把它們進行分組,形成不同的小專業領域,在同一小工作領域的概念,其相關性應該比較強;另外,對其中的每一個概念的重要性要進行評估,選出關鍵性術語,摒棄那些不必要或者超出領域範圍的概念,儘可能準確而精簡的表達出領域的知識; (5)本體庫自定義集成;在創建本體庫可以自定義,也可以是領域中現存的本體庫的重用;重用本體庫時,需要注意查看元本體庫,選擇和自己概念模型中的語義和實現一致的術語定義;其中涉及的關鍵技術是本體的映射;針對每個集成的本體庫,應確定其元本體庫、術語集、形式化的本體庫描述、以及集成在自己本體庫中的位置等屬性; (6)確定概念邏輯關係;主要以專業知識的與科學分類為基礎,根據分類學中的主題法和分類法,確定概念的邏輯關係; (7)建立完整的本體庫;將天然氣與管道標準本體庫與標準文獻有效檢索點結合,從而形成一個領域知識的框架體系,得到領域本體庫的框架結構; 建立天然氣與管道本體庫時,本體劃分應遵循以下基本規則:a)各子項的外延之和應等於母項的外延;b)劃分的各子項,其外延宜相互排斥;c)每次劃分應按同一原則進行;d)劃分應按層次逐級、由高到低、由簡到繁進行,宜結合天然氣與管道主營業務粗細結合;e)應持續更新補充; 類目的劃分與設置應突出主營業務,將內容相關性較大的類目,應儘量臨近設置;對於一些無專屬的類,且具有普遍指導意義的綜合性基礎標準可根據內容分別單獨設置類;上一層次類目的技術要求下層類目都要滿足; (8)確認與評價:本體庫應具有正確性、一致性、可擴展性和有效性; (9)進化:在使用過程中需要對本體庫不斷更新,本體庫進化的方式可以是集成新的本體庫或定義新的概念和關係; (10)完成 本體庫 建立。
【文檔編號】G06F17/30GK103699542SQ201210366895
【公開日】2014年4月2日 申請日期:2012年9月28日 優先權日:2012年9月28日
【發明者】劉冰, 姚學軍, 李雲傑, 張欣, 稅碧垣, 劉豔雙, 鄭娟 申請人:中國石油天然氣股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀