新四季網

基於農業領域本體庫的語義檢索系統和方法

2023-08-05 03:15:01

專利名稱:基於農業領域本體庫的語義檢索系統和方法
技術領域:
本發明屬於智能檢索技術領域,具體涉及一種基於農業領域本體庫的語義檢索系 統和方法。
背景技術:
隨著網際網路上農業網站的不斷湧現,農業知識與數據資源已呈海量增長趨勢。這 些龐雜、分散、異構並且封閉的農業信息資源導致了農業信息資源利用率低的問題,形成了 當前網際網路信息爆炸而農業用戶獲取有效信息匱乏的矛盾現象。許多通用搜尋引擎,如 Google、百度等在一定程度上為信息資源的檢索提供了解決方案。但是一方面通用搜索引 擎面向的是所有行業,針對特定行業信息檢索時準確性和相關性都較差;另一方面通用搜 索引擎採用的是基於關鍵詞的檢索技術,只是將分詞後的關鍵詞和索引庫中的詞語進行匹 配,無法正確理解和處理用戶檢索語義和意圖,存在著檢索結果不準確、無關信息過多等問 題。因此,面向農業行業,利用基於本體的語義檢索技術成為提高搜索效率的有效途徑,對 查全率和查準率均有較高提升。如圖1所示,目前現有技術中提供有一種基於領域本體的智能檢索方法,以及應 用該方法的智能檢索系統。該系統包括查詢接口、查詢預處理模塊、語義本體推理引擎、標 注本體庫、傳統搜索模塊和結果返回接口。查詢接口獲取用戶的查詢信息,將其發送給查詢預處理模塊。查詢預處理模塊分析用戶的查詢信息,通過切分詞技術,將其切分成查詢關鍵詞, 並發送給語義本體推理引擎。語義本體推理引擎根據標註本體庫中定義的本體概念詞彙及概念之間的關係,匹 配推理出查詢關鍵詞所對應的本體概念詞彙,並將其返回給查詢預處理模塊。查詢預處理模塊將語義本體推理引擎返回的本體概念詞彙發送給傳統搜索模塊, 並指明按照語義搜索。這裡按照語義搜索是指在網頁已被標註語義的情況下,按照網頁標 注的語義概念進行字符串匹配,而不是直接對網頁自身的內容進行字符串匹配。傳統搜索模塊進行語義搜索,並將搜索結果發送給結果返回接口。結果返回接口 再將搜索結果返回給用戶。該技術方案充分利用了領域本體庫中的概念及其相互關係,能夠正確理解用戶需 求,優化檢索結果,為用戶更全、更準地返回專業領域信息。但該技術方案並未涉及對基礎數據資源的預處理。一方面基礎數據資源中往往含 有大量無關的冗餘信息,比如網頁中往往還有廣告、導航、版權等垃圾信息,如果不對這些 垃圾信息進行清洗處理,將對後期的檢索帶來極大噪聲幹擾;另一方面,網頁中包含的都是 半結構化數據,真正有用的數據和html標籤混合在一起,這也大大降低了檢索的精準度。同時,現有的技術方案在對用戶輸入的自然查詢語言進行處理時,如果用戶輸入 的自然查詢語句中包括本體概念,則進行句型模式的匹配判斷,無論匹配成功與否,都是直 接對匹配上或進行語義擴展後的本體概念進行查詢,由於整個過程缺少用戶的參與,而通過對用戶輸入的自然查詢語言進行語義分析並不能完全和精準的理解用戶查詢意圖,因 此,勢必造成最終的查詢結果的精準度差強人意。

發明內容
(一)要解決的技術問題本發明要解決的技術問題是如何提高農業領域信息語義檢索過程的精準度以及效率。

(二)技術方案為了解決上述技術問題,本發明提供一種基於農業領域本體庫的語義檢索系統, 包括信息抽取模塊,用於對從網際網路上獲取的信息進行結構化處理,生成農業資源 庫;語義標註處理模塊,用於對所述農業資源庫中的資源數據進行本體語義標註,以 文本格式存儲,並計算標註本體的語義向量空間,然後將所述語義向量空間中標註本體詞 匯和已標註處理的資源數據的語義關聯度,與已標註的文本資源一起入庫,生成本體語義 資源庫;語義索引處理模塊,用於讀取所述本體語義資源庫中的文本數據,根據所述文本 數據中的語義標註信息建立語義本體索引庫以及全文索引庫;語義擴展模塊,用於接收用戶提交的自然語言查詢語句,對所述自然語言查詢語 句進行分詞處理及本體語義擴展處理,生成相應的本體語義擴展集返回給用戶,用戶參與 對所述本體語義擴展集的過濾、補充並再次提交;檢索處理模塊,用於根據所述本體語義擴展集進行檢索,生成檢索結果返回給用 戶。所述系統還包括爬蟲抓取模塊,利用網絡爬蟲抓取工具對網際網路上指定的農業網 頁進行信息獲取。所述語義擴展模塊包括分詞處理單元,用於對所述自然語言查詢語句進行分詞處理;語義本體推理引擎,用於利用農業領域本體庫,判斷所述分詞處理後的查詢關鍵 詞結果中是否存在本體語義概念的角色,根據判斷結果要求用戶重新提交檢索查詢語句, 或者進行下一步的語義擴展;本體語義擴展處理單元,用於訪問農業領域本體庫,進行本體語義擴展,得到本體 語義擴展集,並結合用戶的參與對所述本體語義擴展集進行過濾和權重標識處理。所述檢索處理模塊包括語義本體檢索單元,用於將所述本體語義擴展集轉化為語義查詢檢索式,根據所 述語義查詢檢索式訪問所述語義本體索引庫,生成查詢結果集;全文檢索單元,用於訪問所述全文索引庫進行全文檢索,生成查詢結果集;排名處理單元,用於根據本體語義擴展集的本體詞彙權重標識對所述查詢結果集 進行排名處理,生成檢索結果返回給用戶。此外,本發明還提供一種基於農業領域本體庫的語義檢索方法,包括如下步驟
Sl 對網際網路上指定的農業網頁進行信息獲取,對獲取的信息進行結構化處理,生 成農業資源庫;S2:對所述農業資源庫中的資源數據進行本體語義標註,然後以文本格式存儲,並 計算標註本體的語義向量空間,然後將所述語義向量空間中標註本體詞彙和已標註處理的 資源數據的語義關聯度,與已標註的文本資源一起入庫,生成本體語義資源庫;S3:讀取所述本體語義資源庫中的文本數據,根據所述文本數據中的語義標註信 息建立語義本體索引庫以及全文索引庫;S4:接收用戶提交的自然語言查詢語句,對所述自然語言查詢語句進行分詞處理 及本體語義擴展處理,生成本體語義擴展集;S5 根據所述本體語義擴展集進行檢索,生成檢索結果返回給用戶。所述Sl利用網絡爬蟲抓取工具進行網頁信息獲取。所述步驟S2中對所述農業資源庫中的資源數據進行本體語義標註具體為將資 源數據中的與本體角色相關的詞彙做上標記,即與本體概念建立映射關係。所述步驟S3具體包括S301 讀取本體語義資源庫中的文本數據,判斷文本數據中是否存在語義標註信 息;若存在語義標註信息,則執行步驟302 ;否則結束對該條文本數據建立語義本體索引庫的流程,轉而建立包括對應該條文 本數據索引的全文索引庫;S302:讀取文本數據的語義標註信息,所述語義標註信息存放在所述本體語義資 源庫中;S303 結合本體語義資源庫和文本數據,從中提取語義概念本體詞彙,建立語義本 體索引庫。所述步驟S4具體包括S401 獲得用戶提交的自然語言查詢信息;S402:對所述自然語言查詢信息進行切分詞處理,然後利用農業領域本體庫來判 斷切分後的查詢關鍵詞結果中是否存在本體語義概念的角色;若判斷結果為否,則轉入步驟S403 ;若判斷結果為是,則轉入步驟S404 ;S403:若用戶提交的自然語言查詢信息中不包括本體語義概念,則進行全文檢索 或返回用戶,要求其重新提交檢索查詢語句;S404:若用戶提交的自然查詢查詢信息中包括本體語義概念,則進行下一步的語 義擴展或根據用戶需要只進行全文檢索;S405 訪問農業領域本體庫,進行本體語義擴展,得到本體語義擴展集;S406 結合用戶201的參與對所述本體語義擴展集進行過濾和權重標識處理,確 認最終的本體語義擴展集。所述步驟S5具體包括S501 將所述本體語義擴展集轉化為語義查詢檢索式,根據所述語義查詢檢索式 訪問所述語義本體索引庫,生成查詢結果集;或者訪問所述全文索引庫進行全文檢索,生成查詢結果集;
S502:根據本體語義擴展集的本體詞彙權重標識對所述查詢結果集進行排名處 理,生成檢索結果返回給用戶。(三)有益效果本發明技術方案所提出的基於農業領域本體庫的語義檢索系統和方法利用信息 抽取技術將網頁中的結構化數據抽取出來作為基礎資源,然後利用農業本體庫和用戶適當 參與來實現精準而又高效的農業領域信息語義檢索。具體來說(1)該技術方案基於農業本體的信息抽取技術,針對從網絡上抓取到 的HTML網頁,在清洗無用冗餘信息後,僅僅將析取出有用的結構化的數據信息來作為檢索 的基礎資源,因此在數據基礎資源階段大大保證了檢索的準確性;(2)該技術方案在語義檢索階段,引入用戶交互式參與模式,根據用戶的查詢請求 進行語義擴展和推理,並對用戶輸入的自然語言進行處理或者將擴展後的結果再次返回給 用戶,使得用戶參與的過程中能比較準確的確定擴展語義集中各個本體實例的權重,直到 擴展後的本體實例集符合用戶的查詢需求,因此大大提高最終檢索結果的準確性。與現有技術相比,本發明提出的系統和技術方案一方面利用基於農業本體庫的信 息抽取技術確保了數據來源的結構性和準確性;另一方面建立了比較全面和專業的面向農 業行業的本體庫,在語義推理機的基礎上結合用戶的參與,能較準確的對用戶的檢索關鍵 詞進行語義擴展,從而提高了最終檢索的查準率和查全率。


圖1為目前的語義檢索系統的結構流程圖;圖2為本發明具體實施方式
所提供的基於農業領域本體庫的語義檢索系統的結 構框圖;圖3為本發明具體實施方式
所提供的基於農業領域本體庫的語義檢索方法的流 程圖;圖4是本發明具體實施方式
所涉及的建立語義本體索引庫的流程圖;圖5為本發明具體實施方式
所涉及的進行語義檢索的具體流程圖。
具體實施例方式為使本發明的目的、內容、和優點更加清楚,下面結合附圖和實施例,對本發明的具體實施方式
作進一步詳細描述。為了提高農業領域信息語義檢索過程的精準度以及效率,本發明提供一種基於農 業領域本體庫的語義檢索系統,如圖2所示,所述語義檢索系統包括爬蟲抓取模塊207,用於利用網絡爬蟲抓取工具對網際網路上指定的農業網頁進行 信息獲取;信息抽取模塊208,用於對獲取的信息進行結構化處理,生成農業資源庫209 ;語義標註處理模塊210,其中,包括本體語義標註單元211,用於對所述農業資 源庫209中的資源數據進行本體語義標註,然後以文本格式存儲;語義向量空間計算單元 212:用於計算標註本體的語義向量空間,然後將所述語義向量空間中標註本體詞彙和已 標註處理的資源數據的語義關聯度,與已標註的文本資源一起入庫,生成本體語義資源庫213 ;語義索引處理模塊214,用於讀取所述本體語義資源庫213中的文本數據,根據所 述文本數據中的語義標註信息建立語義本體索引庫215以及全文索引庫216 ;語義擴展模塊202,用於接收用戶201提交的自然語言查詢語句,對所述自然語言 查詢語句進行分詞處理及本體語義擴展處理,生成相應的本體語義擴展集返回給用戶201, 用戶參與對所述本體語義擴展集的過濾、補充並再次提交;檢索處理模塊217,用於根據所述本體語義擴展集進行檢索,生成檢索結果返回給 用戶201。所述語義擴展模塊202包括農業領域本體庫206,所述農業領域本體庫206採用本發明研究過程中自主開發 的一套本體構建工具構建而成,該工具以本體庫構建平臺KAON為基礎,結合對農業科學敘 詞表的數據進行分析,實現了針對農業結構化數據構建農業領域本體庫的半自動化。分詞處理單元203,用於對所述自然語言查詢語句進行分詞處理;語義本體推理引擎205,用於利用農業領域本體庫206,判斷所述分詞處理後的查 詢關鍵詞結果中是否存在本體語義概念的角色,根據判斷結果要求用戶201重新提交檢索 查詢語句,或者進行下一步的語義擴展;本體語義擴展處理單元204,用於訪問遍歷農業領域本體庫206,進行本體語義擴 展,得到本體語義擴展集,並結合用戶201的參與對所述本體語義擴展集進行過濾和權重 標識處理。所述檢索處理模塊217包括語義本體檢索單元218,用於將所述本體語義擴展集轉化為語義查詢檢索式,根據 所述語義查詢檢索式訪問所述語義本體索引庫215,生成查詢結果集;全文檢索單元219,用於訪問所述全文索引庫216進行全文檢索,生成查詢結果 集;排名處理單元220,用於根據本體語義擴展集的本體詞彙權重標識對所述查詢結 果集進行排名處理,生成檢索結果返回給用戶201。此外,本發明基於上述語義檢索系統還提供一種基於農業領域本體庫的語義檢索 方法,如圖3所示,所述方法包括如下步驟Sl 爬蟲抓取模塊207對網際網路上指定的農業網頁進行信息獲取,信息抽取模塊 208對獲取的信息進行結構化處理,生成農業資源庫209 ;S2 本體語義標註單元211對所述農業資源庫中的資源數據進行本體語義標註, 具體為將資源數據中的與本體角色相關的詞彙做上標記,即與本體概念建立映射關係,然 後以文本格式存儲,並通過語義向量空間計算單元212計算標註本體的語義向量空間,然 後將所述語義向量空間中標註本體詞彙和已標註處理的資源數據的語義關聯度,與已標註 的文本資源一起入庫,生成本體語義資源庫213 ;對所述農業資源庫中的資源數據進行本體語義標註,然後以文本格式存儲,並計 算標註本體的語義向量空間,然後將所述語義向量空間中標註本體詞彙和已標註處理的資 源數據的語義關聯度,與已標註的文本資源一起入庫,生成本體語義資源庫;S3:讀取所述本體語義資源庫中的文本數據,根據所述文本數據中的語義標註信息建立語義本體索引庫以及全文索引庫;如圖4所示,所述步驟S3具體包括S301 語義索引處理模塊214讀取本體語義資源庫213中的文本數據;S302 判斷文本數據中是否存在語義標註信息;若存在語義標註信息,則執行步 驟 303 ;否則結束對該條文本數據建立語義本體索引庫215的流程,轉而建立包括對應該 條文本數據索引的全文索引庫216 ;本體語義標註單元211就是將文本信息中的與本體角色相關的詞彙做上標記,即 與本體概念建立映射關係。如果文本信息中的某個詞彙沒有被收錄到農業領域本體庫206 之中或找不到與之相關的本體角色,則該詞彙對於農業領域專業信息檢索而言,屬於幹擾 信息或不相關信息,也就沒有必要為該詞建立語義索引。S303:讀取文本數據的語義標註信息,所述語義標註信息存放在所述本體語義資 源庫213中,其中用一張表的形式表示如下
文本數據 (textid)本體概念URL (concepturl)......100http://.. ./AgriOnto.owl#Cucumber_YiBing... · ·S304 語義索引處理模塊214結合本體語義資源庫213和文本數據,從中提取語義 概念本體詞彙,建立語義本體索引庫215。S4 接收用戶201提交的自然語言查詢語句,對所述自然語言查詢語句進行分詞 處理及本體語義擴展處理,生成本體語義擴展集;如圖5所示,所述步驟S4具體包括S401 語義擴展模塊202獲得用戶201提交的自然語言查詢信息;本實施例中假 設用戶提交的查詢信息為「黃瓜病蟲害防治」;S402 分詞處理單元203對所述自然語言查詢信息進行切分詞處理,切分處理的 具體過程在現有關於搜尋引擎的相關文獻中多有描述,這裡不再複述。本實施例中文本查 詢信息「黃瓜病蟲害防治」經過切分處理後的結果為「黃瓜/病蟲害防治」;S403 由語義本體推理引擎205利用農業領域本體庫206來判斷切分後的查詢關 鍵詞結果中是否存在本體語義概念的角色;若判斷結果為否,則轉入步驟S404 ;若判斷結果為是,則轉入步驟S405 ;本實施例中假定判斷結果為是。S404 若用戶201提交的自然語言查詢信息中不包括本體語義概念,則進行全文 檢索或返回用戶201,要求其重新提交檢索查詢語句;S405 若用戶201提交的自然查詢查詢信息中包括本體語義概念,則進行下一步 的語義擴展或根據用戶201需要只進行全文檢索;
S406 本體語義擴展處理單元204訪問農業領域本體庫206,進行本體語義擴展, 得到本體語義擴展集;例如用戶輸入「夏天黃瓜病蟲防治」進行相關檢索,分詞處理的結果是夏天/t 黃瓜/n病蟲害防治/n,將分詞後的結果作為語義本體推理引擎單元205的輸入,最後通過 本體語義擴展處理單元204處理後返回給用戶的本體語義擴展集為(青瓜、生物、中農2、 津春3號、白粉病、炭疽病...)。S407 結合用戶201的參與對所述本體語義擴展集進行過濾和權重標識處理,最 後將確認的本體語義擴展集發送至檢索處理模塊217 ;例如本實施例中的擴展集可以過濾掉非本體核心詞彙中農2、津春3號。而保留 本體相關的核心詞彙。並對保留的本體詞彙進行權重標識。本實施例中結果為「{青瓜, 1.0}, {生物,0. 3}、{白粉病,0. 5}、{炭疽病,0. 5}··. 」擴展集的本體詞彙權重標識主要通過本體相關度和相似度來判斷擴展集詞彙與 文本信息的語義相似性。作為檢索結果處理和排序的參考指標。S5:檢索處理模塊217根據所述本體語義擴展集進行檢索,生成檢索結果返回給 用戶201。如圖5所示,所述步驟S5具體包括S501 語義本體檢索單元218將所述本體語義擴展集轉化為語義查詢檢索式,根 據所述語義查詢檢索式訪問所述語義本體索引庫,生成查詢結果集;或者訪問所述全文索引庫進行全文檢索,生成查詢結果集;S502:根據本體語義擴展集的本體詞彙權重標識對所述查詢結果集進行排名處 理,生成檢索結果返回給用戶。以上所述僅是本發明的優選實施方式,應當指出,對於本技術領域的普通技術人 員來說,在不脫離本發明技術原理的前提下,還可以做出若干改進和變形,這些改進和變形 也應視為本發明的保護範圍。
權利要求
1.一種基於農業領域本體庫的語義檢索系統,其特徵在於,包括信息抽取模塊,用於對從網際網路上獲取的信息進行結構化處理,生成農業資源庫; 語義標註處理模塊,用於對所述農業資源庫中的資源數據進行本體語義標註,以文本 格式存儲,並計算標註本體的語義向量空間,然後將所述語義向量空間中標註本體詞彙和 已標註處理的資源數據的語義關聯度,與已標註的文本資源一起入庫,生成本體語義資源 庫;語義索引處理模塊,用於讀取所述本體語義資源庫中的文本數據,根據所述文本數據 中的語義標註信息建立語義本體索引庫以及全文索引庫;語義擴展模塊,用於接收用戶提交的自然語言查詢語句,對所述自然語言查詢語句進 行分詞處理及本體語義擴展處理,生成相應的本體語義擴展集返回給用戶,用戶參與對所 述本體語義擴展集的過濾、補充並再次提交;檢索處理模塊,用於根據所述本體語義擴展集進行檢索,生成檢索結果返回給用戶。
2.如權利要求1所述的基於農業領域本體庫的語義檢索系統,其特徵在於,所述系統 還包括爬蟲抓取模塊,利用網絡爬蟲抓取工具對網際網路上指定的農業網頁進行信息獲取。
3.如權利要求1所述的基於農業領域本體庫的語義檢索系統,其特徵在於,所述語義 擴展模塊包括分詞處理單元,用於對所述自然語言查詢語句進行分詞處理; 語義本體推理引擎,用於利用農業領域本體庫,判斷所述分詞處理後的查詢關鍵詞結 果中是否存在本體語義概念的角色,根據判斷結果要求用戶重新提交檢索查詢語句,或者 進行下一步的語義擴展;本體語義擴展處理單元,用於訪問農業領域本體庫,進行本體語義擴展,得到本體語義 擴展集,並結合用戶的參與對所述本體語義擴展集進行過濾和權重標識處理。
4.如權利要求1所述的基於農業領域本體庫的語義檢索系統,其特徵在於,所述檢索 處理模塊包括語義本體檢索單元,用於將所述本體語義擴展集轉化為語義查詢檢索式,根據所述語 義查詢檢索式訪問所述語義本體索引庫,生成查詢結果集;全文檢索單元,用於訪問所述全文索引庫進行全文檢索,生成查詢結果集; 排名處理單元,用於根據本體語義擴展集的本體詞彙權重標識對所述查詢結果集進行 排名處理,生成檢索結果返回給用戶。
5.一種基於農業領域本體庫的語義檢索方法,其特徵在於,包括如下步驟Sl 對網際網路上指定的農業網頁進行信息獲取,對獲取的信息進行結構化處理,生成農 業資源庫;S2:對所述農業資源庫中的資源數據進行本體語義標註,然後以文本格式存儲,並計算 標註本體的語義向量空間,然後將所述語義向量空間中標註本體詞彙和已標註處理的資源 數據的語義關聯度,與已標註的文本資源一起入庫,生成本體語義資源庫;S3 讀取所述本體語義資源庫中的文本數據,根據所述文本數據中的語義標註信息建 立語義本體索引庫以及全文索引庫;S4:接收用戶提交的自然語言查詢語句,對所述自然語言查詢語句進行分詞處理及本 體語義擴展處理,生成本體語義擴展集;S5 根據所述本體語義擴展集進行檢索,生成檢索結果返回給用戶。
6.如權利要求5所述的基於農業領域本體庫的語義檢索方法,其特徵在於,所述Sl利 用網絡爬蟲抓取工具進行網頁信息獲取。
7.如權利要求5所述的基於農業領域本體庫的語義檢索方法,其特徵在於,所述步驟 S2中對所述農業資源庫中的資源數據進行本體語義標註具體為將資源數據中的與本體 角色相關的詞彙做上標記,即與本體概念建立映射關係。
8.如權利要求5所述的基於農業領域本體庫的語義檢索方法,其特徵在於,所述步驟 S3具體包括S301 讀取本體語義資源庫中的文本數據,判斷文本數據中是否存在語義標註信息; 若存在語義標註信息,則執行步驟302 ;否則結束對該條文本數據建立語義本體索引庫的流程,轉而建立包括對應該條文本數 據索引的全文索引庫;S302:讀取文本數據的語義標註信息,所述語義標註信息存放在所述本體語義資源庫中;S303 結合本體語義資源庫和文本數據,從中提取語義概念本體詞彙,建立語義本體索 引庫。
9.如權利要求5所述的基於農業領域本體庫的語義檢索方法,其特徵在於,所述步驟 S4具體包括S401 獲得用戶提交的自然語言查詢信息;S402:對所述自然語言查詢信息進行切分詞處理,然後利用農業領域本體庫來判斷切 分後的查詢關鍵詞結果中是否存在本體語義概念的角色;若判斷結果為否,則轉入步驟S403 ;若判斷結果為是,則轉入步驟S404 ;S403 若用戶提交的自然語言查詢信息中不包括本體語義概念,則進行全文檢索或返 回用戶,要求其重新提交檢索查詢語句;S404:若用戶提交的自然查詢查詢信息中包括本體語義概念,則進行下一步的語義擴 展或根據用戶需要只進行全文檢索;5405訪問農業領域本體庫,進行本體語義擴展,得到本體語義擴展集;5406結合用戶201的參與對所述本體語義擴展集進行過濾和權重標識處理,確認最 終的本體語義擴展集。
10.如權利要求5所述的基於農業領域本體庫的語義檢索方法,其特徵在於,所述步驟 S5具體包括5501將所述本體語義擴展集轉化為語義查詢檢索式,根據所述語義查詢檢索式訪問 所述語義本體索引庫,生成查詢結果集;或者訪問所述全文索引庫進行全文檢索,生成查詢結果集;5502根據本體語義擴展集的本體詞彙權重標識對所述查詢結果集進行排名處理,生 成檢索結果返回給用戶。
全文摘要
本發明涉及基於農業領域本體庫的語義檢索系統和方法,屬於智能檢索技術領域。為提高農業領域信息語義檢索過程的精準度以及效率,本發明利用信息抽取技術僅僅將網頁中有用的結構化數據抽取出來作為檢索的基礎資源,因此在數據基礎資源階段大大保證了檢索數據來源的結構性和準確性;然後建立了比較全面和專業的面向農業行業的本體庫,在語義本體推理引擎的基礎上結合用戶的參與,根據用戶的查詢請求進行語義擴展和推理,並對用戶提交的自然語言進行處理或者將擴展後的結果再次返回給用戶,使得用戶參與的過程中能比較準確的確定擴展語義集中各個本體實例的權重,直到擴展後的本體實例集符合用戶的查詢需求,從而提高了最終檢索的查準率和查全率。
文檔編號G06F17/30GK102073692SQ20101060801
公開日2011年5月25日 申請日期2010年12月16日 優先權日2010年12月16日
發明者吳華瑞, 楊鋒, 趙春江, 顧靜秋, 黃鋒 申請人:北京農業信息技術研究中心

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀