新四季網

一種支持跨類型語義搜索的多媒體存儲與搜索方法

2023-05-01 23:28:21

一種支持跨類型語義搜索的多媒體存儲與搜索方法
【專利摘要】本發明公開了一種支持跨類型語義搜索的多媒體存儲與搜索方法,包括以下步驟:(1)用戶語義標註步驟;(2)本體表達步驟;(3)數據合併步驟;(4)多媒體檢索步驟。該方法不僅支持跨類型多媒體搜索,而且能夠用反映用戶的語義需求。具有如下特點:(1)支持跨類型搜索。用戶可以任意上傳一種類型,找到各種各樣語義匹配的多媒體。(2)操作方便。與傳統搜尋引擎的操作方式完全相同:上傳文件,點擊搜索。(3)保持語義信息。語義信息在多媒體文檔的複製、移動或者離開知識庫的情況下,無需重建,直接可以進行支持語義的多媒體檢索。
【專利說明】一種支持跨類型語義搜索的多媒體存儲與搜索方法
【技術領域】
[0001]本發明涉及多媒體搜索領域,尤其涉及的是一種支持跨類型語義搜索的多媒體存儲與搜索方法。
【背景技術】
[0002]多媒體搜索是搜尋引擎的關鍵技術。目前的多媒體面臨兩大重要需求:
[0003]1、語義多媒體搜索。以圖像為例,實際上,用人類的智能在圖像中來識別一個目標,並非僅僅建立在目標的低層視覺特徵,如顏色、形狀和紋理上,而是充分考慮了目標所描述的對象、事件,甚至情感等語義。例如,同一個明星的真實頭像照片和其卡通頭像照片,以人類的智能來判斷,比較容易判斷其相似之處,甚至可以很容易地確定為同一個人;但是,使用計算機基於低層視覺特徵進行分析,卻難以判斷兩個頭像的相似之處。
[0004]因此,如何能讓用戶在搜索的時候,結合計算機無法識別的人類認知信息,是一個重要的問題。
[0005]2、跨類型多媒體搜索。我們經常需要通過一種多媒體類型搜索其他類型的多媒體文件。比如,當我們聽到一首歌,很好聽,但是不知道唱的人長什麼樣,能夠在搜尋引擎裡面上傳這首歌,就可以返回歌手的頭像呢?音頻、圖像、視頻的存儲格式不同,完全無法用傳統的特徵提取方法來進行比對。因此,跨類型搜索是一個重要的需求,但也是目前面臨的重要研究問題。
[0006]針對以上問題,現有技術進行了折中,主要有如下幾種:
[0007]1、用輸入文本的方法進行搜索。該方法已經在商用搜尋引擎中廣泛應用,用戶輸入關鍵字,搜尋引擎返回相應多媒體,其原理是搜索該多媒體所在的網頁裡面是否有相應的文本和關鍵字相匹配。例如,在傳統的搜尋引擎中,在文本框中輸入「劉德華」,能夠搜索相應的圖片,當然也可以搜索視頻。其原理實際上是因為在該圖片或視頻的周圍,存在「劉德華」這樣的文字。
[0008]該方法存在如下幾個問題:
[0009](I)如果多媒體所在的網頁沒有相關文字,該圖片不會顯示。實際上,目前大量的搜索都存在這樣的問題。比如,商標搜索、純多媒體庫搜索等等,多媒體周圍是沒有文字的。輸入關鍵字(「如劉德華」),由於該多媒體文件並不在網頁中,並沒有配相應的文字信息,因此無法被搜索出來。
[0010](2)網頁中的文字各種各樣,比如含有「劉德華」圖片的一個網頁,裡面可能含有各種各樣的無關信息,因此,搜索速度較慢,可能造成噪音。
[0011](3)如果多媒體文件被拷貝到別的地方,離開含有該文字的網頁,這個多媒體文件不會被搜索出來。
[0012]2、用輸入多媒體數據的方法進行搜索。該方法也已經在商用搜尋引擎中廣泛應用,比如用戶上傳一個圖片,搜尋引擎返回相應圖片,其原理是先提取圖片的視覺特徵,和資料庫中的圖片的視覺特徵相比對。比如上傳葛優照片,獲得葛優的其他照片。[0013]該方法存在如下幾個問題:
[0014](I)忽略了用戶的個人理解。人類認為類似的多媒體(如圖片),用純粹的視覺特徵匹配,卻無法判斷為類似。
[0015](2)無法支持跨類型搜索。音頻、圖像、視頻的存儲格式不同,完全無法用傳統的特徵提取方法來進行比對。
[0016]3、基於語義的搜索。語義搜尋引擎的核心是「語義標註」,也就是在多媒體周圍提供關鍵字的標註。在查詢時,輸入關鍵字,然後查詢相應的標註,標註和多媒體數據分別存儲。目前,語義標註的成果已經成熟。已經廣泛地使用在語義搜尋引擎中。但是,該類方法存在如下問題:
[0017]目前的語義描述策略,基本上是將多媒體的語義標註用相應方法(如對象本體方法)進行描述,存儲在伺服器的知識庫中,當匹配需求到達時,在知識庫中進行查找、匹配和檢索;但是,一幅多媒體在其生命周期中,可能會不斷經過複製、移動等操作,由於多媒體本身的數據和其語義標註信息分開保存,在這種情況下,如果多媒體離開知識庫,在識別時就無法利用其語義標註信息;對於離開知識庫的多媒體,必須重建其語義才能充分利用人類視覺認知機理的優勢。
[0018]站在這個角度,在多媒體語義特徵描述和存儲上,我們考慮到目前的主要方法是將語義特徵存放在知識庫中,與多媒體本身數據存儲割裂開來,這類方法在某種程度上忽略了多媒體語義特徵的特殊性。從識別的角度講,語義特徵和顏色、形狀、紋理等低層視覺特徵是平等的,其最終目的是為了在多媒體複製、移動等任何操作情況下都能夠進行識別;因此,如果只是將語義標註信息存放在知識庫中,和多媒體數據本身分割,語義多媒體的檢索就必須依賴知識庫。對於融合人類視覺認知的目標特徵提取和描述方法,不僅需要規範語義的特徵表達,更重要的問題是讓語義標註信息實現方便的存儲,讓用戶在使用時更加通用。

【發明內容】

[0019]為解決以上問題,本發明提出了一種支持跨類型語義搜索的多媒體存儲與搜索方法。
[0020]本發明的技術方案如下:
[0021]一種支持跨類型語義搜索的多媒體存儲與搜索方法,包括以下步驟:
[0022](I)用戶語義標註步驟,每一個需要保存到資料庫中的多媒體文件都必須被用戶標註;標註以文本的形式進行,標註內容依據用戶對該多媒體的理解;
[0023](2)本體表達步驟:對標註進行分類,並劃分層級,進行本體表達;將標註轉換為本體;
[0024](3)數據合併步驟:將語義信息和本體內容保存在一起,形成新的多媒體數據格式;新的數據形成之後,多媒體文件將會被保存到多媒體資料庫中;
[0025](4)多媒體檢索步驟:搜尋引擎從該多媒體文件中提取語義信息,和多媒體資料庫中的多媒體數據進行比對,如果找到互相匹配的,則返回這些多媒體文件;系統還會讓用戶對自己選定的結果進行進一步標註,來豐富多媒體的語義信息,使得以後的查詢越來越準確。[0026]所述的方法,所述用戶語義標註步驟中:用戶向多媒體文件提供標註,所有的標註用文本形式表示;定義m為多媒體文件,C為多媒體文件集合,滿足C = Im1, m2,...,mN},N為多媒體文件個數;對於任意11 e C,ffli保存在伺服器硬碟上,Hii的路徑被保存在資料庫中,連結到其真實的文件;語義信息由用戶提供,以關鍵詞標註的形式提供給Hli ;
[0027]令Anmi為Hii的標註集合,滿足Anmi = {a1; a2,..., aj , η為Hii的標註個數,對於任意的Hii e C,用戶將會提供很多標註;對於任意的Hii e C,定義標註矩陣Ami:
【權利要求】
1.一種支持跨類型語義搜索的多媒體存儲與搜索方法,其特徵在於,包括以下步驟: (1)用戶語義標註步驟,每一個需要保存到資料庫中的多媒體文件都必須被用戶標註;標註以文本的形式進行,標註內容依據用戶對該多媒體的理解; (2)本體表達步驟:對標註進行分類,並劃分層級,進行本體表達;將標註轉換為本體; (3)數據合併步驟:將語義信息和本體內容保存在一起,形成新的多媒體數據格式;新的數據形成之後,多媒體文件將會被保存到多媒體資料庫中; (4)多媒體檢索步驟:搜尋引擎從該多媒體文件中提取語義信息,和多媒體資料庫中的多媒體數據進行比對,如果找到互相匹配的,則返回這些多媒體文件;系統還會讓用戶對自己選定的結果進行進一步標註,來豐富多媒體的語義信息,使得以後的查詢越來越準確。
2.根據權利要求1所述的方法,其特徵在於,所述用戶語義標註步驟中:用戶向多媒體文件提供標註,所有的標註用文本形式表示;定義m為多媒體文件,C為多媒體文件集合,滿足C = Im1, m2,...,!%}, N為多媒體文件個數;對於任意Hii e CjHii保存在伺服器硬碟上,Hii的路徑被保存在資料庫中,連結到其真實的文件;語義信息由用戶提供,以關鍵詞標註的形式提供給Hli ; 令Anmi為Iiii的標註集合,滿足Anmi = Ia1, a2,..., aj , η為Iiii的標註個數,對於任意的Hii e C,用戶將會提供很多標註;對於任意的Hii e C,定義標註矩陣Ami:
3.根據權利要求2所述的方法,其特徵在於,所述用戶語義標註步驟中,還包括以下步驟: (1)去除較少使用的標註: 定期去除那些很少在搜索中使用的標註;在每一次檢索過後,設計一個權重調整準則:
4.根據權利要求2所述的方法,其特徵在於,所述數據合併步驟中,直接將多媒體語義信息保存在多媒 體數據文件的頭部。
【文檔編號】G06F17/27GK103440284SQ201310352286
【公開日】2013年12月11日 申請日期:2013年8月14日 優先權日:2013年8月14日
【發明者】郭克華, 鄺礫, 王建新 申請人:郭克華

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀