一種信息檢索自適應數據融合方法
2023-05-13 06:55:46
專利名稱:一種信息檢索自適應數據融合方法
技術領域:
本發明涉及ー種信息檢索方法,尤其是一種自適應數據融合方法。
背景技術:
自適應數據融合方法適合於動態檢索環境,其中數據集或成員信息檢索系統隨時間發生顯著的變化。該方法工作原理如下:假設有一組成員信息檢索系統Ir1, ir2,...,it,對於每一個查詢,每個成員系統都會提供相應的文檔排名列表作為檢索結果。通過ー些數據融合方法將這些排名列表進行融合。同時,假設針對每個查詢,任何成員系統的檢索結果都會立即被評估,從而可以直 接知曉這些系統的檢索效果。對於交互式系統,這是ー種合理的假設。而對於其他類型的系統,仍可以使用某種形式的反饋信息,如可由用戶通過點擊提供,然後大致估計信息檢索系統的性能。自適應數據融合方法的工作方式如下:在開始階段,由於沒有任何成員系統或者結果的相關知識,只能對所有成員系統進行同樣的處理。當處理完第一個查詢,就知道了少量的有關這個查詢的結果(也就是相應的成員檢索系統的性能)。由此,就能為線性組合方法更新權重。當進行第二個、第三個、以至於更多個查詢處理時,就能獲取越來越多的相關知識,並且可採用不同的權重更新方式。在現有的研究中,適用於在動態檢索環境下能自動調整、適應的融合方法不多。文獻[I]中所介紹的兩種方法均是通過線形組合的方法來進行結果的融合。文獻[I]中公開的第一種方法是簡單的性能平方更新法(PSU)。PSU方法和性能指標的平方加權有關,使用公式(I)為每個成員系統更新權重:
權利要求
1.一種信息檢索自適應數據融合方法,其特徵在於包括以下步驟: 第一步,依以下方法計算任意兩個檢索結果(A,B)的差異度.S.1,,.4 SH
全文摘要
本發明公開了一種信息檢索自適應數據融合方法。對一組成員檢索系統Li(1≤i≤t),該方法包括以下步驟1、計算任意兩個檢索系統所對應的結果的差異度;2、依據第一步的結論計算每一個系統Li(1≤i≤t)的差異性權重;3、使用性能平方加權方案計算每個系統的性能權重;4、結合第二步和第三步方法的結論,計算每一個系統的最終權重;5、將第四步計算出的權重應用線性組合方法進行檢索結果融合。本發明的權值更新方法既考慮了各個成員檢索模型的性能,又考慮了各個成員檢索模型之間的差異性;權值更新只需要很少的數據,例如從單個查詢所產生的結果即可。本發明即使在數據量小的情況下也能保證融合結果的有效性,適於信息檢索自適應數據融合。
文檔編號G06F17/30GK103116623SQ201310034799
公開日2013年5月22日 申請日期2013年1月29日 優先權日2013年1月29日
發明者吳勝利 申請人:江蘇大學