一種組合新聞分析基於多篇資訊的內容檢索方法與流程
2023-05-30 03:40:16 2

本發明專利屬於內容檢索領域,尤其涉及一種組合新聞分析基於多篇資訊的內容檢索方法。
背景技術:
隨著網際網路的發展,海量數據在網際網路上傳播,針對某個事件的新聞會通過不同維度來描述。隨著時間的變化,事件本身的焦點也回逐漸轉移。對事件評估也只能夠聚焦到事件傳播過程中的某個焦點,並不能針對整個事件做出評估。組合新聞分析就是針對事件多個焦點,多個維度對採集數據進行分析評估。對相同事件不同焦點的新聞組合到一起進行分析,能夠更好的掌握事件隨時間維度變化的發展動態。
發明專利內容
本發明專利提供一種組合新聞分析基於多篇資訊的內容檢索方法,對新聞事件的評估有較高的準確性:通過對時間傳播不同時段的焦點的相關新聞資訊進行組合,更好的分析出整個事件在網際網路上的傳播過程以及傳播情況。
一種組合新聞分析基於多篇資訊的內容檢索方法,包括步驟一,將多篇資訊url組合到一起;作為要評估的輸入項;步驟二,根據這些url對數據進行召回;首先獲取url對應資訊的md5;根據獲取到的這一批md5進行數據召回;每條url對應資訊最多有十條md5,如果對五個url進行組合評估,就將這五條url的md5都獲取過來,進行召回數據;步驟三,對召回的數據通過歸堆算法進行歸堆;步驟四,將歸堆後新聞進行評估分析,響應給用戶。
附圖說明
圖1為一種組合新聞分析基於多篇資訊的內容檢索方法傳播事件河流數據構圖
圖2為一種組合新聞分析基於多篇資訊的內容檢索方法分析結果系統圖。
具體實施方式
實施例:一種組合新聞分析基於多篇資訊的內容檢索方法,包括步驟一,將多篇資訊url組合到一起;作為要評估的輸入項;步驟二,根據這些url對數據進行召回;首先獲取url對應資訊的md5;根據獲取到的這一批md5進行數據召回;每條url對應資訊最多有十條md5,如果對五個url進行組合評估,就將這五條url的md5都獲取過來,進行召回數據;步驟三,對召回的數據通過歸堆算法進行歸堆;步驟四,將歸堆後新聞進行評估分析,響應給用戶。
儘管已經示出和描述了本發明的實施例,對於本領域的普通技術人員而言,可以理解在不脫離本發明的原理和精神的情況下可以對這些實施例進行多種變化、修改、替換和變型,本發明的範圍由所附權利要求及其等同物限定。
技術特徵:
技術總結
一種組合新聞分析基於多篇資訊的內容檢索方法,其特徵在於:包括步驟一,將多篇資訊url組合到一起;作為要評估的輸入項;步驟二,根據這些url對數據進行召回;首先獲取url對應資訊的md5;根據獲取到的這一批md5進行數據召回;每條url對應資訊最多有十條md5,如果對五個url進行組合評估,就將這五條url的md5都獲取過來,進行召回數據;步驟三,對召回的數據通過歸堆算法進行歸堆;步驟四,將歸堆後新聞進行評估分析,響應給用戶。
技術研發人員:李學良
受保護的技術使用者:天津海量信息技術股份有限公司
技術研發日:2016.10.21
技術公布日:2017.08.18