一種資訊傳播過程的內容溯源的計算方法與流程
2023-07-05 06:29:16 1
本發明屬於計算方法
技術領域:
,尤其涉及一種資訊傳播過程的內容溯源的計算方法。
背景技術:
:隨著網際網路中文本內容在傳播過程中多次修改和精編,如果對新聞原創的獲取以通過對新聞採集回來的基礎數據進行匹配,會存在原創穫取不準確的問題;這對獲取新聞原創過程中製造了很大麻煩。單獨只是按照時間排序取最早發布的話,會造成獲取到的原創內容既不準確;如果根據採集過來數據對發布媒體及來源媒體進行相同匹配獲取到的原創也不夠精確。因此需要從時間,媒體,新聞被轉載數量等多個維度,不同的權重來判斷原創媒體。以解決獲取原創的不準確性。技術實現要素:本發明所解決的技術問題採用以下技術方案來實現:一種資訊傳播過程的內容溯源的計算方法,具體計算方法如下:第一步;開始獲取遍歷所有數據得到候選原創集;第二步:得到原創矩陣:包括針對每個候選原創集;第三步:計算候選原創權重比得到原創,結束此方法。所述的第二步中候選原創集包括:獲取候選原創媒體類型、獲取候選原創發布時間和獲取原創轉載量。本發明的有益效果為:本發明對媒體傳播溯源有較高的準確性:通過針對一條諮詢採集回來數據進行原創媒體分析,有利於媒體傳播過程中媒體原創點的定位,有利於對負面諮詢,謠言等源發點的定位。針對於原創的匹配獲取可以通過不同的維度及各個維度不同的權重來比對獲取。附圖說明圖1是本發明的流程圖。具體實施方式實施例1、以下結合附圖對本發明做進一步描述:一種資訊傳播過程的內容溯源的計算方法具體計算方法如下:第一步;開始獲取遍歷所有數據得到候選原創集;遍歷所有數據判斷該條諮詢的轉載媒體是否與該候選原創相同,如果相同,該候選原創轉載量+1。第二步:得到原創矩陣:包括針對每個候選原創集;候選原創集包括:獲取候選原創媒體類型、獲取候選原創發布時間和獲取原創轉載量。原創候選矩陣媒體名稱媒體類型發布時間轉載量人民網中央媒體09-1807:00323世界浙商網其他09-1810:1021新華網中央媒體09-1808:21149第三步:計算候選原創權重比得到原創,結束此方法。權重計算方式定義如下:時間權重計算方式:將發布時間轉成UTC秒計算時間平均值.轉載量權重計算方式:通過遍歷所有數據計算出最大轉載量,用候選原創轉載量/最大轉載量,得到的數值則為轉載量的權重值.媒體類型權重計算方式:媒體類型權重則對應不同類型媒體區分重要性,針對每個類型設置固定的權重值,如:中央媒體:0.92省級媒體:0.78其他媒體:0.31本發明對媒體傳播溯源有較高的準確性:通過針對一條諮詢採集回來數據進行原創媒體分析,有利於媒體傳播過程中媒體原創點的定位,有利於對負面諮詢,謠言等源發點的定位。針對於原創的匹配獲取可以通過不同的維度及各個維度不同的權重來比對獲取。利用本發明所述的技術方案,或本領域的技術人員在本發明技術方案的啟發下,設計出類似的技術方案,而達到上述技術效果的,均是落入本發明的保護範圍。當前第1頁1 2 3