新四季網

一種微博輿情風險研判的方法與流程

2023-05-30 03:04:41


本發明涉及數據挖掘技術領域,尤其涉及一種微博輿情風險研判的方法。



背景技術:

在日常生活中,突然事件頻繁發生,用戶越來越習慣於利用社交網絡(例如微博、論壇、twitter、facebook等)來發明自己的觀點或情感。在某個事件發生後,廣大群眾會通過各種途徑了解到真相,隨之而來的是大量的評論,這些評論中包括支持與反對,理性與感性,熱情或冷漠,當評論中某一種評論或者某幾種評論佔據較大的比例後,這一種或幾種評論會成對大眾的觀點具有導向作用,甚至可以讓整個事件的走向起到重要作用。負面輿論在網上發酵連帶引發的危機和事故就是輿情風險,網際網路高度發達的今天,微博已經成為一種至關重要的社交平臺,大多數人對網上的信息缺乏客觀的判斷能力,常以先入為主的心態看待事物,因此,對於輿情的分析非常重要,輿情風險一旦出現,在短期內,將會把輿情的中心人物或者企業推向風口浪尖,會對中心人物或企業產生非常不利的影響,因此,對於微博輿情風險的研判是對避免輿情風險發生具有決定性的作用。現有的微博輿情風險研判的方法不具有及時性,且容易將風險較低的信息漏掉,跟進不及時的缺點,導致無法對微博輿情風險進行準確研判。



技術實現要素:

本發明的目的在於:為解決現有方法無法準確對微博輿情風險進行研判的問題,本發明提供一種微博輿情風險研判的方法。

本發明的具體內容如下:

一種微博輿情風險研判的方法,所述方法先通過爬蟲採集大量微博數據,再先後通過敏感話題的識別、情感模型、影響力模型、傳播模型的分析,根據這幾個模型的輸出情況,決定是否預警或者是進入下一個模型進行分析。

具體地,包括如下步驟:

s1:提取源信息話題關鍵字,若涉及敏感話題則發出預警,若不涉及敏感話題,則進入情感模型進行分析。

s2:通過情感模型對信息進行情感分析,若為非負面情緒,則結束流程;若負面程度高則發出預警;若負面程度不高,則進入影響力模型進行分析。

s3:影響力模型首先會判斷該信息的作者是否在維護的名單中,如果在則立即預警,否則將會進行影響力分析;進入影響力分析後,如果輸出的影響力值大於或等於預先設定的閾值,則立即預警,否則將會進入傳播模型進行分析。

s4:傳播模型首先會判斷該信息已有的轉發參與者中是否有大v用戶,如果有則立即預警,否則會進行傳播加權分析;進行傳播加權分析後得到傳播風險值,如果輸出的傳播風險值大於預先設定的閾值,則立即預警,否則將會把信息輸入到動態監控池中,動態監控池會對信息進行時效判斷,把當前時間與信息爬取入庫的時間差作為條件進行判斷,在一定時間的短周期內,將該信息重新輸入到傳播模型進行分析;在短周期內,評論與轉發的和的絕對增量超過一定數量則預警:如果超過一定時間沒有觸發預警,則停止對其監控,結束流程。

進一步地,s1中,對於敏感話題的判斷是將源信息的話題關鍵字與提前建立且人工維護的一套詞庫進行判斷。

優選地,所述情緒分析模型為基於循環神經網絡的情感模型,具體包括:訓練數據的準備、語音模型的構造和情感的識別。

具體地,所述訓練數據的準備的具體過程為:從網際網路應用爬取各類用戶的評價數據,如應用商店軟體的評價,電商網站購物的評價,電影的評價等,並把訓練數據分為兩類,負面情感數據和非負面情感數據。

具體地,語言模型的構造以大量文本作為語料,採用無監督方式訓練基於循環神經網絡的語言模型。

具體地,所述情感識別的具體方法為:將輸入文本以字或詞的形式表示,經過訓練好的模型預測,最後得到識別為負面情感和非負面情感的概率,再選擇概率值大的作為最終情感的輸出,其中,負面情緒和非負面情緒的概率加起來為1,負面程度高是指其概率超過0.8以上。

具體地,s3中,影響力分析採用組合量化的方法來量化得出影響力值,影響力=認證佔比*權重*+關注佔比*權重+粉絲佔比*權重+近一周微博發布數量佔比*權限+近一周每條微博平均評論數佔比*權重+近一周每條微博平均轉發數*權重。

具體地,s4中,傳播風險=轉發量佔比*權重*+點讚數佔比*權重+評論數佔比*權重。

具體地,s4中,動態監控池中的具體判斷過程為:如果超過24小時沒有觸發預警,則停止對其監控;在4小時內,每5分鐘作為周期,將該信息重新輸入到傳播模型進行分析;在24小時內,每5分鐘時間內,評論+轉發的絕對增量超過30則預警。

採用本發明的技術方案後,有益效果如下:(1)本發明包含敏感話題的識別、情感模型、影響力模型、傳播模型,充分考慮了每一種情況,經過模型一層一層地深入分析,保障輿情風險高的信息立即預警;(2)設有動態監控池對未報警的信息在有效時間內進行持續跟進,保證了風險較低的信息也不漏掉,避免了風險較低的信息隨著時間的推移風險變大而漏掉的情況;(3)本發明在影響力模型和傳播模型中,均採用了權重的思想,考慮得較為全面,通過自行設置權值,使得數據可以隨著事件的不同而更加靈活,準確性高。

附圖說明

圖1為本發明的流程框圖。

具體實施方式

本說明書中公開的所有特徵,除了互相排斥的特徵和/或步驟以外,均可以以任何方式組合。

下面結合附圖對本發明作詳細說明。

一種微博輿情風險研判的方法,先通過爬蟲採集大量微博數據,再先後通過敏感話題的識別、情感模型、影響力模型、傳播模型的分析,根據這幾個模型的輸出情況,決定是否預警或者是進入下一個模型進行分析。包括如下步驟:

s1:提取源信息話題關鍵字,將源信息的話題關鍵字與提前建立且人工維護的一套詞庫進行判斷,若涉及敏感話題則發出預警,若不涉及敏感話題,則進入情感模型進行分析。

s2:通過情感模型對信息進行情感分析,若為非負面情緒,則結束流程;若負面程度高則發出預警;若負面程度不高,則進入影響力模型進行分析;情緒分析模型為基於循環神經網絡的情感模型,具體包括:訓練數據的準備,即從網際網路應用爬取各類用戶的評價數據,如應用商店軟體的評價,電商網站購物的評價,電影的評價等,並把訓練數據分為兩類,負面情感數據和非負面情感數據;還包括語言模型的構造,即以大量文本作為語料,採用無監督方式訓練基於循環神經網絡的語言模型;還包括情感的識別,即將輸入文本以字或詞的形式表示,經過訓練好的模型預測,最後得到識別為負面情感和非負面情感的概率,再選擇概率值大的作為最終情感的輸出,其中,負面情緒和非負面情緒的概率加起來為1,負面程度高是指其概率超過0.8以上。

s3:影響力模型首先會判斷該信息的作者是否在維護的名單中,如果在則立即預警,否則將會進行影響力分析;進入影響力分析後,具體地,影響力分析採用組合量化的方法來量化得出影響力值:影響力=認證佔比*權重*+關注佔比*權重+粉絲佔比*權重+近一周微博發布數量佔比*權限+近一周每條微博平均評論數佔比*權重+近一周每條微博平均轉發數*權重,具體的權重值如表1所示,如果輸出的影響力值大於或等於預先設定閾值,則立即預警,否則將會進入傳播模型進行分析。

表1

s4:傳播模型首先會判斷該信息已有的轉發參與者中是否有大v用戶,如果有則立即預警,否則會進行傳播加權分析;進行傳播加權分析後得到傳播風險值,傳播風險=轉發量佔比*權重*+點讚數佔比*權重+評論數佔比*權重,其中具體的權重值如表2所示。

如果輸出的傳播風險值大於預先設定的閾值,則立即預警,否則將會把信息輸入到動態監控池中;然後動態監控池會對信息進行時效判斷,把當前時間與信息爬取入庫的時間差作為條件進行判斷,如果超過24小時沒有觸發預警,則停止對其監控;在4小時內,每5分鐘作為周期,將該信息重新輸入到傳播模型進行分析;在24小時內,每5分鐘時間內,評論+轉發的絕對增量超過30則預警。

表2

本發明不局限於上述具體實施例,應當理解,本領域的普通技術人員無需創造性勞動就可以根據本發明的構思做出諸多修改和變化。總之,凡本技術領域中技術人員依本發明的構思在現有技術的基礎上通過邏輯分析、推理或者有限的實驗可以得到的技術方案,皆應在由權利要求書所確定的保護範圍內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀