新四季網

基於微博和模糊認知圖的自殺風險檢測方法及系統與流程

2023-05-09 06:56:31 3


本發明涉及數據分析技術領域,具體涉及一種基於微博和模糊認知圖的自殺風險檢測方法及系統。



背景技術:

自殺作為日益嚴重的公眾健康問題,給個人、家庭和全社會帶來了長久的危害。近年來,社會的快速發展和人們的適應能力之間的矛盾日益加深,自殺率也隨之加劇。因此,在自殺意念形成的早期,及時發現和有效幹預自殺行為的發生,將其扼殺在萌芽狀態,是極有必要的。

當前,越來越多的人們習慣於通過社交媒體來記錄個人生活、抒發個人情感,鑑於微博的平等性、自由性、碎片化,以及在用戶中的廣泛使用,發明人在實施本發明的過程中發現,通過分析用戶在該平臺中的發布內容和發布行為,能夠觸碰到用戶真實的內心世界。與傳統的心理學、生理學和生物學信號等方式相比,通過社交媒體檢測和度量自殺行為具有實時、覆蓋大面積人群和低成本等優勢。

壓力是自殺意念的關鍵預測因子。所謂壓力,是指一種因生活中的各種刺激性壓力事件和內在需求所引發的困惑和緊張的心理狀態,主要表現為身心緊張和不適。過度的壓力會壓縮個體體驗情感和處理信息的能力。也就是說,當壓力過大時,個體的信息處理能力和化解矛盾的能力將會降低,從而簡化了決策處理能力,並產生非此即彼、絕對化的情感體驗。當某個個體在負性生活事件的作用下感受到壓力時,他(她)的易感體質將被觸發,容易產生如壓抑、焦慮、憤怒、悲傷和絕望等嚴重的負面情感反應。這些持續的創傷會讓個體變得更加易感、響應能力受損,導致低下的降壓能力,產生強烈的自殺意念。

壓力導致了負面情緒和情感變化的波動、反覆和持久。因此,深入了解潛在的壓力源、判斷個體的壓力水平,為我們判斷該個體是否處於極端行為的風險中提供了另一個有效途徑。這是與現有工作的根本不同之處。因此,如何從壓力的角度進行基於微博的自殺風險檢測,成為亟待解決的技術問題。



技術實現要素:

針對現有技術中的缺陷,本發明實施例提供一種基於微博和模糊認知圖的自殺風險檢測方法及系統。

一方面,本發明實施例提出一種基於微博和模糊認知圖的自殺風險檢測方法,包括:

s1、從微博獲取待檢測用戶的壓力特徵向量fs、自我關注特徵向量fc、自殺相關表達特徵向量fu、遺言特徵向量fw、社交互動特徵向量fo和情感特徵向量fe,並利用所述壓力特徵向量fs、自我關注特徵向量fc、自殺相關表達特徵向量fu、遺言特徵向量fw、社交互動特徵向量fo和情感特徵向量fe構建六維微博特徵空間;

s2、將所述六維微博特徵空間輸入預設的用於自殺危險檢測的fcm分類模型,得到所述待檢測用戶的自殺風險檢測結果。

可選地,所述壓力特徵向量fs=(fs1,fs2,fs3,fs4,fs5,fs6),令δ為在所述待檢測用戶整個發布微博期間,檢測到的一組不連續的壓力區間,假設i∈δ為其中一個壓力區間,其中,i=[t1,tm],且(t1,sc1,sl1),(t2,sc2,sl2),…,(tm,scm,slm)是一個從壓力區間i所包含的標準時間單元t1,t2,…,tm中,檢測得到的壓力序列,sci為標準時間單元ti內所述待檢測用戶發布的微博推文輸入壓力檢測函數得到的壓力檢測結果中的壓力類型的併集,sli為標準時間單元ti內所述待檢測用戶發布的微博推文輸入壓力檢測函數得到的壓力檢測結果中的壓力程度的平均值,1≤i≤m,壓力區間總數fs1=|δ|,平均壓力程度的均值壓力程度均方根偏差的均值壓力程度峰值的均值peaklevel(l)=max(sl1,…,slm),壓力區間跨度的均值span(i)=|i|=m,不同壓力類型數量的均值categorynum(i)=|sc1∪sc2∪…∪scm|。

可選地,所述自我關注特徵向量fc=(fc1,fc2),自我關注推文在全部推文中的比例.fc1=|cb|/|b|,平均每條自我關注推文中的自我關注詞數量b表示在所述待檢測用戶整個微博發布期間發布的所有推文的集合,|b|表示在所述待檢測用戶整個微博發布期間發布的所有推文的數量,cb表示在所述待檢測用戶整個微博發布期間發布的所有自我關注推文的集合,|cb|表示在所述待檢測用戶整個微博發布期間發布的所有自我關注推文的數量,函數selfwordnum(cb)返回cb中自我關注推文cb中的自我關注詞的數量。

可選地,所述自殺相關表達特徵向量fu=(fu1,fu2,fu3),自殺推文在全部推文中的比例fu1=|sb|/|b|,平均每條自殺推文中的自殺相關詞數量平均每條自殺推文中自殺相關詞的比例,fu3=(∑sb∈sbswordnum(sb)/wordnum(sb))/|sb|,sb表示在所述待檢測用戶整個微博發布期間發布的所有自殺推文的集合,|sb|表示在所述待檢測用戶整個微博發布期間發布的所有自殺推文的數量,swordnum(sb)返回值為,sb中自殺推文sb中與自殺相關的詞和短語的數量,函數wordnum(sb)的返回值為,sb中自殺推文sb中的詞語總數。

可選地,所述遺言特徵向量fw=(fw1,fw2,fw3),遺言推文在最後一周內全部推文中的比例fw1=|lb|/|b'|,平均每條遺言推文中的遺言詞數量平均每條遺言推文中的遺言詞比例fw3=(∑lb∈lblwordnum(lb)/wordnum(lb))/|lb|,b'和lb分別表示所述待檢測用戶最近一周內發布的所有推文和遺言推文的集合,|b'|和|lb|分別表示所述待檢測用戶最近一周內發布的所有推文和遺言推文的數量,函數wordnum(lb)的返回值為lb中遺言推文lb中的詞語總數,函數lwordnum(lb)的返回值為lb中遺言推文lb中遺言詞的總數。

可選地,所述社交互動特徵向量fo=(fo1,fo2,fo3),@-mention交互推文在全部推文中的比例fo1=|mb|/|b|,@-reply交互推文在全部推文中的比例.fo2=|ab|/|b|,轉發交互推文在全部推文中的比例.fo3=|fb|/|b|,mb、ab和fb各表示,在微博發布期間,所述待檢測用戶通過@-mention、@-reply和推文轉發機制發布的交互推文的集合,|mb|、|ab|和|fb|各表示,在微博發布期間,所述待檢測用戶通過@-mention、@-reply和推文轉發機制發布的交互推文的數量。

可選地,所述情感特徵向量fe=(fe1,fe2,fe3),情感積累fe1是指在所述待檢測用戶最近發布的l條微博推文中,各個情感強度的累計值,情感協變度fe2主要用於度量不同情感類別之間的銜接度,情感轉移fe3用於描述情感變化的模式,l為正整數。

可選地,所述fcm分類模型涉及的概念節點包括特徵節點和類別節點,所述特徵節點的值分別取所述六維微博特徵空間中的各個元素的值,所述類別節點的值表示最終的檢測結果,包括自殺和不自殺,其中,

所述s2,包括:

s20、利用激活函數將所述特徵節點的值限定在[0,1]範圍內,所述激活函數f(gi)=1/1+e-c·(gi-mi)·ti,其中,gi表示第i個特徵節點的值,mi表示第i個特徵節點的值域範圍裡的中值,ti=rmax/ri,ri為第i個特徵節點的值域範圍裡,最大值和最小值之間的差值,rmax為p個特徵節點的r1,…,rp之中的最大值,p為所述特徵節點的數量,參數c為sigmoid函數曲線的斜率;

s21、將步驟s20得到的各個特徵節點的值輸入所述fcm分類模型,並根據所述類別節點輸出的值確定所述待檢測用戶的自殺風險檢測結果。

另一方面,本發明實施例一種基於微博和模糊認知圖的自殺風險檢測系統,包括:

構建單元,用於從微博獲取待檢測用戶的壓力特徵向量fs、自我關注特徵向量fc、自殺相關表達特徵向量fu、遺言特徵向量fw、社交互動特徵向量fo和情感特徵向量fe,並利用所述壓力特徵向量fs、自我關注特徵向量fc、自殺相關表達特徵向量fu、遺言特徵向量fw、社交互動特徵向量fo和情感特徵向量fe構建六維微博特徵空間;

輸入單元,用於將所述六維微博特徵空間輸入預設的用於自殺危險檢測的fcm分類模型,得到所述待檢測用戶的自殺風險檢測結果。

本發明實施例提出的基於微博和模糊認知圖的自殺風險檢測方法及系統,將壓力引入了微博中的自殺風險分析,利用六維微博特徵空間,包括整個發微博期間的壓力特徵向量、自我關注特徵向量、自殺相關表達特徵向量、遺言特徵向量、社交互動特徵向量和情感特徵向量,通過將所述六維微博特徵空間輸入用於自殺危險檢測的fcm分類模型,對用戶的自殺風險進行檢測,能夠從壓力的角度進行基於微博的自殺風險檢測,進而提高自殺風險檢測的準確性。

附圖說明

圖1為本發明一種基於微博和模糊認知圖的自殺風險檢測方法一實施例的流程示意圖;

圖2為本發明一種基於微博和模糊認知圖的自殺風險檢測系統一實施例的結構示意圖。

具體實施方式

為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。

參看圖1,本實施例公開一種基於微博和模糊認知圖的自殺風險檢測方法,包括:

s1、從微博獲取待檢測用戶的壓力特徵向量fs、自我關注特徵向量fc、自殺相關表達特徵向量fu、遺言特徵向量fw、社交互動特徵向量fo和情感特徵向量fe,並利用所述壓力特徵向量fs、自我關注特徵向量fc、自殺相關表達特徵向量fu、遺言特徵向量fw、社交互動特徵向量fo和情感特徵向量fe構建六維微博特徵空間;

s2、將所述六維微博特徵空間輸入預設的用於自殺危險檢測的fcm分類模型,得到所述待檢測用戶的自殺風險檢測結果。

本實施例提出的基於微博和模糊認知圖的自殺風險檢測方法,將壓力引入了微博中的自殺風險分析,利用六維微博特徵空間,包括整個發微博期間的壓力特徵向量、自我關注特徵向量、自殺相關表達特徵向量、遺言特徵向量、社交互動特徵向量和情感特徵向量,通過將所述六維微博特徵空間輸入用於自殺危險檢測的fcm分類模型,對用戶的自殺風險進行檢測,能夠從壓力的角度進行基於微博的自殺風險檢測,進而提高自殺風險檢測的準確性。

下面對本方案進行詳細說明。

微博特徵空間的好壞對自殺風險識別有著重要的影響。本發明提出了六維微博特徵空間(fs,fc,fu,fw,fo,fe),來表示用戶在整個發微博期間的壓力、自我關注、自殺相關表達、遺言、社交互動和情感特徵。

1.壓力特徵向量fs

心理學研究表明,長期壓力是自殺風險的良好預測因子之一。本發明用「壓力區間」來度量用戶的長期壓力。

1.1壓力時刻

已有的研究工作已經證實,在微博平臺(例如twitter、騰訊微博和新浪微博)上檢測用戶壓力的可行性。令(t,b)表示在時刻t發布的微博推文b。壓力檢測函數stress(t,b)=(t,sc,sl)用於檢測每一條微博推文,推文中的發布內容(文本語義、表情符、多次出現的感嘆號或問號、共享音樂/圖片類型),發布推文的時間和頻率,以及與朋友之間的社交互動(發布在推文下的喜歡/轉發/關注和評論回復行為)。該函數的返回值為,從微博推文b中檢測得到的壓力類型和壓力程度其中,category={``study",``family",``inter-personnel",``self-cognition",``affection",``health",``finance",``profession",``unknown"},分別表示學習、家庭、人際關係、自我認知、情感、健康、財務、職業和未知九種壓力類型;level={0,1,2,3,4,5},分別對應於無壓力、低弱壓力、弱壓力、中壓力、強壓力、高強壓力六種級別的壓力程度。若且唯若該函數從微博推文中檢測到的壓力程度大於零時(即sl>0),b被稱為壓力推文;t被稱為壓力時刻。

1.2壓力區間

與急性壓力相比,長期的、反覆出現的壓力對人們的身心健康有著更嚴重的影響。這種長期存在的壓力會釋放持續高強度的化學物質,從而影響個體對事物的應對能力,產生自殺意念。因此,在確定了壓力時刻後,需要在其基礎上,找出壓力持續的時間間隔。

然而,以壓力時刻為基礎確定壓力區間,並不是一件容易的任務,這主要面臨兩個挑戰。一方面,微博推文被限定在140個字符之內,因為受字數的限制,用戶很難在這麼少的字數中,清晰、透徹地表達他們所經歷的壓力狀態。因而,從有限長度的微博推文中,準確地感知個體的壓力時刻是具有挑戰性的。另一方面,用戶發布微博推文的行為是相當隨機並且稀疏的,有時他們可能會在一天內發布很多條微博推文,而有時可能好幾天都沒有發布一條推文。例如,在某個自殺案例中,因為學習壓力過大,某大學生在自殺行為實施的當天,在新浪微博平臺上,連續發布了18條高強度壓力的推文。並且,該大學生在一年內總共發布有200條推文,其中約有100條推文是在他實施自殺前的一個月內發布的。這種引發數據缺失的不對稱推文發布行為和需要進一步聚合的需求,對壓力區間的檢測來說,是一項挑戰。

為了對缺失的或誤判的壓力時刻進行修正,我們假設,在壓力區間內,壓力時刻出現的頻率,要大於在非壓力區間內,壓力時刻出現的頻率。也就是說,壓力區間裡發布壓力推文的比例,大於非壓力區間裡發布壓力推文的比例。因此,在檢測壓力區間時,以某個基本的時間段為準,向前或向後依次進行檢測,直到確定了某個符合要求的連續時間段為止。

1.3將瞬時壓力聚合到標準時間單元

為了公平的度量每一個用戶的發微博頻率,我們首先在時間單元上進行了標準化(時間單元可以是天、周或月。在本研究中,主要以天為單元)。對於在同一個時間單元(天)內發布的微博,我們將檢測到的壓力結果進行聚合。聚合方式為,將同一天檢測到的壓力微博,其壓力程度求平均值,其壓力類型做併集運算。

假設某個用戶在時刻t1,t2,…,tn,分別發布了n條連續的微博推文(t1,b1),(t2,b2),…,(tn,bn),(其中,t1<t2<…<tn)。通過壓力檢測函數stress(ti,bi)=(ti,sci,sli)(其中,1≤i≤n),可以得到(t1,sc1,sl1),(t2,sc2,sl2),…,(tn,scn,sln)條壓力檢測結果。對於在同一個時間單元t(天)發布的微博推文(tj,bj),…,(tj+k,bj+k)(其中,t1<tj<tj+k<tn),我們將檢測到的多個壓力結果聚合為一個結果(t,sc,sl)(其中,sc=scj∪…∪scj+k,且

令(t1,sc1,sl1),(t2,sc2,sl2),…,(tm,scm,slm)為在一組連續的標準時間單元t1,t2,…,tm中檢測到的壓力序列(其中,t1<t2<…0時,我們將ti定義為壓力時間單元。

1.4壓力區間的定義

定義:令i=[t1,tm]為一段時間間隔,起始點位於時間單元t1,終止點位於時間單元tm(tm≥t1)。i的時間長度為,在時間間隔i中的時間單元個數,表示為|i|=m。令(t1,sc1,sl1),(t2,sc2,sl2),…,(tm,scm,slm)為一個,從時間間隔i內包含的標準時間單元t1,t2,…,tm中,檢測到的連續的壓力序列。則若且唯若時間間隔i滿足以下三個條件時,i被稱為壓力區間:

(1)當時間長度不小於閾值δ時,即,|i|=m≥δ;

(2)當時間間隔i中的壓力時間單元所佔比例不小於閾值τ時,即

|{ti|(1≤i≤m)∧(sli>0)}|/|i|≥τ;

(3)不存在更長的時間間隔i'=[t1',tm'],使得i'=[t1',tm']包含i=[t1,tm]在內,即(t1'≤t10)}|/|i'|≥τ,(t1',sc1',sl1'),(t2',sc2',sl2'),…,(tm',scm',slm')為一個,從時間間隔i'內包含的標準時間單元t1',t2',…,tm'中,檢測到的連續的壓力序列。

鑑於對閾值δ和τ進行的比較實驗的結果,在本研究中,δ=7天,τ=80%。

根據定義可知,壓力區間中的壓力比非壓力區間中的壓力密度更大、更集中。

1.5壓力區間的特徵

多數情況下,具有自殺想法的用戶會同時或連續地承受不同的心理壓力,並且他們面對這些壓力時的反應也會不同,或強烈或消沉。在某些時期,他們對壓力的感受會比較強烈,波動會比較劇烈;但在另外一些時期,壓力感受的變化又會比較平緩。一些自殺案例中,在用戶自殺行為實施之前的某段時間,隨著用戶自殺意念的增加,其壓力值會達到整個發微博期間的最高值。因此,在整個用戶發布推文期間,感知到的不同壓力區間代表著用戶對壓力的不同回應。

圍繞著壓力區間,針對微博中的自殺危險檢測,我們在壓力特徵向量fs中,主要考慮了六種特徵,即fs=(fs1,fs2,fs3,fs4,fs5,fs6)。這些特徵刻畫了用戶所經歷的長期壓力的劇烈程度。

令δ為在用戶整個發布微博期間,檢測到的一組不連續的壓力區間。假設i∈δ為其中一個壓力區間,其中,i=[t1,tm],且(t1,sc1,sl1),(t2,sc2,sl2),…,(tm,scm,slm)是一個從壓力區間i所包含的標準時間單元t1,t2,…,tm中,檢測得到的壓力序列。

(1)壓力區間總數.fs1=|δ|;

(2)平均壓力程度的均值.

函數meanlevel(i)返回在壓力區間i內,所有壓力程度的平均值。它反映了用戶在整個壓力區間i內,所經歷的平均壓力水平。這是一種相對適度的,用來分辨用戶在給定時間段內,所承受的壓力水平的方法。

(3)壓力程度均方根偏差的均值.

函數deviate(i)計算的是,壓力區間i中,各個壓力程度之間的均方根偏差。該特徵用於描述用戶在壓力區間i內,所承受的壓力的波動水平和變化程度。

(4)壓力程度峰值的均值.

函數peaklevel(i)表示的是用戶在壓力區間i中,承受的最大壓力值。

peaklevel(l)=max(sl1,…,slm)。

(5)壓力區間跨度的均值.

函數span(i)返回的是,壓力區間i持續的時間跨度。它表示了用戶在這一階段承受的壓力的時長,時長越長,用戶感受到的壓力越強烈。span(i)=|i|=m。

(6)不同壓力類型數量的均值.

函數categorynum(i)返回的是,用戶在壓力區間i內,所經歷的不同壓力類型的數量。同一時期承受過多不同類型的壓力,會對用戶帶來心理和生理健康方面的嚴重傷害,從而容易引起精神崩潰。categorynum(i)=|sc1∪sc2∪…∪scm|。

自殺用戶比非自殺用戶承受著更強烈、更頻繁和波動更劇烈的壓力。因此,使用這些特徵,作為通過微博進行自殺危險檢測的有效因子是合理的。

2.自我關注特徵向量fc

自我指代詞的使用頻率,隱含著用戶在社交網絡中的自我關注程度。使用頻率越多,則表示越高的自我關注度。自殺者比非自殺者的自我關注程度更高,並且在他們的遺書中,使用了更多的第一人稱代詞(例如「我」、「我的」、「我們」、「自己」等)。這種現象也同樣反映在用戶的微博中。

在本研究中,我們從用戶的微博中,提取了所有與自我關注相關的詞語,包括「我」、「我的」、「我們」、「自己」、「俺」、「老子」等。如果一條微博推文中,包含一個或多個自我指代詞,則我們稱之為自我關注推文。令cb表示在整個微博發布期間的一組自我關注推文,函數selfwordnum(cb)返回其中某條自我關注推文(cb∈cb)中的自我關注詞的數量。我們使用以下兩個指標,來表徵微博中的自我關注特徵向量fc=(fc1,fc2)。

(1)自我關注推文在全部推文中的比例.fc1=|cb|/|b|

(2)平均每條自我關注推文中的自我關注詞數量.

3.自殺相關表達特徵向量fu

自殺相關表達也是用於自殺意念觀察的重要指標之一。自殺者比較傾向於在他們的微博中表達絕望的自殺感受,而不是壓抑這些感受。表1給出了從新浪微博摘取的一些真實的自殺案例微博,其中包含有自殺相關詞和短語。

表1新浪微博中的自殺相關詞舉例

為了從微博中識別出用戶的自殺相關表達,我們採用了已有的"中國社交媒體自殺字典"作為依據。該詞典列出了2167個自殺相關的單詞和短語,並將這些詞歸為5大類(即自殺想法,自我傷害,身體和精神狀況,生活事件和情境情緒),這些類別分別從不同的角度對自殺意念進行了衡量。此外,每個類別中的單詞和短語都被分配了權重值(從1到3),以標記這些詞與自殺風險之間的相關度,權重越高,相關度越高。表2示例了該字典中的一小部分。

表2中國社交媒體自殺字典部分示例

如果有一條微博推文中,包含了自殺詞典中的詞組或短語(例如,表1中用粗體顯示的詞語),則這條微博推文稱為自殺推文。

令b和sb分別表示,整個微博發布期間的所有推文和自殺推文的集合。函數wordnum(sb)的返回值為,某條自殺推文sb中的詞語總數;swordnum(sb)返回值為,sb中與自殺相關的詞和短語的數量,其中(sb∈sb)。我們通過自殺相關表達特徵向量fu=(fu1,fu2,fu3)中的以下三個指標,來評估自殺意念。

(1)自殺推文在全部推文中的比例.fu1=|sb|/|b|;

(2)平均每條自殺推文中的自殺相關詞數量.

(3)平均每條自殺推文中自殺相關詞的比例.

fu3=(∑sb∈sbswordnum(sb)/wordnum(sb))/|sb|。

4.遺言特徵向量fw

除了檢測發文期間的自殺相關表達外,我們還特別關注了自殺用戶在最後一周內發布的遺言。根據人際理論,遺言是自殺意念的最重要的觀測變量之一。

多數情況下,自殺者在實施自殺行為之前,都會留下一些話,傳遞自己複雜的內心感受,如悔恨、內疚、對家人或朋友的寄語,甚至包括如何安排自己的後事等。近年來,一些有自殺想法的人開始在微博上發布遺言,以引起他人的注意。例如,2012年2月12日,在中國福建省,有一位年輕女子失戀,並在微博上留下了一條打算自殺的推文。該消息剛一經發布,就立即得到網友的廣泛關注,他們在微博中傳遞這條消息,並且在這位女子的微博中留言,試圖阻止她的自殺行動。最終,一些熱心的網友找到並及時挽救了這位女子。

表3給出了一些從幾個自殺案例中截取的微博用戶遺言。這些詞(粗體顯示)透露出了強烈的自殺信號,在自殺詞典中被賦予了權重值2和3。

表3新浪微博中的遺言推文示例

由於自殺者一般會在實施自殺的前幾天留下遺言,因此,我們主要針對最近一周發布的微博推文,進行檢測。如果一條微博推文中包含自殺詞典中的遺言詞,則稱這條推文為遺言推文。

令b'和lb分別表示最近一周內發布的所有推文和遺言推文的集合。則函數wordnum(lb)的返回值為遺言推文lb∈lb中的所有詞的總數,函數lwordnum(lb)的返回值為lb中遺言詞的總數。

我們用三個與遺言特徵向量fw=(fw1,fw2,fw3)相關聯的子特徵,來度量自殺風險。

(1)遺言推文在最後一周內全部推文中的比例.fw1=|lb|/|b'|;

(2)平均每條遺言推文中的遺言詞數量.

(3)平均每條遺言推文中的遺言詞比例.fw3=(∑lb∈lblwordnum(lb)/wordnum(lb))/|lb|。

5.社交互動特徵向量fo

在心理學研究中,社交孤立是用於自殺意念判定的一個重要並可靠的觀察變量。一般的,絕望的人所擁有的社交網絡會很薄弱,從而得到的社會支持也會很少。包括mandelli在內的心理學家們指出,脆弱的社交網絡通常與心理障礙、高度抑鬱,以及自殺傾向相關,而這些因素可以間接的反映弱的社會支持度。而當個體經歷了壓力性生活事件後,弱的社會支持度又會不可避免的增加抑鬱和患心理疾病的風險。

隨著微博平臺的廣泛使用,人們習慣於在這個網絡平臺上,與志同道合的同伴分享和交流思想、看法。當個體陷入困境時,如果他/她能夠從家庭、朋友或者同伴那裡獲得理解和支持,那麼,他/她的壓力和隨之而來的負面情緒就會得以抵消,甚至可以避免極端的自殺行為。也就是說,用戶在網絡中的社交互動行為,在某種程度上,映射出用戶的社交孤立程度和社會支持度。

有三種直接的方式可以反映用戶在微博中與他人的交互的情況,即,@-mention、@-reply和推文轉發機制。

如果一條推文至少包含以上三種交互方式中的一種,那麼,我們稱這條推文為交互推文。

令mb、ab和fb各表示,在微博發布期間,通過@-mention、@-reply和推文轉發機製得到的三組交互推文的集合。

我們採用以下三種子特徵,來度量用戶在社交互動特徵向量fo=(fo1,fo2,fo3)中的社交程度。

(1)@-mention交互推文在全部推文中的比例.fo1=|mb|/|b|

(2)@-reply交互推文在全部推文中的比例.fo2=|ab|/|b|

(3)轉發交互推文在全部推文中的比例.fo3=|fb|/|b|

6.情感特徵向量fe

關於情感特徵向量的提取,我們參照了近期發表的一項相關的研究工作。其中,主要考慮了八個情感類別(喜悅、愛、期望、焦慮、悲傷、憤怒、憎恨和驚喜),以這八類情感為基礎,計算了三個累積的情感特徵,即情感積累、情感協變度和情感轉移,作為最近發布的l條微博推文(約1000條)中,用於自殺風險檢測的情感表達的統計。

(1)情感積累fe1

是指在最近發布的l條微博推文中,各個情感強度的累計值,其中,情感強度介於1和5之間。

(2)情感協變度fe2

主要用於度量不同情感類別之間的關聯度,採用spearman關聯繫數計算方法計算,為現有技術,此處不再贅述。

(3)情感轉移fe3

用於描述情感變化的模式,採用情感轉移矩陣計算,其中,所述情感轉移矩陣的行向量表示前一個時間點的情感,列向量表示當前時間點的情感。對10個連續推文的情感轉移矩陣求平均值,作為情感轉移值。在本研究中,l的取值被設置為1000。

我們構建了一個六維微博特徵向量空間(fs,fc,fu,fw,fo,fe),以從微博獲取用戶的壓力特徵、自我關注、自殺相關表達、遺言、社交互動和情感特徵。然而,這些特徵向量在多大程度上能夠用于衡量用戶的自殺風險?為了評估它們和自殺之間的關係,我們構建了一個用於自殺風險檢測的模糊認知圖(fcm)分類模型。

1.模糊認知圖fcm

模糊認知圖(fcm)是一種模糊反饋動態系統,具有強大的模糊推理能力。模糊技術為人類的行為概念和真實數據之間的接口建模提供了一個框架。選擇fcm作為自殺風險檢測的分類模型,是因為其強大的數值推理能力和反饋能力,適用於具有小數據量和不確定主題的文本分類。除了描述特徵和類別之間的因果關係之外,它還描述了類別之間、以及特徵之間的因果關係,可以很好地解釋特徵值之間的聯繫。

fcm主要由概念節點和有向邊組成。每條有向邊都被賦予一個權重值,表示有向邊連接的兩個概念節點之間的因果關係的影響程度。給定一個有向圖d,令c={c1,c2,…,ck}為一組概念節點,分別表示d中的各個頂點。e:(ci,cj)→wij為一組映射,其中,wij∈e,wij表示節點ci對節點cj的因果關係影響程度,ci∈c,cj∈c,e(cxc)=(wij)kxk為有向圖d的連接矩陣。如果有映射函數x:ci→xi,其中xi表示概念節點ci的狀態,設xj(t)為節點cj在時刻t的狀態值,xi(t+1)為節點ci在下一時刻(t+1)的狀態值。則在fcm中,概念節點ci在時刻(t+1)的狀態值的推理規則為:xi(t+1)=f(σkj=1,j≠iwji·xj(t)),其中,f為激活函數,用於將上述公式輸出值映射到[0,1]。

2.用於自殺危險檢測的fcm分類模型

2.1fcm分類模型推理規則

fcm的動態反饋機制為我們提出的fcm分類模型提供了理論基礎。用於自殺風險檢測的fcm分類模型中,包含兩類節點,特徵節點和類別節點。特徵節點分別對應從微博提取出的6維微博特徵,類別節點則表示最終的檢測結果,自殺或不自殺。在分類過程中,特徵節點的屬性值始終保持不變,而類別節點的屬性值則隨著fcm推理過程的進行而不斷變化,直到達到一個收斂狀態。

為了達到更好的分類效果,我們採用了改進的推理規則。在改進的推理規則中,除了考慮其他節點對類別節點的影響之外,還考慮了類別節點自身,在當前時刻的狀態值對下一個時刻的狀態值的影響。設z={z1,z2,…,zp}為一組特徵節點,l={l1,l2,…,lq}為一組類別節點,s:li→si為一映射函數,其中,si表示類別節點li的狀態,則,改進的推理規則表示為:sit+1=f(sit+σpj=1,j≠iwji·sjt),其中,sit為類別節點li在時刻t的狀態值,sjt為特徵節點zi在時刻t的狀態值。

2.2激活函數

從微博中提取的6維微博特徵向量具有不同的值域範圍,無法在同一個領域相互比較。為了使這些在不同值域範圍內的特徵值具有可比較性,需要用激活函數將它們限定在同一個值域範圍內。在fcm分類模型中,我們採用了一種改進的sigmoid函數,作為激活函數。改進的sigmoid函數能夠補償權重之間的差異,使高值域範圍的特徵與低值域範圍的特徵之間具有可比性。

改進的sigmoid函數為:f(gi)=1/1+e-c·(gi-mi)·ti,其中,gi表示第i個特徵節點的值,mi表示第i個特徵節點的值域範圍裡的中值。此外,上式中的ti=rmax/ri,其中,ri為第i個特徵節點的值域範圍裡,最大值和最小值之間的差值,rmax為p個特徵節點的r1,…,rp之中的最大值。參數c用於確定sigmoid函數曲線的斜率。這樣,具有不同值域範圍的特徵就被均勻的分布在[0,1]之間。

2.3目標函數

為了判定分類過程是否達到了穩定狀態,我們在fcm分類模型中,引入誤差反饋機製作為目標函數。通過檢查目標函數的誤差反饋,fcm分類模型可以根據給定的閾值,來判定系統是否達到一個穩定狀態,以終止分類過程。基於誤差反饋機制的目標函數定義如下:error(w)=0.5·σtt=1σqm=1(lm′(t)-lm(t))2。其中,lm'(t)為第m個類別節點,在第t次迭代後的輸出值;lm(t)為第m個類別節點的真實狀態值;t和q則分別表示迭代的次數和類別節點的數量。當目標函數error(w)的值小於一個足夠小的閾值ε時,分類模型收斂至穩定狀態,則算法結束。本研究中,閾值ε被設置為0.01.

2.4連接矩陣的權值學習

fcm分類模型是通過不斷的調整連接矩陣的權值,以使類別節點的值最終接近或者等於其真實值。為了學習連接矩陣的權值,我們採用了改進的遺傳算法。將fcm分類模型的連接矩陣e(cxc)=(wij)kxk,轉換為一個染色體種群wij=wij'。對於給定的染色體種群,需要計算每個個體的適應度。然後,挑選出具有高適應度的個體,做進一步的交叉和變異運算。令fdif=|fitnesshigh-fitnesslow|,其中,fitnesshigh表示種群中,適應度大於該種群個體平均適應度的個體的平均適應度;fitnesslow表示種群中,適應度小於該種群個體平均適應度的個體的平均適應度。則,自適應交叉算子和變異算子可分別定義為:

pci=k1·(1/(1+e-fdif)+0.5),pmi=1-1/(1+ek2·fdif),

其中,pci表示種群的交叉概率,pmi表示種群的變異概率。k1、k2為參數,在本文中取k1=0.8,k2=-80。

我們採用了uniform交叉策略,即,隨機產生一個交叉特徵碼,若交叉特徵碼為0,則後代染色體上的該基因位不變;若交叉特徵碼為1,則互換雙親的基因位,產生後代的基因位。

對於變異,採取的策略則是,在染色體上隨機選擇兩個基因位置x和y,對於第i條染色體,把該染色體上的位置x上的基因位,設為位置y上的基因位,把位置y上的基因位,設置為位置x上的基因位。

參看圖2,本實施例公開一種基於微博和模糊認知圖的自殺風險檢測系統,包括:

構建單元1,用於從微博獲取待檢測用戶的壓力特徵向量fs、自我關注特徵向量fc、自殺相關表達特徵向量fu、遺言特徵向量fw、社交互動特徵向量fo和情感特徵向量fe,並利用所述壓力特徵向量fs、自我關注特徵向量fc、自殺相關表達特徵向量fu、遺言特徵向量fw、社交互動特徵向量fo和情感特徵向量fe構建六維微博特徵空間;

輸入單元2,用於將所述六維微博特徵空間輸入預設的用於自殺危險檢測的fcm分類模型,得到所述待檢測用戶的自殺風險檢測結果。

本實施例提出的基於微博和模糊認知圖的自殺風險檢測系統,將壓力引入了微博中的自殺風險分析,利用六維微博特徵空間,包括整個發微博期間的壓力特徵向量、自我關注特徵向量、自殺相關表達特徵向量、遺言特徵向量、社交互動特徵向量和情感特徵向量,通過將所述六維微博特徵空間輸入用於自殺危險檢測的fcm分類模型,對用戶的自殺風險進行檢測,能夠從壓力的角度進行基於微博的自殺風險檢測,進而提高自殺風險檢測的準確性。

雖然結合附圖描述了本發明的實施方式,但是本領域技術人員可以在不脫離本發明的精神和範圍的情況下做出各種修改和變型,這樣的修改和變型均落入由所附權利要求所限定的範圍之內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀