新四季網

慢性病的風險預測方法及相關設備

2024-04-15 07:39:05



1.本技術的實施例涉及計算機技術與醫療衛生技術領域,尤其涉及一種慢性病的風險預測方法及相關裝置。


背景技術:

2.在相關的慢性病風險的預測中,臨床醫生卻仍然難以針對某一個體、一定時間內的死亡風險給出精確的量化預測,基於現有觀察性隊列研究而採用的統計學等方法,應用於慢性病人群的風險預測時存在諸多局限性。
3.基於此,需要一種能夠精確給出量化的風險預警提示的方案。


技術實現要素:

4.有鑑於此,本技術的目的在於提出一種慢性病的風險預測方法及相關裝置。
5.基於上述目的,本技術提供了慢性病的風險預測方法,包括:
6.利用預置的患者數據的均值和標準差,對所述患者數據進行篩選,並統一所述患者數據的維度,得到初始數據並輸入預置的深度神經網絡;
7.在所述深度神經網絡中,將所述初始數據映射為輸入矩陣,依據為所述輸入矩陣分配的多個係數矩陣,來進行各個特徵頭的自注意力計算操作並輸出,聯合所述各個特徵頭的輸出後進行線性轉換,得到自注意力得分矩陣,對所述輸入矩陣和所述自注意力得分矩陣設置殘差連接操作和層歸一化操作,來構建特徵提取網絡,以將梯度向前傳播並輸出局部特徵信息;
8.在所述深度神經網絡中,設置局部風險預測網絡和全局風險預測網絡,根據所述初始數據所覆蓋的時間長度,將時序長度對應的特徵提取網絡的輸出的局部特徵信息輸入至對應的局部風險預測網絡,並將各個特徵其提取層輸出的局部特徵信息拼接為輸入所述全局風險預測網絡的全局特徵信息;
9.基於對所述深度神經網絡的預訓練,來對輸入所述全局風險預測網絡的所述全局特徵信息,和輸入所述對應的局部風險預測網絡的局部特徵信息進行風險概率的預測,並得到預測結果。
10.進一步地,對所述深度神經網絡的預訓練,包括:
11.採用遷移學習預置所述深度神經網絡的網絡參數;
12.利用交叉熵構建損失函數;
13.基於預置的所述患者數據的類別,利用所述損失函數,確定所述類別與所述對應的局部風險預測網絡和所述全局風險預測網絡的預測結果之間的誤差;
14.通過對所述誤差進行反向傳播,來更新所述網絡參數;
15.響應於更新後的網絡參數令所述深度神經網絡的誤差小於預設的誤差閾值,完成對所述深度神經網絡的訓練。
16.進一步地,對所述患者數據進行篩選,包括:
17.利用所述均值和所述標準差,設置篩選範圍;
18.並保留取值在所述篩選範圍內的患者數據。
19.進一步地,依據為所述輸入矩陣分配的多個係數矩陣,來進行各個特徵頭的自注意力計算操作,包括:
20.為所述輸入矩陣設置第一權重矩陣、第二權重矩陣和第三權重矩陣,並分別與所述輸入矩陣相乘;
21.得到待匹配特徵矩陣、特徵查詢矩陣和特徵值矩陣;
22.對於各個特徵頭,利用預置的自注意力激活函數進行關於該特徵頭的自注意力計算操作,並確定關於該特徵頭的輸出。
23.進一步地,得到自注意力得分矩陣之前,還包括:
24.確定所述輸入矩陣中的缺失值;
25.為所述缺失值設立缺失值掩碼,得到掩碼矩陣,其中,所述缺失值掩碼由表示數值缺失的0和表示數值存在的1組成;
26.將所述聯合所述各個特徵頭的輸出後進行線性轉換之後的結果與所述掩碼矩陣中的對應元素點乘後得到所述自注意力得分矩陣。
27.進一步地,對所述輸入矩陣和所述自注意力得分矩陣設置殘差連接操作和層歸一化操作,來構建特徵提取網絡,包括:
28.通過將所述輸入矩陣和所述自注意力得分矩陣相加,來進行所述殘差連接操作;
29.利用如下所示的公式進行層歸一化操作:
[0030][0031]
h=layernorm(ffn(h

)+h

)
[0032]
其中,表示所述輸入矩陣,表示所述自注意力得分矩陣,ffn表示前饋神經網絡,h表示層歸一化操作的結果;
[0033]
進一步地,將所述自注意力計算、所述殘差連接操作和所述層歸一化操作、梯度向前傳播和再次進行所述所述殘差連接操作和所述層歸一化操作進行串聯,得到所述特徵提取網絡。
[0034]
進一步地,將時序長度對應的特徵提取網絡的輸出的局部特徵信息輸入至對應的局部風險預測網絡之前,包括:
[0035]
根據所初始數據所覆蓋的時間長度,為不同時序長度的各個初始數據配置不同的序列長度;
[0036]
設置多個特徵提取網絡,並分別對應配置不同序列長度的初始數據。
[0037]
基於同一發明構思,本技術還提供了一種慢性病的風險預測裝置,包括:異構數據處理模塊、風險因子提取模塊、多時間序列聯合預測模塊和訓練與預測模塊;
[0038]
其中,所述異構數據處理模塊,被配置為,利用預置的患者數據的均值和標準差,對所述患者數據進行篩選,並統一所述患者數據的維度,得到初始數據並輸入預置的深度神經網絡;
[0039]
所述風險因子提取模塊,被配置為,在所述深度神經網絡中,將所述初始數據映射為輸入矩陣,依據為所述輸入矩陣分配的多個係數矩陣,來進行各個特徵頭的自注意力計算操作並輸出,聯合所述各個特徵頭的輸出後進行線性轉換,得到自注意力得分矩陣,對所
述輸入矩陣和所述自注意力得分矩陣設置殘差連接操作和層歸一化操作,來構建特徵提取網絡,以將梯度向前傳播並輸出局部特徵信息;
[0040]
所述多時間序列聯合預測模塊,被配置為,在所述深度神經網絡中,設置局部風險預測網絡和全局風險預測網絡,根據所述初始數據所覆蓋的時間長度,將時序長度對應的特徵提取網絡的輸出的局部特徵信息輸入至對應的局部風險預測網絡,並將各個特徵其提取層輸出的局部特徵信息拼接為輸入所述全局風險預測網絡的全局特徵信息;
[0041]
所述訓練與預測模塊,被配置為,基於對所述深度神經網絡的預訓練,來對輸入所述全局風險預測網絡的所述全局特徵信息,和輸入所述對應的局部風險預測網絡的局部特徵信息進行風險概率的預測,並得到預測結果。
[0042]
基於同一發明構思,本技術還提供了一種電子設備,包括存儲器、處理器及存儲在存儲器上並可在處理器上運行的電腦程式,所述處理器執行所述程序時實現如上任意一項所述的慢性病的風險預測方法。
[0043]
基於同一發明構思,本技術還提供了一種非暫態計算機可讀存儲介質,其中,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令用於使所述計算機執行如上述慢性病的風險預測方法。
[0044]
從上面所述可以看出,本技術提供的慢性病的風險預測方法及相關裝置,基於對患者數據的篩選,並在同一患者數據的維度後,解決了存在異構數據的問題,使得所得到的數據適用於深度神經網絡,在構建深度神經網絡時,基於自注意力機制構建了風險因子的特徵提取網絡,並聯合了各個特徵頭的自注意力計算操作的結果,並在構建的風險因子的特徵提取網絡中,綜合考慮了關聯特徵和時序特徵,根據數據不同的時間長度分別構建多個信息提取模塊,聯合多個時間序列的風險因子特徵來進行特徵提取,從而實現利用訓練好的深度神經網絡預測患者的慢性病發展的風險。
附圖說明
[0045]
為了更清楚地說明本技術或相關技術中的技術方案,下面將對實施例或相關技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本技術的實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
[0046]
圖1為本技術實施例的慢性病的風險預測方法及相關裝置方法的流程圖;
[0047]
圖2為本技術實施例的總體執行邏輯圖;
[0048]
圖3為本技術實施例的數據類型示意圖;
[0049]
圖4為本技術實施例的異構數據處理的流程圖;
[0050]
圖5為本技術實施例的風險因子的特徵提取網絡的結構圖;
[0051]
圖6為本技術實施例的多時間序列聯合預測邏輯示意圖;
[0052]
圖7為本技術實施例的訓練步驟流程圖;
[0053]
圖8為本技術實施例的慢性病的風險預測方法及相關裝置裝置結構示意圖;
[0054]
圖9為本技術實施例的電子設備結構示意圖。
具體實施方式
[0055]
為使本技術的目的、技術方案和優點更加清楚明白,以下結合具體實施例,並參照附圖,對本技術進一步詳細說明。
[0056]
需要說明的是,除非另外定義,本技術的實施例使用的技術術語或者科學術語應當為本技術所屬領域內具有一般技能的人士所理解的通常意義。本技術的實施例中使用的「第一」、「第二」以及類似的詞語並不表示任何順序、數量或者重要性,而只是用來區分不同的組成部分。「包括」或者「包含」等類似的詞語意指出現該詞前面的元件或者物件涵蓋出現在該詞後面列舉的元件或者物件及其等同,而不排除其他元件或者物件。「連接」或者「相連」等類似的詞語並非限定於物理的或者機械的連接,而是可以包括電性的連接,不管是直接的還是間接的。「上」、「下」、「左」、「右」等僅用於表示相對位置關係,當被描述對象的絕對位置改變後,則該相對位置關係也可能相應地改變。
[0057]
可以理解的是,在使用本公開中各個實施例的技術方案之前,均會通過恰當的方式對所涉及的個人信息的類型、使用範圍、使用場景等告知用戶,並獲得用戶的授權。
[0058]
例如,在響應於接收到用戶的主動請求時,向用戶發送提示信息,以明確的提示用戶,其請求執行的操作將需要獲取和使用到用戶的個人信息。從而,使得用戶可以根據提示信息來自主的選擇是否向執行本公開技術方案的操作的電子設備、應用程式、伺服器或存儲介質等軟體或硬體提供個人信息。
[0059]
作為一種可選的但非限定的實現方式,響應於接受到用戶的主動請求,向用戶發送提示信息的方式例如可以是彈窗的方式,彈窗中可以以文字的方式呈現提示信息。此外,彈窗中還可以承載供用戶選擇「同意」或者「不同意」向電子設備提供個人信息的選擇控制項。
[0060]
可以理解的是,上述通知和獲取用戶授權過程僅是示意性的,不對本公開的實現方式構成限定,其他滿足相關法律法規的方式也可應用於本公開的實現方式中。
[0061]
如背景技術部分所述,相關的慢性病的風險預測方法還難以滿足實際醫療工作中,對患者進行慢性病發展預測的需要。
[0062]
申請人在實現本技術的過程中發現,相關的慢性病的風險預測方法存在的主要問題在於:既往研究雖然揭示了眾多慢性病的風險因子,但難以精準地個體化預測近期是否發生心血管事件,也就是說,臨床醫生卻仍然難以針對某一個體、一定時間內的死亡風險給出精確的量化預測,基於現有觀察性隊列研究而採用的統計學等方法,應用於慢性病人群的風險預測時存在諸多局限性。
[0063]
具體地,首先,統計學方法通常分析預測變量,也即,潛在風險因子和結局變量,也即,死亡風險概率的線性相關性,如皮爾遜相關分析,邏輯回歸和cox回歸分析等,或假定某種函數關係來分析非線性相關性,如樣條回歸分析,然而,但真實世界中預測變量如血壓和風險和概率卻很難用簡單的線性或非線性關係來描述。
[0064]
進一步地,現有方法對時間序列變量的處理並不理想,無論採用基線、時間平均、時間依存變量,均各有利弊,很難反映出動態變化中某個預測變量對結局的累積效應。
[0065]
基於此,本技術中的一個或多個實施例提供了慢性病的風險預測方法。
[0066]
以下結合附圖詳細說明本技術的實施例。
[0067]
參考圖1,本技術一個實施例的慢性病的風險預測方法方法,包括以下步驟:
[0068]
步驟s101、利用預置的患者數據的均值和標準差,對所述患者數據進行篩選,並統
一所述患者數據的維度,得到初始數據並輸入預置的深度神經網絡。
[0069]
在本技術的實施例中,如圖2所示,通過對患者的相關數據的採集,並分別對基線數據和隨訪數據進行不同的處理,來實現對異構數據的整合,並將整合後的初始數據輸入至深度神經網絡中。
[0070]
在本實施例中,以慢性病患者及其數據作為具體的示例,對於每個患者來說,可以將該患者的患者數依據其轉歸實踐的類別,分別標註為相應的轉歸類別,也即該患者數據的類別,例如持續慢性病、轉血透和死亡等,並將其作為該患者的標籤,將標註好標籤的慢性病患者的患者數據作為訓練本技術中深度神經網絡的訓練數據集。
[0071]
其中,轉歸事件包括患者的病情發生變化,或者轉入另一病情階段,例如,將轉歸事件為死亡的患者數據的標籤標註為1,將非死亡的患者數據的標籤標註為0。
[0072]
進一步地,在患者數據中,如圖3所示,包括了大量不同結構和不同類型的數據,例如,患者的人口學信息、疾病特徵信息、各項生化檢查數據、營養數據和慢性病治療信息等。
[0073]
進一步地,可以將數據分為基線變量,也即基線數據,和隨訪變量,也即隨訪數據;其中,基線數據為採集一次,且在多次採集過程中不發生變化,的數據,例如,患者的性別和身高等,隨訪變量包括隨病情發生變化,且每次均需採集的數據,例如各項生化檢查數據等。
[0074]
進一步地,由於患者的原始隨訪記錄在採集時的時間間隔是不規則的,為保證輸入神經網絡的數據,其時間序列間隔相同,因此,需要按照一定的時間間隔t
step
對原始的隨訪數據進行採樣。
[0075]
具體地,如圖4所示,例如,對於採集到的原始隨訪變量,採取從其記錄的起始時間t
start
,也即,患者錄入平臺或第一次化驗數據的時間,每三個月作為一個時間間隔t
step
選取一條數據的方式來選取數據,該數據為三個月中最接近選取時間點的數據,若三個月內無記錄則填充空值,從而使得到的隨訪變量是以三個月為時間間隔的數據向量,直到達到患者出現轉歸事件的時間t
end

[0076]
在本實施例中,起始時間處的數據為該患者的第一次採樣值r1,並在上述採樣方式採集後,得到隨訪變量的採集結果r=[r1,r2,

,rn],其中,n表示患者數據的序列長度。
[0077]
進一步地,為統一患者數據的維度,設定統一的序列長度w,對序列長度少於w的數據,將其空值填充至w長度,並對序列長度大於w的數據以轉歸事件的時間為終點,選取最後w個數據,根據上述隨訪變量的採集結果得到的隨訪變量為:
[0078][0079]
進一步地,對於基線變量來說,僅記錄有一條數據,則以空值填充的方式將基線變量填充至與隨訪變量相同的向量維度。
[0080]
具體地,將基線變量的空值填充為長度w的向量,再與隨訪變量合併,得到維度為(b+v)
×
w的患者數據矩陣,其中b為基線變量數目,v為隨訪變量數目。
[0081]
進一步地,由於患者數據中包含無法直接使用的類別變量,例如性別等,因此需要將類別變量數據值化,以數值編碼的方式來代表不同的類別信息。
[0082]
在本實施例中,對於上述得到的患者數據來說,由於記錄數據的過程中存在的不規範操作,因此患者數據中存在異常數據,需要篩選並清除出異常數據,來保證準確性。
[0083]
具體地,以化驗指標變量為例,統計其均值μ和標準差σ,並依據3σ準則,對於超出取值範圍(μ-3σ,μ+3σ)的患者數據,視為潛在的異常數據,將取值範圍(μ-3σ,μ+3σ)之內的患者數據,視為正常數據。
[0084]
進一步地,基於判斷結果,保留正常數據,剔除異常數據,並對異常數據進行空值替換,並將篩選後保留的正常數據作為初始數據。
[0085]
在本實施例中,基於上述得到的初始數據,可以將其輸入至預置的深度神經網絡。
[0086]
步驟s102、在所述深度神經網絡中,將所述初始數據映射為輸入矩陣,依據為所述輸入矩陣分配的多個係數矩陣,來進行各個特徵頭的自注意力計算操作並輸出,聯合所述各個特徵頭的輸出後進行線性轉換,得到自注意力得分矩陣,對所述輸入矩陣和所述自注意力得分矩陣設置殘差連接操作和層歸一化操作,來構建特徵提取網絡,以將梯度向前傳播並輸出局部特徵信息。
[0087]
在本技術的實施例中,如圖2所示,可以通過編碼映射,將初始數據輸入至深度神經網絡,並基於自注意力機制,構建特徵提取網絡,用以提取初始數據中各個變量之間的關聯特徵。
[0088]
在本實施例中,如圖5所示,將上述的初始數據作為深度神經網絡的訓練樣本,並將初始數據中的各個變量視為潛在的風險因子,並利用構建的深度神經網絡來提取風險因子的多層次的特徵信息。
[0089]
在具體的示例中,將初始數據的時間長度為設置為上述的w,並包含m=b+v個不同的變量,也即,每個變量的序列長度為w,其中,x
t
表示第t個變量。
[0090]
進一步地,對每個變量x
t
進行歸一化處理,統計整個初始數據的均值和標準差,對每個維度的數據減去均值再除以標準差。
[0091]
進一步地,可以將變量x
t
線性投影到d維向量空間中,得到u
t
,並將u
t
作為輸入向量,其中,d是自注意力機制中每個序列種元素的維度,也即深度神經網絡的維度。
[0092]
進一步地,對於深度神經網絡,其中的參數和輸入向量具備如下所示的關係:
[0093]ut
=w
p
x
t
+b
p
[0094]
其中,均為深度神經網絡中可學習的參數,表示深度神經網絡的輸入向量,並以表示由輸入向量所組成的輸入矩陣。
[0095]
進一步地,如圖5所示,由於自注意力的架構對輸入數據的順序缺少感知能力,基於此,需要加入位置編碼來使深度神經網絡學習時間序列的序列特徵。
[0096]
具體地,輸入矩陣加入位置編碼w
pos
使得其中,表示進行位置編碼後的輸入矩陣。
[0097]
在一些其他實施例中,位置編碼有多種選取方式,在本實施例中設定位置編碼為全部可學習的參數矩陣。
[0098]
在本實施例中,對於位置編碼後的輸入矩陣,可以採取自注意力機制來提取深層語義信息和關聯性關係,其自注意力計算操作的表達式如下所示:
[0099][0100][0101][0102]
multiheadattn(q,k,v)=concact(head1,

,headh)wo=y
[0103]
其中,矩陣wq,wk,wv均為可學習的權重矩陣,可以通過將輸入矩陣分別乘以三個係數矩陣,來分別得到待匹配特徵矩陣q、特徵查詢矩陣k和特徵值矩陣v。
[0104]
進一步地,在上述自注意力計算操作中的attn(q,k,v)中,基於自注意力矩陣的表達式,可以看出,自注意力矩陣中的每一個元素的值記錄了對應的兩個輸入向量,例如q和k,在關聯性上的計算結果;其中,dk表示特徵查詢矩陣k的維度,concact(
·
)表示矩陣的連接操作,softmax(
·
)為歸一化指數函數,headi表示第i個特徵頭。
[0105]
進一步地,基於計算出的各個特徵頭的自注意力計算結果,可以聯合多個特徵頭的計算結果,其中,不同的特徵頭可以分別提取輸入數據的不同層次的特徵,從而提高網絡的魯棒性。
[0106]
具體地,設立h個特徵頭,根據上述的multiheadattn(q,k,v)計算操作,將所有特徵頭的輸出進行首尾拼接後,再進行線性轉換,以獲取最終的自注意力得分矩陣y。
[0107]
其中,進行線性轉換可以通過乘以權重矩陣wo的方式實現。
[0108]
在本實施例中,由於輸入矩陣中存在缺失值,也就是說,某個變量無記錄值或某個時間點無記錄值,其中,前述過程中所填充的空值也可視為缺失值。
[0109]
進一步地,可以在自注意力計算過程中設立缺失值掩碼,並構成掩碼矩陣,具體地,掩碼矩陣由元素0或1組成,0代表該位置的數值缺失,1代表該位置數值存在。
[0110]
進一步地,將輸入矩陣與掩碼矩陣中各自的對應元素進行點乘,可以得到自注意力得分矩陣其中,

為哈達瑪積。
[0111]
在本實施例中,獲取自注意力得分後,深度神經網絡還需要將該自注意力得分用於前向傳播過程中,使用殘差連接操作和層歸一化操作相結合的方法可以有效提高深度神經網絡向前傳播的性能,其中計算過程如下公式所示:
[0112][0113]
h=layernorm(ffn(h

)+h

)
[0114]
其中,基於上述的輸入矩陣和自注意力得分矩陣,在計算殘差時,和分別表示自注意力計算的輸入和輸出,殘差連接的過程即為將該自注意力計算的輸入和輸出相加,以實現增強梯度傳播的效果。
[0115]
進一步地,layernorm(
·
)表示層歸一化操作,ffn(
·
)則表示前饋神經網絡,也即梯度向前傳播的神經網絡,其中,可以使用relu(
·
)作為激活函數用於線性變換。
[0116]
在本實施例中,如圖5所示,可以將自注意力計算,殘差連接操作和層歸一化操作,前向傳播,以及,再次進行殘差連接操作和層歸一化操作四個主要操作串聯執行,並視為一
個自注意力特徵提取層。
[0117]
進一步地,經過編碼後的輸入矩陣在輸入到自注意力特徵提取層後,會得到相同維度大小的輸出,因此,可以將多個自注意力特徵提取層首尾相接,得到特徵提取網絡,以進行多層次的特徵信息的提取,並在提取特徵信息後進入風險預測階段。
[0118]
步驟s103、在所述深度神經網絡中,設置局部風險預測網絡和全局風險預測網絡,根據所述初始數據所覆蓋的時間長度,將時序長度對應的特徵提取網絡的輸出的局部特徵信息輸入至對應的局部風險預測網絡,並將各個特徵其提取層輸出的局部特徵信息拼接為輸入所述全局風險預測網絡的全局特徵信息。
[0119]
在本技術的實施例中,隨訪數據中包含患者從開始記錄到轉歸事件的多個時間點的數據信息,其中,不同時間點的數據信息對結預測結果有不同程度的影響,因此,如圖2所示,可以通過使用不同時間長度的數據,構建相應的特徵提取網絡來提取特徵信息,並將不同特徵提取網絡提取的特徵進行拼接,並將拼接後的數據送入風險預測網絡,得到風險概率的預測結果。
[0120]
在本實施例中,特徵提取網絡以自注意力機制為基礎,重點關注變量之間的關係,而對變量內部的時間序列關係的提取能力較弱,因此,如圖6所示,可以設立多個時間序列長度的特徵提取網絡,分別提取對應時間長度的輸入數據的特徵,再將輸出結果拼接後送入風險預測網絡。
[0121]
具體地,分別設置k個序列長度t1,

,tk,由此得到在時間長度上相對應的輸入數據,構建k個特徵提取網絡net1,

,netk。
[0122]
其中,net1網絡負責處理基線變量和僅取一個時間點的隨訪變量,netk負責處理時間長度為tk的隨訪變量。
[0123]
在具體地示例中,在取值上可以選取例如,k=3,t1=1,t2=10,t3=20。
[0124]
進一步地,構建三個上述的特徵提取網絡,並將其各自輸出的局部特徵信息分別表示分別針對每個特徵提取網絡設置分別對應的局部風險預測網絡:pred1,pred2,pred3。
[0125]
進一步地,將輸出的三個局部特徵信息按照如下所示的方式進行拼接,得到全局特徵信息:
[0126][0127]
並作為全局風險預測網絡pred
out
的輸入。
[0128]
其中,每個局部風險預測網絡,以及,全局風險預測網絡均由一層全連接神經網絡組成,將輸出結果通過softmax(
·
)函數得到對應類別的風險概率。
[0129]
步驟s104、基於對所述深度神經網絡的預訓練,來對輸入所述全局風險預測網絡的所述全局特徵信息,和輸入所述對應的局部風險預測網絡的局部特徵信息進行風險概率的預測,並得到預測結果。
[0130]
在本技術的實施例中,基於上述構建的深度神經網絡,可以通過對其進行訓練,來確定每層網絡的參數設置,並將其保存後用於對患者數據的預測。
[0131]
在本實施例中,深度神經網絡訓練前需要初始化參數,其中的自注意力特徵提取網絡使用遷移學習的方法,可加快網絡的訓練速度,減少訓練開銷,而其他網絡則使用隨機
初始化的方法,基於此,使用損失函數計算該結果與標籤之間的誤差,並基於梯度下降算法和反向傳播原理,來更新網絡參數直至網絡收斂,得到訓練好的網絡。
[0132]
在具體的示例中,如圖7所示,基於自注意力機制的特徵提取網絡net1,

,netk可以使用遷移學習預置網絡參數,其餘神經網絡隨機初始化網絡參數。
[0133]
進一步地,如上所述,每個患者慢性病數據的轉歸事件作為標籤labeli,訓練神經網絡時,使用損失函數計算神經網絡的風險預測結果與標籤之間的誤差loss:
[0134]
loss=j(labeli,f(xi;θ))
[0135]
其中,xi表示網絡中第i個患者的輸入數據,i=2,3,...,s,s為數據集總患者的數量,f(xi;θ)表示網絡參數為θ時,神經網絡的預測結果。j(
·
)表示損失函數,計算神經網絡風險預測結果與標籤之間的誤差。
[0136]
在本實施例的具體示例中,局部風險預測網絡和全局風險預測網絡中的全連接神經網絡pred1,pred2,pred3和pred
out
作為整體深度神經網絡的最後一層,可以輸出預測結果,並直接和標籤計算網絡誤差。
[0137]
具體地,使用交叉熵作為損失函數,計算公式如下所示:
[0138][0139][0140]
其中,li為第i個病人的損失函數;j=1,

c為第j個類別;c為樣本的類別數;y
ij
表示符號函數,例如,若病人i的真實類別等於j則取1,否則取0;p
ij
為網絡輸出風險結果的預測概率,也即,病人i屬於類別j的概率。
[0141]
進一步地,使用雙數損失函數分別計算得到網絡損失l1,l2,l3,l
out
,網絡的總損失l可以按照如下所示的公式確定:
[0142]
l=α1l1+α2l2+α3l3+α
out
l
out
[0143]
其中,α1,α2,α3,α
out
均表示可調整的超參數,用以控制各局部損失對網絡的影響。
[0144]
進一步地,利用梯度下降法,最小化上述的損失函數,通過誤差反向傳播機制更新網絡參數,直至訓練次數達到預設的次數閾值後,或者,網絡的誤差波動小於預設的誤差閾值,則可以認為網絡收斂,並保存網絡每層的參數設置,得到訓練好的深度神經網絡。
[0145]
進一步地,利用訓練好的深度神經網絡進行慢性病患者的風險預測時,可以將數據集中未參與訓練的患者數據,或者其他待預測的患者數據輸入至深度神經網絡中,並輸出預測的分類結果和風險概率。
[0146]
進一步地,可以根據得到的預測結果,根據其準確性等各類評價指標評估網絡性能。
[0147]
本方法構建多時間序列風險因子特徵提取網絡,來提取出慢性病病人數據的關聯特徵和時序特徵,風險預測網絡的輸出基於損失函數與標籤進行計算,通過梯度下降方法反饋給網絡,使網絡根據標籤學習到慢性病臨床醫生的專業知識和慢性病數據與轉歸結果之間的醫學聯繫。
[0148]
可見,本技術的實施例的慢性病的風險預測方法,基於對患者數據的篩選,並在同一患者數據的維度後,解決了存在異構數據的問題,使得所得到的數據適用於深度神經網
絡,在構建深度神經網絡時,基於自注意力機制構建了風險因子的特徵提取網絡,並聯合了各個特徵頭的自注意力計算操作的結果,並在構建的風險因子的特徵提取網絡中,綜合考慮了關聯特徵和時序特徵,根據數據不同的時間長度分別構建多個信息提取模塊,聯合多個時間序列的風險因子特徵來進行特徵提取,從而實現利用訓練好的深度神經網絡預測患者的慢性病發展的風險。
[0149]
需要說明的是,本技術的實施例的方法可以由單個設備執行,例如一臺計算機或伺服器等。本實施例的方法也可以應用於分布式場景下,由多臺設備相互配合來完成。在這種分布式場景的情況下,這多臺設備中的一臺設備可以只執行本技術的實施例的方法中的某一個或多個步驟,這多臺設備相互之間會進行交互以完成所述的方法。
[0150]
需要說明的是,上述對本技術的一些實施例進行了描述。其它實施例在所附權利要求書的範圍內。在一些情況下,在權利要求書中記載的動作或步驟可以按照不同於上述實施例中的順序來執行並且仍然可以實現期望的結果。另外,在附圖中描繪的過程不一定要求示出的特定順序或者連續順序才能實現期望的結果。在某些實施方式中,多任務處理和並行處理也是可以的或者可能是有利的。
[0151]
基於同一發明構思,與上述任意實施例方法相對應的,本技術的實施例還提供了一種慢性病的風險預測裝置。
[0152]
參考圖8,所述慢性病的風險預測裝置,包括:異構數據處理模塊801、風險因子提取模塊802、多時間序列聯合預測模塊803和訓練與預測模塊804;
[0153]
其中,所述異構數據處理模塊801,被配置為,利用預置的患者數據的均值和標準差,對所述患者數據進行篩選,並統一所述患者數據的維度,得到初始數據並輸入預置的深度神經網絡;
[0154]
所述風險因子提取模塊802,被配置為,在所述深度神經網絡中,將所述初始數據映射為輸入矩陣,依據為所述輸入矩陣分配的多個係數矩陣,來進行各個特徵頭的自注意力計算操作並輸出,聯合所述各個特徵頭的輸出後進行線性轉換,得到自注意力得分矩陣,對所述輸入矩陣和所述自注意力得分矩陣設置殘差連接操作和層歸一化操作,來構建特徵提取網絡,以將梯度向前傳播並輸出局部特徵信息;
[0155]
所述多時間序列聯合預測模塊803,被配置為,在所述深度神經網絡中,設置局部風險預測網絡和全局風險預測網絡,根據所述初始數據所覆蓋的時間長度,將時序長度對應的特徵提取網絡的輸出的局部特徵信息輸入至對應的局部風險預測網絡,並將各個特徵其提取層輸出的局部特徵信息拼接為輸入所述全局風險預測網絡的全局特徵信息;
[0156]
所述訓練與預測模塊804,被配置為,基於對所述深度神經網絡的預訓練,來對輸入所述全局風險預測網絡的所述全局特徵信息,和輸入所述對應的局部風險預測網絡的局部特徵信息進行風險概率的預測,並得到預測結果。
[0157]
為了描述的方便,描述以上裝置時以功能分為各種模塊分別描述。當然,在實施本技術的實施例時可以把各模塊的功能在同一個或多個軟體和/或硬體中實現。
[0158]
上述實施例的裝置用於實現前述任一實施例中相應的慢性病的風險預測方法,並且具有相應的方法實施例的有益效果,在此不再贅述。
[0159]
基於同一發明構思,與上述任意實施例方法相對應的,本技術的實施例還提供了一種電子設備,包括存儲器、處理器及存儲在存儲器上並可在處理器上運行的電腦程式,
所述處理器執行所述程序時實現如上任意一實施例所述的慢性病的風險預測方法。
[0160]
圖9示出了本實施例所提供的一種更為具體的電子設備硬體結構示意圖,該設備可以包括:處理器1010、存儲器1020、輸入/輸出接口1030、通信接口1040和總線1050。其中處理器1010、存儲器1020、輸入/輸出接口1030和通信接口1040通過總線1050實現彼此之間在設備內部的通信連接。
[0161]
處理器1010可以採用通用的cpu(central processing unit,中央處理器)、微處理器、應用專用集成電路(application specific integrated circuit,asic)、或者一個或多個集成電路等方式實現,用於執行相關程序,以實現本技術實施例所提供的技術方案。
[0162]
存儲器1020可以採用rom(read only memory,只讀存儲器)、ram(random access memory,隨機存取存儲器)、靜態存儲設備、動態存儲設備等形式實現。存儲器1020可以存儲作業系統和其他應用程式,在通過軟體或者固件來實現本技術實施例所提供的技術方案時,相關的程序代碼保存在存儲器1020中,並由處理器1010來調用執行。
[0163]
輸入/輸出接口1030用於連接輸入/輸出模塊,以實現信息輸入及輸出。輸入/輸出模塊可以作為組件配置在設備中(圖中未示出),也可以外接於設備以提供相應功能。其中輸入設備可以包括鍵盤、滑鼠、觸控螢幕、麥克風、各類傳感器等,輸出設備可以包括顯示器、揚聲器、振動器、指示燈等。
[0164]
通信接口1040用於連接通信模塊(圖中未示出),以實現本設備與其他設備的通信交互。其中通信模塊可以通過有線方式(例如usb、網線等)實現通信,也可以通過無線方式(例如行動網路、wifi、藍牙等)實現通信。
[0165]
總線1050包括一通路,在設備的各個組件(例如處理器1010、存儲器1020、輸入/輸出接口1030和通信接口1040)之間傳輸信息。
[0166]
需要說明的是,儘管上述設備僅示出了處理器1010、存儲器1020、輸入/輸出接口1030、通信接口1040以及總線1050,但是在具體實施過程中,該設備還可以包括實現正常運行所必需的其他組件。此外,本領域的技術人員可以理解的是,上述設備中也可以僅包含實現本技術實施例方案所必需的組件,而不必包含圖中所示的全部組件。
[0167]
上述實施例的裝置用於實現前述任一實施例中相應的慢性病的風險預測方法,並且具有相應的方法實施例的有益效果,在此不再贅述。
[0168]
基於同一發明構思,與上述任意實施例方法相對應的,本技術還提供了一種非暫態計算機可讀存儲介質,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令用於使所述計算機執行如上任一實施例所述的慢性病的風險預測方法。
[0169]
本實施例的計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現信息存儲。信息可以是計算機可讀指令、數據結構、程序的模塊或其他數據。計算機的存儲介質的例子包括,但不限於相變內存(pram)、靜態隨機存取存儲器(sram)、動態隨機存取存儲器(dram)、其他類型的隨機存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、快閃記憶體或其他內存技術、只讀光碟只讀存儲器(cd-rom)、數字多功能光碟(dvd)或其他光學存儲、磁盒式磁帶,磁帶磁碟存儲或其他磁性存儲設備或任何其他非傳輸介質,可用於存儲可以被計算設備訪問的信息。
[0170]
上述實施例的存儲介質存儲的計算機指令用於使所述計算機執行如上任一實施例所述的慢性病的風險預測方法,並且具有相應的方法實施例的有益效果,在此不再贅述。
[0171]
所屬領域的普通技術人員應當理解:以上任何實施例的討論僅為示例性的,並非旨在暗示本技術的範圍(包括權利要求)被限於這些例子;在本技術的思路下,以上實施例或者不同實施例中的技術特徵之間也可以進行組合,步驟可以以任意順序實現,並存在如上所述的本技術的實施例的不同方面的許多其它變化,為了簡明它們沒有在細節中提供。
[0172]
另外,為簡化說明和討論,並且為了不會使本技術的實施例難以理解,在所提供的附圖中可以示出或可以不示出與集成電路(ic)晶片和其它部件的公知的電源/接地連接。此外,可以以框圖的形式示出裝置,以便避免使本技術的實施例難以理解,並且這也考慮了以下事實,即關於這些框圖裝置的實施方式的細節是高度取決於將要實施本技術的實施例的平臺的(即,這些細節應當完全處於本領域技術人員的理解範圍內)。在闡述了具體細節(例如,電路)以描述本技術的示例性實施例的情況下,對本領域技術人員來說顯而易見的是,可以在沒有這些具體細節的情況下或者這些具體細節有變化的情況下實施本技術的實施例。因此,這些描述應被認為是說明性的而不是限制性的。
[0173]
儘管已經結合了本技術的具體實施例對本技術進行了描述,但是根據前面的描述,這些實施例的很多替換、修改和變型對本領域普通技術人員來說將是顯而易見的。例如,其它存儲器架構(例如,動態ram(dram))可以使用所討論的實施例。
[0174]
本技術的實施例旨在涵蓋落入所附權利要求的寬泛範圍之內的所有這樣的替換、修改和變型。因此,凡在本技術的實施例的精神和原則之內,所做的任何省略、修改、等同替換、改進等,均應包含在本技術的保護範圍之內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀