臨床診斷模型的構建方法及構建系統、臨床診斷系統與流程
2023-05-06 20:35:07 2
本發明涉及醫療技術領域,尤其涉及一種臨床診斷模型的構建方法及構建系統、臨床診斷系統。
背景技術:
目前醫生主要通過培訓等專業學習,依靠個人經驗進行判斷疾病,容易由於經驗判斷而產生誤診。由於醫生對病症知識掌握有限,不可能掌握所有疾病的症狀。尤其是專科醫生,臨床上往往只能對日常熟悉的病症進行診斷,而對於不常見疾病不能很好做出判斷,容易產生誤診。
技術實現要素:
本發明的目的在於提供一種臨床診斷模型的構建方法及構建系統、臨床診斷系統,用於提高醫生診病的準確度。
為達到上述目的,本發明提供的臨床診斷模型的構建方法採用如下技術方案:
一種臨床診斷模型的構建方法包括:
步驟s1、進行數據採集,數據採集源為多個電子病歷;
步驟s2、對採集到的數據進行處理;
步驟s3、根據處理後的數據中的已知典型病歷建立病例分析模型,並對病歷分析模型進行訓練評估;
步驟s4、將訓練評估完成的模型應用到臨床診斷系統中,形成臨床診斷模型。
示例性地,步驟s1中的電子病歷的數據包括病人的基本信息、用藥歷史、患病史、症狀主訴和檢查指標。
可選地,步驟s1中採用數據倉庫技術進行數據的採集。
示例性地,步驟s2具體包括:
子步驟s21、去掉未確診和關鍵信息缺失的數據;
子步驟s22、篩選出數據量大且數據可用度好的疾病種類;
子步驟s23、通過疾病共用條件篩選可能病症;
子步驟s24、獲取患者症狀主訴數據、檢查指標數據;
子步驟s25、根據統計學概率分析理論將篩選出的可能病症與患者症狀主訴數據、檢查指標數據進行概率分析。
示例性地,步驟s3中對病歷分析模型進行訓練評估具體包括:逐層對臨床診斷模型進行訓練評估。
進一步地,逐層對臨床診斷模型進行訓練評估具體包括:
針對有核心症狀詞的病症,通過核心症狀詞進行初級判斷過濾,根據過濾結果進行逐層分析,通過回歸、分析、聚類算法將診斷結果輸出;
針對無典型指向的病症,通過貝葉斯網絡神經網絡模型進行算法精細化診斷,通過分析後將診斷結果按照近似概率輸出。
示例性地,病歷分析模型的權重為:w=(w1,w2,…,wn),其中,w1、w2,…,wn均表示各個症狀的權重,n為大於或者等於1的正整數;
p(w)為在未給定任何數據時的先驗概率,在給了訓練數據d後,其後驗概率p(w|d)為:p(d)為歸一化因子,與模型無關;p(d|w)為模型的證據,用以判斷模型的複雜度是否合適。
示例性地,數據採集源包括多個病症的電子病歷時,針對每個病症分別執行步驟s1~步驟s4,以獲得針對不同病症的多個臨床診斷模型。
本發明提供的臨床診斷模型的構建方法包括如上所述的步驟,從而使得使用該構建方法構建的臨床診斷模型應用到臨床診斷系統中後,通過錄入病人的基本信息,例如,年齡、性別、病史等,然後錄入主訴條件,臨床診斷系統即可根據錄入的信息,列出可能診斷出的疾病及其概率,進而使得醫生在診斷時可以參考臨床診斷系統列出的患病概率,針對可疑疾病,通過醫生對患者提問來進行進一步驗證,逐步確認患者所患疾病,起到提高醫生診病的準確度的效果。
本發明提供的臨床診斷模型的構建系統採用如下技術方案:
臨床診斷模型的構建系統包括:
數據採集模塊,用於進行數據採集,數據採集源為多個電子病歷;
數據處理模塊,用於對採集到的數據進行處理;
模型訓練評估模塊,用於根據處理後的數據中的已知典型病歷建立病例分析模型,並對病歷分析模型進行訓練評估;以及
模型應用模塊,用於將訓練評估完成的模型應用到臨床診斷系統中,形成臨床診斷模型。
該臨床診斷模型的構建系統具有和上述臨床診斷模型的構建方法相同的有益效果,此處不再進行贅述。
本發明提供的臨床診斷系統採用如下技術方案:
臨床診斷系統包括:
輸入裝置,用於輸入患者的基本信息、症狀主訴和檢查指標;
診斷裝置,用於根據患者的基本信息、症狀主訴和檢查指標,應用臨床診斷模型診斷出可能的疾病及其概率,其中,臨床診斷模型為使用如權利要求1~8任一項所述的臨床診斷模型的構建方法構建所得;
顯示裝置,用於顯示診斷出的可能的疾病及其概率。
醫生在使用該臨床診斷系統的過程中,通過錄入病人的基本信息,例如,年齡、性別、病史等,然後錄入主訴條件,臨床診斷系統即可根據錄入的信息,列出可能診斷出的疾病及其概率,進而使得醫生在診斷時可以參考臨床診斷系統列出的患病概率,針對可疑疾病,通過醫生對患者提問來進行進一步驗證,逐步確認患者所患疾病,起到提高醫生診病的準確度的效果。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例中的臨床診斷模型的構建方法的流程圖;
圖2為本發明實施例中的臨床診斷系統的示意圖。
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
本發明實施例提供一種臨床診斷模型的構建方法,具體地,如圖1所示,該臨床診斷模型的構建方法包括:
步驟s1、進行數據採集,數據採集源為多個電子病歷。
可選地,數據採集源為三甲醫院多年積累的電子病歷,電子病歷的數據要完整,應包括病人的基本信息、用藥歷史、患病史、症狀主訴、檢查指標等。在本發明實施例中,可選地,步驟s1中採用數據倉庫技術進行數據的採集,以備後續的數據處理及模型訓練使用。其中,數據倉庫技術的英文為extract-transform-load,簡寫為etl,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。
步驟s2、對採集到的數據進行處理。
為了提高臨床診斷模型的準確性,本發明實施例中選擇對採集到的數據進行處理後再進行模型的訓練。
具體數據處理方式可以包括:首先,去掉未確診和關鍵信息缺失的數據;然後,篩選出數據量大且數據可用度好的疾病種類;接著,通過疾病共用條件篩選可能病症;然後,獲取患者症狀主訴數據、檢查指標數據;最後,根據統計學概率分析理論將篩選出的可能病症與患者症狀主訴數據、檢查指標數據進行概率分析。
當然,本領域技術人員也可以採用其他數據處理方式,只要能達到上述目的即可,此處不進行限定。
步驟s3、根據處理後的數據中的已知典型病歷建立病例分析模型,並對病歷分析模型進行訓練評估。
示例性地,步驟s3中對病歷分析模型進行訓練評估具體包括:逐層對臨床診斷模型進行訓練評估。
進一步地,逐層對臨床診斷模型進行訓練評估具體包括:
針對有核心症狀詞的病症,通過核心症狀詞進行初級判斷過濾,根據過濾結果進行逐層分析,通過回歸、分析、聚類算法將診斷結果輸出,相當於快速定位初級分類;
針對無典型指向的病症,通過貝葉斯網絡神經網絡模型進行算法精細化診斷,通過分析後將診斷結果按照近似概率輸出。
模型應用核心是以最大似然(誤差最小)獲得網絡權重的一個解(一個權重向量)。而貝葉斯方法考慮的權重空間(即權重的整個解空間上許多解)上權重的概率分布,通過先驗概論表達不同權重值的相對置信度。當越來越多的數據觀測到,權重的後驗概率會逐漸集中到權重空間的局部上。當觀測到更多數據時,後驗概率會逐步收縮。
示例性地,某一病歷分析模型的權重為:w=(w1,w2,…,wn),其中,w1、w2,…,wn均表示各個症狀的權重,n為大於或者等於1的正整數;
p(w)為在未給定任何數據時的先驗概率,一般很難傾向於某個模型時,就給所有模型賦予同樣的先驗概率,在給了訓練數據d後,其後驗概率p(w|d)為:p(d)為歸一化因子,與模型無關;p(d|w)為模型的evidence,用以判斷模型的複雜度是否合適。
實踐表明,模型越複雜,它能描述的數據集越廣。貝葉斯方法中,可以選擇evidence(證據)最大的模型,也可以利用所有的模型,它會將所有模型的輸出進行加權而得到最終輸出,其權重就是每個模型的evidence。越好的模型對輸出貢獻越大。
根據數據積累情況增加模型參數權重結果,模型越接近實際典型病症判斷標準對實際運算輸出貢獻越大。由於判斷模型是通過訓練數據獲得的,因此可以避免單獨切分出測試數據,減少交叉驗證環節。
上述提及的貝葉斯網絡是基於概率推理的數學模型,具有處理不確定性信息的處理能力,通過大規模數據訓練,逐步提高準確度的優勢。
基於貝葉斯-深層神經網絡具有以下特性:具有很強的容錯性,這是因為信息是分布存貯於網絡內的神經元中;並行處理方法,人工神經元網絡在結構上是並行的,而且網絡的各個單元可以同時進行類似的處理過程,使得計算快速;自學習、自組織、自適應性,神經元之間的連接多種多樣,各元之間聯接強度具有一定可塑性,使得神經網絡可以處理不確定或不知道的系統;可以充分逼近任意複雜的非線性關係;具有很強的信息綜合能力,能同時處理定量和定性的信息,能很好的協調多種輸入信息關係,適用於處理複雜非線性和不確定對象。
步驟s4、將訓練評估完成的模型應用到臨床診斷系統中,形成臨床診斷模型。
本發明實施例中通過提取醫院臨床積累的診斷數據,通過疾病共用條件篩選可能病症,通過獲取患者症狀主訴數據、檢查指標數據並進行預處理,根據統計學概率分析理論將診斷後的疾病庫與患者主訴、各種檢查指標進行概率分析。處理後的數據利用貝葉斯算法進行訓練形成疾病與症狀、檢查指標的概率診斷模型。再對訓練後的診斷模型進行評估,最後將達到要求的模型應用到輔助診斷過程中。其中,利用貝葉斯理論訓練的過程中,針對症狀主訴數據的特點,從兩方面進行了優化,一方面是利用核心症狀詞表在計算向量權重時賦予絕對權重,另一方面是利用疾病大類和特點,採用分層的貝葉斯模型進行訓練。通過訓練症狀主訴、檢查指標等不斷優化,提高疾病輔助診斷模型的準確性,在基層醫生疾病診斷場景下,提醒醫生可能存在的疾病及概率,避免醫生漏診,同時通過疾病對應的症狀,引導醫生對患者進行提問驗證,逐步提高基層醫生的疾病診斷能力。
此外,在本發明實施例中,當數據採集源包括多個病症的電子病歷時,可以針對每個病症分別執行步驟s1~步驟s4,以獲得針對不同病症的多個臨床診斷模型。將多個臨床診斷模型應用於臨床診斷系統中後,通過主訴症狀以及檢查指標等不僅可以獲得患者患某種特定病症的可能性,還可以獲得患者患其他病症的可能性,可輔助醫生確定最可能的病症,進而為醫生的進一步確診提供保證。
本發明實施例還提供一種臨床診斷模型的構建系統,該臨床診斷模型的構建系統與上述構建方法相對應,具體地,該臨床診斷模型的構建系統包括:
數據採集模塊,用於進行數據採集,數據採集源為多個電子病歷;
數據處理模塊,用於對採集到的數據進行處理;
模型訓練評估模塊,用於根據處理後的數據中的已知典型病歷建立病例分析模型,並對病歷分析模型進行訓練評估;以及
模型應用模塊,用於將訓練評估完成的模型應用到臨床診斷系統中,形成臨床診斷模型。
需要補充的是,各模塊執行其功能的具體細節可以參照上述臨床診斷模型的構建方法各步驟的相關描述,此處不再進行贅述。
使用該臨床診斷模型的構建系統構建的臨床診斷模型應用到臨床診斷系統中後,通過錄入病人的基本信息,例如,年齡、性別、病史等,然後錄入主訴條件,臨床診斷系統即可根據錄入的信息,列出可能診斷出的疾病及其概率,進而使得醫生在診斷時可以參考臨床診斷系統列出的患病概率,針對可疑疾病,通過醫生對患者提問來進行進一步驗證,逐步確認患者所患疾病,起到提高醫生診病的準確度的效果。
此外,本發明實施例還提供一種臨床診斷系統,該臨床診斷系統包括輸入裝置,用於輸入患者的基本信息、症狀主訴和檢查指標;診斷裝置,用於根據患者的基本信息、症狀主訴和檢查指標,應用臨床診斷模型診斷出可能的疾病及其概率,其中,臨床診斷模型為使用如上所述的臨床診斷模型的構建方法或構建系統構建所得;顯示裝置,用於顯示診斷出的可能的疾病及其概率。
可選地,輸入裝置為電腦的鍵盤,顯示裝置為電腦的顯示器,診斷裝置和臨床診斷模型均集成在電腦的主機的cpu中。
在該臨床診斷系統中,通過錄入病人的基本信息,例如,年齡、性別、病史等,然後錄入主訴條件,臨床診斷系統即可根據錄入的信息,列出診斷出的可能的疾病及其概率,進而使得醫生在診斷時可以參考臨床診斷系統列出的患病概率,避免醫生漏診,針對可疑疾病,通過醫生對患者提問來進行進一步驗證,逐步確認患者所患疾病,起到提高醫生診病的準確度的效果。該臨床診斷模型可以作為醫生學習和輔助診斷的工具。
示例性地,如圖2所示,該臨床診斷系統的診斷裝置可以包括疾病共用條件庫、查體陽性指標庫、疾病庫、疾病診療庫、症狀描述資源庫和症狀關係庫;臨床診斷系統的顯示裝置中對應顯示有主訴錄入區。示例性地,疾病共用條件庫中的疾病條件包括性別、年齡、病史、疾病自身條件等;查體陽性指標庫中的指標包括查體胃區壓痛、胃鏡提示出血、炎症、潰瘍、無胸腔積液、胸腔積液心音遙遠、肺部哮鳴音咳出白痰後緩解、查體局部壓痛、心彩超未見異常、ecg僅提示st改變、心彩超提示節段性運動障礙、ecg提示st段抬高/壓低紙診斷標準等;疾病庫包括食管/胃炎症、胸膜炎、哮喘肺部疾病、肋軟骨炎、冠心病(心絞痛)等;疾病診療庫包括疾病症狀、疾病檢查、疾病治療等;症狀描述資源庫包括症狀圖片、症狀別名、症狀描述等;與上述疾病庫對應的,症狀關係庫中的症狀包括:反酸、噯氣;黑便;針刺樣疼痛,咽食後明顯;針刺樣疼痛;針刺樣疼痛,隨呼吸變化;胸痛;隨咳嗽加重;與活動無關;乳房牽涉痛;胸悶,呼吸困難;噁心,嘔吐;局部腫脹;活動後加劇;壓榨樣,憋悶樣,絞痛;頭暈等;主訴錄入區可以錄入性別、年齡、主訴條件輸入、病史等。
以患者具有反酸、噯氣、黑便、針刺樣疼痛,咽食後明顯以及噁心、嘔吐的症狀為例,在使用上述疾病診斷系統對患者進行診斷的過程中,先通過輸入裝置將反酸、噯氣、黑便、針刺樣疼痛,咽食後明顯以及噁心、嘔吐的症狀輸入,然後,診斷裝置根據患者的基本信息、症狀主訴和檢查指標,應用臨床診斷模型診斷出可能的疾病及其概率,其中,可能的疾病包括食管/胃炎症,急性心梗,食管/胃炎症的概率為65%,急性心梗的概率為10%;最後通過顯示裝置顯示診斷出的可能的疾病及其概率。
需要補充的是,上述診斷裝置根據患者的基本信息、症狀主訴和檢查指標,應用臨床診斷模型診斷出可能的疾病及其概率的具體方式可以為:將症狀主訴和檢查指標作為臨床診斷模型的輸入,然後應用臨床診斷模型對症狀主訴和檢查指標進行處理,篩選出可能病症及其概率並輸出第一結果,該第一結果作為診斷裝置的最終輸出;或者,將症狀主訴和檢查指標作為臨床診斷模型的輸入,然後應用臨床診斷模型對症狀主訴和檢查指標進行處理,篩選出可能病症及其概率並輸出第一結果a1,但該第一結果a1在診斷裝置的最終輸出中僅佔據一定的權重p1,p1小於1且大於0,診斷裝置還對患者的基本信息進行處理,得到第二結果a2,第二結果a2也佔據一定的權重p2,p2小於1且大於0,且p1+p2=1,將a1*p1+a2*p2作為診斷裝置的最終輸出。其中,p1和p2的具體數值的確定可以由醫生根據其工作經驗確定,或者應用大量的病歷數據統計分析獲得。當然,當篩選出的可能病症為多個疾病時,本領域技術人員必然知道上述第一結果a1和第二結果a2均應該是包含多個相互獨立的數據,各個數據與各個疾病相對應,此處不再舉例進行描述。
以上所述,僅為本發明的具體實施方式,但本發明的保護範圍並不局限於此,任何熟悉本技術領域的技術人員在本發明揭露的技術範圍內,可輕易想到變化或替換,都應涵蓋在本發明的保護範圍之內。因此,本發明的保護範圍應以所述權利要求的保護範圍為準。