Meta分析數值缺失狀態下MCMC模擬導向的基於多重填補法的缺失值處理的方法
2023-07-22 16:08:26
Meta分析數值缺失狀態下MCMC模擬導向的基於多重填補法的缺失值處理的方法
【專利摘要】本發明公開了一種Meta分析數值缺失狀態下MCMC模擬導向的基於多重填補法的缺失值處理的方法,其特點是:以貝葉斯概率論為基點,以馬爾可夫蒙特卡洛(MCMC)隨機模擬方法為導向,基於多重填補法的缺失值處理,應用於任意缺失模式的Meta分析數據缺失狀態下,實現將缺失值處理與常規Meta分析中缺失數據集的一體化整合。該方法可最大程度的擬合缺失數據,以儘可能地保證提取數據的完整性和後續標準統計的可行性,顯著提升Meta分析的統計檢驗效能,增強系統評價結果的穩健性和可靠性,增強對系統綜述評價的科學性和全面性。
【專利說明】Meta分析數值缺失狀態下MCMC模擬導向的基於多重填補 法的缺失值處理的方法
【技術領域】
[0001] 本發明涉及醫學統計學領域,尤其涉及一種Meta分析數值缺失狀態下MCMC模擬 導向的基於多重填補法的缺失值處理的方法。
【背景技術】
[0002] 在生物醫學領域,Meta分析是對具有相同研究目的的多個獨立小樣本的臨床試驗 及基礎實驗研究的結果進行系統分析和定量綜合,以提高統計檢驗的效能和增加效應值估 計的精確度,解決各研究結果的不一致性以及尋求新的假說。Meta分析在臨床診斷技術準 確性的評估和優選、臨床治療效果的評價和優化、病因學因果關聯的評估、疾病預防幹預的 評價、疾病防治的成本效益分析、衛生經濟學研究、衛生服務評價、衛生決策及衛生管理評 價中有著廣泛而深刻的應用價值,有助於將有限的醫療資源更為合理地運用在那些已經在 適當設計的評估中表現出有效的衛生健康服務的方式上。
[0003] 在Meta分析中,對納入的獨立小樣本的臨床試驗及基礎實驗研究進行數據提取 及分析過程中,因個別臨床研究在採集、填寫、錄入等過程中的隨機因素或人為因素,往往 有部分數據的刪失以至於不能提取到需要研究的全部相關數據。缺失數據對Meta分析的 統計和研究推論往往造成不利影響:由於受試者部分數據的缺失,使得受試者的數據在統 計分析時無效或不可靠,以致有效樣本量減少,繼而導致臨床結果的可靠性難以得到保障 和研究結論出現偏差。當前對於研究數據的缺失,常規採取聯繫其研究的原作者,以索取更 為詳細的相關資料和數據,但是因為研究發表的年代差距因素或者實驗本身的局限性因素 等諸多因素,缺失的數據往往未能得以完好的補充;有時在聯繫原作者索取未果情況下,不 得已要將有缺失數據的某研究排除。尤其當完全觀測數據和不完全觀測數據存在系統差異 時,常規處理方法得到的結果通常不能代表整體,這樣可增大Meta分析的統計方差,降低 檢驗效能,影響系統評價的穩定性和可信度,降低評估的精確性和損耗隨機化的效果,以致 作出偏倚性結論,無法得到科學合理的解釋。
【發明內容】
[0004] 本發明主要目的在於提供一種Meta分析數值缺失狀態下MCMC模擬導向的基於多 重填補法的缺失值處理的方法,其特徵在於以貝葉斯概率論為基點,以馬爾可夫蒙特卡洛 (Markov Chain Monte Carlo algorithm,MCMC)隨機模擬方法為導向,基於多重填補法的 缺失值處理,應用於任意缺失模式的Meta分析數據缺失狀態下,實現將缺失值處理與常規 Meta分析中數據提取缺失的一體化整合。在Meta分析對數據提取的過程中,基於Meta分 析數據缺失狀態下的假設,以貝葉斯理論為原理,以缺失值處理分析為解決策略,以缺失的 定量及等級資料為填充對象,以馬爾可夫蒙特卡洛隨機模擬方法為導向,以多重填補法作 為缺失數據處理與模型的契合點,最大程度的擬合缺失數據集,彌補納入研究數據缺失的 不足,以儘可能地保證提取數據的完整性和後續標準統計的可行性,顯著提升Meta分析的 統計檢驗效能,增強系統評價結果的穩健性和可靠性,避免了在Meta分析中獨立研究因數 據缺失而被排除的局限性,增強對系統綜述評價的科學性和全面性。
[0005] 本發明的有益效果為:Meta分析數值缺失狀態下MCMC模擬導向的基於多重填補 法的缺失值處理的方法,有效論證了缺失值處理在Meta分析數據缺失狀態下應用的可行 性,強化了馬爾可夫蒙特卡洛隨機模擬方法在多重填補缺失處理中應用,也開創了在Meta 分析數據缺失狀態下缺失值處理的先例。缺失值處理在Meta分析的數據處理中的應用,最 大程度的保證提取數據的完整性,能夠解決有缺失數據資料中相對普遍的問題,尤其當數 據呈任意缺失模式時,可以運用MCMC模型來處理複雜的數據缺失問題,提高統計效率;還 可有效避免均值填充法易使變量分布扭曲,使替代後的分布更接近真值。該方法是對缺失 處理在循證醫學領域的拓展和創新,也是對現有Meta分析的發展和完善,有利於使Meta分 析更加科學規範化、精確具體化和綜合全面化。
【專利附圖】
【附圖說明】
[0006] 附圖1為本發明的一種實施例的示意圖。
【具體實施方式】
[0007] 本發明的具體方法由以下實施例及其附圖1給出。
[0008] 附圖1是根據本發明提出的Meta分析數值缺失狀態下MCMC模擬導向的基於多重 填補法的缺失值處理的方法的流程圖。下面結合圖1詳細說明依據本發明提出的具體方 法。
[0009] (1)馬爾可夫蒙特卡洛(MCMC)導向的多重填補法主要包括3個關鍵步驟:分別是 對目標估計量的估計(即對研究變量的某種估計),嵌入借補值、創建完全數據集(即主要完 成對借補值的估計),以及合併對目標估計量的估計結果。其中,對缺失數據的借補值的估 計正是目標估計量的估計的關鍵所在。
[0010] (2)從貝葉斯概率論出發,多重填補用Ymis的後驗預測分布表徵Ymis的相關信息, MCMC方法可藉助馬爾可夫鏈構造或者模擬該後驗分布。應用MCMC方法構造一個有效的 馬爾可夫鏈,從而獲得對該概率分布偽隨機抽樣。根據給定的參數Θ初始值Θ 及Y(As, 多次迭代得到馬氏鏈(Y(1)mis,e(1)),(Y (2)mis,θ?),…,以1^,θω),…。從馬氏鏈中可 抽得一個數據擴充鏈Y (k)mis,Y(2k)mis,Y(3k)mis,…,Y(nk)mis…。可從數據擴充鏈中得到Ymis,當 k足夠大時馬氏鏈在(Ymis,Θ | Y(As)處收斂,並且得到鄰近的、相互獨立的兩個借補值。
[0011] (3)當預處理服從多元正態分布的數據時,MCMC須進行以下三步: 初始值:計算已有觀測數據的均值與協方差矩陣,以便估計參數的後驗分布;I-步:依 據與既定Ymis分布進行偽隨機抽樣,從中逐次收集借補值;P-步:根據與缺失數據 借補值 Y(k+1)mis 求得 9(k+1)。
[0012] (4)多重借補的有限次借補:在理想狀態下,重複借補理論認為,無限次的借補時, 該估計的均值正是對缺失數據的估計。基於論證有限次借補公式RE=1A1+λ/ m)為有限次 借補時相對效率,MI的高效估計與借補的數量、缺失數據的比率之間關係密切。優良的估 計參數還要求儘可能小的標準誤估計、儘量窄的置信區間等。實踐中,良好的置信區間與 假設檢驗均需要進行一定數量的借補,那麼允許的條件下應用多重填補法處理數據時應進 行10次或者更多次的借補。
【權利要求】
1. 一種Meta分析數值缺失狀態下MCMC模擬導向的基於多重填補法的缺失值處理的方 法,其特徵在於,以馬爾可夫蒙特卡洛(MCMC)隨機模擬方法為導向,基於多重填補法的缺失 值處理,應用於任意缺失模式的Meta分析數據缺失狀態下,實現將缺失值處理與常規Meta 分析中缺失數據集的一體化整合。
2. 如權利要求1所述的一種Meta分析數值缺失狀態下MCMC模擬導向的基於多重填 補法的缺失值處理的方法,特徵在於,在Meta分析對納入研究的數據提取的過程中,基於 Meta分析數據缺失狀態下的假設,以貝葉斯概率論為基點,以缺失值處理分析為解決策略, 以缺失的定量及等級資料為填充對象,以馬爾可夫蒙特卡洛(MCMC)隨機模擬方法為導向, 以多重填補作為缺失數據處理與模型的契合點,以儘可能最大程度的擬合Meta分析缺失 數據集。
【文檔編號】G06F19/00GK104091094SQ201410376311
【公開日】2014年10月8日 申請日期:2014年8月3日 優先權日:2014年8月3日
【發明者】劉鴻 申請人:劉鴻, 周潔