標準誤差和樣本標準差區別(標準偏差SD和平均值的標準誤差SEM)
2023-10-11 23:36:52 5
爾雲間 一個專門做科研的團隊原創 小薇 A科研顯微鏡 關注我們
你知道嗎?目前已經發表的涉及統計分析的醫學類文章大約有一半的統計方法都是錯誤的。讀者普遍認為當一篇文章出現在期刊上時,審稿人和編輯已經仔細審查了手稿的各個方面,包括統計方法。然而事實並非如此。大量臨床或生物醫學研究人員實際上並沒有接受過生物統計學方面的正式培訓。盲目信任已發表文獻設計自己的實驗並進行統計分析是不可靠的。
今天小薇根據統計學相關文獻,整理了一些基本的經驗法則,可以用於評估已發表文章中統計數據的使用,當然也希望對你的數據分析有幫助。
實驗數據一般都總結成mean SD,或SEM。SD代表標準偏差, SEM代表平均值的標準誤差。
這裡有一個基本法則,即:大約68%的觀測值將在平均值的1個標準差範圍內,大約95%的觀測值將在平均值的2個標準差範圍內,上述情況適用於標準差。(能看懂嗎?看不懂我們以下面這個例子解釋一下)
例如,一篇報導健康成年人的舒張壓為 78 ± 6 mm Hg(mean ± SD)的文章,意味著大約95%的健康成年人的舒張壓在66-90 mm Hg。
「2 個標準差規則」是一個很好的經驗法則:當觀測值(或可以假設)同樣可能高於或低於平均值並且更可能接近平均值而不是遠離平均值時,大約95%它們將在均值兩側的2個標準差內。
與標準差不同,均值的標準誤差SEM不會總結觀察值的可變性,也不會讓讀者深入了解觀察值的範圍。為什麼大多數作者使用SEM來總結他們的數據?一是傳統;其次,SEM總是小於標準差。如果作者報告了平均值和樣本量的SEM,讀者可以使用簡單的公式計算標準差:
例如,假設一篇文章報導九名健康成人的舒張壓為78 ± 2 mm Hg(平均值 ± SEM)。應該包括大約95%的觀察結果的舒張壓範圍是多少?平均值的SEM為2,樣本量為9,因此標準偏差(SD)為6 mm Hg。
答案是66-90 mm Hg,
結果和上一個例子一樣。
相反,如果將「2 個標準差規則」直接用到平均值和SEM來判斷舒張壓的範圍,就應該是
這個範圍其實並不能反映常規的變化範圍(範圍過窄)。
那麼,SEM衡量的是什麼呢? 在一個實驗中,研究者很少研究一個群體中所有可能的成員,而只研究一個小的、有代表性的樣本。從這樣一個樣本計算出的平均值是對真實平均值的估計,如果可以觀察到總體的所有成員,就可以計算出真實平均值。*因為用於計算平均值的樣本是由被研究總體中隨機抽取的個體組成的,所以這個樣本及其平均值沒有什麼特別之處。特別是,如果抽籤的運氣不同,研究人員就會抽取包含不同個人的樣本,並計算出不同的平均值。同樣地,偶然可能導致第三次觀察收集和第三次相關的均值。這三個樣本都有一個均值,每個樣本均值都是真實總體均值的估計。理論上,人們可以計算出所有可能樣本的平均值。一般來說,每一個樣本均值都是不同的,但如果能夠觀察到總體的所有成員,那麼所有的均值都會聚集在真實均值周圍。所有可能樣本均值的標準差就是SEM。
因此,SEM並不像標準差那樣量化觀測值的可變性,而是樣本均值估計真實總體均值的精度。也就是說,SEM量化了人們可以從樣本中估計真實總體均值的確定性。
最後回到舒張壓的例子,九名健康成人的樣本讓讀者有95%的信心相信所有健康成人的平均舒張壓為74-82 mm Hg。過窄的數據範圍並沒有說明數據的真實可變性。
因此,應該使用標準差SD而不是平均值的標準誤SEM來總結數據。
你學會了嗎?歡迎關注我們,了解更多硬核乾貨!
,