統(tǒng)計學中最重要的概念之一就是P值的定義。無論是使用哪種數(shù)據(jù)分析軟件(Excel,R,SAS等)對數(shù)據(jù)進行統(tǒng)計分析時,P值都是關(guān)鍵的輸出之一。之前的文章(正態(tài)分布)(此處增加文章鏈接)簡單介紹了P值。但由于其在統(tǒng)計學中的重要性,加上大家對P值的詢問量,所以本期的統(tǒng)計專欄將帶大家進一步的認識什么是P值。(溫馨提示:熬過三段文字就可以看漫畫啦?。。?/p>
首先,來復習一下假設檢驗,因為有假設檢驗的地方就有P值。假設檢驗是先對總體數(shù)據(jù)提出一個假設值,然后利用樣本信息判斷這一假設是否成立。例如,為了控制成本,國民女神某干媽,使用新辣椒替代原來的舊辣椒(老款辣椒),我們想要知道這樣生產(chǎn)出來的辣醬口感是否有差異。此時我們無法對總體數(shù)據(jù)(全部人對新辣椒與舊辣椒的評價)進行評估,我們只能從總體中隨機抽樣得到樣本數(shù)據(jù)進行分析。我們會設置兩個假設:
1. 原假設/零假設(H0):由新辣椒為原材料制作的辣椒醬口感 = 由舊辣椒為原材料制作的辣椒醬口感(新辣椒與舊辣椒無差異)
2. 備擇假設(H1):由新辣椒為原材料制作的辣椒醬口感 ≠ 由舊辣椒為原材料制作的辣椒醬口感(新辣椒與舊辣椒有差異)
在進行假設檢驗時,我們一般希望拒絕H0,從而接受H1。假設檢驗又分為雙邊假設(上述例子)和單邊假設。例如:我們心里的預期是原來的舊辣椒口感更好時:
1. 原假設/零假設(H0):由舊辣椒為原材料制作的辣椒醬口感 ≤ 由新辣椒為原材料制作的辣椒醬口感
2. 備擇假設(H1):由舊辣椒為原材料制作的辣椒醬口感 > 由新辣椒為原材料制作的辣椒醬口感 (單邊假設)
所以可以總結(jié)為,當備擇假設沒有特定的方向性,形式為“≠”時,這種檢驗假設稱為雙側(cè)檢驗。當備擇假設帶有特定的方向性, 形式為">","<"的假設檢驗,稱為單側(cè)檢驗 "<"稱為左側(cè)檢驗, ">"稱為右側(cè)檢驗。
回到主題,P 值是Probability density Value的縮寫,所以它的取值在0和1 之間。用正式的術(shù)語來說,P值是當原假設為真時,隨機抽樣將產(chǎn)生一個比我們的樣本數(shù)據(jù)估計值更偏離假設值時的概率。用不太正式的術(shù)語來說,P 值告訴我們?nèi)绻僭O為真,得到這樣的結(jié)果的可能性有多大。定義對非統(tǒng)計專業(yè)人士太抽象,所以請看本期的漫畫小劇場:
2022年開始,伊之助沉迷水果布丁。但是近日,他覺得水果布丁中的水果含量沒有達到標準值(包裝上寫明每200克含有70克及以上的水果)。
看完漫畫你也許會有以下疑問:
1. 顯著水平可以是除了0.05 以外的值嗎?
2. 為什么P值小于0.05就可以拒絕原假設?
首先第一個問題的答案是肯定的,顯著水平通常有0.05,0.01,0.005等等,但是0.05是最常用的選擇。
Figure 1 各個數(shù)值的P值解釋
關(guān)于第二個問題,回到P值的定義,假如我們得到的P值是0.04,即如果原假設(布丁中的水果含量大于等于70g)為真時,抽樣計算得到68.7g或者更小值的概率是4%。這相當于是一個小概率事件,也就是說在原假設成立的情況下,小概率事件發(fā)生了,因此要拒絕原假設。
總結(jié):
根據(jù)假設檢驗得到的P值,通常將它與0.05的顯著水平相比較,如果P值大于等于0.05,則不能拒絕原假設。如果P值小于0.05,則可以拒絕原假設,接受備擇假設。需要注意的是,P值因為直觀易懂,非統(tǒng)計學專業(yè)研究者也可以使用P值,因此也被廣泛應用于醫(yī)學研究中。但這也伴隨著P值被濫用的問題。特別是在醫(yī)學實驗中,不僅需要關(guān)注統(tǒng)計學意義的顯著性還需要結(jié)合醫(yī)學意義。P值不能代表實驗的全部,仍然需要其他統(tǒng)計分析來支持實驗結(jié)果。
Reference:
P-value in statistics: Understanding the p-value and what it tells us - Statistics Help - YouTube
1478: P 值 - 解釋 xkcd (explainxkcd.com)(Figure 1)
注:漫畫人物來自動漫鬼滅之刃,侵權(quán)刪。