p-değeri Nedir?
Bir p-değeri, sıfır hipotezinin (H₀) doğru olduğu varsayıldığında, bir çalışmada elde edilen sonuçlar kadar uç sonuçların gözlemlenme olasılığını nicelendirir. Şu soruyu yanıtlar: “Sıfır hipotezi doğruysa, verilerimin bu kadar uç olma olasılığı nedir?”
Temel Tanımlar
- Sıfır Hipotezi (H₀): Varsayılan durum (örneğin, “etki yok”).
- Alternatif Hipotez (H₁): Test edilen iddia (örneğin, “bir etki var”).
- Test İstatistiği: Örneklem verilerinden hesaplanan standartlaştırılmış bir değer (örneğin, Z-skoru, t-skoru).
Tarihsel Bağlam
p-değeri, 1920’lerde Ronald Fisher tarafından popüler hale getirildi. Fisher, istatistiksel anlamlılık için 0,05 eşiğini önerdi; bu kural hala tartışılmaktadır.
Formüller
p-değeri, test istatistiğine ve hipotez testinin türüne bağlıdır:
Genel Formül
Burada test istatistiğini ve gözlemlenen değeri temsil eder.
Z-testi
Z-skoru olan bir Z-testi için:
- Sol kuyruk:
- Sağ kuyruk:
- Çift kuyruk:
t-testi
t-skoru ve serbestlik derecesi olan bir t-testi için:
- Sol kuyruk:
- Sağ kuyruk:
- Çift kuyruk:
Ki-kare (χ²) Testi
serbestlik dereceli χ²-skoru için:
- Sol kuyruk:
- Sağ kuyruk:
F-testi
serbestlik dereceli F-skoru için:
- Sol kuyruk:
- Sağ kuyruk:
Örnekler
Örnek 1: Popülasyon Ortalaması için Z-testi
Senaryo: Bir fabrika, ampullerin 1 200 saat dayandığını iddia ediyor. 50 ampulden oluşan bir örneklemde , . Ortalamanın iddia edilenden az olup olmadığını test edin.
Çözüm:
- Sol kuyruk p-değeri: .
Sonuç: düzeyinde H₀ reddedilemez.
Örnek 2: Bağımsızlık için Ki-kare Testi
Senaryo: Bir anket, cinsiyet (Erkek/Kadın) ve tercih (Evet/Hayır) arasındaki bağımsızlığı test ediyor. Gözlemlenen χ² = 6,25, .
Çözüm:
- Sağ kuyruk p-değeri: .
Sonuç: düzeyinde H₀ reddedilir.
Yorumlama Rehberi
- p-değeri < 0,01: H₀’a karşı güçlü kanıt.
- 0,01 ≤ p-değeri < 0,05: H₀’a karşı orta düzeyde kanıt.
- p-değeri ≥ 0,05: H₀’ı reddetmek için yetersiz kanıt.
Yaygın Yanılgılar
- Efsane: Yüksek p-değeri H₀’ı “kanıtlar”.
Gerçek: Yalnızca H₀’a karşı yetersiz kanıt olduğunu gösterir. - Efsane: p-değeri = H₀’ın doğru olma olasılığı.
Gerçek: p-değeri H₀’ın doğru olduğu varsayımına dayanır; H₀’ın olasılığını ölçmez.
Sıkça Sorulan Sorular
p-değeri negatif olabilir mi?
Hayır. P-değerleri olasılıkları temsil eder ve 0 ile 1 arasında olmalıdır.
p-değeri 0,07 nasıl yorumlanır?
düzeyinde H₀ reddedilemez. Ancak bu sonuç marjinal olarak anlamlıdır ve daha fazla inceleme gerektirir.
Neden 0,05 yaygın bir anlamlılık düzeyidir?
Fisher tarafından popüler hale getirilen 0,05, Tip I hatası (yanlış pozitifler) ve duyarlılık arasında denge sağlar. Ancak bu keyfidir ve alana bağlıdır (örneğin, fizikte , kullanılır).
Örneklem büyüklüğü p-değerlerini nasıl etkiler?
Daha büyük örneklemler testin duyarlılığını artırır ve küçük etkilerin tespit edilmesini kolaylaştırır. P-değerleriyle birlikte etki büyüklüğünü (örneğin, Cohen’in d’si) mutlaka rapor edin.
Tek kuyruklu ve çift kuyruklu testler arasındaki fark nedir?
- Tek kuyruk: Tek yönlü bir etkiyi test eder (örneğin, “büyüktür”).
- Çift kuyruk: Herhangi bir yöndeki etkiyi test eder. Kuyruk olasılığının katını kullanır.