İstatistik

P-değeri hesaplayıcı

Hata bildirimi

Hesaplayıcıyı paylaş

Ücretsiz hesap makinemizi web sitenize ekleyin

Lütfen geçerli bir URL girin. Sadece HTTPS URL'leri desteklenir.

Sayfadaki hesap makinesi giriş alanlarında bulunan mevcut değerleri yerleşik hesap makinesinin varsayılan değerleri olarak kullanın.
Giriş kenar odak rengi, anahtar kutusu işaretli rengi, seçili öğe üzerine gelindiğinde görülen renk vb.

Kullanım Koşulları’na kabul edin.
Önizleme

Hesap makinesini kaydet

p-değeri Nedir?

Bir p-değeri, sıfır hipotezinin (H₀) doğru olduğu varsayıldığında, bir çalışmada elde edilen sonuçlar kadar uç sonuçların gözlemlenme olasılığını nicelendirir. Şu soruyu yanıtlar: “Sıfır hipotezi doğruysa, verilerimin bu kadar uç olma olasılığı nedir?”

Temel Tanımlar

  • Sıfır Hipotezi (H₀): Varsayılan durum (örneğin, “etki yok”).
  • Alternatif Hipotez (H₁): Test edilen iddia (örneğin, “bir etki var”).
  • Test İstatistiği: Örneklem verilerinden hesaplanan standartlaştırılmış bir değer (örneğin, Z-skoru, t-skoru).

Tarihsel Bağlam

p-değeri, 1920’lerde Ronald Fisher tarafından popüler hale getirildi. Fisher, istatistiksel anlamlılık için 0,05 eşiğini önerdi; bu kural hala tartışılmaktadır.

Formüller

p-değeri, test istatistiğine ve hipotez testinin türüne bağlıdır:

Genel Formül

p-deg˘eri={P(SxH0)(Sol kuyruk)P(SxH0)(Sag˘ kuyruk)2×min{P(SxH0),P(SxH0)}(C¸ift kuyruk)\text{p-değeri} = \begin{cases} P(S \leq x \mid H₀) & \text{(Sol kuyruk)} \\ P(S \geq x \mid H₀) & \text{(Sağ kuyruk)} \\ 2 \times \min\left\{P(S \leq x \mid H₀), P(S \geq x \mid H₀)\right\} & \text{(Çift kuyruk)} \end{cases}

Burada SS test istatistiğini ve xx gözlemlenen değeri temsil eder.

Z-testi

Z-skoru ZZ olan bir Z-testi için:

Z=Xˉμσ/nZ = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}
  • Sol kuyruk: Φ(Z)\Phi(Z)
  • Sağ kuyruk: 1Φ(Z)1 - \Phi(Z)
  • Çift kuyruk: 2×Φ(Z)2 \times \Phi(-|Z|)

t-testi

t-skoru ve df=n1df = n-1 serbestlik derecesi olan bir t-testi için:

t=Xˉμs/nt = \frac{\bar{X} - \mu}{s / \sqrt{n}}
  • Sol kuyruk: T_df(t)T\_{df}(t)
  • Sağ kuyruk: 1T_df(t)1 - T\_{df}(t)
  • Çift kuyruk: 2×T_df(t)2 \times T\_{df}(-|t|)

Ki-kare (χ²) Testi

kk serbestlik dereceli χ²-skoru için:

  • Sol kuyruk: χ2_k(x)\chi²\_{k}(x)
  • Sağ kuyruk: 1χ2_k(x)1 - \chi²\_{k}(x)

F-testi

(d1,d2)(d₁, d₂) serbestlik dereceli F-skoru için:

  • Sol kuyruk: F_d1,d2(x)F\_{d₁,d₂}(x)
  • Sağ kuyruk: 1F_d1,d2(x)1 - F\_{d₁,d₂}(x)

Örnekler

Örnek 1: Popülasyon Ortalaması için Z-testi

Senaryo: Bir fabrika, ampullerin 1 200 saat dayandığını iddia ediyor. 50 ampulden oluşan bir örneklemde Xˉ=1180\bar{X} = 1 180, σ=100\sigma = 100. Ortalamanın iddia edilenden az olup olmadığını test edin.
Çözüm:

Z=11801200100/501,414Z = \frac{1 180 - 1 200}{100 / \sqrt{50}} \approx -1,414
  • Sol kuyruk p-değeri: Φ(1,414)0,078\Phi(-1,414) \approx 0,078.
    Sonuç: α=0,05\alpha = 0,05 düzeyinde H₀ reddedilemez.

Örnek 2: Bağımsızlık için Ki-kare Testi

Senaryo: Bir anket, cinsiyet (Erkek/Kadın) ve tercih (Evet/Hayır) arasındaki bağımsızlığı test ediyor. Gözlemlenen χ² = 6,25, df=1df = 1.
Çözüm:

  • Sağ kuyruk p-değeri: 1χ2_1(6,25)0,0121 - \chi²\_{1}(6,25) \approx 0,012.
    Sonuç: α=0,05\alpha = 0,05 düzeyinde H₀ reddedilir.

Yorumlama Rehberi

  • p-değeri < 0,01: H₀’a karşı güçlü kanıt.
  • 0,01 ≤ p-değeri < 0,05: H₀’a karşı orta düzeyde kanıt.
  • p-değeri ≥ 0,05: H₀’ı reddetmek için yetersiz kanıt.

Yaygın Yanılgılar

  1. Efsane: Yüksek p-değeri H₀’ı “kanıtlar”.
    Gerçek: Yalnızca H₀’a karşı yetersiz kanıt olduğunu gösterir.
  2. Efsane: p-değeri = H₀’ın doğru olma olasılığı.
    Gerçek: p-değeri H₀’ın doğru olduğu varsayımına dayanır; H₀’ın olasılığını ölçmez.

Sıkça Sorulan Sorular

p-değeri negatif olabilir mi?

Hayır. P-değerleri olasılıkları temsil eder ve 0 ile 1 arasında olmalıdır.

p-değeri 0,07 nasıl yorumlanır?

α=0,05\alpha = 0,05 düzeyinde H₀ reddedilemez. Ancak bu sonuç marjinal olarak anlamlıdır ve daha fazla inceleme gerektirir.

Neden 0,05 yaygın bir anlamlılık düzeyidir?

Fisher tarafından popüler hale getirilen 0,05, Tip I hatası (yanlış pozitifler) ve duyarlılık arasında denge sağlar. Ancak bu keyfidir ve alana bağlıdır (örneğin, fizikte 5σ5\sigma, p3×107p \approx 3 \times 10^{-7} kullanılır).

Örneklem büyüklüğü p-değerlerini nasıl etkiler?

Daha büyük örneklemler testin duyarlılığını artırır ve küçük etkilerin tespit edilmesini kolaylaştırır. P-değerleriyle birlikte etki büyüklüğünü (örneğin, Cohen’in d’si) mutlaka rapor edin.

Tek kuyruklu ve çift kuyruklu testler arasındaki fark nedir?

  • Tek kuyruk: Tek yönlü bir etkiyi test eder (örneğin, “büyüktür”).
  • Çift kuyruk: Herhangi bir yöndeki etkiyi test eder. Kuyruk olasılığının 2×2 \times katını kullanır.