Apa Itu Nilai-p?
Nilai-p mengkuantifikasi probabilitas untuk mengamati hasil yang sama ekstremnya dengan hasil yang diperoleh dalam suatu studi, dengan asumsi hipotesis nol (H₀) benar. Ini menjawab: “Jika hipotesis nol benar, seberapa mungkin data saya?”
Definisi Kunci
- Hipotesis Nol (H₀): Asumsi default (mis., “tidak ada efek”).
- Hipotesis Alternatif (H₁): Klaim yang diuji (mis., “ada efek”).
- Statistik Uji: Nilai terstandarisasi (mis., skor-Z, skor-t) yang dihitung dari data sampel.
Konteks Historis
Nilai-p dipopulerkan oleh Ronald Fisher pada 1920-an. Fisher menyarankan ambang 0,05 untuk signifikansi statistik, konvensi yang masih diperdebatkan hingga kini.
Rumus
Nilai-p bergantung pada statistik uji dan jenis uji hipotesis:
Rumus Umum
dengan sebagai statistik uji dan sebagai nilai yang diamati.
Uji-Z
Untuk uji-Z dengan skor-Z :
- Ujung kiri:
- Ujung kanan:
- Dua ujung:
Uji-t
Untuk uji-t dengan skor dan :
- Ujung kiri:
- Ujung kanan:
- Dua ujung:
Uji Chi-kuadrat (χ²)
Untuk skor χ² dengan derajat kebebasan:
- Ujung kiri:
- Ujung kanan:
Uji-F
Untuk skor-F dengan derajat kebebasan:
- Ujung kiri:
- Ujung kanan:
Contoh
Contoh 1: Uji-Z untuk Rata-Rata Populasi
Skenario: Pabrik mengklaim lampu tahan 1.200 jam. Sampel 50 lampu menunjukkan , . Uji apakah rata-rata lebih rendah dari klaim.
Solusi:
- Nilai-p ujung kiri: .
Kesimpulan: Gagal menolak H₀ pada .
Contoh 2: Uji Chi-kuadrat Independensi
Skenario: Survei menguji apakah gender (Laki-laki/Perempuan) dan preferensi (Ya/Tidak) independen. χ² teramati = 6,25, .
Solusi:
- Nilai-p ujung kanan: .
Kesimpulan: Tolak H₀ pada .
Panduan Interpretasi
- nilai-p < 0,01: Bukti kuat melawan H₀.
- 0,01 ≤ nilai-p < 0,05: Bukti moderat melawan H₀.
- nilai-p ≥ 0,05: Bukti tidak cukup untuk menolak H₀.
Kesalahpahaman Umum
- Mitos: Nilai-p tinggi “membuktikan” H₀.
Fakta: Hanya menunjukkan bukti tidak cukup melawan H₀. - Mitos: nilai-p = Probabilitas H₀ benar.
Fakta: Nilai-p mengasumsikan H₀ benar; tidak mengukur kemungkinan H₀.
FAQ
Bisakah nilai-p negatif?
Tidak. Nilai-p merepresentasikan probabilitas dan harus antara 0 dan 1.
Bagaimana menginterpretasikan nilai-p 0,07?
Pada , H₀ tidak ditolak. Namun, hasil ini marginal dan perlu studi lanjut.
Mengapa 0,05 umum digunakan sebagai tingkat signifikansi?
Dipopulerkan Fisher, 0,05 menyeimbangkan Kesalahan Tipe I (false positive) dan sensitivitas. Namun, ini arbitrer dan bergantung bidang (mis., fisika menggunakan , ).
Bagaimana ukuran sampel memengaruhi nilai-p?
Sampel besar meningkatkan sensitivitas, mendeteksi efek kecil. Selalu laporkan ukuran efek (mis., d Cohen) bersama nilai-p.
Apa beda uji satu ujung dan dua ujung?
- Satu ujung: Menguji efek ke satu arah (mis., “lebih besar dari”).
- Dua ujung: Menguji efek ke segala arah. Menggunakan probabilitas ujung.