p 値とは何か?
p 値は、**帰無仮説(H₀)**が真であると仮定した場合に、研究で得られた結果と同じくらい極端な結果が観測される確率を定量化します。これは、「帰無仮説が真である場合、自分のデータが得られる可能性はどの程度か?」という問いに答えます。
主な定義
- 帰無仮説(H₀): デフォルトの仮定(例:「効果なし」)。
- 対立仮説(H₁): 検証される主張(例:「効果が存在する」)。
- 検定統計量: サンプルデータから計算される標準化された値(例:Z スコア、t スコア)。
歴史的経緯
p 値は 1920 年代にロナルド・フィッシャーによって普及しました。フィッシャーは統計的有意性の閾値として0.05を提案し、この慣習は現在も議論の的となっています。
数式
p 値は検定統計量と仮説検定の種類に依存します:
一般式
ここで、は検定統計量、はその観測値です。
Z 検定
Z スコアを用いた Z 検定の場合:
- 左側検定:
- 右側検定:
- 両側検定:
t 検定
t スコアと自由度を用いた t 検定の場合:
- 左側検定:
- 右側検定:
- 両側検定:
カイ二乗(χ²)検定
自由度の χ² スコアの場合:
- 左側検定:
- 右側検定:
F 検定
自由度の F スコアの場合:
- 左側検定:
- 右側検定:
例題
例 1: 母平均の Z 検定
シナリオ: 工場が電球の寿命は 1200 時間と主張。50 個のサンプルで、。平均が主張値未満か検定せよ。
解答:
- 左側 p 値:
結論: では H₀ を棄却できない。
例 2: 独立性のカイ二乗検定
シナリオ: 性別(男性/女性)と選好(Yes/No)の独立性を調査。観測 χ² = 6.25、自由度。
解答:
- 右側 p 値:
結論: で H₀ を棄却。
解釈ガイド
- p 値 < 0.01: H₀ に対する強力な反証。
- 0.01 ≤ p 値 < 0.05: H₀ に対する中程度の反証。
- p 値 ≥ 0.05: H₀ を棄却する十分な証拠なし。
一般的な誤解
- 誤解: 高い p 値は H₀ を「証明」する。
事実: 単に H₀ に対する反証が不十分であることを示す。 - 誤解: p 値 = H₀ が真である確率。
事実: p 値は H₀ が真であると仮定した場合の確率であり、H₀ 自体の尤度を測るものではない。
よくある質問
p 値は負になり得るか?
なり得ない。p 値は確率を表すため 0 から 1 の間でなければならない。
p 値 0.07 はどう解釈する?
では H₀ を棄却できない。ただしこの結果は限定的な有意性を示し、追加研究が望ましい。
なぜ 0.05 が一般的な有意水準か?
フィッシャーが普及させた 0.05 は、第 I 種過誤(偽陽性)と検出力のバランスを取る。ただしこれは恣意的で分野依存(例:物理学では、を使用)。
サンプルサイズは p 値にどう影響する?
サンプルサイズが大きいほど検出力が上がり、微小な効果も検出しやすくなる。p 値と併せて効果量(例:コーエンの d)を報告すべき。
片側検定と両側検定の違いは?
- 片側検定: 一方向の効果を検定(例:「より大きい」)。
- 両側検定: 方向性のない効果を検定。尾部確率をする。