p값이란?
p값은 **귀무가설(H₀)**이 참이라고 가정할 때, 연구에서 얻은 결과만큼 극단적인 결과를 관측할 확률을 수치화합니다. 이는 “귀무가설이 참이라면, 내 데이터가 나올 확률은 얼마인가?” 라는 질문에 답합니다.
주요 정의
- 귀무가설(H₀): 기본 가정 (예: “효과 없음”).
- 대립가설(H₁): 검정하려는 주장 (예: “효과 존재”).
- 검정 통계량: 표본 데이터로 계산된 표준화된 값 (예: Z-점수, t-점수).
역사적 배경
p값은 1920년대 로널드 피셔(Ronald Fisher)가 대중화했습니다. 피셔는 통계적 유의성 기준으로 0.05를 제안했으며, 이 관례는 여전히 논쟁의 대상입니다.
공식
p값은 검정 통계량과 검정 유형에 따라 결정됩니다:
일반 공식
여기서 는 검정 통계량, 는 관측값입니다.
Z-검정
Z-점수 에 대한 Z-검정:
- 좌측:
- 우측:
- 양측:
t-검정
t-점수 및 에 대한 t-검정:
- 좌측:
- 우측:
- 양측:
카이제곱(χ²) 검정
자유도 인 χ²-점수:
- 좌측:
- 우측:
F-검정
자유도 인 F-점수:
- 좌측:
- 우측:
예제
예제 1: 모평균에 대한 Z-검정
시나리오: 공장에서 전구 수명이 1200시간이라고 주장합니다. 50개 표본의 평균 , 표준편차 . 평균이 주장보다 작은지 검정하세요.
풀이:
- 좌측 p값:
결론: 에서 H₀ 기각 불가.
예제 2: 독립성 카이제곱 검정
시나리오: 성별(남/녀)과 선호도(예/아니오)의 독립성을 조사합니다. 관측 χ² = 6.25, .
풀이:
- 우측 p값:
결론: 에서 H₀ 기각.
해석 가이드
- p값 < 0.01: H₀에 대한 강한 증거.
- 0.01 ≤ p값 < 0.05: H₀에 대한 중간 증거.
- p값 ≥ 0.05: H₀ 기각할 증거 부족.
흔한 오해
- 오해: 높은 p값은 H₀를 “증명”한다.
진실: H₀에 대한 증거 부족만을 나타냅니다. - 오해: p값 = H₀가 참일 확률.
진실: p값은 H₀가 참이라고 가정한 확률이며, H₀ 자체의 확률이 아닙니다.
FAQ
p값이 음수일 수 있나요?
아닙니다. p값은 0과 1 사이의 확률입니다.
p값 0.07은 어떻게 해석하나요?
에서는 H₀를 기각할 수 없지만, 경계선 결과로 추가 연구가 필요합니다.
왜 0.05가 유의수준으로 흔히 사용되나요?
피셔가 대중화한 0.05는 1종 오류(거짓 양성)와 검정력을 절충합니다. 하지만 이는 임의적이며 분야에 따라 다릅니다(예: 물리학은 , 사용).
표본 크기가 p값에 미치는 영향은?
큰 표본은 작은 효과도 탐지하기 쉽게 합니다. 효과 크기(예: 코헨의 d)를 함께 보고하세요.
단측 검정 vs 양측 검정 차이는?
- 단측: 한 방향의 효과 검정(예: “보다 큼”).
- 양측: 모든 방향의 효과 검정. 꼬리 확률을 로 계산합니다.