쉬운 말로 기초
베이즈 정리는 새로운 정보에 기반하여 신념을 조정하도록 도와줍니다. 그것은 “증거를 본 지금 내 추측이 얼마나 가능한가?”라는 질문에 답하는 수학 도구라고 생각하십시오.
오늘 비가 올지 알아보려 한다고 상상해보세요. 베이즈 정리는 세 가지 핵심 정보를 사용합니다:
- 초기 추측(예: 비 올 확률 20%).
- 추측이 사실일 경우 증거가 발생할 확률(예: 비가 올 때 짙은 구름이 90% 확률로 나타남).
- 일반적으로 증거가 발생하는 빈도(예: 어떤 날에든 짙은 구름이 나타날 가능성 10%).
공식은 이것들을 결합하여 당신에게 업데이트된 확률을 제공합니다:
계산기를 사용해보세요
이 도구는 누락된 값을 해결할 수 있게 해줍니다. 세 개의 퍼센트(0-100%)를 입력하고 계산할 대상을 선택하세요:
필드 | 의미 | 예제 (비 예보) |
---|---|---|
P(H): 사전확률 | 증거 전의 초기 신념 | 오늘 비가 올 확률 20% |
P(E⎮H): 가능성 | 추측이 사실일 경우 증거를 볼 확률 | 비가 올 때 짙은 구름이 나타날 확률 90% |
P(E): 총 증거 | 증거가 전체적으로 얼마나 빈번한가 | 전체적으로 약 10%의 날에 짙은 구름 |
P(H⎮E): 사후확률 | 증거 후의 업데이트된 신념 | 계산기가 해결합니다! |
예제:
구름이 어두운 날씨 (증거)를 보면, 계산기는 비 확률이 20%에서 64%로 상승할 수 있다고 알려줄 수 있습니다.
실제 생활 예시
1. 의료 테스트: “정확도 95%“가 오해를 줄 수 있는 이유
- 사전확률: 오직 1%의 사람들만이 X병을 앓고 있습니다.
- 가능성: 검사는 환자에게 95% 정확합니다.
- 거짓 경보: 검사는 건강한 사람들에게 5% 잘못되었습니다.
- 총 증거:
- 업데이트된 신념:
양성 테스트는 95%가 아닌 단지 16%의 위험을 의미합니다!
2. 스팸 이메일: “무료”가 필터를 작동시키는 방법
- 사전확률: 이메일 2%가 스팸입니다.
- 가능성: 스팸 이메일의 80%는 “무료”라고 씁니다.
- 거짓 경보: 실제 이메일의 0.1%는 “무료”라고 씁니다.
- 업데이트된 신념:
“무료”라는 이메일은 94%의 스팸 확률을 가집니다.
단계별 계산기 가이드
시나리오: 드문 알레르기 (사전확률 1%) 후에 양성 테스트 결과를 받은 후 알레르기일 가능성을 알고 싶습니다 (알레르기가 있을 때 테스트가 90% 정확, 거짓 양성 8%).
- 사전확률 입력: ‘1%’ (알레르기가 얼마나 흔한지).
- 가능성 입력: ‘90%’ (알레르기일 때 테스트의 정확성).
- 총 증거 입력:
- 사후확률 계산:
결과: 양성 테스트는 실제로 알레르기가 있을 확률이 단지 10%임을 의미합니다!
피해야 할 일반적인 실수
- 기준률을 무시하기: 초기 확률을 잊지 마세요 (예: 드문 질병은 양성 테스트가 있어도 여전히 드문 경우입니다).
- “정확도”의 혼동: 테스트의 “정확도 95%“는 아픈 가능성이 95%임을 의미하지 않습니다. 질병의 빈도에 따라 다릅니다.
- 거짓 양성을 잊어버리기: 항상 “이 증거가 우연히 얼마나 자주 발생하는가?”라고 자문하세요.
현재 베이즈 정리가 중요한 이유
- AI & Netflix 추천: 관찰한 바에 따라 예측을 업데이트합니다.
- 자율 주행차: 실시간 센서 데이터를 사용하여 결정을 조정합니다.
- COVID 테스트: 저위험 대 고위험 그룹에서 결과 해석을 돕습니다.
자주 묻는 질문
소수 대신 퍼센트를 사용할 수 있나요?
네! 계산기는 0–100% 입력과 함께 작동합니다 (0.05 = 5% 필요 없음).
”총 증거”를 모르는 경우?
도구에서 “P(E) 계산”을 선택하세요. 다음을 사용합니다:
베이즈 정리는 여러 업데이트에 효과가 있나요?
물론입니다! 다음 증거를 위해 새로운 사전으로 사후(업데이트된 신념)를 사용하세요.