가설
H0 / 귀무가설 / Null Hypothesis
- 대립가설이 증명되기 전까지 유지하는 가정
- H0이 옳음을 증명할 필요는 없다
- 법정에서 무죄추정의 원칙과 비슷
H1 / 대립가설 / Alternative Hypothesis
- 채택하려면 증명이 필요함
- 증거가 강하다면 귀무가설을 기각한다(reject H0)
- 증거가 불충분하면 -> 귀무가설을 기각하지 못한다(do not reject H0)
Test-statistic / 검정 통계량
절대값이 0보다 커질수록 H1이라는 증거가 강해짐
P-value
- H0 귀무가설이 옳을 확률과 비례함
대체로 0.05(5%) 기준으로 판단한다
가설검정의 절차
- 두가지 가설을 설정한다
- 귀무가설이 맞다는 전제하에 절차를 시작
- 대립가설에 대한 증거값을 계산
- 방법1) 유의 확률에 의한 검정
- 방법2) 임계값에 의한 검정
- 두가지 선택지 중 의사결정
- 충분한 증거에 의해서 대립가설이 맞다(귀무가설 기각)
- 불충분한 증거에 의해서 귀무가설이 맞다(귀무가설을 기각하지 못함)
예시
케첩공장에서 생산되는 제품의 평균 수요가 350을 초과하는지 결정하고자 한다.
1. 가설 세우기
2. 귀무가설이 맞다는 전제하에 절차 시작.
3. 대립가설에 대한 증거값을 계산
3-1. P-value(유의 확률) 계산
- P 값이 작을수록 대립가설에 대한 증거는 강해진다.
- 일반적으로 P-value < 0.05인 경우 귀무가설을 기가한다.0.05를 유의 수준 α라고 한다.
3-2. Critical value(임계값) 계산
- 일반적으로 꼬리면적이 0.05가 되도록 임계값을 설정한다.
- 임계값을 초과하면 대립가설이 채택된다.(좌측검정일때는 임계값 미만일 때)
* 임계값을 초과한 표본 평균 값이 나왔는지, 유의수준 미만의 p-value가 나왔는지 둘중 하나만 확인하면 됨.
4. 의사결정
- 임계값을 초과하였으므로 귀무가설을 기각하고 대립가설을 채택한다.
- 유의수준 미만의 p-value가 계산되었으므로 귀무가설을 기각하고 대립가설을 채택한다.
가설 검정의 종류
가설 검정의 오류
실제 현상 | |||
귀무가설 H0가 참 | 대립가설 H1이 참 | ||
검정 결과 | 귀무가설 H0를 기각하지 못함 | 올바른 의사 결정 | 제2종 오류 |
귀무가설 H0를 기각 | 제1종 오류 | 올바른 의사 결정 |
제1종 오류(type I error)
실제로는 귀무가설 H0가 사실인데, 표본으로 부터 계산된 검정통계량 관측치가 우연히 기각역에 포함되어, 귀무가설 H0을 기각하게 되는 오류(제1종 오류 확률을 α 혹은 유의수준이라고 표기한다.)
제2종 오류(type II error)
실제로는 대립가설 H1이 사실인데, 표본으로부터 계산된 검정통계량 관측치가 우연히 기각역에 포함되지 못하여, 귀무가설 H0을 기각하지 못하게 되는 오류(제2종 오류 확률을 β이라고 표기한다.)
'ML | DL | Big data > Data Science' 카테고리의 다른 글
분산 분석 - Analysis of Variance(ANOVA) (0) | 2023.03.02 |
---|---|
정규성 검정 및 변환 (0) | 2023.02.28 |
표본/분산 차이에 대한 가설 검정 방법 (0) | 2023.02.28 |
빅데이터 개요 (0) | 2023.02.28 |
불균형 클래스 분류(Imbalanced Classification)를 위한 4가지 방법 (2) | 2020.09.04 |
누락 데이터(Missing value)를 처리하는 7가지 방법 / Data Imputation (1) | 2020.08.14 |
댓글