[엑셀] 분산 분석
출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel
1. 분산 분석 이란?
01) 분산 분석 개념
두 개 이상 다수의 집단을 비교하여, 평균의 차이가 있는지를 검정
02) 분산 분석 방법
집단 개수에 따라 분산 분석의 방법이 달라짐
집단이 2개일 때 | → T-test |
집단이 3개 이상일 때 | → ANOVA |
03) F 검정
두 집단의 등분산성(분산이 같은지 여부)을 검정하여, 각 상황에 맞는, t-test 방법을 선정하기 위해 사용.
P-value가 0.05보다 크면 두 집단의 분산은 같고 | → Student's t-test |
P-value가 0.05보다 작으면 두 집단의 분산은 다르다 | → Welch's t-test |
2. 실습 1: 2019년도 상반기& 하반기의 매출 분석
01) F검정: 상반기와 하반기 사이의 매출액 분산 분석
(1)데이터 탭 → 데이터분석 탭 → F검정: 분산에 대한 두 집단 탭
(2) 변수 입력
변수1 | 상반기 매출액 |
변수2 | 하반기 매출액 |
(3) 결론: P값이 0.05보다 크므로, 상반기 하반기에 분산의 차이는 없다.
**P-value가 0.05보다 크면 두 집단의 분산은 같다
>>> 등분산성(분산이 같다)이다 |
02) T검정 (등분산성이 같기 때문에)
(1)"데이터" 탭 → "데이터분석" 탭 → "T검정: 등분산 가정 두 집단" 탭
(2) 변수 입력
변수1 | 상반기 매출액 |
변수2 | 하반기 매출액 |
(3) 결론: T-test P값이 0.3
**P-value가 0.05보다 크면 두 집단의 분산은 같다
19년도 상반기와 하반기의 매출액 평균의 차이는 없다 |
3. 실습2: 2019상반기& 2020상반기 매출 분석
01) F검정
(1)데이터 탭 → 데이터분석 탭 → F검정: 분산에 대한 두 집단 탭
(2) 변수 입력
변수1 | 2019 상반기 매출액 |
변수2 | 2020 상반기 매출액 |
(3) 결론: P값이 0.05보다 작으므로, 상반기 하반기에 분산의 차이가 있다.
**P-value가 0.05보다 작으면 두 집단의 분산은 다르다
>>> 이분산성(분산이 다르다) 이다 |
02) T-test
(1)"데이터" 탭 → "데이터분석" 탭 → "T검정: 이분산 가정 두 집단" 탭
(2) 변수 입력
변수1 | 2019 상반기 매출액 |
변수2 | 2020 상반기 매출액 |
(3) 결론: T-test P값이 0.02
**P-value가 0.05보다 작으면 두 집단의 분산은 다르다
19년도 상반기와 하반기의 매출액 평균은 유의미하게 변했다. |