본문 바로가기

데이터 교육/엑셀

[엑셀] 분산 분석

출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel


 

1. 분산 분석 이란?

01) 분산 분석 개념

두 개 이상 다수의 집단을 비교하여, 평균의 차이가 있는지를 검정

 

02) 분산 분석 방법

집단 개수에 따라 분산 분석의 방법이 달라짐

집단이 2개일 때  T-test
집단이 3개 이상일 때   ANOVA

 

 

03) F 검정

두 집단의 등분산성(분산이 같은지 여부)을 검정하여, 각 상황에 맞는, t-test 방법을 선정하기 위해 사용.

P-value가 0.05보다 크면 두 집단의 분산은 같고 → Student's t-test
P-value가 0.05보다 작으면 두 집단의 분산은 다르다 → Welch's t-test

 


2. 실습 1: 2019년도 상반기& 하반기의 매출 분석

01) F검정: 상반기와 하반기 사이의 매출액 분산 분석

(1)데이터 탭 데이터분석 탭 → F검정: 분산에 대한 두 집단 탭

 

 

(2) 변수 입력

변수1 상반기 매출액
변수2 하반기 매출액

 

 

(3) 결론: P값이 0.05보다 크므로, 상반기 하반기에 분산의 차이는 없다.

**P-value가 0.05보다 크면 두 집단의 분산은 같다

>>> 등분산성(분산이 같다)이다

 


 

02) T검정 (등분산성이 같기 때문에)

(1)"데이터" 탭  "데이터분석" 탭 → "T검정: 등분산 가정 두 집단" 탭

 

 

(2) 변수 입력

변수1 상반기 매출액
변수2 하반기 매출액

 

 

(3) 결론: T-test P값이 0.3

**P-value가 0.05보다 크면 두 집단의 분산은 같다

19년도 상반기와 하반기의 매출액 평균의 차이는 없다

 


 

3. 실습2: 2019상반기& 2020상반기 매출 분석

01) F검정

(1)데이터 탭  데이터분석 탭 → F검정: 분산에 대한 두 집단 탭

 

(2) 변수 입력

변수1 2019 상반기 매출액
변수2 2020 상반기 매출액

 

(3) 결론: P값이 0.05보다 작으므로, 상반기 하반기에 분산의 차이가 있다.

**P-value가 0.05보다 작으면 두 집단의 분산은 다르다

>>> 이분산성(분산이 다르다) 이다


 

02) T-test

(1)"데이터" 탭  "데이터분석" 탭 → "T검정: 이분산 가정 두 집단" 탭

 

(2) 변수 입력

변수1 2019 상반기 매출액
변수2 2020 상반기 매출액

 

(3) 결론: T-test P값이 0.02

**P-value가 0.05보다 작으면 두 집단의 분산은 다르다

19년도 상반기와 하반기의 매출액 평균은 유의미하게 변했다.