본문 바로가기

데이터 교육/엑셀

[엑셀] 회귀 분석

출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel


 

1. 회귀 분석이란?

01) 회귀 분석 개념

두 개 이상의 연속형 변수(수치)인 종속 변수독립 변수 간의 관계를 파악하는 분석

EX. 광고비(독립 변수)의 변화에 따른 매출액(종속 변수)의 변화를 알고 싶을 때

 

02) 회귀 분석의 목적

- 두 변수 간의 관계 파악

- 미래 값 예측

 

 

03) 회귀 분석의 종류

독립 변수(X)의 개수에 따라 단순 회귀 분석과 다중 회귀 분석으로 구분

회귀 분석 단순 회귀 분석 독립 변수(X)가 한 개일 때
다중 회귀 분석 독립 변수(X)가 여러 개일 때

 

 

04) 회귀 분석의 평가와 해석

결정 계수 / F값 / Y절편 및 X1의 계수 확인


 

2. 단순 회귀 분석

01) 단순 회귀 분석 개념

독립변수(X)가 변할 때, 종속 변수(Y)값이 어떻게 변하는지를 가장 잘 설명해주는 직선을 찾아 분석하는 방법

 


 

02) 최소 제곱법 (LSE, Least Square Estimation)

전체적으로 오차가 최소가 되는 직선을 찾는 방법.

 

= 빨간 점선의 길이의 합이 가장 작은 직선

= 오차의 합이 가장 작은 직선

= 단, 오차는 +,-가 있으므로 오차를 제곱한 합이 가장 작은 직선을 선택

 


 

03) 단순 회귀 분석: 실습

 조건: 직원수(X: 독립변수)에 대한 매출액(Y: 종속변수)의 변화를 구해보자

(1)데이터 탭 → 데이터 분석 탭  회귀분석

 

(2) 데이터 입력

Y축 매출액
X축 직원수

 

(3)결과

결정계수 = 0.64 로, 직원수가 매출액에 영향을 준다고 말할 수 있다.(64%)

 


 

04) 단순 회귀 분석: 실습-산전도 그리기

**참고: https://marking.tistory.com/28 - 4.산점도

 조건2: 직원수(X: 독립변수)에 대한 매출액(Y: 종속변수)의 변화를 구해보자

(1) 삽입 탭 → 분산형 차트 삽입  마우스 우클릭 데이터 선택 추가 

 

(2) 계열 편집

 계열이름 = 직원수  X값 = 직원수  Y값 = 매출액 

 

(3) 완성(추세선 추가)

 


3. 다중 회귀 분석

01) 다중 회귀 분석: 개념

여러 개의 독립변수(X1,X2,X3...)종속변수(Y)에 미치는 영향을 파악

 

 

02) 다중 회귀 분석: 실습

(1)"데이터" 탭 → "데이터 분석" 탭  "회귀분석"

 

(2) 데이터 입력

Y축 매출액
X축 기간 광고비 교육비 판매수량 직원수 고객 제품수

 

(3)결과

조정된 결정 계수 = 0.96 으로, 다양한 종속변수를 고려하면 매출을 더 잘 설명한다