[엑셀] 회귀 분석
출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel
1. 회귀 분석이란?
01) 회귀 분석 개념
두 개 이상의 연속형 변수(수치)인 종속 변수와 독립 변수 간의 관계를 파악하는 분석
EX. 광고비(독립 변수)의 변화에 따른 매출액(종속 변수)의 변화를 알고 싶을 때
02) 회귀 분석의 목적
- 두 변수 간의 관계 파악
- 미래 값 예측
03) 회귀 분석의 종류
독립 변수(X)의 개수에 따라 단순 회귀 분석과 다중 회귀 분석으로 구분
회귀 분석 | 단순 회귀 분석 | 독립 변수(X)가 한 개일 때 |
다중 회귀 분석 | 독립 변수(X)가 여러 개일 때 |
04) 회귀 분석의 평가와 해석
결정 계수 / F값 / Y절편 및 X1의 계수 확인
2. 단순 회귀 분석
01) 단순 회귀 분석 개념
독립변수(X)가 변할 때, 종속 변수(Y)값이 어떻게 변하는지를 가장 잘 설명해주는 직선을 찾아 분석하는 방법
02) 최소 제곱법 (LSE, Least Square Estimation)
전체적으로 오차가 최소가 되는 직선을 찾는 방법.
= 빨간 점선의 길이의 합이 가장 작은 직선
= 오차의 합이 가장 작은 직선
= 단, 오차는 +,-가 있으므로 오차를 제곱한 합이 가장 작은 직선을 선택
03) 단순 회귀 분석: 실습
조건: 직원수(X: 독립변수)에 대한 매출액(Y: 종속변수)의 변화를 구해보자 |
(1)데이터 탭 → 데이터 분석 탭 → 회귀분석
(2) 데이터 입력
Y축 | 매출액 |
X축 | 직원수 |
(3)결과
결정계수 = 0.64 로, 직원수가 매출액에 영향을 준다고 말할 수 있다.(64%) |
04) 단순 회귀 분석: 실습-산전도 그리기
**참고: https://marking.tistory.com/28 - 4.산점도
조건2: 직원수(X: 독립변수)에 대한 매출액(Y: 종속변수)의 변화를 구해보자 |
(1) 삽입 탭 → 분산형 차트 삽입 → 마우스 우클릭 → 데이터 선택 → 추가
(2) 계열 편집
계열이름 = 직원수 | X값 = 직원수 | Y값 = 매출액 |
(3) 완성(추세선 추가)
3. 다중 회귀 분석
01) 다중 회귀 분석: 개념
여러 개의 독립변수(X1,X2,X3...)가 종속변수(Y)에 미치는 영향을 파악
02) 다중 회귀 분석: 실습
(1)"데이터" 탭 → "데이터 분석" 탭 → "회귀분석"
(2) 데이터 입력
Y축 | 매출액 | ||||||
X축 | 기간 | 광고비 | 교육비 | 판매수량 | 직원수 | 고객 | 제품수 |
(3)결과
조정된 결정 계수 = 0.96 으로, 다양한 종속변수를 고려하면 매출을 더 잘 설명한다 |