본문 바로가기

데이터 교육/엑셀

[엑셀] 탐색적 데이터 분석(EDA)

출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel


1. 탐색적 데이터 분석(EDA, Exploratory Data Analysis)

01) 개념

데이터 분석에 대한 개념으로, 데이를 여러 각도에서 탐색하고 분석하는 것

 

02) 필요한 이유

- 데이터 분포를 파악할 수 있다

- 분석에 필요한 데이터 전처리를 수행할 수 있따

- 데이터의 생김새를 알아야 올바른 분석을 할 수 있다

- 결측치, 이상치를 파악하고 처리할 수 있다

- 가장 적합한 분석 방법을 결정할 수 있다

 


2. 기초 통계량 계산

*엑셀 기초 통계량 계산 함수

합계 =SUM(범위) 중앙값 =MEDIAN(범위) 최대값 =MAX(범위) 최소값 = MIN(범위)
평균 =AVERAGE(범위) 최빈값 =MODE(범위) 분산 =VAR(범위) 표준편차 =STDEV(범위)

 


3. BOXPLOT

01) 개념

최소값, 제 1사분위수, 중앙값, 제 3사분위 수, 최대값을 활용해 그리는 그래프

02) 실습

데이터 선택삽입 통계차트 삽입 상자수염

 

 


4. 산점도

01) 개념

데이터를 점으로 표현해 흩어져 있는 정도를 파악하는 그래프

 

 

02) 실습

(1) 데이터 선택 삽입 →  분산형차트 삽입 마우스 우클릭  데이터 선택 추가

 

 

(2) 계열 편집

 계열이름 = Super Store Sales  X값 = Sales  Y값 = QuantitY 

 

 

(3) 완성