본문 바로가기

데이터 교육/엑셀

(24)
[엑셀] 회귀 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 회귀 분석이란? 01) 회귀 분석 개념 두 개 이상의 연속형 변수(수치)인 종속 변수와 독립 변수 간의 관계를 파악하는 분석 EX. 광고비(독립 변수)의 변화에 따른 매출액(종속 변수)의 변화를 알고 싶을 때 02) 회귀 분석의 목적 - 두 변수 간의 관계 파악 - 미래 값 예측 03) 회귀 분석의 종류 독립 변수(X)의 개수에 따라 단순 회귀 분석과 다중 회귀 분석으로 구분 회귀 분석 단순 회귀 분석 독립 변수(X)가 한 개일 때 다중 회귀 분석 독립 변수(X)가 여러 개일 때 04) 회귀 분석의 평가와 해석 결정 계수 / F값 / Y절편 및 X1의 계수 확인 2. 단순 회귀 분석 01) 단순 회귀 분석 ..
[엑셀] 분산 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 분산 분석 이란? 01) 분산 분석 개념 두 개 이상 다수의 집단을 비교하여, 평균의 차이가 있는지를 검정 02) 분산 분석 방법 집단 개수에 따라 분산 분석의 방법이 달라짐 집단이 2개일 때 → T-test 집단이 3개 이상일 때 → ANOVA 03) F 검정 두 집단의 등분산성(분산이 같은지 여부)을 검정하여, 각 상황에 맞는, t-test 방법을 선정하기 위해 사용. P-value가 0.05보다 크면 두 집단의 분산은 같고 → Student's t-test P-value가 0.05보다 작으면 두 집단의 분산은 다르다 → Welch's t-test 2. 실습 1: 2019년도 상반기& 하반기의 매출 분석..
[엑셀] 상관 분석, 상관 계수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 상관분석의 개념 01) 상관분석 두 변수 간에 어떤 선형적(직선형) 또는 비선형적 관계를 갖고 있는지를 분석하는 방법 02) 상관관계 한쪽이 증가하면 다른 쪽도 증가하거나 반대로 감소되는 경향을 인정하는 두 양(量) 사이의 통계적 관계 → 두 변수가 선형 관계에 있는지 비선형 관계에 있는지 파악 03) 상관계수 두 변수 사이의 상관성을 나타내며 일반적으로 피어슨(Pearson) 상관계수를 사용 상관계수 함수 =CORREL(데이터범위1, 데이터범위2) 2. 실습 01) 상관계수 구하기: 함수식 함수식 =CORREL(기간, 매출) 함수식 =CORREL($E$5:$E$28,D$5:D$28) 결과값 = 0.7531..
[엑셀] 텍스트 데이터: LEFT, RIGHT, MID함수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel * LEFT / RIGHT / MID 함수 01) LEFT / RIGNT 함수 개념 텍스트의 가장 왼쪽 / 오른쪽부터 원하는 문자열까지 추출 02) MID 함수 개념 텍스트의 중간 시작 위치부터 원하는 문자열까지 추출 03) LEFT / RIGNT / MID 함수 실습 조건 왼쪽에서 3자리 오른쪽에서 8자리 5번째부터 3글자 함수식 =LEFT(B5,3) =RIGHT(B5,8) =MID(B5,5,3) 표시 값 Wii Nintendo Spo
[엑셀] 텍스트 데이터: FIND, SEARCH함수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. FIND 함수 01) FIND 함수 개념 - 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력 → 숫자가 나오면 특정 단어가 포함, 오류가 나면 포함되어 있지 않은 것으로 해석 - 띄어쓰기까지 포함하여 문자를 세며 대소문자를 구분 02) FIND 함수 실습 조건 : 후기 중에서 주요 KEYWORD를 언급한 사람의 수를 구해보자 (1) 주요 키워드를 언급한 사람 찾기 =FIND("주요 키워드", "후기") 함수식: =FIND(H$4,$C5) (2) 문제점 : 특정 키워드를 언급한 사람의 칸에는 숫자가 표시, 언급하지 않은 사람의 칸에는 오류#VALUE! 가 난다. (3) 오류 처리 오류는 분석이 ..
[엑셀] 탐색적 데이터 분석(EDA) 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 탐색적 데이터 분석(EDA, Exploratory Data Analysis) 01) 개념 데이터 분석에 대한 개념으로, 데이를 여러 각도에서 탐색하고 분석하는 것 02) 필요한 이유 - 데이터 분포를 파악할 수 있다 - 분석에 필요한 데이터 전처리를 수행할 수 있따 - 데이터의 생김새를 알아야 올바른 분석을 할 수 있다 - 결측치, 이상치를 파악하고 처리할 수 있다 - 가장 적합한 분석 방법을 결정할 수 있다 2. 기초 통계량 계산 *엑셀 기초 통계량 계산 함수 합계 =SUM(범위) 중앙값 =MEDIAN(범위) 최대값 =MAX(범위) 최소값 = MIN(범위) 평균 =AVERAGE(범위) 최빈값 =MODE(범..
[엑셀] 조건부서식 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 조건부 서식이란? * 조건부 서식의 개념: 특정한 조건 규칙을 만족하는 데이터에 자동으로 서식이 적용되도록 하는 기능 2. 셀 값을 기준으로 모든 셀의 서식 지정 01) 개념 : 선택한 범위의 모든 셀에 특정한 조건에 의한 조건부 서식 적용 가능 02) 실습 조건: 확진자 수가 적을수록 초록색, 많을수록 붉은색으로 지정 A. 서식을 걸 데이터 범위를 선택 → 홈 탭의 '조건부 서식' → 제일 하단의 '규칙관리' → '새규칙' 생성 B. 값을 기준으로 모든 셀의 서식 지정 → 최소값과 최대값에 원하는 색 지정 → 적용 C. 다른 서식으로 지정하는 것도 가능 (ex. 숫자 형식) 3. 다음을 포함하는 셀만 서식..
[엑셀] 피벗 테이블 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 피벗 테이블이란? 01) 피벗테이블 정의 피벗 테이블은 커다란 표의 데이터를 요약하는 통계표 cf. 어떤 요약 통계표를 만들어야 하는지 명확하지 않기 때문에 피벗 테이블을 어려워 한다 02) 피벗 테이블 생성방법 피벗 테이블을 만들 Raw data 선택 - [삽입] 탭 - 피벗테이블 03) 피벗 테이블 사용하기 [피벗 테이블 필드]의 필드를 필터/열/행/값 중 필요한 부분에 드래그 2. 피벗 테이블 실습 (1) 피벗 테이블을 만들 Raw data 선택 - [삽입] 탭 - 피벗테이블 (2) 새 워크 시트 혹은 기존 워크 시트 중 원하는 곳에 삽입 03) 목적에 맞게 보기 원하는 필드를 드래그해서 추가한다