본문 바로가기

All

(55)
[엑셀] 실습 1: 스타워즈 캐릭터 데이터 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 분류형 데이터 분석 조건: 머리 색별 인원 수와 비율을 구하기 (0) 피벗테이블을 삽입한다 (1) 인원수 파악 : 행에 "머리색"을, 값에 "이름"을 넣어준다 → 내림차순 정렬 (2) 비율 파악 : "이름" 값 한번 더 추가 → "값 필드 설정" 클릭 → "값 표시 형식" 클릭 → "총 합계 비율" 클릭 (3) 피벗 차트 삽입 2. 수치형 데이터 분석: 기초 통계량 산출 조건: 캐릭터들의 키와 몸무게를 분석하라 (0) 피벗테이블을 삽입한다 (1) : 행에 "이름", "키", "몸무게" 값을 넣어준다 (2) 디자인 탭 → 보고서 레이아웃 → 테이블 형식으로 표시 (3) NA값 제거 (4) 값 붙여넣기(ALT ..
[엑셀] 시계열 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 시계열 데이터와 시계열 분석이란? 01) 시계열 데이터 개념 시계열: 시(시간) 계(계속) 열(나) = 시간의 순서대로 계속 나열되는 데이터 일정 기간에 대해 시간의 함수로(시간의 흐름에 따라) 표현되는 데이터 02) 시계열 데이터 분석 목표 과거 시계열 데이터 특성 파악 및 미래 데이터 예측 업무 (EX. 주가 데이터) **주의점: 예측치는 추정치일 뿐 항상 정확하지는 않음 03) 시계열 분석 방법의 종류 2. 지수 평활법 이해하기 01) 지수평활법 개념 현재의 실제 값과 현재의 예측 값을 합산하여 미래의 예측 값을 구하는 방법 **정리식 3. FORECAST.ETS 함수로 매출 예측하기 01) FOREC..
[엑셀] 회귀 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 회귀 분석이란? 01) 회귀 분석 개념 두 개 이상의 연속형 변수(수치)인 종속 변수와 독립 변수 간의 관계를 파악하는 분석 EX. 광고비(독립 변수)의 변화에 따른 매출액(종속 변수)의 변화를 알고 싶을 때 02) 회귀 분석의 목적 - 두 변수 간의 관계 파악 - 미래 값 예측 03) 회귀 분석의 종류 독립 변수(X)의 개수에 따라 단순 회귀 분석과 다중 회귀 분석으로 구분 회귀 분석 단순 회귀 분석 독립 변수(X)가 한 개일 때 다중 회귀 분석 독립 변수(X)가 여러 개일 때 04) 회귀 분석의 평가와 해석 결정 계수 / F값 / Y절편 및 X1의 계수 확인 2. 단순 회귀 분석 01) 단순 회귀 분석 ..
[엑셀] 분산 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 분산 분석 이란? 01) 분산 분석 개념 두 개 이상 다수의 집단을 비교하여, 평균의 차이가 있는지를 검정 02) 분산 분석 방법 집단 개수에 따라 분산 분석의 방법이 달라짐 집단이 2개일 때 → T-test 집단이 3개 이상일 때 → ANOVA 03) F 검정 두 집단의 등분산성(분산이 같은지 여부)을 검정하여, 각 상황에 맞는, t-test 방법을 선정하기 위해 사용. P-value가 0.05보다 크면 두 집단의 분산은 같고 → Student's t-test P-value가 0.05보다 작으면 두 집단의 분산은 다르다 → Welch's t-test 2. 실습 1: 2019년도 상반기& 하반기의 매출 분석..
[엑셀] 상관 분석, 상관 계수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 상관분석의 개념 01) 상관분석 두 변수 간에 어떤 선형적(직선형) 또는 비선형적 관계를 갖고 있는지를 분석하는 방법 02) 상관관계 한쪽이 증가하면 다른 쪽도 증가하거나 반대로 감소되는 경향을 인정하는 두 양(量) 사이의 통계적 관계 → 두 변수가 선형 관계에 있는지 비선형 관계에 있는지 파악 03) 상관계수 두 변수 사이의 상관성을 나타내며 일반적으로 피어슨(Pearson) 상관계수를 사용 상관계수 함수 =CORREL(데이터범위1, 데이터범위2) 2. 실습 01) 상관계수 구하기: 함수식 함수식 =CORREL(기간, 매출) 함수식 =CORREL($E$5:$E$28,D$5:D$28) 결과값 = 0.7531..
[엑셀] 텍스트 데이터: LEFT, RIGHT, MID함수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel * LEFT / RIGHT / MID 함수 01) LEFT / RIGNT 함수 개념 텍스트의 가장 왼쪽 / 오른쪽부터 원하는 문자열까지 추출 02) MID 함수 개념 텍스트의 중간 시작 위치부터 원하는 문자열까지 추출 03) LEFT / RIGNT / MID 함수 실습 조건 왼쪽에서 3자리 오른쪽에서 8자리 5번째부터 3글자 함수식 =LEFT(B5,3) =RIGHT(B5,8) =MID(B5,5,3) 표시 값 Wii Nintendo Spo
[엑셀] 텍스트 데이터: FIND, SEARCH함수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. FIND 함수 01) FIND 함수 개념 - 긴 텍스트에서 특정 단어나 문장이 시작하는 위치를 숫자로 출력 → 숫자가 나오면 특정 단어가 포함, 오류가 나면 포함되어 있지 않은 것으로 해석 - 띄어쓰기까지 포함하여 문자를 세며 대소문자를 구분 02) FIND 함수 실습 조건 : 후기 중에서 주요 KEYWORD를 언급한 사람의 수를 구해보자 (1) 주요 키워드를 언급한 사람 찾기 =FIND("주요 키워드", "후기") 함수식: =FIND(H$4,$C5) (2) 문제점 : 특정 키워드를 언급한 사람의 칸에는 숫자가 표시, 언급하지 않은 사람의 칸에는 오류#VALUE! 가 난다. (3) 오류 처리 오류는 분석이 ..
[엑셀] 탐색적 데이터 분석(EDA) 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. 탐색적 데이터 분석(EDA, Exploratory Data Analysis) 01) 개념 데이터 분석에 대한 개념으로, 데이를 여러 각도에서 탐색하고 분석하는 것 02) 필요한 이유 - 데이터 분포를 파악할 수 있다 - 분석에 필요한 데이터 전처리를 수행할 수 있따 - 데이터의 생김새를 알아야 올바른 분석을 할 수 있다 - 결측치, 이상치를 파악하고 처리할 수 있다 - 가장 적합한 분석 방법을 결정할 수 있다 2. 기초 통계량 계산 *엑셀 기초 통계량 계산 함수 합계 =SUM(범위) 중앙값 =MEDIAN(범위) 최대값 =MAX(범위) 최소값 = MIN(범위) 평균 =AVERAGE(범위) 최빈값 =MODE(범..