본문 바로가기

데이터 교육

(54)
[파이썬] 입력, 출력, 변수 변수란: 변하는 값, 변수 저장: 자주 사용하는 데이터를 저장하여 사용하는 것. 1. 변수명 작성시: - 값을 출력하기 위해서 사전적으로 변수명이 정의(즉, 대입)되어야 함 - 영문자, 숫자, _ 의 조합으로 구성되어야 함 (한글 사용X) - 변수명의 첫 글자는 숫자로 사용할 수 없음 - 대문자와 소문자는 구분되어 사용됨 - 변수명 사이에 띄어쓰기는 불가함 - 코드문 앞에 #을 붙이면, 코드라고 인식하지 않음 2. 변수 입력 방법 1) 코드셀에 변수 입력 코드 셀 a = 100 b = 10000 여기서 =(등호)는 같다라는 뜻이 아니라, 오른쪽의 값을 왼쪽에 '대입'한다는 의미이다. 즉, a라는 변수에 100값을, b라는 변수에 10000를 대입한다는 뜻이다. cf. 우리가 흔히 아는 같다라는 뜻의 기호..
[파이썬] 파이썬 기초, colab 사용법 목표: 파이썬 기초 배우기 Python이란? Python(이하 파이썬)은 웹 애플리케이션, 소프트웨어 개발, 데이터 과학, 기계 학습(ML)에 널리 사용되는 프로그래밍 언어이다. '인터프리터(한 줄씩 소스 코드를 해석해서 그때그때 실행해 결과를 바로 확인할 수 있는 언어)를 사용하는 객체지향 언어'이자 플랫폼에 독립적인, 동적 타이핑 대화형 언어이다. 효율적이고 배우기 쉬우며 여러 플랫폼에서 실행될 수 있다. _출처: AWS, 위키백과 Python의 장점은? 간결한 문법! ㄴ 자바와 비교해 봤을 때, 직선적이고 간결한 문법 형태를 띈다. Python 실습방식은? - 데이터 분석이라는 흐름에서 파이썬 배우기 - google-colaboratory 활용하여, 강의에서 제공받은 데이터셋으로 실습 Colabor..
[엑셀] 실습 5: 기업 손익 데이터 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 목표: 기업에서 가장 많이 사용하는 데이터인 손익 계산서를 작성, 기초 공식을 익히고 분석하기 1. 데이터 전처리 1) 함수를 이용해 장표 채우기: SUMIFS =SUMIFS(더할 값들의 범위, 더할 조건 범위, 조건) [엑셀] SUMIF(S) 함수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. SUMIF 함수란? 특정 조건에 맞는 데이터들의 합계를 계산하는 함수 =SUMIF(더할 조건의 범위, 조건, 더할 값들의 범위 marking.tistory.com = SUMIF( 금액_범위 , 구분_범위 , 매출액) = 더해라 ( 여러 항목중에, '매출액' 항목에, 해당..
[엑셀] 실습 4: 개인 대출 데이터 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 목표: 대출을 받은 사람과 받지 못한 사람의 여러 데이터들(소득이나 신용카드 사용량 등)이 어떤 관계를 가지고 있는지 분석하고 시각화하기 1. 데이터 전처리 1) 피벗 테이블을 삽입하여 데이터 그룹화 하기: Age - 전체로 나열되어 있는 나이 데이터를 연령대(10대별)별로 '그룹'화(마우스 우클릭) 하기 - 시작과 끝에 체크박스✅를 해제하고, 원하는 시작값(20)과 끝값(70), 단위값(10)을 입력한다 - 다른 데이터(경력연수, 수입, 가족수, 교육년수)도 해석하기 편한 단위별로 그룹화를 해준다 2. 박스플랏과 산점도 그리기 1) 두집단간의 수입 비교: 상자수염 그래프 0 (NO) 대출 받지 않은 사람 1 (..
[엑셀] 실습 3: 따릉이 데이터 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 목표: 서울시 지역구의 따릉이 대여소 별로, 대여율 분포도 시각화하기 (대여가 많이 발생하는 부분 표시하기) 1. 데이터 정리 및 분류하기 필요한 데이터: 대여소 정보, 대여소 코드, 지역구, 대여소 명, 위도, 경도, 이용자 수 1) 대여소 정보 (필터 사용) 데이터 01) 데이터 정리하기 - 중복된 데이터 값 제거 - 불필요한 데이터 제거 (데여소 코드가 없어서 분류가 어려운 데이터를 제거한다.) - 오름차순 정렬 02) 데이터 가공하기 - 대여소 코드와 대여소 명으로 데이터 나누기 : LEFT, FIND함수 =LEFT( $B3 , FIND(".", $B3 ) -1 ) : 점(.)을 기준으로 왼쪽값 가져오기 ..
[엑셀] 실습 2: LA레이커스 데이터 시각화 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel *시각화 :선수들의 3점슛 위치를 농구코트 위에 표시해보자 1) 필요한 값만 볼 수 있도록 필터 설정 - 경기 etype은 골을 넣은 것을 볼 것이기 때문에 shot - 팀은 LAL - 골 타입은 3pt 2) 시각화 하기 위해 분산형 차트를 삽입 3) 성공한 3점슛만 다른 색으로 표현하기 지금 그래프에는 성공(made)한 3점슛과 실패(missed)한 3점슛이 모두 표시가 되어 있으므로 범례항목을 추가하여, "made"에 해당하는 값만 다시 입력해준다 4) 완성 성공한 3점슛 실패한 3점슛 의 위치를 시각화 하여 볼 수 있다. 사진을 그래프에 삽입하여 더 한눈에 보기 좋은 시각화를 해준다.
[엑셀] 실습 2: LA레이커스 점수 데이터 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel * 시즌 승패 구하기 01) LAL(LA레이커스) 점수 구하기 (0) SUMIFS함수 사용 : lakers(실습) 시트에는 날짜별로 각각 선수의 득점 raw data가 있다. 즉, sumifs함수를 사용하여 경기별 팀의 득점수를 구할 수 있고, 두 팀의 합산을 비교하여 승패 정보를 구할 수 있다. [엑셀] SUMIF(S) 함수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel 1. SUMIF 함수란? 특정 조건에 맞는 데이터들의 합계를 계산하는 함수 =SUMIF(더할 조건의 범위, 조건, 더할 값들의 범위 marking.tistory.com *sumifs함수 참고 (1)..
[엑셀] 실습 2: LA레이커스 날짜 데이터 분석 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel * LA레이커스 데이터 분석하기 *날짜 데이터 정리하기 01) letf, right, mid함수 (1) left, mid, right 함수 사용 날짜함수 참조 [엑셀] 텍스트 데이터: LEFT, RIGHT, MID함수 출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Excel * LEFT / RIGHT / MID 함수 01) LEFT / RIGNT 함수 개념 텍스트의 가장 왼쪽 / 오른쪽부터 원하는 문자열까지 추출 02) MID 함수 marking.tistory.com (2) 숫자 형식으로 변경 #value함수 :문자값을 숫자값으로 변경해준다 왼쪽정렬 문자값 오른쪽정렬 숫자값 0..