본문 바로가기

데이터 교육/파이썬

[파이썬] 데이터 샘플: loaded_dataset

loaded.dataset이란?

현업에서 실질적으로 많이 쓰이는 데이터들의 예시이다.

csv파일 형태로 seaborn에서 저장되어 있고, 이를 활용해 데이터 시각화 연습을 해볼 수 있다.

 

car_crashes 에 관한 데이터셋

 

* 데이터셋의 종류가 설명되어 있는 사이트

 

GitHub - mwaskom/seaborn-data: Data repository for seaborn examples

Data repository for seaborn examples. Contribute to mwaskom/seaborn-data development by creating an account on GitHub.

github.com

 

 

 

 

특징 

1. seaborn.load_dataset이라는 명령어를 통해 사용한다.

>> load_dataset 사용법. : sns.load_dataset('데이터 셋 이름') 

 

2. seaborn의 데이터가 csv데이터가 pandas, 즉 표의 구조로 되어 있다.

따라서 라이브러리를 불러올 때,  seaborn 뿐 아니라 pandas도 함께 불러온다.

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

 

 

loaded_dataset 활용 예시

라이브러리를 적용한 다음, 원하는 데이터셋을 변수(df)로 저장한다. 

 
df = sns.load_dataset('iris')

 

 

그리고 데이터 형태를 확인하기 위해 df.head 함수를 통해, 상위 5개의 데이터 정보를 표 출력한다.

df.head()

 

 

아래 그림 같이 iris 꽃의 정보(꽃잎의 길이, 세부 종류 등)를 표의 형태로 확인할 수 있다.

 


출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Python