본문 바로가기

데이터 교육/파이썬

[파이썬] 산점도(scatterplot), 선도표(lineplot) 그리기

산점도 그리기: scatterplot

문제: 'iris 데이터 셋'을 이용하여 sepal_length, sepal_width 별 산점도를 작성하시오

 

1. 데이터 정리하기

 

01) 라이브러리 호출하기

표와 시각화 툴의 라이브러리를 출력한다

> pandas: 테이블(표)형식의 데이터를 다루는 라이브러리

> seaborn, matplotlib.pyplot : 데이터를 시각화해주 라이브러리

코드 입력
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(rc={'figure.figsize':(10, 5)})
import pandas as pd

 

 

 

02) loaded_dataset 불러오기

iris라는 데이터셋을 df라는 변수에 입력해주고,

df.head 함수를 통해 상세 정보를 확인한다.

코드 입력
df = sns.load_dataset('iris')
df.head()

※ sepal: 꽆잎, petal: 꽃받침

 

 

 

03) 결측치 확인: isnull함수 사용

코드입력 df.isnull().sum()

 

결측값이 없어, 따로 데이터 처리 없이 다음 단계로 넘어간다.

 

 

 

2. 데이터 시각화하기

01) iris 꽃의 산점도 그래프를 그리기

코드 입력 sns.scatterplot(data = df, x = 'sepal_width', y = 'sepal_length')
해석 sns.catterplot을 만들 때 데이터는, 상단의 df를 사용한다.
x의 위치값을 sepal_width 로, y의 위치값을 sepal_length 로 지정한다.

 

 

 

02) species 별로 산점도 그리기

코드 입력 sns.scatterplot(data = df, x = 'sepal_width', y = 'sepal_length', hue = 'species')
해석 동일한 코드에 hue함수를 사용해 카테고리 기준을 species로 나눈다.

 

 

 

 


선도표 그리기: lineplot

문제: 연도별, 월별 승객수에 대한 그래프를 그려보시오.

 

 

1. 데이터 정리하기

 

01) 라이브러리 호출하기

표와 시각화 툴의 라이브러리를 출력한다

> pandas: 테이블(표)형식의 데이터를 다루는 라이브러리

> seaborn, matplotlib.pyplot : 데이터를 시각화해주 라이브러리

코드 입력
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(rc={'figure.figsize':(10, 5)})
import pandas as pd

 

 

 

02) loaded_dataset 불러오기

'flights'라는 데이터셋을 df라는 변수에 입력해주고,

df.head 함수를 통해 상세 정보를 확인한다.

코드 입력
df = sns.load_dataset('flights')
df.head()

데이터: 연도별, 월별, 승객수

 

 

03) 결측치 확인: isnull함수 사용

코드입력 df.isnull().sum()

결측값이 없어, 따로 데이터 처리 없이 다음 단계로 넘어간다.

 

 

 

2. 데이터 시각화하기

01) flights의 연도별 승객수 선도표 그래프 그리기

코드 입력 sns.lineplot(data = df, x = 'year', y = 'passengers')
해석 sns.lineplot을 만들 때 데이터는, 상단의 df를 사용한다.
x값을 연도'year'로, y값을 승객수'passengers' 로 지정한다.

가운데 짙은 선이 대표값

 

 

 

 

02) 월별 승객수 그래프 그리기

코드 입력 sns.lineplot(data = df, x = 'year', y = 'passengers', hue = 'month')
해석 동일한 코드에 hue함수를 사용해 카테고리 기준을 month로 나눈다.

 

 

 

 


출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Python