데이터 교육/파이썬
[파이썬] 산점도(scatterplot), 선도표(lineplot) 그리기
마크잉
2023. 12. 5. 17:23
산점도 그리기: scatterplot |
문제: 'iris 데이터 셋'을 이용하여 sepal_length, sepal_width 별 산점도를 작성하시오 |
1. 데이터 정리하기
01) 라이브러리 호출하기
표와 시각화 툴의 라이브러리를 출력한다
> pandas: 테이블(표)형식의 데이터를 다루는 라이브러리
> seaborn, matplotlib.pyplot : 데이터를 시각화해주 라이브러리
코드 입력
|
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(rc={'figure.figsize':(10, 5)})
import pandas as pd
|
02) loaded_dataset 불러오기
iris라는 데이터셋을 df라는 변수에 입력해주고,
df.head 함수를 통해 상세 정보를 확인한다.
코드 입력 |
df = sns.load_dataset('iris') |
df.head() |

03) 결측치 확인: isnull함수 사용
코드입력 | df.isnull().sum() |

결측값이 없어, 따로 데이터 처리 없이 다음 단계로 넘어간다.
2. 데이터 시각화하기
01) iris 꽃의 산점도 그래프를 그리기
코드 입력 | sns.scatterplot(data = df, x = 'sepal_width', y = 'sepal_length') |
해석 | sns.catterplot을 만들 때 데이터는, 상단의 df를 사용한다. x의 위치값을 sepal_width 로, y의 위치값을 sepal_length 로 지정한다. |

02) species 별로 산점도 그리기
코드 입력 | sns.scatterplot(data = df, x = 'sepal_width', y = 'sepal_length', hue = 'species') |
해석 | 동일한 코드에 hue함수를 사용해 카테고리 기준을 species로 나눈다. |

선도표 그리기: lineplot |
문제: 연도별, 월별 승객수에 대한 그래프를 그려보시오. |
1. 데이터 정리하기
01) 라이브러리 호출하기
표와 시각화 툴의 라이브러리를 출력한다
> pandas: 테이블(표)형식의 데이터를 다루는 라이브러리
> seaborn, matplotlib.pyplot : 데이터를 시각화해주 라이브러리
코드 입력
|
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(rc={'figure.figsize':(10, 5)})
import pandas as pd
|
02) loaded_dataset 불러오기
'flights'라는 데이터셋을 df라는 변수에 입력해주고,
df.head 함수를 통해 상세 정보를 확인한다.
코드 입력 |
df = sns.load_dataset('flights') |
df.head() |

03) 결측치 확인: isnull함수 사용
코드입력 | df.isnull().sum() |

결측값이 없어, 따로 데이터 처리 없이 다음 단계로 넘어간다.
2. 데이터 시각화하기
01) flights의 연도별 승객수 선도표 그래프 그리기
코드 입력 | sns.lineplot(data = df, x = 'year', y = 'passengers') |
해석 | sns.lineplot을 만들 때 데이터는, 상단의 df를 사용한다. x값을 연도'year'로, y값을 승객수'passengers' 로 지정한다. |

02) 월별 승객수 그래프 그리기
코드 입력 | sns.lineplot(data = df, x = 'year', y = 'passengers', hue = 'month') |
해석 | 동일한 코드에 hue함수를 사용해 카테고리 기준을 month로 나눈다. |

출처: 패스트 캠퍼스 - 한 번에 끝내는 데이터 분석 초격차 패키지 Online: Python