Github

Exploratory Data Analysis

탐색적 데이터 분석 with NETFLIX

데이터 보러 가기

기초적인 데이터 파악 및 분석

영화 및 TV Show에 대한 전반적인 분석

넷플릭스 상영시간 및 장르에 대한 분석

1. Netflix Movies and TV Shows 에 대한 데이터를 활용하여 EDA 진행하였습니다.



2. 아래 Plot은 Release year에 관한 분석입니다.



3. 아래 Plot은 Rating에 관한 분석입니다.

4. 이 기호만으로는 TV-MA, TV-14 라는 등급이 가장 많다는 것만 알 수 있으니, 이를 변환하여 조금 더 알아보기 쉽게 두번째 탭에서 분석해보겠습니다.

5. 아마존의 심의등급은 아래와 같습니다.

위와 같이 원래의 Rating, 치환된 Recommand_age, Count의 세가지 컬럼으로 구성된 것을 보실 수 있습니다.

6. 변환한 데이터를 가지고 넷플릭스 영화 및 TV쇼의 연령분포를 알아보겠습니다.

18세 이상의 영화가 가장 비율이 높음을 알 수 있습니다. 또한, 16세 이상의 영화 및 TV쇼가 두 분야 모두 75%가량 되는 것을 확인하였습니다.

7. 국가별로 컨텐츠가 얼마나 있는지 Bubble map을 사용해서 확인해보겠습니다.

8. 다음으로, 영화의 상영시간에 대한 분포도를 살펴보겠습니다.

이를 통해, 영화의 상영시간은 보통 100분 근처라는 것을 알 수 있습니다.

9. 마지막으로 넷플릭스 영화와 TV쇼 장르에 대한 분석을 살펴보고 마치겠습니다.

이를 통해, InternationalMovies, Dramas 그리고 Comedies의 비율이 높은 것을 알 수 있습니다.







밑의 내용은 Kaggle Notebook 란에 올린 EDA 결과물입니다.

Go to Kaggle

밑의 내용은 Gist를 활용해 github의 jupyter notebook을 불러온 결과물입니다. 이번 EDA 프로젝트의 첫번째 EDA 결과물입니다.