Análise Exploratória de Dados com o Dataset do TMDB 5000

Este projeto apresenta uma análise exploratória dos dados do MovieLens usando o dataset recomendado para educação e desenvolvimento, o qual possui 100 mil avaliações de 9 mil filmes, feitas por 600 usuários.

O objetivo era explorar a distribuição das notas de cada filme usando tabelas de frequência, medidas de tendência central — moda, média e mediana — e visualizações com histogramas e box-plots.

Além disso, fiz uma análise exploratória dos dados do TMDB 5000 a fim de comparar as quantidades de filmes produzidos em uma determinada língua. Essas comparações foram feitas através da construção de tabelas de frequência e gráficos de barras.

Por fim, fiz uma análise da distribuição das notas dos cinco primeiros filmes do dataset para descobrir quais os mais amados e os mais odiados.

Créditos

Este relatório foi construído com base no conteúdo do curso Data Science: analise e visualização de dados da Escola de Data Science da Alura.

Fiz algumas modificações com a finalidade de enriquecer não somente os relatórios, mas também meu aprendizado.

Como Reproduzir este Projeto

Navegue para a pasta em que deseja clonar este projeto. Em seguida, digite o comando a seguir:

git clone https://github.com/diego-torres-coder/Analise-Exploratoria-de-Dados-com-o-TMDB-5000.git

Navegue para a pasta recém-criada:

cd Analise-Exploratoria-de-Dados-com-o-TMDB-5000/

Crie um ambiente conda para o projeto:

conda create -n tmdb python=3.11

Ative o ambiente virtual com o seguinte comando:

conda activate tmdb

Instale as dependências do projeto:

conda install numpy openpyxl pandas matplotlib seaborn jupyterlab

Execute o Jupyter Lab:

jupyter-lab

Por fim, execute todas as células do notebook.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
Introdução a Data Science.ipynb		Introdução a Data Science.ipynb
README.md		README.md
README.txt		README.txt
links.csv		links.csv
movies.csv		movies.csv
ratings.csv		ratings.csv
requirements.txt		requirements.txt
tags.csv		tags.csv
tmdb_5000_credits.csv		tmdb_5000_credits.csv
tmdb_5000_movies.csv		tmdb_5000_movies.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Análise Exploratória de Dados com o Dataset do TMDB 5000

Créditos

Como Reproduzir este Projeto

About

Releases

Packages

Languages

diego-torres-coder/Analise-Exploratoria-de-Dados-com-o-TMDB-5000

Folders and files

Latest commit

History

Repository files navigation

Análise Exploratória de Dados com o Dataset do TMDB 5000

Créditos

Como Reproduzir este Projeto

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages