Este repositório contém os jupyter notebooks desenvolvidos durante a Imersão Dados 3 promovida pela Alura.
Os dados usados na imersão são provenientes de um desafio proposto no site do kaggle.
Clique aqui para acessar a versão web do documento.
- Python;
- Pandas;
- Jupyter Notebooks;
- Google Colab;
- Scikit-learn.
Resumidamente, os seguintes conteúdos foram desenvolvidos:
- Análise exploratória dos dados;
- Visualização da distribuição dos dados;
- Implementação de modelos de machine learning.
-
aulas: Os notebooks de cada aula com as respostas dos desafios propostos em cada aula;
-
Respostas_desafios: Notebooks com as respostas dos desafios;
-
notebooks_originais: Notebooks originais das aulas.
- Vitrine de Repositórios da Imersão
- Artigo: Como usar o Google Colab
- Artigo: Gráfico de Pizza
- Site original das bases de dados usadas na imersão
- Laboratório de Inovação da Universidade de Harvard
- Site da Matplotlib
- Site da Seaborn
- O que é um histograma?
- Ampliando a análise com o Describe
- Melhorando a análise com o Boxplot
- Correlações curiosas
- Repositório com o desafio final da imersão
- Modelo de Regressão linear do Scikit-Learn
- Otimização de hiperparâmetros
- Vídeo: Imersão Dados - Dicas de Github para o projeto final
- Vídeo: Como funciona o Machine Learning?
- Vídeo: O militar que descobriu a ciência de dados: Flávio Clésio - Scuba Ponto Dev #03
- Vídeo: Live Imersão Dados Github, portfólio e projeto final
Para visualização de dados, evite usar gráficos que lembrem alguma comida. Dica do professor Thiago.