Familiaritza't amb les tecniques de exploració de les dades mitjantçant la estructure de dades, Datafreame amb la llibreria Pandas.
-
Exercici 1:
- Descarrega el data set Airlines Delay: Airline on-time statistics and delay causes i carrega’l a un pandas Dataframe. Explora les dades que conté, i queda’t únicament amb les columnes que consideris rellevants.
-
Exercici 2:
- Fes un informe complet del data set:
- Resumeix estadísticament les columnes d’interès
- Troba quantes dades faltants hi ha per columna
- Crea columnes noves (velocitat mitjana del vol, si ha arribat tard o no...)
- Taula de les aerolínies amb més endarreriments acumulats
- Quins són els vols més llargs? I els més endarrerits?
- Etc.
- Fes un informe complet del data set:
-
Exercici 3:
- Exporta el data set net i amb les noves columnes a Excel.