Skip to content

Commit

Permalink
Ajouter les avantages d'arrow
Browse files Browse the repository at this point in the history
  • Loading branch information
oliviermeslin committed Nov 20, 2023
1 parent 2f1af80 commit 18b5ef0
Showing 1 changed file with 9 additions and 0 deletions.
9 changes: 9 additions & 0 deletions 03_Fiches_thematiques/Fiche_arrow_duckdb.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -50,6 +50,15 @@ Du point de vue d'un statisticien utilisant `R`, le _package_ `arrow` permet de
- Stocker des données en format Parquet.


### Quels sont les avantages d'`arrow`?

En pratique, le _package_ `arrow` présente trois avantages:

- __Performances élevées__: `arrow` est très efficace et très rapide pour la manipulation de données tabulaires (nettement plus performant que `dplyr` par exemple);
- __Usage réduit des ressources__: `arrow` est conçu pour ne charger en mémoire que le minimum de données. Cela permet de réduire considérablement les besoins en mémoire, même lorsque les données sont volumineuses;
- __Facilité d'apprentissage__ grâce aux approches `dplyr` et SQL: `arrow` peut être utilisé avec les verbes de `dplyr` (`select`, `mutate`, etc.) et/ou avec le langage SQL grâce à `duckdb`. Par conséquent, il n'est pas nécessaire d'apprendre une nouvelle syntaxe pour utiliser `arrow`, on peut s'appuyer sur la ou les approches que l'on maîtrise déjà.


## Comment utiliser `arrow`?

- la différence entre grammaire de traitement et moteur d'exécution;
Expand Down

0 comments on commit 18b5ef0

Please sign in to comment.