-
Notifications
You must be signed in to change notification settings - Fork 44
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
feat: Article REX plateforme data #988
Conversation
Images automagically compressed by Calibre's image-actions ✨ Compression reduced images by 21.1%, saving 37.15 KB.
1099 images did not require optimisation. |
1f5adfc
to
6d76b8a
Compare
Images automagically compressed by Calibre's image-actions ✨ Compression reduced images by 22.5%, saving 19.11 KB.
1099 images did not require optimisation. |
⚡️🏠 Lighthouse reportHere's the summary:
Here's the audits:
|
8c85822
to
d5f8db3
Compare
d5f8db3
to
5f23d6a
Compare
7ea3456
to
3dc673c
Compare
Hello, désoler pour ces changements, tu devras faire un rebase sur master et déplacer tes fichiers dans les bons dossiers. |
43d5224
to
61d3f59
Compare
61d3f59
to
1963718
Compare
1963718
to
8559120
Compare
8559120
to
93ead02
Compare
Co-authored-by: Cindyvlv <[email protected]>
Co-authored-by: Cindyvlv <[email protected]>
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
✍️ @lepiaf
lancer. | ||
|
||
Un Poc ("Proof of Concept", ou preuve de concept) a été mise en oeuvre par l'équipe data. Elle s'articule autour d'un | ||
pipeline ELT (extract, load, transform) en utilisant les technologies suivantes : Google Cloud Platform, Talend, dbt et |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
mentionner Big Query
|
||
- MySQL | ||
- MongoDB ([voir notre article de blog sur MongoDB](https://blog.eleven-labs.com/fr/symfony-et-mongodb-retour-aux-sources/)) | ||
- Appel HTTP vers des API externes |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
(CRM, ERP...)
|
||
C'est dans ce contexte que ma mission commence. | ||
|
||
## Le pipeline ELT : Extract, Load, Transform |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
préciser "Le pipeline ELT du PoC existant"
|
||
Ce pipeline est fonctionnel et déjà en place avec Jenkins. Voyons l'architecture de la nouvelle plateforme data. | ||
|
||
## Architecture de la plateforme data |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Préciser "Nouvelle Archi" (que tu as mise en place)
|
||
Une fois l'architecture dessinée et communiquée à l'équipe, nous pouvons la mettre en oeuvre. | ||
|
||
## Conditionnement des charges de travail |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Ces parties suivantes devraient être des sous parties de la partie 'nouvelle archi' ?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
"Conditionnement" : pas sur de comprendre ? parler d'Orchestration ou Ordonnancement peut etre ?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
en anglais on dirait "workload packaging". je veux expliquer que "j'emballe" tout le code dans une image Docker/conteneur.
en effet, il faut changer le niveau de titre en sous-partie de "nouvelle archi"
Enfin, en dernière étape de ce pipeline, il y a l'affichage des données. | ||
|
||
Le but final de tout ce travail est d'éviter d'effectuer tous les calculs au moment d'afficher les rapports d'analyse. | ||
Sans le travail en amont de calcul et d'aggrégation de données, l'affichage des graphiques serait très longs. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
"affichage [...] long" (sans "s")
propriétaire des bases de données. Cette démarcation se traduit dans le code de l'infrastructure et permet de | ||
bien délimiter les responsabilités entre les équipes. | ||
|
||
Nous retrouvons donc en partie supérieure du schéma les sources de données de type base de données qui sont géréeé par |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
géréeé -> gérées
|
||
Suite à cette mise en production, l'infrastructure ne va pas beaucoup changer. Il y aura principalement de la maintenance et des mises à jour à effectuer, en particulier sur le service Composer. | ||
|
||
Un des points de souffrance sur le pipeline est Talend. Cet outil ne s'adapte pas bien à un environnement Cloud. Le projet serait de trouver une solution alternative. Quel serait l'outil adapté pour de l'extraction de données et qui serait complètement géré par Google ? |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
oh le beau teasing pour le prochain article ;)
|
||
La construction de cette plateforme data a été un grand projet de notre [Studio Eleven Labs](https://eleven-labs.com/nos-publications/donnez-une-nouvelle-dimension-a-votre-equipe-produit). Tout a été construit depuis zéro. J'ai bien cerné la problématique, cela m'a permis d'identifier tous les éléments sur le fonctionnement du pipeline. La solution a été de s'adapter à son fonctionnement et aux pré-requis. Enfin, la mise en production s'est déroulée comme prévu. La mise en place d'une surveillance active m'a permis de détecter les erreurs en amont. Cela réduit considérablement les temps d'indisponibilité de la plateforme. | ||
|
||
Pour ma part, cette mission a été très complète. J'ai tantôt été _Architecte_ avec la conception de l'infrastructure, _Ops_ avec l'écriture du Terraform et de la bonne compréhension de Google Cloud Platform, et enfin _Dev_ avec la rédaction du DAG Airflow. J'en ressort avec encore plus d'expérience ! |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Data Eng plutot que Dev non ?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
oui c'est également possible. je vais changer.
No description provided.