Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

feat: Article REX plateforme data #988

Merged
merged 6 commits into from
Nov 14, 2023
Merged

feat: Article REX plateforme data #988

merged 6 commits into from
Nov 14, 2023

Conversation

lepiaf
Copy link
Member

@lepiaf lepiaf commented Oct 11, 2023

No description provided.

@github-actions
Copy link
Contributor

Images automagically compressed by Calibre's image-actions

Compression reduced images by 21.1%, saving 37.15 KB.

Filename Before After Improvement Visual comparison
_assets/posts/2023-10-12-rex-plateforme-data/architecture.png 175.74 KB 138.59 KB -21.1% View diff

1099 images did not require optimisation.

@lepiaf lepiaf force-pushed the feat/data-plateforme branch from 1f5adfc to 6d76b8a Compare October 11, 2023 12:42
@github-actions
Copy link
Contributor

Images automagically compressed by Calibre's image-actions

Compression reduced images by 22.5%, saving 19.11 KB.

Filename Before After Improvement Visual comparison
_assets/posts/2023-10-12-rex-plateforme-data/architecture.png 84.82 KB 65.72 KB -22.5% View diff

1099 images did not require optimisation.

@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 11, 2023 12:45 Destroyed
@github-actions
Copy link
Contributor

github-actions bot commented Oct 11, 2023

⚡️🏠 Lighthouse report

Here's the summary:

Path Performance Accessibility Best practices SEO PWA
/feat/data-plateforme/ 🟠 64 🟢 100 🟢 92 🟢 92 🟠 70
/feat/data-plateforme/fr/authors/ajacquemin/ 🟠 67 🟢 97 🟠 83 🟢 92 🟠 70
/feat/data-plateforme/fr/comment-construire-site-web-avec-nextjs/ 🟠 75 🟢 98 🟠 83 🟢 100 🟠 70
/feat/data-plateforme/fr/nestjs-le-cycle-de-vie-dune-requete/ 🟠 72 🟢 98 🟠 83 🟢 97 🟠 70

Here's the audits:

Path FCP
1800 <=
LCP
2500 <=
Speed Index
3400 <=
TTI
3800 <=
TBT
200 <=
CLS
0.1 <=
/feat/data-plateforme/ 🔴 2617 🔴 8891 🟢 2617 🔴 8953 🟢 83 🟢 0
/feat/data-plateforme/fr/authors/ajacquemin/ 🔴 1843 🔴 8215 🟢 2620 🔴 8152 🟢 90 🟢 0
/feat/data-plateforme/fr/comment-construire-site-web-avec-nextjs/ 🔴 2641 🔴 3877 🟢 2882 🔴 10589 🟢 83 🟢 0
/feat/data-plateforme/fr/nestjs-le-cycle-de-vie-dune-requete/ 🔴 2145 🔴 4817 🟢 2759 🔴 8949 🟢 74 🟢 0.07

@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 12, 2023 09:32 Destroyed
@lepiaf lepiaf force-pushed the feat/data-plateforme branch from 8c85822 to d5f8db3 Compare October 16, 2023 15:21
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 16, 2023 15:23 Destroyed
@lepiaf lepiaf force-pushed the feat/data-plateforme branch from d5f8db3 to 5f23d6a Compare October 16, 2023 15:56
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 16, 2023 15:58 Destroyed
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 18, 2023 12:20 Destroyed
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 18, 2023 12:26 Destroyed
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 18, 2023 12:44 Destroyed
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 18, 2023 13:35 Destroyed
@lepiaf lepiaf force-pushed the feat/data-plateforme branch from 7ea3456 to 3dc673c Compare October 19, 2023 20:58
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme October 19, 2023 21:01 Destroyed
@fpasquet
Copy link
Contributor

Hello, désoler pour ces changements, tu devras faire un rebase sur master et déplacer tes fichiers dans les bons dossiers.
_posts => _articles et _assets/posts => _assets/articles

@lepiaf lepiaf force-pushed the feat/data-plateforme branch 2 times, most recently from 43d5224 to 61d3f59 Compare November 13, 2023 09:09
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 13, 2023 09:12 Destroyed
@lepiaf lepiaf force-pushed the feat/data-plateforme branch from 61d3f59 to 1963718 Compare November 13, 2023 09:49
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 13, 2023 09:51 Destroyed
@lepiaf lepiaf force-pushed the feat/data-plateforme branch from 1963718 to 8559120 Compare November 13, 2023 09:51
@lepiaf lepiaf added status/reviewable status: reviewable and removed status/wip status: wip labels Nov 13, 2023
@lepiaf lepiaf marked this pull request as ready for review November 13, 2023 09:52
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 13, 2023 09:53 Destroyed
@lepiaf lepiaf force-pushed the feat/data-plateforme branch from 8559120 to 93ead02 Compare November 13, 2023 10:00
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 13, 2023 10:03 Destroyed
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 13, 2023 13:32 Destroyed
_articles/fr/2023-11-13-rex-plateforme-data.md Outdated Show resolved Hide resolved
_articles/fr/2023-11-13-rex-plateforme-data.md Outdated Show resolved Hide resolved
_articles/fr/2023-11-13-rex-plateforme-data.md Outdated Show resolved Hide resolved
_articles/fr/2023-11-13-rex-plateforme-data.md Outdated Show resolved Hide resolved
_articles/fr/2023-11-13-rex-plateforme-data.md Outdated Show resolved Hide resolved
_articles/fr/2023-11-13-rex-plateforme-data.md Outdated Show resolved Hide resolved
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 13, 2023 14:43 Destroyed
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 13, 2023 14:46 Destroyed
@lepiaf lepiaf requested a review from Cindyvlv November 13, 2023 18:54
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 14, 2023 09:01 Destroyed
@github-actions github-actions bot temporarily deployed to dev-feat/data-plateforme November 14, 2023 14:19 Destroyed
@ElevenTom ElevenTom merged commit c5acc38 into master Nov 14, 2023
2 checks passed
@ElevenTom ElevenTom deleted the feat/data-plateforme branch November 14, 2023 14:43
Copy link
Member

@ch3ric ch3ric left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

✍️ @lepiaf

lancer.

Un Poc ("Proof of Concept", ou preuve de concept) a été mise en oeuvre par l'équipe data. Elle s'articule autour d'un
pipeline ELT (extract, load, transform) en utilisant les technologies suivantes : Google Cloud Platform, Talend, dbt et
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

mentionner Big Query


- MySQL
- MongoDB ([voir notre article de blog sur MongoDB](https://blog.eleven-labs.com/fr/symfony-et-mongodb-retour-aux-sources/))
- Appel HTTP vers des API externes
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

(CRM, ERP...)


C'est dans ce contexte que ma mission commence.

## Le pipeline ELT : Extract, Load, Transform
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

préciser "Le pipeline ELT du PoC existant"


Ce pipeline est fonctionnel et déjà en place avec Jenkins. Voyons l'architecture de la nouvelle plateforme data.

## Architecture de la plateforme data
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Préciser "Nouvelle Archi" (que tu as mise en place)


Une fois l'architecture dessinée et communiquée à l'équipe, nous pouvons la mettre en oeuvre.

## Conditionnement des charges de travail
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ces parties suivantes devraient être des sous parties de la partie 'nouvelle archi' ?

Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

"Conditionnement" : pas sur de comprendre ? parler d'Orchestration ou Ordonnancement peut etre ?

Copy link
Member Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

en anglais on dirait "workload packaging". je veux expliquer que "j'emballe" tout le code dans une image Docker/conteneur.

en effet, il faut changer le niveau de titre en sous-partie de "nouvelle archi"

Enfin, en dernière étape de ce pipeline, il y a l'affichage des données.

Le but final de tout ce travail est d'éviter d'effectuer tous les calculs au moment d'afficher les rapports d'analyse.
Sans le travail en amont de calcul et d'aggrégation de données, l'affichage des graphiques serait très longs.
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

"affichage [...] long" (sans "s")

propriétaire des bases de données. Cette démarcation se traduit dans le code de l'infrastructure et permet de
bien délimiter les responsabilités entre les équipes.

Nous retrouvons donc en partie supérieure du schéma les sources de données de type base de données qui sont géréeé par
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

géréeé -> gérées


Suite à cette mise en production, l'infrastructure ne va pas beaucoup changer. Il y aura principalement de la maintenance et des mises à jour à effectuer, en particulier sur le service Composer.

Un des points de souffrance sur le pipeline est Talend. Cet outil ne s'adapte pas bien à un environnement Cloud. Le projet serait de trouver une solution alternative. Quel serait l'outil adapté pour de l'extraction de données et qui serait complètement géré par Google ?
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

oh le beau teasing pour le prochain article ;)


La construction de cette plateforme data a été un grand projet de notre [Studio Eleven Labs](https://eleven-labs.com/nos-publications/donnez-une-nouvelle-dimension-a-votre-equipe-produit). Tout a été construit depuis zéro. J'ai bien cerné la problématique, cela m'a permis d'identifier tous les éléments sur le fonctionnement du pipeline. La solution a été de s'adapter à son fonctionnement et aux pré-requis. Enfin, la mise en production s'est déroulée comme prévu. La mise en place d'une surveillance active m'a permis de détecter les erreurs en amont. Cela réduit considérablement les temps d'indisponibilité de la plateforme.

Pour ma part, cette mission a été très complète. J'ai tantôt été _Architecte_ avec la conception de l'infrastructure, _Ops_ avec l'écriture du Terraform et de la bonne compréhension de Google Cloud Platform, et enfin _Dev_ avec la rédaction du DAG Airflow. J'en ressort avec encore plus d'expérience !
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Data Eng plutot que Dev non ?

Copy link
Member Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

oui c'est également possible. je vais changer.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

Successfully merging this pull request may close these issues.

6 participants