Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Ajouter millésime COG plus récents #70

Merged
merged 12 commits into from
Mar 29, 2022
Merged

Ajouter millésime COG plus récents #70

merged 12 commits into from
Mar 29, 2022

Conversation

ddotta
Copy link
Contributor

@ddotta ddotta commented Mar 24, 2022

Une petite PR en rapport avec #69

Ca a l'air de bien fonctionner chez moi, j'espère que j'ai bien mis à jour tous les fichiers et les scripts comme il le faut !

Quelques remarques :

  • pour les régions et les départements, j'ai laissé uniquement 2022 (en remplacement de 2019)
  • pour les communes, j'ai proposé tous les millésimes entre 2018 et 2022.
    A noter que le nom des fichiers csv des communes sur insee.fr varie en fonction des millésimes 🙄 ("commune_2022","commune2021","communes2020","communes_01012019'......) c'est vraiment source d'erreur.
    Pareil pour les noms des colonnes (la casse change : en majuscule pour 2022 et 2012 et en minuscule les années d'avant...)

Si vous comptez rénover {doremifasol} avec cette branche, pas de soucis pour ne pas prendre en compte cette PR !

close #69

@py-b
Copy link
Member

py-b commented Mar 28, 2022

Merci @ddotta !

Pour info, seul le fichier json est désormais utile pour modifier les métadonnées.

Ensuite, il faut juste exécuter le programme data-raw/liste_donnees.R pour générer les données. Plus besoin du fichier csv, ni de l'ancien générateur dans data-raw/archive.

À ta décharge, le contenu des dossiers est sujet à confusion... (je vais également déplacer le fichier csv dans archive, ce sera plus clair).

@py-b
Copy link
Member

py-b commented Mar 28, 2022

La PR me semble tout à fait pertinente. L'automatisation de la recherche des sources n'est pas pour demain, donc toute mise à jour manuelle est pour l'instant la bienvenue. 👍

@py-b
Copy link
Member

py-b commented Mar 28, 2022

J'ai amorcé quelques corrections mineures dans le json (md5, size, ajout variable CTCD).

Pour les millésimes 2021 et antérieurs, je trouve par ailleurs plus cohérent (et pas beauoup plus cher) de télécharger le zip contenant tous les niveaux géographiques (cog_ensemble_AAA_csv.zip) plutôt que le seul fichier des communes. J'ai fait la modif pour 2021. Je ferai les autres millésimes prochainement.

@py-b py-b marked this pull request as draft March 28, 2022 23:20
@ddotta
Copy link
Contributor Author

ddotta commented Mar 29, 2022

Top @py-b ! C'est vrai que modifier le json est plus pratique que le csv.
Peut-être qu'ajouter un court CONTRIBUTING pour la mise à jour manuelle pourrait être utile aux futurs contributeurs ?

@py-b
Copy link
Member

py-b commented Mar 29, 2022

Quelques infos essentielles dans CONTRIBUTING : f4a1464

@py-b py-b marked this pull request as ready for review March 29, 2022 18:38
@py-b py-b merged commit c1d39d4 into InseeFrLab:master Mar 29, 2022
@ddotta ddotta deleted the 69-COG branch March 30, 2022 09:34
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

Nouveaux millésimes du COG à intégrer
2 participants