Skip to content

EcrituresNumeriques/corpusGI

Repository files navigation

corpusGI

Le repository rassemble différents scripts d'analyse et de préparation du corpus GI.

  • converHtml2TEIXML.xq : transforme une archive HTML (collectée avec wget) en archive XML TEI, à partir d'un document d'inventaire (XML).
  • timelineExtraction.xq: extrait les données nécessaires à la création d'une timeline avec Timeline.js au format CSV.
  • screenshotGI.py: produit une archive image (capture vue browser) des items de l'archive.

Il contient par ailleurs un workspace SynopsX en construction pour une future mise en ligne de l'archive.

Plus d'informations sur le carnet de recherche du projet.

About

scripts d'analyse et de préparation du corpus GI

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published