Le repository rassemble différents scripts d'analyse et de préparation du corpus GI.
- converHtml2TEIXML.xq : transforme une archive HTML (collectée avec wget) en archive XML TEI, à partir d'un document d'inventaire (XML).
- timelineExtraction.xq: extrait les données nécessaires à la création d'une timeline avec Timeline.js au format CSV.
- screenshotGI.py: produit une archive image (capture vue browser) des items de l'archive.
Il contient par ailleurs un workspace SynopsX en construction pour une future mise en ligne de l'archive.
Plus d'informations sur le carnet de recherche du projet.