Skip to content
giorgialodi edited this page Oct 22, 2019 · 6 revisions

OntoPiA - la rete di ontologie e vocabolari controllati della Pubblica Amministrazione

Indice

Obiettivi

Questa è la sezione wiki di OntoPiA. L'obiettivo è di descrivere aspetti di processo e caratteristiche di OntoPiA che possono servire a una maggiore partecipazione e adozione della rete stessa.

Definizioni

Ontologia: una specifica formale ed esplicita di rappresentazione (concettualizzazione) condivisa di un dominio di conoscenza, definita sulla base di requisiti specifici

Vocabolario controllato: una serie di termini e codici standard predefiniti e autorizzati, preselezionati al fine di indicizzare e recuperare informazioni. I codici e i relativi termini possono essere organizzati in strutture più o meno complesse come tesauri, tassonomie, liste di codici (code list), ecc.

L'attuale OntoPiA

OntoPiA è una rete di ontologie e vocabolari controllati attualmente (Ottobre 2019) formata da 27 ontologie, di cui una che le importa tutte rappresentando così l'unico punto di accesso alla rete complessiva, 32 vocabolari controllati e 1 file di mappatura tra due diversi vocabolari controllati.

Si distinguono ontologie:

  • di dominio
  • di supporto
  • "core"
  • "top-level"
  • di metadatazione

La Figura seguente rappresenta la rete OntoPiA come uno stack di ontologie. La rete di ontologie e vocabolari controllati OntoPiA

Perché OntoPiA

La rete OntoPiA nasce con l'obiettivo di definire un linguaggio comune e formale, eleborabile da dispositivi digitali e leggibile da persone, per l’interscambio di dati (interoperabilità semantica). Essa, inoltre, apre la strada alla creazione di dati nativamente collegati, ovvero fornisce gli schemi dati per creare e interrogare il “grafo della conoscenza” (knowledge graph) della Pubblica Amministrazione italiana.

Alla luce di questo, OntoPiA quindi:

  • facilita lo sviluppo di nuovi sistemi informativi
  • agevola lo scambio di dati provenienti da fonti diverse anche eterogenee
  • consente di standardizzare i dati della Pubblica Amministrazione, inclusi i dati di tipo aperto
  • facilita la data portability

Standard di riferimento

L'intera rete è disponibile secondo il paradigma degli open data (licenza aperta Creative Commons Attribuzione 4.0 - CC BY 4.0) e utilizzando gli standard del Web Semantico. In particolare, tutte le ontologie sono definite mediante l'Ontology Web Language (OWL) serializzate in 3 formati RDF (Resource Description Framework) diversi ovvero RDF/Turtle, RDF/XML e JSON-LD (in quest'ultimo caso, si è scelto di serializzare in questo formato proprio per rendere disponibili le ontologie a un mondo di sviluppo software prevalentemente orientato al formato JSON).

I vocabolari controllati sono dataset aperti, disponibili secondo le tre serializzazioni RDF suddette nonché, ove possibile, in CSV ed Excel. Nel caso del formato CSV il carattere separatore è la virgola e la codifica utilizzata UTF-8, come raccomandato nelle linee guida per la valorizzazione del patrimonio informativo pubblico.

I principi FAIR applicati a OntoPiA

La metodologia di sviluppo della rete OntoPiA segue i principi FAIR di seguito riportati:

Findable (trovabile): si usano URI neutri e permanenti (si veda nello specifico la politica di gestione degli URI) per identificare concetti e relazioni nella rete di ontologie, e termini nei vocabolari controllati. Ogni ontologia è accompagnata da metadati che la descrivono (specificati al fine di aumentare la rintracciabilità delle ontologie). I metadati delle ontologie seguono una delle ontologie di metadatazione della rete stessa ovvero ADMS-AP_IT - Asset Description Metadata Schema - Profilo Applicativo Italiano. Questa ontologia si basa sull'ontologia di metadatazione nazionale DCAT-AP_IT (esattamente come il profilo applicativo Europeao ADMS-AP si basa sul profilo di metadatazione DCAT-AP) ma estende tale modello con alcuni metadati che caratterizzano le ontologie ovvero metadati quali "prefix", "keyClasses", ecc.

I metadati dei vocabolari controllati seguono l'ontologia DCAT-AP_IT in quanto ciascun vocabolario controllato è un dataset (aperto).

Accessible (accessibile): in OntoPiA si utilizzano protocolli standard aperti per l’accesso della stessa sul Web (i.e. HTTP(S)) e per l’interrogazione dei dati (i.e., SPARQL). Inoltre, sono implementati meccanismi di Content Negotiation e di deferenziazione degli URI

Interoperable (interoperabile): come riportato nella sezione standard di riferimento in OntoPiA si utilizzano standard del Web Semantico quali OWL e RDF per modellare i dati e SPARQL per abilitare interrogazioni sui dati sia human-machine, sia machine-to-machine.

Reusable (riutilizzabile): tutte le ontologie e i vocabolari controllati sono rilasciati secondo una licenza aperta (CC-BY 4.0) e sono collegati (attraverso opportuni link semantici) ad altre ontologie standard (de facto) disponibili nel Web dei Dati.

Politica di gestione degli URI

In OntoPiA gli URI sono neutri e persistenti nel tempo. L'URI quindi per la stessa entità non varia al variare del dataset. Essi seguono il pattern raccomandato dalle linee guida per la valorizzazione del patrimonio informativo pubblico. In particolare l'URI è così formato:

https://{dominio}/{tipo_risorsa}/{concetto}/{codice_riferimento}

Nella rete di ontologie OntoPiA:

  • il dominio è rappresentato da w3id.org/italia

  • il tipo di risorsa può al momento essere uno di questi tre valori:
    a) onto --> per rappresentare tutto il mondo delle ontologie

    b) controlled-vocabulary --> per rappresentare tutto il mondo dei vocabolari controllati

    c) data --> per specificare gli URI dei dati collegati (linked data) che sono creati come istanze dei modelli ontologici di OntoPiA

  • il concetto è lo specifico concetto che si istanzia nei dati o nome dell'ontologia

  • il codice di riferimento è il codice univoco per identificare univocamente la "cosa" descritta

Riassumendo, in OntoPiA le seguenti convenzioni sono adottate per gli URI definiti nelle ontologie e nei dati collegati prodotti utilizzando le ontologie:

Ontologie

URI https://w3id.org/italia/onto/{ontology-slug}

esempio: https://w3id.org/italia/onto/CLV che definisce l'ontologia dei Luoghi/Indirizzi (Core Location Vocabulary - Profilo Applicativo Italiano)

dove slug significa quella parte dell'URL che spiega il contenuto dalla pagine. In questo caso, ontology-slug è il nome dell'ontologia o l'acronimo che la identifica.

Classi definite nelle ontologie

URI https://w3id.org/italia/onto/{ontology-slug}/{class-id}

esempio: https://w3id.org/italia/onto/CLV/City che definisce il concetto di Città (entità territoriale) nell'ontologia dei Luoghi/Indirizzi (CLV - Core Location Vocabulary - Profilo Applicativo Italiano)

Proprietà definite nelle ontologie

URI https://w3id.org/italia/onto/{ontology-slug}/{property-id}

esempio: https://w3id.org/italia/onto/CLV/hasCity che definisce la proprietà di tipo Object Property ha città che collega un Indirizzo alla sua componente città/comune (intesa come entità territoriale).

Vocabolari controllati

URI https://w3id.org/italia/controlled-vocabulary/{vocabulary-namespace}/{vocabulary-id}

esempio: https://w3id.org/italia/controlled-vocabulary/classifications-for-documents/municipal-notice-board

Dati collegati (linked data

URI https://w3id.org/italia/data/{concept}/{id}

esempi:

https://w3id.org/italia/data/public-organization/agid

https://w3id.org/italia/data/standard/SKOS

Il servizio esterno w3id.org

Come raccomandato nelle linee guida per la valorizzazione del patrimonio informativo pubblico, OntoPiA si avvale di un servizio esterno per la gestione degli URI permanenti. Il servizio è chiamato w3id.org ed è mantenuto dal Permanent Identifier Community Group del W3C. Esso è abbastanza utilizzato per ottenere URI persistenti nel Web. Infatti, grazie a esso è possibile definire degli URI che siano sempre redirezionati verso siti web funzionanti.

Nel contesto OntoPiA, è stato acquisito il dominio italia e sono state definite una serie di regole di redirezionamento per ciascun tipo di risorsa, come prima illustrata, definita nella rete. Tali regole consentono l'accesso a tutta OntoPiA sia utilizzando le serializzazioni RDF, sia via HTML.

Come interrogare OntoPiA

Tutti i contenuti della rete OntoPiA possono essere interrogati attraverso lo standard SPARQL (SPARQL Protocol and RDF Query Language) mediante opportune query SPARQL da eseguire su uno SPARQL endpoint. A tal riguardo, lo SPARQL endpoint utilizzato per OntoPiA è quello della Piattaforma Digitale Nazionale dei Dati (PDND), in particolare Virtuoso.

Content Negotiation

Per tutte le ontologie e i vocabolari controllati sono stati implementati meccanismi di content negotiation. Il processo della content negotiation è il processo per cui si disambiguano le risorse nel web mediante il loro tipo. Infatti, si potrebbe incorrere in URI ambigue, ovvero URI che rappresentano sia l'entità del Web Semantico, sia risorse Web (ad esempio, pagine Web, file, ecc.). Per gestire tale situazione si possono configurare le richieste HTTP sulla base appunto del loro tipo. Grazie a strumenti di interazione utente, dove questi meccanismi sono già opportunamenti integrati (e.g., LodView), e grazie a specifiche regole di ReWrite definite nel contesto del dominio italia di w3id.org, OntoPiA è in grado di restituire ontologie anche nelle tre serializzazioni RDF previste e prima discusse.

A titolo d'esempio si consideri questa richiesta curl -L -H "Accept: text/turtle" https://w3id.org/italia/onto/CLV. La richiesta restituisce l'ontologia dei luoghi/indirizzi nel suo formato RDF/Turtle.

Deferenziazione degli URI

Esistono situazioni, tipicamente con accesso da Web browser, in cui è richiesta una risorsa (non ambigua) del Web Semantico come se questa fosse una pagina HTML. In questi casi è possibile rispondere all’utente con una pagina Web informativa relativa alle informazioni associate all’entità identificata da quell’URI. Questa operazione è detta dereferenziazione degli URI.

OntoPiA implementa la deferenziazione degli URI. In particolare, gli utenti possono navigare i contenuti delle ontologie via HTML mediante sia LODE che LodView e possono visualizzare graficamente le ontologie mediante WebVOWL, che sfrutta la Visual Notation for OWL Ontologies (VOWL) (e.g., ontologia delle condizioni d'accesso.

Inoltre, si possono navigare via Web tutti i vocabolari controllati e i loro contenuti e ogni singolo elemento delle ontologie. Se infatti si accede agli URI di singoli concetti e proprietà e delle ontologie, i vari software di visualizzazione user-friendly di OntoPiA vengono attivati. I software sono al momento dispiegati nel contesto della Piattaforma Digitale Nazionale dei Dati (PDND) e sono quelli precedentemente referenziati e introdotti.