Richiesta apertura dati Assemblea Regionale Siciliana: una lettera aperta

NdR: oggi abbiamo inviato al presidente dell’Assemblea Regionale Siciliana Onorevole Micciché e al dott. Ingrao (responsabile dei servizi informatici dell’ARS) l’email di sotto.

—————-

Egregi Presidente Onorevole Micciché e dott. Ingrao,
vi scriviamo a nome della comunità “Open Data Sicilia“, iniziativa civica che si propone di far conoscere e diffondere la cultura dell’open government e le prassi dell’open data nel nostro territorio al fine di aprire una discussione pubblica partecipata.

In occasione della settimana dell’amministrazione aperta, attualmente in corso e durante la quale si concentrano su tutto il territorio nazionale iniziative per promuovere l’amministrazione aperta, vi scriviamo in merito al recente aggiornamento del sito Web istituzionale dell’Assemblea Regionale Siciliana.
Il nuovo portale istituzionale dell’ARS si presenta adesso molto più flessibile in termini di adeguatezza e fruibilità e, allo stesso tempo, nell’ottica di migliorare alcuni aspetti del sito,™ vorremmo suggerirvi l’implementazione di alcune funzionalità che potrebbero aumentare di molto il livello di attrattività del sito stesso.

Il suggerimento più importante che vorremmo darvi è di pubblicare i dati dell’attività politica dell’Assemblea Regionale Siciliana in opendata, così come da anni avviene al Senato della Repubblica.
In un settore chiave come quello legislativo, i dati aperti costituiscono uno strumento essenziale ed estremamente importante, abilitante per tutte quelle iniziative relative al monitoraggio, alla trasparenza, alla partecipazione civica e all’ open-governmentin generale.

Lo scorso 9 e 10 novembre 2018, la comunità ha organizzato il raduno Open Data Sicilia 2018 a Palazzo dei Normanni, presentando il progetto OpenARS, una piattaforma per la pubblicazione dei dati ARS in modalità “Linked-Data“, il livello più alto di fruibilità secondo il modello di Tim Berners-Lee. In quell’occasione abbiamo mostrato l’alto livello di flessibilità raggiunto dalle potenzialità del Web semantico applicato ai dati ARS; abbiamo sviluppato una ontologia per modellare il dominio di riferimento dei dati ARS partendo proprio dai dati estratti dal sito vecchio; abbiamo organizzato un hackathon sui dati ARS, enfatizzando il concetto di riuso, tipico degli opendata, in contesti diversi da quello originale (per maggiori informazioni programma, slide e video sono scaricabili nel sito di riferimento sopraindicato).
Con un obiettivo principale: mostrare come tutto questo consenta di fare diventare più “quotidiane” e più “leggibili” le attività parlamentari.
Anche se esistono dei riferimenti normativi che prevedono che gli enti dello Stato sono tenuti a pubblicare i dati in opendata, vorremmo suggerirvi di pubblicare i dati in formato aperto come scelta di governo, perché ciò rende l’amministrazione veramente trasparente attraverso la diffusione delle informazioni relative al suo funzionamento; migliora la qualità della vita dei cittadini attraverso la creazione di servizi sempre più aderenti alle esigenze degli utenti; diventa volano di sviluppo economico attraverso il riuso dei dati in maniera creativa, ad esempio attraverso lo sviluppo di app data-driven.

Sebbene sul sito del progetto OpenARS siano presenti ontologia, endpoint SPARQL ed esempi pronti all’uso, se pensate che il progetto possa essere preso come spunto anche solo per iniziare a costruire un percorso di apertura dei dati dell’ARS, ci teniamo a farvi sapere che la comunità Open Data Sicilia è disponibile a qualsiasi forma di confrontocollaborazione, scambio di idee, così come già avvenuto nei mesi precedenti l’organizzazione del raduno presso i locali ARS.
Per farvi un esempio, un primissimo passo facilmente perseguibile potrebbe essere la pubblicazione, in un’area dedicata del sito istituzionale, di file CSV relativi ai dati dell’attività parlamentare con licenza aperta. In un’ottica democratica dei rapporti tra cittadino e pubblica amministrazione, una maggiore trasparenza offrirebbe la possibilità di un controllo minuzioso dell’attività amministrativa trasformando la pubblica amministrazione in quella “casa di vetro” tanto agognata dagli ideali dell’Open Government.

Fiduciosi in una vostra risposta cogliamo l’occasione per porgervi cordiali saluti.

OpenARS: una prima esplorazione dei dati

A meno di un mese da Open Data Sicilia 2018, che si terrà a Palermo il 9 e 10 novembre, entriamo adesso più nel vivo nel progetto OpenARS, i linked data dell’Assemblea Regionale Siciliana (ARS), che verrà presentato nel corso dell’evento.
Nell’ultimo post ci eravamo lasciati con la presentazione dell’ontologia OpenARS, creata per descrivere in modo formale le diverse tipologie di dati dell’ARS e le loro interconnessioni.
L’ontologia sviluppata consente di dare ad ogni risorsa un significato e di trasformare i dati dell’ARS in un enorme grafo direttamente interrogabile, esplorabile e riutilizzabile in altri contesti.
Ma come li interroghiamo i dati?
Per farlo è necessario introdurre il linguaggio principe usato nel Web Semantico per le interrogazioni, cioè il linguaggio SPARQL.
Il linguaggio SPARQL è una raccomandazione W3C che definisce in modo standard come interrogare i dati, a partire da grafi RDF distribuiti nel Web. Il criterio di interrogazione è basato su un meccanismo di pattern matching, nello specifico dal costrutto triple pattern, che riflette il modello di asserzioni RDF delle triple e fornisce un modello flessibile per le ricerche.
Lo schema generico di un’interrogazione SPARQL è il seguente:

dove
  • PREFIX è la clausola che definisce prefissi e namespace, comoda per abbreviare le URI;
  • SELECT è la clausola che definisce le informazioni che vogliamo estrarre dal repository;
  • FROM è la clausola che definisce il grafo (o i grafi) da esplorare. Può essere sia locale sia remoto. Possiamo anche inserire clausole come FROM NAMED e GRAPH per specificare sorgenti dati multipli;
  • WHERE è la clausola che definisce il pattern del grafo che intendiamo cercare nel dataset; rappresenta la parte più importante della query;
  • ORDER BY è la clausola che mi consente di ordinare i risultati della ricerca.
Immaginiamo di avere un dataset contenente un insieme di libri (risorse) descritti da una specifica ontologia nel file book.rdf, pubblicato nel Web secondo i principi dei Linked Data. Immaginiamo di identificare il dataset nel Web col seguente URL:
http://example.org/books.rdf .
Il nostro obiettivo è conoscere tutti i libri presenti del dataset con i relativi autori; per fare questo dobbiamo estrarre tutte le risorse di tipo libro (?book) e tutte le persone (?person) che sono autori (ex:hasAuthor) dei libri. Dei libri vogliamo conoscere i titoli (?book_title) e i nomi e cognomi degli autori (?person_name, ?person_surname).
La query di interrogazione sarà la seguente:

e questo un ipotetico risultato
Passiamo adesso ad OpenARS e proviamo ad effettuare un’interrogazione reale direttamente sul suo repository. A differenza del file pubblicato nell’esempio precedente i dati di OpenARS sono caricati su un server di storage dedicato che contiene l’intera base di conoscenza nella forma di triple/asserzioni . Per poter effettuare delle interrogazioni sui dati  è necessario conoscere l’URL punto di ingresso, conosciuto con il nome di SPARQL endpoint.
E’ possibile effettuare l’interrogazione direttamente dal client Web fornito dal triple store, come nella figura sottostante oppure è possibile eseguire query SPARQL da codice sorgente di un qualsiasi linguaggio di programmazione se si vogliono sviluppare applicazioni che interagiscono con i dati.
Prima di effettuare qualsiasi tipo di ricerca è fondamentale conoscere l’ontologia di riferimento al fine di poter interrogare correttamente i dati per tipologie di classi e per connessioni esistenti tra le risorse.
Facciamo adesso qualche esempio di interrogazione relativa a statistiche sull’attività legislativa dell’ARS. Per esempio, vogliamo sapere quanti disegni di legge sono stati presentati nel corso della 16° legislatura.
La query SPARQL è la seguente:

che restituirà come risultato il valore 1346.  Provare per credere.
La query assomiglia molto al linguaggio SQL e risulta di per sé molto leggibile. Nel campo WHERE selezioniamo tutte le risorse dello store di tipo ars:DisegnoDiLegge che sono collegate, tramite la proprietà ars:legislatura, alla risorsa che identifica la sedicesima legislatura ( http://dati.openars.org/legislatura/xvi ).
La selezione restituisce un certo numero di istanze e nel campo SELECT decidiamo di calcolare il numero totale di tali istanze, tramite l’operatore di aggregazione count, che corrisponde al numero totale di disegni di legge della 16° legislatura.
Vediamo adesso qualcosa un pò più complesso.
Voglio sapere la classifica top ten  dei disegni di legge presentati nella 16° legislatura suddivisa per materia. 
La query SPARQL è la seguente:

Questo il risultato:

Alcune considerazioni finali:
  • questi sono solo piccoli esempi che si possono fare con i dati ARS, nel prossimo post presenteremo casi molto più complessi che prenderanno in considerazione interrogazioni a sorgenti dati multipli;
  • passando dal Web di documenti al Web di dati (linked-data), il Web diventa machine-understandable e il tutto risulta esponenzialmente vantaggioso in termini di flessibilità e di interoperabilità semantica;
  • con la pubblicazione dei dati in modalità linked il Web diventa data-centric e le possibili interrogazioni dei dati, grazie alle loro interconnessioni, sia dentro che fuori al dataset, diventano pressoché infinite e delle più disparate;
  • non ci credete? provate a reperire nel Web tradizionale i nomi di TUTTI i sindaci le cui città hanno lo stesso patrono della città collegio di elezione di un qualsiasi deputato dell’ARS

    Nel prossimo post vedremo quanto sarà facile farlo con OpenARS.

Alcuni link per approfondire il linguaggio SPARQL
p.s. le iscrizioni al raduno sono ancora aperte. I posti sono gratuiti ma limitati. Per maggiori informazioni questo è il sito dell’evento.
Alla prossima