LibreItalia Conference 2019: 11 maggio a Palermo

Il prossimo 11 maggio si svolgerà a Palermo la conferenza “LibreItalia Conference 2019“: https://www.libreitalia.org/sesta-conferenza-italiana-libreitalia-2019/

È organizzata dall’associazione LibreItalia, con la collaborazione di Free Circle, l’associazione Mozilla Italia, la comunità Ubuntu Italia e noi di OpenDataSicilia.
Si terrà a Palermo, presso la “Sala De Seta” ai Cantieri della Zisa, presso via Paolo Gili, 4, dalle ore 9.00 alle ore 17.30.

La registrazione all’evento è gratuita e si effettua da qui: https://www.eventbrite.it/e/biglietti-conferenza-libreitalia-palermo-2019-59876453083

Sessione mattutina

Ora Intervento
09:00 Registrazione e accoglienza
09:30 Saluti – Consiglio LibreItalia, autorità
09:45 Il software libero e open source: cos’è e perché riguarda tutti – Giordano Alborghetti, LibreItalia
10:15 L’importanza dei formati standard – Italo Vignoli, Presidente onorario LibreItalia
10:45 Coffee break
11:15 Open Data: un percorso tra formati, strumenti, giurisprudenza e modalità di pubblicazione – Andrea Borruso, Mario Grimaldi e Ciro Spataro, OpenDataSicilia
11:45 La nuova versione dell’Internet Health Report di Mozilla – Edoardo Viola, Mozilla Italia
12:15 Stai in forma e sicuro con Ubuntu – Dario Cavedon, ubuntu-it

Sessione pomeridiana

Ora Intervento
14:00 M come Migrazione (a software libero): Comune di Roma – Flavia Marzano, Assessorato «Roma Semplice»
14:30 M come Migrazione: dalla teoria alla pratica – Enio Gemmo, Presidente LibreItalia
15:00 I professionisti e il software libero – Ing. Bruno Lo Torto, Ordine Ingegneri di Palermo
15:30 Coffee break
16:00 Public Money, Public Code – Marina Latini, CIB software GmbH
16:30 LibreOffice e la sua community – Gabriele Ponzo e Marina Latini, TDF
17:00 Sessione di chiusura e saluti – Consiglio LibreItalia, Free Circle Palermo

Richiesta apertura dati Assemblea Regionale Siciliana: una lettera aperta

NdR: oggi abbiamo inviato al presidente dell’Assemblea Regionale Siciliana Onorevole Micciché e al dott. Ingrao (responsabile dei servizi informatici dell’ARS) l’email di sotto.

—————-

Egregi Presidente Onorevole Micciché e dott. Ingrao,
vi scriviamo a nome della comunità “Open Data Sicilia“, iniziativa civica che si propone di far conoscere e diffondere la cultura dell’open government e le prassi dell’open data nel nostro territorio al fine di aprire una discussione pubblica partecipata.

In occasione della settimana dell’amministrazione aperta, attualmente in corso e durante la quale si concentrano su tutto il territorio nazionale iniziative per promuovere l’amministrazione aperta, vi scriviamo in merito al recente aggiornamento del sito Web istituzionale dell’Assemblea Regionale Siciliana.
Il nuovo portale istituzionale dell’ARS si presenta adesso molto più flessibile in termini di adeguatezza e fruibilità e, allo stesso tempo, nell’ottica di migliorare alcuni aspetti del sito,™ vorremmo suggerirvi l’implementazione di alcune funzionalità che potrebbero aumentare di molto il livello di attrattività del sito stesso.

Il suggerimento più importante che vorremmo darvi è di pubblicare i dati dell’attività politica dell’Assemblea Regionale Siciliana in opendata, così come da anni avviene al Senato della Repubblica.
In un settore chiave come quello legislativo, i dati aperti costituiscono uno strumento essenziale ed estremamente importante, abilitante per tutte quelle iniziative relative al monitoraggio, alla trasparenza, alla partecipazione civica e all’ open-governmentin generale.

Lo scorso 9 e 10 novembre 2018, la comunità ha organizzato il raduno Open Data Sicilia 2018 a Palazzo dei Normanni, presentando il progetto OpenARS, una piattaforma per la pubblicazione dei dati ARS in modalità “Linked-Data“, il livello più alto di fruibilità secondo il modello di Tim Berners-Lee. In quell’occasione abbiamo mostrato l’alto livello di flessibilità raggiunto dalle potenzialità del Web semantico applicato ai dati ARS; abbiamo sviluppato una ontologia per modellare il dominio di riferimento dei dati ARS partendo proprio dai dati estratti dal sito vecchio; abbiamo organizzato un hackathon sui dati ARS, enfatizzando il concetto di riuso, tipico degli opendata, in contesti diversi da quello originale (per maggiori informazioni programma, slide e video sono scaricabili nel sito di riferimento sopraindicato).
Con un obiettivo principale: mostrare come tutto questo consenta di fare diventare più “quotidiane” e più “leggibili” le attività parlamentari.
Anche se esistono dei riferimenti normativi che prevedono che gli enti dello Stato sono tenuti a pubblicare i dati in opendata, vorremmo suggerirvi di pubblicare i dati in formato aperto come scelta di governo, perché ciò rende l’amministrazione veramente trasparente attraverso la diffusione delle informazioni relative al suo funzionamento; migliora la qualità della vita dei cittadini attraverso la creazione di servizi sempre più aderenti alle esigenze degli utenti; diventa volano di sviluppo economico attraverso il riuso dei dati in maniera creativa, ad esempio attraverso lo sviluppo di app data-driven.

Sebbene sul sito del progetto OpenARS siano presenti ontologia, endpoint SPARQL ed esempi pronti all’uso, se pensate che il progetto possa essere preso come spunto anche solo per iniziare a costruire un percorso di apertura dei dati dell’ARS, ci teniamo a farvi sapere che la comunità Open Data Sicilia è disponibile a qualsiasi forma di confrontocollaborazione, scambio di idee, così come già avvenuto nei mesi precedenti l’organizzazione del raduno presso i locali ARS.
Per farvi un esempio, un primissimo passo facilmente perseguibile potrebbe essere la pubblicazione, in un’area dedicata del sito istituzionale, di file CSV relativi ai dati dell’attività parlamentare con licenza aperta. In un’ottica democratica dei rapporti tra cittadino e pubblica amministrazione, una maggiore trasparenza offrirebbe la possibilità di un controllo minuzioso dell’attività amministrativa trasformando la pubblica amministrazione in quella “casa di vetro” tanto agognata dagli ideali dell’Open Government.

Fiduciosi in una vostra risposta cogliamo l’occasione per porgervi cordiali saluti.

Biblioteche e bene comune digitale

a cura di Salvatore Fiandaca e Gianni Vitrano

Dall’11 al 16 marzo 2019 la Presidenza del Consiglio dei Ministri, Dipartimento della Funzione Pubblica organizza a livello nazionale la “Settimana dell’Amministrazione aperta” con l’obiettivo di promuovere la cultura e la pratica della trasparenza, della partecipazione e della accountability nelle amministrazioni pubbliche e nella società e accrescere la fiducia dei cittadini nelle istituzioni. Per il Comune di Palermo ha aderito la Biblioteca Comunale presentando il progetto Teca digitale.

Il progetto nasce a fine 2017, quando sono state pubblicate su Flickr le prime scansioni delle cartoline della Collezione fotografica di Enrico Di Benedetto, con illustrazione e foto di Palermo tra il XIX ed il XX secolo, un progetto permette a noi cittadini di fare un meraviglioso viaggio nel tempo (cit.)

Ad oggi sono state pubblicate più di 800 cartoline, ad ognuna è associato a un “corredo informativo” costituito da: titolo, posizione geografica, gallerie di appartenenza, tag, licenza e metadati (non sono dati presenti in tutte le immagini, ma nella grandissima parte), tutte pubblicate con una licenza aperta CC BY-SA 4.0 che ne consente il riuso

Grazie all’uso della licenza CC BY-SA 4.0, alla buona struttura dei metadati e all’analisi di @aborruso, partendo dagli album di Flickr con il  web scraping  ha ottenuto i dati grezzi ottimi per un riuso. Qui maggiori dettagli sulla la tecnica usata per recuperare i dati.

Il riuso dei dati

Nei file CSV ‘grattati’ da Andrea, per ogni immagine, c’è la posizione geografica, che permette di localizzare le cartolinie sul territorio comunale di Palermo, per farlo è stato utilizzato uno dei più usati GIS Desktop Open Source, QGIS.

Utilizzando solo i file CSV è stato possibile creare la mappa e un atlante (cioè una stampa in serie di tutte le foto con tutti i dati disponibili): la mappa è interattiva, cioè al passaggio del mouse, su ogni punto, compare la relativa immagine (vedi screenshot di sopra); oppure è possibile generare un unico atlante di oltre 800 schede, una per ogni cartolina presente nella collezione.

Scheda dell’atlante realizzato cin QGIS

Dati:

Riferimenti

Video demo

Le mappe

Dal progetto QGIS,  con l’ausilo del plugin Qgis2web e un pizzico di conoscenza di HTML abbiamo realizzato la mappa #viaggioneltempo sfruttando il lavoro fatto per un vecchio progetto, l’Atlante Storico, che abbiamo ritenuto essere la base cartografica naturale per il tema trattatto.

#viaggioneltempo

Sempre con QGIS abbiamo ottenuto i file geojson che ci hanno permesso di costruire una mappa dinamica su uMap (altro esempio di riuso)La Cartografia di base utilizzata nella mappa, è la Carta tecnica storica della Soc. An. Ottico Meccanica Italiana e Rilevamenti Aerofotogrammetrici (O.M.I.R.A.) del 1935 di Roma, pubblicata dal Comune di Palermo nel Portale Cartografico, scaricata e riproiettata per realizzare Atlante delle cartografie storiche di Palermo.

Le mappe sono stata inserita nel contenitore PalermoHub di opendatasicilia.it, un contenitore di mappe realizzate/rielaborate da liberi cittadini o da civic hackers prevalentemente sul territorio comunale di Palermo,  non ha alcun intento commerciale, l’unica finalità è mostrare le possibilità di rielaborazione e comunicazione offerte dagli open data o dati pubblici comunali, regionali, nazionali e tutti possono contribuire alla crescita e alla divulgazione.

Palermo: un meraviglioso viaggio nel tempo grazie alla Biblioteca Comunale di Palermo

La Biblioteca Comunale di Palermo dal 26 ottobre del 2017 ha iniziato a pubblicare su Flickr alcune foto della Collezione fotografica di Enrico Di Benedetto, scattate a Palermo tra il XIX ed il XX secolo, tutte pubblicate con una licenza aperta che ne consente il riuso.

Da quel giorno ne sono state pubblicate poco più di 800 e questa collezione oggi è un archivio a suo modo unico, dal grande valore simbolico e culturale.

A me lascia senza fiato vedere ad esempio la galleria dedicata alla “Cala”, l’attuale porto turistico della città, nonché il più antico porto di Palermo. E questa foto denominata “Imbarco-Emigranti“, di circa 100 anni fa, merita di essere guardata e riguardata.

Note sull’archivio

L’archivio è composto da queste 20 gallerie:

Ogni foto è associata a un “corredo informativo” costituito da: titolo, posizione geografica, gallerie di appartenenza, tag, licenza e metadati (non sono dati presenti in tutte le foto, ma nella grandissima parte).

La posizione geografica viene inserita sfruttando una delle caratteristiche native di Flickr che consente di associare una foto a una posizione su mappa. Una volta fatto, all’elemento viene associata una struttura dati di questo tipo, in cui oltre alla coppia di coordinate è presente un’informazione geografica gerarchica (Italia > Sicilia > Palermo).

Per i metadati lo staff della Biblioteca ha accettato una nostra proposta (vedi paragrafo successivo). Flickr infatti non consente di metadatare in modo strutturato una foto, associargli un identificativo, un autore, un editore, la pagina, ecc. e l’unica possibilità per inserire informazioni di questo tipo è quella di sfruttare lo spazio per le note testuali.
E questo è il modo scelto (immagine di sotto) per il meraviglioso archivio della British Library.

Abbiamo aggiunto un elemento: inserire il testo della nota in una modalità che fosse nativamente non soltanto da leggere a video, ma anche un testo strutturato machine readable, trasformabile in una banca dati da interrogare, analizzare e trasformare.
E allora le note sono in YAML, un formato che è sia human che machine readable.

Ad ogni foto sono quindi associate informazioni con questa struttura tipo:

È leggibile chiaramente da un essere umano e contemporaneamente si può trasformare in dati “leggibili da una macchina”, sfruttando una qualsiasi libreria/modulo in grado di interpretare un testo YAML. Con yq ad esempio trasformo la stringa di input di sopra con <input.yaml yq '.|add', per avere indietro un “classica” rappresentazione JSON:

Nella struttura YAML c’è un errore (a causa di un mio suggerimento errato) – non ci dovrebbero essere i “trattini” che fanno da punto elenco – che per fortuna però non ha conseguenze sulla lettura dei dati.
Flickr inoltre fa un encoding dei caratteri inseriti nel campo note (gli “a capo” diventano \n, le virgolette &quot;, ecc.), ma basta saperlo e prendere le “contromisure” via script, per riportare il testo a una struttura YAML corretta.

Come nasce

Qui in OpenDataSicilia diverse persone hanno mostrato nel tempo interesse verso il riuso del patrimonio fotografico della Biblioteca Comunale di Palermo. Tra i primi Giulio Di Chiara e Ciro Spataro, che nel tempo hanno fatto diversi tentativi per porre in essere la cosa.

Quello riuscito, che ha portato a quanto descritto sopra, parte proprio da un’email di Ciro di settembre del 2017, che scrive a me e al Prof. Taibi queste parole:

[…] poniamo che l’Archivio Storico comunale e la Biblioteca comunale si convinca a creare un profilo FLICKR per postare migliaia di immagini frutto di scansioni di carte e manufatti storici e artistici su Palermo e la Sicilia custodite dentro le due strutture. Per valorizzare pubblicamente il patrimonio custodito, insomma open data. Così come fanno a Londra, a New York le Biblioteche pubbliche […]

Da lì parte uno scambio ricco tra Ciro, Davide, me e la Biblioteca, che ha portato in pochi giorni all’inizio della pubblicazione delle foto su Flickr.

Dati

Flickr consente l’accesso ai suoi dati tramite delle ricche API. Per usarle è necessario usare una API key, ottenuta la quale è possibile interrogarle con semplicità.

Un esempio è questo script bash – “bruttino”, perché molto ottimizzabile – che interroga le API per restituire:

Nota bene: da circa 10 foto non è stato possibile estrarre i metadati, perché ci sono dei piccoli errori nel testo sorgente.

Note conclusive

Quanto fatto dalla Biblioteca Comunale di Palermo è un esempio di valore: è facilmente replicabile, non costringe a rivoluzionare procedure interne, ha dei costi sostenibilirestituisce un bene comune digitale prezioso ed è pronto al riuso di persone e “macchine”.

Non è perfetto e si può fare (come sempre) di più e meglio, ma il progetto merita un plauso e un passaparola.

Nei prossimi giorni ci saranno delle sorprese 🎉🎉, degli esempi di riutilizzo di questi dati.

Casi di riuso

Dopo la pubblicazione di questo articolo i dati sono stati (evviva) riutilizzati. Ecco gli esempi:

“T’ansignari e t’appeddiri!”, ti devo insegnare a fare qualcosa e ti devo perdere.

Molto spesso disperdiamo richieste di aiuto (“Come faccio a …”) e le relative preziose risposte in chatsocial network, email tra due persone, ecc..
Sono informazioni che una volta messe in circolo, dopo pochi minuti sono già “perdute”, confinate in spazi ristretti che non si prestano a una condivisione di conoscenza e quasi mai indicizzati dai motori di ricerca.

Allora abbiamo creato uno spazio, un repository GitHub, per mettere a fattore comune scambi di conoscenza/esperienza sui temi che ci piacciono: dati aperti, trasparenza, Linked Open Data, analisi e trasformazione di dati.

Il luogo principe in cui farlo sarà quello delle issue, delle richieste di collaborazione/aiuto. Abbiamo iniziato ad aprirne, e ce ne è di già chiuse e di aperte.

Lo abbiamo chiamato “T’ansignari e t’appeddiri“.

Il nome di questo spazio

T’ansignari e t’appeddiri!“, ti devo insegnare a fare qualcosa e ti devo perdere.

È un proverbio presente in molti dialetti italiani (in Campania ad esempio è T’aggià mbarà e tt’àggia pèrdë!), è un invito asciutto e diretto a chi riceve un insegnamento, affinché lo valorizzi e non lo disperda. È anche e soprattutto un incoraggiamento a prendersi cura del legame tra chi si sta scambiando conoscenza e esperienza.
Un/a nonno/a con sguardo “birichino” e pieno di luce lo dice a un/a nipote, a mo’ di monito, per ricevere indietro due regali: lo sguardo lucente contraccambiato e constatare che l’insegnamento sia stato utile. Anche dopo anni.
Lo dice specialmente quando il/la nipotino/a non applica quanto avrebbe già dovuto apprendere dai suoi avi.

E sarà un monito per chi frequenterà questo spazio 😉

Il galateo

Ci sono delle “buone maniere”, che abbiamo costruito in questi giorni di primo uso:

  • prima di chiedere aiuto, cerca un po’ sul web. Nel 99% dei casi la risposta esiste già ed è quella giusta;
  • prima di chiedere aiuto, dopo che ti sei documentato, fai comunque qualche tentativo per risolvere il tutto in autonomia. Questo ti aiuterà a scrivere in modo molto chiaro un eventuale richiesta di supporto;
  • documenta per bene la tua domanda. Che strumento hai usato, che versione, ecc. e allega (se puoi) uno o più file per poter replicare quanto descritto;
  • fai domande su temi vicini a quelli che esplora la comunità opendatasicilia: i dati aperti, la trasparenza amministrativa, il civic tech e non l’ultima ricetta di “pasta al forno”, la traduzione del Moby Dick che hai letto o Blender;
  • nel titolo della issue per favore inserisci una “etichetta” per classificare i post (ad esempio [scripting] Come fare a rimuovere i duplicati di una tabella);
  • se sei soddisfatto della risposta, sei invitato a rimborsare, creando un testo, una ricetta, che racconti per bene il problema che hai riscontrato e come è possibile risolverlo (vedi sotto);
  • quando rispondi, fornisci gli elementi di base utili a comprendere quanto hai scritto.

Ricette

Le stiamo raccogliendo in questa cartella e speriamo di leggerne presto una tua. Se non sai come si fa, chiedilo con una issue; non appena possibile scriveremo una guida in merito.

L’obiettivo di fondo è quello di trasformare questa raccolta in un testo ipertestuale strutturato.

Note finali

In ultimo un grazie a Andrea,  Ciro, Gianni, Nino e Salvatore, che si sono spesi a dare una prima forma a questo spazio, a viverlo, alimentarlo e sperimentarlo.

Alloggiati Web ed il diritto all’Identità Digitale.

Nello scorso post del 04/12/2018 dal titolo “Il Difensore civico per il digitale fa moral suasion su SPID?” avevo raccontato due mie segnalazioni aperte al Difensore Civico per il Digitale.

Entrambe riguardavano il tema del diritto all’identità digitale, ovvero, banalizzando la definizione, la possibilità di accedere con un’unica combinazione di nome utente e password ai servizi online della pubblica amministrazione, tramite SPID.

Mi sono chiesto se questo diritto espresso dal Codice dell’Amministrazione Digitale è tutelato in Italia, ed entro quali limiti.

Nei casi di esempio, ho segnalato la mancata implementazione di SPID, sul Portale Alloggiati della Polizia di Stato che i titolari di strutture ricettive utilizzano per comunicare alla Questura le anagrafiche dei loro ospiti, e sul portale della Regione Siciliana dei servizi per lavorare in Sicilia che serve per compilare la Dichiarazione di Immediata Disponibilità al lavoro.

Dopo il post su #opendatasicilia, l’11/12/2018 il Difensore Civico per il Digitale mi manda questa mail per confortarmi sul fatto che le mie segnalazioni sono in lavorazione.

Per la segnalazione sul Portale Alloggiati, viene anticipato che l’istruttoria è conclusa e riceverò a breve la decisione.

Il 13/12/2018, con una successiva mail, ricevo la decisione sul Portale Alloggiati, che qui vi riporto.

Nella risposta, in primo luogo il Difensore Civico per il Digitale indica che il Codice dell’Amministrazione Digitale prevede l’esclusione della sua applicazione limitatamente alle funzioni di ordine e sicurezza pubblica, quale appunto il Portale Alloggiati.

 

Ammetto che avevo il dubbio dell’applicabilità del C.A.D. al Portale Alloggiati prima di fare la segnalazione, ma che il mio dubbio è stato alimentato dal fatto che nel

DECRETO 7 gennaio 2013 del Ministero dell’Interno che regola le “Disposizioni concernenti la comunicazione alle autorità’ di pubblica sicurezza dell’arrivo di persone alloggiate in strutture ricettive”

nel preambolo viene citato un

“Visto il D.L. 7 marzo 2005, n. 235, e successive modificazioni, concernente: «Codice dell’Amministrazione Digitale»;”

come se l’allora Ministro dell’Interno avesse subordinato l’emanazione del Decreto alle regole del C.A.D. vigenti all’epoca.

 

Inoltre, come specifica anche il Difensore Civico per il Digitale nella sua risposta, ero confortato dal fatto che  le segnalazioni inviate al Difensore Civico per il Digitale sono presunte violazioni del C.A.D. e non certe.

 

Andando avanti nella risposta, il Difensore Civico per il Digitale riporta il parere che ha ricevuto dal Ministero dell’Interno.

Metto un attimo da parte le risate per un servizio digitale regolato da una norma che si chiama “Regio Decreto 18 Giugno 1931”, anche perchè è stata modificata recentemente con la LEGGE 1 dicembre 2018, n. 132 che ha esteso l’obbligo di comunicazione alla Questura delle anagrafiche degli ospiti delle Locazioni Brevi rese famose da Airbnb.

Sorvolo anche sulle parole “o mediante fax” contenuta nel Regio Decreto, e vado direttamente ad una precisazione fatta dal ministero dell’interno nella risposta, che ho compreso poco:

Si precisa, infine, che la certificazione digitale non riguarda la “persona fisica” del gestore, bensì la singola struttura ricettiva. Appare, dunque, evidente che l’attività di registrazione informatica delle persone alloggiate negli esercizi ricettivi, rispondendo alla finalità di facilitare l’attività di vigilanza riconducibile alle funzioni di tutela dell’ordine e della sicurezza pubblica esercitate dal Questore, non sia assoggettabili alle disposizioni del CAD

 

È vero che le attività e funzioni di ordine e sicurezza pubblica non sono assoggettabili al C.A.D., ma la risposta del ministero fa pensare che l’identità Digitale sia un concetto legato strettamente alla persona fisica.

Però se passasse il principio che le persone giuridiche non hanno diritto ad esercitare la propria identità digitale per il tramite della persona fisica rappresentante legale, non avremmo servizi come impresa.italia.it, con conseguente necessità di registrare le imprese su ogni servizio online della pubblica amministrazione.

Inoltre all’atto pratico, mi permetto di sollevare dei dubbi sul fatto che le funzioni di ordine e sicurezza pubblica verrebbero meno permettendo ai rappresentanti legali delle imprese di comunicare le anagrafiche degli alloggiati facendo un login con SPID.

 

Successivamente, nell’ultima parte della risposta del Ministero dell’Interno, mi perdo completamente quando il Ministero scrive:

Nella pratica il portale della Polizia di Stato indica la procedura che gli interessati (albergatori, affittacamere, proprietari o gestori di alloggi, ostelli, rifugi, bed & breakfast, agriturismi, campeggi, proprietari di appartamenti e le agenzie immobiliari che gestiscono gli appartamenti per uso turistico), devono seguire. Quest’ultima prevede l’invio di una istanza, debitamente compilata ed allegata la documentazione richiesta. Il tutto va inviato via posta elettronica secondo le indicazioni specificate nella seconda pagina della stessa. Ottenute le credenziali, l’esercente potrà trasmettere telematicamente le generalità delle persone alloggiate direttamente dalla propria struttura ricettiva, attraverso il sito: https://alloggiatiweb.poliziadistato.it .

Seconda pagina? Ministero dell’Interno, dove state leggendo?

Qual è la url di questo documento?

 

Sul Difensore Civico per il Digitale quello che posso dire, è che sicuramente ha rispettato alla lettera le norme ed il C.A.D..

Mi rimangono però molti dubbi sull’utilità di un ufficio che nel caso accerti violazioni del C.A.D. non può combinare sanzioni ma creare delle semplici lettere d’invito, e sulla funzione di Moral Suasion come descritta dal Team Digitale.

Funzione che dovrebbe probabilmente basarsi più sull’autorevolezza del Difensore Digitale che sul rispetto letterale delle norme.


 

Conclusa l’analisi su SPID, provo a spiegare alla comunità Open Data perché tengo molto al Portale Alloggiati e perchè andrebbe reingegnerizzato, al di là di SPID.

 

Il principio dell’ “once only” è un concetto di e-government che prevede che i cittadini e le imprese debbano fornire un dato alla pubblica amministrazione una sola volta.

Usando il consenso esplicito degli utenti, nell’ambito dei regolamenti sul trattamento dei dati e della privacy, le pubbliche amministrazioni sono invitate a scambiarsi i dati tra loro, senza chiederli ossessivamente agli utenti.

Il Portale Alloggiati raccoglie obbligatoriamente tutti i dati delle presenze turistiche, inclusi quelli delle locazioni brevi (Airbnb), come già citato sopra.

 

Ma questi dati sono trattati anche:

 

[Segnalato anche questo lo scorso 02 Gennaio 2019 al Difensore Digitale per la mancanza di SPID].

[Qui SPID c’è! YESSSS]

 

  • Infine, per voler essere più pignoli delle pigne, i dati anagrafici degli ospiti di strutture ricettive che viaggiano per lavoro potrebbero essere individuati tramite le fatture elettroniche loro emesse dalle strutture ricettive.

 

Sarebbe quindi opportuno che il legislatore razionalizzasse il data entry da parte delle strutture ricettive e degli operatori del turismo, chiedendo loro di inserire solo una volta i dati e filtrando successivamente i dati sulla base che il richiedente sia una autorità di sicurezza pubblica, l’Agenzia delle Entrate, l’ISTAT, la comunità open data e tutti gli altri stakeholders del turismo.

 


I credits dell’immagine di copertina li trovate qui.

Le nostre cartoline di auguri per un Buon 2019

Non faremo né la lista delle cose fatte nel 2018, né quella dei buoni propositi per il 2019.

La fine dell’anno ha in ogni caso un valore simbolico. Le foto fatte da Annalisa Conte (grazie) durante il nostro raduno del 2018 sono belle, dicono più di tante parole e ci sembrano simbolicamente delle cartoline di auguri: che si possano vivere altri momenti belli come questo, con la stessa luce che si legge negli occhi delle persone inquadrate.

Ecco le nostre cartoline per un Buon 2019 (quelle del 9 novembre e del 10 novembre).

Il Difensore civico per il digitale fa moral suasion su SPID?

SPID è il sistema pubblico d’identità digitale, la soluzione che permette di accedere a tutti i servizi online della pubblica amministrazione con un’unica Identità Digitale.

Secondo il sito del Piano Triennale per l’informatica nella Pubblica Amministrazione, SPID sarebbe dovuto essere implementato dalle Pubbliche Amministrazioni entro Marzo 2018.

Sempre entro Marzo 2018 AGID avrebbe dovuto rilasciare un piano d’implementazione di SPID per le PA che ancora non avessero provveduto ad implementare SPID sui propri servizi online.

Con l’aggiornamento del Codice dell’Amministrazione Digitale del 13/12/2017 è stato istituito presso AGID l’ufficio del difensore civico per il digitale, a cui chiunque può presentare segnalazioni relative a presunte violazioni del Codice dell’Amministrazione Digitale e di ogni altra norma in materia di digitalizzazione ed innovazione della pubblica amministrazione.

Il sito istituzionale di AGID permette espressamente di inviare segnalazioni sull’identità digitale.

 

Secondo un blog post del Team per la Trasformazione Digitale che ha collaborato alla stesura dell’ultima edizione del Codice dell’Amministrazione Digitale, il Difensore Digitale ha il compito di esercitare una moral suasion sulle amministrazioni che non garantiscono i diritti di cittadinanza digitale.

Ho testato per tre volte il servizio di moral suasion offerto dal Difensore Civico per il Digitale, ecco come è andata.

La prima esperienza l’avevo già raccontata con un post sul blog di #opendatasicilia.

La segnalazione riguardava la mancanza di SPID sul portale online del Sistema regionale degli Sportelli Unici della Regione Siciliana.

Come già documentato nel precedente blog post al quale vi rimando, la segnalazione è stata ritenuta non ricevibile in quanto indipendente dall’utilizzo di SPID.

La seconda segnalazione l’ho inoltrata in data 16/06/2018 e riguardava la mancanza di SPID sul portale della Regione Siciliana dei servizi per lavorare in Sicilia, in quanto avevo appreso dai giornali che in quei giorni i centri per l’impiego avevano qualche problema.

Il 17/07/2018 il Difensore Digitale mi risponde di aver richiesto alla Regione Siciliana “elementi tecnici di approfondimento”, da allora non ho ricevuto altre notizie, neanche il rigetto della mia segnalazione.

 

La terza segnalazione l’ho fatta in data 26/07/2018 e riguardava il portale Alloggiati Web della Polizia di Stato.

Per chi non lo sapesse, tutte le strutture ricettive in Italia sono obbligate ad inviare alla Questura le schede anagrafiche con i dati dei loro ospiti.

Il problema è che i documenti per l’accreditamento delle strutture ricettive al fine di ottenere la password al portale Allogiati Web e poter adempiere all’obbligo dell’invio delle schede anagrafiche degli ospiti cambiano da Questura a Questura.

Ad esempio, qui i moduli di Trapani, qui i moduli di Agrigento, qui i moduli di Enna, sul sito della Questura di Palermo non sono riuscito a trovare i moduli.

Per questo motivo, ho pensato che fosse utile segnalare al Difensore Digitale la mancanza di SPID sul portale Alloggiati Web, anche al fine di liberare le stesse questure dall’incombenza di rilasciare delle password alle strutture ricettive.

Magari le questure hanno cose più importanti da fare che rilasciare password alle imprese?

La mia segnalazione è stata protocollata il 26 Luglio 2018, ma non ho ancora ricevuto alcuna risposta, neanche un rigetto della segnalazione.

 

Ho guardato per curiosità la lista degli otto inviti fatti alle Pubbliche Amministrazioni dal Difensore Digitale nel periodo compreso tra il 10/05/2018 ed il 07/11/2018 e nessuno riguarda SPID.

Concludo con due riflessioni:

  • I tempi del Difensore Digitale sono stati esposti in questa discussione sul Forum di Italia.it,  ma appaiono veramente troppo lunghi e burocratici per delle semplici segnalazioni che hanno come oggetto di verificare se un servizio online sia accessibile con SPID o meno, considerato anche che il Difensore Digitale non ha poteri sanzionatori ma si limita al compito di moral suasion delle Pubbliche Amministrazioni che non rispettano i diritti digitali di cittadini e imprese.
  • Se il monitoraggio sull’implementazione di SPID da parte delle Pubbliche Amministrazioni fosse pubblicato, si potrebbe prevedere una integrazione tra le segnalazioni su SPID al Difensore Digitale e la mappatura dei servizi online che ancora non hanno SPID.
    A proposito, quando verrà pubblicato il monitoraggio sull’implementazione di SPID?

 

—————————————————————————————————————

Aggiornamento 1: il 13 Dicembre 2018 il Difensore Digitale ha risposto alla mia segnalazione su Alloggiati Web.

Aggiornamento 2: il 14 Marzo 2019 il Difensore Digitale ha archiviato la mia segnalazione sul portale della Regione Siciliana dei servizi per lavorare in Sicilia.


L’immagine in copertina è Franco Baresi, che nulla c’entra con questo post.

I credits dell’immagine sono qui.

OpenARS: una prima esplorazione dei dati

A meno di un mese da Open Data Sicilia 2018, che si terrà a Palermo il 9 e 10 novembre, entriamo adesso più nel vivo nel progetto OpenARS, i linked data dell’Assemblea Regionale Siciliana (ARS), che verrà presentato nel corso dell’evento.
Nell’ultimo post ci eravamo lasciati con la presentazione dell’ontologia OpenARS, creata per descrivere in modo formale le diverse tipologie di dati dell’ARS e le loro interconnessioni.
L’ontologia sviluppata consente di dare ad ogni risorsa un significato e di trasformare i dati dell’ARS in un enorme grafo direttamente interrogabile, esplorabile e riutilizzabile in altri contesti.
Ma come li interroghiamo i dati?
Per farlo è necessario introdurre il linguaggio principe usato nel Web Semantico per le interrogazioni, cioè il linguaggio SPARQL.
Il linguaggio SPARQL è una raccomandazione W3C che definisce in modo standard come interrogare i dati, a partire da grafi RDF distribuiti nel Web. Il criterio di interrogazione è basato su un meccanismo di pattern matching, nello specifico dal costrutto triple pattern, che riflette il modello di asserzioni RDF delle triple e fornisce un modello flessibile per le ricerche.
Lo schema generico di un’interrogazione SPARQL è il seguente:

dove
  • PREFIX è la clausola che definisce prefissi e namespace, comoda per abbreviare le URI;
  • SELECT è la clausola che definisce le informazioni che vogliamo estrarre dal repository;
  • FROM è la clausola che definisce il grafo (o i grafi) da esplorare. Può essere sia locale sia remoto. Possiamo anche inserire clausole come FROM NAMED e GRAPH per specificare sorgenti dati multipli;
  • WHERE è la clausola che definisce il pattern del grafo che intendiamo cercare nel dataset; rappresenta la parte più importante della query;
  • ORDER BY è la clausola che mi consente di ordinare i risultati della ricerca.
Immaginiamo di avere un dataset contenente un insieme di libri (risorse) descritti da una specifica ontologia nel file book.rdf, pubblicato nel Web secondo i principi dei Linked Data. Immaginiamo di identificare il dataset nel Web col seguente URL:
http://example.org/books.rdf .
Il nostro obiettivo è conoscere tutti i libri presenti del dataset con i relativi autori; per fare questo dobbiamo estrarre tutte le risorse di tipo libro (?book) e tutte le persone (?person) che sono autori (ex:hasAuthor) dei libri. Dei libri vogliamo conoscere i titoli (?book_title) e i nomi e cognomi degli autori (?person_name, ?person_surname).
La query di interrogazione sarà la seguente:

e questo un ipotetico risultato
Passiamo adesso ad OpenARS e proviamo ad effettuare un’interrogazione reale direttamente sul suo repository. A differenza del file pubblicato nell’esempio precedente i dati di OpenARS sono caricati su un server di storage dedicato che contiene l’intera base di conoscenza nella forma di triple/asserzioni . Per poter effettuare delle interrogazioni sui dati  è necessario conoscere l’URL punto di ingresso, conosciuto con il nome di SPARQL endpoint.
E’ possibile effettuare l’interrogazione direttamente dal client Web fornito dal triple store, come nella figura sottostante oppure è possibile eseguire query SPARQL da codice sorgente di un qualsiasi linguaggio di programmazione se si vogliono sviluppare applicazioni che interagiscono con i dati.
Prima di effettuare qualsiasi tipo di ricerca è fondamentale conoscere l’ontologia di riferimento al fine di poter interrogare correttamente i dati per tipologie di classi e per connessioni esistenti tra le risorse.
Facciamo adesso qualche esempio di interrogazione relativa a statistiche sull’attività legislativa dell’ARS. Per esempio, vogliamo sapere quanti disegni di legge sono stati presentati nel corso della 16° legislatura.
La query SPARQL è la seguente:

che restituirà come risultato il valore 1346.  Provare per credere.
La query assomiglia molto al linguaggio SQL e risulta di per sé molto leggibile. Nel campo WHERE selezioniamo tutte le risorse dello store di tipo ars:DisegnoDiLegge che sono collegate, tramite la proprietà ars:legislatura, alla risorsa che identifica la sedicesima legislatura ( http://dati.openars.org/legislatura/xvi ).
La selezione restituisce un certo numero di istanze e nel campo SELECT decidiamo di calcolare il numero totale di tali istanze, tramite l’operatore di aggregazione count, che corrisponde al numero totale di disegni di legge della 16° legislatura.
Vediamo adesso qualcosa un pò più complesso.
Voglio sapere la classifica top ten  dei disegni di legge presentati nella 16° legislatura suddivisa per materia. 
La query SPARQL è la seguente:

Questo il risultato:

Alcune considerazioni finali:
  • questi sono solo piccoli esempi che si possono fare con i dati ARS, nel prossimo post presenteremo casi molto più complessi che prenderanno in considerazione interrogazioni a sorgenti dati multipli;
  • passando dal Web di documenti al Web di dati (linked-data), il Web diventa machine-understandable e il tutto risulta esponenzialmente vantaggioso in termini di flessibilità e di interoperabilità semantica;
  • con la pubblicazione dei dati in modalità linked il Web diventa data-centric e le possibili interrogazioni dei dati, grazie alle loro interconnessioni, sia dentro che fuori al dataset, diventano pressoché infinite e delle più disparate;
  • non ci credete? provate a reperire nel Web tradizionale i nomi di TUTTI i sindaci le cui città hanno lo stesso patrono della città collegio di elezione di un qualsiasi deputato dell’ARS

    Nel prossimo post vedremo quanto sarà facile farlo con OpenARS.

Alcuni link per approfondire il linguaggio SPARQL
p.s. le iscrizioni al raduno sono ancora aperte. I posti sono gratuiti ma limitati. Per maggiori informazioni questo è il sito dell’evento.
Alla prossima

Alla scoperta di OpenARS – i Linked Data dell’Assemblea Regionale Siciliana

Come già anticipato nel precedente post, al raduno Open Data Sicilia 2018 verrà presentato il progetto OpenARS – i linked datadell’Assemblea Regionale Siciliana. Il progetto OpenARS ha l’obiettivo di pubblicare il patrimonio informativo dell’ARS in un modo completamente nuovo, abbracciando il mondo dei Linked Data, sfruttando le potenzialità del Web Semantico, consentendo la fruizione dei dati dell’ARS in modo flessibile e dinamico.

Vediamo adesso qualche dettaglio in più sul progetto.

Come primo passo sono stati estratti i dati dell’ARS dal sito istituzionale www.ars.sicilia.it attraverso appositi programmi, chiamati scraper, in grado di “grattare il testo dalle pagine Web e di salvare il contenuto in maniera strutturata, cioè individuando per ogni dato estratto la tipologia di appartenenza. Attraverso questi tool sono state estratte informazioni relative a tutte le legislature su deputati, assessori, incarichi e gruppi parlamentari mentre è stata estratta, invece, tutta l’attività parlamentare della 16° legislatura relativa ai disegni di legge, alle risoluzioni, alle interpellanze, alle interrogazioni, agli ordini del giorno, agli iter legislativi e alle sedute.

Applicare i principi Linked Data vuol dire passare da un Web di documenti a un Web di dati. Nel Web semantico non ci sono più documenti ma dati o risorse. Ogni dato è indipendente, collegato agli altri dati e definito formalmente da un’ontologia.
Per i dati ARS è stata sviluppata infatti un’apposita ontologia, chiamata OpenARS, in grado di descrivere in modo formale, sfruttando le potenzialità del Web semantico, le diverse tipologie di dati dell’Assemblea Regionale Siciliana e le interconnessioni che intercorrono tra gli stessi.

L’ontologia ha consentito di dare ad ogni risorsa un significato e di trasformare i dati dell’ARS in un enorme grafo direttamente interrogabile, esplorabile, riutilizzabile in altri contesti, in modo da arricchire il valore dei dati presenti sul sito ARS, abilitare e facilitare l’analisi dati, creare nuova conoscenza dai dati.

Questo è stato reso possibile applicando i principi dei Linked Data che prevedono la definizione univoca di ogni risorsa sul Web, la descrizione di ciascuna risorsa e l’interconnessione delle risorse con altri dataset, apportando così un importante contributo al progetto  LOD – Linked Open Data.

Con OpenARS sono state raggiunte le “5 stelle” di Tim Berners-Lee, cioè il livello più alto nella classificazione degli Open Data in termini di apertura e fruibilità.

 

Nei prossimi post vedremo più nel concreto cosa sono i LOD e come interrogare direttamente  i dati di OpenARS, esploreremo il grafo dei dati per capire come sia possibile iniziare a sviluppare applicazioni, report, ricerche, monitoraggi e statistiche.

Non dimenticatevi di iscrivervi al raduno Open Data Sicilia 2018. L’ingresso è gratuito ma i posti sono limitati.