Sicilia: ecco le informazioni per provincia sulla COVID-19, in formato machine readable e aperto

Il 23 Marzo scorso la nostra comunità ha pubblicato una lettera aperta indirizzata alla Regione Siciliana con la quale ha chiesto di rendere disponibili in un dataset machine readable dati di dettaglio relativi all’epidemia COVID-19 in Sicilia.

La richiesta era motivata dall’esigenza di colmare un vuoto rendendo disponibili dati di dettaglio a livello provinciale sull’epidemia, in modo da consentire studi e analisi non soltanto su base regionale, ma anche per ciascuna delle nove province siciliane (invero nella lettera aperta, tuttora senza risposta, si chiede anche la disponibilità di altri dati di dettaglio, disaggregati per comune, per sesso, per fasce di età, ecc.).

La Regione Siciliana dal 5 Marzo scorso pubblica con sostanziale regolarità (anche se con una certa variabilità di tipologia) le informazioni relative all’epidemia COVID-19 in Sicilia; riguardano l’intero territorio regionale, di cui per alcuni viene fornito il dettaglio per ciascuna provincia, e specificato che si tratta dei dati giornalmente trasmessi all’Unità di Crisi Nazionale (dati successivamente raccolti e resi noti dal Dipartimento della Protezione Civile). 

Relativamente ai dati provinciali, il Dipartimento della Protezione Civile si limita a pubblicare dataset contenenti soltanto i dati giornalieri relativi al numero complessivo dei soggetti contagiati dal virus (nel campo totale_casi), per cui le uniche analisi possibili a livello provinciale possono limitarsi soltanto a questo valore, mentre la Regione Siciliana, sempre a livello provinciale, non rende disponibile alcun dataset, utilizzabile per l’analisi di un maggior numero di parametri, limitandosi ad includere alcuni dati all’interno dei comunicati stampa quotidiani (caratterizzati da testo discorsivo e immagini) che non sono di alcuna utilità allo scopo se non per il semplice fatto di essere comunicati; tali dati, per essere analizzati e generare qualsiasi tipo di studio, report o visualizzazione hanno bisogno di essere raccolti e strutturati all’interno di tabelle in formati open e machine readable che ne consentano appunto un proficuo utilizzo.

In attesa di ricevere una risposta nei fatti, OpenDataSicilia ha trasformato i comunicati stampa in una tabella machine readable. È accessibile al momento in due modalità:

  • in 👉 formato CSV (encoding UTF-8 e , come separatore), con un file di insieme che contiene tutti i dati;
  • come foglio elettronico online. Da notare che questo è il nostro file di lavoro, la fonte dati è il suddetto file.

I dati raccolti e strutturati in un dataset pubblicato su Github derivano quindi dai comunicati stampa della Regione Siciliana, con alcune integrazioni a partire dal dataset provinciale del Dipartimento della Protezione Civile, integrati nei primi giorni – dal 24 Febbraio al 5 Marzo 2020 – con notizie di stampa locali, e con i dati che, pur non esplicitamente comunicati, è stato comunque possibile ricavare applicando dei semplici calcoli.
Per alcuni dati invece (ad es. il numero di tamponi effettuati o il numero di pazienti ricoverati in terapia intensiva) non è stato possibile avere informazioni disaggregate per singola provincia.

I dati così raccolti sono stati strutturati, per uniformità, secondo lo schema adottato dal Dipartimento della Protezione Civile (DPC) e sottoposti a verifiche di consistenza che hanno evidenziato solo alcuni casi, pochi fortunatamente, in cui si sospetta dell’accuratezza dei dati esposti.

Quanto prodotto da DPC è prezioso, perché fa da riferimento. È infatti un caso abbastanza unico in Italia: è raro trovare dei dataset in qualsiasi portale open data della Pubblica Amministrazione, così curati, ben descritti e pronti all’uso.

È così finalmente abbiamo un dataset che consente di effettuare delle visualizzazioni e delle analisi, sui dati COVID-19 a livello di singola provincia siciliana. A seguire due esempi dimostrativi di due visualizzazioni automatiche di riepilogo che adesso è possibile fare con questi dati (la seconda, grazie Totò Fiandaca) rappresenta dati, prima non disponibili.


Per maggiori informazioni vi invitiamo a consultare i dati stessi e la documentazione disponibile sul repo creato partendo dal file README.

Il nostro auspicio è che la Regione pubblichi presto questi dati o in alternativa che anche i dati di dettaglio provinciale vengano resi disponibili nel repository del DPC.

ODSWinter17


La comunità di Open Data Sicilia ha tenuto lo scorso 30 Dicembre il suo quarto raduno invernale a Patti, presso il Caffè Galante (qui una fotogallery).

Il raduno invernale di Open Data Sicilia è detto lo Schiticchio perché l’abitudine di vedersi in questo periodo dell’anno nacque dal desiderio degli appartenenti alla comunità di incontrarsi e di passare piacevolmente una giornata intorno ad una tavola imbandita (accadde per la prima volta a Resuttano, quindi a Pedara, poi a Castelbuono e stavolta a Patti). Da lì venne fuori poi l’idea, visto che ci si incontrava, di approfittare della circostanza per dedicare alcune ore della mattinata ad approfondimenti tematici, aggiornamenti e formazione prima di ritrovarsi seduti intorno ad un tavolo.

Anche il più articolato ed impegnativo raduno estivo che si svolge in più giorni, è frutto, in fondo, dello Schiticchio invernale e del desiderio di incidere significativamente sulla diffusione e l’uso degli open data nella nostra regione e nel nostro Paese (il primo si svolse a Palermo, il successivo a Messina e l’ultimo, l’estate scorsa, a Caltanissetta in forma congiunta con la comunità nazionale di Spaghetti Open Data).

Open Data Sicilia non è nuova a Patti; già nello scorso mese di Marzo aveva donato alla città l’applicazione Albo Pop Patti e presso il Caffè Galante, nel Luglio del 2015, aveva pure contribuito a realizzare il primo evento regionale sugli open data con l’apporto significativo di alcuni elementi della nostra comunità; la prima Summer School siciliana sugli open data, organizzata in quella circostanza da Lo Stretto Digitale, si tenne lì per tre giorni ed ebbe, come già detto, l’apporto significativo di alcuni dei nostri elementi tra gli organizzatori, i relatori e i formatori. E ancora prima, nell’Agosto 2013, fu proprio da una chiacchierata avvenuta a Patti tra due dei nostri che nacque l’idea di provare a dar vita ad un gruppo Facebook da cui poi prese vita la comunità di Open Data Sicilia.

I temi di quest’anno affrontati durante la mattinata hanno riguardato la disponibilità di strumenti digitali open per essere tempestivamente allertati dalla Protezione Civile in caso di incombenti pericoli, conoscere la reale disponibilità e puntualità dei trasporti pubblici urbani anche in realtà non necessariamente metropolitane, consentire ai cittadini di esercitare quel necessario e funzionale controllo dal basso sui nostri politici e sulle nostre amministrazioni per capire quanto e come, bene o male, sia stata in loro riposta la nostra fiducia o siano spese le nostre risorse.

In dettaglio, qui di seguito, gli argomenti trattati durante la mattinata

G. Pirrotta, A. Borruso – La “datificazione” degli alert della protezione civile regionale: un prototipo; slide | slide

G. La Mensa, G. Pirrotta, A. Borruso – Cosa è e come funziona SCATbot, il bot Telegram per avere informazioni in tempo reale sui bus di Caltanissetta; slide

G. Ragusa, G. Pirrotta – FOIAPop: il punto su uno strumento che sta diventando realmente popolare; slide

G. Pirrotta, D. Taibi – Un’ontologia dell’Assemblea Regionale Siciliana: il web semantico a supporto del civic hacking; slide

Open Data Sicilia: riflessioni e obiettivi per il 2018 (e oltre).


ODSWinter17