InformaCOVID raggiunge l’intera provincia di Caltanissetta

Da qualche mese la comunità di Open Data Sicilia lavora ad informaCOVID: non solo un toolkit da mettere a disposizione delle amministrazioni comunali, ma anche un insieme di dataset unici nel loro genere. Si tratta di dati relativi all’emergenza sanitaria in corso, disaggregati per comune, machine-readable, aventi stessa struttura degli Open Data rilasciati dal Dipartimento della Protezione Civile Nazionale, con licenza aperta, e costantemente aggiornati. 

Grazie all’impegno dell’amministrazione comunale di Caltanissetta, e alla sinergia con la rispettiva Azienda Sanitaria Provinciale, gli ultimi comuni aggiunti alla lista di informaCOVID sono proprio i 22 comuni della provincia nissena: Acquaviva Platani, Bompensiere, Butera, Caltanissetta, Campofranco, Delia, Gela, Marianopoli, Mazzarino, Milena, Montedoro, Mussomeli, Niscemi, Resuttano, Riesi, San Cataldo, Santa Caterina Villarmosa, Serradifalco, Sommatino, Sutera, Vallelunga Pratameno, Villalba.

Il processo dettagliato di pubblicazione di tali dati è sintetizzato in questa pagina. Come è possibile notare dall’immagine seguente, l’ASP di Caltanissetta rilascia dei bollettini giornalieri in formato .xlsx che vengono poi convertiti, processati ed elaborati per essere infine pubblicati in formato .csv ed essere così resi disponibili rispettando le linee guida AGID per la valorizzazione del patrimonio informativo.

Processo di pubblicazione dati provincia di Caltanissetta

Ad oggi sono 33 i comuni siciliani per i quali è disponibile InformaCOVID. La mappa e la lista completa di tutti i comuni è pubblicata all’indirizzo https://informacovid.opendatasicilia.it; è sufficiente effettuare un click sul nome di un comune per aprire un report dinamico e interattivo, dal quale chiunque (dai/lle semplici cittadini/e alle pubbliche amministrazioni) può ottenere informazioni relative al numero delle persone attualmente positive, delle persone guarite, e molti altri dettagli.

Cogliamo quindi l’occasione per rinnovare il nostro appello al governo regionale e nazionale finalizzato al rilascio dei dati  epidemiologici COVID-19 con dettaglio provinciale e comunale, così come chiede anche la campagna datiBeneComune:

Vediamo di continuo decisioni prese per limitare il contagio sulla base di dati che non sono pubblici: la trasparenza è alla base di ogni democrazia! I cittadini e le cittadine hanno il diritto di conoscere su quali dati e su quali analisi si basano le decisioni prese dal governo per le restrizioni dei prossimi DPCM. Da questi dati dipende la nostra vita quotidiana, il nostro lavoro, la nostra salute mentale: vogliamo che siano pubblici! E vogliamo che siano in formato aperto, perché dobbiamo permettere agli scienziati e ai giornalisti di lavorare per bene.

Sicilia | Infografiche vaccini covid19

La Regione Sicilia ha pubblicato in opendata il dataset  “target e vaccinati per comune e fasce di età.

Fonte: COVID-19 vaccini Sicilia: target e vaccinati per comune e fasce di età – Dataset – Portale open data della Regione SicilianaOrdinanza n. 75 del 7 luglio 2021 | Regione Siciliana

Quando i dati sono disponibili (open, machine readable e con la licenza giusta) ciascuno di noi può dare libero sfogo alle proprie competenze e alla propria fantasia per far parlare quei dati al meglio, scegliendo o creando la rappresentazione che ritiene più efficace per evidenziare quelli che si ritengono gli aspetti salienti. Ed ecco che, com’era prevedibile, la nostra community non si è fatta attendere e si è attivata subito per tradurre quei dati nelle dashboard che a seguire vi presentiamo.

Dashboard realizzata da: Guenter Richter


Dashboard realizzata da: Giovan Battista Vitrano

Ogni elemento dei grafici è cliccabile e può essere usato anche come filtro.


Dashboard realizzata da: Salvatore Fiandaca


Dashboard realizzata da: Dennis Angemi


Dashboard realizzata da: Gabriele Scalici

InformaCOVID, il Kit di Comunicazione Efficace per il tuo Comune

La comunità di Open Data Sicilia è lieta di invitarti alla presentazione del progetto “InformaCOVID – il Kit di Comunicazione Efficace per il tuo Comune, che si svolgerà online martedì 25 maggio alle ore 17

Open Data Sicilia ha aderito sin da subito alla campagna #datibenecomune, unendosi alla richiesta di rendere disponibili, aperti, interoperabili (machine readable) e disaggregati tutti i dati comunicati dalle Regioni al Governo dall’inizio della pandemia. Questo perché crediamo fortemente che anche i cittadini delle più piccole comunità abbiano il diritto di conoscere i dati che li riguardano e come essi variano nel tempo e di come varia la diffusione della pandemia nel proprio territorio. 

Da queste motivazioni nasce il progetto InformaCOVID, che mette assieme procedure guidate grazie alle quali tutti i comuni potranno avere a costo zero una piattaforma digitale, dinamica e interattiva, che consenta di comunicare i dati COVID in maniera trasparente ed efficace.

Il progetto prevede un pacchetto di strumenti digitali gratuiti e scalabili per tutto il territorio nazionale, in grado di fornire alla cittadinanza un’informazione puntuale e rapida sull’andamento dei dati COVID19 del proprio comune, mediante un sistema informativo di facile utilizzo, fruibile da computer, tablet e smartphone.

InformaCOVID è rivolto principalmente ai sindaci delle città italiane, ma non solo. Associazioni, scuole, testate giornalistiche, praticamente chiunque abbia accesso a dati COVID19 provenienti da fonti ufficiali e autorevoli, potrà utilizzare la piattaforma per informare la cittadinanza.

Se il progetto ti ha incuriosito e vuoi saperne di più, non ti resta che segnare sul calendario la data del 25 maggio e alle ore 17 collegarti qui sotto 👇 

“Red zones” in Sicily: a story of civic hacking

Note: this is a translation of an original piece published by Salvatore Fiandaca on the 10th April 2021. / Questa è una traduzione (più o meno letterale) di un articolo pubblicato da Salvatore Fiandaca il 10 aprile 2021. Thanks to Paola Chiara Masuzzo for translating it into English.


If you live in Sicily and want to know if your city is currently red, i.e. under specific COVID-19 restrictions (Italy uses a colour coded schema), all you need to do is read 197 pages of PDF files published by the regional government.

The official website of Sicily (Regione Siciliana) does not report any list of the cities currently red (which is the highest of the restrictions imposed): this information is trapped within a webpage that collects the so-called ‘ordinanze’ (we will refer to these documents as ‘decrees’ in the rest of this piece), a bunch of PDF files reporting the latest decisions made by the regional government.

This list is not really updated: at noon on the 10th April 2021, the files of the 9th April (number 37 and 38) were still not available.

A possible alternative way to consult these data is the map built by the ‘Dipartimento della Protezione Civile Regionale’, which, however, presents quite some limitations:

  • at 11:30 am on the 10th of April 2021, the map lists several cities that will only become red from the 11th of April, the following day
  • the map does not provide any information on the timeline of the restrictions: since when and until when the city has red zone restrictions; this information is absolutely key, and given the above point, we can’t even be sure that the map provides a precise photo of the current situation
  • it’s impossible, from the map, to go back to the files that delineate the restrictions, their timings, and their scope. It’s crucial to be able to link back this type of data to the raw, official source of information (especially given that this information is provided and published by the local authorities) 
  • the geographic representation of the map alone is not enough: a structured and updated list of files embedding the data represented is nowhere to be found

So, we thought about it: https://tinyurl.com/zonerossesicilia


Note: after the publication of the original post in Italian, the “Dipartimento della Protezione Civile Regionale” has updated its map, corrected it and added the necessary basic information. We appreciate that, it is a nice result of the action of this community.


The documents that list the governmental decisions for the red zones in Sicily (often not even real PDF, but simply the result of the documents scanning) are collected on the official website under the section “SERVIZI INFORMATIVI | ORDINANZE COVID-19”; when this article was written (10th of April 2021), there were 36 of these files. 

PDF files are not the easiest to read, especially if these are images (you can’t even search for text, in this latter case), not from machines, nor from humans, who would be lost in front of a big amount of bureaucratic jargon. So we thought of collecting all the cities in Sicily with red-zone restrictions in a public Google sheet.

The PDF files are on average 7 pages long, the section that contains the useful data is usually in the last two pages:

To remedy to these ugly PDF files (sigh) and make it easier to both create and read maps and structured lists of text, we created a Google sheet where we annotated (after having read every single PDF online from 2021) the cities in red code, together with the time interval, including the possible extension of the restrictions, and a final link to the decree file in PDF.

The main idea is to create a list like the one shown in the screenshot below, allowing these data to become public goods, or, in Italian, ‘bene comune’ (Open Data Sicilia is a big promoter of the running campaign).

What we would like to have is a dataset with at least the following five attributes:

  1. comune, the name of the city as reported in the PDF file
  2. pro_com, the unique, numeric ISTAT code
  3. dataInizio, the beginning date of the red code for the city
  4. dataFine, the end date of the red code for the city
  5. link, the URL of the PDF file.

We read all the PDF of 2021 (28 at the time of writing of this piece) and it took us about one hour, certainly a reasonable amount of time.

After we were done with the sheet, we initiated the second phase, which consisted in rendering these tabular data in a map easily accessible to everyone:

Important to notice, it is possible to download both the entire dataset and the PDF for each city reported directly from the map

Final notes

Creating and publishing an up-to-date list, a CSV file – really, any kind of format of structured text that machines and humans can read – isn’t that much work, but is, first and foremost, a matter of providing a public service to the citizens, a service that is very much needed and due. 

Scanned PDFs prevent text searches and make usability for blind people impossible. In our opinion, these two points alone suffice to say that Sicilian authorities need to do better, but there are also official regulations that point these matters out, like the Digital Administration Code (Codice dell’Amministrazione Digitale, CAD).

These documents must be accessible and usable regardless of personal abilities, according to the accessibility criteria defined by the technical requirements referred in Article 11 of the Law of 9 January 2004, n. 4.

For 2021, 16 out of 28 decrees are scanned.

We therefore ask the Sicilian Region and the ‘Dipartimento della Protezione Civile Regionale’ to create a list of the red areas in the Sicilian territory, readable by people and personal computers, complete with the essential information that we have listed, in which it is also possible to read the temporal changes of the assignments of the restrictions.

Finally, we also urge for a speedy solution of the aforementioned problems on accessibility.

References

The cover image of this piece refers to the situation until the 10th of April 2021, right before the decree number 38 of the 9th of April 2021.

COVID-19 e i comuni siciliani in zona rossa anno 2021

Se sei un/a cittadino/a siciliano/a e vuoi capire se il comune in cui vivi è soggetto a restrizioni, non devi far altro che leggere 197 pagine di ordinanze regionali in PDF.
Sul sito della Regione Siciliana non c’è un elenco dei comuni in zona rossa e questa informazione essenziale è da estrapolare da una pagina con l’elenco delle ordinanze in PDF.
Questo elenco non è tenuto aggiornato rispetto alla pubblicazione di nuove ordinanze: alle ore 12:00 del 10 aprile 2021 non sono presenti ancora le ordinanze 37 e 38 del 9 aprile.

Un’alternativa è la mappa del Dipartimento della Protezione Civile Regionale, che però  ha queste criticità:

  • alle ore 11:30 del 10 aprile 2021, presenta in mappa tanti comuni che saranno in zona rossa da giorno 11 aprile;
  • non dà alcuna informazione sulla data di validità delle restrizioni, che è un dato essenziale e andrebbe reso disponibile in mappa. E visto il punto precedente, non si può nemmeno affermare che la mappa fotografi la situazione corrente;
  • dalla mappa non è possibile risalire alle ordinanze.  È essenziale che da  informazioni di questo tipo – quale area è in zona rossa – sia possibile risalire alla dichiarazione formale di istituzione;
  • è disponibile soltanto la rappresentazione dell’informazione (la mappa), non è disponibile un elenco strutturato e aggiornato dei comuni in zona rossa.

E allora ci abbiamo pensato noi: ▶ https://tinyurl.com/zonerossesicilia

Le ordinanze in PDF per le zone rosse (spesso frutto di scansione) sono raccolte nel sito ufficiale nella sezione “SERVIZI INFORMATIVI | ORDINANZE COVID-19”; a oggi, nel 2021, ne sono state pubblicate circa 36.

I PDF non si prestano a una facile lettura, soprattutto se sono immagini (in questo caso non è nemmeno possibile cercare del testo), da parte di macchine e tantomeno da parte degli umani, in quanto si troverebbero davanti a pagine piene di burocrazia; allora abbiamo pensato di raccogliere tutti i comuni in zona rossa in un foglio elettronico pubblico.

I PDF hanno mediamente 7 pagine, la parte che contiene i dati utili per conoscere i comuni in zona rossa si trova nelle ultime due:

Per ovviare a questi brutti PDF (cit.) e facilitare la lettura e la creazione di mappe e liste di testo strutturato (attualmente non esiste una mappa con metadati e neanche un elenco aggiornato di tutti i comuni attualmente in zona rossa), abbiamo creato questo foglio elettronico, dove abbiamo inserito – dopo aver aperto una ad una tutte le ordinanze del 2021 – i comuni in zona rossa e relativo intervallo temporale, compreso anche di eventuale proroga e link al PDF.

L’idea di base è quella di creare un elenco dei comuni in zona rossa come rappresentato nello screenshot di sotto e fare in modo che questi dati siano un bene comune (OpenDataSicilia è tra le aderenti alla campagna).

Un elenco con almeno questi cinque attributi: 

  1. comune, rappresenta il nome del comune letto nell’ordinanza;
  2. pro_com, codice numerico ISTAT univoco per ogni comune;
  3. dataInizio, data di inizio della zona rossa;
  4. dataFine, data di fine della zona rossa;
  5. link, URL al PDF.

La lettura di tutti i PDF del 2021 (sono 28 ad oggi) ci ha impegnato per circa un’ora, un tempo veramente irrisorio e che può fare chiunque dotato di buona volontà.

Dopo la realizzazione dello sheet, è partita la seconda fase, ovvero, rendere quei dati tabellari una mappa facilmente consultabile da tutti:

Inoltre, dalla mappa è possibile scaricare il dataset completo e l’ordinanza in PDF, comune per comune.

Note finali

Creare un elenco aggiornato, un file CSV – o un qualsiasi altro formato di testo strutturato leggibile da persone e computer – e pubblicarlo, non è un compito oneroso, ma soprattutto darebbe un servizio pubblico ufficiale, essenziale, dovuto e completo ai cittadini.

I PDF pubblicati come scansione impediscono di fare ricerche testuali e rendono impossibile la fruibilità da parte delle persone non vedenti. Questi due punti a nostro avviso sono già un’evidenza forte che dovrebbe portare la Regione Siciliana a fare diversamente, ma ci sono anche delle norme che lo prevedono e in particolare il Codice dell’Amministrazione Digitale (CAD).
Questi documenti devono essere fruibili indipendentemente dalla condizione di disabilità personale, applicando i criteri di accessibilità definiti dai requisiti tecnici di cui all’articolo 11 della legge 9 gennaio 2004, n. 4.
Per il 2021, 16 ordinanze su 28 sono frutto di scansione.

Chiediamo quindi alla Regione Siciliana e al Dipartimento della Protezione Civile Regionale, di creare un elenco delle zone rosse nel territorio siciliano, leggibile da persone e personal computer, completo delle informazioni essenziali che abbiamo elencato, in cui sia possibile anche leggere le variazioni delle assegnazioni nel tempo.

E sollecitiamo con urgenza e priorità la risoluzione dei suddetti problemi sulle norme di accessibilità

RIFERIMENTI

L’immagine di copertina fa riferimento alla situazione fino al 10-aprile-2021, prima dell’ordinanza n°38 del 09-aprile-2021

Dati falsi sul Covid in Sicilia: la nostra comunità segnalava incongruenze da un anno

In questi ultimi giorni di marzo 2021 si è diffusa la notizia di un’indagine della magistratura su presunte falsificazioni dei dati sulla pandemia da coronavirus in Sicilia, che sarebbero state poste in essere dalla Regione Siciliana (qui un articolo dell’Agenzia Ansa che racconta la vicenda). Sono i dati del monitoraggio che poi, comunicati al ministero, portano a decidere quali sono le restrizioni da applicare in quel territorio (ad esempio se dev’essere zona gialla, arancione o rossa).

Troppo presto per giudicare la questione, ma è importante ribadire che da un anno – praticamente dall’inizio della pandemia – abbiamo cercato di dialogare con Regione Siciliana per segnalare irregolarità nei dati. Questa ricerca costante con verifiche quotidiane è stata portata avanti in particolar modo dal nostro Nino Galante, che in maniera certosina ha cercato ogni giorno di raccogliere i dati ufficiali e compararli, evidenziando difformità di ogni genere: le abbiamo raccontate qui. La Regione o non ci ha risposto o ci ha dato l’idea che il messaggio fosse «non disturbate il conducente». L’ultima richiesta di accesso ai dati l’ha fatta Giuseppe Ragusa appena ad inizio marzo 2021: eccola.

Al di là delle vicende giudiziarie, mi permetto di fare un commento: una cosa che ci sembra agghiacciante di questa storia è il fatto che il dialogo con i cittadini venga percepito talvolta e da alcune persone che lavorano nelle istituzioni pubbliche come una perdita di tempo o una rottura di cabbasisi, direbbe il commissario Montalbano, quando invece ascoltadoci la Regione Siciliana avrebbe notato le incrongruenze e sarebbe forse intervenuta prima per sistemare le cose (e vi assicuro che per vie ufficiali, ufficiose, conoscenze, amicizie, piccioni viaggiatori e chi più ne ha più ne metta, abbiamo cercato di parlarci in ogni modo).

Questa comunità non è qui per gridare «piove, governo ladro» ma per dire «proviamo a dare una mano». Quanti anni dovremo ancora aspettare per avere la possiblità di dialogare con istituzione disponibili ad ascoltare i cittadini? Quante volte dovremo dire ancora – come abbiamo fatto su questa pagina – che i dati pubblici sono un bene comune e noi cittadini abbiamo diritto assoluto di accedervi? Chi lavora nelle istituzioni, è sempre consapevole del fatto che è cittadino/a pure lui/lei? In basso un servizio dell’ottimo Emilio Pintaldi, andato in onda su RTP (Tv messinese) che riavvolge il nastro e racconta in pochi minuti quali sono stati i nostri rilievi.



OpenData in zona rossa: il Comune di Regalbuto apre i dati

Quanti sono i soggetti attualmente positivi nel tuo comune? È quasi impossibile rispondere a questa domanda per la maggior parte dei comuni italiani. 

In questo panorama nazionale nel quale si registra la grande assenza di dati disaggregati con dettaglio comunale, alcune amministrazioni comunali hanno deciso di sposare la campagna #datiBeneComune e rendere open e machine readable i dati relativi ai contagi e alle ospedalizzazioni rilasciando dashboard e files CSV.
Questo è il caso del comune di Villarosa in provincia di Enna (la cui dashboard è disponibile
qui) o del Comune di Regalbuto, il cui sindaco, a seguito dell’istituzione della zona rossa, ha accolto tempestivamente e in modo favorevole la nostra richiesta di pubblicazione di dati aperti, dimostrando che è possibile instaurare un dialogo con le PA. 

Giovedì 18 marzo 2021, infatti, abbiamo inviato quanto segue al sindaco Francesco Bivona:

Gent.mo Sindaco,

alla luce dei recenti avvenimenti e al fine di rendere più trasparente possibile la condizione epidemiologica del nostro comune, ho sviluppato una dashboard (che potrebbe essere inserita nel sito del comune) raggiungibile al seguente link che, non solo offre la possibilità di ricevere una rappresentazione visuale dei dati covid related, ma permette anche di scaricare i dati rispettando gli standard degli open data e quindi in formato CSV e con licenza aperta (CC-BY). L’input dei dati potrà essere effettuato da lei con frequenza giornaliera tramite un form, che ho appositamente predisposto e collegato alla dashboard e ad un foglio di calcolo in modo tale da ottenere una visualizzazione dei dati aggiornata in “tempo reale”. Penso che questo strumento possa essere affiancato alle comunicazioni giornaliere tramite post facebook nell’ottica dell’open government e della massima trasparenza per fornire ai cittadini una panoramica più ampia che il solo dato degli attualmente positivi non riesce a descrivere. […]

Richiesta alla quale è seguito un annuncio in diretta sulla pagina Facebook del sindaco, volto ad informare la comunità regalbutese della pubblicazione della dashboard e dei dati. Durante la diretta sono stati specificati alcuni dettagli del formato CSV, dimostrando una buona propensione all’open government.

Così, giorno 19 marzo lo stesso sindaco ha proceduto alla pubblicazione del seguente post e all’implementazione delle dashboard nel sito istituzionale del Comune di Regalbuto

È fondamentale per i cittadini e le cittadine poter accedere ai dati su cui si basano decisioni politiche, ancor di più se queste decisioni introducono delle misure restrittive particolarmente intense quali l’istituzione della zona rossa.

Rilasciando dati aperti, come affermato dall’attuale Presidente del Consiglio dei Ministri Mario Draghi, si instaura un virtuoso rapporto di collaborazione tra istituzioni e collettività amministrate che veda rispettato il principio di coinvolgimento attivo della cittadinanza e riesca a consolidare la fiducia nelle istituzioni.

Invitiamo pertanto tutte le amministrazioni comunali a prendere seriamente in considerazione l’eventualità di rendere pubblici e machine readable i dati in loro possesso relativi all’epidemia nell’ottica della massima trasparenza, e rinnoviamo la nostra richiesta al Dipartimento per le Attività Sanitarie e Osservatorio Epidemiologico della Regione Siciliana che potete trovare qui.

Lettera aperta al Dipartimento per le Attività Sanitarie e Osservatorio Epidemiologico per la pubblicazione di dati aperti COVID-19

A distanza di un anno dalla nostra lettera aperta torniamo a chiedere alla Regione Siciliana la pubblicazione dei dati  epidemiologici covid-19 sul territorio siciliano, con dettaglio provinciale e comunale e alla luce di alcune importanti novità.

La richiesta di dati aperti su questi temi è qualcosa di molto sentito: basti pensare alle quasi 50.000 firme raccolte dalla campagna #datiBeneComune, a cui OpenDataSicilia ha aderito da subito. Perché, così come recita il piano triennale per l’informatica nella Pubblica Amministrazione 2020-2022:

“dati pubblici un bene comune: il patrimonio informativo della pubblica amministrazione è un bene fondamentale per lo sviluppo del Paese e deve essere valorizzato e reso disponibile ai cittadini e alle imprese, in forma aperta e interoperabile”

Ci rivolgiamo in particolare al Dipartimento per le Attività Sanitarie e Osservatorio Epidemiologico (D.A.S.O.E.).

Le Direttive/circolari di riferimento per l’esecuzione e la registrazione dei tamponi in oggetto si trovano pubblicate sul sito del Dipartimento per le attività Sanitarie e Osservatorio Epidemiologico https://www.qualitasiciliassr.it/?q=documenti-covid 1

C’è una specifica circolare rivolta a tutte le Aziende Sanitarie Provinciali e ai laboratori accreditati, che dispone circa la “raccolta centralizzata ed informatizzata dei dati relativi ai tamponi molecolari rinofaringei per SARS-COV-2” disponibile al link: https://www.qualitasiciliassr.it/sites/doc/covid/Direttiva_Tamponi_prot._n._40933_del_16-11-2020.pdf

Lo scopo viene indicato nella necessaria soddisfazione di “tutte le esigenze informative della Regione per l’inoltro al Ministero della Salute/Protezione Civile e all’Istituto Superiore di Sanità”. Tale circolare fa riferimento all’applicativo online da utilizzare obbligatoriamente per l’upload dei dati relativi a tutti i tamponi di cui in oggetto, effettuati sull’intero territorio regionale, disponibile al link: https://www.qualitasiciliassr.it/app/anticovid/pages/login.php 1

I dati raccolti in questa modalità sono così nella piena disponibilità del suddetto Dipartimento.  

Pertanto chiediamo al Dipartimento per le Attività Sanitarie e Osservatorio Epidemiologico (D.A.S.O.E.) della Regione Siciliana di considerare il diritto dei cittadini siciliani e degli altri portatori di interessi, inclusa la comunità scientifica in generale, ad essere compresi tra i diretti interessati alle informazioni raccolte con tali modalità e nel dettaglio:

  • la pubblicazione con aggiornamento giornaliero e costante dei dati aperti (come definiti dall’art. 1 comma 1-ter del D. Lgs 82/2005 e quindi machine readable, così da essere interpretabili da un computer e da software di analisi e visualizzazione di dati), con dettaglio provinciale e comunale, relativi ai tamponi molecolari rinofaringei per SARS-COV-2. Ciò con riferimento particolare ai campi previsti dal file “T003- tracciato – Esito Tamponi (invio unico)” disponibile al link: https://www.qualitasiciliassr.it/sites/doc/covid/trc/allegato-T003_tracciato.xlsx;
  • la pubblicazione con aggiornamento giornaliero e costante dei dati aperti (come definiti dall’art. 1 comma 1-ter del D. Lgs 82/2005 e quindi machine readable, così da essere interpretabili da un computer e da software di analisi e visualizzazione di dati), con dettaglio provinciale e comunale in particolare di: tamponi (numero dei tamponi processati), esiti (in corso, positivi, negativi, non validi, dubbi), nuovi positivi (numero positivi per la prima volta), totale positivi (attuali positivi), dimessi/guariti, ricoverati con sintomi, ricoverati in terapia intensiva, deceduti, totali casi. Seguendo quindi lo schema dati del Dipartimento di Protezione Civile al fine di renderli comparabili con esso.

Tutto questo ovviamente ad esclusione dei dati personali, quali ad esempio i dati anagrafici o di contatto, nel rispetto delle norme sulla privacy.

Siamo disponibili – se ritenuto utile – a dare un contributo strumentale e di processo per realizzare quanto richiesto.

PS: La redazione di questa lettera aperta muove i passi a partire dagli stimoli di un gruppo di attivisti civici dei Comuni di San Giuseppe Jato e San Cipirello che hanno formalmente presentato la richiesta di pubblicazione dati pochi giorni fa. Grazie!

Regione Siciliana e dati COVID-19

PREMESSA – Le preoccupanti notizie di questi giorni sulla possibilità di ripresa nella nostra regione dell’epidemia Covid-19 rafforzano la nostra convinzione sull’importanza di una corretta e ampia circolazione delle informazioni che la riguardano. Per questo insistiamo e ci auguriamo che la Regione Siciliana ritorni sulle sue decisioni (non motivate) di sospendere la pubblicazione dei dati provinciali e accolga il nostro invito a pubblicarne di più dettagliati e di maggiore qualità rispetto a quanto è accaduto fino a poco tempo fa. È, tra l’altro, l’occasione di abbandonare antiquati schemi mentali (politici e amministrativi) e di fornire le risposte che un’evoluta cittadinanza si aspetta; di rispettare i principi dell’Open Government (dialogo con la cittadinanza, dati aperti, ecc.) in un’occasione molto speciale per gravità (più è grave il momento, più l’OpenGov è necessario) come ben sintetizza, ad es., la stessa Accademia Nazionale dei Lincei.

Dall’inizio dell’epidemia Covid-19, come Open Data Sicilia, abbiamo sentito l’esigenza di disporre, oltre che dei dati regionali pubblicati dal Dipartimento della Protezione Civile (cui vengono forniti dalla Regione), di maggiori informazioni almeno a livello provinciale (poiché, a tale livello, l’unico dato che il Dipartimento rende disponibile è quello del totale_casi).

DAGLI INIZI DI MARZO – A partire dai primi giorni di marzo, la Regione ha pubblicato quotidianamente (fino a giugno) dei bollettini con alcuni dati provinciali che hanno permesso di avere un maggiore dettaglio rispetto all’unico dato pubblicato dal Dipartimento ma lo ha fatto appunto con dei comunicati stampa. Per potere utilizzare e analizzare quei dati, studiarne l’andamento, ecc. serviva disporne in formato tabellare (machine readable). 

LA LETTERA APERTA – Da qui è maturata l’idea di scrivere una lettera aperta alla Regione Siciliana in cui, per colmare una lacuna informativa, si chiedeva di rendere disponibili i dati provinciali alla stregua di quello che fa il Dipartimento della Protezione Civile, ovvero in forma tabellare e adottando lo stesso modello del Dipartimento al fine di evitare confusioni sul significato dei vari campi e rendere i dati confrontabili. Nella lettera si chiedeva inoltre di non limitare il dettaglio al solo livello provinciale ma di estenderlo e arricchirlo con dati suddivisi a livello comunale e con altre informazioni, quali il sesso, le fasce di età dei contagiati, ecc. 

IL SILENZIO DELLA REGIONE – La lettera si concludeva con Open Data Sicilia che si dichiarava disponibile a supportare e contribuire all’impresa. Insomma si trattava di una vera e propria proposta di collaborazione, di una parte competente e qualificata della società civile, qual è la comunità di Open Data Sicilia, non nuova a iniziative di questo genere (ad es. la precedente collaborazione con ARPA Sicilia), alla pubblica amministrazione regionale, per un’iniziativa virtuosa che avesse come fine la diffusione di dati di qualità per una migliore comprensione e analisi dell’epidemia nell’isola. E invece, non solo non vi è stata alcuna risposta alla lettera ma anche i tentativi di chiarire i vantaggi e gli intenti sono stati tutti respinti, anche quando si erano indicati soggetti interni all’amministrazione regionale in grado di offrire alla stessa Regione (l’Osservatorio Epidemiologico) ampie garanzie.

GLI ERRORI E LE REAZIONI – Quando inoltre sono apparsi i primi grossolani errori (ad esempio diminuzione da un giorno all’altro dei valori riguardanti i deceduti o i casi totali) che lasciavano capire che sui dati pubblicati non vi fossero elementari controlli di congruità e consistenza, abbiamo offerto un modello funzionante di foglio elettronico che permettesse loro di evitare quantomeno quel tipo di errori, effettuando la verifica incrociata dei totali, e velocizzasse l’inserimento dei dati per i bollettini giornalieri. Anche in questo caso nessun riscontro e laconiche quanto incomprensibili risposte su Twitter (“Conosciamo e capiamo l’importanza della sua richiesta. Speriamo che comprenda che la priorità è in questo momento altrove e che per la maggior parte delle persone le infografiche sono ampiamente sufficienti. In futuro proveremo a migrare ulteriormente verso dati aperti. Grazie”). Ma è davvero pensabile che un Osservatorio Epidemiologico tenga i dati in una tale considerazione e si dimostri sordo alle richieste di confronto e alle segnalazioni d’errore o non senta l’esigenza o il dovere di dare dei riscontri o di giustificarsi? Quanta distanza da quel dibattito e da quelle norme che indirizzano e obbligano le PA a rendere aperti/pubblici e in formato machine readable i dati detenuti e pubblicabili!

L’AZIONE DI OPEN DATA SICILIA – Comunque sia, Open Data Sicilia, nel frattempo, sostituendosi idealmente e concretamente alla Regione, si è sobbarcata il compito, con attività totalmente volontaristica, di aggiornare quotidianamente un dataset con i dati dei bollettini regionali dettagliati per provincia, verificandone la consistenza e la congruità, segnalando gli errori riscontrati, senza mai appunto essere degnata di attenzione, ricevere risposte, conoscere i dati esatti (da inserire al posto di quelli sbagliati), senza ricevere mai un riscontro per le segnalazioni effettuate (!!!).

Errori, gravi, commessi anche dopo tre mesi di attività e di tempo sufficiente per prendere confidenza e rimediare alle pur comprensibili difficoltà iniziali, come dimostrano gli episodi del 2 e 3 Giugno, quando gli stessi dati comunicati dalla Regione presentano importanti discrepanze tra quelli apparsi sui bollettini e quelli inviati al Dipartimento della Protezione Civile. Per non citare articoli apparsi sulla stampa in cui si sono avanzati seri dubbi di attendibilità dei dati diffusi dalla Regione (soprattutto relativamente alle province di Catania e Messina) in uno dei quali appare la foto di un bollettino dell’ASP di Messina con una struttura dati difforme dal modello del Dipartimento della Protezione Civile (sostanzialmente analogo a quello regionale) con nomi dei campi di dubbia comparabilità (la creatività in statistica verrebbe da dire) che lasciano capire che nessuna capacità da parte della Regione vi è stata nell’imporre agli uffici periferici (ASP, ospedali, ecc.) un unico modello di raccolta dei dati per evitare incomprensioni ed errori. Per arrivare infine, il 19 Giugno, al tentativo di nascondere quella clamorosa debacle nella gestione dei dati epidemiologici, che ha costretto a comunicare una rettifica in diminuzione di quasi 400 casi totali sui circa 3500 registrati. Incapacità e inadeguatezza confermate dalla decisione, né motivata né annunciata, di sospendere dopo il 22 Giugno, nell’indifferenza più assoluta di stampa e opinione pubblica, e nonostante fosse passato il momento più critico (a suo tempo invocato per giustificare la mancanza di maggiori dettagli e qualità dei dati diffusi), la pubblicazione di quei pochi dati che ci consentivano di avere qualche informazione in più sulle province siciliane.

CONCLUSIONI – La più grande delle amarezze che rimane è determinata dall’osservare quanto ancora profonda sia la distanza tra apparati burocratici e società civile, la totale indifferenza verso i principi dell’open government, il distacco di funzionari regionali dimostratisi incapaci di cogliere stimoli di valore da parte di chi impegnandosi quotidianamente con spirito civico ha inteso dimostrare in che modo, tutti quanti, si possa crescere e migliorare, anche senza un corrispettivo in campo ma solo per senso di appartenenza ad una comunità, quella della nostra Regione.

Per chi voglia approfondire, qui di seguito pubblichiamo l’analisi delle incongruenze più evidenti rilevate.  


L’ANALISI DELLE INCONGRUENZE RILEVATE – Ribadendo che nostro obiettivo era quello di colmare una lacuna informativa e di analizzare la distribuzione dei dati per provincia secondo lo schema adottato dal Dipartimento (ma per dati appunto mancanti nel dataset del Dipartimento), abbiamo purtroppo da subito dovuto limitarci ai soli dati provinciali disponibili. Purtroppo di alcuni valori la Regione non ha mai comunicato la distribuzione provinciale e pertanto non ci è stato possibile né considerarli né valutarli (ad es. ricoverati in terapia intensiva, numero dei tamponi o dei casi testati). Ciò premesso, il Dipartimento della Protezione Civile inizia a pubblicare i dati Covid-19 a partire dal 24 Febbraio; in quella data i dati riguardanti la Regione Sicilia sono tutti a zero ma già dal giorno successivo si registrano i primi casi di contagio. Si tratta, in quel momento, di dati rinvenibili nel dataset del Dipartimento della Protezione Civile, cui la Regione li comunica giornalmente, che abbiamo integrato, ove necessario, con notizie di stampa (circostanza resa possibile dall’ancora davvero esigua quantità di casi registrati nel periodo) mentre i primi bollettini che la Regione diffonderà direttamente si avranno solo a partire dai primi giorni di Marzo e con essi i primi errori. Gli errori di cui parliamo riguardano sempre la consistenza degli stessi dati, non si tratta cioè di rilevazioni riguardanti l’effettiva aderenza dei dati alla realtà (non si hanno ovviamente conoscenze in tal senso), si tratta piuttosto di errori grossolani che evidenziano la totale mancanza dei più banali controlli di congruità; ci riferiamo in particolare a due valori, il totale_casi e i deceduti che per loro natura non possono mai diminuire ma solo crescere nel tempo o, al più, rimanere stazionari. Infine anche laddove, raramente (probabilmente in una sola circostanza, eccettuata la rettifica rilevante del 19 Giugno), vi è stata l’ammissione da parte della Regione di aver comunicato dei dati errati, mai sono stati forniti i dati esatti in sostituzione di quelli errati, tutt’al più è stato dichiarato che gli errori sono stati riassorbiti nell’ultima comunicazione emanata. Tutto questo anche a fronte delle segnalazioni di errore (pubbliche o private) effettuate da Open Data Sicilia alla Regione con le conseguenti richieste di poter conoscere i dati esatti in sostituzione di quelli errati. D’altra parte questo atteggiamento di indifferenza sulla qualità dei dati e di assoluta mancanza di rispetto nei confronti dei destinatari che caratterizzerà la Regione Siciliana per tutto il periodo della pandemia è rilevabile anche dalla totale mancanza di note a commento nel dataset del Dipartimento cui invece ricorreranno abbondantemente le altre regioni italiane per segnalare appunto errori nei dati comunicati. L’unica volta in cui è possibile rilevare annotazioni da parte della Regione Siciliana nel dataset del Dipartimento della Protezione Civile è il 19 Giugno, quando verrà operata la clamorosa rettifica in diminuzione dei circa 400 casi totali registrati in eccesso nell’isola.  

Il primo caso di errore che si osserva risale al 2 Marzo, quando tra i dati regionali resi disponibili dal Dipartimento della Protezione Civile troviamo una diminuzione dei casi a livello regionale che da 9 diventano 7 (come accennato prima, questo dato, totale_casi, che somma il numero di contagi rilevati, per sua stessa natura non può diminuire), dato riconfermato il giorno successivo (3 Marzo) e che torna a risalire il 4 Marzo.

data ricoverati con sintomi terapia intensiva totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi tamponi
01/03/2020 1 0 1 6 7 5 5 2 0 9 291
02/03/2020 2 0 2 3 5 -2 -2 2 0 7 307
03/03/2020 2 0 2 3 5 0 0 2 0 7 307
04/03/2020 5 0 5 11 16 11 11 2 0 18 367

In particolare l’analisi dei dati lascerebbe pensare che l’errore del 2 Marzo si verifichi sul totale_casi della provincia di Catania ma non si hanno notizie certe per via della presenza, in quel giorno, di 3 casi di cui non si conosce la provincia di appartenenza (i cosiddetti casi “In fase di definizione/aggiornamento”).

Eccettuata la rilevante rettifica, cui accennavamo prima, effettuata dalla Regione il 19 Giugno, questo è l’unico caso in cui a livello regionale si osserva l’anomala diminuzione del totale_casi; gli altri errori rilevati si evidenzieranno a livello di singole province e riguarderanno anche alcune impossibili variazioni in diminuzione del numero dei deceduti.

Il primo errore che si evidenzia solo a livello provinciale (senza che se ne abbia percezione osservando i dati del giorno a livello regionale) riguarda la diminuzione del totale_casi che si ha il 7 Marzo, quando in provincia di Enna si azzera il primo caso di contagio registrato nel giorno precedente, il 6 Marzo.

data denominazione
regione
denominazione
provincia
totale casi
05/03/2020 Sicilia Enna 0
06/03/2020 Sicilia Enna 1
07/03/2020 Sicilia Enna 0
08/03/2020 Sicilia Enna 0
09/03/2020 Sicilia Enna 0

I due errori appena descritti sono gli unici rilevabili tra i file resi disponibili dal Dipartimento della Protezione Civile, che della distribuzione provinciale espone, come già detto, soltanto i valori del campo totale_casi. Gli altri errori rilevati riguardano la consistenza dei dati pubblicati nei bollettini regionali che, a partire dal 9 Marzo, la Regione ha comunicato quotidianamente (fino al 5 Giugno, giorno in cui ha iniziato a comunicarli ogni due/tre giorni) tramite il sito web e i canali social regionali.

Il 2 Marzo si ha il primo bollettino della Regione che fornisce dei numeri e che, confrontati con i valori esposti tra il 1° e il 3 Marzo dal Dipartimento della Protezione Civile, lascia supporre un problema di comunicazione tra i due enti; nel comunicato che viene pubblicato il 2 Marzo non si precisano date ma emerge, per confronto con i dati del Dipartimento, che si fa riferimento soprattutto a dati del 1° Marzo. Il comunicato regionale, nel tentativo di fare chiarezza a possibili fraintendimenti della stampa, specifica intanto che i dati riportati da alcuni giornali si riferiscono al numero dei tamponi effettuati, 291 (corrispondente al valore del 1° Marzo riportato dal Dipartimento), e non al totale_casi; il comunicato regionale viene quindi integrato con un aggiornamento in cui si lamenta la correttezza dei dati esposti dal Dipartimento e specificato che “fino ad oggi” (si capirà dall’analisi e dal confronto con i dati del Dipartimento che quel “fino ad oggi” debba intendersi per 1° Marzo) sono 6 i campioni sospetti positivi e che un settimo sarà trasmesso “domani” (quindi il 2 Marzo). Segue quindi la lamentela cui accennavamo: “Ci viene riferito che nel calcolo fatto a Roma, probabilmente, sono stati sommati i casi positivi con quelli guariti.” Qui, a nostro avviso, emerge quel problema di comunicazione tra Palermo e Roma a cui accennavamo prima. Proviamo a spiegare: il valore totale_casi, ovvero il numero dei contagi registrati in assoluto dall’inizio dell’epidemia, prescinde dallo stato del contagiato (positivo, dimesso_guarito, deceduto) e come viene ben spiegato sul sito del Dipartimento, esso è determinato dalla somma dei contagiati ancora ammalati (totale_positivi), dei dimessi_guariti e dei deceduti. In quel periodo non erano stati ancora registrati decessi in Sicilia e pertanto il totale_casi è dato solo dalla somma degli ammalati e dei guariti (quello che viene contestato come un errore nel comunicato regionale). Ma vediamo i dati: il 25 Febbraio vengono rilevati a Palermo i primi 3 contagiati (quindi totale_casi = 3, coincidente con il totale_positivi); due giorni dopo, il 27 Febbraio, viene rilevato a Catania un nuovo_positivo e pertanto il totale_casi passa da 3 a 4; nello stesso giorno, 27 Febbraio, due degli ammalati guariscono e pertanto si ha totale_positivi = 2 e dimessi_guariti = 2; totale_casi = totale_positivi + dimessi_guariti = 4. Questa situazione rimane invariata fino al 29 Febbraio. Il 1° Marzo il Dipartimento riporta i dati di cui alla prima tabella: totale_positivi = 7 (5 in più rispetto al giorno precedente), dimessi_guariti = 2 (dato invariato rispetto al giorno precedente) e pertanto totale_casi = 7 + 2 = 9 (5 in più rispetto al giorno precedente). Confrontando questi dati con il comunicato regionale i conti quasi tornano, nel senso che se sommiamo i 6 positivi cui si fa riferimento nel comunicato ai 2 dimessi_guariti, il totale_casi è pari a 8 (contro il 9 riportato dal Dipartimento). In realtà nel comunicato si accenna a 7 nuovi casi (in tal caso i valori coinciderebbero, 7 + 2 = 9) di cui uno però sarebbe stato comunicato il giorno successivo (non conoscendo però né il giorno né l’orario della dichiarazione riportata nel comunicato, non possiamo fare ulteriori supposizioni). Tuttavia Il giorno dopo, il 2 Marzo, tra i dati del Dipartimento troviamo la prima delle incongruenze di cui abbiamo detto precedentemente, il totale_casi  passa da 9 a 7 (evidentemente nel tentativo maldestro di rettificare l’ipotetico(?) errore lamentato nel comunicato regionale. L’errore si evidenzia, oltre che dall’impossibilità che il valore in questione, totale_casi, possa diminuire, anche dalla variazione in negativo del totale_positivi (che passa da 7 a 5, -2) senza la corrispondente variazione tra dimessi_guariti e deceduti (che rimangono rispettivamente a 2 e a 0). Se errore c’era stato nel comunicare al Dipartimento i nuovi casi di giorno 1° Marzo, sarebbe stato sicuramente più giusto e corretto variare e rettificare i dati del 1° Marzo invece di quelli del 2 Marzo generando l’incongruità che abbiamo tentato di spiegare finora. Infine il totale_positivi = 5 del 2 Marzo è inferiore ai 6/7 nuovi positivi cui si fa riferimento nel comunicato del 2 Marzo. Il che lascia pensare che non ci fossero errori tra i dati del 1° Marzo ma un più banale problema di comunicazione tra Palermo e Roma che sarebbe stato meglio chiarire piuttosto che alterare i dati per via di una dichiarazione “politica”, per quanto “autorevole”, originata solo dall’incomprensione del significato dei valori interessati. Inoltre il comunicato regionale del 3 Marzo dice che ai 7 casi del giorno precedente (e non 5, il valore frutto della rettifica, con una palese contraddizione) si aggiungono altri 3 casi (di cui uno nel ragusano). In tal caso il 3 Marzo, secondo quanto riportato nel comunicato regionale dovremmo avere totale_positivi = 10 (7 + 3) + dimessi_guariti = 2, totale_casi = 12 (10 + 2). I dati del Dipartimento invece vedono una situazione invariata rispetto al giorno precedente (come si evidenzia nella prima tabella sopra) e, tra l’altro, nessun caso ancora segnalato nel ragusano (tra i file provinciali del Dipartimento il primo caso a Ragusa viene registrato il 6 Marzo), il che evidenzia una palese incongruenza tra quanto si asserisce nel comunicato regionale e quanto comunicato dalla Regione al Dipartimento. Inoltre emerge, a nostro avviso, in questa fase iniziale dell’epidemia (ma i fatti dimostreranno anche dopo diversi mesi) che vi sono chiari problemi di comunicazione tra Roma e Palermo (o forse sarebbe meglio dire, che vi è un’evidente incomprensione, da parte di Palermo, del significato dei vari campi).

Il 5 Marzo appare il primo bollettino regionale con un minimo di strutturazione (anche se in formato immagine + testo) che riporta però i dati del 4 Marzo; si segnala un utilizzo dei nomi dei campi difforme da quelli utilizzati dal Dipartimento della Protezione Civile e questo, a nostro avviso, sarà in qualche modo fuorviante agli occhi degli utenti meno attenti per parecchio tempo.

Il primo bollettino destinato a dare informazioni sulla distribuzione provinciale dei dati (anch’esso in formato immagine + testo) appare il 9 Marzo.

Il primo caso d’errore che riguarda il campo deceduti si registra in provincia di Agrigento il 25 Marzo, quando il valore deceduti = 2 del giorno precedente viene inaspettatamente diminuito ad 1.

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
23/03/2020 Sicilia Agrigento 0 42 42 3 4 2 1 45
24/03/2020 Sicilia Agrigento 1 42 43 1 2 2 2 47
25/03/2020 Sicilia Agrigento 1 46 47 4 3 2 1 50
26/03/2020 Sicilia Agrigento 1 51 52 5 5 2 1 55


Ciò che ancora una volta si denuncia non è tanto l’errore in sé, quanto il più totale silenzio e la mancata esigenza di fornire i dati esatti a fronte di errori soprattutto se segnalati.

Sempre nello stesso giorno, il 25 Marzo, segnaliamo delle variazioni in diminuzione dei dimessi_guariti in provincia di Enna e di Palermo; sebbene la variazione sia in assoluto possibile, rimane comunque un evento raro ed eccezionale (che ci fa sospettare piuttosto di errori commessi).

Ad Enna i dimessi_guariti passano dai 2 di giorno 24 Marzo all’ 1 del giorno successivo.

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
23/03/2020 Sicilia Enna 22 16 38 9 10 2 4 44
24/03/2020 Sicilia Enna 29 26 55 17 19 2 6 63
25/03/2020 Sicilia Enna 53 30 83 28 27 1 6 90
26/03/2020 Sicilia Enna 55 71 126 43 43 1 6 133


A Palermo la variazione è ancora più marcata in quanto dagli 11 dimessi_guariti di giorno 24 Marzo si passa ai 6 dimessi_guariti del giorno successivo, ben 5 guariti_dimessi che si sarebbero riammalati.

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
23/03/2020 Sicilia Palermo 39 59 98 17 18 11 1 110
24/03/2020 Sicilia Palermo 45 113 158 60 60 11 1 170
25/03/2020 Sicilia Palermo 50 136 186 28 23 6 1 193
26/03/2020 Sicilia Palermo 56 141 197 11 12 6 2 205


Un altro “warning” dello stesso tipo, riguardante cioè la diminuzione dei dimessi_guariti riguarda la provincia di Messina nella giornata del 28 Marzo, quando i 5 dimessi_guariti del giorno precedente, 27 Marzo, si riducono a 3.  

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
26/03/2020 Sicilia Messina 94 118 212 44 47 5 4 221
27/03/2020 Sicilia Messina 126 90 216 4 6 5 6 227
28/03/2020 Sicilia Messina 133 129 262 46 52 3 14 279
29/03/2020 Sicilia Messina 129 137 266 4 10 8 15 289


Analoghi errori riguardanti variazioni in diminuzione del numero di dimessi_guariti ma stavolta molto più consistenti e ammessi e riconosciuti dalla Regione in modo generico, senza fornire i dati esatti in sostituzione di quelli sbagliati (ma limitandosi a dichiarare “
Si precisa che un errore materiale, nel calcolo dei dati relativi alle province comunicati ieri, è stato corretto e assorbito in quelli odierni.”), si verificano in provincia di Siracusa e Trapani il 26 Aprile. L’anomalia si evidenzia per la variazione in diminuzione rilevata il giorno successivo, 27 Aprile, nelle due province.

A Siracusa, dove si osserva la variazione più consistente, si passa dai 142 dimessi_guariti del 26 Aprile agli 86 del 27 Aprile (-56).   

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
25/04/2020 Sicilia Siracusa 50 46 96 -1 1 82 23 201
26/04/2020 Sicilia Siracusa 51 -5 46 -50 10 142 23 211
27/04/2020 Sicilia Siracusa 52 59 111 65 10 86 24 221
28/04/2020 Sicilia Siracusa 49 62 111 0 0 86 24 221


A Trapani si passa dai 57 dimessi_guariti del 26 Aprile ai 40 del 27 Aprile.

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
25/04/2020 Sicilia Trapani 6 104 110 0 0 20 5 135
26/04/2020 Sicilia Trapani 6 68 74 -36 1 57 5 136
27/04/2020 Sicilia Trapani 6 86 92 18 1 40 5 137
28/04/2020 Sicilia Trapani 6 88 94 2 2 40 5 139


Una
segnalazione di incongruenza tra gli stessi dati, riguardanti soggetti ricoverati e posti in isolamento domiciliare, comunicati nei due bollettini del 7 Maggio dalla Regione rimane senza riscontro.

Altri due casi di errore riguardanti il numero dei deceduti si verificano in Maggio in provincia di Messina e di Palermo.

In provincia di Messina i 52 deceduti del 3 Maggio diventano 51 nel giorno successivo. 

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
02/05/2020 Sicilia Messina 79 298 377 0 1 122 50 549
03/05/2020 Sicilia Messina 76 298 374 -3 1 124 52 550
04/05/2020 Sicilia Messina 76 299 375 1 0 124 51 550
05/05/2020 Sicilia Messina 74 299 373 -2 1 126 52 551


In provincia di Palermo si passa dai 34 deceduti del 14 Maggio ai 33 del giorno successivo.

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
13/05/2020 Sicilia Palermo 51 327 378 2 3 138 33 549
14/05/2020 Sicilia Palermo 50 327 377 -1 0 138 34 549
15/05/2020 Sicilia Palermo 50 322 372 -5 2 146 33 551
16/05/2020 Sicilia Palermo 39 322 361 -11 4 161 33 555


Nei bollettini regionali l’enunciato iniziale a proposito dei dati comunicati recita: “
così come comunicato dalla Regione Siciliana all’Unità di crisi nazionale” ma quello che succede tra il 2 Giugno e il 3 Giugno è inedito e contraddice tale dichiarazione; i dati comunicati dalla Regione Siciliana al Dipartimento di Protezione Civile, e da quest’ultimo pubblicati nel proprio repository, e quelli riportati dalla Regione nei propri bollettini regionali differiscono in maniera significativa in alcuni campi come si evince dalle seguenti tabelle.

Dati comunicati dalla Regione Siciliana al Dipartimento di Protezione Civile e da quest’ultimo pubblicati

data denominazione regione totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
01/06/2020 Sicilia 73 894 967 -19 0 2202 274 3443
02/06/2020 Sicilia 69 897 966 -1 4 2206 275 3447
03/06/2020 Sicilia 67 813 880 -86 0 2292 275 3447
04/06/2020 Sicilia 63 816 879 -1 0 2292 276 3447
05/06/2020 Sicilia 60 812 872 -7 1 2300 276 3448


Dati pubblicati dalla Regione Siciliana nei propri bollettini quotidiani

data denominazione regione totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
01/06/2020 Sicilia 73 894 967 -19 0 2202 274 3443
02/06/2020 Sicilia 69 893 962 -5 4 2210 275 3447
03/06/2020 Sicilia 67 837 904 -58 0 2268 275 3447
04/06/2020 Sicilia 63 816 879 -25 0 2292 276 3447
05/06/2020 Sicilia 60 812 872 -7 1 2300 276 3448


Nonostante la
richiesta di chiarimento su quali fossero i dati esatti indirizzata alla Regione da Open Data Sicilia attraverso il proprio account Twitter e l’ampio risalto avuto dalla stessa, nessun riscontro come al solito è seguito.

Comunque, come già accennato, la più clamorosa delle rettifiche è quella del 19 Giugno, quando vediamo diminuire in un colpo solo il totale_casi da 3464 a 3070, una variazione negativa di ben 394 casi, che denota in maniera inequivocabile il fallimento della Regione Siciliana nella gestione dei dati Covid-19 regionali. Una variazione negativa che non avrebbe dovuto ovviamente aver luogo, vista la natura del campo in questione, che si giustifica appunto come frutto di una rettifica tesa a sanare i numerosi errori commessi lungo tutto il periodo di pandemia e che avrebbe dovuto essere evidenziata nel campo nuovi_positivi che, a nostro avviso erroneamente, riporta invece il valore 3, come a voler evidenziare i nuovi_casi effettivi rilevati in più (?) rispetto al giorno precedente. In realtà è la definizione stessa del campo nuovi_positivi = totale_casi del giorno corrente – totale_casi del giorno precedente, data dallo stesso Dipartimento di Protezione Civile, che ci porta appunto a sostenere che sarebbe stato più corretto indicare il valore -394, invece del valore 3, nel campo nuovi_positivi di giorno 19 Giugno.

A parte comunque la variazione di cui abbiamo discusso, vale la pena notare come già nei giorni immediatamente precedenti, ovvero il 17 e il 18 Giugno, osserviamo delle significative variazioni negative tra i soggetti in isolamento_domiciliare (da 777 a 610 a 124, con una variazione complessiva di -653) e di conseguenza nel totale_positivi (da 805 a 637 a 150, con una variazione complessiva di -655) e una opposta variazione in aumento dei dimessi_guariti che da 2377 passano a 2547 e infine a 2640, con una variazione positiva di 263 dimessi_guariti; la differenza tra la variazione_totale_positivi e la variazione dei dimessi_guariti, 655 – 263 =  392 è pari all’incirca alla rettifica negativa del totale_casi di giorno 19 Giugno (-394).     

data denominazione regione totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
16/06/2020 Sicilia 36 770 806 1 2 2374 280 3460
17/06/2020 Sicilia 28 777 805 -1 2 2377 280 3462
18/06/2020 Sicilia 27 610 637 -168 2 2547 280 3464
19/06/2020 Sicilia 26 124 150 -487 3 2640 280 3070
20/06/2020 Sicilia 26 114 140 -10 0 2650 280 3070


I dettagli di queste variazioni “anomale”, nelle province in cui si sono evidenziate, sono riportati nelle seguenti tabelle (si tenga comunque conto che non si tratta di variazioni giornaliere poiché dopo il 5 Giugno la Regione non ha più emesso i suoi bollettini con cadenza quotidiana come in precedenza ma mediamente ogni due o tre giorni, arrivando anche a pubblicare a distanza di cinque giorni dall’ultimo).

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
15/06/2020 Sicilia Agrigento 0 32 32 0 0 108 1 141
17/06/2020 Sicilia Agrigento 0 32 32 0 0 108 1 141
22/06/2020 Sicilia Agrigento 0 4 4 -28 -6 130 1 135

 

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
15/06/2020 Sicilia Catania 11 387 398 0 1 578 101 1077
17/06/2020 Sicilia Catania 10 387 397 -1 0 579 101 1077
22/06/2020 Sicilia Catania 9 8 17 -380 -300 659 101 777

 

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
15/06/2020 Sicilia Messina 12 107 119 0 0 387 59 565
17/06/2020 Sicilia Messina 10 110 120 1 1 387 59 566
22/06/2020 Sicilia Messina 9 14 23 -97 -94 390 59 472

 

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
10/06/2020 Sicilia Palermo 13 241 254 0 1 290 37 581
12/06/2020 Sicilia Palermo 9 243 252 -2 0 291 38 581
15/06/2020 Sicilia Palermo 9 208 217 -35 2 328 38 583
17/06/2020 Sicilia Palermo 7 210 217 0 1 329 38 584
22/06/2020 Sicilia Palermo 7 62 69 -148 -86 391 38 498

 

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
15/06/2020 Sicilia Ragusa 0 7 7 -1 0 84 7 98
17/06/2020 Sicilia Ragusa 0 7 7 0 0 84 7 98
22/06/2020 Sicilia Ragusa 0 2 2 -5 -11 78 7 87

 

data denominazione regione denominazione provincia totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
15/06/2020 Sicilia Trapani 0 14 14 0 0 123 5 142
17/06/2020 Sicilia Trapani 0 15 15 1 1 123 5 143
22/06/2020 Sicilia Trapani 0 5 5 -10 -7 126 5 136


L’ultimo episodio che segnaliamo riguarda 24 dimessi_guariti che, da più di un mese ormai, la Regione Siciliana non riesce a determinare a quali province appartengano. Nello specifico, il 19 Giugno compare nuovamente (succedeva soprattutto nelle prime settimane dell’epidemia) un record del tipo “
In fase di definizione/aggiornamento” tra i dati provinciali pubblicati dal Dipartimento, che accoglie, in attesa appunto di definizione/aggiornamento, i casi di cui andrà definita la provenienza provinciale. Non avendo la Regione emanato bollettini il 19 Giugno, e quindi in mancanza di dati di dettaglio provinciale per quel giorno, consideriamo i dati delle due tabelle seguenti che contengono i dati di dettaglio provinciale pubblicati dalla Regione con i propri bollettini il 17 e il 22 Giugno e la cui comparazione ci permette di evidenziare questa ulteriore anomalia. 

data denominazione regione denominazione
provincia
totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
17/06/2020 Sicilia Agrigento 0 32 32 0 0 108 1 141
17/06/2020 Sicilia Caltanissetta 1 8 9 -1 1 157 11 177
17/06/2020 Sicilia Catania 10 387 397 -1 0 579 101 1077
17/06/2020 Sicilia Enna 0 8 8 0 0 388 29 425
17/06/2020 Sicilia Messina 10 110 120 1 1 387 59 566
17/06/2020 Sicilia Palermo 7 210 217 0 1 329 38 584
17/06/2020 Sicilia Ragusa 0 7 7 0 0 84 7 98
17/06/2020 Sicilia Siracusa 0 0 0 0 0 222 29 251
17/06/2020 Sicilia Trapani 0 15 15 1 1 123 5 143
17/06/2020 Sicilia 28 777 805 0 4 2377 280 3462

 

data denominazione regione denominazione
provincia
totale ospedalizzati isolamento domiciliare totale positivi variazione totale positivi nuovi positivi dimessi guariti deceduti totale casi
22/06/2020 Sicilia Agrigento 0 4 4 -28 -6 130 1 135
22/06/2020 Sicilia Caltanissetta 1 6 7 -2 8 167 11 185
22/06/2020 Sicilia Catania 9 8 17 -380 -300 659 101 777
22/06/2020 Sicilia Enna 0 7 7 -1 13 402 29 438
22/06/2020 Sicilia Messina 9 14 23 -97 -94 390 59 472
22/06/2020 Sicilia Palermo 7 62 69 -148 -86 391 38 498
22/06/2020 Sicilia Ragusa 0 2 2 -5 -11 78 7 87
22/06/2020 Sicilia Siracusa 0 7 7 7 69 284 29 320
22/06/2020 Sicilia Trapani 0 5 5 -10 -7 126 5 136
22/06/2020 Sicilia 26 115 141 -664 -414 2627 280 3048
22/06/2020 Sicilia In fase di
definizione/ aggiornamento
24 24 24
22/06/2020 Sicilia 26 115 141 -664 -390 2651 280 3072

 

Sicilia: ecco le informazioni per provincia sulla COVID-19, in formato machine readable e aperto

Il 23 Marzo scorso la nostra comunità ha pubblicato una lettera aperta indirizzata alla Regione Siciliana con la quale ha chiesto di rendere disponibili in un dataset machine readable dati di dettaglio relativi all’epidemia COVID-19 in Sicilia.

La richiesta era motivata dall’esigenza di colmare un vuoto rendendo disponibili dati di dettaglio a livello provinciale sull’epidemia, in modo da consentire studi e analisi non soltanto su base regionale, ma anche per ciascuna delle nove province siciliane (invero nella lettera aperta, tuttora senza risposta, si chiede anche la disponibilità di altri dati di dettaglio, disaggregati per comune, per sesso, per fasce di età, ecc.).

La Regione Siciliana dal 5 Marzo scorso pubblica con sostanziale regolarità (anche se con una certa variabilità di tipologia) le informazioni relative all’epidemia COVID-19 in Sicilia; riguardano l’intero territorio regionale, di cui per alcuni viene fornito il dettaglio per ciascuna provincia, e specificato che si tratta dei dati giornalmente trasmessi all’Unità di Crisi Nazionale (dati successivamente raccolti e resi noti dal Dipartimento della Protezione Civile). 

Relativamente ai dati provinciali, il Dipartimento della Protezione Civile si limita a pubblicare dataset contenenti soltanto i dati giornalieri relativi al numero complessivo dei soggetti contagiati dal virus (nel campo totale_casi), per cui le uniche analisi possibili a livello provinciale possono limitarsi soltanto a questo valore, mentre la Regione Siciliana, sempre a livello provinciale, non rende disponibile alcun dataset, utilizzabile per l’analisi di un maggior numero di parametri, limitandosi ad includere alcuni dati all’interno dei comunicati stampa quotidiani (caratterizzati da testo discorsivo e immagini) che non sono di alcuna utilità allo scopo se non per il semplice fatto di essere comunicati; tali dati, per essere analizzati e generare qualsiasi tipo di studio, report o visualizzazione hanno bisogno di essere raccolti e strutturati all’interno di tabelle in formati open e machine readable che ne consentano appunto un proficuo utilizzo.

In attesa di ricevere una risposta nei fatti, OpenDataSicilia ha trasformato i comunicati stampa in una tabella machine readable. È accessibile al momento in due modalità:

  • in 👉 formato CSV (encoding UTF-8 e , come separatore), con un file di insieme che contiene tutti i dati;
  • come foglio elettronico online. Da notare che questo è il nostro file di lavoro, la fonte dati è il suddetto file.

I dati raccolti e strutturati in un dataset pubblicato su Github derivano quindi dai comunicati stampa della Regione Siciliana, con alcune integrazioni a partire dal dataset provinciale del Dipartimento della Protezione Civile, integrati nei primi giorni – dal 24 Febbraio al 5 Marzo 2020 – con notizie di stampa locali, e con i dati che, pur non esplicitamente comunicati, è stato comunque possibile ricavare applicando dei semplici calcoli.
Per alcuni dati invece (ad es. il numero di tamponi effettuati o il numero di pazienti ricoverati in terapia intensiva) non è stato possibile avere informazioni disaggregate per singola provincia.

I dati così raccolti sono stati strutturati, per uniformità, secondo lo schema adottato dal Dipartimento della Protezione Civile (DPC) e sottoposti a verifiche di consistenza che hanno evidenziato solo alcuni casi, pochi fortunatamente, in cui si sospetta dell’accuratezza dei dati esposti.

Quanto prodotto da DPC è prezioso, perché fa da riferimento. È infatti un caso abbastanza unico in Italia: è raro trovare dei dataset in qualsiasi portale open data della Pubblica Amministrazione, così curati, ben descritti e pronti all’uso.

È così finalmente abbiamo un dataset che consente di effettuare delle visualizzazioni e delle analisi, sui dati COVID-19 a livello di singola provincia siciliana. A seguire due esempi dimostrativi di due visualizzazioni automatiche di riepilogo che adesso è possibile fare con questi dati (la seconda, grazie Totò Fiandaca) rappresenta dati, prima non disponibili.

!function(){“use strict”;window.addEventListener(“message”,function(a){if(void 0!==a.data[“datawrapper-height”])for(var e in a.data[“datawrapper-height”]){var t=document.getElementById(“datawrapper-chart-“+e)||document.querySelector(“iframe[src*='”+e+”‘]”);t&&(t.style.height=a.data[“datawrapper-height”][e]+”px”)}})}();

!function(){“use strict”;window.addEventListener(“message”,function(a){if(void 0!==a.data[“datawrapper-height”])for(var e in a.data[“datawrapper-height”]){var t=document.getElementById(“datawrapper-chart-“+e)||document.querySelector(“iframe[src*='”+e+”‘]”);t&&(t.style.height=a.data[“datawrapper-height”][e]+”px”)}})}();


Per maggiori informazioni vi invitiamo a consultare i dati stessi e la documentazione disponibile sul repo creato partendo dal file README.

Il nostro auspicio è che la Regione pubblichi presto questi dati o in alternativa che anche i dati di dettaglio provinciale vengano resi disponibili nel repository del DPC.