Uno sguardo sul Patrimonio Culturale di Palermo

patrimoniodipalermo.netlify.app, la dataviz che riscopre la Città

a cura di:
Silvia Spacca | Laurea magistrale in Ingegneria del Cinema. 3D Artist, grafica, fotografa https://twitter.com/silla_abrasax
Leonardo Zanchi | Dopo la laurea magistrale in Computer Science metto i pallini sulle mappe https://twitter.com/lezanviz


Zīz, Πάνορμος, Panormus, Balarm, in ogni caso Palermo, una città dai mille volti e dalle molte dominazioni, ognuna delle quali ha lasciato alla popolazione mondiale inestimabili tesori appartenenti a epoche e culture diverse.

In considerazione del vasto Patrimonio Culturale della Città, concentrato in gran parte nell’originario centro nevralgico costituito dagli antichi quartieri della Kalsa, l’Albergheria, la Loggia e il Capo, è nata l’idea di realizzare una visualizzazione che permetta di volgere uno sguardo generale a questi Beni, contestualizzandoli all’interno del tessuto urbano.
La visualizzazione è consultabile all’indirizzo: https://patrimoniodipalermo.netlify.app/.

Tracce della connessione con il territorio possono essere ritrovate nelle scelte grafiche, progettate nel dettaglio per creare l’effetto di una cartolina d’altri tempi. 

Il font usato riproduce quello delle illustrazioni del dopoguerra, affiancato dall’immagine delle Cubula, scelta per identificare l’intero Patrimonio Culturale; un edificio arabo-normanno che assurge a simbolo di multiculturalità e integrazione, aspetti che storicamente hanno caratterizzato la Città.
Infine la scelta della  paletta di colori utilizzati per i componenti grafici, essa infatti è stata realizzata prendendo le tonalità più utilizzate nelle tradizionali ceramiche di Caltagirone, anche loro scelte a simboleggiare la cultura siciliana più in generale.

La struttura

La visualizzazione si presenta come una dashboard composta da tre aree tematiche, da noi identificate come: i luoghi, il tempo e le proporzioni. Ognuna di queste risponde in modo interattivo ai filtri che l’utente può impostare dalle select.

I luoghi sono costituiti, tecnicamente parlando, da una Scattermap, una Gridmap e una Choropleth, definite rispettivamente Posizione, Distribuzione e Prevalenza, al fine di facilitare l’esperienza utente. Le mappe possono essere visualizzate una per volta attraverso dei bottoni e mostrano diversi aspetti dei monumenti rispetto alla loro posizione geografica, alla distribuzione nel territorio e la prevalenza di uno stile architettonico rispetto ad altri per ogni quartiere. I tooltip che accompagnano la selezione di ogni elemento forniscono informazioni circa la locazione dell’edificio, l’anno di costruzione e il quartiere di appartenenza. 

Il tempo è costituito da un grafico di tipo Lollipop, in cui l’ascissa rappresenta l’evoluzione temporale, che procede di cinquant’anni in cinquant’anni, mentre l’ordinata mostra la quantità di monumenti per ogni gruppo appartenente all’asse temporale considerato. Quando non sono presenti edifici per un determinato periodo, il grafico mostra una sfera grigia alla base dell’asse.

Le proporzioni sono composte da tre Waffle, i quali mostrano proporzionalmente informazioni sullo stile architettonico, la tipologia di Bene e l’Ente gestore dello stesso, così da permettere uno sguardo generale sulla totalità delle voci presenti nel database. Ogni categoria è identificata con un colore e un tooltip permette di ottenere informazioni specifiche sulla categoria selezionata.

Per andare incontro alla maggiore quantità di persone possibile e facilitare l’esperienza utente, ogni grafico ha una leggenda a scomparsa, è stato inserito un pannello di spiegazioni attivabile con il tasto menu ed è stata introdotta una guida passo passo che mostra le principali azioni che l’utente può effettuare.

I dati

Il dataset che abbiamo scelto per realizzare la visualizzazione è disponibile all’interno del Portale Open Data del Comune di Palermo. Nonostante i dati risultassero parziali, non aggiornati dal 2017 e con errori e imprecisioni, con le dovute modifiche e correzioni sono stati una base di partenza discreta. Abbiamo corretto campi, eliminato quello che non sarebbe servito e aggiunto informazioni essenziali per ciò che si voleva visualizzare.
La nostra versione è disponibile qui, per qualsiasi dubbio/proposta, aprite una issue. 

Dal nostro punto di vista, la forza del dato risiede anche nella sua stessa esistenza e nella funzione di stimolo che può assolvere.
In questo modo è andata la realizzazione del progetto sul Patrimonio di Palermo: stavamo cercando qualche ispirazione all’interno del Portale e l’idea di colorare la città in base allo stile dei monumenti è nata man mano che si prendeva coscienza della presenza dei dati e di quello che permettevano di creare.

Le criticità che abbiamo individuato nel dataset sono riassumibili in tre punti:

  1. è estremamente parziale, contiene solo 140 monumenti e spesso alcuni campi dei dati hanno un valore nullo.
  2. non viene aggiornato dal 2017. Dal punto di vista del nostro lavoro non è un grosso problema, ma in generale non è auspicabile.
  3. contiene errori piuttosto grossolani riguardo alla posizione del monumento, in particolare per latitudine e longitudine (alcuni beni sono posizionati nel golfo di Palermo).

Come già detto, il secondo punto non è nel nostro caso un problema, così come il terzo, per quanto richieda molto tempo correggere le inesattezze. Il primo punto è sicuramente quello più importante, perché rischia di inficiare tutto il senso della visualizzazione. Il dataset è scarno, 140 voci sono veramente poche se messe a confronto con quello che Palermo possiede. Dovrebbe essere ampliato, dato anche l’estremo interesse che il patrimonio di una città come Palermo riscuote.

Dei campi disponibili su ogni singola voce abbiamo deciso di utilizzare la descrizione (il tipo di monumento), la denominazione (il nome del monumento), il gestore (l’ente gestore del monumento), latitudine, longitudine e indirizzo. Al dataset mancavano importanti informazioni (basilari, almeno nel nostro caso, ma sentirei di estenderlo al dataset in generale) relative all’anno di costruzione e allo stile. A volte queste informazioni sono contenute più o meno esplicitamente nella proprietà Cenni_storici, ma sono difficilmente estraibili in modo automatizzato, data anche la parzialità con cui compaiono riportate nelle proprietà. Molto del tempo è stato quindi dedicato a ricercare l’anno di costruzione del monumento e il suo stile e ad aggiungere voci mancanti. Qua si aprirebbe un discorso molto lungo, che può essere riassunto in questo modo: un inferno.

A questo proposito apro una piccola parentesi: se qualcuno è a conoscenza di monumenti mancanti, corredati dalle informazioni sopra elencate, scriveteci così che sia possibile ampliare il dataset e la visualizzazione (dove è finito il liberty di Palermo?), senza limitarsi al solo nome del Bene, ma includendo le informazioni annesse, che sono la parte più complicata da individuare. Lo stesso se avete notato errori in quello che è già presente.

Lo Sviluppo

Dal punto di vista implementativo si tratta di una web application realizzata con ReactJS. Si potrebbe obiettare che la scelta di utilizzare tale libreria per un sito web simile sia “overkill”, tanto boilerplate per una singola pagina non soggetta ad update: sono d’accordo, non era sicuramente necessario introdurre React per realizzarla, ma è diventato talmente semplice avere una base di partenza “up and running”, che non riesco a farne a meno. In realtà il vero motivo per cui React è diventato per me imprescindibile è la galassia di librerie che sono costruite attorno ad esso e la semplicità con cui è possibile introdurle nel proprio progetto. Ne cito alcune che ritengo più valide, e che dovrebbero essere tenute in considerazione da chi fa dataviz con React:

  • DeckGL: è un framework costruito su webgl che permette di visualizzare una grande mole di dati geospaziali. Da quando l’ho scoperto e devo trattare dati spaziali, è la mia prima scelta (anche sopra Leaflet), specialmente su React. È open-source ed è realizzata da Uber.
  • KeplerGL: se avete bisogno di visualizzare dati geospaziali velocemente, direttamente online senza installare nulla sul proprio PC, è la scelta migliore. Sempre di Uber, sempre opensource.
  • Nivo: d3.js e React? Nivo è una delle mie prime scelte quando ho bisogno di grafici classici, specialmente se ho bisogno di un Waffle. Sempre open source.
  • Recharts: sempre d3.js e React. La libreria mette a disposizione dei layout pronti all’uso, ma consente anche di personalizzarli. Sempre open source.
  • VX: ancora d3.js e React. Normalmente impiego questa libreria quando ho necessità di creare grafici che hanno bisogno di una certa personalizzazione, ma voglio una base solida di partenza basata sui paradigmi di React. Rispetto alle altre due librerie, VX è ad un livello di astrazione più basso, più vicino a d3.js, ma con il vantaggio che qualcuno si è già preso la briga di implementare ogni modulo come componente. Sempre open source.
  • Highcharts: è una libreria che ho scoperto durante un lavoro per una azienda dove avevano l’assoluta necessità di impiegare Highcharts. È ben fatta, solida, ben supportata, ma è pagamento per prodotti commerciali. La uso spesso per i progetti, soprattutto se ho bisogno di grafici classici. Su React dò sempre più spazio a react-jsx-Highcharts, un wrapper non ufficiale di Highcharts, alternativa a quella ufficiale.
  • Per riferimento lascio altre librerie che ho impiegato di tanto in tanto, in ordine sparso: Reaviz, React-vis, Semiotic, Vega e Vega-lite, G2, Echarts, HarpGL. Tutto open source, tutte free.

In questo progetto sono state impiegate tre librerie grafiche: DeckGL, Nivo e Highcharts.

Con DeckGL è stata realizzata la parte di visualizzazione geospaziale, che consiste nelle tre mappe a sinistra (in una visualizzazione desktop).
DeckGL utilizza un layer statico che rappresenta la mappa, implementato con un componente di React-map-gl (se dovete utilizzare Mapbox su React, React-map-gl [https://visgl.github.io/react-map-gl/] è la libreria che vi serve), e tre layer dinamici che codificano i dati disponibili, implementati utilizzando i componenti offerti da DeckGL.

Quello che vedete è praticamente tutto quello che serve per avere una mappa pronta all’uso. Per aggiungere i dati è necessario dichiarare il layer e aggiungerlo al componente di DeckGL in questo modo. 

Per avere interattività negli oggetti rappresentati nella visualizzazione c’è da scrivere qualche riga di codice in più, ma nulla di complicato, una useEffect() è sufficiente.

Con Nivo, invece, si sono realizzati i tre Waffle in alto a destra, utilizzati per mostrare le proporzioni.

Ciò che mi piace di Nivo è il suo approccio dichiarativo all’implementazione dei charts, che lo rende estremamente semplice nel suo utilizzo. Se con Deck.GL le righe di codice erano una ventina per avere una mappa con dei dati rappresentati, con Nivo per avere un Waffle pronto e responsive ne sono sufficienti 5.

Se non conoscete la libreria, fate un salto sul sito ufficiale e guardatevi uno dei componenti che mette a disposizione, per esempio il Waffle[https://nivo.rocks/waffle/]. Avete provato le modifiche on the fly al chart?

Con Highcharts è stato realizzato il Lollipop in basso a destra. Come già detto, alcuni mesi fa ho fatto la conoscenza di una libreria wrapper per React di Highcharts chiamata react-jsx-highcharts, una alternativa al wrapper ufficiale Highcharts-react. Si trattava di una situazione un po’ al limite, in cui avevo moltissimi dati (ordine del milione) in una Heatmap e doveva essere possibile interagire con il grafico, cambiare i dati mostrati. La prima implementazione l’ho realizzata con Highcharts-react, non era brillante, i tempi di attesa erano superiori al secondo. Avevo provato tutto quello che mi era venuto in mente, passare da svg a canvas, eliminare qualsiasi animazione, ma i tempi ancora non erano soddisfacenti. Ho provato react-jsx-highcharts e la transizione dei dati era pressoché istantanea, nessun ritardo. Da quel momento in poi è diventata la mia libreria di Highcharts per React.

Nel caso del Lollipop le righe di codice sono circa una decina, direi non male?

Ciò che mi piace in generale di Highcharts è il vasto parco di grafici che mette a disposizione, non sono personalizzabili come con d3.js, ma conoscendo a fondo la libreria è possibile spingersi molto oltre quelle che sono le demo disponibili [https://www.highcharts.com/demo]. Un altro aspetto che mi piace è la generalità con cui si dichiarano gli elementi che costituiscono il grafico, riuscendo a stabilire un semplicità di utilizzo che difficilmente trova eguali.

Ovviamente il discorso non si esaurirebbe qui, si potrebbe parlare della struttura che permetta di interagire con i grafici, della costruzione del dato, dell’interfaccia e l’esperienza utente. Tipicamente parti del lavoro che richiedono molto tempo, in particolare la costruzione del dato, che in alcuni casi è parzialmente facilitata se è già presente un dataset e la realizzazione di un’interfaccia utente che sia responsive,  intuitiva, accattivante e che rispecchi coerentemente la natura del lavoro.
Poi l’ultima parte della progettazione: ottimizzazione, testing e debugging.

Lettera aperta alla Regione Siciliana, per la pubblicazione in formato machine readable dei dati sulla COVID19

La Regione Siciliana informa quotidianamente la cittadinanza sui numeri relativi alla COVID19.
Lo fa in prosa e con immagini, con informazioni interessanti non presenti nella banca dati nazionale del Dipartimento della Protezione Civile.

Sono informazioni di grande interesse che a nostro avviso vanno pubblicate anche come dati in modalità machine readable, in un formato che li renda interpretabili da un computer e da software di analisi e visualizzazione di dati.

Per questa ragione abbiamo fatto questa richiesta alla Pubblica Amministrazione Regionale.

La richiesta

In diverse circostanze, attraverso il contributo singolo o collettivo dei suoi membri, la comunità OpenDataSicilia ha interloquito positivamente con diversi rami dell’amministrazione regionale fornendo il proprio supporto.

In questa circostanza invitiamo l’Amministrazione Regionale a rendere disponibili anche in forma machine readable, i dati provinciali sul COVID19, che ogni giorno la Regione Siciliana pubblica in prosa (sui canali social ufficiali e su siciliacoronavirus.it).
Si veda come esempio la comunicazione su facebook del 20 marzo 2020 (o l’analogo su costruiresalute) in cui si legge: 

Risultano ricoverati 210 pazienti (27 a Palermo, 105 a Catania, 17 a Messina, 1 ad Agrigento, 11 a Caltanissetta, 18 a Enna, 6 a Ragusa, 17 a Siracusa e 8 a Trapani) di cui 42 in terapia intensiva, mentre 169 sono in isolamento domiciliare, venticinque guariti (11 a Palermo, 5 a Catania, 4 a Messina, 2 ad Agrigento ed Enna, 1 a Ragusa) e quattro deceduti.

Questi dati con taglio provinciale sono a integrazione di quanto pubblicato in modo centralizzato dal Dipartimento della Protezione Civile (DPC), che al momento pubblica per provincia soltanto il totale dei casi (vedi qui). Ancora più interessante sarebbe un taglio comunale.

Potreste fare riferimento allo schema che il DPC usa per i dati regionali, integrando per provincia e/o per comune le seguenti informazioni:

  • Codice ISTAT provinciale
  • Codice ISTAT comunale
  • Ricoverati con sintomi            
  • Ricoverati in terapia intensiva   
  • Totale ospedalizzati              
  • Persone in isolamento domiciliare 
  • Totale attualmente positivi (ospedalizzati + isolamento domiciliare)
  • Nuovi attualmente positivi (Totale attualmente positivi attuali – Totale attualmente positivi del giorno prima)
  • Persone dimesse guarite           
  • Persone decedute
  • Totale casi                          
  • Totale tamponi      

Il formato dati (il CSV e/o il JSON) e le modalità di pubblicazione scelte dal DPC sono sicuramente da prendere come riferimento a cui allinearsi.

Inoltre riteniamo che sarebbe di grande interesse conoscere avere un’estrazione di informazioni  (iniziando anche in modalità one shot) su:

  • totale a oggi (23 marzo 2020) di persone entrate in Sicilia dal 29 gennaio;
  • numero di persone che ha compilato il censimento di autodenuncia;
  • il numero generico dei deceduti in Sicilia suddivisi per cause, patologia, età, sesso, sempre dal 29 gennaio (la data del 29 gennaio è stata individuata perché si è registrato il primo caso di contagio Covid-19 in Italia).

Siamo disponibili – se ritenuto utile – a dare un contributo strumentale e di processo per realizzare quanto richiesto.

Uso responsabile ed etico delle mappe

Lyzi Diamond – che attualmente è docs lead presso heroku, che in precedenza ha lavorato presso glitch, mapbox, maptimehq, codeforamerica e oregongeology – circa 10 giorni fa ha redatto un thread twitter molto bello sull’uso responsabile ed etico delle mappe, per evitare di raccontare una storia sbagliata.

Quando l’ha scritto era tra le pochissime che sottolineasse l’inadeguatezza di molte scelte di rappresentazione cartografica di tante mappe sul COVID19. Lei lo ha fatto a partire proprio da quella che ad oggi è stata più diffusa.
Da quel giorno altre e altri si sono uniti.

Ci è sembrato e ci sembra ancora un contributo prezioso sul tema e abbiamo voluto crearne una traduzione in italiano. Un grazie a Paola Masuzzo per il tempo che ha dedicato alla cosa.

Il thread

Ciao a tutti, facciamo un altro Twitter-torial sulle mappe! L’argomento di oggi è la visualizzazione di dati aggregati. Si tratta per lo più di una critica a questa mappa, che probabilmente avrete visto circolare un bel po’.
È una mappa che mostra dati importanti! Ma ho qualche problema con le tecniche utilizzate.

tweet originale


Conosciamo tutti le mappe che visualizzano dati aggregati. La più nota tra tutte è probabilmente la mappa coropletica: mostra aree geografiche riempite con un colore o un motivo, per rappresentare informazioni relative a quelle aree.
Un esempio è questa elettorale della BBC:

mappa coropletica

tweet originale


I colori sulla mappa rappresentano delle informazioni: ad esempio, quale partito ha vinto le elezioni in un distretto e con quale percentuale. Le mappe coropletiche hanno dei limiti (spesso legati a ipotesi fatte su aree geografiche estese), ma sono comunque utili per mostrare dati aggregati per aree.

tweet originale


Esistono altri due modi comuni di visualizzare dati aggregati: le “mappe a densità di punti” e quelle con simboli di dimensioni variabili rispetto a una parametro. Le “mappe a densità di punti” usano un punto per rappresentare un determinato numero di elementi che si vogliono mappare, e raggruppano i punti in un’area geografica.
Ecco un esempio di Bill Rankin (2009):

mappa a densità di punti

tweet originale

Ciascun punto rappresenta 25 persone nella città di Chicago. Ogni punto però non fornisce la locazione geografica precisa di quelle 25 persone, ma una posizione random dentro l’area geografica di interesse (assieme agli altri punti che appartengono alla stessa area geografica). Interessante, no? È di certo un bel modo per raccontare una storia.

tweet originale


Esistono anche le mappe a “simboli proporzionali”. In queste viene usato un simbolo (comunemente un cerchio) per rappresentare un’area geografica, e la dimensione e/o il colore del simbolo hanno una qualche relazione con una proprietà dei dati che si vogliono rappresentare. Un esempio: la mappa della diffusione del coronavirus sviluppata dall’istituto Johns Hopkins.

mappa a simbolo graduato

tweet originale

Nel caso specifico di questa mappa, ciascun punto rappresenta uno stato/provincia o Paese (dipende dalla regione geografica, negli Stati Uniti d’America sono gli stati), e il raggio del cerchio di ogni punto cresce al crescere dei casi di coronavirus confermati in quell’area geografica. (Da notare che la scala non è lineare, ma logaritmica!)

mappa a simbolo graduato - legenda

tweet originale


Cosa ci vuole dire questa mappa? Lo scopo sembra voler essere quello di mostrare (e quindi informare l’utente su) il numero totale dei casi di COVID-19 nel mondo. La domanda è: ci riesce? La risposta? Sì e no. Ecco alcune mie critiche su questa mappa.

tweet originale


Conoscere il numero totale di casi in una determinata area geografica è utile. Conoscere il numero totale di casi entro una specifica area politica… forse un po’ meno. Se vivo al confine tra Washington e Oregon (supponiamo a Portland), quel confine di stato per me non ha molto significato…

tweet originale


In termini di contenimento e misure adottate da uno specifico stato, sembra essere utile sapere quanti casi sono presenti al suo interno. Da un punto di vista epidemiologico, però, ai virus non importa granché di confini di stato. Si parla infatti di un concetto chiamato il “Problema delle unità areali modificabili”.

tweet originale


Questo problema riguarda il modo in cui la modifica dei limiti delle aree di studio può cambiare completamente i risultati di un’analisi spaziale. Questo conduce ad un errore ecologico: l’idea che questi confini abbiano importanza nell’interpretazione dei dati (per saperne di più, guardate questo Twitter-torial).

tweet originale


La mia modesta opinione, quindi, è che mostrare il numero di casi per area geografica è utile, ma solo in termini di risposta “ufficiale” di quell’area geografica/amministrativa (risposta ai dati che si stanno interpretando).

tweet originale


2 Questa è una mappa “slippy”, il che significa che posso scorrerla, ingrandirla e rimpicciolirla. Una cosa utile! Posso quindi fare zoom sulla mia città per verificare se ci siano casi riportati. Vivo a New York, dove so che ci sono casi. Ma cosa succede quando aumento lo zoom?

mappa - zoom in

tweet originale


Non trovo niente! E sapete perché? Perché il simbolo graduato che rappresenta il numero di casi nello stato (stato=area geografica) è situato nel suo centroide geografico, triangolato approssimativamente tra Binghamton ed Oneonta.

mappa - centroide

tweet originale


Il centroide di un’area è la posizione media di tutti i suoi punti — non è proprio il “centro” dell’area, ma ci si avvicina. Se stessimo parlando di una mappa analogica (di carta), tutto ciò avrebbe molto più senso. È molto più semplice leggere la mappa quando facciamo zoom out! Ma..

tweet originale


… se io non sapessi come funzionano le mappe con simboli proporzionali, se non sapessi come vengono costruite, e quale messaggio cercano di trasmettere… ipotizzerei che NYC non abbia nessun caso di COVID-19 e che tutti i casi di New York sono concentrati intorno alla città di Downsville, New York. È lì che si trova il simbolo!

tweet originale


Inoltre, i simboli graduati scompaiono quando si fa uno zoom in avanti oltre il livello 7. Questo vuol dire che, anche se credessi che tutti i casi di New York sono localizzati in quell’area, non saprei nemmeno di preciso dove localizzarla, perché i simboli scompaiono sinché non si fa zoom indietro.

tweet originale


Dunque, come possiamo rendere questa mappa più chiara? Quali accorgimenti può prendere un cartografo per raccontare questa storia in modo più chiaro?

tweet originale


Un’opzione è quella di impostare dei limiti allo zoom. Semplicemente, non lasciare che l’utente possa fare zoom in avanti oltre un certo livello. Questa impostazione farebbe capire all’utente che non ci sono dati disponibili oltre una certa risoluzione/scala, e allo stesso tempo chiarisce che i simboli rappresentano un dato aggregato.

tweet originale


Onestamente, però, non riesco a capire del tutto che cosa sta cercando di mostrare o di raccontare questa mappa. Mostrare i casi confermati aggregati per stato o nazione non mi sembra una cosa molto utile. Piuttosto, che andamento hanno i casi nel tempo? Come potremmo visualizzare questo andamento? E le statistiche normalizzate per popolazione?

tweet originale


Sono consapevole che questi dati sono recenti e non sappiamo di preciso quanto siano affidabili, e so che è importante ottenere quante più informazioni possibile, che ci aiutino a capire che cosa sta succedendo. Il problema è che tutte queste mappe sono rischiose perché raccontano una storia sbagliata.

tweet originale


Un consiglio generale: quando si aggregano dei dati, bisogna per forza di cose rimuovere dettagli e sfumature. È nostra responsabilità, come cartografi, assicurarci di farlo in modo responsabile ed etico, in particolare condividendo la metodologia che adoperiamo e spiegando i risultati che otteniamo.

tweet originale


Inoltre, L’ALFABETIZZAZIONE SULLE MAPPE È IMPORTANTE E DOBBIAMO CONTINUARE A FARLA E TRASMETTERLA, ANCHE NELL’ERA DI GOOGLE MAPS. Le mappe sono strumenti storici di oppressione e spetta a noi essere critici sulla visualizzazione dei dati di tutti i tipi, piuttosto che accettarla come un dogma.

tweet originale

Raduno Open Data Sicilia 2020 – edizione “do not give up”

Il 6 e il 7 marzo ci sarebbe dovuto essere a Catania il nostro raduno del 2020. L’emergenza COVID-19 ci ha costretto a sospendere l’evento.
Peccato, c’era un programma bellissimo.

Allora è stata fatta la proposta di organizzare un evento online, per non disperdere del tutto quanto era stato preparato. Alcuni di noi hanno accettato la proposta e ne è uscito un bell’incontro, che abbiamo video registrato e di cui trovate i dettagli a seguire.

Ne è venuta fuori un’edizione breve che abbiamo denominato (citando Paola) “do not give up“.

Un grazie speciale a Paola Masuzzo, Guenter Richter, Giovanni Pirrotta, Ciro Spataro, Maurizio Napolitano, Andrea Borruso, Andrea Nelson Mauro, Davide Taibi, Nino Galante, Mario Grimaldi, Francesca De Chiara, Giulio Di Chiara per esserci stati.

Indice interventi:

Maurizio Napolitano

Dieci anni di OpenData

Di più avrei potuto fare, specialmente nel campo statistico, se non ci fosse nel nostro paese, e nei privati e negli enti morali, una tal quale ritrosia a confidare al dominio del pubblico dati, fatti e notizie. (C. Battisti 1898

Paola Masuzzo

FAIR and Open Data for the Life Sciences: we can and must do better!

Guenter Richter

Una visualizzazione “colorata”, dei cittadini stranieri di Palermo

Giovanni Pirrotta

Protezione Civile Pop

Andrea BorrusoCiro Spataro e Giovanni Pirrotta (e non collegati Emilio Di GristinaSalvatore Fiandaca e Giovan Battista Vitrano)

I dati aperti sulle fontanelle d’acqua potabile a Palermo: un dataset dal valore sorprendente

Raduno di OpenDataSicilia: ecco il programma – #ODS2020 (ANNULLATO, per COVID-19)

Grazie al gruppo di lavoro dedicato  – costituito Cristiano Longo, Isabel Matranga, Giovanni Pirrotta e Davide Taibi – è stata redatta la prima versione del programma del raduno di OpenDataSicilia che si terrà il 6 e 7 marzo a Catania.

Trovate tutte le informazioni sul sito dedicatohttps://ods2020.opendatasicilia.it/#schedules

Il 6 e il 7 marzo 2020, il raduno di OpenDataSicilia a Catania: inviaci la tua proposta!!

La comunità di #OpenDataSicilia si troverà a Catania dal 6 al 7 Marzo 2020. Saranno due giornate di confronto, workshop formativi ad accesso gratuito e gruppi di sviluppo progettuale per lavorare sui dati aperti.

Lavori, fai ricerca o esperimenti sugli Open Data?
Mandaci la tua idea – entro il 31 gennaio – e vieni a raccontarla http://bit.ly/ods2020proposte

Le altre informazioni sul sito dell’evento: https://ods2020.opendatasicilia.it/

LibreItalia Conference 2019: 11 maggio a Palermo

Il prossimo 11 maggio si svolgerà a Palermo la conferenza “LibreItalia Conference 2019“: https://www.libreitalia.org/sesta-conferenza-italiana-libreitalia-2019/

È organizzata dall’associazione LibreItalia, con la collaborazione di Free Circle, l’associazione Mozilla Italia, la comunità Ubuntu Italia e noi di OpenDataSicilia.
Si terrà a Palermo, presso la “Sala De Seta” ai Cantieri della Zisa, presso via Paolo Gili, 4, dalle ore 9.00 alle ore 17.30.

La registrazione all’evento è gratuita e si effettua da qui: https://www.eventbrite.it/e/biglietti-conferenza-libreitalia-palermo-2019-59876453083

Sessione mattutina

Ora Intervento
09:00 Registrazione e accoglienza
09:30 Saluti – Consiglio LibreItalia, autorità
09:45 Il software libero e open source: cos’è e perché riguarda tutti – Giordano Alborghetti, LibreItalia
10:15 L’importanza dei formati standard – Italo Vignoli, Presidente onorario LibreItalia
10:45 Coffee break
11:15 Open Data: un percorso tra formati, strumenti, giurisprudenza e modalità di pubblicazione – Andrea Borruso, Mario Grimaldi e Ciro Spataro, OpenDataSicilia
11:45 La nuova versione dell’Internet Health Report di Mozilla – Edoardo Viola, Mozilla Italia
12:15 Stai in forma e sicuro con Ubuntu – Dario Cavedon, ubuntu-it

Sessione pomeridiana

Ora Intervento
14:00 M come Migrazione (a software libero): Comune di Roma – Flavia Marzano, Assessorato «Roma Semplice»
14:30 M come Migrazione: dalla teoria alla pratica – Enio Gemmo, Presidente LibreItalia
15:00 I professionisti e il software libero – Ing. Bruno Lo Torto, Ordine Ingegneri di Palermo
15:30 Coffee break
16:00 Public Money, Public Code – Marina Latini, CIB software GmbH
16:30 LibreOffice e la sua community – Gabriele Ponzo e Marina Latini, TDF
17:00 Sessione di chiusura e saluti – Consiglio LibreItalia, Free Circle Palermo

Richiesta apertura dati Assemblea Regionale Siciliana: una lettera aperta

NdR: oggi abbiamo inviato al presidente dell’Assemblea Regionale Siciliana Onorevole Micciché e al dott. Ingrao (responsabile dei servizi informatici dell’ARS) l’email di sotto.

—————-

Egregi Presidente Onorevole Micciché e dott. Ingrao,
vi scriviamo a nome della comunità “Open Data Sicilia“, iniziativa civica che si propone di far conoscere e diffondere la cultura dell’open government e le prassi dell’open data nel nostro territorio al fine di aprire una discussione pubblica partecipata.

In occasione della settimana dell’amministrazione aperta, attualmente in corso e durante la quale si concentrano su tutto il territorio nazionale iniziative per promuovere l’amministrazione aperta, vi scriviamo in merito al recente aggiornamento del sito Web istituzionale dell’Assemblea Regionale Siciliana.
Il nuovo portale istituzionale dell’ARS si presenta adesso molto più flessibile in termini di adeguatezza e fruibilità e, allo stesso tempo, nell’ottica di migliorare alcuni aspetti del sito,™ vorremmo suggerirvi l’implementazione di alcune funzionalità che potrebbero aumentare di molto il livello di attrattività del sito stesso.

Il suggerimento più importante che vorremmo darvi è di pubblicare i dati dell’attività politica dell’Assemblea Regionale Siciliana in opendata, così come da anni avviene al Senato della Repubblica.
In un settore chiave come quello legislativo, i dati aperti costituiscono uno strumento essenziale ed estremamente importante, abilitante per tutte quelle iniziative relative al monitoraggio, alla trasparenza, alla partecipazione civica e all’ open-governmentin generale.

Lo scorso 9 e 10 novembre 2018, la comunità ha organizzato il raduno Open Data Sicilia 2018 a Palazzo dei Normanni, presentando il progetto OpenARS, una piattaforma per la pubblicazione dei dati ARS in modalità “Linked-Data“, il livello più alto di fruibilità secondo il modello di Tim Berners-Lee. In quell’occasione abbiamo mostrato l’alto livello di flessibilità raggiunto dalle potenzialità del Web semantico applicato ai dati ARS; abbiamo sviluppato una ontologia per modellare il dominio di riferimento dei dati ARS partendo proprio dai dati estratti dal sito vecchio; abbiamo organizzato un hackathon sui dati ARS, enfatizzando il concetto di riuso, tipico degli opendata, in contesti diversi da quello originale (per maggiori informazioni programma, slide e video sono scaricabili nel sito di riferimento sopraindicato).
Con un obiettivo principale: mostrare come tutto questo consenta di fare diventare più “quotidiane” e più “leggibili” le attività parlamentari.
Anche se esistono dei riferimenti normativi che prevedono che gli enti dello Stato sono tenuti a pubblicare i dati in opendata, vorremmo suggerirvi di pubblicare i dati in formato aperto come scelta di governo, perché ciò rende l’amministrazione veramente trasparente attraverso la diffusione delle informazioni relative al suo funzionamento; migliora la qualità della vita dei cittadini attraverso la creazione di servizi sempre più aderenti alle esigenze degli utenti; diventa volano di sviluppo economico attraverso il riuso dei dati in maniera creativa, ad esempio attraverso lo sviluppo di app data-driven.

Sebbene sul sito del progetto OpenARS siano presenti ontologia, endpoint SPARQL ed esempi pronti all’uso, se pensate che il progetto possa essere preso come spunto anche solo per iniziare a costruire un percorso di apertura dei dati dell’ARS, ci teniamo a farvi sapere che la comunità Open Data Sicilia è disponibile a qualsiasi forma di confrontocollaborazione, scambio di idee, così come già avvenuto nei mesi precedenti l’organizzazione del raduno presso i locali ARS.
Per farvi un esempio, un primissimo passo facilmente perseguibile potrebbe essere la pubblicazione, in un’area dedicata del sito istituzionale, di file CSV relativi ai dati dell’attività parlamentare con licenza aperta. In un’ottica democratica dei rapporti tra cittadino e pubblica amministrazione, una maggiore trasparenza offrirebbe la possibilità di un controllo minuzioso dell’attività amministrativa trasformando la pubblica amministrazione in quella “casa di vetro” tanto agognata dagli ideali dell’Open Government.

Fiduciosi in una vostra risposta cogliamo l’occasione per porgervi cordiali saluti.

Biblioteche e bene comune digitale

a cura di Salvatore Fiandaca e Gianni Vitrano

Dall’11 al 16 marzo 2019 la Presidenza del Consiglio dei Ministri, Dipartimento della Funzione Pubblica organizza a livello nazionale la “Settimana dell’Amministrazione aperta” con l’obiettivo di promuovere la cultura e la pratica della trasparenza, della partecipazione e della accountability nelle amministrazioni pubbliche e nella società e accrescere la fiducia dei cittadini nelle istituzioni. Per il Comune di Palermo ha aderito la Biblioteca Comunale presentando il progetto Teca digitale.

Il progetto nasce a fine 2017, quando sono state pubblicate su Flickr le prime scansioni delle cartoline della Collezione fotografica di Enrico Di Benedetto, con illustrazione e foto di Palermo tra il XIX ed il XX secolo, un progetto permette a noi cittadini di fare un meraviglioso viaggio nel tempo (cit.)

Ad oggi sono state pubblicate più di 800 cartoline, ad ognuna è associato a un “corredo informativo” costituito da: titolo, posizione geografica, gallerie di appartenenza, tag, licenza e metadati (non sono dati presenti in tutte le immagini, ma nella grandissima parte), tutte pubblicate con una licenza aperta CC BY-SA 4.0 che ne consente il riuso

Grazie all’uso della licenza CC BY-SA 4.0, alla buona struttura dei metadati e all’analisi di @aborruso, partendo dagli album di Flickr con il  web scraping  ha ottenuto i dati grezzi ottimi per un riuso. Qui maggiori dettagli sulla la tecnica usata per recuperare i dati.

Il riuso dei dati

Nei file CSV ‘grattati’ da Andrea, per ogni immagine, c’è la posizione geografica, che permette di localizzare le cartolinie sul territorio comunale di Palermo, per farlo è stato utilizzato uno dei più usati GIS Desktop Open Source, QGIS.

Utilizzando solo i file CSV è stato possibile creare la mappa e un atlante (cioè una stampa in serie di tutte le foto con tutti i dati disponibili): la mappa è interattiva, cioè al passaggio del mouse, su ogni punto, compare la relativa immagine (vedi screenshot di sopra); oppure è possibile generare un unico atlante di oltre 800 schede, una per ogni cartolina presente nella collezione.

Scheda dell’atlante realizzato cin QGIS

Dati:

Riferimenti

Video demo

Le mappe

Dal progetto QGIS,  con l’ausilo del plugin Qgis2web e un pizzico di conoscenza di HTML abbiamo realizzato la mappa #viaggioneltempo sfruttando il lavoro fatto per un vecchio progetto, l’Atlante Storico, che abbiamo ritenuto essere la base cartografica naturale per il tema trattatto.

#viaggioneltempo

Sempre con QGIS abbiamo ottenuto i file geojson che ci hanno permesso di costruire una mappa dinamica su uMap (altro esempio di riuso)La Cartografia di base utilizzata nella mappa, è la Carta tecnica storica della Soc. An. Ottico Meccanica Italiana e Rilevamenti Aerofotogrammetrici (O.M.I.R.A.) del 1935 di Roma, pubblicata dal Comune di Palermo nel Portale Cartografico, scaricata e riproiettata per realizzare Atlante delle cartografie storiche di Palermo.

Le mappe sono stata inserita nel contenitore PalermoHub di opendatasicilia.it, un contenitore di mappe realizzate/rielaborate da liberi cittadini o da civic hackers prevalentemente sul territorio comunale di Palermo,  non ha alcun intento commerciale, l’unica finalità è mostrare le possibilità di rielaborazione e comunicazione offerte dagli open data o dati pubblici comunali, regionali, nazionali e tutti possono contribuire alla crescita e alla divulgazione.

“T’ansignari e t’appeddiri!”, ti devo insegnare a fare qualcosa e ti devo perdere.

Molto spesso disperdiamo richieste di aiuto (“Come faccio a …”) e le relative preziose risposte in chatsocial network, email tra due persone, ecc..
Sono informazioni che una volta messe in circolo, dopo pochi minuti sono già “perdute”, confinate in spazi ristretti che non si prestano a una condivisione di conoscenza e quasi mai indicizzati dai motori di ricerca.

Allora abbiamo creato uno spazio, un repository GitHub, per mettere a fattore comune scambi di conoscenza/esperienza sui temi che ci piacciono: dati aperti, trasparenza, Linked Open Data, analisi e trasformazione di dati.

Il luogo principe in cui farlo sarà quello delle issue, delle richieste di collaborazione/aiuto. Abbiamo iniziato ad aprirne, e ce ne è di già chiuse e di aperte.

Lo abbiamo chiamato “T’ansignari e t’appeddiri“.

Il nome di questo spazio

T’ansignari e t’appeddiri!“, ti devo insegnare a fare qualcosa e ti devo perdere.

È un proverbio presente in molti dialetti italiani (in Campania ad esempio è T’aggià mbarà e tt’àggia pèrdë!), è un invito asciutto e diretto a chi riceve un insegnamento, affinché lo valorizzi e non lo disperda. È anche e soprattutto un incoraggiamento a prendersi cura del legame tra chi si sta scambiando conoscenza e esperienza.
Un/a nonno/a con sguardo “birichino” e pieno di luce lo dice a un/a nipote, a mo’ di monito, per ricevere indietro due regali: lo sguardo lucente contraccambiato e constatare che l’insegnamento sia stato utile. Anche dopo anni.
Lo dice specialmente quando il/la nipotino/a non applica quanto avrebbe già dovuto apprendere dai suoi avi.

E sarà un monito per chi frequenterà questo spazio 😉

Il galateo

Ci sono delle “buone maniere”, che abbiamo costruito in questi giorni di primo uso:

  • prima di chiedere aiuto, cerca un po’ sul web. Nel 99% dei casi la risposta esiste già ed è quella giusta;
  • prima di chiedere aiuto, dopo che ti sei documentato, fai comunque qualche tentativo per risolvere il tutto in autonomia. Questo ti aiuterà a scrivere in modo molto chiaro un eventuale richiesta di supporto;
  • documenta per bene la tua domanda. Che strumento hai usato, che versione, ecc. e allega (se puoi) uno o più file per poter replicare quanto descritto;
  • fai domande su temi vicini a quelli che esplora la comunità opendatasicilia: i dati aperti, la trasparenza amministrativa, il civic tech e non l’ultima ricetta di “pasta al forno”, la traduzione del Moby Dick che hai letto o Blender;
  • nel titolo della issue per favore inserisci una “etichetta” per classificare i post (ad esempio [scripting] Come fare a rimuovere i duplicati di una tabella);
  • se sei soddisfatto della risposta, sei invitato a rimborsare, creando un testo, una ricetta, che racconti per bene il problema che hai riscontrato e come è possibile risolverlo (vedi sotto);
  • quando rispondi, fornisci gli elementi di base utili a comprendere quanto hai scritto.

Ricette

Le stiamo raccogliendo in questa cartella e speriamo di leggerne presto una tua. Se non sai come si fa, chiedilo con una issue; non appena possibile scriveremo una guida in merito.

L’obiettivo di fondo è quello di trasformare questa raccolta in un testo ipertestuale strutturato.

Note finali

In ultimo un grazie a Andrea,  Ciro, Gianni, Nino e Salvatore, che si sono spesi a dare una prima forma a questo spazio, a viverlo, alimentarlo e sperimentarlo.