titticimmino.com

Social Life in Social Network

 

rss | entries | comments






Linked Open Data: cui prodest? Pensieri sparsi su dati.piemonte.it

Linked Open Data,  cui prodest?

La condivisione della conoscenza e in particolare gli open data sono  una preziosa risorsa per la società, ma avere un sito web o pubblicare  una relazione on-line potrebbe non essere sufficiente per rispondere alle attese di apertura di questo momento.
Il valore dei dati non dipende solo dal loro ambito, ma anche dal formato in cui l’informazione  che essi trasportano è condivisa. Il formato determina il valore della risorsa nella misura in cui il pubblico può sfruttarla per l’analisi e il riutilizzo..

I dati devono essere pubblicati proattivamente in un formato machine-processable in modo che l’utente possa ordinare, ricercare e trasformare le informazioni  per i suoi obiettivi. Quando parliamo di benefici relativi ad un’informazione, solitamente pensiamo all’uomo, eppure v’è un beneficio anche per la macchina: questa, infatti, svolge un ruolo fondamentale sulle nostre capacità di consumare informazioni. E non mi riferisco all’effetto domino che la macchina ha avuto e ha sull’incremento del consumo delle informazioni, dovuto all’abbattimento dei costi di distribuzione. Possiamo riferirci per esempio all’effetto della ricerca di informazioni sul web, oppure all’ordinamento in un foglio di calcolo delle spese, come pure alla rappresentazione grafica delle informazioni, il visualdata. Ma un computer non può eseguire le operazioni sopra tirate in ballo con ogni qualsivoglia formato di file. Le informazioni devono essere strutturate: pensiamo alla necessità di ordinare delle informazioni in maniera temporale o anche spaziale: una macchina può mantenere un elenco cronologico di una serie di informazioni solo se il file è redatto con un formato di data ad hoc. Una relazione che sia scritta in formato machine-processable in grado per esempio di tenere traccia cronologica di una serie di informazioni/eventi permette l’analisi di queste/i a supporto di una ottimizzazione delle decisioni, permette il controllo dell’evoluzione dello stato dell’arte della materia oggetto della relazione, educando in modo sostenibile alla misurazione e alla valutazione anche del processo, non solo dei risultati! E che dire della possibilità che la macchina avrebbe di poter processare il file anche in base alle coordinate geospaziali? Linkando infatti opportuni dati geospaziali si potrebbero avere ulteriori informazioni sul percorso stradale più efficiente o sui parcheggi limitrofi alla zona in evidenza… Linked Open Data: l’enciclopedia degli specchi delle possibilità, se solo si ri-usassero i dati in formato adatto!

Dunque abbiamo bisogno di dati aperti e anche  linked.  La geolocalizzazione è un esempio di opportunità che i LOD offrono: sviluppo sostenibile dell’ambiente, sicurezza, salute, educazione, sono alcuni degli ambiti di utulizzo. Dal punto di vista medico, si potrebbero correlare i dati sulla qualità dell’aria e l’incidenza dei problemi respiratori di abitanti in una determinata area;  da una consulenza ambientale si potrebbe valutare l’entità dell’impatto ambientale che una struttura (ponte, autostrada) avrebbe sull’habitat .

E perché non aggiungere alla geolocalizzazione dei servizi anche dati relativi alla qualità degli stessi?

Un esempio di applicazioni web a tal proposito è il sito eatsure.ca che, come si comprende,  mostra su una mappa interattiva, l’elenco georeferenziato dei ristoranti con unità di informazioni relative alle ispezioni  sulla qualità di cibo e strutture, di cui sono stati oggetto.

Date uno sguardo alle figure in basso

eatsure1

Cliccando, ecco i dettagli:

eatsure2

Un evidente sapiente ri-utilizzo di dati.piemonte del Commercio, di recente rilasciati, no?

I dati.pimeonte  sono il primo esempio di open data a livello regionale in Italia, e per ora unico. Sono dati pubblicati in CSV, ma tale formato non basta per il riuso degli stessi.

Scienziati, ricercatori, analisti, economisti richiedono i dati alla rinfusa, e che siano scaricabili, richiedono l’accesso per la lettura ottica dei dati, per poter combinarli con altri data set. Il CSV risponde a questi bisogni ma non in modo adeguato. I dati dovrebbero essere offerti in forma più strutturata, per esempio in XML e JSON.

I programmatori per la creazione di applicazioni (di civic apps), raramente vogliono dati di massa in quanto in tal caso si richiederebbe  loro di sviluppare processi e sistemi di storage di un database per la conservazione dei dati fino ad oggi. I programmatori preferiscono di gran lunga open data  APIs , che puntano a una fonte di dati  in tempo reale. Le APIs dovrebbe offrire al programmatore la flessibilità della richiesta su come i dati vengono restituiti, per dati di esempio in JSON, XML o CSV o anche come open linked data in RDF.

La categoria dei cittadini non tecnicamente esperti, ma interessati, annovera casualmente utenti che non  hanno interesse a scaricare un csv contenente centinaia o migliaia di dati in elenco: essi si limitano ad effettuare la ricerca attraverso il set di dati per vedere se un dato per loro rilevante è presente o meno, oppure  vogliono ordinare il set in base ad un certo indicatore (frequenza di partecipanti, di iscritti, di assicurati, di visitatori etc). Le esigenze di questo gruppo sono più soddisfatte quando i dati vengono resi disponibili online in un ordinamento coerente, o scaricabili ma in un formato interattivo che permette la ricerca, il filtraggio e la visualizzazione dei dati. Il download di una massa di dati in CSV costituisce una barriera di accesso inutile per una significativa percentuale di cittadini.

I vantaggi della scelta di un formato opportuno sono visibili non solo per il consumatore, a qualunque categoria egli appartenga, ma anche per chi pubblica i dati. Ci sono un gran numero di dispositivi, macchine, programmi e siti web attraverso cui  le persone potranno, direttamente e indirettamente consumare e utilizzare i dati del governo. Più i governi rendono più facile collegare, incorporare, condividere e socializzare i propri dati in questi dispositivi, macchine, programmi e siti web,  più in generale le persone avranno accesso ai dati – forse senza nemmeno saperlo. La pubblicazione tramite CSV riduce la probabilità che i  dati siano scoperti o condivisi; che la gente discuta, collabori o riusi  i vostri dati, oppure che la gente crei visualizzazioni – tabelle, grafici e cartine, una volta che il CSV è stato scaricato, cosa succede? Nessuno lo sa. Non sarebbe interessante per il data publisher sapere da chi, come e dove i propri dati vengono utilizzati? Questo è l’anello mancante dell’ impegno civico! Certo, si può vedere il numero di pagine viste e contare il numero di download, ma questo è tutto ciò che si sa. Non è possibile misurare una qualsiasi delle attività indirette. Quante volte, i dati sono stati twittati? Quante volte si è discusso su Facebook? Quante volte sono stati integrati i dati su tutti i tipi di siti web e blog su Internet? Quante applicazioni li stanno incorporando?

Per non parlare del risparmio  sui costi. Ci sono costi reali associati alla condivisione dei dati pubblici. Due dei costi diretti sono il costo dello storage e il costo della banda per fornire i dati. Quando un’agenzia pubblica un CSV, essa sostiene il costo di trasmissione per consegnare l’intero file a tutti coloro che lo scaricano, anche se dopo il download e aver trovato il valore richiesto, poi gettano via il file. Consentendo ai consumatori di accedere a dati selettivamente, solo ai record che vogliono, si riduce la quantità di dati trasferiti, riducendo i costi di banda. Come si può permettere alle persone di scegliere in modo selettivo i registri? L’attivazione di API consente applicazioni, widget e controlli,  fornendo lo stream  di dati in piccoli chunks o in risposta a esplicite richieste di ricerca o filtri.

I dati pubblici devono essere online, interattivi, integrabile e linkabili.

E non dimenticare che:
The Best Thing to do with Your Data will be thought of by Someone Else (The Many Minds Principle).

Cui prodest scelus, is fecit!



Submit Article: Digg | Del.icio.us | Google | Technorati.

Posted: 27 July, 2010 (09:13) | accesso, connecting, Education, Environment, knowledge, Tecnologia, transparency | by: titticimmino


Comments


Pingback from Big Data. I Said, BIG Data. Ooooh, and Aaah | Infoservi.it
Time: July 27, 2010, 9:36 am

[…] fare qualche riflessione più approfondita sul tema degli Open Linked Data, come fa Titti Cimmino in questo post. Salva o condividi il post come […]


Comment from anna maria simonini
Time: July 27, 2010, 2:58 pm

ciao,
ho aperto un blog ed un gruppo su linkedin per parlare di analisid i dati
ho postato il link a questo tuo articolo
se ti va di visitarci e seguirci ecco i link

http://analisididati.blogspot.com/

http://www.linkedin.com/groups?mostPopular=&gid=3225522

grazie, ciao!
AM


Comment from titticimmino
Time: July 27, 2010, 7:13 pm

ciao a te , Anna Maria.
Lieta di questa incursione: trovo i tuoi spunti interessanti e quanto mai attuali nell’ambito di questa sfida italiana al Linked Open Data. Volentieri prendo parte alla discussione.
Grazie a te
:)


Pingback from Open Data in Italia: dati utili e dati aperti bastano per una reale trasparenza? « YBlog
Time: September 13, 2010, 12:04 pm

[…] anche implicite e nascoste tra i dati? Non basta di certo averli in PDF, nè in un formato CSV… come dice anche Titti, d’altronde: Citazione I dati pubblici devono essere online, interattivi, integrabili e […]


Pingback from Linked Open Data: perché solo Open data non basta, neppure in Italia. /  titticimmino.com
Time: December 24, 2010, 9:32 am

[…] Linked Open Data: cui prodest? […]


Trackback from www.blog-news.it
Time: March 10, 2011, 8:40 pm

Linked Open Data: cui prodest? …

La condivisione della conoscenza e in particolare gli open data sono una preziosa risorsa per la società, ma avere un sito web o pubblicare una relazione on-line potrebbe non essere sufficiente per rispondere alle attese di apertura di questo momento…

Write a comment

(required)

(required)

Your email address is in safe hands. Relax!


(OpenID Enabled) If you have an OpenID, you may fill it in here. If your OpenID provider
provides a name and email, those values will be used instead of the values here.
Learn more about OpenID or find an OpenID Provider.