titticimmino.com

Social Life in Social Network

 






Linked Open Data: cui prodest? Pensieri sparsi su dati.piemonte.it

Linked Open Data,  cui prodest?

La condivisione della conoscenza e in particolare gli open data sono  una preziosa risorsa per la società, ma avere un sito web o pubblicare  una relazione on-line potrebbe non essere sufficiente per rispondere alle attese di apertura di questo momento.
Il valore dei dati non dipende solo dal loro ambito, ma anche dal formato in cui l’informazione  che essi trasportano è condivisa. Il formato determina il valore della risorsa nella misura in cui il pubblico può sfruttarla per l’analisi e il riutilizzo..

I dati devono essere pubblicati proattivamente in un formato machine-processable in modo che l’utente possa ordinare, ricercare e trasformare le informazioni  per i suoi obiettivi. Quando parliamo di benefici relativi ad un’informazione, solitamente pensiamo all’uomo, eppure v’è un beneficio anche per la macchina: questa, infatti, svolge un ruolo fondamentale sulle nostre capacità di consumare informazioni. E non mi riferisco all’effetto domino che la macchina ha avuto e ha sull’incremento del consumo delle informazioni, dovuto all’abbattimento dei costi di distribuzione. Possiamo riferirci per esempio all’effetto della ricerca di informazioni sul web, oppure all’ordinamento in un foglio di calcolo delle spese, come pure alla rappresentazione grafica delle informazioni, il visualdata. Ma un computer non può eseguire le operazioni sopra tirate in ballo con ogni qualsivoglia formato di file. Le informazioni devono essere strutturate: pensiamo alla necessità di ordinare delle informazioni in maniera temporale o anche spaziale: una macchina può mantenere un elenco cronologico di una serie di informazioni solo se il file è redatto con un formato di data ad hoc. Una relazione che sia scritta in formato machine-processable in grado per esempio di tenere traccia cronologica di una serie di informazioni/eventi permette l’analisi di queste/i a supporto di una ottimizzazione delle decisioni, permette il controllo dell’evoluzione dello stato dell’arte della materia oggetto della relazione, educando in modo sostenibile alla misurazione e alla valutazione anche del processo, non solo dei risultati! E che dire della possibilità che la macchina avrebbe di poter processare il file anche in base alle coordinate geospaziali? Linkando infatti opportuni dati geospaziali si potrebbero avere ulteriori informazioni sul percorso stradale più efficiente o sui parcheggi limitrofi alla zona in evidenza… Linked Open Data: l’enciclopedia degli specchi delle possibilità, se solo si ri-usassero i dati in formato adatto!

Dunque abbiamo bisogno di dati aperti e anche  linked.  La geolocalizzazione è un esempio di opportunità che i LOD offrono: sviluppo sostenibile dell’ambiente, sicurezza, salute, educazione, sono alcuni degli ambiti di utulizzo. Dal punto di vista medico, si potrebbero correlare i dati sulla qualità dell’aria e l’incidenza dei problemi respiratori di abitanti in una determinata area;  da una consulenza ambientale si potrebbe valutare l’entità dell’impatto ambientale che una struttura (ponte, autostrada) avrebbe sull’habitat .

E perché non aggiungere alla geolocalizzazione dei servizi anche dati relativi alla qualità degli stessi?

Un esempio di applicazioni web a tal proposito è il sito eatsure.ca che, come si comprende,  mostra su una mappa interattiva, l’elenco georeferenziato dei ristoranti con unità di informazioni relative alle ispezioni  sulla qualità di cibo e strutture, di cui sono stati oggetto.

Date uno sguardo alle figure in basso

eatsure1

Cliccando, ecco i dettagli:

eatsure2

Un evidente sapiente ri-utilizzo di dati.piemonte del Commercio, di recente rilasciati, no?

I dati.pimeonte  sono il primo esempio di open data a livello regionale in Italia, e per ora unico. Sono dati pubblicati in CSV, ma tale formato non basta per il riuso degli stessi.

Scienziati, ricercatori, analisti, economisti richiedono i dati alla rinfusa, e che siano scaricabili, richiedono l’accesso per la lettura ottica dei dati, per poter combinarli con altri data set. Il CSV risponde a questi bisogni ma non in modo adeguato. I dati dovrebbero essere offerti in forma più strutturata, per esempio in XML e JSON.

I programmatori per la creazione di applicazioni (di civic apps), raramente vogliono dati di massa in quanto in tal caso si richiederebbe  loro di sviluppare processi e sistemi di storage di un database per la conservazione dei dati fino ad oggi. I programmatori preferiscono di gran lunga open data  APIs , che puntano a una fonte di dati  in tempo reale. Le APIs dovrebbe offrire al programmatore la flessibilità della richiesta su come i dati vengono restituiti, per dati di esempio in JSON, XML o CSV o anche come open linked data in RDF.

La categoria dei cittadini non tecnicamente esperti, ma interessati, annovera casualmente utenti che non  hanno interesse a scaricare un csv contenente centinaia o migliaia di dati in elenco: essi si limitano ad effettuare la ricerca attraverso il set di dati per vedere se un dato per loro rilevante è presente o meno, oppure  vogliono ordinare il set in base ad un certo indicatore (frequenza di partecipanti, di iscritti, di assicurati, di visitatori etc). Le esigenze di questo gruppo sono più soddisfatte quando i dati vengono resi disponibili online in un ordinamento coerente, o scaricabili ma in un formato interattivo che permette la ricerca, il filtraggio e la visualizzazione dei dati. Il download di una massa di dati in CSV costituisce una barriera di accesso inutile per una significativa percentuale di cittadini.

I vantaggi della scelta di un formato opportuno sono visibili non solo per il consumatore, a qualunque categoria egli appartenga, ma anche per chi pubblica i dati. Ci sono un gran numero di dispositivi, macchine, programmi e siti web attraverso cui  le persone potranno, direttamente e indirettamente consumare e utilizzare i dati del governo. Più i governi rendono più facile collegare, incorporare, condividere e socializzare i propri dati in questi dispositivi, macchine, programmi e siti web,  più in generale le persone avranno accesso ai dati – forse senza nemmeno saperlo. La pubblicazione tramite CSV riduce la probabilità che i  dati siano scoperti o condivisi; che la gente discuta, collabori o riusi  i vostri dati, oppure che la gente crei visualizzazioni – tabelle, grafici e cartine, una volta che il CSV è stato scaricato, cosa succede? Nessuno lo sa. Non sarebbe interessante per il data publisher sapere da chi, come e dove i propri dati vengono utilizzati? Questo è l’anello mancante dell’ impegno civico! Certo, si può vedere il numero di pagine viste e contare il numero di download, ma questo è tutto ciò che si sa. Non è possibile misurare una qualsiasi delle attività indirette. Quante volte, i dati sono stati twittati? Quante volte si è discusso su Facebook? Quante volte sono stati integrati i dati su tutti i tipi di siti web e blog su Internet? Quante applicazioni li stanno incorporando?

Per non parlare del risparmio  sui costi. Ci sono costi reali associati alla condivisione dei dati pubblici. Due dei costi diretti sono il costo dello storage e il costo della banda per fornire i dati. Quando un’agenzia pubblica un CSV, essa sostiene il costo di trasmissione per consegnare l’intero file a tutti coloro che lo scaricano, anche se dopo il download e aver trovato il valore richiesto, poi gettano via il file. Consentendo ai consumatori di accedere a dati selettivamente, solo ai record che vogliono, si riduce la quantità di dati trasferiti, riducendo i costi di banda. Come si può permettere alle persone di scegliere in modo selettivo i registri? L’attivazione di API consente applicazioni, widget e controlli,  fornendo lo stream  di dati in piccoli chunks o in risposta a esplicite richieste di ricerca o filtri.

I dati pubblici devono essere online, interattivi, integrabile e linkabili.

E non dimenticare che:
The Best Thing to do with Your Data will be thought of by Someone Else (The Many Minds Principle).

Cui prodest scelus, is fecit!

This entry was posted in Education, Environment, Tecnologia, accesso, connecting, knowledge, transparency and tagged , , . Bookmark the permalink. Post a comment or leave a trackback: Trackback URL.

2 Comments

  1. Posted July 27, 2010 at 2:58 pm | Permalink

    ciao,
    ho aperto un blog ed un gruppo su linkedin per parlare di analisid i dati
    ho postato il link a questo tuo articolo
    se ti va di visitarci e seguirci ecco i link

    http://analisididati.blogspot.com/

    http://www.linkedin.com/groups?mostPopular=&gid=3225522

    grazie, ciao!
    AM

  2. Posted July 27, 2010 at 7:13 pm | Permalink

    ciao a te , Anna Maria.
    Lieta di questa incursione: trovo i tuoi spunti interessanti e quanto mai attuali nell’ambito di questa sfida italiana al Linked Open Data. Volentieri prendo parte alla discussione.
    Grazie a te
    :)

5 Trackbacks

  1. [...] fare qualche riflessione più approfondita sul tema degli Open Linked Data, come fa Titti Cimmino in questo post. Salva o condividi il post come [...]

  2. [...] anche implicite e nascoste tra i dati? Non basta di certo averli in PDF, nè in un formato CSV… come dice anche Titti, d’altronde: Citazione I dati pubblici devono essere online, interattivi, integrabili e [...]

  3. [...] Linked Open Data: cui prodest? [...]

  4. By www.blog-news.it on March 10, 2011 at 8:40 pm

    Linked Open Data: cui prodest? …

    La condivisione della conoscenza e in particolare gli open data sono una preziosa risorsa per la società, ma avere un sito web o pubblicare una relazione on-line potrebbe non essere sufficiente per rispondere alle attese di apertura di questo momento…

  5. [...] Come altre volte sottolineato,la categoria dei cittadini non tecnicamente esperti, ma interessati, annovera casualmente utenti che non  hanno interesse a scaricare un csv contenente centinaia o migliaia di dati in elenco: essi si limitano ad effettuare la ricerca attraverso il set di dati per vedere se un dato per loro rilevante è presente o meno, oppure  vogliono ordinare il set in base ad un certo indicatore (frequenza di partecipanti, di iscritti, di assicurati, di visitatori etc). Le esigenze di questo gruppo sono più soddisfatte quando i dati vengono resi disponibili online in un ordinamento coerente, o scaricabili ma in un formato interattivo che permette la ricerca, il filtraggio e la visualizzazione dei dati. Il download di una massa di dati in CSV costituisce una barriera di accesso inutile per una significativa percentuale di cittadini. [...]

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Subscribe without commenting

Improve the web with Nofollow Reciprocity.