titticimmino.com

Social Life in Social Network

 

rss | entries | comments






OpenData, OpenGov e spaghetti all’italiana (part 2)

Bisogna udire il fragore della battaglia! Scriveva Michel Foucault

La declinazione della trasparenza ha le sue eccezioni, si sa. Altro che fragore! Dati on line, dati consultabili solo via web e solo da parte chi è addentro alle questioni o del primo avventore che, senza alcuna velleità, cerca , googlea, diremmo.. senza riflettere sulla questione eminente che sta alla base della trasparenza e non è il cercare , ma il trovare! E invece siamo ancora alle prese con gli spaghettiopendata che mi sanno tanto di SPAGHETTI CON LE VONGOLE FUJUTEA’MMARE ( e cioè spaghetti finte vongole, cioè senza vongole!) : spaghetti senza opendata! Perché? Perché prima o poi i conti con la richiesta originale dovremo farli! Open Data Signori! Non dati alla bisogna e in tutte le salse!

La linea spaghettiOpenData proprio non riesco a … digerirla!

Tipi di dati e di informazioni  su cui ciascuno dice la sua. Che importa!, Di fatto poi tanto l’ombrello “open data” è sempre aperto! Attenti! Attenti a non farsi scudo con ciò che non è open data, e a maggior ragione su ciò che è solo aperto ma non collegato col resto dei dati stipati in altri database, rendendo , di fatto, le informazioni ( i dati, in prima istanza), non completamente chiare, accontentandoci a metà cioè di cercare ma senza trovare!

Dati, questi sconosciuti, ma anche no! Ecco di seguito l’enciclopedia degli specchi delle svariate possibilità di dati.

dati legally open (opendefinition.org): per cui è consentito il riuso dei dati da parte di chiunque e senza alcuna restrizione, nemmeno di tipo commerciale, che sia senza copyright, che siano usabili per lavori futuri

dati technically open: machine readable non solo disponibile via APIs

dati Open Gov: rilasciati da amminisitrazioni gevernative, non quelli relativi all’argomento di cui essi sono espressione quantitativa

dati socially open: dati rintraccaibili anche in seno al ripettivo contesto e su cui c’è uno scambio di battute, impressioni, valutazioi tra coloro che ri-utilizzano i dati stessi con eventuali feedback.

dati pubblici (accezione italiana): dato detenuto da soggetti pubblici perché raccolto o utilizzato da soggetti pubblici, nell’ambito dei propri fini istituzionali. I soggetti pubblici, in virtù dei loro compiti istituzionali, raccolgono e trattano grandi quantità di informazioni, codificate in forma di dati, sui cittadini, le imprese, le istituzioni, il territorio e i principali fenomeni della vita del paese. La conoscibilità di tali dati è costituita dall’insieme di regole che disciplinano la fruibilità in favore dei soggetti interessati da parte dei soggetti pubblici che li raccolgono e li trattano. La conoscibilità comporta due fondamentali qualità dei dati: la sicurezza, intesa come insieme delle misure tese ad assicurare l’accesso ai soli dati conoscibili a un soggetto interessato, e l’usabilità, intesa come la facilità con cui un soggetto interessato ed abilitato a conoscere il dato riesce ad accedervi con le tecnologie disponibili, tenuto conto della sua situazione fisica, psichica e culturale.
Un dato conoscibile può essere reso noto al soggetto interessato mediante tre modalità di scambio: accesso, comunicazione, diffusione. L’accesso permette al soggetto interessato di fruire direttamente del dato; la comunicazione consiste nel far pervenire il dato ad uno o più destinatari abilitati e predeterminati; la diffusione consiste nel rendere i dati disponibili ad una platea indeterminata di soggetti, anche tramite la loro pubblicazione, in forma tradizionale o su internet. La crescente disponibilità di dati in formato digitale e la diffusione delle tecnologie internet hanno imposto un riesame della problematica relativa alla conoscibilità, a causa dell’aumentata accessibilità, del venir meno di limiti territoriali e della diminuzione del costo. Le nuove tecnologie, peraltro, se da un lato favoriscono la usabilità dei dati, con l’uso di interfacce di comprensione sempre più intuitiva, dall’altro avanzano la questione degli obblighi di protezione per chi li detiene e sollevano problemi di discriminazione tecnologica verso gli utenti e di concorrenza tra la pubblica amministrazione.

L’evoluzione delle tecnologie offre per i dati molte modalità di rappresentazione. I dati, sia quando siano memorizzati ed elaborati con tecniche tradizionali, sia, come si assume sempre nel seguito, quando siano rappresentati in modo da essere trattati direttamente con elaboratori digitali, assumono diverse forme:
1. dati strutturati aventi formato ammesso nei campi ed archivi di una base di dati;
2. documenti, ovvero dati non strutturati, caratterizzati dall’essere espressi in linguaggio naturale.

La locuzione dati pubblici può essere interpretata secondo diverse accezioni:
– dati accessibili pubblicamente: questa definizione fa riferimento all’assenza di requisiti di riservatezza, e riflette quindi un aspetto legato alla legittimità della consultazione da parte di soggetti comunque interessati. Risulta quindi applicabile ad un sottoinsieme dei dati detenuti dai soggetti pubblici (ad esempio: le leggi);
– dati detenuti da un soggetto pubblico: fa riferimento alla natura pubblica del titolare del trattamento (ad esempio: dati anagrafici di persone e imprese) che può eventualmente esserne anche il produttore. È l’accezione adottata dal “Libro verde sull’informazione del settore pubblico nella società dell’informazione” della Commissione Europea;
– dati di interesse di un soggetto pubblico: fa riferimento alla natura pubblica del fruitore nell’interesse della collettività e riguarda informazioni che, anche se detenute da un soggetto privato, devono essere in detreminate condizioni rese accessibili ai soggetti pubblici per il perseguimento di fini istituzionali ( ad esempio: i dati di traccia- mento di contatti telefonici ).

I dati pubblici possono essere classificati secondo diverse caratteristiche. Ecco di seguito alcune di queste:

1. identificabilità : I dati possono essere riferiti a soggetti, persone fisiche o giuridiche, identificati o identificabili, nel qual caso sono dati personali (dati sensibili o no), oppure non essere riconducibili a singole persone fisiche o giuridiche, nel qual caso sono dati anonimi.

2. presenza in registri pubblici o simili: In alcuni casi i dati sono provenienti da pubblici registri, elenchi, atti o documenti conoscibili da chiunque, senza condizioni. Essi sono tenuti o formati da uno o più soggetti pubblici, in virtù di una norma di legge o di regolamento; la norma che è alla base della conoscibilità in questi casi può prevedere particolari modalità di accesso o limiti temporali che vanno rispettati anche in caso di comunicazione o di diffusione dei dati. Il solo fatto di poter rinvenire un dato personale, ad esempio l’indirizzo di posta elettronica, in uno spazio pubblico di internet, non com- porta che esso sia conoscibile da chiunque e quindi non autorizza l’uso libero del dato.

3. aggregazione e generalizzazione: I dati sono detti elementari quando rappresentano un aspetto della realtà non ulteriormente riconducibile, date le ipotesi adottate, ad aspetti più semplici; statistici quando sono il risultato di una elaborazione attraverso funzioni di aggregazione su dati elementari. Un esempio di dato elementare è l’età di una persona; esempi di dato statistico sono il numero di soggetti con quell’età in un territorio specifico e l’età media della popolazione di un comune.
Secondo un diverso processo di astrazione, usualmente detto di generalizzazione, si distinguono i metadati e gli schemi di dati. I metadati sono proprietà di un insieme di dati. Uno schema di dati consiste nella descrizione di un insieme di classi di dati e delle relazioni che intercorrono tra di essi. Ad esempio:
– un quadro di un orario ferroviario è un insieme di dati;
– la proprietà per cui gli orari di arrivo e partenza siano rappresentati mediante due cifre per l’ora e due cifre per il minuto è un metadato;
– la conoscenza della relazione tra treni e città collegate da treni, attraverso gli orari di arrivo e di partenza dei treni in o rispettivamente da tali città, è lo schema dei dati del quadro

4. grado di elaborazione: a) dati grezzi: sono i dati raccolti ma non ancora sottoposti ad elaborazioni significative e che quindi si trovano sostanzialmente nella forma in cui sono stati acquisiti; b) dati di base: sono i dati già sottoposti alle elaborazioni necessarie a renderli elaborabili al di fuori di un singolo sistema o di una singola tecnologia, solitamente da parte di soggetti diversi da quello che li ha raccolti, ad esempio:
– indirizzi postali normalizzati; – nominativi di professionisti iscritti ad un albo; c) dati arricchiti (o elaborati): sono i dati risultanti da operazioni di ricerca e di confronto con informazioni di differente provenienza, ma collegate ad uno stesso fenomeno. Esempi di dati arricchiti sono: – la posizione fiscale di un’impresa come risulta da diverse basi di dati del Ministero dell’economia e finanze; – i dati contenuti nello stato di famiglia di un cittadino; – l’indice dei prezzi al consumo collegato ad una città; – una carta geografica ricavata da dati fotogrammetrici grezzi.

5. utilità per i soggetti interessati ad accedervi: I dati essenziali sono i dati pubblici dei quali i cittadini, le imprese e altri operatori privati devono poter disporre per esercitare i propri diritti. I dati essenziali possono essere sia anonimi, come le norme e molti dati statistici, sia personali (la maggior parte dei dati amministrativi). Esempi di dati essenziali: 1. le leggi e i regolamenti vigenti; 2. i dati statistici nazionali più importanti o necessari per le decisioni individuali o collettive; 3. i dati personali in possesso dei soggetti pubblici e che riguardano il richiedente; 4. le indicazioni necessarie ad usufruire dei servizi erogati da soggetti pubblici e a verificare lo stato dell’iter amministrativo (portali e sportelli di accesso unificati ai servizi, organigrammi, indirizzi postali, numeri di telefono, eccetera).

Si possono avere quattro situazioni distinte per quanto concerne la conoscibilità dei dati detenuti da soggetti pubblici: 1. dati conoscibili da chiunque; 2. dati a conoscibilità circoscritta riservata ad alcuni soggetti pubblici, oppure ad alcune categorie professionali o ad altre particolari categorie di soggetti; 3. dati conoscibili ai sensi dell’articolo 22 della legge n. 241/1990 da parte di chi ha un interesse personale e concreto e per la tutela di situazioni giuridicamente rilevanti; 4. dati conoscibili dal solo soggetto pubblico che li detiene, coperti cioè dal segreto d’ufficio o dal segreto statistico o sottoposti a particolare tutela dalla legge n. 675/99.

La qualità dei dati è una caratteristica desiderata da parte degli utenti. Legate alla conoscibilità sono due qualità: sicurezza e usabilità. Inoltre, è importante che i dati siano aggiornati, che siano esatti, cioè corrispondano in modo corretto (se ciò sia possibile) al fenomeno osservato, ovvero almeno accurati, cioè ne siano una buona approssimazione.

Ma mentre è possibile determinare se i dati siano legally open e technically open in maniera estremamente semplice, come si può determinare il livello di socially open di un dato? D’accordo sul fatto che i dati debbano essere ritrovabili semplicemente da tutti, ma l’aver messo i dati sul sito web di un settore pubblico dell’Amministrazione centrale o locale non basta , è inutile  se poi i dati non vengono ritrovati semplicemente. Perché questo accada è necessario ricorrere a registri pubblici, a cataloghi data gov, a motori di ricerca ottimizzati con elevata possibilità di indiccizazione, management semantico anche a partire da metadati, da microformati, fino a raggiungere il livello di  linked open data.

Le grandi basi di dati gestite da soggetti pubblici, spesso a copertura nazionale, rendono sempre più facile produrre, attraverso semplici elaborazioni, nuovi dati a partire da quelli già disponibili. Tali operazioni possono essere compiute per fini istituzionali all’interno di uno stesso soggetto, oppure sfruttando almeno in parte dati presenti presso altri soggetti. E poi che accade? Questi dati a cosa servono se non sono ri-usabili da tutti?

Non chiamateli opendata se non lo sono! Diciamo piuttosto che qui in Italia si porta avanti la battaglia per la trasparenza, ma se come uno zibaldone raccogliamo tutti i dati, non trinceriamoci dietro la battaglia open data semplicemente perché questo è il trend del momento con buona pace dei cacciatori di followers!!

Diffido sempre da coloro che fanno di un principio o di un diritto semplicemente una bandiera.. perché si sa: le bandiere seguono il vento!



Submit Article: Digg | Del.icio.us | Google | Technorati.

Posted: 23 December, 2010 (11:57) | accesso, business, Education, Environment, piattaforme, Tecnologia, transparency | by: titticimmino


Comments


Comment from Francesca
Time: December 27, 2010, 5:49 pm

Ciao Titti, hai partecipato alla consulta pubblica della commissione europea sulla PSi directive. Adesso è chiusa (scadeva il 30 Novembre) ma spero che tu l’abbia fatta.
Sono d’accordo soprattutto su quanto scrivi negli ultimi paragrafi. sto lavorando ad un progetto sull’open data in europa, appena ho qualche cosa da condividere ti mando qualche link, magari su twitter.


Comment from titticimmino
Time: December 27, 2010, 9:01 pm

Ciao a te, Francesca. Si ho parteipato alla consulta pubblica di cui fui informata anche da qualche esponente della Commissione Europea.
Mi sa che se non ci si mette di preciso intento nello sgomberare il campo da stupidi equivoci che son serviti solo per esaltare qualche azione senza seguito significativo, qui in Italia restiamo appesi.. altro che open data!
Ok. Aspetto tue nuove. Grazie


Comment from Francesca
Time: January 10, 2011, 12:43 am

Ciao Titti, eccomi di nuovo con i link promessi. Mi interesserebbe molto il tuo feedback e tuoi commenti a questo toolkit che ha l’obiettivo di faclitare il riuso degli Open Data da parte degli sviluppatori. In particolare questo è un esempio di GEO data delle scuole elementari Olandesie del codice da usare per l’accesso ai dati per i più comuni linguaggi di sviluppo http://dev.govdata.eu/DataBrowser/nlOpenData/Basisscholen?lang=en#param=NOFILTER–DataView–Results nella sezione Developers . Se ti fai un giro sul sito http://dev.govdata.eu/Developers , puoi vedere le caratteristiche in maggior dettaglio sui formati con cui vengono esposti i dati (JSON; ATOM,..). Sono disponibile, anzi mi piacerebbe, parlarne direttamente, magari in conference call, se ti interessa.
Come avrai capito, lavoro alla MIcrosoft e sono responsbaile delle strategie di Interoperabilità per Western Europe. A presto,


Comment from titticimmino
Time: January 13, 2011, 3:16 pm

Eccomi a replicare, cara Francesca. Il progetto OData poggia le sue fondamenta sul protocollo Open Data, o più semplicemente OData, a sua volta basato sulle specifiche del protocollo standard Atom Publishing; i dati vengono messi in rete e manipolati tramite messaggi HTTP. La lettura dei dati diventa così molto simile all’iscrizione a un feed RSS. In occasione delle Olimpiadi invernali 2010 di Vancouver, è stata progettata un’applicazione su Windows Azure, che sfruttava proprio un catalogo OData.. tipo quello che mi h hai girato via primo link. Per sua natura l’uso di OData è multipiattaforma.. ma c’è qualcosa che a mio avviso non va.
Ogni OData source è un data silo a sé, non connesso con altri data sources. Tecnicamente sarebbe possibile collegare le sorgenti OData (via ATOM) . Invece nel Linked Data Web ciascun data source viene collegato ad ogni altro (come nel Web of Document ogni documento è linkato ad altri via href) in quanto nel mondo Linked Data le proprietà vengono usate per linkare nei dataset (data surce) e in ATOM si otrebbe usare i valori rel.
Ti riporto le parole che M. Hausenblas ha riferito in merito alla questione OData-Linked Data

Imagine a Web (a Web of Documents, if you wish), which is not based on HTML and hyperlinks, but on MS Word documents. The documents are all available on the Internet, so you can download them and consume the content. But after you’re done with a certain document that talks about a book, how do you learn more about it? For example, reviews about the book or where you can purchase it? Maybe the original document mentions that there is some more related information on another server. So you’d need to go there and look for the related bit of information yourself. You see? That’s what the Web is great at – you just click on a hyperlink and it takes you to the document (or section) you’re interested in. All the legwork is taken care of for you through HTML, URIs and HTTP.

Hm, right, but how is this related to OData?

Well, OData feels a bit like the above mentioned scenario, just concerning data. Of course you – well actually rather a software program I guess – can consume it (a single source), but that’s it

Creare Linked Data da OData non sembra una strada promettente; creare OData da Linked Data sembra possibile al fine di sfruttare strumenti come Pivot


Comment from Francesca Di Massimo
Time: January 14, 2011, 3:06 pm

Grazie Titti, sono assolutamente d’accordo che l’interoperabilità tecnica tra i due protocolli è critica per la sostenibilità futura dell’Open Data.
E credo anche che questo non debba frenare le iniziative in corso. Prendi ad esempio la lista di data catalogue che è stata pubblicata ieri dalla Open Knowledge Foundation, se vai a vedere i singoli dataset, molti non sono realmente riutilizzabili dagli sviluppatori. Nella pratica ci sono ancora forti barriere all’upload e al riuso. In generale credo che sia importante che iniziative come LOD, come govdata.eu, come Aporta e altre, diventino sempre più numerose e di qualità superiore (sempre in termini di upload e riuso), per stimolare l’innovazione e far si che gli Open Data realizzino veramente un pezzo di Open government. La settimana prossima dovrei sentire la OKFN a questo proposito se ti interessa, ti faccio sapere.
Ciao e buon lavoro.


Comment from titticimmino
Time: January 14, 2011, 3:42 pm

ok, grazie. In attesa di tue novità, ti rimando anche a linkedopendata.it e che è ben integrato con ckan.net e suppongo, dalle mail che ricevo, anche con it.ckan.net a brave. Appena hai aggiornamenti da Rufus Pollock e compagni fammi sapere.
Un abbraccio

Write a comment

(required)

(required)

Your email address is in safe hands. Relax!


(OpenID Enabled) If you have an OpenID, you may fill it in here. If your OpenID provider
provides a name and email, those values will be used instead of the values here.
Learn more about OpenID or find an OpenID Provider.