OpenData, OpenDataGov, Linked Data, Licence: in Italia un po’ di confusione ormai rischia di disseminare informazioni a volte anche poco chiare o sbagliate e a mio avviso con inutile spreco di energie.
Ma andiamo con ordine. Suppongo sia acclarata l’urgenza di comunicare nel modo più efficace su quest’entità curiosamente seducente chiamata “opendata“.
Dacché sembrava infatti scontata la differenza tra dati pubblici e opendata, è venuto fuori uno zibaldone tutto italiano di dati che nella maggior parte sono pubblici ma non opendata.. e ciò che mi costringe ad una riflessione più cauta è stato l’aver preso atto che qualche movimento dal basso stia emergendo ma senza operare i dovuti chiarimenti: dovuti perché pensavo scontata quella differenza di cui sopra.. e invece no.
Sto riferendomi a spaghettiopendata : iniziativa di un gruppo di
cittadini italiani interessati al rilascio di dati pubblici in formato aperto, in modo da renderne facile l’accesso e il riuso (open data). Ci sembra che questa pratica sia utile per alimentare la discussione sulle scelte che ci attendono; rendendo facilmente accessibili informazioni di qualità alta, contribuirà a renderla più razionale, allargata e fondata sui dati.
Non è “formato aperto” quello relativo ad alcuni dataset che spaghettiopendata ha raccolto ad esempio il Conto Annuale RGS (Ragioneria Generale dello Stato) che è in versione pdf oppure on line come pure consultabile on line è l’Archivio storico delle Elezioni .. e del resto avevo già descritto una problematica simile aggiungendo l’ulteriore considerazione che si tratta anche di dati non aggiornati!
Fermo restando che tutta la mia stima va a Matteo Brunati a cui si deve la realizzazione tecnica di spaghettiopendata.org, mi chiedo:
- valeva la pena profondere tutto l’impegno senza precipuamente considerare il nostro it.ckan.net ed eventualmente collaborare con Stefano Costa (Steko), Rufus Pollock e il dream team di ckan.net (che sta dietro a data.gov.uk) per il miglioramento (?) del portale italiano anche dal punto di vista grafico per renderlo anche più “accattivante” (ove mai esistesse questa urgenza, ora!) per poi tendere ad un data.gov.it ufficiale!???
- sarebbe stato il caso di consultare tutti (e non siamo pochi) quelli che sono stati in qualche modo interessati ai dati italiani (senza attributo, così da raccogliere più istanze ed avere una condivisa linea di sviluppo)?
Dal momento che SOD ormai ha raccolto dataset, a mio avviso convergere tali dataset su it.ckan.net è il passo successivo! E benvenuti ai ragazzi di SOD!
Bisogna vedere tutto questo in dettaglio. Bisogna mettere le carte in tavola
(Blaise PASCAL)

6 Comments
[Whoops! Scusa mi sono dimenticato un po' di chiusure di tags. Riposto il commento con il codice, spero, in ordine.]
Grazie della segnalazione del database “intruso” in PDF, che ho girato alla mailing list di SOD (anche se sai che Matteo non la pensa esattamente al tuo stesso modo). Provo anche a abbozzare una risposta alle tue due domande:
Valeva pena profondere tutto l’impegno senza considerare CKAN italiano? Ovviamente no. E infatti Matteo riporta di un primo contatto con uno dei responsabili del CKAN italiano” già il 21 settembre, il giorno stesso della creazione della mailing list (a href=”https://groups.google.com/group/spaghettiopendata/browse_thread/thread/6f69ac20cf23c0bf/aeb843b2bff7fd6b?hl=it&lnk=gst&q=ckan#aeb843b2bff7fd6b”>thread. Le modalità di integrazione con CKAN sono state discusse in mailing list. Si è deciso (il 24 ottobre) di andare online con uno strumento provvisorio, ma già pensato per essere riversato facilmente in CKAN. Una persona si è presa le responsabilità di curare la cosa (thread, a cui partecipavate sia tu che Stefano Costa, quindi un po’ mi stupisco della tua domanda!).
Non sarebbe stato il caso di consultare tutti? Certo che sì, ed è stato fatto. Come? Come si fa in rete, cioè costruendo processi aperti e abilitando l’autoselezione dei partecipanti. Si appende un bel cartello con su scritto “qui ci occupiamo di X, se vi interessa benvenuti”. E noi l’abbiamo fatto: con i post (qui il mio, del 16 settembre), con i social network (questo thread su Friendfeed del 6 settembre, per esempio). E con la mailing list, che è stata tenuta completamente aperta – tanto che tu e Stefano vi siete iscritti.
Buona serata.
1. Se vogliamo fingere di non capire, ok.. ti accontento; se sono stata infelice nell’esprimermi, cerco di rimediare essendo più meridiana. Di dati.piemonte sapevate anzitempo, e dunque anche di it.ckan.net: contattare Steko sarebbe stato il primo passo e non via ff et similia, ma via email direttamente e prima di metter su nient’altro che un duplicato di it.ckan.. E’ un peccato davvero, perché nel gruppo che avete attivato ci sono risorse straordinarie: anche senza dettagliati distinguo, c’è tanto di ciò che è utile.. ma per andare insieme uniti e senza agevolare repliche o deliri di onnipotenza di alcuno, sia chiaro.. per quel che mi riguarda, sono stata invitata quando sod era già pronto per il lancio, tant’è che il vostro problema era principalmente un problema di forma e di formattazione del sito. Se fossi stata contattata quando sod era in nuce, e non già allestito, ti avrei detto quanto leggi sopra. E avrei aggiunto che tra SOD eit.ckan.net avrei optato decisamente per il secondo, pur mantenendo una discussione come avviene grazie al gruppo e all’interno del gruppo: lì esistono le risorse. ckan è un punto di partenza, non di arrivo.
2. Sono d’accordo con Matteo e con quanti ritengono che mostrare i dati che sono rilasciati PUBBLICI e non open debbano avere visibilità, ma per favore non mettiamoli nel ” ….”opendata: non facciamo commistione. Siamo in Italia e già di bailamme c’è ne è tanta, non credi? Avrei fatto altro, e semmai delineerò i dettagli nella seconda parte di questa serie di post.
Buona giornata :)
Tengo a precisare che qui parlo come individuo e non a nome e per conto di Spaghetti Open Data, pertanto tutto ciò che dico può essere usato solo ed esclusivamente contro di me ;)
Capisco il tuo “biasimo” Titti nel giudicare SOD come un “duplicato” inutile e controproducente di CKAN Ita. Così come sottolineare che i dati pubblici non sempre siano aperti, e dunque quelli messi in SOD (in PDF o non in formati aperti) non si possano certamente definire “open”.
Ma è proprio questa contraddizione che dovremmo tenere bene in evidenza, sia per evitare di giudicare SOD come pleonastico, sia per portare all’attenzione del pubblico la grande differenza (ma anche grande dipendenza) che c’è tra i dati “pubblici” e quelli “aperti”: non sempre gli uni implicano gli altri.
Voglio qui richiamare i concetti (che molti di voi già conosceranno) che ci sono dietro due importanti Direttive europee che riguardano i dati digitali: la INSPIRE e la PSI.
INSPIRE è una infrastruttura per l’informazione territoriale che riguarda tutti i dati digitali detenuti da autorità pubbliche, di rilevanza ambientale. Prevede che i suddetti dati vengano resi disponibili da queste in formati aperti, facilmente ricercabili, scaricabili e soprattutto con una struttura standard.
La Direttiva PSI punta parallelamente al riutilizzo dell’informazione nel settore pubblico. Cito testualmente (art. 5): “Gli enti pubblici mettono a disposizione i propri documenti in qualsiasi formato e lingua preesistente, ove possibile e opportuno per via elettronica”. Non c’è dunque obbligo di renderli aperti, e addirittura liberi (ovvero privi di qualunque forma di copyright). E’ qui però che noi facciamo leva: convincere l’autorità pubblica a rilasciare i dati in formati aperti e liberi, costruendo la massa critica dal basso, dai cittadini.
CKAN, così com’è a prima vista e a un utilizzatore medio può sembrare un pò ostico e freddo: non si sa da dove cominciare. Certo, una volta provato a giocarci, le cose diventano via via più chiare e se ne comprende la sua utilità. Ma bisogna riconoscere che un cittadino medio spesso non ha bisogno di sapere dove si trovano dati rigorosamente aperti, ma semplicemente “pubblici”, ovvero raggiungibili e consultabili.
A questo punto, si potrebbe considerare SOD innanzitutto come un catalogo di dati pubblici, prima che aperti e liberi. Certo, comprendo le perplessità di Titti sul fatto che si chiami Spaghetti “Open” Data e che dunque quell’open risulti una forzatura e per certi versi fuorviante. Ma SOD è un movimento di hacktivisti, che ha messo su un progetto: alla fine siamo mossi da entropia. In lista arrivano segnalazioni di fonti e di dati e tool i più disparati, spesso non aperti e nemmeno liberi. Ma prenderne nota vuol dire ritornarci dopo del tempo, per andare magari a bussare a chi li detiene e fargli presente che sarebbe utile, importante e per certi versi vantaggioso per se stessi renderli aperti e liberi. A volte basta banalmente suggerire di pubblicare una tabella non come PDF ma come file Excel (non voglio dire proprio CSV, anche se gli si può insegnare a farlo): basta poco, che ce vò… ;)
Per concludere, SOD potrebbe essere un vero e proprio catalogo di dati pubblici, e mi spingerei a dire che con tale termine non intendo nemmeno “provenienti da pubbliche amministrazioni” ma “pubblicamente disponibili sulla rete”.
Insomma: dati aperti (CKAN) sottoinsieme di dati pubblici (SOD) = public (linkable) and (open) data. Le parentesi indicano che tali caratteristiche possono e devono essere misurate.
Comunque, abbiamo gli stessi obiettivi… liberare i dati!
INSPIRE e Direttiva Europea si riferiscono a OpenGovData e sono indicazioni, come tu sottolinei, di cui debbono tener conto coloro che liberano /pubblicano i dati (su cui naturalmente potremmo aprire altra discussione). Continuo a sostenere che sia il caso di non fare commistione tra il risultato e il dato di partenza.
Se il cittadino ha bisogno di sapere dove sono i dati, di certo non ha bisogno che gli si propini nuovamente l’invenzione della ruota. Piuttosto il cittadino vorrà sapere come utilizzare i dati o che applicazione qualcuno più esperto può tirar fuori per migliorare la qualità della sua vita (sia da cittadino che da privato solamente). Il cittadino medio poi con un po’ di googleate trova quello che (qualcuno vuole, a modo proprio, che) cerca.
Confermo la bailamme verso il gruppo sta derivando: se poi parliamo per massimi sistemi, potremmo creare maxi categorie che fanno un baffo a quelle Kantiane.. E considerando che stai parlando ad una matematica, ho non poche perplessità sulla tua categorizzazione con tanto di etichetta SOD= public (linkable) and (open).. NOi dobbiamo essere onesti: vedere ciò che SOD è in atto, non confonderlo con ciò che potrebbe essere in potenza.
Per il resto, it.ckan.net è il portale di riferimento
Grazie per il tuo pensiero :)
CKAN è e resterà sempre il portale di riferimento per gli open data, non c’è dubbio alcuno.
E voglio fugare ogni fraintendimento riguardo la mia “concettualizzazione”, perciò provo a tradurla: i dati aperti (quelli direttamente utilizzabili per applicazioni e usi diversi) si trovano in CKAN, che è il “portale” grazie al quale trovarli e reperirne i metadati, i dati aperti sono a loro volta un “sottoinsieme” dei dati pubblici (intesi come pubblicamente reperibili) che invece sono reperibili in un “blob” come SOD.
E’ indubbio che ciò sia vero: fatti 100 i dati resi disponibili in rete (public data), il 30% (la butto là) sono in formato aperto (public e open data), il restante 70% rimangono solo “public”.
Arrivo alla sintesi finale: CKAN + SOD = public (linkable) and (open) data. Le parentesi indicano fattori che variano in funzione del dato, ecco perchè li ho definiti misurabili nel precedente commento.
Ognuno dei due progetti ha obiettivi differenti, ma convergenti: catalogare i dati pubblicamente disponibili e tra questi individuare quelli aperti.
Se manterremo la chiarezza su ciò che è “solo” pubblico e ciò che è ANCHE aperto, allora non ci sarà confusione, ma sono sinergia. Nessuno reinventerà la ruota in questo modo.
Buon lavoro…
CKAN resta il mio riferimento. Lo spreco di risrse e di energie è quacosa che caratterizza enormemente lo stivale.
2 Trackbacks
[...] per rispondere a Titti, forse il limite tecnico dei dubbi che condivido appieno è stato il tempo: era importante andare [...]
[...] datagov.it. Di qui, le regole da rispettare anche per i cinguettii, o almeno così sembrava. Nasce spaghettiopendata, a partire da una serie di scambi sempre più frequenti in una mailing list dedicata al tema open [...]