titticimmino.com

Social Life in Social Network

 






A Web with a meaning. From XML to RDF

In principio fu HTML, e la pagina Web vide la luce:  il Web 1.0

Poi l’utente si accorse che non gli bastava descrivere semplicemente la pagina web: voleva un linguaggio che gli offrisse la possibilità di descrivere documenti di ogni sorta, entità relate al business, al sociale, ai propri interessi, alle attività individuali e a quelle collettive.

E quindi venne XML, e il tag fece il suo ingresso nel www, consentendo all’utente di descrivere ciò che desiderava ed in modo personalizzato, con la possibilità di estrarre informazioni secondo specifici criteri, di riadattare (più o meno)  ad altri formati, e di averne una visualizzazione in funzione delle capacità del terminale.

Ciascuno di noi ha avuto la possibilità di descrivere se stesso , per esempio:

<xml>

<person>

<name>Titti Cimmino</name>

<occupation>e-Learning Consultant | Educational Trainer</occupation>

<placeOfResidence>Naples</ placeOfResidence>

</person>

</xml>

La flessibilità di questa descrizione contiene però un vulnus: sebbene sia possibile inviare a chiunque il documento contenente questo codice, ciò presuppone che il ricevente conosca gli stessi tag usati,  “occupation” e “placeOfResidence” (  non “work” oppure “address”), e quindi che il mittente abbia comunicato i medesimi al ricevente che potrà quindi interpretare il documento. Inoltre il ricevente sarà costretto a usare lo stesso codice cui convenzionalmente il mittente ha fatto ricorso per usare il file XML inviatogli, altrimenti il suo software non sarà in grado di elaborare il documento che ha ricevuto.

Inoltre, sebbene Titti Cimmino sia stata “descritta” semanticamente con opportuni tag, tutti i documenti che menzionano Titti Cimmino si riferiscono alla stessa persona?

Da qui si deduce quanto sia ridotto il potenziale di condivisione dei dati sul web, pur essendo l’XML già flessibile. Il web è decentralizzato e distribuito e l’XML non definisce alcun meccanismo esplicito per qualificare le relazioni tra documenti.

Semantic Web Solutions.

Il  miglioramento  a partire dall’XML : RDF, uno standard W3C per la descrizione delle risorse.

“If  HTML and the Web made all the online documents look like one huge book, RDF, schema, and inference languages will make all the data in the world look like one huge database”

Tim Berners-Lee, Weaving the Web, 1999

RDF cos’è?

The Resource Description Framework (RDF) is the standard for representing the relationship between URIs and literals (e.g. float, string, date time, etc.)…   RDF is a data model. As such, there exists many serializations (encoding formats) of that model. RDF/XML is not RDF. It is a serialization of RDF. It is smart to, at all costs, avoid learning RDF/XML as it is an unintuitive standard. Other serializations include: N-TRIPLE, N3, TRIX, TRIG…

In sostanza si compone di un Modello che ne descrive una possibile sintassi basata su XML – RDF Model and Syntax (1999 Recommendation) – e di uno Schema – RDF Schema (2000 Candidate Recommendation) – che esprime la sintassi per definire schemi e  vocabolari di metainformazioni.

RDF conserva tutti i vantaggi di XML senza però il vincolo della conoscenza di tag specifici; dal momento che un utente non necessariamente deve conoscere il codice ad hoc per elaborare i propri tag, RDF, essendo destinato ai processi delle macchine, può essere condiviso immediatamente da più macchine e senza l’intrazione umana!

RDF lavora esprimendo dichiarazioni in merito alle risorse: una singola dichiarazione RDF assomiglia ad una tipica espressione strutturata in Soggetto-Predicato-Oggetto. Questa tripla è ciò che solitamente si esprime con RDF Triple (il Modello RDF)

Il soggetto è sempre una risorsa web. In RDF, una risorsa – indirizzo Web, un documento, un’immagine, un file, un servizio, un indirizzo di posta elettronica, ecc -  è rappresentata da un URI. A differenza di un URL , una URI  non viene utilizzata per localizzare le risorse, solo per individuarle (da qui la I per Identifier invece della L per Locator). Un predicato descrive il soggetto . Infine, l’oggetto può essere un’altra risorsa o un semplice costante, possibilmente che rappresenta un numero, stringa o dato.

Titti sta scrivendo un post è una tripla facilmente comprensibile nella grammatica della lingua italiana, ma la sintassi RDF è un po’ meno immediata, perché è destinata ad una macchina allo scopo di  migliorare la leggibilità della stessa.

Ecco uno snippet di RDF che rappresenta la semplice tripla Titti sta scrivendo un post

<RDF:RDF

xmlns:RDF=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”

xmlns:j.0=”http://www.w3.org/2001/XMLSchema#”

xmlns:RDFS=”http://www.w3.org/2000/01/rdf-schema#”

xmlns:RFDExample=”http://titticimmino.com/rdfExample#” >

<RDF:Description RDF:about=”http://titticimmino.com/rdfExample#Titti”>

<RFDExample:isWriting RDF:resource=”http://titticimmino.com/rdfExample#Post

<RDF:type RDF:resource=”http://www.w3.org/2000/01/rdf-schema#Class”/>

</RDF:Description>

<RDF:Description RDF:about=”http://titticimmino.com/rdfExample#Post”>

<RDF:type RDF:resource=”http://www.w3.org/2000/01/rdf-schema#Class”/>

</RDF:Description>

<RDF:Description RDF:about=”http://semanticalley.com/onto/2009/rdfExample#isWriting”>

<RDF:type RDF:resource=”http://www.w3.org/1999/02/22-rdf-syntax-ns#predicate”/>

</RDF:Description>

</RDF:RDF>

Quella sopra scritta è una sequenza a mo’ di esempio di uno Schema RDF.  Quest’ultimo RDF  fornisce un meccanismo di base per un sistema di tipizzazione da utilizzare in modelli RDF. Lo schema è scritto in termini di RDF stesso e definisce un insieme di risorse RDF da usare per descrivere caratteristiche di altre risorse e proprietà RDF.

Oltra ai software utili seganalti  in un post precedente, ecco un validatore e visualizzatore di documenti RDF : http://www.w3.org/RDF/Validator/

Come si legge dal W3C:

RDF and the RDF Schema language were also based on metadata research in the Digital Library community. In particular, RDF adopts a modular approach to metadata that can be considered an implementation of the Warwick Framework

Di questo modello di Framework, RDF è un’evoluzione, venendo così a costituire uno dei punti forti su cui si basa la Dublin Core Metadata Initiative (DCMI). Un’applicazione immediata dell’RDF è nella descrizione delle pagine Web. Le specifiche dell’RDFSchema  forniscono ad un  understandable machine system gli schemi necessari per vocabolari descrittivi, così come il Dublin Core.  RDFSchema consente ai progettisti di specificare classi di tipi, di risorse e proprietà , di trasmettere le descrizioni di tali classi, le relazioni tra queste  proprietà e classi – anche se queste relazioni non sono a inclusione, superando l’XML quindi,  e i vincoli sulle combinazioni consentite di  classi, proprietà e valori. Inoltre a  differenza dell’XML , l’RDF esprime dati di un documento pur non essendo ivi inclusi .

A questo punto si pone una questione sostanziale: la distinzione semantica dei termi usati e l’equivalenza di “concetti” espessi con termini differenti.

Vediamo qualche esempio.

Di fronte ad una frase del genere:

the jaguar eats meat” , ciascuno di noi interpreta

jaguar : animale

eats : mangia – attraverso la bocca

meat : carne come cibo

E se effettuiamo la variazione:

jaguar eats gas“, pure siamo in grado di interpretare:

jaguar : automobile di lusso
eats : consuma – riferito al carburante
gas : carburante.

Una macchina riesce a distinguere i due differenti significati semantici? E quante inferenze è possibile generare?

Dal punto di vista tecnico si tratta di estendere l’RDF con un vocabolario : ecco l’OWL , Web Ontology Language, e cioè un linguaggio che descrive l’insieme delle informazioni , l’ontologia, appunto. L’importanza delle ontologie sta nel fatto che, per avviarci al completo utilizzo di Internet, abbiamo bisogno , nelle nostre ricerche relate riguardanti una tripla, un Soggetto con un predicato ed un Oggetto, di ottenere non (solo) singoli risultati  relativi ai singoli tre elementi (concetti), ma soprattutto il legame tra di essi. E questo legame è espresso mediante l’OWL.

Vedo la nostra comunità come una Global Search Community, e quindi il web semantico diventa sempre più indispensabile, nel campo dell’e-Commerce così come in quello delle scienze e così via.

This entry was posted in intelligenza sociale, knowledge, www and tagged , , , , , , , , , , , , . Bookmark the permalink. Post a comment or leave a trackback: Trackback URL.

2 Comments

  1. Posted September 2, 2009 at 7:46 am | Permalink

    Fantastico articolo!
    Bel lavoro Titti!
    Marco

  2. Posted September 2, 2009 at 7:56 am | Permalink

    Grazie Marco e benvenuto.. e c’è altro! ;-)

2 Trackbacks

  1. [...] pubblicare in formati arbitrari e user-unfriendly, hanno fatto ricorso all’ RDFa, formato che fornisce la struttura di informazione e di significato, con una licenza per consentire la raccolta, raccolta e riutilizzo dei dati da parte di chiunque [...]

  2. [...] usando machine understandable vocabolari, ontologie , facendo ricorso a standard web come RDF , RDFa OWl… I  portali semantici in genere forniscono all’utente finale  due [...]

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Subscribe without commenting

Improve the web with Nofollow Reciprocity.