Open Doors, Open Mind!
Il New York Times annunciava a febbraio scorso il lancio della nuova strategia Open con cui presentava nytimes.com come una piattaforma di informazioni e news basata sulle TimesTags API aprendo le porte ai metadati.
What’s so great about metadata? Well, you’ve probably heard that “information wants to be free.” But even more than that, information wants to be found. And metadata — data about the data — improves findability.
Per quasi 100 anni, il The New York Times ha curato il proprio thesaurus che consiste di più di un milione di termini organizzati in cinque vocabolari controllati: i soggetti, i nomi di persone, organizzazioni, luoghi geografici e dei titoli di opere dell’ingegno (libri, film, giochi, ecc.) A giugno, durante la settimana dedicata alla Semantic Technology Conference, è stata annucniata l’intenzione di pubblicare il thesaurus del The New York Times sotto una licenza che consentirà alla comunità sia usarlo e contribuire al suo sviluppo. I risultati consentiranno, nel tempo, al NYT di entrare a far parte del linked data cloud.
Evan Sandhaus del New York Times spiega i due modi per taggare i contenuti sia on line che su carta:
There are two types of tagging that go on at the times… Every day, indexers take the paper and go article by article and associate each article with subject keywords. Then they manually summarize it. It’s like a Google list, but in dead tree form.
Another type of tagging we do is… when an article goes from the newsroom to the web, it’s put there by a producer who will augment the article with any number of rich features like images, multimedia… and subject keywords. Unlike the indexers, who do this completely by hand, the producers are assisted in their tagging by an automated classification system which suggests tags to be applied to the data and which are ultimately approved by the producer
Di seguito ecco una slide che illustra come il Times classifica gli incidenti aerei per creare un archivio più intelligente


2 Comments
Noto con piacere che almeno oltreoceano stanno innovando a livello tecnologico
Non è l’unica innovazione. LA semantica nell’ambito dell’indistria delle news è tenuta in alta considerazione e non solo: si passa velocemente alla tecnica. Tra un po’ sarò più dettagliata in merito alla situazione.
Grazie Massimiliano