Aggregatori di dati culturali, linked open data e prospettive per la ricerca e contestualizzazione dell’informazione

Un’opportunità strategica importante per il settore culturale può essere rappresentata dall’incrocio di grandi quantità di dati mediante l’annunciato diffondersi di web semantico e linked data. Ma, mentre i tempi d’acquisizione delle nuove tecnologie del web sono ancora tutti da sperimentare, è invece tangibile la disponibilità di importanti dataset del patrimonio culturale. Infatti, grazie a diverse organizzazioni che hanno implementato piattaforme ad hoc chiamate “aggregatori”, esistono già ora rilevanti concentrazioni di dati in fase incrementale.

In particolare, a livello nazionale spicca “CulturaItalia” che a sua volta fa riferimento – per l’ambito europeo – al grande aggregatore “Europeana”. La piattaforma “CulturaItalia”, per ora conta oltre 2 milioni di dati provenienti da circa 30 istituzioni culturali di primo piano, tra cui la Galleria Nazionale d’Arte Moderna, il Polo museale fiorentino, l’Accademia di Santa Cecilia, l’Archivio fotografico Alinari, la Biblioteca del Senato, l’Istituto Luce ecc. Mentre “Europeana”, che invece si propone anche come portale multilingua aggregando 29 paesi, raccoglie dati da più di 2000 tra aggregatori pubblici, privati ed enti – di questi per la maggior parte biblioteche, archivi e musei – e attualmente conta nel suo repository quasi 26 milioni di dati.

Si tratta di piattaforme – tecnologicamente progettate – per realizzare la massima interoperabilità oggi possibile tra i dati. Sistemi aperti, basati sui principali standard internazionali (Dublin Core, OAI-PMH, XML ecc.) è dotati di “data model” in grado di processare i flussi dei dati provenienti dai fornitori. “Open” – altro aspetto fondamentale – anche dal punto di vista del copyright. Sia “CulturaItalia” che “Europeana” applicano, infatti, sui dati raccolti la licenza “Creative Commons 1.0 Public Domain Dedication” che in pratica corrisponde a una dichiarazione di rinuncia ai diritti con applicazione universale. In più, ai fornitori dell’aggregatore europeo è richiesto di sottoscrivere l’accordo DEA (European Data Exchange Agreement) sempre basato su licenza CCO 1.0 Public Domain, che permette a chiunque di utilizzare i metadati poi pubblicati da Europeana per qualunque scopo, compresi scopi commerciali.

Inoltre, queste piattaforme, in linea con la filosofia “open” e con le recenti normative italiane ed europee sull’uso aperto dei dati pubblici, stanno lavorando per incentivare uso e sviluppo dei LOD (Linked Open Data). In particolare, Europeana già da tempo è impegnata nella sperimentazione, e pubblica i metadati sottoforma di LOD. Si tratta di “dati grezzi” pubblicati in formato RDF (Resource Description Framework) con licenza aperta (accordo DEA) e arricchiti semanticamente con diverse modalità: per i luoghi mediante il database geografico “GeoNames”, per i concetti con il thesaurus “Gemet”, per le persone utilizzando “Dbpedia”.

La progressiva messa e disposizione di questi “big data” della cultura con loro pubblicazione sotto forma di LOD, può aprire interessanti prospettive non solo nell’ambito del riutilizzo commerciale con ricaduta in vari settori contigui e no a quello culturale a cominciare dalle applicazioni per il turismo, ma anche e soprattutto può determinare una vera e propria “rivoluzione” nel trattamento delle informazioni, nella gestione delle conoscenze. E proprio le biblioteche – da questo punto di vista – possono cogliere una opportunità con l’avvento del web semantico.

Oggi, milioni e milioni di dati bibliografici conservati negli OPAC delle biblioteche di tutto il mondo, sono in pratica tagliati fuori dal web in quanto creati e registrati con un formato chiuso e obsoleto: il MARC. Il W3C – organizzazione internazionale che ha come scopo lo sviluppo del web – già da qualche anno ha prodotto un rapporto stimolante per il mondo delle biblioteche: Library Linked Data Incubator Group, dove si sostiene la fondamentale importanza dei collegamenti tra dati bibliografici e dati della rete. Secondo il W3C non deve più esserci distinzione tra i dati. Obiettivo: nel web devono esistere solo dati condivisibili, modulari, riutilizzabili, la cui realizzazione richiede però una interoperabilità totale: non solo tra biblioteche, musei, archivi ecc. ma soprattutto tra silos culturali e l’esterno, il web dei dati.

La disponibilità di grandi dataset del patrimonio culturale e loro sfruttamento grazie ai Linked Open Data, può determinare un potenziale innovativo nella circolazione del sapere. Già segni ci sono e riguardano – in ambito bibliotecario ma non solo – l’estensione delle capacità di ricerca e la contestualizzazione dell’informazione. La possibilità – grazie ai linked data – di creare nuovi collegamenti tra conoscenze durante i processi informativi significa – in pratica – lavorare per far interagire i cataloghi delle biblioteche (OPAC) con il “web dei dati” creando in questo modo un dinamico “contesto esteso” .

Già oggi, ad esempio, l’Archivio Nazionale OlandeseMapit1418.nl” nel mettere a disposizione dei propri utenti foto sulla prima guerra mondiale – riguardanti trincee, devastazioni, azioni militari ecc.- scattate però in luoghi spesso sconosciuti, chiede ai propri utenti, che ne riconoscano alcuni, di trasferire mediante una mappa interattiva le foto nella posizione appropriata. Il tutto possibile grazie all’incrocio dei Linked Open Data.

Altro esempio interessante è quello offerto dalla Bibliotheque Nationale de France, che nel suo http://data.bnf.fr/ crea – a partire da un documento che può essere un libro – pagine web dinamiche che presentano collegamenti a immagini, film, testimonianze sonore, risorse multimediali, collegamenti esterni relative al soggetto cercato. Sulla stessa linea è l’Open Library – biblioteca universale legata a Internet Archive che aggrega dati bibliografici di oltre 20 milioni di libri provenienti da grandi fornitori mondiali quali biblioteche, editori, librari ecc. – la quale, non a caso, afferma che è parte della propria mission realizzare che ad “ogni entità corrisponda una pagina web”.

Questa voce è stata pubblicata in big data, linked data, linked open data, web semantico e contrassegnata con , , , , , , , , , , , , , . Contrassegna il permalink.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *