Dal MARC a BIBFRAME: la lunga marcia delle biblioteche per integrarsi nel Web

bibframe-and-moving-away-from-marc-10-638E’ una storia con quattro protagonisti: il catalogo delle biblioteche, i formati MARC e BIBFRAME,  il Web. Possiamo farla iniziare nel 2002, quanto il bibliotecario-tecnologo Roy Tennant pubblica il famoso articolo: “Marc Must Die”. Da quel momento, per il mondo delle biblioteche è chiaro che qualcosa sta davvero cambiando: con l’inizio del XXI secolo la rivoluzione del nuovo sistema dell’informazione globale lambisce ormai anche il piccolo  periferico spazio chiuso del catalogo bibliografico.

Fino a quel momento,  i ricercatori del sapere avevano interrogato l’universo bibliografico del libro a stampa tramite Il migliore strumento di intermediazione fino ad allora inventato: il catalogo, ovvero un linguaggio di interrogazione ormai evoluto e dotato di vocabolario, semantica e sintassi proprie. Quando poi, a cominciare dai paesi anglosassoni,  intorno alla metà degli anni ’60 del secolo scorso,   era partito il primo tentativo di automazione del catalogo delle biblioteche: sostanzialmente nulla era cambiato,  a parte l’apparizione – nelle incredule sale delle biblioteche – di  rudimentali terminali collegati a primitive reti telematiche.

Si trattava di dare veste  informatica alla scheda cartacea bibliografica. E la scelta era caduta sul  MARC (Machine Readable Cataloguing), ovvero su un formato per una catalogazione leggibile da una macchina. Un immediato successo, quello del Marc, dovuto alla combinazione di due fattori, entrambi preziosissimi nella paleo-informatica del tempo: capacità di ottimizzare la scarsa (e costosa) memoria di sistema e gestione non “troppo complicata” delle informazioni trasferite su supporto informatico.

In pratica, data questa impostazione, il MARC  appariva come un formato molto strutturato – in etichette da tre cifre – ma soprattutto rigidamente chiuso: figlio di un sistema informativo ancora concettualmente analogico nel quale cominciava a fare il suo ingresso un’informatica – per forza di cose – settoriale, proprietaria, solo per addetti ai lavori. Insomma, ancora lontana anni luce  dall’evoluzione futura, cioè quella di un’informatica fattasi rete globale, aperta, interoperabile, condivisibile.

 Diffusosi il modello d’automazione bibliotecaria e consolidatosi il MARC, ad un certo punto della nostra storia irrompe il terzo protagonista: il Web. Il solco è aperto prima dall’avvento di Internet e poi dall’accelerazione dell’innovazione tecnologica a cavallo tra il XX e XXI secolo. A questo punto, la velocità di cambiamento diventa vertiginosa. Il sistema dell’informazione muta in ecosistema digitale ubiquo e pervasivo. Nello stesso tempo, parte la digitalizzazione massiva dei contenuti sostenuta dal nuovo paradigma della dematerializzazione.

L’innovazione del Web, significa per il catalogo ritrovarsi dietro un muro: apparentemente autosufficiente nel loro reticolo informativo, le descrizioni bibliografiche  formato MARC sono di fatto isolate. Mentre, dall’altra parte del muro, dalla parte del Web, le informazioni si muovono sempre più velocemente, trasversalmente, liberamente. Nello stesso tempo, ad accrescere ancora di più l’immobilismo del catalogo rispetto anche alla dematerializzazione avanzante, contribuisce il fermo immagine del processo catalografico sulla pubblicazione, ovvero sul supporto fisico dell’informazione.

Ritardi e separazione evidenziati pure dalle tecniche di indicizzazione: nell’universo catalografico esclusivamente manuali e con unico riferimento il patrimonio della biblioteca, mentre nel Web il modello è l’indicizzazione automatica globale mutuata dai  motori di ricerca.

La questione per il catalogo è – a questo punto – come “aprirsi” al Web. In altre parole, come far interagire gli OPAC delle biblioteche con le altre risorse della Rete, come scambiare i dati con le comunità virtuali non bibliotecarie. E poi, come andare oltre il principio di “materialità” in base al quale ha finora considerato le proprie risorse documentali. Più precisamente:  come spostare il focus dal supporto al contenuto della descrizione bibliografica, e cioè sull’entità autori, titoli, soggetti, e soprattutto sulle relazioni che legano dinamicamente queste entità.

Per avviare la “rivoluzione copernicana”, nel 1998 l’IFLA (International Federation of Library Associations and Institutions) mette a punto un nuovo modello concettuale per la rappresentazione delle informazioni bibliografiche: l’FRBR (Functional Requirements for Bibliographic Records), basato sulle relazioni intese come strumenti che possono essere utilizzati dall’utente nell’esplorazione dell’universo rappresentato da una bibliografia, così come nell’esplorazione di basi dati bibliografiche residenti nel Web.  Anche se solo concettuale, si tratta di un primo passo importante che mostra ancor di più l’urgenza di superare l’obsolescenza del formato MARC:  ormai diventato l’ostacolo tra le biblioteche e il Web.

Il successivo passaggio fondamentale è la realizzazione del nuovo modello per le descrizioni bibliografiche. Per averlo, bisogna attendere fino al novembre 2012, quanto la Library of Congress rilascia BIBFRAME (Bibliographic Framework). È un grande cambiamento: il risultato è un formato che aspira a rappresentare un ambiente con una struttura dati bibliografica basata su relazioni e costruita tecnologicamente sul Web, e quindi agnostica rispetto alle vecchie regole catalografiche.

Netta distinzione tra i dati sul contenuto concettuale e quelli sulla manifestazione fisica di un oggetto bibliografico, uso di sistemi di controllo d’autorità per identificare univocamente gli elementi informativi, rappresentazione delle relazioni esistenti tra le entità in modo da favorire la navigabilità, sono questi i principi – secondo BIBFRAME – sui quali si deve fondare il futuro della catalogazione bibliografica.

Ma, oltre a ciò, cosa assai importante, l’apertura e la flessibilità di BIBFRAME dovrebbero consentire al mondo bibliotecario di interagire con la più recente ed epocale evoluzione del Web: la sua trasformazione da Web dei documenti a Web dei dati. Per questo, il nuovo formato dovrà essere in grado di separare significato dei dati dalla codifica strutturata degli stessi. Insomma, l’obiettivo è mantenere lo stesso significato (web semantico) anche cambiando formato.

La tecnologia che anche le biblioteche cominciano a utilizzare – tecnologia nata  per pubblicare e collegare i dati rendendoli interpretabili alle macchine – è quella dei Linked Data. Grazie ad essa, i dati collegati si potranno  via via costituire reticoli sempre più grandi a partire da un dominio che a sua volta si collegherà  ad altri domini esterni in un contesto di relazioni sempre più ramificate ed estese.

Si tratta anche per le biblioteche – con l’aiuto di BIBFRAME – di percorrere la strada indicata da Tim Berners-Lee, ovvero:  “a web of things in the world, described by data on the web”. Vale a dire, entrare “in una rete di cose presenti nel mondo, descritta nel web tramite dati”. “Cose del mondo” collegate ad altre “cose del mondo”, nella fattispecie  descrizioni bibliografiche collegate ad altre entità così da arricchire reciprocamente le informazioni ottenute.

Insomma, nell’universo semantico del web del prossimo futuro, BIBFRAME permetterà non solo ai cataloghi delle biblioteche di interagire con la Rete globale, ma anche di offrire un modello capace di ospitare metadati non solo creati da professionisti e da sistemi di automazione, ma anche  e soprattutto da utenti, metadati compresivi di annotazioni, recensioni e informazioni sull’utilizzo delle risorse.

Per questo, nella strutturazione dei dati in BIBFRAME  è stata inserita la classe “annotation” che definisce una gestione flessibile dei dati provenienti da più fonti tradizionali e non tradizionali. Inoltre, tale capacità di combinare informazioni professionali e non, fornirà anche un importante riconoscimento teorico e una definizione tecnica all’apporto degli utenti rendendoli – per la prima volta – parte attiva del processo catalografico.

Questa voce è stata pubblicata in biblioteca digitale, digitalizzazione, futuro del libro, linked data, tecnologie digitali, web semantico e contrassegnata con , , , , , . Contrassegna il permalink.