Biblioteche nel diluvio dei Big Data: prospettive per nuovi servizi tra “data curation” e “open data”

SynthSysDATAdiagram-cmykI Big Data – per ora – hanno solo “sfiorato” il mondo delle biblioteche. Si è trattato  di un “rendezvous” che  lascia però presagire ulteriori sviluppi “rivoluzionari”. L’ingresso pieno di questa nuova tecnologia in Biblioteca potrà, infatti, suscitare nuovi importanti significati con ricadute non soltanto tecnologiche ma anche organizzative. Si profila una sfida in grado di determinare un vero e proprio rivolgimento degli attuali assetti bibliotecari. Si può immaginare che l’impatto dei Big Data possa perfino  spostare il tradizionale baricentro delle biblioteche dalle collezioni ai dati. Questo – probabilmente – comporterebbe un ritorno – nell’organizzazione dei sistemi bibliotecari – a forme più centralizzate (più attrezzate nella  gestione della complessità dei Big Data) con il conseguente declino dei modelli distribuiti basati su biblioteche di medio – piccole dimensioni.

Parallelamente, alla luce di questi scenari, anche il ruolo del bibliotecario sembra destinato a cambiare drasticamente. Già ora,  nei paesi anglosassoni e del nord Europa,  si sta affermando una nuova figura professionale: il “liaison librarian”, ovvero un bibliotecario, che a stretto contatto con il mondo della ricerca universitaria,  svolge attività qualificate di consulenza. Ma, questa nuova definizione, potrebbe presto essere a sua volta scavalcata, da un’altra ancora più nuova anch’essa figlia della rivoluzione dei Big Data: quella di “data librarian”, vale a dire un bibliotecario anche e soprattutto capace di “affrontare” grandi masse di dati maneggiando gli  strumenti della “data curation”.

Al momento, le biblioteche hanno cominciato a misurarsi con i Big Data offrendo supporto per la gestione dei dati della ricerca e progettando piattaforme per l’accesso pubblico agli Open Data. Nel mondo scientifico la crescita dei dati in formato digitale ha assunto da tempo un andamento esponenziale. Per molteplici discipline (astronomia, fisica, climatologia, vulcanologia, medicina,    chimica, matematica ecc..) ormai si parla di “data intensive”. Negli USA, secondo uno studio dell’Università del Tennessee, su oltre 100 biblioteche universitarie, almeno il 40% è impegnato a sviluppare programmi per supportare gli scienziati  nelle procedure di “big data curation”. Tra queste, il sistema bibliotecario John Hopkins dell’Università di Baltimora che supporta il progetto  “Sloan Digital Sky Survey” per la gestione dei Big Data astronomici, oppure “l’UC3 Curation Center” della “California Digital Library” che ha iniziato a fornire servizi d’assistenza con sistema di storage a pagamento, fino alle biblioteche della Bodleian di Oxford che affiancano i ricercatori della prestigiosa università  ad amministrare i petabyte di dati da essi generati. Secondo un’altra indagine effettuata da università austriache e britanniche nel 2015, gli ambiti “big data” dove finora c’è stata più richiesta di supporto alle biblioteche sono quelli riguardanti l’assistenza sul formato dati, le stime per lo storage e le questioni tecniche e legali nelle quali possono trovarsi i ricercatori rispetto al copyright.

James R. Jacobs, bibliotecario di Stanford, sostiene che “le biblioteche per le loro competenze negli standard dei metadati e nelle strategie di conservazione, possono candidarsi a partner fondamentali nei processi di costruzione di sistemi pubblici basati sugli Open (Big) Data”. Mentre, il coordinatore del sistema bibliotecario scientifico dell’Università di New Mexico – William Michener – ha fatto osservare che nessuno meglio delle biblioteche può occuparsi della conservazione dei datasets scientifici generati con finanziamenti pubblici.

Insomma, i dati prodotti con i soldi pubblici devono essere liberamente accessibili ai cittadini, ma non basta essere semplicemente “Open”, i dati per essere davvero utilizzabili, devono anche essere “Intelligently Open”. E qui le biblioteche possono avere un ruolo importante nel rendere “di qualità” i dati, e cioè intellegibili, autentici, affidabili, di rilevanza scientifica, e poi anche “nell’arricchirli” con adeguate descrizioni tramite metadati.

Diverse iniziative sono in campo e vedono sistemi di biblioteche che offrono piattaforme per l’accesso pubblico agli Open Data. Le biblioteche degli Enti locali emiliano – romagnoli raccolgono, organizzano e diffondono dati e in questo modo  promuovono il diritto all’informazione, allo studio e alla cultura dei cittadini. I datasets “open” mettono a disposizione informazioni sulle biblioteche del circuito, sugli archivi storici e su i musei presenti sul territorio provinciale. “Open Data” è anche il progetto delle Biblioteche di Roma. Tramite il portale “Biblio Tu”, sono stati resi disponibili dati che sono la diretta conseguenza dell’operato delle biblioteche sul territorio: servizio di prestito, anagrafica delle sedi, patrimonio documentale. Tutti datasets fruibili per il download e soprattutto per il libero riuso.

Un importante e innovativo progetto di “Open Data” viene anche direttamente dal mondo delle biblioteche: è quello della Library Of Congress che recentemente ha annunciato di aver deciso di rendere “open” e riusabili ben 25 milioni di record bibliografici. Carla Hayden, bibliotecaria della LOC, ha spiegato lo spirito e lo scopo del progetto: “La Library of Congress è un monumento alla conoscenza della nostra nazione, e dobbiamo assicurarci che le porte siano aperte a tutti, non solo fisicamente ma anche digitalmente…rendere accessibili i dati bibliografici del catalogo on line è un grande passo in avanti. Sono impaziente di vedere come le persone utilizzeranno queste informazioni”.

Nel dettaglio, l’iniziativa prevede la messa a disposizione di un enorme dataset che copre 45 anni dell’attività della Biblioteca: dal 1968 al 2014. Ogni record rilasciato contiene una serie di informazioni standardizzate: titolo, autore,  anno pubblicazione, soggetto,  note ecc., e sono dati riguardanti una vasta gamma di  documenti della biblioteca: libri,  file computer, manoscritti, mappe, musica e materiali visivi. Il rilascio del dataset prevede due modalità: accessibilità gratuita per i cittadini mediante il sito data.gov e distribuzione a pagamento in formato MARC solo per grandi clienti commerciali e biblioteche di tutto il mondo.

Infine, sull’importanza innovativa nel riuso di dati bibliografici, Beacher Wiggins – direttore della LOC per le acquisizioni e l’accesso bibliografico – ha sintetizzando il progetto esprimendo un auspicio suggestivo: «Oltre al loro tradizionale valore,  i dati bibliografici rilasciati potranno  essere utilizzati per una vasta gamma di ricerche culturali, storiche e letterarie… da una  più efficiente condivisione delle informazioni alla visualizzazioni e altre possibilità che  possiamo cominciare a prevedere…speriamo che questi dati vengano analizzati da scienziati sociali, analisti di dati, sviluppatori, statistici e tutti coloro che possono fare un lavoro innovativo con grandi set di dati per migliorare l’apprendimento e la formazione di nuove conoscenze “

Questa voce è stata pubblicata in biblioteca digitale, big data, Big Data culturali, big data curation, Datafication, open data e contrassegnata con , , , , , , . Contrassegna il permalink.