Come un libro aperto
Oggi, per la comunità scientifica, si pone il problema della conservazione del sapere in formato digitale. Sapere costituito da documenti accademici e periodici di ricerca nonché da ebooks, che abbandonato il supporto cartaceo è via via migrato verso il supporto elettronico.
E le biblioteche di ricerca che fino ad un po’ di tempo fa raccoglievano e conservavano ordinatamente in volumi sui loro scaffali tutte queste risorse, devono ora misurarsi con la complessa questione della preservazione digitale ed in particolare con le ancor più instabile e volatile garanzia offerta dalle riviste scientifiche, settore ormai praticamente “web based”.
Si tratta di una situazione che pone le biblioteche in una posizione paradossale perché le fa dipendere, per la creazione e il mantenimento delle loro collezioni elettroniche, da editori trasformatisi in “web publisher”. Il rischio che corrono è si ritrovino - proprio loro “geneticamente” destinate alla conservazione - nell’imbarazzante condizione di non essere più sicure di quello che posseggono e quindi nel dover solo sperare che i vari “content provider” assicurino nel tempo l’accesso alle raccolte.
Cosa - e questo è il punto cruciale della questione - sulla quale non v’è alcuna certezza, visto che gli editori dovrebbero accollarsi l’onere, assai dispendioso, di implementare archivi digitali a carattere perpetuo dove immagazzinare copia di tutto il loro pubblicato.
Ma c’è un’innovazione che promette di ribaltare a vantaggio delle biblioteche questo stato cose. E’ nata nei campus dell’Università di Stanford in California, ed è basata su un’idea apparentemente semplice ma nello stesso tempo rivoluzionaria: le biblioteche non devono far altro che continuare a fare quello che hanno sempre fatto, cioè conservare le informazioni per garantirne la trasmissione nel tempo.
Spetta poi alla tecnologia trovare soluzioni ad hoc per fargli esplicare questa loro funzione anche nell’era digitale.
LOCKSS (Lots of Copies Keep Stuff Safe) e CLOCKSS (Controlled Lots of Copies Keep Stuff Safe) sono i nomi delle “soluzioni” venute su dall’ambito californiano. Due progetti (il secondo sviluppo logico del primo) ben presto allargatesi a partner esteri, e che già si collocano tra le iniziative più interessanti a livello internazionale riguardo la conservazione delle risorse scientifiche in formato digitale.
Ciò che li accomuna è una particolare tecnologia di preservazione “open source” attrezzata per far fronte a qualsiasi “calamità” digitale, i bassi costi di partecipazione soprattutto vantaggiosi per le biblioteche sempre alle prese (un po’ in tutto il mondo) con finanziamenti striminziti, l’idea di una governance comunitaria no profit che vede insieme biblioteche ed editori, ma soprattutto il concetto che nell’era della rete - visto che nessuna biblioteca al mondo può farsi più carico (come nelle epoche passate) di garantire la trasmissione del sapere scientifico alle generazioni future - è necessario puntare su grandi network cooperativi tra più biblioteche e archivi. Ciò che invece li differenzia: i contesti – che nell’ambito di una strategia complessiva – vedono LOCKSS concentrarsi sulle biblioteche e CLOCKSS occuparsi anche del versante editori.
“Molte copie rendono il materiale sicuro” recita l’acronimo LOCKSS una volta sciolto (e tradotto). Infatti, al centro del sistema che il progetto propone c’è il concetto di ridondanza, ovvero la caratteristica principe dell’antico modello fisico della conservazione: le tante copie distribuite di un dato documento tra tante biblioteche ha costituito la misura basilare contro la possibilità di perdere l’accesso a quel contenuto.
La community LOCKSS che comprende più di 200 biblioteche appartenenti ad un po’ tutti i paesi del mondo (in maggioranza nordamericane ed europee), ha sviluppato una rete peer-to-peer a struttura ridondante e decentrata. Mentre a livello di singola biblioteca i computer LOCKSS archiviano copie del periodico sottoscritto acquisite dal sito web dell’editore (con cui è stato stipulato in tal senso un accordo), a livello di rete il sistema effettua un continuo controllo in automatico dello stato d’integrità delle copie dei documenti nelle memorie dei partners e qualora un documento risulti mancante o danneggiato parte la richiesta o all’editore oppure alle altre biblioteche che ne possiedono un duplicato.
Dal punto di vista dell’utente finale, l’accesso alle copie preservate può verificarsi quando un editore non è raggiungibile temporaneamente per problemi tecnici o quando la biblioteca non abbia rinnovato l’abbonamento ma mantenga il diritto all’accesso alle annate già pagate (post termination), oppure nel caso limite del fallimento dell’editore.
Nel caso invece di CLOCKSS, il modello di conservazione prevede una rete non solo a “ridondanza” ma anche finalizzata al “data back-up” delle risorse digitali del network. Si tratta di una soluzione nell’ambito delle strategie di preservazione atta a scongiurare un letale nemico dei dati digitali: un improvviso quanto pericoloso “trigger event”.
L’evento imprevisto può assumere l’aspetto di un errore umano, di un attacco informatico, di un guasto tecnico o di un’improvvisa ma prolungata (o definitiva) indisponibilità da parte del fornitore di contenuti. Per far fronte a questi “triggers”, biblioteche (circa 90) ed editori (più di 30) associati nell’ambito del progetto CLOCKSS, hanno puntato – sempre utilizzando tecnologia open source LOCKSS – sull’implementazione di un “dark archive” (archivio nascosto), quale deposito di sicurezza accessibile unicamente nei casi di emergenza quando si tratta di ripristinare l’accesso a contenuti altrimenti irrimediabilmente persi.
Interessante poi il fatto che i contenuti recuperati se “abbandonati e/o orfani” possono diventare (sulla base di un accordo con gli editori) “per sempre” liberamente disponibili. Ritornando alla rete CLOCKSS, l’infrastruttura è organizzata in 12 nodi geografici (che presto dovrebbero diventare 15) distribuiti tra le principali biblioteche di ricerca del mondo (tra cui l’italiana Biblioteca dell’Università Cattolica di Milano), nodi che fungendo ognuno da repository, nel loro insieme, vanno a costituire - anche se fisicamente ubicati in maniera decentrata e delocalizzata - il “dark archive” che virtualmente si configura come luogo unico e ultimo di custodia delle pubblicazioni elettroniche degli editori scientifici. Tra questi il grande editore e distributore digitale Springer, primo ha sottoscrivere un accordo per la conservazione a lungo termine di ebooks scientifici (oltre 32 mila) attraverso CLOCKSS.
La sfida della conservazione dei documenti cartacei è stata alla fine vinta perché affrontata e risolta, nel corso dei tempi, con soluzioni tecniche ed economiche adeguate. Altrettanto bisogna fare con la conservazione digitale ed in particolare con le informazioni scientifiche che sono fondamentali per il futuro delle nostre società. Occorrono le armi delle nuove tecnologie, di progetti innovativi e della sostenibilità economica. LOCKSS e CLOCKSS possono rappresentare importanti risposte che vanno in questa direzione.
Pubblicato su Newton oggi n.16 Giugno 2011
- Cultura Digitale 2003 -
|
|
||||||
|
|
|
|
|||||
|
|
|||||||