Archive.org, la memoria storica del web

Internet Archive, raggiungibile all’indirizzo www.archive.org, è una biblioteca digitale senza scopo di lucro, che fornisce accesso pubblico gratuito a collezioni di materiali digitalizzati fra cui siti web, applicazioni, musica, film, video, e libri. La sua collezione, stando alle fonti ufficiali, ha già superato la dimensione di circa 15 petabyte. Lo scopo della fondazione è quello di garantire un accesso permanente a ricercatori, storici, studiosi e a chiunque desideri ricercare e visualizzare materiale raro o di pubblico dominio.

Fondato nel 1996 e con sede a San Francisco, l’Archivio ha ricevuto, col passare del tempo, molte donazioni di dati, a partire da quella proveniente dalla compagnia Alexa, tutte finalizzate a archiviare e preservare la memoria storica del web.

Una delle sezioni più interessanti e visitate del sito è sicuramente la “Wayback Machine”, ovvero un servizio che consente di esplorare l’evoluzione storica di quasi 500 miliardi di pagine web.

archive org

Volete sapere come appariva Yahoo al suo lancio, nel 1996? Qui lo potrete ritrovare: le singole pagine web sono state salvate ed i vari link ipertestuali sono rimasti attivi, garantendo agli utenti un’usabilità totale delle copie dei vecchi siti e dei loro relativi dati – immagini, codici, documenti, ecc. Naturalmente i proprietari dei siti devono concedere l’uso della copia da parte della fondazione, ed è per questo che non è possibile trovare esattamente tutto; la mole di dati si rivela in ogni caso impressionante.

L’altro grande punto di forza dell’Archivio è certamente la sezione libri. La collezione comprende testi digitalizzati di collezioni personali e pubbliche, i cui diritti siano decaduti o siano stati concessi direttamente dagli autori, provenienti da varie biblioteche e istituzioni culturali di tutto il mondo.

L’Internet Archive, sostenuto in questo da fondazioni e privati, collabora con decine di centri di scansione in vari paesi, con un ritmo di digitalizzazione di circa 1000 libri al giorno ed un totale di oltre 5 milioni di libri (la maggior parte in inglese).

Oltre agli archivi web, l’Internet Archive conserva ampie collezioni di differenti media digitali, che sono diventati di dominio pubblico all’interno del territorio degli Stati Uniti o i cui diritti patrimoniali d’autore, ai sensi delle convenzioni internazionali, risultano decaduti – cosa che avviene, salvo alcune eccezioni o casi particolari, dopo 70 anni dal decesso dell’autore.

In alternativa vengono raccolti e archiviati anche i media distribuiti con una licenza che permette la redistribuzione, come i Creative Commons. I media sono organizzati per tipologie (immagini, audio, video, ecc), e in sotto-collezioni di vari criteri.