Internet Archive (noto anche come Archive.org per via del nome del dominio, oppure come “Wayback Machine” dal nome dell’interfaccia applicata) è una biblioteca online no profit nata con lo scopo di preservare la conoscenza e l’accesso a molti tipi di risorse come siti web, file audio, immagini, video, libri digitali.
Cos’è Internet Archive
Internet Archive è una vera e propria organizzazione (con server e uffici amministrativi a San Francisco) che si occupa di promuovere la libera circolazione della conoscenza su Internet.
La sua creazione risale al 1996 per merito di Brewster Kahle, e in virtù del proprio impegno a favore della salvaguardia delle opere dell’ingegno fa parte della International Internet Preservation Consortium. L’importanza di questa biblioteca digitale è attestata dai milioni di navigatori al giorno e dal fatto che risulta uno dei 300 siti più visitati al mondo.
Archive.org contiene oltre 396 bilioni di pagine web, 14 miliardi di testi, 35 miliardi di contenuti multimediali di vario genere, e costituisce un’immensa biblioteca digitale concepita per preservare la conoscenza in ogni sua forma. Sostanzialmente, il portale costituisce una “copia di backup” dell’intero Internet dal 1996 a oggi, grazie all’incommensurabile apporto di 28 sedi sparse per il mondo che digitalizzano oltre 1.000 libri al giorno.
Come funziona la Wayback Machine
Internet Archive – ancora non conosciutissimo in Italia al pari di Wikipedia, ma comunque molto apprezzato – offre un insostituibile impegno nella difesa del patrimonio culturale e artistico dell’umanità.
Archive.org mette a disposizione nel proprio sito opere multimediali di ogni genere provenienti da tutti i Paesi del mondo, allo scopo di preservare la conoscenza di opere dell’ingegno umano e di aiutarle a superare indenni il trascorrere del tempo. Come puoi immaginare questo proposito di conservazione richiede spazi titanici di immagazzinamento, e l’organizzazione ricorre appunto a 30 petabytes per immagazzinare, addirittura, 2 copie di ogni pagina web!
La Wayback Machine, l’interfaccia in Archive.org, è una vera e propria macchina del tempo che permette di sfogliare i contenuti web sotto forma di istantanee, delle vere e proprie “fotografie” dei siti web scansionati. A oggi sono presenti nel portale oltre 400 miliardi di immagini e di file di altro genere.
Il meccanismo della Time Machine ti permette quindi di visionare lo stato di un sito in un dato periodo di tempo e di confrontare uno stesso portale a distanza di anni per monitorare la sua evoluzione.
La Wayback Machine è una risorsa eccezionale per nostalgici e appassionati che permette di:
- Studiare come cambiano i siti web nel corso degli anni
- Ritrovare pagine web e file ormai decaduti che altrimenti sarebbero da considerarsi persi
- Documentare i contenuti e lo stato di certi siti in un dato momento storico
- Creare immediatamente una copia del sito se questo è ancora online
La Wayback Machine in pratica è composta da funzioni che consentono di memorizzare le scansioni dei siti web e da quelle che le rendono accessibili a chiunque.
Per ogni sito web memorizzato è possibile consultare un “sommario” dei dati salvati e una mappa circolare dei materiali divisi per anno. La piattaforma è integrabile su browser anche grazie ai pratici componenti aggiuntivi.
Questa formidabile applicazione è in grado di memorizzare anche i siti web dinamici: gli snapshot che produce infatti sono versioni statiche dei siti web e, nel momento in cui la scansione viene formata, la versione “immagine” del sito viene memorizzata come se fosse in cache.
Da un lato, ciò permette di replicare la pagina web originale in ogni suo dettaglio; dall’altro, questa procedura è in grado di salvare soltanto la versione elaborata in quel dato momento dal server (proprio come una fotografia può recepire soltanto gli aspetti inquadrati di un soggetto). Non è possibile comunque visionare il contenuto delle aree riservate con database inaccessibile.
I siti memorizzati sono perfettamente funzionanti all’interno del portale con tanto di hyperlink, perciò si possono consultare come quando “erano in vita”.
Funzionalità di Internet Archive
Archive.org contempla una vasta gamma di materiali digitali, tra cui:
- Immagini in movimento (film, cinegiornali, cartoni animati classici, propaganda di guerra, film didattici, filmati amatoriali)
- Audio
- Testi
Per consultare il patrimonio di questo immenso libro di storia digitale, basta digitare nella barra di ricerca della home page il nome o l’URL del sito che stiamo cercando o della risorsa che ci interessa.
I contenuti sono divisi in maniera pratica in risorse come Immagini, Libri, Video, Audio, e relative sotto-collezioni. Possiamo eseguire inoltre la ricerca focalizzandoci su:
- Metadata
- Contenuti testuali
- Catture di trasmissioni TV
- Siti web archiviati
Archive.org costituisce quindi un’enorme raccolta di film e libri, serie TV e immagini, consultabili e scaricabili in maniera legale e gratuita. Possiamo ad esempio recuperare vecchi film altrimenti irreperibili, dai classici come “La corazzata Potëmkin”, “Nosferatu” e il “Dottor Mabuse”, alle serie TV dei tempi di guerra come “Why We Fight”.
Grazie a Internet Archive possiamo accedere a innumerevoli biblioteche di ogni genere, rese disponibili come di pubblico dominio, oppure volumi antichi i cui diritti sono decaduti (in genere 70 anni dopo la morte dell’autore). Si può scaricare libri precedenti al 1923, prendere il prestito dal sito Open Library libri moderni oppure consultarne altri con funzione di stampa disabilitata.
La sezione dei video è ricchissima, possiamo trovare cartoni animati, film storici e didattici, vlog, programmi televisivi, collezioni video.
La sezione delle immagini contempla diverse collezioni, come quelle del Metropolitan Museum o del Brooklyn Museum, e illustrazioni con licenza Creative Commons provenienti ad esempio da Flickr e persino da archivi NASA messi a disposizione del pubblico.
La categoria dei software racchiude programmi storici, videogame, software su CD che altrimenti sarebbe quasi impossibile rinvenire altrove. La sezione dei libri contiene volumi in forma digitale con tutte le informazioni del caso (autore, data di pubblicazione, biblioteca di provenienza, stato del copyright…).
Come fare a memorizzare volontariamente un sito in Archive.org? Se ci teniamo che un sito venga memorizzato, basta sottoporle l’URL della risorsa da scansionare. Una volta salvato, la Wayback Machine tornerà di tanto in tanto a scansionarlo per memorizzare altre “immagini” che andranno a costruire una successione di copie del sito per diversi intervalli temporali.
Le novità introdotte in Internet Archive
- Nuovi dati relativi alle ricerche e competitività delle keyword (volume, competizione, numero di risultati, CPC)
- Indicazione dei principali competitor posizionati per la keyword di interesse
- Indicazione degli inserzionisti principali posizionati per la keyword di interesse
- Sistema di filtri per rintracciare risultati di interesse nel mare magnum di quelli offerti
- Indicazione delle negative keywords che non si vogliono vedere incluse nell’elaborazione
- Esportazione della lista di keyword in CSV o copiandole tutte
Alla sezione Tool del sito, inoltre, si viene rimandati al SEO Analyzer, uno strumento che, dato un URL, restituisce (anche come report PDF):
- Una comparazione fino a 3 pagine web
- Una serie di statistiche sul sito tra cui errori (elementi non visualizzati nell’above the fold, titoli ripetuti) e suggerimenti di miglioramento come:
- Ridurre il numero di link interni
- Ridurre la lunghezza delle intestazioni
- Aumentare i backlink che rimandano al sito
- Verificare l’impatto sui social media
Questo strumento aggiuntivo è utile per avere una visione iniziale dei potenziali aspetti di criticità SEO – divisi per presunta gravità – e per avere suggerimenti sugli aspetti su cui lavorare per ottenere un miglioramento del ranking. Inoltre riepiloga brevemente il grado di successo di un sito in un’ottica di velocità di caricamento, ottimizzazione SEO, condivisione sui social network e stima un traffico ipotetico, utile per capire quanto ancora c’è da lavorare per raggiungere il successo con il nostro portale.
Internet Archive diventerà a pagamento?
Un possibile sviluppo non tanto improbabile potrebbe essere che al momento il tool sia in una sorta di “beta gratuita” per consentire agli utenti di fruirne e di esprimere il proprio apprezzamento – ad esempio per segnalare eventuali bug e mancanze – in vista dell’introduzione un domani della versione ancora più migliorata e a pagamento.
Brewster Kahle è famoso per aver realizzato innumerevoli e corpose guide gratuite, ma di certo non ha mai mancato nemmeno di vendere corsi a praticanti del settore: e se anche Internet Archive dovesse diventare un tool a pagamento?
Ragionevolmente le funzioni per allora disponibili dovrebbero essere ancora di più, difficilmente si riuscirebbe a far pagare solamente per un tool per l’estrazione delle long tail keyword quando ce ne sono già molti altri in commercio.
Al momento ogni ipotesi è buona, e la situazione appare ancora fluida. Lo strumento potrebbe rimanere anche in futuro gratuito, molto probabilmente sarebbe maggiore l’incremento di visibilità sul brand e di traffico derivante dall’acquisizione della tariffa stessa per l’utilizzo del tool, per il momento d’altronde possiamo utilizzarlo senza pagare alcunché.
Conclusioni
E tu, che cosa ne pensi?
Sei soddisfatto dei nuovi sviluppi di Internet Archive oppure preferisci passare da altri strumenti? Commenta questo articolo per raccontarci la tua esperienza!
Altri Articoli Utili
- Consulente SEO Esperto: Chi è, Cosa Fa e Come Lavora?
- Analisi SEO Completa: Strategie e Ottimizzazioni per il Tuo Sito Web
- SEO per Ecommerce: la strategia per ottimizzare il tuo negozio online
- SEO Copywriting a Perugia: contenuti di qualità per il tuo progetto
- Consulenza SEO Perugia: chi è, cosa fa e come lavora
- Traffico Organico: Scopri come Aumentarlo con le nostre Strategie
- Posizionamento Organico SEO: La Guida per posizionarti
- Progetta l’architettura e alberatura di un sito SEO Oriented
- Google Search Console: Vantaggi e Funzionalità per un SEO Vincente a Perugia
- Come Verificare e Posizionare un sito su Google nel 2024
- Analisi di Benchmark SEO: Come Battere i Competitor | SEO Perugia
- Come Creare un Piano Editoriale SEO Efficace e che Converta
- Come Aumentare il Traffico Organico con le Strategie SEO
- Guida Completa a Google Analytics 4 (GA4)
- Posizionamento Organico SEO: La Guida Completa per Migliorare la Visibilità
- Architettura del Sito Web e Alberatura: Ottimizza la Navigazione
- Blog Strategico: Guida Completa per il Successo nel Blogging
- Reputazione Online: Strategie SEO per Migliorarla
- Google Search Console – Scopriamone Vantaggi e Funzionalità
- Landing page: definizione e guida pratica con esempi
Contatti e Servizi
Per ulteriori informazioni sui nostri servizi di SEO o per richiedere una consulenza personalizzata, visita le nostre pagine dedicate: