Autor: Mark Graham

Blick in die Vergangenheit: So hilft dir die Wayback Machine bei deiner nächsten Recherche

“Ein Wissensschatz, der für alle zugänglich ist” – das war und ist die Mission des „Internet Archive“, einer gemeinnützigen Online-Bibliothek, die 2021 ihr 25-jähriges Bestehen feierte und die ich aktuell leite. Ihr wohl bekanntestes Tool ist die Wayback Machine, die täglich über eine Milliarde öffentliche Webseiten archiviert und der Allgemeinheit so ein Stück Internetgeschichte kostenfrei zugänglich macht.

Journalist:innen, Forscher:innen, Fact-Checker:innen, Aktivist:innen und auch die breite Öffentlichkeit, sie alle greifen täglich auf unterschiedliche Weise auf die Wayback Machine zu. Mehrere tausend Zeitungs-, Magazin- oder Online-Beiträge befassen sich mit uns oder unseren Services. Und in der GIJN-Reihe „My Favorite Tools“ von 2020 haben mehrere führende Investigativjournalist:innen die Wayback Machine als ein zentrales Element ihrer Arbeit bezeichnet.

Im Folgenden haben wir einige Tipps für dich zusammengestellt, damit auch du das Tool für deine nächste Recherche nutzen kannst.

URLs archivieren

Hin und wieder kommt es vor, dass Journalist:innen in ihren Beiträgen auf eine Webseite verweisen, die Betreiber der Seite jedoch entweder wichtige Passagen löschen oder gar die gesamte Seite stilllegen. Wenn diese Seiten vorab nicht archiviert wurden, sind diese Daten verloren. Doch das lässt sich verhindern.

Nutzer:innen der Wayback-Machine aus aller Welt archivieren täglich dutzende Millionen URLs mithilfe der Funktion „Save Page Now“. Diese ist für jeden und jede frei zugänglich. Wenn du zusätzlich ein kostenloses Nutzerkonto erstellst, kannst du alle „Outlinks“ – also externe Links innerhalb der Originalseite – in der Archivierung erfassen und dir eine Übersicht davon per Mail zuschicken lassen.

Info: Wenn du eine komplette Liste mit URLs zum Archivieren hast, können alle URLs auf einmal übermittelt werden. Nutze dazu unseren “Safe Page Now” Google Sheets Service. Gebe in einer Google Sheet Datei in der Spalte „A“ die URLs ein. In den Spalten B, C und D erscheinen dann ein Hinweis darauf, ob die URL bereits von Wayback Machine archiviert wurde, ein Statuscode und die archivierte URL.

Ein Screenshot der Ergebnisse des “Save Page Now” Services und dem Google Sheets Service

Außerdem kannst du einzelne URLs per E-Mail an spn@archive.org schicken. Wenn du dazu „capture outlinks“ in die Betreffzeile schreibst, werden diese ebenfalls archiviert. Auch hier wirst du per E-Mail benachrichtigt, sobald die Archivierung abgeschlossen ist.

Wer technisch etwas versierter ist und die eigene Arbeit automatisieren möchte, kann die Wayback Machine auch über eine Programmierschnittstelle (API, vom englischen Begriff: application programming interface) in den eigenen Software-Workflow oder direkt in eine neue Anwendung integrieren.

Was ist gleich und was ist anders?

Hast du dich schon einmal gefragt, wie sich Unterschiede zwischen zwei Versionen derselben Webseite herausfinden und anzeigen lassen? Beispielsweise, ob ein Unternehmen oder eine Person die eigene Website geändert oder die Texte aktualisiert hat? Mit der Funktion „Changes“ ist genau das möglich.

Zum Ausprobieren, gib einfach eine beliebige archivierte URL in die Suchmaske auf der Startseite der Wayback Machine ein, drücke Enter und klicke anschließend auf den Button „Changes“.

Anschließend wird dir eine Liste mit archivierten Website-Versionen verschiedener Tage und Uhrzeiten angezeigt. Farbliche Markierungen zeigen dir außerdem an, wie stark die Seite zu einem bestimmten Zeitpunkt geändert wurde.

Wenn du dann zwei beliebige, mit einem Zeitstempel versehene Versionen der URL auswählst und auf „Compare“ klickst, siehst du beide Versionen direkt nebeneinander. Die Unterschiede im Text kannst du an blauen und gelben Markierungen erkennen. Mit dieser Funktion konnte unter anderem gezeigt werden, wie ein hochrangiger britischer Blogger und politischer Berater nachträgliche Änderungen an einem Blog-Beitrag vornahm (siehe Screenshot unten).

Die „Changes“-Funktion der Wayback Machine zeigt, wie Dominic Cummings, der ehemalige Chefberater des britischen Premierministers, seinen ursprünglichen Blogbeitrag (links) heimlich ergänzt hat (in blau, rechts). (Bild: Screenshot)

Noch tiefer ins Archiv einsteigen

Bislang indiziert die Wayback Machine nicht automatisch alle Texte der archivierten URLs. Dadurch können noch keine Schlüsselwörter für die Suche genutzt werden. Nutzer:innen müssen die konkrete URL kennen, nach der sie suchen. Nur so können sie auch Archivversionen davon finden. Das Team der Wayback Machine inzidiert eine Vielzahl von Metadaten von Webseiten, um thematische Archivsammlungen zu erstellen.

(Weitere Informationen über die verfügbaren Dienste für unsere „Collections“ findest du auf der Homepage des Internet Archive).

Die Nutzung von Programmierschnittstellen (APIs)

Neben einer API zur Unterstützung der Archivierung durch den „Save Page Now“ Service gibt es auch APIs zur Überprüfung, ob bestimmte URLs bereits von Wayback Machine archiviert wurden. Weitere Informationen dazu findest du hier.

Mehr Informationen dazu findest du hier.

Wie bei fast allen Funktionen der Wayback Machine gibt es keine Beschränkung bei der Verwendung der APIs. Doch manchmal kann es zu Drosselungsmaßnahmen kommen.. Falls du bei der Nutzung der Wayback Machine Probleme hast, schicke uns eine Mail oder eine Nachricht auf Twitter. Wir sind stets bemüht, Journalist:innen bei ihrer Arbeit zu unterstützen.

Archivierte Seiten mit Kontext versehen

Jedes Archiv lebt davon, zusätzlich konkrete Informationen zu Kontext und Herkunft des Materials bereitzustellen. Aus diesem Grund haben wir Kontext-Registerkarten in unsere Nutzeroberfläche eingebunden. Sie sollen unseren Nutzer:innen helfen, das Material, mit dem sie arbeiten, noch besser zu verstehen. Diese Tabs können beispielsweise nützlich sein, wenn eine archivierte Seite entfernt wurde oder wenn eine bekannte Forschungseinrichtung über die Seite geschrieben hat.

Der Ursprung jeder der archivierten URLs, aus denen sich eine Webseite zusammensetzt, kann für das Verständnis dieser Seite von entscheidender Bedeutung sein. Beispielsweise kannst du erkennen, ob einige Bilder auf einer archivierten Seite zur gleichen Zeit und am gleichen Datum wie andere Elemente auf der Seite archiviert wurden. Detaillierte Informationen dazu bekommst du mit einem Klick auf die Registerkarte „About this capture“, die oben rechts auf jeder archivierten URL-Wiedergabeseite zu finden ist.

Gelbe Kopfzeilen in der Wayback Machine verweisen auf externe Verwendungen archivierter Seiten. Und die Registerkarte „About this capture“ liefert zusätzliche Details über den historischen Kontext einer Seite. (Bild: Screenshot)

Wir arbeiten dauerhaft und mit größter Sorgfalt und Aufmerksamkeit an unseren Archiven und gehen dabei stets transparent vor. Auch deswegen schenken uns nicht nur unsere Nutzer:innen ihr Vertrauen. Auch mehrere Gerichte weltweit haben auf der Wayback Machine gespeicherte Informationen bereits als Beweise anerkannt.

Wenn du der Meinung bist, wir sollten zusätzlichen Kontext zu einer URL hinzufügen, die du mit unserer Funktion „Save Page Now“ archiviert hast, gib uns bitte Bescheid.

Browser-Erweiterungen

Selbstverständlich gibt es für die Wayback Machine Browser-Erweiterungen für Safari, Firefox und Chrome sowie iOS– und Android-Apps. Darüber hinaus haben wir uns mit dem Suchmaschinendienst Brave zusammengetan, um die Erkennung der berüchtigten 404-Fehler (sowie anderer Fehler) direkt in deren Browser zu integrieren. So kannst du die Wayback Machine im Brave-Browser noch einfacher nutzen.

Vor allem aber solltest du wissen, dass du bei der Nutzung des Internet Archive und der Wayback Machine nie auf dich allein gestellt bist. Unser Support-Team ist nur eine E-Mail oder Twitter-Direktnachricht entfernt. Schreib uns deine Fragen und Wünsche, was geklappt und nicht geklappt hat – oder, wo du noch Verbesserungspotenzial siehst. Wir wollen erfahren, was dir an unseren Diensten nicht gefällt oder welche Funktionen wir deiner Meinung nach verbessern beziehungsweise hinzufügen sollten. Nur so können wir den Bedürfnissen und Wünschen von Journalist:innen noch besser nachkommen.

Wir können nicht nur Websites…

Das „Internet Archive“ sichert nicht nur große Teile der im Internet verbreitete Informationen. Es hat sich ebenso zur Aufgabe gemacht, ein möglichst breites Spektrum anderer Materialien bereitzustellen. So findest du bei uns beispielsweise auch über 25 Millionen frei zugängliche wissenschaftliche Arbeiten und knapp 30 Millionen E-Books und Texte, die sich entweder in einer Vorschau anzeigen, ausleihen oder herunterladen lassen. Außerdem haben wir unzählige Bilder und Audiodateien sowie Millionen Stunden TV-Nachrichten dutzender Sender archiviert, und das über einen Zeitraum von fast 10 Jahren. Diese lassen sich durch die zugehörigen Untertitel sogar nach bestimmten Inhalten durchsuchen.

Um über die Projekte und Dienste des „Internet Archive“ und der Wayback Machine auf dem Laufenden zu bleiben, folge uns am besten auf Twitter (@internetarchive und @waybackmachine) oder schaue regelmäßig in unseren Blog.

—-

Mark Graham leitet die Wayback Machine seit mehr als fünf Jahren. Davor war er Senior Vice President bei NBC News Digital.

Diese Guide wurde übersetzt von Florian Sturm.

Illustrationen: Shutterstock, Anwendungen der Wayback Machine