Wie übertrage ich Inhalte von der Wayback Machine (archive.org) nach Wordpress?

Gepostet von: 2019-12-04

Mit der Option "Strukturierten Inhalt extrahieren" können Sie auf einfache Weise ein Wordpress-Blog sowohl von der Website im Webarchiv als auch von jeder anderen Website aus erstellen. Suchen Sie dazu zunächst die Quellwebsite und aktivieren Sie dann im Tool "Die Webseite wiederherstellen" oder "Laden Sie eine Webseite" die Option "Extrahieren Sie strukturierte Inhalte". Geben Sie Ihre Optionen (E-Mail, Zeitstempel usw.) ein und starten Sie den Download.


Wenn ein Website-Downloadprozess abgeschlossen ist, stellt das System ihn auf unserem Server bereit und beginnt mit dem Extrahieren von Inhalten. Bei der Erstellung eines Artikelarchivs berücksichtigt unser Parser nur sinnvolle Inhalte, ausgenommen doppelte Artikel, Steuerelemente und Serviceseiten, sodass nur Artikel mit gespeicherter Formatierung zum Import in Ihre Website bereitstehen. Nachdem das Extrahieren der Artikel abgeschlossen ist, erhalten Sie ein Bestätigungsschreiben, öffnen es und laden den Inhalt herunter - die Schaltfläche "Artikel (.zip)".


Das ZIP-Archiv enthält den extrahierten Inhalt in verschiedenen Formaten. Wählen Sie aus diesen eine Datei mit der Erweiterung .wxr aus. Starten Sie auf Ihrer Wordpress-Website den Import von Inhalten (im Admin-Bereich von Wordpress - Tools - Import - Wordpress - Import starten).


Wenn der extrahierte Inhalt einige Bilder enthält, werden Links zu diesen in der Artikeldatei enthalten sein. Um sie in Ihre Wordpress-Site zu importieren, müssen Sie unser Archivarix External Images Importer-Plugin verwenden. In der Plugin-Registerkarte "Einstellungen herunterladen" können Sie den Parameter "Download starten" auf "Sofort" setzen. Dies bedeutet, dass beim Importieren einer Datei mit Artikeln das Plugin sofort alle externen Bilder in die Wordpress-Mediengalerie herunterlädt. Wenn Sie viele Bilder haben, können Sie den Hintergrundimport verwenden. Wählen Sie in derselben Registerkarte "In Warteschlange stellen" und klicken Sie dann auf die Schaltfläche "Hintergrundverarbeitung ausführen". Nach einer Weile werden alle verfügbaren Mediendateien in Ihre Site importiert.

Die Verwendung von Artikelmaterialien ist nur zulässig, wenn der Link zur Quelle veröffentlicht wird: https://de.archivarix.com/blog/convert-archiveorg-to-wordpress/

Neueste Nachrichten:
2020.05.21
Ein Update, das Webstudios und Outsourcing-Experten zu schätzen wissen.
- Separates Passwort für den abgesicherten Modus.
- Erweiterter abgesicherter Modus. Jetzt können Sie benutzerdefinierte Regeln und Dateien erstellen, jedoch ohne ausführbaren Code.
- Neuinstallation der Site vom CMS, ohne dass manuell etwas vom Server gelöscht werden muss.
- Möglichkeit, benutzerdefinierte Regeln zu sortieren.
- Verbessertes Suchen und Ersetzen für sehr große Websites.
- Zusätzliche Einstellungen für das Tool "Viewport-Meta-Tag".
- Unterstützung für IDN-Domains beim Hosting mit der alten Version der Intensivstation.
- Bei der Erstinstallation mit einem Passwort wird die Möglichkeit zum Abmelden hinzugefügt.
- Wenn während der Integration mit WP .htaccess erkannt wird, werden die Archivarix-Regeln zu Beginn hinzugefügt.
- Beim Herunterladen von Websites nach Seriennummer wird CDN verwendet, um die Geschwindigkeit zu erhöhen.
- Andere kleinere Verbesserungen und Korrekturen.
2020.05.12
Unser Archivarix CMS entwickelt sich rasant weiter. Neues Update, in dem erschienen ist:
- Neues Dashboard zum Anzeigen von Statistiken, Servereinstellungen und Systemaktualisierungen.
- Möglichkeit, Vorlagen zu erstellen und der Site bequem neue Seiten hinzuzufügen.
- Integration mit Wordpress und Joomla mit einem Klick.
- In Search-Substitution wird jetzt eine zusätzliche Filterung in Form eines Konstruktors durchgeführt, in dem Sie eine beliebige Anzahl von Regeln hinzufügen können.
- Jetzt können Sie die Ergebnisse nach Domain / Subdomains, Datum / Uhrzeit und Dateigröße filtern.
- Ein neues Tool zum Zurücksetzen des Caches in Cloudlfare oder zum Aktivieren / Deaktivieren des Dev-Modus.
- Ein neues Tool zum Entfernen der Versionierung in URLs, z. B. "?ver=1.2.3" in CSS oder JS. Ermöglicht die Reparatur auch von Seiten, die im WebArchiv aufgrund fehlender Stile mit unterschiedlichen Versionen schief aussahen.
- Das robots.txt-Tool kann eine Sitemap-Karte sofort aktivieren und hinzufügen.
- Automatische und manuelle Erstellung von Rollback-Punkten für Änderungen.
- Importieren kann Vorlagen importieren.
- Das Speichern / Importieren der Einstellungen des Loaders enthält die erstellten benutzerdefinierten Dateien.
- Für alle Aktionen, die länger als eine Zeitüberschreitung dauern können, wird ein Fortschrittsbalken angezeigt.
- Ein Tool zum Hinzufügen eines Ansichtsfenster-Meta-Tags zu allen Seiten einer Site.
- Tools zum Entfernen defekter Links und Bilder können Dateien auf dem Server berücksichtigen.
- Ein neues Tool zum Beheben falscher Urlencode-Links im HTML-Code. Selten, kann aber nützlich sein.
- Verbessertes Tool für fehlende URLs. Zählt jetzt zusammen mit dem neuen Loader Aufrufe an nicht vorhandene URLs.
- Regex-Tipps für Suche und Substitution.
- Verbesserte Überprüfung auf fehlende PHP-Erweiterungen.
- Alle verwendeten js-Tools wurden auf die neuesten Versionen aktualisiert.

Dies und viele andere kosmetische Verbesserungen und Geschwindigkeitsoptimierungen.
2020.02.14
Neuer Freitag, neue Updates!
In Archivarix CMS wurde viel Neues und Nützliches getan:
- In Suchen und Ersetzen können Sie jetzt nach URL-Datum filtern.
- Jetzt können externe Links von allen Seiten der Site mit einem Klick auf eine Schaltfläche entfernt werden. Anker bleiben erhalten.
- Ein neuer Parameter ACMS_SAFE_MODE, der das Ändern der Loader / CMS-Einstellungen und das Laden benutzerdefinierter Dateien verbietet. Das Importieren von Einstellungen und benutzerdefinierten Dateien ist ebenfalls verboten.
- Die JSON-Einstellungsdateien für den Loader und das CMS können jetzt von einer Datei auf dem Computer auf Ihren Computer heruntergeladen und auf das CMS heruntergeladen werden. Dadurch ist die Übertragung von Einstellungen auf andere Websites noch einfacher geworden.
- Das Erstellen benutzerdefinierter Regeln ist praktischer geworden. Es gibt häufig verwendete Muster, die Sie auswählen können.
- Neue benutzerdefinierte Dateien können im Dateimanager erstellt werden, ohne dass die Datei heruntergeladen werden muss.
- Der URL-Baum für die Hauptdomain steht immer an erster Stelle.
- Wenn Sie den URL-Baum für die Domain / Subdomain ausblenden, wird diese Einstellung während der Arbeit mit dem CMS gespeichert.
- Öffnen / reduzieren Sie anstelle von zwei Schaltflächen den URL-Baum, der jetzt beides kann.
- Das Erstellen einer neuen URL wurde vereinfacht. Beim Erstellen können Sie die Datei sofort vom Computer aus angeben.
- Im mobilen Layout steht der Hauptarbeitsteil an erster Stelle.
- Nach jeder Bearbeitung der Datei wird ihre Größe in der Datenbank aktualisiert.
- Feste Schaltflächen für selektive Verlaufs-Rollbacks.
- Das Erstellen neuer URLs für Subdomains, die Nummern im Domainnamen enthalten, wurde behoben.
2020.02.07
Neuer Teil der Updates!
Der Quellcode der Dateien muss jetzt nicht mehr geändert werden.
- Jetzt können Sie Websites auf den Server hochladen, indem Sie nur ein Skript aus unserem Archivarix CMS auf den Server hochladen.
- Um etwas in den CMS-Einstellungen zu ändern, müssen Sie den Quellcode nicht mehr öffnen. Sie können ein Passwort oder niedrigere Grenzwerte direkt im Abschnitt Einstellungen festlegen.
- Um Ihre Zähler, Tracker und benutzerdefinierten Skripte zu verbinden, wird jetzt ein separater Ordner "Includes" im Ordner .content.xxxxxx verwendet. Sie können benutzerdefinierte Dateien auch direkt über den neuen Dateimanager in CMS hochladen. Das Hinzufügen von Zählern und Analysen zu allen Seiten der Website ist ebenfalls bequem und verständlich geworden.
- Importe unterstützen eine neue Dateistruktur mit Einstellungen und dem Ordner "Includes".
- Tastaturkürzel für die Arbeit im Code-Editor hinzugefügt.

Diese und viele andere Verbesserungen in der neuen Version. Der Loader wurde ebenfalls aktualisiert und arbeitet mit den vom CMS erstellten Einstellungen.
2020.01.23
Ein weiteres Mega-Update von Archivarix CMS!

Es wurden sehr nützliche Tools hinzugefügt, die das Klicken auf eine Schaltfläche ermöglichen:
- alle defekten internen Links säubern,
- fehlende Bilder löschen,
- für alle externen Links rel = "nofollow" setzen.

Jetzt kann zusätzliche Wiederherstellung direkt aus dem CMS selbst importiert werden. Sie können verschiedene Wiederherstellungen in einer Arbeitsumgebung kombinieren.

Für diejenigen, die mit großen Websites arbeiten oder schlechtes Hosting verwenden - alle Aktionen, die zuvor zum Zeitlimit Ihres Hostings abgebrochen wurden, werden jetzt in Teile unterteilt und automatisch fortgesetzt, bis sie abgeschlossen sind. Möchten Sie einen Ersatz im Code von 500.000 Dateien vornehmen? Mehrere Gigabyte Recovery importieren? All dies ist jetzt auf jedem, auch sehr günstigen Hosting möglich. Die Timeout-Zeit (standardmäßig 30 Sekunden) kann im Parameter ACMS_TIMEOUT geändert werden.

Unser Loader (index.php) funktioniert nun unabhängig von den Build-Parametern mit den Protokollen http und https. Sie können das Protokoll erzwingen, indem Sie den Wert des Parameters ARCHIVARIX_PROTOCOL ändern.