Autor
5. September 2023
Autor
Suchen Sie nach einer Möglichkeit, Spammer und Betrüger davon abzuhalten, Ihre WordPress-Blogbeiträge mit Hilfe von Content Scrapers zu stehlen?
Als Inhaber einer Website ist es sehr frustrierend zu sehen, dass jemand Ihre Inhalte ohne Erlaubnis stiehlt, sie zu Geld macht, Ihnen in Google den Rang abläuft und Ihr Publikum klaut.
In diesem Artikel erfahren Sie, was Blog-Content-Scraping ist, wie Sie Content-Scraping einschränken und verhindern können und sogar, wie Sie Content-Scraper zu Ihrem eigenen Vorteil nutzen können.
Blog-Content-Scraping bedeutet, dass Inhalte aus zahlreichen Quellen entnommen und auf einer anderen Website neu veröffentlicht werden. In der Regel geschieht dies automatisch über die Website Ihres BlogsRSS-Feed.
Leider ist es sehr einfach und sehr häufig, dass IhreWordPress-Blog Inhalte auf diese Weise gestohlen werden. Wenn Ihnen das schon einmal passiert ist, dann wissen Sie, wie stressig und frustrierend das sein kann.
Manchmal werden Ihre Inhalte einfach kopiert und direkt in eine andere Website eingefügt, einschließlich Ihrer Formatierung, Bilder, Videos und mehr.
In anderen Fällen werden Ihre Inhalte mit Quellenangabe und einem Link zu Ihrer Website veröffentlicht, jedoch ohne Ihre Zustimmung. Dies kann zwar für IhreSEOmöchten Sie vielleicht, dass Ihre Originalinhalte nur auf Ihrer Website gehostet werden.
Warum klauen Content Scraper Inhalte?
Einige unserer Nutzer haben uns gefragt, warum Scraper Inhalte klauen. Normalerweise ist die Hauptmotivation für den Diebstahl von Inhalten, von Ihrer harten Arbeit zu profitieren:
Ist es möglich, das Scraping von Inhalten vollständig zu verhindern?
In diesem Artikel zeigen wir Ihnen einige Maßnahmen, die Sie ergreifen können, um das Scraping von Inhalten zu reduzieren und zu verhindern. Aber leider gibt es keine Möglichkeit, einen entschlossenen Dieb vollständig zu stoppen.
Deshalb haben wir diesen Artikel mit einem Abschnitt darüber beendet, wie Sie sich die Vorteile von Content-Scrapern zunutze machen können. Auch wenn Sie einen Dieb nicht immer aufhalten können, so können Sie doch durch die von ihm gestohlenen Inhalte etwas Traffic und Einnahmen erzielen.
Was sollten Sie tun, wenn Sie feststellen, dass jemand Ihre Inhalte abgegriffen hat?
Da es nicht möglich ist, Scraper vollständig zu stoppen, könnten Sie eines Tages feststellen, dass jemand Inhalte verwendet, die er aus Ihrem Blog gestohlen hat. Sie fragen sich vielleicht, was Sie tun sollen, wenn das passiert.
Im Folgenden werden einige Vorgehensweisen im Umgang mit Content Scrapers vorgestellt:
Werfen wir also einen Blick darauf, wie man Blog-Scraping in WordPress verhindern kann. Da es sich um einen umfassenden Leitfaden handelt, haben wir zur leichteren Navigation ein Inhaltsverzeichnis eingefügt:
Marken- und Urheberrechtsgesetze schützen Ihre Rechte an geistigem Eigentum, Ihre Marke und Ihr Unternehmen vor vielen rechtlichen Angriffen. Dazu gehört auch die illegale Verwendung Ihres urheberrechtlich geschützten Materials oder des Namens und Logos Ihrer Marke.
Sie sollten auf Ihrer Website deutlich einen Urheberrechtshinweis anbringen. Auch wenn Ihre Inhalte automatisch unter das Urheberrecht fallen, können Sie mit einem Hinweis darauf aufmerksam machen, dass Ihre Inhalte urheberrechtlich geschützt sind und Ihr geschütztes Eigentum nicht für geschäftliche Zwecke genutzt werden darf.
Sie können zum BeispielHinzufügen eines Urheberrechtshinweises mit dynamischem Datum in Ihrer WordPress-Fußzeile. So bleibt Ihr Copyright-Hinweis auf dem neuesten Stand.
Dies kann einige Nutzer davon abhalten, sie zu stehlen. Es hilft auch für den Fall, dass Sie eine Unterlassungsaufforderung schicken oder eine DCMA-Beschwerde einreichen müssen, um die gestohlenen Inhalte zu entfernen.
Sie können die Registrierung von Urheberrechten auch online beantragen. Dieser Prozess kann kompliziert sein, aber zum Glück gibt es kostengünstige juristische Dienstleistungen, die kleinen Unternehmen und Privatpersonen helfen können.
Erfahren Sie in unserem Leitfaden überwie Sie den Namen und das Logo Ihres Blogs marken- und urheberrechtlich schützen.
Da das Scraping von Blog-Inhalten in der Regel automatisch über die Website Ihres Blogs erfolgtRSS-FeedSehen wir uns nun einige hilfreiche Änderungen an, die Sie an Ihrem Feed vornehmen können.
Fügen Sie nicht den gesamten Inhalt eines Beitrags in Ihren WordPress-RSS-Feed ein
Sie können statt des vollständigen Inhalts nur eine Zusammenfassung jedes Beitrags in Ihren RSS-Feed aufnehmen. Dies beinhaltet sowohl einen Auszug als auch einen BeitragMetadaten wie z. B. das Datum, den Autor und die Kategorie.
In der Blogger-Gemeinde wird sicherlich darüber diskutiert, ob man vollständige RSS-Feeds oder Zusammenfassungen haben sollte. Darauf wollen wir jetzt nicht eingehen, sondern nur sagen, dass einer der Vorteile von Zusammenfassungen darin besteht, dass sie das Auslesen von Inhalten verhindern helfen.
Sie können die Einstellungen ändern, indem Sie zuEinstellungen “ Lesen in Ihrem WordPress-Administrationsbereich. Wählen Sie die Option „Auszug“ und klicken Sie dann auf die Schaltfläche „Änderungen speichern“.
Jetzt wird im RSS-Feed nur ein Auszug Ihres Artikels angezeigt. Wenn jemand Ihre Inhalte über Ihren RSS-Feed stiehlt, erhält er nur die Zusammenfassung und nicht den vollständigen Beitrag.
Wenn Sie die Zusammenfassung optimieren möchten, lesen Sie bitte unseren Leitfaden zuwie man WordPress-Auszüge anpasst.
Optimieren Sie Ihren RSS-Feed, um Scraping zu verhindern
Es gibt andere Möglichkeiten, wie SieOptimieren Sie Ihren WordPress-RSS-Feed um Ihre Inhalte zu schützen, mehr Backlinks zu erhalten, Ihren Webverkehr zu erhöhen und vieles mehr. Eine der besten Möglichkeiten ist, das Erscheinen von Beiträgen im RSS-Feed zu verzögern.
Wenn Sie die Veröffentlichung von Beiträgen in Ihrem RSS-Feed hinauszögern, geben Sie den Suchmaschinen Zeit, Ihre Inhalte zu crawlen und zu indizieren, bevor sie an anderer Stelle, z. B. auf Scraper-Websites, erscheinen. Die Suchmaschinen sehen dann Ihre Website als die Autorität an.
Am sichersten und einfachsten ist es, wenn Sie dazuWPCode weil es ein Rezept hat, das automatisch die richtigenbenutzerdefinierter Code für WordPress.
Detaillierte Anweisungen finden Sie in unserem Leitfaden überwie Sie das Erscheinen von Beiträgen in Ihrem WordPress-RSS-Feed verzögern können.
In den Anfangstagen des Bloggens,Trackbacks und Pingbacks wurden eingeführt, damit sich Blogs gegenseitig über Links informieren können. Wenn jemand auf einen Beitrag in Ihrem Blog verlinkt, sendet seine Website automatisch einen Ping an Ihre.
Dieser Pingback erscheint dann in der Liste Ihres BlogsKommentar-Moderation Warteschlange mit einem Link zu ihrer Website. Wenn Sie ihn genehmigen, erhalten sie einen Backlink und eine Erwähnung von Ihrer Website.
Dies gibt dem Spammer einen Anreiz, Ihre Website zu scrapen und Trackbacks zu senden. Glücklicherweise können Sie Trackbacks und Pingbacks deaktivieren, um Scrapern einen Grund weniger zu geben, Ihre Inhalte zu stehlen.
Weitere Informationen finden Sie in unserem Leitfaden überDeaktivierung von Trackbacks für alle zukünftigen Beiträge. Das könnte Sie auch interessierenDeaktivieren von Trackbacks und Pings bei bestehenden WordPress-Beiträgen.
WordPress REST API deaktivieren
Abgesehen von Trackbacks und Pingbacks empfehlen wir auch, die WordPress REST API zu deaktivieren, da sie es Spammern erleichtern kann, Ihre Inhalte zu scrapen.
Wir haben einen detaillierten Leitfaden überwie Sie die WordPress REST API deaktivieren können.
Alles, was Sie tun müssen, ist die Installation und Aktivierung derkostenloses WPCode-Plugin und verwenden Sie deren vorgefertigtes Snippet, um die REST-API zu deaktivieren.
Eine Möglichkeit, Scraper davon abzuhalten, Ihre Inhalte zu stehlen, besteht darin, ihnen den Zugang zu Ihrer Website zu verwehren. Sie können dies manuell tun, indem Sie ihre IP-Adresse blockieren, aber die meisten Nutzer werden es einfacher finden, ein Sicherheits-Plugin wie eine Web Application Firewall zu verwenden.
Blockieren Sie den Scraper mit einem Sicherheits-Plugin (empfohlen)
Das manuelle Blockieren von Scrapern ist knifflig und macht eine Menge Arbeit. Vor allem, weil viele Hacking-Versuche und Angriffe über eine Vielzahl zufälliger IP-Adressen aus der ganzen Welt durchgeführt werden. Es ist fast unmöglich, mit all diesen zufälligen IP-Adressen Schritt zu halten.
Deshalb brauchen Sie eineWeb-Anwendungs-Firewall (WAF) wie zum BeispielWordfence oder Securi. Diese fungieren als Schutzschild zwischen Ihrer Website und dem gesamten eingehenden Datenverkehr, indem sie den Datenverkehr Ihrer Website überwachen und gängige Sicherheitsbedrohungen blockieren, bevor sie Ihre WordPress-Website erreichen.
Für die WPBeginner-Website verwenden wirSucuri. Es handelt sich um einen Website-Sicherheitsdienst, der Ihre Website mithilfe einer Website-Anwendungsfirewall vor solchen Angriffen schützt.
Grundsätzlich läuft der gesamte Datenverkehr Ihrer Website über die Server des Sicherheitsdienstes, wo er auf verdächtige Aktivitäten untersucht wird. Verdächtige IP-Adressen werden automatisch daran gehindert, Ihre Website überhaupt zu erreichen. Sehen Sie, wieSucuri hat uns geholfen, 450.000 WordPress-Angriffe zu blockieren in 3 Monaten.
Manuelles Blockieren oder Umleiten der IP-Adresse des Scrapers
Fortgeschrittene Benutzer können die IP-Adresse eines Scrapers auch manuell blockieren. Das ist zwar mehr Arbeit, aber Sie können die Adresse des Scrapers gezielt anvisieren, sobald Sie sie kennen. WebentwicklerJeff Star schlägt diesen Ansatz vor, wenn er darüber schreibt, wie er mit Content Scrapers umgeht.
Anmerkung: Das Hinzufügen von Code zu Website-Dateien kann gefährlich sein. Schon ein kleiner Fehler kann zu großen Fehlern auf Ihrer Website führen. Deshalb empfehlen wir diese Methode nur für fortgeschrittene Benutzer.
Die IP-Adresse des Scrapers finden Sie unter „Raw Access Logs“ im cPanel-Dashboard IhresWordPress-Hosting Konto. Sie müssen nach IP-Adressen mit einer ungewöhnlich hohen Anzahl von Anfragen suchen und diese aufzeichnen, indem Sie sie beispielsweise in eine separate Textdatei kopieren.
Tipp: Sie müssen sicherstellen, dass Sie sich selbst, legitime Nutzer oder Suchmaschinen nicht vom Zugriff auf Ihre Website abhalten. Kopieren Sie eine verdächtig aussehende IP-Adresse und verwenden Sie onlineIP-Lookup-Tools um mehr darüber zu erfahren.
Wenn Sie sicher sind, dass die IP-Adresse zu einem Scraper gehört, können Sie sie mit dem cPanel-Tool „IP-Blocker“ oder durch Hinzufügen des folgenden Codes in Ihrem Stammverzeichnis blockieren.htaccess Datei:
Ablehnen von 123.456.789
Ersetzen Sie die IP-Adresse im Code durch diejenige, die Sie blockieren möchten. Sie können mehrere IP-Adressen sperren, indem Sie sie durch Leerzeichen getrennt in dieselbe Zeile eingeben.
Detaillierte Anweisungen finden Sie in unserem Leitfaden überwie man IP-Adressen in WordPress blockiert.
Anstatt die Scraper einfach zu blockieren, schlägt Jeff vor, ihnen stattdessen Dummy-RSS-Feeds zu schicken. Sie könnten Feeds voller Lorem Ipsum und störender Bilder erstellen oder sie sogar direkt auf ihre eigene Website zurückschicken, was eine Endlosschleife verursacht und ihren Server zum Absturz bringt.
Um sie auf einen Dummy-Feed umzuleiten, müssen Sie einen Code wie den folgenden in Ihre .htaccess-Datei einfügen:
RewriteCond %{REMOTE_ADDR} 123.456.789.
Nicht nur Ihre schriftlichen Inhalte müssen Sie schützen. Sie sollten auch den Diebstahl von Bildern in WordPress verhindern.
Wie beim Text gibt es keine Möglichkeit, den Diebstahl von Bildern vollständig zu verhindern, aber es gibt viele Möglichkeiten, den Diebstahl von Bildern auf einer WordPress-Website zu unterbinden.
Sie können zum Beispiel das Hotlinking Ihrer WordPress-Bilder deaktivieren. Das bedeutet, dass die Bilder nicht auf die eigene Website geladen werden, wenn jemand Ihre Inhalte kopiert.
Außerdem werden dadurch die Serverlast und die Bandbreitennutzung verringert,Steigerung der Geschwindigkeit und Leistung von WordPress.
Alternativ dazu können Sie Ihre Bilder mit einem Wasserzeichen versehen, das Sie als Urheber ausweist. So wird deutlich, dass der Scraper Ihre Inhalte gestohlen hat.
Diese beiden Techniken sowie weitere Möglichkeiten zum Schutz Ihrer Bilder finden Sie in unserem Leitfaden überMöglichkeiten zur Verhinderung von Bilddiebstahl in WordPress.
Während die meisten Scraper automatische Tools verwenden, versuchen manche Content-Diebe, Ihren gesamten Inhalt oder Teile davon manuell zu kopieren.
Eine Möglichkeit, dies zu erschweren, besteht darin, sie daran zu hindern, Ihren Text zu kopieren und einzufügen. Sie können dies tun, indem Sie es ihnen erschweren, den Text auf Ihrer Website auszuwählen.
Wie Sie das manuelle Kopieren Ihrer Inhalte verhindern können, erfahren Sie in unserer Schritt-für-Schritt-Anleitung aufwie man Textauswahl und Kopieren/Einfügen in WordPress verhindert.
Allerdings sind Ihre Inhalte dadurch nicht vollständig geschützt. Denken Sie daran, dass technisch versierte Benutzer immer noch den Quellcode einsehen oder dieWerkzeug inspizieren um alles zu kopieren, was sie wollen. Außerdem funktioniert diese Methode nicht mit allen Webbrowsern.
Denken Sie auch daran, dass nicht jeder, der Ihren Text kopiert, ein Content-Dieb ist. Manche Leute wollen zum Beispiel den Titel kopieren, umTeilen Sie Ihren Beitrag in den sozialen Medien.
Deshalb empfehlen wir Ihnen, diese Methode nur dann anzuwenden, wenn Sie der Meinung sind, dass sie für Ihre Website wirklich erforderlich ist.
Je größer Ihr Blog wird, desto unmöglicher ist es, alle Content Scraper zu stoppen oder im Auge zu behalten. Wir verschicken immer noch DMCA-Beschwerden. Wir wissen jedoch, dass es tonnenweise andere Websites gibt, die unsere Inhalte klauen, und wir können einfach nicht mehr mithalten.
Stattdessen versuchen wir, die Vorteile von Content-Scrapern zu nutzen. Es ist nicht so schlimm, wenn Sie sehen, dass Sie mit Ihren gestohlenen Inhalten Geld verdienen oder viel Traffic von der Website eines Scrapers erhalten.
Machen Sie die interne Verlinkung zur Gewohnheit, um Traffic und Backlinks von Scrapern zu gewinnen
In unseremultimativer Leitfaden für SEOempfehlen wir Ihnen, die interne Verlinkung zur Gewohnheit zu machen. Indem Sie in Ihren Blogbeiträgen Links zu Ihren anderen Inhalten platzieren, können SieErhöhung der Seitenaufrufe und Verringerung der Absprungrate auf Ihrer eigenen Website.
Aber es gibt noch einen zweiten Vorteil, wenn es um Scraping geht. Interne Links verschaffen Ihnen wertvolleBacklinks von den Leuten, die Ihre Inhalte klauen. Suchmaschinen wie Google verwenden Backlinks als Ranking-Signal, so dass die zusätzlichen Backlinks gut für Ihre SEO sind.
Und schließlich können Sie mit diesen internen Links das Publikum des Scrapers abwerben. Talentierte Blogger platzieren Links aufinteressante StichworteDadurch werden die Nutzer zum Klicken verleitet. Die Besucher der Scraper-Website werden auch auf die Links klicken, die sie direkt auf Ihre eigene Website zurückführen.
Auto-Link Keywords mit Affiliate-Links, um Geld von Scrapers zu verdienen
Wenn Sie mit Ihrer Website Geld verdienen durchPartnermarketingdann empfehlen wir, die automatische Verlinkung in Ihren RSS-Feeds zu aktivieren. Auf diese Weise können Sie Ihre Einnahmen von Lesern, die Ihre Website nur über RSS-Reader lesen, maximieren.
Noch besser: Sie können damit Geld von den Websites einnehmen, die Ihre Inhalte stehlen.
Verwenden Sie einfach ein Plugin wieThirstyAffiliates die zugewiesene Keywords automatisch durch Affiliate-Links ersetzt. Wie das geht, zeigen wir Ihnen in unserem Leitfaden aufwie man automatisch Schlüsselwörter mit Affiliate-Links in WordPress verknüpft.
Bewerben Sie Ihre Website in Ihrer RSS-Fußzeile
Sie können dieAlles in Einem SEO Plugin, um benutzerdefinierte Elemente zu Ihrer RSS-Fußzeile hinzuzufügen.
Sie können zum Beispiel ein Banner hinzufügen, das Ihre eigenen Produkte, Dienstleistungen oder Inhalte bewirbt.
Das Beste daran ist, dass diese Banner auch auf der Website des Scrapers erscheinen.
In unserem Fall fügen wir immer einen kleinen Haftungsausschluss am Ende der Beiträge in unseren RSS-Feeds ein. Auf diese Weise erhalten wir einen Backlink zum Originalartikel von der Scraper-Website.
So können Google und andere Suchmaschinen erkennen, dass wir die Autorität sind. Es lässt auch ihre Nutzer wissen, dass die Website unsere Inhalte klaut.
Die beliebtesten Beiträge