Was Bot Traffic ist und wie Sie ihn ausfiltern können

Dieser Artikel wurde zuletzt aktualisiert am 26. März 2024

Im Bereich der Webanalyse sind genaue Daten für eine fundierte Entscheidungsfindung von größter Bedeutung. Bots und irrelevanter Traffic können jedoch die von Analyseplattformen gewonnenen Erkenntnisse verfälschen. Um dem entgegenzuwirken, bietet Google Analytics robuste Filtermechanismen, einschließlich Bot-Filterung und IP-Filterung. Mit der zuletzt erfolgten Umstellung auf Google Analytics 4 (GA4) fragen sich die Nutzer vielleicht, wie sich diese Filterfunktionen von Universal Analytics (UA) unterscheiden und wie sie diese effektiv nutzen können. In diesem Artikel befassen wir uns mit den Feinheiten der Bot- und IP-Filterung in GA4, untersuchen die Unterschiede zu UA und geben Einblicke in die Optimierung der Datenintegrität.

Anfang Februar 2021 hatten wir eine Reihe von Kunden, die ungewöhnliche Trafficspitzen in ihren Google Analytics-Konten feststellten. Nach einer schnellen Auswertung stellten wir fest, dass sie alle mit etwa 500 Sitzungen von einem “Traffic-Bot” betroffen waren. Da vielen Leuten nicht klar ist, warum dieser Traffic auftaucht und was er bezweckt, haben wir uns entschlossen, einen kurzen Blogbeitrag zu schreiben, in dem wir erklären, was es damit auf sich hat und wie Sie sicherstellen können, dass Ihre Analytics Konten so eingerichtet sind, dass Ihre Metriken nicht durch diese Traffic-Bots verfälscht werden.

Was ist Bot Traffic und warum taucht er in Google Analytics auf?

Bot Traffic wird, wie der Name vermuten lässt, von so genannten Bots erzeugt. Das sind automatisierte Programme, die Website-Aktivitäten wie Website-Besuche, Klicks oder das Platzieren von Kommentaren vornehmen. Es handelt sich hierbei um den neuesten Trend im Analytics-Spam (allerdings um nichts Neues) und es gibt bestimmte Websites, die solche Dienste nutzen, um ihre Website-Metriken zu beeinflussen. Da dieser “unnatürliche/gefälschte” Traffic die Website-Besuche, Absprungraten und/oder die Verweildauer auf der Seite erhöhen kann, denken einige Unternehmen wohl, dass es eine gute Idee ist, diese Dienste in Anspruch zu nehmen. 

Die Bot-Filterung dient als Schutzschild gegen Spam-Bots und irrelevanten Datenverkehr und stellt sicher, dass die Analysedaten echte Nutzerinteraktionen genau wiedergeben. In GA4 ist die Bot-Filterung standardmäßig aktiviert und nutzt die fortschrittlichen Algorithmen von Google, um bekannte Bots und Spider zu identifizieren und von der Datenerfassung auszuschließen. Diese automatische Filterung trägt dazu bei, die Integrität der Analysedaten zu erhalten, ohne dass ein manuelles Eingreifen erforderlich ist.

Wir können jedoch ganz klar sagen, dass Sie auf jeden Fall davon absehen sollten, diese Dienste zu nutzen, um Ihre Website-Metriken zu “manipulieren”. Denn diese “Bot-Sessions” spiegeln nicht das tatsächliche Nutzerverhalten wider und bringen den Überblick über Ihre tatsächlichen Website-Daten komplett durcheinander. Nochmals: Wir raten davon ab, diese Dienste zu nutzen. Sie wollen Ihre Website für tatsächliche Nutzer optimieren, und zwar ausschließlich für tatsächliche Nutzer. Deshalb ist es wichtig, Ihre Daten zu pflegen und sicherzustellen, dass Sie “unnatürlichen und unerwünschten Traffic” aus Ihrem Reporting ausschließen.

Was ist Spider Traffic?

Neben dem Bot Traffic gibt es noch eine weitere Art von Website Traffic, der Ihre Seite erreicht, aber nicht in Ihrem Analytics Report auftauchen sollte. Dieser Traffic wird von sogenannten Spiders oder Web Crawlers generiert. Normalerweise sollte dieser Traffic nicht in Ihren Analytics Daten auftauchen, Sie können ihn aber in Ihren Server Logs identifizieren. Crawler greifen auf Ihre Website zu, um Daten zu erfassen und weiterzuverarbeiten. Eine der bekanntesten Spiders ist die “Google Spider”, die das Web durchkämmt, um “neue Inhalte” zu finden. Allerdings können weitere Crawler auch Tools sein, die Sie aktiv für On-Page-Optimierung, Website-Tracking oder Uptime-Monitoring einsetzen. In den nächsten Schritten werden wir uns hauptsächlich auf gekauften Traffic konzentrieren, jedoch können die meisten der genannten Regeln auch für Spider/Crawler Traffic angewendet werden.

Wichtig! Stellen Sie immer sicher, dass Sie eine “Testansicht” in Ihrem Google Analytics Konto haben und testen Sie alle Ihre Änderungen in dieser Testansicht, bevor Sie etwas in Ihrer Produktions- oder Berichtsansicht einsetzen. Neben einer Testansicht empfehlen wir, dass Sie eine “Alle Website-Daten-Ansicht” haben, die alle Ihre Rohdaten und keinerlei Filter enthält.

Wie Sie Traffic-Bots in 7 einfachen Schritten ausschließen

Wie Sie unbekannten Bot Traffic identifizieren

Hin und wieder sehen wir in den Kundenkonten übliche Traffic-Spitzen, die von den standardmäßigen Bot- und Spider-Filtern nicht abgedeckt werden. Daher empfehlen wir, diese unbekannten Bots mit Hilfe eines Filters auszuschließen.

Bevor Sie jedoch mit dem Ausschluss von “Bot Traffic” beginnen, müssen Sie festlegen, welcher Traffic ausgeschlossen werden soll. Es gibt einige Indikatoren für unnatürlichen/ungewollten Traffic, nach denen Sie in Ihren Google Analytics-Properties suchen können. Einige der bekanntesten Indikatoren sind:

  • Plötzliche Traffic Spitzen von sehr kurzer Dauer (Stunden oder bis zu einem Tag)

  • Traffic Spitzen, mit einer Absprung-Rate von hundert Prozent oder einer

  • Verweildauer auf der Seite von 0 SekundenTraffic Spitzen von Quellen, die das Wort “Bot” enthalten

  • Hostnamen, die nicht Ihre eigene Website widerspiegeln

  • Traffic Spitzen von bestimmten und ungewöhnlichen Standorten

  • Eine 100% New Session Rate oder sehr nahe an 100%

  • Genau 1 Seite pro Session

  • Browser dimension “nicht gesetzt”

Hier ein Beispiel aus jüngster Zeit, das in der GA4-Welt ziemlich populär war, da bestimmter Bot-Traffic begann, bestimmte Eigenschaften zu füllen und dabei die Fähigkeit von GA4, Bot-Traffic automatisch zu filtern, umging. Aus der Analyse der Zahlen lässt sich eindeutig ableiten, dass es sich nicht um normalen Traffic handelt, sondern um Tausende von Nutzern und Sitzungen mit fast keinem Engagement.

Wie kann man bekannte Spiders and Bots in Google Analytics filtern?

Google ist sich der Tatsache bewusst, dass es viele Bots und Spiders gibt, die tagtäglich auf Ihre Websites zugreifen, und hatte daher eine Standardfunktion in Universal Analytics eingebaut, die “Bot-Filterung” heißt und unter den “Ansichtseinstellungen” in Ihrem Universal Analytics Adminbereich zu finden war.  Sie hatten die Möglichkeit, unter dem Abschnitt “Bot-Filterung” das Feld “Alle Treffer von bekannten Bots und Spiders ausschließen” auszuwählen. 

Dadurch wurden sofort automatisch alle bekannten Bots und Spiders von Ihrer Property in Google Analytics ausgeschlossen. Bedenken Sie, dass diese Filterung nicht rückwirkend funktioniert.  

Änderungen von UA zu GA4

Der oben beschriebene Mechanismus ist ein wesentlicher Unterschied zwischen GA4 und UA in der Art und Weise, wie Bot-Traffic heutzutage gehandhabt wird. Während in Universal Analytics die Benutzer die Bot-Filterung manuell über die Admin-Einstellungen aktivieren mussten, wird dieser Prozess in GA4 durch das automatische Herausfiltern bekannter Bots ohne Benutzereingriff rationalisiert. Diese Verbesserung in GA4 vereinfacht den Einrichtungsprozess und verringert die Wahrscheinlichkeit, dass versehentlich Bot-Traffic in Berichte aufgenommen wird.

Die IP-Filterung ermöglicht es Benutzern, bestimmte IP-Adressen oder IP-Bereiche vom Analyse-Tracking auszuschließen und so internen Datenverkehr, z. B. von Mitarbeitern, die auf die Website zugreifen, oder unerwünschte Datenverkehrsquellen zu eliminieren. Obwohl sowohl GA4 als auch UA IP-Filtering-Funktionen bieten, unterscheidet sich der Prozess der Implementierung von Filtern in den beiden Versionen leicht.

Während die Benutzer in UA zum Admin-Panel navigierten, die gewünschte Ansicht auswählten und den Bereich Filter aufriefen, um einen IP-Filter zu erstellen, ist die IP-Filterung in GA4 direkt in die Berichtsoberfläche integriert und bietet einen intuitiveren Ansatz. Benutzer können IP-Filter innerhalb des Analysis Hub definieren oder benutzerdefinierte Segmente auf der Grundlage von IP-Adressen erstellen, was eine größere Flexibilität beim Ausschluss unerwünschter Verkehrsquellen bietet.

BOT-FILTERUNG IN 2024

Bot- und IP-Filterung spielen eine zentrale Rolle bei der Aufrechterhaltung der Genauigkeit und Zuverlässigkeit von Analysedaten sowohl in Google Analytics 4 als auch in Universal Analytics.

Während GA4 den Prozess mit automatischer Bot-Filterung und integrierter IP-Filterung optimiert, bleibt das grundlegende Ziel in beiden Versionen gleich: den Nutzern umsetzbare Erkenntnisse auf der Grundlage authentischer Nutzerinteraktionen zu liefern.

Durch das Verständnis der Nuancen zwischen GA4 und den UA-Filtermechanismen und die Implementierung von Best Practices können Unternehmen die Analysedaten effektiv nutzen, um fundierte Entscheidungen zu treffen und die Online-Performance zu optimieren.

Bot Filterung in Google Analytics 4

Eine der größten Änderungen zwischen UA und GA4 ist die native Fähigkeit von GA4, Bot-Traffic automatisch zu filtern, während dies in der vorherigen Version noch manuell eingerichtet werden musste. Wie wir jedoch in unserem vorherigen Beispiel gezeigt haben, kann Bot- oder unerwünschter Traffic immer noch Ihre GA4-Eigenschaft füllen.

Was zusätzlich getan werden kann, ist die Einrichtung einer IP-Filterung in GA4. Sie können unerwünschten, internen oder Bot-Traffic filtern, wenn Sie in der Lage sind, die betreffende IP zu lokalisieren.

Gehen Sie zunächst zu Ihren Admin-Einstellungen, die Sie auf der unteren linken Seite Ihrer GA4-Eigenschaft finden, und gehen Sie zu den Data streams:

Anschließend gehen Sie weiter zu Configure tag settings:

Nun klicken Sie auf Define internal traffic (wenn Sie im obigen Schritt auf Tag-Einstellungen konfigurieren klicken, sehen Sie standardmäßig nicht alle Einstellungen unten, Sie müssen auf show more klicken.

Dann werden Sie aufgefordert, eine internal traffic rule zu erstellen, die Sie zu diesem Fenster führt:

Hier geben Sie an, um welche Art von Traffic es sich handelt (standardmäßig um internen Traffic, aber Sie können jede IP-Adresse ausschließen, die nicht in Ihre Eigenschaften aufgenommen werden soll, unabhängig davon, ob es sich um internen Datenverkehr handelt oder nicht, und einen benutzerdefinierten Namen für die Art der Regel festlegen).

Ihr Bot Traffic sollte nun ausgefiltert sein

Ihre Analysedaten sollten nun frei von störenden Bot-Sitzungen sein. Beachten Sie, dass diese Filter ab dem Zeitpunkt funktionieren, an dem Sie auf “Bereitstellen” klicken, was bedeutet, dass Ihre historischen Daten nicht “aktualisiert” werden. Wenn Sie Hilfe bei der Einrichtung und Verwaltung Ihres Google Analytics Kontos benötigen, kontaktieren Sie uns gerne über unser Kontaktformular, um zu prüfen, wie wir Ihnen weiterhelfen können. 

WIE SIE ES ZUVOR IN UNIVERSAL ANALYTICS GEMACHT HABEN

Um unbekannten Bot-Traffic auszuschließen, stellen Sie sicher, dass Sie in einer Testansicht arbeiten. Erstellen Sie eine solche, wenn Sie noch keine haben.

Sie haben nun die Option “Alle Treffer von bekannten Bots und Spiders ausschließen” gewählt und sehen dennoch Bot Traffic in Ihrem GA-Konto? Dann müssen wir diese einzeln mit Hilfe von Ansichtsfiltern ausschließen. In den nächsten 7 Schritten zeigen wir Ihnen anhand des oben verwendeten Beispiels genau, wie Sie Bot Traffic ausschließen können.

1. Identifizieren des Bot Traffics:
Identifizieren Sie die Bots, die Sie ausschließen wollen. In unserem Beispiel verwenden wir Traffic von der Quelle “trafficbot.live”

2. Zu Filtern navigieren:
Öffnen Sie den Admin-Bereich in Ihrem Google Analytics Konto, navigieren Sie zu Ihrer Testansicht und klicken Sie auf “Filter” unterhalb der Spalte “Ansicht”.

3. Erstellen Sie einen Filter:
Klicken Sie auf “Filter hinzufügen”

4. Filter-Kriterien bestimmen
Die Filterkriterien festlegen: Benennen Sie Ihren Filter, wählen Sie den “benutzerdefinierten” Filtertyp, definieren Sie das Feld, nach dem Sie filtern möchten, in unserem Fall verwenden wir “hostname” und wir definieren das Filtermuster mit regex.Da wir die folgenden Hostnamen ausschließen wollen:
Trafficbot.life
Bot-traffic.icu
Trafficbot.live
bottraffic.xyz (dieser Bot neigt dazu, mit mehreren Variablen zu arbeiten, wie z.B. bottraffic459.xyz, daher schließen wir alle Domains aus, die “bottraffic” beinhalten)
Wir werden den folgenden Regex-Code verwenden, um auch alle Variationen der oben genannten Domains auszuschließen. Kopieren Sie einfach den unten stehenden Code und fügen Sie jeden Bot, den Sie ausschließen möchten, durch .*NAME DES BOT.* getrennt durch “|” ein, was in der Regex UND bedeutet.
Filter Pattern .*trafficbot.*|.*bot-traffic.*|.*bottraffic*.

5. Verifizieren Sie den Filter
Klicken Sie auf “verify this filter”, um Ihre Filterfunktion zu testen. denken Sie daran, dass die Filter auf einer Teilmenge Ihrer Daten verifiziert werden und ältere Sender möglicherweise nicht auftauchen.

6. Speichern und Überwachen des Filters:
Klicken Sie auf “Speichern” und überprüfen Sie innerhalb der nächsten Tage, ob Ihr Bot Traffic in der Testansicht korrekt herausgefiltert wird oder nicht.

7. Einsatz in der Produktion:
Wenn Ihr Filter in der Testansicht korrekt funktioniert, ist es an der Zeit, Ihren Filter in Ihrer Berichts- oder Produktionsansicht einzusetzen, indem Sie in Ihrer Berichtsansicht auf “Filter zur Ansicht hinzufügen” klicken und “Vorhandenen Filter anwenden” auswählen und den gewünschten Filter aus der verfügbaren Filterliste auswählen und auf “Hinzufügen” klicken.

Als letzten Tipp empfehlen wir Ihnen, eine Anmerkung zu Ihrer Analytics Ansicht hinzuzufügen, um sicherzustellen, dass alle Analytics Nutzernutzer von Ihren Änderungen Kenntnis nehmen.

Neueste Beiträge

Stehen Sie vor ähnlichen Herausforderungen?

Wir würden uns freuen, mit Ihnen zu besprechen, wie wir Sie am besten unterstützen können. Zögern Sie nicht, ein kostenloses Beratungsgespräch zu einem Termin Ihrer Wahl zu vereinbaren!