Bot-Traffic und Spam-Zugriffe in Analytics

Dem aufmerksamen Google Analytics Benutzer ist es vielleicht schon aufgefallen. Es gibt den "guten" Traffic, der offensichtlich von Menschen stammt und der plausible Daten erzeugt. Und es gibt den Traffic, den man mit einem Stirnrunzeln betrachtet, weil solche Zugriffe irgendwie komisch aussehen. Wie man Bot-Traffic erkennt, woher er kommt und was man dagegen tun kann, erfahrt ihr in diesem Beitrag.

In letzter Zeit kamen mehrere Kunden auf uns zu uns wunderten sich über auffälligen Traffic in ihren Analytics-Berichten. Sie baten uns, das mal genauer anzuschauen und es stellte sich heraus, dass es sich um Spam Traffic von Bots und dergleichen handelte. Grund genug, sich mit dem Thema mal genauer zu beschäftigen und unsere Erkenntnisse hier festzuhalten.

Was sind denn eigentlich Bots?

Bots im Allgemeinen sind ein Teil der Infrastruktur des Webs und prinzipiell nützlich. Sie werden u.a. von Suchmaschinen dazu benutzt, Websites zu crawlen und in den Index aufzunehmen. Dadurch können sinnvolle Suchergebnisseiten für die Nutzer ausgegeben werden. Der bekannteste ist der Googlebot.
Es gibt jedoch auch bösartigen Bot-Traffic. Dieser kann unterschiedlichen Zwecken dienen, etwa Spam, Identitätsspionage, Content- oder Datenklau.

Was ist das Problem mit Bots?

Da Bots keine echte Sitzung erzeugen, verzerren sie die Daten in Analytics und verschlechtern die allgemeine Traffic-Qualität. Diese verunreinigten Daten können zu Fehlinterpretationen führen und sind eine denkbar schlechte Grundlage, um Marketing- oder Business-Entscheidungen zu treffen.

Laut des „Bot-Traffic-Reports 2014“ des Security-Unternehmens Incapsula sind Bots für mehr als die Hälfte des weltweiten Webtraffics verantwortlich. Kleinere Websites (ca. 1.000 Visits/Tag) haben tendenziell mehr Bot-Zugriffe als große Websites (>10.000 Visits/Tag). Weiterhin legt die Studie dar, dass, egal auf welcher Website, ein Drittel des Traffics immer von bösartigen Bots stammt. In den letzten drei Jahren ist der Anteil dieser bösartigen Bots am Gesamttraffic auf Websites immer weiter angestiegen.

In dieser Infografik gibt es mehr Informationen über die Entwicklung des Bot-Traffic in 2014.

Wie erkenne ich Bots in Google Analytics?

Fake-Traffic tritt an unterschiedlichen Stellen zutage

  • Jeder hat sich wahrscheinlich schon einmal über Verweise von semalt.com, buttons-for-website.com, darodar.com oder ähnliche Seiten in den Verweisquellen gewundert.
  • Sonderbare Suchbegriffe im organischen Keyword-Report wie „ilovevitaly SEM“ sind ebenfalls ein Indiz.
  • Auch wer einen unerklärlichen Peak in den Direktzugriffen entdeckt oder immer mehr Zugriffe aus anderen Ländern wie Russland feststellt, hat wahrscheinlich ein Problem mit Bots.

Wie kann ich diesen Fake-Traffic aus meinen Daten ausschließen?

Es gibt leider keine Non-Plus-Ultra-Lösung gegen Bots.
In Google Analytics gibt es die Möglichkeit, bekannte Bots und Spider per Checkbox in den Einstellungen der Datenansicht herauszufiltern, jedoch funktioniert das bestenfalls für einen kleinen Teil der Bots.
Besser sind benutzerdefinierte Filter, mit denen man seine Google Analytics Daten so gut es geht bereinigen kann.

Ich empfehle auf jeden Fall, alle Filter zunächst einmal in einer separaten Test-Datenansicht anzulegen!

Internetanbieter filtern

Auf Bots wird man oft im Verweisbericht aufmerksam. Jedoch macht es wenig Sinn, diese Verweisquellen auszuschließen, da die Namen regelmäßig geändert werden und der Filter dann nicht mehr greift.

Beispiele für sich ändernde Verweise von Bot-Traffic
Die Namen der Verweisquellen werden immer wieder verändert. Dadurch wird das Filtern erschwert.

Den Internetanbieter (Internet Service Provider) kann man jedoch nicht so schnell wechseln. Da man den Bots kein Cookie anhängen kann, um sie beim nächsten Besuch wiederzuerkennen, werden sie immer als neue Besucher gezählt. Außerdem sind die Engagement-Werte dieser Sitzungen natürlich sehr schlecht. Man erkennt sie also an:

  • 100% Neue Sitzungen
  • 100% Absprungrate
  • nur ein Seitenaufruf pro Sitzung
  • sehr geringe durchschnittliche Sitzungsdauer (unter 10 Sekunden)
  • keine Conversions

Hat man die Bot-Provider identifiziert, kann man sie per Filter für die Zukunft ausschließen. Dazu navigieren Sie in den Verwalten-Bereich, zur Test-Datenansicht und legen in den Datenansichtseinstellungen unter „Filter“ einen neuen Filter an. So wie bei allen Filtern greifen die Einstellungen erst ab dem Zeitpunkt der Einrichtung. Historische Daten können nicht nachträglich verändert werden.

broadband customers|net by net holding|2com|customers broadband|cjsc er-telecom|llc multiscan|aroma-lesk|fttb users block|residential networks segment|ncnet

Filtereinstellungen für ISP-Bot-Filter
Viele Bot-Zugriffe kann man über den Internet-Service-Provider ausschließen.

Trotz Filter gilt: Bot-Traffic nimmt weiter zu und man muss alles Verdächtige weiterhin im Auge behalten und die Filter ggf. anpassen.

Welche Erfahrungen habt ihr mit Bots wie versucht ihr, diesem Problem Herr zu werden? Schildert eure Erfahrungen in den Kommentaren!

Alle Beiträge von Gloria

Unsere meistgelesenen Beiträge

Zwei Jahre Chromebook: Ein Erfahrungsbericht

Google Chromebook
|
Gute 25 Jahre PC-Nutzung - von Anfang an mit Windows. Dann raucht im wahrsten Sinne des Wortes mein teures und gar nicht so altes Lenovo-Notebook ab. Und ich bestelle mir einfach ein Chromebook und bin schneller weg aus der Windows-Welt, als ich es für möglich gehalten hätte. Zwei Jahre ist das nun her - und ich habe zwischendurch immer wieder über meine Erfahrungen mit dem Chromebook berichtet.