Documentation Fundamentals

Bot Detection

Die owntag Bot Detection analysiert eingehende Requests und identifiziert, ob der Request von einem Bot stammt, wie z. B. einem Suchmaschinen-Crawler oder einem SEO-Tool-Spider.
In aller Regel möchte man solche Bots insbesondere für die Web-Analyse blockieren, damit sie die von echten Nutzern gemessenen Daten nicht verfälschen.

Ob der Request von einem Bot stammt, wird im HTTP Header x-owntag-is-bot für deinen SGTM verfügbar gemacht.
Stammt der Request von einem Bot, so ist der Wert des Headers true, andernfalls false.

Wie funktioniert die Bot Detection?

Die Bot Detection analysiert den User-Agent Header der eingehenden Requests. Der Request eines normalen Nutzers sieht z. B. so aus:

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3

Ein Request eines Bots sieht z. B. so aus:

CCBot/2.0 (https://commoncrawl.org/contact/)

Die Bot Detection analysiert nun den User-Agent String und vergleicht ihn mit einer Liste mit über 500 bekannten Bot-User-Agent Strings. Auch "CCBot" ist Teil dieser Liste, sodass in diesem Fall der Header x-owntag-is-bot den Wert true hat.

Wie nutze ich diese Information im SGTM?

Header auslesen

Damit du den Bot-Status auslesen kannst, musst du den Header vom eingehenden Tracking-Request auslesen. Leg dazu eine neue Variable vom Typ “Anfrage-Header” (bzw. “Request Header” in der englischen UI) mit dem Namen x-owntag-is-bot an:

Die Variable 'Anfrage-Header' anlegen

Bot-Status an GA4 senden

Wenn du die Bot-Requests nicht komplett ausschließen möchtest, kannst du den Bot-Status auch an GA4 (oder ähnlich auch an andere Tools) weitergeben und anschließend in der Analyse filtern. Damit hast du mehr Kontrolle darüber, welche Daten in deinem Tracking enthalten sind und kannst nachvollziehen, wie groß der Einfluss von Bots auf deine Daten ist.
Um den Bot-Status an GA4 zu senden, kannst du in deinen GA4 Tags einen zusätzlichen Parameter hinzufügen. In diesem Beispiel haben wir ihn bot_status genannt:

Den Bot-Status als GA4 Parameter hinzufügen

Damit du den true bzw. false Wert des Bot-Status auch in der GA4 Oberfläche in deinen Reports anzeigen kannst, musst du dann noch den Parameter in der GA4 Konfiguration als Benutzerdefinierte Dimension hinzufügen:

Den Bot-Status als GA4 Dimension hinzufügen

Ab dann steht der Wert dir als Dimension in der GA4 Oberfläche zur Verfügung und du kannst z. B. über die Filterfunktion Daten filtern, bei denen die Dimension den Wert true hat.

Bot-Requests ausschließen

Wenn du die Bot-Requests hingegen komplett ausschließen möchtest, kannst du den Bot-Status als Kriterium für die Auslösung von Triggern nutzen und deine Trigger nur dann auslösen lassen, wenn x-owntag-is-bot den Wert false hat:

Den Bot-Status als Trigger-Kriterium nutzen