Bot Detection
Die owntag Bot Detection analysiert eingehende Requests und identifiziert, ob der Request von einem Bot stammt, wie z. B. einem Suchmaschinen-Crawler oder einem SEO-Tool-Spider.
In aller Regel möchte man solche Bots insbesondere für die Web-Analyse blockieren, damit sie die von echten Nutzern gemessenen Daten nicht verfälschen.
Ob der Request von einem Bot stammt, wird im HTTP Header x-owntag-is-bot
für deinen SGTM verfügbar gemacht.
Stammt der Request von einem Bot, so ist der Wert des Headers true
, andernfalls false
.
Wie funktioniert die Bot Detection?
Die Bot Detection analysiert den User-Agent
Header der eingehenden Requests. Der Request eines normalen Nutzers sieht z. B. so aus:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3
Ein Request eines Bots sieht z. B. so aus:
CCBot/2.0 (https://commoncrawl.org/contact/)
Die Bot Detection analysiert nun den User-Agent String und vergleicht ihn mit einer Liste mit über 500 bekannten Bot-User-Agent Strings.
Auch "CCBot"
ist Teil dieser Liste, sodass in diesem Fall der Header x-owntag-is-bot
den Wert true
hat.
Wie nutze ich diese Information im SGTM?
Header auslesen
Damit du den Bot-Status auslesen kannst, musst du den Header vom eingehenden Tracking-Request auslesen. Leg dazu eine neue Variable vom Typ “Anfrage-Header” (bzw. “Request Header” in der englischen UI) mit dem Namen x-owntag-is-bot
an:
Bot-Status an GA4 senden
Wenn du die Bot-Requests nicht komplett ausschließen möchtest, kannst du den Bot-Status auch an GA4 (oder ähnlich auch an andere Tools) weitergeben und anschließend in der Analyse filtern. Damit hast du mehr Kontrolle darüber, welche Daten in deinem Tracking enthalten sind und kannst nachvollziehen, wie groß der Einfluss von Bots auf deine Daten ist.
Um den Bot-Status an GA4 zu senden, kannst du in deinen GA4 Tags einen zusätzlichen Parameter hinzufügen. In diesem Beispiel haben wir ihn bot_status
genannt:
Damit du den true bzw. false Wert des Bot-Status auch in der GA4 Oberfläche in deinen Reports anzeigen kannst, musst du dann noch den Parameter in der GA4 Konfiguration als Benutzerdefinierte Dimension hinzufügen:
Ab dann steht der Wert dir als Dimension in der GA4 Oberfläche zur Verfügung und du kannst z. B. über die Filterfunktion Daten filtern, bei denen die Dimension den Wert true
hat.
Bot-Requests ausschließen
Wenn du die Bot-Requests hingegen komplett ausschließen möchtest, kannst du den Bot-Status als Kriterium für die Auslösung von Triggern nutzen und deine Trigger nur dann auslösen lassen, wenn x-owntag-is-bot
den Wert false
hat: