Logfile-Analyse mit Matomo im Vergleich zur Cookie-Verpixelung

In einem vorherigen Beitrag habe ich die Logfile-Analyse mit Hilfe von Matomo als alternative Variante zum normalen Cookie-basierten Tracking vorgestellt. Die Logfile-Analyse benötigt keine Cookies und setzt auf keine Fingerprinting-Technologien, so dass sie im Allgemeinen aus Datenschutz-Sicht unkritisch gesehen wird. Voraussetzung für Datenschutz-konforme Nutzung ist, dass die IP-Adressen sich anonymisiert im Logfile befinden, in dem die letzten beiden Bytes durch eine „0“ ersetzt wurden. Das erreicht man durch Einstellungen am Webserver.

Dieser Beitrag soll nun die Messergebnisse vergleichen, wenn das Besucherverhalten einer Webseite einerseits mit dem normalen Tracking („Verpixelung“ mit Cookies) und mit der Logfile-Analyse andererseits in Matomo gemessen werden.

Der Vergleich wurde anhand einer konkreten Blog-Webseite vorgenommen.

Hinweis: Die technische Verwendung des Log-Analytics-Tools betrachte ich in diesem Beitrag nicht. Hier verweise ich auf die Links am Ende.

Normales, herkömmliches Tracking mit Matomo

Um die Qualität von Messergebnissen beim weitverbreiteten Tracking mit Cookies richtig einzuordnen, möchte ich zunächst erklären, warum dieser Ansatz, obwohl populär, abgesehen von der Kritik an Cookies auch Nachteile hinsichtlich der Genauigkeit der Messergebnisse besitzt .

Unter dem normalen, herkömmlichen Tracking mit Matomo wird verstanden, wie auch bei anderen Tools wie Google Analytics, eTracker, Webtrekk und im weitesten Sinne einem Facebook-Pixel, dass im HTML einer Webseite ein JavaScript-Code der jeweiligen Tracking-Plattform verbaut ist. Dieser Code wird im Browser des Besuchers ausgeführt, sobald der Besucher auf die Webseite kommt. Dabei werden auch Cookies geschrieben, die zur späteren Identifizierung des Besuchers dienen, wenn er weitere Seiten desselben Webauftritts besucht.

Durch Datenschutzmaßnahmen des Nutzers, manuell oder mit Browser-Erweiterungen, kann das Tracking jedoch ausgehebelt, in die Irre geführt oder gar inaktiv gesetzt werden. Dazu zählen beispielsweise

  1. Regelmäßiges Löschen von Cookies
  2. Verwendung verschiedener Browser/ Endgeräte
  3. Surfen mit dem Privat-Modus oder mit No-Tracking-Einstellung
  4. Tracking Opt-Out aktiviert (gesetzlich vorgeschrieben für jede Webseite)
  5. Einsatz von Antitracking- oder Adblocker-Erweiterungen im Browser

Die Auswirkungen auf die Messergebnisse hinsichtlich der Besucherzahlen sind je nach Punkt verschieden. Während die ersten beiden Punkte sogar die Besucherzahlen sogenannter eindeutiger Besucher steigen und die Anzahl wiederkehrender Besucher sinken lässt, werden durch die restlichen drei Punkte erst gar keine Besucher gezählt.

Hieran erkennt man leicht, wie ungenau die gemessenen Ergebnisse sein müssen. Eine Webseite, die von sich behauptet bspw. 5.000 Besucher in einem Monat zu haben, hat niemals wirklich 5.000 Besucher gehabt. Vermutlich war die Zahl sogar höher, jedoch wird man mit diesem Tracking-Ansatz nie herausfinden können, ob um 10 oder 25 Prozent höher. Die folgende Grafik zeigt, dass an den Stellen mit den roten „Explosionen“ bestimmte Besucher der Tracking-Messung abhandenkommen und ihre Klicks keinen Eingang in die Datenbank von Matomo (oder anderen Trackingtools) finden.

Tracking mit Matomo mit Javascript-Snippet. Adblocker, No Track

Ansicht, wie Zugriffe beim herkömmlichen Tracking mit Matomo verlaufen. Der Browser ruft beim Abruf einer Webseite Seiten und Bilder vom Webserver ab (Datenweg 1). Für das Tracking sendet der Browser an Matomo eine Anfrage (Datenweg 2), ausgelöst durch den vorherigen Aufruf der Webseite. Ist ein Adblocker (oder ähnlicher Tracking-Filter) oder der InPrivate-Modus im Browser aktiv, geht die Anfrage jedoch nicht zu Matomo. Ist die „Do not track“-Einstellung im Browser gesetzt, wird die Anfrage von Matomo verworfen.

Dass die Online-Marketing-Branche trotzdem mit diesen Zahlen seit knapp zwei Jahrzehnten operiert, erkläre ich mir wie folgt:

  1. Alternativlosigkeit bei den zu Verfügung stehenden Tools. Dieser technologische Tracking-Ansatz muss deshalb gezwungenermaßen verfolgt werden, da diese Tools mehrheitlich in Clouds betrieben werden und sie nicht an die Webserver-Logfiles herankommen – mit Ausnahme von Matomo und einigen anderen wenigen Tools.
  2. Cookies (oder auch andere Browser-basierte Speichermöglichkeiten von Besucherprofilen, wie in Webstorages) erfolgreichstes Technologie-Mittel zur Webspurenverfolgung („Verhaltensanalyse“) darstellen.
  3. Man ferner wohl davon ausgeht, dass der Anteil von Nutzern, die oben genannte Schutzmaßnahmen praktizieren, sich statistisch gleich verteilt und damit sich eine Vergleichbarkeit zwischen Zeiträumen oder zwischen Webseiten herstellen lässt. Somit also durch den Webanalysten mehr der Vergleich (Anstieg um x Prozent seit einem Jahr) als die absolute Zahl (x Besucher in einem Jahr) in den Mittelpunkt rückt.

Logfile Analyse mit Matomo

In dem erwähnten früheren Beitrag hatte ich bereits beschrieben, dass die Logfile Analyse realistischere Besucherzahlen liefern kann, jedoch einige Einschränkungen in den Trackingmöglichkeiten besitzt, vor allem wenn es um Verhaltensanalysen der Besucher oder gar Erkennung der Wiederkehr geht.

Doch was passiert überhaupt bei der Analyse der Logfiles? Folgende Grafik zeigt, dass alle Zugriffe des Nutzers auf eine Webseite im Logfile gespeichert werden und oben genannte Schutzmaßnahmen innerhalb des Browsers nicht greifen und völlig unwirksam sind.

Matomo Logfileanalyse

Ansicht, wie beim Logfile-Tracking die Daten in Matomo gelangen. Der Browser ruft Seiten und Bilder vom Webserver ab (Datenweg 1).  Für das Tracking sendet der Browser keine Anfrage mehr an Matomo. Stattdessen importiert Matomo die Logfiles vom Webserver (Datenweg 2). Adblocker oder InPrivate-Modus werden ausgehebelt.

Ein solches Webserver-Logfile enthält alle Abrufe von Inhalten oder Dateien einer Webseite. Also nicht nur die Zugriffe auf Seiten, sondern auch auf Bilder, Dokumente, aber auch technische Dateien, wie CSS oder JavaScript-Dateien. Hier ein Beispiel für einen Abruf der Seite „neues“ mit einem Bild „logo.png“.

62.214.0.0 – – [09/Jul/2019:15:25:24 +0200] „GET /neues.html HTTP/1.1“ 200 8711 „https://www.beispiel.de/start.html“ „Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36“

62.214.0.0 – – [09/Jul/2019:15:25:25 +0200] „GET /logo.png HTTP/1.1“ 200 8711 „https://www.beispiel.de/neues.html“ „Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36“

Matomo berücksichtigt nur Seiten und Dokumente. Bilder, Grafiken oder technische Dateien werden anhand ihrer Dateiendung ausgefiltert und ignoriert. Der zweite Eintrag oben würde nicht berücksichtigt.

Anhand der (anonymisierten) IP-Adresse und der gespeicherten Information zum Betriebssystem und zur Browserversion kann Matomo erkennen, ob es sich um einen Besucher handelt, der bereits schon einmal Inhalte kurz vorher innerhalb von 30 Minuten abgerufen hat. Diese Kriterien gewährleisten natürlich insbesondere aufgrund der anonymisierten IP-Adresse nur eine eingeschränkte Eindeutigkeit, so dass Matomo längstens nur Zugriffe innerhalb weniger Minuten ein- und demselben Besucher zuordnet.

Vergleich der Messergebnisse der Matomo-Messverfahren

Ich habe nun für eine Blog-Webseite die Analysezahlen mit beiden Matomo-Messverfahren ermittelt und für den Zeitraum eines Monates miteinander verglichen.

Ziele waren:

  • Wie verändern sich die Besucherzahlen?
  • Wie verändern sich die Seitenaufrufe?
  • Wie ändern sich die Verhaltenswerte, sofern sie mit der Logfile-Analyse messbar sind?
  • In welchen Geräteklassen gibt es Zuwächse/ Verluste an Besuchern?

Die folgenden Messergebnisse zeigen teilweise einen signifikanten Unterschied:

Mit Cookie
Logfile
Veränder­ung laut Logfile-Analyse
Besucher 7.233 8.065 +12%
Wieder­kehrende Besucher 1.170 5 -100%
Aufenthalts­dauer 123s 73s -41%
Abgespr­ungene Besucher 72% 78% +8%
Aktionen pro Besuch 1,8 1,5 -17%
Seitenaufrufe 10.920 12.080 +11%
Geräte Smartphone 4.698 4.676 0%
Geräte Desktop 1.617 2.389 +48%
Geräte Tablet 864 841 -3%

Besucher, Seitenaufrufe und Geräteverteilung

Die Besucherzahlen und damit auch die Seitenaufrufe sind bei der Logfile-Analyse erwartungsgemäß höher als bei der Variante des Cookie-basierten Trackings. Die eingangs in diesem Beitrag erwähnten Schutzmechanismen durch Browser oder aktiv durch Nutzer vor einem Tracking greifen. Die Statistik zeigt auch, dass diese Anti-Tracking-Maßnahmen offenbar auf Browser zurückgehen, die von Nutzern auf dem PC oder dem Laptop verwendet werden.

Wiederkehrende Besucher und Engagement-Werte

Wie schon beschrieben, werden wiederkehrende Besucher nur anhand eines 13-Monate-lang gültigen Cookies von Matomo erkannt. Bei der Logfile-Analyse fehlen Cookies generell, so dass der Abgleich nach Wiederkehr keine oder geringfügige Zahlen liefert.

Die fünf in der Statistik als wiedergekehrt ausgewiesenen Besucher waren Besucher, die vor 24 Uhr auf die Webseite kamen und nach 24 Uhr noch innerhalb von 30 Minuten nach ihrer allerersten Aktion vor Mitternacht mindestens eine weitere Aktion durchführten.

Das die Aufenthaltsdauer von Besuchern gesunken ist, wie auch die Anzahl Aktionen pro Besuch, und andererseits die Anzahl abgesprunger Besucher leicht angestiegen ist, führe ich ebenfalls auf die fehlenden Cookies zurück, die es Matomo nicht eindeutig möglich macht, Nutzer stets eindeutig (aber anonymisiert!) zu identifizieren.

Besonderheiten der Messungen von Matomo beim Cookie-basierten Tracking

Beim näheren Betrachten einzelner Seiten an bestimmten Tagen sind mir zwischen Cookie-basierter Messung und Logfile-Analyse Ergebnisse aufgefallen, welche die eben genannten Rückschlüsse bei Besuchern und Seitenaufrufen in ihrer Klarheit widerlegten

So wurden für eine bestimmte Seite an einem Tag 20 Besucher vom Cookie-Tracking und nur 14 Besucher bei der Logfile-Analyse gemessen. Statt einer Zunahme also ein Rückgang um mehr als 25%.  Woran liegt das?

Vereinfacht gesagt zählte Matomo in meinem Szenario beim Cookie-Tracking auch Zugriffe dann schon als „Besucher“, bei denen gar nicht die Seite abgerufen wurde, sondern nur ein Bestandteil davon. Oder es wurde ein Besuch gezählt, wenn lediglich auf der Seite vom Nutzer eine Interaktion ausgelöst wurde.

Das waren z.B. laut Logfile bzw. auch laut Matomo-Besucher-Log Intervall-artige Abrufe eines Favicons durch den Browser eines Nutzers bzw. ein offensichtliches Scrollen auf einem Smartphone, das eine Content-Impression vom Matomo-Inhaltstracking auslöste, welches in der Webseite genutzt wurde.

Natürlich hat irgendwann vorher – mind. über 30min zurückliegend, damit es als neuer Besuch zählte – ein Abruf der Seite im Browser dieses Nutzers stattgefunden. Der Nutzer aber, so meine Interpretation anhand der von mir angesehenen Logs, hat die Seite in einem Browser-Tab über Stunden hinweg offen gelassen oder sein Browser hatte die Seite im Browser-Cache zwischengespeichert und beim Reload nicht vom Webserver geholt.

Technisch entscheidend war, dass der Nutzer einen Cookie bei seinem ersten Besuch bekommen hat und sein Browser zu einem späteren Zeitpunkt den Cookie erneut sendete und diese Seite als Referer mit übertragen wurde. Und das zählte als Besuch!

Während also die eigentliche Seite nicht vom Webserver abgerufen wurde und in der Logfile-Analyse nicht mitzählte, gab es im Cookie-Tracking eine Besucher-Messung.

Verkehrte Welt? Ja und zugleich eine weitere Bestätigung, welche anzweifelbare Aussagekraft die Tracking-Zahlen hinsichtlich ihrer Absolutheit besitzen.

Fazit

Die Analyse der Webserver-Logfiles mit Matomo zeigt erwartungsgemäß andere Werte als die einer Webanalyse auf Basis von Tracking-Cookies. Insbesondere Antitracking-Maßnahmen auf Desktop-Browsern sorgen beim Cookie-basierten Tracking für geringere Besucher- und Interaktionszahlen. Ca. 12% mehr Besucher aus den Logfiles ermittelt zu haben, bewegt sich in Bereichen von mir bekannten Schätzungen von 10-20% von Internet-Nutzern, die durch Cookie-basiertes Tracking nicht gemessen werden.

Die Anzahl Besucher und Anzahl Seitenaufrufe, die mit dem Log-Analytics-Tool von Matomo ermittelt wurden, dürften daher näher an der Realität liegen.

Umgekehrt ergab sich jedoch auch, dass beim Cookie-basierten Tracking bereits Besuche auf Seiten gezählt werden, bei denen es gar keinen Seitenabruf gab. Auch wenn dies keine „eindeutigen“ Besucher (unique visitors) und keine eindeutigen Seitenabrufe waren, so zeigt es, dass Zahlen aus Webanalyse-Tools (und hier schließe ich auch Google Analytics mit ein) eher zum relativen Vergleich der Entwicklung über Zeiträume hinweg dienen.

Links

Logfile-Analyse in Matomo einrichten – Anleitung (Englisch): https://matomo.org/docs/log-analytics-tool-how-to/

Logfile-Analyse in Matomo einrichten – Tutorial (Video, Englisch): https://www.youtube.com/watch?v=dSoB_BDZnLo

Alternativen (Webalizer und Awstats): http://www.webalizer.org/ und https://awstats.sourceforge.io/

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.