Die Sache mit der Zählerei

Analytics

Analytics

Wer irgendetwas irgendwo postet, möchte meistens auch wissen ob das jemand liest, schliesslich hat er oder sie ja Zeit, Talent, Kreativität und viel Hirnschmalz in den Beitrag investiert, vielleicht sogar Geld.
Zählen ist aber gar nicht so einfach. Zunächst ist es ein grosser Unterscheid, ob etwas „aus Leidenschaft“ passiert oder ob ein „Budget“ benötigt wird. Der leidenschaftliche Poster freut sich vermutlich über Anerkennung, steht aber meist über der Erbsenzählerei von Zugriffszahlen. Es geht „um Wichtigeres“.
Alle anderen, nicht ganz so leidenschaftliche Menschen, werden aus unterschiedlichen Gründen durchaus mal nach Zugriffszahlen ihrer Beiträge gefragt. Und genau an diesem Punkt stellt man fest, dass es gar nicht so einfach ist, eine Antwort auf diese doch so einfache Frage zu geben.

Das, was man relativ einfach messen kann, ist der Zugriff auf eine Website. Wenn ein Browser eine Website aufruft, muss sie ja von einem Webserver nach den Regeln des HTTP Protokolls ausgeliefert werden.

Webserver Log Dateien

Wenn der Webserver etwas ausliefert, schreibt er den entsprechenden Statuscode mit einer Meldung in eine Zeile des Zugriffslogs. Das Log ist eine Textdatei, die bei jedem Webhosting „einfach“ lesbar ist. Hier ein Beispieleintrag.

91.106.164.136 - - [21/Jan/2019:08:31:27 +0100] "GET /2019/01/21/das-webform-modul-fuer-drupal-8-ist-stable/ HTTP/1.1" 200 23169 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.71 Safari/537.36"

Am 21. Januar 2019 um 8:31 ist von der IP Adresse 66.249.92.95 auf den Artikel blog.novatrend.ch/2019/01/21/das-webform-modul-fuer-drupal-8-ist-stable/ mit einem Firefox kompatiblen Browser von einem Apple Rechner zugegriffen worden. Die Website mit dem Artikel wurde erfolgreich ausgeliefert (Statuscode 200). Aus diesem kleinen Eintrag kann man bereits ein paar Sachen ableiten.

Hinweis: An dieser Stelle weise ich darauf hin, dass das natürlich nur ein Beispiel ist und ich jetzt gar nicht die Diskussion über die Speicherung von IP Adressen aufmachen möchte. Das Beispiel soll zeigen, dass eine erfolgreiche Kommunikation nur stattfinden kann, wenn Empfänger und Sender miteinander Kontakt aufnehmen können. Das kann natürlich auch Ende zu Ende verschlüsselt passieren oder über VPNs oder über TOR oder andere. Ob nun wirklich jemand aus Norddeutschland auf diesen Artikel zugegriffen hat, weiss ich nicht. Ich sehe nur diesen Eintrag im Zugriffslog des Webservers. Ein Webserver ist hochkonfigurierbar, das heisst, so ein Log kann auch anders aussehen.

Die Daten in der Logdatei nennt man Raw Data. Rohe Daten müssen/können interpretiert werden um daraus Erkenntnisse zu gewinnen. Wenn ich mehrere Einträge dieser Art gefunden hätte, könnte ich versucht sein zu interpretieren:

„In Norddeutschland wird veraltete Software benutzt und es herrscht ein grosses Interesse an Online Formularen. „

Diese Interpretation oder eher Spekulation ist vermutlich falsch und daher bedarf es weiterer Kennzeichen, um Aussagen zu treffen. Aber zum Zählen der Zugriffe reicht es doch eigentlich. Ich könnte das Webserver Log auswerten und daraus Zugriffszahlen erzeugen. Genau das machen Programme wie AWStats.

AWStats wertet Logdateien aus

AWStats findest du bei uns im Kontrollzentrum (cPanel) und es bietet dir interessante Einsichten über die Nutzung deiner Website. Als Beispiel hier ein Screenshot vom Novatrend Blog aus dem Monat November 2018.

Es handelt sich dabei um die kumulierten Rohdaten. Ich frage mich schon, warum ein Blog mit deutschen Texten so beliebt in den USA ist. Hier beginnt aber die Interpretation und da bin ich auch einfach überfragt. Die Gründe können vielfältig sein.

Ausser den kumulierten Länderzugriffen gibt es auch Browserversionen, Betriebsysteme und die reinen Zugriffe. Ich kann mir mit AWStats also einen Eindruck von der Nutzung des Blogs verschaffen.
Hier beispielsweise die Zugriffe für das Jahr 2018

Mit dieser Auflistung könnten im Prinzip alle glücklich sein. Der leidenschaftliche Blogger erhält ein Gefühl wie viele Besucher sich für ihn interessieren und der Budget Verantwortliche sieht einen Gegenwert für die Investition (oder eben nicht 🙂 ).

Cookies

Um „genauere Daten“ zu ermitteln, beispielsweise ob jemand ein wiederkehrender Besucher ist, muss man etwas im Browser des Benutzers hinterlassen, das bei einem erneuten Besuch wieder erkannt wird. Das nennt man Cookie. Im HTTP Protokoll können auch Cookies gesetzt werden. Der Webserver sagt dem Browser, er soll bitte eine Variable und einen Wert speichern (name=wert). Wenn von diesem Browser die Website erneut besucht wird, darf der Webserver diesen Wert lesen. Im Beispiel handelt es sich um Google Analytics Cookies.

Cookie

In einem Cookie kann (und wird) alles mögliche gespeichert. Das können ganz wichtige Informationen sein, wie beispielsweise ein Kennzeichen, dass man bereits eingeloggt ist. Wenn es die Möglichkeit ein Cookie im Browser zu setzen nicht geben würde, müsste man sich bei jedem Seitenaufruf neu einloggen.

Es können aber natürlich auch andere Informationen gespeichert werden. So ein Cookie hat auch ein Haltbarkeitsdatum, genau wie ein echter Keks. Der Webserver liefert auch dieses Haltbarkeitsdatum mit. Wenn es um das oben beschriebene Kennzeichen geht, ist die Haltbarkeit vielleicht 10 Minuten. Cookies können aber auch 30 Jahre gültig sein.

Matomo

Matomo ist eine freie Software zur Analyse von Daten. Sie lässt sich bei uns mit Softaculous automatisiert installieren und aktualisieren. Matomo kann eine oder mehrere Websites analysieren. Pro Website wird jeweils ein Cookie mit einem einjährigen Verfallsdatum gesetzt. Matomo erkennt dadurch wiederkehrende Benutzer und kann daher genauere Auswertungen liefern.

Hier ein Beispiel aus meinem privaten Blog

Matomo – Besucherübersicht pro Woche

Matomo ermöglicht vielfältige professionelle Auswertungsmöglichkeiten, kann auch Kampagnen verfolgen und bietet eine Menge Features.

Google Analytics

Google bietet mit Analytics DAS Analyseprogramm für Websites an. Google Analytics setzt Cookies mit einer Haltbarkeit von zwei Jahren. Durch eine Kombination von Google Services kann Google mehr Daten erfassen und dadurch wiederum genauere Auswertungen bieten. Das ebenfalls von Google betriebene Anzeigensystem Google Ads agiert getrennt (zumindest nach aussen) von Google Analytics. Man erhält sehr genaue Auswertungen, liefert im Gegenzug aber die Daten seiner Besucher UND seiner Website kostenlos an Google. Das ist durchaus nicht ungewöhnlich, denn mehr als 80% der weltweit betriebenen Mobiltelefone liefern ebenfalls Daten an Google. Was Google mit diesen Daten macht ist nicht transparent. Es bleibt daher doch ein Geschmäckle.

Soziale Netzwerke

Wenn du etwas in sozialen Medien postest, möchtest du vielleicht auch wissen, wie oft dort zugegriffen wird.

Twitter

Twitter hat sein eigenes Analytics Portal. Dort erhältst du für deinen Benutzer eine von Twitter aufbereitete Statistik

Twitter Analytics

Instagram

Instagram bietet mit Insights ebenfalls Zugriffszahlen an und verbindet das gleich mit der Möglichkeit Posts zu „promoten“, also Werbung zu schalten.

Facebook Pages

Facebook Pages funktionieren wie Instagram, die beiden Services lassen sich auch verbinden. Bilder und Kommentare von Instagram erscheinen auf der Facebook Page und vice versa. Es besteht überall die Möglichkeit Anzeigen zu schalten

Facebook Page Overview

LinkedIn

Auch LinkedIn offeriert Analysetools zu Profilen und Unternehmensseiten.

LinkedIn Views eines Profil-Artikels innerhalb von LinkedIn

Auf den Unternehmensseiten wird die Analyse bereits mit der Möglichkeit von Werbung verknüpft.

Fazit

Die Zählerei ist und bleibt „so eine Sache“.

Um einen Überblick über die Zugriffe der selbst gehosteten Website zu haben, reichen tatsächlich die Serverlogs oder beispielsweise bei WordPress Plugins wie Statify. Wer detaillierte, Cookie basierte Statistiken benötigt, sollte sich Matomo genauer ansehen. Mehr Daten benötigt man selten.

Vergleichbar sind die jeweils ermittelten Zugriffszahlen von Websites nur, wenn auch die gleiche Zählmethode verwendet wird. Ob die Zahlen inhaltlich stimmen, ist nur bei bei der eigenen Auswertung von Serverlogs (z.B. AWStats) oder Datenbanken (z.B. Matomo) überprüfbar.

Google Analytics ist für „Zahlenmenschen“ verführerisch aber oft in der Tiefe gar nicht notwendig. Das Unternehmen an sich hat etwas vom Zauberlehrling. Google Analytics lässt sich DSGVO kompatibel betreiben, man hat also noch eine gewisse Kontrolle über die Daten.

Bei den Social Media Plattformen entfällt oft die Trennung zwischen Auswertung und Werbung. Wenn einem die Zugriffszahlen zu niedrig erscheinen, kann man mit einem bezahlten Boost dafür sorgen, dass mehr Besucher den Beitrag sehen. Die Zahlen, die den Boost bestätigen, sind nicht nachprüfbar.

Der Wunsch nach Auswertungen und Visualisierungen hat eine ganze Industrie erschaffen, die Aufmerksamkeit gegen Bezahlung erzeugt und dem Auftraggeber dann auf eine einfache Art dokumentiert. Zur Frage inwieweit diese Art von Auswertungen hilfreich ist, möchte ich mit folgendem Zitat enden.

Die Statistik ist wie eine Laterne im Hafen. Sie dient dem betrunkenen Seemann mehr zum Halt als zur Erleuchtung.

Hermann Josef Abs

tl;dr: Visualisierte Aufmerksamkeit ist schwer überprüfbar

Autor: hagengraf

consultant, author, trainer, solution finder, web architect, developer, open source lover, visionary, orator, the good old webmaster. Able to simplify!

Ein Gedanke zu „Die Sache mit der Zählerei“

Kommentar verfassen