\r\r\r\r\r\rBrowserstatistiken im WWW

Welcher Browser wird am meisten genutzt?

Es gibt Programme, die Statistiken mit Bezug zum WWW erzeugen. Diese können nur bedingt dazu gebraucht werden, Aussagen darüber zu treffen, wieviele Leser oder Besucher mit welchem Browser eine Webseite hatte. Meistens (und zu Recht) weisen die Hersteller dieser Programme ausdrücklich darauf hin, daß diese Statistiken nicht fehlerfrei sind. Manche Leute aber bestehen darauf, diese Zahlen zu mißbrauchen. Bedeutungslosen Zahlen eine Bedeutung zuweisen zu wollen, ist schlimmer, als keine Zahlen zu haben. Wenn man unvollständige Informationen hat, ist es gut zu wissen, daß man unvollständige Informationen hat, wenn man wegen dieser Zahlen Überlegungen zu Änderungen an der Seite anstellt. Webstatistiken geben den falschen Eindruck von Wissen, und das kann schlimmer sein als bewußt ignorant zu sein.

Man kann einen Vergleich zu Werbepostern ziehen. Man kann und wird niemals wissen, wieviele Leute es bemerkt oder gelesen haben.

Hat jemand mal eine Statistik für mich?

So oder ähnlich lautet die Frage immer wieder mal. Eine Antwort wird's auch hier nicht geben, aber dafür eine Erklärung, warum es keine wirklich genauen Statistiken geben kann.

Es gibt Anbieter, die verschiedene Statistiken zu allem möglichen (und unmöglichen) veröffentlichen. Ich bin mir sicher, daß man mit ein bißchen Suche eine Statistik findet, die mit der ersten nicht in Einklang zu bringen ist. Auf welche sollte man sich denn dann verlassen?

Schon diese Statistiken an sich sind schon auf unsicherer Grundlage erstellt. Es gab eine Zeit, in der man nur auf eine Seite kam, wenn man Netscape benutzte. Einige Versionen von Microsoft Internet Explorer, Opera und WebTV gaben sich also als Netscape aus. Heute hat es sich umgedreht: Browser müssen sich manchmal als IE ausgeben, um auf eine Seite zu gelangen (und das in einem browserunabhängigen Medium; aber das ist ein anderes Thema).

Aussagen über den verwendeten Browser

Es gibt nach RfC 2068 eine User-Agent-Zeile, die aber sehr sehr einfach zu ändern und damit zu verfälschen ist. Man kann dort eintragen, was man mag. Das gibt über den tatsächlich verwendeten Browser keine Auskunft. So kann Opera dann beispielsweise als Internet Explorer in der Statistik erscheinen. Es ist offensichtlich, daß das zu falschen Zahlen führt.

Logfileauszüge

Sind Logfiles verläßlicher?

Stellen wir uns mal eine Seite mit drei Frames und mehreren Bildern vor.

Jetzt kommen verschiedene Besucher mit verschiedenen Browsern und rufen diese Seite auf. Der übliche Ablauf eines Aufrufes sieht folgendermaßen aus:

Stellen wir uns vor, ich surfe also oben angesprochene Seite mit einem Browser an, der die folgenden Dateien verlangt:

Im Protokoll erscheint in der User-Agent-Zeile folgendes:

Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Mozilla/4.0 (compatible; MSIE 5.0; Mac_PowerPC)
Das sind 17 Einträge

Jetzt nehme ich einen anderen Browser, und der verlangt die folgenden Dateien:

Im Protokoll erscheint in der User-Agent-Zeile folgendes:

Mozilla/4.75 (Macintosh; U; PPC)
Mozilla/4.75 (Macintosh; U; PPC)
Mozilla/4.75 (Macintosh; U; PPC)
Mozilla/4.75 (Macintosh; U; PPC)
Das sind 4 Einträge

Jetzt benutzt jemand Lynx, um diese Seite aufzurufen:

Im Protokoll erscheint in der User-Agent-Zeile folgendes:

Lynx/2.6 libwww-FM/2.14

(Hoffentlich habt ihr einen guten <noframes>-Bereich!)

Was bedeutet das für die Statistik?

Das Analyseprogramm gibt anhand der obigen Seitenaufrufe die folgenden Zahlen aus:

77%Internet Explorer
18%Netscape
4% Lynx

Drei Leute mit drei Browsern haben die Seite jeweils einmal aufgerufen. Die Verteilung sollte also 33% zu 33% zu 33% sein. Es ist offensichtlich, daß diese Zahlen völlig voneinander abweichen.

Proxy Server

Darüberhinaus gibt es auch Proxy-Server, die diese Zahlen verfälschen. Proxy-Server werden eingesetzt, um die Netzlast zu verringern, indem Dokumente vorgehalten werden. Diese kann man sich als örtlichen Zwischenspeicher vorstellen.

Grob gesagt halten diese eine Webseite nach einem Aufruf durch einen Nutzer eine Zeitlang vor. Es ist denkbar, daß eine Seite von einem Netscape-Benutzer aufgerufen wird (das erscheint auch im Protokoll) und anschließend neun IE-Benutzer die Seiten aus dem Cache bekommen (und das erscheint nicht im Logfile!). In der Statistik erscheinen 100% Netscape, tatsächlich sind es aber nur 10%. Von David Henderson gibt es eine vereinfachte Erklärung der Arbeitsweise von Proxy-Servern (leider nur auf englisch) mit weiteren Beispielen, warum dadurch Statistiken verfälscht werden.

Verhindern von Caching?

Caching kann man verhindern. Dafür sollte man aber einen guten Grund haben, denn es erschwert dem potentiellen Leser zum einen Eure Seite zu erreichen und es erzeugt zum anderen auch unnötigen Traffic, der bezahlt werden muß. Ich bin davon überzeugt, daß das keine sonderlich gute Idee ist, nur um bessere (nicht: richtige!) Statistiken zu bekommen.

Gesamtbetrachtung

Darüber hinaus ist es auch nur unter Umständen sinnvoll Daten, wie Browserhersteller, Browserversionen und dergleichen zu erheben: Das ist dann der Fall, wenn zum einen die Daten über einen gewissen Zeitraum konstant bleiben und deren Verteilung zum anderen Auswirkungen auf die zu entwickelnde Strategie haben können.

Konstanz der Daten

Diese Daten können, selbst wenn man sie mit 100% Genauigkeit ermitteln könnte, schon in der nächsten Woche völlig anders aussehen. Zum Beispiel wenn sich ein ISP entscheidet, einen anderen Browser als bisher an seine Kunden zu verteilen. (AOL plant beispielsweise den Umstieg vom Internet Explorer zu Mozilla.)

Strategieplanung

Es kommt hier auf die Qualität (und die damit oben angesprochenen Probleme) der erhobenen Daten an.

Darüber hinaus stellt sich auch die Frage, welche Strategien man aus den gewonnenen Statistiken entwickeln kann. Für eine profitorientierte Seite wäre es wesentlich interessanter zu erfahren, ob mit einem bestimmten Browser eine bestimmte Kaufkraft korreliert. Dabei gibt es aber wieder einige unbekannte Variablen.

Was nützt das Wissen, daß 80% aller Benutzer IE 6 verwenden, bei der Entwicklung einer Strategie für eine profitorientierte Site, wenn zum Beispiel 90% dieser Benutzer über ein monatliches Haushaltsnettoeinkommen von z. B. 50 EUR (vulgo Taschengeld) verfügen?

Sinnvoller wäre da eine Strategie, die auf die 15% NN4-User Rücksicht nimmt, von denen unter Umständen 90% über ein monatl. Haushaltsnettoeinkommen von z.B. 5.000 € verfügen.

Für eine Site mit 5.000 Usern ergäbe sich mit den o. g. Zahlen folgende Rechnung:

80% (= 4.000 Benutzer) verwenden IE 6, 90% davon (= 3.600 Benutzer) sind Taschengeldempfänger. Das bedeutet: 400 der IE-6-Benutzer sind wirtschaftlich interessant.

15% (=750 Benutzer) verwenden NN 4, 90% davon (=675 Benutzer) sind reich. Das bedeutet: 675 der NN-4-Benutzer sind wirtschaftlich interessant.

Was bedeutet das für unsere Strategie? Der Autor, der aufgrund seiner Statistiken auf 80% seiner Benutzer "Rücksicht nimmt" (was immer das bedeuten mag), begeht einen Fehler; dagegen handelt der Autor, der "nur" auf 15% seiner Benutzer Rücksicht nimmt, klug.

Wenn es aber klüger ist, auf 15% der Benutzer Rücksicht zu nehmen, als auf 80% der Benutzer, drängt sich doch die Frage auf, warum ein Autor Browserverteilungen zählen soll.

Sicher, am klügsten handelt der Webdesigner, der auf alle Rücksicht nimmt - was uns erneut zur Ausgangsfrage nach dem Sinn solcher Statistiken bringt.

Quellen

Web-Technik und Anleitungen.