• Facebook
  • Google+
  • Twitter
  • XING
13.08.2006

Datenvisualisierung von Webstatistiken: Logarithmische Diagramme und abfallende Kurven

Wenn Sie ein lineares Diagramm benutzen, um Daten aus Internet-Traffic-Logfiles auszudrucken, kann das dazu führen, dass Sie wichtige Schlussfolgerungen übersehen. Zuweilen sind komplexere Visualisierungen den höheren Aufwand wert.

 

by Jakob Nielsen (deutsche Übersetzung) - 14.08.2006

 

Immer wenn ich in meinen Usability-Seminaren doppel-logarithmische Diagramme zeige, sehe ich, wie die Augen des Publikums glasig werden. Die Leute wollen nur einfachste Datenvisualisierungen sehen. Und doch, an den komplexeren Visualisierungen führt kein Weg vorbei: Denn es sind nun einmal die Daten, die den Usability-Richtlinien zugrunde liegen, und ich muss ein paar davon zeigen.

Um zum Beispiel die Muster des Website-Traffics zu verstehen, die man bei Web-Analysen findet, sind ein paar dieser unbeliebten, komplexeren Visualisierungen leider nicht zu vermeiden. Ohne sie kann man einfach nicht erklären, was da passiert.

Betrachten Sie beispielsweise den folgenden linearen Graph meiner Logfile-Analyse zu der Frage, wie viele Besucher jede Seite einer gegebenen Website hat:

 

linearen Graph der Logfile-Analyse

Dieser lineare Graph sieht aus wie eine klassische Verteilung mit einer flachen Kurve (wie sie wirklich dem Zipfschen Gesetz entspricht). Und so ist sie auch - beinahe. Der Unterschied zwischen Theorie und Praxis wird aber deutlich, sobald man dieselben Daten auf logarithmische Skalen überträgt:

 

logarithmische Skala

Jetzt sieht man, dass die Kurve abfällt: Die Website hat einfach nicht genug Inhalte, um die vorausgesagte Anforderung am unteren Ende erfüllen zu können.

Ohne diesen doppellogarithmischen Kunstgriff hätten wir nie das Potenzial der Website gesehen, mehr Zugriffe zu erzielen, indem man grosse Mengen weniger wichtiger Inhalte hinzufügt. Ich staune, wie oft Artikel, die den Internetverkehr oder andere Geschäfte mit dieser abfallenden Kurve analysieren, lineare Diagramme verwenden und nicht zeigen, was wirklich passiert.

Um Ereignisse mit grossem und Ereignisse mit geringem Volumen im gleichen Diagramm miteinander zu vergleichen, sind logarithmische Skalen normalerweise am besten. (Wenn Sie mit Excel arbeiten, bekommen Sie logarithmische Skalen, wenn Sie einfach auf jede Achse doppelklicken, im Dialog "Achsen formatieren" den Reiter "Skalierung" anklicken und dort die Option "logarithmische Skalierung" auswählen.)

Zusätzlich zur abfallenden Kurve habe ich in meiner ursprünglichen Analyse eine Ausbuchtung in der Kurve für Suchanfragen gefunden - ein weiteres Phänomen, das nur in einem doppellogarithmischen Diagramm zum Vorschein kommt.

Wie man mit der abfallenden Kurve wedelt

Nun, was würde passieren, wenn die Website unseres Beispiels ihre abfallende Kurve bis zur Geraden anheben könnte, die das theoretisch vorhergesagte Traffic-Potenzial repräsentiert?

Bei meiner Analyse lag der gegenwärtige Traffic auf 1000 Seiten bei 2,6 Mio. Seitenabrufen im Laufe von 8 Wochen. Mit 260.000 Seiten könnte die Website ihren Traffic im gleichen Zeitraum voraussichtlich auf 4,8 Mio. Seitenabrufe steigern. Das heisst, die 259.000 neuen Seiten mit geringem Verkehr würden 2,2 Mio. Seitenabrufe erzielen, bei einem Durchschnitt von 9 Abrufen pro Seite.

Wenn wir nun aus den 8 Wochen ein ganzes Jahr machen, würde sich der gesamte Traffic fast verdoppeln - von 16,9 Mio. auf 32,2 Mio. Seitenabrufe -,wobei auf jede neue Seite im Schnitt 58 Abrufe entfielen.

Was sind 58 Seitenabrufe wert?

Im Verlauf der letzten Jahre hat Yahoo! mit jedem Seitenabruf ausserhalb der Suche zwischen 0,2 und 0,4 Cent verdient [Angaben in $]. Allerdings glaube ich, dass die Online-Werbung überbewertet ist und dass sich die Werbetreibenden etwas vormachen und zu viel bezahlen. Auf längere Sicht wird der Werbewert ausserhalb der Suche auf 0,1 Cent pro Seite oder weniger sinken.

Mithin haben 58 Seitenabrufe bei einem langfristig zu erwartenden Wert von 0,1 Cent pro Abruf einen Wert von 6 Cent. Wenn wir annehmen, dass die neuen Seiten fünf Jahre lang Traffic anziehen und von den zukünftigen Einnahmen 10% pro Jahr abziehen, liegt der gegenwärtige Wert jeder neuen Seite bei 24 Cent.

Das ist nicht viel. Allerdings sprechen wir von 259.000 Seiten, daraus ergibt sich ein Gesamtwert von $ 62.000.

Das hört sich nach einer hübschen Summe an - aber könnte die Website für $ 62.000 259.000 neue Seiten produzieren? Natürlich nicht, falls die Mitarbeiter, die die Seiten machen, ein normal übliches Salär verdienen.

Der einzig machbare Ansatz ist der, den heutzutage viele Websites wählen: Man bringt die Nutzer dazu, Inhalte kostenlos beizutragen. Allerdings ist auch dafür ein System für Nutzerbeiträge nötig, das (wenn man es richtig machen will) wiederum Nutzertests und andere Qualitätssicherungen erfordert, bevor man es online stellen kann. Wenn die Funktionen des Systems nicht besonders anspruchsvoll sind, könnte es unsere Beispiel-Website wahrscheinlich für weniger als $ 62.000 entwickeln. Aber es wäre nicht kostenlos.

Ergebnis der Analyse?

Wahrscheinlich würde es sich für unsere Beispiel-Website nicht auszahlen, aus der Gelegenheit den Nutzen zu ziehen, welcher die Logfile-Analyse aufgezeigt hat. Das Ende der abfallenden Kurve zahlt sich für Sammler aus, die ihre Produkte von anderen bekommen, aber Unternehmen, die alles selbst entwickeln müssen, lassen die abfallende Kurve lieber abfallende Kurve sein.

Das heisst, ein Blick auf das Ende der abfallenden Kurve könnte von Nutzen sein, wenn eine Website eine der beiden folgenden Bedingungen erfüllt: Sie kennt einen besseren Weg, aus Traffic Geld zu machen, als schwach frequentierte Anzeigen, oder sie hat so viele Nutzer, dass das Gesamteinkommen substanziell höher wäre als die Entwicklungskosten der neuen Funktionalität.

In jedem Fall sollten Sie für Ihre eigene Website solche ROI-Szenarios erforschen. Dafür brauchen Sie korrekte Datenanalysen, und dafür wiederum bessere Visualisierungen als die, die man gewöhnlich sieht. Wie Sie sehen, liegt eine Chance in logarithmischen Kurven - ungeachtet ihrer abschreckenden Bezeichnung.

Um Missverständnisse zu vermeiden: Sie sollten natürlich keine Logfile-Diagramme in Websites präsentieren, die auf ein breites Verbraucherpublikum abzielen. Die sind nur für den internen Gebrauch gedacht - oder für Websites wie meine, die auf ein intellektuelles Publikum abzielt.

 

© Deutsche Version von Jakob Nielsens Alertbox. Institut für Software-Ergonomie und Usability AG. Alle Rechte vorbehalten.

Kommentare auf diesen Beitrag

    Keine Kommentare

Kommentar hinzufügen

Die mit * gekenzeichneten Felder sind zwingend auszufüllen