Vermutungen oder Fakten als Basis für Design-Empfehlungen
Selbst winzige Mengen von empirischen Fakten (sagen wir, die Beobachtung von zwei Nutzern) vergrössern die Wahrscheinlichkeit, richtige Entscheidungen über das Design der Nutzeroberfläche zu treffen, erheblich.
by Jakob Nielsen (deutsche Übersetzung) - 08.06.2009
Sollte man den Nutzern Hilfe anbieten, um die Schriftgrössen einzustellen, oder kann man sich da einfach auf die im Browser eingebauten Befehle verlassen? Diese Frage wurde neulich in einer Diskussionsgruppe von Interaktionsdesignern gepostet (die ich hier nicht nennen will, um die Anonymität der unten zitierten Personen zu wahren).
12 Personen haben auf die Frage geantwortet. Die meisten haben einfach ihre persönliche Meinung gesagt, was sie für richtig halten. Sicher: Alle Menschen sind Experten, was ihre eigenen Vorlieben angeht. Aber hier gab es sechs Kommentare zu der Frage, was für andere Leute besser wäre.
2/3 dieser Beiträge waren reine Vermutungen, während 1/3 sich auf irgendeine Form von Fakten in Form von empirischen Nutzerbeobachtungen stützte.
Die Vermutungen:
- "Heutzutage [...] wissen die meisten Leute, die die Schriftgrössen in ihrem Web-Browser vergrössern wollen, wie man das macht." FALSCH!
- "Wer es wirklich nötig hat, die Schrift zu vergrössern, wird das per Browser machen; das ist ja nicht schwierig." FALSCH!
- "Wir haben nicht 1995; es sind doch nicht alle Leute über 50 solche Anfänger, dass sie nicht wissen, wie man die Schriftgrösse im Browser umstellt." FALSCH!
- "Die Leute, die das stärkste Bedürfnis haben, die Schrift zu vergrössern, sind über 65; und genau das ist die Gruppe, bei der es am wenigsten wahrscheinlich ist, dass sie fit genug sind, um die richtigen Einstellungen zu haben." RICHTIG!
Die Fakten:
- "Für meine Eltern musste ich das von Hand umstellen; der Prozentsatz von Leuten über 65, die immer schlauer werden, wächst zwar in erstaunlichem Tempo - aber versteckte Funktionen wie die Einstellung der Textgrösse entgehen ihnen oft." RICHTIG!
- "Ich habe Usability-Studien über Websites gesehen, die eine Vorrichtung zum Ändern der Textgrösse eingebaut haben [...] Die meisten, wenn nicht sogar alle Teilnehmer [...] hatten keine Ahnung, was das sein soll." RICHTIG!
Fakten schlagen Vermutungen
Die allgemeine Richtlinie sagt, dass man relative Schriftgrössen verwenden soll, so dass die Nutzer die Schriftgrösse ändern können (wenn sie wissen wie), und die grosse, gut lesbare Schrift als Voreinstellung zu nehmen. Diese Schlussfolgerung basiert auf zahlreichen Beobachtungen, die zeigen, dass viele ältere Nutzer nicht die Fähigkeit haben, die Schriftgrösse zu ändern.
In unserer beispielhaften Diskussionsgruppe:
- lagen die Designer, die auf externe Fakten zurückgegriffen haben, zu 100% richtig, während
- die Designer, ich auf ihre persönliche Meinung verlassen haben, zu 25% richtig lagen.
Schlagender noch: 75% der Vermutenden lagen falsch. Sie hätten besser eine Münze geworfen, als diese Leute um Rat zu fragen.
In diesem einfachen Beispiel hat der Versuch, seinen Rat auf eine minimale Menge empirischer Beobachtungen von realen Nutzern zu stützen, die Wahrscheinlichkeit, richtig zu liegen, vervierfacht.
Eine Warnung: Auch wenn Daten von Ihren Eltern besser sind als gar keine Daten, rate ich davon ab, Design-Entscheidungen auf Ihre Familienmitglieder zu stützen, weil diese wahrscheinlich schlauer sind als Durchschnittsnutzer. (Weil Sie schlauer sind, da Sie jemand sind, der etwas von Usability versteht.) Aus Studien mit Kindern und Teenagern wissen wir, dass durchschnittliche Kids und Teens viel grössere Schwierigkeiten haben, Websites zu benutzen, als man denken möchte, wenn man Internet-Verantwortliche stolz erzählen hört, wie fit ihr Nachwuchs im Internet ist.
Schon zwei Nutzertests schlagen die Vermutungen
Unser Beispiel mit der Schriftgrösse ist zwar schlagend, aber es basiert nur auf einem kleinen Satz Antworten. Ein anderes Beispiel liefert eine ähnliche Schlussfolgerung mit einer grösseren Stichprobe.
Wir haben zwei verschiedene Arten, Bankkonto-Informationen anzuzeigen, mit jeweils 76 Nutzern getestet, sowie mit 152 Teilnehmern in einem subjektbezogenen Vergleichstest. Wir haben die Nutzer gebeten, Aufgaben zu erfüllen wie das Kontrollieren ihres Kontostandes oder herauszufinden, welche Zinsrate die Bank aktuell anbietet. Die Ergebnisse waren wie folgt:
Usability-Metrik | Design A | Design B |
Erfolgsrate (über vier Aufgaben) | 56% | 76% |
Zeit für die Erledigung der Aufgaben (min:s) | 5:15 | 5:03 |
Subjektive Zufriedenheit (Skala 1-5, 5 am besten) | 2.8 | 3.0 |
Bei allen drei Usability-Attributen hat Version B besser abgeschnitten, allerdings war nur die Differenz bei den Erfolgsraten gross genug, um statistisch signifikant zu sein. Insgesamt jedoch besteht kein Zweifel, dass B besser war.
(Bei anderen Studien gewinnen manchmal beide Designs jeweils in unterschiedlichen Usability-Attributen. Zum Beispiel fühlen sich die Leute manchmal bei einem Design erfolgreicher, während das andere ihnen hilft, die Aufgabe schneller zu erledigen. In solchen Fällen müssen Sie vielleicht einen Kompromiss finden oder, wenn möglich, ein drittes Design kreieren, das die besten Aspekte der beiden Alternativen vereint.)
In diesem Fall habe ich die Designs A und B 21 Leuten gezeigt, die an einem Kurs für Interaktionsdesign teilnahmen, und habe sie gefragt, welches davon sie der Bank empfehlen würden. Wenn sie sich nur auf ihre persönlichen Vermutungen verlassen haben, welches Design das beste sei, lag die Wahrscheinlichkeit, dass sie das bessere Design empfohlen haben, bei 50%. Also nicht besser, als wenn man eine Münze wirft. (Die Münze Ihres Vertrauens zu befragen ist ein einfacher Weg, Beraterhonorare einzusparen.)
Dann habe ich eine andere Gruppe von 38 Leuten, die den gleichen Kurs besuchten, gebeten, die beiden Designs jeweils mit 2 Nutzern zu testen. Nun, gestützt auf empirische Beobachtungen mit 2 Nutzern pro Alternative, lag die Wahrscheinlichkeit, dass sie das bessere Design empfahlen, bei 76%.
Eine andere Sichtweise auf dieses Ergebnis ist: Tests mit zwei Nutzern pro Design reduzieren die Wahrscheinlichkeit, falsch zu liegen, von 50% auf 24% - also auf die Hälfte. Natürlich ist eine Wahrscheinlichkeit von 24%, das falsche Design zu erwischen, nicht gut genug, wenn es um Design-Entscheidungen mit hoher Rendite geht, so dass wir in solchen Fällen mehr als zwei Nutzern pro Design zu testen pflegen. (Ich empfehle gewöhnlich fünf Nutzer.)
Doch selbst eine so extrem verkleinerte Studie mit nur zwei getesteten Nutzern pro Design hat die Empfehlung gegenüber der Münzwurf-Variante der Vermutungen enorm verbessert.
(Bei dieser Studie sahen die beiden Versionen gleich gut aus, was bei quantitativen Studien wichtig ist. Wenn Sie einen grob geschnittenen Prototypen mit einem voll ausgefeilten Grafik-Design vergleichen, verzerren Sie die Ergebnisse.)
Wenn Vermutungen schrecklich in die Irre gehen
Wenn wir die beiden Fallstudien vergleichen, dann hatte das Vermutungsfeld aus dem Schriftgrössen-Beispiel die bei weitem schlechteste Leistung. Eine Person, die ihre Design-Entscheidung auf diesen Vermutungen aufgebaut hätte, hätte in ¾ der Fälle falsch gelegen. In dem Banken-Beispiel hätte sie nur in der Hälfte der Fälle falsch gelegen.
Wie kam es zu den miserablen Vermutungen in der Diskussionsgruppe? Die Antwort liegt in folgenden beiden Floskeln:
- "Heutzutage..." ("In this day and age...")
- "Wir haben nicht mehr 1995..." ("It’s not 1995...")
Leider weigern sich zu viele Web-Designer an die Dauerhaftigkeit von Usability-Ergebnissen zu glauben. Zu denken, dass etwas, das in der Vergangenheit schwierig war, inzwischen sicher einfach ist, hat schon viele Websites ins Verderben geführt.
Wenn wir wirklich reale Nutzer studieren, sehen wir, wie langsam sie neue Techniken erlernen, und wie geringfügig sich ihre Fähigkeit verbessert hat, kunstvolle Websites zu nutzen. Und, besonders wichtig: Wir sehen, wie wenig sich die Nutzer darum kümmern, kunstvolle Web-Techniken zu erlernen. Die Leute wollen reinkommen, ihr Ding erledigen und wieder rausgehen. Sie wollen nichts lernen.
Vermutungen gehen in die Irre, weil viele Designer verzweifelt an die Potenziale ihres fortgeschrittenen Designs glauben wollen. Sie können es einfach nicht fassen, wie wenig die meisten Leute über ihre technischen Lieblingsspielzeuge wissen.
(Ja, bei unseren jüngsten Tests haben wir ein paar kleine Fortschritte bei den Fähigkeiten der Nutzer gefunden, aber der Fortschritt ist sehr langsam; besser, Sie glauben daran, dass der Einfachheit auch noch in Jahrzehnten der Tag gehören wird.)
Der lange Weg zu einem Bisschen Fakten
In meinen beiden Beispielen oder die Wahrscheinlichkeit, die richtige Design-Entscheidung zu treffen, durch minimale Mengen empirischer Daten enorm verbessert: die Beobachtung der eigenen Eltern, oder Tests mit zwei Nutzern pro Design.
Natürlich wäre eine grössere Studie besser, aber auch minimale Fakten sind besser als gar keine Fakten. Wie viele Design-Entscheidungen treffen Sie ohne die geringste empirische Beobachtung des Verhaltens Ihrer Kunden?
© Deutsche Version von Jakob Nielsens Alertbox. Institut für Software-Ergonomie und Usability AG. Alle Rechte vorbehalten.
Kommentare auf diesen Beitrag