• Facebook
  • Google+
  • Twitter
  • XING
28.02.2016

Microsoft Desirability Toolkit, um die visuelle Attraktivität zu testen

Die Meinung der Nutzer kann mit einem kontrollierten Vokabeltest gemessen werden: zeigen Sie Nutzern eine Liste von Begriffen, die eine Reaktion auf das Produkt beschreiben, und bitten Sie sie, jene auszuwählen, die das Design am besten repräsentieren.

© vege

 

by Kate Meyer (deutsche Übersetzung) - 28. Februar 2016 

 

Neben Zufriedenheitsbewertungen oder einer qualitativen Kommentaranalyse hilft auch der Microsoft Desirability Toolkit (auch Microsoft Reaction Card Methode genannt) Designern dabei, die Reaktion der Nutzer auf die Ästhetik einer Webseite zu erfassen.

Diese Methode der Desirability-Messung wurde von Joey Benedeck und Trish Miner zum ersten Mal im Jahr 2002 in der Publikation „Measuring Desirability: New methods for evaluating desirability in a usability lab setting“ erwähnt. Benedeck und Miner entwickelten eine Methode, mit der emotionale Reaktionen, wie Attraktivität und Spass gemessen werden können. Sie erstellten 118 Karten mit verschiedenen Begriffen, die die Reaktion auf ein Produkt beschreiben. Am Ende des Usability-Tests erhielten die Teilnehmer die Karten und wurden gebeten, jene fünf Begriffe auszuwählen, die das Produkt am besten beschrieben.

(Diese Karten werden „Microsoft Reaction Cards“ genannt, da die Studie im Jahr 2002 bei Microsoft durchgeführt wurde.)

Ein Vorteil dieser Methode ist, dass den Teilnehmern ein limitiertes Vokabular zur Verfügung gestellt wird. Die Variabilität der Begriffswahl bei einer freien qualitativen Bewertung kann für die Datenanalyse nämlich problematisch sein. Ein Forscher muss zum Beispiel herausfinden, was die Teilnehmerin damit meinte, als sie das Design als „interessant“ beschrieb. (Selbst ein limitiertes Vokabular kann dieses Problem nicht komplett eliminieren – ich traf einmal einen Studienteilnehmer, der das Wort „raffiniert“ auf einzigartige Weise negativ interpretierte.)

Die ganze Liste der Begriffe, die Reaktionen auf Produkte beschreiben, ist relativ lang und komplex. Die Begriffe decken eine Vielzahl von möglichen Reaktionen auf Elemente des visuellen Designs, verwendete Mikrokopien, Funktionen und das gesamte Nutzererlebnis ab. Hier sind einige Beispielbegriffe:

  • Befähigend
  • Aufgeschlossen
  • Unzusammenhängend
  • Freundlich
  • Irrelevant
  • Herablassend
  • Stabil

Um diese Methode anzupassen, damit sie nur die visuelle Attraktivität berücksichtigt, empfehlen wir, die Begriffsliste anzupassen. Sie sollten aber einige Dinge bedenken, während Sie die Liste kürzen:

  • Welche Begriffe Sie mit einbeziehen, hängt davon ab, was Sie messen möchten. Inkludieren Sie Begriffe, die Nutzer Ihrer Meinung nach verwenden, um die Nutzeroberfläche zu beschreiben, sowie Begriffe, die für Ihre Studienziele relevant sind. Scheuen Sie nicht davor zurück, der Liste Ihre eigenen Wörter hinzuzufügen.
  • Um die Attraktivität zu messen, sollten Sie Begriffe entfernen, die nur für Funktionen, Inhalte oder Performance relevant sind (wie „steuerbar“, „zu technisch“ oder „langsam“).
  • Es dauert lange, eine Liste mit 118 Begriffen zu lesen und zu prüfen – selbst bei Usability-Studien im Labor. Falls Sie ein Umfrageformat (besonders eine Online-Umfrage) verwenden möchten, sollten Sie die Anzahl der Begriffe reduzieren. 25 oder weniger Begriffe sind ideal. Es gilt: je weniger desto besser, sofern Sie noch genügend Begriffe haben, um alle möglichen Reaktionen abzudecken. Indem Sie die Anzahl der Begriffe reduzieren, vermeiden Sie Erschöpfung und stellen eine höhere Antwortrate sicher.
  • Zeigen Sie die Begriffe, falls möglich, in zufälliger Reihenfolge an. So können Sie den Einfluss fauler Teilnehmer, die sich die Anleitung nicht durchlesen und einfach die ersten fünf Wörter auswählen, reduzieren (das ist eher bei Online-Umfragen ein Problem).
  • Beziehen Sie eine Vielzahl von Begriffen mit ein: negative, positive und neutrale. Ihre Resultate sind nicht sinnvoll, wenn die Teilnehmer nur lobende Begriffe auswählen, um Ihre Nutzeroberfläche zu beschreiben. Benedek und Miner zielten darauf ab, mindestens 40% negative Begriffe in ihre ursprüngliche Liste miteinzubiehen.
  • Nutzer müssen nicht mit dem Design interagieren. Indem Sie den Teilnehmern einfach einen Screenshot oder ein Designmodell zeigen, reduzieren Sie Ablenkungen, die aus der Beurteilung von Inhalten oder Funktionen entstehen.

In unserer Online-Umfrage zur Messung der Attraktivität von Flat Designs verwendeten wir diese angepasste Liste von Reaktionen auf ein Produkt:

  • Langweilig
  • Hektisch
  • Ruhig
  • Billig
  • Kreativ
  • Modern
  • Aufregend
  • Teuer
  • Vertraut
  • Frisch
  • Beeindruckend
  • Innovativ
  • Inspirierend
  • Einschüchternd
  • Alt
  • Professionell
  • Vertrauenswürdig
  • Unprofessionell

Um die Antworten der Teilnehmer zu analysieren, ermitteln Sie den Prozentsatz der Teilnehmer, die jeden einzelnen Begriff ausgewählt haben, und reihen Sie die Begriffe dann, um die häufigsten zu ermitteln.

  • Nennen Sie die am häufigsten gewählten Begriffe (zum Beispiel „ruhig“, „teuer“, „innovativ“, „frisch“ und „einschüchternd“).
  • Verwenden Sie Prozentsätze, anstatt in absoluten Zahlen anzugeben, wie oft jeder Begriff gewählt wurde. (Zum Beispiel könnten Sie ermitteln, dass 71% der Teilnehmer das Wort „frisch“ wählten, um das Design zu beschreiben.)
  • Falls Sie über mehrere Nutzergruppen verfügen und diese in den Antworten der Teilnehmer identifizieren können, inkludieren Sie sie in die Präsentation der Resultate. Bedeutende Unterschiede zwischen den Begriffen, die die beiden Gruppen bevorzugen, könnten Ihnen Einblicke in ihre Geisteshaltung geben. (Sie könnten zum Beispiel ermitteln, dass 54% der erfahrenen Nutzer das Design als „aufregend“ beschrieben, während nur 13% der neuen Nutzer diesen Begriff wählten.)
  • Falls Sie mehrere Designs oder Versionen desselben Designs beurteilen (zum Beispiel alt und neu), sollten Sie sich die Unterschiede der gewählten Begriffe ansehen, mit denen die einzelnen Designs beschrieben wurden. (Zum Beispiel könnten Sie ermitteln, dass 83% der Nutzer die redesignte App als „professionell“ bezeichneten, während nur 20% denselben Begriff für die ältere Version der App verwendeten.)
  • Falls die Webseite bestimmte Markenattribute kommunizieren soll, sollten Sie im Voraus entscheiden, welche Begriffe mit Ihrer Markenpositionierung übereinstimmen. Ermitteln Sie dann, wie viele Nutzer mindestens eines dieser Wörter in ihre Top-5-Liste inkludierten.
  • Erstellen Sie ein Venn-Diagramm, um zu präsentieren, wie Ihre Resultate für Richtungswörter verwendet werden können, wie verschiedene Designs beschrieben wurden oder wie ein Design von unterschiedlichen Nutzergruppen beschrieben wurde (siehe nachfolgendes Beispiel).

Dieses Venn-Diagramm zeigt die Begriffe, die von zwei verschiedenen Nutzergruppen (junge Erwachsene im Alter von 18-25 Jahren und älteren Erwachsenen ab 35 Jahren) gewählt wurden, um ein Flat Design zu beschreiben. Im Diagramm sind die Top 5 der Begriffe zu sehen, die von jeder Altersgruppe gewählt wurden. Begriffe, die von beiden Gruppen gewählt wurden, sind in der Mitte zu sehen, wo sich die beiden Kreise überschneiden.

Referenzen

J. Benedek and T. Miner. 2010. Measuring desirability: New methods for evaluating desirability in a usability lab setting. Proceedings of UPA 2002 Conference

C. Rohrer. 2008. Desirability studies: Measuring aesthetic response to visual designs. xdStrategy.com


© Deutsche Version. Institut für Software-Ergonomie und Usability AG. Alle Rechte vorbehalten.

Kommentare auf diesen Beitrag

    Keine Kommentare

Kommentar hinzufügen

Die mit * gekenzeichneten Felder sind zwingend auszufüllen