Die bewegungsgesteuerte Nutzeroberfläche von Kinect: erste Eindrücke
Inkonsistente Gesten, unsichtbare Befehle, übersehene Warnungen, eigenartige Dialogbestätigungen. Aber es macht Spass zu spielen.
by Jakob Nielsen (deutsche Übersetzung) - 27.12.2010
Kinect ist ein neues Videospielsystem, das allein durch Körperbewegungen kontrolliert wird. Es ist ähnlich der Wii, bedarf aber keines Controllers (und vermeidet so auch das Risiko, die Wohnzimmereinrichtung zu beschädigen, wenn der Wii-Controller während eines aggressiven Tennisspiels aus der Hand fliegt).
Kinect beobachtet die Spieler über eine Videokamera und erkennt die Bewegungen ihrer Körperteile, einschliesslich Händen, Armen, Beinen und allgemeiner Haltung. Das Fitnessprogramm weist mich beispielsweise an, tiefere Kniebeugen zu machen, weil es erkennt, wie sich mein ganzer Körper bewegt. Derlei detaillierte Analysen von Körperbewegungen übersteigen die Fähigkeiten der Wii, werden allerdings meinen Trainer im Fitnessstudio dennoch nicht arbeitslos machen.
Kinect bietet ein weitaus fortgeschritteneres, bewegungsorientiertes Nutzererlebnis als alle anderen Vorgängersysteme auf dem Markt, Experimente in speziellen Labors ausgenommen. Ja, ich habe ähnliche Oberflächen bereits im Jahr 1985 auf innovativen akademischen Konferenzen gesehen - da sei vor allem Myron Kruegers Videoplace genannt. Aber es gibt natürlich einen deutlichen Unterschied zwischen einem mehrere Millionen Dollar teuren Forschungsprojekt und einem Zubehör für die X-Box im Bereich von 150 Dollar.
Einerseits ist Kinect ein fantastischer Fortschritt, vor allem wenn man den niedrigen Preis bedenkt. Andererseits ist eine Zeitspanne von 25 Jahren von Forschung bis Marktreife für bewegungsgesteuerte Nutzeroberflächen noch länger als die bei Geräten für die Mensch-Computer-Interaktion. Zwischen der Erfindung der Computermaus durch Doug Engelbart im Jahr 1964 und der wirtschaftlichen Realisation eines mausbasierten Computers (des Mac) lagen beispielsweise "nur" 20 Jahre.
Bewegungsbasierte Nutzeroberfläche = Usability-Schwächen
Kinect weist viele der Schwächen auf, die Don Norman und ich in unserer Analyse von Usability-Problemen bewegungsbasierter Nutzeroberflächen aufgelistet haben.
Sichtbarkeit
Manchmal werden Optionen als eigenständiges Menü dargestellt und sind daher gut sichtbar. Allerdings gibt es auf dem Bildschirm keine ausdrückliche Gewähr für die meisten Dinge, die man während des Spielverlaufs tun kann. Im Wesentlichen müssen sich die Spieler die Anweisungen merken, bevor das Spiel beginnt. (Obwohl es ein wichtiges Prinzip des menschlichen Faktors ist, sich möglichst wenig auf das höchst unzuverlässige menschliche Erinnerungsvermögen zu verlassen.)
Wie soll man beispielsweise erkennen, dass man bei Kinect Sports nach oben springen muss, um einen weiten Sprung zu machen, obwohl das unlogisch ist und eher zu einem hohen Sprung passen würde? Nun, natürlich, indem man sich daran erinnert, was man gelesen hat, bevor der Avatar das Stadion betrat.
Lies die Anleitungen, bevor du die Oberfläche benutzt. (Ja, die Anleitung ist witzig, aber man muss sie sich trotzdem einprägen.) (Kinect Adventures)
Kinect weist noch eine andere Art von Sichtbarkeitsproblemen auf: Warnungen, die auf dem Bildschirm erscheinen, übersieht man leicht, da die Aufmerksamkeit des Spielers auf das Geschehen des Spiels gerichtet ist. Das passiert selten bei berührungsgesteuerten Nutzeroberflächen für Handys; weil sie so klein sind, sieht man alles, was auf dem Bildschirm erscheint. Dagegen kommt es oft vor, dass Nutzer Fehlermeldungen auf überfüllten Internetseiten übersehen.
Bei Kinect übersehen die Spieler die Warnungen und Hinweise nicht, weil der Bildschirm überfüllt ist, sondern weil sie vom Spiel gefesselt sind. Als ich beispielsweise Spieler bei Kinect Adventures beobachtete, bemerkte ich mehrmals einen Warnhinweis im oberen linken Teil des Bildschirms, der den Spieler anwies, sich in eine bestimmt Richtung zu bewegen, um einen anderen Teil des Spielfeldes zu erreichen. Ja, als Usability-Beobachter habe ich das bemerkt, aber die Spieler haben es nicht registriert. Sie waren zu sehr auf die fesselnden Bewegungen in der Mitte des Bildschirms konzentriert. Sie haben ihren Avatar und das Spielgeschehen beobachtet und die Hinweise der Nutzeroberfläche in der Ecke nicht bemerkt.
Wie können die Spieler das riesige "Move Forward"-Schild übersehen? Sie übersehen es, weil sie vollauf damit beschäftigt sind, ihr Schlauchboot den Fluss hinabzusteuern. (Kinect Adventures)
Ein ähnliches, aber weniger ernstes Problem entsteht bei Your Shape: Fitness Evolved. Beim Versuch, ein anspruchsvolles Herz-Trainings-Programm zu absolvieren, werden die noch verbleibenden Wiederholungen im linken unteren Teil des Bildschirms abgezählt. Man neigt aber dazu, sich an der Trainerin zu orientieren und ihren Bewegungen zu folgen.
Es wäre eine Herausforderung an das Design die Aufmerksamkeit der Spieler auf die Systemmitteilungen zu ziehen, ohne sie vom Spiel und dem eigentlichen Spielgeschehen zu abzulenken.
Feedback
In Folge der mangelnden Sichtbarkeit ist es schwer zu verstehen, warum bestimmte Aktionen bestimmte Wirkungen haben, da es nur wenig direktes Feedback gibt. Beim Tischtennis simuliert eine ohrfeigenähnliche Handbewegung das harte, direkte Treffen des Balls mit dem Schläger, und es gibt eine direkte Rückmeldung, ob man den Ball getroffen hat oder nicht. Allerdings ist es schwierig herauszufinden, warum man manchmal erfolgreich den Ball schmettert. Es kann sicher nicht allein an der Geschwindigkeit der Handbewegung liegen.
Bei anderen Gelegenheiten gibt Kinect direkte Rückmeldungen, die unmittelbar auf der Beobachtung der Bewegungen basieren. Bei Dance Central versucht man, die Bewegungen eines Tänzers auf dem Bildschirm nachzumachen, dessen Körperteile da aufleuchten, wo es bei deinen Tanzbewegungen noch hapert. Das halte ich für ein besseres (und weniger störendes) Feedback als eine Stimme, die sagt: "Bewege deinen linken Arm mehr nach oben."
Konsistenz und Standards
Dass es noch keine einheitlichen Standards für Bewegungsinteraktion gibt, ist ein Problem an sich. Die Nutzeroberflächen können sich deshalb nicht auf erlerntes Verhalten verlassen. Allerdings hat Kinect einige Systemstandards, die den Spielern helfen.
Zum Beispiel gibt es eine Standardbewegung, die das Spiel pausieren und das Menü erscheinen lässt: Man hält den rechten Arm dicht am Körper nach unten und winkelt den linken mit 45 Grad ab. Diese unnatürliche Pose wurde sicher bewusst gewählt, da sie im normalen Spielablauf nicht vorkommt.
Die "Pausieren"-Geste wird zur Rettungsleine des Spielers, aber es gibt keine anderen standardisierten Bewegungen für häufig benötigte allgemeine Befehle wie zum Beispiel "zurück". Das macht die Steuerung der Nutzeroberfläche schwierig, weil sie jedes Mal von neuem herausfinden müssen, wie diese Basis-Aktionen funktionieren. Der Lerneffekt ist automatisch kleiner, wenn die gleiche Funktion in unterschiedlichen Spielen anders aufgerufen wird.
Wie die beiden folgenden Screenshots zeigen, ist noch nicht einmal einheitlich geregelt, welche Hand man für den "Zurück"-Befehl verwendet, geschweige denn, wie die Bewegung aussieht und wie sie visuell auf der Oberfläche dargestellt wird.
"Zurück" im oberen rechten Bildbereich; wird aktiviert, indem man die Hand über die Schaltfläche hält (Kinect Sports)
"Zurück" im unteren linken Bildbereich; wird aktiviert durch eine Rechtsbewegung der linken Hand (Dance Central)
Zumindest ist erkennbar, dass die Designer die Nutzerfreundlichkeit getestet haben: bei Dance Central wird der Nutzer durch eine Notiz an die linke Hand erinnert, die neben dem Hinweis des "Zurück"-Kommandos auftaucht. Sobald man eine grafische Nutzeroberfläche erläutern muss, ist die Oberfläche noch nicht fehlerfrei.
Bei Kinect Sports verwendet der Spieler unterschiedliche Bewegungen, um einen Ball, einen Diskus oder einen Speer zu werfen, und wieder andere, um einen Tischtennisball zu schmettern oder einen Fussball zu schiessen. Allerdings stellt diese Inkonsistenz innerhalb eines Spiels kein allzu grosses Problem dar, da das Design externe Konsistenz aufweist: die Bewegungen ähneln denen in der realen Welt.
Zuverlässigkeit und versehentliche Aktivierung
Kinect hat eine relativ gute Strategie, um versehentliche Aktivierungen zu verhindern, ein Problem, das bei Mobilgeräten oft auftaucht. Wenn der Finger versehentlich über ein Icon des iPad oder iPhone streicht, wird die Funktion unmittelbar aktiviert, und der Nutzer weiss oft nicht einmal, was passiert ist (weil er nicht weiss, was er berührt hat).
Kinect verlangt für gewöhnlich eine Bestätigungsgeste, bevor die Funktion ausgeführt wird. Diese Bestätigung zeigt den Spielern, dass etwas passieren wird, und verhindert das Auslösen von Funktionen durch unabsichtliche Bewegungen. Leider sind diese Bestätigungen nicht einheitlich:
- Halte die Hand ruhig über eine Schaltfläche, während sich ein animierter Kreis schliesst. (bei den meisten Spielen)
- Bewege die Hand nach links, nachdem ein Menüpunkt ausgewählt wurde, es sei denn, man möchte das "Zurück"-Kommando, dann bewegt man die Hand nach rechts. (Dance Central)
- Wähle zuerst eine Funktion, halte dann die Hand ruhig über eine kleine Schaltfläche, die neben der Funktion auftaucht (Your Shape)
Eine Schaltfläche zu berühren, aktiviert sie nicht; stattdessen taucht eine weitere Schaltfläche als Bestätigungsschritt auf. (Your Shape: Fitness Evolved)
Diese Bestätigungsbewegungen sind lästig, allerdings glaube ich, dass sie auf lange Sicht Zeit sparen werden, weil keine unbeabsichtigten Funktionen ausgelöst werden. (Ich habe aber immer noch Funktionen versehentlich ausgewählt, weil ich meine Hand zu lange über einer Schaltfläche gehalten habe. Dann werden die mangelhafte "Rückgängig"-Funktion und die schlechte "Zurück"-Lösung doppelt lästig.)
Gute Usability
Kinect verfügt über mehrere grossartige Designelemente, die deutlich zeigen, dass das Team a) mit dem Konzept der Usability vertraut ist, b) Nutzertests durchgeführt hat und c) die Projektleitung auf ihrer Seite hat, wenn es darum geht, Usability- Verbesserungen Priorität zu geben, auch wenn damit zusätzliche Entwicklungsarbeit verbunden ist.
Das ist sinnvoll; die Daseinsberechtigung für Kinect liegt in erster Linie in der Einfachheit der Anwendung. Es ist nicht für Hardcore-Spieler gedacht, die willens sind, sich diverse komplizierte Tastenkombinationen anzueignen, um ihre Spielcharaktere zu bewegen. Kinect ist an die breite Masse gerichtet, und das erfordert ein hohes Mass an Usability. (Tatsächlich wurde das Spiel in den ersten sechs Wochen vier Millionen Mal verkauft.)
Gute Usability zeigt sich an Beispielen wie dem oben erwähnten Bildschirmhinweis, der genau an der Stelle auftaucht, an der man sonst die schwer zu aktivierende Funktion vermuten würde. Woher wussten die Designer, wann der Spieler sich einen Hinweis wünscht? Sie haben reale Menschen beim Spiel beobachtet und notiert, wo sich Probleme zeigten.
Ein weiteres Beispiel für auf Hochglanz polierte Usability ist eine Art "Schnappeffekt": Schaltflächen sind quasi magnetisch und ziehen den Cursor an, sobald sich die Hand in die Nähe einer Schaltfläche bewegt. (Was die effektive Grösse der Schaltfläche nach Fitts' Gesetz deutlich vergrössert und Störungen durch zittrige Handbewegungen abmildert.)
Die faszinierendste Usability-Verbesserung liegt aber in der automatischen Erkennung der Spieler: Kinect erkennt die Spieler am Gesicht und meldet sie dann automatisch an. Steht man vor dem Sensor, taucht "Jakob erkannt" auf dem Bildschirm auf, und das Spiel startet mit meinem Avatar. Das entspricht der Interaktionsstrategie, die ich 1993 als kommandofreie Nutzeroberfläche bezeichnet habe: Man hat nicht das Gefühl, dass man einem Computer Kommandos erteilt; man geht vor, wie man es normalerweise tun würde, und der Computer erledigt den notwendigen Rest.
Wir wissen von der Erforschung von Firmenportalen, dass eine einmalige Anmeldung das am meisten gewünschte (und am wenigsten realisierte) Intranet-Feature ist. Eine automatische Anmeldung ist noch besser und macht eine ganze Reihe von Interaktionsschritten überflüssig.
Ein gutes Spiel, trotz der Usability-Probleme
Während der letzten Usability-Konferenz in Las Vegas haben wir Kinect im Pausenbereich aufgestellt, um Teilnehmern die Möglichkeit zu geben, diese neue Art der Nutzeroberfläche zu testen. (Auch bei der Konferenz in New York im Februar werden wir die Kinect aufstellen.)
Die Leute hatten viel Spass und waren schon nach einer kurzen Demonstration in der Lage, Spiele zu spielen.
Diese Situation machte deutlich, dass die gleichen Usability-Aspekte, die beim iPad-Nutzertest Schwierigkeiten bereitet haben, für Kinect Spieler keine Probleme darstellten. Wie kann es sein, dass trotz der vielen Mängel in der Nutzeroberfläche die Nutzer-Akzeptanz insgesamt doch hoch ist?
Die Erklärung liegt in den unterschiedlichen Nutzeranforderungen der beiden Systeme. Usability definiert sich relativ zu zwei Punkten: den Nutzern und ihren Aufgaben. Im Vergleich von iPad mit Kinect wird deutlich, dass sich selbst bei identischen Nutzern die Usability unterscheidet, wenn unterschiedliche Aufgaben erledigt werden.
Natürlich spielen die Leute auch auf dem iPad Spiele - tatsächlich habe auch ich auf Flughäfen stundenlang Solitaire City und We Rule gespielt, und andere Mitglieder der Nielsen Norman Group schwören auf Angry Birds. Allerdings muss man festhalten, dass merkwürdige Interaktionsvarianten bei Spielen selten Probleme verursachen. Worum es uns beim Tablet-Design wirklich geht, sind die geschäftsorientierten Nutzeroberflächen für Anwendungen wie E-Commerce, Aktiengeschäfte und Informationsbeschaffung. Hier behindern Inkonsistenzen und eigenartiges Design die tatsächliche Nutzung und können so mitunter das Geschäft schädigen.
Kinect-Spieler springen natürlich auch nicht von einer Anwendung zur nächsten, wie es Handy-Nutzer oft tun. Spielt man ein Kinect-Spiel, taucht man in das Spielgeschehen ein (oft auch für eine halbe Stunde oder mehr) und beachtet die anderen Spiele nicht. Tatsächlich kann man oft die Spiele nicht durch Bildschirmnavigation wechseln, sondern muss die DVD wechseln und kann so die Nutzeroberfläche entlasten.
Letztendlich haben unterschiedliche Spiele auch sehr unterschiedliche Ziele und Aktivitäten, und deshalb ist es kein Problem, wenn die Nutzeroberflächen verschieden sind. Wildwasser-Rafting und Tanzen zu Lady Gagas neuesten Hits haben nicht mehr gemeinsam als Wurst und Käse.
Wenn man mit dem iPad etwas online einkauft, erwartet man, nach den besten Praktiken für das E-Commerce-Erlebnis bedient zu werden, wie man sie von zahllosen Websites kennt, die man bereits besucht hat. Auch beim Lesen von Zeitungen und Magazinen erwartet man eine ähnliche Methodik in der Nutzeroberfläche, wenn man nach Artikeln sucht oder den Inhalt eines Artikels durchsieht. Ob man sein Aktiendepot kontrolliert, die Wettervorhersage ansieht oder eine Flugreservierung ändern will, man will ähnliche Interaktionstechniken für das Filtern langer Listen oder den Wechsel von Masseinheiten vorfinden.
- Der zielgerichtete Einsatz des iPad oder bewegungsgesteuerter Oberflächen anderer Tablet-PCs oder Handys besteht aus relativ einfachen Anwendungen, die von hoher Nutzererwartung und einem häufigem Wechsel zwischen Anwendungen geprägt sind, wobei sich inkonsistentes Design sofort schädlich auswirkt. Dazu kommt, dass die Nutzer grosse Datensätze mithilfe zahlreicher Funktionen bearbeiten müssen und einen grossen Teil ihrer Zeit damit verbringen, die Nutzeroberfläche zu bedienen. Die Qualität des Nutzererlebnisses wird hauptsächlich von der Usability der Nutzeroberfläche bestimmt und davon, ob die Inhalte schnell die Informationsbedürfnisse der Nutzer befriedigen.
- Das Spielen mit Kinect schliesst hoch differenzierte Aktivitäten ein, bei denen der Spieler auf ein Spiel konzentriert ist und daher besser mit Inkonsistenzen umgehen kann. Hier bewegen sich Spieler durch einen beschränkten Datenraum, spielen den Grossteil der Zeit und schweifen nur kurz ab, um im kommandobasierten Teil der Nutzeroberfläche Einstellungen vorzunehmen. Das Nutzererlebnis wird in erster Linie durch das Spiel geprägt.
Ein letzter Unterschied besteht darin, dass Mobilgeräte den Höhepunkt individueller Nutzung darstellen: Dein Handy ist deins, und der Umgang damit erfolgt meistens allein. Selbst beim Zugriff auf soziale Netzwerke bleibt man als tatsächlicher Nutzer des Geräts allein. Im Gegensatz dazu werden Spielkonsolen oft innerhalb einer Gruppe eingesetzt, wo neue Spieler durch erfahrene Nutzer sanft an die neue Nutzeroberfläche herangeführt werden.
Dieser Unterschied in der Anwendung macht klar, dass Spielkonsolen nicht so grossen Wert auf eine selbsterklärende Nutzeroberfläche legen müssen, während es bei Nutzeroberflächen von Mobiltelefonen entscheidend auf eine hohe Erlernbarkeit ankommt.
Kinect (+ und andere Spielkonsolen) | iPads, Tablet PCs, Mobiltelefone (wenn nicht für Spiele genutzt) | |
Hauptziel des Nutzers | Unterhaltung | Erledigung von Aufgaben |
Was wird gesteuert | Eigenständige Spielwelt | Die reale Welt |
Folgen von Nutzerfehlern | Der Avatar "stirbt" und das Level muss wiederholt werden. | Jobverlust und Einbussen bei Investitionen |
Vielfältigkeit der Aktivitäten | Hoch | Ähnliche Abläufe bei verschiedenen Aufgaben |
Zeit, die mit einer Nutzeroberfläche verbracht wird | 1 Stunde pro Spiel | 1-2 Minuten pro Website oder App |
Navigationsraum | Klein (ausser beim Ansteuern der Spielwelt) | Mittelgross (Apps) bis gross (Internet) |
Kommandos | Wenige | Viele |
Daten-Objekte im Zugriff | Eine Handvoll | Hunderte bis Millionen |
Nutzungskontext | Oft gemeinsam (erfahrene Nutzer helfen Neulingen) | Allein (man muss die Anwendung selbst erlernen) |
Was das Nutzererlebnis prägt | Das Spiel | Die Usability der Oberfläche; ob die Inhalte die Informationsbedürfnisse schnell befriedigen |
Kinect ist ein aufregender Fortschritt in der Nutzeroberflächen-Technologie, aber viele Faktoren des Nutzererlebnisses, die seine Faszination ausmachen, bedeuten auch, dass dies kein Weg für die praktischen Nutzeroberflächen ist, die Unternehmen, Behörden und gemeinnützige Organisationen für ihre alltäglichen Websites, Intranets und Anwendungen benötigen. Die Designideen, die Kinect unterhaltsam machen, können Sie Millionen kosten.
© Deutsche Version von Jakob Nielsens Alertbox. Institut für Software-Ergonomie und Usability AG. Alle Rechte vorbehalten.
Kommentare auf diesen Beitrag