Conversational UX – Von Chat bis Bot, von GUI bis VUI #bitkom #uux

Die heutige Sitzung des BITKOM AK Usability und User Experience fand in den schön gelegenen Räumlichkeiten von Microsoft am Rheinufer in Köln statt. Thematisch ging es um eines der Trendthemen des Jahres 2017 – Conversational User Interfaces. Wie immer will ich an dieser Stelle versuchen Euch einen Eindruck von der Veranstaltung zu geben und die wichtigsten Erkenntnisse zusammenzufassen. 

Chatty Devices – Sascha Wolter, Deutsche Telekom

Sascha eröffnete den Tag mit einer amüsanten Einleitung zum Thema Conversational UX. Wie üblich bediente er sich dabei seiner persönlichen Dauerfokusgruppe (n=3) um Erfahrungen mit sprachlichen User Interfaces zu sammeln. Die Beobachtung seiner familiären Testgruppe ergab, dass sich Menschen trotz anfänglicher Skepsis so schnell an die Konversation mit Maschinen und an die Steuerung mittels Sprache bedienen, dass sie sich mit der alten Welt der manuellen Schalter schwer tun. Dieser Umstand macht sich auch in der zunehmenden Menge an verfügbaren Geräten bemerkbar. Immer mehr Hersteller drängen mit Sprachassistenten auf den Markt, um so ihre Ökosysteme näher in die Alltagswelt der Anwender zu integrieren.


Aus seinen bisherigen Erfahrungen schloss er, dass sich Unternehmen, die sich jetzt nicht mit sprachlichen User Interfaces beschäftigen, mit hoher Wahrscheinlichkeit einen wichtigen Zugangskanal zu Ihren Kunden verlieren werden. Es wird dabei aber nicht so sein, dass sprachliche User Interfaces graphische User Interfaces komplett ersetzen. Vielmehr werden sie je nach Kontext eine Ergänzung bieten. Wir werden in naher Zukunft multimodale Ein- und Ausgabemedien nutzen, um mit Maschinen zu interagieren.

Does mouse and monitor soon become a thing of the past?

Das schöne an Saschas Vorträgen ist, dass er es vor aller Begeisterung für die neue Technologie und Möglichkeiten immer auch versteht eine kritische und differenzierte Sicht auf neue Dinge zu werfen. So beschäftigte er sich natürlich auch mit den Schattenseiten von Sprachassistenten wie Cortana, Alexa und Google Home. Auch wenn oft behauptet wird, dass diese Sprachassistenten das Leben der Nutzer ausspionieren, gibt es zumindest in Deutschland klare rechtliche Grenzen um dies zu verhindern. (Siehe §90 Telekommunikationsgesetz) So ist der Besitz und Betrieb von Geräten, die ohne des Wissens der Anwender aufnehmen und senden verboten. Alle am Markt verfügbaren Geräte dürfen sich daher nur nach dem Sagen eines Wake Words (z.B. „Alexa“) oder einem expliziten Knopfdruck mit den dahinterliegenden Cloudservice verbinden. Entwickler, die sich mit sprachlichen User Interfaces befassen, dürfen nicht nur den technischen Fortschritt im Auge behalten, sondern sie müssen sich auch intensiv damit beschäftigen was die Verwendung dieser Technologie für seine Anwender aus ethischer und moralischer Sicht bedeuten kann. Eltern stehen heute vor der Herausforderung den Umgang mit sprachlichen UIs und künstlicher Intelligenz ihren Kindern zu vermitteln. (Siehe moralmachine.mit)

Auch wenn sich sprachliche User Interfaces in einer atemberaubenden Geschwindigkeit im Monatsrythmus weiterentwickeln, so ist die Thematik nicht neu. Für die Gestaltung von Conversational UIs verwies auf Grundlagenliteratur aus dem Jahr 1975, wie z.B. Grice’s Maxims. Eine der großen Herausforderungen bei der Gestaltung ist die Persönlichkeit von sprachlichen Interfaces. Wenn es nicht gelingt die Persönlichkeit eines Sprachassistenten authentisch und natürlich zu gestalten, landet man schnell im Uncanny Valley. Der Persönlichkeit von Sprachassistenten sollte daher eine hohe Aufmerksamkeit zu teil werden. (Siehe Cortana vs. Siri) Außerdem empfahl er die Gestaltung an den Richtlinien der Hersteller zu orientieren (z.B. Design Checklist von Google)

Create more personal computing – Malte Lantin, Microsoft

Malte Lantin gab in seinem Vortrag einen Einblick in die Sichtweise von Microsoft auf sprachliche User Interfaces. Microsoft versteht Konversationen als eine neue Plattform für die Mensch-Maschine-Interaktion. Sie unterscheiden dabei zwischen digitalen Assistenten, wie z.B. Cortana und Bots. Bots sind nach Microsoft-Sichtweise wie Apps, in denen die Funktionen angeboten werden. Digitale Assistenten sind Meta-Apss, die lediglich eine natürliche Brücke zwischen Mensch und Bot schlagen.

Human language is the new UI.

Microsoft-typisch ging er in einer kleinen Tech-Demo auf die techn. Möglichkeiten des Microsoft Bot Framework, der Cognitive Services und Microsofts Luis.ai ein. Außerdem stellte er den QnA-Maker vor mit dem sich aus FAQ einfache Chatbots erzeugen lassen.

Wer Bequemlichkeit beim Einkaufen schätzt, der wird den Amazon Echo lieben. – Thorsten Wilhelm, eResult

Thorsten Wilhelm stellte die Ergebnisse einer Studie (n=5) vor, in der das Nutzungserlebnis mit Amazon Echo untersucht wurde. Die Studie wurde durchgeführt, weil er durch die 300 Mio aktiven Amazon-Kunden und schon heute über 400.000 Echo-Geräten in Deutschland großes Potential für Amazon Echo sieht. Er sieht es als den Weg für Unternehmen ihre Dienste enger in den Alltag der Anwender zu integrieren. Aber auch bei dieser Technologie gilt: „Nicht irgendwas machen, nur um auch dabei zu sein.“. Um erfolgreich zu sein, gilt es herauszufinden, welchen echten Nutzen diese Interaktion stiften kann.

„Wir stellten fest, dass Amazon Echo („Alexa“) recht schnell in den Alltag integriert wird, neue Rituale entstehen und sich der Umgang mit anderen Geräten und auch die Kommunikation mit dem Partner und der Familie verändern.

Die Studie ist kostenlos auf der eResult-Webseite verfügbar.

Alexa Development: einmal API und zurück, bitte – Christoph Jerolimov


Wie der Titel des Beitrags schon andeut, führte Christoph Jerolimov die Teilnehmer anhand der beiden Alexa-Skills mobilecologne und Kino Bonn an die Implementierung von Alexa-Skills mit dem Alexa Skills Kit heran. Er erläuterte die technischen Grundprinzipien und zeigte Ausschnitte aus dem Programmcode der beiden Skills.

Es könnte aber alles so einfach sein, isses aber nich – Ulrich Leschak, Peter Behrens School of Art Düsseldorf


Ulrich Leschak – seines Zeichens Lehrbeauftragte für Kommunikationsdesign der Peter Behrens School of Art Düsseldorf – beschäftigte sich in seinem Beitrag mit dem Thema Einfachheit. Er betrachtet die Entwicklung der Sprachassistenten eingangs recht kritisch. Aus seiner Sicht führen sie dazu, dass die Menschen nicht mehr zu sich selbst finden. Die zahlreichen Geräte lenken sehr vom Leben ab und stören, wenn sie schlecht gestaltet sind. 

Wenn man weiß wie es geht, ist alles einfach. – Ulrich Leschak

Zu Einfachheit sagte er: Einfachheit ist eine Illusion, die schwer zu erzeugen ist. Einfachheit hängt immer vom Betrachter ab. Einfachheit ist eine Kunst und erfordert manchmal Besessenheit bei der Suche nach der einfachsten Lösung. Natürlich zitierte er in diesem Zusammhang auch die Laws of simplicity von Maeda.

Mit Blick auf die sprachliche User Interfaces plädierte er für einen verantwortungsvollen Umgang mit dieser Technologie. Entwickler müssen sich bewusst sein, welche emotionale Kraft  dieser Technologie innewohnt und welche Auswirkungen ein unbedachter Einsatz auf die Menschen haben kann.

Prototyping Conversations – Johannes Baeck, usability.de

Im letzten Vortrag des Tages ging Johannes Baeck auf die nutzerzentrierte Gestaltung von Conversational UI ein. Er berichtete aus einem Praxisprojekt mit welchen Methoden usability.de in den unterschiedlichen Projektphasen arbeitetet, um Konversationen zu konzipieren. 


So setzten sie in der Forschungsphase des Projektes beispielsweise auf Contextual Interviews in den Räumlichkeiten der Anwender, um den Kontext besser zu verstehen, in dem die Konversation stattfindet. Weiterhin erhoben sie Fragen, die Anwender in der Konversation mit der Maschine stellen wollen und welcher Modus (Screen, Sprache oder beides) für die Konversation am besten geeignet ist. In der Strategiephase verwendeten sie Experience Maps, um die Konversation im Gesamtkontext des Use Cases einordnen zu können und gemeinsames Verständnis im Team für den Umfang des Use Cases zu entwickeln. 

Personality allows people to know how to behave towards others and what to expect in return. – Wired for Speech, Clifford Nass & Scott Brave

Die Persönlichkeit des Bots gestalteten sie anhand von Bot-Personas. In diesen speziellen Personas wurden insbesondere Wertversprechen, Interaktionsprinzipien und Persönlichkeiten definiert. Auf diese Weise entstanden die Richtlinien für das Verhalten des Bots. In der Designphase bauten sie mittels Papier oder Sayspring – einem Prototyping-Tool für Alexa Skills – Prototypen und evaluierten Konversationen mit der Wizard-of-Oz-Methode.

Neues aus dem AK UUX

Neben der Ankündigung, dass der nächste AK UUX im Oktober bei DATEV in Nürnberg stattfinden wird, gab es auch erfreuliche Nachrichten. Der bitkom-Leitfaden „Usability & User Experience – Software näher zum Nutzer bringen“ ist endlich verfügbar. Der Leitfaden zeigt Best Practices aus dem Bereich User Experience für Unternehmen auf und gibt Entscheidungshilfen zur Auswahl und zum Einsatz von Methoden sowie Vorgehensweisen.