Die Auswirkungen von Large Language Models wie ChatGPT auf Sprachassistenten und den Voice-Commerce-Bereich

Voisento Logo
Alexa vs. ChatGPT

Post teilen auf:

Ist es nicht ärgerlich, wenn wir diesen Satz gehört haben: „Leider habe ich deine Anfrage nicht verstanden, bitte wiederhole ihn.“ Ehrlich gesagt, wie oft haben wir schon genervt aufgestöhnt, wenn uns das passiert ist? Ist damit jetzt Schluss? In diesem Beitrag beleuchten wir die Auswirkungen von LLM (Large Language Models) auf Sprachassistenten und den Bereich Voice Commerce.

Alexa vs. ChatGPT

Die neuen Large Language Models wie ChatGPT und Co. haben die Bühne betreten und beeindrucken uns mit ihrer Fähigkeit, komplexe Texte zu verstehen und sich an den Gesprächsverlauf zu erinnern. Sie haben die „alten KI-Helden“ Alexa und Siri geradezu überflügelt. Doch was bedeutet das für Sprachassistenten wie Amazon Alexa? Wird der sogenannte Fallback (der Text, den sie sagt, wenn sie eine Anfrage nicht versteht oder zuordnen kann) bald überflüssig?

Verbessertes Kontextverständnis für eine präzisere Interaktion:

Etwas, das bisher eher Menschen und Tieren vorbehalten war, wird voraussichtlich den größten Einfluss auf Sprachassistenten haben und ihnen in den kommenden Monaten einen enormen Schub geben: die Fähigkeit, Kontexte zu erkennen. Sprachassistenten werden nun besser darin sein, die gesprochenen Texte des Nutzers abzugleichen und zuzuordnen. Zusätzlich werden sie versuchen, den Kontext daraus zu verstehen. Um es mit einem Beispielsatz zu verdeutlichen: „Ich war mit meiner letzten Bestellung zufrieden, jedoch hat mir der Geschmack nicht gefallen.“ Das System interpretiert diesen Satz nicht mehr nur als allgemeine Zufriedenheit mit der vorherigen Bestellung, sondern erkennt, dass der Kunde dasselbe Produkt erneut bestellen möchte, jedoch mit einer anderen Geschmacksrichtung.

Eine neue Herangehensweise für besseres Verständnis von Sprachassistenten

Die Fähigkeit, Kontext zu erkennen, stellte bisher eine große Herausforderung für Sprachassistenten dar. Wir von Voisento konnten diese Herausforderungen zwar durch unsere entwickelten Anwendungen für Alexa reduzieren, jedoch reichten unsere Bemühungen, die KI von Amazon zu trainieren, immer noch nicht aus, um sie auf das Niveau von Modellen wie ChatGPT zu bringen. Es gibt Beispielsweise unzählige Möglichkeiten, den Wecker in deutscher Sprache einzustellen. „Stelle den Wecker auf 8:00 Uhr“, „Bitte wecke mich um 8:00 Uhr“ usw. Eine mögliche und neue Herangehensweise könnte nun darin bestehen, dass Entwickler die KI nicht mehr mit Hunderten von „Trigger-Sätzen“ füttern, sondern die KI den Satz verarbeiten lassen und anschließend Optionen zur Zuordnung geben. Handelt es sich bei der Anfrage des Kunden um:

  • eine Bestellung
  • eine Stornierung
  • eine Influencerkooperation

Kunden können also noch natürlicher und einfacher per Sprache Dinge erledigen und einkaufen. Möglicherweise sogar in Zukunft mit einer auf sie angepassten Artikulation. Ein noch sehr theoretischer Teil, aber in Zukunft könnten sich Sprachassistenten möglicherweise der Art anpassen, wie ihr Anwender spricht. Bei älteren Personen möglicherweise klar und geradlinig, bei jüngeren Personen vielleicht etwas umgangssprachlicher. Dass wir Menschen unterbewusst eine Bindung zu unserem Sprachassistenten aufbauen, haben wir bereits in einem früheren Blogbeitrag erläutert. Diese Fähigkeit würden die Interaktion noch vertrauter und persönlicher machen. (Hier gehts zum Beitrag „psychologische Einblicke in die Bindungen zu Sprachassistenten und der Impact im Voice Commerce„)

Personalisierte Produktvorschläge von Sprachassistenten durch den Einsatz von Large Language Models

Sprechen wir nochmals über das verbesserte Kontextverständnis. In Zukunft wird dies für Unternehmen eine noch entscheidendere Rolle spielen, um noch bessere Produktvorschläge in ihren Voice Shops anbieten zu können. Durch ein besseres Verständnis des individuellen Einkaufsverhaltens und die Analyse vergangener Gespräche ist es möglich, Empfehlungen auszusprechen, ähnlich wie es ein Verkäufer in einem traditionellen Ladengeschäft tun würde. Hierbei geht es nicht nur um explizite Anfragen der Nutzer, sondern auch um die Auswertung von Interaktionen während des Einkaufsprozesses. Ein kurzes Gespräch mit dem Sprachassistenten kann den Nutzer dazu verleiten, zusätzliche Produkte zu kaufen und seinen Warenkorb zu erweitern.

Die Kunst der richtigen Antwort: Risiken und Chancen bei der Informationsausgabe von LLM Sprachassistenten

Large Language Models und der Einsatz bei Sprachassistenten

Wie man sehen kann, werden durch neue LLM-Sprachassistenten in Zukunft die Anwendung noch natürlicher und einfacher gestaltet. Ein letzter Punkt, der sowohl als Vorteil wie auch als Herausforderung betrachtet werden kann, ist die Informationsausgabe durch Sprachassistenten. Bisher haben wir uns nur mit den Hintergrundprozessen befasst, die die Benutzerinteraktion erleichtern. Aber wie sieht es aus, wenn die KI selbst Informationen bereitstellt? Als Unternehmen wäre es natürlich inakzeptabel, wenn Nutzer in der Voice-App eines Unternehmens Fragen stellen und falsche oder nachteilige Antworten erhalten. Wir alle kennen die falschen oder unerwünschten Antworten von ChatGPT. Ist es also ein Risiko, LLM auch für die Informationsausgabe zu verwenden? Unsere Antwort lautet: Nein! Es müssen lediglich einige Dinge beachtet werden. Ein großer Vorteil besteht darin, der KI Informationen über ein Produkt zur Verfügung zu stellen und dann die Anweisung zu geben, bei Fragen zu diesem Produkt nur die bereitgestellten Informationen zu verwenden.

Der Vorteil liegt auf der Hand: Bei einer Frage wie „Ist in dem Produkt … enthalten?“ würde die Antwort sich ausschließlich auf die Frage beziehen, zum Beispiel „Nein, das Produkt enthält kein …“. Der Sprachassistent müsste in diesem Fall nicht den vollständigen vorgefertigten Text mit den Inhaltsstoffen vorlesen. Damit haben wir die Risiken und Vorteile beleuchtet. Vorgefertigte Texte können durch eine Antwort ersetzt werden, die von der KI generiert wird, jedoch nur unter klaren Vorgaben, woher die Informationen stammen sollen. Von einer generellen Beantwortung aller Fragen würden wir zum heutigen Standpunkt noch abraten.

Zukunftsperspektiven und Zusammenfassung

Die Auswirkungen der Large Language Models im Voice Commerce versprechen aufregende Zeiten. Die Interaktion mit Sprachassistenten wird immer natürlicher und kontextbezogener. Unternehmen haben die Chance, ihren Kunden ein personalisiertes und reibungsloses Einkaufserlebnis zu bieten. Mit jedem Fortschritt in der Technologie werden Sprachassistenten zu wertvollen Instrumenten, um Kundenbindung aufzubauen und langfristige Beziehungen zu den Käufern zu schaffen. Die Zukunft des Einkaufens ist sprachgesteuert und voller spannender Möglichkeiten. Auch Amazon hat diesen Trend erkannt und bereits angekündigt, ihre eigenen Sprachassistenten durch die Entwicklung eigener Large Language Models zu verbessern. Amazon plant, sein Large Language Model vor allem für Alexa einzusetzen, um die „Weltbeste persönliche Assistenz“ zu schaffen.

Offne Fragen? Kontaktieren Sie ganz einfach oder vereinbaren Sie einen kurzen Termin. Ständig auf dem Laufenden bleibt man auch über unsere Social Media Kanäle @Voisento

Ein Bericht von Business Insider über die Pläne von Amazon Alexa und einem neuen LLM gibt es hier: https://www.businessinsider.com/amazon

Ein exklusiven Einblick in den Bereich Voice Commerce erhalten Sie in diesem kurzen Whitepaper:
https://www.voisento.de/voice-commerce-whitepaper

Weitere Beiträge