Digitalisierung & Technologie, 10. Mai 2021

Die Entwicklung eines Phonebots

Ein neuer digitaler Kollege

Mann am Schreibtisch mit Telefonhörer am Ohr

Viele kennen die Situation: Ein neuer Kollege soll das Team verstärken. Sehr gut, denn es gibt viel zu tun. Doch bevor der neue Kollege zu hundert Prozent einsatzbereit ist, werden noch ein paar Wochen der Einarbeitung vergehen. Das ist bei der Entwicklung eines Phonebots ganz ähnlich. Phonebots sind sprachgesteuerte digitale Assistenten. Wie ein solcher Phonebot entsteht, erklärt Sven Vanoeteren, Voice User Interface Lead Designer bei ERGO.

Endlich ist es soweit. Der neue Kollege hat seinen ersten Tag. Bereits im Vorfeld haben sie überlegt welche Aufgaben er übernehmen soll und sich aufgrund seiner Fähigkeiten, für ihn entschieden. Seine neue Hauptaufgabe wird die Bearbeitung von telefonischen Kundenanliegen im Service-Center sein.

Nun geht es los. Vorgesetzte und Mitarbeiter kennenlernen, Schulungen besuchen, Abläufe verinnerlichen, von Kollegen das Handwerk lernen und dann endlich selbst die ersten Telefonate führen. Natürlich wird er noch weiter Hilfe benötigen. Aber mit der Zeit wird er zu einem routinierten und geschätzten Kollegen.

Nur einen Namen hat er noch nicht. Ja, richtig gelesen: Unsere Phonebots bekommen alle einen Rufnamen. Das hilft uns im Team bei der Kommunikation. „Henry“ geht wesentlich schneller über die Lippen als „Phonebot zur Anliegenerkennung.“

In der Kommunikation am Telefon benutzen wir hingegen nur genau eine Bot-Persona, die wir gemeinsam mit Kunden entwickelt haben. Ziel der Bot-Persona ist es, eine einheitliche Nutzungserfahrung und Form der Kommunikation zu gewährleisten.

In 3 Schritten zum erfolgreichen Phonebot

Schritt 1 - Research and Analysis

Die Basis eines jeden erfolgreichen Phonebots ist eine angemessene Recherche und Analyse der Zielgruppe, der bestehenden Prozesse und der technischen Möglichkeiten.

Grundsätzlich beobachten wir eine gute Akzeptanz bei unseren Kunden, ihre Anliegen mit einem unserer Phonebots zu klären. Zur Wahrheit gehört aber auch, dass wir mit unserem Angebot noch nicht alle Kunden erreichen. Zumal unsere Sprachlösungen ein freiwilliges Angebot für unsere Kunden darstellen.

Unsere Phonebots ergänzen das Angebot im telefonischen Kunden-Service. Der Vorteil für unsere Kunden ist, dass sie ohne Wartezeit ihr Anliegen direkt erledigen können. Bei einer Umfrage im Jahr 2020 in unserer Kundenwerkstatt war dies der Top-Grund (58 Prozent), um eher mit einem Phonebot zu sprechen anstelle eines Mitarbeiters.

Doch für welche Kundenanliegen eignet sich der Einsatz eines Phonebots?

Es gibt eine ganze Reihe von Aufgaben, die Phonebots sehr gut ausführen können, zum Beispiel das Beantworten häufig gestellter Fragen, Erteilen von Auskünften oder das Weiterleiten von Anrufen. Generell eignen sie sich besonders gut für Aufgaben, die standardisiert sind und daher eine vorhersehbare Struktur aufweisen.

Die Kollegen im Kundenservice werden durch ihren neuen Kollegen also entlastet und bekommen mehr Zeit für andere, komplexere Kunden-Anfragen oder Anliegen, bei denen das persönliche Gespräch mit einem Menschen eine wesentliche Rolle einnimmt.

Damit sich der Einsatz eines Phonebots auch betriebswirtschaftlich lohnt, sollte das Kundenanliegen in ausreichend großer Menge auftreten.

Schritt 2 - Design and Build

Wenn alle Voraussetzungen für den Einsatz eines Phonebots erfüllt sind, starten wir mit der Entwicklung. Wir arbeiten in cross-funktionalen Scrum-Teams und in engem Kontakt mit den Einheiten, in denen der neue Phonebot-Kollege zum Einsatz kommen wird.

Gemeinsam definieren wir die Dialogschritte, die möglichst das Gespräch mit einem echten Menschen abbilden sollen. Dabei soll sich der Dialog so natürlich wie möglich anfühlen, ohne Menschlichkeit vorzugaukeln. Uns ist es sehr wichtig, dass unseren Kunden klar ist, dass sie mit einer Maschine sprechen.

Im Anschluss erstellen wir einen ersten Prototyp, der den einfachsten und geradlinigsten Weg durch den Prozess abbildet. Darauf aufbauend, entwickeln wir den Dialog immer weiter. Dafür nutzen wir das Dialog-Management-System „Parloa“.

Parloa ermöglicht es uns, einen Dialog mit all seinen Schritten, Logiken und Bedingungen abzubilden. Durch integrierbare Services können wir auf Schnittstellen zugreifen, um zum Beispiel Informationen zum aktuellen Stand einer Leistungsbearbeitung abzurufen. Diese werden dann in einen Text eingearbeitet, den unser Phonebot spricht. 

Aber wie funktioniert so ein Dialog eigentlich?

Der Happy-Path:

Jeder Dialogschritt ist ein Knotenpunkt in unserem Dialog-Management-System. Er besteht aus der Aussage des Phonebots und den von uns erwarteten Antworten des Anrufers. Mit seinen Antworten beabsichtigt der Anrufer wiederum eine Reaktion des Phonebots. Deshalb nennen wir sie „Intents“ (Absichten).

Ein Beispiel:

Phonebot: „Bitte nennen Sie mir Ihre Versicherungsnummer.“

Anrufer: „Meine Nummer lautet 12345678.“

Jeder Anrufer antwortet jedoch ein bisschen anders, auch wenn er dieselbe Absicht verfolgt. Dafür erstellen wir eine Liste mit vielen verschiedenen Antwortbeispielen für jeden Intent und trainieren damit den Phonebot. Dabei ist es nicht erforderlich jede mögliche Antwort zu erfassen - was auch kaum möglich ist. Vielmehr berechnet der Phonebot die Wahrscheinlichkeit, mit der die Aussage des Anrufers zu einem Intent passt. Gibt es ein Match, so wird der Dialog an dem Knotenpunkt fortgeführt, der mit dem Intent verbunden ist.

Dazu prüfen wir Angaben, wie die Versicherungsnummer, das Geburtsdatum etc. zum Beispiel auf Vollständigkeit und logische Stimmigkeit, damit der Phonebot direkt nochmal nachfragen kann, wenn das, was er verstanden hat, nicht den erwarteten oder möglichen Formaten entspricht, wie ein Geburtsdatum „30. Februar 1879“ (den Tag gibt es nicht und 142 Jahre ist kein valides Alter für einen Menschen).

Expect the unexpected

Doch was, wenn der Anrufer nicht wie erwartet antwortet?

Ein Beispiel:

Phonebot: „Bitte nennen Sie mir Ihre Versicherungsnummer.“

Anrufer: „Oh, die habe ich gerade nicht griffbereit.“

Auch solche Fälle müssen von einem sehr guten Phonebot abgefangen werden. Nichts ist nerviger, als bei einer solchen Aussage immer wieder dieselbe Frage vom Phonebot gestellt zu bekommen. Unser Ziel ist es, wie bereits erwähnt, natürliche Dialoge zu gestalten. Ein Mitarbeiter des Kunden-Services hätte für solche Fälle auch eine passende Antwort in petto.

Es gilt also im Idealfall auf alle im Kontext möglichen Aussagen eines Anrufers eingehen zu können. In unserem Beispiel könnte der Phonebot den Anrufer fragen, ob er einen Rückruf vereinbaren möchte, um sein Anliegen später zu klären.

Um einem Missverständnis vorzubeugen: Ein Phonebot muss und kann nicht auf alles die passende Antwort haben. Ein Gespräch darf aber nie in einer Sackgasse enden. Als Ausweg kann der Kunde zum Beispiel an einen menschlichen Kollegen weitergeleitet werden, wenn der Phonebot nicht mehr helfen kann.

Hören, nicht lesen

Die Aussagen unserer Phonebots sind keine statischen Audio-Dateien, so wie man sie von vielen klassischen Telefon-Hotlines kennt. Sie werden durch eine Text-to-Speech-Engine in Echtzeit erzeugt und von einer synthetischen Stimme gesprochen.

Basis dafür sind die Texte, die wir im Dialog-Management-System hinterlegen.

Dies hat viele Vorteile:

  • Die Audio-Dateien müssen nicht vorab erstellt werden
  • Texte können ganz einfach geändert werden
  • Dynamische Inhalte, wie die Wiederholung einer Versicherungsnummer, sind problemlos integrierbar.


Für das Schreiben von Bot-Texten gibt es viele Richtlinien und Best Practices. Eine der Wichtigsten für mich ist: „Hören, nicht lesen“. Geschriebene Texte wirken beim Lesen oft schon gut verständlich. Doch erst beim Hören merkt man, ob dies wirklich der Fall ist. Fühlt es sich natürlich an, passt es in den Kontext des Dialogs. Das alles wird erst beim Hören fassbar.

Neben den sprachlichen Aspekten, kommt auch ein technischer Aspekt hinzu: Die Synthese-Stimme.

Neueste Synthese-Stimmen kommen zwar bereits sehr nah an den Klang von menschlichen Stimmen heran. Manche Begriffe oder Formulierungen hören sich aber auch noch sehr unnatürlich an, weshalb das Anhören der Aussagen auch deshalb ein so wichtiger Schritt in der Erstellung eines Phonebots ist.

Schritt 3 – Learn and Optimise

Nach mehreren Sprints, in denen wir die technischen und dialogischen Grundlagen geschaffen haben, ist der neue Phonebot-Kollege endlich einsatzbereit.

Auf dem Weg hat er einige Trainingseinheiten absolviert, um das Sprachmodell zu optimieren, sprich die Wahrscheinlichkeit, dass die Absicht des Anrufers richtig erkannt wird. Auch dabei ist Teamwork gefragt. Viele Kolleg:innen sorgen mit Testanrufen für die Trainingsdaten, die wir benötigen.

Wir sind immer alle sehr aufgeregt, wenn ein neuer Phonebot seine ersten Anrufe entgegennimmt. Schließlich stellt sich erst unter echten Live-Bedingungen heraus, ob die Performance bereits auf einem guten Niveau ist.

Wie bei jedem neuen Kollegen wird noch nicht jedes Gespräch routiniert ablaufen: Der Phonebot wird Anrufer missverstehen oder Anrufer werden ihn mit Anliegen konfrontieren, die wir ihm (noch) nicht beigebracht haben.

Deshalb hört unsere Arbeit mit dem Go-Live nicht auf. Die kommenden Wochen werden geprägt sein von intensiver Auswertung von Daten, kurzen Iterationen, um das Sprachmodell weiter zu verbessern und vielen Gesprächen mit der zuständigen Einheit, um den Phonebot weiter zu optimieren.

Das alles geschieht datengestützt. Das heißt, dass wir zum Beispiel A/B-Tests durchführen, um verschiedene Varianten zu prüfen oder die Anrufer fragen, ob eine Information hilfreich war oder was den Anrufern gefehlt hat. Auf diese Weise lernen wir sehr viel von unseren Kunden und können unsere Phonebots weiterentwickeln, damit sie ein bestmögliches Nutzungserlebnis bieten.

Wichtig ist, dass man diese Schritte direkt mit einplant und den Phonebot gegebenenfalls nicht sofort für hundert Prozent der ankommenden Anrufe einsetzt. Lieber übergibt man ihm nach und nach mehr Anrufvolumen, wenn er dazugelernt hat. Schließlich dient er keinem Selbstzweck, sondern soll einen echten Mehrwert für Kunden, Kollegen und ERGO erbringen.

Seit Mitte 2020 haben wir auf diese Weise rund zehn Phonebots einen Job vermittelt. Aufgrund der sehr guten Ergebnisse unterstützen wir neben den deutschen ERGO Gesellschaften mittlerweile auch internationale Kolleg:innen. Eine ganz neue Herausforderung, die wir mit viel Freude gemeinsam angehen. 

Text: Sven Vanoeteren, Voice User Interface Lead Designer bei ERGO


Ihre Meinung
Wenn Sie uns Ihre Meinung zu diesem Beitrag mitteilen möchten, senden Sie uns bitte eine E-Mail an: next@ergo.de


Weitere Magazin-Beiträge