Im Bereich Coaching und Beratung werden immer mehr digitale Tools und KI-Anwendungen eingesetzt. Welche Potenziale sehen Sie darin grundsätzlich?
Da gibt es eine Menge Potential, aber auch Risiken. Da ich beides bin, Professor an der Süddänischen Universität (genauer am dortigen Zentrum für Industrieelektronik) und CEO des dänischen Sprachtechnologie-Startups AllGoodSpeakers, sehe ich das Potential naturgemäß mehr durch die Brille des CEOs und die Risiken mehr durch die Brille des forschenden Professors.
Beginnen wir mal mit dem Positiven, dem Potential. KI ist – richtig ausgestaltet und sachkundig angewendet – einfach Spitze darin, übergeordnete Muster zu erkennen und daraus Handlungsoptionen abzuleiten. Wir können, unterstützt durch eine KI, mehr Gesichtspunkte des Coachees bzw. des zu beratenden Menschen mit in den Blick nehmen – gegenwärtige wie vergangene – und somit ganzheitlichere, bessere Entscheidungen treffen. Ein Mensch allein wäre mit so vielen Daten und komplexen Zusammenhängen überfordert.
Nehmen wir einmal unser „Acoustic Voice Profiling(R)“ als Beispiel: Früher haben sich Coaches bzw. TrainerInnen beim Stimmtraining auf ein Merkmal zur selben Zeit konzentriert, wie etwa das Tempo oder die Stimmlage. Heute können wir sagen: Wenn wir am Tempo arbeiten und es durch Training in eine bestimmte Richtung verschieben, dann hat das erwartbare Auswirkungen auch auf Stimmlage, Pausendauern, Rhythmus und Melodizität; und weil einige davon nicht vorteilhaft sein werden, setzen wir besser bei den Pausendauern an und erreichen so indirekt auch unser Ziel beim Tempo – und obendrein eine deutlich vorteilhaftere Gesamtperformance. In dieser Art und Weise wird uns KI bei allen Coachings und Beratungen unterstützen.
Und die Risiken? KIs arbeiten und schlussfolgern auf Basis von Datenmengen und daraus abgeleiteten Statistiken. Und daraus folgt zweierlei. Erstens wird eine KI immer besser darin sein, den „Mainstream-Menschen“ zu beraten und zu unterstützen. Je seltener oder ungewöhnlicher ein Mensch, ein Lebenslauf oder auch nur eine Stimme ist, desto schlechter wird eine KI darin sein, brauchbare Schlussfolgerungen oder Empfehlungen zu geben; es sei denn, sie wird von uns richtig „vorgewarnt“ und/oder wurde mit einem wissenschaftlich fundierten, gut ausbalancierten Datensatz trainiert. Beides geschieht oft nicht. Wir als Verwender einer KI haben meist keine Ahnung, welche Daten mit welchem Umfang die Basis für eine KI bilden, und Entwickler wollen in der Regel dieses Wissen nicht liefern, sondern stattdessen ihre KI als omnipotent darstellen. Entsprechend schlecht können wir die Anwendungsgrenzen unserer KI abschätzen oder die KI für Spezialfälle „feintunen“. Kurz gesagt: Eine KI ersetzt das eigene Denken und Handeln nicht, sie verlagert es nur auf eine höhere Ebene. Man wird zur Führungskraft, die klare und gute Instruktionen geben und gute und schlechte Vorschläge erkennen bzw. viele alternative Vorschläge gegeneinander abwägen muss.
Ihr Spezialgebiet ist die phonetische Forschung. Inwieweit ist hier der Einsatz der KI schon fortgeschritten?
In der Forschung selbst kaum, würde ich sagen, in der Anwendung hingegen schon. Die phonetische Forschung ist das Rückgrat jeder maschinellen Kommunikation; sie liefert die wissenschaftliche Basis dafür, Akustik in textuelle Inhalte zu übersetzen (z.B. bei einer Diktiersoftware oder bei Stimmerkennung) oder einen Text in eine verständliche Akustik (z.B. bei einem Sprachassistenten oder einer Navigationsgerät). Die Schlüsselwörter hier sind „Inhalte“ und „verständlich“. Eine KI kann sich gut ausdrücken, und sie kann festhalten, was wir sagen. Aber – und da stimmen wir wohl alle zu – bei Emotionen, Einstellungen, sozialen Umgangsformen, kurzum, bei allem, was nonverbal „zwischen den Textzeilen“ kommuniziert wird, da ist eine KI noch nicht sonderlich weit fortgeschritten.
Natürlich gibt es spezielle KIs, die bereits erstaunliche Dinge können, z.B. kann eine KI Depressionen und Parkinson bemerkenswert früh und zuverlässig auf Basis phonetischer Daten erkennen, und selbst unser „Acoustic Voice Profiling(R)“ ist – obwohl gar nicht dafür entwickelt – ähnlich gut in der stimmbasierten Einschätzung von Persönlichkeitsstörungen wie einige Teile etablierter, psychologischer Fragebögen. Dennoch bleibt der große zukünftige Beitrag der phonetischen Forschung und ihrer Anwendung, dass KIs auf breiter Basis besser in der Lage sind, all das zwischen den Zeilen kommunizierte zu verstehen und selbst auszudrücken. Und es sind spannenderweise genau diese zwischenmenschlichen Dinge, wegen derer wir Menschen überhaupt kommunizieren. Das heißt: Kommunikation dreht sich immer in erster Linie um Soziales und erst in zweiter Linie um Inhalte, und KIs haben bislang erst diese zweite Linie nachhaltig überschritten.
Es gibt aber auch Befürchtungen, KI könnte in ganzen Bereichen Coaching und Beratung ersetzen. Welches sind Ihre Erwartungen?
Das glaube ich ehrlicherweise nicht, zumindest nicht aus der Perspektive eines 47-jährigen Menschen, der vielleicht noch 20 Jahre arbeitet und mit Glück noch 40 Jahre lebt; und zwar aus zwei, vielleicht drei Gründen.
Der erste Grund ist technischer Natur: Alle biologischen Systeme, und ja, da gehören wir Menschen auch dazu, sind unheimlich variabel. Wir können nicht einmal das gleiche Wort drei Mal hintereinander in exakt der gleichen Weise aussprechen, und ebenso variabel sind unsere Bewegungen, unsere Handlungen, unsere Entscheidungen – und damit schließlich auch unsere Lebensläufe und Interaktionen. Die Komplexität, die sich daraus ergibt, macht es wahrscheinlicher, dass kleine, hochspezialisierte KIs das Erfolgsmodell der Zukunft sein werden, und die scheinen mir nicht in der Lage, ganze Bereiche zu ersetzen. Es ist am Ende immer der Mensch, der KI-Ausgaben korrigiert, einordnet oder auch nur die passende KI für die passende Aufgabe auswählt. Außerdem lernt eine KI nicht einfach von Daten per se. Diese Daten müssen aufbereitet und mit entsprechenden Etiketten versehen werden, ähnlich, wie man sich früher auf das Vokabel-Lernen in der Schule vorbereitet hat. Was nicht etikettiert ist, kann eine KI nicht lernen, und für einige Dinge wird eine solche Etikettierung schlichtweg unwirtschaftlich sein.
Der zweite Grund ist aber noch wichtiger: Gerade im Bereich Coaching und Beratung wollen Menschen Kontakt zu anderen Menschen haben! Diese Dienstleistungen sind sehr persönlich, sozial oder manchmal gar sehr privat. Dafür wollen sich Menschen einfach nicht an Maschinen „outsourcen“ lassen. Der Mensch an sich ist integraler Teil der Dienstleistung. Das sehen wir auch in unserem Stimmtraining. Software und Hardware sind eine sehr als willkommene Unterstützung, aber die Brücke zur Kundin bzw. zum Kunden baut der Mensch, mit dem man gemeinsam lachen, reflektieren und diskutieren kann. Wie ich unter Punkt 2 sagte: Wir meinen oft, bei Kommunikation geht es um Inhalt; das ist grundfalsch. Kommunikation ist etwas zutiefst Soziales.
Der letzte und dritte Grund hat etwas mit Energie bzw. „Strom“ zu tun: KIs erfordern sehr viel davon, und wir stoßen jetzt bereits an die Grenzen der Energie, die wir haben. Wenn es mehr KIs gibt, dann müssen diese „schlanker“ werden, was wiederum in Richtung einer Zusammenarbeit zwischen Mensch und Maschine weist. Das menschliche Gehirn kommt mit 2000 kcal pro Tag aus, mir ist keine „große“ KI bekannt, die das auch nur annähernd schafft. Kleinere Modelle hingegen könnten durchaus mit 200-300 kcal pro Tag und User auskommen bzw. mit dem entsprechenden Wert in Kilowattstunden.