Wie funktionieren ChatGPT & Co.?
Grundsätzlich benötigen Werkzeuge der Generativen KI zunächst eine möglichst große Datenmenge, aus der sie später Muster erkennen und reproduzieren können. Je größer die Datenmenge, desto größer ist am Ende die Wahrscheinlichkeit, passende Antworten auf unsere Fragen zu finden. Damit eine KI jedoch sinnvolle Zusammenhänge zwischen ihrer Datenbasis und unseren Anforderungen (Prompts) herstellen kann, ist ein intensives Training notwendig.
ChatGPT als derzeit prominentestes KI-Tool setzt auf das Large Language Model GPT-3 als Datenbasis. GPT steht für „Generative Pretrained Transformer“ und beschreibt die Funktion bereits treffend: Es geht um das Generieren von Texten aus einer vortrainierten Datenbasis.
Der ChatGPT-Anbieter OpenAI stellt das Training vereinfacht in drei Schritten dar.
Das datenbasierte Training ist der aufwändigste Teil, da hier menschliche Trainer den Lernprozess steuern. Dieser Schritt hat sich als sehr wichtig erwiesen, auch wenn KI-Systeme mittlerweile durchaus selbstständig lernen können. Dies bedeutet jedoch einen gewissen Kontrollverlust, wie öffentliche KI-Experimente in der Vergangenheit gezeigt haben.
So musste Microsoft 2016 einen KI-Chatbot namens „Tay“ bereits nach wenigen Stunden wieder abschalten. Er sollte als weiblicher Avatar auf Twitter lernen, wie Jugendliche kommunizieren. Doch das ging gründlich nach hinten los, denn der selbstlernende Bot wurde schnell zum „rassistischen Scheusal“.
Bei ChatGPT setzt OpenAI daher in den ersten beiden Trainingsschritten auf „Supervised Learning“, das als überwachtes Lernen eine bessere Kontrolle bietet. Außerdem wurde die KI speziell darauf trainiert, ihre Antworten als Teil einer Konversation zu formulieren. Der Bot erinnert sich an frühere Fragen und kann so einen realistischeren Gesprächsverlauf imitieren.
Was kann ChatGPT heute schon, welche Risiken gibt es und wo liegen die Grenzen?
Seit ChatGPT kostenlos getestet werden kann, gibt es grundsätzlich zwei Lager unter den Testern. Die einen bewerten die Möglichkeiten bereits jetzt als herausragenden Entwicklungsschritt und wollen das Tool in Zukunft flächendeckend für alle Textarbeiten einsetzen. Der andere Teil der Tester ist deutlich skeptischer und verweist auf die begrenzte Datenbasis (bis 2021), immer wieder auftretende Fehler oder mangelnde Textqualität bei immer gleichen Strukturen.
Wie so oft ist die Mitte zwischen den Extremen eine vernünftige Einschätzung. Mit einer möglichst guten Aufforderung (Prompt) lassen sich mit ChatGPT durchaus gute Ergebnisse erzielen. Wie bei der Beauftragung menschlicher Autoren gilt auch hier, dass die Qualität des Briefings entscheidend für die Qualität der Ergebnisse ist. Wir müssen uns also nach wie vor sehr genau überlegen, welchen Text wir eigentlich haben wollen.Einen wichtigen Aspekt sollten wir dabei immer im Hinterkopf behalten: KI-Tools der heutigen Generation produzieren erstaunliche Inhalte, aber sie „verstehen“ nicht, was sie uns liefern. Sie erkennen und reproduzieren Muster, nicht mehr und nicht weniger. Das bedeutet zum Beispiel, dass eine Fehlinformation zu einem Muster werden kann, wenn sie oft genug in der Datenbank vorkommt.
Darüber hinaus sind noch einige rechtliche Fragen zu klären. Allein die Frage der Urheberschaft muss aus verschiedenen Perspektiven betrachtet werden. So wird ein KI-Tool nicht als Urheber anerkannt, da unser Urheberrecht nur menschliche Urheber kennt. Zudem stellt sich die Frage, wie es sich rechtlich mit Data Mining verhält.
In den USA ist dazu bereits der erste Prozess anhängig. Die Bildagentur Getty Images verklagt Stability AI, weil deren KI-Bildgenerator millionenfach Urheberrechte verletzt haben soll, indem die Bilder zum Training verwendet wurden. Dies könnte der Beginn einer Klagewelle sein, da in verschiedenen sozialen Netzwerken immer wieder KI-Bilder von verschiedenen Tools kursieren, die sogar noch ein Wasserzeichen einer Bildagentur tragen.
Ausblick: KI-Tools als neue Kollegen
Mit ChatGPT hat OpenAI eine Entwicklung massiv beschleunigt, die bisher eher im Verborgenen stattfand. Neue Ankündigungen zeigen, dass sie auch von Tech-Giganten wie Google nicht verschlafen wurde. Die nächsten Monate und Jahre werden von weiteren Entwicklungen geprägt sein, denn der aktuelle Stand ist erst der Anfang.
Und hier schließt sich der Kreis zur iPhone-Analogie: Wenn wir heute das erste iPhone in die Hand nehmen, können wir die damalige Magie kaum nachvollziehen. Dieses im Vergleich zu heutigen Modellen so limitierte Gerät hat aber entscheidend zum Aufstieg von Apple zur wertvollsten Marke der Welt beigetragen. KI-Anwendungen sind heute auf dem Stand des ersten iPhones – wie sie sich in den nächsten 15 Jahren weiterentwickeln werden, können wir uns noch nicht einmal ansatzweise vorstellen.
Solange die rechtlichen Fragen nicht geklärt sind, sollten Inhalte von Generativer KI zumindest für kommerzielle Zwecke nur mit Vorsicht eingesetzt werden. Die Zukunft dieser Werkzeuge könnte aber auch in einer anderen Richtung als der Generierung kompletter Inhalte liegen: Wenn Bild- oder Textgeneratoren nur bestimmte Aufgaben übernehmen, die sie besonders gut können und die für Menschen eher zeitaufwändig sind, werden sie zu nützlichen KI-Kollegen.
Text: Falk Hedemann
Zum Weiterlesen:
Was ist ChatGPT?
next.ergo.com/de/KI-Robotics/2023/ChatGPT-Generative-AI-OpenAi-Chat-GPT-Sprachmodell.html
Was ChatGPT für Texte bedeutet
next.ergo.com/de/KI-Robotics/2023/ChatGPT-Fake-News-Mensch-Maschine-Klassifizierung-Texte.html
Wie gefährlich ist ChatGPT für die Versicherer?
versicherungswirtschaft-heute.de/unternehmen-und-management/2023-02-22/wie-gefaehrlich-ist-chatgpt-fuer-die-versicherer/
Microsoft legt Bing-Chatbot an die Leine
spiegel.de/netzwelt/wegen-uebergriffiger-antworten-microsoft-legt-bing-chatbot-an-die-leine-a-a70246a7-0a89-475e-b353-1cf380055ac0