ArtificialIntelligenceDevouringItself - Ein im Stil des Malers Francisco de Goya nachempfundenes Bild, erstellt von der KI Dall-E. Es zeigt eine menschenähnliche Figur, wie sie einen unförmigen Körper verschlingt.  - © Bild: Rainer Messerklinger / DALL·E / Artificial intelligence Devouring itself as a painting by Spanish artist Francisco Goya

Der Kannibalismus der KI-Systeme

19451960198020002020

Sprachmodelle wie ChatGPT benötigen riesige Datenmengen. Doch der Vorrat an Texten könnte bald erschöpft sein: Schon jetzt kauen Maschinen Daten wieder, die zuvor von anderen Maschinen ausgespuckt wurden.

19451960198020002020

Sprachmodelle wie ChatGPT benötigen riesige Datenmengen. Doch der Vorrat an Texten könnte bald erschöpft sein: Schon jetzt kauen Maschinen Daten wieder, die zuvor von anderen Maschinen ausgespuckt wurden.

Werbung
Werbung
Werbung

ChatGPT hat für einen KI-Hype gesorgt. Schüler schreiben Hausaufgaben mit dem Werkzeug, Anwälte Klageschriften, Künstler Songs. Sogenannte „Large Language Models“ (LLMs), also extrem leistungsfähige Sprachmodelle, werden mit riesigen Datenmengen aus dem Internet trainiert, um daraus statistische Muster und Regelmäßigkeiten abzuleiten. ChatGPT zum Beispiel wurde mit einem Textkorpus von rund 300 Milliarden Wörtern unter anderem aus der englischsprachigen Wikipedia gefüttert. Zum Vergleich: Marcel Prousts Monumentalwerk „Auf der Suche nach der verlorenen Zeit“ umfasst rund 1,5 Millionen Wörter.

Die geheime Bücherliste von ChatGPT, die ein Berkeley-Forscher mithilfe von Algorithmen entschlüsselt hat, liest sich übrigens wie die Empfehlung eines Nerds: Klassiker wie „Stolz und Vorurteil“ von Jane Austen, die auf dem Bildungsplan vieler Schulen stehen, aber auch jede Menge Science-Fiction-Literatur: „Harry Potter und der Stein der Weisen“, „1984“, „Fahrenheit 451“ usw. Klar ist: Die Bücherliste spiegelt auch die literarischen Interessen ihrer Programmierer. Doch wenn der Computer mit einem einseitigen Kanon trainiert wird, braucht man sich nicht wundern, wenn die KI halluziniert, also Unstimmigkeiten artikuliert, die jedoch durchaus plausibel erscheinen können.

Ein Thema. Viele Standpunkte. Im FURCHE-Navigator weiterlesen.

FURCHE-Navigator Vorschau
Werbung
Werbung
Werbung