
Der Kannibalismus der KI-Systeme
Sprachmodelle wie ChatGPT benötigen riesige Datenmengen. Doch der Vorrat an Texten könnte bald erschöpft sein: Schon jetzt kauen Maschinen Daten wieder, die zuvor von anderen Maschinen ausgespuckt wurden.
Sprachmodelle wie ChatGPT benötigen riesige Datenmengen. Doch der Vorrat an Texten könnte bald erschöpft sein: Schon jetzt kauen Maschinen Daten wieder, die zuvor von anderen Maschinen ausgespuckt wurden.
ChatGPT hat für einen KI-Hype gesorgt. Schüler schreiben Hausaufgaben mit dem Werkzeug, Anwälte Klageschriften, Künstler Songs. Sogenannte „Large Language Models“ (LLMs), also extrem leistungsfähige Sprachmodelle, werden mit riesigen Datenmengen aus dem Internet trainiert, um daraus statistische Muster und Regelmäßigkeiten abzuleiten. ChatGPT zum Beispiel wurde mit einem Textkorpus von rund 300 Milliarden Wörtern unter anderem aus der englischsprachigen Wikipedia gefüttert. Zum Vergleich: Marcel Prousts Monumentalwerk „Auf der Suche nach der verlorenen Zeit“ umfasst rund 1,5 Millionen Wörter.
Die geheime Bücherliste von ChatGPT, die ein Berkeley-Forscher mithilfe von Algorithmen entschlüsselt hat, liest sich übrigens wie die Empfehlung eines Nerds: Klassiker wie „Stolz und Vorurteil“ von Jane Austen, die auf dem Bildungsplan vieler Schulen stehen, aber auch jede Menge Science-Fiction-Literatur: „Harry Potter und der Stein der Weisen“, „1984“, „Fahrenheit 451“ usw. Klar ist: Die Bücherliste spiegelt auch die literarischen Interessen ihrer Programmierer. Doch wenn der Computer mit einem einseitigen Kanon trainiert wird, braucht man sich nicht wundern, wenn die KI halluziniert, also Unstimmigkeiten artikuliert, die jedoch durchaus plausibel erscheinen können.
Ein Thema. Viele Standpunkte. Im FURCHE-Navigator weiterlesen.
In Kürze startet hier der FURCHE-Navigator.
Steigen Sie ein in die Diskurse der Vergangenheit und entdecken Sie das Wesentliche für die Gegenwart. Zu jedem Artikel finden Sie weitere Beiträge, die den Blickwinkel inhaltlich erweitern und historisch vertiefen. Dafür digitalisieren wir die FURCHE zurück bis zum Gründungsjahr 1945 - wir beginnen mit dem gesamten Content der letzten 20 Jahre Entdecken Sie hier in Kürze Texte von FURCHE-Autorinnen und -Autoren wie Friedrich Heer, Thomas Bernhard, Hilde Spiel, Kardinal König, Hubert Feichtlbauer, Elfriede Jelinek oder Josef Hader!
