Speak, Memory

An Archaeology of Books Known to ChatGPT/GPT-4

Kent K. Chang, Mackenzie Cramer, Sandeep Soni, David Bamman

Publikationsdatum: 28.04.2023

Diese Seite wurde seit 1 Jahr inhaltlich nicht mehr aktualisiert. Unter Umständen ist sie nicht mehr aktuell.

Zusammenfassungen

In this work, we carry out a data archaeology to infer books that are known to ChatGPT and GPT-4 using a name cloze membership inference query. We find that OpenAI models have memorized a wide collection of copyrighted materials, and that the degree of memorization is tied to the frequency with which passages of those books appear on the web. The ability of these models to memorize an unknown set of books complicates assessments of measurement validity for cultural analytics by contaminating test data; we show that models perform much better on memorized books than on nonmemorized books for downstream tasks. We argue that this supports a case for open models whose training data is known.

Von Kent K. Chang, Mackenzie Cramer, Sandeep Soni, David Bamman im Text Speak, Memory (2023)

Dieser Text erwähnt ...

Aussagen KB IB clear	Machine Learning kann bestehende Vorurteile/Ungerechtigkeiten verstärken/weitertragen
Begriffe KB IB clear	Chat-GPT , Daten data , Generative Machine-Learning-Systeme (GMLS)computer-generated text , Generative Pretrained Transformer 4 (GPT-4) , GPT-2

Dieser Text erwähnt vermutlich nicht ...

Nicht erwähnte Begriffe

Generative Pretrained Transformer 3 (GPT-3), GMLS & Bildung, GMLS & Schule, Künstliche Intelligenz (KI / AI)

Zitationsgraph (Beta-Test mit vis.js)

1 Erwähnungen

Harry Potter und 1984 - Das steht auf ChatGPTs heimlicher Leseliste (2023)

Volltext dieses Dokuments

Speak, Memory: Artikel als Volltext ( lokal

, 313 kByte; WWW

)

Anderswo suchen

Beat und dieser Text

Beat hat Dieser Text während seiner Zeit am Institut für Medien und Schule (IMS) ins Biblionetz aufgenommen. Beat besitzt kein physisches, aber ein digitales Exemplar. Eine digitale Version ist auf dem Internet verfügbar (s.o.). Aufgrund der wenigen Einträge im Biblionetz scheint er es nicht wirklich gelesen zu haben. Es gibt bisher auch nur wenige Objekte im Biblionetz, die dieses Werk zitieren.

Beats Biblionetz - Texte