Speak, MemoryAn Archaeology of Books Known to ChatGPT/GPT-4
Kent K. Chang, Mackenzie Cramer, Sandeep Soni, David Bamman
Publikationsdatum:
|
![]() |

Zusammenfassungen
In this work, we carry out a data archaeology
to infer books that are known to ChatGPT and
GPT-4 using a name cloze membership inference query. We find that OpenAI models have
memorized a wide collection of copyrighted
materials, and that the degree of memorization
is tied to the frequency with which passages
of those books appear on the web. The ability
of these models to memorize an unknown set
of books complicates assessments of measurement validity for cultural analytics by contaminating test data; we show that models perform
much better on memorized books than on nonmemorized books for downstream tasks. We
argue that this supports a case for open models
whose training data is known.
Von Kent K. Chang, Mackenzie Cramer, Sandeep Soni, David Bamman im Text Speak, Memory (2023)
Dieser Text erwähnt ...
Dieser Text erwähnt vermutlich nicht ... 
![]() Nicht erwähnte Begriffe | Generative Pretrained Transformer 3 (GPT-3), GMLS & Bildung, GMLS & Schule, Künstliche Intelligenz (KI / AI) |
Tagcloud
Zitationsgraph (Beta-Test mit vis.js)
1 Erwähnungen 
- Harry Potter und 1984 - Das steht auf ChatGPTs heimlicher Leseliste (2023)
Volltext dieses Dokuments
![]() | ![]() ![]() ![]() ![]() ![]() |
Anderswo suchen 
Beat und dieser Text
Beat hat Dieser Text während seiner Zeit am Institut für Medien und Schule (IMS) ins Biblionetz aufgenommen. Beat besitzt kein physisches, aber ein digitales Exemplar. Eine digitale Version ist auf dem Internet verfügbar (s.o.). Aufgrund der wenigen Einträge im Biblionetz scheint er es nicht wirklich gelesen zu haben. Es gibt bisher auch nur wenige Objekte im Biblionetz, die dieses Werk zitieren.