/ en / Traditional / help

Beats Biblionetz - Begriffe

Generative Machine-Learning-Systeme (GMLS) computer-generated text

iconBiblioMap Dies ist der Versuch, gewisse Zusammenhänge im Biblionetz graphisch darzustellen. Könnte noch besser werden, aber immerhin ein Anfang!

Diese Grafik ist nur im SVG-Format verfügbar. Dieses Format wird vom verwendeteten Browser offenbar nicht unterstützt.

Diese Grafik fensterfüllend anzeigen (SVG)

iconSynonyme

computergeneriertes Schreiben, Schreiben durch Computer, computergenerierte Texte, Schreibroboter, Textbots, computational journalism, machine written news, automated journalism, natural language generation, GMLS, large language model, LLM, Generative Machine-Learning-Systeme

iconDefinitionen

Similar to [14], we understand the term language model (LM) to refer to systems which are trained on string prediction tasks: that is, predicting the likelihood of a token (character, word or string) given either its preceding context or (in bidirectional and masked LMs) its surrounding context. Such systems are unsupervised and when deployed, take a text as input, commonly outputting scores or string predictions.
Von Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell im Text On the Dangers of Stochastic Parrots (2021)
Doris WeßelsKI-gestütztes Schreiben beschreibt einen Schreibprozess, der durch eine KI-basierte Software in unterschiedlichen Phasen des Schreibprozesses und mit unterschiedlicher Intensität und Funktionalität unterstützt wird. Er gliedert sich in die beiden Teilbereiche KI-gestützte Textbearbeitung und KI-gestützte Textgenerierung. Die primären Zielsetzungen des KI-gestützten Schreibens sind die effizientere Bearbeitung vorhandener Texte oder das automatisierte Generieren neuer Textsequenzen.
Von Doris Weßels, Ole Gottschalk im Text Hochschullehre unter dem Einfluss des KI-gestützten Schreibens (2022)
ArbeitsfreiEine andere Ausprägung des Narrative-Science-Systems, bei dem die Firma auch schon Konkurrenten hat, ist die Generierung der verpflichtenden Quartalsberichte für börsennotierte Unternehmen. Diese Berichte werden meist ohnehin nur von ein paar Dutzend Investmentanalysten gelesen und ausgewertet – und von Börsen-Handelsalgorithmen. Das Prinzip der Berichtgenerierung bleibt gleich: Aktuelle Geschäftszahlen, die aus der Unternehmenssoftware extrahiert worden sind, werden mit denen aus den vergangenen Quartalen, Zahlenwerken über die Situation in den verschiedenen Absatzmärkten und weiteren relevanten Daten zum Faktengrundgerüst für den Bericht zusammengestellt.
Die Berichtgenerierungssoftware erzeugt dann daraus nach den gleichen Methoden wie bei der automatischen Sportberichterstattung einen Fließtext, wenn gewünscht mit Tabellen, der sich nicht ohne weiteres von solchen unterscheiden läßt, die von Menschen geschrieben wurden. Bei Quartalsberichten sind die teilweise gesetzlich vorgeschriebenen Inhalte und die daraus abgeleitete Struktur ohnehin noch mal ähnlicher und wiederkehrender als bei Sportberichten. Niemand erwartet hier literarische Höchstleistungen. Im Gegenteil: Die Algorithmen auf der anderen Seite, die zur Auswertung solcher Quartalsberichte geschrieben wurden, funktionieren besser, wenn weitgehend auf sprachliche Dekorationen verzichtet wird.
Von Constanze Kurz, Frank Rieger im Buch Arbeitsfrei (2013) im Text Die Automatisierung des Geistes
ArbeitsfreiAuch menschliche Kreativität, die bisher als nicht oder nur begrenzt durch Algorithmen ersetzbar galt, ist in einigen Bereichen weitaus weniger unersetzbar als angenommen. Ein drastisches Beispiel hierfür liefert die Firma Narrative Sciences, die es sich zum Ziel gesetzt hat, ihre Software Geschichten erzählen zu lassen. Wie es sich für ein gewinnorientiertes Start-up gehört, geht es dabei nicht um Märchen oder Sagen, sondern um Quartalsberichte von Unternehmen und – durchaus beeindruckend – um Sportberichterstattung.
Durch Analyse von Millionen von Zeitungsartikeln über in den USA beliebte Sportarten wie Baseball oder Basketball, die mit den über jedes Spiel erfaßten Daten über Spielaktionen, Ballbesitz, Tore, statistische Auffälligkeiten und Rekorde und so weiter verglichen wurden, lernten die Systeme von Narrative Science, wie Menschen über ein Spiel schreiben. Typische Phrasen und Wortverbindungen der Sportberichterstattung für die jeweiligen Situationen wurden extrahiert und in einer Datenbank gespeichert. Ergibt sich aus den Daten des Spiels, über das die Software gerade einen Bericht schreibt, eine ähnliche Situation, werden die dazugehörigen Satzbestandteile zur Beschreibung herausgesucht.
Aus dem Kontext der Daten und daraus, wann in der von der Software belieferten Zeitung diese Satzbausteine zuletzt verwendet wurden – man will schließlich keine zu auffälligen Wiederholungen von Formulierungen –, und weiteren Modulen, die unter anderem auf korrekten Satzbau und Grammatik achten, ergeben sich letztendlich die fertigen Sätze und Absätze eines Artikels. Die nackten, formalisierten Daten werden zu einer Geschichte, wie sie ein Mensch erzählen würde.
Von Constanze Kurz, Frank Rieger im Buch Arbeitsfrei (2013) im Text Die Automatisierung des Geistes

iconBemerkungen

Philippe WampflerEtwas polemisch könnte man festhalten, dass Algorithmen nur Schreibaufgaben unterminieren, die an sich schon problematisch sind.
Von Philippe Wampfler im Text Grundlagenartikel: Umgang mit KI-Programmen im Schreibunterricht (2022)
Mike SharplesPlagiarism software will not detect essays written by Transformers, because the text is generated, not copied. A Google search of the essay shows that each sentence is original.
Von Mike Sharples im Text New AI tools that can write student essays require educators to rethink teaching and assessment (2022)
Ich sehe keinen grossen Wert in einer Maschine, die synthetischen Text erzeugt. Und leider kommen gerade jede Menge richtig schlechter Ideen auf, wofür man Chat-GPT einsetzen könnte.
Von Emily M. Bender im Text «Ein Chatbot kann nicht logisch denken» (2023)
Trends 2017Algorithmen schreiben schneller und billiger als Menschen. Ihr Hauptvorteil ist jedoch: Sie können ihre Texte dynamisch an die Leser anpassen. Den Online-Handel wird das schneller verändern als den Journalismus.
Von Klappentext in der Zeitschrift Trends 2017 (2017) im Text Den Unterschied merkt man nicht
Die Frage ist, welche implikationen es für die Kultur und die Öffentlichkeit insgesamt hat, wenn künftig ganze alben oder Self-Publishing-Programme mit computergenerierten Werken bestückt werden. Wird Kultur vorhersehbarer, berechenbarer und möglicherweise auch gefälliger?
Von Adrian Lobe im Text Gefangen in der Feedback-Schleife (2023)
Forschung & Lehre 7/23Da Englisch gewissermaßen die Leitsprache von Systemen wie GPT-4 darzustellen scheint, d.h. eine klare Tendenz besteht, englische Stilprinzipien auf andere Sprachen zu übertragen, droht die Proliferation artifizieller Texte die Hegemonie des Englischen und des mit ihm verbundenen Schreib- und Denkstils weiter zu stärken.
Von Dirk Siepmann in der Zeitschrift Forschung & Lehre 7/23 im Text Vom Akkordarbeiter zum Gutachter (2023)
Die Standarderwartung an Texte wird sich also auf kurz oder lang verschieben – von der Überzeugung, ein Mensch stehe dahinter, zum Zweifel, ob es nicht doch eine Maschine sein könnte. Damit aber wird auch die Unterscheidung zwischen natürlichen und artifiziellen Texten zusehends hinfällig. Wir würden dann womöglich in eine Phase postartifizieller Texte übergehen.
Von Hannes Bajohr im Text Schreiben nach KI – artifizielle und postartifizielle Texte (2023)
Tristan HarrisLarge language models are our second contact with A.I. We cannot afford to lose again. But on what basis should webelieve humanity is capable of aligning these new forms of A.I. to our benefit? If we continue with business as usual,the new A.I. capacities will again be used to gain profit and power, even if it inadvertently destroys the foundations ofour society.
Von Yuval Harari, Tristan Harris, Aza Raskin im Text You Can Have the Blue Pill or the Red Pill, and We’re Out of Blue Pills (2023)
KI-Systeme und Sprachmodelle im Besonderen werden von Menschen programmiert. Und die implementieren nicht nur mathematische, sondern auch soziale Werte. ChatGPT ist schon jetzt eine Storytelling-Maschine, die es mit der Diskursmacht von Disney oder Hollywood aufnehmen könnte. Die Frage, wie dieses Computersystem lernt, hat daher auch gesellschaftspolitische Relevanz.
Von Adrian Lobe im Text Geschichten von morgen (2023)
Die Standarderwartung an Texte wird sich also auf kurz oder lang verschieben – von der Überzeugung, ein Mensch stehe dahinter, zum Zweifel, ob es nicht doch eine Maschine sein könnte. Damit aber wird auch die Unterscheidung zwischen natürlichen und artifiziellen Texten zusehends hinfällig. Wir würden dann womöglich in eine Phase postartifizieller Texte übergehen.
Von Hannes Bajohr im Text Artifizielle und postartifizielle Texte (2023)
Der universelle TexterSo wie kein Autor unter seinen Text schreibt: „Dieser Artikel wurde mit Word 16.66.1 geschrieben und mit dessen Rechtschreibkorrektur überprüft“, ergibt es in Zukunft keinen Sinn, alle KI-Tools aufzulisten, die bei der Recherche und Formulierung geholfen haben. Wichtiger ist es, dass immer ein Autor für den Inhalt eines Textes geradesteht und verantwortlich gemacht werden kann.
Von Hartmut Gieselmann in der Zeitschrift Der universelle Texter (2023) im Text Wer soll das alles lesen?
Mike SharplesYou should be worried. GPT-3 and programs like it are starting to take over routine writing tasks like composing blogs and writing news stories. They are good at summarizing magazine articles and academic papers. They can write convincing poetry. The computer games industry is adopting these programs to offer lifelike characters, with personalities and emotions, who can engage in deep conversation with players.
Von Mike Sharples, Rafael Perez Y Pérez im Buch Story Machines (2022) im Text Can a computer write a story?
Auch in der Schweiz schreiben erste Roboter Texte selbst, allerdings keine Meinungsbeiträge, sondern nur standardisierte Textsorten, für die keine speziellen Kenntnisse oder Erfahrungen nötig sind. So wird bei 'CH Media' automatisiert von einem Textgenerator über sämtliche regionalen Fussballspiele berichtet. Dort kommt zur Generierung der Texte die Textengine Arria NLG zum Einsatz, wie der Entwickler 'Persönlich' erklärte.
Von Marcel Gamma im Text Schrieb eine KI eine geistreiche Abhandlung selbst? (2020)
Die Flut massenhaft verfügbarer schlechter Texte, die kein Algorithmus mehr vernünftig bewerten und aussortieren kann, könnte einen Trend umkehren, der ursprünglich durch das Internet ausgelöst wurde. Das Internet hat einst die Rolle der Verlage als Gatekeeper geschwächt. ChatGPT könnte sie wieder stärken, wenn die Verlage mit menschlich kuratierten Inhalten für Autoren und Textqualität bürgen, die dem austauschbaren Content der Vorschlagsalgorithmen überlegen ist.
Von Philipp Schönthaler im Text Schneller als gedacht (2023)
Auch wenn es immer wieder Forderungen nach Verboten geben wird, sind wir überzeugt, dass es – wie bereits bei Innovationen vergangener Jahre – darum geht, wie wir mit der neuen Technologie umgehen wollen und sollen. In der Tat stehen wir vor einer grossen Herausforderung, aber gemeinsam – Eltern, Lehrpersonen und Schulleitungen – werden wir Wege finden, damit umzugehen, damit qualitative Bildung weiterhin für alle zugänglich ist und Chancengerechtigkeit nicht eine Worthülse bleibt.
Von Jörg Berger im Text Im Dialog mit dem Chatbot (2023)
As argued by Bender and Koller [14], it is important to understand the limitations of LMs and put their success in context. This not only helps reduce hype which can mislead the public and researchers themselves regarding the capabilities of these LMs, but might encourage new research directions that do not necessarily depend on having larger LMs. As we discuss in §5, LMs are not performing natural language understanding (NLU), and only have success in tasks that can be approached by manipulating linguistic form [14].
Von Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell im Text On the Dangers of Stochastic Parrots (2021)
Vermutlich sollten wir schnellstens lernen, Chat GPT als assistierende Software zu betrachten, die in weniger Zeit mehr Daten verarbeiten kann als Menschen. Die schlau klingt, aber oft falschliegt. Dabei sollten wir wachsam bleiben: Die guten Sätze, sie werden uns immer wieder einlullen. Sinnvoll ist es, Chatbots dort zu nutzen, wo das Resultat leicht zu überprüfen ist – Synonyme vorschlagen, Texte zusammenfassen, Programmier­code ergänzen –, oder dort, wo die Wahrheit egal ist: für ein Lied über die Volatilität der Aktien­märkte oder ein Drama zum Untergang einer Grossbank.
Von Marie-José Kolly im Text Chatbots wie GPT können wunderbare Sätze bilden. Genau das macht sie zum Problem (2023)
Jahrbuch Qualität der Medien

In der Schweiz setzen die grossen Medienhäuser in diesen Bereichen seit einigen Jahren ebenfalls automatisierte Textproduktion ein (Beck, 2023). Tamedia erstellt seit 2018 Berichte zu Abstimmungen auf Gemeindeebene automatisiert mit dem Textroboter Tobi (Fürst & Grubenmann, 2019). Lena, der Textroboter von Keystone-SDA, produziert automatisiert mehrsprachige Kurztexte zu den Resultaten nationaler und kantonaler Abstimmungen (Fürst & Grubenmann, 2019). Auch CH Media nutzt KI, um Texte zu News aus Gemeinden oder Resultaten im Regionalsport zu generieren (Aargauer Zeitung, 2021).

Von Daniel Vogler, Mark Eisenegger, Silke Fürst, Linards Udris, Quirin Ryffel, Maude Rivière, Mike S. Schäfer im Buch Jahrbuch Qualität der Medien (2023) im Text Künstliche Intelligenz in der journalistischen Nachrichtenproduktion
ArbeitsfreiDie Arbeitsweise der Algorithmen, ihre Heranziehung von großen Mengen archivierter Artikel, um damit das Skelett der Daten mit Formulierungen zu umkleiden, die sie für den Menschen besser les- und verstehbar machen, eignet sich jedoch bei weitem nicht für alle Arten von Text. Sie wird gut funktionieren, wenn die zu beschreibenden Sachverhalte anhand von strukturierten Daten vorliegen, die »nur noch« in Prosa umgesetzt werden müssen. Andere Algorithmen sind jedoch zumindest in begrenztem Maße in der Lage, auch aus sogenanntem unstrukturiertem Text, also Nachrichtentickermeldungen oder Dokumenten, wohlfeile strukturierte Informationen zu extrahieren, die dann wiederum von anderen Algorithmen weitergenutzt werden können.
Von Constanze Kurz, Frank Rieger im Buch Arbeitsfrei (2013) im Text Die Automatisierung des Geistes
Beat Döbeli HoneggerDas dritte Beispiel des computational journalism dürfte am deutlichsten machen, dass Computer anfangen, kognitive Leistungen für Menschen zu übernehmen. Mehrere Firmen verkaufen bereits erfolgreich computergenerierte Sport- und Börsenberichte an Zeitungen. Je mehr Daten zu einem Ereignis digital verfügbar sind, desto einfacher ist es für einen Computer, daraus einen Artikel zu formulieren, der von Menschen nicht als vom Computer geschrieben erkannt wird. In den USA eignet sich zum Beispiel Baseball sehr, da in einem solchen Spiel viele Daten anfallen, aus denen sich der Spielverlauf ablesen lässt. Im Finanzbereich wird das Verfassen von Jahresberichten börsennotierter Unternehmen immer heikler, da falsche Formulierungen juristische Konsequenzen haben könnten. Also wird auch diese Arbeit Computern übertragen, die aus den Geschäftsdaten einen trockenen Prosatext generieren. Computer schreiben erfolgreich Texte – damit verschiebt sich unaufhaltsam die Grenze dessen, was wir für automatisierbar halten.
Von Beat Döbeli Honegger im Buch Mehr als 0 und 1 (2016) im Text Warum die ganze Aufregung?
Kultur der DigitalitätBereits 2010 wurde die Anwendung Stats Monkey vorgestellt, die kurze Berichte zu Baseballspielen anfertigen kann. Alles, was das Programm dafür benötigt, sind umfassende Daten zu den Spielen, die mittlerweise routinemäßig erhoben und dank verbesserter algorithmischer Bilderkennung und neuer Sensoren immer detaillierter werden. Das Programm extrahiert aus den Daten die entscheidenden Momente und Akteure eines Spiels, erkennt charakteristische Muster im Spielverlauf (etwa “frühe Führung stetig ausgebaut”, “dramatische Aufholjagd” oder Ähnliches) und generiert darauf aufbauend eigene Berichte. Dabei kann eine Vielzahl von Variablen bestimmt werden, etwa ob ein Artikel aus der Perspektive eines neutralen Beobachters oder vom Standpunkt eines der beiden Teams geschrieben werden soll. Oder man kann, weil Eltern nicht gerne über die Fehler ihrer Kinder lesen, festlegen, dass vor allem die gelungenen Spielzüge hervorgehoben werden sollen, wenn es um Partien in der Schülerliga geht. Der Algorithmus wurde rasch patentiert, und aus dem ursprünglich interdisziplinären Forschungsprojekt wurde ein Start-up-Unternehmen: Narrative Science. Dieses bietet heute Texte aller Art an, neben Sport- vor allem auch Finanzberichterstattung, ebenfalls ein Feld, für das statistische Informationen in Fülle vorliegen. Diese Texte werden in renommierten Medien wie dem Wirtschaftsmagazin Forbes veröffentlicht und dort mit dem Autorenvermerk “narrative science” gekennzeichnet. Noch beschränken sich diese Beiträge auf relativ einfache Themen. Dabei soll es aber nicht bleiben. Auf die Frage, wie groß der Anteil algorithmisch verfasster Nachrichten in fünfzehn Jahren sein werde, antwortete Kristian Hammond, Technologiechef von Narrative Science und einer der Gründer des Unternehmens, 2012 selbstbewusst mit “neunzig Prozent” – und fügte gleich noch hinzu, dass ein Algorithmus schon in fünf Jahren zum ersten Mal den Pulitzer-Preis gewinnen werde.[195] Da wird einiges an Hype und Selbstmarketing mitschwingen, aber als generelle Einschätzung ist seine Aussage nicht unglaubwürdig.
Von Felix Stalder im Buch Kultur der Digitalität (2016) im Text Formen der Digitalität

iconVerwandte Objeke

icon
Verwandte Begriffe
(co-word occurance)
Chat-GPT(0.46), Textgeneratoren & Bildung(0.26), Generative Pretrained Transformer 3 (GPT-3)(0.2), Textgeneratoren & Schule(0.17), Generative Pretrained Transformer 4 (GPT-4)(0.14), Textgeneratoren & Hochschule(0.1), Künstliche Intelligenz (KI / AI)artificial intelligence(0.08), Textgeneratoren-Verbot(0.05), GPT-2(0.04), GMLS-Detektor(0.03), prompt engineering(0.03)
icon
Verwandte Aussagen
Computergenerierte Texte gefährden den Journalismus
Computergenerierte Texte erleichtern Plagiarismus bzw. entsprechenden Textbetrug.Computer-generated texts facilitate plagiarism / text fraud
Nutzung von generativen Machine-Learning-Systemen wird bald wird bald so selbstverständlich wie die Nutzung eines Taschenrechners
Computergenerierte Texte erhöhen die Informationsflut
Generative Machine-Learning-Systeme erleichtern das Generieren von Fake-News massiv
Generative Machine-Learning-Systeme erleichtern das Generieren von Bullshit
Generative Machine-Learning-Systeme erhöhen die Gültigkeit von Brandolinis Gesetz massiv
Generative Machine-Learning-Systeme benötigen viel Energie
Generative Machine-Learning-Systeme machen Medienkompetenz noch wichtiger
Generative Machine-Learning-Systeme erhöhen den digitalen Schereneffekt
Generative Machine-Learning-Systeme verletzen oft das Urheberrecht
Generative Machine-Learning-Systeme erleichtern / perfektionieren Phishing
Generative Machine-Learning-Systeme erfordern mehr mündliche Prüfungen
Generative Machine-Learning-Systeme bestehen immer mehr Abschlussprüfungen
Generative Machine-Learning-Systeme sind nicht kreativ, sie rekombinieren nur Bekanntes
Generative Machine-Learning-Systeme verändern das wissenschaftliche Schreiben
Generative Machine-Learning-Systeme verändern das Fremdsprachenlernen
Generative Machine-Learning-Systeme erhöhen die Produktivität
Generative Machine-Learning-Systeme erleichtern Kriminalität
Generative Machine-Learning-Systeme können die Reputation der Betreiber gefährden
Generative Machine-Learning-Systeme haben bereits den grössten Teil der weltweit verfügbaren Daten verarbeitet

CoautorInnenlandkarte

Diese Grafik ist nur im SVG-Format verfügbar. Dieses Format wird vom verwendeteten Browser offenbar nicht unterstützt.

Diese Grafik fensterfüllend anzeigen (SVG)

iconHäufig erwähnende Personen

iconHäufig co-zitierte Personen

Ilya Sutskever Ilya
Sutskever
Sandhini Agarwal Sandhini
Agarwal
Mark Chen Mark
Chen
Christopher Hesse Christopher
Hesse
Clemens Winter Clemens
Winter
Jeffrey Wu Jeffrey
Wu
Daniel M. Ziegler Daniel M.
Ziegler
Aditya Ramesh Aditya
Ramesh
Rewon Child Rewon
Child
Eric Sigler Eric
Sigler
Gretchen Krueger Gretchen
Krueger
Ariel Herbert-Voss Ariel
Herbert-Voss
Girish Sastry Girish
Sastry
Pranav Shyam Pranav
Shyam
Arvind Neelakantan Arvind
Neelakantan
Jared Kaplan Jared
Kaplan
Melanie Subbiah Melanie
Subbiah
Nick Ryder Nick
Ryder
Benjamin Mann Benjamin
Mann
Kewal Dhariwal Kewal
Dhariwal
Tom Henighan Tom
Henighan
Tom B. Brown Tom B.
Brown
Mateusz Litwin Mateusz
Litwin
Amanda Askell Amanda
Askell
Prafulla Dhariwal Prafulla
Dhariwal
Dario Amodei Dario
Amodei
Alec Radford Alec
Radford
Sam McCandlish Sam
McCandlish
Christopher Berner Christopher
Berner
Jack Clark Jack
Clark
Benjamin Chess Benjamin
Chess
Scott Gray Scott
Gray

iconStatistisches Begriffsnetz  Dies ist eine graphische Darstellung derjenigen Begriffe, die häufig gleichzeitig mit dem Hauptbegriff erwähnt werden (Cozitation).

icon12 Vorträge von Beat mit Bezug

iconEinträge in Beats Blog

iconZeitleiste

icon352 Erwähnungen  Dies ist eine nach Erscheinungsjahr geordnete Liste aller im Biblionetz vorhandenen Werke, die das ausgewählte Thema behandeln.

iconAnderswo finden

iconAnderswo suchen  Auch im Biblionetz finden Sie nicht alles. Aus diesem Grund bietet das Biblionetz bereits ausgefüllte Suchformulare für verschiedene Suchdienste an. Biblionetztreffer werden dabei ausgeschlossen.

iconBiblionetz-History Dies ist eine graphische Darstellung, wann wie viele Verweise von und zu diesem Objekt ins Biblionetz eingetragen wurden und wie oft die Seite abgerufen wurde.