Generative Machine-Learning-Systeme (GMLS) computer-generated text

BiblioMap

Diese Grafik fensterfüllend anzeigen (SVG)

Synonyme

computergeneriertes Schreiben, Schreiben durch Computer, computergenerierte Texte, Schreibroboter, Textbots, computational journalism, machine written news, automated journalism, natural language generation, GMLS, large language model, LLM, Generative Machine-Learning-Systeme

Definitionen

Similar to [14], we understand the term language model (LM) to refer to systems which are trained on string prediction tasks: that is, predicting the likelihood of a token (character, word or string) given either its preceding context or (in bidirectional and masked LMs) its surrounding context. Such systems are unsupervised and when deployed, take a text as input, commonly outputting scores or string predictions.

Von Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell im Text On the Dangers of Stochastic Parrots (2021)

KI-gestütztes Schreiben beschreibt einen Schreibprozess, der durch eine KI-basierte Software in unterschiedlichen Phasen des Schreibprozesses und mit unterschiedlicher Intensität und Funktionalität unterstützt wird. Er gliedert sich in die beiden Teilbereiche KI-gestützte Textbearbeitung und KI-gestützte Textgenerierung. Die primären Zielsetzungen des KI-gestützten Schreibens sind die effizientere Bearbeitung vorhandener Texte oder das automatisierte Generieren neuer Textsequenzen.

Von Doris Weßels, Ole Gottschalk im Text Hochschullehre unter dem Einfluss des KI-gestützten Schreibens (2022)

Eine andere Ausprägung des Narrative-Science-Systems, bei dem die Firma auch schon Konkurrenten hat, ist die Generierung der verpflichtenden Quartalsberichte für börsennotierte Unternehmen. Diese Berichte werden meist ohnehin nur von ein paar Dutzend Investmentanalysten gelesen und ausgewertet – und von Börsen-Handelsalgorithmen. Das Prinzip der Berichtgenerierung bleibt gleich: Aktuelle Geschäftszahlen, die aus der Unternehmenssoftware extrahiert worden sind, werden mit denen aus den vergangenen Quartalen, Zahlenwerken über die Situation in den verschiedenen Absatzmärkten und weiteren relevanten Daten zum Faktengrundgerüst für den Bericht zusammengestellt.
Die Berichtgenerierungssoftware erzeugt dann daraus nach den gleichen Methoden wie bei der automatischen Sportberichterstattung einen Fließtext, wenn gewünscht mit Tabellen, der sich nicht ohne weiteres von solchen unterscheiden läßt, die von Menschen geschrieben wurden. Bei Quartalsberichten sind die teilweise gesetzlich vorgeschriebenen Inhalte und die daraus abgeleitete Struktur ohnehin noch mal ähnlicher und wiederkehrender als bei Sportberichten. Niemand erwartet hier literarische Höchstleistungen. Im Gegenteil: Die Algorithmen auf der anderen Seite, die zur Auswertung solcher Quartalsberichte geschrieben wurden, funktionieren besser, wenn weitgehend auf sprachliche Dekorationen verzichtet wird.

Von Constanze Kurz, Frank Rieger im Buch Arbeitsfrei (2013) im Text Die Automatisierung des Geistes

Auch menschliche Kreativität, die bisher als nicht oder nur begrenzt durch Algorithmen ersetzbar galt, ist in einigen Bereichen weitaus weniger unersetzbar als angenommen. Ein drastisches Beispiel hierfür liefert die Firma Narrative Sciences, die es sich zum Ziel gesetzt hat, ihre Software Geschichten erzählen zu lassen. Wie es sich für ein gewinnorientiertes Start-up gehört, geht es dabei nicht um Märchen oder Sagen, sondern um Quartalsberichte von Unternehmen und – durchaus beeindruckend – um Sportberichterstattung.
Durch Analyse von Millionen von Zeitungsartikeln über in den USA beliebte Sportarten wie Baseball oder Basketball, die mit den über jedes Spiel erfaßten Daten über Spielaktionen, Ballbesitz, Tore, statistische Auffälligkeiten und Rekorde und so weiter verglichen wurden, lernten die Systeme von Narrative Science, wie Menschen über ein Spiel schreiben. Typische Phrasen und Wortverbindungen der Sportberichterstattung für die jeweiligen Situationen wurden extrahiert und in einer Datenbank gespeichert. Ergibt sich aus den Daten des Spiels, über das die Software gerade einen Bericht schreibt, eine ähnliche Situation, werden die dazugehörigen Satzbestandteile zur Beschreibung herausgesucht.
Aus dem Kontext der Daten und daraus, wann in der von der Software belieferten Zeitung diese Satzbausteine zuletzt verwendet wurden – man will schließlich keine zu auffälligen Wiederholungen von Formulierungen –, und weiteren Modulen, die unter anderem auf korrekten Satzbau und Grammatik achten, ergeben sich letztendlich die fertigen Sätze und Absätze eines Artikels. Die nackten, formalisierten Daten werden zu einer Geschichte, wie sie ein Mensch erzählen würde.

Von Constanze Kurz, Frank Rieger im Buch Arbeitsfrei (2013) im Text Die Automatisierung des Geistes

Bemerkungen

Etwas polemisch könnte man festhalten, dass Algorithmen nur Schreibaufgaben unterminieren, die an sich schon problematisch sind.

Von Philippe Wampfler im Text Grundlagenartikel: Umgang mit KI-Programmen im Schreibunterricht (2022)

Plagiarism software will not detect essays written by Transformers, because the text is generated, not copied. A Google search of the essay shows that each sentence is original.

Von Mike Sharples im Text New AI tools that can write student essays require educators to rethink teaching and assessment (2022)

Ich sehe keinen grossen Wert in einer Maschine, die synthetischen Text erzeugt. Und leider kommen gerade jede Menge richtig schlechter Ideen auf, wofür man Chat-GPT einsetzen könnte.

Von Emily M. Bender im Text «Ein Chatbot kann nicht logisch denken» (2023)

Algorithmen schreiben schneller und billiger als Menschen. Ihr Hauptvorteil ist jedoch: Sie können ihre Texte dynamisch an die Leser anpassen. Den Online-Handel wird das schneller verändern als den Journalismus.

Von Klappentext in der Zeitschrift Trends 2017 (2017) im Text Den Unterschied merkt man nicht

Die Frage ist, welche implikationen es für die Kultur und die Öffentlichkeit insgesamt hat, wenn künftig ganze alben oder Self-Publishing-Programme mit computergenerierten Werken bestückt werden. Wird Kultur vorhersehbarer, berechenbarer und möglicherweise auch gefälliger?

Von Adrian Lobe im Text Gefangen in der Feedback-Schleife (2023)

Da Englisch gewissermaßen die Leitsprache von Systemen wie GPT-4 darzustellen scheint, d.h. eine klare Tendenz besteht, englische Stilprinzipien auf andere Sprachen zu übertragen, droht die Proliferation artifizieller Texte die Hegemonie des Englischen und des mit ihm verbundenen Schreib- und Denkstils weiter zu stärken.

Von Dirk Siepmann in der Zeitschrift Forschung & Lehre 7/23 im Text Vom Akkordarbeiter zum Gutachter (2023)

Die Standarderwartung an Texte wird sich also auf kurz oder lang verschieben – von der Überzeugung, ein Mensch stehe dahinter, zum Zweifel, ob es nicht doch eine Maschine sein könnte. Damit aber wird auch die Unterscheidung zwischen natürlichen und artifiziellen Texten zusehends hinfällig. Wir würden dann womöglich in eine Phase postartifizieller Texte übergehen.

Von Hannes Bajohr im Text Schreiben nach KI – artifizielle und postartifizielle Texte (2023)

Large language models are our second contact with A.I. We cannot afford to lose again. But on what basis should webelieve humanity is capable of aligning these new forms of A.I. to our benefit? If we continue with business as usual,the new A.I. capacities will again be used to gain profit and power, even if it inadvertently destroys the foundations ofour society.

Von Yuval Harari, Tristan Harris, Aza Raskin im Text You Can Have the Blue Pill or the Red Pill, and We’re Out of Blue Pills (2023)

KI-Systeme und Sprachmodelle im Besonderen werden von Menschen programmiert. Und die implementieren nicht nur mathematische, sondern auch soziale Werte. ChatGPT ist schon jetzt eine Storytelling-Maschine, die es mit der Diskursmacht von Disney oder Hollywood aufnehmen könnte. Die Frage, wie dieses Computersystem lernt, hat daher auch gesellschaftspolitische Relevanz.

Von Adrian Lobe im Text Geschichten von morgen (2023)

Von Hannes Bajohr im Text Artifizielle und postartifizielle Texte (2023)

So wie kein Autor unter seinen Text schreibt: „Dieser Artikel wurde mit Word 16.66.1 geschrieben und mit dessen Rechtschreibkorrektur überprüft“, ergibt es in Zukunft keinen Sinn, alle KI-Tools aufzulisten, die bei der Recherche und Formulierung geholfen haben. Wichtiger ist es, dass immer ein Autor für den Inhalt eines Textes geradesteht und verantwortlich gemacht werden kann.

Von Hartmut Gieselmann in der Zeitschrift Der universelle Texter (2023) im Text Wer soll das alles lesen?

You should be worried. GPT-3 and programs like it are starting to take over routine writing tasks like composing blogs and writing news stories. They are good at summarizing magazine articles and academic papers. They can write convincing poetry. The computer games industry is adopting these programs to offer lifelike characters, with personalities and emotions, who can engage in deep conversation with players.

Von Mike Sharples, Rafael Perez Y Pérez im Buch Story Machines (2022) im Text Can a computer write a story?

Auch in der Schweiz schreiben erste Roboter Texte selbst, allerdings keine Meinungsbeiträge, sondern nur standardisierte Textsorten, für die keine speziellen Kenntnisse oder Erfahrungen nötig sind. So wird bei 'CH Media' automatisiert von einem Textgenerator über sämtliche regionalen Fussballspiele berichtet. Dort kommt zur Generierung der Texte die Textengine Arria NLG zum Einsatz, wie der Entwickler 'Persönlich' erklärte.

Von Marcel Gamma im Text Schrieb eine KI eine geistreiche Abhandlung selbst? (2020)

Die Flut massenhaft verfügbarer schlechter Texte, die kein Algorithmus mehr vernünftig bewerten und aussortieren kann, könnte einen Trend umkehren, der ursprünglich durch das Internet ausgelöst wurde. Das Internet hat einst die Rolle der Verlage als Gatekeeper geschwächt. ChatGPT könnte sie wieder stärken, wenn die Verlage mit menschlich kuratierten Inhalten für Autoren und Textqualität bürgen, die dem austauschbaren Content der Vorschlagsalgorithmen überlegen ist.

Von Philipp Schönthaler im Text Schneller als gedacht (2023)

Auch wenn es immer wieder Forderungen nach Verboten geben wird, sind wir überzeugt, dass es – wie bereits bei Innovationen vergangener Jahre – darum geht, wie wir mit der neuen Technologie umgehen wollen und sollen. In der Tat stehen wir vor einer grossen Herausforderung, aber gemeinsam – Eltern, Lehrpersonen und Schulleitungen – werden wir Wege finden, damit umzugehen, damit qualitative Bildung weiterhin für alle zugänglich ist und Chancengerechtigkeit nicht eine Worthülse bleibt.

Von Jörg Berger im Text Im Dialog mit dem Chatbot (2023)

As argued by Bender and Koller [14], it is important to understand the limitations of LMs and put their success in context. This not only helps reduce hype which can mislead the public and researchers themselves regarding the capabilities of these LMs, but might encourage new research directions that do not necessarily depend on having larger LMs. As we discuss in §5, LMs are not performing natural language understanding (NLU), and only have success in tasks that can be approached by manipulating linguistic form [14].

Von Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell im Text On the Dangers of Stochastic Parrots (2021)

Vermutlich sollten wir schnellstens lernen, Chat GPT als assistierende Software zu betrachten, die in weniger Zeit mehr Daten verarbeiten kann als Menschen. Die schlau klingt, aber oft falschliegt. Dabei sollten wir wachsam bleiben: Die guten Sätze, sie werden uns immer wieder einlullen. Sinnvoll ist es, Chatbots dort zu nutzen, wo das Resultat leicht zu überprüfen ist – Synonyme vorschlagen, Texte zusammenfassen, Programmiercode ergänzen –, oder dort, wo die Wahrheit egal ist: für ein Lied über die Volatilität der Aktienmärkte oder ein Drama zum Untergang einer Grossbank.

Von Marie-José Kolly im Text Chatbots wie GPT können wunderbare Sätze bilden. Genau das macht sie zum Problem (2023)

In der Schweiz setzen die grossen Medienhäuser in diesen Bereichen seit einigen Jahren ebenfalls automatisierte Textproduktion ein (Beck, 2023). Tamedia erstellt seit 2018 Berichte zu Abstimmungen auf Gemeindeebene automatisiert mit dem Textroboter Tobi (Fürst & Grubenmann, 2019). Lena, der Textroboter von Keystone-SDA, produziert automatisiert mehrsprachige Kurztexte zu den Resultaten nationaler und kantonaler Abstimmungen (Fürst & Grubenmann, 2019). Auch CH Media nutzt KI, um Texte zu News aus Gemeinden oder Resultaten im Regionalsport zu generieren (Aargauer Zeitung, 2021).

Von Daniel Vogler, Mark Eisenegger, Silke Fürst, Linards Udris, Quirin Ryffel, Maude Rivière, Mike S. Schäfer im Buch Jahrbuch Qualität der Medien (2023) im Text Künstliche Intelligenz in der journalistischen Nachrichtenproduktion

Die Arbeitsweise der Algorithmen, ihre Heranziehung von großen Mengen archivierter Artikel, um damit das Skelett der Daten mit Formulierungen zu umkleiden, die sie für den Menschen besser les- und verstehbar machen, eignet sich jedoch bei weitem nicht für alle Arten von Text. Sie wird gut funktionieren, wenn die zu beschreibenden Sachverhalte anhand von strukturierten Daten vorliegen, die »nur noch« in Prosa umgesetzt werden müssen. Andere Algorithmen sind jedoch zumindest in begrenztem Maße in der Lage, auch aus sogenanntem unstrukturiertem Text, also Nachrichtentickermeldungen oder Dokumenten, wohlfeile strukturierte Informationen zu extrahieren, die dann wiederum von anderen Algorithmen weitergenutzt werden können.

Von Constanze Kurz, Frank Rieger im Buch Arbeitsfrei (2013) im Text Die Automatisierung des Geistes

Das dritte Beispiel des computational journalism dürfte am deutlichsten machen, dass Computer anfangen, kognitive Leistungen für Menschen zu übernehmen. Mehrere Firmen verkaufen bereits erfolgreich computergenerierte Sport- und Börsenberichte an Zeitungen. Je mehr Daten zu einem Ereignis digital verfügbar sind, desto einfacher ist es für einen Computer, daraus einen Artikel zu formulieren, der von Menschen nicht als vom Computer geschrieben erkannt wird. In den USA eignet sich zum Beispiel Baseball sehr, da in einem solchen Spiel viele Daten anfallen, aus denen sich der Spielverlauf ablesen lässt. Im Finanzbereich wird das Verfassen von Jahresberichten börsennotierter Unternehmen immer heikler, da falsche Formulierungen juristische Konsequenzen haben könnten. Also wird auch diese Arbeit Computern übertragen, die aus den Geschäftsdaten einen trockenen Prosatext generieren. Computer schreiben erfolgreich Texte – damit verschiebt sich unaufhaltsam die Grenze dessen, was wir für automatisierbar halten.

Von Beat Döbeli Honegger im Buch Mehr als 0 und 1 (2016) im Text Warum die ganze Aufregung?

Bereits 2010 wurde die Anwendung Stats Monkey vorgestellt, die kurze Berichte zu Baseballspielen anfertigen kann. Alles, was das Programm dafür benötigt, sind umfassende Daten zu den Spielen, die mittlerweise routinemäßig erhoben und dank verbesserter algorithmischer Bilderkennung und neuer Sensoren immer detaillierter werden. Das Programm extrahiert aus den Daten die entscheidenden Momente und Akteure eines Spiels, erkennt charakteristische Muster im Spielverlauf (etwa “frühe Führung stetig ausgebaut”, “dramatische Aufholjagd” oder Ähnliches) und generiert darauf aufbauend eigene Berichte. Dabei kann eine Vielzahl von Variablen bestimmt werden, etwa ob ein Artikel aus der Perspektive eines neutralen Beobachters oder vom Standpunkt eines der beiden Teams geschrieben werden soll. Oder man kann, weil Eltern nicht gerne über die Fehler ihrer Kinder lesen, festlegen, dass vor allem die gelungenen Spielzüge hervorgehoben werden sollen, wenn es um Partien in der Schülerliga geht. Der Algorithmus wurde rasch patentiert, und aus dem ursprünglich interdisziplinären Forschungsprojekt wurde ein Start-up-Unternehmen: Narrative Science. Dieses bietet heute Texte aller Art an, neben Sport- vor allem auch Finanzberichterstattung, ebenfalls ein Feld, für das statistische Informationen in Fülle vorliegen. Diese Texte werden in renommierten Medien wie dem Wirtschaftsmagazin Forbes veröffentlicht und dort mit dem Autorenvermerk “narrative science” gekennzeichnet. Noch beschränken sich diese Beiträge auf relativ einfache Themen. Dabei soll es aber nicht bleiben. Auf die Frage, wie groß der Anteil algorithmisch verfasster Nachrichten in fünfzehn Jahren sein werde, antwortete Kristian Hammond, Technologiechef von Narrative Science und einer der Gründer des Unternehmens, 2012 selbstbewusst mit “neunzig Prozent” – und fügte gleich noch hinzu, dass ein Algorithmus schon in fünf Jahren zum ersten Mal den Pulitzer-Preis gewinnen werde.[195] Da wird einiges an Hype und Selbstmarketing mitschwingen, aber als generelle Einschätzung ist seine Aussage nicht unglaubwürdig.

Von Felix Stalder im Buch Kultur der Digitalität (2016) im Text Formen der Digitalität

CoautorInnenlandkarte

Diese Grafik fensterfüllend anzeigen (SVG)

Häufig erwähnende Personen

Hartmut
Gieselmann

Häufig co-zitierte Personen

Ilya
Sutskever

Sandhini
Agarwal

Mark
Chen

Christopher
Hesse

Clemens
Winter

Jeffrey
Wu

Daniel M.
Ziegler

Aditya
Ramesh

Rewon
Child

Eric
Sigler

Gretchen
Krueger

Ariel
Herbert-Voss

Girish
Sastry

Pranav
Shyam

Arvind
Neelakantan

Jared
Kaplan

Melanie
Subbiah

Nick
Ryder

Benjamin
Mann

Kewal
Dhariwal

Tom
Henighan

Tom B.
Brown

Mateusz
Litwin

Amanda
Askell

Prafulla
Dhariwal

Dario
Amodei

Alec
Radford

Sam
McCandlish

Christopher
Berner

Jack
Clark

Benjamin
Chess

Scott
Gray

Statistisches Begriffsnetz

12 Vorträge von Beat mit Bezug

Aus dem fernen Digitalien...
edudays 2015 (Videoaufzeichnung)
Krems an der Donau 2015, 08.04.2015
Schule - Medien - Informatik - Worauf sollen wir uns einstellen?
Eröffnungsreferat an der Kick-Off-Veranstaltung zur dynamischen ICT-Strategie des Kantons Thurgau
PH Thurgau, Kreuzlingen, 24.06.2015
1001 Fragen zu Digitalisierung und Fachdidaktik
Hauptvortrag von Ralf Romeike und Beat Döbeli Honegger an der Jahrestagung der Gesellschaft für Fachdidaktik (GFD)
Regensburg, bzw. Internet, 23.09.2020
Anforderungen an die Lehrkräftebildung MIT - ÜBER - IN digitalen Medien

QLB-BMBF-Kongress Berlin, 22.11.2021
Die Reise nach Digitalien

PH VS / HEP VS, Sion, 18.01.2023
ChatGPT - der iPhone-Moment für KI?

Klausur PHSZ, Oberägeri, 14.02.2023
ChatGPT - der iPhone-Moment des maschinellen Lernens

AG Fremdsprachen Kammer PH swissuniversities, 25.05.2023
ChatGPT - der iPhone-Moment des maschinellen Lernens

NMS Bern, 07.06.2023
ChatGPT - Refresher

Dozierenden-Klausur PHSZ, Goldau, 26.06.2023
BBZGPT

Berufsbildungszentrum Goldau, 17.08.2023
Nachrichtenkompetenz – und jetzt auch noch ChatGPT & Co.

Tagung "Nachrichtenkompetenz auf Sekundarstufe II" von ZHAW und SRG public value, 03.11.2023
ChatGPT & Co. – eine Etappe auf der Reise nach Digitalien

CAS Lernreise, 19.01.2024