/ en / Traditional / help

Beats Biblionetz - Begriffe

AlphaGo

iconBemerkungen

Smarte MaschinenIm März 2016 schaffte es die lernfähige Software AlphaGo, den weltbesten Go-Spieler Lee Sedol bei diesem komplexen Brettspiel haushoch zu schlagen – eine Leistung, die Fachleute noch wenige Monate zuvor nicht vor dem Jahr 2025 erwartet hätten.
Von Ulrich Eberl im Buch Smarte Maschinen (2016)
Beat Döbeli HoneggerDas Bemerkenswerte an AlphaGo ist für mich nicht, dass die Software den Weltmeister geschlagen hat, sondern dass AlphaGo eine Strategie verwendet hat, welche die Menschheit bisher nicht kannte und nun die Art und Weise prägt, wie künftig Go gespielt wird. Damit stellt sich unter anderem die Frage, wer oder was hier intelligent war: Die Software oder die Entwickler der Software, die aber nicht wissen konnten, dass durch ihre Entwicklung eine neue Strategie entstehen wird.
Von Beat Döbeli Honegger, erfasst im Biblionetz am 19.11.2022
The Coming WaveDer Triumph von AlphaGo läutete ein neues Zeitalter der KI ein. Anders als bei DQN wurde das Verfahren diesmal live vor einem Millionenpublikum übertragen. Unser Team hatte vor den Augen der Öffentlichkeit das hinter sich gelassen, was Forscher den «KI-Winter» nannten, als die Forschungsmittel versiegten und das Feld gemieden wurde. KI war wieder da und begann endlich zu liefern. Wieder einmal war ein tiefgreifender technologischer Wandel im Anmarsch, eine neue Welle zeichnete sich ab. Und das war erst der Anfang. Von
Von Mustafa Suleyman, Michael Bhaskar im Buch The Coming Wave (2023) im Text Die Technologie der Intelligenz
Als Lee Sedol‌ und danach alle anderen Go-Meister von AlphaGo geschlagen wurden, nahmen viele an, dass der Anfang vom Ende gekommen sei: Schließlich hatte eine Maschine von Grund auf gelernt, den Menschen bei einer selbst für extrem intelligente Vertreter unserer Spezies sehr schwierigen Aufgabe zu schlagen. Da konnte es nicht mehr lang dauern, bis die KI den Ton angeben würde. Sogar einige Skeptiker wurden unruhig, als AlphaZero neben Go auch Schach und Shōgi meisterte. Doch AlphaZero hat Grenzen: Es funktioniert nur für die Klasse diskreter, beobachtbarer Spiele für zwei Spieler mit bekannten Regeln. Der Ansatz funktioniert überhaupt nicht für Aufgaben wie Autofahren, Lehren, das Führen von Staatsgeschäften oder das Erringen der Weltherrschaft
Von Stuart Russell im Text Natürliche und künstliche Intelligenz
Das DeepMind-Team‌ von Google erschuf das weltmeisterliche AlphaGo,‌ ohne Go wirklich in den Mittelpunkt zu rücken. Der Code enthält also keine rein auf Go‌ bezogenen Anweisungen für bestimmte Stellungen. Seine Entscheidungsprozeduren funktionieren somit nicht nur für das Go-Spiel. Stattdessen hat das Team zwei recht allgemeine Techniken verbessert, nämlich die vorausschauende oder Lookahead-Suche zur Entscheidungsfindung und das Reinforcement Learning. Durch Letzteres kann der Algorithmus lernen, die jeweilige Spielstellung zu bewerten. Dies reichte aus, um AlphaGo auf übermenschlichem Niveau spielen zu lassen.‌ ‌Diese Verbesserungen lassen sich auch auf viele andere Probleme in ganz anderen Gebieten anwenden, zum Beispiel in der Robotik. Eine neuere Version von AlphaGo namens AlphaZero schlug vor Kurzem nicht nur AlphaGo vernichtend im Go, sondern mit Stockfish auch das beste Schachprogramm der Welt und mit Elmo das beste Shōgi-Programm der Welt – beide sehr viel besser als jeder Mensch.‌‌‌ Um dem Ganzen die Krone aufzusetzen, schaffte AlphaZero das alles an nur einem Tag.
Von Stuart Russell im Text Natürliche und künstliche Intelligenz
Nun ist es selbst für den Go-kundigen Amateur kaum nachzuvollziehen, wieso die Profis einen Zug als innovativ bezeichnen, ist doch praktisch jede Stellung mit mehr als 20 Steinen auf dem Go-Brett einmalig und vermutlich noch nie zuvor gespielt worden. Aber aus der einhelligen Meinung der Kommentatoren zu bestimmten Zügen kann man schließen, dass AlphaGo über seine Schöpfer hinausgewachsen ist. Das ist vielleicht nicht ganz verwunderlich. Die neuronalen Netze, die zentraler Bestandteil von AlphaGo sind, wurden nämlich nur zu Beginn mit Millionen von Stellungen aus Partien starker menschlicher Spieler trainiert. Hier lernten sie zunächst, Menschen in ihrem Spiel zu imitieren. Dann kam aber eine Phase des Reinforcement Learning: Das neuronale Netz spielte Millionen von Partien gegen sich selbst und lernte daraus, wie man dieses Spiel noch besser spielt. Während ein werdender Profiin Asien sein halbes Leben damit verbringt, das Jahrhunderte alte Wissen und die Traditionen zu verinnerlichen, durfte AlphaGo ganz alleine lernen, ohne die Vorurteile eines Lehrers. So sah denn Michael Redmond nach dem Zwischenstand 3:0 für den Computer das Go mitnichten dem Untergang geweiht, sondern spekulierte sogar, dass vielleicht durch die Computer eine dritte Revolution der Eröffnungstheorie bevorsteht.
Von Harald Bögeholz im Text Jubel und Ernüchterung (2016)
The Coming WaveIm März 2016 organisierten wir dann ein Turnier in Südkorea. Alpha- Go trat gegen Lee Sedol an, einen virtuosen Weltmeister. Wer gewinnen würde, war keineswegs klar. Die meisten Beobachter setzten in der ersten Runde auf Sedol. Aber AlphaGo gewann die erste Partie, sehr zu unserem Schrecken und unserer Freude. In der zweiten Partie kam Zug Nummer 37, ein Zug, der in die Annalen von KI und von Go einging. Er ergab keinen Sinn. AlphaGo hatte es offensichtlich vermasselt und folgte blindlings einer Verluststrategie, die kein professioneller Spieler jemals verfolgen würde. Die Live-Kommentatoren, beides Profis auf höchstem Niveau, meinten, es sei ein «sehr seltsamer Zug», und hielten ihn für «einen Fehler ». Er war jedenfalls so ungewöhnlich, dass Sedol fünfzehn Minuten brauchte, um zu reagieren, und sogar vom Brett aufstand, um nach draußen zu gehen.
Während wir von unserem Kontrollraum aus zusahen, herrschte eine geradezu unwirkliche Spannung. Doch als das Spiel dem Ende zuging, erwies sich dieser «falsche» Zug als entscheidend. AlphaGo hatte erneut gewonnen. Die Go-Strategie wurde vor unseren Augen neu geschrieben. Unsere KI hatte Ideen aufgedeckt, auf die selbst die brillantesten Spieler seit Tausenden von Jahren nicht gekommen waren. In nur wenigen Monaten konnten wir Algorithmen so trainieren, dass sie neues Wissen entdeckten und neue, scheinbar übermenschliche Erkenntnisse gewannen.
Von Mustafa Suleyman, Michael Bhaskar im Buch The Coming Wave (2023) im Text Die Technologie der Intelligenz

iconVerwandte Objeke

icon
Verwandte Begriffe
(co-word occurance)
deep learning(0.05), AlphaFold(0.04), Künstliche Intelligenz (KI / AI)artificial intelligence(0.03)

iconHäufig erwähnende Personen

Mustafa Suleyman Mustafa
Suleyman

iconHäufig co-zitierte Personen

Harald Bögeholz Harald
Bögeholz
Hannah Fry Hannah
Fry
Nick Bostrom Nick
Bostrom
Eckart Zitzler Eckart
Zitzler
Elon Musk Elon
Musk
Thomas Ramge Thomas
Ramge
Pedro Domingos Pedro
Domingos
Ray Kurzweil Ray
Kurzweil
Meredith Broussard Meredith
Broussard
Katharina Simbeck Katharina
Simbeck
Judy Wajcman Judy
Wajcman
Tom Rodden Tom
Rodden
Yvonne Rogers Yvonne
Rogers
Xiaolin Wu Xiaolin
Wu
Xi Zhang Xi
Zhang
Michio Kaku Michio
Kaku
Yilun Wang Yilun
Wang
Hans Moravec Hans
Moravec

iconStatistisches Begriffsnetz  Dies ist eine graphische Darstellung derjenigen Begriffe, die häufig gleichzeitig mit dem Hauptbegriff erwähnt werden (Cozitation).

icon10 Vorträge von Beat mit Bezug

iconZitationsgraph

Diese Grafik ist nur im SVG-Format verfügbar. Dieses Format wird vom verwendeteten Browser offenbar nicht unterstützt.

Diese Grafik fensterfüllend anzeigen (SVG)

iconZeitleiste

icon93 Erwähnungen  Dies ist eine nach Erscheinungsjahr geordnete Liste aller im Biblionetz vorhandenen Werke, die das ausgewählte Thema behandeln.

iconAnderswo finden

iconAnderswo suchen  Auch im Biblionetz finden Sie nicht alles. Aus diesem Grund bietet das Biblionetz bereits ausgefüllte Suchformulare für verschiedene Suchdienste an. Biblionetztreffer werden dabei ausgeschlossen.

iconBiblionetz-History Dies ist eine graphische Darstellung, wann wie viele Verweise von und zu diesem Objekt ins Biblionetz eingetragen wurden und wie oft die Seite abgerufen wurde.