Reinforcement Learning: Neuronale Netze mit Atari-Spielen trainieren

Reinforcement Learning lässt sich gut mit Videospielen ausprobieren – im Beispiel mit TensorFlow und Python.

Artikel verschenken

5

29.05.2019, 16:15 Uhr

Lesezeit: 19 Min.

iX Magazin

Von

Gerhard Völkl

Reinforcement Learning: Neuronale Netze mit Atari-Spielen trainieren
- Deep Q-Learning im neuronalen Netz
- Docker-Umgebung für das Beispielprogramm
Bildbearbeitung vorab
Ebenen des neuronalen Netzes
Die Loss-Funktion

Artikel in iX 6/2019 lesen

Die Herausforderung, Software zu entwickeln, die besser Schach spielen kann als ein Mensch, haben Programmierer schon lange gemeistert. Aber dass Computer mehr Punkte in Videospielen holen als ein Durchschnittsspieler, hat die Firma DeepMind erst 2013 mit Reinforcement Learning – Lernen durch Belohnung – überzeugend geschafft.

2014 kaufte Google DeepMind. Der Kaufpreis, der nie offiziell bestätigt wurde, wird auf etwa 500 Millionen Dollar geschätzt. DeepMind verwendete Q-Learning, eine bestimmte Variante des Reinforcement Learning. Der dritte Teil konzentriert sich darauf, das Verfahren von DeepMind in Python mit der Bibliothek TensorFlow vereinfacht nachzubilden – ganz nach dem Prinzip: Nur wer einen Algorithmus nachbauen kann, hat die Grundzüge des Verfahrens verstanden.

Klassische Atari-Videospiele bieten eine gute Möglichkeit, Reinforcement-Algorithmen zu testen.

Normalerweise benötigen Q-Learning-Algorithmen einiges an Rechenleistung, die häufig aus zusätzlicher Hardware – etwa Grafikkarten – kommt. Das Beispielprogramm q_learning.py ist nicht für eine bestimmte Hardware optimiert, da es auf möglichst vielen Plattformen laufen soll. Im Fokus steht, dass auf "einfachen" Rechnern einige Lernvorgänge damit möglich sind. Professionelle Lernprogramme benötigen aber einige Hunderttausende oder gar Millionen davon, um die gewünschte Qualität zu erreichen. Der Original-Quellcode von DeepMind ist auf GitHub zu finden.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

iPad Pro M4 mit Magic Keyboard und Apple Pencil

iPad Pro 13" M4 im Test: Was Apples 3000-Euro-Tablet taugt

Das iPad Pro ist flacher und schneller als jedes Apple-Tablet zuvor. Wir haben das Spitzenmodell mit entspiegeltem OLED-Display getestet. Lohnt der Umstieg?

Gehälter 2024: Das verdienen Admins in Deutschland

Firmen suchen händeringend nach IT-Admins. Sie sind der Grundstein für eine gute technische Infrastruktur. Wir zeigen, was Administratoren verdienen.

Gehaltsverhandlungs-Tricks

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Bonusprogramme belohnen Ihren Einkauf mit Punkte und Meilen. Ob sich das Sammeln lohnt, hängt auch von den jeweiligen Partnern und den Abkürzungen im System ab.

!!!Aufmacher: die 3 Growboxen auf Basis der Herstellerfotos gezeichnet (cyberstyle) vor Hanfhintergrund!!!,

Growboxen ausprobiert: Digital unterstützte Anzuchtboxen für den Cannabis-Anbau

Drei Cannabispflanzen darf man daheim aufziehen. Helfen kann eine Anzuchtbox, die sich um Licht, Wasser und Lüftung für die anspruchsvollen Gewächse kümmert.

Raspi: Eigene Serverdienste mit einem Klick einrichten

Die Software Umbrel ermöglicht, Cloud-Dienste wie Home Assistant mit einem Klick einzurichten. Dadurch wird die Softwareverwaltung auf einem Raspi erleichtert.

Air,Conditioning,Technician,And,A,Part,Of,Preparing,To,Install

Wandel bei Wärmepumpen: Neue Kältemittel, ohne Kompressor und mit KI

Die Wärmepumpe ist die Heiztechnik der Zukunft. Ihre technische Entwicklung ist allerdings weiterhin nicht ausgereizt – insbesondere in Hinblick auf Effizienz.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

iPad Pro 13" M4 im Test: Was Apples 3000-Euro-Tablet taugt

Das iPad Pro ist flacher und schneller als jedes Apple-Tablet zuvor. Wir haben das Spitzenmodell mit entspiegeltem OLED-Display getestet. Lohnt der Umstieg?

Gehälter 2024: Das verdienen Admins in Deutschland

Firmen suchen händeringend nach IT-Admins. Sie sind der Grundstein für eine gute technische Infrastruktur. Wir zeigen, was Administratoren verdienen.

Gehaltsverhandlungs-Tricks

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Bonusprogramme belohnen Ihren Einkauf mit Punkte und Meilen. Ob sich das Sammeln lohnt, hängt auch von den jeweiligen Partnern und den Abkürzungen im System ab.

Growboxen ausprobiert: Digital unterstützte Anzuchtboxen für den Cannabis-Anbau

Drei Cannabispflanzen darf man daheim aufziehen. Helfen kann eine Anzuchtbox, die sich um Licht, Wasser und Lüftung für die anspruchsvollen Gewächse kümmert.

Raspi: Eigene Serverdienste mit einem Klick einrichten

Die Software Umbrel ermöglicht, Cloud-Dienste wie Home Assistant mit einem Klick einzurichten. Dadurch wird die Softwareverwaltung auf einem Raspi erleichtert.

Wandel bei Wärmepumpen: Neue Kältemittel, ohne Kompressor und mit KI

Die Wärmepumpe ist die Heiztechnik der Zukunft. Ihre technische Entwicklung ist allerdings weiterhin nicht ausgereizt – insbesondere in Hinblick auf Effizienz.

nach oben

Alle Angebote

Newsletter heise-Bot

${intro} ${title}

${intro} ${title}

Reinforcement Learning: Neuronale Netze mit Atari-Spielen trainieren

Immer mehr Wissen. Das digitale Abo für IT und Technik.

iPad Pro 13" M4 im Test: Was Apples 3000-Euro-Tablet taugt

Gehälter 2024: Das verdienen Admins in Deutschland

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Growboxen ausprobiert: Digital unterstützte Anzuchtboxen für den Cannabis-Anbau

Raspi: Eigene Serverdienste mit einem Klick einrichten

Wandel bei Wärmepumpen: Neue Kältemittel, ohne Kompressor und mit KI

Immer mehr Wissen. Das digitale Abo für IT und Technik.

iPad Pro 13" M4 im Test: Was Apples 3000-Euro-Tablet taugt

Gehälter 2024: Das verdienen Admins in Deutschland

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Growboxen ausprobiert: Digital unterstützte Anzuchtboxen für den Cannabis-Anbau

Raspi: Eigene Serverdienste mit einem Klick einrichten

Wandel bei Wärmepumpen: Neue Kältemittel, ohne Kompressor und mit KI

Spiele

1 Jahr nur 1,90 € pro Woche

Das digitale Abo für IT und Technik.