Maschinelles Lernen durch Belohnung: Wie eine Maschine ihre Entscheidung trifft

Versuch und Irrtum prägen nicht nur menschliches Lernen, auch Computerprogramme können ihren Handlungsspielraum über das Erforschen ihrer Umgebung erweitern.

Artikel verschenken

2

26.04.2019, 14:07 Uhr

Lesezeit: 12 Min.

iX Magazin

Von

Gerhard Völkl

Maschinelles Lernen durch Belohnung: Wie eine Maschine ihre Entscheidung trifft
- Learning by doing
- Gleiche Begriffe helfen beim Lernen
Umgebung für die Interaktion
Allgemeingültige Vorgehensweisen finden

Artikel in iX 5/2019 lesen

Katzen in Bildern erkennen? Für einen Computer kein Problem – dank maschinellem Lernen. Die nächste Herausforderung besteht darin, dass ein Computer lernt, selbstständig sinnvolle Entscheidungen zu treffen, etwa in Videospielen mehr Punkte zu holen als ein durchschnittlicher menschlicher Spieler. Mit Reinforcement Learning (RL) kann das gelingen.

"Computer bringt sich selbst Go bei – und wird Weltklasse", "Roboter lernen im Turbo-Tempo" und "Künstliche Intelligenz bewältigt 49 Atari-Spiele" sind Schlagzeilen, hinter denen dieser spezielle Bereich des Machine Learning (ML) steckt, das Lernen durch Belohnung.

Wie das funktioniert und wie man damit in Python arbeiten kann, zeigt dieses Tutorial. Der erste Teil erklärt die Grundlagen, auf denen alle weiteren Verfahren aufbauen. Im zweiten Teil geht es um beschreibende Funktionen, die zum optionalen Lösungsweg führen. Wie ein Programm selbstständig lernt, ein klassisches Atari-Videospiel zu spielen, wird der dritte Teil zeigen.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Unbekannte haben einen dubiosen Server unter dem Domainnamen fritz.box betrieben. Wir zeigen, wie man unerwünschten Verkehr mit zweifelhaften Servern vermeidet.

Mit der Apple Watch im Schlaflabor: So gut zeichnet sie Schlaf auf

Wie sich die Apple Watch nachts gegenüber anderen Schlaf-Trackern schlägt und wie im Vergleich zur Analyse durch ein Schlaflabor.

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Bonusprogramme belohnen Ihren Einkauf mit Punkte und Meilen. Ob sich das Sammeln lohnt, hängt auch von den jeweiligen Partnern und den Abkürzungen im System ab.

Vier E-Reader mit Farbdisplay im Test: Entspannt im Freien lesen

E-Book-Reader werden bunt: Wir testen Tolino Shine Color, Pocketbook Era Color, Pocketbook Inkpad Color 3 und Boox Note Air3 C.

E-Books leihen

Banknoten neben den Feldern eines Gasherds

Das deutsche Gasnetz: Was daraus werden soll und was Verbraucher wissen müssen

Erdgas steht vor dem Aus und das Gasnetz vor dem Umbau: In welche Richtung es sich entwickeln kann und was das für die Gaskunden bedeutet.

Gehälter 2024: Das verdienen Admins in Deutschland

Firmen suchen händeringend nach IT-Admins. Sie sind der Grundstein für eine gute technische Infrastruktur. Wir zeigen, was Administratoren verdienen.

Gehaltsverhandlungs-Tricks

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Unbekannte haben einen dubiosen Server unter dem Domainnamen fritz.box betrieben. Wir zeigen, wie man unerwünschten Verkehr mit zweifelhaften Servern vermeidet.

Mit der Apple Watch im Schlaflabor: So gut zeichnet sie Schlaf auf

Wie sich die Apple Watch nachts gegenüber anderen Schlaf-Trackern schlägt und wie im Vergleich zur Analyse durch ein Schlaflabor.

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Bonusprogramme belohnen Ihren Einkauf mit Punkte und Meilen. Ob sich das Sammeln lohnt, hängt auch von den jeweiligen Partnern und den Abkürzungen im System ab.

Vier E-Reader mit Farbdisplay im Test: Entspannt im Freien lesen

E-Book-Reader werden bunt: Wir testen Tolino Shine Color, Pocketbook Era Color, Pocketbook Inkpad Color 3 und Boox Note Air3 C.

E-Books leihen

Das deutsche Gasnetz: Was daraus werden soll und was Verbraucher wissen müssen

Erdgas steht vor dem Aus und das Gasnetz vor dem Umbau: In welche Richtung es sich entwickeln kann und was das für die Gaskunden bedeutet.

Gehälter 2024: Das verdienen Admins in Deutschland

Firmen suchen händeringend nach IT-Admins. Sie sind der Grundstein für eine gute technische Infrastruktur. Wir zeigen, was Administratoren verdienen.

Gehaltsverhandlungs-Tricks

nach oben

Alle Angebote

Newsletter heise-Bot

${intro} ${title}

${intro} ${title}

Maschinelles Lernen durch Belohnung: Wie eine Maschine ihre Entscheidung trifft

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Mit der Apple Watch im Schlaflabor: So gut zeichnet sie Schlaf auf

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Vier E-Reader mit Farbdisplay im Test: Entspannt im Freien lesen

Das deutsche Gasnetz: Was daraus werden soll und was Verbraucher wissen müssen

Gehälter 2024: Das verdienen Admins in Deutschland

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Gefährdete Router: Verkehr mit dubiosen Internetdomains verhindern

Mit der Apple Watch im Schlaflabor: So gut zeichnet sie Schlaf auf

DeutschlandCard, Miles & More, Payback: Welches Bonusprogramm sich lohnt

Vier E-Reader mit Farbdisplay im Test: Entspannt im Freien lesen

Das deutsche Gasnetz: Was daraus werden soll und was Verbraucher wissen müssen

Gehälter 2024: Das verdienen Admins in Deutschland

Spiele

1 Jahr nur 1,90 € pro Woche

Das digitale Abo für IT und Technik.