Maschinelles Lernen durch Belohnung: Wie eine Maschine ihre Entscheidung trifft

Versuch und Irrtum prägen nicht nur menschliches Lernen, auch Computerprogramme können ihren Handlungsspielraum über das Erforschen ihrer Umgebung erweitern.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Reinforcement Learning, Teil 1: Grundlagen der maschinellen Entscheidungsfindung
Lesezeit: 12 Min.
Von
  • Gerhard Völkl
Inhaltsverzeichnis

Katzen in Bildern erkennen? Für einen Computer kein Problem – dank maschinellem Lernen. Die nächste Herausforderung besteht darin, dass ein Computer lernt, selbstständig sinnvolle Entscheidungen zu treffen, etwa in Videospielen mehr Punkte zu holen als ein durchschnittlicher menschlicher Spieler. Mit Reinforcement Learning (RL) kann das gelingen.

"Computer bringt sich selbst Go bei – und wird Weltklasse", "Roboter lernen im Turbo-Tempo" und "Künstliche Intelligenz bewältigt 49 Atari-Spiele" sind Schlagzeilen, hinter denen dieser spezielle Bereich des Machine Learning (ML) steckt, das Lernen durch Belohnung.

Schwerpunkt: Reinforcement Learning

Wie das funktioniert und wie man damit in Python arbeiten kann, zeigt dieses Tutorial. Der erste Teil erklärt die Grundlagen, auf denen alle weiteren Verfahren aufbauen. Im zweiten Teil geht es um beschreibende Funktionen, die zum optionalen Lösungsweg führen. Wie ein Programm selbstständig lernt, ein klassisches Atari-Videospiel zu spielen, wird der dritte Teil zeigen.

Das war die Leseprobe unseres heise-Plus-Artikels "Maschinelles Lernen durch Belohnung: Wie eine Maschine ihre Entscheidung trifft". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.