Nächste Seite: Idee bzw. Aufgabe Aufwärts: Neuronale_Netze Vorherige Seite: Lernen Inhalt
Reinforcement Learning (Bestärkendes Lernen)
Beim Reinforcement Learning (Übersetzt: Bestärkendes Lernen) gibt es anders als bei MLPs und RBF-Netzen keinen Teacher mehr, sondern nur noch einen Reward, der uns sagt, ob wir gut oder schlecht waren. Dies ist ein Mittelding zwischen Teacher und gar nichts, wie zum Beispiel bei SOMs und Neuronalem Gas.Unterabschnitte
- Idee bzw. Aufgabe
- Agent in Environment
- Agent lernt eine Policy
- Unterschied Zustand - Situation
- Reward und Return
- Sonderfälle des Rewards
- Beispiele
- Value Function
- Greedy-Policy vs. Optimal Policy
- Lernen der Value Function (Temporal Difference Learning)
- Was passiert?
- State Value Function
- Action Value Funktion
- Neuronales Netz zur Bestimmung der Value function eines Teilbaumes
- Reinforcment Learning mit (adaptive) Critic
- SARO (Sensor Driven Random Optimisation)
- ASE - ACE