nach oben

Erschienen in:

2024 | OriginalPaper | Buchkapitel

3. Optimal entscheiden in einer bekannten Umwelt

verfasst von : Uwe Lorenz

Erschienen in: Reinforcement Learning

Verlag: Springer Berlin Heidelberg

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Zusammenfassung

In diesem Abschnitt wird beschrieben, wie eine optimale Handlungsstrategie in einer Umwelt mit einer endlichen Anzahl von Zuständen und Aktionsmöglichkeiten berechnet werden kann. Sie lernen den Unterschied zwischen einer „off-Policy“- und einer „on-Policy“-Bewertung von Aktionsmöglichkeiten kennen. Es werden die beiden Ansätze „Zustandsbewertung“ und „Taktiksuche“ vorgestellt und in Übungsszenarien mit dem Java-Hamster angewendet und ausprobiert. Zudem werden wir die „Policy-Iteration“ als Kombination der beiden unterschiedlichen Ansätze kennen lernen, die sich hier auf interessante Weise ergänzen. Daraus lässt sich eine allgemeine Strategie zur Suche von optimalem Verhalten ableiten. Schließlich wird auf der erarbeiteten Grundlage die Ermittlung von optimalen Zügen in einem überschaubaren Brettspielszenario mit einem Gegenspieler vorgestellt.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Grundbegriffe des Bestärkenden Lernens

Nächstes Kapitel Entscheiden und Lernen in einer unbekannten Umwelt

Nur mit Berechtigung zugänglich

Vgl. Sutton und Barto 2018, Kap. 4.1

Prozesse die einander widersprechen, aber doch eine Einheit bilden und sich u. U. in einer neuen.

Stufe aufheben können.

Alpaydin E (2019) Maschinelles Lernen., 2., erweiterte Auflage. De Gruyter Studium, Berlin/Boston.

Bohles D. Java-hamster-model. www.java-hamster-modell.de

Russell S, Norvig P (2010) Artificial intelligence. A modern approach, 3. Aufl. Pearson Education, New Jersey

Sutton RS, Barto A (2018) Reinforcement learning. An introduction, 2. Aufl. The MIT Press (Adaptive computation and machine learning), Cambridge/London

Titel: Optimal entscheiden in einer bekannten Umwelt
verfasst von: Uwe Lorenz
Verlag: Springer Berlin Heidelberg
Buch: Reinforcement Learning
Print ISBN: 978-3-662-68310-1

Electronic ISBN: 978-3-662-68311-8

Copyright-Jahr: 2024
DOI: https://doi.org/10.1007/978-3-662-68311-8_3

Springer Professional

Zusammenfassung

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"

Premium Partner