nach oben

Erschienen in:

2024 | OriginalPaper | Buchkapitel

4. Entscheiden und Lernen in einer unbekannten Umwelt

verfasst von : Uwe Lorenz

Erschienen in: Reinforcement Learning

Verlag: Springer Berlin Heidelberg

Einloggen

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Aus

Zusammenfassung

In diesem Kapitel wird beschrieben, wie ein Agent ein unbekanntes Umweltsystem, in das er gesetzt wurde, erkunden kann. Dabei entdeckt er Zustände mit Belohnungen und muss zum einen die Pfade zu diesen Zielen optimieren, d. h. seine „Performanz verbessern“, zum anderen aber auch neue Ziele und Handlungsoptionen erkunden. Hierbei muss der Agent einen Kompromiss zwischen „Ausbeutung“ (Exploitation) und „Erkundung“ (Exploration) berücksichtigen. Einerseits muss er den möglichen Lohn bereits entdeckter Ziele kassieren, andererseits die Erkundung bewerkstelligen ohne zu wissen, ob sich der Abstecher ins Neuland überhaupt lohnt. Hierbei gibt es verschiedene Ansätze, die wertvollen Erfahrungen zu verarbeiten, die der Agent sammelt. Zum einen zielen sie darauf ab, diese so zu verarbeiten, dass der Agent unter gleichen Bedingungen künftig besser reagiert („Modellfreie Methoden“), zum anderen gibt es Ansätze, die darauf abzielen, Modelle zu verbessern, die vorhersagen können, was bei der Auswahl bestimmter Aktionen passieren würde. Zudem gibt es auch Ansätze, die Exploration zu optimieren. Dabei können Begriffe wie bspw. „Neugier“ oder „Langeweile“ als Inspirationsquelle dienen.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Online-Abonnement

Mit Springer Professional "Wirtschaft+Technik" erhalten Sie Zugriff auf:

über 102.000 Bücher
über 537 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Finance + Banking
Management + Führung
Marketing + Vertrieb
Maschinenbau + Werkstoffe
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Technik"

Online-Abonnement

Mit Springer Professional "Technik" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 390 Zeitschriften

aus folgenden Fachgebieten:

Automobil + Motoren
Bauwesen + Immobilien
Business IT + Informatik
Elektrotechnik + Elektronik
Energie + Nachhaltigkeit
Maschinenbau + Werkstoffe

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Springer Professional "Wirtschaft"

Online-Abonnement

Mit Springer Professional "Wirtschaft" erhalten Sie Zugriff auf:

über 67.000 Bücher
über 340 Zeitschriften

aus folgenden Fachgebieten:

Bauwesen + Immobilien
Business IT + Informatik
Finance + Banking
Management + Führung
Marketing + Vertrieb
Versicherung + Risiko

Jetzt Wissensvorsprung sichern!

Jetzt informieren

Vorheriges Kapitel Optimal entscheiden in einer bekannten Umwelt

Nächstes Kapitel Schätzer für Zustandsbewertung und Aktionsauswahl

Nur mit Berechtigung zugänglich

Dennett DC (2018) Von den Bakterien zu Bach – und zurück. Die Evolution des Geistes. Suhrkamp, Berlin

Kocsis L, Szepesvári C (2006) Bandit Based Monte-Carlo Planning. In: Fürnkranz J, Scheffer T, Spiliopoulou M (Hrsg) Machine learning: ECML 2006. 17th European Conference on Machine Learning, Berlin, Germany, September 18–22, 2006; proceedings. ECML; European Conference on Machine Learning. Springer, Berlin (Lecture notes in computer science Lecture notes in artificial intelligence, 4212), S 282–293

Godfrey-Smith P (2019) Der Krake, das Meer und die tiefen Ursprünge des Bewusstseins, 1. Aufl. Matthes & Seitz, Berlin

Legg S, Hutter M (2007) A collection of definitions of intelligence. In: IDSIA-07-07

Pathak D, Agrawal P, Efros AA, Darrell T (2017) Curiosity-driven Exploration by Self-supervised Prediction. arXiv:1705.05363

Russell S, Norvig P (2010) Artificial intelligence. A modern approach, 3. Aufl. Pearson Education Inc., New Jersey, USA

Silver D, Huang A (2016) Mastering the game of go with deep neural networks and tree search. Nature. https://www.nature.com/articles/nature16961

Sutton RS, Barto A (2018) Reinforcement learning. An introduction. Second edition. The MIT Press, Cambridge (Adaptive computation and machine learning)

Williams RJ (1992) Simple statistical gradient-following algorithms for connectionist reinforcement learning, S 229–256

Titel: Entscheiden und Lernen in einer unbekannten Umwelt
verfasst von: Uwe Lorenz
Verlag: Springer Berlin Heidelberg
Buch: Reinforcement Learning
Print ISBN: 978-3-662-68310-1

Electronic ISBN: 978-3-662-68311-8

Copyright-Jahr: 2024
DOI: https://doi.org/10.1007/978-3-662-68311-8_4

Springer Professional

Zusammenfassung

Bitte loggen Sie sich ein, um Zugang zu Ihrer Lizenz zu erhalten.

Sie haben noch keine Lizenz? Dann Informieren Sie sich jetzt über unsere Produkte:

Springer Professional "Wirtschaft+Technik"

Springer Professional "Technik"

Springer Professional "Wirtschaft"

Premium Partner