Glossar

Reinforcement Learning

Erforsche Reinforcement Learning: Verwandle KI in autonome Entscheidungsfindung mit Hilfe von RL-Konzepten und Anwendungen in Robotik, Spielen und Industrie.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Verstärkungslernen (Reinforcement Learning, RL) ist ein Teilbereich des maschinellen Lernens, bei dem ein Agent lernt, Entscheidungen zu treffen, indem er Aktionen in einer Umgebung ausführt, um bestimmte Ziele zu erreichen. Im Gegensatz zum überwachten Lernen, bei dem das Modell aus einem markierten Datensatz lernt, stützt sich das Reinforcement Learning auf ein System von Belohnungen und Strafen, um den Agenten zu optimalem Verhalten zu führen.

Wie Reinforcement Learning funktioniert

Beim Verstärkungslernen interagiert der Agent in diskreten Zeitschritten mit seiner Umwelt. Bei jedem Schritt erhält der Agent eine Rückmeldung in Form einer Belohnung, die ein numerischer Wert ist. Das Ziel ist es, die kumulierte Belohnung über die Zeit zu maximieren. Der Agent wählt seine Aktionen auf der Grundlage einer Strategie, die deterministisch oder stochastisch sein kann. Mit der Zeit wird die Strategie verbessert, da der Agent aus den Folgen seiner Handlungen lernt.

Zu den wichtigsten Elementen eines RL-Systems gehören:

  • Agent: Der Lernende oder Entscheidungsträger.
  • Umgebung: Alles, mit dem der Agent interagiert.
  • Handlungen: Alle möglichen Bewegungen, die der Agent machen kann.
  • Belohnungen: Feedback aus der Umwelt, um die Aktionen zu bewerten.
  • Zustand: Eine Darstellung der aktuellen Situation der Umwelt.
  • Strategie: Eine Strategie, die der Agent anwendet, um Aktionen auf der Grundlage des aktuellen Zustands zu bestimmen.

Wichtige RL-Konzepte

  • Wertfunktion: Schätzt die erwartete kumulative Belohnung für einen bestimmten Zustand oder ein bestimmtes Zustands-Aktionspaar.
  • Q-Learning: Ein beliebter RL-Algorithmus, bei dem der Agent den Wert von Aktionen direkt lernt.
  • Erforschung vs. Ausbeutung: Abwägen zwischen der Notwendigkeit, neue Strategien zu erforschen, und dem Ausnutzen bekannter erfolgreicher Strategien.
  • Temporal Difference Learning: Kombiniert Ideen aus Monte-Carlo-Methoden und dynamischer Programmierung.

Unterscheidung zwischen RL und verwandten Begriffen

Verstärkungslernen unterscheidet sich vom überwachten Lernen, bei dem das Modell aus Eingabe-Ausgabe-Paaren lernt. Beim Reinforcement Learning steht stattdessen die Interaktion mit der Umwelt im Vordergrund. Es unterscheidet sich auch vom unüberwachten Lernen, da keine expliziten Kennzeichnungen für das Belohnungsfeedback verfügbar sind.

Anwendungen von Reinforcement Learning

Selbstfahrende Autos

Verstärkungslernen ist entscheidend für die Entwicklung von KI für selbstfahrende Autos. Die RL-Algorithmen helfen diesen Fahrzeugen, in simulierten Umgebungen optimale Fahrstrategien zu erlernen, bevor sie in der Praxis getestet werden.

Robotik

RL ermöglicht es Robotern, komplexe Aufgaben durch Versuch und Irrtum zu lernen. Zum Beispiel können Roboter in Lagerhäusern durch Reinforcement Learning lernen, mit verschiedenen Objekten umzugehen, und so ihre Effizienz und Genauigkeit erhöhen.

Spielend

RL wurde bereits in Spielen eingesetzt, wo Agenten lernen, Spiele wie Go und Schach zu spielen und zu meistern, wie DeepMinds AlphaGo zeigt.

RL in Wirtschaft und Industrie

Reinforcement Learning kann Abläufe wie Bestandsmanagement und Logistik optimieren. Unter Ultralyticshelfen RL-basierte Systeme dabei, datengesteuerte Entscheidungen zu treffen, um die Effizienz und Kosteneffizienz in Lieferketten zu verbessern.

Ressourcen für weitere Erkundungen

Verstärkungslernen zeichnet sich als robuste Methode zur Entwicklung intelligenter Systeme aus, die in der Lage sind, selbstständig Entscheidungen zu treffen, und ist damit ein Eckpfeiler für Fortschritte in der künstlichen Intelligenz und im maschinellen Lernen.

Alles lesen