Glossar

Feature Engineering

Meistere das Feature Engineering, um die Leistung von Machine Learning-Modellen zu steigern. Lerne Techniken, praktische Anwendungen und Tipps für mehr Genauigkeit.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Feature Engineering ist ein wichtiger Prozess beim maschinellen Lernen (ML), bei dem Rohdaten in ein Format umgewandelt werden, das die Leistung von ML-Modellen verbessert. Es ist die Kunst und Wissenschaft der Auswahl, Erstellung und Umwandlung von Variablen, den sogenannten Features, die als Input für diese Modelle verwendet werden. Das Ziel ist es, Merkmale zu erstellen, die die wesentlichen Informationen in den Daten erfassen und es dem Modell erleichtern, Muster zu lernen und genaue Vorhersagen zu treffen. Ein effektives Feature-Engineering kann die Fähigkeit eines Modells, von den Trainingsdaten auf unbekannte Daten zu verallgemeinern, erheblich verbessern und so letztlich seine Genauigkeit und Effizienz steigern.

Die Bedeutung von Feature Engineering

Die Entwicklung von Merkmalen ist von entscheidender Bedeutung, denn die Qualität und Relevanz der Merkmale wirkt sich direkt auf die Leistung eines maschinellen Lernmodells aus. Gut entwickelte Merkmale können die zugrundeliegende Struktur der Daten vereinfachen und es den Modellen erleichtern, Muster und Beziehungen zu erkennen. Dies kann zu genaueren Vorhersagen, schnelleren Trainingszeiten und einer geringeren Komplexität der Modelle führen. In vielen Fällen können die richtigen Merkmale den Unterschied zwischen einem Modell, das schlecht abschneidet, und einem, das Spitzenergebnisse erzielt, ausmachen. Dies ist besonders wichtig bei komplexen Aufgaben wie der Objekterkennung, bei der die rohen Pixeldaten möglicherweise nicht direkt aussagekräftig sind.

Techniken der Merkmalstechnik

Bei der Entwicklung von Merkmalen werden üblicherweise verschiedene Techniken eingesetzt:

  • Interaktionsmerkmale erstellen: Dabei werden zwei oder mehr Merkmale kombiniert, um ein neues Merkmal zu erstellen, das die Wechselwirkungen zwischen den Variablen erfasst. In einem Modell zur Vorhersage von Immobilienpreisen könnte zum Beispiel die Multiplikation der Anzahl der Zimmer mit der Größe des Hauses ein aussagekräftigeres Merkmal ergeben als eine der beiden Variablen allein.
  • Umgang mit fehlenden Werten: Fehlende Daten können durch verschiedene Methoden ersetzt werden, z. B. durch den Mittelwert, den Median oder den Modus der beobachteten Werte oder durch ausgefeiltere Techniken wie die prädiktive Imputation.
  • Merkmalsskalierung: Dabei werden die Merkmale auf einen ähnlichen Bereich skaliert, was für Algorithmen, die auf die Skalierung der Eingabemerkmale reagieren, wie z. B. bei Abstandsberechnungen, entscheidend sein kann. Zu den gängigen Methoden gehören Standardisierung und Normalisierung. Erfahre mehr über diese Techniken in der Vorverarbeitung von kommentierten Daten.
  • Kodierung kategorischer Variablen: Kategoriale Merkmale, wie Farben oder Kategorien, müssen in ein numerisches Format umgewandelt werden, das ML-Modelle verarbeiten können. Zu den Techniken gehören One-Hot-Encoding, Label-Encoding und Target-Encoding.
  • Binning oder Diskretisierung: Kontinuierliche Merkmale können in kategoriale Merkmale umgewandelt werden, indem der Wertebereich in Bins unterteilt wird. Dies kann nützlich sein, um nicht-lineare Beziehungen in den Daten zu erfassen.
  • Merkmalsauswahl: Nicht alle Merkmale sind gleich informativ. Methoden zur Merkmalsauswahl, wie Filter-, Wrapper- und eingebettete Methoden, helfen dabei, die relevantesten Merkmale zu identifizieren, die Dimensionalität zu reduzieren und die Modellleistung zu verbessern. Erfahre mehr über Dimensionalitätsreduktion auf der Website Ultralytics .

Feature Engineering vs. Feature Extraction

Sowohl das Feature-Engineering als auch die Feature-Extraktion zielen darauf ab, die Modellleistung durch die Arbeit mit Merkmalen zu verbessern, unterscheiden sich aber in ihrem Ansatz. Bei der Merkmalsextraktion werden automatisch neue Merkmale aus den Rohdaten erstellt, oft mithilfe von Algorithmen. In der Bildverarbeitung kann zum Beispiel ein Convolutional Neural Network (CNN) lernen, Kanten oder Texturen aus Bildern zu extrahieren. Beim Feature-Engineering hingegen werden die Merkmale in der Regel manuell erstellt oder umgewandelt, und zwar auf der Grundlage von Fachwissen und einem Verständnis der Daten.

Anwendungen in der realen Welt

Hier sind zwei Beispiele für Feature Engineering in realen KI/ML-Anwendungen:

  1. Betrugsaufdeckung: Bei der Erkennung von Kreditkartenbetrug können die Rohdaten der Transaktion den Betrag, die Zeit, den Ort und den Anbieter enthalten. Durch Feature-Engineering können neue Merkmale erstellt werden, z. B. die Zeitdifferenz zwischen aufeinanderfolgenden Transaktionen, der durchschnittliche Transaktionsbetrag in einem bestimmten Zeitraum oder ein binäres Merkmal, das anzeigt, ob eine Transaktion an einem ungewöhnlichen Ort stattgefunden hat. Diese technischen Merkmale können die Fähigkeit eines Modells, betrügerische Transaktionen zu erkennen, erheblich verbessern.
  2. Vorausschauende Wartung: In der Produktion können durch die Vorhersage von Anlagenausfällen erhebliche Kosten eingespart werden. Zu den Rohdaten von Sensoren können Temperatur-, Druck- und Vibrationswerte gehören. Beim Feature Engineering können Merkmale wie die Änderungsrate der Temperatur, der gleitende Durchschnitt der Vibrationswerte oder die Zeit seit der letzten Wartung erstellt werden. Mithilfe dieser Merkmale kann ein Modell vorhersagen, wann eine Maschine wahrscheinlich ausfallen wird, sodass eine rechtzeitige Wartung möglich ist. Erfahre mehr über KI in der Produktion auf der Website Ultralytics .

Feature Engineering und Ultralytics

Ultralytics bietet leistungsstarke Werkzeuge und Ressourcen für Computer-Vision-Aufgaben, darunter auch solche, die vom Feature Engineering profitieren. So können zum Beispiel die Modelle zur Objekterkennung auf Ultralytics YOLO durch sorgfältige Entwicklung von Merkmalen aus Bilddaten verbessert werden. Durch Techniken wie die Erstellung von Interaktionsmerkmalen oder den Umgang mit fehlenden Werten können die Nutzer/innen die Genauigkeit und Effizienz ihrer Modelle verbessern. Darüber hinaus bietet Ultralytics eine benutzerfreundliche Plattform, Ultralytics HUB, die das Training und den Einsatz von Modellen vereinfacht und das Experimentieren mit verschiedenen Feature-Engineering-Ansätzen erleichtert. Erforsche die neuesten Fortschritte beiUltralytics YOLO Modelle, um zu sehen, wie Feature Engineering in innovativen Computer Vision Projekten eingesetzt werden kann.

Um mehr über Feature Engineering und verwandte Konzepte zu erfahren, kannst du Ressourcen wie die Wikipedia-Seite über Feature Engineering und die scikit-learn-Dokumentation über die Vorverarbeitung von Daten nutzen.

Alles lesen