Glossaire

Ingénierie de pointe

Maîtrise l'ingénierie des fonctionnalités pour booster les performances des modèles d'apprentissage automatique. Apprends des techniques, des applications réelles et des astuces pour une meilleure précision.

Entraîne les modèles YOLO simplement
avec Ultralytics HUB

En savoir plus

L'ingénierie des caractéristiques est un processus crucial de l'apprentissage machine (ML) qui consiste à transformer les données brutes dans un format qui améliore les performances des modèles ML. C'est l'art et la science de la sélection, de la création et de la transformation de variables, appelées caractéristiques, qui sont utilisées comme entrées pour ces modèles. L'objectif est de créer des caractéristiques qui capturent les informations essentielles des données, ce qui permet au modèle d'apprendre plus facilement des modèles et de faire des prédictions précises. Une ingénierie des caractéristiques efficace peut améliorer de manière significative la capacité d'un modèle à généraliser des données d'apprentissage à des données inédites, ce qui améliore en fin de compte sa précision et son efficacité.

Importance de l'ingénierie des fonctionnalités

L'ingénierie des caractéristiques est vitale car la qualité et la pertinence des caractéristiques ont un impact direct sur les performances d'un modèle d'apprentissage automatique. Des caractéristiques bien conçues peuvent simplifier la structure sous-jacente des données, ce qui permet aux modèles de discerner plus facilement les modèles et les relations. Cela peut conduire à des prédictions plus précises, à des temps de formation plus rapides et à une réduction de la complexité des modèles. Dans de nombreux cas, les bonnes caractéristiques peuvent faire la différence entre un modèle peu performant et un modèle qui obtient des résultats de pointe. Ceci est particulièrement important dans les tâches complexes telles que la détection d'objets, où les données brutes des pixels peuvent ne pas être directement informatives.

Techniques d'ingénierie des fonctionnalités

Plusieurs techniques sont couramment utilisées dans l'ingénierie des caractéristiques :

  • Création de caractéristiques d'interaction: Il s'agit de combiner deux ou plusieurs caractéristiques pour créer une nouvelle caractéristique qui capture les interactions entre les variables. Par exemple, dans un modèle de prédiction des prix de l'immobilier, la multiplication du nombre de pièces par la taille de la maison peut créer une caractéristique plus informative que l'une ou l'autre variable seule.
  • Traitement des valeurs manquantes: Les données manquantes peuvent être imputées à l'aide de différentes méthodes, comme le remplissage avec la moyenne, la médiane ou le mode des valeurs observées, ou à l'aide de techniques plus sophistiquées comme l'imputation prédictive.
  • Mise à l'échelle des caractéristiques: Il s'agit de mettre les caractéristiques à l'échelle d'une gamme similaire, ce qui peut être crucial pour les algorithmes sensibles à l'échelle des caractéristiques d'entrée, tels que ceux qui utilisent des calculs de distance. Les méthodes courantes comprennent la normalisation et la standardisation. Tu trouveras plus d'informations sur ces techniques dans la rubrique prétraitement des données annotées.
  • Encodage des variables catégorielles: Les caractéristiques catégorielles, telles que les couleurs ou les catégories, doivent être converties en un format numérique que les modèles ML peuvent traiter. Les techniques comprennent l'encodage à une touche, l'encodage d'étiquettes et l'encodage de cibles.
  • Classement ou discrétisation: Les caractéristiques continues peuvent être converties en caractéristiques catégorielles en divisant la plage de valeurs en bacs. Cela peut être utile pour capturer les relations non linéaires dans les données.
  • Sélection des caractéristiques: Toutes les caractéristiques n'ont pas la même valeur informative. Les méthodes de sélection des caractéristiques, telles que les méthodes de filtrage, d'enveloppement et d'intégration, permettent d'identifier les caractéristiques les plus pertinentes, de réduire la dimensionnalité et d'améliorer les performances du modèle. Pour en savoir plus sur la réduction de la dimensionnalité, consulte le site Web Ultralytics .

Ingénierie des caractéristiques vs. extraction des caractéristiques

Bien que l'ingénierie des caractéristiques et l'extraction des caractéristiques visent toutes deux à améliorer les performances des modèles en travaillant avec les caractéristiques, elles diffèrent dans leur approche. L'extraction de caractéristiques consiste à créer automatiquement de nouvelles caractéristiques à partir des données brutes, souvent à l'aide d'algorithmes. Par exemple, dans le traitement des images, un réseau neuronal convolutif (CNN) peut apprendre à extraire les bords ou les textures des images. L'ingénierie des caractéristiques, en revanche, implique généralement la création ou la transformation manuelle des caractéristiques en fonction des connaissances du domaine et de la compréhension des données.

Applications dans le monde réel

Voici deux exemples d'ingénierie des fonctionnalités dans des applications IA/ML du monde réel :

  1. Détection de la fraude: Dans la détection de la fraude par carte de crédit, les données brutes de la transaction peuvent inclure le montant de la transaction, l'heure, le lieu et le vendeur. L'ingénierie des caractéristiques pourrait impliquer la création de nouvelles caractéristiques telles que la différence de temps entre des transactions consécutives, le montant moyen de la transaction sur une période, ou une caractéristique binaire indiquant si une transaction s'est produite dans un lieu inhabituel. Ces caractéristiques techniques peuvent améliorer considérablement la capacité d'un modèle à détecter les transactions frauduleuses.
  2. Maintenance prédictive: Dans le secteur de la fabrication, la prévision des pannes d'équipement peut permettre de réaliser des économies importantes. Les données brutes provenant des capteurs peuvent inclure des relevés de température, de pression et de vibration. L'ingénierie des caractéristiques pourrait impliquer la création de caractéristiques telles que le taux de changement de la température, la moyenne mobile des niveaux de vibration ou le temps écoulé depuis la dernière maintenance. Ces caractéristiques peuvent aider un modèle à prédire quand une machine est susceptible de tomber en panne, ce qui permet une maintenance en temps voulu. Pour en savoir plus sur l'IA dans la fabrication, consulte le site Web Ultralytics .

Ingénierie des fonctionnalités et Ultralytics

Ultralytics offre des outils et des ressources puissants pour les tâches de vision artificielle, y compris celles qui bénéficient de l'ingénierie des caractéristiques. Par exemple, les modèles de détection d'objets du site Ultralytics YOLO peuvent être améliorés par l'élaboration minutieuse de caractéristiques à partir des données d'images. En utilisant des techniques telles que la création de caractéristiques d'interaction ou la gestion des valeurs manquantes, les utilisateurs peuvent améliorer la précision et l'efficacité de leurs modèles. En outre, Ultralytics fournit une plateforme conviviale, Ultralytics HUB, qui simplifie le processus de formation et de déploiement des modèles, facilitant ainsi l'expérimentation de différentes approches d'ingénierie des caractéristiques. Explore les dernières avancées en matière deUltralytics YOLO pour voir comment l'ingénierie des caractéristiques peut être appliquée dans des projets de vision par ordinateur de pointe.

Pour en savoir plus sur l'ingénierie des caractéristiques et les concepts connexes, tu peux explorer des ressources telles que la page Wikipédia sur l'ingénierie des caractéristiques et la documentation scikit-learn sur le prétraitement des données.

Tout lire