Découvre comment l'apprentissage non supervisé utilise le regroupement, la réduction de la dimensionnalité et la détection des anomalies pour découvrir des modèles cachés dans les données.
L'apprentissage non supervisé est un type d'apprentissage machine (ML) dans lequel les algorithmes apprennent des modèles à partir de données non étiquetées. Contrairement à l'apprentissage supervisé, qui s'appuie sur des étiquettes prédéfinies ou des "bonnes réponses", les méthodes non supervisées explorent la structure inhérente des données pour découvrir des relations cachées, des regroupements ou des anomalies sans orientation préalable. Cette approche est particulièrement utile en intelligence artificielle (IA) pour l'exploration initiale des données et la compréhension d'ensembles de données complexes où l'étiquetage est peu pratique, voire impossible. Elle permet aux modèles de découvrir des schémas et des idées directement à partir des données.
Les techniques d'apprentissage non supervisé sont employées dans divers scénarios du monde réel, en particulier lorsqu'il s'agit de traiter de grands volumes de données non étiquetées :
L'apprentissage non supervisé joue un rôle crucial pour donner un sens aux vastes quantités de données brutes et non étiquetées caractéristiques du Big Data. Il sert souvent d'étape essentielle dans le prétraitement des données et l'ingénierie des caractéristiques, en aidant à découvrir des structures cachées ou à réduire la complexité des données avant d'appliquer d'autres techniques de ML. Alors que les modèles comme Ultralytics YOLO sont principalement formés à l'aide de méthodes supervisées pour des tâches telles que la détection d'objets, la compréhension des structures de données grâce à des méthodes non supervisées peut aider de manière significative à la préparation et à l'analyse des ensembles de données, améliorant potentiellement les performances des modèles. Tu peux explorer les guides de collecte et d'annotation des données pour préparer les ensembles de données, et gérer tes données et tes modèles à l'aide de plateformes comme Ultralytics HUB.
Il est important de distinguer l'apprentissage non supervisé des paradigmes apparentés que sont le Deep Learning (DL) et le ML :
L'apprentissage non supervisé reste un domaine fondamental de la ML, favorisant la découverte et la compréhension dans des ensembles de données complexes où les étiquettes sont rares ou indisponibles.
Comment fonctionne l'apprentissage non supervisé
L'objectif principal de l'apprentissage non supervisé est de modéliser la structure ou la distribution sous-jacente au sein des données afin d'en apprendre davantage à leur sujet. On laisse les algorithmes découvrir par eux-mêmes les similitudes, les différences et les structures. Les techniques courantes comprennent :