Glosario

Aprendizaje no supervisado

Descubre cómo el aprendizaje no supervisado utiliza la agrupación, la reducción dimensional y la detección de anomalías para descubrir patrones ocultos en los datos.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El aprendizaje no supervisado es un tipo de aprendizaje automático (AM) en el que los algoritmos aprenden patrones a partir de datos no etiquetados. A diferencia del aprendizaje supervisado, que se basa en etiquetas predefinidas o "respuestas correctas", los métodos no supervisados exploran la estructura inherente de los datos para descubrir relaciones ocultas, agrupaciones o anomalías sin orientación previa. Este enfoque es especialmente útil en Inteligencia Artificial (IA) para la exploración inicial de datos y la comprensión de conjuntos de datos complejos en los que el etiquetado es poco práctico o imposible. Permite a los modelos descubrir patrones y percepciones directamente a partir de los datos.

Cómo funciona el aprendizaje no supervisado

El objetivo principal del aprendizaje no supervisado es modelar la estructura o distribución subyacente en los datos para aprender más sobre ellos. Se deja que los algoritmos descubran similitudes, diferencias y estructuras por sí mismos. Entre las técnicas habituales se incluyen:

  • Agrupación: Consiste en agrupar automáticamente puntos de datos similares en función de determinadas características. Entre los algoritmos más populares están K-Means Clustering y DBSCAN.
  • Reducción de la dimensionalidad: Esta técnica simplifica los datos reduciendo el número de variables de entrada o características, pero conservando la información esencial. El Análisis de Componentes Principales (ACP ) es un método muy utilizado para la reducción de la dimensionalidad.
  • Aprendizaje de reglas de asociación: Este método descubre relaciones interesantes o reglas de asociación entre variables en grandes conjuntos de datos. Se aplica comúnmente en el análisis de la cesta de la compra para encontrar artículos que se compran juntos con frecuencia.

Aplicaciones del aprendizaje no supervisado

Las técnicas de aprendizaje no supervisado se emplean en diversos escenarios del mundo real, sobre todo cuando se trata de grandes volúmenes de datos no etiquetados:

  • Segmentación de clientes: Las empresas utilizan la segmentación para agrupar a los clientes con comportamientos, preferencias o datos demográficos similares. Esto permite realizar campañas de marketing específicas más eficaces y experiencias de cliente personalizadas. Más información sobre la segmentación de clientes.
  • Detección de anomalías: Los algoritmos no supervisados destacan en la identificación de puntos de datos inusuales o valores atípicos que se desvían significativamente de la norma. Esto es fundamental para aplicaciones como la detección de fraudes en las finanzas, la detección de intrusiones en la red o la identificación de defectos en la fabricación.

Relevancia en IA y ML

El aprendizaje no supervisado desempeña un papel crucial a la hora de dar sentido a las enormes cantidades de datos brutos y sin etiquetar característicos de Big Data. A menudo sirve como paso esencial en el preprocesamiento de datos y la ingeniería de características, ayudando a descubrir estructuras ocultas o a reducir la complejidad de los datos antes de aplicar otras técnicas de ML. Aunque los modelos como Ultralytics YOLO se entrenan principalmente utilizando métodos supervisados para tareas como la detección de objetos, la comprensión de las estructuras de datos mediante métodos no supervisados puede ayudar significativamente en la preparación y el análisis del conjunto de datos, mejorando potencialmente el rendimiento del modelo. Puedes explorar las guías de recogida y anotación de datos para preparar conjuntos de datos, y gestionar tus datos y modelos utilizando plataformas como Ultralytics HUB.

Aprendizaje no supervisado frente a otros tipos de aprendizaje

Es importante distinguir el aprendizaje no supervisado de los paradigmas relacionados del Aprendizaje Profundo ( AD) y el ML:

  • Aprendizaje supervisado: Requiere un conjunto de datos totalmente etiquetados, lo que significa que cada punto de datos tiene una salida o categoría conocida. El objetivo es entrenar un modelo que pueda predecir con exactitud el resultado de puntos de datos nuevos y desconocidos basándose en los ejemplos etiquetados.
  • Aprendizaje Autosupervisado: A menudo considerado un tipo de aprendizaje no supervisado, genera automáticamente etiquetas a partir de los propios datos de entrada creando tareas previas (por ejemplo, predecir una parte oculta de una imagen). Se utiliza mucho para preentrenar grandes modelos, incluidos los basados en la arquitectura Transformer.
  • Aprendizaje semisupervisado: Utiliza una combinación de una pequeña cantidad de datos etiquetados y una gran cantidad de datos sin etiquetar. Este enfoque pretende aprovechar los datos no etiquetados para mejorar la precisión del aprendizaje más allá de lo que sería posible sólo con los limitados datos etiquetados. Explora más a fondo el aprendizaje semisupervisado.

El aprendizaje no supervisado sigue siendo un área fundamental del ML, que impulsa el descubrimiento y la comprensión en conjuntos de datos complejos en los que las etiquetas son escasas o no están disponibles.

Leer todo