Glosario

Aprendizaje no supervisado

Descubre cómo el aprendizaje no supervisado utiliza la agrupación, la reducción dimensional y la detección de anomalías para descubrir patrones ocultos en los datos.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El aprendizaje no supervisado es un tipo de aprendizaje automático en el que los algoritmos aprenden a partir de datos no etiquetados. A diferencia del aprendizaje supervisado, que se basa en datos etiquetados para entrenar modelos, los algoritmos de aprendizaje no supervisado exploran los datos e identifican patrones sin orientación explícita. Este enfoque es especialmente útil cuando se trata de grandes conjuntos de datos en los que el etiquetado es poco práctico o cuando el objetivo es descubrir estructuras y relaciones ocultas en los datos.

Cómo funciona el aprendizaje no supervisado

En el aprendizaje no supervisado, al algoritmo se le presentan datos de entrada sin las correspondientes etiquetas de salida. A continuación, el sistema intenta aprender la estructura inherente de los datos. Esto se consigue mediante diversas técnicas que pretenden:

  • Agrupar Datos: Agrupa puntos de datos similares. El clustering de K-means es un algoritmo popular para esto, que divide los datos en clusters distintos basándose en la similitud de las características.
  • Reduce la dimensionalidad: Simplificar los datos reduciendo el número de variables y conservando la información esencial. El Análisis de Componentes Principales (ACP ) es un método habitual de reducción de la dimensionalidad, que transforma los datos de alta dimensión en una representación de menor dimensión.
  • Descubre Asociaciones: Identificar relaciones y dependencias entre variables de los datos. La minería de reglas de asociación, por ejemplo, puede descubrir reglas que describen patrones frecuentes de co-ocurrencia.
  • Detección de anomalías: Identificar puntos de datos inusuales que se desvían significativamente de la norma. DBSCAN (Agrupación Espacial de Aplicaciones con Ruido Basada en la Densidad) puede utilizarse para identificar valores atípicos reconociendo regiones poco pobladas en el espacio de datos.

Aplicaciones del aprendizaje no supervisado

Las técnicas de aprendizaje no supervisado se utilizan en diversos campos para extraer información valiosa de los datos:

  • Segmentación de clientes: Las empresas utilizan algoritmos de agrupación para segmentar a los clientes en grupos distintos en función del comportamiento de compra, los datos demográficos o la actividad en el sitio web. Esto permite estrategias de marketing específicas y experiencias de cliente personalizadas. Por ejemplo, una empresa minorista puede utilizar el aprendizaje no supervisado sobre los datos de las transacciones de los clientes para identificar diferentes segmentos de clientes, lo que le permite adaptar las recomendaciones de productos y las promociones.
  • Detección de anomalías en la detección de fraudes: En finanzas, la detección de anomalías es crucial para identificar transacciones fraudulentas. Los algoritmos de aprendizaje no supervisado pueden aprender patrones de transacciones normales y señalar desviaciones que podrían indicar actividades fraudulentas. Esto ayuda a prevenir proactivamente las pérdidas financieras y a mejorar la seguridad de los datos.
  • Análisis de imágenes médicas: El aprendizaje no supervisado desempeña un papel importante en el análisis de imágenes médicas. Técnicas como la reducción de la dimensionalidad y la agrupación pueden ayudar a analizar imágenes médicas, como radiografías o resonancias magnéticas, para detectar patrones que podrían ser indicativos de enfermedades o anomalías, incluso sin etiquetas explícitas.
  • Agrupación de documentos: En el procesamiento del lenguaje natural, el aprendizaje no supervisado se utiliza para la agrupación de documentos, agrupando documentos similares en función de su contenido. Esto es útil para organizar grandes colecciones de datos de texto, como artículos de noticias o trabajos de investigación, y para tareas como el modelado de temas y la búsqueda semántica.

Aprendizaje no supervisado vs. Aprendizaje supervisado

La principal diferencia entre el aprendizaje no supervisado y el supervisado reside en el tipo de datos utilizados para el entrenamiento. El aprendizaje supervisado utiliza datos etiquetados, en los que cada punto de datos de entrada se empareja con una etiqueta de salida correspondiente. El algoritmo aprende a asignar entradas a salidas basándose en estos ejemplos etiquetados. En cambio, el aprendizaje no supervisado utiliza datos no etiquetados y pretende descubrir estructuras o patrones ocultos en los propios datos, sin etiquetas de salida explícitas.

Tanto el aprendizaje supervisado como el no supervisado son herramientas esenciales en el aprendizaje automático (AM) y la inteligencia artificial (IA), y la elección entre ellos depende del problema específico, la disponibilidad de datos etiquetados y el resultado deseado. En los proyectos de Ultralytics YOLO modelos, mientras que el entrenamiento suele basarse en el aprendizaje supervisado para tareas como la detección de objetos y la segmentación de imágenes, los métodos no supervisados pueden ser valiosos en el preprocesamiento de datos, el análisis exploratorio de datos o en aplicaciones específicas como la detección de anomalías en el control de calidad de la fabricación.

Leer todo