La detección de anomalías es una técnica utilizada en el análisis de datos y el aprendizaje automático (ML) para identificar elementos, sucesos u observaciones poco comunes que levantan sospechas por diferir significativamente de la mayoría de los datos. Estos patrones disconformes suelen denominarse anomalías, valores atípicos, excepciones o peculiaridades. La idea central es establecer primero una comprensión clara de lo que constituye un comportamiento "normal" dentro de un conjunto de datos y, a continuación, señalar cualquier punto de datos o patrón que se desvíe sustancialmente de esta norma. Esto es crucial en diversos ámbitos para identificar posibles riesgos, errores u oportunidades únicas.
Cómo funciona la detección de anomalías
Los sistemas de detección de anomalías suelen aprender los patrones normales presentes en un conjunto de datos de entrenamiento. Este aprendizaje puede producirse mediante varios métodos:
- Métodos estadísticos: Estos métodos utilizan propiedades estadísticas de los datos, como la media, la desviación típica o las distribuciones de probabilidad, para definir un rango normal. Los puntos de datos que caen fuera de este rango se consideran anomalías.
- Enfoques de aprendizaje automático:
- Agrupación: Algoritmos como DBSCAN agrupan puntos de datos similares. Los puntos que no pertenecen a ningún conglomerado o pertenecen a conglomerados muy pequeños pueden marcarse como anomalías.
- Clasificación: Técnicas como las Máquinas de Vectores de Soporte (SVM) o las Redes Neuronales (NN) pueden entrenarse para distinguir entre datos normales y anómalos, a menudo necesitando ejemplos etiquetados de ambos(Aprendizaje Supervisado).
- Autocodificadores: Estas redes neuronales aprenden a comprimir y reconstruir datos normales. Las anomalías suelen dar lugar a errores de reconstrucción elevados, lo que las hace detectables. Se trata de una forma de Aprendizaje No Supervisado, ya que aprende principalmente de los datos normales.
La elección del método depende de la naturaleza de los datos y de los requisitos específicos de la aplicación.
Detección de anomalías frente a conceptos relacionados
Es importante distinguir la detección de anomalías de las tareas relacionadas de visión por ordenador (VC) y ML:
- Detección de objetos: Esta tarea se centra en identificar y localizar tipos conocidos de objetos dentro de una imagen (por ejemplo, encontrar todos los coches y peatones). La detección de anomalías, sobre todo en visión, puede identificar un objeto inesperado o un defecto que no pertenece a una clase predefinida. Por ejemplo, detectar una grieta en una superficie en lugar de identificar la propia superficie.
- Clasificación de imágenes: Asigna una imagen a una de varias categorías predefinidas (por ejemplo, clasificar una imagen como que contiene un "gato" o un "perro"). La detección de anomalías identifica imágenes o patrones que no encajan bien en ninguna de las categorías normales y esperadas.
Aplicaciones en el mundo real
La detección de anomalías tiene amplias aplicaciones:
- Control de calidad de la fabricación: Identificación de defectos como arañazos, grietas o componentes desalineados en las líneas de producción mediante sistemas de visión. La IA en la fabricación aprovecha esto para evitar que los productos defectuosos lleguen a los consumidores. Por ejemplo, un sistema podría marcar como anomalía una botella con una etiqueta mal impresa. Puedes obtener más información sobre cómo la visión por ordenador mejora el control de calidad.
- Ciberseguridad: Detectar patrones inusuales de tráfico en la red, intentos de inicio de sesión desde lugares inesperados o comportamientos anómalos del sistema que podrían indicar la existencia de malware, intrusiones o ataques de denegación de servicio. Organizaciones como la Agencia de Ciberseguridad y Seguridad de las Infraestructuras (CISA ) destacan la importancia de estos métodos de detección.
- Detección de fraudes financieros: Identificar patrones de transacciones atípicos, como compras inusualmente grandes o transacciones desde lugares desconocidos, que podrían ser señal de actividad fraudulenta. Explora cómo afecta la IA a las finanzas.
- Sanidad: Detección de resultados anormales en el análisis de imágenes médicas, como la identificación de tumores en las exploraciones o la señalización de signos vitales inusuales de los pacientes. Mira cómo pueden utilizarse los modelos YOLO para la detección de tumores.
- Monitorización del estado del sistema: Monitorización de sensores y registros de equipos industriales o infraestructuras informáticas para predecir fallos o detectar problemas de rendimiento basados en desviaciones de los parámetros normales de funcionamiento. Comprueba la monitorización de sistemas heredados con YOLO11.
Herramientas y tecnologías
El desarrollo de sistemas de detección de anomalías suele implicar bibliotecas ML estándar y plataformas especializadas. Frameworks como PyTorch y TensorFlow proporcionan herramientas fundamentales para construir modelos personalizados. Para tareas basadas en la visión, modelos como Ultralytics YOLO pueden adaptarse. Aunque los modelos YOLO preentrenados destacan en la detección de objetos comunes, pueden entrenarse a medida en conjuntos de datos específicos para identificar anomalías propias del dominio, como defectos únicos o patrones visuales inusuales. Plataformas como Ultralytics HUB ofrecen entornos integrados para entrenar, desplegar y gestionar eficientemente tales modelos.
La detección de anomalías es una capacidad vital en la IA y el ML modernos, que permite la identificación proactiva de problemas críticos y desviaciones en numerosos sectores. Explora más sobre conceptos relacionados en nuestro GlosarioUltralytics .