Glosario

Red neuronal convolucional (CNN)

Descubre cómo las Redes Neuronales Convolucionales (CNN) revolucionan la visión por ordenador, impulsando la IA en la sanidad, los coches autónomos y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Una Red Neuronal Convolucional (CNN) es un tipo especializado de Red Neuronal (NN) diseñado principalmente para procesar datos de tipo cuadriculado, como imágenes y vídeos. A diferencia de las redes neuronales tradicionales, las CNN aprovechan el principio de convolución para aprender automáticamente jerarquías espaciales de características a partir de los datos de entrada. Esto las hace excepcionalmente eficaces para tareas dentro de la visión por ordenador (VC), impulsando avances significativos en la forma en que las máquinas interpretan la información visual y potenciando muchas aplicaciones modernas de Inteligencia Artificial (IA).

Componentes básicos y funcionalidad

Las CNN suelen estar compuestas por varias capas distintas que trabajan juntas para extraer y procesar información de entradas visuales:

  • Capas convolucionales: Son los componentes básicos. Aplican filtros (núcleos) a la imagen de entrada para crear mapas de características que resalten patrones específicos como bordes, esquinas o texturas. La operación de convolución permite a la red aprender características relevantes para la tarea.
  • Funciones de activación: Aplicadas después de las capas convolucionales, funciones como ReLU (Unidad Lineal Rectificada) o ReLU Fugaz introducen la no linealidad, lo que permite a la red aprender relaciones más complejas en los datos. Más información sobre las distintas funciones de activación.
  • Capas de agrupamiento: Estas capas reducen las dimensiones espaciales (anchura y altura) de los mapas de características, disminuyendo la carga computacional y ayudando a que las características aprendidas sean más robustas a las variaciones de posición. Entre las técnicas comunes de agrupación están la Agrupación Máxima y la Agrupación Media, detalladas en recursos como esta visión general de los métodos de agrupación.
  • Capas totalmente conectadas: Estas capas, que suelen encontrarse al final de la red, toman las características de alto nivel extraídas por las capas convolucionales y de agrupación y las utilizan para tareas de clasificación o regresión, de forma similar a las capas de una red neuronal estándar de avance.

Principales diferencias con otras redes neuronales

Aunque comparten conceptos fundamentales con otras redes neuronales, las CNN poseen características únicas:

  • Aprendizaje de jerarquías espaciales: Las CNN destacan en el reconocimiento de patrones y jerarquías espaciales en datos como imágenes, gracias a sus capas convolucionales y campos receptivos locales. Las NN estándar suelen tratar las características de entrada de forma independiente, perdiendo el contexto espacial.
  • Compartición de parámetros: Los filtros se comparten en toda la imagen de entrada en las capas convolucionales, lo que reduce significativamente el número de parámetros en comparación con las redes totalmente conectadas y mejora la eficacia.
  • Enfoque del caso de uso: Las CNN son la arquitectura a la que se recurre para tareas de análisis de imágenes y vídeos. En cambio, las Redes Neuronales Recurrentes (RNN) son más adecuadas para datos secuenciales como el texto para el Procesamiento del Lenguaje Natural (PLN) o el análisis de series temporales.

Aplicaciones en el mundo real

Las CNN han demostrado un éxito notable en numerosos dominios. He aquí dos ejemplos destacados:

  1. Análisis de imágenes médicas: Las CNN ayudan a los profesionales médicos analizando radiografías, tomografías computarizadas y resonancias magnéticas para detectar anomalías sutiles como tumores o fracturas. Esto contribuye significativamente a la IA en la asistencia sanitaria, al permitir diagnósticos más rápidos y potencialmente más precisos. La investigación sigue superando los límites, como demuestran los estudios disponibles en plataformas como PubMed Central.
  2. Vehículos autónomos: Los coches autónomos dependen en gran medida de las CNN para la detección de objetos en tiempo real (identificación de peatones, coches, señales de tráfico) y la segmentación de imágenes (comprensión de los carriles de la carretera, obstáculos). Esta percepción visual es crucial para la navegación segura en entornos complejos, y constituye el núcleo de la IA en los coches autónomos.

Herramientas y marcos

El desarrollo y despliegue de las CNN se ve facilitado por varias potentes herramientas y marcos de aprendizaje profundo:

  • Marcos de trabajo: Las opciones más populares son PyTorch, TensorFlowy Keras, que proporcionan capas preconstruidas, optimizadores y soporte para aceleración por hardware como las GPU. Puedes encontrar entradas de glosario para PyTorch, TensorFlowy Keras.
  • EcosistemaUltralytics : Herramientas como Ultralytics YOLO proporcionan modelos basados en CNN de última generación optimizados para la detección de objetos y otras tareas de CV. La plataforma Ultralytics HUB simplifica el proceso de entrenamiento, despliegue y gestión de estos modelos sin necesidad de una codificación exhaustiva. Explora los consejos de entrenamiento de modelos para optimizar tus CNN.
Leer todo