Glosario

Red neuronal (NN)

Descubre el poder de las redes neuronales, clave para las innovaciones en IA y ML, como la visión por ordenador, la PNL y los avances en aprendizaje profundo.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Las Redes Neuronales (RN), a menudo llamadas Redes Neuronales Artificiales (RNA), son modelos computacionales inspirados en la compleja estructura y función del cerebro humano. Constituyen la piedra angular de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AM) modernos, diseñados principalmente para reconocer patrones intrincados en los datos. Estas redes impulsan muchos sistemas inteligentes con los que interactuamos a diario, desde sofisticadas herramientas de reconocimiento de imágenes hasta avanzados servicios de traducción de idiomas.

Comprender las redes neuronales

Una red neuronal está formada por capas de nodos interconectados, o neuronas. Estas capas suelen incluir una capa de entrada que recibe datos brutos, una o más capas ocultas que procesan los datos y una capa de salida que produce el resultado final, como una clasificación o predicción. Cada conexión entre neuronas tiene un peso, que indica la importancia de la conexión. Las neuronas procesan sus entradas utilizando una Función de Activación para determinar la señal de salida que transmiten. La red aprende ajustando estos pesos durante un proceso de entrenamiento, que suele utilizar algoritmos como el descenso gradiente y la retropropagación, para minimizar el error entre sus predicciones y los valores objetivo reales. Para obtener orientación sobre un entrenamiento eficaz, consulta nuestros Consejos para el entrenamiento de modelos.

Los modelos que emplean el aprendizaje profundo son esencialmente redes neuronales con numerosas capas ocultas (de ahí lo de "profundas"). Esta profundidad les permite aprender patrones muy complejos y características jerárquicas a partir de grandes conjuntos de datos, lo que las hace excepcionalmente eficaces para tareas como la detección de objetos y la segmentación de imágenes. A diferencia de los modelos de ML más sencillos, que pueden requerir la ingeniería manual de características, las NN destacan en la extracción automática de características relevantes a partir de datos no estructurados, como imágenes y texto.

Aplicaciones de las redes neuronales

Las redes neuronales son increíblemente versátiles y se han aplicado en numerosos ámbitos. He aquí dos ejemplos clave:

  1. Visión por ordenador: En el campo de la visión por ordenador (VC), las NN, en particular los tipos especializados como las CNN, se utilizan para analizar e interpretar la información visual. Los modelos más avanzados, como Ultralytics YOLO aprovechan las redes neuronales profundas para la detección de objetos en tiempo real, la segmentación de imágenes y la estimación de poses, permitiendo aplicaciones que van desde la conducción autónoma al análisis de imágenes médicas. Puedes entrenar y desplegar estos modelos utilizando plataformas como Ultralytics HUB.
  2. Procesamiento del Lenguaje Natural: Las NN son fundamentales para el Procesamiento del Lenguaje Natural (PLN), ya que permiten a las máquinas comprender y generar lenguaje humano. Las aplicaciones incluyen la traducción automática, el análisis de sentimientos y el desarrollo de chatbot. Modelos como BERT y varios modelos GPT se basan en sofisticadas arquitecturas de redes neuronales, concretamente en Transformadores.

Redes neuronales frente a conceptos similares

Es útil distinguir las NN de los conceptos de IA relacionados:

  • Inteligencia Artificial (IA): La IA es el amplio campo de la creación de máquinas inteligentes. Las NN son una técnica específica utilizada dentro de la IA para conseguir capacidades de aprendizaje.
  • Aprendizaje Automático (AM): El ML es un subconjunto de la IA centrado en algoritmos que aprenden de los datos. Las NN son una clase importante de modelos de ML, especialmente dominantes en el aprendizaje profundo.
  • Aprendizaje profundo (AD): El DL es un subcampo del ML que utiliza específicamente redes neuronales con muchas capas (arquitecturas profundas) para modelar patrones complejos. Todos los modelos de aprendizaje profundo son redes neuronales, pero no todas las redes neuronales son profundas.
  • Redes Neuronales Convolucionales (CNN): Las CNN son un tipo especializado de NN diseñadas principalmente para procesar datos de tipo reticular, como las imágenes, lo que las hace muy eficaces para tareas de visión por ordenador.
  • Redes neuronales recurrentes (RNN): Las RNN están diseñadas para manejar datos secuenciales, como texto o series temporales, al tener conexiones que forman ciclos, permitiendo que la información persista.
  • Transformadores: Los Transformadores son una arquitectura más reciente, muy basada en mecanismos de atención, que se han convertido en la tecnología más avanzada para muchas tareas de PNL y se utilizan cada vez más en visión por ordenador.

En resumen, las redes neuronales son potentes modelos inspirados en el cerebro que permiten a las máquinas aprender patrones complejos a partir de los datos. Son bloques de construcción fundamentales para el aprendizaje profundo e impulsan el progreso en diversas aplicaciones de la IA, desde la comprensión de imágenes con visión por ordenador hasta el procesamiento del lenguaje en PNL.

Leer todo