Glosario

Aprendizaje profundo (AD)

Descubre el poder del aprendizaje profundo: explora las redes neuronales, las técnicas de entrenamiento y las aplicaciones reales en IA, sanidad y mucho más.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Aprendizaje Profundo (AD) es un subcampo especializado del Aprendizaje Automático (AM), que a su vez se engloba en el ámbito más amplio de la Inteligencia Artificial (IA). Los algoritmos de AD se inspiran en la estructura y la función del cerebro humano, concretamente utilizando redes neuronales artificiales (RNA) con múltiples capas (de ahí lo de "profundo"). Estas arquitecturas profundas permiten a los modelos aprender patrones complejos y representaciones jerárquicas directamente a partir de datos brutos como imágenes, texto o sonido, superando a menudo a las técnicas tradicionales de LD, especialmente en conjuntos de datos grandes y complejos.

Cómo funciona el aprendizaje profundo

Los componentes básicos del Aprendizaje Profundo son las redes neuronales profundas, que constan de una capa de entrada, varias capas ocultas y una capa de salida. Cada capa contiene nodos interconectados o "neuronas" que procesan la información. A diferencia de las redes menos profundas, la profundidad de estos modelos les permite aprender características jerárquicamente. Por ejemplo, en el reconocimiento de imágenes, las capas iniciales pueden detectar bordes simples, las capas siguientes combinarlos en formas y las capas más profundas reconocer objetos complejos. Este proceso de extracción automática de rasgos elimina la necesidad de ingeniería manual de rasgos, una ventaja significativa sobre muchos enfoques tradicionales de ML. Entrenar estas redes suele implicar alimentarlas con grandes cantidades de datos etiquetados(aprendizaje supervisado) y utilizar algoritmos como la retropropagación y el descenso de gradiente para ajustar los pesos del modelo y minimizar los errores(función de pérdida). Este proceso computacionalmente intensivo depende en gran medida de un hardware potente, en particular de las GPU, para un entrenamiento eficiente del modelo.

Importancia en IA y Visión por Computador

El Aprendizaje Profundo es uno de los principales impulsores del progreso de la IA, en particular dentro de la Visión por Computador (VC). Su capacidad para aprender representaciones significativas a partir de vastos conjuntos de datos, como el conjunto de datos COCO o ImageNet, ha dado lugar a avances en áreas que antes se consideraban difíciles para las máquinas. Modelos como Ultralytics YOLO aprovechan la DL para la detección de objetos, la segmentación de imágenes y la clasificación de imágenes de alto rendimiento. Técnicas como el aprendizaje por transferencia permiten aprovechar modelos preentrenados (modelos ya entrenados en grandes conjuntos de datos) para acelerar el desarrollo en tareas nuevas relacionadas, incluso con menos datos. Este campo debe mucho a pioneros como Geoffrey Hinton, Yann LeCun y Yoshua Bengio, a los que a menudo se hace referencia como los "padrinos de la IA". Organizaciones como DeepLearning.AI y la Asociación para el Avance de la Inteligencia Artificial (AAAI) siguen impulsando la investigación y la educación en este campo en rápida evolución.

Distinción de términos afines

  • Aprendizaje Automático (AM): El DL es un subconjunto del ML. Aunque todo DL es ML, no todo ML es DL. El LD abarca una gama más amplia de algoritmos, incluidos los métodos de redes no neuronales como las Máquinas de Vectores de Soporte (SVM), los Árboles de Decisión y la Regresión Lineal, que a menudo requieren ingeniería manual de características. La AD destaca en tareas que implican datos no estructurados y aprendizaje automático de características mediante arquitecturas profundas.
  • Inteligencia Artificial (IA): La IA es el campo general centrado en la creación de sistemas que muestren un comportamiento inteligente. El ML es un enfoque para lograr la IA permitiendo a los sistemas aprender de los datos. La DL es un conjunto específico de técnicas dentro de la ML que utiliza redes neuronales profundas. Piensa en ello como conceptos anidados: IA > ML > DL.

Aplicaciones en el mundo real

El aprendizaje profundo impulsa muchas aplicaciones modernas de IA:

Herramientas y marcos

El desarrollo de modelos de AD se ve facilitado por diversas bibliotecas y plataformas de software. Los marcos de código abierto más populares son:

Plataformas como Ultralytics HUB proporcionan entornos integrados para entrenar modelos personalizados, desplegar y gestionar modelos DL, en particular para tareas de visión por ordenador que utilizan modelos como YOLO11. Un desarrollo eficaz suele implicar prácticas como el ajuste riguroso de los hiperparámetros, la comprensión de las métricas de rendimiento y la utilización de la aceleración deGPU para un entrenamiento eficaz de los modelos.

Leer todo