Glosario

Aprendizaje Profundo (DL)

Explora los fundamentos del aprendizaje profundo (DL), desde las redes neuronales hasta las aplicaciones de IA en el mundo real. Descubre cómo Ultralytics simplifica el entrenamiento y la implementación.

El aprendizaje profundo (DL) es un subconjunto especializado del aprendizaje automático (ML) que imita la forma en que el cerebro humano procesa la información. Mientras que el ML tradicional suele basarse en la extracción manual de características, el aprendizaje profundo automatiza este proceso mediante el uso de estructuras multicapa conocidas como redes neuronales artificiales (ANN). Estas redes están compuestas por capas de nodos interconectados, o neuronas, que procesan datos de forma jerárquica. Esta «profundidad» permite a los modelos aprender patrones y representaciones complejos directamente a partir de entradas sin procesar, como imágenes, audio y texto, lo que los hace excepcionalmente potentes para abordar problemas de datos no estructurados.

¿Cómo funciona el aprendizaje profundo?

El mecanismo central del aprendizaje profundo consiste en hacer pasar los datos a través de múltiples capas de unidades de procesamiento no lineales. En una red neuronal feedforward estándar, la información fluye desde una capa de entrada, a través de varias capas «ocultas», y finalmente a una capa de salida. Durante la fase de entrenamiento, la red ajusta sus parámetros internos —conocidos como weights and biasesen función del error de sus predicciones. Este ajuste se consigue normalmente utilizando un algoritmo de optimización como el descenso de gradiente estocástico (SGD) combinado con retropropagación para minimizar la pérdida.

El aprendizaje profundo destaca cuando se trata con grandes cantidades de datos. A diferencia de los algoritmos más simples, cuyo rendimiento puede estancarse , los modelos de aprendizaje profundo suelen seguir mejorando a medida que aumenta el tamaño de los datos de entrenamiento. Esta escalabilidad es una de las principales razones por las que a menudo se utilizan GPU de alto rendimiento para acelerar la pesada carga computacional que requiere el entrenamiento de estas enormes arquitecturas.

Arquitecturas clave y diferencias

El aprendizaje profundo se confunde a menudo con el aprendizaje automático, pero la distinción radica en el nivel de intervención humana y la complejidad arquitectónica. El aprendizaje automático suele requerir datos estructurados y características diseñadas por el ser humano. El aprendizaje profundo , por el contrario, realiza una extracción automática de características.

Existen varias arquitecturas especializadas dentro del aprendizaje profundo para manejar tipos específicos de datos:

Redes neuronales convolucionales (CNN): Son el estándar de referencia para las tareas de procesamiento de imágenes. Al utilizar capas convolucionales, conservan las jerarquías espaciales, lo que las hace ideales para la detección de objetos y la segmentación de imágenes.
Redes neuronales recurrentes (RNN): Diseñadas para datos secuenciales, las RNN y sus variantes más avanzadas, como las LSTM, son cruciales para el análisis de series temporales y el reconocimiento de voz.
Transformadores: La columna vertebral moderna del procesamiento del lenguaje natural (NLP), los transformadores utilizan mecanismos de autoatención para procesar secuencias completas en paralelo, lo que potencia los modelos de lenguaje grandes (LLM) avanzados.

Aplicaciones en el mundo real

El aprendizaje profundo ha pasado de ser una teoría académica a convertirse en el núcleo de las pilas tecnológicas modernas. A continuación se presentan dos ejemplos concretos de su impacto:

Conducción detect : los coches autónomos dependen en gran medida del aprendizaje profundo para circular con seguridad. Modelos como YOLO26 procesan señales de vídeo en tiempo real para detectar peatones, otros vehículos y señales de tráfico. Esto implica tareas complejas como el seguimiento de múltiples objetos y la estimación de la profundidad para tomar decisiones en fracciones de segundo.
Diagnóstico médico: En el ámbito sanitario, los algoritmos de aprendizaje profundo ayudan a los radiólogos mediante el análisis de imágenes médicas como radiografías y resonancias magnéticas. Por ejemplo, la IA en el ámbito sanitario utiliza modelos de segmentación para identificar tumores o anomalías con una precisión que iguala o, en ocasiones, supera a la de los expertos humanos, lo que permite intervenciones más tempranas .

Implementación del aprendizaje profundo

Herramientas como PyTorch y TensorFlow democratizado el acceso al aprendizaje profundo, pero las interfaces de alto nivel lo hacen aún más fácil. El ultralytics El paquete permite a los desarrolladores aprovechar arquitecturas de última generación sin necesidad de diseñar redes neuronales desde cero.

A continuación se muestra un ejemplo conciso de cómo cargar un modelo de aprendizaje profundo preentrenado y ejecutar una inferencia en una imagen:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (a Convolutional Neural Network)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see identified objects and bounding boxes
results[0].show()

Tendencias y herramientas futuras

El campo está evolucionando rápidamente hacia modelos más eficientes y capaces. Técnicas como el aprendizaje por transferencia permiten a los usuarios ajustar modelos preentrenados masivos en conjuntos de datos más pequeños y específicos, lo que ahorra una cantidad significativa de tiempo y recursos informáticos. Además, el auge de la IA generativa demuestra la capacidad del aprendizaje profundo para crear nuevos contenidos, desde imágenes realistas hasta código.

Para los equipos que buscan optimizar su flujo de trabajo, Ultralytics ofrece un entorno integral para gestionar el ciclo de vida de los proyectos de aprendizaje profundo. Desde la anotación colaborativa de datos hasta la formación y la implementación basadas en la nube , estas herramientas ayudan a salvar la brecha entre la investigación experimental y las aplicaciones listas para la producción. Para comprender mejor los fundamentos matemáticos, recursos como el libro MIT Deep Learning Book ofrecen una amplia cobertura teórica.

Aprendizaje Profundo (DL)

Entrene los modelosYOLO Ultralytics para agilizar los flujos de trabajo en todos los sectores

Solución de licencias empresariales flexible para impulsar su innovación

Entrene modelos de IA en segundos con Ultralytics YOLO

¿Cómo funciona el aprendizaje profundo?

Arquitecturas clave y diferencias

Aplicaciones en el mundo real

Implementación del aprendizaje profundo

Tendencias y herramientas futuras

Leer más en esta categoría

12 casos de uso de imágenes aéreas impulsados por la visión artificial

¿Qué es la estimación de profundidad monocular? Una visión general

Una mirada al uso deYOLO Ultralytics para la detección de amenazas mediante IA

Únase a la comunidad Ultralytics