Glosario

Pesos del modelo

Descubre la importancia de los pesos de los modelos en el aprendizaje automático, su papel en las predicciones y cómo Ultralytics YOLO simplifica su uso para las tareas de IA.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

Los pesos del modelo son los parámetros fundamentales que un modelo de aprendizaje automático aprende durante su proceso de entrenamiento. Estos valores numéricos representan el conocimiento adquirido a partir de los datos de entrenamiento y son fundamentales para que el modelo haga predicciones o tome decisiones sobre datos nuevos y no vistos. Esencialmente, los pesos determinan la fuerza y la importancia de las conexiones dentro del modelo, como entre las neuronas de una red neuronal (NN).

Comprender las ponderaciones de los modelos

Imagina una máquina compleja con muchos mandos ajustables; los pesos del modelo actúan como esos mandos. Durante el entrenamiento, se muestran al modelo ejemplos de un conjunto de datos, y éste hace predicciones. La diferencia entre estas predicciones y las respuestas correctas reales (verdad básica) se mide mediante una función de pérdida. A continuación, un algoritmo de optimización, como el Descenso Gradiente Estocástico (SGD) o Adam, ajusta sistemáticamente estos pesos para minimizar esta pérdida. Este proceso se repite a lo largo de muchas iteraciones, o épocas, refinando gradualmente los pesos. Al principio, los pesos suelen fijarse en pequeños valores aleatorios, pero con el entrenamiento convergen a valores que captan los patrones subyacentes en los datos. Es importante distinguir los pesos de los hiperparámetros, como la velocidad de aprendizaje o el tamaño del lote, que se fijan antes del entrenamiento y guían el propio proceso de aprendizaje, en lugar de aprenderse durante él. Los sesgos, otro tipo de parámetro aprendido que a menudo se encuentra junto a los pesos en las NN, representan la activación basal de una neurona.

La importancia de las ponderaciones de los modelos

Los pesos del modelo son fundamentales porque codifican los patrones y relaciones aprendidos a partir de los datos de entrenamiento. Unos pesos bien optimizados permiten a un modelo generalizar eficazmente, haciendo predicciones precisas sobre datos que no ha encontrado antes. La calidad de los pesos influye directamente en las métricas de rendimiento del modelo, como la precisión y la solidez. Los pesos mal entrenados, a menudo debido a problemas como datos insuficientes o sobreajuste, dan lugar a predicciones poco fiables.

En muchas aplicaciones modernas de IA, especialmente en visión por ordenador (VC), los modelos suelen preentrenarse en grandes conjuntos de datos generales como ImageNet o COCO. Los pesos resultantes capturan amplias características visuales. Estos pesos preentrenados, como los disponibles para los modelosYOLO Ultralytics , pueden utilizarse directamente para la inferencia o como punto de partida para el ajuste fino en una tarea específica o en un conjunto de datos personalizado. Esta técnica, conocida como aprendizaje por transferencia, acelera significativamente el entrenamiento y a menudo conduce a un mejor rendimiento, especialmente con datos personalizados limitados. Puedes gestionar y entrenar modelos con pesos específicos utilizando plataformas como Ultralytics HUB.

Aplicaciones en el mundo real

Los pesos de los modelos son el motor de innumerables aplicaciones de IA:

  1. Detección de objetos en vehículos autónomos: Modelos como Ultralytics YOLOv8 utilizan sus pesos aprendidos para identificar y localizar objetos como coches, peatones y señales de tráfico en secuencias de vídeo en tiempo real, lo que permite una navegación más segura. Los pesos determinan cómo interpreta el modelo los patrones de píxeles para reconocer estos objetos específicos.
  2. Análisis de imágenes médicas para la detección de enfermedades: En sanidad, los modelos de IA entrenados en imágenes médicas (como radiografías o resonancias magnéticas) utilizan sus pesos para detectar anomalías sutiles indicativas de enfermedades, como la identificación de posibles tumores en escáneres cerebrales utilizando conjuntos de datos como el de Tumores Cerebrales. Los pesos codifican las características visuales aprendidas de miles de imágenes médicas anotadas. Herramientas como Weights & Biases pueden ayudar a rastrear los experimentos que producen estas ponderaciones.
Leer todo