Glosario

Regresión lineal

¡Descubre el poder de la Regresión Lineal en el aprendizaje automático! Aprende sus aplicaciones, ventajas y conceptos clave para el éxito del modelado predictivo.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La Regresión Lineal es un algoritmo fundamental en estadística y aprendizaje automático (AM) que se utiliza para el modelado predictivo. Su objetivo es establecer una relación lineal entre una variable dependiente (la que se predice) y una o más variables independientes (predictores o características). Al ser una de las técnicas de regresión más sencillas e interpretables, constituye la base para entender modelos más complejos y sirve de referencia crucial en muchas tareas analíticas. Pertenece a la categoría del aprendizaje supervisado, ya que aprende a partir de datos de entrenamiento etiquetados.

Cómo funciona la regresión lineal

La idea central es encontrar la línea recta que mejor se ajuste a los puntos de datos y que minimice la diferencia entre los valores previstos y los reales. Esta línea representa la relación lineal entre las variables. Cuando sólo hay una variable independiente, se llama Regresión Lineal Simple; con múltiples variables independientes, es Regresión Lineal Múltiple. El proceso implica estimar coeficientes (o pesos del modelo) para cada variable independiente, que cuantifican el cambio en la variable dependiente para un cambio de una unidad en el predictor. A menudo se utilizan técnicas como el Descenso Gradiente para encontrar estos coeficientes óptimos minimizando una función de pérdida, normalmente la suma de errores al cuadrado. Un preprocesamiento cuidadoso de los datos, que incluya la normalización y la ingeniería de características, puede mejorar significativamente el rendimiento del modelo. La recogida y anotación eficaces de datos son requisitos previos para construir un modelo fiable.

Aplicaciones en el mundo real

La Regresión Lineal se aplica ampliamente en diversos campos debido a su sencillez e interpretabilidad:

  • Previsión financiera: Predecir el precio de las acciones, el valor de los activos o el crecimiento económico basándose en datos históricos e indicadores económicos. Por ejemplo, predecir los ingresos de una empresa basándose en el gasto en marketing y el tamaño del mercado es un caso de uso común en la IA en finanzas.
  • Predicción de ventas: Estimación de las ventas futuras basándose en factores como el presupuesto publicitario, las actividades promocionales y los precios de la competencia, ayudando en la gestión del inventario y logrando la eficiencia minorista con IA.
  • Valoración inmobiliaria: Predecir el precio de las casas basándose en características como los metros cuadrados, el número de dormitorios, la ubicación y la antigüedad. Se trata de un ejemplo clásico utilizado a menudo en los cursos introductorios de ML.
  • Evaluación del riesgo: Evaluación del riesgo crediticio mediante la modelización de la relación entre las tasas de impago de los préstamos y las características de los prestatarios en el sector bancario.
  • Análisis de la asistencia sanitaria: Estudio de la relación entre factores como las elecciones de estilo de vida (p. ej., fumar, dieta) y los resultados de salud (p. ej., presión arterial), contribuyendo a la comprensión de la IA en la asistencia sanitaria.

Regresión lineal frente a otros modelos

Es importante distinguir la Regresión Lineal de otros modelos de ML:

Relevancia y limitaciones

La Regresión Lineal supone una relación lineal entre las variables, independencia de los errores y varianza constante de los errores (homocedasticidad). La violación de estos supuestos puede dar lugar a un mal rendimiento del modelo. También es sensible a los valores atípicos, que pueden afectar desproporcionadamente a la línea ajustada. A pesar de estas limitaciones, su sencillez, rapidez y alta interpretabilidad lo convierten en un excelente punto de partida para muchos problemas de regresión y en una valiosa herramienta para comprender las relaciones básicas de los datos. A menudo sirve como punto de referencia para evaluar modelos más complejos. Las bibliotecas como Scikit-learn proporcionan implementaciones sólidas para el uso práctico, y comprender sus principios es crucial antes de explorar técnicas avanzadas o utilizar plataformas para el entrenamiento y despliegue de modelos. Evaluar los modelos utilizando métricas como el Error Cuadrático Medio (ECM) o R-cuadrado, junto con métricas como la precisión o la puntuación F1 en contextos relacionados, ayuda a valorar la eficacia en los datos de validación. Seguir las mejores prácticas para el despliegue de modelos garantiza una aplicación fiable en el mundo real, y aplicar consejos para el entrenamiento de modelos puede mejorar los resultados.

Leer todo