Glosario

Regresión logística

Descubre cómo la regresión logística potencia tareas de clasificación binaria como el diagnóstico médico y la puntuación crediticia. Aprende sus conceptos clave y sus aplicaciones.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La regresión logística es un algoritmo fundamental de aprendizaje automático que se utiliza para problemas de clasificación binaria, en los que el objetivo es predecir la probabilidad de que se produzca un suceso. A diferencia de la regresión lineal, que predice valores continuos, la regresión logística produce una probabilidad entre 0 y 1, lo que la hace adecuada para tareas en las que el resultado es categórico, como si un correo electrónico es spam o no, o si un paciente tiene una enfermedad o no.

Cómo funciona la regresión logística

La regresión logística emplea una función logística, también conocida como función sigmoidea, para comprimir la salida de una ecuación lineal entre 0 y 1. Esta función mapea cualquier valor de entrada en un valor de probabilidad, proporcionando una transición suave entre los dos resultados posibles. El modelo aprende los mejores parámetros para la ecuación lineal durante el entrenamiento minimizando la diferencia entre las probabilidades predichas y los resultados reales en los datos de entrenamiento.

Conceptos clave

  • Clasificación binaria: La regresión logística se utiliza principalmente para tareas de clasificación binaria, prediciendo uno de dos resultados posibles. Explora la clasificación binaria para más detalles.
  • Función sigmoidea: El núcleo de la regresión logística es la función sigmoidea, que transforma cualquier entrada en un valor entre 0 y 1, que representa una probabilidad. Más información sobre la función sigmoidea.
  • Límite de decisión: Se utiliza un umbral, normalmente 0,5, para clasificar el resultado. Por ejemplo, si la probabilidad predicha es superior a 0,5, el resultado se clasifica como una clase; de lo contrario, se clasifica como la otra clase.
  • Entrenamiento del modelo: Durante el entrenamiento, el algoritmo ajusta los parámetros de la ecuación lineal para minimizar la función de pérdida, que mide la diferencia entre las probabilidades predichas y los resultados reales.
  • Evaluación: El rendimiento de un modelo de regresión logística suele evaluarse utilizando métricas como la exactitud, la precisión, la recuperación y la puntuación F1, que proporcionan información sobre la capacidad del modelo para clasificar correctamente las instancias.

Aplicaciones en el mundo real

La regresión logística se utiliza mucho en diversos campos por su sencillez y eficacia. He aquí dos ejemplos concretos:

  1. Diagnóstico médico: En sanidad, la regresión logística puede utilizarse para predecir la probabilidad de que un paciente padezca una enfermedad concreta basándose en diversos factores, como la edad, el sexo y los resultados de las pruebas. Por ejemplo, puede evaluar la probabilidad de que un paciente desarrolle diabetes en función de su estilo de vida y sus predisposiciones genéticas. Más información sobre la IA en la sanidad.
  2. Calificación crediticia: Las instituciones financieras utilizan la regresión logística para evaluar el riesgo crediticio. Analizando factores como el historial crediticio, los ingresos y los niveles de deuda, el modelo puede predecir la probabilidad de impago de un solicitante de préstamo, ayudando en las decisiones de préstamo. Descubre más sobre la puntuación crediticia.

Regresión logística frente a otros algoritmos

Aunque la regresión logística es potente para la clasificación binaria, es importante entender en qué se diferencia de otros algoritmos:

  • Regresión lineal: A diferencia de la regresión lineal, que predice resultados continuos, la regresión logística predice probabilidades de resultados categóricos.
  • Máquina de vectores de soporte (SVM): El objetivo de la SVM es encontrar un hiperplano que separe mejor las distintas clases en el espacio de características. Aunque tanto la regresión logística como la SVM pueden utilizarse para la clasificación binaria, la SVM puede ser más eficaz en espacios de alta dimensión y con conjuntos de datos complejos.
  • Árboles de decisión y bosques aleatorios: Los árboles de decisión y los bosques aleatorios pueden manejar tanto tareas de clasificación como de regresión y pueden captar relaciones no lineales. Sin embargo, pueden ser propensos al sobreajuste en comparación con la regresión logística.

Uso de la regresión logística con Ultralytics

Ultralytics proporciona herramientas y recursos para facilitar el uso de diversos modelos de aprendizaje automático, incluida la regresión logística. Con Ultralytics HUB, los usuarios pueden entrenar, validar y desplegar modelos con facilidad. Aunque Ultralytics es conocida por sus modelos de vanguardia Ultralytics YOLO en la detección de objetos, la plataforma también admite una amplia gama de tareas de aprendizaje automático, lo que la convierte en una opción versátil para desarrolladores e investigadores. Explora el blogUltralytics para conocer los últimos avances y aplicaciones en IA.

Leer todo