Glossário

Regressão logística

Descobre o poder da Regressão Logística para a classificação binária. Aprende as suas aplicações, conceitos-chave e relevância na aprendizagem automática.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A regressão logística é um algoritmo estatístico fundamental e de aprendizagem automática (ML) utilizado principalmente para problemas de classificação binária, em que o objetivo é prever um de dois resultados possíveis. Apesar de o seu nome conter "regressão", é um algoritmo de classificação. Trabalha modelando a probabilidade de uma determinada entrada pertencer a uma categoria particular, normalmente produzindo um valor entre 0 e 1. Isto torna-o uma escolha popular para tarefas que requerem resultados probabilísticos.

Conceito e funcionalidade principais

A Regressão Logística calcula a probabilidade de um resultado binário (como sim/não, verdadeiro/falso ou 0/1) com base numa ou mais variáveis independentes (caraterísticas). Utiliza uma função matemática específica, conhecida como função sigmoide ou logística, para transformar uma combinação linear de caraterísticas de entrada numa pontuação de probabilidade. Esta pontuação representa a probabilidade de a instância pertencer à classe positiva (normalmente designada por 1). Um limiar de decisão (geralmente 0,5) é então aplicado a essa probabilidade para atribuir a instância a uma classe específica. Por exemplo, se a probabilidade prevista for superior a 0,5, a instância é classificada como classe 1; caso contrário, é classificada como classe 0. Entra na categoria de Aprendizagem supervisionada.

Comparação com a Regressão Linear

Embora tanto a Regressão Logística como a Regressão Linear sejam técnicas de modelação fundamentais, têm objectivos diferentes. A Regressão linear é usada para prever valores contínuos (por exemplo, prever preços de casas), enquanto a Regressão logística é usada para prever resultados categóricos, especificamente probabilidades para tarefas de classificação. O resultado da Regressão Logística é limitado entre 0 e 1 através da função sigmoide, o que a torna adequada para a estimativa de probabilidades, ao contrário da Regressão Linear, cujo resultado pode variar infinitamente.

Tipos de regressão logística

Embora a forma mais comum seja a Regressão Logística Binária (duas classes de resultados), existem extensões:

  • Regressão logística multinomial: Utilizada quando a variável alvo tem três ou mais categorias nominais (por exemplo, classificar tipos de fruta como maçã, laranja, banana).
  • Regressão logística ordinal: Aplica-se quando a variável-alvo tem três ou mais categorias ordenadas (por exemplo, classificar a satisfação como baixa, média, alta).

Aplicações no mundo real

A regressão logística é amplamente utilizada devido à sua simplicidade, interpretabilidade e eficiência em dados linearmente separáveis.

  1. Deteção de e-mails de spam: Classifica os e-mails como "spam" ou "não spam" com base em caraterísticas como palavras-chave, informações do remetente e estrutura do e-mail. Isto envolve a previsão da probabilidade de um e-mail ser spam. Técnicas mais complexas podem envolver o Processamento de Linguagem Natural (PNL).
  2. Diagnóstico médico: Prevê a probabilidade de um doente ter uma doença específica (por exemplo, diabetes) com base em medições de diagnóstico como a tensão arterial, o IMC e a idade. Isto ajuda na deteção precoce e no planeamento do tratamento, complementando frequentemente a análise de imagens médicas. Lê mais sobre o papel da IA na investigação clínica.

Relevância e avaliação

No contexto mais alargado da Inteligência Artificial (IA), a Regressão Logística serve de modelo de base para tarefas de classificação. Os seus coeficientes podem ser interpretados para compreender a influência de cada caraterística no resultado, contribuindo para a explicabilidade do modelo. Embora modelos mais complexos como as Redes Neuronais (NN), as Máquinas de Vectores de Suporte (SVM) ou mesmo arquitecturas avançadas como o Ultralytics YOLO para deteção de objectos consigam frequentemente um melhor desempenho em conjuntos de dados complexos, a Regressão Logística continua a ser útil para problemas mais simples ou como passo inicial na modelação preditiva.

O desempenho do modelo é normalmente avaliado utilizando métricas como a exatidão, a precisão, a recuperação, a pontuação F1 e a área sob a curva ROC (AUC). Bibliotecas como Scikit-learn fornecem implementações robustas. Compreender estas métricas de desempenhoYOLO também pode ser útil num contexto de ML mais amplo. Para gerir e implementar vários modelos de ML, plataformas como o Ultralytics HUB oferecem ferramentas abrangentes.

Lê tudo