Glossário

Regressão logística

Descobre o poder da Regressão Logística para a classificação binária. Aprende as suas aplicações, conceitos-chave e relevância na aprendizagem automática.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A regressão logística é um algoritmo fundamental no mundo da aprendizagem automática e da estatística, utilizado principalmente para tarefas de classificação binária. Ao contrário da regressão linear, que prevê valores numéricos contínuos, a regressão logística prevê a probabilidade de um resultado categórico. É um método poderoso e interpretável, o que o torna um favorito para várias aplicações em que a compreensão da probabilidade de um evento é crucial.

Relevância e aplicações

A regressão logística é particularmente útil quando a variável de resultado é binária, o que significa que só pode assumir um de dois valores, como sim/não, verdadeiro/falso ou 0/1. A sua força reside na sua capacidade de modelar a probabilidade destes resultados com base numa ou mais caraterísticas de entrada. Isto torna-a incrivelmente versátil em vários domínios.

Por exemplo, no diagnóstico médico, a regressão logística pode prever a probabilidade de um doente ter uma determinada doença com base em várias medidas clínicas. Considera a análise de imagens médicas, onde pode estimar a probabilidade de um tumor ser maligno ou benigno com base nas caraterísticas da imagem.

Outra aplicação importante é a análise de sentimentos. Na análise de sentimentos, a regressão logística pode classificar o sentimento de um texto (como um tweet ou uma avaliação de um produto) como positivo ou negativo, com base nas palavras utilizadas. Isto é crucial para as empresas compreenderem as opiniões dos clientes e a perceção da marca.

No domínio da deteção de objectos, enquanto modelos mais complexos como o Ultralytics YOLOv8 são utilizados para localizar e classificar objectos, os princípios da regressão logística podem ser encontrados em certos aspectos, particularmente em tarefas de classificação binária em sistemas maiores. Por exemplo, determinar se uma região de interesse contém ou não um objeto pode ser enquadrado como um problema de regressão logística.

Além disso, a regressão logística é amplamente utilizada na deteção de fraudes, na pontuação de crédito e até na previsão da rotatividade de clientes nas empresas. A sua interpretabilidade permite que os intervenientes compreendam quais as caraterísticas mais influentes na elaboração de previsões, o que é muitas vezes tão importante como a própria previsão.

Conceitos-chave

Na sua essência, a regressão logística utiliza uma função sigmoide para transformar o resultado de uma equação linear num valor de probabilidade entre 0 e 1. Esta função sigmoide é o que torna a regressão logística adequada para problemas de classificação. O modelo aprende os coeficientes das caraterísticas de entrada durante o treino, normalmente utilizando métodos como a descida gradiente para minimizar uma função de custo, como a perda de entropia cruzada.

Embora a regressão logística seja um algoritmo de aprendizagem supervisionada, é importante notar a sua distinção das técnicas de aprendizagem não supervisionada que lidam com dados não rotulados. A regressão logística requer dados rotulados para ser treinada de forma eficaz.

A avaliação do desempenho de um modelo de regressão logística envolve muitas vezes métricas como a exatidão, a precisão, a recuperação e a pontuação F1. A área sob a curva (AUC) da curva ROC também é uma métrica comum, especialmente para conjuntos de dados desequilibrados. Compreender essas métricas é crucial para avaliar o grau de generalização do modelo para dados não vistos e para a avaliação do modelo em geral.

Embora seja um algoritmo relativamente simples em comparação com os modelos de aprendizagem profunda, a regressão logística continua a ser uma ferramenta poderosa, especialmente quando se dá prioridade à interpretabilidade e à eficiência computacional. Serve como uma base sólida para compreender algoritmos de classificação mais complexos e é frequentemente utilizada como modelo de base em projectos de aprendizagem automática.

Lê tudo