Glossário

Regressão linear

Descobre o poder da Regressão Linear na aprendizagem automática! Aprende as suas aplicações, benefícios e conceitos chave para o sucesso da modelação preditiva.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A regressão linear é um algoritmo fundamental na aprendizagem automática (ML), particularmente no domínio da aprendizagem supervisionada. É um método estatístico utilizado para modelação preditiva, com o objetivo de estabelecer e quantificar uma relação linear entre uma variável dependente (a que se pretende prever) e uma ou mais variáveis independentes (os preditores ou caraterísticas). Compreender a regressão linear é muitas vezes o primeiro passo para a análise preditiva, fornecendo uma base para técnicas mais complexas de Inteligência Artificial (IA).

Compreender a Regressão Linear

Na sua essência, a Regressão Linear procura encontrar a linha reta de melhor ajuste (ou hiperplano em casos com múltiplas variáveis independentes) através de um conjunto de pontos de dados. Esta linha representa a relação prevista entre as variáveis. O "melhor ajuste" é normalmente determinado pela minimização da soma das diferenças quadráticas entre os valores reais observados e os valores previstos pelo modelo linear. Este processo de minimização é frequentemente conseguido utilizando algoritmos de otimização como o Gradient Descent.

Uma das principais vantagens da Regressão Linear é a sua capacidade de interpretação. Os coeficientes de saída indicam diretamente a força e a direção (positiva ou negativa) da relação entre cada variável independente e a variável dependente, assumindo que os pressupostos subjacentes ao modelo são verdadeiros. Esta transparência torna-o valioso em cenários em que a compreensão do motivo pelo qual uma previsão é feita é tão importante como a própria previsão. Em comparação com modelos complexos, como as redes de aprendizagem profunda, a regressão linear é computacionalmente eficiente e requer menos dados para ser treinada eficazmente, embora se baseie no pressuposto de uma relação linear.

Conceitos e considerações fundamentais

Vários conceitos são fundamentais para compreender e aplicar eficazmente a Regressão Linear:

  • Variáveis dependentes e independentes: É crucial identificar claramente qual a variável que estás a tentar prever (dependente) e quais as variáveis que estão a ser utilizadas para fazer a previsão (independentes).
  • Engenharia de caraterísticas: A seleção e a transformação de variáveis independentes têm um impacto significativo no desempenho do modelo. As caraterísticas relevantes e informativas são fundamentais.
  • Avaliação do modelo: Avaliar o desempenho do modelo é vital. As métricas comuns incluem o R-quadrado (que mede a proporção da variância explicada pelo modelo) e a raiz do erro quadrático médio (RMSE), que indica a magnitude média dos erros de previsão. Podem ser utilizadas várias métricas de regressão, dependendo do objetivo específico.
  • Sobreajuste e subajuste: Um modelo pode ajustar-se demasiado aos dados de treino (sobreajuste), capturando ruído e tendo um desempenho fraco em novos dados, ou pode ser demasiado simples (subajuste) e não conseguir captar a tendência subjacente. Técnicas como a regularização podem ajudar a mitigar o sobreajuste.

Aplicações da Regressão Linear

A Regressão Linear é amplamente utilizada em vários domínios para previsão e análise:

  1. Previsão económica: Previsão de indicadores económicos, como o crescimento do PIB, com base em variáveis como taxas de inflação, números de desemprego e despesas públicas. Os modelos econométricos utilizam frequentemente a regressão linear como base.
  2. Previsão de vendas comerciais: Prevê as vendas futuras de produtos com base em factores como despesas de publicidade, dados de vendas anteriores, preços da concorrência e sazonalidade. Ajuda na gestão de stocks e no planeamento de recursos.
  3. Avaliação do risco em finanças: Avalia o risco de crédito através da modelação da relação entre os atributos financeiros de um mutuário (rendimento, dívida, histórico de crédito) e a probabilidade de incumprimento, muitas vezes como parte de sistemas de pontuação mais complexos. Vê como a IA é utilizada em Finanças.
  4. Estudos médicos: Analisar a relação entre factores como os níveis de dosagem e a redução da pressão sanguínea do doente, ou entre factores de estilo de vida (dieta, exercício) e resultados de saúde, embora muitas vezes exija modelos mais avançados para sistemas biológicos complexos.

Regressão Linear vs. Outros Modelos

É importante distinguir a Regressão Linear de outros modelos de ML:

Apesar da sua simplicidade, a Regressão Linear continua a ser uma ferramenta valiosa e amplamente utilizada na análise de dados e no ML, fornecendo informações interpretáveis e servindo como um modelo de base crucial para muitas tarefas de previsão. Bibliotecas como Scikit-learn fornecem implementações robustas para uso prático.

Lê tudo