Descobre o que é o subajuste, as suas causas, sinais e soluções. Aprende a melhorar o desempenho do modelo e a evitar problemas de subadaptação.
A subadaptação ocorre quando um modelo de aprendizagem automática é demasiado simples para captar a estrutura subjacente dos dados. Normalmente, isto acontece quando o modelo tem poucos parâmetros ou caraterísticas relativamente à complexidade dos dados que está a tentar aprender. Como resultado, o modelo não consegue aprender adequadamente com os dados de treino e tem um desempenho fraco não só no conjunto de treino, mas também em dados não vistos, como um conjunto de validação ou de teste.
Os modelos subadaptados são frequentemente caracterizados por um elevado enviesamento e uma baixa variância. O enviesamento refere-se ao erro introduzido pela aproximação de um problema do mundo real, que pode ser complexo, através de um modelo simplificado. Um modelo subadaptado faz suposições demasiado simplistas sobre os dados, conduzindo a erros sistemáticos. A variância, por outro lado, refere-se à sensibilidade do modelo a flutuações nos dados de treino. Os modelos subadaptados apresentam uma variância baixa porque são demasiado simples para serem muito afectados por alterações nos dados de treino. No entanto, esta simplicidade também significa que não conseguem captar padrões e nuances importantes nos dados.
Vários factores podem contribuir para o subajuste:
Identificar o subajuste é essencial para melhorar o desempenho do modelo. Os sinais de subadaptação incluem:
Para combater a subadaptação, considera as seguintes estratégias:
É importante distinguir entre subadaptação e sobreadaptação. Enquanto o subajuste ocorre quando um modelo é demasiado simples, o sobreajuste acontece quando um modelo é demasiado complexo e começa a memorizar os dados de treino, incluindo ruído e valores atípicos. Os modelos sobreajustados têm um desempenho excecionalmente bom nos dados de treino, mas fraco em dados não vistos. O equilíbrio entre a complexidade do modelo e o treino é crucial para evitar tanto o subajuste como o sobreajuste.
Imagina que estás a construir um modelo para prever os preços das casas com base na sua dimensão. Se utilizares um modelo de regressão linear simples e partires do princípio de que os preços das casas aumentam linearmente com a sua dimensão, poderás não estar a adaptar-te aos dados. Na realidade, a relação entre o tamanho da casa e o preço é provavelmente mais complexa, envolvendo factores como rendimentos decrescentes para tamanhos maiores ou preços mais elevados para determinadas gamas de tamanho. Um modelo linear não conseguiria captar estas nuances, resultando num fraco desempenho de previsão tanto nos dados de treino como nos novos dados.
Considera uma tarefa de classificação de imagens em que estás a tentar classificar imagens de animais em diferentes categorias. Se utilizares um modelo muito simples, como a regressão logística, poderás não conseguir ajustar os dados. A classificação de imagens requer frequentemente a captura de padrões e caraterísticas complexas nas imagens, o que um modelo simples não consegue fazer. Como resultado, o modelo teria um desempenho fraco tanto no conjunto de treino como em imagens novas e não vistas. A utilização de um modelo mais complexo, como uma rede neural convolucional (CNN), pode melhorar significativamente o desempenho.
Ao compreender as causas e os sinais de subadaptação, os profissionais podem tomar as medidas adequadas para melhorar os seus modelos. Ferramentas como Ultralytics YOLOv8 fornecem recursos avançados para a construção e o ajuste de modelos complexos, ajudando a evitar o subajuste e a melhorar o desempenho em várias tarefas de visão computacional. Para obter mais informações sobre treinamento e otimização de modelos, visita o blogUltralytics .