Glossário

Função de perda

Descobre o papel das funções de perda na aprendizagem automática, os seus tipos, importância e aplicações de IA do mundo real, como YOLO e deteção de objectos.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Na inteligência artificial (IA) e na aprendizagem automática (ML), uma função de perda é um componente crucial utilizado durante o treino do modelo. Mede a diferença, ou "perda", entre as previsões do modelo e os valores reais dos dados de treino. Pensa nela como uma pontuação que quantifica o fraco desempenho do modelo numa tarefa específica. Um valor de perda elevado significa que as previsões estão muito afastadas, enquanto um valor de perda baixo indica que as previsões estão próximas dos valores reais. O objetivo fundamental do treino da maioria dos modelos de aprendizagem automática, especialmente na aprendizagem profunda (DL), é minimizar esta função de perda, tornando assim o modelo o mais preciso e fiável possível.

Importância das funções de perda

As funções de perda são essenciais porque fornecem um objetivo concreto e quantificável para o processo de formação do modelo. Traduzem o objetivo abstrato de "aprender com os dados" num valor matemático que um algoritmo de otimização pode trabalhar para minimizar. Este processo de otimização, muitas vezes utilizando técnicas como Gradient Descent e backpropagation, baseia-se no valor da perda para ajustar iterativamente os parâmetros internos do modelo(pesos do modelo) na direção que reduz o erro de previsão. A escolha de uma função de perda adequada é crítica e depende muito da tarefa específica de ML, como regressão, classificação ou deteção de objectos. A utilização de uma função de perda incorrecta pode conduzir a um desempenho subóptimo do modelo, mesmo com dados e recursos computacionais suficientes. Orienta o processo de aprendizagem de redes neurais complexas (NN).

Tipos de funções de perda

Diferentes tarefas de aprendizagem automática requerem diferentes funções de perda, adaptadas à natureza do problema e ao resultado pretendido. Alguns exemplos comuns incluem:

  • Erro médio quadrático (MSE): Frequentemente utilizado em tarefas de regressão em que o objetivo é prever um valor numérico contínuo. Calcula a média das diferenças quadráticas entre os valores previstos e reais, penalizando fortemente os erros maiores.
  • Erro absoluto médio (MAE): Outra função de perda de regressão que calcula a média das diferenças absolutas entre as previsões e os valores reais. É menos sensível a outliers em comparação com o MSE.
  • Perda de entropia cruzada (perda de log): A função de perda padrão para tarefas de classificação. Mede o desempenho de um modelo de classificação cujo resultado é um valor de probabilidade entre 0 e 1. A entropia cruzada binária é usada para problemas de duas classes, enquanto a entropia cruzada categórica é usada para problemas de várias classes.
  • Perda de Hinge: Utilizada principalmente para treinar Máquinas de Vectores de Suporte (SVMs) e tem como objetivo maximizar a margem entre classes.
  • Perdas na deteção de objectos: Modelos como Ultralytics YOLO utilizam funções de perda compostas que frequentemente combinam vários componentes. Por exemplo, YOLOv8 utiliza uma função de perda que inclui termos para a regressão da caixa delimitadora (a precisão com que a caixa localiza o objeto), classificação (a que classe pertence o objeto) e, por vezes, objetividade (se um objeto está presente numa célula da grelha). Implementações específicas podem ser encontradas na documentação dos utilitários de perdaUltralytics .

Aplicações no mundo real

As funções de perda são fundamentais para treinar modelos em várias aplicações de IA:

  1. Análise de imagens médicas: Nos modelos de formação para deteção de tumores ou segmentação de órgãos, é minimizada uma função de perda como a perda de dados ou uma variante da entropia cruzada. Isto faz com que o modelo preveja máscaras de segmentação que se aproximam das anotações de verdade fornecidas pelos radiologistas, afectando diretamente a precisão do diagnóstico em IA nos cuidados de saúde.
  2. Veículos autónomos: Os sistemas de perceção em veículos autónomos utilizam modelos de deteção de objectos treinados através da minimização de funções de perda. Estas funções penalizam os erros na previsão da localização (caixas delimitadoras) e da classe (peão, carro, ciclista) dos objectos na estrada, cruciais para uma navegação segura e para evitar colisões. Os modelosYOLO são frequentemente utilizados neste caso.

Relação com outros conceitos-chave

As funções de perda estão intimamente ligadas a vários outros conceitos fundamentais de ML:

  • Algoritmos de otimização: As funções de perda definem a "paisagem" em que os optimizadores navegam. Algoritmos como o Adam Optimizer e o Stochastic Gradient Descent (SGD) utilizam o gradiente da função de perda para atualizar os pesos do modelo, guiados pela taxa de aprendizagem.
  • Métricas de avaliação: É fundamental distinguir as funções de perda das métricas de avaliação como a exatidão, a precisão, a recuperação, a pontuação F1 e a precisão média (mAP). As funções de perda são utilizadas durante o treino para orientar o processo de otimização. Elas precisam ser diferenciáveis para que os métodos baseados em gradiente funcionem. As métricas de avaliação são utilizadas após a formação (ou durante a validação) para avaliar o desempenho do modelo no mundo real em dados não vistos(dados de validação ou dados de teste). Embora uma perda menor esteja geralmente relacionada com melhores pontuações métricas, estas medem coisas diferentes e nem sempre são diretamente intercambiáveis. Por exemplo, a otimização da perda de entropia cruzada não optimiza diretamente a precisão, embora muitas vezes a melhore. Podes saber mais sobre as métricas de desempenhoYOLO aqui.
  • Sobreajuste e subajuste: A monitorização da perda no conjunto de treino e num conjunto de validação separado é fundamental para diagnosticar estes problemas. O sobreajuste ocorre quando a perda de treinamento continua a diminuir enquanto a perda de validação começa a aumentar. A subadaptação é indicada por valores elevados de perda em ambos os conjuntos. As estratégias para resolver esses problemas são discutidas em guias como Dicas para treinamento de modelos e Informações sobre avaliação de modelos.

Conclusão

As funções de perda são a pedra angular do treino de modelos de aprendizagem automática eficazes. Fornecem o sinal necessário para que os algoritmos de otimização ajustem os parâmetros do modelo, permitindo que os modelos aprendam padrões complexos a partir dos dados e resolvam tarefas desafiantes na visão computacional (CV) e não só. Compreender o seu objetivo, os diferentes tipos disponíveis e a sua relação com as métricas de avaliação é crucial para o desenvolvimento de aplicações de IA bem sucedidas. Plataformas como o Ultralytics HUB simplificam o processo de formação de modelos sofisticados como o Ultralytics YOLO11que lida com as complexidades da implementação e otimização da função de perda nos bastidores, tornando a IA avançada mais acessível. Podes explorar mais a fundo a documentaçãoUltralytics .

Lê tudo