Glossário

Área sob a curva (AUC)

Aprende a importância da Área sob a Curva (AUC) na avaliação de modelos de ML. Descobre os seus benefícios, os conhecimentos sobre a curva ROC e as aplicações no mundo real.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A área sob a curva (AUC) é uma métrica de desempenho amplamente reconhecida, utilizada para avaliar a eficácia dos modelos de classificação na aprendizagem automática (ML). Quantifica a capacidade geral de um modelo para distinguir entre diferentes classes, fornecendo um único valor escalar que representa o desempenho do modelo em todos os limites de classificação possíveis. A AUC é particularmente útil quando lida com conjuntos de dados desequilibrados, em que uma classe supera significativamente a(s) outra(s). É frequentemente utilizada em conjunto com a curva ROC (Receiver Operating Characteristic), uma representação gráfica do desempenho de um modelo.

Compreender a curva ROC

A curva ROC (Receiver Operating Characteristic, caraterística de funcionamento do recetor) é um conceito fundamental para compreender a AUC. A curva ROC representa a taxa de verdadeiros positivos (TPR) em relação à taxa de falsos positivos (FPR) em várias definições de limiar. A TPR, também conhecida como sensibilidade ou recuperação, mede a proporção de positivos reais que são corretamente identificados. A FPR mede a proporção de negativos reais que são incorretamente classificados como positivos. Um classificador perfeito teria um TPR de 1 e um FPR de 0, o que significa que identifica corretamente todos os positivos e negativos.

Interpretação dos valores AUC

O valor AUC varia entre 0 e 1, em que:

  • AUC = 1: Indica um classificador perfeito que consegue distinguir perfeitamente entre todas as instâncias positivas e negativas.
  • AUC = 0,5: Sugere que o classificador não tem um desempenho melhor do que o acaso, essencialmente lançando uma moeda ao ar para fazer previsões.
  • AUC < 0.5: Implies that the classifier is performing worse than random, potentially indicating an issue with the model or data.
  • AUC > 0,5: Representa um classificador que tem um desempenho melhor do que o aleatório, com valores mais elevados a indicar um melhor desempenho.

Em geral, uma AUC superior a 0,8 é frequentemente considerada boa, enquanto uma AUC superior a 0,9 é considerada excelente. No entanto, a interpretação de uma AUC "boa" pode variar consoante a aplicação específica e a complexidade do problema.

Relação entre AUC e ROC

A AUC é literalmente a área sob a curva ROC. A curva ROC representa visualmente o compromisso entre a taxa de verdadeiros positivos e a taxa de falsos positivos para um modelo em diferentes limites de classificação. Um modelo com uma AUC mais elevada terá uma curva ROC mais próxima do canto superior esquerdo do gráfico, o que significa um melhor desempenho em todos os limiares. Explora YOLO Métricas de desempenho para obteres mais informações sobre métricas de avaliação semelhantes.

Vantagens da utilização da AUC

A AUC oferece várias vantagens como métrica de desempenho:

  • Invariância do limiar: A AUC mede o desempenho global de um modelo, independentemente do limiar de classificação escolhido. Isto torna-a útil para comparar modelos que podem funcionar com limiares diferentes.
  • Robustez ao desequilíbrio de classes: A AUC é menos sensível ao desequilíbrio das classes em comparação com outras métricas como a precisão. Fornece uma medida de desempenho mais fiável quando uma classe é significativamente mais predominante do que as outras.
  • Interpretação probabilística: A AUC pode ser interpretada como a probabilidade de o modelo classificar uma instância positiva escolhida aleatoriamente como superior a uma instância negativa escolhida aleatoriamente.

Aplicações reais da AUC

A AUC é utilizada numa variedade de aplicações do mundo real, incluindo:

  • Diagnóstico médico: Na análise de imagens médicas, a AUC pode ser utilizada para avaliar o desempenho de modelos que detectam doenças a partir de imagens médicas como raios X ou ressonâncias magnéticas. Por exemplo, um modelo que distingue entre tumores cancerígenos e benignos pode ser avaliado utilizando a AUC para medir a sua precisão de diagnóstico. Sabe mais sobre a IA nos cuidados de saúde.
  • Deteção de fraudes: Em finanças, a AUC é utilizada para avaliar a eficácia dos modelos que identificam transacções fraudulentas. Um modelo com uma AUC elevada pode distinguir eficazmente entre actividades legítimas e fraudulentas, ajudando a minimizar as perdas financeiras. Lê sobre outras aplicações da IA nas finanças.

AUC vs. outras métricas

Embora a AUC seja uma métrica valiosa, é importante considerá-la juntamente com outras medidas de desempenho. Por exemplo, a precisão e a recuperação fornecem informações sobre o desempenho do modelo em classes específicas, enquanto a pontuação F1 equilibra a precisão e a recuperação. Ao contrário da precisão média (mAP), que é normalmente utilizada na deteção de objectos, a AUC é utilizada principalmente para problemas de classificação binária.

Conclusão

A AUC é uma métrica poderosa para avaliar o desempenho de modelos de classificação, particularmente em cenários com conjuntos de dados desequilibrados. A sua invariância de limiar, robustez ao desequilíbrio de classes e interpretação probabilística tornam-na uma ferramenta valiosa para avaliar e comparar modelos. Ao compreenderem a curva ROC e o significado dos valores AUC, os profissionais podem obter informações mais aprofundadas sobre o desempenho dos seus modelos e tomar decisões informadas sobre a seleção e otimização de modelos. Podes aprender a exportar modelos de Ultralytics YOLO para vários formatos, tais como ONNXpara uma inferência optimizada em diferentes plataformas.

Lê tudo