Aprende a importância da Área sob a Curva (AUC) na avaliação de modelos de ML. Descobre os seus benefícios, os conhecimentos sobre a curva ROC e as aplicações no mundo real.
A área sob a curva (AUC) é uma métrica de desempenho fundamental utilizada principalmente na aprendizagem automática (ML) para avaliar modelos de classificação binária. Quantifica a capacidade de um modelo para distinguir entre classes positivas e negativas em todos os limites de classificação possíveis. As pontuações AUC variam de 0 a 1, com valores mais altos indicando um melhor desempenho do modelo. Um modelo com uma pontuação de 0,5 não tem um desempenho melhor do que o acaso, enquanto um modelo perfeito que separa as classes sem falhas obtém uma AUC de 1,0. Essa métrica fornece uma medida única e agregada do desempenho da classificação, independente de qualquer escolha de limite específico.
O valor AUC é derivado diretamente da curva ROC (Receiver Operating Characteristic). A curva ROC é um gráfico que ilustra a capacidade de diagnóstico de um classificador binário à medida que o seu limiar de discriminação é variado. Traça a Taxa de Verdadeiros Positivos (TPR), também conhecida como sensibilidade ou Recuperação, no eixo y contra a Taxa de Falsos Positivos (FPR) no eixo x em várias definições de limiar. A AUC representa toda a área bidimensional por baixo desta curva ROC. Encontra uma visão geral abrangente das curvas ROC na Wikipédia.
A AUC é interpretada como a probabilidade de um modelo classificar uma instância positiva escolhida aleatoriamente como superior a uma instância negativa escolhida aleatoriamente. Isto torna-a uma medida do poder discriminativo global do modelo. Uma das principais vantagens da AUC é a sua relativa insensibilidade ao desequilíbrio das classes em comparação com métricas como a Precisão. Em conjuntos de dados em que uma classe supera amplamente a outra (um cenário comum em problemas do mundo real), a precisão pode ser enganadora, enquanto a AUC fornece uma medida mais robusta de quão bem o modelo separa as classes. Uma AUC próxima de 1 indica um modelo com excelente capacidade de separação, enquanto uma AUC próxima de 0,5 sugere uma fraca capacidade de discriminação, semelhante à adivinhação aleatória. Compreender estas interpretações é crucial para uma avaliação eficaz do modelo.
A AUC é amplamente utilizada em vários domínios em que as tarefas de classificação binária são críticas. Eis dois exemplos:
Muitas estruturas e bibliotecas de aprendizagem profunda (DL), incluindo PyTorch e TensorFlowsão utilizadas para construir estes classificadores. Ferramentas como o Scikit-learn oferecem funções convenientes para calcular as pontuações ROC AUC, simplificando o processo de avaliação. Plataformas como o Ultralytics HUB também facilitam o treinamento e a avaliação de modelos em que essas métricas são relevantes.
Embora a AUC seja uma métrica valiosa, é importante compreender a sua diferença em relação a outras medidas de avaliação utilizadas na visão computacional (CV) e no ML:
A escolha da métrica correta depende do problema específico, das caraterísticas do conjunto de dados (como o equilíbrio das classes) e dos objectivos do projeto de IA. A AUC continua a ser uma pedra angular para avaliar o desempenho da classificação binária devido à sua robustez e interpretabilidade.