Glossário

Matriz de confusão

Compreende o desempenho do modelo com uma matriz de confusão. Explora métricas, utilizações no mundo real e ferramentas para aperfeiçoar a precisão da classificação da IA.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Uma matriz de confusão é uma ferramenta de medição do desempenho utilizada na aprendizagem supervisionada, especificamente para problemas de classificação. Fornece um resumo abrangente do desempenho de um modelo de classificação, comparando as classificações previstas com as classificações verdadeiras reais para um conjunto de dados de teste. Esta visualização ajuda a compreender não só a correção geral do modelo, mas também os tipos de erros que comete (ou seja, onde o modelo está "confuso"). É particularmente útil na Aprendizagem Automática (AM) e na Inteligência Artificial (IA) para avaliar modelos treinados para tarefas como a classificação de imagens ou a deteção de objectos.

Compreender os componentes

Uma matriz de confusão é normalmente apresentada como uma grelha quadrada em que cada linha representa as instâncias de uma classe real e cada coluna representa as instâncias de uma classe prevista (ou vice-versa). Para um problema simples de classificação binária (duas classes, por exemplo, Positivo e Negativo), a matriz tem quatro células:

  • Verdadeiros positivos (TP): O modelo previu corretamente a classe positiva.
  • Verdadeiros negativos (TN): O modelo previu corretamente a classe negativa.
  • Falsos positivos (FP) (Erro do tipo I): O modelo previu incorretamente a classe positiva (previu positivo, mas a classe real era negativa).
  • Falsos negativos (FN) (erro do tipo II): O modelo previu incorretamente a classe negativa (previu negativo, mas a classe real era positiva).

Estes quatro componentes constituem a base para o cálculo de vários indicadores de desempenho.

Relação com outras métricas de avaliação

Embora uma matriz de confusão forneça uma análise detalhada, várias métricas-chave são derivadas dela para resumir o desempenho:

  • Precisão: A proporção do total de previsões que estavam corretas (TP + TN) / (TP + TN + FP + FN). Embora simples, pode ser enganador para conjuntos de dados desequilibrados.
  • Precisão: Mede a exatidão das previsões positivas. TP / (TP + FP). Responde: "De todas as instâncias previstas como positivas, quantas são realmente positivas?"
  • Recuperação (Sensibilidade ou taxa de verdadeiros positivos): Mede a capacidade do modelo de identificar instâncias positivas reais. TP / (TP + FN). Responde: "De todas as instâncias positivas reais, quantas o modelo identificou corretamente?"
  • F1-Score: A média harmónica de Precisão e Recuperação, fornecendo uma pontuação única que equilibra ambas as preocupações.
  • Especificidade (Taxa de verdadeiros negativos): Mede a capacidade do modelo de identificar instâncias negativas reais. TN / (TN + FP).
  • Curva Caraterística de Funcionamento do Recetor (ROC): Traça o gráfico da taxa de verdadeiros positivos (Recall) em relação à taxa de falsos positivos (1 - Especificidade) em várias definições de limiar, resumindo o desempenho em diferentes limiares de decisão.

Compreender a matriz de confusão ajuda a escolher as métricas mais relevantes para um problema específico, especialmente quando os custos dos diferentes tipos de erros (FP vs. FN) variam significativamente. Podes saber mais sobre isto no nosso guia de métricas de desempenhoYOLO .

Utilização em Ultralytics

Ao treinar modelos como o Ultralytics YOLO para tarefas como a deteção de objectos ou a classificação de imagens, as matrizes de confusão são geradas automaticamente durante a fase de validação(modo Val). Estas matrizes ajudam os utilizadores a visualizar o desempenho do modelo em diferentes classes de conjuntos de dados como o COCO ou conjuntos de dados personalizados. Plataformas como o Ultralytics HUB fornecem ambientes integrados para treinar modelos, gerir conjuntos de dados e analisar resultados, incluindo matrizes de confusão, para obter uma visão abrangente da avaliação do modelo. Isto permite uma rápida identificação das classes com as quais o modelo tem dificuldades, informando sobre o aumento dos dados ou o ajuste dos hiperparâmetros. Estruturas como PyTorch e TensorFlow integram frequentemente ferramentas para gerar estas matrizes.

Aplicações no mundo real

As matrizes de confusão são vitais em muitos domínios:

  1. Diagnóstico médico: Ao avaliar um modelo concebido para detetar doenças como o cancro a partir de imagens médicas, a matriz de confusão é crucial. Um Falso Negativo (não detetar cancro quando presente) pode ter consequências graves, potencialmente mais graves do que um Falso Positivo (detetar cancro quando ausente, levando a mais testes). A análise da matriz ajuda a equilibrar a Precisão e a Recuperação de acordo com as necessidades clínicas. Para mais contexto, consulta os recursos do NIH sobre imagiologia médica. Esta é uma área fundamental da IA nos cuidados de saúde.
  2. Deteção de e-mails de spam: Para um filtro de spam, uma matriz de confusão ajuda a avaliar o desempenho. Um Falso Positivo (classificar um e-mail legítimo como spam) pode ser mais problemático para os utilizadores do que um Falso Negativo (deixar passar um e-mail de spam). A matriz detalha a frequência com que cada tipo de erro ocorre, orientando os ajustes do modelo. Podes explorar a investigação sobre deteção de spam utilizando estas técnicas, muitas vezes envolvendo o Processamento de Linguagem Natural (PNL). Outras aplicações incluem a deteção de fraudes e a avaliação de modelos em sistemas de segurança.

Benefícios e limitações

A principal vantagem de uma matriz de confusão é a sua capacidade de fornecer uma análise detalhada, classe a classe, do desempenho do modelo para além de uma única pontuação de precisão. Mostra claramente onde o modelo está "confuso" e é essencial para depurar e melhorar os modelos de classificação, especialmente em cenários com classes desequilibradas ou custos diferentes associados a erros. Suporta a visualização de dados para facilitar a interpretação. Uma limitação é que, para problemas com um número muito grande de classes(como os de grandes conjuntos de dados, como o ImageNet), a matriz pode se tornar grande e difícil de interpretar visualmente sem agregação ou técnicas de visualização especializadas.

Em resumo, a matriz de confusão é uma ferramenta de avaliação indispensável na aprendizagem supervisionada, oferecendo informações cruciais para o desenvolvimento de modelos robustos e fiáveis de Visão por Computador (CV) e outros modelos de ML. Compreender os seus componentes é fundamental para a avaliação e iteração eficazes de modelos em plataformas como o Ultralytics HUB.

Lê tudo