Glossário

Classificação de imagens

Descobre a classificação de imagens com Ultralytics YOLO : treina modelos personalizados para cuidados de saúde, agricultura, retalho e muito mais, utilizando ferramentas de ponta.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A classificação de imagens é uma tarefa fundamental na Visão por Computador (CV) que envolve a atribuição de uma única etiqueta ou categoria a uma imagem inteira com base no seu conteúdo visual. É uma capacidade essencial da Inteligência Artificial (IA), permitindo que as máquinas compreendam e categorizem imagens de forma semelhante à forma como os humanos reconhecem cenas ou objectos. Alimentada por técnicas de aprendizagem automática (ML) e, em particular, de aprendizagem profunda (DL), a classificação de imagens tem como objetivo responder à pergunta: "Qual é o tema principal desta imagem?". Esta tarefa serve como um bloco de construção para muitos problemas de compreensão visual mais complexos.

Como funciona a classificação de imagens

O processo envolve normalmente o treino de um modelo, muitas vezes um tipo especializado de rede neural chamado Rede Neural Convolucional (CNN), num grande conjunto de dados de imagens rotuladas. Conjuntos de dados famosos como o ImageNet, que contém milhões de imagens em milhares de categorias, são normalmente utilizados para treinar modelos robustos. Durante o treino, o modelo aprende a identificar padrões e caraterísticas distintivas - tais como texturas, formas, arestas e distribuições de cores - que caracterizam diferentes categorias. Estruturas como PyTorch e TensorFlow fornecem as ferramentas e bibliotecas necessárias para criar e treinar estes modelos de aprendizagem profunda. Podes explorar vários conjuntos de dados de classificaçãoUltralytics , como o CIFAR-100 ou o MNIST, para iniciares os teus próprios projectos. O objetivo final é que o modelo treinado preveja com precisão o rótulo da classe para imagens novas e não vistas anteriormente. Para uma compreensão técnica mais profunda dos mecanismos subjacentes, recursos como o curso Stanford CS231n sobre Redes Neurais Convolucionais para Reconhecimento Visual oferecem material abrangente.

Principais diferenças em relação a outras tarefas de visão

A classificação de imagens centra-se na atribuição de um rótulo único e abrangente a toda a imagem. Isto torna-a distinta de outras tarefas comuns de visão computacional:

  • Deteção de objectos: Esta tarefa vai um pouco mais longe, não só classificando os objectos dentro de uma imagem, mas também localizando-os, normalmente desenhando caixas delimitadoras em torno de cada instância detectada. Responde a "Que objectos existem nesta imagem e onde estão localizados?".
  • Segmentação de imagens: Classifica cada pixel da imagem.
    • Segmentação semântica atribui uma etiqueta de classe (por exemplo, "carro", "estrada", "céu") a cada pixel, sem distinguir entre diferentes instâncias da mesma classe.
    • Segmentação de instâncias distingue entre instâncias individuais de objectos, atribuindo um identificador único aos pixels pertencentes a cada objeto separado (por exemplo, rotulando 'carro 1', 'carro 2').

Compreender estas diferenças é crucial para selecionar a técnica adequada para um problema específico, uma vez que cada tarefa fornece um nível diferente de detalhe sobre o conteúdo da imagem.

Aplicações no mundo real

A classificação de imagens é amplamente utilizada em vários domínios devido à sua eficácia na categorização da informação visual:

Classificação de imagens com Ultralytics

Os modelos Ultralytics YOLO , embora reconhecidos pela deteção de objectos, também demonstram um forte desempenho em tarefas de classificação de imagens. Arquitecturas de ponta como o Ultralytics YOLO11 podem ser facilmente treinadas ou ajustadas para classificação usando o intuitivo pacoteUltralytics Python ou a plataforma Ultralytics HUB sem código. Estas ferramentas fornecem recursos abrangentes, incluindo sugestões de formação de modelos e documentação clara, como o guia sobre como utilizar Ultralytics YOLO11 para classificação de imagens. Para praticar mais, considera explorar os tutoriais de classificaçãoPyTorch ou participar em competições de classificação de imagens do Kaggle. Para te manteres atualizado sobre os últimos avanços da investigação, recursos como o Papers With Code são inestimáveis. Também podes comparar o desempenho do modelo YOLO em benchmarks padrão.

Lê tudo