Glossário

Classificação de imagens

Descobre a classificação de imagens com Ultralytics YOLO : treina modelos personalizados para cuidados de saúde, agricultura, retalho e muito mais, utilizando ferramentas de ponta.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A classificação de imagens é uma tarefa fundamental na Visão por Computador (CV) que envolve a atribuição de uma única etiqueta ou categoria a uma imagem inteira com base no seu conteúdo visual. É uma capacidade essencial da Inteligência Artificial (IA), permitindo que as máquinas compreendam e categorizem imagens de forma semelhante à forma como os humanos reconhecem cenas ou objectos. Alimentada por técnicas de aprendizagem automática (ML) e, em particular, de aprendizagem profunda (DL), a classificação de imagens tem como objetivo responder à pergunta: "Qual é o tema principal desta imagem?"

Como funciona a classificação de imagens

O processo envolve normalmente o treino de um modelo, muitas vezes um tipo especializado de rede neural chamado Rede Neural Convolucional (CNN), num grande conjunto de dados de imagens rotuladas. Conjuntos de dados famosos como o ImageNet contêm milhões de imagens categorizadas em milhares de classes. Durante o treino, o modelo aprende a identificar padrões e caraterísticas - como texturas, formas e distribuições de cores - que distinguem diferentes categorias. Estruturas como o PyTorch e TensorFlow fornecem as ferramentas para criar e treinar estes modelos. Podes explorar vários conjuntos de dados de classificaçãoUltralytics para iniciares os teus próprios projectos. O objetivo é que o modelo treinado preveja com precisão o rótulo da classe para imagens novas e não vistas. Para uma compreensão técnica mais profunda, recursos como o curso Stanford CS231n oferecem material abrangente sobre CNNs.

Principais diferenças em relação a outras tarefas

A classificação de imagens centra-se na atribuição de uma única etiqueta a toda a imagem. Isto distingue-a de outras tarefas comuns de CV:

  • Deteção de objectos: Identifica vários objectos dentro de uma imagem e localiza cada um deles utilizando caixas delimitadoras. Responde a "Que objectos estão na imagem e onde estão?"
  • Segmentação de instâncias: Vai um passo além da deteção de objectos, delineando os limites exactos dos pixels de cada instância de objeto distinta.
  • Segmentação semântica: Classifica cada pixel da imagem num conjunto de categorias predefinidas (por exemplo, "céu", "estrada", "carro"), mas não diferencia entre instâncias individuais da mesma categoria.

Compreender estas diferenças é crucial para selecionar a técnica adequada para um determinado problema.

Aplicações no mundo real

A classificação de imagens é amplamente utilizada em vários domínios devido à sua relativa simplicidade e eficácia:

Classificação de imagens com Ultralytics

Os modelosYOLO Ultralytics , conhecidos pela deteção de objectos, também são excelentes em tarefas de classificação de imagens. Arquitecturas modernas como o Ultralytics YOLOv11 podem ser facilmente treinadas para classificação utilizando o pacoteUltralytics Python ou a plataforma sem código Ultralytics HUB. Essas ferramentas fornecem recursos abrangentes, incluindo dicas de treinamento de modelos e documentação clara, como o guia sobre como usar Ultralytics YOLOv11 para classificação de imagens. Para praticar, considera explorar os tutoriais de classificaçãoPyTorch ou participar em competições de classificação de imagens do Kaggle. Mantém-te atualizado sobre os últimos avanços da investigação através de recursos como Papers With Code.

Lê tudo