Glossário

Extração de caraterísticas

Descobre o poder da extração de caraterísticas na aprendizagem automática com Ultralytics YOLO11 . Aprende técnicas para deteção e análise eficientes.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A extração de caraterísticas é um processo vital na aprendizagem automática (ML) e na visão computacional (CV), actuando como uma etapa crítica para converter dados brutos, frequentemente complexos, num formato que os algoritmos possam processar eficazmente. Envolve a transformação de dados não estruturados ou de elevada dimensão, como imagens, áudio ou texto, num conjunto estruturado de caraterísticas numéricas, normalmente representadas como um vetor de caraterísticas. Estas caraterísticas visam captar as caraterísticas essenciais dos dados originais, eliminando simultaneamente o ruído e a redundância. Os principais objectivos incluem a redução da complexidade dos dados através da redução da dimensionalidade, destacando padrões relevantes e tornando os dados mais adequados para os modelos de ML. Isto conduz frequentemente a uma maior precisão do modelo, a um treino mais rápido do modelo e a uma melhor generalização a dados não vistos.

Como funciona a extração de caraterísticas

As técnicas específicas de extração de caraterísticas dependem muito do tipo de dados a processar.

Extração de caraterísticas vs. engenharia de caraterísticas

A extração de caraterísticas é frequentemente confundida com a engenharia de caraterísticas, mas são conceitos distintos.

  • Extração de caraterísticas: Concentra-se especificamente na transformação de dados brutos num conjunto de caraterísticas derivadas, muitas vezes utilizando algoritmos automatizados (como camadas CNN) ou técnicas matemáticas estabelecidas (como PCA ou transformadas de Fourier). O objetivo é, normalmente, a redução da dimensionalidade e a criação de uma representação mais fácil de gerir.
  • Engenharia de caraterísticas: É uma prática mais ampla que inclui a extração de caraterísticas, mas também envolve a criação de novas caraterísticas a partir de outras já existentes (por exemplo, calcular o rácio de duas medições), selecionar as caraterísticas mais relevantes para um modelo, tratar valores em falta e transformar caraterísticas com base no conhecimento do domínio e em requisitos específicos do modelo(como o pré-processamento de dados). Requer frequentemente mais esforço manual e conhecimentos especializados.

Embora os modelos de aprendizagem profunda automatizem grande parte do processo de extração de caraterísticas para tarefas como o reconhecimento de imagens e a deteção de objectos, os princípios de engenharia de caraterísticas, como o aumento adequado dos dados ou a normalização das entradas, continuam a ser cruciais para alcançar um desempenho ótimo.

Aplicações no mundo real

A extração de caraterísticas é fundamental para inúmeras aplicações de IA e ML:

  1. Análise de imagens médicas: Na análise de exames médicos como raios X, TACs ou MRIs para detetar doenças como o cancro, são extraídas caraterísticas específicas das imagens. Estas podem incluir padrões de textura dentro dos tecidos, a forma e o tamanho de potenciais anomalias (como tumores encontrados no conjunto de dados Brain Tumor) ou variações de intensidade. Estas caraterísticas extraídas são depois introduzidas num classificador (como um SVM ou uma rede neural) para prever a presença ou o estádio de uma doença. Isto ajuda os radiologistas no diagnóstico, conforme discutido em publicações como Radiology: Inteligência Artificial. Os sistemas modernos podem utilizar Ultralytics YOLO11 que extrai implicitamente caraterísticas para tarefas como a análise de imagens médicas.

  2. Análise de sentimentos: Para determinar o sentimento (positivo, negativo, neutro) expresso em dados de texto, como comentários de clientes ou publicações em redes sociais, as caraterísticas devem ser extraídas do texto em bruto. Isso pode envolver a contagem da frequência de palavras positivas e negativas(Bag-of-Words), usando pontuações TF, ou gerando embeddings de frases sofisticadas usando modelos de linguagem pré-treinados, como os disponíveis via Hugging Face. Estas caraterísticas quantificam o tom emocional do texto, permitindo que um modelo de ML classifique o sentimento geral, o que é crucial para compreender o feedback do cliente.

Extração de caraterísticas em modelosYOLO Ultralytics

Modelos de deteção de objectos de última geração, como o Ultralytics YOLOv8 e YOLO11 efectuam a extração de caraterísticas implicitamente na sua arquitetura de rede neural (NN). As camadas iniciais (frequentemente parte da espinha dorsal) actuam como poderosos extractores de caraterísticas aprendidas. À medida que os dados de entrada passam por estas camadas, as caraterísticas hierárquicas são automaticamente identificadas e representadas nos mapas de caraterísticas. Embora o processo seja em grande parte automatizado, a compreensão da extração de caraterísticas ajuda a conceber passos eficazes de pré-processamento de dados, a efetuar a afinação de hiperparâmetros e a interpretar o comportamento do modelo, utilizando potencialmente ferramentas disponíveis na documentaçãoUltralytics ou em plataformas como o Ultralytics HUB para gerir conjuntos de dados e experiências. As técnicas também são utilizadas em tarefas a jusante, como o rastreio de objectos, em que as caraterísticas de aparência podem ser extraídas para manter a identidade dos objectos em todos os fotogramas. Frameworks como PyTorch e TensorFlow fornecem a infraestrutura subjacente para construir e treinar estes modelos.

Lê tudo