Glossário

Engenharia de recursos

Domina a engenharia de caraterísticas para aumentar o desempenho do modelo de aprendizagem automática. Aprende técnicas, aplicações do mundo real e dicas para uma melhor precisão.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A engenharia de caraterísticas é um processo crucial na aprendizagem automática (ML) que envolve a transformação de dados em bruto num formato que melhora o desempenho dos modelos de ML. É a arte e a ciência de selecionar, criar e transformar variáveis, conhecidas como caraterísticas, que são utilizadas como entradas para estes modelos. O objetivo é criar caraterísticas que captem as informações essenciais dos dados, facilitando ao modelo a aprendizagem de padrões e a realização de previsões precisas. Uma engenharia de caraterísticas eficaz pode aumentar significativamente a capacidade de generalização de um modelo a partir dos dados de treino para dados não vistos, melhorando assim a sua precisão e eficiência.

Importância da engenharia de caraterísticas

A engenharia de caraterísticas é vital porque a qualidade e a relevância das caraterísticas têm um impacto direto no desempenho de um modelo de aprendizagem automática. As caraterísticas bem concebidas podem simplificar a estrutura subjacente dos dados, facilitando aos modelos o discernimento de padrões e relações. Isto pode levar a previsões mais exactas, a tempos de formação mais rápidos e a uma redução da complexidade dos modelos. Em muitos casos, as caraterísticas corretas podem fazer a diferença entre um modelo que tem um desempenho fraco e um que atinge resultados de topo de gama. Isto é particularmente importante em tarefas complexas como a deteção de objectos, em que os dados brutos de pixéis podem não ser diretamente informativos.

Técnicas de engenharia de caraterísticas

Várias técnicas são normalmente utilizadas na engenharia de caraterísticas:

  • Criação de caraterísticas de interação: Trata-se de combinar duas ou mais caraterísticas para criar uma nova caraterística que capte as interações entre variáveis. Por exemplo, num modelo de previsão de preços de imóveis, a multiplicação do número de divisões pelo tamanho da casa pode criar uma caraterística mais informativa do que qualquer uma das variáveis isoladamente.
  • Tratamento de valores em falta: Os dados em falta podem ser imputados utilizando vários métodos, como o preenchimento com a média, mediana ou moda dos valores observados, ou utilizando técnicas mais sofisticadas como a imputação preditiva.
  • Escala de caraterísticas: Envolve o escalonamento das caraterísticas para um intervalo semelhante, o que pode ser crucial para algoritmos sensíveis à escala das caraterísticas de entrada, como os que utilizam cálculos de distância. Os métodos comuns incluem a padronização e a normalização. Sabe mais sobre estas técnicas no pré-processamento de dados anotados.
  • Codificação de variáveis categóricas: As caraterísticas categóricas, como cores ou categorias, precisam de ser convertidas num formato numérico que os modelos de ML possam processar. As técnicas incluem a codificação de um ponto, a codificação de etiquetas e a codificação de alvos.
  • Binning ou Discretização: As caraterísticas contínuas podem ser convertidas em caraterísticas categóricas, dividindo o intervalo de valores em compartimentos. Isto pode ser útil para captar relações não lineares nos dados.
  • Seleção de caraterísticas: Nem todas as caraterísticas são igualmente informativas. Os métodos de seleção de caraterísticas, como os métodos de filtro, wrapper e incorporados, ajudam a identificar as caraterísticas mais relevantes, reduzindo a dimensionalidade e melhorando o desempenho do modelo. Sabe mais sobre a redução da dimensionalidade no sítio Web Ultralytics .

Engenharia de caraterísticas vs. Extração de caraterísticas

Embora tanto a engenharia de caraterísticas como a extração de caraterísticas tenham como objetivo melhorar o desempenho do modelo trabalhando com caraterísticas, diferem na sua abordagem. A extração de caraterísticas envolve a criação automática de novas caraterísticas a partir dos dados brutos, muitas vezes utilizando algoritmos. Por exemplo, no processamento de imagens, uma rede neural convolucional (CNN) pode aprender a extrair arestas ou texturas das imagens. A engenharia de caraterísticas, por outro lado, envolve normalmente a criação ou transformação manual de caraterísticas com base no conhecimento do domínio e na compreensão dos dados.

Aplicações no mundo real

Eis dois exemplos de engenharia de caraterísticas em aplicações reais de IA/ML:

  1. Deteção de fraudes: Na deteção de fraudes com cartões de crédito, os dados brutos da transação podem incluir o montante, a hora, o local e o vendedor da transação. A engenharia de caraterísticas pode envolver a criação de novas caraterísticas, como a diferença de tempo entre transacções consecutivas, o montante médio da transação durante um período ou uma caraterística binária que indique se uma transação ocorreu num local invulgar. Estas caraterísticas podem melhorar significativamente a capacidade de um modelo para detetar transacções fraudulentas.
  2. Manutenção Preditiva: Na indústria transformadora, a previsão de falhas no equipamento pode poupar custos significativos. Os dados brutos dos sensores podem incluir leituras de temperatura, pressão e vibração. A engenharia de caraterísticas pode envolver a criação de caraterísticas como a taxa de variação da temperatura, a média móvel dos níveis de vibração ou o tempo decorrido desde a última manutenção. Estas caraterísticas podem ajudar um modelo a prever quando uma máquina é suscetível de falhar, permitindo uma manutenção atempada. Sabe mais sobre a IA no fabrico no sítio Web Ultralytics .

Engenharia de recursos e Ultralytics

Ultralytics oferece ferramentas e recursos poderosos para tarefas de visão computacional, incluindo aquelas que beneficiam da engenharia de caraterísticas. Por exemplo, os modelos de deteção de objectos do Ultralytics YOLO podem ser melhorados através da engenharia cuidadosa de caraterísticas a partir de dados de imagem. Ao utilizar técnicas como a criação de caraterísticas de interação ou o tratamento de valores em falta, os utilizadores podem melhorar a precisão e a eficiência dos seus modelos. Além disso, o Ultralytics fornece uma plataforma de fácil utilização, o Ultralytics HUB, que simplifica o processo de formação e implementação de modelos, facilitando a experimentação de diferentes abordagens de engenharia de caraterísticas. Explora os últimos avanços em modelosUltralytics YOLO modelos para ver como a engenharia de caraterísticas pode ser aplicada em projectos de visão computacional de ponta.

Para saber mais sobre engenharia de caraterísticas e conceitos relacionados, podes explorar recursos como a página da Wikipedia sobre engenharia de caraterísticas e a documentação do scikit-learn sobre pré-processamento de dados.

Lê tudo