Aumenta a precisão da aprendizagem automática com engenharia especializada de caraterísticas. Aprende técnicas para criar, transformar e selecionar caraterísticas com impacto.
A engenharia de caraterísticas é o processo crucial de seleção, transformação e criação de caraterísticas a partir de dados brutos para os tornar mais adequados aos modelos de aprendizagem automática (ML). Envolve a utilização de conhecimentos de domínio e técnicas de análise de dados para criar entradas que representem melhor o problema subjacente, melhorando, em última análise, o desempenho, a precisão e a interpretabilidade do modelo. Pensa nisto como preparar os melhores ingredientes para uma receita; mesmo o chefe (ou modelo) mais competente tem dificuldades com ingredientes de fraca qualidade(dados de treino). Este passo é frequentemente considerado uma das partes mais críticas e demoradas do fluxo de trabalho de ML.
Os dados brutos recolhidos no mundo real raramente estão prontos para utilização direta em algoritmos de aprendizagem automática. Podem conter valores em falta, inconsistências, informações irrelevantes ou estar em formatos inadequados para o consumo de modelos (como texto ou dados categóricos). A engenharia de caraterísticas aborda estas questões através de:
Várias técnicas são abrangidas pelo conceito de engenharia de caraterísticas:
Embora sejam frequentemente utilizadas de forma indistinta, a engenharia de caraterísticas e a extração de caraterísticas têm nuances distintas.
Na sua essência, a extração de caraterísticas é frequentemente uma ferramenta utilizada no âmbito do processo mais vasto de engenharia de caraterísticas.
Enquanto modelos avançados como o Ultralytics YOLO se destacam em tarefas como a deteção de objectos e a segmentação de imagens, aprendendo automaticamente caraterísticas visuais relevantes através das suas arquitecturas de redes neurais profundas(espinha dorsal, pescoço, cabeça), os princípios da engenharia de caraterísticas continuam a ser relevantes. Por exemplo, o pré-processamento de imagens de entrada (por exemplo, equalização de histograma para iluminação variável, redução de ruído usando bibliotecas como OpenCV ou aplicação de aumentos de dados específicos adaptados ao domínio do problema) antes de as alimentar num modelo YOLO é uma forma de engenharia de caraterísticas que pode melhorar a robustez e o desempenho do modelo. Além disso, os resultados do YOLO (como coordenadas de caixas delimitadoras, classes de objectos, contagens) podem ser transformados em caraterísticas para tarefas a jusante ou combinados com outras fontes de dados para análises mais complexas, talvez geridas em plataformas como o Ultralytics HUB, que ajuda a organizar conjuntos de dados e modelos. Explora a documentação e os tutoriais Ultralytics para obteres mais informações sobre a utilização de modelos, formação personalizada e pré-processamento de dados anotados. Ferramentas como o Featuretools também podem ajudar a automatizar partes do processo de engenharia de caraterísticas, alinhando-se com os conceitos do Automated Machine Learning (AutoML). A engenharia eficaz de recursos, mesmo com modelos poderosos de aprendizado profundo, continua sendo um aspeto fundamental das práticas bem-sucedidas de MLOps.