Explore a aprendizagem supervisionada em IA. Saiba como modelos como Ultralytics usam dados rotulados para classificação e regressão para alcançar resultados de alta precisão.
A aprendizagem supervisionada é uma abordagem fundamental na inteligência artificial (IA), na qual os algoritmos são treinados com dados de entrada que foram marcados com a saída correta. Neste método, o modelo aprende ao comparar as suas próprias previsões com esses rótulos fornecidos, essencialmente tendo um «supervisor» para corrigi-lo durante o processo de treinamento. O objetivo principal é que o sistema aprenda a função de mapeamento de entradas para saídas bem o suficiente para que possa prever com precisão os rótulos para novos dados de teste não vistos . Essa técnica é a força motriz por trás de muitas das aplicações de IA mais práticas e bem-sucedidas em uso hoje, desde filtros de spam de e-mail até sistemas de condução autónoma .
O fluxo de trabalho da aprendizagem supervisionada gira em torno do uso de dados rotulados. Um conjunto de dados é organizado de forma que cada exemplo de treino seja emparelhado com um rótulo de «verdade fundamental» correspondente. Durante a fase de treino do modelo, o algoritmo processa as características de entrada e gera uma previsão. Uma fórmula matemática chamada função de perda mede então o erro — a diferença entre a previsão do modelo e o rótulo real.
Para minimizar esse erro, um algoritmo de otimização, como Stochastic Gradient Descent (SGD), ajusta iterativamente os parâmetros internos do modelo ou os pesos do modelo. Esse processo se repete ao longo de muitos ciclos, conhecidos como épocas, até que o modelo atinja um nível satisfatório de precisão sem sobreajustar os dados de treino . Ferramentas como a Ultralytics simplificam todo esse pipeline ao gerenciar a anotação, o treino e a avaliação do conjunto de dados em um ambiente unificado.
Os problemas de aprendizagem supervisionada são geralmente categorizados em dois tipos principais, com base na natureza da variável-alvo:
A aprendizagem supervisionada impulsiona uma vasta gama de tecnologias em diferentes setores:
É importante distinguir a aprendizagem supervisionada da aprendizagem não supervisionada. Enquanto a aprendizagem supervisionada depende de pares de entrada-saída rotulados, a aprendizagem não supervisionada trabalha com dados não rotulados. Em cenários não supervisionados, o algoritmo tenta encontrar estruturas, padrões ou agrupamentos ocultos nos dados por conta própria, como a segmentação de clientes em marketing. A aprendizagem supervisionada é geralmente mais precisa para tarefas específicas em que há dados históricos disponíveis, enquanto a aprendizagem não supervisionada é melhor para a análise exploratória de dados.
A aprendizagem supervisionada é fundamental para treinar modelos modernos de visão computacional. O seguinte Python demonstra como treinar um modelo YOLO26 usando um conjunto de dados supervisionado (COCO8). O modelo aprende com as imagens rotuladas no conjunto de dados para detect .
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model using the 'coco8.yaml' dataset (supervised learning)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model is now fine-tuned based on the supervised labels in the dataset
Este processo simples aproveita o poder do PyTorch para realizar operações matriciais complexas e cálculos de gradiente. Para aqueles que procuram otimizar o aspecto de gestão de dados, a Ultralytics oferece ferramentas para formação baseada na nuvem e auto-anotação, tornando o fluxo de trabalho de aprendizagem supervisionada significativamente mais eficiente.