Glossário

Pesos do modelo

Descobre a importância dos pesos dos modelos na aprendizagem automática, o seu papel nas previsões e como Ultralytics YOLO simplifica a sua utilização em tarefas de IA.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Os pesos do modelo são os parâmetros principais que um modelo de aprendizagem automática aprende durante o seu processo de formação. Estes valores numéricos representam o conhecimento adquirido a partir dos dados de treino e são fundamentais para a forma como o modelo faz previsões ou toma decisões sobre dados novos e não vistos. Essencialmente, os pesos determinam a força e a importância das ligações dentro do modelo, tal como entre neurónios numa rede neural (NN).

Compreender os pesos dos modelos

Imagina uma máquina complexa com muitos botões ajustáveis; os pesos do modelo funcionam como esses botões. Durante o treino, são apresentados ao modelo exemplos de um conjunto de dados e este faz previsões. A diferença entre estas previsões e as respostas corretas reais (verdade terrestre) é medida por uma função de perda. Um algoritmo de otimização, como o Stochastic Gradient Descent (SGD) ou o Adam, ajusta sistematicamente estes pesos para minimizar esta perda. Este processo é repetido ao longo de muitas iterações, ou épocas, refinando gradualmente os pesos. Inicialmente, os pesos são frequentemente definidos para pequenos valores aleatórios, mas através do treino, convergem para valores que captam os padrões subjacentes nos dados. É importante distinguir os pesos dos hiperparâmetros, como a taxa de aprendizagem ou o tamanho do lote, que são definidos antes do treino e orientam o próprio processo de aprendizagem, em vez de serem aprendidos durante o mesmo. Os vieses, outro tipo de parâmetro aprendido frequentemente encontrado junto com os pesos nas NNs, representam a ativação da linha de base de um neurônio.

O significado dos pesos dos modelos

Os pesos do modelo são críticos porque codificam os padrões e relacionamentos aprendidos a partir dos dados de treinamento. Pesos bem optimizados permitem que um modelo generalize eficazmente, fazendo previsões precisas sobre dados que nunca encontrou antes. A qualidade dos pesos tem um impacto direto nas métricas de desempenho do modelo, como a precisão e a robustez. Os pesos mal treinados, muitas vezes devido a problemas como dados insuficientes ou sobreajuste, resultam em previsões pouco fiáveis.

Em muitas aplicações modernas de IA, especialmente na visão computacional (CV), os modelos são frequentemente pré-treinados em grandes conjuntos de dados gerais, como o ImageNet ou o COCO. Os pesos resultantes captam caraterísticas visuais gerais. Estes pesos pré-treinados, como os disponíveis para os modelosYOLO Ultralytics , podem então ser utilizados diretamente para inferência ou como ponto de partida para um ajuste fino numa tarefa específica ou num conjunto de dados personalizado. Esta técnica, conhecida como aprendizagem por transferência, acelera significativamente a formação e conduz frequentemente a um melhor desempenho, especialmente com dados personalizados limitados. Podes gerir e treinar modelos com pesos específicos utilizando plataformas como o Ultralytics HUB.

Aplicações no mundo real

Os pesos dos modelos são o motor por detrás de inúmeras aplicações de IA:

  1. Deteção de objectos em veículos autónomos: Modelos como Ultralytics YOLOv8 utilizam os seus pesos aprendidos para identificar e localizar objectos como carros, peões e sinais de trânsito em feeds de vídeo em tempo real, permitindo uma navegação mais segura. Os pesos determinam como o modelo interpreta os padrões de pixel para reconhecer esses objetos específicos.
  2. Análise de imagens médicas para deteção de doenças: Nos cuidados de saúde, os modelos de IA treinados em imagens médicas (como raios X ou ressonâncias magnéticas) utilizam os seus pesos para detetar anomalias subtis indicativas de doenças, como a identificação de potenciais tumores em exames cerebrais utilizando conjuntos de dados como o conjunto de dados Brain Tumor. Os pesos codificam as caraterísticas visuais aprendidas com milhares de imagens médicas anotadas. Ferramentas como Weights & Biases podem ajudar a rastrear as experiências que produzem esses pesos.
Lê tudo