Glossário

Poda de modelos

Optimiza os modelos de aprendizagem automática com a poda de modelos. Obtém inferência mais rápida, uso reduzido de memória e eficiência energética para implantações com recursos limitados.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

A poda de modelos é uma técnica crucial na aprendizagem automática centrada na otimização de modelos treinados. Simplifica os modelos reduzindo a sua complexidade e tamanho, o que é conseguido através da remoção de parâmetros menos críticos - como pesos e ligações - de uma rede neural. Esse processo torna os modelos mais eficientes sem sacrificar significativamente o desempenho, levando a benefícios como processamento mais rápido, menor uso de memória e menor consumo de energia, especialmente benéfico para a implantação em ambientes com recursos limitados.

Porquê utilizar a poda de modelos?

Há várias razões convincentes para empregar a poda de modelos. Em primeiro lugar, reduz significativamente o tamanho dos modelos de aprendizagem automática, tornando-os mais fáceis de implementar em dispositivos com armazenamento limitado, como telemóveis ou sistemas de ponta. Modelos menores também levam a velocidades de inferência mais rápidas, pois há menos cálculos necessários para gerar previsões. Esta melhoria da velocidade é vital para aplicações em tempo real, como a deteção de objectos em veículos autónomos ou a análise de vídeo em direto. Além disso, os modelos reduzidos consomem menos energia, uma vantagem crucial para dispositivos alimentados por bateria e centros de dados de grande escala que visam práticas de IA sustentáveis.

Tipos de poda de modelos

A poda de modelos pode ser classificada em dois tipos principais:

  • Poda de pesos: Esta técnica centra-se na remoção de pesos individuais dentro da rede neural. Pode ser dividida em poda estruturada e não estruturada. A poda não estruturada remove pesos individuais independentemente de sua posição, o que leva à esparsidade, mas a padrões de acesso à memória potencialmente irregulares. A poda estruturada, por outro lado, remove estruturas inteiras, como filtros ou canais, resultando em modelos mais compactos e amigáveis ao hardware.
  • Poda de neurônios: A poda de neurônios, também conhecida como poda de nós ou unidades, envolve a remoção de neurônios ou nós inteiros de uma rede neural. Esse método simplifica a arquitetura da rede de forma mais agressiva do que a poda de pesos e, às vezes, pode levar a aumentos de velocidade mais significativos e à redução do tamanho do modelo.

Model Pruning vs. Outras Técnicas de Otimização

Enquanto a poda de modelos reduz o tamanho do modelo através da remoção de parâmetros, outras técnicas como a quantização do modelo e a destilação do conhecimento oferecem estratégias de otimização alternativas. A quantização reduz a precisão dos pesos (por exemplo, de ponto flutuante de 32 bits para inteiro de 8 bits), o que também diminui o tamanho do modelo e acelera a computação sem alterar a estrutura do modelo. A destilação de conhecimento treina um modelo "aluno" menor para imitar o comportamento de um modelo "professor" maior e mais complexo. Estas técnicas são frequentemente utilizadas em combinação com a poda para obter ganhos de eficiência ainda maiores. Por exemplo, um modelo pode ser primeiro podado para reduzir seu tamanho e depois quantizado para otimizar ainda mais seu desempenho para implantação.

Aplicações reais da poda de modelos

A poda de modelos é amplamente aplicada em vários domínios, especialmente quando os recursos computacionais são limitados ou a eficiência é fundamental. Algumas das principais aplicações incluem:

  • Dispositivos móveis e de ponta: A implantação de modelosUltralytics YOLO em dispositivos móveis para deteção de objetos em tempo real e processamento de imagens exige modelos eficientes. A poda ajuda a reduzir o tamanho e a latência do modelo, tornando viável a execução de tarefas complexas de IA em smartphones e dispositivos IoT.
  • Veículos autónomos: Os carros autónomos requerem uma tomada de decisão rápida com base em dados de sensores. Os modelos podados garantem uma inferência rápida para tarefas críticas como a deteção de peões e a manutenção da faixa de rodagem, em que a baixa latência é crucial para a segurança.

Conclusão

A poda de modelos é uma técnica de otimização essencial para a implementação de modelos de aprendizagem automática eficientes. Ao reduzir o tamanho e a complexidade do modelo, permite uma inferência mais rápida, uma menor utilização de memória e um menor consumo de energia. Ultralytics fornece um conjunto de ferramentas e recursos para ajudar os utilizadores a otimizar os seus modelos, incluindo técnicas como a poda para melhorar a praticidade e a eficiência das suas aplicações de visão computacional em diversos cenários de implementação.

Lê tudo