Optimiza os modelos de aprendizagem automática com a poda de modelos. Obtém inferência mais rápida, uso reduzido de memória e eficiência energética para implantações com recursos limitados.
A poda de modelos é uma técnica crucial na aprendizagem automática centrada na otimização de modelos treinados. Simplifica os modelos reduzindo a sua complexidade e tamanho, o que é conseguido através da remoção de parâmetros menos críticos - como pesos e ligações - de uma rede neural. Esse processo torna os modelos mais eficientes sem sacrificar significativamente o desempenho, levando a benefícios como processamento mais rápido, menor uso de memória e menor consumo de energia, especialmente benéfico para a implantação em ambientes com recursos limitados.
Há várias razões convincentes para empregar a poda de modelos. Em primeiro lugar, reduz significativamente o tamanho dos modelos de aprendizagem automática, tornando-os mais fáceis de implementar em dispositivos com armazenamento limitado, como telemóveis ou sistemas de ponta. Modelos menores também levam a velocidades de inferência mais rápidas, pois há menos cálculos necessários para gerar previsões. Esta melhoria da velocidade é vital para aplicações em tempo real, como a deteção de objectos em veículos autónomos ou a análise de vídeo em direto. Além disso, os modelos reduzidos consomem menos energia, uma vantagem crucial para dispositivos alimentados por bateria e centros de dados de grande escala que visam práticas de IA sustentáveis.
A poda de modelos pode ser classificada em dois tipos principais:
Enquanto a poda de modelos reduz o tamanho do modelo através da remoção de parâmetros, outras técnicas como a quantização do modelo e a destilação do conhecimento oferecem estratégias de otimização alternativas. A quantização reduz a precisão dos pesos (por exemplo, de ponto flutuante de 32 bits para inteiro de 8 bits), o que também diminui o tamanho do modelo e acelera a computação sem alterar a estrutura do modelo. A destilação de conhecimento treina um modelo "aluno" menor para imitar o comportamento de um modelo "professor" maior e mais complexo. Estas técnicas são frequentemente utilizadas em combinação com a poda para obter ganhos de eficiência ainda maiores. Por exemplo, um modelo pode ser primeiro podado para reduzir seu tamanho e depois quantizado para otimizar ainda mais seu desempenho para implantação.
A poda de modelos é amplamente aplicada em vários domínios, especialmente quando os recursos computacionais são limitados ou a eficiência é fundamental. Algumas das principais aplicações incluem:
A poda de modelos é uma técnica de otimização essencial para a implementação de modelos de aprendizagem automática eficientes. Ao reduzir o tamanho e a complexidade do modelo, permite uma inferência mais rápida, uma menor utilização de memória e um menor consumo de energia. Ultralytics fornece um conjunto de ferramentas e recursos para ajudar os utilizadores a otimizar os seus modelos, incluindo técnicas como a poda para melhorar a praticidade e a eficiência das suas aplicações de visão computacional em diversos cenários de implementação.