Glosario

Poda de modelos

Optimiza los modelos de aprendizaje automático con la poda de modelos. Consigue una inferencia más rápida, menor uso de memoria y eficiencia energética para implantaciones con recursos limitados.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

La poda de modelos es una técnica crucial en el aprendizaje automático centrada en optimizar los modelos entrenados. Agiliza los modelos reduciendo su complejidad y tamaño, lo que se consigue eliminando los parámetros menos críticos -como pesos y conexiones- de una red neuronal. Este proceso hace que los modelos sean más eficientes sin sacrificar significativamente el rendimiento, lo que conlleva ventajas como un procesamiento más rápido, un menor uso de la memoria y un menor consumo de energía, especialmente beneficioso para la implantación en entornos con recursos limitados.

¿Por qué utilizar la Poda Modelo?

Hay varias razones de peso para emplear la poda de modelos. En primer lugar, reduce significativamente el tamaño de los modelos de aprendizaje automático, lo que facilita su despliegue en dispositivos con almacenamiento limitado, como teléfonos móviles o sistemas de borde. Los modelos más pequeños también conducen a velocidades de inferencia más rápidas, ya que se necesitan menos cálculos para generar predicciones. Esta mejora de la velocidad es vital para aplicaciones en tiempo real, como la detección de objetos en vehículos autónomos o el análisis de vídeo en directo. Además, los modelos podados consumen menos energía, una ventaja crucial para los dispositivos que funcionan con baterías y los centros de datos a gran escala que persiguen prácticas de IA sostenibles.

Tipos de poda de modelos

La poda de modelos puede clasificarse a grandes rasgos en dos tipos principales:

  • Poda de pesos: Esta técnica se centra en eliminar pesos individuales dentro de la red neuronal. Puede dividirse a su vez en poda estructurada y no estructurada. La poda no estructurada elimina pesos individuales independientemente de su posición, lo que da lugar a dispersidad pero a patrones de acceso a la memoria potencialmente irregulares. La poda estructurada, en cambio, elimina estructuras enteras como filtros o canales, lo que da lugar a modelos más compactos y fáciles de usar.
  • Poda de neuronas: La poda de neuronas, también conocida como poda de nodos o unidades, consiste en eliminar neuronas o nodos enteros de una red neuronal. Este método simplifica la arquitectura de la red de forma más agresiva que la poda de pesos y, a veces, puede dar lugar a aumentos de velocidad más significativos y a una reducción del tamaño del modelo.

Poda de modelos frente a otras técnicas de optimización

Mientras que la poda de modelos reduce el tamaño del modelo eliminando parámetros, otras técnicas como la cuantización de modelos y la destilación de conocimientos ofrecen estrategias de optimización alternativas. La cuantización reduce la precisión de los pesos (por ejemplo, de 32 bits de coma flotante a enteros de 8 bits), lo que también disminuye el tamaño del modelo y acelera el cálculo sin cambiar la estructura del modelo. La destilación de conocimientos entrena a un modelo "alumno" más pequeño para que imite el comportamiento de un modelo "maestro" más grande y complejo. Estas técnicas se utilizan a menudo en combinación con la poda para lograr ganancias de eficiencia aún mayores. Por ejemplo, un modelo podría podarse primero para reducir su tamaño y luego cuantificarse para optimizar aún más su rendimiento de cara a su despliegue.

Aplicaciones reales de la poda de modelos

La poda de modelos se aplica ampliamente en diversos ámbitos, especialmente cuando los recursos computacionales son limitados o la eficiencia es primordial. Algunas aplicaciones clave son:

  • Dispositivos móviles y Edge: El despliegue de modelosUltralytics YOLO en dispositivos móviles para la detección de objetos y el procesamiento de imágenes en tiempo real exige modelos eficientes. La poda ayuda a reducir el tamaño del modelo y la latencia, haciendo factible la ejecución de tareas complejas de IA en smartphones y dispositivos IoT.
  • Vehículos autónomos: Los coches autónomos requieren una toma de decisiones rápida basada en los datos de los sensores. Los modelos podados garantizan una inferencia rápida para tareas críticas como la detección de peatones y el mantenimiento del carril, donde la baja latencia es crucial para la seguridad.

Conclusión

La poda de modelos es una técnica de optimización esencial para desplegar modelos eficientes de aprendizaje automático. Al reducir el tamaño y la complejidad del modelo, permite una inferencia más rápida, un menor uso de la memoria y un menor consumo de energía. Ultralytics proporciona un conjunto de herramientas y recursos para ayudar a los usuarios a optimizar sus modelos, incluyendo técnicas como la poda para mejorar la practicidad y la eficiencia de sus aplicaciones de visión por ordenador en diversos escenarios de despliegue.

Leer todo