Glosario

Descenso Gradiente Estocástico (SGD)

Explora el Descenso Gradiente Estocástico, un algoritmo rápido y eficiente para la optimización del aprendizaje profundo utilizado en IA, como Ultralytics YOLO modelos para tareas en tiempo real.

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Saber más

El Descenso Gradiente Estocástico (SGD) es un popular algoritmo de optimización utilizado para entrenar modelos de aprendizaje automático, especialmente en el aprendizaje profundo. Es un método iterativo para minimizar una función objetivo, normalmente la función de pérdida, que es crucial tanto en el aprendizaje supervisado como en el no supervisado. A diferencia del Descenso Gradiente estándar, que utiliza todo el conjunto de datos para calcular el gradiente de la función de pérdida, el SGD utiliza un subconjunto aleatorio de datos en cada paso, lo que lo hace más rápido y eficiente, especialmente en grandes conjuntos de datos.

Cómo funciona el SGD

SGD actualiza los parámetros del modelo moviéndolos en la dirección opuesta al gradiente de la función de pérdida. Evalúa el gradiente utilizando sólo uno o unos pocos ejemplos de entrenamiento, proporcionando actualizaciones frecuentes y permitiendo una convergencia más rápida en escenarios de datos a gran escala. Esto hace que el SGD resulte atractivo para muchas aplicaciones de IA, incluidas las que utilizan Ultralytics YOLO para la detección y segmentación de objetos en tiempo real.

Características principales

  • Eficacia: Al considerar sólo un subconjunto de los datos, el SGD reduce la sobrecarga en comparación con los métodos de lote completo, como el Descenso Gradiente.

  • Convergencia: Aunque el SGD puede fluctuar más que el Descenso Gradiente por Lotes debido a su naturaleza estocástica, a menudo encuentra mejores soluciones al escapar de los mínimos locales.

  • Flexibilidad: El SGD es compatible con diversas funciones de pérdida y modelos, lo que aumenta su utilidad en numerosas tareas de aprendizaje automático.

Aplicaciones en el mundo real

Coches autónomos

El SGD forma parte integral del entrenamiento de modelos que detectan y clasifican objetos del entorno, como peatones y vehículos, garantizando una navegación segura. Explora cómo las aplicaciones de Vision AI mantienen la seguridad vial en los vehículos autónomos.

Diagnóstico sanitario

En imagen médica, el SGD ayuda a desarrollar modelos que pueden clasificar imágenes para ayudar en el diagnóstico, como la identificación de tumores en resonancias magnéticas. Descubre diversas aplicaciones de la IA de Visión en la Sanidad.

Conceptos relacionados

Descenso Gradiente

Aunque el Descenso Gradiente es el enfoque tradicional, es menos eficaz que el SGD en grandes conjuntos de datos debido a que hay que calcular el gradiente sobre todo el conjunto de datos en cada iteración.

Optimizador Adam

El Optimizador Adam se basa en el SGD utilizando ritmos de aprendizaje adaptativos, lo que lo convierte en una opción avanzada y a menudo preferible para modelos complejos.

Ventajas y retos

El SGD permite iteraciones rápidas y a menudo conduce a una convergencia inicial más rápida, lo que resulta ventajoso para los profesionales del aprendizaje profundo que requieren retroalimentación en tiempo real, como en el entrenamiento de los modelos Ultralytics YOLO . Sin embargo, la aleatoriedad puede dar lugar a actualizaciones ruidosas; técnicas como la programación de la tasa de aprendizaje y el impulso pueden mitigar estos problemas.

Conclusión

El Descenso Gradiente Estocástico sigue siendo una piedra angular del entrenamiento de modelos de IA debido a su sencillez y eficacia. Su aplicación abarca varias industrias y campos de investigación, lo que la convierte en una herramienta esencial para los profesionales que pretenden aprovechar el poder del aprendizaje automático y la tecnología de IA. Para saber más sobre la IA y sus repercusiones, visita Ultralytics para conocer cómo estas tecnologías transforman vidas.

Leer todo