용어집

확률적 그라디언트 하강(SGD)

확률적 경사 하강이 어떻게 머신러닝 모델을 최적화하여 대규모 데이터 세트와 딥러닝 작업을 효율적으로 학습할 수 있는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

확률적 경사 하강(SGD)은 머신 러닝과 딥 러닝에서 널리 사용되는 최적화 알고리즘입니다. 이는 경사 하강의 변형으로, 특히 대규모 데이터 세트를 다룰 때 모델을 효율적으로 훈련하도록 설계되었습니다. SGD는 모델 파라미터를 반복적으로 업데이트하여 손실 함수를 최소화하고 최적의 성능을 내는 파라미터 세트로 모델을 안내하는 방식으로 작동합니다. 전체 데이터 세트에서 기울기를 계산하는 기존의 기울기 하강과 달리, SGD는 무작위로 선택된 단일 데이터 포인트 또는 작은 데이터 배치에서 기울기를 추정합니다. 이 접근 방식은 특히 대규모 머신 러닝 작업에서 계산 속도를 높이고 메모리 효율을 높입니다.

머신 러닝의 관련성

확률적 경사 하강은 많은 머신 러닝 모델, 특히 모델에 수백만 개 또는 수십억 개의 매개변수가 있는 딥 러닝 분야의 모델을 훈련하는 데 기본이 됩니다. 대규모 데이터 세트를 효율적으로 처리할 수 있어 이미지 분류, 객체 감지, 자연어 처리 등 다양한 애플리케이션에 사용되는 복잡한 신경망을 훈련하는 데 이상적입니다. 다음과 같은 프레임워크 PyTorch 와 TensorFlow 와 같은 프레임워크는 SGD와 그 변형을 널리 구현하여 최신 AI 개발의 초석이 되고 있습니다. Ultralytics YOLO예를 들어 , 는 실시간 객체 감지에서 최첨단 성능을 달성하기 위해 SGD를 포함한 최적화 알고리즘을 활용합니다.

주요 개념 및 변형

SGD의 기본 원칙은 일관되게 유지되지만, 성능을 향상하고 한계를 해결하기 위해 여러 가지 변형이 개발되었습니다. 주요 개념과 인기 있는 변형은 다음과 같습니다:

  • 그라데이션 하강: 전체 데이터 세트를 사용하여 그라디언트를 계산하는 SGD가 파생되는 기본 최적화 알고리즘입니다.
  • 미니 배치 그라데이션 하강: SGD와 기존 그라데이션 하강을 절충한 것으로, 소량의 데이터를 사용하여 그라데이션을 계산하므로 계산 효율성과 그라데이션 정확도 사이의 균형을 제공합니다.
  • 아담 옵티마이저: 각 매개변수에 대한 모멘텀과 적응형 학습 속도를 통합하여 SGD를 기반으로 구축되는 적응형 최적화 알고리즘으로, 종종 더 빠른 수렴과 더 나은 성능으로 이어집니다.

관련 개념과의 차이점

SGD는 다른 최적화 기법 및 머신 러닝 개념과 밀접한 관련이 있지만, 그와는 별개의 개념입니다:

  • 최적화 알고리즘: SGD는 최적화 알고리즘이지만, 더 넓은 범주에는 손실 함수를 최소화하기 위해 다양한 접근 방식을 사용할 수 있는 아담 옵티마이저최적화 알고리즘과 같은 다른 방법도 포함됩니다. SGD는 무작위 데이터 포인트 또는 배치를 사용하는 확률적 특성이 특징입니다.
  • 배치 크기: SGD의 성능은 배치 크기에 영향을 받을 수 있습니다. 배치 크기 1(실제 SGD)을 사용하면 그라데이션 업데이트에 더 많은 노이즈가 발생할 수 있으며, 더 큰 미니 배치는 더 안정적이지만 잠재적으로 업데이트 효율이 떨어질 수 있습니다.
  • 학습 속도: 다른 그라데이션 기반 최적화 알고리즘과 마찬가지로 SGD의 효과는 파라미터 업데이트 중 단계 크기를 제어하는 학습 속도에 민감합니다. 성공적인 모델 학습을 위해서는 학습 속도를 신중하게 조정하는 것이 중요합니다.

실제 애플리케이션

SGD의 효율성과 다재다능함으로 인해 다양한 실제 시나리오에 적용할 수 있습니다:

예시 1: 의료 이미지 분석

의료 이미지 분석에서 SGD는 엑스레이, MRI, CT 스캔과 같은 의료 이미지에서 질병을 감지할 수 있는 딥러닝 모델을 훈련하는 데 매우 중요합니다. 예를 들어, SGD로 훈련된 컨볼루션 신경망(CNN) 은 종양이나 기타 이상을 나타내는 미묘한 패턴을 식별하는 방법을 학습하여 더 빠르고 정확한 진단을 내리는 데 도움을 줄 수 있습니다. 이는 시기적절하고 정확한 탐지가 환자 치료 결과를 크게 개선할 수 있는 의료 분야의 AI와 같은 애플리케이션에서 매우 중요합니다.

예 2: 자율 주행

자율 주행 자동차는 주변 환경을 인식하기 위해 물체 감지 모델에 크게 의존합니다. SGD는 보행자, 차량, 교통 표지판 및 기타 물체를 실시간으로 정확하게 식별하도록 이러한 모델을 훈련하는 데 중요한 역할을 합니다. Ultralytics YOLOSGD를 사용하여 훈련할 수 있는 자율주행 시스템은 물체 감지 작업의 속도와 정확성 때문에 자율주행 시스템에 자주 사용되어 보다 안전하고 효율적인 내비게이션을 가능하게 합니다. 자율주행차의 AI가 실시간 인식을 위해 이러한 기술을 활용하는 방법에 대해 자세히 알아보세요.

스토캐스틱 그라데이션 하강은 작은 데이터 하위 집합을 기반으로 모델 파라미터를 효율적으로 업데이트함으로써 다양한 AI 애플리케이션을 위한 복잡하고 효과적인 머신러닝 모델 학습을 가능하게 하는 초석 알고리즘으로 남아 있습니다.

모두 보기