용어집

Epoch

Ultralytics YOLO 에서 머신 러닝의 획기적인 발전이 모델 학습에 미치는 영향, 과적합 방지, 성능 최적화에 대해 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

머신러닝 영역, 특히 신경망 학습에서 에포크는 전체 학습 데이터 세트의 완전한 통과를 표시하는 기본 개념입니다. 에포크를 이해하는 것은 시간이 지남에 따라 모델이 어떻게 학습하고 개선되는지 파악하는 데 매우 중요합니다. 에포크는 학습 과정의 기간을 결정하고 모델 성능에 큰 영향을 미치는 핵심적인 하이퍼파라미터입니다.

머신 러닝의 시대적 배경 이해

에포크는 전체 학습 데이터 세트에 대한 신경망 학습의 전체 주기를 나타냅니다. 한 에포크 동안 모델은 학습 데이터 세트의 각 데이터 포인트를 한 번씩 보게 됩니다. 예를 들어, 훈련 데이터 세트에 1,000개의 이미지가 포함되어 있는 경우, 하나의 에포크는 훈련 과정에서 모델이 1,000개의 이미지를 모두 한 번 처리한다는 의미입니다.

에포크는 모델이 데이터를 반복적으로 학습할 수 있도록 하기 때문에 필수적입니다. 각 에포크에서 모델은 이전 패스에서 발생한 오류를 기반으로 내부 파라미터(weights and biases)를 조정합니다. 이 조정 프로세스는 종종 아담 옵티마이저 또는 확률적 경사 하강(SGD)과 같은 최적화 알고리즘에 의해 주도되며, 모델이 손실 함수를 최소화하고 정확도를 점진적으로 개선하는 데 도움이 됩니다.

모델 훈련에서 에포크의 중요성

모델 훈련에 사용되는 에포크 수는 모델의 학습 곡선과 최종 성능에 직접적인 영향을 미치는 중요한 하이퍼파라미터입니다. 너무 적은 에포크로 학습하면 모델이 데이터의 기본 패턴을 학습하지 못하여 학습 및 검증 데이터 모두에서 성능이 저하되는 과적합이 발생할 수 있습니다. 반대로 너무 많은 에포크를 훈련하면 모델이 훈련 데이터에 너무 특화되어 보이지 않는 데이터에서 성능이 저하되어 효과적으로 일반화하지 못하는 과적합이 발생할 수 있습니다.

적절한 에포크 수를 찾으려면 훈련 중에 검증 세트에 대한 모델의 성능을 모니터링해야 하는 경우가 많습니다. K-Fold 교차 검증과 같은 기술은 다양한 데이터 하위 집합에서 모델 성능을 보다 강력하게 추정하여 최적의 에포크 수를 평가하는 데 도움이 될 수 있습니다. TensorBoard나 Weights & Biases 와 같은 도구는 훈련 진행 상황을 시각화하고 과적합 또는 과소적합을 방지하기 위해 훈련을 중단할 시점을 결정하는 데 매우 유용할 수 있습니다.

에포크, 반복 및 배치 크기

에포크를 반복 및 배치 크기와 같은 관련 용어와 구별하는 것이 중요합니다. 에포크는 전체 학습 데이터 세트에 대한 완전한 통과인 반면, 반복은 학습 예제 배치에 대한 한 번의 통과입니다. 배치 크기는 각 반복에서 처리되는 훈련 예제 수를 결정합니다.

예를 들어 1,000개의 이미지로 구성된 데이터 세트가 있고 배치 크기를 10으로 설정한 경우 각 에포크는 100회의 반복으로 구성됩니다(1,000개 이미지/배치당 10개 이미지 = 100회 반복). 각 반복에서 모델은 10개의 이미지를 처리하고 오류를 계산하며 모델 파라미터를 업데이트합니다. 100번의 반복이 끝나면 모델은 1,000개의 이미지를 모두 한 번 보고 하나의 에포크를 완료합니다.

이 관계를 이해하는 것은 효율적인 학습을 위해 매우 중요하며, 특히 메모리에 한 번에 담을 수 없는 대규모 데이터 세트를 다룰 때는 더욱 그렇습니다. 배치 크기와 에포크당 반복 횟수는 다음과 같은 트레이닝 프레임워크에서 구성 가능한 매개변수입니다. PyTorch( Ultralytics YOLO )와 같은 훈련 프레임워크에서 설정할 수 있는 매개변수입니다.

에포크의 실제 적용 사례

에포크는 모든 딥러닝 모델 학습의 기본이며, 다양한 영역에 걸쳐 적용됩니다. 다음은 몇 가지 예시입니다:

  1. Ultralytics YOLO 물체 감지: 객체 감지를 위해 모델을 훈련할 때 Ultralytics YOLOv8 모델을 훈련할 때는 데이터 세트에서 모델을 훈련할 에포크 수를 정의합니다. 예를 들어, 과일 감지를 위한 농업용 컴퓨터 비전과 같은 시나리오에서는 YOLO 모델을 100개의 에포크로 훈련할 수 있습니다. 즉, 이 모델은 과일 이미지의 전체 데이터 세트를 100회 반복하여 이미지에서 과일을 정확하게 식별하고 위치를 파악하는 방법을 학습하게 됩니다. Ultralytics HUB 플랫폼은 이 프로세스를 간소화하여 사용자가 훈련 중에 에포크를 쉽게 설정하고 관리할 수 있도록 합니다.

  2. 의료 이미지 분석: 의료 이미지 분석에서 에포크는 의료 스캔에서 질병이나 이상을 감지하는 모델을 훈련하는 데 필수적입니다. 예를 들어, 뇌종양 MRI 이미지에서 종양을 감지하는 모델을 훈련하려면 여러 개의 에포크를 설정해야 합니다. 각 에포크는 MRI 스캔의 전체 데이터 세트에서 종양을 나타내는 미묘한 패턴을 인식하는 모델의 능력을 개선하여 연속적인 에포크에 걸쳐 진단 정확도를 향상시킵니다.

결론적으로, 에포크는 딥러닝 훈련 프로세스의 초석입니다. 학습 데이터에 대한 완전한 학습 주기를 나타내며, 최적의 모델 성능을 달성하고 과적합 및 과소적합과 같은 일반적인 함정을 피하려면 에포크 수를 신중하게 관리하는 것이 필수적입니다. 실무자는 에포크를 이해함으로써 다양한 실제 애플리케이션에 맞게 AI 모델의 학습을 더 잘 제어하고 최적화할 수 있습니다.

모두 보기