과적합은 모델이 노이즈와 이상값을 포함하여 학습 데이터를 너무 잘 학습하는 머신 러닝에서 흔히 발생하는 문제입니다. 이로 인해 학습 데이터에서는 뛰어난 성능을 보이지만 유효성 검사 또는 테스트 세트와 같이 보이지 않는 데이터에서는 제대로 작동하지 않는 모델이 생성됩니다. 기본적으로 모델은 일반화에 실패하여 기본 패턴이 아닌 학습 데이터의 특정 세부 사항을 포착합니다.
과적합을 식별하려면 학습 데이터와 별도의 검증 데이터 모두에서 모델의 성능을 모니터링해야 합니다. 이 두 데이터 세트 간의 성능 차이가 크면 과적합 가능성이 있음을 나타냅니다. 몇 가지 기술을 통해 과적합을 방지할 수 있습니다:
과적합은 다양한 머신러닝(ML) 애플리케이션에서 중요한 문제로, 실제 시나리오에서 모델의 신뢰성과 정확도에 영향을 미칩니다. 예를 들어, 컴퓨터 비전(CV)에서 과적합 모델은 학습 이미지의 특정 물체를 인식하는 데는 잘 작동하지만 보이지 않는 새로운 이미지로 일반화하는 데는 실패할 수 있습니다.
의료 분야에서 과적합 모델은 학습 데이터 세트를 기반으로 질병을 정확하게 진단하지만 새로운 환자 데이터가 제시되면 실패할 수 있습니다. 예를 들어, 제한된 MRI 스캔 세트를 사용하여 뇌종양을 탐지하도록 훈련된 모델은 종양의 일반적인 특징이 아닌 해당 스캔의 특정 특징만을 학습할 수 있습니다. 이는 모델이 다른 환자나 영상 장비의 스캔을 접할 때 오진으로 이어질 수 있습니다. 의료 분야의 AI에 대해 자세히 알아보세요.
자율 주행 차량의 경우, 물체 감지 모델이 과도하게 장착된 경우 시뮬레이션이나 통제된 환경에서는 완벽하게 작동하지만 다양한 실제 주행 조건에서는 어려움을 겪을 수 있습니다. 예를 들어 화창한 날씨의 보행자 이미지로만 학습된 모델은 비나 눈이 내릴 때 보행자를 감지하지 못할 수 있습니다. 물체 감지에 대한 자세한 내용은 Ultralytics 웹사이트를 참조하세요.
과소적합은 과적합과 반대되는 개념입니다. 모델이 너무 단순하여 데이터의 기본 패턴을 포착하지 못해 학습 및 검증 세트 모두에서 성능이 저하될 때 발생합니다. 이는 종종 모델 복잡성이 충분하지 않거나 훈련이 부적절하기 때문에 발생합니다.
편향-분산 트레이드오프는 머신러닝의 기본 개념으로, 과적합과 과소적합과 관련이 있습니다. 편향이 높으면 과적합이 발생하고 분산이 높으면 과적합이 발생합니다. 잘 일반화되는 모델을 구축하려면 이 두 가지의 균형을 맞추는 것이 중요합니다.
여러 도구와 기술을 통해 과적합을 완화할 수 있습니다. Ultralytics YOLO 예를 들어, 고급 데이터 증강 및 정규화 방법 등 과적합을 방지하기 위한 다양한 기법이 모델에 통합되어 있습니다. 또한 Ultralytics HUB와 같은 플랫폼은 모델 성능을 모니터링하고 하이퍼파라미터를 조정하여 최적의 결과를 얻을 수 있는 도구를 제공합니다.
다음과 같은 프레임워크 TensorFlow 및 PyTorch 와 같은 프레임워크는 정규화 기법, 교차 검증 및 과적합을 방지하는 기타 방법을 구현하는 데 광범위한 지원을 제공합니다. 이러한 도구는 강력하고 신뢰할 수 있는 머신 러닝 모델을 구축하는 데 필요한 유연성을 제공합니다.