용어집

데이터 증강

데이터 증강으로 머신러닝 모델을 강화하세요. 정확도를 높이고, 과적합을 줄이고, 견고성을 향상하는 기술을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

데이터 증강은 머신러닝에서 기존 데이터의 수정된 버전을 생성하여 학습 데이터 세트의 크기를 인위적으로 확장하는 데 사용되는 기술입니다. 이 과정에는 이미지 회전, 뒤집기, 크기 조정, 자르기 등 원본 데이터에 다양한 변형을 적용하는 것이 포함됩니다. 데이터 증강은 학습 데이터의 다양성을 높여 머신러닝 모델의 일반화 능력을 향상시킴으로써 과적합의 가능성을 낮추고 더 강력하게 만듭니다. 과적합은 모델이 노이즈와 이상값을 포함하여 학습 데이터를 너무 잘 학습할 때 발생하며, 이는 보이지 않는 새로운 데이터에 대한 성능 저하로 이어질 수 있습니다.

데이터 증강의 이점

데이터 증강은 몇 가지 주요 이점을 제공합니다. 첫째, 학습 중에 모델을 더 넓은 범위의 변형에 노출시켜 과적합을 줄이는 데 도움이 됩니다. 이렇게 하면 모델이 학습 데이터의 특정 특징에 덜 민감해지고 보이지 않는 새로운 데이터로 일반화할 수 있습니다. 둘째, 특히 원본 데이터 세트가 작거나 다양성이 부족한 경우 모델의 정확도와 성능을 향상시킬 수 있습니다. 데이터 증강은 더 많은 학습 예제를 생성함으로써 모델에 데이터의 기본 패턴을 학습할 수 있는 더 많은 기회를 제공합니다. 마지막으로, 모델의 견고성을 향상시켜 조명, 방향 또는 배경 소음의 변화와 같은 입력 데이터의 변화에 더 탄력적으로 대응할 수 있습니다.

일반적인 데이터 증강 기술

특히 컴퓨터 비전 작업에서 데이터 증강을 위해 몇 가지 일반적인 기술이 사용됩니다:

  • 기하학적 변형: 여기에는 회전, 이동, 크기 조정, 전단 및 뒤집기와 같은 작업이 포함됩니다. 예를 들어 이미지를 몇도 회전하거나 가로로 뒤집으면 새롭고 유효한 교육 예제를 만들 수 있습니다.
  • 색 공간 변환: 이미지의 밝기, 대비, 채도 또는 색조를 조정하면 다양한 조명 조건을 시뮬레이션하고 다양한 환경에서 일반화할 수 있는 모델의 능력을 향상시킬 수 있습니다.
  • 커널 필터: 필터를 적용하여 이미지를 선명하게 하거나 흐리게 하면 모델이 이러한 변화에 변하지 않는 특징을 학습하는 데 도움이 될 수 있습니다.
  • 무작위 지우기: 이미지의 일부를 무작위로 마스킹하면 모델이 오브젝트의 가려진 부분이나 누락된 부분에 대해 더욱 강력해질 수 있습니다.
  • 이미지 혼합: MixUp 및 CutMix와 같은 기술은 이미지와 해당 레이블을 혼합하여 새로운 학습 예제를 생성합니다. 예를 들어 MixUp은 이미지와 레이블을 선형적으로 보간합니다.

컴퓨터 비전의 데이터 증강

컴퓨터 비전에서 데이터 증강은 모델이 직면할 수 있는 다양한 실제 시나리오를 시뮬레이션할 수 있기 때문에 특히 유용합니다. 예를 들어, 객체 감지에서는 증강 이미지로 학습된 페이지 모델에서 Ultralytics YOLO YOLO 이 처음 언급되면 방향, 크기 또는 조명 조건에 관계없이 객체를 감지하는 방법을 학습할 수 있습니다. 이는 자율 주행 차량과 같이 다양하고 예측할 수 없는 조건에서 모델이 안정적으로 작동해야 하는 애플리케이션에 매우 중요합니다. 예를 들어, 보행자와 차량 이미지에 회전, 크기 조정, 노이즈 추가 등 다양한 변형을 적용하여 다양한 실제 시나리오에서 이러한 물체를 정확하게 감지하도록 자율 주행 시스템을 훈련할 수 있습니다. 마찬가지로 이미지 분류에서 다양한 색상 조정으로 이미지를 보강하면 모델이 다양한 조명 조건에 더 잘 일반화할 수 있습니다.

다른 도메인의 데이터 증강

데이터 증강은 컴퓨터 비전에서 널리 사용되지만 자연어 처리(NLP) 및 오디오 처리와 같은 다른 영역에도 적용할 수 있습니다. NLP에서는 동의어 대체, 역번역, 단어 임의 삽입/삭제와 같은 기술을 통해 텍스트 데이터를 증강할 수 있습니다. 오디오 처리에서는 배경 소음 추가, 피치 변경 또는 오디오 시간 늘리기를 통해 다양한 학습 예제를 만들 수 있습니다.

실제 애플리케이션

  • 헬스케어: 의료 이미지 분석에서는 데이터 증강을 사용하여 제한된 수의 의료 이미지로 모델을 훈련시킬 수 있습니다. 예를 들어, MRI 스캔에 회전, 뒤집기, 작은 변형을 적용하여 모델이 다양한 환자와 영상 조건에서 이상 징후를 더 정확하게 감지하는 방법을 학습할 수 있습니다.
  • 농업: 데이터 증강은 다양한 조건에서 촬영한 이미지에서 식물 질병이나 해충을 감지하도록 모델을 훈련시키는 데 도움이 될 수 있습니다. 다양한 조명, 각도, 줌 레벨로 농작물 이미지를 증강하면 모델이 현장에서 강력한 성능을 발휘하여 농부가 문제를 조기에 파악하고 시정 조치를 취할 수 있도록 도와줍니다.

데이터 증강과 다른 기술 비교

데이터 증강을 다른 관련 기술과 구별하는 것이 중요합니다:

  • 데이터 전처리: 데이터 증강과 데이터 전처리는 모두 모델 학습을 위해 데이터를 준비하지만, 전처리에는 일반적으로 정규화, 표준화, 결측값 처리와 같은 단계가 포함됩니다. 이러한 단계는 데이터가 모델에 적합한 형식인지 확인하는 데 필수적입니다. 반면 데이터 증강은 학습 데이터의 다양성을 높이는 데 중점을 둡니다.
  • 합성 데이터 생성: 합성 데이터는 생성적 적대 신경망(GAN)과 같은 생성 모델을 사용하여 완전히 새로운 데이터 포인트를 생성하는 것을 포함합니다. 이는 기존 데이터를 수정하는 데이터 증강과는 다릅니다. 합성 데이터는 의료 또는 금융 분야와 같이 실제 데이터가 부족하거나 민감한 경우 특히 유용할 수 있습니다.

도구 및 라이브러리

여러 도구와 라이브러리가 데이터 증강을 지원합니다. Python 에서 OpenCV와 같은 라이브러리와 TensorFlow 와 같은 라이브러리는 이미지 변환을 위한 다양한 기능을 제공합니다. 또한 Albumentations와 같은 전문 라이브러리는 고도로 최적화되고 다양한 증강 파이프라인을 제공합니다. Ultralytics 또한 HUB는 데이터 증강을 위한 도구를 제공하여 이러한 기술을 모델 훈련 프로세스에 쉽게 통합할 수 있도록 지원합니다. 모델 학습을 향상시키기 위한 MixUp, Mosaic, Random Perspective와 같은 데이터 증강 기법을 살펴보세요.

모두 보기