Yolo 비전 선전
선전
지금 참여하기
용어집

데이터 증강

데이터 증강이 모델의 강건성을 향상시키고 과적합을 줄이는 방식을 살펴보세요. 컴퓨터 비전을 위한 Ultralytics 성능을 향상시키는 핵심 기법을 알아보세요.

데이터 증강은 기존 데이터의 변형 버전을 생성하여 훈련 데이터 세트의 규모와 다양성을 인위적으로 증가시키는 머신러닝 및 컴퓨터 비전 분야의 핵심 기법입니다. 시간과 비용이 많이 드는 완전히 새로운 데이터 수집 및 라벨링 대신, 증강은 원본 샘플에 다양한 변환을 적용합니다. 이러한 변형은 머신러닝 모델이 패턴을 보다 견고하게 인식하도록 학습시켜 실제 환경에서 변형이 발생해도 우수한 성능을 발휘하도록 보장합니다. 훈련 과정에서 모델을 더 광범위한 시나리오에 노출시킴으로써 개발자는 과적합을 효과적으로 줄이고 일반화 능력을 향상시킬 수 있습니다.

현대 인공지능에서의 관련성

컴퓨터 비전 분야에서 모델은 종종 훈련 데이터와 미묘하게 다른 이미지를 접했을 때 어려움을 겪습니다. 조명, 방향 또는 배경 잡음의 변동은 충분한 다양성을 접하지 못한 모델을 혼란스럽게 할 수 있습니다. 데이터 증강은 이러한 변동을 프로그램적으로 시뮬레이션함으로써 이 문제를 해결합니다. 예를 들어, 고양이 이미지를 회전하거나 뒤집거나 약간 흐리게 처리하여 이러한 변화에도 불구하고 대상이 여전히 "고양이"임을 모델에 가르칠 수 있습니다.

이 과정은 풍부하고 다양한 데이터셋에 의존하여 객체 탐지이미지 분할과 같은 작업에서 높은 정확도를 달성하는 Ultralytics 같은 현대적 아키텍처의 성공에 필수적입니다. 새로운 훈련 예제를 합성함으로써, 증강은 모델이 불변 특징—입력 변경에도 불구하고 변하지 않는 특성—을 학습할 수 있게 합니다.

일반적인 기법과 방법

데이터 증강은 단순한 기하학적 조정부터 복잡한 생성적 접근법까지 다양한 변환 기법을 포괄합니다:

  • 기하학적 변환: 여기에는 회전, 크기 조정, 뒤집기, 자르기, 이미지 이동(변위)과 같은 연산이 포함됩니다. 이는 카메라 시점이나 물체 위치의 변화를 나타냅니다.
  • 색 공간 조정: 밝기, 대비, 채도 및 색조를 수정하면 모델이 다양한 조명 조건이나 카메라 센서를 처리하는 데 도움이 됩니다.
  • 노이즈 주입: 가우시안 노이즈와 같은 무작위 노이즈를 추가하면 모델이 입자감이 있거나 저품질 입력 데이터에 대해 더 탄력적으로 대응할 수 있습니다.
  • 이미지 혼합: MixUp 모자이크( YOLO 널리 YOLO ) MixUp 같은 기법은 여러 이미지를 하나의 훈련 샘플로 결합하여 모델이 컨텍스트와 객체 간의 관계를 보다 효과적으로 학습하도록 강제합니다.
  • 생성적 접근법: 고급 기법은 생성형 AI 또는 확산 모델을 활용하여 원본 데이터셋의 특성을 모방하는 완전히 새로운 합성 훈련 샘플을 생성합니다.

실제 애플리케이션

데이터 증강 기술의 실질적 영향은 데이터 부족이나 높은 변동성이 문제인 수많은 산업 분야에 걸쳐 있습니다.

자율 주행

자율주행차 개발 과정에서 모든 기상 조건이나 조명 시나리오에 대한 데이터를 수집하는 것은 거의 불가능합니다. 엔지니어들은 데이터 증강 기술을 활용해 맑은 날씨 사진에 비, 안개, 눈 또는 눈부심을 시뮬레이션합니다. 이를 통해 인식 시스템이 환경 요인과 무관하게 detect , 교통 표지판 및 다른 차량을 안정적으로 detect 수 있도록 하여 안전성과 신뢰성을 높입니다.

의료 영상

의료 영상 분석은 개인정보 보호 문제와 특정 질환의 희귀성으로 인해 종종 제한된 데이터셋으로 어려움을 겪습니다. 증강 기법은 탄성 변형, 회전 또는 강도 이동을 적용하여 X선이나 MRI 스캔의 소규모 데이터셋을 확장할 수 있게 합니다. 이는 환자 위치나 스캔 품질이 달라져도 높은 민감도로 종양이나 골절을 식별할 수 있는 견고한 진단 모델을 훈련하는 데 도움이 됩니다.

관련 개념 구분하기

데이터 증강과 합성 데이터를 구분하는 것이 중요합니다. 둘 다 데이터셋 규모를 늘리는 것을 목표로 하지만, 합성 데이터는 (종종 3D 렌더링이나 시뮬레이션 엔진을 사용하여) 처음부터 인위적으로 생성되는 반면, 데이터 증강은 기존 실제 데이터를 수정합니다. 또한 데이터 전처리 ( Data Preprocessing )는 모델에 적합하도록 데이터를 정리하고 형식을 조정하는 과정(예: 크기 조정, 정규화)을 포함하지만, 증강과 달리 반드시 훈련 샘플의 수를 증가시키지는 않습니다.

Ultralytics 통한 증강 구현

현대적인 프레임워크는 증강을 훈련 파이프라인에 직접 통합합니다. 아래 예시는 YOLO26 모델 훈련 중 뒤집기 및 크기 조정과 같은 증강을 적용하는 방법을 보여줍니다. ultralytics 패키지입니다.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train with custom data augmentation hyperparameters
# fliplr: 50% chance of horizontal flip, scale: image scaling gain
results = model.train(data="coco8.yaml", epochs=10, fliplr=0.5, scale=0.5)

이러한 하이퍼파라미터를 조정함으로써 개발자는 데이터셋과 애플리케이션의 특정 요구사항에 맞춰 증강 전략을 맞춤화할 수 있으며, 효율적인 모델 개발을 위해 Ultralytics 플랫폼의 유연성을 활용할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기