라벨 평활화는 머신러닝 모델 훈련, 특히 분류 작업에서 일반적으로 사용되는 정규화 기법입니다. 여기에는 실측값 레이블을 수정하여 신뢰도를 낮추고 레이블의 원핫 인코딩을 스무딩 버전으로 대체하는 것이 포함됩니다. 이 조정은 모델의 예측에 대한 과신도를 줄이고 일반화를 개선하며 과적합을 완화합니다.
일반적인 분류 문제에서 원핫 인코딩은 올바른 클래스에 1의 확률을, 다른 모든 클래스에 0의 확률을 할당합니다. 라벨 평활화는 올바른 클래스의 신뢰도 일부를 모든 클래스에 재분배하여 이러한 확률을 조정합니다. 예를 들어 라벨을 다음과 같이 표현하는 대신 [1, 0, 0]
레이블 평활화는 다음과 같이 표현할 수 있습니다. [0.9, 0.05, 0.05]
를 0.1의 평활화 계수로 설정합니다.
실측값을 부드럽게 함으로써 모델은 예측에 대한 지나친 확신을 피할 수 있습니다. 이는 특히 데이터에 노이즈가 포함되어 있거나 분류하기 어려운 시나리오에서 모델을 더욱 강력하게 만듭니다.
라벨 평활화는 모델 보정과 성능을 개선하기 위해 이미지 분류 작업에서 널리 사용됩니다. 예를 들어 이미지 분류를 위해 이미지넷 데이터 세트에서 학습된 모델과 같은 모델은 더 나은 일반화를 달성하고 과적합을 줄이기 위해 라벨 평활화를 사용하는 경우가 많습니다.
NLP에서 레이블 평활화는 기계 번역과 같은 시퀀스 간 작업에서 사용됩니다. BERT(양방향 인코더 변환기 표현 ) 및 변환기 기반 모델과 같은 대규모 언어 모델은 안정적인 학습을 보장하고 예측에 대한 과도한 신뢰를 피하기 위해 훈련 중에 레이블 평활화의 이점을 누릴 수 있습니다.
자율 주행 자동차: 자율 주행 차량 시스템에서 라벨 평활화는 이미지 분류 및 물체 감지 작업을 위해 학습된 모델에 적용됩니다. 예를 들어, 고급 객체 감지를 위한 COCO와 같은 데이터 세트는 이 기술을 통해 자율 주행 시스템의 객체 감지에 널리 사용되는 Ultralytics YOLO 과 같은 모델의 견고성을 향상시키는 데 도움이 됩니다.
의료 진단: 뇌종양 감지 데이터 세트를 사용한 종양 감지와 같은 의료 영상 애플리케이션에서 라벨 평활화는 예측의 신뢰성을 향상시킵니다. 이는 모델이 잘못된 분류를 지나치게 확신할 위험을 줄여주며, 이는 의료와 같이 중요한 영역에서 매우 중요합니다.
Ultralytics HUB는 라벨 평활화를 통해 분류 모델을 훈련하기 위한 원활한 통합을 제공합니다. 이미지 분류를 위해 CIFAR-10과 같은 데이터 세트로 작업하든 사용자 지정 데이터 세트로 작업하든, Ultralytics HUB는 라벨 평활화 인자를 포함한 하이퍼파라미터 설정 프로세스를 간소화하여 모델의 성능을 최적화합니다.
라벨 평활화는 머신러닝 모델의 견고성과 신뢰성을 향상시키는 간단하면서도 강력한 기술입니다. 대상 레이블을 부드럽게 함으로써 모델이 더 잘 일반화하고, 과적합을 피하며, 잘 보정된 예측을 생성하도록 도와줍니다. 이미지 분류, NLP, 객체 감지 등 어떤 작업을 하든 라벨 평활화는 머신 러닝 툴킷에서 유용한 도구입니다. 관련 기술 및 애플리케이션에 대한 더 많은 인사이트는 AI 및 컴퓨터 비전 용어집( Ultralytics )을 참조하세요.