용어집

라벨 스무딩

라벨 평활화가 과적합을 줄이고 일반화를 강화하며 예측 신뢰도를 높여 머신 러닝 모델을 개선하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

라벨 평활화는 머신러닝 모델 훈련, 특히 분류 작업에서 일반적으로 사용되는 정규화 기법입니다. 여기에는 실측값 레이블을 수정하여 신뢰도를 낮추고 레이블의 원핫 인코딩을 스무딩 버전으로 대체하는 것이 포함됩니다. 이 조정은 모델의 예측에 대한 과신도를 줄이고 일반화를 개선하며 과적합을 완화합니다.

라벨 평활화 작동 방식

일반적인 분류 문제에서 원핫 인코딩은 올바른 클래스에 1의 확률을, 다른 모든 클래스에 0의 확률을 할당합니다. 라벨 평활화는 올바른 클래스의 신뢰도 일부를 모든 클래스에 재분배하여 이러한 확률을 조정합니다. 예를 들어 라벨을 다음과 같이 표현하는 대신 [1, 0, 0]레이블 평활화는 다음과 같이 표현할 수 있습니다. [0.9, 0.05, 0.05] 를 0.1의 평활화 계수로 설정합니다.

실측값을 부드럽게 함으로써 모델은 예측에 대한 지나친 확신을 피할 수 있습니다. 이는 특히 데이터에 노이즈가 포함되어 있거나 분류하기 어려운 시나리오에서 모델을 더욱 강력하게 만듭니다.

라벨 스무딩의 이점

  1. 일반화 개선: 라벨 평활화는 예측에 대한 과도한 신뢰를 줄임으로써 모델이 보이지 않는 데이터에 대해 더 잘 일반화할 수 있도록 도와줍니다.
  2. 과적합 완화: 정규화 역할을 하여 모델이 학습 레이블의 노이즈에 덜 민감하게 반응하도록 합니다.
  3. 향상된 보정: 라벨 평활화로 훈련된 모델은 종종 실제 정확도에 더 가까운 더 나은 보정된 확률을 생성합니다.

라벨 평활화의 적용

이미지 분류

라벨 평활화는 모델 보정과 성능을 개선하기 위해 이미지 분류 작업에서 널리 사용됩니다. 예를 들어 이미지 분류를 위해 이미지넷 데이터 세트에서 학습된 모델과 같은 모델은 더 나은 일반화를 달성하고 과적합을 줄이기 위해 라벨 평활화를 사용하는 경우가 많습니다.

자연어 처리(NLP)

NLP에서 레이블 평활화는 기계 번역과 같은 시퀀스 간 작업에서 사용됩니다. BERT(양방향 인코더 변환기 표현 ) 및 변환기 기반 모델과 같은 대규모 언어 모델은 안정적인 학습을 보장하고 예측에 대한 과도한 신뢰를 피하기 위해 훈련 중에 레이블 평활화의 이점을 누릴 수 있습니다.

실제 사례

  1. 자율 주행 자동차: 자율 주행 차량 시스템에서 라벨 평활화는 이미지 분류 및 물체 감지 작업을 위해 학습된 모델에 적용됩니다. 예를 들어, 고급 객체 감지를 위한 COCO와 같은 데이터 세트는 이 기술을 통해 자율 주행 시스템의 객체 감지에 널리 사용되는 Ultralytics YOLO 과 같은 모델의 견고성을 향상시키는 데 도움이 됩니다.

  2. 의료 진단: 뇌종양 감지 데이터 세트를 사용한 종양 감지와 같은 의료 영상 애플리케이션에서 라벨 평활화는 예측의 신뢰성을 향상시킵니다. 이는 모델이 잘못된 분류를 지나치게 확신할 위험을 줄여주며, 이는 의료와 같이 중요한 영역에서 매우 중요합니다.

라벨 평활화 대 관련 개념

  • 과적합: 라벨 평활화는 모델이 학습 데이터에 대해 지나치게 확신하지 못하도록 하여 과적합을 직접적으로 방지합니다. 과적합 용어집 페이지에서 모델에서 과적합을 감지하고 방지하는 방법에 대해 자세히 알아보세요.
  • 정규화: 라벨 평활화는 정규화의 한 형태이지만, L2 정규화나 드롭아웃과 같은 기법과는 다릅니다. 이러한 방법은 가중치에 불이익을 주거나 특정 뉴런에 대한 의존도를 낮추는 데 중점을 두는 반면, 라벨 평활화는 대상 라벨 자체를 수정합니다. 정규화에 대해 자세히 알아보려면 정규화 용어집 페이지를 참조하세요.
  • 교차 엔트로피 손실: 라벨 평활화는 손실 함수 계산에 평활화 계수를 도입하여 기존의 교차 엔트로피 손실을 수정합니다. 손실 함수에 대해 자세히 알아보려면 손실 함수 용어집 페이지를 참조하세요.

Ultralytics HUB로 라벨 평활화 구현하기

Ultralytics HUB는 라벨 평활화를 통해 분류 모델을 훈련하기 위한 원활한 통합을 제공합니다. 이미지 분류를 위해 CIFAR-10과 같은 데이터 세트로 작업하든 사용자 지정 데이터 세트로 작업하든, Ultralytics HUB는 라벨 평활화 인자를 포함한 하이퍼파라미터 설정 프로세스를 간소화하여 모델의 성능을 최적화합니다.

결론

라벨 평활화는 머신러닝 모델의 견고성과 신뢰성을 향상시키는 간단하면서도 강력한 기술입니다. 대상 레이블을 부드럽게 함으로써 모델이 더 잘 일반화하고, 과적합을 피하며, 잘 보정된 예측을 생성하도록 도와줍니다. 이미지 분류, NLP, 객체 감지 등 어떤 작업을 하든 라벨 평활화는 머신 러닝 툴킷에서 유용한 도구입니다. 관련 기술 및 애플리케이션에 대한 더 많은 인사이트는 AI 및 컴퓨터 비전 용어집( Ultralytics )을 참조하세요.

모두 보기