용어집

정규화

머신 러닝에서 정규화의 힘을 알아보세요! 모델 학습을 개선하고 성능을 향상시키며 강력한 AI 솔루션을 보장하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

정규화는 머신 러닝과 데이터 과학에서 데이터를 표준 범위(일반적으로 0과 1 또는 -1과 1 사이)로 재조정하는 데 사용되는 중요한 전처리 기술입니다. 이 프로세스는 모든 특징이 모델 학습에 동등하게 기여하도록 하여 값이 큰 특징이 작은 특징을 지배하지 못하도록 하는 것을 목표로 합니다. 정규화는 서로 다른 특징을 비슷한 규모로 가져옴으로써 알고리즘, 특히 딥러닝에 사용되는 경사 하강 기반 방법과 같이 특징 확장에 민감한 알고리즘이 더 빠르고 효율적으로 수렴하는 데 도움이 됩니다.

정규화가 중요한 이유

데이터 집합에서 특징은 종종 다양한 범위를 갖습니다. 예를 들어, 주택 가격을 예측하는 데이터 집합에서 주택의 크기는 500~5000평방피트인 반면 침실 수는 1~5개에 불과할 수 있습니다. 정규화가 없으면 머신 러닝 모델은 범위가 큰 특징에 과도한 중요성을 부여할 수 있습니다. 정규화는 이 문제를 해결하여 학습 중에 모든 피처가 균일하게 처리되도록 합니다. 이는 특히 Ultralytics YOLO 모델에 사용되는 신경망과 같은 알고리즘의 경우 더욱 안정적이고 강력한 모델, 향상된 성능, 빠른 훈련 시간으로 이어집니다.

정규화 유형

일반적으로 몇 가지 정규화 기법이 사용됩니다:

  • 최소-최대 스케일링: 가장 일반적인 기법 중 하나입니다. 각 특징을 [0, 1] 범위가 되도록 개별적으로 스케일링하고 변환합니다. 최소-최대 스케일링에 대한 자세한 내용은 인기 있는 머신 러닝 라이브러리인 Scikit-learn 웹사이트( Python)에서 확인할 수 있습니다.
  • Z점수 표준화: 기술적으로는 표준화이지만, 정규화와 혼용해서 사용하는 경우가 많습니다. Z점수 표준화는 데이터를 평균 0, 표준 편차 1로 변환합니다. 이 방법은 최소-최대 스케일링에 비해 이상값에 덜 민감합니다.
  • 최대 복근 스케일링: 이 방법은 각 피처의 최대 절대값을 기준으로 배율을 조정합니다. 희소 데이터에 특히 유용하며 값이 [-1, 1] 범위 내에 유지되도록 합니다.

적절한 정규화 기법을 선택하는 것은 데이터 세트와 사용 중인 머신 러닝 모델에 따라 다릅니다. 객체 감지를 위한 모델 훈련( Ultralytics YOLO )을 비롯한 많은 딥 러닝 애플리케이션에서 정규화는 표준 전처리 단계입니다.

정규화 적용

정규화는 AI와 ML의 다양한 영역에 널리 적용됩니다. 다음은 몇 가지 예시입니다:

요약하자면, 정규화는 머신러닝을 위한 데이터 준비의 기본 단계입니다. 정규화는 모든 기능의 공정한 기여를 보장하고, 학습을 가속화하며, Ultralytics YOLO 을 비롯한 다양한 애플리케이션에서 AI 모델의 안정성과 성능을 개선합니다.

모두 보기