용어집

일괄 정규화

일괄 정규화로 딥러닝 성능을 향상하세요! 이 기법으로 AI 모델의 학습 속도, 안정성, 정확도를 향상시키는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

일괄 정규화는 딥러닝에서 인공 신경망에 추가 레이어를 추가하여 인공 신경망을 더 빠르고 안정적으로 만드는 데 사용되는 기술입니다. 새로운 레이어는 이전 레이어에서 들어오는 입력에 대해 표준화 및 정규화 작업을 수행합니다. 특히 물체 감지나 이미지 분류와 같은 복잡한 작업에서 딥러닝 모델의 성능과 안정성을 향상시키는 데 도움이 되는 방법입니다. 일괄 정규화는 일반적으로 완전히 연결된 레이어 또는 컨볼루션 레이어와 활성화 함수 사이에 사용됩니다. 이 기법은 2015년 세르게이 이오프와 크리스티안 세게디( Google ) 연구원의 논문에서 소개되었습니다.

배치 정규화 작동 방식

일괄 정규화는 이전 계층의 활성화를 정규화하는 방식으로 작동합니다. 즉, 다음 레이어에 대한 입력은 평균이 0이고 표준편차가 1이 됩니다. 이 정규화 과정은 훈련 중 네트워크 파라미터의 변화로 인한 네트워크 활성화 분포의 변화인 내부 공변량 이동을 줄이는 데 도움이 됩니다. 일괄 정규화는 레이어 입력의 분포를 안정화함으로써 더 빠르고 안정적인 학습을 가능하게 합니다.

실제로 배치 정규화는 훈련 중 미니 배치 내에서 활성화의 평균과 표준 편차를 계산하여 이루어집니다. 그런 다음 이러한 통계를 사용하여 활성화를 정규화하는 데 사용합니다. 또한 각 활성화에 대해 두 개의 학습 가능한 파라미터인 감마(γ)와 베타(β)가 도입됩니다. 이러한 매개변수를 통해 네트워크는 정규화된 활성화의 크기를 조정하고 이동하여 네트워크가 최적의 표현을 학습할 수 있는 유연성을 제공합니다.

일괄 정규화의 이점

일괄 정규화는 딥 러닝에서 널리 사용되는 데 기여하는 몇 가지 이점을 제공합니다:

  • 더 빠른 훈련: 일괄 정규화는 각 레이어에 대한 입력을 정규화함으로써 학습 과정의 속도를 높일 수 있습니다. 그래디언트가 폭발하거나 사라질 위험 없이 더 높은 학습 속도를 사용할 수 있기 때문입니다.
  • 향상된 그래디언트 흐름: 일괄 정규화는 네트워크를 통한 그래디언트의 흐름을 개선하여 더 깊은 네트워크를 학습하는 데 도움이 됩니다.
  • 초기화에 대한 의존성 감소: 딥 네트워크는 매개변수의 초기화에 민감할 수 있습니다. 일괄 정규화는 이러한 민감도를 줄여 학습이 초기 조건에 덜 의존하도록 합니다.
  • 정규화 효과: 일괄 정규화는 네트워크에 약간의 노이즈를 추가하여 과적합을 줄이고 보이지 않는 데이터에 대한 일반화를 개선하는 정규화 효과를 가져올 수 있습니다.
  • 더 높은 학습률: 일괄 정규화를 사용하면 학습의 불안정성을 유발하지 않고 더 높은 학습 속도를 사용할 수 있습니다. 이를 통해 학습 프로세스를 더욱 가속화할 수 있습니다.

일괄 정규화 적용

컴퓨터 비전

컴퓨터 비전에서 일괄 정규화는 성능과 학습 안정성을 개선하기 위해 CNN(Convolutional Neural Network) 에서 자주 사용됩니다. 예를 들어 Ultralytics YOLO 과 같은 모델에서는 배치 정규화가 아키텍처에 통합되어 실시간 객체 감지 작업의 정확도와 속도를 향상시킵니다. 이는 학습 프로세스를 안정화하여 더 나은 융합과 감지 정확도 향상으로 이어집니다.

자연어 처리(NLP)

자연어 처리(NLP)에서 일괄 정규화는 트랜스포머와 같은 심층 아키텍처를 갖춘 모델에 적용할 수 있습니다. 특히 대규모 데이터 세트를 다룰 때 학습 프로세스를 안정화하는 데 도움이 됩니다. 예를 들어, 기계 번역이나 감정 분석에서 배치 정규화는 여러 계층에 걸쳐 일관된 학습을 보장하여 모델의 전반적인 성능에 기여합니다.

실제 사례

의료 이미지 분석

MRI나 CT 스캔의 종양 검출과 같은 의료 이미지 분석에서 일괄 정규화는 딥러닝 모델을 안정화시키는 데 도움이 됩니다. 그 결과 이상 징후를 더 안정적으로 감지하고 학습 시간을 단축할 수 있어 정확하고 시기 적절한 진단을 내리는 데 매우 중요합니다.

자율 주행 차량

배치 정규화는 자율 주행 차량의 인식 시스템에서 중요한 역할을 합니다. 예를 들어, 자율주행 차량 시스템에서는 교통 표지판, 보행자 및 기타 차량을 인식하는 컴퓨터 비전 모델의 성능을 향상시킵니다. 일괄 정규화는 모델의 안정성과 정확성을 개선함으로써 보다 안전하고 신뢰할 수 있는 자율 주행 시스템을 만드는 데 기여합니다.

관련 개념

드롭아웃 대 배치 정규화

드롭아웃 레이어와 배치 정규화는 모두 딥러닝 모델의 성능을 개선하는 데 사용되는 기술이지만 작동 방식은 다릅니다. 드롭아웃은 각 훈련 반복 중에 뉴런의 일부를 무작위로 비활성화하여 과적합을 방지하는 데 도움이 됩니다. 반면 일괄 정규화는 이전 레이어의 활성화를 정규화하여 학습을 안정화하고 속도를 높이는 데 도움이 됩니다. 이러한 기술을 함께 사용하면 모델 성능과 견고성을 더욱 향상시킬 수 있습니다.

일반 정규화

일괄 정규화는 딥 러닝에서 사용되는 정규화의 한 형태입니다. 다른 유형으로는 인스턴스 정규화 및 레이어 정규화가 있습니다. 인스턴스 정규화는 각 샘플의 활성화를 독립적으로 정규화하므로 스타일 전송 작업에 유용합니다. 레이어 정규화는 기능 전체의 활성화를 정규화하므로 반복 신경망에 유용합니다. 이러한 정규화 방법 간의 차이점을 이해하면 특정 작업과 아키텍처에 적합한 기법을 선택하는 데 도움이 될 수 있습니다.

Ultralytics 허브와 통합

배치 정규화는 다음과 같은 최신 AI 프레임워크에 원활하게 통합됩니다. PyTorch와 같은 최신 AI 프레임워크에 원활하게 통합되어 Ultralytics HUB와 같은 도구를 구동합니다. 이러한 통합은 물체 감지부터 이미지 분할에 이르기까지 다양한 작업에 최적화된 모델을 훈련하고 배포하는 프로세스를 간소화합니다. 이러한 프레임워크에서 일괄 정규화를 사용하면 모델을 효율적으로 학습하고 다양한 애플리케이션에서 높은 성능을 달성할 수 있습니다.

모두 보기