일괄 정규화는 딥러닝에서 각 계층의 입력을 정규화하여 신경망의 학습을 개선하는 데 사용되는 기법입니다. 이는 내부 공변량 이동과 같은 문제를 해결하고 학습을 가속화하며 과적합을 줄이는 데 도움이 됩니다. 배치 정규화는 중간 출력을 정규화함으로써 여러 계층의 데이터가 안정적인 분포를 유지하도록 하여 네트워크가 보다 효과적으로 학습할 수 있도록 합니다.
학습 중에 배치 정규화는 배치 평균을 빼고 배치 표준 편차로 나누어 레이어에 대한 입력을 표준화합니다. 그런 다음 학습 가능한 파라미터인 감마(스케일)와 베타(시프트)를 사용하여 정규화된 값의 스케일과 시프트를 조정합니다. 이러한 매개변수를 통해 네트워크는 복잡한 패턴을 모델링할 수 있는 역량을 유지할 수 있습니다.
일괄 정규화는 일반적으로 선형 변환(weights and biases)과 레이어의 활성화 함수 사이에 적용됩니다. 이 위치 지정은 활성화가 다음 레이어로 전달되기 전에 정규화되도록 하여 학습을 안정화합니다.
배치 정규화는 이미지 분류 및 객체 감지와 같은 컴퓨터 비전 작업에서 널리 사용됩니다. 예를 들어 컨볼루션 신경망(CNN) 과 같은 모델은 성능과 안정성을 향상시키기 위해 일괄 정규화 레이어를 통합하는 경우가 많습니다. 에서 Ultralytics YOLO에서 배치 정규화는 실시간 객체 감지 작업에서 높은 정확도를 달성하는 데 기여합니다.
기계 번역이나 감정 분석과 같은 NLP 작업에서 일괄 정규화는 Transformers와 같은 심층 아키텍처를 사용하는 모델의 학습을 안정화합니다. 특히 대규모 데이터 세트를 다룰 때 여러 계층에 걸쳐 일관된 학습을 보장합니다.
의료 이미지 분석: 종양 감지와 같은 애플리케이션에서 일괄 정규화는 딥러닝 모델을 안정화하여 CT 또는 MRI 스캔에서 이상 징후를 감지할 때 신뢰성을 확보하는 데 도움이 됩니다. 이를 통해 진단 정확도가 향상되고 학습 속도가 빨라집니다.
자율 주행 차량: 일괄 정규화는 자율 주행 차량의 실시간 인식 작업에서 중요한 역할을 합니다. 예를 들어, 자율주행 차량 시스템에서는 교통 표지판, 보행자, 장애물을 인식하는 데 사용되는 컴퓨터 비전 모델의 성능을 향상시켜 보다 안전한 주행을 보장합니다.
드롭아웃과 배치 정규화는 모두 모델 일반화를 개선하는 것을 목표로 하지만, 작동 방식은 다릅니다. 드롭아웃은 훈련 중에 뉴런을 무작위로 비활성화하여 과적합을 방지하는 반면, 배치 정규화는 레이어 입력을 정규화하여 안정적인 분포를 유지합니다. 이러한 기법은 모델 견고성을 향상시키기 위해 함께 사용되는 경우가 많습니다.
일괄 정규화는 정규화의 한 형태입니다. 인스턴스 정규화와 같은 다른 유형은 스타일 전송과 같은 특정 작업에 사용됩니다. 정규화 방법 간의 미묘한 차이를 이해하면 다양한 AI 애플리케이션에 맞는 솔루션을 맞춤화하는 데 도움이 될 수 있습니다.
배치 정규화는 다음과 같은 최신 AI 프레임워크에 원활하게 통합됩니다. PyTorch와 같은 최신 AI 프레임워크에 원활하게 통합되어 Ultralytics HUB와 같은 도구를 구동합니다. 이러한 통합은 물체 감지부터 이미지 분할에 이르기까지 다양한 작업에 최적화된 모델을 학습하고 배포하는 프로세스를 간소화합니다.
일괄 정규화는 최신 딥러닝의 초석이 되어 더 빠르고 안정적인 학습을 가능하게 합니다. AI 영역 전반에 걸쳐 광범위하게 채택되면서 정확하고 효율적인 머신러닝 시스템을 구축하는 데 있어 그 중요성이 강조되고 있습니다.