신경망 아키텍처 검색(NAS)이 어떻게 신경망 설계를 자동화하여 객체 감지, AI 등의 성능을 최적화하는지 알아보세요.
신경망 아키텍처 검색(NAS)은 머신러닝(ML) 분야의 자동화된 기술로, 신경망(NN)의 최적의 구조 또는 아키텍처를 설계하는 데 중점을 두고 있습니다. NAS는 시행착오를 통해 네트워크 레이아웃을 수동으로 설계하는 인간 전문가에 의존하는 대신 알고리즘을 사용하여 방대한 아키텍처 공간을 탐색하고 주어진 작업과 데이터 세트에 가장 효과적인 아키텍처를 식별합니다. 이러한 자동화는 개발 프로세스를 가속화하고 인간 설계자에게는 직관적으로 분명하지 않을 수 있는 새로운 고성능 아키텍처를 발견하여 정확도, 속도(추론 대기 시간) 또는 계산 효율성과 같은 메트릭에 최적화할 수 있습니다.
NAS의 기본 프로세스에는 검색 공간, 검색 전략, 성능 추정 전략의 세 가지 주요 구성 요소가 포함됩니다. 검색 공간은 설계 가능한 네트워크 아키텍처의 집합을 정의하며, 기본적으로 다양한 유형의 컨볼루션 또는 활성화 함수와 같은 빌딩 블록과 이를 연결할 수 있는 방법을 간략하게 설명합니다. 검색 전략은 무작위 검색 및 강화 학습에서 진화 알고리즘에 이르는 다양한 방법을 사용하여 이 공간을 탐색하도록 안내합니다. 마지막으로 성능 추정 전략은 후보 아키텍처의 성능을 평가하는 것으로, 데이터 세트에 대해 네트워크를 부분적으로 또는 전체적으로 훈련하고 성능을 측정하는 경우가 많지만 Google AI의 연구에 자세히 설명된 대로 가중치 공유 또는 성능 예측자와 같은 기술을 사용하여 속도를 높일 수 있습니다.
NAS로 아키텍처 설계를 자동화하면 상당한 이점을 얻을 수 있습니다:
대표적인 예로 Deci AI NAS 기술을 사용해 개발한 YOLO 있습니다. 이 모델은 특히 NAS를 통해 발견된 양자화 친화적인 블록을 통합하여 이전 Ultralytics YOLO 버전의 한계를 타깃으로 삼았습니다. 그 결과 정확도와 지연 시간 간에 탁월한 균형을 제공하는 모델이 탄생했으며, 효율적인 배포를 위해 INT8과 같은 형식으로 모델을 양자화한 후에도 자동차 솔루션의 AI 및 스마트 트래픽 관리와 같은 실시간 애플리케이션에 매우 효과적입니다. 양자화 기법에 대한 자세한 내용은 NVIDIA TensorRT 문서와 같은 리소스에서 확인할 수 있습니다.
의료 분야에서 NAS는 의료 이미지 분석을 위한 맞춤형 컨볼루션 신경망(CNN)을 설계하는 데 사용됩니다. 예를 들어, NAS는 MRI 스캔에서 종양을 감지하거나 CT 이미지에서 장기를 분할하는 등의 작업을 위해 아키텍처를 최적화하여 임상의를 돕는 더 빠르고 정확한 진단 도구로 이어질 수 있습니다. 의료 이미지 분석에 AI를 적용하는 것은 국립보건원(NIH)과 같은 기관에서 강조하듯이 빠르게 성장하고 있는 분야입니다. 이러한 전문화된 모델과 데이터 세트 관리는 Ultralytics HUB와 같은 플랫폼을 사용하여 간소화할 수 있습니다.
NAS는 광범위한 자동화된 머신 러닝(AutoML) 분야 내의 특정 구성 요소입니다. NAS는 최적의 신경망 아키텍처를 찾는 데만 초점을 맞추는 반면, AutoML은 데이터 전처리, 기능 엔지니어링, 모델 선택, 하이퍼파라미터 튜닝과 같은 단계를 포함한 전체 ML 파이프라인을 자동화하는 것을 목표로 합니다. 하이퍼파라미터 튜닝은 주어진 고정된 모델 아키텍처에 대한 구성 설정( 학습 속도 또는 배치 크기 등)을 최적화하는 반면, NAS는 아키텍처 자체를 검색합니다. 최적의 모델 성능을 달성하기 위해 두 가지 기술을 함께 사용하는 경우가 많습니다. 하이퍼파라미터 최적화를 위해 Optuna 또는 Ray Tune과 같은 도구가 널리 사용됩니다.