용어집

모델 배포

모델 배포의 필수 요소에 대해 알아보고, ML 모델을 예측, 자동화 및 AI 기반 인사이트를 위한 실제 도구로 전환하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

모델 배포는 학습된 머신 러닝 모델을 기존 프로덕션 환경에 통합하여 실용적이고 실제적인 예측을 수행하는 프로세스입니다. 이 단계는 애플리케이션, 시스템 또는 비즈니스 프로세스에서 모델을 사용할 수 있도록 하기 때문에 머신 러닝 수명 주기에서 매우 중요한 단계입니다. 배포하지 않으면 모델은 개발 환경에 머물러 실제 시나리오에서 가치를 제공할 수 없습니다.

모델 배포의 관련성

모델 배포는 모델 개발과 실제 적용 사이의 간극을 메워줍니다. 이 단계는 머신러닝 모델이 이론적 구성에서 작업을 자동화하고 인사이트를 제공하며 의사 결정을 내릴 수 있는 실질적인 도구로 전환되는 단계입니다. 성공적인 모델 배포는 모델 개발에 투자한 노력과 리소스가 비즈니스 운영 개선, 사용자 경험 향상, 복잡한 문제 해결 등 실제 혜택으로 이어질 수 있도록 보장합니다. 배포는 AI 및 머신러닝 프로젝트의 투자 수익을 실현하는 데 필수적이며, 모델이 보이지 않는 새로운 데이터에 대한 예측을 생성하고 모델 모니터링을 통해 시간이 지남에 따라 지속적으로 학습하고 개선할 수 있도록 합니다.

모델 배포의 응용

모델 배포는 다양한 산업 분야의 광범위한 애플리케이션에 필수적인 요소입니다. 다음은 몇 가지 구체적인 예시입니다:

  • 스마트 리테일: 소매업에서는 Ultralytics YOLOv8 과 같은 객체 감지 모델을 매장에 배포하여 실시간으로 재고 수준을 모니터링할 수 있습니다. 배포된 모델은 카메라 피드를 분석하여 진열대에 있는 제품을 자동으로 계산하고, 잘못 배치된 제품을 식별하며, 재고가 부족할 때 알림을 보냅니다. 이를 통해 효율적인 재고 관리를 보장하고 품절을 줄이며 제품 가용성을 보장하여 전반적인 쇼핑 경험을 개선할 수 있습니다.
  • 자율 주행 차량: 자율 주행 자동차는 배포된 객체 감지 및 인스턴스 세분화 모델에 크게 의존합니다. 이러한 모델은 종종 다음과 같은 아키텍처를 기반으로 합니다. YOLOv5와 같은 아키텍처를 기반으로 하는 이러한 모델은 차량의 온보드 컴퓨터에 배포되어 카메라와 LiDAR의 센서 데이터를 실시간으로 처리합니다. 배포된 모델은 보행자, 차량, 교통 표지판 및 기타 장애물을 감지하여 차량이 안전하게 주행하고 정보에 입각한 주행 결정을 내릴 수 있도록 지원함으로써 자율 주행 차량의 AI 발전에 기여합니다.

모델 배포 시 중요 고려 사항

모델 배포 시 효율성, 안정성 및 확장성을 보장하기 위해 몇 가지 중요한 측면을 고려합니다:

  • 추론: 실시간 추론은 특히 자율 주행이나 실시간 비디오 분석과 같이 즉각적인 예측이 필요한 애플리케이션의 경우 핵심적인 고려 사항입니다. 추론 대기 시간을 줄이기 위해 모델을 최적화하는 것은 매우 중요하며, 모델 크기와 계산 오버헤드를 줄이기 위해 모델 정량화 및 가지 치기와 같은 기술을 사용하는 경우가 많습니다. TensorRTNVIDIA 의 고성능 추론 최적화 도구는 Ultralytics YOLO 모델을 NVIDIA GPU에서 추론을 가속화하는 데 자주 사용됩니다.
  • 배포 환경: 모델은 각각 고유한 요구 사항과 제약 조건이 있는 다양한 환경에 배포할 수 있습니다.
    • 엣지 배포: 엣지 컴퓨팅은 스마트폰, 임베디드 시스템( NVIDIA Jetson 또는 Raspberry Pi), 엣지 서버 등 네트워크의 엣지에 있는 디바이스에 모델을 배포하는 것을 포함합니다. 엣지 배포는 짧은 지연 시간, 데이터 개인정보 보호, 오프라인 기능이 필요한 애플리케이션에 유용합니다. 예를 들어, 모바일 디바이스에 FastSAM 모델을 모바일 디바이스에 배포하는 것이 그 예입니다.
    • 클라우드 배포: 클라우드 컴퓨팅은 모델을 웹 서비스 또는 API로 배포할 수 있는 확장 가능한 인프라를 제공합니다. 클라우드 배포는 고가용성, 확장성 및 중앙 집중식 관리가 필요한 애플리케이션에 적합합니다. Ultralytics 허브와 같은 플랫폼은 클라우드 배포를 용이하게 하여 사용자가 클라우드에서 Ultralytics YOLO 모델을 교육, 배포 및 관리할 수 있도록 합니다.
  • 모델 서빙: 모델 서빙은 애플리케이션이나 사용자가 배포된 모델에 액세스할 수 있도록 하는 프로세스로, 주로 API를 통해 이루어집니다. 강력한 모델 서빙 솔루션은 배포된 모델의 고가용성, 확장성, 효율적인 관리를 보장합니다. NVIDIA Triton 추론 서버와 같은 도구를 Ultralytics YOLO 과 통합하여 확장 가능하고 효율적인 딥 러닝 추론 배포를 할 수 있습니다.

성공적인 모델 배포는 머신러닝 모델이 실제 애플리케이션에서 가치를 제공할 수 있도록 신중한 계획, 최적화, 모니터링이 필요한 다각적인 프로세스입니다. Ultralytics 허브와 같은 플랫폼은 배포 프로세스를 간소화하고 능률화하여 개발자와 기업이 비전 AI의 성능을 더 쉽게 활용할 수 있도록 설계되었습니다.

모두 보기