용어집

모델 배포

모델 배포의 필수 요소에 대해 알아보고, ML 모델을 예측, 자동화 및 AI 기반 인사이트를 위한 실제 도구로 전환하는 방법을 알아보세요.

모델 배포는 학습된 머신 러닝(ML) 모델을 라이브 프로덕션 환경에서 사용할 수 있도록 하는 중요한 프로세스입니다. 이 단계에서는 모델을 개발 또는 테스트 단계에서 새로운 실제 데이터에 대한 예측(추론)을 생성할 수 있는 운영 도구로 전환합니다. 머신 러닝 수명 주기에서 중요한 단계로, ML 모델을 구축하는 것과 애플리케이션, 시스템 또는 비즈니스 프로세스에서 가치를 제공하기 위해 실제로 사용하는 것 사이의 간극을 메우는 단계입니다. 배포에 대한 이해는 기본 ML 개념에 익숙한 사람이라면 누구나 자신의 모델을 효과적으로 적용하고자 할 때 필수적입니다.

모델 배포의 관련성

효과적인 배포가 없다면 아무리 정확한 모델이라도 학문적인 연구로만 남을 뿐 실질적인 이점을 제공할 수 없습니다. 배포는 AI 및 ML 프로젝트에서 투자 수익률(ROI)을 실현하는 데 필수적입니다. 이를 통해 조직은 작업을 자동화하고, 데이터에서 실행 가능한 인사이트를 얻고, 사용자 경험을 개선하고, 정보에 기반한 의사결정을 내릴 수 있습니다. 성공적인 배포는 모델 학습에 투자한 리소스가 실질적인 성과로 이어질 수 있도록 보장합니다. 지속적인 운영에는 데이터 드리프트와 같은 요인으로 인해 시간이 지남에 따라 성능이 저하되지 않도록 모델 모니터링 및 유지 관리가 수반되는 경우가 많습니다. 모델 배포 모범 사례를 따르는 것이 성공의 열쇠입니다.

모델 배포의 응용

모델 배포를 통해 산업 전반에 걸쳐 광범위한 AI 기반 애플리케이션을 구현할 수 있습니다. 다음은 몇 가지 구체적인 예시입니다:

소매 재고 관리: An Ultralytics YOLO 물체 감지를 위해 훈련된 모델을 소매점에 배포할 수 있습니다. 카메라가 선반 이미지를 캡처하고 배포된 모델이 실시간으로 제품을 식별하고 계산하여 재고 확인을 자동화하고 재고 부족을 줄입니다. 이는 더 스마트한 리테일 재고 관리를 위한 AI의 예시입니다.
의료 이미지 분석: 의료 스캔에서 이상 징후를 감지하도록 훈련된 모델(예: 종양 식별)을 병원 방사선과에 배치할 수 있습니다. 이 모델은 엑스레이나 MRI에서 잠재적으로 우려되는 영역을 강조 표시하여 진단 속도를 높이고 정확도를 향상시킴으로써 방사선과 의사를 지원합니다. 의료 솔루션 및 의료 이미지 분석의 AI에 대해 자세히 알아보세요.

모델 배포 시 중요 고려 사항

ML 모델을 효과적으로 배포하려면 몇 가지 요소에 대한 신중한 계획이 필요합니다:

확장성: 배포 인프라는 다양한 부하를 처리해야 합니다. 여기에는 자동으로 확장할 수 있는 클라우드 컴퓨팅 리소스를 사용하거나 리소스가 제한된 에지 컴퓨팅 장치에 효율적으로 모델을 배포하는 것이 포함될 수 있습니다. 확장성 원칙을 이해하는 것이 중요합니다.
지연 시간 및 처리량: 애플리케이션에는 응답 시간(추론 대기 시간)과 초당 예측 수(처리량)에 대한 엄격한 요구 사항이 있는 경우가 많습니다. 모델 정량화 또는 프루닝과 같은 기술을 사용하여 모델을 최적화하고 올바른 하드웨어(GPU, CPU, TPU)가 중요합니다. 지연 시간 대비 처리량을 위한 OpenVINO 최적화에 대해 알아보세요.
배포 환경: API(애플리케이션 프로그래밍 인터페이스)를 통해 액세스하는 웹 서비스로 배포하거나, Docker와 같은 도구를 사용하여 컨테이너에 패키징하거나(Docker 빠른 시작 가이드), 라즈베리 파이 또는 NVIDIA Jetson과 같은 하드웨어에 직접 임베드하는 등 다양한 방식으로 모델을 배포할 수 있습니다.
MLOps(머신 러닝 운영): 여기에는 배포, 모니터링, 재교육 등 엔드투엔드 ML 라이프사이클을 자동화하고 간소화하기 위한 관행이 포함됩니다. MLOps 원칙은 안정성과 유지보수성을 보장합니다. Ultralytics MLOps 통합에 대해 알아보세요.

모델 배포와 관련 개념 비교

모델 배포를 관련 단계 및 개념과 구분하는 것이 도움이 됩니다:

모델 학습: 학습 데이터를 사용하여 모델을 학습시키는 과정입니다. 배포는 만족스러운 모델이 학습된 후에 이루어집니다(모델 학습을 위한 팁).
추론: 학습되고 배포된 모델이 새로운 데이터를 예측하는 프로세스입니다. 배포를 통해 프로덕션 환경에서 추론을 수행할 수 있습니다. YOLO 스레드 안전 추론에 대해 읽어보세요.
모델 제공: 모델을 호스팅하고 추론 요청에 효율적으로 응답하기 위해 설정된 인프라(하드웨어 및 소프트웨어)를 구체적으로 말합니다. 배포의 핵심 구성 요소입니다(모델 서빙 용어집).

도구 및 플랫폼

다양한 도구와 플랫폼이 배포 프로세스를 간소화합니다. 다음과 같은 ML 프레임워크 PyTorch 및 TensorFlow 와 같은 ML 프레임워크는 다양한 형식으로 모델 내보내기 기능을 제공하는 경우가 많습니다(예 ONNX, TensorRT, CoreML) 배포 대상(모델 배포 옵션 가이드)에 따라 적합한모델을 선택할 수 있습니다. Ultralytics HUB와 같은 플랫폼은 컴퓨터 비전 모델의 교육Ultralytics HUB 클라우드 교육), 추적 및 배포를 위한 통합 솔루션을 제공하여 개발부터 프로덕션까지 워크플로우를 간소화합니다( Ultralytics HUB를 사용한 YOLO11 교육 및 배포). AWS, Azure, Google Cloud와 같은 클라우드 제공업체도 포괄적인 배포 서비스를 제공합니다.

모델 배포

YOLO 모델을 Ultralytics HUB로 간단히
훈련

혁신을 지원하는 유연한 엔터프라이즈 라이선싱 솔루션

다음을 사용하여 몇 초 만에 AI 모델을 훈련하세요. Ultralytics YOLO

Ultralytics HUB로 간단히 YOLO 모델 교육

모델 배포의 관련성

모델 배포의 응용

모델 배포 시 중요 고려 사항

모델 배포와 관련 개념 비교

도구 및 플랫폼

블로그 더 보기

Ultralytics 커뮤니티 가입하기

모델 배포

YOLO 모델을 Ultralytics HUB로 간단히훈련

혁신을 지원하는 유연한 엔터프라이즈 라이선싱 솔루션

다음을 사용하여 몇 초 만에 AI 모델을 훈련하세요. Ultralytics YOLO

Ultralytics HUB로 간단히 YOLO 모델 교육

모델 배포의 관련성

모델 배포의 응용

모델 배포 시 중요 고려 사항

모델 배포와 관련 개념 비교

도구 및 플랫폼

블로그 더 보기

Ultralytics 커뮤니티 가입하기

YOLO 모델을 Ultralytics HUB로 간단히
훈련