실시간 추론( Ultralytics YOLO )을 통해 자율 주행 및 보안 시스템과 같은 AI 애플리케이션에서 어떻게 즉각적인 예측이 가능한지 알아보세요.
실시간 추론은 학습된 머신 러닝(ML) 모델이 새로운 데이터가 도착하는 즉시 예측 또는 의사 결정을 내리는 프로세스를 말합니다. 시간 경과에 따라 수집된 데이터를 그룹으로 처리하는 배치 추론과 달리 실시간 추론은 짧은 지연 시간과 즉각적인 응답을 우선시합니다. 이 기능은 실시간 데이터 스트림을 기반으로 즉각적인 피드백이나 조치가 필요한 애플리케이션에 필수적이며, 실시간 컴퓨팅의 원칙에 따라 시스템이 변화하는 조건에 동적으로 반응할 수 있게 해줍니다.
실제로 실시간 추론은 다음과 같은 ML 모델을 배포하는 것을 의미합니다. Ultralytics YOLO 모델과 같은 ML 모델을 배포하여 비디오 프레임이나 센서 판독값과 같은 개별 데이터 입력을 분석하고 최소한의 지연으로 출력을 생성할 수 있습니다. 주요 성능 지표는 입력을 받은 후 예측을 생성하기까지 걸리는 시간인 추론 지연 시간입니다. 짧은 지연 시간을 달성하려면 모델 자체를 최적화하고 특수 하드웨어 및 소프트웨어를 활용하는 등 여러 가지 전략이 필요합니다.
주요 차이점은 데이터 처리 방식과 관련 지연 시간 요구 사항에 있습니다:
실시간 추론은 즉각적인 의사 결정이 중요한 많은 최신 인공 지능(AI) 애플리케이션을 지원합니다:
실시간 애플리케이션을 위해 모델을 충분히 빠르게 실행하려면 상당한 최적화가 필요한 경우가 많습니다:
다음과 같은 모델 Ultralytics YOLO11 와 같은 모델은 효율성과 정확성을 염두에 두고 설계되어 실시간 객체 감지 작업에 적합합니다. Ultralytics HUB와 같은 플랫폼은 훈련, 최적화(예: 내보내기 ONNX 또는 TensorRT 형식으로 내보내기) 및 모델을 배포할 수 있는 도구를 제공하여 다양한 배포 옵션에서 실시간 추론 솔루션을 쉽게 구현할 수 있습니다.