용어집

실시간 추론

AI에서 즉각적인 예측을 위한 실시간 추론의 힘을 알아보고 자율 주행, 헬스케어 등의 분야에서 신속한 의사 결정을 내릴 수 있습니다.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

실시간 추론은 특히 즉각적인 결과가 필수적인 애플리케이션에서 머신 러닝(ML) 모델을 배포하는 데 있어 매우 중요한 요소입니다. 실시간 추론은 학습된 ML 모델을 사용하여 거의 즉각적으로 보이지 않는 새로운 데이터를 예측하는 프로세스를 말합니다. 데이터를 큰 덩어리로 처리하는 일괄 처리와 달리 실시간 추론은 데이터가 도착하는 즉시 처리하므로 즉각적인 인사이트를 제공하고 신속한 의사 결정을 내릴 수 있습니다. 이 기능은 자율 주행, 실시간 비디오 분석, 대화형 사용자 경험과 같이 즉각적인 피드백이 필요한 애플리케이션에 매우 중요합니다.

실시간 추론의 중요성

실시간 추론의 중요성은 지연 시간이 성능이나 사용자 경험에 큰 영향을 미칠 수 있는 애플리케이션에 필수적인 즉각적인 예측을 제공할 수 있다는 데 있습니다. 예를 들어, 자율 주행 차량에서는 실시간 추론을 통해 다양한 센서의 데이터를 기반으로 순식간에 의사 결정을 내릴 수 있어 안전성과 반응성을 보장할 수 있습니다. 마찬가지로 의료 분야에서도 의료 이미지의 실시간 분석은 신속한 진단과 치료 계획 수립에 도움을 줄 수 있습니다. 데이터를 즉시 처리하고 반응할 수 있는 능력은 실시간 추론이 많은 최신 AI 애플리케이션의 초석이 되는 이유입니다.

실시간 추론과 관련된 주요 개념

몇 가지 주요 개념은 실시간 추론과 밀접하게 연관되어 있습니다:

  • 지연 시간: 지연 시간: 모델에 데이터를 입력할 때와 예측 결과를 받을 때까지의 시간 지연을 의미합니다. 실시간 애플리케이션에서는 짧은 지연 시간이 매우 중요합니다. 모델 양자화모델 가지 치기와 같은 기술은 모델 크기와 복잡성을 줄여 지연 시간을 줄이는 데 도움이 됩니다.
  • 처리량: 단위 시간당 모델에서 처리하는 데이터의 양을 측정합니다. 대량의 수신 데이터를 효율적으로 처리하려면 높은 처리량이 필수적입니다.
  • 엣지 컴퓨팅: 스마트폰이나 IoT 디바이스와 같은 엣지 디바이스에서 추론을 수행하면 중앙 서버로 데이터를 전송할 필요성이 줄어들어 지연 시간이 단축되고 응답성이 향상됩니다. 엣지 AI의 실제 적용 사례를 이해하는 방법에 대해 자세히 알아보세요.
  • 모델 최적화: 추론을 위한 모델 최적화에는 모델을 다음과 같은 특수 형식으로 변환하는 것과 같은 기술이 포함됩니다. TensorRT 또는 특정 하드웨어에서 효율적으로 실행되도록 설계된 TFLite와 같은 특수 형식으로 변환하는 등의 기술이 포함됩니다.

실시간 추론의 실제 적용 사례

실시간 추론은 다양한 산업 분야의 광범위한 애플리케이션을 지원합니다:

  1. 자율주행 차량: 자율주행차는 카메라, 라이더 및 기타 센서의 데이터를 처리하기 위해 실시간 추론에 의존합니다. 시스템은 물체를 감지하고, 분류하고, 밀리초 내에 주행 결정을 내려야 합니다. Ultralytics YOLO 모델은 안전한 자율 주행에 필수적인 빠르고 정확한 물체 감지 기능을 제공하여 이 영역에서 탁월한 성능을 발휘합니다.
  2. 비디오 감시: 비디오 피드의 실시간 분석을 통해 의심스러운 활동이나 이상 징후를 즉시 감지할 수 있습니다. 예를 들어, 보안 시스템은 실시간 추론을 통해 무단 액세스를 식별하거나 비정상적인 행동을 감지하거나 관심 대상을 추적하여 보안 조치를 강화하고 신속하게 대응할 수 있습니다.
  3. 헬스케어: 의료 영상 분야에서 실시간 추론은 엑스레이, MRI 및 기타 스캔의 즉각적인 분석을 지원하여 신속하고 정확한 진단을 도울 수 있습니다. 이는 시기적절한 결정이 생명을 구할 수 있는 응급 상황에서 특히 유용합니다.
  4. 산업 자동화: 실시간 추론을 통해 제조 공정을 모니터링하고, 제품의 결함을 감지하고, 생산 라인을 즉시 최적화할 수 있습니다. 이를 통해 효율성을 개선하고 낭비를 줄이며 고품질의 결과물을 보장할 수 있습니다.
  5. 리테일: 실시간 추론은 스마트 리테일 솔루션에서 고객 행동을 분석하고 재고를 관리하며 쇼핑 경험을 개인화하기 위해 사용됩니다. 예를 들어 실시간 추론 기능이 탑재된 카메라는 고객의 움직임을 추적하고 구매 패턴을 분석하며 제품 배치를 실시간으로 최적화할 수 있습니다.

실시간 추론 대 일괄 처리

실시간 추론과 일괄 처리 모두 머신 러닝 모델을 배포하는 방법이지만, 서로 다른 용도로 사용되며 다양한 유형의 애플리케이션에 적합합니다.

실시간 추론은 데이터를 처리하고 거의 즉각적으로 예측을 생성하므로 즉각적인 피드백이 필요한 애플리케이션에 이상적입니다. 이 방법은 짧은 지연 시간과 응답성을 우선시합니다.

반면 일괄 처리는 대량의 데이터를 예정된 간격으로 일괄 처리하는 방식입니다. 이 방법은 일일 보고서 생성이나 대규모 데이터 분석 수행과 같이 즉각적인 결과가 중요하지 않은 애플리케이션에 적합합니다. 일괄 처리는 대용량 데이터 세트를 처리할 때 높은 처리량과 효율성을 우선시합니다.

실시간 추론과 일괄 처리 중 어떤 것을 선택할지는 애플리케이션의 특정 요구 사항에 따라 달라집니다. 실시간 추론은 대화형이고 시간에 민감한 애플리케이션에 필수적인 반면, 일괄 처리는 즉각적인 결과 없이 대량의 데이터를 처리해야 하는 작업에 더 적합합니다. 모델 배포 옵션 및 모범 사례에 대한 자세한 내용은 Ultralytics 문서를 참조하세요.

결론

실시간 추론은 AI 및 머신러닝 분야에서 즉각적인 예측과 신속한 의사결정을 가능하게 하는 강력한 기능입니다. 자율 주행 차량과 비디오 감시부터 의료 및 산업 자동화에 이르기까지 다양한 애플리케이션에서 그 중요성이 분명하게 드러납니다. 개발자는 실시간 추론과 관련된 주요 개념과 기술을 이해함으로써 이 기술을 활용하여 즉각적인 가치를 제공하고 사용자 경험을 향상시키는 혁신적인 솔루션을 만들 수 있습니다. AI가 계속 발전함에 따라 실시간 추론은 의심할 여지 없이 기술의 미래를 형성하는 데 점점 더 중요한 역할을 하게 될 것입니다. 모델 페이지를 방문하여 Ultralytics YOLO 모델 페이지를 방문하여 실시간 객체 감지 및 기타 컴퓨터 비전 작업의 최첨단 발전을 살펴보세요.

모두 보기