실시간 추론( Ultralytics YOLO )을 통해 자율 주행 및 보안 시스템과 같은 AI 애플리케이션에서 어떻게 즉각적인 예측이 가능한지 알아보세요.
실시간 추론은 새로운 데이터를 사용할 수 있게 되는 즉시 머신 러닝 모델로 예측하는 프로세스입니다. 이는 시간이 지남에 따라 수집된 데이터 포인트 그룹에 대해 예측을 하는 배치 추론과는 대조적입니다. 실시간 추론에서는 속도와 즉각성에 중점을 두어 시스템이 최신 정보를 기반으로 즉각적으로 반응하고 의사 결정을 내릴 수 있도록 합니다.
머신 러닝, 특히 Ultralytics YOLO 과 같은 모델에서 실시간 추론은 모델이 이미지나 비디오 프레임과 같은 개별 데이터 입력을 처리하고 거의 즉각적으로 예측을 생성할 수 있다는 것을 의미합니다. 이 기능은 적시 대응이 필수적인 애플리케이션에 매우 중요합니다. 예를 들어, 객체 감지의 경우 실시간 추론을 통해 모델은 실시간 비디오 스트림에서 눈에 띄는 지연 없이 객체를 식별하고 위치를 찾을 수 있습니다.
실시간 추론의 효율성은 모델이 단일 입력에서 예측을 생성하는 데 걸리는 시간인 추론 지연 시간으로 측정되는 경우가 많습니다. 실시간 시스템이 효과적으로 작동하려면 지연 시간이 짧아야 합니다. 짧은 지연 시간을 달성하기 위해 모델 정량화 및 모델 가지치기와 같은 기술을 통해 속도를 최적화하거나 GPU 또는 TPU와 같은 특수 하드웨어에 모델을 배포하는 경우가 많습니다. 다음과 같은 프레임워크 TensorRT ( NVIDIA )과 같은 프레임워크도 추론을 가속화하도록 설계되어 실시간 성능을 더욱 향상시킬 수 있습니다.
실시간 추론은 다양한 산업 분야에 걸쳐 수많은 첨단 애플리케이션의 근간을 이루고 있습니다. 다음은 몇 가지 구체적인 예시입니다:
이러한 사례는 빠르게 변화하는 데이터를 기반으로 즉각적인 의사 결정과 대응이 요구되는 애플리케이션에서 실시간 추론의 중요한 역할을 강조합니다. AI 기술이 발전함에 따라 실시간 추론은 계속해서 더욱 역동적이고 반응성이 뛰어난 시스템을 구현하여 산업 전반의 자동화와 인텔리전스를 향상시킬 것입니다. Ultralytics 모델로 실시간 추론을 구현하려는 사람들을 위해 Ultralytics HUB와 같은 플랫폼은 효율적인 실시간 성능을 위해 모델을 훈련, 최적화 및 배포할 수 있는 도구를 제공합니다.