시계열 분석
시계열 분석을 통한 예측 및 이상 탐색을 탐구하세요. Ultralytics 활용해 시계열 데이터를 생성하는 방법을 배우고 고급 AI 인사이트를 얻으세요.
시계열 분석은 일정 시간 간격에 걸쳐 수집된 데이터 포인트 시퀀스를 분석하는 특정 방법입니다.
이 과정에서 분석가는 데이터 포인트를 간헐적 또는 무작위로 기록하는 대신, 설정된 기간 동안 일정한 간격으로 데이터 포인트를 기록합니다. 표준 이미지 분류에 사용되는 정적 데이터셋과 달리, 시계열 데이터는 시간적 차원을 추가합니다. 즉, 데이터의 순서가 근본적인 패턴을 이해하는 데 중요합니다. 이 기술은 데이터 분석의 기초이며, 과거 추세를 바탕으로 미래 사건을 예측하는 데 널리 사용됩니다.
핵심 구성 요소 및 기술
시간 기반 데이터를 효과적으로 분석하기 위해서는 실무자들이 신호를 구성하는 개별 구성 요소를 식별해야 한다.
-
추세 분석: 이는 데이터의 장기적인 방향을 파악하는 것을 포함합니다. 예를 들어,
선형 회귀 분석은 종종
수년간 매출이 전반적으로 증가하는지 감소하는지를 모델링하는 데 사용됩니다.
-
계절성 탐지: 많은 데이터셋은 매년 반복되는 규칙적이고 예측 가능한 변화를 보입니다.
소매업체들은 휴일 수요 급증이나 날씨 관련 구매 습관에 대비하기 위해 계절성 분석을 활용합니다.
-
정역성: 시계열은 평균과 분산과 같은 통계적 특성이 시간에 따라 변하지 않을 때 정역성이라고 한다.
디키-풀러 검정과 같은 기법은 모델링 전에 데이터 변환이 필요한지 판단하는 데 도움을 준다.
-
잡음 추정: 무작위 변동 또는 "백색 잡음"은 진정한 패턴을 가릴 수 있습니다. 고급 필터링 또는 자동 인코더를 사용하여 무의미한 신호를 무작위 변동으로부터 분리합니다.
실제 AI/ML 애플리케이션
시계열 분석은 운영을 최적화하고 위험을 줄이기 위해 정확한 예측이 필요한 산업에서 매우 중요합니다.
위험 감소.
-
소매업에서의 수요 예측: 소매업체들은
인공지능(AI)을 활용해 재고 요구량을 예측합니다.
과거 판매 시계열 데이터를 분석함으로써 기업들은 공급망을 최적화하여
과잉 재고와 품절을 동시에 줄일 수 있습니다.
소매 데이터에서 나타나는 강한 계절적 효과를 처리하기 위해
Facebook Prophet과 같은 도구가 자주 활용됩니다.
-
의료 생체 신호 모니터링: 의료 분야에서
의료 시스템의 인공지능은 심박수 및 혈압과 같은
환자의 생체 신호를 지속적으로 모니터링합니다. 시계열 알고리즘은
이상 감지 기능을 수행하여 환자의 측정값이 정상적인 과거 기준선에서 벗어날 경우
의료진에게 즉시 경보를 발령함으로써 생명을 구할 수 있습니다.
-
예측 유지보수: 제조 공장은 센서를 활용해 기계의 진동 또는 온도 데이터를 지속적으로 수집합니다.
제조업에 인공지능을 적용함으로써 기업은 장비 고장이 발생하기 전에 이를 예측하여 가동 중단 시간을 최소화할 수 있습니다.
컴퓨터 비전에서 시계열 생성
시계열 분석은
이미지와 같은 공간 데이터에 초점을 맞추는 컴퓨터 비전(CV)과는 별개이지만,
두 분야는 종종 교차한다. CV 모델은 비디오 스트림을 처리하여 시계열 데이터를 생성할 수 있다.
예를 들어, 교통 카메라에서 실행되는 물체 계수 시스템은 분당 차량 수를 순차적으로 산출한다.
다음 예제는 Ultralytics 사용하여
비디오 내 track 시각적 데이터를 객체 개수 시계열로
효과적으로 변환하는 방법을 보여줍니다.
from ultralytics import YOLO
# Load the YOLO26 model for object tracking
model = YOLO("yolo26n.pt")
# Track objects in a video stream (generates time-series data)
# The 'stream=True' argument returns a generator for memory efficiency
results = model.track("https://docs.ultralytics.com/modes/track/", stream=True)
# Process frames sequentially to build a time series of counts
for i, r in enumerate(results):
if r.boxes.id is not None:
count = len(r.boxes.id)
print(f"Time Step {i}: {count} objects detected")
이러한 파이프라인에 투입되는 데이터셋 관리 및 모델 훈련을 위해 사용자는
Ultralytics 활용할 수 있습니다. 이 플랫폼은 주석 작업부터 배포까지의 워크플로를 간소화합니다.
현대 신경망 아키텍처
ARIMA(자동회귀 통합 이동평균) 과 같은 전통적인 통계 기법은 여전히 널리 사용되지만,
현대적인 딥 러닝(DL) 은 강력한 대안을 제시했습니다.
-
순환 신경망(RNN): 순차적 데이터에 특화되어 설계된
순환 신경망(RNN)은
이전 입력값에 대한 "기억"을 유지함으로써 단기 의존성을 처리하는 데 적합합니다.
-
장기 단기 기억(LSTM): 긴 시퀀스를 기억하는 데 있어 표준 RNN의 한계를 해결하기 위해
장기 단기 기억(LSTM)
아키텍처는 게이트를 사용하여 정보 흐름을 제어함으로써 장기적인 시간적 의존성을 효과적으로 모델링합니다.
-
트랜스포머: 원래 텍스트 처리를 위해 개발된
트랜스포머 아키텍처와 그 어텐션 메커니즘은
이제 복잡한 시계열 데이터 예측 분야에서 최첨단 기술로 자리잡았으며, 종종 기존 재귀 모델들을 능가하는 성능을 보여준다.
관련 용어와의 차이점
시계열 분석과 시퀀스 모델링을 구분하는 것이 중요합니다.
컴퓨터 비전과 구별하는 것이 중요합니다.
-
시계열 대 시퀀스 모델링: 모든 시계열은 시퀀스이지만, 모든 시퀀스가 시계열은 아니다.
자연어 처리(NLP)는 순서가 중요한 단어 시퀀스를 다루지만, '시간' 요소는 추상적이다. 시계열 분석은 특히 데이터가 시간으로 인덱싱됨을 의미한다.
-
시계열 대 컴퓨터 비전: CV는 시각적 입력(픽셀)을 해석하는 분야입니다. 그러나
비디오 이해와 같은 기술은 시각 분석에 시간적 차원을 추가함으로써
이 간극을 메우며, 종종 트랜스포머를 활용해 시각적 콘텐츠가
시간에 따라 어떻게 변화하는지 이해합니다.