시계열 분석은 시간이 지남에 따라 수집된 데이터 포인트의 시퀀스를 분석하는 데 사용되는 통계적 방법입니다. 주요 목표는 데이터의 기본 패턴, 추세, 계절성, 주기적 요소를 이해하여 미래에 대한 정보에 입각한 의사 결정이나 예측을 내리는 것입니다. 이 기술은 과거 데이터를 활용하여 미래 가치를 예측하는 다양한 분야에서 기본이 되는 기술입니다. 특히 시간순으로 정렬된 데이터에 초점을 맞춘 머신러닝(ML)의 전문 영역입니다.
핵심 개념
시계열 데이터를 이해하려면 몇 가지 핵심 요소를 파악해야 합니다:
- 추세: 추세: 데이터의 장기적인 증가 또는 감소입니다.
- 계절성: 일별, 주별 또는 연간 변동과 같이 일정 기간 동안 반복되는 패턴입니다.
- 주기: 주기: 경제 또는 비즈니스 상황과 관련된 고정된 기간이 아닌 장기적인 변동으로, 종종 경제 또는 비즈니스 상황과 관련이 있습니다.
- 노이즈/불규칙성: 추세, 계절성, 주기를 고려한 후에도 남아있는 데이터의 무작위적이고 예측할 수 없는 변동입니다.
효과적인 분석을 위해서는 종종 결측치 처리, 평균 및 분산과 같은 통계적 특성이 시간에 따라 일정하게 유지되도록 데이터를 변환하는 등 데이터 전처리 기술이 필요한데, 이는 ARIMA와 같은 일부 기존 모델에 필요한 요건입니다.
기술 및 모델
시계열 분석에는 다양한 기법이 사용됩니다:
- 고전적인 방법: 이동 평균, 지수 평활법(홀트-윈터스 등), 자동 회귀 통합 이동 평균(ARIMA) 모델 등. 이 방법에는 이동 평균, 지수 평활법, 자동 회귀 통합 이동 평균이 포함됩니다. 이러한 방법은 잘 정립된 통계적 접근 방식입니다.
- 머신 러닝 모델: 랜덤 포레스트 또는 그라데이션 부스팅(예: XGBoost)과 같은 기법을 시계열 예측에 적용하여 지연된 피처를 생성할 수 있습니다.
- 딥 러닝 모델: 복잡한 패턴의 경우, 딥러닝(DL) 은 강력한 도구를 제공합니다. LSTM과 GRU를 포함한 순환 신경망(RNN)은 순차적 데이터를 처리하도록 설계되었습니다. 최근에는 자연어 처리(NLP)를 위해 처음 개발된 Transformer 아키텍처가 시계열 작업에서 강력한 성능을 보여주고 있습니다. 다음과 같은 프레임워크 PyTorch 와 같은 프레임워크가 이러한 모델을 구축하는 데 일반적으로 사용됩니다.
AI/ML의 실제 애플리케이션
시계열 분석은 많은 AI 및 ML 애플리케이션에서 매우 중요합니다:
- 재무 예측: 과거 재무 데이터를 기반으로 주가, 환율 또는 회사 매출을 예측합니다. 알고리즘은 과거 시장 동향과 계절성을 분석하여 미래의 움직임을 예측함으로써 투자 전략과 재무 계획을 지원합니다. 금융 분야의 AI에 대해 자세히 알아보세요.
- 수요 예측: 소매업체는 시계열 분석을 통해 제품 수요를 예측하여 재고 관리와 공급망을 최적화합니다. 마찬가지로 에너지 회사는 전력 수요를 예측하여 그리드 안정성과 효율적인 자원 배분을 보장하고 재생 에너지의 지속 가능성 노력을 지원합니다. 미국 에너지 정보국(EIA)의 사례를 참조하세요.
Ultralytics YOLO 같은 모델이 수행하는 객체 감지나 이미지 분할과 같은 컴퓨터 비전(CV) 작업과는 구별되지만, 순수한 시계열 방법보다는 공간-시간 모델을 사용하는 경우가 많지만, 프레임의 시퀀스를 시간에 따라 분석하는 비디오 분석에서는 시계열 개념이 교차할 수 있습니다. 이러한 모델의 수명 주기를 관리하기 위해서는 실험 및 배포를 위한 머신 러닝 운영(MLOps ) 원칙과 Ultralytics HUB와 같은 플랫폼이 필요한 경우가 많습니다. Meta의 Prophet 라이브러리와 같은 도구도 예측 작업에 널리 사용됩니다.