Phân tích chuỗi thời gian là một phương pháp thống kê được sử dụng để phân tích chuỗi các điểm dữ liệu được thu thập theo thời gian. Mục tiêu chính là hiểu các mô hình, xu hướng, tính theo mùa và các thành phần theo chu kỳ cơ bản trong dữ liệu để đưa ra quyết định hoặc dự đoán sáng suốt về tương lai. Kỹ thuật này là cơ bản trong nhiều lĩnh vực, tận dụng dữ liệu lịch sử để dự báo các giá trị trong tương lai. Đây là một lĩnh vực chuyên biệt trong Học máy (ML) tập trung cụ thể vào dữ liệu theo thứ tự thời gian.
Các khái niệm cốt lõi
Để hiểu dữ liệu chuỗi thời gian, cần xác định một số thành phần chính:
- Xu hướng: Sự tăng hoặc giảm dài hạn của dữ liệu.
- Tính theo mùa: Các mô hình lặp lại trong một khoảng thời gian cố định, chẳng hạn như biến động hàng ngày, hàng tuần hoặc hàng năm.
- Chu kỳ: Những biến động dài hạn không có thời hạn cố định, thường liên quan đến điều kiện kinh tế hoặc kinh doanh.
- Tiếng ồn/Bất thường: Những biến đổi ngẫu nhiên, không thể đoán trước trong dữ liệu còn lại sau khi tính đến xu hướng, tính theo mùa và chu kỳ.
Phân tích hiệu quả thường đòi hỏi các kỹ thuật xử lý dữ liệu trước , bao gồm xử lý các giá trị bị thiếu và có khả năng chuyển đổi dữ liệu để đạt được tính dừng (trong đó các thuộc tính thống kê như trung bình và phương sai không đổi theo thời gian), đây là yêu cầu đối với một số mô hình truyền thống như ARIMA .
Kỹ thuật và mô hình
Nhiều kỹ thuật khác nhau được sử dụng để Phân tích Chuỗi thời gian:
- Phương pháp cổ điển: Bao gồm các mô hình Trung bình động, Làm mịn theo hàm mũ (như Holt-Winters) và Trung bình động tích hợp tự hồi quy (ARIMA). Đây là những phương pháp thống kê đã được thiết lập tốt.
- Mô hình học máy: Các kỹ thuật như Rừng ngẫu nhiên hoặc Tăng cường độ dốc (ví dụ: XGBoost ) có thể được áp dụng để dự báo chuỗi thời gian, thường bằng cách tạo ra các tính năng bị trễ.
- Mô hình học sâu: Đối với các mẫu phức tạp, Học sâu (DL) cung cấp các công cụ mạnh mẽ. Mạng nơ-ron hồi quy (RNN) , bao gồm LSTM và GRU , được thiết kế để xử lý dữ liệu tuần tự. Gần đây hơn, kiến trúc Transformer , ban đầu được phát triển cho Xử lý ngôn ngữ tự nhiên (NLP) , đã cho thấy hiệu suất mạnh mẽ trong các tác vụ chuỗi thời gian. Các khuôn khổ như PyTorch thường được sử dụng để xây dựng các mô hình này.
Ứng dụng thực tế trong AI/ML
Phân tích chuỗi thời gian rất quan trọng trong nhiều ứng dụng AI và ML:
- Dự báo tài chính: Dự đoán giá cổ phiếu, tỷ giá hối đoái hoặc doanh số bán hàng của công ty dựa trên dữ liệu tài chính lịch sử. Các thuật toán phân tích xu hướng thị trường trong quá khứ và tính theo mùa để dự báo các động thái trong tương lai, hỗ trợ các chiến lược đầu tư và lập kế hoạch tài chính. Khám phá thêm về AI trong Tài chính .
- Dự báo nhu cầu: Các nhà bán lẻ sử dụng phân tích chuỗi thời gian để dự đoán nhu cầu sản phẩm, tối ưu hóa quản lý hàng tồn kho và chuỗi cung ứng. Tương tự, các công ty năng lượng dự báo nhu cầu điện để đảm bảo sự ổn định của lưới điện và phân bổ nguồn lực hiệu quả, hỗ trợ các nỗ lực phát triển bền vững trong năng lượng tái tạo . Xem ví dụ từ Cơ quan Thông tin Năng lượng Hoa Kỳ (EIA) .
Trong khi khác biệt với các tác vụ Thị giác máy tính (CV) như phát hiện đối tượng hoặc phân đoạn hình ảnh được thực hiện bởi các mô hình như Ultralytics YOLO , các khái niệm chuỗi thời gian có thể giao nhau trong phân tích video, trong đó các chuỗi khung hình được phân tích theo thời gian, mặc dù thường liên quan đến các mô hình không gian-thời gian hơn là các phương pháp chuỗi thời gian thuần túy. Quản lý vòng đời của các mô hình này thường liên quan đến các nguyên tắc của Hoạt động học máy (MLOps) và các nền tảng như Ultralytics HUB để thử nghiệm và triển khai . Các công cụ như thư viện Prophet của Meta cũng phổ biến cho các tác vụ dự báo.