Khám phá cách học không giám sát sử dụng phân cụ, giảm chiều và phát hiện bất thường để khám phá các mẫu ẩn trong dữ liệu.
Học không giám sát là một loại học máy (ML) trong đó các thuật toán học các mẫu từ dữ liệu không có nhãn. Không giống như học có giám sát , dựa trên các nhãn được xác định trước hoặc 'câu trả lời đúng', các phương pháp không giám sát khám phá cấu trúc vốn có của dữ liệu để khám phá các mối quan hệ, nhóm hoặc bất thường ẩn mà không cần hướng dẫn trước. Cách tiếp cận này đặc biệt hữu ích trong Trí tuệ nhân tạo (AI) để khám phá dữ liệu ban đầu và hiểu các tập dữ liệu phức tạp mà việc dán nhãn là không thực tế hoặc không thể. Nó cho phép các mô hình khám phá các mẫu và thông tin chi tiết trực tiếp từ dữ liệu.
Mục tiêu chính của học không giám sát là mô hình hóa cấu trúc hoặc phân phối cơ bản trong dữ liệu để tìm hiểu thêm về nó. Các thuật toán được để tự khám phá ra điểm tương đồng, khác biệt và cấu trúc. Các kỹ thuật phổ biến bao gồm:
Các kỹ thuật học không giám sát được sử dụng trong nhiều tình huống thực tế khác nhau, đặc biệt là khi xử lý khối lượng lớn dữ liệu không có nhãn:
Học không giám sát đóng vai trò quan trọng trong việc hiểu được khối lượng lớn dữ liệu thô, chưa được gắn nhãn đặc trưng của Dữ liệu lớn . Nó thường đóng vai trò là bước thiết yếu trong quá trình xử lý trước dữ liệu và kỹ thuật tính năng , giúp khám phá các cấu trúc ẩn hoặc giảm độ phức tạp của dữ liệu trước khi áp dụng các kỹ thuật ML khác. Trong khi các mô hình như Ultralytics YOLO chủ yếu được đào tạo bằng các phương pháp có giám sát cho các nhiệm vụ như phát hiện đối tượng , việc hiểu các cấu trúc dữ liệu thông qua các phương pháp không có giám sát có thể hỗ trợ đáng kể trong việc chuẩn bị và phân tích tập dữ liệu, có khả năng cải thiện hiệu suất mô hình. Bạn có thể khám phá các hướng dẫn thu thập và chú thích dữ liệu để chuẩn bị tập dữ liệu và quản lý dữ liệu và mô hình của mình bằng các nền tảng như Ultralytics HUB .
Điều quan trọng là phải phân biệt học không giám sát với các mô hình Học sâu (DL) và ML có liên quan:
Học không giám sát vẫn là lĩnh vực cơ bản của ML, thúc đẩy khám phá và hiểu biết trong các tập dữ liệu phức tạp, nơi nhãn khan hiếm hoặc không có sẵn.