Học có giám sát
Khám phá cách học có giám sát hỗ trợ AI bằng dữ liệu được gắn nhãn, cho phép dự đoán chính xác và ứng dụng như phát hiện đối tượng và phân tích tình cảm.
Học có giám sát là một mô hình cơ bản trong học máy (ML), trong đó một thuật toán học từ dữ liệu đã được gắn nhãn thủ công với các kết quả chính xác. Mục tiêu chính là học một hàm ánh xạ có thể dự đoán đầu ra cho dữ liệu mới, chưa được biết đến. Hãy hình dung việc học này giống như việc học với một giáo viên hoặc một "người giám sát", người cung cấp các câu trả lời chính xác (nhãn) trong giai đoạn đào tạo. Phương pháp này là nền tảng của nhiều ứng dụng Trí tuệ Nhân tạo (AI) thành công, đặc biệt là trong thị giác máy tính (CV) .
Học có giám sát hoạt động như thế nào
Quá trình học có giám sát bắt đầu với một tập dữ liệu được chọn lọc chứa các đặc trưng đầu vào và nhãn đầu ra tương ứng. Tập dữ liệu được gắn nhãn này được chia thành dữ liệu huấn luyện , dữ liệu xác thực và dữ liệu kiểm tra .
- Huấn luyện: Mô hình được cung cấp dữ liệu huấn luyện . Nó đưa ra dự đoán cho từng đầu vào và so sánh chúng với các nhãn chính xác.
- Sửa lỗi: Sự khác biệt giữa dự đoán của mô hình và nhãn thực tế được định lượng bằng hàm mất mát . Một thuật toán tối ưu hóa , chẳng hạn như giảm dần độ dốc , sẽ điều chỉnh các tham số nội bộ của mô hình, hay trọng số mô hình , để giảm thiểu lỗi này.
- Lặp lại: Quá trình này được lặp lại qua nhiều kỷ nguyên , cho phép mô hình học các mẫu cơ bản trong dữ liệu. Hiệu suất của mô hình được theo dõi trên tập xác thực để ngăn ngừa các vấn đề như quá khớp .
- Dự đoán: Sau khi được huấn luyện, mô hình có thể đưa ra dự đoán trên dữ liệu mới, chưa được gắn nhãn. Chất lượng của những dự đoán này được đánh giá bằng bộ kiểm tra và các chỉ số hiệu suất .
Toàn bộ quy trình làm việc này được sắp xếp hợp lý trên các nền tảng như Ultralytics HUB , giúp đơn giản hóa việc quản lý tập dữ liệu, đào tạo mô hình và triển khai .
Các loại vấn đề học có giám sát
Nhiệm vụ học có giám sát thường được phân loại thành hai loại chính:
- Phân loại : Mục tiêu là dự đoán một danh mục hoặc nhãn lớp riêng biệt. Ví dụ, một mô hình phân loại hình ảnh có thể được huấn luyện để phân loại hình ảnh chứa "mèo" hoặc "chó". Các ví dụ khác bao gồm phát hiện email rác và phân tích cảm xúc. Các mô hình như Ultralytics YOLO có thể được huấn luyện cho các tác vụ phân loại hiệu suất cao. Để tìm hiểu thêm, hãy khám phá phần giới thiệu về phân loại này.
- Hồi quy : Mục tiêu là dự đoán một giá trị số liên tục. Ví dụ, một mô hình có thể dự đoán giá của một ngôi nhà dựa trên các đặc điểm như kích thước và vị trí của nó. Các ứng dụng khác bao gồm dự báo giá cổ phiếu và dự báo nhiệt độ. Tổng quan về hồi quy có thể được tìm thấy trong hướng dẫn phân tích hồi quy này.
Ứng dụng trong thế giới thực
Học có giám sát thúc đẩy vô số hệ thống AI hiện đại. Dưới đây là hai ví dụ nổi bật:
- Phát hiện Đối tượng trong Xe Tự hành: Xe tự lái dựa vào các mô hình phát hiện đối tượng để xác định và định vị người đi bộ, các phương tiện khác và biển báo giao thông. Các mô hình này được đào tạo trên các tập dữ liệu khổng lồ, trong đó các đối tượng trong hình ảnh được gắn nhãn bằng các hộp giới hạn . Mô hình đã được đào tạo sau đó có thể xử lý nguồn cấp dữ liệu video theo thời gian thực để đưa ra các quyết định lái xe quan trọng. Ultralytics cung cấp các giải pháp AI mạnh mẽ trong ngành công nghiệp ô tô .
- Phân tích hình ảnh y tế: Trong chăm sóc sức khỏe, các mô hình học có giám sát được sử dụng để phân tích hình ảnh y tế , chẳng hạn như phát hiện khối u trong chụp MRI hoặc CT. Các bác sĩ X quang sẽ dán nhãn một số lượng lớn hình ảnh chụp, cho biết sự hiện diện hoặc vắng mặt của khối u. Sau đó, một mạng nơ-ron tích chập (CNN) được huấn luyện trên dữ liệu này để hỗ trợ chẩn đoán sớm. Ví dụ, các mô hình có thể được huấn luyện trên các tập dữ liệu để phát hiện khối u não .
So sánh với các mô hình học tập khác
Học có giám sát khác biệt với các mô hình học máy cơ bản khác:
- Học không giám sát : Phương pháp này sử dụng dữ liệu không có nhãn, trong đó thuật toán cố gắng tự tìm các mẫu hoặc cấu trúc, chẳng hạn như nhóm các điểm dữ liệu tương tự ( phân cụm ) hoặc giảm kích thước dữ liệu. Nó không học ánh xạ đầu vào-đầu ra trực tiếp từ các câu trả lời đã biết. Đọc Tổng quan về Học không giám sát .
- Học tự giám sát (SSL) : Một tập hợp con của học không giám sát, trong đó các tín hiệu giám sát (nhãn) được tạo tự động từ chính dữ liệu đầu vào. Đây là một kỹ thuật mạnh mẽ để huấn luyện trước các mô hình nền tảng trên một lượng lớn dữ liệu chưa được gắn nhãn trước khi tinh chỉnh chúng cho một tác vụ cụ thể.
- Học Tăng cường : Trong mô hình này, một tác nhân học cách đưa ra chuỗi quyết định bằng cách tương tác với môi trường và nhận phần thưởng hoặc hình phạt dựa trên hành động của mình. Tác nhân học các hành vi tối ưu thông qua thử nghiệm và sai sót, thay vì từ một tập dữ liệu tĩnh được gắn nhãn. Khám phá Tổng quan về Học Tăng cường .
Tóm lại, học có giám sát là một kỹ thuật mạnh mẽ và được sử dụng rộng rãi, tận dụng dữ liệu được gắn nhãn để đào tạo các mô hình cho các nhiệm vụ dự đoán. Nó tạo thành xương sống của nhiều ứng dụng AI thành công, bao gồm cả những ứng dụng được Ultralytics phát triển và hỗ trợ, và là một kỹ năng quan trọng đối với bất kỳ ai làm việc trong khoa học dữ liệu hoặc AI.