Thuật ngữ

Học có giám sát

Khám phá cách học có giám sát hỗ trợ AI bằng dữ liệu được gắn nhãn, cho phép dự đoán chính xác và ứng dụng như phát hiện đối tượng và phân tích tình cảm.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Học có giám sát là một phạm trù cơ bản của học máy (ML), trong đó các thuật toán học từ một tập dữ liệu chứa các cặp đầu vào-đầu ra, được gọi là dữ liệu được gắn nhãn. Về bản chất, thuật toán được "giám sát" vì nó học bằng cách so sánh các dự đoán của nó trên dữ liệu đầu vào với các đầu ra chính xác đã biết (nhãn) được cung cấp trong dữ liệu đào tạo . Mục tiêu là để thuật toán học một hàm ánh xạ có thể dự đoán chính xác đầu ra cho các đầu vào mới, chưa từng thấy. Cách tiếp cận này là trọng tâm của nhiều ứng dụng Trí tuệ nhân tạo (AI) hiện đại, cho phép các hệ thống đưa ra dự đoán hoặc quyết định dựa trên các ví dụ lịch sử.

Học có giám sát hoạt động như thế nào

Quá trình bắt đầu với một tập dữ liệu trong đó mỗi điểm dữ liệu bao gồm các tính năng đầu vào và nhãn đầu ra chính xác tương ứng. Ví dụ, trong một tác vụ phân loại hình ảnh , các đầu vào sẽ là hình ảnh và nhãn sẽ là các danh mục mà chúng thuộc về (ví dụ: 'mèo', 'chó'). Thuật toán lặp đi lặp lại đưa ra dự đoán trên dữ liệu đào tạo và điều chỉnh các tham số nội bộ của nó bằng cách sử dụng thuật toán tối ưu hóa như giảm dần độ dốc để giảm thiểu sự khác biệt giữa các dự đoán của nó và các nhãn thực tế, được đo bằng hàm mất mát . Quá trình đào tạo này tiếp tục cho đến khi mô hình đạt được mức độ chính xác thỏa đáng trên dữ liệu xác thực .

Sự liên quan và ứng dụng

Học có giám sát cực kỳ linh hoạt và hỗ trợ một loạt các ứng dụng trong đó dữ liệu lịch sử có thể dự đoán các sự kiện trong tương lai hoặc phân loại thông tin mới. Khả năng học trực tiếp từ các ví dụ được gắn nhãn của nó làm cho nó phù hợp với các tác vụ đòi hỏi độ chính xác cao. Nhiều tác vụ thị giác máy tính phụ thuộc rất nhiều vào học có giám sát, bao gồm cả những tác vụ được thực hiện bởi các mô hình như Ultralytics YOLO .

Sau đây là hai ví dụ cụ thể:

  1. Phân tích hình ảnh y tế: Các mô hình học có giám sát có thể được đào tạo trên các tập dữ liệu quét y tế (như X-quang hoặc MRI) được các bác sĩ X quang dán nhãn. Ví dụ, một mô hình có thể học cách phát hiện khối u trong hình ảnh y tế bằng cách được đào tạo trên các hình ảnh được dán nhãn là 'khối u' hoặc 'không có khối u'. Điều này hỗ trợ các bác sĩ trong việc chẩn đoán và lập kế hoạch điều trị, đóng góp đáng kể vào các giải pháp AI trong chăm sóc sức khỏe .
  2. Phân tích tình cảm: Các doanh nghiệp thường muốn hiểu ý kiến của khách hàng từ dữ liệu văn bản như đánh giá hoặc bài đăng trên mạng xã hội. Một mô hình được giám sát có thể được đào tạo trên các ví dụ văn bản được gắn nhãn tình cảm ('tích cực', 'tiêu cực', 'trung lập'). Sau khi được đào tạo, nó có thể tự động phân loại văn bản mới, cung cấp thông tin chi tiết có giá trị cho nghiên cứu thị trường và dịch vụ khách hàng. Tìm hiểu thêm về phân tích tình cảm .

Các ứng dụng phổ biến khác bao gồm phát hiện đối tượng trong hình ảnh và video (được sử dụng trong xe tự hành và hệ thống an ninh), lọc email rác, dự đoán giá nhà (nhiệm vụ hồi quy ) và nhận dạng khuôn mặt .

Các khái niệm chính

Một số khái niệm quan trọng để hiểu về học có giám sát:

  • Dữ liệu được gắn nhãn: Nền tảng của học có giám sát, bao gồm dữ liệu đầu vào được ghép nối với nhãn đầu ra chính xác. Thu thập dữ liệu chất lượng cao và chú thích là rất quan trọng.
  • Tính năng: Các biến đầu vào có thể đo lường hoặc các đặc điểm được mô hình sử dụng để đưa ra dự đoán. Kỹ thuật tính năng có thể tác động đáng kể đến hiệu suất.
  • Nhãn (hoặc Mục tiêu): Giá trị đầu ra chính xác liên quan đến các tính năng đầu vào trong dữ liệu đào tạo.
  • Phân loại: Một loại nhiệm vụ học có giám sát trong đó mục tiêu là dự đoán nhãn danh mục riêng biệt (ví dụ: phân loại email là 'thư rác' hoặc 'không phải thư rác' hoặc hình ảnh thành các lớp khác nhau bằng cách sử dụng các mô hình như YOLO để phân loại ).
  • Hồi quy: Một loại nhiệm vụ học có giám sát trong đó mục tiêu là dự đoán một giá trị số liên tục (ví dụ: dự đoán nhiệt độ, giá cổ phiếu hoặc giá trị nhà ở bằng các thuật toán như hồi quy tuyến tính ).
  • Thuật toán phổ biến: Bao gồm các phương pháp như Hồi quy logistic , Máy vectơ hỗ trợ (SVM) , Cây quyết định , Rừng ngẫu nhiên và nhiều loại Mạng nơ-ron (NN) , đặc biệt là Mạng nơ-ron tích chập (CNN) cho các tác vụ liên quan đến hình ảnh, thường được triển khai bằng các nền tảng như PyTorch .

So sánh với các mô hình học tập khác

Học có giám sát khác biệt với các mô hình học máy cơ bản khác:

  • Học không giám sát : Thuật toán học các mẫu từ dữ liệu không có nhãn mà không cần hướng dẫn rõ ràng. Các tác vụ phổ biến bao gồm phân cụm (nhóm các điểm dữ liệu tương tự) và giảm chiều (đơn giản hóa dữ liệu). Nó được sử dụng khi dữ liệu có nhãn không khả dụng hoặc mục tiêu là khám phá các cấu trúc ẩn.
  • Học tăng cường : Thuật toán học bằng cách tương tác với môi trường và nhận phản hồi dưới dạng phần thưởng hoặc hình phạt. Mục tiêu là học một chính sách (chiến lược lựa chọn hành động) giúp tối đa hóa phần thưởng tích lũy theo thời gian. Nó thường được sử dụng trong robot, trò chơi và hệ thống dẫn đường.

Tóm lại, học có giám sát là một kỹ thuật mạnh mẽ tận dụng dữ liệu được gắn nhãn để đào tạo các mô hình cho các nhiệm vụ dự đoán, tạo thành xương sống của nhiều ứng dụng AI thành công, bao gồm cả những ứng dụng được phát triển và hỗ trợ bởi Ultralytics và các nền tảng như Ultralytics HUB .

Đọc tất cả