Khám phá học có giám sát trong trí tuệ nhân tạo. Tìm hiểu cách các mô hình như... Ultralytics YOLO26 sử dụng dữ liệu được gắn nhãn cho phân loại và hồi quy để đạt được kết quả có độ chính xác cao.
Học có giám sát là một phương pháp nền tảng trong trí tuệ nhân tạo (AI), trong đó các thuật toán được huấn luyện trên dữ liệu đầu vào đã được gắn nhãn với đầu ra chính xác. Trong phương pháp này, mô hình học bằng cách so sánh các dự đoán của chính nó với các nhãn được cung cấp, về cơ bản là có một "người giám sát" để sửa lỗi trong quá trình huấn luyện. Mục tiêu chính là để hệ thống học được hàm ánh xạ từ đầu vào sang đầu ra đủ tốt để nó có thể dự đoán chính xác các nhãn cho dữ liệu thử nghiệm mới, chưa từng thấy. Kỹ thuật này là động lực thúc đẩy nhiều ứng dụng AI thực tiễn và thành công nhất hiện nay, từ bộ lọc thư rác đến hệ thống lái xe tự động.
Quy trình của học có giám sát xoay quanh việc sử dụng dữ liệu được gán nhãn . Một tập dữ liệu được biên soạn, trong đó mỗi ví dụ huấn luyện được ghép nối với một nhãn "thực tế" tương ứng. Trong giai đoạn huấn luyện mô hình , thuật toán xử lý các đặc trưng đầu vào và tạo ra dự đoán. Một công thức toán học được gọi là hàm mất mát sau đó đo lường lỗi—sự khác biệt giữa dự đoán của mô hình và nhãn thực tế.
Để giảm thiểu lỗi này, một thuật toán tối ưu hóa , chẳng hạn như Thuật toán Giảm Độ Phức Ngẫu Nhiên ( SGD ) , sẽ điều chỉnh lặp đi lặp lại các tham số nội bộ hoặc trọng số của mô hình. Quá trình này lặp lại qua nhiều chu kỳ, được gọi là epoch , cho đến khi mô hình đạt được mức độ chính xác thỏa đáng mà không bị quá khớp với dữ liệu huấn luyện. Các công cụ như Nền tảng Ultralytics đơn giản hóa toàn bộ quy trình này bằng cách quản lý việc chú thích tập dữ liệu, huấn luyện và đánh giá trong một môi trường thống nhất.
Các bài toán học có giám sát thường được phân loại thành hai loại chính dựa trên bản chất của biến mục tiêu:
Học có giám sát là nền tảng của rất nhiều công nghệ trong các ngành công nghiệp khác nhau:
Điều quan trọng là phải phân biệt giữa học có giám sát và học không giám sát . Trong khi học có giám sát dựa trên các cặp đầu vào-đầu ra được gắn nhãn, học không giám sát hoạt động với dữ liệu không được gắn nhãn. Trong các trường hợp không giám sát, thuật toán cố gắng tự tìm ra các cấu trúc, mẫu hoặc nhóm ẩn trong dữ liệu, chẳng hạn như phân khúc khách hàng trong tiếp thị. Học có giám sát thường chính xác hơn đối với các nhiệm vụ cụ thể khi có sẵn dữ liệu lịch sử, trong khi học không giám sát phù hợp hơn cho việc phân tích dữ liệu mang tính khám phá.
Học có giám sát là yếu tố cốt lõi trong việc huấn luyện các mô hình thị giác máy tính hiện đại. Những điều sau đây Python Đoạn mã này minh họa cách huấn luyện mô hình YOLO26 bằng cách sử dụng tập dữ liệu có giám sát ( COCO8 Mô hình học hỏi từ các hình ảnh được gắn nhãn trong tập dữ liệu để detect các đối tượng.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model using the 'coco8.yaml' dataset (supervised learning)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
# The model is now fine-tuned based on the supervised labels in the dataset
Quy trình đơn giản này tận dụng sức mạnh của PyTorch để thực hiện các phép toán ma trận phức tạp và tính toán đạo hàm. Đối với những người muốn đơn giản hóa khía cạnh quản lý dữ liệu, Nền tảng Ultralytics cung cấp các công cụ huấn luyện dựa trên đám mây và tự động chú thích, giúp quy trình học có giám sát hiệu quả hơn đáng kể.