Tìm hiểu những kiến thức cơ bản về gắn nhãn dữ liệu cho máy học. Khám phá các loại gắn nhãn quan trọng như phát hiện đối tượng và cách tăng tốc quy trình làm việc bằng cách sử dụng chúng. Ultralytics YOLO26.
Việc gắn nhãn dữ liệu là quá trình cơ bản để xác định dữ liệu thô—chẳng hạn như hình ảnh, khung hình video, văn bản hoặc âm thanh—và thêm các thẻ hoặc siêu dữ liệu có ý nghĩa để cung cấp ngữ cảnh. Trong lĩnh vực học máy (ML) , các thuật toán không thể tự hiểu thế giới vật lý; chúng cần một "người hướng dẫn" để chỉ bảo. Sự hướng dẫn này đến từ các tập dữ liệu được gắn nhãn được sử dụng trong quá trình học có giám sát . Các nhãn này đóng vai trò là dữ liệu tham chiếu , đại diện cho các câu trả lời chính xác mà mô hình cố gắng dự đoán. Cho dù huấn luyện một bộ phân loại đơn giản hay một kiến trúc phức tạp như Ultralytics YOLO26 , độ chính xác, tính nhất quán và chất lượng của các nhãn này là những yếu tố quyết định chính đến sự thành công của mô hình.
Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau trong các cuộc trò chuyện thông thường, nhưng có một sự khác biệt tinh tế đáng chú ý. "Gán nhãn dữ liệu" thường đề cập đến hành động rộng rãi là gán một danh mục hoặc thẻ cho một mẩu dữ liệu (ví dụ: gắn thẻ email là "thư rác"). Ngược lại, chú thích dữ liệu thường cụ thể hơn trong lĩnh vực thị giác máy tính (CV) , liên quan đến việc xác định chính xác các đối tượng bằng cách sử dụng hộp giới hạn, đa giác hoặc điểm đặc trưng. Tuy nhiên, trong hầu hết các quy trình vận hành học máy (MLOps) , cả hai thuật ngữ đều mô tả việc tạo ra dữ liệu huấn luyện chất lượng cao.
Phương pháp gắn nhãn thay đổi tùy thuộc vào nhiệm vụ mà mô hình phải thực hiện. Các loại phổ biến bao gồm:
Tính hữu ích của việc gắn nhãn dữ liệu trải rộng hầu như trong mọi ngành công nghiệp sử dụng trí tuệ nhân tạo.
Việc tạo ra một tập dữ liệu được gắn nhãn thường là phần tốn nhiều thời gian nhất trong một dự án AI. Quá trình này thường liên quan đến phương pháp "Con người tham gia vào vòng lặp" (Human-in-the-Loop - HITL), trong đó người gắn nhãn sẽ xác minh các nhãn để đảm bảo độ chính xác cao. Các quy trình làm việc hiện đại tận dụng các công cụ như Nền tảng Ultralytics , giúp đơn giản hóa việc quản lý tập dữ liệu và cho phép các nhóm cộng tác trong việc gắn nhãn. Các kỹ thuật tiên tiến như học chủ động cũng có thể được sử dụng, trong đó mô hình gắn nhãn trước cho dữ liệu, và con người chỉ sửa các dự đoán có độ tin cậy thấp, giúp tăng tốc đáng kể quá trình.
Ví dụ sau đây minh họa cách sử dụng mô hình YOLO26 đã được huấn luyện trước để tự động tạo nhãn (gán nhãn tự động) cho một hình ảnh mới, sau đó có thể được chỉnh sửa bởi con người:
from ultralytics import YOLO
# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")
# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")