Bảng chú giải thuật ngữ

Gán Nhãn Dữ Liệu (Data Labeling)

Tìm hiểu những kiến thức cơ bản về gắn nhãn dữ liệu cho máy học. Khám phá các loại gắn nhãn quan trọng như phát hiện đối tượng và cách tăng tốc quy trình làm việc bằng cách sử dụng chúng. Ultralytics YOLO26.

Việc gắn nhãn dữ liệu là quá trình cơ bản để xác định dữ liệu thô—chẳng hạn như hình ảnh, khung hình video, văn bản hoặc âm thanh—và thêm các thẻ hoặc siêu dữ liệu có ý nghĩa để cung cấp ngữ cảnh. Trong lĩnh vực học máy (ML) , các thuật toán không thể tự hiểu thế giới vật lý; chúng cần một "người hướng dẫn" để chỉ bảo. Sự hướng dẫn này đến từ các tập dữ liệu được gắn nhãn được sử dụng trong quá trình học có giám sát . Các nhãn này đóng vai trò là dữ liệu tham chiếu , đại diện cho các câu trả lời chính xác mà mô hình cố gắng dự đoán. Cho dù huấn luyện một bộ phân loại đơn giản hay một kiến trúc phức tạp như Ultralytics YOLO26 , độ chính xác, tính nhất quán và chất lượng của các nhãn này là những yếu tố quyết định chính đến sự thành công của mô hình.

Ghi nhãn dữ liệu so với chú thích dữ liệu

Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau trong các cuộc trò chuyện thông thường, nhưng có một sự khác biệt tinh tế đáng chú ý. "Gán nhãn dữ liệu" thường đề cập đến hành động rộng rãi là gán một danh mục hoặc thẻ cho một mẩu dữ liệu (ví dụ: gắn thẻ email là "thư rác"). Ngược lại, chú thích dữ liệu thường cụ thể hơn trong lĩnh vực thị giác máy tính (CV) , liên quan đến việc xác định chính xác các đối tượng bằng cách sử dụng hộp giới hạn, đa giác hoặc điểm đặc trưng. Tuy nhiên, trong hầu hết các quy trình vận hành học máy (MLOps) , cả hai thuật ngữ đều mô tả việc tạo ra dữ liệu huấn luyện chất lượng cao.

Các loại chính trong thị giác máy tính

Phương pháp gắn nhãn thay đổi tùy thuộc vào nhiệm vụ mà mô hình phải thực hiện. Các loại phổ biến bao gồm:

Phân loại hình ảnh : Gán một nhãn duy nhất cho toàn bộ hình ảnh, chẳng hạn như xác định điều kiện thời tiết là "có mây" hoặc "nắng".
Phát hiện đối tượng : Vẽ các khung hình chữ nhật 2D xung quanh các đối tượng riêng biệt để dạy cho mô hình biết đối tượng đó là gì và vị trí của nó.
Phân đoạn đối tượng : Tạo mặt nạ hoặc đa giác chính xác đến từng pixel xung quanh các đối tượng, điều này rất cần thiết để xác định hình dạng và ranh giới chính xác.
Ước lượng tư thế : Đánh dấu các điểm mấu chốt cụ thể trên đối tượng, chẳng hạn như các khớp xương, để phân tích chuyển động hoặc tư thế.

Các Ứng dụng Thực tế

Tính hữu ích của việc gắn nhãn dữ liệu trải rộng hầu như trong mọi ngành công nghiệp sử dụng trí tuệ nhân tạo.

Xe tự lái: Xe tự lái dựa trên các tập dữ liệu khổng lồ, trong đó mọi phương tiện, người đi bộ, biển báo giao thông và vạch kẻ làn đường đều được dán nhãn một cách tỉ mỉ. Dữ liệu được dán nhãn này cho phép hệ thống nhận thức điều hướng trong môi trường phức tạp một cách an toàn. Các công ty sản xuất xe tự lái đầu tư mạnh vào việc dán nhãn ở cấp độ pixel để đảm bảo tuân thủ các quy định an toàn.
Nông nghiệp chính xác: Trong nền nông nghiệp hiện đại, trí tuệ nhân tạo (AI) được sử dụng để detect Các bệnh hại cây trồng hoặc theo dõi các giai đoạn sinh trưởng. Nông dân sử dụng các mô hình được huấn luyện trên hình ảnh được dán nhãn về lá "khỏe mạnh" so với lá "bị bệnh" để tự động hóa việc xử lý, giảm việc sử dụng hóa chất và tăng năng suất.

Quy trình ghi nhãn

Việc tạo ra một tập dữ liệu được gắn nhãn thường là phần tốn nhiều thời gian nhất trong một dự án AI. Quá trình này thường liên quan đến phương pháp "Con người tham gia vào vòng lặp" (Human-in-the-Loop - HITL), trong đó người gắn nhãn sẽ xác minh các nhãn để đảm bảo độ chính xác cao. Các quy trình làm việc hiện đại tận dụng các công cụ như Nền tảng Ultralytics , giúp đơn giản hóa việc quản lý tập dữ liệu và cho phép các nhóm cộng tác trong việc gắn nhãn. Các kỹ thuật tiên tiến như học chủ động cũng có thể được sử dụng, trong đó mô hình gắn nhãn trước cho dữ liệu, và con người chỉ sửa các dự đoán có độ tin cậy thấp, giúp tăng tốc đáng kể quá trình.

Ví dụ sau đây minh họa cách sử dụng mô hình YOLO26 đã được huấn luyện trước để tự động tạo nhãn (gán nhãn tự động) cho một hình ảnh mới, sau đó có thể được chỉnh sửa bởi con người:

from ultralytics import YOLO

# Load the YOLO26n model (nano version)
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Save the detection results to a text file in standard YOLO format
# This file can now be used as a starting point for data labeling
results[0].save_txt("bus_labels.txt")

Gán Nhãn Dữ Liệu (Data Labeling)

Xe lửa Ultralytics YOLO các mô hình để hợp lý hóa quy trình làm việc trên khắp các ngành công nghiệp

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Ghi nhãn dữ liệu so với chú thích dữ liệu

Các loại chính trong thị giác máy tính

Các Ứng dụng Thực tế

Quy trình ghi nhãn

Đọc thêm trong danh mục này

12 trường hợp sử dụng ảnh chụp từ trên không được hỗ trợ bởi thị giác máy tính

Ước lượng độ sâu đơn ảnh là gì? Tổng quan

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tham gia Ultralytics cộng đồng