Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Học với Số Lượng Mẫu Ít (Few-Shot Learning)

Khám phá Học tập với Số lượng Dữ liệu Tối thiểu (FSL) để huấn luyện AI với lượng dữ liệu tối thiểu. Tìm hiểu cách thực hiện. Ultralytics YOLO26 tận dụng siêu học máy để thích ứng nhanh chóng và đạt độ chính xác cao.

Học ít dữ liệu (Few-Shot Learning - FSL) là một lĩnh vực chuyên biệt của học máy (ML) được thiết kế để huấn luyện các mô hình nhận dạng và classify FSL (Floating Learning Learning) tạo ra các khái niệm mới bằng cách sử dụng một số lượng rất nhỏ các ví dụ được gắn nhãn. Trong học sâu truyền thống (DL) , để đạt được độ chính xác cao thường cần các tập dữ liệu khổng lồ chứa hàng nghìn hình ảnh cho mỗi danh mục. Tuy nhiên, FSL mô phỏng khả năng nhận thức của con người để khái quát hóa nhanh chóng từ kinh nghiệm hạn chế — giống như một đứa trẻ có thể nhận ra một con hươu cao cổ sau khi chỉ nhìn thấy một hoặc hai bức tranh trong một cuốn sách. Khả năng này rất cần thiết để triển khai trí tuệ nhân tạo (AI) trong các trường hợp thu thập một lượng lớn dữ liệu huấn luyện là quá tốn kém, mất thời gian hoặc gần như không thể thực hiện được.

Cơ chế cốt lõi của việc học ít lần

Mục tiêu chính của FSL là giảm sự phụ thuộc vào việc thu thập dữ liệu rộng rãi bằng cách tận dụng kiến thức có sẵn. Thay vì học các mẫu từ đầu, mô hình sử dụng "tập dữ liệu hỗ trợ" chứa một vài ví dụ đã được gắn nhãn để hiểu các lớp mới. Điều này thường đạt được thông qua các kỹ thuật tiên tiến như siêu học , hay còn gọi là "học cách học". Trong mô hình này, mô hình được huấn luyện trên nhiều nhiệm vụ khác nhau để học được quy tắc khởi tạo hoặc cập nhật tối ưu, cho phép nó thích ứng với các nhiệm vụ mới với sự điều chỉnh tối thiểu.

Một phương pháp phổ biến khác liên quan đến học dựa trên số liệu, trong đó mô hình học cách ánh xạ dữ liệu đầu vào vào không gian vectơ bằng cách sử dụng các embedding . Trong không gian này, các mục tương tự được nhóm lại gần nhau trong khi các mục không giống nhau bị đẩy ra xa. Các thuật toán như Mạng Nguyên mẫu (Prototypical Networks) tính toán một biểu diễn trung bình, hay nguyên mẫu, cho mỗi lớp và classify Các mẫu truy vấn mới được tạo ra dựa trên khoảng cách của chúng đến các nguyên mẫu này. Điều này thường dựa vào khả năng trích xuất đặc trưng được phát triển trong quá trình huấn luyện trước trên các tập dữ liệu tổng quát lớn hơn.

Các Ứng dụng Thực tế

Học máy dựa trên dữ liệu ít (Few-Shot Learning) đang làm thay đổi các ngành công nghiệp nơi mà trước đây sự khan hiếm dữ liệu đã cản trở việc áp dụng các công nghệ AI.

Chẩn đoán và hình ảnh y tế

Trong lĩnh vực phân tích hình ảnh y tế , việc thu thập hàng nghìn hình ảnh quét được dán nhãn cho các bệnh lý hiếm gặp thường là điều không khả thi. FSL cho phép các nhà nghiên cứu huấn luyện các hệ thống thị giác máy tính (CV) để... detect Chỉ cần sử dụng một số ít nghiên cứu trường hợp được chú thích, người ta có thể xác định các loại khối u hiếm gặp hoặc các bất thường di truyền cụ thể. Khả năng này giúp dân chủ hóa việc tiếp cận các công cụ chẩn đoán tiên tiến, một mục tiêu mà các tổ chức như Stanford Medicine đang theo đuổi, giúp xác định các bệnh lý mà nếu không sẽ cần đến chuyên môn của con người.

Kiểm soát chất lượng công nghiệp

Ứng dụng trí tuệ nhân tạo hiện đại trong sản xuất phụ thuộc rất nhiều vào việc kiểm tra tự động. Tuy nhiên, các lỗi cụ thể có thể xảy ra rất hiếm khi, khiến việc xây dựng một tập dữ liệu lớn về các bộ phận "hỏng" trở nên khó khăn. FSL cho phép các hệ thống phát hiện bất thường học được các đặc điểm của một loại lỗi mới chỉ từ một vài hình ảnh. Điều này cho phép các nhà điều hành nhà máy nhanh chóng cập nhật các quy trình đảm bảo chất lượng mà không cần dừng sản xuất để thu thập dữ liệu, cải thiện đáng kể hiệu quả trong môi trường sản xuất năng động.

Phân biệt các khái niệm liên quan

Việc phân biệt FSL với các mô hình học máy dựa trên dữ liệu thấp tương tự sẽ giúp hiểu rõ hơn về vị trí đặc thù của nó:

  • Học chuyển giao (Transfer Learning ): FSL thường được triển khai như một hình thức đặc biệt, cực đoan của học chuyển giao. Trong khi học chuyển giao tiêu chuẩn có thể tinh chỉnh một mô hình như YOLO26 trên hàng trăm hình ảnh, FSL nhắm mục tiêu vào các kịch bản chỉ với khoảng 5 đến 10 hình ảnh mỗi lớp (được gọi là phân loại "N-way K-shot").
  • Học một lần (One-Shot Learning ): Đây là một tập hợp con nghiêm ngặt của FSL, trong đó mô hình phải học từ chính xác một ví dụ được gắn nhãn. Nó thường được sử dụng trong nhận dạng khuôn mặt để xác minh danh tính dựa trên một bức ảnh được lưu trữ duy nhất.
  • Học không cần dữ liệu huấn luyện (Zero-Shot Learning ): Không giống như FSL, vốn yêu cầu ít nhất một tập dữ liệu hỗ trợ hình ảnh nhỏ, Học không cần dữ liệu huấn luyện không yêu cầu bất kỳ ví dụ hình ảnh nào về lớp mục tiêu trong quá trình huấn luyện. Thay vào đó, nó dựa vào các mô tả ngữ nghĩa hoặc thuộc tính (như gợi ý bằng văn bản) để nhận dạng các đối tượng chưa từng thấy.

Thực hiện thực tế với Ultralytics

Trên thực tế, một trong những cách hiệu quả nhất để thực hiện Học ít dữ liệu (Few-Shot Learning) là tận dụng một mô hình được huấn luyện trước có độ mạnh mẽ cao. Các mô hình tiên tiến như YOLO26 mới hơn đã học được các biểu diễn đặc trưng phong phú từ các tập dữ liệu khổng lồ như COCO hoặc ImageNet . Bằng cách tinh chỉnh các mô hình này trên một tập dữ liệu tùy chỉnh nhỏ, chúng có thể thích ứng với các nhiệm vụ mới với tốc độ và độ chính xác đáng kể.

Sau đây Python Ví dụ này minh họa cách huấn luyện mô hình trên một tập dữ liệu nhỏ bằng cách sử dụng... ultralytics gói phần mềm, thực hiện thích ứng hiệu quả với số lượng mẫu ít:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (incorporates learned features)
model = YOLO("yolo26n.pt")

# Fine-tune on a tiny dataset (e.g., coco8 has only 4 images per batch)
# This leverages the model's prior knowledge for the new task
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)

# The model adapts to detect objects in the small dataset
print("Few-shot adaptation complete.")

Thách thức và triển vọng tương lai

Mặc dù mạnh mẽ, FSL vẫn đối mặt với những thách thức về độ tin cậy. Nếu một vài ví dụ được cung cấp là ngoại lệ hoặc nhiễu, hiệu suất của mô hình có thể suy giảm, một vấn đề được gọi là quá khớp (overfitting ). Nghiên cứu về tăng cường dữ liệu và tạo dữ liệu tổng hợp là rất quan trọng để giảm thiểu những rủi ro này. Khi các mô hình nền tảng trở nên lớn hơn và có khả năng hơn, và các công cụ như Nền tảng Ultralytics đơn giản hóa việc huấn luyện và quản lý mô hình, khả năng tạo ra các giải pháp AI tùy chỉnh với dữ liệu tối thiểu sẽ ngày càng dễ tiếp cận hơn đối với các nhà phát triển trên toàn thế giới.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay