Khám phá ImageNet , bộ dữ liệu nền tảng của học sâu. Tìm hiểu cách nó vận hành. Ultralytics YOLO26 sử dụng học chuyển giao để phân loại hình ảnh với độ chính xác cao.
ImageNet là một cơ sở dữ liệu hình ảnh đồ sộ được thiết kế để sử dụng trong nghiên cứu phần mềm nhận dạng đối tượng hình ảnh và được coi là chất xúc tác khơi mào cuộc cách mạng học sâu hiện đại. Được tổ chức theo hệ thống phân cấp WordNet , ImageNet Nó bao gồm hàng triệu hình ảnh được gắn nhãn trên hàng nghìn danh mục, cung cấp quy mô dữ liệu khổng lồ cần thiết để huấn luyện các mạng nơ-ron phức tạp. Đối với các nhà nghiên cứu và nhà phát triển trong lĩnh vực thị giác máy tính , ImageNet Nó đóng vai trò là tiêu chuẩn tham chiếu để đánh giá hiệu suất của các thuật toán, đặc biệt là trong các tác vụ như phân loại hình ảnh và định vị đối tượng.
Bộ dữ liệu này đã trở nên nổi tiếng toàn cầu thông qua cuộc thi ImageNet Large Scale Visual Recognition Challenge (ILSVRC) , một cuộc thi thường niên được tổ chức từ năm 2010 đến năm 2017. Cuộc thi này yêu cầu các thuật toán phải đáp ứng các yêu cầu sau: classify Phân loại hình ảnh vào một trong 1.000 danh mục với độ chính xác cao. Một bước ngoặt lịch sử đã xảy ra vào năm 2012 khi kiến trúc mạng nơ-ron tích chập (CNN) có tên AlexNet đạt được tỷ lệ lỗi thấp hơn đáng kể so với các đối thủ cạnh tranh. Chiến thắng này đã chứng minh tính ưu việt của mạng nơ-ron sâu so với các phương pháp trích xuất đặc trưng truyền thống, chính thức khởi đầu kỷ nguyên AI hiện nay. Ngày nay, các kiến trúc tiên tiến như Ultralytics YOLO26 tiếp tục xây dựng dựa trên các nguyên tắc nền tảng được thiết lập trong những thử thách này.
Một trong những đóng góp quan trọng nhất của ImageNet Vai trò của nó nằm ở học chuyển giao . Việc huấn luyện một mạng nơ-ron sâu từ đầu đòi hỏi tài nguyên tính toán khổng lồ và lượng dữ liệu huấn luyện lớn. Để khắc phục điều này, các nhà phát triển thường sử dụng "mô hình được huấn luyện trước" - các mạng đã học cách trích xuất các biểu diễn đặc trưng phong phú từ dữ liệu. ImageNet .
Khi một mô hình được huấn luyện trước trên ImageNet Nó học cách nhận diện các yếu tố hình ảnh cơ bản như cạnh, kết cấu và hình dạng. Sau đó, các trọng số mô hình đã học này có thể được tinh chỉnh trên một tập dữ liệu nhỏ hơn, cụ thể hơn cho một nhiệm vụ khác. Quá trình này giúp tăng tốc đáng kể chu kỳ phát triển và cải thiện hiệu suất, đặc biệt khi sử dụng các công cụ như Nền tảng Ultralytics để huấn luyện mô hình tùy chỉnh.
Ảnh hưởng của ImageNet Mở rộng phạm vi vượt xa nghiên cứu học thuật sang các hệ thống AI thực tiễn, hàng ngày:
Trong khi ImageNet Đây là tiêu chuẩn vàng cho việc phân loại, vì vậy điều quan trọng là phải phân biệt nó với các tập dữ liệu phổ biến khác:
Các khung AI hiện đại cho phép người dùng tận dụng ImageNet Huấn luyện trước dễ dàng. Ví dụ dưới đây minh họa cách tải mô hình phân loại YOLO26 , mô hình này đã được huấn luyện trước. ImageNet , ĐẾN classify một hình ảnh.
from ultralytics import YOLO
# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")
Đoạn mã này sử dụng yolo26n-cls.pt mô hình, đã học được 1.000 ImageNet các danh mục cho phép nó nhận diện ngay lập tức nội dung của hình ảnh đầu vào mà không cần bất kỳ quá trình huấn luyện bổ sung nào.