Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

ImageNet

Khám phá ImageNet , bộ dữ liệu nền tảng của học sâu. Tìm hiểu cách nó vận hành. Ultralytics YOLO26 sử dụng học chuyển giao để phân loại hình ảnh với độ chính xác cao.

ImageNet là một cơ sở dữ liệu hình ảnh đồ sộ được thiết kế để sử dụng trong nghiên cứu phần mềm nhận dạng đối tượng hình ảnh và được coi là chất xúc tác khơi mào cuộc cách mạng học sâu hiện đại. Được tổ chức theo hệ thống phân cấp WordNet , ImageNet Nó bao gồm hàng triệu hình ảnh được gắn nhãn trên hàng nghìn danh mục, cung cấp quy mô dữ liệu khổng lồ cần thiết để huấn luyện các mạng nơ-ron phức tạp. Đối với các nhà nghiên cứu và nhà phát triển trong lĩnh vực thị giác máy tính , ImageNet Nó đóng vai trò là tiêu chuẩn tham chiếu để đánh giá hiệu suất của các thuật toán, đặc biệt là trong các tác vụ như phân loại hình ảnh và định vị đối tượng.

Cái ImageNet Thách thức và sự trỗi dậy của CNN

Bộ dữ liệu này đã trở nên nổi tiếng toàn cầu thông qua cuộc thi ImageNet Large Scale Visual Recognition Challenge (ILSVRC) , một cuộc thi thường niên được tổ chức từ năm 2010 đến năm 2017. Cuộc thi này yêu cầu các thuật toán phải đáp ứng các yêu cầu sau: classify Phân loại hình ảnh vào một trong 1.000 danh mục với độ chính xác cao. Một bước ngoặt lịch sử đã xảy ra vào năm 2012 khi kiến ​​trúc mạng nơ-ron tích chập (CNN) có tên AlexNet đạt được tỷ lệ lỗi thấp hơn đáng kể so với các đối thủ cạnh tranh. Chiến thắng này đã chứng minh tính ưu việt của mạng nơ-ron sâu so với các phương pháp trích xuất đặc trưng truyền thống, chính thức khởi đầu kỷ nguyên AI hiện nay. Ngày nay, các kiến ​​trúc tiên tiến như Ultralytics YOLO26 tiếp tục xây dựng dựa trên các nguyên tắc nền tảng được thiết lập trong những thử thách này.

Vai trò của đào tạo trước và học tập chuyển giao

Một trong những đóng góp quan trọng nhất của ImageNet Vai trò của nó nằm ở học chuyển giao . Việc huấn luyện một mạng nơ-ron sâu từ đầu đòi hỏi tài nguyên tính toán khổng lồ và lượng dữ liệu huấn luyện lớn. Để khắc phục điều này, các nhà phát triển thường sử dụng "mô hình được huấn luyện trước" - các mạng đã học cách trích xuất các biểu diễn đặc trưng phong phú từ dữ liệu. ImageNet .

Khi một mô hình được huấn luyện trước trên ImageNet Nó học cách nhận diện các yếu tố hình ảnh cơ bản như cạnh, kết cấu và hình dạng. Sau đó, các trọng số mô hình đã học này có thể được tinh chỉnh trên một tập dữ liệu nhỏ hơn, cụ thể hơn cho một nhiệm vụ khác. Quá trình này giúp tăng tốc đáng kể chu kỳ phát triển và cải thiện hiệu suất, đặc biệt khi sử dụng các công cụ như Nền tảng Ultralytics để huấn luyện mô hình tùy chỉnh.

Các Ứng dụng Thực tế

Ảnh hưởng của ImageNet Mở rộng phạm vi vượt xa nghiên cứu học thuật sang các hệ thống AI thực tiễn, hàng ngày:

  • Hệ thống thanh toán tự động tại quầy bán lẻ: Các hệ thống tự động nhận dạng sản phẩm tại ki-ốt tự thanh toán dựa trên khả năng phân loại được tinh chỉnh trên các tập dữ liệu khổng lồ như... ImageNet Bằng cách phân biệt giữa các mặt hàng trông giống nhau (ví dụ: các loại táo khác nhau), các hệ thống này giúp tối ưu hóa ứng dụng trí tuệ nhân tạo trong bán lẻ .
  • Kiểm duyệt nội dung: Các nền tảng mạng xã hội sử dụng nhận dạng hình ảnh để tự động quét hàng triệu hình ảnh được tải lên nhằm tìm kiếm nội dung không phù hợp. Khả năng cốt lõi trong việc nhận dạng đối tượng và cảnh vật thường bắt nguồn từ các hệ thống được đào tạo ban đầu trên... ImageNet Thể loại.

ImageNet so với COCO so với CIFAR-10

Trong khi ImageNet Đây là tiêu chuẩn vàng cho việc phân loại, vì vậy điều quan trọng là phải phân biệt nó với các tập dữ liệu phổ biến khác:

  • ImageNet so với COCO : Tập dữ liệu COCO (Common Objects in Context) là chuẩn mực chính cho việc phát hiện và phân đoạn đối tượng . Trong khi đó, ImageNet Tập trung vào "những gì" có trong hình ảnh (phân loại), COCO Tập trung vào "vị trí" của các đối tượng và ranh giới chính xác của chúng.
  • So sánh ImageNet và CIFAR-10: CIFAR-10 là một tập dữ liệu nhỏ hơn nhiều, bao gồm các hình ảnh nhỏ có kích thước 32x32 pixel. Nó thường được sử dụng để tạo mẫu nhanh hoặc cho mục đích giáo dục, trong khi đó, ImageNet và CIFAR-10 lại nhỏ hơn nhiều. ImageNet Đây là một thách thức chuyên nghiệp, độ phân giải cao dành cho các mô hình sẵn sàng sản xuất.

Sử dụng ImageNet Các mô hình được đào tạo trước

Các khung AI hiện đại cho phép người dùng tận dụng ImageNet Huấn luyện trước dễ dàng. Ví dụ dưới đây minh họa cách tải mô hình phân loại YOLO26 , mô hình này đã được huấn luyện trước. ImageNet , ĐẾN classify một hình ảnh.

from ultralytics import YOLO

# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")

Đoạn mã này sử dụng yolo26n-cls.pt mô hình, đã học được 1.000 ImageNet các danh mục cho phép nó nhận diện ngay lập tức nội dung của hình ảnh đầu vào mà không cần bất kỳ quá trình huấn luyện bổ sung nào.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay