Изучите ImageNet, основополагающий набор данных для глубокого обучения. Узнайте, как он обеспечивает работу Ultralytics посредством переноса обучения для высокоточной классификации изображений.
ImageNet огромная визуальная база данных, предназначенная для использования в исследованиях в области программного обеспечения для распознавания визуальных объектов и широко считающаяся катализатором, который дал начало современной революции в области глубокого обучения. Организованная в соответствии с иерархией WordNet, ImageNet миллионы помеченных изображений по тысячам категорий, предоставляя огромный объем данных, необходимых для обучения сложных нейронных сетей. Для исследователей и разработчиков в области компьютерного зрения ImageNet стандартным эталоном для оценки эффективности алгоритмов, особенно в таких задачах, как классификация изображений и локализация объектов.
Этот набор данных приобрел мировую известность благодаря конкурсу ImageNet Scale Visual Recognition Challenge (ILSVRC), который проводился ежегодно с 2010 по 2017 год. В рамках этого конкурса алгоритмы должны были с высокой точностью classify по одной из 1000 категорий. Исторический поворотный момент произошел в 2012 году, когда сверточная нейронная сеть (CNN) под названием AlexNet достигла значительно более низкого уровня ошибок, чем ее конкуренты. Эта победа продемонстрировала превосходство глубоких нейронных сетей над традиционными методами извлечения признаков, что фактически положило начало современной эре искусственного интеллекта. Сегодня современные архитектуры, такие как Ultralytics , продолжают развиваться на основе фундаментальных принципов, установленных в ходе этих соревнований.
Одним из наиболее значительных вкладов ImageNet его роль в переносе обучения. Обучение глубокой нейронной сети с нуля требует огромных вычислительных ресурсов и большого количества обучающих данных. Чтобы обойти это, разработчики часто используют «предварительно обученные модели» — сети, которые уже научились извлекать богатые представления признаков из ImageNet.
Когда модель предварительно обучается на ImageNet, она учится идентифицировать основные визуальные элементы, такие как края, текстуры и формы. Затем эти выученные веса модели могут быть точно настроены на меньшем, специфическом наборе данных для другой задачи. Этот процесс значительно ускоряет циклы разработки и улучшает производительность, особенно при использовании таких инструментов, как Ultralytics для обучения пользовательских моделей.
Влияние ImageNet далеко за рамки академических исследований и распространяется на практические, повседневные системы искусственного интеллекта:
Хотя ImageNet золотым стандартом для классификации, важно отличать его от других популярных наборов данных:
Современные фреймворки искусственного интеллекта позволяют пользователям без труда использовать ImageNet . Пример ниже демонстрирует, как загрузить модель классификации YOLO26, которая предварительно обучена на ImageNet, для classify .
from ultralytics import YOLO
# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")
Этот фрагмент использует yolo26n-cls.pt модель, которая изучила 1000 ImageNet , что позволяет
ей мгновенно распознавать содержимое входного изображения без дополнительного обучения.