Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

ImageNet

Изучите ImageNet, основополагающий набор данных для глубокого обучения. Узнайте, как он обеспечивает работу Ultralytics посредством переноса обучения для высокоточной классификации изображений.

ImageNet огромная визуальная база данных, предназначенная для использования в исследованиях в области программного обеспечения для распознавания визуальных объектов и широко считающаяся катализатором, который дал начало современной революции в области глубокого обучения. Организованная в соответствии с иерархией WordNet, ImageNet миллионы помеченных изображений по тысячам категорий, предоставляя огромный объем данных, необходимых для обучения сложных нейронных сетей. Для исследователей и разработчиков в области компьютерного зрения ImageNet стандартным эталоном для оценки эффективности алгоритмов, особенно в таких задачах, как классификация изображений и локализация объектов.

Конкурс ImageNet и рост популярности CNN

Этот набор данных приобрел мировую известность благодаря конкурсу ImageNet Scale Visual Recognition Challenge (ILSVRC), который проводился ежегодно с 2010 по 2017 год. В рамках этого конкурса алгоритмы должны были с высокой точностью classify по одной из 1000 категорий. Исторический поворотный момент произошел в 2012 году, когда сверточная нейронная сеть (CNN) под названием AlexNet достигла значительно более низкого уровня ошибок, чем ее конкуренты. Эта победа продемонстрировала превосходство глубоких нейронных сетей над традиционными методами извлечения признаков, что фактически положило начало современной эре искусственного интеллекта. Сегодня современные архитектуры, такие как Ultralytics , продолжают развиваться на основе фундаментальных принципов, установленных в ходе этих соревнований.

Роль предварительного обучения и переноса знаний

Одним из наиболее значительных вкладов ImageNet его роль в переносе обучения. Обучение глубокой нейронной сети с нуля требует огромных вычислительных ресурсов и большого количества обучающих данных. Чтобы обойти это, разработчики часто используют «предварительно обученные модели» — сети, которые уже научились извлекать богатые представления признаков из ImageNet.

Когда модель предварительно обучается на ImageNet, она учится идентифицировать основные визуальные элементы, такие как края, текстуры и формы. Затем эти выученные веса модели могут быть точно настроены на меньшем, специфическом наборе данных для другой задачи. Этот процесс значительно ускоряет циклы разработки и улучшает производительность, особенно при использовании таких инструментов, как Ultralytics для обучения пользовательских моделей.

Применение в реальном мире

Влияние ImageNet далеко за рамки академических исследований и распространяется на практические, повседневные системы искусственного интеллекта:

  • Автоматизированная розничная касса: системы, которые автоматически идентифицируют продукты или товары в киоске самообслуживания, полагаются на возможности классификации, отточенные на огромных наборах данных, таких как ImageNet. Различая визуально похожие предметы (например, разные сорта яблок), эти системы оптимизируют ИИ в розничной торговле.
  • Модерация контента: Социальные сети используют визуальное распознавание для автоматического сканирования миллионов загруженных изображений на предмет нежелательного контента. Основная способность распознавать объекты и сцены часто происходит от базовых моделей, изначально обученных на ImageNet .

ImageNet COCO CIFAR-10

Хотя ImageNet золотым стандартом для классификации, важно отличать его от других популярных наборов данных:

  • ImageNet . COCO: Набор данных COCO Common Objects in Context) является основным эталоном для обнаружения и сегментации объектов. В то время как ImageNet «что» находится на изображении (классификация), COCO на «где» находятся объекты и их точных границах.
  • ImageNet ImageNet ImageNet CIFAR-10: CIFAR-10 — это гораздо меньший набор данных, состоящий из крошечных изображений размером 32x32 пикселя. Он часто используется для быстрого прототипирования или в образовательных целях, тогда как ImageNet представляет собой профессиональный набор данных высокого разрешения для готовых к производству моделей.

Использование предварительно обученных моделей ImageNet

Современные фреймворки искусственного интеллекта позволяют пользователям без труда использовать ImageNet . Пример ниже демонстрирует, как загрузить модель классификации YOLO26, которая предварительно обучена на ImageNet, для classify .

from ultralytics import YOLO

# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")

Этот фрагмент использует yolo26n-cls.pt модель, которая изучила 1000 ImageNet , что позволяет ей мгновенно распознавать содержимое входного изображения без дополнительного обучения.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас