Глоссарий

Классификация изображений

Открой для себя классификацию изображений с помощью Ultralytics YOLO : обучай пользовательские модели для здравоохранения, сельского хозяйства, розничной торговли и многого другого, используя передовые инструменты.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Классификация изображений - это фундаментальная задача в компьютерном зрении (КВ), которая заключается в присвоении единой метки или категории всему изображению на основе его визуального содержания. Это одна из основных возможностей искусственного интеллекта (ИИ), позволяющая машинам понимать и классифицировать изображения подобно тому, как человек распознает сцены или объекты. Используя методы машинного обучения (ML) и особенно глубокого обучения (DL), классификация изображений призвана ответить на вопрос: "Что является основным объектом этого изображения?".

Как работает классификация изображений

Обычно этот процесс включает в себя обучение модели, часто специализированного типа нейронной сети, называемой конволюционной нейронной сетью (CNN), на большом наборе данных помеченных изображений. Такие известные наборы данных, как ImageNet, содержат миллионы изображений, разделенных на тысячи классов. В процессе обучения модель учится определять паттерны и особенности - например, текстуры, формы и распределение цветов, - которые отличают различные категории. Такие фреймворки, как PyTorch и TensorFlow предоставляют инструменты для создания и обучения этих моделей. Ты можешь изучить различные наборы данных для классификацииUltralytics , чтобы начать свои собственные проекты. Цель состоит в том, чтобы обученная модель точно предсказывала метку класса для новых, невидимых изображений. Для более глубокого технического понимания такие ресурсы, как курс Stanford CS231n, предлагают исчерпывающий материал по CNN.

Основные отличия от других заданий

Классификация изображений сосредоточена на присвоении одной метки всему изображению. Это отличает ее от других распространенных задач, связанных с резюме:

  • Обнаружение объектов: Определяет несколько объектов на изображении и определяет местоположение каждого из них с помощью ограничительных рамок. Он отвечает на вопрос "Какие объекты есть на изображении и где они находятся?".
  • Сегментация экземпляров: Это шаг дальше, чем обнаружение объектов, - он определяет точные пиксельные границы каждого отдельного экземпляра объекта.
  • Семантическая сегментация: Классифицирует каждый пиксель на изображении в набор заранее определенных категорий (например, "небо", "дорога", "автомобиль"), но не различает отдельные экземпляры одной и той же категории.

Понимание этих различий крайне важно для выбора подходящей техники для решения конкретной задачи.

Применение в реальном мире

Классификация изображений широко используется в различных областях благодаря своей относительной простоте и эффективности:

Классификация изображений с помощью Ultralytics

Модели Ultralytics YOLO , прославившиеся обнаружением объектов, также отлично справляются с задачами классификации изображений. Современные архитектуры, такие как Ultralytics YOLOv11, можно легко обучить классификации с помощью пакетаUltralytics Python или некодируемой платформы Ultralytics HUB. Эти инструменты предоставляют обширные ресурсы, включая советы по обучению моделей и понятную документацию, как, например, руководство по использованию Ultralytics YOLOv11 для классификации изображений. Для практики изучи учебники по классификации наPyTorch или прими участие в соревнованиях по классификации изображений на Kaggle. Будь в курсе последних научных достижений с помощью таких ресурсов, как Papers With Code.

Читать полностью