Глоссарий

Классификация изображений

Откройте для себя классификацию изображений с помощью Ultralytics YOLO: обучайте пользовательские модели для здравоохранения, сельского хозяйства, розничной торговли и других с помощью передовых инструментов.

Классификация изображений - это фундаментальная задача компьютерного зрения (КВ), которая заключается в присвоении всему изображению одной конкретной метки из заранее определенного набора категорий. Основная цель - определить основной объект изображения и классифицировать его соответствующим образом. Например, модель классификации анализирует изображение и выдает метку "кошка", "собака" или "автомобиль". Эта задача лежит в основе многих более сложных приложений CV и является основным компонентом машинного обучения (ML). В этом процессе используются алгоритмы, в первую очередь конволюционные нейронные сети (CNN), для изучения отличительных признаков на основе больших наборов данных с метками.

Как работает классификация изображений

Модели классификации изображений обучаются с помощью контролируемого обучения, когда им подается огромное количество изображений, которые уже были вручную помечены на нужный класс. В процессе обучения нейронная сеть учится определять узоры, текстуры, формы и цветовые сочетания, связанные с каждой категорией. Это обучение достигается с помощью процесса, называемого обратным распространением, который регулирует внутренние параметры модели, или веса, чтобы минимизировать разницу между ее прогнозами и реальными метками.

Современные модели классификации часто используют архитектуры глубокого обучения с большим количеством слоев. Ранние слои могут научиться распознавать простые признаки, такие как края и углы, а более глубокие слои объединяют их для определения более сложных структур, таких как глаза, колеса или лица. Последний слой сети обычно использует функцию softmax для получения оценки вероятности для каждого возможного класса. Класс с наибольшей вероятностью выбирается в качестве окончательного прогноза. Ключевым моментом в этом процессе является извлечение признаков, когда модель автоматически обучается наиболее информативным признакам для задачи классификации.

Применение классификации изображений

Классификация изображений используется во многих отраслях промышленности для автоматизации и масштабирования задач визуального распознавания. Два ярких примера включают:

  1. Анализ медицинских изображений: В здравоохранении модели классификации анализируют медицинские снимки, такие как рентгеновские, магнитно-резонансные и компьютерные томограммы, чтобы помочь радиологам обнаружить заболевания. Например, модель может быть обучена на тысячах маммограмм, чтобы классифицировать изображения как "доброкачественные" или "злокачественные", помогая обнаружить рак груди на ранней стадии. Это может привести к ускорению постановки диагноза и снижению количества человеческих ошибок. Подробнее об этом читайте в обзоре Американского онкологического общества, посвященном применению ИИ для выявления рака.
  2. Сельскохозяйственные технологии: Фермеры используют классификацию изображений для мониторинга состояния посевов по снимкам, сделанным беспилотниками или спутниками. Модель может классифицировать изображения листьев растений по таким категориям, как "здоровые", "больные" или "пораженные вредителями". Это позволяет целенаправленно применять пестициды или удобрения, повышая урожайность и способствуя устойчивому ведению сельского хозяйства. Узнайте больше о том, как Ultralytics поддерживает ИИ в сельском хозяйстве.

Классификация изображений в сравнении со смежными задачами

Несмотря на тесную связь с другими задачами компьютерного зрения, классификация изображений имеет свою собственную цель. Важно отличать ее от:

  • Обнаружение объектов: Эта задача идет на шаг дальше классификации. Вместо того чтобы присваивать одну метку всему изображению, задача обнаружения объектов определяет несколько объектов на изображении и рисует ограничительную рамку вокруг каждого из них, также присваивая каждой рамке метку класса. Например, можно не просто обозначить изображение как "уличная сцена", а найти и классифицировать отдельные "автомобили", "пешеходы" и "светофоры".
  • Сегментация изображения: Эта задача позволяет получить наиболее подробное представление об изображении, классифицируя каждый пиксель. Существуют различные типы, включая семантическую сегментацию, которая присваивает класс каждому пикселю (например, все пиксели, принадлежащие автомобилям, имеют один цвет), и сегментацию экземпляров, которая различает различные экземпляры одного и того же объекта (например, каждый автомобиль имеет разный цвет). Такой уровень детализации очень важен для таких приложений, как автономные автомобили.

В общем, классификация позволяет определить , что находится на изображении, обнаружение - что и где, а сегментация - получить подробную карту всего, что находится в сцене, на уровне пикселей.

Классификация изображений с помощью ультралитературы

Хотя модели Ultralytics YOLO известны в области обнаружения объектов, они также отлично справляются с задачами классификации изображений. Современные модели, такие как YOLO11, можно легко обучать или настраивать на пользовательских наборах данных с помощью интуитивно понятного пакета Ultralytics Python или платформы Ultralytics HUB, не требующей кода.

Наша документация содержит обширные ресурсы, включая советы по обучению моделей и подробное руководство по использованию YOLO11 для классификации изображений. Разработчики могут использовать предварительно обученные модели на эталонных наборах данных, таких как ImageNet, CIFAR-100 и Caltech-101, или обучить новую модель с нуля. Для тех, кто интересуется последними достижениями, такие ресурсы, как Papers With Code, предлагают полный обзор наиболее эффективных моделей. Вы также можете сравнить производительность модели YOLO со стандартными бенчмарками. Такие фреймворки, как PyTorch и TensorFlow, обеспечивают основу для построения и обучения этих моделей.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему искусственного интеллекта. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединяйтесь сейчас
Ссылка копируется в буфер обмена