Глоссарий

Распознавание образов

Узнай, как распознавание изображений позволяет ИИ классифицировать и понимать визуальные образы, стимулируя инновации в здравоохранении, розничной торговле, безопасности и многом другом.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Распознавание изображений - важнейшая отрасль искусственного интеллекта (ИИ) и компьютерного зрения (КВ), которая позволяет машинам идентифицировать и интерпретировать визуальную информацию из изображений или видео. Оно выходит за рамки простого разглядывания пикселей; оно включает в себя понимание содержания, такого как объекты, люди, сцены и действия, изображенные в визуальных данных. Эта технология лежит в основе бесчисленных приложений, позволяя системам "видеть" и осмысливать мир примерно так же, как человек.

Как работает распознавание образов

В своей основе распознавание изображений в значительной степени опирается на машинное обучение (ML), в частности на алгоритмы глубокого обучения (DL). Конволюционные нейронные сети (CNN) - это фундаментальный компонент, предназначенный для автоматического и адаптивного обучения пространственным иерархиям признаков на изображениях. Обычно этот процесс включает в себя обучение модели на огромных наборах помеченных изображений, таких как знаменитый набор данных ImageNet, где каждое изображение помечено информацией о его содержании, часто организованной с помощью структур, подобных иерархии WordNet. В процессе обучения модель учится ассоциировать определенные визуальные паттерны и особенности (например, края, текстуры, формы) с различными метками или категориями. Архитектуры, подобные ResNet, значительно улучшили производительность при решении этих задач. После обучения модель может анализировать новые, невидимые изображения и предсказывать объекты или концепции, присутствующие в них. Понимание этих концепций можно углубить с помощью ресурсов вроде специализации Deep Learning. Хотя ImageNet является ключевым для классификации, такие наборы данных, как COCO, также важны для более широких задач визуального понимания. Эффективное обучение моделей требует тщательного планирования и выполнения.

Отличия от родственных терминов

Хотя распознавание изображений связано с другими задачами компьютерного зрения, оно часто используется как более широкий термин, охватывающий несколько специфических возможностей. Важно отличать его от более узких задач:

Иногда распознавание изображений может относиться конкретно к классификации изображений, но чаще подразумевает более широкие возможности понимания содержания изображения, что может включать в себя обнаружение или сегментацию в зависимости от потребностей приложения.

Применение в реальном мире

Распознавание образов обеспечивает широкий спектр приложений в различных отраслях:

Эта область постоянно развивается благодаря исследованиям, которыми делятся на таких площадках, как Конференция по компьютерному зрению и распознаванию образов (CVPR), и организациям вроде Фонда компьютерного зрения (CVF). Читай практические советы в блогеGoogle Cloud AI Blog.

Инструменты и обучение

Разработка приложений для распознавания изображений часто подразумевает использование специализированных библиотек и фреймворков. К ключевым технологиям относятся:

Читать полностью