Изучите одноступенчатые детекторы объектов для высокоскоростного искусственного интеллекта в реальном времени. Узнайте, как Ultralytics обеспечивает высочайшую точность и эффективность для Edge AI и развертывания.
Одноэтапные детекторы объектов — это мощный класс архитектур глубокого обучения, предназначенных для выполнения задач обнаружения объектов с исключительной скоростью и эффективностью. В отличие от традиционных двухэтапных детекторов объектов, которые разделяют процесс обнаружения на отдельные этапы для предложения области и последующей классификации, одноэтапные модели анализируют все изображение за один проход. Рассматривая обнаружение как задачу прямой регрессии, эти сети одновременно прогнозируют координаты ограничивающей рамки и вероятности классов непосредственно из входных пикселей. Этот оптимизированный подход значительно снижает вычислительные затраты, делая одноэтапные детекторы предпочтительным выбором для приложений, требующих вывода и развертывания в реальном времени на ограниченных по ресурсам периферийных устройствах искусственного интеллекта.
Архитектура одноступенчатого детектора обычно основана на сверточной нейронной сети (CNN) , которая служит основой для извлечения признаков. Когда изображение проходит через сеть, модель генерирует сетку карт признаков, которые кодируют пространственную и семантическую информацию.
Ранние реализации, такие как Single Shot MultiBox Detector (SSD), опирались на заранее определенные анкерные рамки различных масштабов для локализации объектов. Однако современные достижения, такие как Ultralytics YOLO11 и ультрасовременный YOLO26 в значительной степени перешли к бесшарнирным конструкциям. Эти новые архитектуры напрямую предсказывают центры и размеры объектов, устраняя необходимость в сложной настройке гиперпараметров, связанной с анкерами. Конечный результат состоит из векторов координат для локализации и показателя достоверности, который отражает уверенность модели в отношении обнаруженного объекта.
Разграничение этих двух основных категорий помогает выбрать подходящий инструмент для конкретной задачи:
Эффективность одноступенчатых детекторов способствовала их широкому распространению в различных отраслях промышленности, где критически важна мгновенная реакция:
Реализация одноступенчатого детектора не представляет сложности с помощью современных высокоуровневых API. Для обеспечения точности результатов модели часто прогнозируют несколько потенциальных областей, которые затем фильтруются с помощью таких методов, как немаксимальное подавление (NMS) на основе пороговых значений пересечения над объединением (IoU), хотя более новые сквозные модели, такие как YOLO26, обрабатывают это нативно.
Следующий Python демонстрирует, как загрузить современную модель YOLO26 и выполнить инференцию по изображению:
from ultralytics import YOLO
# Load the YOLO26 model, the latest natively end-to-end one-stage detector
model = YOLO("yolo26n.pt")
# Run inference on an image URL to detect objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes and labels
results[0].show()
Развитие одноступенчатых детекторов было сосредоточено на преодолении компромисса между «точностью и скоростью». Для устранения дисбаланса классов во время обучения были введены такие методы, как Focal Loss, которые гарантируют, что модель сосредоточивается наclassify , а не на обильном фоне. Кроме того, интеграция Feature Pyramid Networks (FPN) позволяет этим моделям эффективно detect в разных масштабах.
Сегодня исследователи и разработчики могут легко обучать эти передовые архитектуры на пользовательских наборах данных с помощью таких инструментов, как Ultralytics , которая упрощает рабочий процесс от аннотирования данных до развертывания модели. Будь то сельское хозяйство или здравоохранение, доступность одноступенчатых детекторов демократизирует мощные возможности компьютерного зрения.