Ultralytics YOLO11 앵커 없는 객체 감지를 지원하는 방법과 이 모델 아키텍처가 다양한 애플리케이션에 제공하는 이점에 대해 알아보세요.
비전 AI 모델의 역사를 되돌아보면, 이미지나 동영상 내에서 객체를 식별하고 위치를 파악하는 컴퓨터 비전의 핵심 작업인 객체 감지 개념은 1960년대부터 존재해 왔습니다. 하지만 오늘날 최첨단 혁신에서 물체 감지가 중요한 이유는 그 이후로 물체 감지 기술과 모델 아키텍처가 발전하고 빠르게 개선되었기 때문입니다.
이전 기사에서는 물체 감지의 진화와 Ultralytics YOLO 모델로 이어진 여정에 대해 설명했습니다. 오늘은 이 여정에서 보다 구체적인 이정표인 앵커 기반 감지기에서 앵커가 없는 감지기로의 전환을 살펴보는 데 중점을 두겠습니다.
앵커 기반 감지기는 '앵커'라고 하는 사전 정의된 상자에 의존하여 이미지에서 객체가 어디에 있는지 예측합니다. 반면, 앵커 프리 디텍터는 이러한 사전 정의된 상자를 건너뛰고 객체 위치를 직접 예측합니다.
이러한 변화는 단순하고 논리적인 변화처럼 보일 수 있지만, 실제로 물체 감지 정확도와 효율성을 크게 향상시켰습니다. 이 글에서는 앵커 프리 디텍터가 다음과 같은 발전을 통해 컴퓨터 비전을 어떻게 재구성했는지 살펴봅니다. Ultralytics YOLO11.
앵커 기반 감지기는 앵커라고 하는 미리 정의된 상자를 사용하여 이미지에서 개체를 찾는 데 도움을 줍니다. 이러한 앵커는 이미지 위에 놓인 다양한 크기와 모양의 상자 그리드라고 생각하면 됩니다. 그런 다음 모델은 감지한 객체에 맞게 이러한 상자를 조정합니다. 예를 들어 모델이 자동차를 식별하면 자동차의 위치와 크기에 더 정확하게 일치하도록 앵커 상자를 수정합니다.
각 앵커는 이미지에서 가능한 물체와 연결되며, 학습 과정에서 모델은 물체의 위치, 크기 및 종횡비에 더 잘 맞도록 앵커 상자를 조정하는 방법을 학습합니다. 이를 통해 모델은 다양한 배율과 방향의 물체를 감지할 수 있습니다. 그러나 올바른 앵커 박스 세트를 선택하는 데는 시간이 많이 소요될 수 있으며 미세 조정 과정에서 오류가 발생할 수 있습니다.
YOLOv4와 같은 앵커 기반 감지기는 많은 애플리케이션에서 잘 작동했지만 몇 가지 단점이 있습니다. 예를 들어, 앵커 박스는 모양이나 크기가 다른 물체와 항상 잘 정렬되지 않아 모델이 작거나 불규칙한 모양의 물체를 감지하기 어렵게 만들 수 있습니다. 앵커 박스 크기를 선택하고 미세 조정하는 과정도 시간이 오래 걸리고 많은 수작업이 필요할 수 있습니다. 이 외에도, 앵커 기반 모델은 사전 정의된 박스가 이러한 복잡한 시나리오에 잘 적응하지 못할 수 있기 때문에 가려지거나 겹치는 물체를 감지하는 데 어려움을 겪는 경우가 많습니다.
앵커 프리 감지기는 2018년부터 주목을 받기 시작했는데, 이는 미리 정의된 앵커 박스가 필요 없어 물체 감지에 대한 새로운 접근 방식을 취한 코너넷과 센터넷과 같은 모델입니다. 다양한 크기와 모양의 앵커 박스에 의존해 물체의 위치를 예측하는 기존 모델과 달리, 앵커 프리 모델은 물체의 위치를 직접 예측합니다. 중심과 같은 물체의 주요 지점이나 특징에 초점을 맞추기 때문에 감지 프로세스가 간소화되고 더 빠르고 정확해집니다.
앵커 없는 모델의 일반적인 작동 방식은 다음과 같습니다:
앵커 프리 모델은 앵커 박스에 의존하지 않기 때문에 디자인이 더 단순합니다. 즉, 계산 효율성이 더 높다는 뜻입니다. 여러 개의 앵커 박스를 처리할 필요가 없으므로 물체를 더 빠르게 감지할 수 있어 자율 주행 및 비디오 감시와 같은 실시간 애플리케이션에서 중요한 이점을 제공합니다.
앵커가 없는 모델은 작고 불규칙하거나 가려진 물체를 처리하는 데도 훨씬 더 효과적입니다. 앵커 박스에 맞추기보다는 주요 지점을 감지하는 데 초점을 맞추기 때문에 훨씬 더 유연합니다. 따라서 앵커 기반 모델이 실패할 수 있는 복잡하거나 어수선한 환경에서도 정확하게 물체를 감지할 수 있습니다.
원래 속도와 효율성을 위해 설계된 YOLO 모델은 점차 앵커 기반 방식에서 앵커 없는 감지 방식으로 전환되어 YOLO11 같은 모델이 더 빠르고 유연하며 다양한 실시간 애플리케이션에 더 적합해졌습니다.
앵커 없는 디자인이 여러 버전( YOLO )에서 어떻게 발전해 왔는지 간략히 살펴보세요:
YOLO11 을 사용한 앵커 프리 감지의 장점을 보여주는 좋은 예는 자율 주행 차량입니다. 자율주행차에서는 보행자, 다른 차량, 장애물을 빠르고 정확하게 감지하는 것이 안전을 위해 매우 중요합니다. YOLO11 의 앵커 프리 접근 방식은 미리 정의된 앵커 박스에 의존하지 않고 보행자의 중심이나 다른 차량의 경계와 같은 물체의 주요 지점을 직접 예측하여 감지 프로세스를 간소화합니다.
YOLO11 는 계산 비용이 많이 들고 느릴 수 있는 각 개체에 앵커 그리드를 조정하거나 맞출 필요가 없습니다. 대신 핵심 기능에 집중하기 때문에 더 빠르고 효율적입니다. 예를 들어, 보행자가 차량의 경로에 들어서면 YOLO11 사람이 부분적으로 가려져 있거나 움직이고 있어도 주요 지점을 정확히 찾아내어 위치를 빠르게 식별할 수 있습니다. 앵커 박스 없이도 다양한 모양과 크기에 적응할 수 있는 기능 덕분에 YOLO11 자율주행 시스템의 실시간 의사 결정에 필수적인 물체를 더 안정적으로 더 빠른 속도로 감지할 수 있습니다.
YOLO11의 앵커 프리 기능이 정말 돋보이는 다른 애플리케이션은 다음과 같습니다:
YOLO11 같은 앵커 프리 모델은 많은 장점을 제공하지만, 몇 가지 제한 사항이 있습니다. 실용적으로 고려해야 할 주요 사항 중 하나는 앵커 프리 모델도 폐색 또는 매우 겹치는 물체로 인해 어려움을 겪을 수 있다는 것입니다. 그 이유는 컴퓨터 비전은 인간의 시각을 재현하는 것을 목표로 하며, 우리가 때때로 가려진 물체를 식별하는 데 어려움을 겪는 것처럼 AI 모델도 비슷한 문제에 직면할 수 있기 때문입니다.
또 다른 흥미로운 요소는 모델 예측 처리와 관련이 있습니다. 앵커가 없는 모델의 아키텍처는 앵커 기반 모델보다 간단하지만, 특정 경우에는 추가적인 세분화가 필요합니다. 예를 들어, 중복되는 예측을 정리하거나 혼잡한 장면에서 정확도를 향상시키기 위해 비최대 억제 (NMS)와 같은 후처리 기술이 필요할 수 있습니다.
앵커 기반에서 앵커 프리 감지로의 전환은 물체 감지의 중요한 발전이었습니다. YOLO11 과 같은 앵커 프리 모델을 사용하면 프로세스가 간소화되어 정확도와 속도가 모두 향상됩니다.
YOLO11 을 통해 빠르고 정확한 감지가 중요한 자율주행차, 비디오 감시, 의료 영상과 같은 실시간 애플리케이션에서 앵커 없는 객체 감지가 얼마나 뛰어난지 살펴봤습니다. 이 접근 방식을 사용하면 YOLO11 다양한 물체 크기와 복잡한 장면에 더 쉽게 적응하여 다양한 환경에서 더 나은 성능을 제공할 수 있습니다.
컴퓨터 비전이 계속 발전함에 따라 객체 감지는 더욱 빠르고 유연하며 효율적으로 발전할 것입니다.
GitHub 리포지토리를 살펴보고 활발한 커뮤니티에 참여하여 AI에 관한 모든 최신 소식을 받아보세요. 비전 AI가 제조 및 농업과 같은 분야에 어떤 영향을 미치고 있는지 확인해 보세요.