녹색 확인
링크가 클립보드에 복사됨

Ultralytics YOLO11 앵커 프리 디텍터의 이점

Ultralytics YOLO11 앵커 없는 객체 감지를 지원하는 방법과 이 모델 아키텍처가 다양한 애플리케이션에 제공하는 이점에 대해 알아보세요.

비전 AI 모델의 역사를 되돌아보면, 이미지나 동영상 내에서 객체를 식별하고 위치를 파악하는 컴퓨터 비전의 핵심 작업인 객체 감지 개념은 1960년대부터 존재해 왔습니다. 하지만 오늘날 최첨단 혁신에서 물체 감지가 중요한 이유는 그 이후로 물체 감지 기술과 모델 아키텍처가 발전하고 빠르게 개선되었기 때문입니다. 

이전 기사에서는 물체 감지의 진화와 Ultralytics YOLO 모델로 이어진 여정에 대해 설명했습니다. 오늘은 이 여정에서 보다 구체적인 이정표인 앵커 기반 감지기에서 앵커가 없는 감지기로의 전환을 살펴보는 데 중점을 두겠습니다. 

앵커 기반 감지기는 '앵커'라고 하는 사전 정의된 상자에 의존하여 이미지에서 객체가 어디에 있는지 예측합니다. 반면, 앵커 프리 디텍터는 이러한 사전 정의된 상자를 건너뛰고 객체 위치를 직접 예측합니다.

이러한 변화는 단순하고 논리적인 변화처럼 보일 수 있지만, 실제로 물체 감지 정확도와 효율성을 크게 향상시켰습니다. 이 글에서는 앵커 프리 디텍터가 다음과 같은 발전을 통해 컴퓨터 비전을 어떻게 재구성했는지 살펴봅니다. Ultralytics YOLO11.

앵커 기반 감지기란 무엇인가요?

앵커 기반 감지기는 앵커라고 하는 미리 정의된 상자를 사용하여 이미지에서 개체를 찾는 데 도움을 줍니다. 이러한 앵커는 이미지 위에 놓인 다양한 크기와 모양의 상자 그리드라고 생각하면 됩니다. 그런 다음 모델은 감지한 객체에 맞게 이러한 상자를 조정합니다. 예를 들어 모델이 자동차를 식별하면 자동차의 위치와 크기에 더 정확하게 일치하도록 앵커 상자를 수정합니다.

각 앵커는 이미지에서 가능한 물체와 연결되며, 학습 과정에서 모델은 물체의 위치, 크기 및 종횡비에 더 잘 맞도록 앵커 상자를 조정하는 방법을 학습합니다. 이를 통해 모델은 다양한 배율과 방향의 물체를 감지할 수 있습니다. 그러나 올바른 앵커 박스 세트를 선택하는 데는 시간이 많이 소요될 수 있으며 미세 조정 과정에서 오류가 발생할 수 있습니다.

그림 1. 앵커 박스란 무엇인가요?

YOLOv4와 같은 앵커 기반 감지기는 많은 애플리케이션에서 잘 작동했지만 몇 가지 단점이 있습니다. 예를 들어, 앵커 박스는 모양이나 크기가 다른 물체와 항상 잘 정렬되지 않아 모델이 작거나 불규칙한 모양의 물체를 감지하기 어렵게 만들 수 있습니다. 앵커 박스 크기를 선택하고 미세 조정하는 과정도 시간이 오래 걸리고 많은 수작업이 필요할 수 있습니다. 이 외에도, 앵커 기반 모델은 사전 정의된 박스가 이러한 복잡한 시나리오에 잘 적응하지 못할 수 있기 때문에 가려지거나 겹치는 물체를 감지하는 데 어려움을 겪는 경우가 많습니다.

앵커 없는 객체 감지로의 전환

앵커 프리 감지기는 2018년부터 주목을 받기 시작했는데, 이는 미리 정의된 앵커 박스가 필요 없어 물체 감지에 대한 새로운 접근 방식을 취한 코너넷과 센터넷과 같은 모델입니다. 다양한 크기와 모양의 앵커 박스에 의존해 물체의 위치를 예측하는 기존 모델과 달리, 앵커 프리 모델은 물체의 위치를 직접 예측합니다. 중심과 같은 물체의 주요 지점이나 특징에 초점을 맞추기 때문에 감지 프로세스가 간소화되고 더 빠르고 정확해집니다.

앵커 없는 모델의 일반적인 작동 방식은 다음과 같습니다:

  • 키포인트 감지: 일부 모델은 미리 정의된 상자를 사용하는 대신 물체의 중앙이나 특정 모서리와 같은 중요한 지점을 식별합니다. 이러한 키포인트는 모델이 물체의 위치와 크기를 파악하는 데 도움이 됩니다.
  • 센터 예측: 일부 모델은 물체의 중심을 예측하는 데 중점을 둡니다. 중심을 찾으면 모델은 거기에서 전체 물체의 크기와 위치를 예측할 수 있습니다.
  • 히트맵 회귀: 많은 앵커 프리 모델은 각 픽셀이 객체의 가능한 위치를 나타내는 히트맵을 사용합니다. 히트맵 값이 강할수록 해당 지점에 객체가 존재한다는 신뢰도가 높습니다.
그림 2. 앵커 기반 탐지 대 앵커 프리 탐지 비교.

앵커 프리 모델은 앵커 박스에 의존하지 않기 때문에 디자인이 더 단순합니다. 즉, 계산 효율성이 더 높다는 뜻입니다. 여러 개의 앵커 박스를 처리할 필요가 없으므로 물체를 더 빠르게 감지할 수 있어 자율 주행 및 비디오 감시와 같은 실시간 애플리케이션에서 중요한 이점을 제공합니다. 

앵커가 없는 모델은 작고 불규칙하거나 가려진 물체를 처리하는 데도 훨씬 더 효과적입니다. 앵커 박스에 맞추기보다는 주요 지점을 감지하는 데 초점을 맞추기 때문에 훨씬 더 유연합니다. 따라서 앵커 기반 모델이 실패할 수 있는 복잡하거나 어수선한 환경에서도 정확하게 물체를 감지할 수 있습니다.

Ultralytics YOLO11: 앵커가 필요 없는 감지기

원래 속도와 효율성을 위해 설계된 YOLO 모델은 점차 앵커 기반 방식에서 앵커 없는 감지 방식으로 전환되어 YOLO11 같은 모델이 더 빠르고 유연하며 다양한 실시간 애플리케이션에 더 적합해졌습니다.

앵커 없는 디자인이 여러 버전( YOLO )에서 어떻게 발전해 왔는지 간략히 살펴보세요:

  • Ultralytics YOLOv5u: 앵커 프리 스플릿 Ultralytics 헤드 도입으로 사전 정의된 앵커 박스가 필요 없게 되었습니다. 대신 모델이 이미지에서 객체의 위치를 직접 예측하여 프로세스를 간소화하고 유연성과 속도를 향상시킵니다.
  • YOLOv6: 훈련 중에만 앵커를 사용하는 앵커 보조 훈련(AAT)이라는 새로운 방법이 사용되었습니다. 이를 통해 모델은 훈련 중에는 앵커 기반 방법의 구조를 활용하면서 런타임에는 앵커 없는 감지를 사용하여 속도와 적응력을 향상시킬 수 있었습니다.
  • Ultralytics YOLOv8: 앵커 프리 스플릿 Ultralytics 헤드를 사용하여 앵커 프리 감지로 완전히 전환했습니다. 이를 통해 특히 앵커 박스에 잘 맞지 않는 작거나 이상한 모양의 물체에 대해 모델이 더 빠르고 정확해졌습니다.
  • Ultralytics YOLO11: YOLOv8 의 앵커 프리 접근 방식을 기반으로 하며, 앵커 박스를 완전히 제거하여 탐지를 더욱 최적화합니다. 그 결과 동물 행동 모니터링 및 리테일 분석과 같은 실시간 애플리케이션에서 더 빠르고 정확한 감지가 가능합니다.
그림 3. Ultralytics YOLOv8 과 Ultralytics YOLO11 비교 .

실제 적용 사례 YOLO11

YOLO11 을 사용한 앵커 프리 감지의 장점을 보여주는 좋은 예는 자율 주행 차량입니다. 자율주행차에서는 보행자, 다른 차량, 장애물을 빠르고 정확하게 감지하는 것이 안전을 위해 매우 중요합니다. YOLO11 의 앵커 프리 접근 방식은 미리 정의된 앵커 박스에 의존하지 않고 보행자의 중심이나 다른 차량의 경계와 같은 물체의 주요 지점을 직접 예측하여 감지 프로세스를 간소화합니다. 

그림 4. YOLO11 (작성자 이미지)에서 앵커 프리 감지의 이점.

YOLO11 는 계산 비용이 많이 들고 느릴 수 있는 각 개체에 앵커 그리드를 조정하거나 맞출 필요가 없습니다. 대신 핵심 기능에 집중하기 때문에 더 빠르고 효율적입니다. 예를 들어, 보행자가 차량의 경로에 들어서면 YOLO11 사람이 부분적으로 가려져 있거나 움직이고 있어도 주요 지점을 정확히 찾아내어 위치를 빠르게 식별할 수 있습니다. 앵커 박스 없이도 다양한 모양과 크기에 적응할 수 있는 기능 덕분에 YOLO11 자율주행 시스템의 실시간 의사 결정에 필수적인 물체를 더 안정적으로 더 빠른 속도로 감지할 수 있습니다.

YOLO11의 앵커 프리 기능이 정말 돋보이는 다른 애플리케이션은 다음과 같습니다:

  • 소매 및 재고 관리YOLO11 을 사용하면 진열대에 제품이 쌓여 있거나 부분적으로 가려져 있어도 쉽게 모니터링할 수 있습니다. 이를 통해 더 빠르고 정확하게 재고를 추적하고 오류를 줄일 수 있습니다.
  • 의료 영상: YOLO11 의료 스캔에서 종양이나 기타 이상 징후를 감지할 수 있는 의료 분야에서도 효과적입니다. 불규칙한 모양의 물체를 처리할 수 있어 복잡한 상태를 진단할 때 정확도를 높이는 데 도움이 됩니다.
  • 야생동물 모니터링: 야생동물 연구에서 YOLO11 은 울창한 숲이나 거친 지형에서 동물을 추적하여 연구자들이 행동을 모니터링하거나 멸종 위기종을 보호하는 데 도움을 줄 수 있습니다.
  • 스포츠 분석YOLO11 스포츠 경기 중 선수, 공의 움직임 또는 기타 요소를 실시간으로 추적하여 팀, 코치, 방송사에게 유용한 인사이트를 제공하는 데 사용할 수 있습니다.

앵커 프리 모델로 작업할 때 고려해야 할 사항

YOLO11 같은 앵커 프리 모델은 많은 장점을 제공하지만, 몇 가지 제한 사항이 있습니다. 실용적으로 고려해야 할 주요 사항 중 하나는 앵커 프리 모델도 폐색 또는 매우 겹치는 물체로 인해 어려움을 겪을 수 있다는 것입니다. 그 이유는 컴퓨터 비전은 인간의 시각을 재현하는 것을 목표로 하며, 우리가 때때로 가려진 물체를 식별하는 데 어려움을 겪는 것처럼 AI 모델도 비슷한 문제에 직면할 수 있기 때문입니다.

또 다른 흥미로운 요소는 모델 예측 처리와 관련이 있습니다. 앵커가 없는 모델의 아키텍처는 앵커 기반 모델보다 간단하지만, 특정 경우에는 추가적인 세분화가 필요합니다. 예를 들어, 중복되는 예측을 정리하거나 혼잡한 장면에서 정확도를 향상시키기 위해 비최대 억제 (NMS)와 같은 후처리 기술이 필요할 수 있습니다.

AI의 미래를 위한 닻을 내리다 YOLO11

앵커 기반에서 앵커 프리 감지로의 전환은 물체 감지의 중요한 발전이었습니다. YOLO11 과 같은 앵커 프리 모델을 사용하면 프로세스가 간소화되어 정확도와 속도가 모두 향상됩니다.

YOLO11 을 통해 빠르고 정확한 감지가 중요한 자율주행차, 비디오 감시, 의료 영상과 같은 실시간 애플리케이션에서 앵커 없는 객체 감지가 얼마나 뛰어난지 살펴봤습니다. 이 접근 방식을 사용하면 YOLO11 다양한 물체 크기와 복잡한 장면에 더 쉽게 적응하여 다양한 환경에서 더 나은 성능을 제공할 수 있습니다.

컴퓨터 비전이 계속 발전함에 따라 객체 감지는 더욱 빠르고 유연하며 효율적으로 발전할 것입니다.

GitHub 리포지토리를 살펴보고 활발한 커뮤니티에 참여하여 AI에 관한 모든 최신 소식을 받아보세요. 비전 AI가 제조농업과 같은 분야에 어떤 영향을 미치고 있는지 확인해 보세요.

Facebook 로고트위터 로고LinkedIn 로고복사 링크 기호

이 카테고리에서 자세히 보기

인공지능의 미래
를 함께 만들어 갑시다!

머신 러닝의 미래와 함께하는 여정 시작하기