YOLO11 앵커 프리 탐지: 이점

Vision AI 모델의 역사를 되돌아보면 이미지 또는 비디오 내에서 객체를 식별하고 위치를 파악하는 핵심 컴퓨터 비전 작업인 객체 감지 개념은 1960년대부터 존재했습니다. 그러나 오늘날 첨단 혁신에서 객체 감지가 중요한 이유는 객체 감지 기술과 모델 아키텍처가 그 이후로 발전하고 빠르게 개선되었기 때문입니다.

이전 기사에서는 물체 감지의 진화 과정과 Ultralytics YOLO 모델로 이어진 여정에 대해 설명했습니다. 오늘은 이 여정에서 보다 구체적인 이정표인 앵커 기반 감지기에서 앵커가 없는 감지기로의 전환을 살펴보는 데 초점을 맞추고자 합니다.

앵커 기반 검출기는 이미지에서 객체의 위치를 예측하기 위해 "앵커"라고 하는 미리 정의된 상자에 의존합니다. 반면, 앵커 프리 검출기는 이러한 미리 정의된 상자를 건너뛰고 객체 위치를 직접 예측합니다.

이러한 변화는 단순하고 논리적인 변화처럼 보일 수 있지만, 실제로는 물체 감지 정확도와 효율성을 크게 향상시켰습니다. 이 글에서는 앵커 없는 감지기가 다음과 같은 발전을 통해 컴퓨터 비전을 어떻게 재구성했는지 살펴봅니다. Ultralytics YOLO11.

앵커 기반 검출기란 무엇입니까?

Anchor-based detectors는 이미지 내 객체 위치를 파악하는 데 도움이 되는 앵커라는 미리 정의된 상자를 사용합니다. 이러한 앵커는 이미지 위에 다양한 크기와 모양으로 배치된 상자 격자라고 생각하면 됩니다. 모델은 이러한 상자를 조정하여 감지된 객체에 맞춥니다. 예를 들어 모델이 자동차를 식별하면 앵커 상자를 수정하여 자동차의 위치와 크기에 더 정확하게 맞춥니다.

각 앵커는 이미지에서 가능한 물체와 연결되며, 학습 과정에서 모델은 물체의 위치, 크기 및 종횡비에 더 잘 맞도록 앵커 상자를 조정하는 방법을 학습합니다. 이를 통해 모델은 다양한 배율과 방향의 물체를detect 수 있습니다. 그러나 올바른 앵커 박스 세트를 선택하는 데는 시간이 많이 소요될 수 있으며 미세 조정 과정에서 오류가 발생할 수 있습니다.

__wf_reserved_inherit — Fig 1. 앵커 박스란 무엇인가?

‍

YOLOv4와 같은 앵커 기반 감지기는 많은 애플리케이션에서 잘 작동했지만 몇 가지 단점이 있습니다. 예를 들어, 앵커 박스는 모양이나 크기가 다른 물체와 항상 잘 정렬되지 않아 모델이 작거나 불규칙한 모양의 물체를 detect 어렵게 만들 수 있습니다. 앵커 박스 크기를 선택하고 미세 조정하는 과정도 시간이 오래 걸리고 많은 수작업이 필요할 수 있습니다. 이 외에도, 앵커 기반 모델은 사전 정의된 박스가 이러한 복잡한 시나리오에 잘 적응하지 못할 수 있기 때문에 가려지거나 겹치는 물체를 감지하는 데 어려움을 겪는 경우가 많습니다.

앵커 프리 객체 감지로의 전환

앵커 프리 검출기는 2018년에 CornerNet 및 CenterNet과 같은 모델을 통해 주목을 받기 시작했으며, 미리 정의된 앵커 상자의 필요성을 없애 객체 탐지에 대한 새로운 접근 방식을 취했습니다. 다양한 크기와 모양의 앵커 상자에 의존하여 객체의 위치를 예측하는 기존 모델과 달리 앵커 프리 모델은 객체의 위치를 직접 예측합니다. 중심과 같은 객체의 주요 지점이나 특징에 집중하여 탐지 프로세스를 단순화하고 더 빠르고 정확하게 만듭니다.

다음은 앵커 프리 모델의 일반적인 작동 방식입니다.

키포인트(Keypoint) 감지: 미리 정의된 박스를 사용하는 대신, 일부 모델은 객체의 중심이나 특정 모서리와 같은 중요한 지점을 식별합니다. 이러한 키포인트는 모델이 객체의 위치와 크기를 파악하는 데 도움이 됩니다.
‍
중심 예측: 일부 모델은 객체의 중심을 예측하는 데 중점을 둡니다. 중심이 파악되면 모델은 전체 객체의 크기와 위치를 예측할 수 있습니다.
‍
히트맵 회귀: 많은 앵커 프리 모델은 히트맵을 사용하며, 여기서 각 픽셀은 객체의 가능한 위치를 나타냅니다. 히트맵 값이 클수록 해당 지점에 객체가 존재할 가능성이 높다는 것을 나타냅니다.

‍

앵커 프리 모델은 앵커 박스에 의존하지 않기 때문에 디자인이 더 단순합니다. 즉, 계산 효율성이 더 높다는 뜻입니다. 여러 개의 앵커 박스를 처리할 필요가 없으므로 물체를 더 빠르게 detect 수 있어 자율 주행 및 비디오 감시와 같은 실시간 애플리케이션에서 중요한 이점을 제공합니다.

앵커가 없는 모델은 작고 불규칙하거나 가려진 물체를 처리하는 데도 훨씬 더 효과적입니다. 앵커 박스에 맞추기보다는 주요 지점을 감지하는 데 초점을 맞추기 때문에 훨씬 더 유연합니다. 따라서 앵커 기반 모델이 실패할 수 있는 복잡하거나 어수선한 환경에서도 정확하게 물체를 detect 수 있습니다.

Ultralytics YOLO11: 앵커가 필요 없는 검출기

원래 속도와 효율성을 위해 설계된 YOLO 모델은 점차 앵커 기반 방식에서 앵커가 없는 감지 방식으로 전환되어 YOLO11 같은 모델이 더 빠르고 유연하며 다양한 실시간 애플리케이션에 더 적합해졌습니다.

앵커 프리 디자인이 다양한 YOLO 버전에서 어떻게 진화했는지 간략하게 살펴보세요:

Ultralytics YOLOv5u: 앵커가 필요 없는 분할형 Ultralytics 헤드를 도입하여 사전 정의된 앵커 박스가 필요하지 않습니다. 대신 모델이 이미지에서 객체의 위치를 직접 예측하여 프로세스를 간소화하고 유연성과 속도를 개선합니다.
‍
YOLOv6: 훈련 중에만 앵커를 사용하는 앵커 보조 훈련(AAT)이라는 새로운 방법이 사용되었습니다. 이를 통해 모델은 훈련 중에는 앵커 기반 방법의 구조를 활용하면서 런타임에는 앵커 없는 감지를 사용하여 속도와 적응력을 향상시킬 수 있었습니다.
‍
Ultralytics YOLOv8: 앵커 프리 분할 Ultralytics 헤드를 사용하여 앵커 프리 감지로 완전히 전환했습니다. 이를 통해 특히 앵커 박스에 잘 맞지 않는 작거나 이상한 모양의 물체에 대해 모델이 더 빠르고 정확해졌습니다.
‍
Ultralytics YOLO11: YOLOv8앵커 프리 접근 방식을 기반으로 구축되어 앵커 박스를 완전히 제거함으로써 탐지를 더욱 최적화합니다. 따라서 동물 행동 모니터링 및 리테일 분석과 같은 실시간 애플리케이션에서 더 빠르고 정확하게 탐지할 수 있습니다.

‍

YOLO11 실제 적용 사례

YOLO11 사용한 앵커 프리 감지의 이점을 보여주는 좋은 예는 자율주행 차량입니다. 자율주행차에서는 보행자, 다른 차량, 장애물을 빠르고 정확하게 감지하는 것이 안전을 위해 매우 중요합니다. YOLO11 앵커 프리 접근 방식은 미리 정의된 앵커 박스에 의존하지 않고 보행자의 중심이나 다른 차량의 경계와 같은 물체의 주요 지점을 직접 예측하여 감지 프로세스를 간소화합니다.

‍

YOLO11 계산 비용이 많이 들고 속도가 느려질 수 있는 각 개체에 앵커 그리드를 조정하거나 맞출 필요가 없습니다. 대신 핵심 기능에 집중하여 더 빠르고 효율적으로 작동합니다. 예를 들어, 보행자가 차량의 경로에 들어왔을 때 YOLO11 사람이 부분적으로 가려져 있거나 움직이고 있어도 주요 지점을 정확히 찾아내어 그 위치를 빠르게 식별할 수 있습니다. 앵커 박스 없이도 다양한 모양과 크기에 적응할 수 있는 기능 덕분에 YOLO11 자율주행 시스템의 실시간 의사 결정에 필수적인 물체를 더 안정적으로 더 빠른 속도로 detect 수 있습니다.

YOLO11앵커 프리 기능이 정말 돋보이는 다른 애플리케이션은 다음과 같습니다:

소매 및 재고 관리: YOLO11 사용하면 진열대에 제품이 쌓여 있거나 부분적으로 가려져 있어도 쉽게 모니터링할 수 있습니다. 이를 통해 더 빠르고 정확하게 재고를 추적하고 오류를 줄일 수 있습니다.
‍
의료 영상: YOLO11 의료 스캔에서 종양이나 기타 이상 징후를 detect 수 있는 의료 분야에서도 효과적입니다. 불규칙한 모양의 물체도 처리할 수 있어 복잡한 상태를 진단하는 정확도를 높이는 데 도움이 됩니다.
‍
야생동물 모니터링: 야생동물 연구에서 YOLO11 울창한 숲이나 거친 지형에서 동물을 track 연구자들이 행동을 모니터링하거나 멸종 위기종을 보호할 수 있도록 도와줍니다.
↪f_200D↩
스포츠 분석: YOLO11 스포츠 경기 중 선수, 공의 움직임 또는 기타 요소를 실시간으로 track 팀, 코치, 방송사에게 귀중한 인사이트를 제공하는 데 사용할 수 있습니다.

앵커 프리 모델 작업 시 고려 사항

YOLO11 같은 앵커 프리 모델은 많은 장점을 제공하지만, 몇 가지 한계가 있습니다. 실용적으로 고려해야 할 주요 사항 중 하나는 앵커 프리 모델도 폐색이나 매우 겹치는 물체로 인해 어려움을 겪을 수 있다는 것입니다. 그 이유는 컴퓨터 비전은 인간의 시각을 재현하는 것을 목표로 하며, 우리가 때때로 가려진 물체를 식별하는 데 어려움을 겪는 것처럼 AI 모델도 비슷한 문제에 직면할 수 있기 때문입니다.

또 다른 흥미로운 요소는 모델 예측 처리와 관련이 있습니다. 앵커가 없는 모델의 아키텍처는 앵커 기반 모델보다 간단하지만, 특정 경우에는 추가적인 세분화가 필요합니다. 예를 들어, 중복되는 예측을 정리하거나 혼잡한 장면에서 정확도를 향상시키기 위해 비최대 억제NMS와 같은 후처리 기술이 필요할 수 있습니다.

YOLO11 함께 AI의 미래에 닻을 내리기

앵커 기반에서 앵커 프리 감지로의 전환은 물체 감지의 중요한 발전이었습니다. YOLO11 같은 앵커 프리 모델을 사용하면 프로세스가 간소화되어 정확도와 속도가 모두 향상됩니다.

YOLO11 통해 빠르고 정확한 감지가 중요한 자율주행차, 비디오 감시, 의료 영상과 같은 실시간 애플리케이션에서 앵커 없는 객체 감지가 얼마나 뛰어난지 확인했습니다. 이러한 접근 방식을 통해 YOLO11 다양한 물체 크기와 복잡한 장면에 보다 쉽게 적응하여 다양한 환경에서 더 나은 성능을 제공할 수 있습니다.

컴퓨터 비전이 계속 발전함에 따라 객체 감지는 더욱 빠르고 유연하며 효율적으로 변모할 것입니다.

GitHub 저장소를 살펴보고 활발한 커뮤니티에 참여하여 모든 AI 관련 소식을 받아보세요. Vision AI가 제조업 및 농업과 같은 분야에 어떤 영향을 미치는지 확인해 보세요.

앵커 프리 디텍터인 Ultralytics YOLO11 이점

앵커 기반 검출기란 무엇입니까?

앵커 프리 객체 감지로의 전환

Ultralytics YOLO11: 앵커가 필요 없는 검출기

YOLO11 실제 적용 사례

앵커 프리 모델 작업 시 고려 사항

YOLO11 함께 AI의 미래에 닻을 내리기

이 카테고리에서 더 읽어보기

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 활용한 교통 사고 관리 자동화

Ultralytics 프로덕션 환경에 배포하기 더 쉬운 이유를 살펴봅니다!

함께 미래의 AI를 만들어 갑시다!