2023년부터 2025년까지 이러한 모델이 어떻게 진화하고 개선되었는지 알아보려면 Ultralytics YOLOv8, YOLOv9, YOLOv10 및 Ultralytics YOLO11 비교하세요.
일상 업무 자동화부터 실시간 정보에 기반한 의사 결정 지원까지, 인공지능(AI)은 다양한 산업의 미래를 재편하고 있습니다. 특히 흥미로운 AI 분야 중 하나는 비전 AI라고도 불리는 컴퓨터 비전입니다. 컴퓨터 비전은 기계가 사람처럼 시각적 데이터를 분석하고 해석할 수 있도록 하는 데 중점을 둡니다.
특히 컴퓨터 비전 모델은 안전과 효율성을 모두 향상시키는 혁신을 주도하고 있습니다. 예를 들어, 이러한 모델은 자율 주행 차량에서 보행자를 감지하고 보안 카메라에서 24시간 건물을 모니터링하는 데 사용됩니다.
가장 잘 알려진 컴퓨터 비전 모델 중 하나는 실시간 객체 감지 기능으로 유명한 YOLO (You Only Look Once) 모델입니다. 시간이 지남에 따라 YOLO 모델은 새로운 버전이 나올 때마다 더 나은 성능과 유연성을 제공하면서 개선되었습니다.
다음과 같은 최신 버전 Ultralytics YOLO11 는 인스턴스 분할, 이미지 분류, 포즈 추정, 다중 객체 추적과 같은 다양한 작업을 이전보다 더 나은 정확도, 속도, 정밀도로 처리할 수 있습니다.
이 문서에서는 다음을 비교합니다. Ultralytics YOLOv8, YOLOv9, YOLOv10 및 Ultralytics YOLO11 비교하여 이러한 모델이 어떻게 발전했는지 더 잘 파악할 수 있습니다. 주요 기능, 벤치마크 결과 및 성능 차이를 분석해 보겠습니다. 지금 바로 시작하세요!
2023년 1월 10일에 출시된 YOLOv8 이전 YOLO 모델에 비해 크게 발전한 버전입니다. 실시간 정확한 탐지에 최적화되어 있으며, 더 나은 결과를 위해 잘 테스트된 접근 방식과 혁신적인 업데이트를 결합했습니다.
물체 감지를 넘어 인스턴스 분할, 포즈 추정, 방향성 경계 상자(OBB) 물체 감지, 이미지 분류와 같은 컴퓨터 비전 작업도 지원합니다. YOLOv8 또 다른 중요한 특징은 필요에 따라 속도와 정확도의 적절한 균형을 맞출 수 있도록 나노, 소형, 중형, 대형, X의 다섯 가지 모델로 제공된다는 점입니다.
다재다능하고 강력한 성능을 갖춘 YOLOv8 보안 시스템, 스마트 시티, 헬스케어, 산업 자동화 등 다양한 실제 애플리케이션에서 사용할 수 있습니다.
YOLOv8 다른 주요 기능 몇 가지를 자세히 살펴보세요:
2024년 2월 21일, 대만 아카데미아 시니카 정보과학연구소의 왕치엔야오와 홍위안 마크 리아오가 YOLOv9을 출시했습니다. 객체 감지 및 인스턴스 세분화와 같은 작업을 지원합니다.
이 모델은 다음을 기반으로 합니다. Ultralytics YOLOv5 를 기반으로 하며 두 가지 주요 혁신이 도입되었습니다: 프로그래밍 가능한 그라데이션 정보(PGI)와 일반화된 효율적인 레이어 집계 네트워크(GELAN)입니다.
PGI는 YOLOv9이 레이어를 통해 데이터를 처리할 때 중요한 정보를 유지하여 보다 정확한 결과를 도출할 수 있도록 도와줍니다. 한편, GELAN은 모델이 레이어를 사용하는 방식을 개선하여 성능과 계산 효율성을 높입니다. 이러한 업그레이드 덕분에 YOLOv9은 컴퓨팅 리소스가 제한적인 엣지 디바이스 및 모바일 앱에서 실시간 작업을 처리할 수 있게 되었습니다.
다음은 YOLOv8 다른 주요 기능 몇 가지를 간략히 소개합니다:
2024년 5월 23일 칭화대학교 연구진에 의해 출시된 YOLOv10은 실시간 객체 감지에 중점을 두고 있습니다. 이 버전은 중복 감지를 제거하는 데 사용되는 후처리 단계인 비최대 억제(NMS)의 필요성을 제거하고 전반적인 모델 설계를 개선함으로써 이전 YOLO 버전의 한계를 해결합니다. 그 결과 물체를 더 빠르고 효율적으로 감지하는 동시에 최첨단 정확도를 달성할 수 있게 되었습니다.
이를 가능하게 하는 핵심적인 부분은 일관된 이중 레이블 할당으로 알려진 학습 접근 방식입니다. 이는 동일한 객체에서 여러 예측을 학습할 수 있는 전략(일대다)과 최상의 단일 예측을 선택하는 데 중점을 두는 전략(일대일)의 두 가지 전략을 결합한 것입니다. 두 전략 모두 동일한 매칭 규칙을 따르기 때문에 모델이 스스로 중복을 피하는 방법을 학습하므로 NMS가 필요하지 않습니다.
또한 YOLOv10의 아키텍처는 개선된 CSPNet 백본을 사용하여 기능을 더 효과적으로 학습하고, 여러 계층의 정보를 결합하는 PAN(경로 집계 네트워크) 넥을 사용하여 작은 물체와 큰 물체를 모두 더 잘 감지할 수 있도록 합니다. 이러한 개선 사항 덕분에 제조, 소매업, 자율 주행 등의 실제 애플리케이션에 YOLOv10을 사용할 수 있게 되었습니다.
다음은 YOLOv10의 다른 뛰어난 기능 중 일부입니다:
올해 9월 30일, Ultralytics 연례 하이브리드 행사인 YOLO 비전 2024(YV24)에서 YOLO 시리즈의 최신 모델 중 하나인 YOLO11 공식 출시했습니다.
이번 릴리스에는 이전 버전에 비해 크게 개선된 기능이 도입되었습니다. YOLO11 더 빠르고 정확하며 매우 효율적입니다. 물체 감지, 인스턴스 분할, 이미지 분류 등 YOLOv8 사용자에게 익숙한 컴퓨터 비전 작업의 모든 범위를 지원합니다. 또한 YOLOv8 워크플로우와의 호환성을 유지하므로 사용자가 새 버전으로 원활하게 전환할 수 있습니다.
또한 YOLO11 경량 엣지 디바이스에서 강력한 클라우드 시스템에 이르기까지 다양한 컴퓨팅 요구사항을 충족하도록 설계되었습니다. 이 모델은 오픈 소스 버전과 엔터프라이즈 버전으로 제공되므로 다양한 사용 사례에 맞게 조정할 수 있습니다.
의료 영상 및 위성 탐지와 같은 정밀 작업은 물론 자율 주행 차량, 농업 및 의료 분야의 광범위한 애플리케이션에 적합한 옵션입니다.
다음은 YOLO11 다른 고유 기능입니다:
다양한 모델을 살펴볼 때 기능만 보고 비교하기란 쉽지 않습니다. 이때 벤치마킹이 필요합니다. 동일한 데이터 세트에서 모든 모델을 실행하면 객관적으로 성능을 측정하고 비교할 수 있습니다. COCO 데이터 세트에서 각 모델이 어떻게 작동하는지 살펴보겠습니다.
각 새 버전은 정확도, 속도, 유연성 측면에서 눈에 띄게 개선되었습니다. 특히 YOLO11m은 YOLOv8m 22% 적은 수의 파라미터를 사용하므로 더 가볍고 빠르게 실행할 수 있다는 점에서 비약적인 발전을 이루었습니다. 또한 더 작은 크기에도 불구하고 COCO 데이터 세트에서 더 높은 평균 정밀도(mAP)를 달성합니다. 이 지표는 모델이 객체를 얼마나 잘 감지하고 위치를 파악하는지를 측정하므로, mAP가 높을수록 예측이 더 정확하다는 것을 의미합니다.
실제 상황에서 이러한 모델이 어떻게 작동하는지 살펴보겠습니다.
신뢰도 점수 0.3(모델은 물체를 정확하게 식별했다고 30% 이상 확신하는 경우에만 탐지 결과를 표시함)과 이미지 크기 640을 사용하여 동일한 교통 영상에서 YOLOv8, YOLOv9, YOLOv10 및 YOLO11 모두 실행하여 공정한 평가를 진행했습니다. 물체 감지 및 추적 결과는 감지 정확도, 속도 및 정밀도에서 주요 차이점을 강조했습니다.
첫 번째 프레임부터 YOLO11 트럭과 같은 대형 차량을 포착했는데, 이는 YOLOv10이 놓친 것입니다. YOLOv8 YOLOv9는 괜찮은 성능을 보였지만 조명 조건과 물체 크기에 따라 차이가 있었습니다. 작고 멀리 있는 차량은 모든 모델에서 여전히 어려운 문제였지만, YOLO11 이러한 감지 성능도 눈에 띄게 향상되었습니다.
속도 측면에서는 모든 모델이 프레임당 10~20밀리초로 작동하여 50FPS 이상의 실시간 작업을 처리할 수 있을 만큼 빨랐습니다. 한편으로 YOLOv8 YOLOv9는 비디오 전체에서 안정적이고 신뢰할 수 있는 감지 성능을 제공했습니다. 흥미롭게도 지연 시간을 줄이기 위해 설계된 YOLOv10은 더 빨랐지만 특정 물체 유형을 감지하는 데 약간의 불일치를 보였습니다.
반면에 YOLO11 속도와 정확도 사이의 강력한 균형을 제공하는 정밀도가 돋보였습니다. 모든 프레임에서 완벽한 성능을 보인 모델은 없었지만, 나란히 비교한 결과 YOLO11 전반적으로 가장 우수한 성능을 제공한다는 것이 분명하게 드러났습니다.
프로젝트의 모델 선택은 프로젝트의 특정 요구 사항에 따라 달라집니다. 예를 들어, 어떤 애플리케이션은 속도를 우선시하는 반면, 어떤 애플리케이션은 더 높은 정확도가 필요하거나 배포 제약 조건이 결정에 영향을 미칠 수 있습니다.
또 다른 중요한 요소는 해결해야 하는 컴퓨터 비전 작업의 유형입니다. 다양한 작업에 걸쳐 보다 폭넓은 유연성을 원한다면 YOLOv8 YOLO11 좋은 옵션입니다.
YOLOv8 YOLO11 중 어떤 것을 선택할지는 여러분의 필요에 따라 달라집니다. 컴퓨터 비전을 처음 접하고 더 큰 커뮤니티, 더 많은 튜토리얼, 광범위한 타사 통합을 중요하게 생각한다면 YOLOv8 선택하는 것이 좋습니다.
반면, 더 나은 정확도와 속도를 갖춘 최첨단 성능을 원한다면 최신 릴리스이기 때문에 커뮤니티가 더 작고 통합 기능이 적지만 YOLO11 더 나은 선택입니다.
Ultralytics YOLOv8 Ultralytics YOLO11 이르기까지, YOLO 모델 시리즈의 진화는 보다 지능적인 컴퓨터 비전 모델을 향한 지속적인 노력을 반영합니다. YOLO 각 버전은 속도, 정확도, 정밀도 측면에서 의미 있는 업그레이드를 제공합니다.
컴퓨터 비전이 계속 발전함에 따라 이러한 모델은 물체 감지부터 자율 시스템에 이르기까지 현실 세계의 과제에 대한 신뢰할 수 있는 솔루션을 제공합니다. YOLO 모델의 지속적인 개발은 이 분야가 얼마나 발전했으며 앞으로 얼마나 더 많은 것을 기대할 수 있는지를 보여줍니다.
AI에 대해 자세히 알아보려면 GitHub 리포지토리를 방문하고 커뮤니티에 참여하세요. 제조업의 비전 AI부터 의료 분야의 컴퓨터 비전까지, 산업 전반의 발전을 살펴보세요. 지금 바로 라이선스 옵션을 확인하여 Vision AI 프로젝트를 시작하세요.