정확한 포즈 추정을 위해 Ultralytics YOLO11 모델을 사용하는 방법을 알아보세요. 다양한 애플리케이션을 위한 실시간 추론 및 사용자 지정 모델 학습에 대해 다룹니다.
인공 지능(AI)의 한 분야인 컴퓨터 비전과 관련된 연구는 1960년대로 거슬러 올라갑니다. 하지만 2010년대 들어 딥러닝이 등장하면서 기계가 이미지를 이해하는 방식에 획기적인 발전이 이루어졌습니다. 컴퓨터 비전의 최신 발전 중 하나는 최첨단 Ultralytics YOLO11 모델입니다. Ultralytics 의 연례 하이브리드 이벤트인 YOLO Vision 2024(YV24)에서 처음 소개된 YOLO11 모델은 포즈 추정을 비롯한 다양한 컴퓨터 비전 작업을 지원합니다.
포즈 추정은 이미지나 동영상에서 사람이나 물체의 주요 지점을 감지하여 위치, 자세 또는 움직임을 파악하는 데 사용할 수 있습니다. 스포츠 분석, 동물 행동 모니터링, 로봇 공학 등의 애플리케이션에서 기계가 신체 동작을 실시간으로 해석하는 데 널리 사용됩니다. 이전 모델인 YOLO (You Only Look Once) 시리즈보다 정확도, 효율성, 속도가 향상되었습니다, YOLO11 은 실시간 포즈 추정 작업에 매우 적합합니다.
이 글에서는 포즈 추정이 무엇인지 살펴보고, 몇 가지 응용 사례를 살펴보고, 포즈 추정을 위해 YOLO11 포즈 추정용 Ultralytics Python 패키지를 사용하는 방법을 안내합니다. 또한 Ultralytics HUB를 사용하여 몇 번의 클릭만으로 YOLO11 및 포즈 추정을 사용해 볼 수 있는 방법도 살펴볼 것입니다. 시작해 봅시다!
새로운 포즈 추정 모델(Ultralytics YOLO11 )을 사용하는 방법을 살펴보기 전에 포즈 추정에 대해 더 잘 이해해 보겠습니다.
포즈 추정은 이미지나 동영상에서 사람이나 물체의 포즈를 분석하는 데 사용되는 컴퓨터 비전 기법입니다. 다음과 같은 딥러닝 모델은 YOLO11 과 같은 딥러닝 모델은 주어진 물체나 사람의 주요 포인트를 식별하고, 위치를 찾고, 추적할 수 있습니다. 물체의 경우 이러한 키 포인트 에는 모서리, 가장자리 또는 뚜렷한 표면 표시가 포함될 수 있지만 사람의 경우 이러한 키 포인트는 팔꿈치, 무릎 또는 어깨와 같은 주요 관절을 나타냅니다.
포즈 추정은 객체 감지와 같은 다른 컴퓨터 비전 작업과 비교할 때 독특하고 더 복잡합니다. 객체 감지는 객체 주위에 상자를 그려서 이미지에서 객체의 위치를 찾는 반면, 포즈 추정은 객체의 주요 지점의 정확한 위치를 예측하는 방식으로 한 단계 더 나아갑니다.
포즈 추정에는 상향식과 하향식의 두 가지 주요 방식이 있습니다. 상향식 접근 방식은 개별 키 포인트를 감지하여 스켈레톤으로 그룹화하는 반면, 하향식 접근 방식은 먼저 객체를 감지한 다음 그 안에서 키 포인트를 추정하는 데 중점을 둡니다.
YOLO11 은 하향식 방식과 상향식 방식의 장점을 결합한 방식입니다. 상향식 방식과 마찬가지로 주요 포인트를 수동으로 그룹화할 필요 없이 간단하고 빠르게 작업할 수 있습니다. 동시에 한 단계로 사람을 감지하고 포즈를 추정하여 하향식 방법의 정확성을 활용합니다.
포즈 추정을 위한 YOLO11 의 다양한 기능은 다양한 산업 분야에서 폭넓게 활용될 수 있는 가능성을 열어줍니다. YOLO11 의 몇 가지 포즈 추정 사용 사례를 자세히 살펴보겠습니다.
안전은 모든 건설 프로젝트에서 중요한 요소입니다. 특히 통계적으로 건설 현장에서는 업무 관련 재해가 더 많이 발생하기 때문에 더욱 그렇습니다. 2021년에는 전체 업무 관련 사망 재해의 약 20%가 건설 현장 또는 그 근처에서 발생했습니다. 중장비와 전기 시스템과 같은 일상적인 위험 요소로 인해 작업자의 안전을 지키기 위해서는 강력한 안전 조치가 필수적입니다. 표지판, 바리케이드, 감독자의 수동 모니터링과 같은 기존의 방법은 항상 효과적인 것은 아니며 감독자가 더 중요한 업무에서 벗어날 수 있는 경우가 많습니다.
AI가 개입하여 안전을 개선하고, 자세 추정 기반 작업자 모니터링 시스템을 사용하여 사고 위험을 줄일 수 있습니다. Ultralytics YOLO11 모델을 사용하여 작업자의 움직임과 자세를 추적할 수 있습니다. 작업자가 위험한 장비에 너무 가까이 서 있거나 작업을 잘못 수행하는 등의 잠재적 위험을 빠르게 발견할 수 있습니다. 위험이 감지되면 감독자에게 알림을 보내거나 알람을 통해 작업자에게 경고할 수 있습니다. 지속적인 모니터링 시스템은 항상 위험을 경계하고 작업자를 보호함으로써 건설 현장을 더욱 안전하게 만들 수 있습니다.
농부와 연구자들은 YOLO11 을 사용하여 소와 같은 농장 동물의 움직임과 행동을 연구하여 파행과 같은 질병의 조기 징후를 발견할 수 있습니다. 파행은 동물이 다리나 발의 통증으로 인해 제대로 움직이지 못하는 상태를 말합니다. 소의 경우 파행과 같은 질병은 소의 건강과 복지에 영향을 미칠 뿐만 아니라 낙농장의 생산 문제로 이어집니다. 연구에 따르면 전 세계 낙농 산업에서 방목 기반 시스템에서는 소의 8%, 밀폐형 시스템에서는 15~30%가 절름발이를 앓고 있는 것으로 나타났습니다. 절름발이를 조기에 발견하고 해결하면 동물 복지를 개선하고 이 질환과 관련된 생산 손실을 줄일 수 있습니다.
YOLO11의 자세 추정 기능은 농부들이 동물의 걸음걸이 패턴을 추적하고 관절 문제나 감염과 같은 건강 문제를 나타내는 이상 징후를 빠르게 파악할 수 있도록 도와줍니다. 이러한 문제를 조기에 발견하면 더 빠르게 치료할 수 있어 동물의 불편함을 줄이고 농가의 경제적 손실을 방지할 수 있습니다.
비전 AI 지원 모니터링 시스템은 휴식 행동, 사회적 상호작용, 먹이 섭취 패턴을 분석하는 데도 도움이 될 수 있습니다. 또한 농부들은 자세 추정을 사용하여 스트레스나 공격성의 징후를 관찰할 수 있습니다. 이러한 인사이트는 동물에게 더 나은 생활 환경을 조성하고 복지를 향상시키는 데 사용될 수 있습니다.
자세 추정 기능은 사람들이 운동하는 동안 실시간으로 자세를 개선하는 데에도 도움이 될 수 있습니다. 체육관 및 요가 강사는 YOLO11 을 통해 운동하는 사람들의 신체 움직임을 모니터링하고 추적하여 관절과 팔다리와 같은 주요 지점에 초점을 맞춰 자세를 평가할 수 있습니다. 수집된 데이터는 이상적인 포즈 및 운동 기술과 비교할 수 있으며, 강사는 동작을 잘못 수행하는 경우 알림을 받아 부상을 예방할 수 있습니다.
예를 들어, 요가 수업 중에 자세 추정 기능은 모든 수강생이 적절한 균형과 정렬을 유지하고 있는지 모니터링하는 데 도움이 될 수 있습니다. 컴퓨터 비전 및 자세 추정 기능이 통합된 모바일 애플리케이션은 집에서 운동하는 사람이나 개인 트레이너를 만날 수 없는 사람들도 피트니스에 더 쉽게 접근할 수 있게 해줍니다. 이러한 지속적인 실시간 피드백은 사용자가 기술을 개선하고 피트니스 목표를 달성하는 동시에 부상 위험을 줄이는 데 도움이 됩니다.
이제 포즈 추정이 무엇인지 살펴보고 몇 가지 적용 사례에 대해 알아보았습니다. 이제 새로운 YOLO11 모델로 포즈 추정을 사용해 보는 방법을 살펴보겠습니다. 시작하려면 Ultralytics Python 패키지를 사용하거나 Ultralytics HUB를 이용하는 두 가지 편리한 방법이 있습니다. 두 가지 옵션을 모두 살펴보겠습니다.
추론을 실행하려면 YOLO11 모델이 학습 세트 외부의 새로운 데이터를 처리하고 학습한 패턴을 사용하여 해당 데이터를 기반으로 예측을 수행해야 합니다. 추론은 Ultralytics Python 패키지를 사용하여 코드를 통해 실행할 수 있습니다. 시작하려면 pip, conda 또는 Docker를 사용하여 Ultralytics 패키지를 설치하기만 하면 됩니다. 설치하는 동안 문제가 발생하면 일반적인 문제 가이드에서 유용한 문제 해결 팁을 확인할 수 있습니다.
패키지를 성공적으로 설치했으면 다음 코드는 모델을 로드하고 이를 사용하여 이미지에서 객체의 포즈를 예측하는 방법을 간략하게 설명합니다.
컴퓨터 비전 프로젝트를 진행 중이고 포즈 추정과 관련된 특정 애플리케이션에 대한 특정 데이터 세트가 있다고 가정해 보겠습니다. 그런 다음 애플리케이션에 맞게 사용자 지정 YOLO11 모델을 미세 조정하고 훈련할 수 있습니다. 예를 들어, 키포인트 데이터 세트를 사용하여 팔다리, 머리, 꼬리의 위치와 같은 주요 특징을 식별하여 이미지에서 호랑이의 포즈를 분석하고 이해할 수 있습니다.
다음 코드 스니펫을 사용하여 YOLO11 포즈 추정 모델을 로드하고 훈련할 수 있습니다. 모델은 YAML 구성에서 구축하거나 사전 학습된 모델을 로드하여 학습할 수 있습니다. 또한 이 스크립트를 사용하면 가중치를 전송하고 포즈 추정을 위한 COCO 데이터 세트와 같은 지정된 데이터 세트를 사용하여 모델 학습을 시작할 수 있습니다.
새로 학습된 사용자 지정 모델을 사용하여 컴퓨터 비전 솔루션과 관련된 보이지 않는 이미지에 대해 추론을 실행할 수 있습니다. 학습된 모델은 내보내기 모드를 사용하여 다른 형식으로 변환할 수도 있습니다.
지금까지 기본적인 코딩 지식이 필요한 YOLO11 사용 방법에 대해 살펴보았습니다. 이 방법을 원하지 않거나 코딩에 익숙하지 않다면 다른 옵션이 있습니다: Ultralytics HUB입니다. Ultralytics HUB는 YOLO 모델을 훈련하고 배포하는 과정을 간소화하도록 설계된 사용자 친화적인 플랫폼입니다. HUB를 사용하면 기술적 전문 지식 없이도 데이터 세트를 쉽게 관리하고, 모델을 훈련하고, 배포할 수 있습니다.
이미지에 대한 추론을 실행하려면 계정을 만들고'모델' 섹션으로 이동한 다음 관심 있는 YOLO11 포즈 추정 모델을 선택하면 됩니다. 미리보기 섹션에서 이미지를 업로드하고 아래와 같이 예측 결과를 확인할 수 있습니다.
Ultralytics YOLO11 는 다양한 애플리케이션에서 자세 추정과 같은 작업을 위한 정확하고 유연한 솔루션을 제공합니다. 건설 현장 작업자의 안전 개선부터 가축의 건강 모니터링, 피트니스 루틴의 자세 교정 지원까지, YOLO11 은 첨단 컴퓨터 비전 기술을 통해 정밀하고 실시간 피드백을 제공합니다.
다양한 모델 변형과 특정 사용 사례에 맞게 맞춤 훈련할 수 있는 기능을 갖춘 다용도성 덕분에 개발자와 비즈니스 모두에게 매우 유용한 도구입니다. Ultralytics Python 패키지로 코딩하거나 Ultralytics HUB를 사용하여 쉽게 구현할 수 있는 포즈 추정은 YOLO11 을 통해 접근성과 영향력을 높일 수 있습니다.
자세히 알아보려면 GitHub 리포지토리를 방문하여 커뮤니티에 참여하세요. 솔루션 페이지에서 제조 및 농업 분야의 AI 애플리케이션을 살펴보세요. 🚀