다양한 학습 데이터로 모델 성능을 개선하기 위해 Ultralytics YOLO11 사용자 지정 학습할 때 증강을 위한 문서화를 사용하는 방법을 알아보세요.
컴퓨터 비전 솔루션을 구축할 때 비전 AI 모델 학습을 위해 다양한 이미지를 수집하는 것은 프로세스의 중요한 부분입니다. 이 작업에는 많은 시간과 비용이 필요하며, 때로는 수집된 이미지가 모델이 효과적으로 학습하기에 충분하지 않은 경우도 있습니다.
예를 들어, 다음과 같은 컴퓨터 비전 모델은 Ultralytics YOLO11 와 같은 컴퓨터 비전 모델은 다양한 애플리케이션과 관련된 다양한 컴퓨터 비전 작업을 위해 이미지 데이터세트를 맞춤 학습할 수 있습니다. 다양한 데이터는 모델이 더 잘 일반화하여 다양한 실제 시나리오에서 물체와 패턴을 인식할 수 있도록 돕기 때문에 중요합니다.
다양한 데이터 부족으로 어려움을 겪고 있다면 이미지 데이터 증강 기술이 훌륭한 솔루션이 될 수 있습니다. 회전, 뒤집기, 밝기 조정과 같은 방법을 사용하면 데이터 세트의 다양성을 높여 더 광범위한 조건을 처리할 수 있는 모델의 능력을 향상시킬 수 있습니다.
이것이 바로 Ultralytics 이미지 데이터 증강을 위한 통합을 지원하는 이유입니다. 다양한 변환 모음을 제공하는 인기 도구인 앨범멘테이션을 사용하면 다양한 시각적 데이터를 생성할 수 있습니다. 이 통합은 훈련 이미지를 자동으로 증강하여 YOLO11 훈련 프로세스를 간소화하여 모델 성능을 향상시킵니다.
이 문서에서는 문서화 통합을 사용하는 방법과 그 이점, 모델 교육에 미치는 영향에 대해 살펴봅니다.
컴퓨터 비전 모델은 다양한 환경의 물체를 인식하기 위해 광범위한 고품질 이미지 세트로부터 학습할 수 있습니다. 실제 소스에서 대규모 데이터 세트를 수집하는 것은 느리고 비용이 많이 들며 비효율적일 수 있습니다. 이 작업을 간소화하기 위해 이미지 데이터 증강을 사용하면 기존 이미지의 새로운 변형을 생성하여 더 많은 데이터를 수집하지 않고도 모델이 다양한 시나리오에서 학습할 수 있도록 지원할 수 있습니다.
특히, 2018년에 효율적인 이미지 데이터 증강을 위해 도입된 오픈 소스 라이브러리인 앨범멘테이션을 활용할 수 있습니다. 회전 및 뒤집기와 같은 간단한 기하학적 변경부터 밝기, 대비, 노이즈 추가와 같은 보다 복잡한 조정에 이르기까지 다양한 작업을 지원합니다.
Albumentation은 고성능으로 잘 알려져 있어 이미지를 빠르고 효율적으로 처리할 수 있습니다. OpenCV 및 NumPy와 같은 최적화된 라이브러리를 기반으로 구축되어 처리 시간을 최소화하면서 대규모 데이터 세트를 처리하므로 모델 훈련 중 빠른 데이터 증강에 이상적입니다.
다음은 문서화의 다른 주요 기능입니다:
데이터 세트에 증강 기능을 적용하는 방법에는 여러 가지가 있으며, OpenCV와 같은 도구를 사용하여 직접 만들 수도 있습니다. 그렇다면 왜 앨범멘테이션과 같은 라이브러리를 지원하는 통합을 선택해야 할까요?
OpenCV와 같은 도구를 사용하여 수동으로 증강을 만들려면 시간이 많이 걸리고 전문 지식이 필요합니다. 또한 최상의 결과를 얻기 위해 변환을 미세 조정하는 것도 까다로울 수 있습니다. 문서화 통합 기능을 사용하면 이 과정이 더 쉬워집니다. 바로 사용할 수 있는 다양한 변환을 제공하여 데이터 집합을 준비할 때 시간과 노력을 절약할 수 있습니다.
알버멘테이션 통합을 선택해야 하는 또 다른 이유는 Ultralytics 모델 트레이닝 파이프라인과 원활하게 작동하기 때문입니다. 훈련 중에 증강 기능이 자동으로 적용되므로 YOLO11 훨씬 더 쉽게 사용자 지정 훈련할 수 있습니다. 프로세스가 간소화되므로 데이터 준비 처리보다는 모델 개선에 더 집중할 수 있습니다.
흥미로운 점은 알비멘테이션 통합 기능을 사용하여 YOLO11 훈련하는 것이 생각보다 간단하다는 것입니다. 올바른 라이브러리를 설정하면 통합 기능은 학습 중에 이미지 데이터 증강을 자동으로 적용합니다. 이는 모델이 동일한 데이터 세트를 사용하여 다양한 이미지 변형을 학습하는 데 도움이 됩니다.
다음으로, YOLO11 사용자 지정 교육할 때 기록 통합 기능을 설치하고 사용하는 방법을 안내해 드리겠습니다.
증강 기능을 적용하기 전에 Ultralytics Python 패키지와 Albumentation을 모두 설치해야 합니다. 두 라이브러리가 기본적으로 원활하게 함께 작동하도록 통합이 구축되었으므로 복잡한 구성에 대해 걱정할 필요가 없습니다.
아래 이미지와 같이 Python 라이브러리 설치를 위한 패키지 관리 도구인 pip 명령 한 번으로 전체 설치 프로세스를 단 몇 분 만에 완료할 수 있습니다.
문서화가 설치되면 Ultralytics 모델 학습 모드가 학습 중에 이미지 증강을 자동으로 적용합니다. 문서화가 설치되어 있지 않으면 이러한 증강 기능이 적용되지 않습니다. 자세한 내용은 공식 Ultralytics 설명서를 참조하세요.
문서화 통합의 내부에서 어떤 일이 벌어지고 있는지 더 잘 이해해 보겠습니다.
YOLO11 교육에 적용된 증강 기능을 자세히 살펴보세요:
특정 애플리케이션에 맞게 YOLO11 맞춤 학습하는 경우, 문서화 통합을 통해 다양한 조건에 맞게 조정하여 모델의 성능을 향상시킬 수 있습니다. 실제 애플리케이션과 이 통합을 통해 해결할 수 있는 몇 가지 과제에 대해 논의해 보겠습니다.
의료 분야의 비전 AI는 의사들이 의료 이미지를 보다 정확하게 분석하여 진단을 돕고 환자 치료를 개선하는 데 도움을 주고 있습니다. 실제로 의료 기관의 약 5분의 1이 이미 AI 솔루션을 사용하고 있습니다.
하지만 이러한 컴퓨터 비전 솔루션을 만드는 데에는 여러 가지 어려움이 따릅니다. 의료 스캔은 병원마다 장비, 환경, 심지어 기술자의 경험 등의 요인에 따라 크게 달라질 수 있습니다. 밝기, 대비, 노출의 변화는 비전 AI 모델의 일관성과 정확성에 영향을 미쳐 다양한 환경에서 안정적으로 작동하기 어렵게 만들 수 있습니다.
바로 이 부분에서 알비멘테이션과 같은 도구의 통합이 필수적입니다. Albumentations는 동일한 스캔의 여러 증강 버전을 생성함으로써 모델이 다양한 이미지 품질로부터 학습할 수 있도록 합니다. 이를 통해 모델이 더욱 견고해져 고화질과 저화질 이미지 모두에서 질병을 정확하게 감지할 수 있습니다.
비전 AI의 또 다른 흥미로운 응용 분야는 보안 및 감시 분야입니다. 실시간 객체 감지는 보안 팀이 잠재적인 위협을 빠르게 식별하는 데 도움이 될 수 있습니다.
이 애플리케이션과 관련된 주요 관심사는 보안 카메라는 하루 종일 다양한 조명 조건에서 영상을 캡처하며, 이러한 조건은 모델이 이러한 이미지를 이해하는 방식에 큰 영향을 미칠 수 있다는 것입니다. 저조도 환경, 눈부심 또는 가시성 저하와 같은 요인으로 인해 컴퓨터 비전 모델이 물체를 감지하거나 잠재적인 위협을 일관되게 인식하기 어려울 수 있습니다.
알버멘테이션 통합은 다양한 조명 조건을 모방하기 위해 변환을 적용하여 도움을 줍니다. 이를 통해 모델은 밝은 환경과 어두운 환경 모두에서 물체를 감지하는 방법을 학습하여 신뢰성을 높이고 까다로운 조건에서 응답 시간을 개선할 수 있습니다.
슈퍼마켓 통로에서 물건을 흘리거나, 개가 매장을 뛰어다니거나, 어린이가 제품 진열대를 넘어뜨리는 것은 리테일 환경에서 비전 AI의 엣지 케이스가 될 수 있는 일상적인 이벤트의 몇 가지 예에 불과합니다. 컴퓨터 비전은 쇼핑객의 행동을 추적하고, 유동 인구를 모니터링하고, 진열대에 있는 제품을 식별하여 고객 경험을 개선하는 데 점점 더 많이 사용되고 있습니다. 그러나 이러한 실제 상황은 AI 시스템이 이해하고 정확하게 처리하기 어려울 수 있습니다.
컴퓨터 비전 데이터 세트에 모든 시나리오를 표현할 수는 없지만, 문서화 통합은 예상치 못한 조명, 비정상적인 각도 또는 장애물 등 다양한 상황을 커버할 수 있도록 데이터를 보강하여 도움을 줍니다. 이를 통해 컴퓨터 비전 모델은 다양한 조건에 적응하여 엣지 케이스를 처리하고 역동적인 리테일 환경에서 정확한 예측을 할 수 있는 능력을 향상시킬 수 있습니다.
모델 학습을 위해 다양한 실제 데이터를 수집하는 것은 복잡할 수 있지만, Albumentations를 사용하면 모델이 다양한 조건에 적응하는 데 도움이 되는 이미지 변형을 생성하여 더 쉽게 작업할 수 있습니다.
Ultralytics 지원하는 문서화 통합은 이러한 증강 기능을 적용하는 프로세스를 간소화하는 동시에 YOLO11 맞춤 학습합니다. 그 결과 데이터 세트 품질이 향상되어 보다 정확하고 신뢰할 수 있는 Vision AI 모델을 생성함으로써 다양한 산업 분야에 도움이 됩니다.
커뮤니티에 가입하고 GitHub 리포지토리를 탐색하여 AI에 대해 자세히 알아보고, 라이선스 옵션을 확인하여 Vision AI 프로젝트를 시작하세요. 제조 분야의 AI 또는 자율 주행 분야의 컴퓨터 비전과 같은 혁신에 관심이 있으신가요? 솔루션 페이지를 방문하여 자세히 알아보세요.