컴퓨터 비전을 위한 데이터 라벨링

인공지능(AI)은 기계에 인간과 유사한 능력을 부여하는 데 중점을 두고 있으며, 이를 수행하는 가장 일반적인 방법 중 하나는 지도 학습을 이용하는 것입니다. 즉, AI 모델에 레이블이 지정된 예제를 보여줌으로써 패턴을 학습하고 작업 능력을 향상시킬 수 있습니다. 이는 인간이 경험을 통해 배우는 방식과 매우 유사합니다. 그렇다면 이러한 레이블이 지정된 예제는 어떻게 생성될까요?

데이터 어노테이션은 머신러닝 알고리즘이 데이터를 이해하도록 돕기 위해 데이터에 레이블을 지정하거나 태그를 추가하는 것을 의미합니다. 컴퓨터 비전에서 이는 이미지나 비디오를 마킹하여 객체, 동작 또는 장면을 정확하게 인식하고 분류하는 것을 의미합니다. AI 모델의 성공은 학습에 사용되는 레이블이 지정된 데이터의 품질에 크게 좌우되기 때문에 데이터 레이블링은 매우 중요합니다.

연구에 따르면 AI 프로젝트 시간의 80% 이상이 데이터를 수집 및 집계하는 것부터 정리 및 레이블링하는 것까지 데이터 관리에 소요됩니다. 이는 AI 모델 개발에서 데이터 어노테이션이 얼마나 중요한지를 보여줍니다. 고품질로 어노테이션된 데이터를 사용하면 AI 모델이 실제 상황에서 얼굴 인식 및 객체 탐지와 같은 작업을 보다 정확하고 안정적으로 수행할 수 있습니다.

데이터 어노테이션이 필요한 이유

데이터 어노테이션은 컴퓨터 비전 모델의 성능이 얼마나 우수한지에 대한 기초를 형성합니다. 레이블이 지정된 데이터는 모델이 학습하고 예측하는 데 사용하는 정답(Ground Truth)입니다. 정답 데이터는 모델이 이해하려고 노력하는 실제 세계를 나타내기 때문에 매우 중요합니다. 이 신뢰할 수 있는 기준선이 없으면 AI 모델은 나침반 없이 항해하는 배와 같습니다.

__wf_reserved_inherit — 그림 1. 정답(Ground Truth) 대 예측.

‍

정확한 레이블링은 이러한 모델이 보고 있는 것을 이해하도록 돕고 더 나은 의사 결정으로 이어집니다. 데이터 레이블링이 잘못되었거나 일관성이 없으면 모델은 올바른 예측과 결정을 내리는 데 어려움을 겪을 것이며, 이는 마치 학생이 부정확한 교과서로 학습하는 것과 같습니다. 어노테이션된 데이터 덕분에 모델은 이미지 및 비디오에서 객체의 이미지 분류, 인스턴스 분할 및 자세 추정과 같은 작업을 학습할 수 있습니다.

데이터 세트(Dataset)를 위한 최고의 리소스

새로운 데이터 세트를 만들고 이미지와 비디오에 꼼꼼하게 레이블을 지정하기 전에 프로젝트에 기존 데이터 세트를 사용할 수 있는지 확인하는 것이 좋습니다. 무료로 고품질 데이터 세트에 액세스할 수 있는 훌륭한 오픈 소스 저장소가 많이 있습니다. 가장 인기 있는 저장소는 다음과 같습니다.

ImageNet: 이미지 분류 모델 학습에 주로 사용됩니다.
‍
COCO: 이 데이터 세트는 객체 감지, 분할 및 이미지 캡션을 위해 설계되었습니다.
↪cf_200D↩
파스칼 VOC: 객체 감지 및 세분화 작업을 지원합니다.

‍

데이터 세트를 선택할 때 프로젝트에 얼마나 적합한지, 데이터 세트의 크기, 다양성 및 레이블 품질과 같은 요소를 고려하는 것이 중요합니다. 또한 라이선스 약관을 검토하여 법적 영향을 피하고 데이터가 워크플로 및 도구에 적합한 방식으로 포맷되었는지 확인하십시오.

기존 데이터 세트가 요구 사항에 맞지 않는 경우 사용자 지정 데이터 세트를 만드는 것이 좋습니다. 프로젝트에 필요한 사항에 따라 웹캠, 드론 또는 스마트폰과 같은 도구를 사용하여 이미지를 수집할 수 있습니다. 이상적으로 사용자 지정 데이터 세트는 다양하고 균형이 잡혀 있어야 하며 해결하려는 문제를 진정으로 나타내야 합니다. 이는 다양한 조명 조건, 다양한 각도 및 여러 환경에서 이미지를 캡처하는 것을 의미할 수 있습니다.

더 적은 수의 이미지나 비디오만 수집할 수 있는 경우 데이터 증강은 유용한 기술입니다. 여기에는 기존 이미지에 회전, 뒤집기 또는 색상 조정과 같은 변환을 적용하여 데이터 세트를 확장하는 것이 포함됩니다. 데이터 세트의 크기를 늘리고 모델을 더욱 강력하게 만들고 데이터의 변화를 더 잘 처리할 수 있도록 합니다. 오픈 소스 데이터 세트, 사용자 지정 데이터 세트 및 증강된 데이터를 혼합하여 사용하면 컴퓨터 비전 모델의 성능을 크게 향상시킬 수 있습니다.

이미지 어노테이션 기법의 종류

이미지 어노테이션을 시작하기 전에 다양한 어노테이션 유형에 익숙해지는 것이 중요합니다. 이는 프로젝트에 적합한 유형을 선택하는 데 도움이 될 것입니다. 다음으로 주요 어노테이션 유형을 살펴보겠습니다.

바운딩 박스

바운딩 박스는 컴퓨터 비전에서 가장 일반적인 어노테이션 유형입니다. 이는 이미지에서 객체의 위치를 표시하는 데 사용되는 직사각형 상자입니다. 이러한 상자는 모서리의 좌표로 정의되며 AI 모델이 객체를 식별하고 찾는 데 도움이 됩니다. 바운딩 박스는 주로 객체 탐지에 사용됩니다.

‍

세그멘테이션 마스크

때로는 객체 주변에 그려진 바운딩 박스만으로는 객체를 더 정확하게 탐지해야 할 필요가 있습니다. 이미지에서 객체의 경계에 관심이 있을 수 있습니다. 이 경우 세그멘테이션 마스크를 사용하면 복잡한 객체의 윤곽을 그릴 수 있습니다. 세그멘테이션 마스크는 더 자세한 픽셀 수준 표현입니다.

이러한 마스크는 시맨틱 세그멘테이션 및 인스턴스 세그멘테이션에 사용될 수 있습니다. 시맨틱 세그멘테이션은 보행자, 자동차, 도로 또는 인도와 같이 객체 또는 영역을 나타내는 이미지의 모든 픽셀에 레이블을 지정하는 것을 포함합니다. 그러나 인스턴스 세그멘테이션은 한 단계 더 나아가 이미지에서 모든 자동차가 동일한 유형이더라도 각 객체를 개별적으로 식별하고 분리합니다.

‍

3D 큐보이드

3D 큐보이드는 바운딩 박스와 유사하지만, 3D 큐보이드가 깊이 정보를 추가하고 객체의 3D 표현을 제공한다는 점에서 고유합니다. 이 추가 정보를 통해 시스템은 3D 공간에서 객체의 모양, 부피 및 위치를 이해할 수 있습니다. 3D 큐보이드는 자율 주행 자동차에서 차량으로부터 객체의 거리를 측정하는 데 자주 사용됩니다.

‍

키포인트 및 랜드마크

또 다른 흥미로운 유형의 어노테이션은 눈, 코 또는 관절과 같은 특정 지점이 객체에 표시되는 키포인트입니다. 랜드마크는 이러한 점들을 연결하여 얼굴이나 신체 자세와 같이 더 복잡한 모양의 구조와 움직임을 캡처함으로써 한 단계 더 나아갑니다. 이러한 유형의 어노테이션은 얼굴 인식, 모션 캡처 및 증강 현실과 같은 애플리케이션에 사용됩니다. 또한 제스처 인식 또는 스포츠 성과 분석과 같은 작업에서 AI 모델의 정확도를 향상시킵니다.

‍

labelImg를 사용하여 데이터를 어노테이션하는 방법

다양한 유형의 주석에 대해 살펴봤으니 이제 인기 있는 도구인 LabelImg를 사용해 이미지에 주석을 다는 방법을 알아봅시다. LabelImg는 이미지 주석을 간단하게 만들 수 있는 오픈 소스 도구로, YOLO (You Only Look Once) 형식의 데이터 집합을 만드는 데 사용할 수 있습니다. 소규모 Ultralytics YOLOv8 프로젝트를 진행하는 초보자에게 좋은 선택입니다.

LabelImg 설정은 간단합니다. 먼저 컴퓨터에 Python 3이 설치되어 있는지 확인합니다. 그런 다음 빠른 명령으로 LabelImg를 설치할 수 있습니다.

설치가 완료되면 다음 명령을 사용하여 도구를 시작할 수 있습니다.

LabelImg는 Windows, macOS 및 Linux를 포함한 여러 플랫폼에서 작동합니다. 설치 중에 문제가 발생하면 공식 LabelImg 저장소에서 더 자세한 지침을 확인할 수 있습니다.

‍

도구를 실행한 후 다음의 간단한 단계를 따라 이미지 레이블링을 시작하십시오.

클래스 설정: “predefined_classes.txt”라는 파일에서 어노테이션할 클래스(카테고리) 목록을 정의하여 시작합니다. 이 파일을 통해 소프트웨어는 이미지에서 레이블링할 객체를 알 수 있습니다.
‍
YOLO 형식으로 전환합니다: 기본적으로 LabelImg는 파스칼 VOC 형식을 사용하지만, YOLO 작업하는 경우 형식을 전환해야 합니다. 툴바에서 "PascalVOC" 버튼을 클릭하면 YOLO 전환할 수 있습니다.
‍
주석을 달기 시작합니다: '열기' 또는 'OpenDIR' 옵션을 사용해 이미지를 로드합니다. 그런 다음 주석을 달려는 객체 주위에 경계 상자를 그리고 올바른 클래스 레이블을 지정합니다. 각 이미지에 라벨을 지정한 후 작업을 저장합니다. LabelImg는 이미지와 같은 이름의 텍스트 파일을 생성하며, 여기에는 YOLO 주석이 포함되어 있습니다.
‍
저장하고 검토합니다: 주석은 YOLO 형식의 .txt 파일에 저장됩니다. 또한 소프트웨어는 모든 수업 이름이 나열된 "classes.txt" 파일을 저장합니다.

효율적인 데이터 레이블링 전략

데이터 레이블링 프로세스를 원활하게 진행하기 위해 몇 가지 주요 전략을 염두에 두어야 합니다. 예를 들어 명확한 어노테이션 지침이 중요합니다. 이러한 지침이 없으면 어노테이터마다 작업을 다르게 해석할 수 있습니다.

이미지에서 새를 바운딩 박스로 어노테이션하는 작업이 있다고 가정해 보겠습니다. 한 어노테이터는 새 전체를 레이블링하는 반면, 다른 어노테이터는 머리나 날개만 레이블링할 수 있습니다. 이러한 불일치는 학습 중에 모델에 혼란을 줄 수 있습니다. "날개와 꼬리를 포함한 새 전체를 레이블링한다"와 같이 명확한 정의를 제공하고 까다로운 경우에 대한 예시와 지침을 제공함으로써 데이터를 정확하고 일관되게 태깅할 수 있습니다.

높은 기준을 유지하려면 정기적인 품질 검사도 중요합니다. 벤치마크를 설정하고 특정 메트릭을 사용하여 작업을 검토함으로써 데이터의 정확성을 유지하고 지속적인 피드백을 통해 프로세스를 개선할 수 있습니다.

데이터 레이블링 요약

데이터 어노테이션은 컴퓨터 비전 모델에 큰 영향을 미칠 수 있는 간단한 개념입니다. LabelImg와 같은 도구를 사용하여 이미지에 어노테이션을 추가하든 오픈 소스 데이터 세트에서 모델을 학습하든 데이터 레이블링을 이해하는 것이 중요합니다. 데이터 레이블링 전략은 전체 프로세스를 간소화하고 효율성을 높이는 데 도움이 될 수 있습니다. 어노테이션 접근 방식을 개선하는 데 시간을 투자하면 더 나은, 더 신뢰할 수 있는 AI 결과를 얻을 수 있습니다.

계속 탐색하고 기술을 확장하세요! AI에 대해 계속 학습하려면 커뮤니티와 계속 소통하세요! GitHub 저장소를 확인하여 제조 및 헬스케어와 같은 산업에서 혁신적인 솔루션을 만들기 위해 AI를 어떻게 사용하는지 알아보세요. 🚀

컴퓨터 비전 프로젝트를 위한 데이터 레이블링 살펴보기

데이터 어노테이션이 필요한 이유

데이터 세트(Dataset)를 위한 최고의 리소스

이미지 어노테이션 기법의 종류

바운딩 박스

세그멘테이션 마스크

3D 큐보이드

키포인트 및 랜드마크

labelImg를 사용하여 데이터를 어노테이션하는 방법

효율적인 데이터 레이블링 전략

데이터 레이블링 요약

이 카테고리에서 더 읽어보기

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 활용한 교통 사고 관리 자동화

Ultralytics 프로덕션 환경에 배포하기 더 쉬운 이유를 살펴봅니다!

함께 미래의 AI를 만들어 갑시다!