반지도 학습이 라벨링된 데이터와 라벨링되지 않은 데이터를 결합하여 모델 정확도를 향상시키는 방식을 살펴보세요. Ultralytics 사용하여 SSL 워크플로를 구현하는 방법을 배워보세요.
반지도 학습(SSL)은 기계 학습(ML) 에서 두 가지 전통적인 훈련 방법 사이의 가교 역할을 하는 전략적 패러다임입니다. 지도 학습이 완전히 주석이 달린 데이터셋에 전적으로 의존하고 비지도 학습이 어떠한 태그 없이 데이터에서 패턴을 찾으려 시도하는 반면, SSL은 소량의 라벨링된 데이터와 훨씬 더 방대한 양의 라벨링되지 않은 데이터 풀을 결합하여 작동합니다. 이 접근법은 특히 보안 카메라나 위성 영상과 같은 원시 이미지 수집은 상대적으로 저렴하지만, 전문가들에 의한 데이터 라벨링 과정은 비용이 많이 들고 느리며 노동 집약적인 실제 컴퓨터 비전(CV) 시나리오에서 매우 유용합니다. 라벨링되지 않은 예시 안에 숨겨진 구조를 효과적으로 활용함으로써, SSL은 방대한 주석 예산 없이도 모델 정확도와 일반화 능력을 크게 향상시킬 수 있습니다.
SSL의 주요 목표는 소규모의 라벨링된 예제 집합에서 발견된 정보를 더 큰 규모의 라벨링되지 않은 집합으로 전파하는 것이다. 이를 통해 신경망은 데이터의 저밀도 영역을 통과하는 결정 경계를 학습할 수 있으며, 결과적으로 보다 견고한 분류 또는 탐지가 가능해진다.
대부분의 반지도 학습 워크플로를 주도하는 두 가지 인기 있는 기법은 다음과 같습니다:
다음 Python ultralytics 패키지를 사용한 간단한 의사 라벨링 워크플로를 보여줍니다. 여기서 우리는 작은 데이터셋으로 YOLO26 모델을 훈련한 후, 이를 사용하여 라벨이 지정되지 않은 이미지 디렉토리에 대한 라벨을 생성합니다.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train initially on a small available labeled dataset
model.train(data="coco8.yaml", epochs=10)
# Run inference on unlabeled data to generate pseudo-labels
# Setting save_txt=True saves the detections as text files for future training
results = model.predict(source="./unlabeled_images", save_txt=True, conf=0.85)
반지도 학습은 데이터는 풍부하지만 전문성은 부족한 산업을 변화시키고 있다.
AI 솔루션을 효과적으로 배포하려면 SSL이 유사한 전략과 어떻게 다른지 이해하는 것이 중요합니다:
딥 러닝(DL) 모델의 규모가 커짐에 따라 데이터 활용 효율성이 가장 중요해집니다. PyTorch 와 TensorFlow 는 이러한 고급 훈련 루프를 위한 계산 백엔드를 제공합니다. 또한 Ultralytics 같은 도구는 데이터셋 관리 라이프사이클을 간소화하고 있습니다. 자동 주석과 같은 기능을 활용함으로써 팀은 반지도 워크플로를 보다 쉽게 구현하여 원시 데이터를 신속하게 생산 준비 완료 상태의 모델 가중치로 전환할 수 있습니다. 이러한 MLOps의 진화는 고정밀 비전 시스템 구축의 진입 장벽이 지속적으로 낮아지고 있음을 보장합니다.