최소한의 레이블이 지정된 데이터로 강력한 데이터 표현을 위한 자가 지도 기법인 대조 학습의 강력한 성능을 알아보세요.
대조 학습은 머신 러닝(ML) 기법으로, 주로 자기 지도 학습(SSL)에서 사용되며 명시적인 레이블에 의존하지 않고 의미 있는 데이터 표현을 학습하도록 설계되었습니다. 미리 정의된 카테고리를 예측하는 대신 데이터 포인트를 비교하여 학습합니다. 핵심 아이디어는 데이터 샘플의 유사(포지티브) 쌍과 유사하지 않은(네거티브) 쌍을 구별하도록 모델을 훈련시키는 것입니다. 이렇게 함으로써 모델은 학습된 특징 공간에서 유사한 항목을 서로 가깝게 그룹화하고 서로 다른 항목을 더 멀리 밀어내는 방법을 학습하여 유용한 임베딩을 생성합니다.
이 프로세스에는 일반적으로 '앵커' 데이터 포인트가 포함됩니다. 앵커에 자르기, 회전 또는 색상 변경과 같은 강력한 데이터 증강을 적용하여 "긍정적인" 예시를 만듭니다. "네거티브" 예시는 데이터 세트의 다른 데이터 포인트로, 앵커와 다른 것으로 가정합니다. 인코더 모델(일반적으로 이미지용 컨볼루션 신경망(CNN) 과 같은 신경망(NN) 은 이러한 샘플을 처리하여 표현 또는 임베딩을 생성합니다. 그런 다음 대조 손실 함수(예: InfoNCE)가 앵커와 포지티브 임베딩 사이의 거리를 최소화하고 앵커와 네거티브 임베딩 사이의 거리를 최대화하여 학습을 안내합니다. 이렇게 하면 모델이 데이터 내의 본질적인 유사점과 차이점을 포착하는 특징을 학습하도록 장려합니다.
대조 학습 프레임워크에는 몇 가지 요소가 기본이 됩니다:
대조 학습은 다른 ML 패러다임과 크게 다릅니다:
대조 학습은 다양한 영역에서 괄목할 만한 성공을 거두었습니다:
대비 사전 학습은 강력한 컴퓨터 비전 모델을 개발하는 데 매우 적합합니다. 학습된 표현은 종종 특정 작업에 잘 적용되며, 때로는 미세 조정을 위해 더 적은 레이블이 지정된 데이터만 필요한 경우도 있습니다(Few-Shot Learning). 이는 다음과 같은 모델의 훈련에 큰 도움이 될 수 있습니다. Ultralytics YOLO 와 같은 모델의 훈련에 큰 도움이 될 수 있으며, 대량의 라벨링되지 않은 데이터에서 학습된 강력한 초기 가중치를 제공하고, 잠재적으로 Ultralytics HUB와 같은 플랫폼을 사용하여 관리 및 훈련할 수 있습니다. 다음과 같은 딥 러닝 프레임워크 PyTorch 및 TensorFlow 과 같은 딥 러닝 프레임워크는 이러한 기술을 구현하는 데 필요한 도구를 제공합니다. 더 자세히 알아보려면 자기 지도 학습과 표현 학습에 대한 개요를 살펴보세요.