용어집

대조 학습

최소한의 레이블이 지정된 데이터로 강력한 데이터 표현을 위한 자가 지도 기법인 대조 학습의 강력한 성능을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

대조 학습은 모델이 레이블이 지정된 데이터에 의존하지 않고 유사하거나 다른 데이터 포인트를 식별하는 방법을 학습하는 자기 지도 학습의 강력한 접근 방식입니다. 이 방법은 긍정적인 쌍과 부정적인 쌍을 대조하여 서로 다른 데이터 샘플 간의 관계를 이해하도록 모델을 훈련시키는 것입니다. 본질적으로, 모델은 유사한 데이터 포인트의 표현을 한데 모으고 서로 다른 데이터 포인트의 표현을 분리하는 방법을 학습합니다. 이 기술은 컴퓨터 비전, 자연어 처리(NLP), 오디오 처리 등 다양한 영역에서 매우 효과적인 것으로 입증되었습니다. 대조 학습은 풍부하고 강력한 데이터 표현을 학습함으로써 제한된 레이블 데이터로도 모델이 다운스트림 작업을 잘 수행할 수 있게 해주므로 레이블 데이터가 부족하거나 비용이 많이 드는 시나리오에서 유용한 도구가 될 수 있습니다.

대조 학습의 핵심 개념

대조 학습은 서로 다른 데이터 샘플을 비교하고 대조하여 의미 있는 표현을 학습하는 아이디어를 중심으로 이루어집니다. 두 가지 주요 유형의 데이터 쌍이 사용됩니다:

  • 포지티브 쌍: 유사하거나 관련된 두 개의 데이터 샘플로 구성됩니다. 예를 들어 이미지 분석에서 포지티브 쌍은 동일한 이미지의 서로 다른 두 가지 증강 보기(예: 회전 또는 자른 버전)일 수 있습니다.
  • 네거티브 쌍: 서로 다르거나 관련이 없는 두 개의 데이터 샘플로 구성됩니다. 이미지 예제를 계속 이어서, 네거티브 쌍은 서로 다른 두 이미지의 증강 보기가 될 수 있습니다.

목표는 임베딩 공간에서 양수 쌍의 표현은 서로 가깝게, 음수 쌍의 표현은 멀리 떨어져 있도록 모델을 훈련하는 것입니다. 이는 양의 쌍 사이의 거리를 최소화하고 음의 쌍 사이의 거리를 최대화함으로써 달성할 수 있습니다.

대조 학습 대 지도 학습

대조 학습과 지도 학습은 모두 정확한 예측을 하도록 모델을 훈련시키는 것을 목표로 하지만, 접근 방식과 요구 사항에서 큰 차이가 있습니다. 지도 학습은 각 데이터 포인트가 특정 레이블 또는 대상 변수와 연관된 레이블이 지정된 데이터 세트에 의존합니다. 모델은 이러한 레이블이 지정된 예시를 기반으로 입력을 출력에 매핑하는 방법을 학습합니다. 대조 학습은 비지도 학습의 하위 집합인 자가 지도 학습의 범주에 속하며, 명시적인 레이블 없이 데이터 자체에서 모델을 학습합니다. 따라서 대조 학습은 레이블이 지정된 데이터가 제한적이거나 사용할 수 없는 경우에 특히 유용합니다.

대조 학습 대 반지도 학습

대조 학습과 준지도 학습은 모두 레이블이 지정된 데이터가 부족할 때 모델 성능을 개선하는 것을 목표로 하는 기법이지만, 서로 다른 메커니즘을 통해 이를 수행합니다. 준지도 학습은 학습 중에 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터의 조합을 활용합니다. 이 모델은 기존의 지도 학습 방식으로 레이블이 지정된 데이터로부터 학습하는 동시에 레이블이 지정되지 않은 데이터를 사용하여 기본 데이터 구조를 더 잘 이해합니다. 반면 대조 학습은 라벨이 없는 데이터에서 유사한 샘플과 다른 샘플을 대조하여 표현을 학습하는 데에만 초점을 맞춥니다. 준지도 학습은 일부 레이블이 지정된 데이터를 활용할 수 있지만, 대조 학습은 레이블이 전혀 필요하지 않으며 대신 데이터 자체에 내재된 관계에 의존합니다.

대조 학습의 응용

대조 학습은 다양한 애플리케이션에서 괄목할 만한 성공을 거두었습니다:

  • 컴퓨터 비전: 컴퓨터 비전에서 대비 학습은 강력한 이미지 표현을 학습하는 데 사용됩니다. 예를 들어, 동일한 이미지의 다양한 증강 보기를 유사한 것으로 인식하도록 모델을 훈련함으로써 모델은 관련 없는 변형을 무시하고 필수적인 특징에 집중하는 방법을 학습합니다. 이렇게 학습된 표현은 물체 감지, 이미지 분류, 이미지 분할과 같은 다운스트림 작업에 사용할 수 있습니다.
  • 자연어 처리: 대조 학습도 NLP에서 상당한 진전을 이루었습니다. 유사한 문장이나 문서를 구별하도록 모델을 학습시켜 텍스트 분류, 감정 분석, 질문 답변과 같은 작업의 성능을 향상시킬 수 있습니다.
  • 오디오 처리: 오디오 처리에서는 대조 학습을 사용하여 오디오 신호의 표현을 학습할 수 있습니다. 예를 들어, 동일한 오디오 클립의 여러 세그먼트를 유사한 것으로 식별하고 다른 클립의 세그먼트를 서로 다른 것으로 구별하도록 모델을 학습시킬 수 있습니다. 이러한 표현은 음성 인식 및 화자 식별과 같은 작업을 향상시킬 수 있습니다.

실제 애플리케이션에서의 대조 학습 예시

예제 1: SimCLR을 사용한 이미지 표현 학습

SimCLR(시각적 표현의 대조 학습을 위한 간단한 프레임워크)은 이미지 표현에서 대조 학습의 힘을 입증하는 널리 알려진 프레임워크입니다. SimCLR은 한 쌍의 증강 이미지에 대해 모델을 훈련하는 방식으로 작동합니다. 배치의 각 이미지는 무작위 자르기, 크기 조정 및 색상 왜곡과 같은 증강 기능을 사용하여 두 가지 다른 보기로 변환됩니다. 이러한 증강된 보기는 양수 쌍을 형성하고, 다른 이미지의 보기는 음수 쌍을 형성합니다. 일반적으로 컨볼루션 신경망(CNN)인 이 모델은 긍정적인 쌍에 대해서는 유사한 임베딩을, 부정적인 쌍에 대해서는 서로 다른 임베딩을 생성하는 방법을 학습합니다. 학습이 완료되면 모델은 적용된 특정 증강에 변하지 않으면서도 필수적인 특징을 포착하는 고품질 이미지 표현을 생성할 수 있습니다. 이러한 표현은 다양한 다운스트림 컴퓨터 비전 작업의 성능을 크게 향상시킬 수 있습니다. 원본 연구 논문에서 SimCLR에 대해 자세히 알아보세요.

예 2: 의료 이미지 분석

대조 학습은 의료 이미지 분석, 특히 라벨이 지정된 의료 데이터가 부족한 시나리오에서 큰 가능성을 보여주었습니다. 예를 들어, 동일한 의료 스캔(예: MRI 또는 CT 스캔)의 서로 다른 뷰 또는 슬라이스를 유사한 것으로 구분하고 다른 환자의 스캔은 서로 다른 것으로 취급하도록 모델을 학습시킬 수 있습니다. 이 접근 방식을 통해 모델은 광범위한 수동 주석에 의존하지 않고도 의료 이미지의 강력한 표현을 학습할 수 있습니다. 이렇게 학습된 표현은 이상 징후 감지, 질병 분류, 해부학적 구조 분할과 같은 진단 작업의 정확성과 효율성을 개선하는 데 사용할 수 있습니다. 대조 학습을 활용하면 의료 영상 시스템은 더 적은 레이블 데이터로 더 나은 성능을 달성하여 현장의 중요한 병목 현상을 해결할 수 있습니다. 이 연구 백서에서 의료 영상 분야의 콘트라스트 러닝 적용 사례에 대해 자세히 알아보세요.

모두 보기