용어집

자기 주도 학습

자가 지도 학습이 어떻게 레이블이 없는 데이터를 활용하여 효율적인 학습을 하고, 컴퓨터 비전, 자연어 처리 등의 분야에서 AI를 혁신하는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

자가 지도 학습은 레이블이 없는 데이터를 활용하여 모델을 학습시키는 머신 러닝 접근 방식입니다. 라벨이 지정된 데이터 세트가 필요한 지도 학습과 달리, 자가 지도 학습은 라벨이 지정되지 않은 데이터 자체의 고유한 구조에서 자체 라벨을 생성합니다. 이 방법은 라벨이 없는 방대한 양의 데이터를 쉽게 사용할 수 있지만 수동으로 라벨을 지정하는 데 많은 비용과 시간이 소요되는 컴퓨터 비전(CV)자연어 처리(NLP) 같은 분야에서 특히 유용합니다.

자기 주도 학습의 작동 방식

자가 지도 학습의 핵심 아이디어는 모델이 레이블이 없는 데이터에서 유용한 표현을 학습할 수 있도록 '구실 과제'를 설계하는 것입니다. 이 구실 과제는 데이터에서 의미 있는 패턴을 이해해야 풀 수 있도록 공식화됩니다. 예를 들어 이미지 처리에서 구실 작업은 이미지 패치에 적용된 회전을 예측하거나 회색조 이미지에 색을 입히는 것일 수 있습니다. 언어 처리에서 일반적인 구실 작업은 모델이 문장에서 마스크된 단어를 예측하는 마스크 언어 모델링입니다.

대량의 라벨링되지 않은 데이터를 사용하여 모델이 사전 작업에서 학습되면 데이터의 일반적인 특징과 표현을 학습합니다. 이렇게 학습된 표현은 순수 지도 학습에 필요한 것보다 훨씬 적은 레이블이 지정된 데이터로 물체 감지, 이미지 분류 또는 이미지 분할과 같은 다운스트림 작업을 위해 전송되고 미세 조정될 수 있습니다. 이러한 전이 학습 기능은 자율 지도 학습의 핵심적인 장점입니다.

자기 주도 학습의 응용

자기 지도 학습은 다양한 영역에서 활용되고 있으며, 특히 레이블이 지정된 데이터를 구하기 어렵거나 비용이 많이 드는 경우에 특히 유용합니다:

  • 컴퓨터 비전: 의료 이미지 분석에서 자가 지도 학습은 라벨이 없는 의료 이미지의 대규모 데이터 세트(예: 엑스레이 또는 MRI 스캔)에 대해 모델을 사전 학습시킬 수 있습니다. 이렇게 사전 학습된 모델은 제한된 레이블이 지정된 데이터를 사용하여 특정 진단 작업에 맞게 미세 조정되어 의료 이미지 해석의 정확성과 효율성을 개선할 수 있습니다. 예를 들어, 다음과 같은 모델은 Ultralytics YOLOv8 과 같은 모델은 자체 감독 사전 학습을 통해 의료 이미지의 이상 징후를 감지하는 성능을 향상시킬 수 있습니다.
  • 자연어 처리: GPT-4와 같은 대규모 언어 모델(LLM)은 대량의 텍스트 데이터에 대해 자가 지도 학습 기법을 사용하여 사전 학습되는 경우가 많습니다. 이러한 사전 학습을 통해 일반적인 언어 이해 및 생성 기능을 학습한 다음 텍스트 요약, 번역 또는 감정 분석과 같은 특정 NLP 작업에 맞게 미세 조정할 수 있습니다. 프롬프트 튜닝과 같은 기술은 이러한 사전 학습된 모델을 더욱 활용하여 새로운 작업에 효율적으로 적응할 수 있도록 합니다.

자기 주도 학습과 유사한 개념 비교

자기 지도 학습을 다른 관련 머신 러닝 패러다임과 구별하는 것이 중요합니다:

  • 비지도 학습: 둘 다 레이블이 없는 데이터를 사용하지만, 비지도 학습은 특정 작업(예: 클러스터링, 차원 축소)을 염두에 두지 않고 데이터에 내재된 구조나 패턴을 찾는 것을 목표로 합니다. 반면에 자기 지도 학습은 다운스트림 작업에 유용한 표현을 학습하기 위한 구실 작업을 공식화합니다.
  • 준지도 학습: 반지도 학습은 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터를 조합하여 사용하지만, 여전히 학습을 위해 일정량의 레이블이 지정된 데이터에 의존합니다. 자기 지도 학습은 주로 레이블이 없는 데이터에서 학습한 다음 소량의 레이블이 있는 데이터로 잠재적으로 미세 조정하는 데 중점을 둡니다.

자가 지도 학습은 머신러닝의 중요한 발전으로, 라벨이 지정되지 않은 방대한 양의 데이터를 효과적으로 사용할 수 있게 해주고 값비싼 라벨이 지정된 데이터 세트에 대한 의존도를 줄여줍니다. 다음과 같은 모델이 Ultralytics YOLO11 과 같은 모델이 계속 발전함에 따라, 자율 지도 기술은 다양한 비전 AI 애플리케이션에서 성능과 적용 가능성을 향상시키는 데 점점 더 중요한 역할을 하게 될 것입니다.

모두 보기