용어집

지도 학습

지도 학습이 어떻게 레이블이 지정된 데이터로 AI를 강화하여 물체 감지 및 감정 분석과 같은 정확한 예측과 애플리케이션을 지원하는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

지도 학습은 레이블이 지정된 데이터로 알려진 입력-출력 쌍이 포함된 데이터 세트에서 알고리즘이 학습하는 머신 러닝(ML) 의 기본 범주입니다. 본질적으로 알고리즘은 입력 데이터에 대한 예측과 학습 데이터에 제공된 알려진 올바른 출력(레이블)을 비교하여 학습하기 때문에 '지도 학습'이라고 합니다. 목표는 알고리즘이 보이지 않는 새로운 입력에 대한 출력을 정확하게 예측할 수 있는 매핑 함수를 학습하는 것입니다. 이 접근 방식은 많은 최신 인공 지능(AI) 애플리케이션의 핵심으로, 시스템이 과거 사례를 기반으로 예측 또는 결정을 내릴 수 있게 해줍니다.

지도 학습의 작동 방식

프로세스는 각 데이터 포인트가 입력 특징과 그에 해당하는 올바른 출력 레이블로 구성된 데이터 세트에서 시작됩니다. 예를 들어 이미지 분류 작업에서 입력은 이미지이고 레이블은 이미지가 속하는 카테고리(예: '고양이', '개')입니다. 알고리즘은 학습 데이터를 반복적으로 예측하고 경사 하강과 같은 최적화 알고리즘을 사용하여 내부 파라미터를 조정하여 예측과 실제 레이블 간의 차이를 최소화하고 손실 함수로 측정합니다. 이 훈련은 모델이 검증 데이터에 대해 만족할 만한 수준의 정확도를 달성할 때까지 계속됩니다.

관련성 및 응용 분야

지도 학습은 매우 다재다능하며, 과거 데이터를 통해 미래의 사건을 예측하거나 새로운 정보를 분류할 수 있는 다양한 애플리케이션에 활용되고 있습니다. 레이블이 지정된 예제에서 직접 학습할 수 있기 때문에 높은 정밀도가 요구되는 작업에 적합합니다. 많은 컴퓨터 비전 작업은 다음과 같은 모델에 의해 수행되는 작업을 포함하여 지도 학습에 크게 의존합니다. Ultralytics YOLO.

다음은 두 가지 구체적인 예입니다:

  1. 의료 이미지 분석: 지도 학습 모델은 방사선 전문의가 라벨을 붙인 의료 스캔 데이터 세트(예: 엑스레이 또는 MRI)로 학습할 수 있습니다. 예를 들어, 모델은 '종양' 또는 '종양 없음'으로 표시된 이미지에 대한 학습을 통해 의료 영상에서 종양을 감지하는 방법을 배울 수 있습니다. 이는 의사의 진단 및 치료 계획을 지원하여 의료 분야의 AI 솔루션에 크게 기여합니다.
  2. 감정 분석: 기업은 종종 리뷰나 소셜 미디어 게시물과 같은 텍스트 데이터에서 고객의 의견을 이해하고자 합니다. 지도 모델은 감정('긍정', '부정', '중립')으로 레이블이 지정된 텍스트 예시를 통해 학습할 수 있습니다. 학습이 완료되면 새로운 텍스트를 자동으로 분류하여 시장 조사 및 고객 서비스를 위한 귀중한 인사이트를 제공할 수 있습니다. 감성 분석에 대해 자세히 알아보세요.

다른 일반적인 애플리케이션으로는 이미지 및 비디오의 물체 감지 ( 자율 주행 차량 및 보안 시스템에서 사용), 스팸 이메일 필터링, 주택 가격 예측(회귀 작업), 얼굴 인식 등이 있습니다.

주요 개념

지도 학습을 이해하는 데 있어 몇 가지 개념이 핵심입니다:

  • 레이블이 지정된 데이터: 지도 학습의 기초로, 올바른 출력 레이블과 쌍을 이루는 입력 데이터로 구성됩니다. 고품질 데이터 수집과 주석 달기가 중요합니다.
  • 특징: 특징: 예측을 위해 모델에서 사용하는 측정 가능한 입력 변수 또는 특성입니다. 특징 엔지니어링은 성능에 큰 영향을 미칠 수 있습니다.
  • 레이블(또는 타깃): 학습 데이터의 입력 특징과 연관된 올바른 출력 값입니다.
  • 분류: 분류: 불연속적인 카테고리 레이블을 예측하는 것이 목표인 지도 학습 작업의 한 유형으로, 예를 들어 이메일을 '스팸' 또는 '스팸 아님'으로 분류하거나 이미지를 YOLO 같은 모델을 사용하여 여러 등급으로 분류하는 것이 목표입니다.
  • 회귀: 선형 회귀와 같은 알고리즘을 사용하여 온도, 주가 또는 집값을 예측하는 등 연속적인 수치 값을 예측하는 것이 목표인 지도 학습 작업의 한 유형입니다.
  • 일반적인 알고리즘: 로지스틱 회귀, SVM(서포트 벡터 머신), 의사 결정 트리, 랜덤 포레스트, 다양한 유형의 신경망(NN), 특히 이미지 관련 작업을 위한 컨볼루션 신경망(CNN) 과 같은 방법을 포함하며, 종종 다음과 같은 프레임워크를 사용하여 구현됩니다. PyTorch.

다른 학습 패러다임과의 비교

지도 학습은 다른 주요 머신 러닝 패러다임과 구별됩니다:

  • 비지도 학습: 알고리즘은 명시적인 지침 없이 레이블이 없는 데이터에서 패턴을 학습합니다. 일반적인 작업으로는 클러스터링(유사한 데이터 포인트 그룹화)과 차원 축소(데이터 단순화)가 있습니다. 레이블이 지정된 데이터를 사용할 수 없거나 숨겨진 구조를 발견하는 것이 목표일 때 사용됩니다.
  • 강화 학습: 알고리즘은 환경과 상호 작용하고 보상 또는 페널티의 형태로 피드백을 받음으로써 학습합니다. 목표는 시간이 지남에 따라 누적 보상을 극대화하는 정책(행동 선택 전략)을 학습하는 것입니다. 로봇 공학, 게임 플레이 및 내비게이션 시스템에서 자주 사용됩니다.

요약하면, 지도 학습은 레이블이 지정된 데이터를 활용하여 예측 작업을 위한 모델을 훈련하는 강력한 기술로, Ultralytics 및 Ultralytics HUB와 같은 플랫폼에서 개발 및 지원하는 것을 포함하여 많은 성공적인 AI 애플리케이션의 근간을 형성합니다.

모두 보기