지도 학습이 어떻게 레이블이 지정된 데이터로 AI를 강화하여 물체 감지 및 감정 분석과 같은 정확한 예측과 애플리케이션을 지원하는지 알아보세요.
지도 학습은 레이블이 지정된 데이터로 알려진 입력-출력 쌍이 포함된 데이터 세트에서 알고리즘이 학습하는 머신 러닝(ML) 의 기본 범주입니다. 본질적으로 알고리즘은 입력 데이터에 대한 예측과 학습 데이터에 제공된 알려진 올바른 출력(레이블)을 비교하여 학습하기 때문에 '지도 학습'이라고 합니다. 목표는 알고리즘이 보이지 않는 새로운 입력에 대한 출력을 정확하게 예측할 수 있는 매핑 함수를 학습하는 것입니다. 이 접근 방식은 많은 최신 인공 지능(AI) 애플리케이션의 핵심으로, 시스템이 벤치마크 데이터 세트 또는 사용자 지정 데이터 세트 에서 찾은 과거 사례를 기반으로 예측 또는 결정을 내릴 수 있게 해줍니다.
이 프로세스는 각 데이터 포인트가 입력 특징과 그에 맞는 올바른 출력 레이블로 구성된 세심하게 준비된 데이터 세트에서 시작됩니다. 여기에는 종종 데이터 수집과 주석 달기에 상당한 노력이 수반됩니다. 예를 들어, 이미지 분류 작업에서 입력은 이미지( OpenCV와 같은 라이브러리의 기술을 사용해 사전 처리된 이미지일 수 있음)이고 레이블은 이미지가 속한 카테고리(예: '고양이', '개')가 될 수 있습니다. 알고리즘은 학습 데이터에 대해 반복적으로 예측을 수행하고, 예측과 실제 레이블 간의 차이를 최소화하기 위해 확률적 경사 하강(SGD) 또는 Adam과 같은 최적화 알고리즘을 사용하여 내부 파라미터(또는 모델 가중치)를 조정합니다. 이 차이는 손실 함수로 측정됩니다. 이 훈련은 모델이 별도의 검증 데이터에서 만족스러운 수준의 정확도 또는 기타 관련 성능 지표를 달성하여 새로운 데이터에 잘 일반화되고 과적합을 방지할 때까지 종종 여러 시대에 걸쳐 계속됩니다.
지도 학습은 매우 다재다능하며, 과거 데이터를 통해 미래의 사건을 예측하거나 새로운 정보를 분류할 수 있는 다양한 애플리케이션에 활용되고 있습니다. 레이블이 지정된 예시로부터 직접 학습할 수 있기 때문에 높은 정밀도가 요구되는 작업에 적합합니다. 많은 컴퓨터 비전(CV) 작업은 다음과 같은 최신 모델에서 수행되는 작업을 포함하여 지도 학습에 크게 의존합니다. Ultralytics YOLO.
다음은 두 가지 구체적인 예입니다:
그 밖에도 이미지와 비디오의 물체 감지 ( 자율주행 차량 및 보안 시스템에서 사용), 스팸 이메일 필터링, 주택 가격 예측( 회귀 작업), 얼굴 인식 등 다양한 분야에서 활용되고 있습니다. 또한 더 스마트한 소매 재고 관리를 위한 AI와 농업 솔루션의 AI에도 적용되고 있습니다.
지도 학습을 효과적으로 이해하고 적용하기 위해서는 몇 가지 개념이 핵심입니다:
지도 학습은 다른 주요 머신 러닝 패러다임과 구별됩니다:
요약하자면, 지도 학습은 레이블이 지정된 데이터를 활용하여 예측 작업을 위한 모델을 훈련하는 강력하고 널리 사용되는 기술입니다. 이는 Ultralytics 개발하고 지원하는 것을 포함하여 많은 성공적인 AI 애플리케이션의 근간을 형성하며, 데이터 과학 또는 AI 분야에서 일하는 모든 사람에게 중요한 기술입니다.