용어집

비지도 학습

비지도 학습이 클러스터링, 차원 축소, 이상 징후 탐지를 사용하여 데이터의 숨겨진 패턴을 발견하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

비지도 학습은 알고리즘이 레이블이 없는 데이터에서 패턴을 학습하는 머신 러닝(ML) 의 한 유형입니다. 미리 정의된 레이블이나 '정답'에 의존하는 지도 학습과 달리, 비지도 방법은 데이터의 고유한 구조를 탐색하여 사전 지침 없이 숨겨진 관계, 그룹화 또는 이상 징후를 발견합니다. 이 접근 방식은 특히 인공지능(AI) 에서 초기 데이터 탐색과 라벨링이 비현실적이거나 불가능한 복잡한 데이터 세트의 이해에 유용합니다. 이를 통해 모델은 데이터에서 직접 패턴과 인사이트를 발견할 수 있습니다.

비지도 학습의 작동 방식

비지도 학습의 주요 목표는 데이터 내의 기본 구조 또는 분포를 모델링하여 데이터에 대해 더 많이 학습하는 것입니다. 알고리즘은 스스로 유사점, 차이점, 구조를 발견하도록 맡겨집니다. 일반적인 기법에는 다음이 포함됩니다:

  • 클러스터링: 클러스터링은 특정 특성에 따라 유사한 데이터 포인트를 자동으로 그룹화하는 것입니다. 널리 사용되는 알고리즘으로는 K-평균 클러스터링과 DBSCAN이 있습니다.
  • 차원 축소: 이 기술은 필수 정보는 보존하면서 입력 변수나 특징의 수를 줄여 데이터를 단순화합니다. 주성분 분석(PCA) 은 차원 축소를 위해 널리 사용되는 방법입니다.
  • 연관 규칙 학습: 이 방법은 대규모 데이터 세트에서 변수 간의 흥미로운 관계나 연관 규칙을 발견합니다. 일반적으로 시장 바구니 분석에 적용되어 자주 함께 구매하는 품목을 찾는 데 사용됩니다.

비지도 학습의 응용

비지도 학습 기법은 다양한 실제 시나리오에서 사용되며, 특히 레이블이 없는 대량의 데이터를 다룰 때 유용합니다:

  • 고객 세분화: 기업은 클러스터링을 활용하여 유사한 행동, 선호도 또는 인구통계학적 특성을 가진 고객을 그룹화합니다. 이를 통해 보다 효과적인 타겟 마케팅 캠페인과 개인화된 고객 경험을 제공할 수 있습니다. 고객 세분화에 대해 자세히 알아보세요.
  • 이상 징후 탐지: 비지도 알고리즘은 정상에서 크게 벗어난 비정상적인 데이터 포인트나 이상값을 식별하는 데 탁월합니다. 이는 금융 분야의 사기 탐지, 네트워크 침입 탐지, 제조 분야의 결함 식별과 같은 애플리케이션에 매우 중요합니다.

AI와 ML의 관련성

비지도 학습은 빅 데이터의 특징인 방대한 양의 레이블이 없는 원시 데이터를 이해하는 데 중요한 역할을 합니다. 이는 종종 데이터 전처리피처 엔지니어링의 필수 단계로 사용되며, 다른 ML 기술을 적용하기 전에 숨겨진 구조를 발견하거나 데이터 복잡성을 줄이는 데 도움을 줍니다. Ultralytics YOLO 같은 모델은 주로 개체 감지와 같은 작업을 위해 지도 방법을 사용해 학습되지만, 비지도 방법을 통해 데이터 구조를 이해하면 데이터 세트 준비 및 분석에 큰 도움이 되어 잠재적으로 모델 성능을 향상시킬 수 있습니다. 데이터 세트 준비를 위한 데이터 수집 및 주석 가이드를 살펴보고, Ultralytics HUB와 같은 플랫폼을 사용하여 데이터와 모델을 관리할 수 있습니다.

비지도 학습과 다른 학습 유형 비교

비지도 학습과 관련 딥러닝(DL) 및 머신러닝 패러다임을 구분하는 것이 중요합니다:

  • 지도 학습: 완전히 레이블이 지정된 데이터 세트가 필요하며, 이는 각 데이터 포인트에 알려진 출력 또는 카테고리가 있음을 의미합니다. 목표는 레이블이 지정된 예시를 기반으로 보이지 않는 새로운 데이터 포인트의 출력을 정확하게 예측할 수 있는 모델을 학습시키는 것입니다.
  • 자기 지도 학습: 종종 비지도 학습의 한 유형으로 간주되는 이 학습은 입력 데이터 자체에서 구실 작업(예: 이미지의 숨겨진 부분 예측)을 생성하여 자동으로 레이블을 생성합니다. 트랜스포머 아키텍처에 기반한 모델을 포함하여 대규모 모델을 사전 학습하는 데 널리 사용됩니다.
  • 준지도 학습: 소량의 레이블이 지정된 데이터와 대량의 레이블이 지정되지 않은 데이터를 조합하여 사용합니다. 이 접근 방식은 레이블이 없는 데이터를 활용하여 제한된 레이블이 있는 데이터만으로 가능한 것 이상으로 학습 정확도를 향상시키는 것을 목표로 합니다. 준지도 학습에 대해 자세히 알아보세요.

비지도 학습은 레이블이 부족하거나 사용할 수 없는 복잡한 데이터 세트에서 발견과 이해를 촉진하는 ML의 기본 영역으로 남아 있습니다.

모두 보기