용어집

비지도 학습

비지도 학습이 클러스터링, 차원 축소, 이상 징후 탐지를 사용하여 데이터의 숨겨진 패턴을 발견하는 방법을 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

비지도 학습은 알고리즘이 레이블이 없는 데이터에서 학습하는 머신 러닝의 한 유형입니다. 라벨이 지정된 데이터에 의존하여 모델을 학습시키는 지도 학습과 달리, 비지도 학습 알고리즘은 명시적인 지침 없이 데이터를 탐색하고 패턴을 식별합니다. 이 접근 방식은 라벨링이 비현실적인 대규모 데이터 세트를 다루거나 데이터 내의 숨겨진 구조와 관계를 발견하는 것이 목표일 때 특히 유용합니다.

비지도 학습의 작동 방식

비지도 학습에서는 알고리즘에 해당 출력 레이블이 없는 입력 데이터가 제공됩니다. 그런 다음 시스템은 데이터의 고유한 구조를 학습하려고 시도합니다. 이는 다양한 기법을 통해 이루어집니다:

  • 클러스터 데이터: 유사한 데이터 포인트를 함께 그룹화합니다. K-평균 클러스터링은 이를 위해 널리 사용되는 알고리즘으로, 특징 유사성을 기반으로 데이터를 별개의 클러스터로 분할합니다.
  • 차원 축소: 필수 정보는 보존하면서 변수 수를 줄여 데이터를 단순화하세요. 주성분 분석(PCA) 은 차원 축소를 위한 일반적인 방법으로, 고차원 데이터를 저차원 표현으로 변환합니다.
  • 연관성을 발견합니다: 데이터에서 변수 간의 관계와 종속성을 식별합니다. 예를 들어, 연관 규칙 마이닝은 빈번한 공동 발생 패턴을 설명하는 규칙을 발견할 수 있습니다.
  • 이상 징후 탐지: 표준에서 크게 벗어난 비정상적인 데이터 포인트를 식별합니다. 데이터 공간에서 인구 밀도가 낮은 영역을 인식하여 이상값을 식별하는 데 DBSCAN(밀도 기반 노이즈가 있는 애플리케이션 공간 클러스터링 )을 사용할 수 있습니다.

비지도 학습의 응용

비지도 학습 기법은 다양한 분야에서 데이터에서 가치 있는 인사이트를 추출하는 데 사용됩니다:

  • 고객 세분화: 기업은 클러스터링 알고리즘을 사용하여 구매 행동, 인구 통계 또는 웹사이트 활동을 기반으로 고객을 여러 그룹으로 분류합니다. 이를 통해 타겟 마케팅 전략과 개인화된 고객 경험을 제공할 수 있습니다. 예를 들어, 소매업체는 고객 거래 데이터에 대한 비지도 학습을 사용하여 다양한 고객 세그먼트를 식별하여 맞춤형 제품 추천 및 프로모션을 제공할 수 있습니다.
  • 사기 탐지의 이상 징후 탐지: 금융 분야에서 이상 거래 탐지는 사기 거래를 식별하는 데 매우 중요합니다. 비지도 학습 알고리즘은 정상적인 거래 패턴을 학습하고 사기 행위를 나타낼 수 있는 편차를 표시할 수 있습니다. 이를 통해 금전적 손실을 사전에 예방하고 데이터 보안을 강화할 수 있습니다.
  • 의료 영상 분석: 비지도 학습은 의료 이미지 분석에서 중요한 역할을 합니다. 차원 축소 및 클러스터링과 같은 기술은 엑스레이나 MRI와 같은 의료 이미지를 분석하여 명시적인 레이블 없이도 질병이나 이상을 나타낼 수 있는 패턴을 감지하는 데 도움이 될 수 있습니다.
  • 문서 클러스터링: 자연어 처리에서 비지도 학습은 문서 클러스터링에 사용되어 콘텐츠에 따라 유사한 문서를 함께 그룹화합니다. 이는 뉴스 기사나 연구 논문과 같은 대규모 텍스트 데이터 모음을 정리하거나 토픽 모델링 및 의미론적 검색과 같은 작업에 유용합니다.

비지도 학습과 지도 학습 비교

비지도 학습과 지도 학습의 주요 차이점은 학습에 사용되는 데이터 유형에 있습니다. 지도 학습은 각 입력 데이터 포인트가 해당 출력 레이블과 짝을 이루는 레이블이 지정된 데이터를 사용합니다. 알고리즘은 이러한 레이블이 지정된 예시를 기반으로 입력을 출력에 매핑하는 방법을 학습합니다. 반면, 비지도 학습은 레이블이 없는 데이터를 사용하며 명시적인 출력 레이블 없이 데이터 자체에서 숨겨진 구조나 패턴을 발견하는 것을 목표로 합니다.

지도 학습과 비지도 학습은 모두 머신 러닝(ML)인공 지능(AI)의 필수 도구이며, 이 중 어떤 것을 선택할지는 특정 문제, 라벨링된 데이터의 가용성, 원하는 결과에 따라 달라집니다. 다음과 관련된 프로젝트의 경우 Ultralytics YOLO 모델의 경우, 일반적으로 물체 감지이미지 분할과 같은 작업에는 지도 학습을 사용하는 반면, 데이터 전처리, 탐색적 데이터 분석 또는 제조 품질 관리의 이상 징후 감지와 같은 특정 애플리케이션에서는 비지도 방법이 유용할 수 있습니다.

모두 보기