비지도 학습
비지도 학습이 클러스터링, 차원 축소, 이상 징후 탐지를 사용하여 데이터의 숨겨진 패턴을 발견하는 방법을 알아보세요.
비지도 학습은 라벨링, 분류 또는 분류되지 않은 데이터에 대해 알고리즘을 학습시키는 머신 러닝(ML) 의 기본 패러다임입니다. 다른 방법과 달리, 시스템은 해당 출력 레이블 없이 데이터 자체에서 직접 패턴과 구조를 학습하려고 시도합니다. 주요 목표는 데이터를 탐색하고 의미 있는 구조나 패턴을 찾는 것이므로 인공지능(AI) 분야의 데이터 탐색 및 분석을 위한 핵심 도구로 사용됩니다.
핵심 비지도 학습 과제
비지도 학습 알고리즘은 일반적으로 탐색적 데이터 분석에 사용되며 몇 가지 주요 작업으로 그룹화할 수 있습니다:
- 클러스터링: 클러스터링은 가장 일반적인 비지도 학습 작업으로, 유사성에 따라 데이터 포인트를 클러스터로 그룹화하는 작업입니다. 목표는 단일 클러스터 내의 데이터 포인트를 서로 매우 유사하게 만들고 다른 클러스터의 포인트와는 다르게 만드는 것입니다. 널리 사용되는 알고리즘으로는 K-평균 클러스터링과 DBSCAN이 있습니다.
- 차원 축소: 이 기술은 데이터 세트의 입력 변수 수를 줄이는 데 사용됩니다. 모델을 단순화하고 계산 시간을 단축하며 데이터 시각화에 도움을 줄 수 있으므로 고차원 데이터를 다룰 때 유용합니다. 주성분 분석(PCA) 은 이 작업에 널리 사용되는 방법입니다.
- 연관 규칙 마이닝: 이 방법은 대규모 데이터베이스의 변수들 사이에서 흥미로운 관계나 연관 규칙을 발견합니다. 대표적인 예로는 상점에서 자주 함께 구매하는 품목 간의 관계를 찾아내는 '마켓 바스켓 분석'이 있습니다.
실제 애플리케이션
비지도 학습은 여러 산업 분야에서 혁신을 주도하고 있습니다. 다음은 몇 가지 구체적인 예시입니다:
- 고객 세분화: 리테일 및 이커머스 기업은 클러스터링 알고리즘을 사용해 행동과 선호도가 비슷한 고객을 그룹화합니다. 구매 내역, 검색 활동, 인구 통계를 분석함으로써 기업은 타겟 마케팅 캠페인을 만들고, 개인화된 추천을 제공하며, 고객 경험을 개선하여 궁극적으로 리테일 업계에서 AI를 강화할 수 있습니다.
- 이상 징후 탐지: 사이버 보안에서 비지도 학습 모델은 보안 침해를 나타낼 수 있는 비정상적인 네트워크 트래픽을 식별할 수 있습니다. 마찬가지로 제조 분야에서도 이러한 알고리즘은 최신 품질 검사의 핵심 요소인 표준 편차를 식별하여 조립 라인에서 제품의 결함을 감지할 수 있습니다.
다른 학습 패러다임과의 비교
비지도 학습은 다른 ML 접근 방식과 크게 다릅니다:
- 지도 학습: 분류 또는 회귀와 같은 작업을 위해 레이블이 지정된 데이터(입력-출력 쌍)를 사용하여 모델을 훈련합니다. 목표는 입력을 알려진 출력에 매핑하는 것입니다. 자세한 내용은 지도 학습과 비지도 학습의 비교에서 확인할 수 있습니다.
- 강화 학습: 에이전트가 누적 보상을 최대화하기 위해 환경에서 작업을 수행하여 의사 결정을 내리는 방법을 학습하는 것을 포함합니다. 피드백 신호(보상 또는 페널티)의 안내에 따라 시행착오를 통해 학습합니다. 심층 강화 학습에 대한 개요를 참조하세요.
- 준지도 학습: 소량의 레이블이 지정된 데이터와 대량의 레이블이 지정되지 않은 데이터를 조합하여 지도 학습과 비지도 학습 사이의 간극을 메웁니다.
- 자기 지도 학습: 입력 데이터 자체에서 레이블이 자동으로 생성되는 비지도 학습의 하위 집합으로, 자연어 처리(NLP) 또는 컴퓨터 비전(CV)과 같은 대규모 모델을 사전 학습하는 데 자주 사용됩니다.
비지도 학습은 데이터를 탐색하고, 숨겨진 구조를 발견하고, 가치 있는 특징을 추출하기 위한 강력한 도구입니다. 지도 모델에 데이터를 공급하기 전에 데이터 전처리를 수행하는 등 복잡한 데이터 과학 파이프라인에서 중요한 첫 단계로 사용되는 경우가 많습니다. Ultralytics HUB와 같은 플랫폼은 데이터 세트 분석을 위해 잠재적으로 비지도 기법을 통합한 다양한 ML 모델을 개발하고 관리할 수 있는 환경을 제공합니다. PyTorch 및 TensorFlow와 같은 프레임워크는 비지도 알고리즘의 구현을 지원하는 광범위한 라이브러리를 제공하며, Scikit-learn의 비지도 학습 가이드와 같은 리소스를 통해 더 많은 것을 살펴볼 수 있습니다.