비지도 학습은 알고리즘을 사용하여 레이블이 지정되지 않은 데이터 세트를 분석하고 클러스터링하는 머신 러닝의 한 유형입니다. 이러한 알고리즘은 사전 지식이나 학습 데이터 없이 숨겨진 패턴이나 데이터 그룹을 발견합니다. 결과를 예측하기 위해 레이블이 지정된 데이터에 의존하는 지도 학습과 달리 비지도 학습은 데이터의 기본 구조를 이해하려고 노력합니다. 이는 사람의 라벨링이 비현실적인 시나리오에서 특히 유용할 수 있으며, 데이터 기반 연구 및 분석을 탐색하는 초석이 됩니다.
비지도 학습에서 가장 일반적으로 사용되는 기법은 클러스터링과 차원 축소입니다. 클러스터링은 서로 유사한 데이터 요소를 그룹화하는 것이고, 차원 축소는 고려 중인 무작위 변수의 수를 줄여 데이터를 단순화하는 것입니다.
K-Means 클러스터링:
K-평균은 특징 유사성을 기반으로 데이터를 K개의 별개의 클러스터로 분할하는 널리 사용되는 클러스터링 알고리즘입니다. 각 클러스터 내의 분산을 최소화하여 클러스터 중심을 반복적으로 조정합니다. 이는 고객 세분화 및 시장 조사에 널리 사용됩니다. K-평균에 대해 자세히 알아보세요.
DBSCAN:
DBSCAN(노이즈가 있는 애플리케이션의 밀도 기반 공간 클러스터링)은 고밀도의 핵심 샘플을 식별하고 이로부터 클러스터를 확장합니다. 복잡한 데이터 구조에서 잘 작동하며 클래스 분포를 알 수 없는 애플리케이션에 유용합니다. DBSCAN 살펴보기.
주성분 분석(PCA):
PCA는 데이터 집합에서 변이를 강조하고 강력한 패턴을 이끌어내는 데 사용되는 방법입니다. 대규모 데이터 세트를 새로운 변수 집합으로 변환하여 데이터 세트의 차원을 줄입니다. PCA는 이미지 압축과 노이즈 감소에 매우 유용합니다. PCA에 대해 알아보기.
t-분산 확률적 이웃 임베딩(t-SNE):
t-SNE는 각 데이터 포인트에 2차원 또는 3차원 지도의 위치를 부여하여 고차원 데이터를 시각화하는 기법입니다. 많은 기능이 포함된 복잡한 데이터 집합을 시각화하는 데 탁월합니다. t-SNE에 대해 자세히 알아보세요.
기업들은 종종 시장 세분화를 위해 비지도 학습을 활용하여 구매 행동에 따라 뚜렷한 고객 세그먼트를 식별합니다. 이를 통해 타겟 마케팅 전략과 제품 포지셔닝을 강화할 수 있습니다.
사이버 보안에서는 잠재적인 보안 위협을 나타낼 수 있는 네트워크 트래픽의 비정상적인 패턴이나 이상 징후를 탐지하기 위해 비지도 학습 알고리즘을 배포합니다. 이상 징후 탐지 기법을 살펴보세요.
지도 학습: 비지도 학습과 달리 지도 학습은 결과를 예측하기 위해 레이블이 지정된 데이터가 필요합니다. 지도 학습에 대해 자세히 알아보세요.
준지도 학습: 소량의 레이블이 지정된 데이터와 대량의 레이블이 지정되지 않은 데이터를 결합하여 지도 학습과 비지도 학습 사이에 위치합니다. 준지도 학습에 대해 알아보세요.
비지도 학습은 최신 데이터 분석 및 검색에서 중요한 역할을 합니다. 개인화를 통한 고객 경험 향상부터 이상 징후 탐지를 통한 보안 개선까지, 그 적용 분야는 광범위하고 다양합니다. Ultralytics 는 이와 같은 강력한 학습 기술을 통해 AI의 긍정적인 잠재력을 지속적으로 탐구하여 기업과 연구자들이 데이터의 모든 역량을 활용할 수 있도록 지원하고 있습니다. Ultralytics 의 미션과 솔루션을 살펴보고 영향력 있는 애플리케이션을 위한 AI 도구가 어떻게 개발되고 있는지 알아보세요.