Yolo 비전 선전
선전
지금 참여하기
용어집

LightGBM

구조화된 데이터를 위한 고성능 그라디언트 부스팅 프레임워크인 LightGBM을 살펴보세요. 머신러닝 작업에서 더 빠른 훈련과 더 높은 정확도를 제공하는 방법을 알아보세요.

라이트 그라디언트 부스팅 머신(Light Gradient Boosting Machine), 일반적으로 LightGBM으로 알려진 이 프레임워크는 오픈소스 분산 그라디언트 부스팅 기술로 Microsoft 가 개발한 오픈소스 분산형 그라디언트 부스팅 프레임워크입니다. 트리 기반 학습 알고리즘을 사용하며, 분산 처리와 효율성을 위해 설계되어 다음과 같은 장점을 제공합니다: 더 빠른 훈련 속도와 높은 효율성, 낮은 메모리 사용량, 향상된 정확도, 병렬 및 GPU 지원, 대규모 데이터 처리 능력. 머신러닝(ML)의 광범위한 영역에서 랭킹, 분류 및 기타 다양한 머신러닝 작업을 위한 강력한 도구로 활용됩니다. 라이트지엠비는 특히 구조화된 데이터 처리 속도와 성능이 최우선인 경쟁적인 데이터 사이언스 및 산업 분야에서 선호됩니다.

LightGBM의 작동 방식

LightGBM의 핵심은 여러 의사결정 트리의 예측을 결합하여 최종 예측을 생성하는 앙상블 방법입니다. 기존 부스팅 알고리즘이 레벨 단위(수평적)로 트리를 성장시키는 것과 달리, LightGBM은 잎 단위(수직적) 성장 전략을 활용합니다. 즉, 최대 델타 손실을 보이는 잎을 선택하여 성장시킵니다. 이 접근법은 레벨 단위 알고리즘보다 손실을 더 크게 감소시켜 더 높은 정확도와 빠른 수렴을 이끌어냅니다.

정밀도를 희생하지 않으면서 속도를 유지하기 위해 LightGBM은 두 가지 새로운 기법을 사용합니다: 기울기 기반 단일 측면 샘플링(GOSS)과 배타적 특징 번들링(EFB). GOSS는 기울기 변화가 작은 상당량의 데이터 인스턴스를 제외하여 학습이 어려운 예시에 집중합니다. EFB는 상호 배타적인 특징들을 묶습니다. 샘플링(GOSS)과 배타적 특징 묶기(EFB)입니다. GOSS는 기울기가 작은 상당수 데이터 인스턴스를 제외하여 학습이 어려운 예시에 집중합니다. EFB는 상호 배타적인 특징들을 묶어 효과적으로 특징 수를 줄입니다. 이러한 최적화를 통해 프레임워크는 저메모리 소비를 유지하면서 방대한 양의 훈련 데이터를 신속하게 처리할 수 있습니다.

LightGBM과 다른 모델의 차이점

적합한 도구를 선택하기 위해서는 LightGBM을 머신러닝 분야에서 널리 사용되는 다른 프레임워크들과 비교해 보는 것이 도움이 됩니다.

  • LightGBM 대 XGBoost: 둘 다 강력한 경사 부스팅 라이브러리입니다. 그러나 XGBoost는 전통적으로 레벨별 성장 전략을 사용하는데, 이는 일반적으로 더 안정적이지만 느립니다. LightGBM의 리프별 접근 방식은 일반적으로 더 빠르고 메모리 효율적이지만, 소규모 데이터셋에서 과적합을 방지하기 위해 신중한 하이퍼파라미터 조정이 필요할 수 있습니다.
  • LightGBM 대 Ultralytics YOLO: LightGBM은 구조화된(표 형식) 데이터의 표준인 반면, Ultralytics 이미지 및 비디오와 같은 비정형 데이터를 위해 설계된 딥 러닝(DL) 프레임워크입니다. LightGBM이 판매 동향을 예측할 수 있는 반면, YOLO 물체 탐지 이미지 분류와 같은 작업을 처리합니다. 개발자들은 종종 Ultralytics 이러한 도구를 결합하여 시각적 데이터와 수치적 데이터를 모두 활용하는 포괄적인 AI 솔루션을 구축합니다.

실제 애플리케이션

LightGBM은 다용도로 활용되며 다양한 산업 분야에서 구조화된 데이터를 사용하여 복잡한 예측 문제를 해결하는 데 사용됩니다.

  1. 금융 위험 평가: 은행 및 핀테크 기업들은 신용 평가 및 사기 탐지를 위해 LightGBM을 활용합니다. 거래 내역, 사용자 인구 통계, 행동 패턴을 분석함으로써 이 모델은 실시간으로 classify 정상 또는 사기로 정확히 classify 금융 손실을 크게 줄일 수 있습니다.
  2. 소매 수요 예측: 소매업체는 재고 수요를 예측하기 위해 이 프레임워크를 활용합니다. LightGBM은 과거 판매 데이터, 계절성, 마케팅 지출을 처리함으로써 공급망을 최적화하여 고객이 필요로 할 때 제품을 확보하면서도 과잉 재고를 방지합니다. 이는 현대적인 스마트 제조 관행과 부합합니다.

코드 예제

다음 Python 합성 데이터로 기본 LightGBM 분류기를 훈련하는 방법을 보여줍니다. 이 코드는 기본적인 데이터 전처리를 수행했다고 가정합니다.

import lightgbm as lgb
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

# Generate synthetic binary classification data
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Initialize and train the LightGBM model
model = lgb.LGBMClassifier(learning_rate=0.05, n_estimators=100)
model.fit(X_train, y_train)

# Display the accuracy score
print(f"Test Accuracy: {model.score(X_test, y_test):.4f}")

특정 매개변수 및 설치 지침에 대한 자세한 내용은 공식 LightGBM 문서를 참조하십시오. 이러한 모델을 대규모 파이프라인에 통합할 때는 생산 환경에서의 신뢰성을 보장하기 위해 모델 평가와 같은 단계가 종종 포함됩니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기