Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

LightGBM

Изучите LightGBM — высокопроизводительную среду для градиентного бустинга структурированных данных. Узнайте, как она обеспечивает более быстрое обучение и более высокую точность для задач машинного обучения.

Light Gradient Boosting Machine, широко известная как LightGBM, — это открытая распределенная платформа для градиентного усиления , разработанная Microsoft , которая использует алгоритмы обучения на основе деревьев . Она разработана для распределенного и эффективного использования и обладает следующими преимуществами: более высокая скорость обучения и более высокая эффективность, меньшее использование памяти, более высокая точность, поддержка параллельного и GPU , а также возможность обработки больших объемов данных. В более широком контексте машинного обучения (ML) она служит мощным инструментом для ранжирования, классификации и многих других задач машинного обучения. LightGBM особенно популярен в конкурентных областях науки о данных и промышленных приложениях, где скорость и производительность при работе со структурированными данными имеют первостепенное значение.

Как работает LightGBM

По сути, LightGBM — это ансамблевый метод, который объединяет прогнозы нескольких деревьев решений для получения окончательного прогноза. В отличие от традиционных алгоритмов бустинга, которые выращивают деревья по уровням (горизонтально), LightGBM использует стратегию роста по листьям (вертикально). Это означает, что он выбирает для роста лист с максимальной дельта-потерей. Такой подход позволяет снизить потери более значительно, чем алгоритм по уровням, что приводит к более высокой точности и более быстрой конвергенции.

Для поддержания скорости без потери точности LightGBM использует две новые технологии: одностороннюю выборку на основе градиента выборка (GOSS) и эксклюзивное объединение признаков (EFB). GOSS исключает значительную часть экземпляров данных с небольшими градиентами, сосредоточив обучение на более сложных для обучения примерах. EFB объединяет взаимоисключающие признаки, чтобы эффективно уменьшить количество признаков. Эти оптимизации позволяют фреймворку быстро обрабатывать огромные объемы учебных данных, сохраняя при этом низкое потребление памяти

Отличие LightGBM от других моделей

Чтобы выбрать подходящий инструмент, полезно сравнить LightGBM с другими популярными фреймворками в области машинного обучения .

  • LightGBM против XGBoost: обе библиотеки являются мощными библиотеками градиентного усиления. Однако XGBoost традиционно использует стратегию роста по уровням, которая часто является более стабильной, но более медленной. Подход LightGBM по листьям, как правило, быстрее и более эффективен с точки зрения памяти, хотя он может требовать тщательной настройки гиперпараметров, чтобы предотвратить переобучение на небольших наборах данных.
  • LightGBM против Ultralytics YOLO: LightGBM является стандартом для структурированных (табличных) данных, тогда как Ultralytics — это фреймворк глубокого обучения (DL), разработанный для неструктурированных данных, таких как изображения и видео. В то время как LightGBM может прогнозировать тенденции продаж, YOLO обрабатывают такие задачи, как обнаружение объектов и классификация изображений. Разработчики часто комбинируют эти инструменты на Ultralytics для создания комплексных решений искусственного интеллекта, которые используют как визуальные, так и числовые данные.

Применение в реальном мире

LightGBM является универсальным и используется в различных отраслях для решения сложных задач прогнозирования с использованием структурированных данных.

  1. Оценка финансовых рисков: банки и финтех-компании используют LightGBM для кредитного скоринга и выявления мошенничества. Анализируя историю транзакций, демографические данные пользователей и поведенческие модели, модель может точно classify как законные или мошеннические в режиме реального времени, что значительно снижает финансовые потери.
  2. Прогнозирование розничного спроса: Розничные продавцы используют эту структуру для прогнозирования потребностей в запасах. Обрабатывая исторические данные о продажах, сезонности и маркетинговых расходах, LightGBM помогает оптимизировать цепочки поставок, обеспечивая наличие продуктов, когда они нужны клиентам, без избыточных запасов. Это соответствует современным практикам интеллектуального производства.

Пример кода

Следующий Python демонстрирует, как обучить базовый классификатор LightGBM на синтетических данных. Предполагается, что вы выполнили базовую предварительную обработку данных.

import lightgbm as lgb
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

# Generate synthetic binary classification data
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Initialize and train the LightGBM model
model = lgb.LGBMClassifier(learning_rate=0.05, n_estimators=100)
model.fit(X_train, y_train)

# Display the accuracy score
print(f"Test Accuracy: {model.score(X_test, y_test):.4f}")

Для более глубокого изучения конкретных параметров и инструкций по установке вы можете посетить официальную документацию LightGBM. Интеграция этих моделей в более крупные конвейеры часто включает в себя такие шаги, как оценка модели, чтобы обеспечить надежность в производственных средах.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас