用語集

キャットブースト

CatBoostは、カテゴリカル・データの処理や実世界のアプリケーションに優れた強力な勾配ブースティング・ライブラリです。

Ultralytics HUB で
を使ってYOLO モデルをシンプルにトレーニングする。

さらに詳しく

CatBoostはYandexによって開発された高性能なオープンソースの勾配ブースティング・ライブラリです。CatBoostは、機械学習(ML)の分野において、カテゴリ特徴の卓越した処理、オーバーフィッティングに対する頑健性、最小限のパラメータチューニングでしばしば優れた精度を実現することで傑出している。決定木の勾配ブースティングの概念に基づき、CatBoostはカテゴリデータを効果的かつ効率的に処理する新しいアルゴリズムを実装しており、構造化データや表形式データを含むタスクによく選ばれています。

コア・コンセプトとテクニック

CatBoostは勾配ブースティングの基礎の上に構築されており、新しいモデルを順次追加して前のモデルのエラーを修正するアンサンブル手法である。CatBoostの主な革新点は以下の通り:

  • 順序ブースティング:並べ替えに基づく学習アプローチで、カテゴリ特徴を扱う際に標準的な勾配ブースティングの実装でよく見られる問題である、ターゲットリークによる予測シフトに対処するのに役立つ。これにより、より優れたモデルの汎化に貢献する。
  • カテゴリ特徴処理:CatBoostは、ワンホットエンコーディングのような大規模な前処理を必要とする代わりに、順序付けされたターゲット統計やカテゴリ特徴の組み合わせのようなテクニックを使用して、トレーニング中にそれらを数値表現に変換します。これにより、多くの場合、より良い結果が得られ、データの前処理パイプラインが簡素化されます。
  • 対称木:CatBoostは通常、ベース学習者として忘却決定木(対称木)を使用し、予測時間の短縮とオーバーフィッティングの防止に役立ちます。

CatBoostと類似アルゴリズムの違い

CatBoostは、XGBoostや LightGBMのような一般的なライブラリと並んで、勾配ブースティング・マシン(GBM)のファミリーに属する。3つとも表データに対する教師あり学習のための強力なアルゴリズムですが、CatBoostの主な差別化点は、カテゴリ特徴の洗練された処理を内蔵していることです。これにより、XGBoostやLightGBMと比較して、特に多くのカテゴリ変数を持つデータセットにおいて、手作業による特徴エンジニアリングや大規模なハイパーパラメータのチューニングの必要性が軽減されます。しかし、これらのアルゴリズムは、主に構造化された表形式のデータを得意としていることに注意することが重要です。画像分類や 物体検出のようなコンピュータ・ビジョン(CV)のタスクでは、畳み込みニューラルネットワーク(CNN)のような特殊なアーキテクチャや、以下のようなモデルが使用されます。 Ultralytics YOLOようなモデルが一般的に採用され、多くの場合、Ultralytics HUBのようなプラットフォームを使用して管理およびトレーニングされます。

実世界での応用

CatBoostは、その性能と使いやすさ、特に多様なデータセットで、さまざまな業界で広く使用されています:

  • 不正行為の検出:金融機関はCatBoostを使用して、複雑な前処理を行うことなく、トランザクションの種類、加盟店ID、ユーザーの場所、デバイス情報などのカテゴリ特徴を効果的に活用することで、不正なトランザクションを特定しています。金融におけるAIについてもっと読む。
  • レコメンデーションシステム:Eコマースやストリーミング・プラットフォームは、レコメンデーション・システムの構築にCatBoostを活用している。CatBoostは、カテゴリ化されたユーザーやアイテムの識別子、インタラクション履歴、およびコンテキスト情報を効率的に処理し、ユーザーの嗜好やクリックスルー率を予測します。
  • 顧客の解約予測:企業はCatBoostを使用して、サブスクリプション・プラン、利用パターン、人口統計情報などのさまざまなカテゴリー・データ・ポイントを組み込み、どの顧客がサービスの利用をやめる可能性があるかを予測します。

ツールとリソース

CatBoostライブラリは、主にPython パッケージを通じて、一般的なデータサイエンスワークフローとの容易な統合を提供する。CatBoostはまた、Rとコマンドライン使用のためのインターフェースも提供している。包括的なドキュメントとチュートリアルはCatBoostの公式ウェブサイトで利用可能で、トレーニング、評価、モデルのデプロイを通じてユーザーをガイドする。

すべて読む