Ultralytics YOLO11 カスタムトレーニングする際の補強にAlbumentationを使用し、多様なトレーニングデータでモデルのパフォーマンスを向上させる方法をご紹介します。
コンピュータ・ビジョンのソリューションを構築する際、ビジョンAIモデルを学習させるための多様な画像セットを収集することは、プロセスの重要な部分となります。多くの場合、多くの時間と費用を必要とし、収集された画像はモデルが効果的に学習するのに十分なバリエーションがないこともあります。
例えば、次のようなコンピュータビジョンモデルがある。 Ultralytics YOLO11のようなコンピュータビジョンモデルは、さまざまなアプリケーションに関連するさまざまなコンピュータビジョンタスクの画像データセットでカスタムトレーニングすることができます。多様なデータは、モデルの汎化を助け、実世界の幅広いシナリオで物体やパターンを認識できるようにするため、重要な鍵となります。
多様なデータの不足に悩んでいる場合、画像データの補強技術が素晴らしい解決策になります。回転、反転、明るさの調整などの方法は、データセットの多様性を高め、より幅広い条件に対応するモデルの能力を向上させるのに役立ちます。
そのため、Ultralytics 画像データ拡張のための統合をサポートしています。Albumentationsという、変換のコレクションを提供する人気のツールを使えば、多様なビジュアルデータを作成することができます。この統合は、トレーニング画像を自動的に補強することでYOLO11 トレーニングプロセスを簡素化し、モデル性能の向上につながります。
この記事では、Albumentations統合の使用方法、その利点、モデルトレーニングへの影響について説明します。
コンピュータ・ビジョンのモデルは、さまざまな環境における物体を認識するために、高品質な画像の幅広いセットから学習することができる。実世界のソースから大規模なデータセットを収集するのは、時間がかかり、コストがかかり、非効率的です。このタスクを効率化するために、画像データの拡張を使用して、既存の画像の新しいバリエーションを作成し、より多くのデータを収集することなく、モデルが異なるシナリオから学習できるようにすることができます。
具体的には、2018年に効率的な画像データ補強のために導入されたオープンソースライブラリであるAlbumentationsを活用することができる。回転や反転といった単純な幾何学的変化から、明るさ、コントラスト、ノイズの付加といった複雑な調整まで、さまざまな操作をサポートしている。
Albumentationsは、高速かつ効率的に画像を処理できる高性能で知られています。OpenCVやNumPyのような最適化されたライブラリ上に構築されているため、最小限の処理時間で大規模なデータセットを処理することができ、モデルトレーニング中の高速なデータ増強に最適です。
その他、Albumentationsの主な特徴は以下の通り:
データセットにオーギュメンテーションを適用する方法はたくさんあるし、OpenCVのようなツールを使って自分で作ることもできる。では、なぜAlbumentationsのようなライブラリをサポートするインテグレーションを選ぶのでしょうか?
OpenCVのようなツールを使って手動でオーグメントを作成するには、多くの時間がかかり、ある程度の専門知識が必要です。また、最良の結果を得るために変換を微調整するのも厄介です。Albumentationsの統合は、このプロセスを簡単にします。データセットを準備する際の時間と労力を節約できる、すぐに使える変換を多数提供しています。
Albumentationsインテグレーションを選ぶもう一つの理由は、Ultralytics モデルトレーニングパイプラインとスムーズに連動することです。トレーニング中に補強が自動的に適用されるため、YOLO11カスタムトレーニングがより簡単になります。プロセスが簡素化されるため、データ準備の処理よりもモデルの改善に集中することができます。
興味深いことに、YOLO11 トレーニングにAlbumentations統合を使用することは、見た目よりも簡単である。適切なライブラリーがセットアップされると、統合はトレーニング中に自動的に画像データの補強を適用する。これは、同じデータセットを使用して、異なる画像バリエーションからモデルを学習するのに役立ちます。
次に、YOLO11カスタムトレーニングする際に、Albumentationsインテグレーションをインストールして使う方法を説明しよう。
補強を適用する前に、Ultralytics Python パッケージとAlbumentationsの両方をインストールする必要があります。統合は、デフォルトで両方のライブラリがシームレスに連携するように構築されているので、複雑な設定を心配する必要はありません。
下の画像に示すように、Python ライブラリをインストールするためのパッケージ管理ツールであるpipコマンドを1回実行するだけで、インストールプロセス全体が数分で完了する。
Albumentationsをインストールすると、Ultralytics モデルのトレーニングモードでは、トレーニング中に自動的に画像補強が適用されます。Albumentationsがインストールされていない場合、これらの補強は適用されません。詳細については、 Ultralytics 公式ドキュメントを参照してください。
Albumentationsの統合のボンネットの下で何が起こっているのか、理解を深めよう。
YOLO11 トレーニングで適用される補強について詳しく見てみよう:
特定のアプリケーションのためにYOLO11 カスタムトレーニングする場合、Albumentationsの統合は、様々な条件に適応することで、モデルのパフォーマンスを向上させるのに役立ちます。実際のアプリケーションと、この統合が解決できる課題について説明しましょう。
ヘルスケアにおけるビジョンAIは、医師が医療画像をより正確に分析し、診断を支援し、患者のケアを向上させるのに役立っている。実際、医療機関の約5分の1がすでにAIソリューションを利用している。
しかし、このようなコンピュータ・ビジョン・ソリューションの構築には、それなりの課題が伴う。医療スキャンは病院によって大きく異なることがあり、異なる機器、設定、さらには技術者の経験などの要因に影響されます。明るさ、コントラスト、露出のばらつきは、Vision AIモデルの一貫性と精度に影響を与える可能性があり、異なる環境下で信頼性の高いパフォーマンスを発揮することが難しくなります。
そこでAlbumentationsのようなツールの統合が不可欠となる。Albumentationsは、同じスキャンの複数の拡張バージョンを生成することにより、モデルが様々な画像品質から学習することを可能にします。これにより、モデルはよりロバストになり、高画質画像と低画質画像の両方で病気を正確に検出できるようになります。
ビジョンAIのもう一つの興味深い用途は、セキュリティと監視だ。リアルタイムの物体検出は、セキュリティチームが潜在的な脅威を迅速に特定するのに役立つ。
このアプリケーションに関連する主な懸念は、防犯カメラが一日中さまざまな照明条件の下で映像を撮影することであり、これらの条件は、モデルがそのような画像を理解する方法に劇的に影響を与える可能性があることです。低照度環境、まぶしさ、視界の悪さなどの要因は、コンピュータビジョンモデルが物体を検出したり、潜在的な脅威を一貫して認識したりすることを困難にします。
Albumentationsの統合は、異なる照明条件を模倣するために変換を適用することによって支援します。これにより、モデルは明るい環境と暗い環境の両方で物体を検出することを学習し、信頼性を高め、厳しい条件下での応答時間を改善します。
スーパーマーケットの通路で食べこぼしをしたり、犬が店内を走り回ったり、子供が商品の陳列棚を倒したりするのは、小売環境におけるビジョンAIの エッジケースとなり得る日常的な出来事のほんの一例に過ぎません。コンピュータ・ビジョンは、買い物客の行動を追跡し、人の往来を監視し、棚にある商品を識別することで、顧客体験を向上させるためにますます使用されるようになっています。しかし、このような実世界の状況をAIシステムが理解し、正確に処理することは困難です。
すべてのシナリオをコンピュータビジョンのデータセットで表現できるわけではありませんが、Albumentationsの統合は、予期しない照明、異常な角度、障害物など、多くの可能性のある状況をカバーするためにデータを補強することで役立ちます。これにより、コンピュータビジョンモデルが様々な状況に適応し、エッジケースを処理する能力を向上させ、ダイナミックな小売環境で正確な予測を行うことができます。
モデルのトレーニングのために実世界の多様なデータを収集することは複雑な場合がありますが、Albumentationsは、モデルが異なる条件に適応するのを助ける画像バリエーションを作成することで、それを容易にします。
Ultralytics サポートするAlbumentations統合は、YOLO11カスタムトレーニング中にこれらの補強を適用するプロセスを簡素化します。その結果、データセットの品質が向上し、より正確で信頼性の高いVision AIモデルを生成することで、幅広い業界に利益をもたらします。
私たちのコミュニティに参加してGitHub リポジトリを探索し、AI についてもっと学び、Vision AI プロジェクトを開始するための ライセンスオプションをチェックしてください。製造業におけるAIや 自動運転におけるコンピュータビジョンのようなイノベーションに興味がありますか?ソリューションのページをご覧ください。