Ultralytics YOLO11の新モデル、その特徴、様々な産業におけるリアルタイム・アプリケーションのすべてをご紹介します。必要なことをすべてご説明します。
9月30日(月)、Ultralytics は、Ultralytics' 年次ハイブリッド・イベントであるYOLO Vision 2024 (YV24) でのデビューに続き、Ultralytics YOLO11、コンピュータ・ビジョンの最新の進歩を正式に発表した。AIコミュニティは、このモデルの能力を探求しようと躍起になっている。より高速な処理、より高い精度、エッジデバイスとクラウド展開の両方に最適化されたモデルにより、YOLO11はリアルタイムコンピュータビジョンアプリケーションの可能性を再定義します。
Ultralytics 、創設者兼CEOのグレン・ジョーチャーは インタビューで次のように語っている。「世界はクリーンエネルギーに向かっていますが、十分なスピードではありません。私たちは、より少ないエポック、より少ない補強、より少ないデータでモデルを訓練できるようにしたいと考えています。最小の物体検出モデルであるYOLO11nのパラメータはわずか260万個で、JPEGのサイズに匹敵する。最大の物体検出モデルであるYOLO11xのパラメータは約5,600万個で、これでも他のモデルと比べると信じられないほど小さい。5年前のNvidia GPU のような安いGPU 、興奮と少しのコーヒーだけで訓練できる。"
この記事では、YOLO11の特徴、改善点、パフォーマンス・ベンチマーク、そして実際のアプリケーションを詳しく紹介し、このモデルで何ができるのかを理解してもらう。始めよう!
YOLO11は、YOLO (You Only Look Once)シリーズのコンピュータビジョンモデルの最新の進歩であり、以下のような以前のバージョンよりも大幅に改善されています。 YOLOv5そして YOLOv8.Ultralytics のチームは、YOLO11 をより速く、より正確に、より効率的にするために、コミュニティからのフィードバックと最先端の研究を取り入れました。YOLO11は、YOLOv8 と同じコンピュータ・ビジョン・タスク( オブジェクト検出、インスタンス・セグメンテーション、 画像分類など)もサポートしています。実際、ユーザーは既存のワークフローを変更することなく、簡単にYOLO11に切り替えることができます。
YOLO11の主なハイライトのひとつは、前モデルと比較して、精度と速度の両方で優れた性能を発揮していることです。YOLO11mは、YOLOv8m より22%少ないパラメータで、COCOデータセットにおいてより高い平均精度(mAP)を達成しており、より正確かつ効率的に物体を検出することができます。処理速度の面でも、YOLO11は以前のモデルを凌駕しており、迅速な検出と応答が重要であり、ミリ秒単位が重要なリアルタイム・アプリケーションに最適です。
下のベンチマークグラフは、YOLO11が従来のモデルと比べてどのように際立っているかを示している。横軸はCOCOボックスの平均精度(AP)で、物体検出の精度を示している。縦軸は、NVIDIA T4 GPU 、 TensorRT10 FP16を使用したレイテンシを表示し、モデルのデータ処理速度を示しています。
Ultralytics YOLO11の発売により、Ultralytics 、YOLO シリーズを拡大し、オープンソースと エンタープライズモデルの両方を提供することで、業界を問わず高まる需要に応えていく。
YOLO11は、Nano、Small、Medium、Large、Xの5つの異なるモデルサイズを備えています。ユーザーは、コンピュータビジョンアプリケーションの特定のニーズに応じて最適なモデルを選択することができます。この5つのサイズは、画像分類、物体検出、インスタンス分割、追跡、姿勢推定、方向バウンディングボックス(OBB)物体検出などのタスクに柔軟性を提供します。各サイズには、各タスクで利用可能なモデルがあり、その結果、Ultralytics' 提供物の中核を形成する合計25のオープンソースモデルが あります。これらのモデルは、YOLO11nモデルが優れた効率を提供するエッジデバイス上の軽量タスクから、YOLO11lおよびYOLO11xモデルを必要とする大規模アプリケーションまで、幅広いアプリケーションに最適です。
Ultralytics 、初めて企業向けモデルを導入し、当社の製品提供における大きな節目を迎えます。これらの新機軸をユーザーの皆様と共有できることを嬉しく思います。YOLO11では、商用ユースケース向けに特別に設計された5つの独自モデルを導入します。来月から利用可能になるこれらの企業向けモデルは、Ultralytics' 100万枚以上の画像からなる新しい独自のデータセットで学習され、よりロバストな事前学習済みモデルを提供します。これらのモデルは、正確な物体検出が重要な医療画像解析や 衛星画像処理など、要求の厳しい実世界のアプリケーション向けに設計されています。
さて、YOLO11の特徴について説明してきた。
YOLO11の開発における重要な課題のひとつは、モデルをより小さく、より速く、より正確にするという、相反する優先事項の間で適切なバランスを見つけることだった。Ultralyticsの創設者兼CEOであるグレン・ジョーチャーは、次のように説明する。「YOLO の研究開発に携わることは、3つの異なる方向に進みたいので、本当に難しいことです。モデルをより小さくしたい、より正確にしたい、しかし、CPU やGPU のような異なるプラットフォームでより速くしたい。これらはすべて利害が対立するため、妥協し、変更する箇所を選択しなければなりません」。このような課題にもかかわらず、YOLO11は見事なバランスを達成し、YOLOv8 のような以前のバージョンよりもスピードと精度の両方を向上させている。
YOLO11では、バックボーンとネックアーキテクチャの再設計による特徴抽出の改善など、大幅な機能強化が行われ、より正確な物体検出が可能になりました。また、スピードと効率性も最適化されており、高い精度を維持しながら処理時間を短縮しています。これらの利点に加え、YOLO11はさまざまな環境に高度に適応し、エッジデバイス、クラウドプラットフォーム、NVIDIA GPUを使用するシステムでシームレスに動作します。この適応性により、モバイルデバイスから大規模サーバーまで、さまざまなハードウェアセットアップにわたって柔軟な展開オプションを必要とするユーザーにとって理想的な選択肢となる。
YOLO11の多用途性により、特に複雑なユースケースを扱う場合、多くの業界で信頼できるツールとなる。例えば、エッジ・デバイス上でシームレスに動作し、コンピューティング・パワーが限られた環境でリアルタイムの分析を必要とするアプリケーションに使用できる。その優れた例が自律走行で、車両は皆の安全を守るために瞬時の判断を下す必要がある。YOLO11は、歩行者や他の車など、道路上の物体を検出・分析することで、低照度や物体が部分的に隠れているような厳しい条件下でも役立ちます。迅速で正確な検知は、事故を防ぎ、自動運転車が安全に航行できるようにします。
YOLO11の範囲の広さを示すもうひとつの興味深い例は、オリエンテッド・バウンディング・ボックス(OBB)を扱えることだ。これは、完全に整列していないオブジェクトを検出するために不可欠です。OBBオブジェクトの検出は、農業、マッピング、監視などの業界で特に役立つ機能で、空撮画像や衛星画像には、作物や建物のような回転したオブジェクトが含まれていることが多い。従来のモデルとは異なり、YOLO11はあらゆる角度の物体を識別することができ、精度が要求される作業においてより正確な結果を提供します。
YOLO11を使い始めるのは簡単で、コーディングする場合でも、コーディングしない場合でも、アクセスしやすい。コードを使ってYOLO11を操作するには、Ultralytics Python パッケージを使えば、簡単にモデルをトレーニングし、デプロイすることができる。コードなしのアプローチをお望みなら、 Ultralytics HUBを使えば、数回クリックするだけでYOLO11を試すことができる。
YOLO11 をPython で使うには、まずUltralytics パッケージをインストールする必要がある。好みに応じて、pip、conda、またはDockerを使用してインストールできます。インストール・プロセスに関する詳細な手順とベスト・プラクティスについては、Ultralytics インストール・ガイドを参照してください。YOLO11に必要なパッケージのインストール中に、何らかの問題が発生した場合は、解決策やヒントについて、よくある問題ガイドを参照してください。
Ultralytics パッケージをインストールすれば、YOLO11の使い方は簡単だ。以下のコード・スニペットは、モデルのロード、トレーニング、性能テスト、ONNX フォーマットへの エクスポートのプロセスを説明します。 Ultralytics YOLO11を最大限に活用するための詳細なガイドやベストプラクティスが掲載されています。
ノーコードでのアプローチを好むユーザーには、Ultralytics HUBが、わずか数クリックでYOLO11モデルをトレーニングおよびデプロイする簡単な方法を提供します。HUBを使い始めるには、Ultralytics HUBプラットフォームでアカウントを作成するだけで、直感的なインターフェイスを通じてモデルのトレーニングと管理を始めることができます。
AIコミュニティは、実世界のアプリケーションのために、より速く、より正確なモデルを開発するよう努力することで、コンピュータ・ビジョンの分野を常に発展させている。Ultralytics YOLO11は、この取り組みにおける重要なマイルストーンであり、速度、精度、柔軟性の向上をもたらします。リアルタイムかつエッジなアプリケーション向けに設計されているため、ヘルスケアや自律走行などの業界に最適です。YOLO11 は、Ultralytics Python パッケージを使用する場合でも、コード不要のUltralytics Hub を使用する場合でも、複雑なビジョン AI タスクを簡素化します。YOLO11は、強力なコンピュータ・ビジョン機能を提供し、開発者や企業にとって最適な選択肢となります。
GitHubリポジトリをチェックし、活発なコミュニティに参加してAIについてもっと学びましょう。ビジョンAIがヘルスケアや 農業などの分野でどのようにイノベーションを推進しているかをご覧ください。