新しいUltralytics YOLO11 モデル、その特徴、様々な業界におけるリアルタイム・アプリケーションのすべてをご紹介します。必要なことはすべてご説明します。
9月30日(月)、Ultralytics 。 Ultralytics YOLO11YOLO Vision 2024 (YV24)、Ultralytics' 年次ハイブリッド・イベントでのデビューに続き、コンピュータ・ビジョンの最新の進歩である。AIコミュニティは、このモデルの能力を探求しようと躍起になっている。より高速な処理、より高い精度、エッジデバイスとクラウド展開の両方に最適化されたモデルにより、YOLO11 、リアルタイムコンピュータビジョンアプリケーションの可能性を再定義する。
Ultralytics 、創設者兼CEOのグレン・ジョーチャーは インタビューで次のように語っている。「世界はクリーンエネルギーに向かっていますが、十分なスピードではありません。私たちは、より少ないエポック、より少ない補強、より少ないデータでモデルを訓練できるようにしたいと考えています。最小の物体検出モデルであるYOLO11nのパラメータはわずか260万個で、JPEGのサイズに匹敵する。最大の物体検出モデルであるYOLO11xのパラメータは約5,600万個で、これでも他のモデルと比べると信じられないほど小さい。5年前のNvidia GPU のような安いGPU 、興奮と少しのコーヒーだけで訓練できる。"
この記事では、YOLO11 、その特徴、改良点、パフォーマンス・ベンチマーク、そして実際のアプリケーションを詳しく紹介し、このモデルで何ができるのかを理解してもらう。始めよう!
YOLO11 は、YOLO (You Only Look Once)シリーズのコンピュータビジョンモデルの最新の進歩であり、以下のような以前のバージョンよりも大幅に改善されている。 YOLOv5そして YOLOv8.Ultralytics のチームは、コミュニティからのフィードバックと最先端の研究を取り入れ、YOLO11 をより高速、より正確、より効率的にしました。YOLO11 は、YOLOv8 と同じコンピュータ・ビジョン・タスク( オブジェクト検出、インスタンス・セグメンテーション、 画像分類など)もサポートしています。実際、ユーザーは既存のワークフローを変更する必要なく、簡単にYOLO11 に切り替えることができます。
YOLO11mは、YOLO11 より22%少ないパラメータで、COCOデータセットの平均平均精度(mAP)を高めている。YOLO11mは、YOLOv8m より22%少ないパラメータで、COCOデータセットにおいてより高い平均精度(mAP)を達成しており、これは物体をより正確かつ効率的に検出できることを意味する。処理速度の面では、YOLO11 は以前のモデルを凌駕しており、迅速な検出と応答が重要で、ミリ秒単位が重要なリアルタイム・アプリケーションに最適です。
以下のベンチマークグラフは、YOLO11 が以前のモデルからいかに際立っているかを示している。横軸はCOCOボックスの平均精度(AP)で、物体検出の精度を示している。縦軸は、NVIDIA T4 GPU 、 TensorRT10 FP16を使用したレイテンシを示し、このモデルがいかに高速にデータを処理するかを示しています。
Withthe launch ofUltralytics YOLO11 , Ultralytics is expanding theYOLO series by offering bothopen-sourceandenterprisemodels to meet the growing demand across industries.
YOLO11ナノ、スモール、ミディアム、ラージ、およびXの5つの異なるモデルサイズを備えています。ユーザーは、コンピュータビジョンアプリケーションの特定のニーズに応じて最適なモデルを選択することができます。5つのサイズは、画像分類、物体検出、インスタンス分割、追跡、姿勢推定、OBB(Oriented bounding boxes)物体検出などのタスクに柔軟に対応します。各サイズには、各タスクで利用可能なモデルがあり、その結果、Ultralytics' 提供物の中核を形成する合計25のオープンソースモデルが あります。これらのモデルは、YOLO11nモデルが優れた効率を提供するエッジデバイス上の軽量タスクから、YOLO11lおよびYOLO11xモデルを必要とする大規模アプリケーションまで、幅広いアプリケーションに最適です。
Ultralytics YOLO11 は、商用ユースケース向けに特別に設計された 5 つの独自モデルを導入する。来月から利用可能になるこれらのエンタープライズモデルは、 ' 100万枚以上の画像からなる新しい独自のUltralyticsデータセットで学習され、より堅牢な事前学習済みモデルを提供します。これらのモデルは、医療画像解析や 衛星画像処理など、正確な物体検出が重要な、要求の厳しい実世界のアプリケーション向けに設計されています。
YOLO11 、YOLO11 の特徴について説明しよう。
YOLO11 の開発における重要な課題のひとつは、モデルをより小さく、より速く、より正確にするという、相反する優先事項の間で適切なバランスを見つけることだった。Ultralyticsの創設者兼CEOであるグレン・ジョーチャーは、次のように説明する。「YOLO の研究開発に携わるのは、3つの異なる方向に進みたいからです。モデルをより小さくしたい、より正確にしたい、しかし、CPU やGPU のようなさまざまなプラットフォームでより速くしたいのです。これらはすべて利害が対立するため、妥協し、どこに変更を加えるかを選択しなければならない。"このような課題にもかかわらず、YOLO11 は見事なバランスを達成し、YOLOv8 のような以前のバージョンよりもスピードと精度の両方を向上させている。
YOLO11 は、バックボーンとネックアーキテクチャの再設計による特徴抽出の改善など、大幅な機能強化を実現し、より正確な物体検出を可能にしました。このモデルはまた、スピードと効率のために最適化されており、高い精度を維持しながら処理時間を短縮しています。これらの利点に加え、YOLO11 はさまざまな環境に高い適応性を持ち、エッジデバイス、クラウドプラットフォーム、NVIDIA GPU を使用するシステムでシームレスに動作します。この適応性により、モバイルデバイスから大規模サーバーまで、さまざまなハードウェアセットアップにわたって柔軟な展開オプションを必要とするユーザーにとって理想的な選択肢となる。
YOLO11の多用途性により、特に複雑なユースケースを扱う場合、多くの業界にわたって信頼できるツールとなる。例えば、エッジデバイス上でシームレスに動作し、コンピューティングパワーが限られた環境でリアルタイム分析を必要とするアプリケーションに使用できる。その優れた例が自律走行で、車両は皆の安全を守るために瞬時の判断を下す必要がある。YOLO11 、低照度や物体が部分的に隠れているような厳しい条件下でも、歩行者や他の車のような道路上の物体を検出して分析することで役立つ。迅速で正確な検知は、事故を防ぎ、自動運転車が安全に航行できるようにします。
YOLO11のもうひとつの興味深い例は、オリエンテッド・バウンディング・ボックス(OBB)を扱えることだ。これは、完全に整列していないオブジェクトを検出するために不可欠である。OBBオブジェクトの検出は、農業、マッピング、監視のような業界で特に有用な機能であり、空撮画像や衛星画像に作物や建物のような回転したオブジェクトが含まれていることがよくあります。従来のモデルとは異なり、YOLO11 、あらゆる角度の物体を識別することができ、精度が要求される作業においてより正確な結果を提供します。
YOLO11 を使い始めるのは簡単で、コーディングが好きでも、コードなしのオプションが好きでも、アクセスしやすい。コードを使ってYOLO11 を扱うには、Ultralytics Python パッケージを使えば、簡単にモデルをトレーニングし、デプロイすることができる。コードなしのアプローチをご希望の場合は、Ultralytics HUB を使用すると、わずか数回のクリックでYOLO11 を試すことができます。
Python でYOLO11 を使うには、まずUltralytics パッケージをインストールする必要がある。好みに応じて、pip、conda、またはDockerを使用してインストールできます。インストールプロセスに関する詳細な手順とベストプラクティスについては、Ultralytics インストールガイドを確認してください。YOLO11 に必要なパッケージのインストール中に、何らかの問題が発生した場合は、解決策とヒントについて、よくある問題ガイドを参照してください。
Ultralytics パッケージをインストールしたら、 YOLO11 を使うのは簡単です。以下のコード・スニペットは、モデルのロード、トレーニング、性能テスト、ONNX 形式への エクスポートのプロセスを説明しています。より詳細な例や高度な使い方については、 Ultralytics の公式ドキュメントを参照してください。 YOLO11 を最大限に活用するための詳細なガイドやベストプラクティスが掲載されています。
Ultralytics HUBは、ノーコードでのアプローチを好むユーザーに対して、わずか数クリックでYOLO11 モデルのトレーニングとデプロイを行う簡単な方法を提供します。HUBを使い始めるには、Ultralytics HUBプラットフォームでアカウントを作成するだけで、直感的なインターフェイスを通じてモデルのトレーニングと管理を始めることができます。
AI コミュニティは、実世界のアプリケーションのために、より高速で正確なモデルを開発するよう努力することで、コンピュータ・ビジョンの分野を常に発展させています。Ultralytics YOLO11 は、この努力における主要なマイルストーンであり、速度、精度、柔軟性の向上をもたらします。リアルタイムおよびエッジ・アプリケーション向けに設計されているため、ヘルスケアや自律走行などの業界に最適です。Ultralytics Python パッケージまたはコード不要のUltralytics ハブのいずれを使用している場合でも、YOLO11 は複雑なビジョン AI タスクを簡素化します。強力なコンピュータビジョン機能を提供するため、開発者や企業にとって最適な選択肢となります。
GitHubリポジトリをチェックし、活発なコミュニティに参加してAIについてもっと学びましょう。ビジョンAIがヘルスケアや 農業などの分野でどのようにイノベーションを推進しているかをご覧ください。