Dmitriy PastushenkovとAdrian BoguszewskiのYOLO Vision 2024を再訪し、Intel OpenVino 、Intel's AI PC上でリアルタイム推論を実行しながら、YOLO モデルの最適化について話す。
YOLO ビジョン2024(YV24)は、Ultralytics' 毎年恒例のハイブリッドイベントで、世界中からAI愛好家、開発者、専門家が集まり、コンピュータビジョンの最新イノベーションを探求した。YV24は、新たなブレークスルーを議論する絶好の機会であり、プラットフォームであった。このイベントでは、AI業界の主要企業が最新のイノベーションを紹介した。その中で、Intel は、同社の新しい画期的なAI PCと、Intel OpenVino Ultralytics YOLO のような モデルとの統合に関する基調講演を行った。 Ultralytics YOLO11.
講演は、LandCover.aiデータセットを共同作成し、Intel「OpenVINO 」ツールキットについて開発者を教育するソフトウェア・エバンジェリストのエイドリアン・ボグシェフスキーと、産業オートメーションとAIで20年以上の経験を持つAI PCエバンジェリストのドミトリー・パストゥシェンコフが担当した。イベント中、エイドリアンは興奮を分かち合い、次のように語った。"今日は素晴らしいイベントです。Ultralytics がYOLO の新バージョンを提供したからだけでなく、私たちの新しいハードウェア上で動作するこの新しいモデル、そしてOpenVINO の新バージョンを紹介できるからです。"
この記事では、IntelのYV24での講演の主なハイライトを紹介し、同社のAI PC、Intel Core Ultra 200Vシリーズの内部と外部を掘り下げ、Ultralytics YOLO モデルと、OpenVINO ツールキットを使用してどのように統合するかについて説明する。さっそく始めよう!
ドミトリーは基調講演の冒頭で、従来のAIとジェネレーティブAIの主な違いについて説明した。焦点は、2024年にこれらのテクノロジーとそのユースケースがどのように進化しているかに絞られた。コンピュータ・ビジョンや 自然言語処理のような伝統的なAI技術は、姿勢推定、物体検出、音声認識のようなタスクに不可欠である。しかし、ジェネレーティブAIは、チャットボット、テキストから画像への生成、コードの記述、さらにはテキストからビデオへの変換といったアプリケーションを含む、AI技術の新しい波を表している。
ドミトリーは両者のスケールの違いを指摘した。従来のAIモデルが数百万個のパラメータで構成されているのに対し、ジェネレーティブAIモデルははるかに大規模で動作すると説明した。ジェネレーティブAIモデルは、数十億から数兆のパラメータを含むことが多く、計算負荷がはるかに高くなります。
ドミトリーは、従来のAIモデルとジェネレーティブAIモデルの両方を効率的に実行するという増大する課題に対処するために設計された新しいハードウェアソリューションとして、Intel AI PCを紹介した。Intel AI PCはパワフルでエネルギー効率の高いマシンです。クラウドベースの処理を必要とせず、幅広いAIモデルをローカルで実行することができる。
ローカル処理は、機密データのプライバシー保護に役立つ。AIモデルがインターネット接続から独立して動作できるようになれば、プライバシーとセキュリティに関する業界の倫理的懸念に答えることができる。
Intel AI PCの原動力は、Intel Core Ultra 200Vシリーズ・プロセッサーである。このプロセッサーには、中央処理ユニット(CPU )、グラフィックス・プロセッシング・ユニット(GPU )、ニューラル・プロセッシング・ユニット(NPU)の3つの主要コンポーネントが組み込まれています。それぞれが、さまざまな種類のAIワークロードを処理する上で特定の役割を果たします。CPU は、迅速な応答が求められる小規模で低レイテンシーのタスクに最適で、GPU は、AIモデルの実行などの高スループット処理に最適化されています。電力効率を重視して設計されたNPUは、以下のようなモデルによるリアルタイムの物体検出のような長時間実行タスクに適している。 YOLO11.
CPU は最大5TOPS(1秒間に数兆回の演算)、GPU は最大67TOPSを実現し、NPUはシステムリソースを消耗することなくAIタスクを継続的に実行するエネルギー効率の高い方法を提供することが強調された。
Intel Core Ultra 200Vシリーズ・プロセッサーは、3つのAIエンジン(NPU、CPU 、GPU )を1つの小型チップに統合している。その設計は、性能を犠牲にすることなく、ノートPCのようなコンパクトなデバイスに最適です。
プロセッサーにはRAMも内蔵されており、グラフィックカードを別途用意する必要がない。これにより、消費電力を削減し、デバイスをコンパクトに保つことができる。ドミトリーはまた、プロセッサーの柔軟性を強調した。ユーザーはタスクに応じて、AIモデルをCPU 、GPU 、NPUのどれで実行するかを決めることができる。例えば、 YOLO11 モデルによる物体検出は、これらのエンジンのいずれでも実行できるが、テキストから画像への生成のような複雑なタスクでは、GPU とNPUの両方を同時に使用することで、より優れたパフォーマンスを得ることができる。
プレゼンテーションの間、ドミトリーはポケットからチップを取り出し、このような高度なAIタスクを処理する能力があるにもかかわらず、このチップが本当に小さいことを皆にはっきりと実感させた。これは、Intel 、強力なAI機能をよりポータブルで実用的なデバイスにもたらすことを示す、楽しく印象的な方法だった。
Intel の最新のハードウェアの進歩を紹介した後、ドミトリーは、AIをサポートするIntel のソフトウェアスタックに話を移した。彼はOpenVINO を紹介した。Intelは、AIモデルを最適化し、さまざまなデバイスに効率的に展開するために設計されたオープンソースのフレームワークである。OpenVINO は視覚的なタスクにとどまらず、自然言語処理、音声処理、トランスフォーマーなどに使用されるAIモデルにもサポートを拡大している。
OpenVINO のような一般的なプラットフォームと互換性があります。 PyTorchやTensorFlowONNXなどの一般的なプラットフォームと互換性があり、開発者はワークフローに簡単に組み込むことができる。彼が注目した重要な機能のひとつが量子化だ。量子化はモデルの重みを圧縮してサイズを小さくするため、大規模なモデルでもクラウドを必要とせずにローカルデバイスでスムーズに実行できる。OpenVINO は複数のフレームワークで動作し、CPU 、GPU 、NPU、FPGA、あるいはARMデバイスでも動作し、Windows、Linux、macOSをサポートしている。ドミトリーはまた、OpenVINO を使い始めるのがいかに簡単かを聴衆に説明した。
講演の第2部では、マイクがエイドリアンに渡され、Ultralytics YOLO モデルとIntel'sOpenVINO ツールキットとのシームレスな統合について説明し、YOLO モデル展開のプロセスを簡素化した。彼は、Ultralytics Python パッケージを使用して YOLO モデルを OpenVINO フォーマットにエクスポートする方法が、迅速かつ簡単であることをステップ・バイ・ステップで説明した。この統合により、開発者はモデルをIntel ハードウェアに最適化し、両プラットフォームを最大限に活用することがより容易になります。
エイドリアンは、Ultralytics YOLO モデルの学習が完了したら、いくつかの簡単なコマンドライン・フラグを使用してそれをエクスポートできることを示した。たとえば、最大精度を得るために浮動小数点数バージョンとしてモデルをエクスポートするか、スピードと効率性を高めるために量子化バージョンとしてエクスポートするかを指定することができます。また、開発者がコードを通じてこのプロセスを直接管理し、INT8量子化などのオプションを使用することで、精度をあまり犠牲にすることなくパフォーマンスを向上させる方法についても強調しました。
この理論を実践するため、Intel チームは、 AI PC上で動作する物体検出のリアルタイム・デモを発表した。 YOLO11Intel のリアルタイムデモを発表した。エイドリアンは、システムが異なるプロセッサー間でモデルをどのように処理するかを紹介し、浮動小数点モデルでCPU 、毎秒36フレーム(FPS)を達成し、統合GPU 、100FPSを超え、INT8量子化バージョンで70FPSを達成した。彼らは、Intel AI PCがいかに効率的に複雑なAIタスクを管理できるかを示すことができた。
また、このシステムは、すべてのデータやビデオフレームが前もって利用可能なタスクに対して、CPU 、GPU 、NPUを併用し、モデルを並列実行できることも指摘した。これは、ビデオのような高負荷を処理する場合に便利です。システムは作業負荷を異なるプロセッサーに分割できるため、より高速で効率的な処理が可能になる。
最後にエイドリアンは、人数のカウントや インテリジェントな待ち行列管理などの ソリューションを含め、ユーザーが自宅でデモを試すことができると述べた。そして、ユーザーがプロンプトを入力することで、夢のような画像をリアルタイムで生成するボーナス・デモを GPU 。これは、従来のAIタスクと創造的で生成的なAIプロジェクトの両方に対応するIntel AI PCの多用途性を示すものだった。
同イベントでは、Intel のブースが設けられ、Intel AI PC上で動作するYOLO11 を使ったリアルタイムの物体検出デモが展示された。参加者は、OpenVINO で最適化され、Intel Core Ultra 200V プロセッサーにデプロイされたモデルを実際に見ることができた。
Intel のブースで、ドミトリーは「YOLO ビジョンに参加するのは初めてで、マドリードに来られてうれしいです。私たちは、Intel Core Ultra 200Vプロセッサー上で動作する、Ultralytics のYOLO11 モデルを紹介しています。このモデルは優れたパフォーマンスを示しており、モデルの最適化とデプロイにはOpenVINO を使用しています。Ultralytics とのコラボレーションは非常に簡単で、CPU 、GPU 、NPU を活用し、最新のIntel ハードウェア上でモデルを実行することができました。"ブースでは、参加者が持ち帰れるTシャツやノートブックなど、楽しい景品も用意されていた。
Intel Intel Core Ultra 200Vシリーズ・プロセッサーをフィーチャーしたYV24での技術講演では、 ツールキットが のようなAIモデルをどのように最適化するかを紹介した。この統合により、ユーザーは のモデルをデバイス上で直接実行できるようになり、物体検出などのコンピュータ・ビジョン・タスクで優れたパフォーマンスを発揮する。主な利点は、ユーザーがクラウドサービスに依存する必要がないことです。OpenVINO Ultralytics YOLO11 YOLO
YOLO Intel OpenVINO ツールキットは、 モデルと組み合わせることで、高度なAI機能をパーソナル・デバイスに直接もたらす新たな可能性を開き、さまざまな業界でAIイノベーションを推進することを熱望する開発者にとって理想的な選択肢となる。Ultralytics YOLO
コラボレーションして、イノベーションを起こしましょう!GitHub リポジトリを訪問して、私たちのコントリビューションを探索し、私たちのコミュニティに参加してください。製造業やヘルスケアなどの業界にインパクトを与えるためにAIをどのように活用しているかをご覧ください。