Ultralytics 顧客に戻る

プレツェント、スライド要素の検出にUltralytics YOLO モデルを採用

問題

Prezent社は、スライド構造を自動的に検出するVision AIソリューションを必要としていた。従来のツールは時間がかかり、信頼性が低く、デザインを保持できないことが多かったからだ。

ソリューション

Ultralytics YOLO モデルにより、Prezentは精度を65%から87%に向上させ、トレーニング時間を3日から1日に短縮し、スライド処理を10秒以下に短縮した。

プレゼンテーションは、ビジネスミーティングにおける明確なコミュニケーションの鍵となりますが、インパクトがあり、かつ情報量の多いプレゼンテーションにデザインし直すことは困難です。PrezentはAIを使用して、タイトル、テキスト、画像、図表などのスライド要素を検出し、理解します。

スライド要素検出のための様々なツールをテストした際、Prezentは多くのツールがレイアウトや情報階層を乱し、プレゼンテーションのまとまりを悪くしていることに気づきました。Ultralytics YOLO モデルを統合することで、Prezentはプロセスを合理化し、スライド要素の検出を最小限の労力で、より速く、よりスムーズに、よりプロフェッショナルにします。

AIでスライドのリデザインをより速くスマートに

Prezentは、リデザインプロセスを自動化することで、経営幹部やビジネスチームが明確でプロフェッショナルなプレゼンテーションを作成できるよう支援します。当初は、手作業によるテンプレートと人手に頼っていたため、時間がかかり非効率的でした。 

Prezentは、効率を改善するため、AIとコンピュータ・ビジョンに着目し、元のレイアウトを維持したままスライドのフォーマットを自動化しました。オブジェクト検出モデルを使用することで、同社のプラットフォームはスライドコンテンツを自動的に検出して整理し、ユーザー入力を最小限に抑えながら、より迅速でシームレスな再設計プロセスを実現できるようになりました。そうすることで、Prezentは、プレゼンテーションが明確で、視覚的に魅力的で、わかりやすいままであることを保証します。

AIを活用したスライド・リデザインのハードル

優れたプレゼンテーションとは、情報だけでなく、分かりやすさ、構成、インパクトが重要です。しかし、より魅力的なスライドにするために手作業でデザインを変更するには、時間と労力がかかります。会議でプレゼンテーションに頼ることの多いC-suiteエグゼクティブやビジネスチームにとって、時間がかかり、イライラさせられる再設計プロセスは大きな課題でした。

Prezentはスライドのリデザインを自動化することに着手しましたが、そこには重要な障害がありました。従来のツールでは、テキストを抽出することはできても、タイトルや画像、図表がどのように配置されているかを認識できず、レイアウトが崩れてしまうことがよくありました。

当初、Prezentはオープンソースのオブジェクト検出モデルを使用していましたが、これらの方法には限界がありました。精度が低い(60~65%)、処理時間が遅い、レイアウトを手作業で修正する必要がある、などです。プロセスを真に自動化するために、Prezentは、スライド要素を正確に検出し、構造を損なうことなく再設計できる、より高速でスマートなVision AIソリューションを必要としていました。そこで、プロセスをシームレスにするために、コンピュータ・ビジョンとAIに注目したのです。

プレツェントのスライド素子検出用ビジョンAIソリューション

レイアウトを維持したままスライドの再設計を自動化するために、PrezentはUltralytics YOLO モデルをプラットフォームに統合した。Ultralytics YOLO モデルは、オブジェクト検出を含む様々なコンピュータビジョンタスクをサポートします。スライドは画像に変換され、YOLO タイトル、テキストボックス、画像、図表などの重要な要素を、元のレイアウトを維持したまま検出します。 

YOLO レイアウト抽出において重要な役割を果たし、Prezentが各スライドの構造と階層を保持しながら、高速で自動化された再設計を可能にします。YOLO 、テキストとビジュアル要素の両方を認識することで、プレゼンテーションが機能性と洗練されたデザインの両方を維持できるよう支援します。高い精度と高速処理により、YOLO Prezentのスライド要素検出を自動化し、手作業による調整の必要性を減らします。

Ultralytics YOLO モデルを選ぶ理由は?

Prezent社がUltralytics YOLO モデルを選んだ理由は、他のVision AIモデルと比較して、より速くトレーニングでき、より正確で、レイテンシーが低いからです。Prezent社は、ほとんどのモデルがトレーニングに2~3日を要し、反復と改善を遅らせていることを発見した。 

「通常、機械学習モデルのトレーニングには膨大な時間がかかり、推論が終わるまで2〜3日待たされ、その後精度が十分かどうかを判断しなければならないことが多い。しかし、YOLO使えば、1日でモデルを訓練し、迅速に決定を下し、その結果から迅速に学習することができます」とプレゼントのプリンシパル・データ・サイエンティストは言う。

YOLO使用することで、Prezentの精度は65%から87%に向上し、モデルを迅速に改良してパフォーマンスを高めることができました。また、YOLO高速推論速度により、スライド処理を10秒以内に行うことができ、リアルタイムの自動化とシームレスなユーザーエクスペリエンスが保証されました。YOLO統合することで、Prezentは、効率的で正確なスライド再設計のための、信頼できるスケーラブルなソリューションを見つけました。

YOLOスライドを10秒以内に加工

Ultralytics YOLO モデルを活用することで、Prezentはスライドの再設計プロセスをより速く、より効率的に、より正確に再定義しました。スライド要素を自動的に検出して整理する機能により、プレゼンテーションは手動で操作することなく、元の構造、明瞭さ、視覚的な魅力を維持することができるようになりました。

「Ultralytics YOLO使用すると、10秒以内に完全に処理されたスライドを顧客に提供できるため、処理速度も優れています。迅速なトレーニング時間と低レイテンシーは、ワークフローを合理化し、再設計の質を向上させる鍵となりました。

YOLOリアルタイム処理機能により、Prezentはスライドレイアウトの検出を完全に自動化し、手作業による再設計の非効率性を排除することができました。経営幹部やビジネスチームは、洗練されたプロフェッショナルなプレゼンテーションを即座に作成することができ、ワークフローの効率とユーザーエクスペリエンスが向上します。コンピュータビジョンとAIを統合することで、Prezentは生産性とプレゼンテーションの質の両方を向上させる拡張性のある自動化ソリューションを構築しました。

文書解析におけるコンピュータ・ビジョンの前途

Prezentは、コンピュータビジョンモデルがより複雑なレイアウトを扱う能力を向上させ、文書構造をより深く理解できるようになることを望んでいる。そうすれば、より洗練された正確なスライドの再設計が可能になるでしょう。

潜在的な改善点の1つは、関連する要素をサブカテゴリーにグループ化する機能です。このような洞察は、Vision AIモデルがスライド・コンポーネント間の階層と関係を理解するのに役立ちます。その結果、再設計されたスライドは、より構造化され、視覚的にまとまり、フォローしやすくなります。

全体として、自動化とAI主導のソリューションに対する需要が高まるにつれ、コンピューター・ビジョンのモデルは、より複雑なタスクをより正確かつ迅速に処理できるように進化し続けるだろうとプレゼントは考えている。 

ビジョンAIがお客様のビジネスをどのように改善できるか興味がありますか?GitHubリポジトリでヘルスケアや 製造業における コンピュータビジョンなど、さまざまな業界向けのUltralyticsAIソリューションをご覧ください。UltralyticsのYOLO モデルやライセンスオプションがどのようにお客様のビジネスに役立つかをご覧ください!

続きを読む

すべて読む

ALYCEのスマート・トラフィック・ソリューションは、Ultralytics YOLO モデルを活用している。

運輸・物流

キウィトロンは、Ultralytics YOLO モデルで工業用ハザードの検出を行う。

製造業

産業別ソリューション

よくある質問

よくあるご質問

Ultralytics YOLO モデルとは?
Ultralytics YOLO モデルの違いは何ですか?
Ultralytics YOLO どのモデルを選べばいいですか?
どのようなライセンスが必要ですか?

YOLO ライセンスでパワーアップ

あなたのプロジェクトに高度なAIビジョンを。今すぐ目的に合ったライセンスを見つけよう

ライセンスオプションの検討