شيك أخضر
تم نسخ الرابط إلى الحافظة

دليل للتعمق في اكتشاف الأجسام في عام 2025

تعرّف على كيفية اكتشاف الأجسام وأهميته في الذكاء الاصطناعي، وكيف تعمل نماذج مثل YOLO11 على تحويل صناعات مثل السيارات ذاتية القيادة والرعاية الصحية والأمن.

تعمل العديد من الصناعات على دمج حلول الذكاء الاصطناعي (AI) بسرعة في عملياتها. من بين العديد من تقنيات الذكاء الاصطناعي المتاحة اليوم، تُعد الرؤية الحاسوبية واحدة من أكثرها شيوعًا. الرؤية الحاسوبية هي فرع من فروع الذكاء الاصطناعي يساعد أجهزة الكمبيوتر على رؤية وفهم محتويات الصور ومقاطع الفيديو، تماماً كما يفعل البشر. وهي تتيح للآلات إمكانية التعرف على الأشياء وتحديد الأنماط وفهم ما تنظر إليه. 

من المتوقع أن تنمو القيمة السوقية العالمية للرؤية الحاسوبية إلى 175.72 مليار دولار بحلول عام 2032. تشمل الرؤية الحاسوبية العديد من المهام التي تمكّن أنظمة الذكاء الاصطناعي للرؤية من تحليل البيانات المرئية وتفسيرها. إحدى أكثر مهام الرؤية الحاسوبية استخدامًا وأهمية هي اكتشاف الأجسام. 

يركز اكتشاف الكائنات على تحديد موقع الكائنات وتصنيفها في البيانات المرئية. على سبيل المثال، إذا عرضت على الكمبيوتر صورة لبقرة، فيمكنه اكتشاف البقرة ورسم مربع محدد حولها. هذه القدرة مفيدة في تطبيقات العالم الحقيقي مثل مراقبة الحيوانات والسيارات ذاتية القيادة والمراقبة. 

إذن، كيف يمكن إجراء اكتشاف الأجسام؟ إحدى الطرق هي من خلال نماذج الرؤية الحاسوبية. على سبيل المثال Ultralytics YOLO11 هو نموذج رؤية حاسوبية يدعم مهام الرؤية الحاسوبية مثل اكتشاف الأجسام. 

في هذا الدليل، سنستكشف اكتشاف الكائنات وكيفية عمله. سنناقش أيضًا بعض التطبيقات الواقعية لاكتشاف الكائنات و Ultralytics YOLO11.

الشكل 1. استخدام دعم YOLO11للكشف عن الأجسام لرصد الماشية.

ما هو اكتشاف الأجسام؟ 

اكتشاف الأجسام هو مهمة رؤية حاسوبية تحدد الأجسام في الصور أو مقاطع الفيديو وتحدد موقعها. وهي تجيب على سؤالين رئيسيين: "ما هي الأجسام الموجودة في الصورة؟" و"أين تقع هذه الأجسام؟

يمكنك التفكير في اكتشاف الأجسام كعملية تتضمن خطوتين رئيسيتين. الأولى، وهي تصنيف الأجسام، تسمح للنظام بالتعرّف على الأجسام وتسميتها، مثل تحديد قطة أو سيارة أو شخص بناءً على الأنماط المكتسبة. أما الخطوة الثانية، وهي التوطين، فتحدد موقع الجسم من خلال رسم مربع محدد حوله، مع الإشارة إلى مكان ظهوره في الصورة. تمكّن هذه الخطوات معاً الآلات من اكتشاف الأجسام في المشهد وفهمها.

الجانب الذي يجعل اكتشاف الأجسام فريداً من نوعه هو قدرته على التعرف على الأجسام وتحديد موقعها بدقة. تركز مهام الرؤية الحاسوبية الأخرى على أهداف مختلفة.

على سبيل المثال، يقوم تصنيف الصور بتعيين تسمية لصورة كاملة. وفي الوقت نفسه، يوفر تجزئة الصورة فهمًا على مستوى البكسل للعناصر المختلفة. من ناحية أخرى، يجمع اكتشاف الكائنات بين التعرّف على الكائنات وتحديد موقعها. وهذا يجعلها مفيدة بشكل خاص لمهام مثل عدّ كائنات متعددة في الوقت الفعلي.

الشكل 2. مقارنة مهام الرؤية الحاسوبية.

التعرف على الكائنات مقابل اكتشاف الكائنات

أثناء استكشافك لمصطلحات الرؤية الحاسوبية المختلفة، قد تشعر أن التعرف على الكائنات واكتشاف الكائنات قابلان للتبادل - لكنهما يخدمان أغراضًا مختلفة. هناك طريقة رائعة لفهم الفرق من خلال النظر إلى اكتشاف الوجوه والتعرف على الوجوه.

اكتشاف الوجه هو نوع من أنواع اكتشاف الأجسام. فهو يحدد وجود وجه في الصورة ويحدد موقعه باستخدام مربع محدد. يجيب على السؤال "أين الوجه في الصورة؟ تُستخدم هذه التقنية بشكل شائع في كاميرات الهواتف الذكية التي تركز تلقائيًا على الوجوه أو في كاميرات المراقبة التي تكتشف وجود شخص ما.

أما التعرف على الوجوه، من ناحية أخرى، فهو شكل من أشكال التعرف على الأشياء. فهو لا يكتشف الوجه فقط؛ بل يحدد من هو صاحب الوجه من خلال تحليل السمات الفريدة ومقارنتها بقاعدة بيانات. إنه يجيب على السؤال "من هذا الشخص؟ هذه هي التقنية وراء فتح قفل هاتفك باستخدام Face ID أو أنظمة أمن المطارات التي تتحقق من الهويات.

ببساطة، يقوم اكتشاف الكائنات بالعثور على الكائنات وتحديد مواقعها، بينما يقوم التعرف على الكائنات بتصنيفها وتحديدها. 

الشكل 3. اكتشاف الكائنات مقابل التعرف على الكائنات. الصورة للمؤلف.

صُممت العديد من نماذج اكتشاف الأجسام، مثل YOLO11 لدعم اكتشاف الوجوه وليس التعرف على الوجوه. يمكن ل YOLO11 تحديد وجود وجه في الصورة بكفاءة ورسم مربع محدد حوله، مما يجعله مفيدًا لتطبيقات مثل أنظمة المراقبة ومراقبة الحشود ووضع علامات على الصور آليًا. ومع ذلك، لا يمكنه تحديد صاحب الوجه. يمكن دمج YOLO11 مع نماذج مدرّبة خصيصاً للتعرّف على الوجوه، مثل Facenet أو DeepFace، لتمكين كل من الكشف وتحديد الهوية في نظام واحد.

فهم كيفية عمل الكشف عن الكائنات

قبل أن نناقش كيفية عمل اكتشاف الأجسام، دعنا أولاً نلقي نظرة فاحصة على كيفية تحليل الكمبيوتر للصورة. بدلاً من رؤية الصورة كما نفعل نحن، يقوم الحاسوب بتقسيمها إلى شبكة من المربعات الصغيرة التي تسمى بكسل. يحتوي كل بكسل على معلومات اللون والسطوع التي يمكن للكمبيوتر معالجتها لتفسير البيانات المرئية.

لفهم هذه البكسلات، تقوم الخوارزميات بتجميعها في مناطق ذات معنى بناءً على الشكل واللون ومدى قربها من بعضها البعض. يمكن لنماذج اكتشاف الأجسام، مثل YOLO11 التعرّف على الأنماط أو السمات في مجموعات البكسل هذه. 

على سبيل المثال، لا ترى السيارة ذاتية القيادة أحد المشاة بالطريقة التي نراها نحن، فهي تكتشف الأشكال والأنماط التي تتطابق مع سمات المشاة. وتعتمد هذه النماذج على التدريب المكثف على مجموعات بيانات الصور الموسومة، مما يسمح لها بتعلم الخصائص المميزة للأشياء مثل السيارات وإشارات المرور والأشخاص.

يحتوي النموذج النموذجي للكشف عن الكائنات على ثلاثة أجزاء رئيسية: العمود الفقري والرقبة والرأس. يستخرج العمود الفقري الميزات المهمة من الصورة. تقوم الرقبة بمعالجة هذه الميزات وتنقيحها، بينما يكون الرأس مسؤولاً عن التنبؤ بمواقع الأجسام وتصنيفها.

تنقيح الاكتشافات وعرض النتائج

بمجرد إجراء الاكتشافات الأولية، يتم تطبيق تقنيات ما بعد المعالجة لتحسين الدقة وتصفية التنبؤات الزائدة عن الحاجة. على سبيل المثال، تتم إزالة المربعات المتداخلة المتداخلة لضمان الاحتفاظ فقط بالكشفات الأكثر صلة. أيضًا، يتم تعيين درجات الثقة (قيم رقمية تمثل مدى تأكد النموذج من انتماء الكائن المكتشف إلى فئة معينة) لكل كائن مكتشف للإشارة إلى مدى يقين النموذج في تنبؤاته.

أخيرًا، يتم تقديم المخرجات مع مربعات محددة مرسومة حول الأجسام المكتشفة، إلى جانب تصنيفات الفئات المتوقعة ودرجات الثقة. يمكن بعد ذلك استخدام هذه النتائج في تطبيقات العالم الحقيقي.

نماذج الكشف عن الأجسام الشائعة 

في الوقت الحاضر، هناك العديد من نماذج الرؤية الحاسوبية المتاحة، ومن أشهرها نماذجUltralytics YOLO . وهي معروفة بسرعتها ودقتها وتعدد استخداماتها. على مر السنين، أصبحت هذه النماذج أسرع وأكثر دقة وقدرة على التعامل مع مجموعة واسعة من المهام. إن إصدار Ultralytics YOLOv5 جعل عملية النشر أسهل مع أطر عمل مثل PyTorch مما سمح لمزيد من الأشخاص باستخدام الذكاء الاصطناعي المتقدم للرؤية دون الحاجة إلى خبرة تقنية عميقة.

بناءً على هذا الأساس, Ultralytics YOLOv8 ميزات جديدة مثل تجزئة المثيل وتقدير الوضعية وتصنيف الصور. والآن، يرتقي YOLO11 بالأمور إلى ما هو أبعد من ذلك مع أداء أفضل عبر مهام متعددة. مع معلمات أقل بنسبة 22% أقل من YOLOv8m يحقق YOLO11m متوسط دقة أعلى (mAP) على مجموعة بيانات COCO. بعبارات بسيطة، يمكن لـ YOLO11 التعرف على الكائنات بدقة أكبر مع استخدام موارد أقل، مما يجعله أسرع وأكثر موثوقية.

سواء كنت خبيراً في مجال الذكاء الاصطناعي أو بدأت للتو في العمل، فإن YOLO11 يقدم لك حلاً قوياً وسهل الاستخدام لتطبيقات الرؤية الحاسوبية.

تدريب نموذج مخصص للكشف عن الكائنات

يتضمن تدريب نماذج الذكاء الاصطناعي البصري مساعدة أجهزة الكمبيوتر على التعرف على الصور ومقاطع الفيديو وفهمها. ومع ذلك، يمكن أن يكون التدريب عملية تستغرق وقتاً طويلاً. فبدلاً من البدء من الصفر، يُسرّع التعلُّم المنقول الأمور باستخدام نماذج مُدرّبة مسبقاً تتعرف بالفعل على الأنماط الشائعة.

على سبيل المثال، تم تدريب YOLO11 بالفعل على مجموعة بيانات COCO، والتي تحتوي على مجموعة متنوعة من الأشياء اليومية. يمكن تدريب هذا النموذج المُدرَّب مسبقًا تدريبًا مخصصًا إضافيًا لاكتشاف كائنات محددة قد لا تكون مدرجة في مجموعة البيانات الأصلية. 

لتدريب YOLO11 بشكل مخصص، تحتاج إلى مجموعة بيانات مصنفة تحتوي على صور للأشياء التي تريد اكتشافها. على سبيل المثال، إذا كنت ترغب في إنشاء نموذج لتحديد أنواع مختلفة من الفاكهة في متجر بقالة، يمكنك إنشاء مجموعة بيانات تحتوي على صورٍ مُصنَّفة للتفاح والموز والبرتقال وغيرها. بمجرد إعداد مجموعة البيانات، يمكن تدريب YOLO11 وتعديل المعلمات مثل حجم الدُفعات ومعدل التعلّم والحقبة الزمنية لتحسين الأداء.

من خلال هذا النهج، يمكن للشركات تدريب YOLO11 على اكتشاف أي شيء، بدءاً من الأجزاء المعيبة في التصنيع إلى أنواع الحياة البرية في مشاريع الحفاظ على البيئة، وتكييف النموذج مع احتياجاتها الدقيقة.

تطبيقات الكشف عن الأجسام

بعد ذلك، دعنا نلقي نظرة على بعض حالات الاستخدام الواقعية لاكتشاف الأجسام وكيف أنها تُحدث تحولاً في مختلف الصناعات.

الكشف عن المخاطر للقيادة الذاتية

تستخدم السيارات ذاتية القيادة مهام الرؤية الحاسوبية مثل اكتشاف الأجسام للتنقل بأمان وتجنب العقبات. وتساعدها هذه التقنية على التعرف على المشاة والمركبات الأخرى والحفر ومخاطر الطريق، مما يتيح لها فهم محيطها بشكل أفضل. ويمكنها اتخاذ قرارات سريعة والتحرك بأمان خلال حركة المرور من خلال تحليل بيئتها باستمرار.

الشكل 4. مثال على استخدام الكشف عن الأجسام لاكتشاف الحفر باستخدام YOLO11.

تحليل التصوير الطبي في مجال الرعاية الصحية

تخلق تقنيات التصوير الطبي مثل الأشعة السينية والتصوير بالرنين المغناطيسي والتصوير المقطعي المحوسب والتصوير بالموجات فوق الصوتية صوراً مفصلة للغاية لجسم الإنسان للمساعدة في تشخيص الأمراض وعلاجها. تُنتج هذه الفحوصات كميات كبيرة من البيانات التي يجب على الأطباء، مثل أخصائيي الأشعة وأخصائيي علم الأمراض، تحليلها بعناية للكشف عن الأمراض. ومع ذلك، فإن مراجعة كل صورة بالتفصيل قد تستغرق وقتاً طويلاً، وقد يفوت الخبراء البشريون أحياناً بعض التفاصيل بسبب الإرهاق أو ضيق الوقت.

يمكن أن تساعد نماذج اكتشاف الأجسام مثل YOLO11 من خلال تحديد السمات الرئيسية في الفحوصات الطبية تلقائياً، مثل الأعضاء أو الأورام أو التشوهات بدقة عالية. يمكن للنماذج المدرّبة حسب الطلب تسليط الضوء على المناطق المثيرة للقلق من خلال المربعات المحددة، مما يساعد الأطباء على التركيز على المشاكل المحتملة بشكل أسرع. يؤدي ذلك إلى تقليل عبء العمل وتحسين الكفاءة وتوفير رؤى سريعة.

الشكل 5. تحليل الصور الطبية باستخدام YOLO11.

زيادة الأمان مع الكشف عن الأشخاص والحالات الشاذة

تتبع الأجسام هو إحدى مهام الرؤية الحاسوبية التي يدعمها YOLO11 مما يتيح المراقبة في الوقت الفعلي وتحسينات الأمان. وهي تعتمد على اكتشاف الأجسام من خلال تحديد الأجسام وتتبع حركتها باستمرار عبر الإطارات. تُستخدم هذه التقنية على نطاق واسع في أنظمة المراقبة لتحسين السلامة في بيئات مختلفة.

على سبيل المثال، في المدارس ومراكز الرعاية النهارية، يمكن أن يساعد تتبع الأجسام في مراقبة الأطفال ومنعهم من التجول. في التطبيقات الأمنية، يلعب دورًا رئيسيًا في الكشف عن الدخلاء في المناطق المحظورة، ومراقبة الحشود بحثًا عن الازدحام أو السلوك المشبوه، وإرسال تنبيهات في الوقت الفعلي عند اكتشاف نشاط غير مصرح به. من خلال تتبع الأجسام أثناء تحركها، تعمل أنظمة التتبع YOLO11 على تعزيز الأمن وأتمتة المراقبة والسماح باستجابات أسرع للتهديدات المحتملة.

إيجابيات وسلبيات اكتشاف الأجسام

فيما يلي بعض الفوائد الرئيسية التي يمكن أن يحققها اكتشاف الكائنات لمختلف الصناعات:

  • الأتمتة: يمكن أن يساعد اكتشاف الأشياء في تقليل الحاجة إلى الإشراف البشري في مهام مثل مراقبة لقطات كاميرات المراقبة.
  • يعمل مع نماذج الذكاء الاصطناعي الأخرى: يمكن دمجه مع أنظمة التعرف على الوجه والتعرف على الحركة والتتبع لتحسين الدقة والوظائف.
  • المعالجة في الوقت الحقيقي: تتسم العديد من نماذج اكتشاف الأجسام، مثل YOLO11 بالسرعة والكفاءة، مما يجعلها مثالية للتطبيقات في الوقت الحقيقي التي تتطلب نتائج فورية. 

في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير اكتشاف الكائنات على حالات الاستخدام المختلفة، من المهم أيضًا النظر في التحديات التي ينطوي عليها تنفيذها. فيما يلي بعض التحديات الرئيسية:

  • خصوصية البيانات: قد يؤدي استخدام البيانات المرئية، خاصة في المجالات الحساسة مثل المراقبة أو الرعاية الصحية، إلى إثارة قضايا الخصوصية والمخاوف الأمنية.
  • الانسداد: يحدث الانسداد في اكتشاف الأجسام عندما تكون الأجسام محجوبة أو مخفية جزئيًا عن الأنظار، مما يجعل من الصعب على النموذج اكتشافها وتصنيفها بدقة.
  • مكلف حسابياً: غالباً ما تتطلب النماذج عالية الأداء وحدات معالجة رسومات قوية (وحدات معالجة الرسومات) للمعالجة، مما يجعل النشر في الوقت الحقيقي مكلفاً.

الوجبات الرئيسية

اكتشاف الأجسام هو أداة لتغيير قواعد اللعبة في مجال الرؤية الحاسوبية تساعد الآلات على اكتشاف الأجسام في الصور ومقاطع الفيديو وتحديد مواقعها. يتم استخدامه في قطاعات من السيارات ذاتية القيادة إلى الرعاية الصحية، مما يجعل المهام أسهل وأكثر أمانًا وفعالية. مع النماذج الأحدث مثل YOLO11 يمكن للشركات بسهولة إنشاء نماذج مخصصة للكشف عن الكائنات لإنشاء تطبيقات رؤية حاسوبية متخصصة. 

على الرغم من وجود بعض التحديات، مثل المخاوف المتعلقة بالخصوصية وإخفاء الأجسام عن الأنظار، إلا أن اكتشاف الأجسام تقنية موثوقة. كما أن قدرتها على أتمتة المهام ومعالجة البيانات المرئية في الوقت الفعلي والتكامل مع أدوات الذكاء الاصطناعي المرئي الأخرى تجعلها جزءاً أساسياً من الابتكارات المتطورة.

لمعرفة المزيد، قم بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. استكشف الابتكارات في قطاعات مثل الذكاء الاصطناعي في السيارات ذاتية القيادة والرؤية الحاسوبية في الزراعة على صفحات الحلول الخاصة بنا. تحقق من خيارات ترخيص yolo الخاصة بنا واجعل مشاريعك في مجال الذكاء الاصطناعي في الرؤية تنبض بالحياة. 🚀

شعار الفيسبوكشعار تويترشعار LinkedInرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي