شيك أخضر
تم نسخ الرابط إلى الحافظة

الرؤية الحاسوبية مقابل معالجة الصور: الاختلافات الرئيسية

استكشف الفرق بين الرؤية الحاسوبية ومعالجة الصور. تعلم كيف يمكنهما العمل معاً لتحسين وتحليل البيانات المرئية مثل الصور ومقاطع الفيديو.

هل أصبحت الكاميرات أكثر ذكاءً، أم أنها أصبحت أفضل في تحسين الصور؟ يعود الأمر كله إلى كيفية معالجتها للبيانات المرئية وتنقيحها.

في قلب هذا التطور توجد تقنيتان رئيسيتان: معالجة الصور والرؤية الحاسوبية. وعلى الرغم من أنهما غالباً ما يتم ذكرهما معاً، إلا أنهما يخدمان أغراضاً مختلفة. تركز معالجة الصور على تحسين الصور، وضبط السطوع، وشحذ التفاصيل، وتقليل التشويش، دون فهم ما بداخلها بالضرورة. 

من ناحية أخرى، تأخذ الرؤية الحاسوبية الأمور إلى أبعد من ذلك من خلال تمكين الآلات من التعرف على الصور ومقاطع الفيديو وتفسيرها كما يفعل البشر. وهذا يجعل مهام مثل التعرف على الوجه، واكتشاف الأشياء، وتحليل المشهد في الوقت الفعلي أمراً ممكناً.

أصبحت كلتا التقنيتين أساسيتين في مجموعة متنوعة من الصناعات. من تحسين صور الهواتف الذكية إلى تشغيل السيارات ذاتية القيادة، فإن تأثيرهما واسع الانتشار. بحلول عام 2033، من المتوقع أن يصل حجم سوق الرؤية الحاسوبية إلى 111.43 مليار دولار، بينما من المرجح أن ينمو سوق معالجة الصور الرقمية إلى 378.71 مليار دولار بحلول عام 2034.

في هذه المقالة، سنستكشف كيفية عمل معالجة الصور والرؤية الحاسوبية وتطبيقاتهما في العالم الحقيقي، وكيفية تداخلهما. دعونا نتعمق!

نظرة عامة: الرؤية الحاسوبية مقابل معالجة الصور

تتعامل كل من الرؤية الحاسوبية ومعالجة الصور مع الصور، ولكن لكل منهما أهداف مختلفة. تساعد الرؤية الحاسوبية الآلات على فهم واتخاذ القرارات بناءً على الصور أو مقاطع الفيديو. في المقابل، تركز معالجة الصور على تحسين الصورة أو تغييرها لجعلها أكثر وضوحًا أو أكثر جاذبية بصريًا دون تفسير محتواها.

علاوة على ذلك، تستفيد حلول الرؤية الحاسوبية من نماذج مثل Ultralytics YOLO11 لتحليل محتويات الصورة وفهمها. تشمل مهام الرؤية الحاسوبية الشائعة اكتشاف الأجسام، وتصنيف الصور، وتجزئة النماذج، وتتبع الأجسام. تُستخدَم الرؤية الحاسوبية على نطاق واسع في تطبيقات مثل السيارات ذاتية القيادة، حيث تساعد في التعرف على المشاة وإشارات المرور والمركبات الأخرى في الوقت الفعلي لضمان القيادة الآمنة.

من ناحية أخرى، تركز معالجة الصور على تعديل الصور باستخدام الدوال الرياضية التي تضبط قيم البكسل دون فهم الصورة ككل. تعمل تقنيات مثل تقليل الضوضاء وزيادة الوضوح وتحسين التباين من خلال تغيير ألوان وشدة وحدات البكسل الفردية لتحسين جودة الصورة، ولكنها لا تتعرف على الأشياء أو الأشكال أو المعنى داخل الصورة. يتم التعامل مع هذا المستوى من الفهم عن طريق الرؤية الحاسوبية.

الشكل 1. مقارنة بين الرؤية الحاسوبية ومعالجة الصور. الصورة للمؤلف.

يمكنك التفكير في معالجة الصور على أنها مجموعة الأدوات التي تعمل على تحسين الصورة، مما يجعلها أكثر وضوحًا أو أكثر جاذبية بصريًا. بمجرد معالجة الصورة، يمكن للرؤية الحاسوبية أن تكون بمثابة الدماغ الذي يحلل الصور لأداء مهام مختلفة.

كيف تعمل معالجة الصور

معالجة الصور هو مفهوم تأسيسي وضع الأساس لتطوير الرؤية الحاسوبية. وهي تتضمن استخدام الخوارزميات لتحسين أو تحليل أو تعديل البيانات المرئية مثل الصور ومقاطع الفيديو. ويمكنها معالجة الصور الرقمية وتحسينها من خلال ضبط المعلمات مثل السطوع أو التباين أو توازن الألوان أو تصفية الضوضاء. تقوم هذه الطرق بإعداد الصور لمزيد من التحليل المتقدم بواسطة نماذج الرؤية الحاسوبية.

تعمل معالجة الصور عن طريق تقسيم الصور إلى وحدات بكسل فردية ثم معالجة كل منها للحصول على التأثيرات المطلوبة. على سبيل المثال، للكشف عن الحواف، تقوم الخوارزميات بفحص وحدات البكسل بحثاً عن التغيرات المفاجئة في قيم البكسل. وهذا يسهل على أنظمة الذكاء الاصطناعي التعرف على الأشياء أو الأنماط بدقة. بدءاً من تحسين صور الهواتف الذكية إلى تحسين لقطات كاميرات المراقبة ومسح المستندات ضوئياً لتحسين إمكانية قراءتها، تُستخدم معالجة الصور بشكل شائع في التطبيقات اليومية حيث يكون تحسين الجودة البصرية أمراً مهماً.

الشكل 2. مثال على استخدام معالجة الصور لاكتشاف الحواف.

استكشاف تقنيات معالجة الصور

فيما يلي بعض الأمثلة على تقنيات معالجة الصور الرئيسية:

  • مطابقة القالب: يقارن أجزاء من الصورة مع قالب محدد مسبقاً لتحديد موقع أنماط أو كائنات معينة.
  • التعتيم (التنعيم): يقلل من ضوضاء الصورة وتفاصيلها عن طريق حساب متوسط قيم البكسل، ويُستخدم عادةً في المعالجة المسبقة لمزيد من التحليل.
  • العمليات الشكلية: تقوم بتعديل شكل الأجسام في الصورة باستخدام تقنيات مثل التوسيع (تكبير الأجسام)، والتآكل (تصغير الأجسام)، والفتح (إزالة الضوضاء الصغيرة)، والإغلاق (ملء الفجوات الصغيرة).
  • تحديد العتبة: يفصل الكائنات عن الخلفية بناءً على كثافة البكسل، مما يسهّل عملية التجزئة واستخراج السمات.

غالبًا ما يستخدم المطورون أدوات متخصصة مثل OpenCV و Pillow و Scikit-image و TensorFlow و PyTorch لتطبيق تقنيات معالجة الصور على الصور بسهولة. توفر هذه المكتبات وظائف مبنية مسبقًا وخوارزميات مُحسَّنة، مما يلغي الحاجة إلى كتابة تعليمات برمجية معقدة من البداية. 

كما أنها تدعم لغات برمجة متعددة، وتتكامل بشكل جيد مع الأدوات الأخرى، وتوفر توثيقًا مستفيضًا، مما يجعل معالجة الصور أسرع وأكثر كفاءة ويمكن الوصول إليها حتى لمن ليس لديهم خبرة عميقة في هذا المجال.

كيف تعمل الرؤية الحاسوبية

تأتي بعض من أكثر نماذج الرؤية الحاسوبية تقدماً اليوم من سلسلة YOLO (أنت تنظر مرة واحدة فقط). وعلى مر السنين، تم إصدار إصدارات جديدة على مر السنين، كل منها يحسّن الدقة والكفاءة. يقدم أحدث إصدار، وهو Ultralytics YOLO11 دقة وأداءً أفضل.

يمكن تدريب نماذج مثل YOLO11 على التعرف على كائنات معينة وهي قادرة على التعامل مع مهام رؤية حاسوبية متعددة، بما في ذلك اكتشاف الكائنات وتجزئة النماذج وتتبع الكائنات في الوقت الفعلي.

إليك لمحة سريعة عن مهام الرؤية الحاسوبية التي يدعمها YOLO11:

  • اكتشاف الأجسام: يحدد الأجسام داخل الصورة ويحدد موقعها، مثل اكتشاف المشاة للسيارات ذاتية القيادة.
  • تصنيف الصور: هذا يعين تسميات للصور بأكملها، مثل تحديد ما إذا كانت الصورة تحتوي على كلب أو قطة.
  • تجزئة المثيل: يقسم الصورة إلى أجزاء أو مناطق ذات معنى، مثل عزل الأعضاء الفردية في عمليات المسح الطبي. 
  • تقدير الوضعية: يتتبع حركة ووضعية الأجسام، مثل اكتشاف الإيماءات أو تعديلات الوضعية. عند تطبيقها على البشر، يمكنها تحليل حركات الجسم في الوقت الفعلي، مما يجعلها مفيدة لتطبيقات مثل تتبع اللياقة البدنية وإعادة التأهيل.
الشكل 3. مهام الرؤية الحاسوبية التي يدعمها YOLO11.

تطبيقات الرؤية الحاسوبية ومعالجة الصور

والآن بعد أن ناقشنا كيفية عمل الرؤية الحاسوبية ومعالجة الصور، دعونا نستعرض تطبيقاتهما في العالم الحقيقي وأين يتداخلان.

مراقبة الثروة الحيوانية باستخدام الرؤية الحاسوبية

هل تساءلت يومًا كيف تقوم المزارع الكبيرة بتتبع ماشيتها؟ إن مراقبة مئات الحيوانات يدويًا تستغرق وقتًا طويلاً، ولكن مع نماذج الرؤية الحاسوبية مثل YOLO11 يمكن مراقبة الحيوانات آليًا. 

يمكن YOLO11 اكتشاف الحيوانات وتتبعها وتحليلها في الوقت الفعلي، مما يساعد المزارعين على إدارة ماشيتهم بكفاءة. يمكن أن تساعد الرؤى المستقاة من هذا النوع من التحليل في الكشف عن العلامات المبكرة للمشكلات الصحية، مثل العرج، مما يسمح بالتدخل السريع ورعاية أفضل للحيوانات بشكل عام.

الشكل 4. مثال على مراقبة سلوك الحيوان باستخدام YOLO11.

عد الماشية مع معالجة الصور

وبالمثل، يمكن استخدام معالجة الصور لمراقبة الماشية من خلال عدّ الحيوانات في بيئات خاضعة للرقابة مثل الحظائر أو الحظائر. في الصور ذات الخلفيات المنتظمة، يمكن استخدام تقنيات معالجة الصور مثل تحديد العتبة والكشف عن الكفاف (يمكن أن تحدد حدود الكائنات) للكشف عن الحيوانات وإحصائها. تستخدم هذه الطرق تقنيات مثل إزالة الخلفية واكتشاف الحواف والتجزئة لتحديد أشكال الماشية.

الشكل 5. مثال على استخدام معالجة الصور للكشف عن الحيوانات.

قد تعتقد أن هذا يبدو تماماً مثل رؤية الكمبيوتر. فما الفرق إذن؟

الفرق الرئيسي هو أن معالجة الصور تحلل قيم وأنماط البكسل دون فهم حقيقي لما تراه. فهي تكتشف الحواف والأشكال لإحصاء الحيوانات كل على حدة، ويمكن أن تساعد بعض التقنيات في فصل الحيوانات عندما تقف قريبة من بعضها البعض في الصور.

ومع ذلك، على عكس الرؤية الحاسوبية، لا تتعرف معالجة الصور على الحيوانات الفردية أو تميزها - فهي تقوم بالعد فقط بناءً على الشكل والحجم. وهذا يجعلها مفيدة في عدّ الماشية ومراقبتها، ولكن لها قيود. إذا تداخلت الحيوانات أو تغيرت مواقعها أو إذا اختلفت ظروف الإضاءة، فقد تتأثر الدقة. كما أنه لا يمكنه تتبع الحيوانات بمرور الوقت أو تقديم نظرة ثاقبة لسلوكها، وهي مزايا حاسمة للرؤية الحاسوبية.

يمكن أن تعمل الرؤية الحاسوبية ومعالجة الصور معًا

تعد معالجة الصور والرؤية الحاسوبية مجالين مرتبطين ارتباطًا وثيقًا يمكن دمجهما معًا في كثير من الأحيان لتعزيز دقة وكفاءة تحليل البيانات المرئية. يمكن لمعالجة الصور تنقيح البيانات الأولية عن طريق تحسين الجودة وإزالة الضوضاء وإبراز السمات الرئيسية، مما يضمن قدرة نماذج الرؤية الحاسوبية على استخلاص رؤى ذات مغزى. 

على سبيل المثال، في تحليل الطب الشرعي، يمكن أن تعمل معالجة الصور والرؤية الحاسوبية معاً لتحليل بصمات الأحذية الموجودة في مسرح الجريمة. يمكن لتقنيات معالجة الصور مثل تحسين التباين واكتشاف الحواف تحسين وضوح البصمات، مما يسهل تقييمها. يعمل تحسين التباين على ضبط السطوع والحدة لجعل التفاصيل أكثر وضوحاً، بينما يعمل كشف الحواف على زيادة وضوح الخطوط العريضة للحصول على تعريف أفضل.

بعد معالجة الصور باستخدام هذه التقنيات، يمكن لنماذج الرؤية الحاسوبية استخدام تقنيات مطابقة الأنماط لمقارنة البصمات مع قواعد بيانات الطب الشرعي، مما يجعل عملية تحديد الهوية أكثر دقة. ويسهّل هذا المزيج من التقنيات على المحققين معالجة الأدلة الجنائية وتفسيرها.

الشكل 6. معالجة الصور والرؤية الحاسوبية المستخدمة للكشف عن بصمات الأحذية.

الوجبات الرئيسية

تسير الرؤية الحاسوبية ومعالجة الصور جنبًا إلى جنب، مما يساعد على تحسين البيانات المرئية وتحليلها وتفسيرها. تعمل معالجة الصور على تحسين جودة الصورة واستخراج الميزات الرئيسية، بينما تعمل الرؤية الحاسوبية على تعزيزها من خلال توفير رؤى متعمقة.

مع استمرار تطور الذكاء الاصطناعي البصري في التطور، ستعمل الرؤية الحاسوبية ومعالجة الصور على تعزيز الأتمتة والتحليل في الوقت الفعلي واتخاذ القرارات في مختلف المجالات. من تحسين التعرف على الصور إلى تحسين اكتشاف الأنماط، ستجعل هذه التقنيات أنظمة الذكاء الاصطناعي للرؤية أكثر دقة وكفاءة وقدرة على فهم البيانات المرئية في التطبيقات العملية.

هل لديك فضول حول الذكاء الاصطناعي؟ انضم إلى مجتمعنا واستكشف مستودع GitHub الخاص بنا. تعرّف على كيفية إعادة تشكيل الرؤية الحاسوبية في مجال الرعاية الصحية والذكاء الاصطناعي في التصنيع. اكتشف خيارات الترخيص لدينا لبدء مشاريع الذكاء الاصطناعي في الرؤية! 

شعار الفيسبوكشعار تويترشعار LinkedInرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي