الشيك الأخضر
تم نسخ الرابط إلى الحافظة

أنواع تقنيات تعلم الذكاء الاصطناعي المستخدمة في الرؤية الحاسوبية

استكشف الأنواع المختلفة من تقنيات التعلّم الآلي والتعلّم العميق المستخدمة في تطبيقات الرؤية الحاسوبية، بدءاً من التعلّم تحت الإشراف إلى التعلّم التحوّلي.

التعلم الآلي هو نوع من أنواع الذكاء الاصطناعي (AI) يساعد أجهزة الكمبيوتر على التعلم من البيانات حتى تتمكن من اتخاذ القرارات من تلقاء نفسها، دون الحاجة إلى برمجة مفصلة لكل مهمة. وهو ينطوي على إنشاء نماذج خوارزمية يمكنها تحديد الأنماط في البيانات. ومن خلال تحديد الأنماط في البيانات والتعلم منها، يمكن لهذه الخوارزميات تحسين أدائها تدريجياً بمرور الوقت.

أحد المجالات التي يلعب فيها التعلم الآلي دوراً حاسماً هو مجال الرؤية الحاسوبية، وهو مجال الذكاء الاصطناعي الذي يركز على البيانات المرئية. تستخدم الرؤية الحاسوبية التعلم الآلي لمساعدة أجهزة الكمبيوتر على اكتشاف الأنماط في الصور ومقاطع الفيديو والتعرف عليها. ومن المتوقع أن تبلغ القيمة السوقية العالمية للرؤية الحاسوبية حوالي 175.72 مليار دولار بحلول عام 2032، مدفوعةً بالتطورات في مجال التعلم الآلي. 

في هذه المقالة، سنلقي نظرة على الأنواع المختلفة للتعلم الآلي المستخدم في الرؤية الحاسوبية، بما في ذلك التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف والتعلم المعزز والتعلم التحوّلي، وكيف يلعب كل منها دورًا في التطبيقات المختلفة. لنبدأ!

نظرة عامة على التعلم الآلي في الرؤية الحاسوبية

تعتمد الرؤية الحاسوبية على التعلّم الآلي، وخاصةً تقنيات مثل التعلّم العميق والشبكات العصبية، لتفسير المعلومات البصرية وتحليلها. تتيح هذه الأساليب لأجهزة الكمبيوتر أداء مهام الرؤية الحاسوبية مثل اكتشاف الأجسام في الصور، وتصنيف الصور حسب الفئة، والتعرف على الوجوه. يعد التعلم الآلي ضروريًا أيضًا لتطبيقات الرؤية الحاس وبية في الوقت الفعلي مثل مراقبة الجودة في التصنيع والتصوير الطبي في مجال الرعاية الصحية. في هذه الحالات، تساعد الشبكات العصبية أجهزة الكمبيوتر في تفسير البيانات المرئية المعقدة، مثل تحليل فحوصات الدماغ للكشف عن الأورام

في الواقع، العديد من نماذج الرؤية الحاسوبية المتقدمة، مثل Ultralytics YOLO11، مبنية على الشبكات العصبية. 

الشكل 1. تقسيم فحوصات الدماغ باستخدام Ultralytics YOLO11.

هناك عدة أنواع من طرق التعلم في التعلم الآلي، مثل التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف والتعلم التحوّلي والتعلم المعزز، والتي تدفع حدود ما هو ممكن في مجال الرؤية الحاسوبية. في الأقسام التالية، سنستكشف كل نوع من هذه الأنواع لفهم كيفية مساهمتها في الرؤية الحاسوبية.

استكشاف التعلم تحت الإشراف

التعلم الخاضع للإشراف هو أكثر أنواع التعلم الآلي استخدامًا. في التعلّم الخاضع للإشراف، يتم تدريب النماذج باستخدام بيانات مصنفة. يتم تمييز كل مدخل مع المخرجات الصحيحة، مما يساعد النموذج على التعلم. وعلى غرار الطالب الذي يتعلم من المعلم، تعمل هذه البيانات الموسومة كدليل أو مشرف.

أثناء التدريب، يتم إعطاء النموذج كلاً من بيانات المدخلات (المعلومات التي يحتاج إلى معالجتها) وبيانات المخرجات (الإجابات الصحيحة). يساعد هذا الإعداد النموذج على تعلم العلاقة بين المدخلات والمخرجات. الهدف الرئيسي من التعلّم تحت الإشراف هو أن يكتشف النموذج قاعدة أو نمطًا يربط بدقة بين كل مدخلات ومخرجاته الصحيحة. ومن خلال هذا الربط، يمكن للنموذج إجراء تنبؤات دقيقة عندما يواجه بيانات جديدة. على سبيل المثال، يعتمد التعرف على الوجه في رؤية الكمبيوتر على التعلم الخاضع للإشراف لتحديد الوجوه بناءً على هذه الأنماط المكتسبة.

من الاستخدامات الشائعة لهذا الأمر هو فتح قفل هاتفك الذ كي باستخدام التعرف على الوجه. يتم تدريب النموذج على صور مُصنَّفة لوجهك بحيث عندما تذهب لفتح قفل هاتفك، يقارن النموذج الصورة الحية بما تعلمه. إذا اكتشف تطابقاً، يتم فتح قفل هاتفك.

الشكل 2. يمكن استخدام ميزة التعرّف على الوجه لإلغاء قفل هاتفك الذكي.

كيف يعمل التعلّم غير الخاضع للإشراف في الذكاء الاصطناعي؟

التعلُّم غير الخاضع للإشراف هو نوع من أنواع التعلُّم الآلي الذي يستخدم بيانات غير مُسمَّاة - لا يتم إعطاء النموذج أي إرشادات أو إجابات صحيحة أثناء التدريب. بدلاً من ذلك، يتعلم النموذج اكتشاف الأنماط والرؤى من تلقاء نفسه. 

يحدد التعلم غير الخاضع للإشراف الأنماط باستخدام ثلاث طرق رئيسية: 

  • التجميع: تجميع نقاط البيانات المتشابهة معًا. وهو مفيد لمهام مثل تجزئة العملاء، حيث يمكن تجميع العملاء المتشابهين بناءً على سلوكياتهم أو سماتهم.
  • الارتباط: يُستخدم لتحديد العلاقات بين العناصر، مما يساعد في الكشف عن الروابط داخل البيانات (على سبيل المثال، العثور على المنتجات التي يتم شراؤها معًا في تحليل سلة السوق).
  • تقليل البُعدية: تبسيط مجموعات البيانات عن طريق إزالة الميزات الزائدة عن الحاجة، مما يساعد في التصور والمعالجة. 

أحد التطبيقات الرئيسية للتعلم غير الخاضع للإشراف هو ضغط الصور، حيث تعمل تقنيات مثل التجميع k-means على تقليل حجم الصورة دون التأثير على الجودة البصرية. يتم تجميع وحدات البكسل في مجموعات، ويتم تمثيل كل مجموعة بلون متوسط، مما ينتج عنه صورة بألوان أقل وحجم ملف أصغر.

الشكل 3. مثال على ضغط الصور غير الخاضع للإشراف.

ومع ذلك، يواجه التعلم غير الخاضع للإشراف بعض القيود. فبدون إجابات محددة مسبقًا، يمكن أن يواجه صعوبات في الدقة وتقييم الأداء. وغالبًا ما يتطلب جهدًا يدويًا لتفسير النتائج وتسمية المجموعات، كما أنه حساس لمشاكل مثل القيم المفقودة والضوضاء، والتي يمكن أن تؤثر على جودة النتائج.

شرح التعلم المعزز

على عكس التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف، لا يعتمد التعلم المعزز على بيانات التدريب. وبدلاً من ذلك، فإنه يستخدم عوامل الشبكة العصبية للتفاعل مع البيئة لتحقيق هدف محدد. 

تتضمن العملية ثلاثة مكونات رئيسية:

  • الوكيل: المتعلم أو صانع القرار.
  • البيئة: كل ما يتفاعل معه الوكيل، والذي يمكن أن يكون حقيقياً أو افتراضياً.
  • إشارة المكافأة: قيمة عددية تعطى بعد كل إجراء، توجه الوكيل نحو الهدف.

عندما يتخذ الوكيل إجراءات، فإنه يؤثر على البيئة، والتي تستجيب بعد ذلك بالتغذية الراجعة. تساعد التغذية الراجعة الوكيل على تقييم خياراته وتعديل سلوكه. تساعد إشارة المكافأة الوكيل على فهم الإجراءات التي تقربه من تحقيق هدفه.

يُعد التعلُّم المعزز أمرًا أساسيًا لحالات الاستخدام مثل القيادة الذاتية والروبوتات. في القيادة الذاتية، تتعلم مهام مثل التحكم في السيارة واكتشاف الأجسام وتجنبها بناءً على التغذية الراجعة. يتم تدريب النماذج باستخدام عوامل الشبكة العصبية لاكتشاف المشاة أو الأجسام الأخرى واتخاذ الإجراءات المناسبة لتجنب الاصطدام. وبالمثل، في مجال الروبوتات، يتيح التعلم المعزز مهام مثل التلاعب بالأشياء والتحكم في الحركة.

من الأمثلة الرائعة على التعلّم المعزز في العمل مشروع OpenAI، حيث قام الباحثون بتدريب وكلاء الذكاء الاصطناعي على لعب لعبة الفيديو الشهيرة متعددة اللاعبين Dota 2. باستخدام الشبكات العصبية، عالجت هذه الوكلاء كميات هائلة من المعلومات من بيئة اللعبة لاتخاذ قرارات استراتيجية سريعة. ومن خلال التغذية الراجعة المستمرة، تعلّم الوكلاء وتحسّنوا بمرور الوقت، ووصلوا في النهاية إلى مستوى مهارة عالٍ بما يكفي للتغلب على بعض أفضل اللاعبين في اللعبة

الشكل 4. التفسير البشري مقابل الذكاء الاصطناعي لمصفوفة دوتا.

فهم أساسيات التعلّم التحويلي

يختلف التعلم التحويلي عن أنواع التعلم الأخرى. فبدلاً من تدريب نموذج من الصفر، يستخدم نموذجًا مدربًا مسبقًا على مجموعة بيانات كبيرة ويضبطه لمهمة جديدة ولكن ذات صلة. يتم استخدام المعرفة المكتسبة أثناء التدريب الأولي لتحسين أداء المهمة الجديدة. يقلل التعلم التحويلي من الوقت اللازم للتدريب على مهمة جديدة، اعتمادًا على مدى تعقيدها. وهو يعمل من خلال الاحتفاظ بالطبقات الأولية للنموذج التي تلتقط السمات العامة واستبدال الطبقات النهائية بالطبقات النهائية للمهمة الجديدة المحددة. 

يعد نقل الأسلوب الفني تطبيقًا مثيرًا للاهتمام لتعلم النقل في الرؤية الحاسوبية. تمكّن هذه التقنية النموذج من تحويل صورة ما لتتناسب مع أسلوب عمل فني مختلف. ولتحقيق ذلك، يتم أولاً تدريب شبكة عصبية على مجموعة بيانات كبيرة من الصور المقترنة بأساليبها الفنية. من خلال هذه العملية، يتعلم النموذج تحديد السمات العامة للصور وأنماط الأنماط الفنية.

بمجرد أن يتم تدريب النموذج، يمكن ضبطه لتطبيق نمط لوحة معينة على صورة جديدة. تتكيف الشبكة مع الصورة الجديدة مع الحفاظ على ميزات النمط المكتسبة، مما يتيح لها إنشاء نتيجة فريدة تجمع بين المحتوى الأصلي والأسلوب الفني المحدد. على سبيل المثال، يمكنك التقاط صورة لسلسلة جبال وتطبيق أسلوب لوحة "الصرخة" لإدفارد مونش ( The Scream)، مما ينتج عنه صورة تجسد المشهد ولكن بأسلوب اللوحة الجريء والمعبّر.

الشكل 5. مثال على نقل النمط الفني باستخدام التعلّم التحويلي.

نظرة على الاختلافات بين أنواع التعلم الآلي

والآن بعد أن قمنا بتغطية الأنواع الرئيسية للتعلم الآلي، دعنا نلقي نظرة فاحصة على كل منها لمساعدتك على فهم أفضلها للتطبيقات المختلفة.

  • التعلّم الخاضع للإشراف: هذا النوع دقيق للغاية عند العمل مع البيانات المصنفة ولكنه يتطلب الكثير من البيانات ويمكن أن يكون حساسًا للضوضاء.
  • التعلّم غير الخاضع للإشراف: وهو مفيد لاستكشاف البيانات غير المعنونة للعثور على أنماط مخفية، على الرغم من أن النتائج قد تكون أقل دقة وأصعب في التفسير.
  • التعلم المعزز: يقوم بتدريب الوكلاء على اتخاذ قرارات تدريجية في بيئات معقدة، ولكنه غالباً ما يتطلب قوة حاسوبية كبيرة.
  • نقل التعلّم: يستخدم هذا النهج نماذج مدربة مسبقًا لتسريع التدريب وتحسين الأداء في المهام الجديدة، خاصةً عندما تكون البيانات محدودة.
الشكل 6. مقارنة بين جميع أنواع التعلم الآلي. الصورة من قبل المؤلف.

يعتمد اختيار نوع التعلم الآلي المناسب على عدة عوامل. يعمل التعلّم الخاضع للإشراف بشكل جيد إذا كان لديك بيانات موسومة وفيرة ومهمة واضحة. يكون التعلّم غير الخاضع للإشراف مفيدًا لاستكشاف البيانات أو عندما تكون الأمثلة المصنفة نادرة. يُعد التعلّم المعزز مثاليًا للمهام المعقدة التي تتطلب اتخاذ القرارات خطوة بخطوة، بينما يكون التعلّم التحوّلي رائعًا عندما تكون البيانات محدودة أو عندما تكون الموارد محدودة. من خلال النظر في هذه العوامل، يمكنك اختيار النهج الأنسب لمشروع الرؤية الحاسوبية الخاص بك.

في المخص:

يمكن لتقنيات التعلم الآلي معالجة مجموعة متنوعة من التحديات، خاصةً في مجالات مثل الرؤية الحاسوبية. من خلال فهم الأنواع المختلفة، التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف والتعلم المعزز والتعلم التحوّلي، يمكنك اختيار أفضل نهج لاحتياجاتك.

 يُعد التعلّم الخاضع للإشراف رائعًا للمهام التي تتطلب دقة عالية وبيانات معنونة، بينما يُعد التعلّم غير الخاضع للإشراف مثاليًا لإيجاد الأنماط في البيانات غير المعنّنة. يعمل التعلّم المعزز بشكل جيد في الإعدادات المعقدة القائمة على اتخاذ القرارات، ويكون التعلّم التحويلي مفيدًا عندما تريد البناء على نماذج مدربة مسبقًا ببيانات محدودة. 

لكل طريقة نقاط قوة وتطبيقات فريدة من نوعها، من التعرف على الوجه إلى الروبوتات إلى نقل الأسلوب الفني. يمكن أن يؤدي اختيار النوع المناسب إلى فتح إمكانيات جديدة في صناعات مثل الرعاية الصحية والسيارات والترفيه.

لاستكشاف المزيد، قم بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. استكشف تطبيقات الذكاء الاصطناعي في السيارات ذاتية القيادة والزراعة على صفحات الحلول الخاصة بنا. 🚀

شعار الفيسبوكشعار تويترشعار لينكد إنرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي