مسرد المصطلحات

الالتفاف

تعلّم كيف يعمل التلافيف على تشغيل الذكاء الاصطناعي في مجال الرؤية الحاسوبية، مما يتيح مهام مثل اكتشاف الأجسام والتعرف على الصور والتصوير الطبي بدقة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

يُعد التلافيف عملية رياضية أساسية تُستخدم على نطاق واسع في الذكاء الاصطناعي، خاصةً في مجال الرؤية الحاسوبية. وهي تشكّل اللبنة الأساسية للشبكات العصبية التلافيفية (CNNs)، مما يمكّن هذه الشبكات من تعلم الأنماط الهرمية بفعالية من البيانات الشبيهة بالشبكات، مثل الصور. وتتضمن العملية تطبيق مرشح صغير، يُطلق عليه غالبًا اسم النواة، عبر إشارة أو صورة مُدخَلة لإنتاج مخرجات تُعرف باسم خريطة السمات. تبرز خرائط السمات هذه أنماطًا محددة مثل الحواف أو القوام أو الأشكال التي تكتشفها النواة.

كيف يعمل الالتفاف

تخيل انزلاق عدسة مكبرة صغيرة (النواة) على صورة أكبر (المدخلات). في كل موضع، تركز العدسة المكبرة على رقعة صغيرة من الصورة. تحسب عملية الالتفاف مجموعًا مرجحًا لقيم البكسل داخل تلك الرقعة باستخدام الأوزان التي تحددها النواة. تصبح هذه القيمة الواحدة المحسوبة بكسلًا واحدًا في خريطة سمات الإخراج. تنزلق النواة بشكل منهجي عبر صورة الإدخال بالكامل، خطوة بخطوة (يتم تحديدها بواسطة معلمة تسمى "الخطوة")، مما يؤدي إلى إنشاء خريطة ميزات كاملة. تم تصميم نوى مختلفة لاكتشاف ميزات مختلفة؛ على سبيل المثال، قد تكتشف إحدى النوى الحواف الأفقية، بينما تكتشف نواة أخرى الزوايا. باستخدام نوى متعددة في طبقة واحدة، يمكن لشبكة CNN استخراج مجموعة غنية من الميزات من المدخلات. يمكنك استكشاف التفسيرات المرئية لهذه العملية في مصادر مثل ملاحظات الدورة التدريبية CS231n في جامعة ستانفورد حول الشبكات الشبكية ذات النواة الواحدة.

المكونات الرئيسية للتدوير

  • بيانات الإدخال: عادةً ما تكون صورة متعددة القنوات (على سبيل المثال، قنوات RGB) أو خريطة ميزات الإخراج من طبقة سابقة.
  • نواة (مرشح): مصفوفة صغيرة من الأوزان التي تحدد الميزة المراد اكتشافها. يتم تعلم هذه الأوزان أثناء عملية تدريب النموذج.
  • خريطة الميزات: مخرجات عملية الالتفاف، التي تمثل الوجود والموقع المكاني للسمات المكتشفة.
  • الخطوة: عدد البكسلات التي تنقلها النواة على المدخلات في كل خطوة.
  • الحشو: إضافة وحدات بكسل (عادةً ما تكون أصفارًا) حول حدود صورة الإدخال للتحكم في الأبعاد المكانية لخريطة الميزة الناتجة.

تطبيقات التدوير

تُعد الطبقات التلافيفية ضرورية في العديد من تطبيقات الذكاء الاصطناعي الحديثة:

1. كشف الكائنات

في الكشف عن الأجسام، تستخدم شبكات CNN التلافيف لتحديد الأجسام ومواقعها داخل الصورة باستخدام المربعات المحدودة. نماذج مثل Ultralytics YOLO تعتمد بشكل كبير على الطبقات التلافيفية لاستخراج الميزات بمقاييس مختلفة، مما يتيح اكتشاف الأجسام المختلفة بكفاءة. وهذا أمر بالغ الأهمية لتطبيقات مثل المركبات ذاتية القيادة، حيث يعد اكتشاف المشاة والسيارات وإشارات المرور في الوقت الفعلي أمراً حيوياً للسلامة. تعرّف على المزيد حول حلول الذكاء الاصطناعي في السيارات.

2. تحليل الصور الطبية

يُعد التلافيف مفيداً في تحليل الصور الطبية، حيث يساعد أخصائيي الأشعة في تحليل صور الأشعة مثل الأشعة السينية والتصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي. يمكن لنماذج الذكاء الاصطناعي التي تستخدم شبكات CNNs اكتشاف الحالات الشاذة الدقيقة، مثل الأورام أو الكسور، وغالباً ما يكون ذلك أسرع وأحياناً أكثر دقة من الخبراء البشريين وحدهم. على سبيل المثال، يوضح استخدام YOLOv11 للكشف عن الأورام هذه القدرة. استكشف المزيد عن حلول الذكاء الاصطناعي في مجال الرعاية الصحية.

الالتفاف مقابل المفاهيم ذات الصلة

غالبًا ما يُستخدم الالتفاف إلى جانب عمليات ومفاهيم أخرى داخل الشبكات العصبية:

  • التجميع: بينما يستخرج الالتفاف الميزات، فإن تجميع الطبقات (مثل Max Pooling أو Average Pooling) يقلل من الأبعاد المكانية (تصغير العينة) لخرائط الميزات. يساعد ذلك في تقليل العبء الحسابي ويجعل تمثيل الميزة أكثر قوة للتغيرات المكانية الصغيرة. يلخص التجميع الميزات في منطقة ما، بينما يستخرجها الالتفاف. يمكن العثور على مزيد من التفاصيل في المصادر التي تشرح طبقات التجميع في الشبكات الشبكية ذات الشبكات المتكاملة.
  • استخراج الميزات: هذا مصطلح أوسع يشير إلى عملية تحويل البيانات الخام إلى ميزات رقمية قابلة للاستخدام في التعلم الآلي. يعد التلافيف تقنية محددة وفعالة للغاية لاستخراج السمات تلقائيًا من البيانات الشبيهة بالشبكة، خاصةً في شبكات الشبكات الشبكية.
  • الطبقات المتصلة بالكامل: على عكس الطبقات التلافيفية التي تطبق النواة محليًا وتتشارك الأوزان، فإن الطبقات المتصلة بالكامل تربط كل خلية عصبية من الطبقة السابقة بكل خلية عصبية في الطبقة الحالية. وتظهر عادةً في نهاية بنية شبكة CNN لإجراء التصنيف أو الانحدار بناءً على الميزات عالية المستوى المستخرجة من الطبقات التلافيفية والتجميعية. تعرف على المزيد حول أساسيات الشبكات العصبية (NNs).

إن فهم الالتفاف هو المفتاح لفهم كيفية تفسير العديد من نماذج الذكاء الاصطناعي الحديثة، بما في ذلك النماذج المتاحة من خلال Ultralytics HUB، للمعلومات المرئية. أطر عمل مثل PyTorch و TensorFlow تطبيقات فعالة لعمليات الالتفاف. تستخدم مكتبات مثل OpenCV أيضًا الالتفاف لمهام معالجة الصور التقليدية مثل التعتيم والتوضيح.

قراءة الكل