Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

الالتفاف

استكشف أساسيات التحويل في الرؤية الحاسوبية والتعلم العميق. تعرف على كيفية قيام النوى وخرائط الميزات بتشغيل Ultralytics للمهام في الوقت الفعلي.

التلافيف هي عملية حسابية أساسية تشكل حجر الأساس لأنظمة الرؤية الحاسوبية (CV) و التعلم العميق (DL) الحديثة. في سياق معالجة الصور، تتضمن التلافيف تحريك مرشح صغير — يُسمى غالبًا النواة — عبر صورة الإدخال لإنشاء خريطة للسمات المهمة. تسمح هذه العملية لنماذج الذكاء الاصطناعي (AI) بالتعلم التلقائي وتحديد الأنماط مثل الحواف والأنسجة والأشكال دون تدخل بشري. على عكس التعلم الآلي التقليدي (ML) الذي غالبًا يتطلب استخراج الميزات يدويًا، تتيح التلافيف للشبكات بناء فهم هرمي للبيانات المرئية، بدءًا من الخطوط البسيطة وصولًا إلى الأشياء المعقدة مثل الوجوه أو المركبات.

كيف يعمل الالتفاف

تعمل العملية عن طريق تمرير مرشح على البيانات المدخلة، وإجراء عملية الضرب لكل عنصر على حدة، وجمع النتائج لإنتاج قيمة واحدة لكل موضع. يُعرف هذا الناتج باسم خريطة الميزات.

  • النواة: هي مصفوفة صغيرة من الأرقام (الأوزان) التي تكتشف ميزات محددة. على سبيل المثال، عامل سوبيل هو نوع محدد من النواة يستخدم detect الحواف detect أو الأفقية.
  • النافذة المنزلقة: يتحرك النواة عبر الصورة باستخدام حجم خطوة محدد يسمى "الخطوة". تحافظ عملية التصفية المكانية هذه على العلاقة بين وحدات البكسل، وهو أمر بالغ الأهمية لفهم الصور.
  • تسلسل الطبقات: في البنى العميقة مثل الشبكات العصبية التلافيفية (CNNs)، تلتقط الطبقات الأولية التفاصيل منخفضة المستوى، بينما تجمع الطبقات الأعمق هذه التفاصيل في مفاهيم عالية المستوى.

التلافيف مقابل المفاهيم ذات الصلة

لفهم التحويل بشكل كامل، من المفيد تمييزه عن المصطلحات المماثلة التي غالبًا ما ترد في أدبيات الشبكات العصبية (NN):

  • الترابط المتبادل مقابل التلافيف: من الناحية الحسابية، تتضمن التلافيف الحقيقية قلب النواة قبل تطبيقها. ومع ذلك، فإن معظم أطر العمل الخاصة بالتعلم العميق، بما في ذلك PyTorch تطبق الترابط المتبادل (الانزلاق دون قلب) ولكنها تسميها "تلافيف" لأن الأوزان يتم تعلمها أثناء التدريب، مما يجعل التمييز بين القلب والتلافيف غير ذي صلة بالأداء.
  • التلافيف مقابل الانتباه: بينما تعالج التلافيف المعلومات محليًا (البيكسلات المجاورة)، تسمح آلية الانتباه للنموذج بربط الأجزاء البعيدة من الصورة في وقت واحد. غالبًا ما تستخدم البنى الحديثة مثل YOLO26 طبقات تلافيفية عالية التحسين للحفاظ على سرعات الاستدلال في الوقت الفعلي ، حيث يمكن أن تكون طبقات الانتباه أكثر ثقلًا من الناحية الحسابية.

تطبيقات واقعية

مكنت كفاءة التحويل من إحداث ثورة في مختلف الصناعات من خلال تعزيز أنظمة الإدراك القوية :

  1. التشخيص الطبي: في مجال الذكاء الاصطناعي في الرعاية الصحية، تساعد التلافيف في تحليل الأشعة المغناطيسية عالية الدقة. باستخدام نوى محددة مصممة لإبراز الحالات الشاذة، يمكن للنماذج detect العلامات detect للأورام أو الكسور بدقة تضاهي خبراء البشر.
  2. الملاحة الذاتية: تعتمد المركبات ذاتية القيادة على التحويلات للتعرف على الأجسام في الوقت الفعلي. أثناء تحرك السيارة، تقوم طبقات التحويلات بمعالجة مقاطع الفيديو للتعرف على المشاة وعلامات حارات السير وإشارات المرور على الفور، وهو عنصر أساسي في الذكاء الاصطناعي في مجال سلامة السيارات.

Python مع Ultralytics

يمكنك فحص الطبقات التلافيفية داخل النماذج الحديثة باستخدام Python. يقوم المثال التالي بتحميل يولو26 النموذج ويتحقق من أن طبقته الأولية تستخدم عملية تلافيفية قياسية، والتي يتم تنفيذها عبر torch.nn.

import torch.nn as nn
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Access the first layer of the model's backbone
first_layer = model.model.model[0]

# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
    print("Success: The first layer is a standard convolution.")
    print(f"Kernel size: {first_layer.conv.kernel_size}")

لماذا تعتبر التحويلات مهمة بالنسبة للذكاء الاصطناعي الطرفي

عمليات التحويل التلافيفي قابلة للتحسين بدرجة كبيرة، مما يجعلها مثالية لنشر الذكاء الاصطناعي في الحافة حيث الموارد الحاسوبية محدودة. ونظرًا لأن النواة نفسها مشتركة عبر الصورة بأكملها (مشاركة المعلمات)، فإن النموذج يتطلب ذاكرة أقل بكثير من البنى القديمة المتصلة بالكامل. تسمح هذه الكفاءة بتشغيل النماذج المتقدمة على الهواتف الذكية وأجهزة إنترنت الأشياء.

بالنسبة للفرق التي تسعى إلى الاستفادة من هذه العمليات في مجموعات البيانات المخصصة، توفر Ultralytics بيئة سلسة لتعليق الصور وتدريب النماذج القائمة على التلافيف دون الحاجة إلى إدارة بنية تحتية معقدة. باستخدام التعلم النقلي، يمكنك ضبط الأوزان التلافيفية المدربة مسبقًا للتعرف على كائنات جديدة بأقل قدر من بيانات التدريب.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن