استكشف أساسيات التحويل في الرؤية الحاسوبية والتعلم العميق. تعرف على كيفية قيام النوى وخرائط الميزات بتشغيل Ultralytics للمهام في الوقت الفعلي.
التلافيف هي عملية حسابية أساسية تشكل حجر الأساس لأنظمة الرؤية الحاسوبية (CV) و التعلم العميق (DL) الحديثة. في سياق معالجة الصور، تتضمن التلافيف تحريك مرشح صغير — يُسمى غالبًا النواة — عبر صورة الإدخال لإنشاء خريطة للسمات المهمة. تسمح هذه العملية لنماذج الذكاء الاصطناعي (AI) بالتعلم التلقائي وتحديد الأنماط مثل الحواف والأنسجة والأشكال دون تدخل بشري. على عكس التعلم الآلي التقليدي (ML) الذي غالبًا يتطلب استخراج الميزات يدويًا، تتيح التلافيف للشبكات بناء فهم هرمي للبيانات المرئية، بدءًا من الخطوط البسيطة وصولًا إلى الأشياء المعقدة مثل الوجوه أو المركبات.
تعمل العملية عن طريق تمرير مرشح على البيانات المدخلة، وإجراء عملية الضرب لكل عنصر على حدة، وجمع النتائج لإنتاج قيمة واحدة لكل موضع. يُعرف هذا الناتج باسم خريطة الميزات.
لفهم التحويل بشكل كامل، من المفيد تمييزه عن المصطلحات المماثلة التي غالبًا ما ترد في أدبيات الشبكات العصبية (NN):
مكنت كفاءة التحويل من إحداث ثورة في مختلف الصناعات من خلال تعزيز أنظمة الإدراك القوية :
يمكنك فحص الطبقات التلافيفية داخل النماذج الحديثة باستخدام Python. يقوم المثال التالي بتحميل
يولو26 النموذج ويتحقق من أن طبقته الأولية تستخدم
عملية تلافيفية قياسية، والتي يتم تنفيذها عبر torch.nn.
import torch.nn as nn
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Access the first layer of the model's backbone
first_layer = model.model.model[0]
# Verify it is a Convolutional layer
if isinstance(first_layer.conv, nn.Conv2d):
print("Success: The first layer is a standard convolution.")
print(f"Kernel size: {first_layer.conv.kernel_size}")
عمليات التحويل التلافيفي قابلة للتحسين بدرجة كبيرة، مما يجعلها مثالية لنشر الذكاء الاصطناعي في الحافة حيث الموارد الحاسوبية محدودة. ونظرًا لأن النواة نفسها مشتركة عبر الصورة بأكملها (مشاركة المعلمات)، فإن النموذج يتطلب ذاكرة أقل بكثير من البنى القديمة المتصلة بالكامل. تسمح هذه الكفاءة بتشغيل النماذج المتقدمة على الهواتف الذكية وأجهزة إنترنت الأشياء.
بالنسبة للفرق التي تسعى إلى الاستفادة من هذه العمليات في مجموعات البيانات المخصصة، توفر Ultralytics بيئة سلسة لتعليق الصور وتدريب النماذج القائمة على التلافيف دون الحاجة إلى إدارة بنية تحتية معقدة. باستخدام التعلم النقلي، يمكنك ضبط الأوزان التلافيفية المدربة مسبقًا للتعرف على كائنات جديدة بأقل قدر من بيانات التدريب.