تعرف على كيفية عمل أوزان النماذج كمعرفة للذكاء الاصطناعي. اكتشف كيف يستخدم Ultralytics أوزانًا محسّنة لتدريب واستدلال أسرع وأكثر دقة.
أوزان النموذج هي المعلمات القابلة للتعلم داخل نموذج التعلم الآلي التي تحول البيانات المدخلة إلى مخرجات متوقعة . في الشبكة العصبية، تمثل هذه الأوزان قوة الروابط بين الخلايا العصبية عبر الطبقات المختلفة . عند تهيئة النموذج، عادةً ما يتم تعيين هذه الأوزان على قيم عشوائية صغيرة، مما يعني أن النموذج "لا يعرف" شيئًا. من خلال عملية تسمى التدريب، يقوم النموذج بتعديل هذه الأوزان بشكل متكرر بناءً على الأخطاء التي يرتكبها، ويتعلم تدريجياً التعرف على الأنماط والميزات والعلاقات داخل البيانات. يمكنك التفكير في أوزان النموذج على أنها "ذاكرة" أو "معرفة" الذكاء الاصطناعي؛ فهي تخزن ما تعلمه النظام من بيانات التدريب.
الهدف الأساسي من تدريب الشبكة العصبية هو إيجاد المجموعة المثلى من أوزان النموذج التي تقلل الخطأ بين تنبؤات النموذج والحقيقة الفعلية. تتضمن هذه العملية تمرير البيانات عبر الشبكة — وهي خطوة تُعرف باسم التمرير الأمامي — ثم حساب قيمة الخسارة باستخدام دالة خسارة محددة. إذا كان التنبؤ غير صحيح، فإن خوارزمية تحسين مثل Stochastic Gradient Descent (SGD) أو مُحسِّن Muon الأحدث المستخدم في YOLO26 تحسب مدى مساهمة كل وزن في الخطأ.
من خلال تقنية تسمى التراجع الخلفي، يقوم الخوارزمية بتحديث الأوزان قليلاً لتقليل الخطأ في المرة التالية. يتكرر هذا الدورة آلاف أو ملايين المرات حتى تستقر أوزان النموذج ويحقق النظام دقة عالية. بمجرد اكتمال التدريب، يتم "تجميد" الأوزان وحفظها، مما يسمح بنشر النموذج للاستدلال على بيانات جديدة غير مرئية.
من المهم التمييز بين weights and biases يعملان معًا ولكنهما يخدمان أغراضًا مختلفة. في حين أن أوزان النموذج تحدد قوة واتجاه الاتصال بين الخلايا العصبية (التحكم في منحدر التنشيط)، فإن التحيزات تسمح بتحول وظيفة التنشيط إلى اليسار أو اليمين. يضمن هذا الإزاحة أن النموذج يمكن أن يتناسب مع البيانات بشكل أفضل، حتى عندما تكون جميع ميزات الإدخال صفرية. تشكل الأوزان والتحيزات معًا المعلمات القابلة للتعلم التي تحدد سلوك البنى مثل الشبكات العصبية التلافيفية (CNNs).
أوزان النماذج هي المكون الأساسي الذي يمكّن أنظمة الذكاء الاصطناعي من العمل في مختلف الصناعات. فيما يلي مثالان ملموسان على كيفية تطبيقها:
في الممارسة العملية، يتضمن العمل مع أوزان النموذج حفظ المعلمات المدربة في ملف وتحميلها لاحقًا من أجل
التنبؤ أو الضبط الدقيق. في نظام Ultralytics
، يتم تخزين هذه البيانات عادةً على النحو التالي .pt (PyTorch) الملفات.
فيما يلي مثال بسيط لكيفية تحميل الأوزان المدربة مسبقًا في YOLO وتشغيل التنبؤ:
from ultralytics import YOLO
# Load a model with pre-trained weights (e.g., YOLO26n)
model = YOLO("yolo26n.pt")
# Run inference on an image using the loaded weights
results = model("https://ultralytics.com/images/bus.jpg")
# Print the number of detected objects
print(f"Detected {len(results[0].boxes)} objects.")
أحد أقوى جوانب أوزان النماذج هو قابليتها للنقل. بدلاً من تدريب نموذج من الصفر — الأمر الذي يتطلب مجموعات بيانات ضخمة وقدرة حوسبة كبيرة — غالبًا ما يستخدم المطورون التعلم بالنقل. يتضمن ذلك أخذ نموذج بأوزان مدربة مسبقًا على مجموعة بيانات كبيرة مثل COCO أو ImageNet وتكييفه مع مهمة محددة.
على سبيل المثال، يمكنك أخذ الأوزان من كاشف كائنات عام وتصحيحها على مجموعة بيانات أصغر من الألواح الشمسية. نظرًا لأن الأوزان المدربة مسبقًا تفهم بالفعل الحواف والأشكال والأنسجة، فإن النموذج يتقارب بشكل أسرع بكثير و يتطلب بيانات مصنفة أقل. تعمل أدوات مثل Ultralytics على تبسيط هذه العملية، مما يسمح للفرق بإدارة مجموعات البيانات وتدريب النماذج على السحابة ونشر الأوزان المُحسّنة على الأجهزة الطرفية بسلاسة.
غالبًا ما تركز أبحاث الذكاء الاصطناعي الحديثة على تقليل حجم ملفات أوزان النماذج دون التضحية بالأداء، وهي عملية تُعرف باسم تكمية النماذج. من خلال تقليل دقة الأوزان (على سبيل المثال، من 32 بت عائم إلى 8 بت صحيح)، يمكن للمطورين تقليل استخدام الذاكرة بشكل كبير وتحسين سرعة الاستدلال. وهذا أمر بالغ الأهمية لنشر النماذج على الأجهزة ذات الموارد المحدودة مثل الهواتف المحمولة أو أجهزة Raspberry Pi. بالإضافة إلى ذلك، تقوم تقنيات مثل التقليم بإزالة الأوزان التي تساهم بقليل في الناتج، مما يؤدي إلى مزيد من تبسيط النموذج للتطبيقات في الوقت الفعلي.