تعلّم كيف يعمل التلافيف على تشغيل الذكاء الاصطناعي في مجال الرؤية الحاسوبية، مما يتيح مهام مثل اكتشاف الأجسام والتعرف على الصور والتصوير الطبي بدقة.
يُعد التلافيف عملية رياضية أساسية تُستخدم على نطاق واسع في الذكاء الاصطناعي، خاصةً في مجال الرؤية الحاسوبية. وهي تشكّل اللبنة الأساسية للشبكات العصبية التلافيفية (CNNs)، مما يمكّن هذه الشبكات من تعلم الأنماط الهرمية بفعالية من البيانات الشبيهة بالشبكات، مثل الصور. وتتضمن العملية تطبيق مرشح صغير، يُطلق عليه غالبًا اسم النواة، عبر إشارة أو صورة مُدخَلة لإنتاج مخرجات تُعرف باسم خريطة السمات. تبرز خرائط السمات هذه أنماطًا محددة مثل الحواف أو القوام أو الأشكال التي تكتشفها النواة.
تخيل انزلاق عدسة مكبرة صغيرة (النواة) على صورة أكبر (المدخلات). في كل موضع، تركز العدسة المكبرة على رقعة صغيرة من الصورة. تحسب عملية الالتفاف مجموعًا مرجحًا لقيم البكسل داخل تلك الرقعة باستخدام الأوزان التي تحددها النواة. تصبح هذه القيمة الواحدة المحسوبة بكسلًا واحدًا في خريطة سمات الإخراج. تنزلق النواة بشكل منهجي عبر صورة الإدخال بالكامل، خطوة بخطوة (يتم تحديدها بواسطة معلمة تسمى "الخطوة")، مما يؤدي إلى إنشاء خريطة ميزات كاملة. تم تصميم نوى مختلفة لاكتشاف ميزات مختلفة؛ على سبيل المثال، قد تكتشف إحدى النوى الحواف الأفقية، بينما تكتشف نواة أخرى الزوايا. باستخدام نوى متعددة في طبقة واحدة، يمكن لشبكة CNN استخراج مجموعة غنية من الميزات من المدخلات. يمكنك استكشاف التفسيرات المرئية لهذه العملية في مصادر مثل ملاحظات الدورة التدريبية CS231n في جامعة ستانفورد حول الشبكات الشبكية ذات النواة الواحدة.
تُعد الطبقات التلافيفية ضرورية في العديد من تطبيقات الذكاء الاصطناعي الحديثة:
في الكشف عن الأجسام، تستخدم شبكات CNN التلافيف لتحديد الأجسام ومواقعها داخل الصورة باستخدام المربعات المحدودة. نماذج مثل Ultralytics YOLO تعتمد بشكل كبير على الطبقات التلافيفية لاستخراج الميزات بمقاييس مختلفة، مما يتيح اكتشاف الأجسام المختلفة بكفاءة. وهذا أمر بالغ الأهمية لتطبيقات مثل المركبات ذاتية القيادة، حيث يعد اكتشاف المشاة والسيارات وإشارات المرور في الوقت الفعلي أمراً حيوياً للسلامة. تعرّف على المزيد حول حلول الذكاء الاصطناعي في السيارات.
يُعد التلافيف مفيداً في تحليل الصور الطبية، حيث يساعد أخصائيي الأشعة في تحليل صور الأشعة مثل الأشعة السينية والتصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي. يمكن لنماذج الذكاء الاصطناعي التي تستخدم شبكات CNNs اكتشاف الحالات الشاذة الدقيقة، مثل الأورام أو الكسور، وغالباً ما يكون ذلك أسرع وأحياناً أكثر دقة من الخبراء البشريين وحدهم. على سبيل المثال، يوضح استخدام YOLOv11 للكشف عن الأورام هذه القدرة. استكشف المزيد عن حلول الذكاء الاصطناعي في مجال الرعاية الصحية.
غالبًا ما يُستخدم الالتفاف إلى جانب عمليات ومفاهيم أخرى داخل الشبكات العصبية:
إن فهم الالتفاف هو المفتاح لفهم كيفية تفسير العديد من نماذج الذكاء الاصطناعي الحديثة، بما في ذلك النماذج المتاحة من خلال Ultralytics HUB، للمعلومات المرئية. أطر عمل مثل PyTorch و TensorFlow تطبيقات فعالة لعمليات الالتفاف. تستخدم مكتبات مثل OpenCV أيضًا الالتفاف لمهام معالجة الصور التقليدية مثل التعتيم والتوضيح.