مسرد المصطلحات

المحول

اكتشف كيف تُحدِث بنيات Transformer ثورة في الذكاء الاصطناعي، وتحقق اختراقات في مجال البرمجة اللغوية العصبية والرؤية الحاسوبية ومهام التعلّم الآلي المتقدمة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

المحولات هي نوع من معماريات الشبكات العصبية التي أحدثت ثورة في مجال الذكاء الاصطناعي، لا سيما في معالجة اللغات الطبيعية (NLP) وبشكل متزايد في مجال الرؤية الحاسوبية. وهي مصممة للتعامل مع البيانات المتسلسلة، مثل النصوص، بفعالية أكبر من البنى السابقة مثل الشبكات العصبية المتكررة (RNNs)، وذلك باستخدام آلية تسمى الانتباه الذاتي. وهذا يسمح للنموذج بموازنة أهمية الأجزاء المختلفة من تسلسل المدخلات عند معالجتها، مما يؤدي إلى تحسينات كبيرة في الأداء للعديد من المهام.

الأهمية والأثر

يُعزى ظهور المحولات إلى حد كبير إلى قدرتها على التغلب على قيود نماذج التسلسل السابقة. عانت شبكات RNNs التقليدية مع التسلسلات الطويلة بسبب مشاكل مثل التدرجات المتلاشية، مما يجعل من الصعب التقاط التبعيات بعيدة المدى في البيانات. يمكن للمحولات، مع آلية الانتباه الخاصة بها، معالجة جميع أجزاء تسلسل المدخلات بالتوازي، مما يسرع بشكل كبير من التدريب والاستدلال. وقد جعلت هذه القدرة على المعالجة المتوازية وفعالية الانتباه من المحولات العمود الفقري لأحدث النماذج في مختلف المجالات. يمتد تأثيرها من تشغيل مهام البرمجة اللغوية العصبية المتقدمة إلى تعزيز نماذج الرؤية الحاسوبية.

تطبيقات في الذكاء الاصطناعي والتعلم الآلي

المحولات متعددة الاستخدامات وقد وجدت تطبيقات عبر مجموعة واسعة من مهام الذكاء الاصطناعي وتعلم الآلة. فيما يلي بعض الأمثلة الملموسة:

  • معالجة اللغات الطبيعية: من أبرز التطبيقات في النماذج اللغوية مثل GPT-3 و GPT-4، والتي تُستخدم لتوليد النصوص وترجمتها وفهمها. تستفيد هذه النماذج من قدرة بنية المحول على فهم السياق وتوليد نص متماسك ومرتبط بالسياق. على سبيل المثال، يتم استخدامها في روبوتات المحادثة وأدوات تلخيص النصوص.

  • اكتشاف الأجسام وتجزئة الصور: على الرغم من هيمنتها في البداية في مجال معالجة اللغات الطبيعية إلا أن المحولات تُستخدم بشكل متزايد في الرؤية الحاسوبية. نماذج مثل RT-DETR و YOLO-NAS التي تدمج بنيات المحولات لتحسين مهام اكتشاف الأجسام وتجزئة الصور. تستفيد هذه النماذج من قدرة المحولات على التقاط السياق العالمي داخل الصور، مما يؤدي إلى أنظمة رؤية أكثر دقة وقوة. Ultralytics YOLO نفسها تتطور باستمرار وتستكشف العمود الفقري القائم على المحولات للنماذج المستقبلية.

المفاهيم الرئيسية والمصطلحات ذات الصلة

يتضمن فهم المحولات استيعاب بعض المفاهيم ذات الصلة:

  • الانتباه الذاتي: هذه هي الآلية الأساسية للمحولات التي تسمح للنموذج بموازنة أهمية الأجزاء المختلفة من المدخلات عند معالجة كل جزء. وهي تمكن النموذج من التركيز على المعلومات ذات الصلة، مما يحسن الأداء في المهام التي تتطلب فهم السياق.

  • بنية المشفر-فك التشفير: تتبع العديد من نماذج المحولات بنية مشفر-مفك تشفير. تعالج وحدة التشفير تسلسل المدخلات، وتقوم وحدة فك التشفير بتوليد تسلسل المخرجات، مع وجود آليات انتباه تسهل تدفق المعلومات بينهما.

  • BERT (تمثيلات التشفير ثنائية الاتجاه من المحولات): نموذج شائع قائم على المحولات يستخدم بشكل أساسي لفهم سياق النص. يعد BERT والنماذج المماثلة أساسية في العديد من تطبيقات البرمجة اللغوية العصبية الحديثة ومتاحة على منصات مثل Hugging Face.

  • محول الرؤية (ViT): يعمل هذا المحول على تكييف بنية المحول لمهام معالجة الصور، حيث يطبق بفعالية الانتباه الذاتي على بقع الصور بدلاً من الكلمات. وقد أظهرت ViT أداءً رائعًا في تصنيف الصور ومهام الرؤية الأخرى، مما يدل على تعدد استخدامات المحولات خارج نطاق البرمجة اللغوية العصبية.

لقد أصبحت المحولات حجر الزاوية في الذكاء الاصطناعي الحديث، حيث تدفع باستمرار حدود ما هو ممكن في كل من فهم البيانات المعقدة وتوليدها، ومن المتوقع أن يزداد تأثيرها أكثر في مختلف التطبيقات في المستقبل. ومع تطور النماذج، يظل فهم بنية المحولات ومبادئها الأساسية أمرًا بالغ الأهمية لأي شخص يعمل في مجال الذكاء الاصطناعي والتعلم الآلي.

قراءة الكل