اكتشف كيف تقوم نماذج تحويل التسلسل إلى تسلسل بتحويل المدخلات إلى تسلسلات مخرجات، مما يدعم مهام الذكاء الاصطناعي مثل الترجمة وروبوتات الدردشة والتعرف على الكلام.
نماذج من تسلسل إلى تسلسل (Seq2Seq) هي فئة من نماذج التعلّم العميق المصممة لتحويل تسلسل المدخلات إلى تسلسل المخرجات، حيث يمكن أن تختلف أطوال المدخلات والمخرجات. هذه المرونة تجعلها قوية بشكل استثنائي لمجموعة واسعة من المهام في معالجة اللغات الطبيعية (NLP) وخارجها. تم تقديم الفكرة الأساسية في أوراق بحثية من قبل باحثين في Google ومختبر يوشوا بنجيو، مما أحدث ثورة في مجالات مثل الترجمة الآلية.
بُنيت نماذج Seq2Seq على بنية مشفر-مفك تشفير. تسمح هذه البنية للنموذج بمعالجة التسلسلات متغيرة الطول بفعالية.
أداة التشفير: يعالج هذا المكون تسلسل الإدخال بالكامل، مثل جملة باللغة الإنجليزية. فهو يقرأ التسلسل عنصرًا واحدًا في كل مرة (على سبيل المثال، كلمة بكلمة) ويضغط المعلومات في تمثيل رقمي ثابت الطول يسمى متجه السياق أو "متجه الفكر". عادةً ما تكون أداة التشفير عبارة عن شبكة عصبية متكررة (RNN) أو متغير أكثر تقدمًا مثل الذاكرة طويلة المدى القصيرة (LSTM)، والتي تكون بارعة في التقاط المعلومات المتسلسلة.
أداة فك التشفير: يأخذ هذا المكون متجه السياق من المشفر كمدخل أولي له. وتتمثل مهمته في توليد تسلسل الإخراج عنصرًا تلو الآخر. على سبيل المثال، في مهمة الترجمة، يقوم بتوليد الجملة المترجمة كلمة بكلمة. تتم إعادة تغذية المخرجات من كل خطوة إلى وحدة فك التشفير في الخطوة التالية، مما يسمح لها بتوليد تسلسل مترابط. تستمر هذه العملية حتى يتم إنتاج رمز مميز لنهاية التسلسل. أحد الابتكارات الرئيسية التي حسّنت أداء Seq2Seq بشكل كبير هو آلية الانتباه، والتي تسمح لوحدة فك الترميز بالرجوع إلى أجزاء مختلفة من تسلسل الإدخال الأصلي أثناء توليد المخرجات.
إن القدرة على ربط المدخلات متغيرة الطول بالمخرجات متغيرة الطول تجعل نماذج Seq2Seq متعددة الاستخدامات.
في حين أن نماذج Seq2Seq القائمة على الشبكات الشبكية العصبية العصبية القابلة للتشغيل (RNNs) كانت رائدة، فقد تطور المجال:
في حين أن Seq2Seq غالباً ما يشير إلى بنية فك التشفير القائمة على شبكة الشبك الشبكي الشبكي RNN، فإن المبدأ العام لتعيين تسلسلات المدخلات إلى تسلسلات المخرجات باستخدام تمثيل وسيط يظل محورياً في العديد من البنى الحديثة. وتوفر أدوات مثل PyTorch و TensorFlow لبنات بناء لتنفيذ نماذج التسلسل التقليدية والحديثة. ويمكن تبسيط إدارة عملية التدريب باستخدام منصات مثل Ultralytics HUB، التي تبسّط خط أنابيب نشر النموذج بأكمله.