الترميز
اكتشف قوة الترميز في البرمجة اللغوية العصبية والتعلم الآلي! تعلّم كيف أن تقسيم النص إلى رموز يعزز مهام الذكاء الاصطناعي مثل تحليل المشاعر وتوليد النصوص.
الترميز هو العملية التأسيسية لتقسيم تدفق البيانات، مثل النص الخام أو الصورة، إلى وحدات أصغر ومنفصلة تسمى الرموز. هذه خطوة أولى حاسمة في خط المعالجة المسبقة للبيانات لجميع أنظمة الذكاء الاصطناعي (AI) تقريبًا. من خلال تحويل البيانات غير المهيكلة إلى تنسيق موحد، يتيح الترميز لنماذج التعلم الآلي تفسير الأنماط وتحليلها وتعلمها بفعالية. وبدون هذه الخطوة، لن تتمكن معظم النماذج من معالجة البيانات الضخمة والمتنوعة التي تغذي تطبيقات الذكاء الاصطناعي الحديثة.
الملاءمة والتطبيقات الواقعية
يعد الترميز أمرًا بالغ الأهمية لأن معظم بنيات التعلّم العميق تتطلب مدخلات رقمية بدلاً من نصوص أو وحدات بكسل خام. من خلال تحويل البيانات إلى رموز منفصلة، يمكننا بعد ذلك تعيين هذه الرموز إلى تمثيلات رقمية، مثل التضمينات. تلتقط هذه المتجهات العددية المعنى الدلالي والعلاقات، مما يسمح للنماذج المبنية باستخدام أطر عمل مثل PyTorch أو TensorFlow بالتعلم من البيانات. تدعم هذه الخطوة التأسيسية العديد من تطبيقات الذكاء الاصطناعي:
معالجة اللغات الطبيعية (NLP): يعد الترميز أمرًا أساسيًا في جميع مهام معالجة اللغات الطبيعية تقريبًا.
- الترجمة الآلية: تقوم خدمات مثل Google Translate بترميز الجملة المدخلة في اللغة المصدر، ومعالجة هذه الرموز باستخدام نماذج معقدة (غالبًا ما تعتمد على بنية Transformer )، ثم توليد رموز في اللغة الهدف، والتي يتم تجميعها في النهاية في الجملة المترجمة.
- تحليل المشاعر: لتحديد ما إذا كان تقييم العميل إيجابيًا أو سلبيًا، يتم أولاً ترميز النص برموز. ثم يقوم النموذج بعد ذلك بتحليل هذه الرموز لتصنيف الشعور العام. تعرف على المزيد حول تحليل المشاعر. تعتمد تقنيات مثل الضبط الفوري أيضًا على معالجة تسلسل الرموز الرمزية. بالنسبة للمطورين، توفر مكتبات مثل spaCy و NLTK أدوات ترميز قوية.
الرؤية الحاسوبية (CV): على الرغم من ارتباطه تقليديًا بالبرمجة اللغوية العصبية إلا أن المفهوم يمتد ليشمل الرؤية الحاسوبية.
- محولات الرؤية (ViT): في نماذج مثل محولات الرؤية (ViT)، يتم تقسيم الصور إلى رقع ذات حجم ثابت. وكما هو موضح في ورقة بحث ViT الأصلية، يتم التعامل مع هذه الرقع على أنها "رموز بصرية" ويتم تسويتها إلى تسلسلات. ثم يتم إدخال هذه التسلسلات في شبكة محولات، والتي تستخدم آليات مثل الانتباه الذاتي لفهم العلاقات بين أجزاء الصورة المختلفة. يتيح ذلك مهام مثل تصنيف الصور واكتشاف الأجسام.
- نماذج متعددة الوسائط: تعمل نماذج مثل CLIP و YOLO-World على الربط بين الرؤية واللغة من خلال معالجة كل من الرموز النصية والرموز المرئية لأداء مهام مثل اكتشاف الأجسام التي لا تُطلق عليها لقطات. وبالمثل، تستخدم أيضًا نماذج تجزئة الصور المتقدمة مثل نموذج تجزئة أي شيء (SAM) مفاهيم شبيهة بالرموز.
طرق الترميز الشائعة
توجد استراتيجيات مختلفة لترميز البيانات، ولكل منها مفاضلاتها الخاصة. يمكن أن يؤثر اختيار الطريقة بشكل كبير على أداء النموذج.
- الترميز المستند إلى الكلمات: تقوم هذه الطريقة بتقسيم النص بناءً على المسافات وعلامات الترقيم. على الرغم من بساطتها وبديهيتها، إلا أنها تواجه صعوبة في التعامل مع المفردات الكبيرة والكلمات "خارج المفردات" (الكلمات التي لم تتم رؤيتها أثناء التدريب).
- الترميز القائم على الأحرف: تقسم هذه الطريقة النص إلى أحرف فردية. وهي تحل مشكلة خروج المفردات عن المفردات ولكن يمكن أن تؤدي إلى تسلسلات طويلة جدًا تفقد المعنى الدلالي عالي المستوى، مما يجعل من الصعب على النماذج تعلم العلاقات بين الكلمات.
- ترميز الكلمات الفرعية: هذا نهج هجين أصبح معيارًا لنماذج البرمجة اللغوية العصبية الحديثة. فهو يقسم الكلمات إلى وحدات فرعية أصغر ذات معنى. تبقى الكلمات الشائعة كرموز مفردة، بينما يتم تقسيم الكلمات النادرة إلى رموز كلمات فرعية متعددة. تتعامل هذه الطريقة بفعالية مع الكلمات المعقدة وتتجنب مشكلة خروج المفردات عن المفردات. وتتضمن الخوارزميات الشائعة ترميز أزواج البايتات (BPE) وWordPiece، والتي تُستخدم في نماذج مثل BERT وGPT.
الترميز مقابل الرمز المميز
من المهم التمييز بين "الترميز" و"الرمز المميز".
- الترميز: يشير إلى عملية تقسيم البيانات إلى وحدات أصغر. إنها خطوة معالجة مسبقة أساسية في كيفية عمل النماذج اللغوية.
- الرمز: يشير إلى نتيجة عملية الترميز - الوحدة الفردية (كلمة أو كلمة فرعية أو حرف أو رقعة صورة) التي يعالجها النموذج.
يُعد فهم الترميز أمرًا أساسيًا لفهم كيفية تفسير نماذج الذكاء الاصطناعي والتعلم من أنواع البيانات المتنوعة. وغالباً ما تتضمن إدارة مجموعات البيانات ونماذج التدريب منصات مثل Ultralytics HUB، والتي تساعد على تبسيط المعالجة المسبقة للبيانات وسير عمل تدريب النماذج. مع تطور الذكاء الاصطناعي، تستمر أساليب الترميز في التكيف، حيث تلعب دوراً رئيسياً في بناء نماذج أكثر تطوراً للمهام التي تتراوح من توليد النصوص إلى الفهم البصري المعقد في مجالات مثل المركبات ذاتية القيادة وتحليل الصور الطبية.