تعلّم كيف تعمل الرموز، وهي اللبنات الأساسية لنماذج الذكاء الاصطناعي، على تشغيل البرمجة اللغوية العصبية والرؤية الحاسوبية ومهام مثل تحليل المشاعر واكتشاف الأشياء.
في مجال الذكاء الاصطناعي والتعلُّم الآلي، لا سيما في مجال معالجة اللغات الطبيعية (NLP) وبشكل متزايد في مجال الرؤية الحاسوبية، يمثل "الرمز المميز" أصغر وحدة من البيانات التي يعالجها النموذج. فكّر في الرموز على أنها وحدات البناء الأساسية التي تستخدمها نماذج الذكاء الاصطناعي لفهم المعلومات وتحليلها، سواء كانت نصوصاً أو صوراً أو أشكالاً أخرى من البيانات.
الترميز هو عملية تقسيم البيانات الخام إلى هذه الأجزاء الأصغر حجماً والقابلة للهضم. في معالجة اللغات الطبيعية على سبيل المثال، يتم ترميز النص إلى كلمات أو وحدات كلمات فرعية أو حتى أحرف. تعمل هذه العملية على تحويل النص المستمر إلى وحدات منفصلة يمكن لنماذج التعلم الآلي معالجتها بفعالية. يمكن أن تؤثر طريقة ترميز البيانات بشكل كبير على أداء النموذج وكفاءته.
تُعد الرموز مهمة لأن نماذج التعلم الآلي، وخاصة نماذج التعلم العميق مثل تلك المستخدمة في Ultralytics YOLO ، لا يمكنها معالجة البيانات الخام غير المهيكلة مباشرة. فهي تتطلب أن تكون البيانات بتنسيق رقمي أو منفصل. يعمل الترميز بمثابة جسر، حيث يحول المدخلات المعقدة إلى تنسيق يمكن للخوارزميات فهمه والتعلم منه. هذا التحويل ضروري لمهام مثل توليد النصوص وتحليل المشاعر واكتشاف الأشياء.
تجد الرموز تطبيقات عبر مختلف مهام الذكاء الاصطناعي والتعلم الآلي. فيما يلي بعض الأمثلة الملموسة:
معالجة اللغة الطبيعية (NLP): في البرمجة اللغوية العصبية، تعتبر الرموز الرمزية هي أساس نماذج اللغة. على سبيل المثال، عند إجراء تحليل للمشاعر، قد يتم ترميز جملة مثل "كان هذا الفيلم رائعًا!" إلى ["هذا"، "فيلم"، "كان"، "رائع"، "!"]. ثم يتم تحويل كل رمز من هذه الرموز إلى تمثيل رقمي، مثل تضمين الكلمات، والذي يستخدمه النموذج لفهم المشاعر. تعتمد النماذج اللغوية الكبيرة مثل GPT-4 و GPT-3 اعتمادًا كبيرًا على الرموز في معالجة وتوليد النص. تم تصميم تقنيات مثل تسلسل المطالبات وضبط المطالبات حول معالجة وتحسين تسلسل الرموز لتحقيق المخرجات المطلوبة من هذه النماذج.
الرؤية الحاسوبية: على الرغم من ارتباط الرموز تقليديًا بالبرمجة اللغوية العصبية، إلا أنها تزداد أهميتها في نماذج الرؤية الحاسوبية الحديثة، خاصة مع ظهور محولات الرؤية (ViT). في نماذج مثل نموذج أي شيء قطاعي (SAM)، غالبًا ما يتم تقسيم الصور إلى بقع، والتي يمكن اعتبارها رموزًا مرئية. تتم بعد ذلك معالجة هذه الرموز المرئية بواسطة شبكات المحولات، والاستفادة من آليات الانتباه لفهم العلاقات بين الأجزاء المختلفة من الصورة لمهام مثل تجزئة الصور واكتشاف الأجسام. حتى في نماذج اكتشاف الأجسام مثل Ultralytics YOLOv8على الرغم من عدم استخدام "الرموز المرئية" صراحةً بنفس طريقة استخدام الرموز المرئية في نماذج الكشف عن الأجسام، يمكن اعتبار مفهوم تقسيم الصورة إلى شبكة ومعالجة كل خلية شبكية شكلاً من أشكال الترميز الضمني، حيث تصبح كل خلية شبكية وحدة تحليل.
يعد فهم الرموز أمرًا أساسيًا لفهم كيفية معالجة نماذج الذكاء الاصطناعي للمعلومات. مع استمرار تطور الذكاء الاصطناعي، من المرجح أن يصبح مفهوم الرموز والترميز أكثر أهمية في التعامل مع أنواع البيانات المتنوعة وبناء نماذج أكثر تطوراً وكفاءة.