مسرد المصطلحات

الترميز

اكتشف قوة الترميز في البرمجة اللغوية العصبية والذكاء الاصطناعي! تعلّم كيف أن تقسيم النص إلى رموز يعزز تحليل المشاعر والتصنيف وغير ذلك الكثير.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

الترميز هو عملية تقسيم النص إلى وحدات أصغر تسمى الرموز. يمكن أن تكون هذه الرموز صغيرة مثل الأحرف الفردية أو الكلمات أو العبارات، اعتمادًا على السياق والتطبيق. ويُعد الترميز خطوة أساسية في معالجة اللغة الطبيعية (NLP) ومهام التعلم الآلي (ML)، مما يمكّن أجهزة الكمبيوتر من معالجة البيانات النصية وتحليلها بفعالية. ومن خلال تحويل النص غير المهيكل إلى رموز منظمة، تسهل عملية الترميز على الخوارزميات أداء مهام مثل تصنيف النصوص وتحليل المشاعر ونمذجة اللغة.

أهمية الترميز في الذكاء الاصطناعي

يعد الترميز أمرًا ضروريًا لتحويل النص الخام إلى تنسيق يمكن لنماذج التعلم الآلي فهمه. في البرمجة اللغوية العصبية، تقوم نماذج مثل BERT أو GPT بمعالجة تسلسل الرموز بدلاً من النص الخام. تعمل هذه الرموز بمثابة اللبنات الأساسية لمزيد من التحليل، مثل توليد التضمين أو آليات الانتباه.

بالإضافة إلى ذلك، يساعد الترميز على توحيد النص، مما يمكّن الخوارزميات من التركيز على الأنماط ذات المعنى بدلاً من التفاصيل غير ذات الصلة (مثل علامات الترقيم أو المسافات البيضاء). وتدعم هذه العملية أيضًا مهام مثل توليد النص، حيث تتنبأ النماذج بالرمز التالي في التسلسل، والترجمة الآلية، حيث تتم ترجمة الرموز بين اللغات.

أنواع الترميز

  1. ترميز الكلمات: يقسم النص إلى كلمات فردية. على سبيل المثال، الجملة "Ultralytics HUB قوي" تصبح ["Ultralytics"، "HUB"، "هو"، "قوي"].
  2. ترميز الكلمات الفرعية: تقسيم النص إلى وحدات كلمات فرعية أصغر. هذه الطريقة شائعة في نماذج مثل BERT و GPT للتعامل مع الكلمات النادرة أو غير المعروفة من خلال تقسيمها إلى أجزاء ذات معنى (على سبيل المثال، كلمة "قوي" إلى "قوة" و "فول").
  3. ترميز الأحرف: يقسم النص إلى أحرف فردية. على سبيل المثال، "Ultralytics" تصبح ["U"، "l"، "t"، "r"، "a"، "l"، "y"، "t"، "i"، "c"، "s"].

لكل طريقة مزاياها ومقايضاتها. ترميز الكلمات بسيط ولكنه قد يواجه صعوبة في التعامل مع الكلمات غير المعروفة، في حين أن ترميز الكلمات الفرعية وترميز الأحرف يتعامل مع الكلمات النادرة بشكل أفضل ولكنه يزيد من طول التسلسل والتعقيد الحسابي.

تطبيقات الترميز

تحليل المشاعر

في تحليل المشاعر، يقسّم الترميز مراجعات المستخدمين أو منشورات وسائل التواصل الاجتماعي إلى رموز لتحديد المشاعر الإيجابية أو السلبية أو المحايدة. على سبيل المثال، في مراجعة لمنتج مثل "أحب سرعة Ultralytics YOLO "، يساعد الترميز في استخراج الرموز الرئيسية مثل "أحب" و"السرعة" و"Ultralytics YOLO " لتقييم المشاعر.

تصنيف النص

يعد الترميز خطوة أساسية في مهام تصنيف النصوص مثل الكشف عن الرسائل غير المرغوب فيها أو نمذجة المواضيع. في الكشف عن الرسائل غير المرغوب فيها، تقوم النماذج بتحليل الرموز داخل رسائل البريد الإلكتروني لتحديد الأنماط التي تميز بين الرسائل غير المرغوب فيها والرسائل المشروعة. تعرف على المزيد حول مهام التصنيف وتنفيذها في سير عمل Ultralytics YOLO .

نماذج اللغة

يُعد الترميز جزءًا لا يتجزأ من تدريب واستخدام النماذج اللغوية مثل GPT-4. تمثل الرموز مدخلات ومخرجات هذه النماذج، مما يتيح مهام مثل تلخيص النصوص، والإجابة عن الأسئلة، والذكاء الاصطناعي التخاطبي.

البيانات الوصفية لاكتشاف الكائنات

في مهام الرؤية الحاسوبية، يُستخدم الترميز في معالجة البيانات الوصفية مثل تسميات الكائنات أو التعليقات التوضيحية. على سبيل المثال، قد تقوم نماذج الكشف عن الكائنات مثل Ultralytics YOLO بترميز التعليقات التوضيحية المستندة إلى النص لتعزيز التوافق مع خطوط أنابيب التعلم الآلي.

الترميز في الممارسة العملية

مثال 1: تطبيقات البرمجة اللغوية العصبية

فكّر في روبوت محادثة مدعوم بفهم اللغة الطبيعية (NLU). تقوم عملية الترميز بتحويل مدخلات المستخدم مثل "ما هو الطقس في مدريد؟" إلى رموز مثل ["ماذا"، "ماذا"، "ذا"، "الطقس"، "مثل"، "في"، "مدريد"، "؟"]. ثم تتم معالجة هذه الرموز لتوليد استجابة ذات صلة.

مثال 2: ترميز الكلمات الفرعية للكلمات النادرة

في مجموعة بيانات الرعاية الصحية، قد لا تظهر المصطلحات الطبية النادرة مثل "رأب الأوعية الدموية" في المفردات القياسية. تعمل عملية ترميز الكلمات الفرعية على تقسيم المصطلح إلى ["angio"، "plasty"]، مما يسمح للنماذج بفهم المصطلحات غير المألوفة ومعالجتها بفعالية. تعرف على المزيد حول تطبيقات الرعاية الصحية للذكاء الاصطناعي.

الترميز مقابل المفاهيم ذات الصلة

على الرغم من أن الترميز أمر أساسي في معالجة اللغات الطبيعية إلا أنه يختلف عن المفاهيم ذات الصلة مثل التضمين وآليات الانتباه. حيث يقوم الترميز بإعداد النص الخام للمعالجة، بينما تقوم التضمينات بتحويل الرموز إلى متجهات رقمية، وتحدد آليات الانتباه أهمية الرموز ضمن تسلسل ما.

الأدوات وأطر العمل الداعمة للترميز

  • PyTorch: غالبًا ما يتم دمج الترميز في خطوط الأنابيب PyTorch لمهام البرمجة اللغوية العصبية.
  • Ultralytics HUB: تبسيط تدريب النموذج ونشره، بما في ذلك خطوات المعالجة المسبقة مثل الترميز.
  • Hugging Face المحولات: توفّر أدوات ترميز مُدرّبة مسبقًا لأحدث النماذج اللغوية.

باختصار، يُعد الترميز خطوة حاسمة في إعداد البيانات النصية لتطبيقات الذكاء الاصطناعي والتعلم الآلي. ويمتد تعدد استخداماتها وفائدتها عبر تحليل المشاعر والتصنيف ونمذجة اللغة وغير ذلك، مما يجعلها عملية لا غنى عنها في عمليات سير عمل الذكاء الاصطناعي الحديثة.

قراءة الكل