يُعد التعرف على الكيانات المسماة (NER) مهمة أساسية في معالجة اللغات الطبيعية (NLP) ومكونًا رئيسيًا للذكاء الاصطناعي الحديث (AI). وهي تتضمن تحديد وتصنيف أجزاء محددة من المعلومات - المعروفة باسم "الكيانات المسماة" - تلقائيًا داخل نص غير منظم. وتمثل هذه الكيانات عادةً أشياء من العالم الحقيقي مثل الأشخاص والمؤسسات والمواقع والتواريخ وأسماء المنتجات والقيم النقدية وغيرها. ويتمثل الهدف الأساسي من NER في تحويل النص الخام إلى بيانات منظمة، مما يسهل على الآلات فهمها ومعالجتها واستخراج رؤى قيمة منها.
كيف يعمل التعرف على الكيانات المسماة
تقوم أنظمة NER بتحليل البنية اللغوية وسياق النص لتحديد موقع الكيانات وتصنيفها. وبينما اعتمدت الأنظمة المبكرة اعتمادًا كبيرًا على القواعد النحوية والقواميس، تستفيد النُهج الحديثة من التعلم الآلي، وخاصة التعلم العميق. تتفوق نماذج مثل المحولات في فهم السياق والأنماط اللغوية الدقيقة، مما يؤدي إلى دقة أعلى. تتضمن العملية عمومًا تحديد الكيانات المحتملة (كلمات أو عبارات) ثم تصنيفها إلى فئات محددة مسبقًا (على سبيل المثال، شخص أو منظمة أو موقع).
على سبيل المثال، في الجملة "أعلن سوندار بيتشاي عن أحدث نموذج للذكاء الاصطناعي من Google في الحدث الذي أقيم في ماونتن فيو"، سيحدد نظام NER "سوندار بيتشاي" كشخص، وGoogle" كمنظمة، و"ماونتن فيو" كموقع. هذا الناتج المنظم أكثر فائدة بكثير للمهام النهائية من النص الأصلي وحده.
الملاءمة والتطبيقات
تعد تقنية NER تقنية أساسية تتيح العديد من التطبيقات في مختلف المجالات من خلال هيكلة المعلومات النصية:
- استخراج المعلومات: يمكن للأنظمة مسح كميات كبيرة من المستندات (مثل المقالات الإخبارية أو الأوراق البحثية) لاستخراج الكيانات الرئيسية، مما يسهل استرجاع المعلومات وتحليلها بشكل أسرع. على سبيل المثال، يمكن للمحللين الماليين استخدام تقنية NER لاستخراج أسماء الشركات والقيم النقدية من تقارير الأرباح. اقرأ دراسة استقصائية عن تقنيات NER.
- أتمتة دعم العملاء: تستخدم روبوتات الدردشة الآلية وأنظمة الدعم تقنية NER لتحديد التفاصيل المهمة مثل أسماء المنتجات أو معرّفات المستخدمين أو أنواع المشكلات المذكورة في استفسارات العملاء، مما يتيح التوجيه الفعّال وتوليد الاستجابة. استكشف الذكاء الاصطناعي للغة الطبيعية من Google Cloud للحصول على أمثلة.
- التوصية بالمحتوى: من خلال تحديد الكيانات المذكورة في المقالات أو مقاطع الفيديو (مثل الأشخاص أو الموضوعات أو المواقع)، يمكن للمنصات اقتراح محتوى أكثر صلة بالمستخدمين.
- معلوماتية الرعاية الصحية: تُعد تقنية NER ضرورية لاستخراج المعلومات مثل أسماء المرضى والأمراض والأدوية والأدوية والأعراض من الملاحظات السريرية، مما يساعد في إدارة السجلات الطبية والأبحاث. ويمكنه دعم مهام مثل تحليل الصور الطبية من خلال ربط النتائج بالتقارير النصية.
- البحث الدلالي: يعزز قدرات محرك البحث من خلال فهم الكيانات الموجودة في الاستعلام، مما يؤدي إلى نتائج أكثر دقة وذات صلة بالسياق.
الاختلافات الرئيسية عن المفاهيم ذات الصلة
وغالبًا ما تُستخدم NER جنبًا إلى جنب مع مهام البرمجة اللغوية العصبية الأخرى ولكن لها تركيزًا مميزًا:
- تحليل المشاعر: يحدد النغمة العاطفية (إيجابية، سلبية، محايدة) المعبر عنها في النص، بدلاً من تحديد كيانات معينة. قد تحدد NER ماهية المشاعر (على سبيل المثال، منتج ما)، بينما يحدد تحليل المشاعر كيف يشعر المستخدم تجاهه.
- تلخيص النص: يهدف إلى إنشاء نسخة مختصرة وموجزة من نص أطول، مع الحفاظ على المعلومات الأساسية ولكن ليس بالضرورة التركيز على تصنيف جميع الكيانات المسماة.
- اكتشاف الأجسام: مهمة الرؤية الحاسوبية (CV) التي تحدد الأجسام داخل الصور أو مقاطع الفيديو وتحدد موقعها. تتعامل NER حصريًا مع البيانات النصية. ومع ذلك، يمكن أن تكمّل تقنية NER السيرة الذاتية في التطبيقات متعددة الوسائط، مثل تحليل النصوص المستخرجة من الصور.
- فهم اللغة الطبيعية (NLU): مجال أوسع يركز على تمكين الآلات من فهم معنى النص. تعتبر NER مهمة فرعية أساسية ضمن NLU.
التقنيات والأدوات
تسهّل العديد من المكتبات والمنصات تنفيذ NER:
- توفر المكتبات مفتوحة المصدر مثل spaCy و NLTK قدرات قوية في مجال NER.
- Hugging Face إمكانية الوصول إلى مجموعة كبيرة من نماذج المحولات المدربة مسبقًا والمضبوطة بدقة لمهام NER.
- توفر منصات مثل Ultralytics HUB أدوات لإدارة مشاريع الذكاء الاصطناعي، بما في ذلك تدريب النماذج ونشرها. بينما تركز في المقام الأول على نماذج الرؤية مثل Ultralytics YOLOفإن المنصة يمكن أن تكون جزءًا من خط أنابيب أكبر يتضمن مهام معالجة اللغات الطبيعية مثل NER، خاصةً في الأنظمة التي تحلل البيانات المرئية والنصية على حد سواء. استكشف وثائقUltralytics لمعرفة المزيد عن إدارة النماذج ونشرها.