مسرد المصطلحات

التعرف على الكيانات المسماة (NER)

استكشف الرؤى باستخدام ميزة التعرّف على الكيانات المسماة (NER). اكتشف كيف يقوم الذكاء الاصطناعي بتحويل النصوص غير المهيكلة إلى بيانات قابلة للتنفيذ لتطبيقات متنوعة.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

يعد التعرف على الكيانات المسماة (NER) مكونًا حاسمًا في أنظمة الذكاء الاصطناعي الحديثة (AI) والتعلم الآلي (ML)، لا سيما في مجال معالجة اللغات الطبيعية (NLP). وهو يمكّن أجهزة الكمبيوتر من تحديد المعلومات الأساسية وتصنيفها تلقائيًا في نص غير منظم، وتحويلها إلى تنسيق يمكن للآلات فهمه واستخدامه بسهولة. وتتضمن هذه العملية تحديد "الكيانات المسماة" - أي الكلمات أو العبارات التي تمثل أجزاء محددة من المعلومات - وتصنيفها إلى فئات محددة مسبقًا مثل الأشخاص والمنظمات والمواقع والتواريخ وغيرها. ومن خلال استخلاص هذه الكيانات، تكشف تقنية NER عن رؤى قيّمة من البيانات النصية، مما يجعلها لا غنى عنها لمجموعة واسعة من التطبيقات.

كيف يعمل التعرف على الكيانات المسماة

تعمل أنظمة NER من خلال تحليل البنية اللغوية للنص لتحديد موقع الكيانات وتصنيفها. يتضمن ذلك عادةً عدة خطوات:

  • الترميز: تقسيم النص إلى كلمات أو رموز فردية.
  • وسم جزء من الكلام: تحديد الدور النحوي لكل كلمة (على سبيل المثال، اسم، فعل، صفة).
  • اكتشاف الكيانات: التعرف على الكيانات المسماة المحتملة بناءً على السياق والأنماط. على سبيل المثال، غالبًا ما تشير الكلمات المكتوبة بحروف كبيرة إلى كيانات مسماة.
  • تصنيف الكيانات: تصنيف الكيانات المكتشفة إلى أنواع محددة مسبقًا باستخدام نماذج التعلم الآلي المدربة على كميات هائلة من البيانات النصية المشروحة. وتشمل الفئات الشائعة ما يلي:
    • شخص: أسماء الأفراد (مثل "غلين جوشر").
    • المنظمة: أسماء الشركات أو المؤسسات أو المجموعات (على سبيل المثال، "Ultralytics").
    • الموقع: الأماكن الجغرافية (مثل "مدريد").
    • التاريخ: تواريخ التقويم (على سبيل المثال، "29 نوفمبر 2024").
    • الوقت: نقطة زمنية (على سبيل المثال، "3 مساءً").
    • القيم العددية: الأرقام ذات المعاني المحددة (على سبيل المثال، "20,000 نجمة").

على سبيل المثال، في الجملة "Ultralytics YOLO11 تم إطلاق في YOLO Vision 2024"، سيحدد نظام NER "Ultralytics" كمنظمة، و"YOLO11" كمنتج، و"YOLO Vision 2024" كحدث. وغالبًا ما تستفيد أنظمة NER الحديثة من بنيات التعلم العميق، لا سيما المحولات، التي تتفوق في فهم السياق والأنماط المعقدة في اللغة.

الملاءمة والتطبيقات

تُعد تقنية NER تقنية أساسية للعديد من التطبيقات التي تعتمد على الذكاء الاصطناعي في مختلف الصناعات. إن قدرتها على استخراج المعلومات المنظمة تلقائيًا من النص تجعلها لا تقدر بثمن من أجل:

  • استخراج المعلومات: تُعد عملية الاستخلاص الصوتي للمعلومات أساسية لاستخراج التفاصيل الأساسية تلقائيًا من المستندات، مثل تحديد شروط العقد في المستندات القانونية أو استخراج معلومات المريض من تقارير تحليل الصور الطبية.
  • محركات البحث وأنظمة التوصيات: تستخدم محركات البحث أنظمة التعرف على المصادر الطبيعية لفهم القصد من وراء استعلامات المستخدم بشكل أكثر فعالية. على سبيل المثال، إذا بحث المستخدم عن "أحداث في مدريد"، يمكن أن تحدد محركات البحث NER "الأحداث" كنوع المعلومات المطلوبة و"مدريد" كموقع، وبالتالي تحسين نتائج البحث. وبالمثل، يمكن لأنظمة التوصيات استخدام أنظمة التوصية باستخدام NER لتحليل مراجعات المستخدمين وتفضيلاتهم لتقديم اقتراحات أكثر ملاءمة.
  • دعم العملاء: يمكن أن يساعد تحليل ملاحظات العملاء وبطاقات الدعم باستخدام تقنية NER الشركات على تحديد المشكلات الشائعة، وتتبع الإشارات إلى منتجات أو خدمات محددة، وتوجيه الاستفسارات إلى الأقسام المناسبة، مما يعزز تجربة العملاء.
  • التحليل المالي: في مجال التمويل، يمكن استخدام NER لاستخراج أسماء الشركات ومؤشرات الأسهم وتفاصيل المعاملات من المقالات الإخبارية والتقارير المالية، مما يساعد في أبحاث السوق وإدارة المخاطر.
  • التوصية بالمحتوى: تستخدم مجمّعات الأخبار ومنصات المحتوى تقنية NER لتصنيف المقالات واقتراح المحتوى ذي الصلة للمستخدمين بناءً على الكيانات المحددة، مما يعزز اكتشاف المحتوى ومشاركة المستخدم، على غرار تقنيات البحث الدلالي.

على سبيل المثال، في سياق التجارة الإلكترونية، يمكن أن تحلل تقنية NER أوصاف المنتجات لتمييز المنتجات تلقائيًا بالفئات والسمات ذات الصلة. في مجال الرؤية الحاسوبية في الزراعة، يمكن تطبيق NER لتحليل التقارير عن صحة المحاصيل واستخراج كيانات مثل أسماء الأمراض أو المناطق المصابة لتبسيط تحليل البيانات واتخاذ القرارات.

الاختلافات الرئيسية عن المفاهيم ذات الصلة

في حين أن عملية الإنصاف الصوتي الصوتي ترتبط ارتباطًا وثيقًا بمهام البرمجة اللغوية العصبية الأخرى، إلا أن لها وظائف متميزة:

  • تحليل مصادر الإنبعاثات الصفرية مقابل تحليل المشاعر: في حين أن NER يحدد ويصنف الكيانات، يركز تحليل المشاعر على تحديد النبرة العاطفية أو الرأي المعبر عنه في النص. قد تحدد NER اسم منتج، بينما يحدد تحليل المشاعر ما إذا كان النص يعبر عن مشاعر إيجابية أو سلبية أو محايدة تجاه هذا المنتج.
  • تلخيص النصوص مقابل تلخيص النصوص: يهدف تلخيص النصوص إلى تلخيص كميات كبيرة من النصوص في ملخصات أقصر ومتماسكة. وعلى العكس من ذلك، يركّز التلخيص الصوتي الصوتي على استخراج أجزاء محددة من المعلومات (الكيانات) من النص دون تلخيص المحتوى بأكمله بالضرورة.
  • NER وفهم اللغة الطبيعية (NLU): تعد NER أحد مكونات فهم اللغة الطبيعية (NLU). إن NLU هو مجال أوسع يهدف إلى تمكين الحواسيب من فهم اللغة البشرية بالكامل، بما في ذلك القصد والسياق والفروق الدقيقة. تساهم NER في NLU من خلال توفير معلومات منظمة على مستوى الكيان تساعد في الفهم اللغوي العام.

التقنيات والأدوات

تسهّل العديد من الأدوات والمنصات تطوير ونشر أنظمة NER. Hugging Face توفر مجموعة واسعة من النماذج والمكتبات المحولة المدربة مسبقًا والتي تتسم بفعالية عالية لمهام NER. توفر منصات مثل Ultralytics HUB أدوات وبنية تحتية لتدريب نماذج الذكاء الاصطناعي ونشرها وإدارتها، بما في ذلك النماذج المستخدمة في NER، مما يسهل دمج قدرات NER في حلول الذكاء الاصطناعي الأوسع نطاقًا. Ultralytics YOLO يمكن دمج النماذج، المعروفة في المقام الأول للكشف عن الأشياء، مع خطوط أنابيب معالجة اللغات الطبيعية لإنشاء أنظمة شاملة تفهم البيانات المرئية والنصية على حد سواء، مما يعزز من تنوع استخدامات NER في التطبيقات متعددة الوسائط.

قراءة الكل