مسرد المصطلحات

تحليلات البيانات

اكتشف كيف تؤدي تحليلات البيانات إلى نجاح الذكاء الاصطناعي وتعلم الآلة من خلال تحسين جودة البيانات، والكشف عن الرؤى، وتمكين اتخاذ القرارات الذكية.

تدريب YOLO النماذج
ببساطة مع Ultralytics HUB

التعرف على المزيد

تتضمن تحليلات البيانات الفحص الحسابي المنهجي للبيانات أو الإحصاءات. وهو يشمل عمليات فحص البيانات وتنظيفها وتحويلها ونمذجتها للكشف عن المعلومات المفيدة واستخلاص الاستنتاجات ودعم اتخاذ القرارات المستنيرة. في مجالات الذكاء الاصطناعي والتعلم الآلي ( AI) والتعلم الآلي (ML)، تُعد تحليلات البيانات أساسية لإعداد مجموعات البيانات، وفهم خصائص البيانات من خلال تقنيات مثل التحليل الاستكشافي للبيانات (EDA)، واستخراج الميزات ذات المعنى، وتقييم أداء النموذج. ويساهم هذا التحليل الدقيق في نهاية المطاف في بناء أنظمة ذكاء اصطناعي أكثر قوة وموثوقية، بما في ذلك النماذج المتطورة مثل Ultralytics YOLO لمهام مثل اكتشاف الأجسام.

أهمية تحليلات البيانات في الذكاء الاصطناعي والتعلم الآلي

تعمل تحليلات البيانات كأساس لمشاريع الذكاء الاصطناعي والتعلم الآلي الناجحة. قبل تدريب النماذج المعقدة، تتطلب البيانات الأولية تحليلاً شاملاً. ويتضمن ذلك خطوات حاسمة مثل تنظيف البيانات لمعالجة الأخطاء والتناقضات، والمعالجة المسبقة للبي انات لتنسيق البيانات بشكل مناسب للخوارزميات. وتساعد تقنيات مثل EDA، التي غالبًا ما يتم تعزيزها من خلال تصور البيانات باستخدام أدوات مثل Seaborn، في الكشف عن الأنماط الأساسية والهياكل والقيم المتطرفة والتحيزات المحتملة داخل البيانات. ويُعد الفهم العميق لهذه الجوانب أمرًا بالغ الأهمية لاختيار النماذج المناسبة، وضمان جودة البيانات، وتحقيق التدريب الفعّال، وغالبًا ما تتم إدارته داخل منصات مثل Ultralytics HUB.

علاوة على ذلك، تظل تحليلات البيانات ضرورية بعد تدريب النموذج. يتضمن تقييم أداء النموذج تحليل نتائج التنبؤ مقابل بيانات الحقيقة الأساسية باستخدام مقاييس مثل الدقة أو متوسط الدقة (mAP). يمكنك معرفة المزيد حول مقاييس أداءYOLO في دليلنا. تساعد هذه العملية التحليلية على تحديد نقاط الضعف في النموذج، وفهم أنواع الأخطاء (غالبًا ما يتم تصورها باستخدام مصفوفة الارتباك)، وتوجيه التحسينات من خلال طرق مثل ضبط المعلمة الفائقة أو استكشاف بنيات النماذج المختلفة. أطر عمل مثل PyTorch و TensorFlowإلى جانب مكتبات مثل Pandas لمعالجة البيانات، وهي أدوات شائعة في هذه العملية.

تحليلات البيانات مقابل المفاهيم ذات الصلة

على الرغم من ارتباطها ببعضها البعض، إلا أن تحليلات البيانات تختلف عن العديد من المصطلحات الأخرى:

  • التنقيب عن البيانات: يركز في المقام الأول على اكتشاف أنماط وعلاقات جديدة غير معروفة سابقًا في مجموعات البيانات الكبيرة. وغالبًا ما تتضمن تحليلات البيانات تحليل جوانب البيانات المعروفة أو اختبار فرضيات محددة، على الرغم من أنها يمكن أن تشمل الاكتشاف الاستكشافي. تعرف على المزيد حول دور التنقيب عن البيانات في الرؤية الحاسوبية.
  • التعلم الآلي (ML): يستخدم خوارزميات للتعلم من البيانات (غالبًا ما يتم إعدادها وتحليلها من خلال تحليلات البيانات) لإجراء تنبؤات أو قرارات دون برمجة صريحة. توفر التحليلات الرؤى والبيانات المعدة التي تستهلكها نماذج التعلم الآلي. التعلم الآلي هو طريقة لتحقيق الذكاء الاصطناعي، في حين أن تحليلات البيانات هي عملية تطبق على البيانات.
  • البيانات الضخمة: تشير إلى مجموعات البيانات الكبيرة والمعقدة للغاية. تحليلات البيانات هي عملية استخلاص القيمة والرؤى من البيانات، بغض النظر عما إذا كانت مؤهلة لأن تكون "بيانات كبيرة". تطبق تحليلات البيانات الضخمة تقنيات تحليلية خاصة على مجموعات البيانات الكبيرة هذه.
  • تصوّر البيانات: هو التمثيل البياني للبيانات والمعلومات. وهو أداة رئيسية تُستخدم ضمن العملية الأوسع لتحليلات البيانات لاستكشاف البيانات وتوصيل النتائج بفعالية. انظر الأمثلة في دليل تكامل TensorBoard الخاص بنا.
  • ذكاء الأعمال (BI): غالبًا ما يركز بشكل أكبر على التحليلات الوصفية (ما حدث) باستخدام البيانات التاريخية لإبلاغ قرارات الأعمال، عادةً من خلال لوحات المعلومات والتقارير. يمكن أن تشمل تحليلات البيانات التحليلات الوصفية والتشخيصية والتنبؤية والوصفية. اقرأ المزيد في Gartner's Gartner's Glossary's IT Glossary.

تطبيقات الذكاء الاصطناعي/التعلم الآلي في العالم الحقيقي

تلعب تحليلات البيانات دورًا أساسيًا في دفع عجلة التقدم في العديد من تطبيقات الذكاء الاصطناعي:

  1. تحليل الصور الطبية: قبل أن يتمكن نموذج الذكاء الاصطناعي من اكتشاف الحالات الشاذة في الفحوصات الطبية (مثل الأشعة السينية أو التصوير بالرنين المغناطيسي)، يتم استخدام تحليل البيانات على نطاق واسع. تتم معالجة الصور الأولية مسبقًا (تطبيعها وتغيير حجمها) وتنظيفها. يساعد التحليل الاستكشافي على فهم الاختلافات في جودة الصورة أو التركيبة السكانية للمريض ضمن مجموعات البيانات مثل مجموعة بيانات أورام الدماغ. تساعد التحليلات على تحديد الميزات ذات الصلة وتقييم أداء النموذج التشخيصي(الدقة والحساسية والخصوصية) مقابل شروح الخبراء، وتوجيه التحسينات للاستخدام السريري. تسلط موارد مثل مبادرة علوم البيانات الطبية الحيوية التابعة للمعاهد الوطنية للصحة الضوء على أهميتها. انظر كيف يمكن استخدام نماذج YOLO للكشف عن الأورام في التصوير الطبي.
  2. إدارة مخزون التجزئة القائم على الذكاء الاصطناعي: يستخدم تجار التجزئة تحليلات البيانات لتحسين مستويات المخزون وتقليل الفاقد. ويتضمن ذلك تحليل بيانات المبيعات التاريخية، وتحديد الاتجاهات الموسمية، وفهم أنماط شراء العملاء(النمذجة التنبؤية). علاوة على ذلك، يمكن لأنظمة الرؤية الحاسوبية، المدعومة بنماذج مدربة باستخدام البيانات المرئية التي تم تحليلها، مراقبة مخزون الرفوف في الوقت الفعلي. تعمل تحليلات البيانات على تقييم فعالية هذه الأنظمة من خلال تحليل دقة الكشف وربط بيانات المخزون بنتائج المبيعات، مما يتيح استراتيجيات تجديد أكثر ذكاءً. استكشف حلول الذكاء الاصطناعي السحابي منGoogle Cloud لتجارة التجزئة لحلول الصناعة. تقدم Ultralytics رؤى حول الذكاء الاصطناعي لإدارة مخزون التجزئة بشكل أكثر ذكاءً وتحقيق كفاءة البيع بالتجزئة باستخدام الذكاء الاصطناعي.

توفر تحليلات البيانات الرؤى الهامة اللازمة لبناء أنظمة الذكاء الاصطناعي والتعلم الآلي الفعالة وتنقيحها والتحقق من صحتها في مجالات متنوعة، من الرعاية الصحية إلى الزراعة والتصنيع. يمكن أن يؤدي استخدام منصات مثل Ultralytics HUB إلى تبسيط العملية من تحليل البيانات إلى نشر النموذج.

قراءة الكل