اكتشف كيف يمكن استخدام تقنيات الذكاء الاصطناعي للرؤية مثل اكتشاف الأجسام وتقدير الوضعية لتتبع العين واكتشاف النظرات في تطبيقات مختلفة.
الرؤية الحاسوبية هو فرع من فروع الذكاء الاصطناعي (AI) يركز على تمكين الآلات من تحليل البيانات المرئية وتفسيرها بطريقة مشابهة للبشر. أحد التطبيقات الرائعة بشكل خاص للذكاء الاصطناعي البصري هو اكتشاف النظرات، مما يجعل من الممكن للآلات تتبع وفهم المكان الذي ينظر إليه الشخص.
كبشر، يمكننا بشكل طبيعي متابعة نظرات شخص ما وفهم ما يركز عليه. على سبيل المثال، إذا كنت تتحدث إلى صديق لك ونظر فجأة نحو الباب، فقد تلتفت غريزيًا لترى ما الذي لفت انتباهه. من ناحية أخرى، لا تمتلك الآلات هذه القدرة المدمجة - فهي تحتاج إلى التدريب باستخدام تقنيات الرؤية الحاسوبية للتعرف على حركات العين وتفسير اتجاه النظرة.
من المتوقع أن تصل قيمة السوق العالمية لاكتشاف النظرات إلى 11.9 مليار دولار بحلول عام 2032، حيث تعتمد العديد من الصناعات على هذه التقنية في تطبيقات مختلفة. على سبيل المثال، يُستخدم كشف النظرات في السيارات لتحسين سلامة السائقين من خلال مراقبة مستويات الانتباه واكتشاف علامات النعاس أو التشتت.
في هذه المقالة، سنستكشف كيفية استخدام الرؤية الحاسوبية لتتبع العين واكتشاف النظرات. كما سنلقي نظرة على بعض تطبيقاته الرئيسية في مختلف الصناعات. لنبدأ!
تتبع العين واكتشاف النظرات هي تقنيات تُستخدم لتحديد تركيز انتباه الشخص من خلال تحليل حركات العين واتجاه النظرات. وبفضل التطورات في مجال الذكاء الاصطناعي وتكنولوجيا الاستشعار، أصبح من الممكن الآن تتبع عيني الشخص في الوقت الفعلي.
تقليدياً، تعتمد معظم أنظمة تتبع العين على كاميرات الأشعة تحت الحمراء (IR)، التي تكتشف حركات حدقة العين من خلال إضاءة العينين بالأشعة تحت الحمراء القريبة من الأشعة تحت الحمراء والتقاط انعكاسات القرنية. توفر هذه الأنظمة دقة عالية. ومع ذلك، فإنها غالباً ما تتطلب أغطية رأس متخصصة، والتي يمكن أن تكون غير مريحة عند ارتدائها وعرضة لمشاكل المعايرة.
مع ظهور الذكاء الاصطناعي، ينشط الباحثون في استكشاف أساليب تتبع العين القائمة على الرؤية الحاسوبية. على عكس الأنظمة التقليدية القائمة على الأشعة تحت الحمراء، تعتمد هذه الأساليب على نماذج الرؤية الحاسوبية مثل Ultralytics YOLO11 لاكتشاف ملامح الوجه مثل العينين والبؤبؤ، بالإضافة إلى إجراء تقدير وضعية الرأس. وبالإضافة إلى ذلك، صُممت نماذج التعلم العميق المتخصصة مثل GazeNet من NVIDIA خصيصاً لتقدير النظرات.
على الرغم من أن تتبع النظرات القائم على الرؤية الحاسوبية لا يزال مجالاً متطوراً، إلا أن تتبع النظرات القائم على الرؤية الحاسوبية لديه القدرة على جعل تتبع العين أكثر سهولة، مما يقلل من التكاليف ويحسن قابلية الاستخدام للتطبيقات في مجالات التسويق وعلم النفس وعلم الأعصاب.
بعد ذلك، دعنا نستكشف التحول من الأنظمة التقليدية القائمة على الأشعة تحت الحمراء إلى حلول أكثر سهولة تعتمد على البرمجيات.
قد تتساءل عما إذا كان من الممكن تتبع العين ورصد النظرات دون استخدام الذكاء الاصطناعي - فلماذا توجد أبحاث جارية حول دمج الذكاء الاصطناعي والرؤية الحاسوبية في هذه التقنيات؟ على الرغم من وجود طرق تقليدية لتتبع العين، إلا أنها غالبًا ما تعتمد على كاميرات الأشعة تحت الحمراء المتخصصة وأجهزة تعقب العين المثبتة على الرأس، والتي قد تكون باهظة الثمن ومرهقة وتتطلب ظروف إضاءة خاضعة للتحكم. ومع ذلك، تتيح الحلول القائمة على الذكاء الاصطناعي إمكانية تتبع العين باستخدام كاميرات الويب القياسية وكاميرات الهواتف الذكية، مما يقلل التكاليف ويحسن إمكانية الوصول إليها.
فيما يلي بعض العوامل الأخرى وراء تطور تقنية تتبع العين ورصد النظرات:
والآن بعد أن ناقشنا دور الرؤية الحاسوبية في تتبع العين واكتشاف النظرات، دعنا نستعرض كيف يمكن استخدام YOLO11 هنا.
يدعمYOLO11 Ultralytics YOLO11 مهام مثل اكتشاف الأجسام وتقدير الوضعية. تم تدريبه مسبقًا على مجموعة بيانات COCO، وهو يحقق دقة عالية في اكتشاف الأجسام المختلفة. وعلى وجه التحديد، بالنسبة لحل اكتشاف النظرات، يمكن أن يلعب YOLO11 دورًا داعمًا.
على الرغم من أنه لا يمكنه التنبؤ مباشرةً باتجاه النظرة، إلا أنه يمكن ضبطه بدقة لاكتشاف الوجوه والعينين والبؤبؤ، وهي عناصر أساسية لإجراء المزيد من التحليل. بمجرد تحديد هذه الميزات، يمكن للنماذج الإضافية معالجة بيانات حركة العين لتقدير اتجاه النظرة.
على سبيل المثال، لتحسين الدقة، يمكن تدريب YOLO11 على مجموعات بيانات مثل WIDER FACE لاكتشاف الوجوه. أيضًا، فيما يتعلق بإمكانيات تقدير وضعية YOLO11 يمكن أن يساعد في تتبع اتجاه الرأس، مما يعزز دقة اكتشاف النظرات.
يتميز اكتشاف النظرات، الذي يتم تمكينه بواسطة رؤية الكمبيوتر، بمجموعة واسعة من التطبيقات في مختلف الصناعات، بدءاً من تحسين السلامة في قطاع السيارات إلى تحليل التركيز في الألعاب. دعونا نستكشف كيف تستفيد المجالات المختلفة من هذه التقنية.
يتم استخدام تتبع العين في الألعاب لتوفير رؤى في الوقت الفعلي حول تركيز اللاعبين واتخاذ القرارات وأوقات رد الفعل. من خلال تتبع حركات العين، تساعد هذه التقنية اللاعبين على تحسين استراتيجياتهم، وتعزز برامج التدريب، وتحسن مشاركة الجمهور من خلال عرض المكان الذي ينظر إليه اللاعبون بصريًا خلال اللحظات الحاسمة.
ومن الأمثلة المثيرة للاهتمام على ذلك سباقات السباق، وهي رياضة سيارات افتراضية تنافسية يتسابق فيها اللاعبون باستخدام محاكاة واقعية للقيادة. يساعد تعقب العين في تحليل كيفية تركيز السائقين على المسار، والتفاعل مع الخصوم، والتنقل في المنعطفات الحادة. من خلال تتبع نظراتهم في الوقت الحقيقي، يمكن للمدربين تحديد الأنماط واكتشاف الانحرافات وتحسين استراتيجيات السباق.
بالإضافة إلى سباقات المحاكاة، يتم استخدام تتبع العين أيضًا في الألعاب التنافسية سريعة الوتيرة لتحليل ردود أفعال اللاعبين وأوقات رد الفعل وكيفية تركيزهم على العناصر الرئيسية داخل اللعبة. من خلال فهم أين ينظر اللاعب قبل القيام بحركة ما، تساعد هذه البيانات في تحسين عملية اتخاذ القرار وتحسين الدقة وتعزيز التدريب على اللعب عالي المستوى.
هناك العديد من تطبيقات الذكاء الاصطناعي للرؤية لتقدير النظرة المتعلقة بالأبحاث. ومن الأمثلة الجيدة على ذلك استخدامه في علم النفس لدراسة الانتباه والحمل المعرفي والسلوك الاجتماعي. من خلال تحليل حركات العين، يمكن للباحثين الحصول على رؤى حول الإدراك وصنع القرار وحالات الصحة العقلية مثل التوحد واضطراب فرط الحركة ونقص الانتباه وفرط الحركة ونقص الانتباه.
وعلى وجه التحديد، يساعد تتبع النظرات باستخدام الرؤية الحاسوبية في تحديد أنماط حركة العين ومدة التثبيت والانتباه البصري، والتي يمكن أن تكشف عن الحالات المعرفية والعاطفية. ومع التقدم في التعلم العميق وتقدير النظرات المستند إلى الذكاء الاصطناعي، أصبحت هذه الأساليب أكثر دقة وسهولة في الوصول إليها، مما يسمح بتطبيقات أوسع في الأبحاث العصبية.
على مر السنين، استخدم الباحثون طرقاً مختلفة لدراسة انتباه وتركيز السائقين أثناء ظروف المرور المختلفة. ومن بين هذه الطرق، كان لتتبع العينين أهمية بالغة ويمكن أن يوفر نظرة ثاقبة للمكان الذي ينظر إليه السائق أثناء القيادة.
بمساعدة نماذج الرؤية الحاسوبية، يمكن أن يؤدي اكتشاف النظرات إلى تحسين هذا التحليل من خلال تتبع حركات العين بدقة في الوقت الفعلي. يمكن أن يمنحنا هذا التحليل فهماً أفضل لسلوك السائق، مما يساعد في تحديد حالات التشتت أو الإرهاق أو الهفوات في الانتباه، الأمر الذي يمكن أن يحسّن السلامة على الطرق ويساعد في تطوير أنظمة متقدمة لمساعدة السائق.
على سبيل المثال، إذا كان السائق ينظر بعيداً عن الطريق بشكل متكرر للتحقق من هاتفه أو كان بطيئاً في الاستجابة عند التقاطعات، يمكن للنظام اكتشاف هذه السلوكيات وإصدار تنبيهات لإعادة تركيز انتباهه، مما قد يمنع وقوع الحوادث.
فيما يلي بعض الفوائد الرئيسية التي يمكن أن تجلبها تقنيات تتبع العينين واكتشاف النظرات إلى حياتنا اليومية:
في حين أن هذه الفوائد تسلط الضوء على كيفية تأثير اكتشاف النظرات بشكل إيجابي على حياتنا، إلا أنه من المهم أيضًا مراعاة التحديات التي ينطوي عليها تطبيقه. فيما يلي بعض القيود الرئيسية التي يجب وضعها في الاعتبار:
يعمل تتبع العين واكتشاف النظرات، بدعم من نماذج الرؤية الحاسوبية مثل YOLO11 على تغيير طريقة تفاعلنا مع العالم. من جعل الطرق أكثر أماناً إلى فهم السلوك البشري، أصبحت هذه التكنولوجيا مفيدة بشكل متزايد في الحياة اليومية.
في حين أن هناك تحديات مثل المخاوف المتعلقة بالخصوصية والحاجة إلى أجهزة كمبيوتر قوية، فإن التطورات في مجال الذكاء الاصطناعي والرؤية الحاسوبية تجعل تتبع العين أكثر دقة وأسهل في الاستخدام. ومع استمرار تحسنه، من المرجح أن يلعب دوراً أكبر في مجموعة من الصناعات.
لمعرفة المزيد، قم بزيارة مستودع GitHub الخاص بنا وتفاعل مع مجتمعنا. استكشف الابتكارات في قطاعات مثل الذكاء الاصطناعي في السيارات ذاتية القيادة والرؤية الحاسوبية في الزراعة على صفحات الحلول الخاصة بنا. اطّلع على خيارات الترخيص لدينا واجعل مشاريعك في مجال الذكاء الاصطناعي في الرؤية تنبض بالحياة. 🚀