شيك أخضر
تم نسخ الرابط إلى الحافظة

تعمل نماذج Google Gemini Robotics من Google Gemini Robotics على تشغيل روبوتات أكثر ذكاءً

استكشف كيف تعمل Google Gemini Robotics على تعزيز الروبوتات التي تعمل بالذكاء الاصطناعي بذكاء متعدد الوسائط، مما يعزز القدرة على التكيف والبراعة والتفاعل البشري السلس.

لعقود من الزمن، كانت الروبوتات ترمز إلى المستقبل، حيث ظهرت في مختبرات الأبحاث وأفلام الخيال العلمي وعروض النماذج الأولية المتطورة في الصناعة. والآن، وبفضل التقدم الأخير في مجال الذكاء الاصطناعي (AI) ، فإن هذه النماذج الأولية تتجاوز البيئات الخاضعة للرقابة إلى تطبيقات العالم الحقيقي. 

على وجه التحديد، مع Gemini Robotics، تخطو Google خطوة أقرب إلى التكنولوجيا اللازمة لبناء روبوتات أكثر ذكاءً. تم إطلاق نموذج Gemini Robotics ونموذجها المصاحب، Gemini Robotics-ER (التفكير المجسّد)، الذي تم إطلاقه في 12 مارس 2025، وهما أحدث ابتكارات Google DeepMind. 

وهي مبنية على Gemini 2.0، وهو نموذج لغوي كبير متعدد الوسائط (LLM) يمكنه معالجة وتوليد أنواع مختلفة من البيانات، بما في ذلك النصوص والصور والصوت والفيديو، مما يسهل تفاعلات أكثر تنوعًا وطبيعية. تجلب هذه النماذج قدرات Gemini 2.0 متعددة الوسائط إلى العالم المادي، مما يتيح المزيد من الروبوتات الحاذقة والتفاعلية والذكية.

على سبيل المثال، على عكس الروبوتات التقليدية التي تتبع تعليمات ثابتة، يمكن للروبوتات المدمجة مع نماذج جيميني روبوتيكس معالجة الرؤية واللغة. وهذا يجعل من الممكن لها اتخاذ قرارات في الوقت الحقيقي والتكيف مع البيئات المتغيرة.

في هذه المقالة، سنستكشف في هذا المقال، سنستكشف Gemini Robotics و Gemini Robotics-ER، وكيفية عمل هذه النماذج، وميزاتها وتطبيقاتها الرئيسية. لنبدأ!

الشكل 1. تساعد روبوتات جيميني روبوتيكس الروبوتات على أداء مهام متعددة بكفاءة.

تقديم Google Gemini Robotics الروبوتية

إن Gemini Robotics من Googleهو نموذج ذكاء اصطناعي متقدم مصمم لمنح الروبوتات القدرة على الإدراك والتفكير والتفاعل في العالم المادي. وباعتباره نموذجًا للرؤية واللغة والحركة (VLA)، فإنه يسمح للروبوتات بمعالجة التعليمات وتفسير بيئتها وتنفيذ المهام المعقدة بدقة عالية.

وفي الوقت نفسه، يعمل نموذج Gemini Robotics-ER على تحسين قدرة الروبوت على فهم العلاقات المكانية لكيفية وضع الأجسام وكيفية تحركها وكيفية تفاعلها. وهذا يساعد الروبوتات على توقع الحركات وتعديل حركاتها وفقاً لذلك. 

على سبيل المثال، فكر في مهمة يحتاج فيها الروبوت إلى لف سلك حول سماعة رأس. تساعده روبوتات Gemini Robotics-ER على فهم المشهد، والتعرف على شكل السلك ومرونته، وتحديد بنية سماعة الرأس، والتنبؤ بكيفية انحناء السلك أثناء حركته. بعد ذلك، تترجم Gemini Robotics Robotics هذا الفهم إلى عمل، حيث تقوم بتنسيق كلتا اليدين للتعامل مع السلك بسلاسة، وتعديل قبضتها لتجنب التشابك، وضمان التفاف آمن.

من خلال الجمع بين الإدراك الحسي والحركة، تبتكر شركتا Gemini Robotics وGemini Robotics-ER نظاماً ذكياً يسمح للروبوتات بأداء المهام الحاذقة بكفاءة في البيئات الديناميكية.

الشكل 2. لمحة عامة عن عائلة طراز Gemini Robotics.

الذكاء الاصطناعي في الروبوتات: استكشاف كيفية عمل الروبوتات الجوزاء الروبوتية

بعد ذلك، دعنا نلقي نظرة فاحصة على كل نموذج لفهم أفضل لكيفية عمل Gemini Robotics و Gemini Robotics-ER معًا لتحقيق التوازن بين المرونة والإجراءات السريعة. 

من ناحية، يستفيد نموذج Gemini Robotics-ER من آليتين رئيسيتين: توليد التعليمات البرمجية بدون لقطات، والتعلم في سياق اللقطات القليلة (ICL). من خلال توليد التعليمات البرمجية بدون لقطات، يمكن للنموذج إنشاء تعليمات برمجية للتحكم في الروبوت بناءً على تعليمات المهمة والصور وبيانات الوقت الحقيقي دون الحاجة إلى تدريب إضافي. 

وبالمثل، يتكيف النموذج مع التعلّم بقليل من اللقطات، حيث يتكيف النموذج مع المهام الجديدة من خلال التعلم من أمثلة قليلة فقط، مما يقلل من الحاجة إلى تدريب مكثف. تتيح هذه الطرق معاً للروبوت أداء المهام المعقدة بسرعة والتكيف مع التحديات الجديدة بأقل جهد ممكن.

من ناحية أخرى، تم تصميم Gemini Robotics من أجل السرعة والكفاءة. فهو يستخدم نظاماً هجيناً يتألف من عمود فقري قائم على السحابة ووحدة فك ترميز للحركة على متن الطائرة. يقوم العمود الفقري القائم على السحابة بمعالجة المعلومات بسرعة، مع زمن استجابة للطلب إلى الاستجابة أقل من 160 ميلي ثانية. 

ثم تساعد وحدة فك التشفير المدمجة في ترجمة هذه البيانات إلى إجراءات في الوقت الفعلي. يحقق هذا النظام المشترك وقت استجابة إجمالي يبلغ حوالي 250 مللي ثانية تقريبًا، مع سرعة تحكم تبلغ 50 إجراءً في الثانية.

الشكل 3. فهم كيفية دعم Gemini Robotics للتحكم في الروبوت في الوقت الفعلي.

القدرات الرئيسية لشركة Gemini Robotics 

إليك لمحة سريعة عن ميزات Gemini Robotics الرئيسية:

  • العمومية: يمكنه التكيف مع التغيرات في الإضاءة، والخلفيات، والأشياء مع الحفاظ على دقة الحركة. كما أنه يفهم أيضاً الأوامر المعاد صياغتها أو متعددة اللغات ويمكنه ضبط الحركات حسب الظروف المختلفة.

  • التفاعلية: يمكن لهذا النموذج معالجة مجموعة واسعة من أوامر اللغة الطبيعية والاستجابة بشكل حدسي. كما يقوم بتعديل إجراءاته بناءً على التغيرات في الوقت الفعلي في البيئة، مما يجعله مثالياً للتعاون بين الإنسان والروبوت.

  • البراعة: يمكن للروبوت الذي يعمل بهذا النموذج أن يؤدي مهام معقدة ودقيقة، مثل طي الأوريغامي أو التعامل مع الأشياء الدقيقة. وسواء كانت العملية خطوة بخطوة أو إجراءات سريعة، يمكن للنموذج المساعدة في تنفيذها بكفاءة.
  • تجسيدات متعددة: يعمل عبر مختلف المنصات الروبوتية، مثل الأنظمة ثنائية الأذرع والروبوتات الشبيهة بالبشر، مع القليل من الضبط الدقيق. يتكيف بسرعة مع المهام الجديدة مع الحفاظ على الأداء العالي.
الشكل 4. تعمل شركة Google Gemini Robotics عبر منصات روبوتية مختلفة.

الإمكانات الرئيسية لشركة Gemini Robotics - ER

فيما يلي نظرة على بعض الميزات الرئيسية لـ Gemini Robotics-ER التي تساعد الروبوتات على فهم العالم والتفاعل معه:

  • اكتشاف الأجسام والتتبع: يمكن استخدامه لتحديد وتتبع الأجسام في كل من الفضاءات ثنائية الأبعاد وثلاثية الأبعاد. وباستخدام استعلامات اللغة الطبيعية، يساعد الروبوتات في العثور على الأجسام والتنبؤ بمواقعها، سواءً بناءً على النوع أو الموقع أو الوظيفة.

  • التأشير: تسمح هذه الميزة للنموذج بتحديد كائنات أو أجزاء معينة داخل الصورة باستخدام إحداثيات دقيقة. يمكن استخدامها لمساعدة الروبوتات على تحديد موقع أجسام كاملة أو أجزاء من الأجسام أو حتى المساحات الفارغة.
  • التنبؤ بالإمساك: يمكن استخدام Gemini Robotics-ER لتحديد أفضل طريقة للإمساك بالأشياء بناءً على شكلها ووظيفتها. فهو يتنبأ بمكان الإمساك بالأشياء، سواء كانت موزة أو مقبض كوب، مما يمكّن الروبوتات من التعامل مع الأشياء بعناية.

  • استدلال المسار: يمكن استخدام النموذج لتخطيط مسارات الحركة من خلال التنبؤ بتسلسل الإجراءات. على سبيل المثال، يمكن للنموذج توجيه يد الروبوت نحو أداة ما أو تحديد نقاط الطريق لمهمة معينة، مما يساعد الروبوت على إكمال المهام بكفاءة.

  • تطابق متعدد المناظر: تساعد هذه الميزة النموذج على فهم الهياكل ثلاثية الأبعاد من خلال مقارنة كيفية ظهور الأجسام من زوايا مختلفة. يمكن استخدامها لتعزيز التفكير المكاني، مما يسمح للروبوتات بالتفاعل بشكل أفضل مع الأجسام في البيئات الديناميكية.
الشكل 5. يمكن لروبوتات الجوزاء الروبوتية-ER التعامل مع مجموعة متنوعة من المهام.

تطبيقات نماذج Google Gemini Robotics من Google Gemini

والآن بعد أن ناقشنا الإمكانيات الرئيسية لروبوتات Gemini Robotics و Gemini Robotics-ER، دعونا نتعمق في تطبيقاتها في العالم الحقيقي في مختلف الصناعات.

يمكن استخدام روبوتات Google Gemini Robotics في التصنيع

عندما يتعلق الأمر بالتصنيع، فإن الدقة والسرعة مهمتان، ولكن القدرة على التكيف هي ما يجعل كل شيء يسير بسلاسة. على سبيل المثال، يمكن للروبوت الصناعي الذي يعمل بنظام Gemini تجميع نظام بكرة من خلال تحديد المكونات الصحيحة ووضعها بشكل صحيح والتعامل مع شريط مطاطي مرن بقوة دقيقة. 

ويمكنه تمديد الشريط ولفه حول البكرات وتثبيته دون أن ينكسر أو يختل. إذا تغير الإعداد أو اختلفت المهمة، يمكن للروبوت أن يتكيف دون الحاجة إلى إعادة برمجة واسعة النطاق. تقلل هذه الأتمتة الذكية من الأخطاء وتحسن الكفاءة وتحافظ على سير عمليات التصنيع بسلاسة.

الشكل 6. روبوت صناعي ثنائي الذراعين يركب شريطاً مطاطياً بدقة على نظام بكرة.

تمكين المنازل الذكية بواسطة روبوتات الجوزاء الذكية

يمكن للجداول الزمنية المزدحمة أن تجعل مواكبة الأعمال المنزلية أمراً صعباً. يمكن أن تتدخل الروبوتات الذكية للتعامل مع مهام مثل التنظيف وفرز البقالة وحتى المساعدة في إعداد الوجبات، مما يجعل الحياة اليومية أسهل. 

قد يبدو ذلك مثل روبوت يقوم بتعبئة حقيبة الغداء، ويختار بعناية المواد الغذائية ويضعها داخلها مع ضبط قبضته لحماية العناصر الهشة مثل الفاكهة أو المعلبات. حتى إذا تغير الترتيب، يمكن للروبوت أن يتكيف من تلقاء نفسه، مما يسهل الأعمال اليومية بأقل قدر من الإشراف.

الشكل 7. روبوت شبيه بالإنسان الآلي يحزم حقيبة غداء بعناية.

إيجابيات وسلبيات الاستفادة من شركة Gemini Robotics 

تعمل شركة Gemini Robotics على توسيع نطاق ما يمكن أن تفعله الروبوتات، من التصنيع الدقيق إلى المساعدة المنزلية الذكية. إليك بعض المزايا الرئيسية لاستخدام Gemini Robotics في مختلف التطبيقات: 

  • الحد الأدنى الحد الأدنى من التدريب المتطلبات: على عكس الروبوتات التقليدية، يمكن للروبوتات التي تعتمد على الروبوتات من Gemini Robotics أن تتعلم من خلال بعض العروض التوضيحية، مما يقلل من تكاليف التدريب ويجعل نشرها أسهل.

  • تعزيز السلامة: في البيئات الخطرة، يمكن للروبوتات المدمجة مع روبوتات الجوزاء أداء المهام الخطرة، مما يقلل من خطر إصابة العمال البشر.
  • ميزات قابلة للتخصيص: تعني مرونة Gemini Robotics أنه يمكن تصميمها لتلبية الاحتياجات المحددة لمختلف الصناعات أو الشركات الفردية، مما يسمح بتطبيقات متخصصة وحلول فريدة من نوعها.

بينما تقدم Gemini Robotics العديد من الفوائد، من المهم أيضًا معالجة القيود التالية:

  • تحديات العلاقات المكانية: قد تواجه هذه النماذج صعوبة في تتبع العلاقات المكانية على مدى تسلسلات الفيديو الطويلة، مما يؤثر على قدرتها على تتبع وفهم الأشياء مع مرور الوقت.
  • الافتقار إلى الدقة العددية: قد لا تكون تنبؤات النموذج، مثل النقاط والمربعات المحددة، دقيقة بما فيه الكفاية للمهام التي تتطلب تحكمًا دقيقًا، مثل المهام الروبوتية الدقيقة.
  • المهام المعقدة: قد تواجه الروبوتات الجوزاء صعوبة في التعامل مع المهام المعقدة التي تحتاج إلى تفكير متعدد الخطوات وحركات دقيقة، خاصةً في المواقف الجديدة أو غير المألوفة. 

مستقبل الذكاء الاصطناعي في مجال الروبوتات

مع استمرار تقدم الذكاء الاصطناعي، تقود نماذج مثل Gemini Robotics و Gemini Robotics-ER مستقبل الروبوتات. من المرجح أن تركز التحسينات المستقبلية على تعزيز التفكير متعدد الخطوات، مما يمكّن الروبوتات من تقسيم المهام إلى خطوات منطقية لتحقيق دقة أكبر.

هناك مجال رئيسي آخر من مجالات التطوير التي تخطط Google DeepMind للعمل عليه وهو التدريب القائم على المحاكاة. فمن خلال التعلّم في بيئات افتراضية قبل النشر في العالم الحقيقي، يمكن للروبوتات تحسين عملية اتخاذ القرارات والحركات، مما يقلل من الأخطاء في التطبيقات العملية.

ومع تطور هذه التقنيات، يمكن أن تمهد الطريق لمستقبل تكون فيه الروبوتات أكثر استقلالية وقدرة على التكيف والعمل بسلاسة إلى جانب البشر في الحياة اليومية.

الوجبات الرئيسية

تُعد Gemini Robotics خطوة كبيرة إلى الأمام في مجال الأتمتة القائمة على الذكاء الاصطناعي، حيث تربط بين الذكاء الرقمي والمهام المادية في العالم الحقيقي. من خلال الجمع بين الرؤية واللغة والتعلم القائم على الحركة، يمكن لهذه الروبوتات التعامل مع المهام المعقدة بدقة وقدرة على التكيف. 

مع استمرار الروبوتات في أن تصبح أكثر ذكاءً، من المرجح أن تلعب دوراً أكبر في الحياة اليومية، مما يغير كيفية عمل البشر والآلات معاً. إن هذا التقدم يقربنا من عالم أكثر ذكاءً وترابطاً حيث تعمل الأتمتة القائمة على الذكاء الاصطناعي على تعزيز كل من الصناعات والمهام اليومية.

كن جزءًا من مجتمعنا المتنامي! قم بزيارة مستودع GitHub الخاص بنا للتعمق في الذكاء الاصطناعي. هل تتطلع إلى بدء مشاريع الرؤية الحاسوبية الخاصة بك؟ ألقِ نظرة على خيارات الترخيص لدينا. تعرّف على المزيد حول الذكاء الاصطناعي في التصنيع والذكاء الاصطناعي البصري في صناعة السيارات على صفحات الحلول الخاصة بنا!

شعار الفيسبوكشعار تويترشعار LinkedInرمز نسخ الرابط

اقرأ المزيد في هذه الفئة

دعونا نبني المستقبل
من الذكاء الاصطناعي معا!

ابدأ رحلتك مع مستقبل التعلم الآلي