اكتشف Auto-GPT، الوكيل الذكي المستقل الذي يربط الأفكار لتحقيق الأهداف. تعرف على كيفية تكامله مع Ultralytics لأداء مهام الرؤية المتقدمة.
Auto-GPT هو وكيل ذكاء اصطناعي مستقل مفتوح المصدر مصمم لتحقيق الأهداف من خلال تقسيمها إلى مهام فرعية وتنفيذها بالتسلسل دون تدخل بشري مستمر. على عكس واجهات الدردشة الآلية القياسية حيث يتعين على المستخدم مطالبة النظام بكل خطوة، يستخدم Auto-GPT نماذج لغوية كبيرة (LLMs) لـ "ربط" الأفكار معًا. يقوم بالتوجيه الذاتي، وينتقد عمله الخاص، ويكرر الحلول، مما يؤدي بشكل فعال إلى إنشاء حلقة من التفكير والعمل حتى يتم تحقيق الهدف الأوسع. تمثل هذه القدرة تحولًا كبيرًا من أدوات الذكاء الاصطناعي التفاعلية إلى وكلاء الذكاء الاصطناعي الاستباقيين الذين يمكنهم إدارة سير العمل المعقد والمتعدد الخطوات.
تعتمد الوظيفة الأساسية لـ Auto-GPT على مفهوم يُوصف غالبًا بـ "حلقة التفكير-العمل-الملاحظة" . عند إعطاء هدف عالي المستوى — مثل "إنشاء خطة تسويقية لعلامة تجارية جديدة للقهوة" — لا يقوم الوكيل ببساطة بإنشاء استجابة نصية ثابتة. بدلاً من ذلك، يقوم بتنفيذ الدورة التالية:
يتم تشغيل هذا السلوك المستقل بواسطة نماذج أساسية متقدمة، مثل GPT-4، التي توفر قدرات الاستدلال اللازمة للتخطيط والنقد.
يوضح الذكاء الاصطناعي التوليدي التلقائي كيف يمكن تطبيق الذكاء الاصطناعي التوليدي لأداء مهام قابلة للتنفيذ بدلاً من مجرد توليد النصوص.
بينما يعالج برنامج GPT التلقائي النصوص في المقام الأول، فإن الوكلاء الحديثين متعددي الوسائط بشكل متزايد، ويتفاعلون مع العالم المادي مع العالم المادي من خلال الرؤية الحاسوبية (CV). قد يستخدم الوكيل قد يستخدم نموذج رؤية "لرؤية" بيئته قبل اتخاذ القرار.
يوضح المثال التالي كيف يمكن Python — يعمل كمكون وكيل بسيط — استخدام Ultralytics detect واتخاذ قرار بشأن الإجراء بناءً على المدخلات المرئية.
from ultralytics import YOLO
# Load the YOLO26 model to serve as the agent's "vision"
model = YOLO("yolo26n.pt")
# Run inference on an image to perceive the environment
results = model("https://ultralytics.com/images/bus.jpg")
# Agent Logic: Check for detected objects (class 0 is 'person' in COCO)
# This simulates an agent deciding if a scene is populated
if any(box.cls == 0 for box in results[0].boxes):
print("Agent Status: Person detected. Initiating interaction protocol.")
else:
print("Agent Status: No people found. Continuing patrol mode.")
من المهم التمييز بين Auto-GPT والمصطلحات الأخرى في نظام الذكاء الاصطناعي لفهم فائدته المحددة:
يشير تطوير عوامل مثل Auto-GPT إلى تحرك نحو الذكاء الاصطناعي العام (AGI) من خلال تمكين الأنظمة من التفكير بمرور الوقت. مع ازدياد قوة هذه الوكلاء، من المتوقع أن يلعبوا دورًا حاسمًا في عمليات التعلم الآلي (MLOps)، حيث يمكنهم إدارة نشر النماذج بشكل مستقل، ومراقبة انحراف البيانات، وتشغيل دورات إعادة التدريب على منصات مثل Ultralytics . ومع ذلك، فإن ظهور الوكلاء المستقلين يجلب أيضًا تحديات تتعلق بسلامة الذكاء الاصطناعي والتحكم فيه، مما يستلزم تصميمًا دقيقًا لأنظمة الأذونات وآليات الرقابة.