Découvrez comment l'IA et la vision par ordinateur alimentent la robotique moderne. Apprenez à déployer Ultralytics pour la perception en temps réel, l'autonomie et l'automatisation intelligente.
La robotique est un domaine interdisciplinaire situé à la convergence de l'ingénierie, de l'informatique et de la technologie, consacré à la conception, à la construction et au fonctionnement de machines programmables appelées robots. Alors que la robotique traditionnelle se concentrait sur des tâches mécaniques répétitives et préprogrammées, le paysage moderne a été fondamentalement transformé par l'intégration de l' intelligence artificielle (IA) et de l' apprentissage automatique (ML). Cette synergie permet aux machines de percevoir leur environnement grâce à des capteurs, de prendre des décisions autonomes et d'apprendre à partir d'interactions, évoluant ainsi d'outils d'automatisation rigides à des agents intelligents capables de naviguer dans des scénarios complexes et non structurés du monde réel .
Pour qu'un robot puisse fonctionner efficacement en dehors d'une cage contrôlée, il doit posséder une « perception », c'est-à-dire la capacité d' interpréter des données sensorielles. La vision par ordinateur (CV) agit comme la principale modalité sensorielle, traitant les entrées visuelles provenant des caméras, des capteurs LiDAR et des capteurs de profondeur. Des modèles avancés d' apprentissage profond (DL) permettent aux robots d'identifier des obstacles, de lire des panneaux ou d'inspecter des produits. Des technologies telles que Ultralytics sont essentielles dans ce domaine, car elles offrent la détection d'objets à grande vitesse nécessaire pour une réactivité en temps réel sur du matériel embarqué tel que la plateforme NVIDIA .
Les principales capacités du ML qui favorisent l'autonomie robotique comprennent :
L'application de la robotique intelligente transforme divers secteurs en améliorant l'efficacité et la sécurité.
Dans le paradigme de l'industrie 4.0, les « cobots » (robots collaboratifs) travaillent aux côtés des humains. En utilisant l' IA dans la fabrication, ces systèmes utilisent la segmentation d'images pour identifier les défauts microscopiques sur les chaînes de montage que les inspecteurs humains pourraient manquer. La Fédération internationale de robotique (IFR) signale une augmentation significative de la densité de ces systèmes automatisés intelligents à l'échelle mondiale.
Les entrepôts utilisent des AMR pour transporter des marchandises sans infrastructure fixe. Contrairement aux anciens véhicules à guidage automatique (AGV) qui suivaient des bandes magnétiques, les AMR utilisent une navigation autonome alimentée par l' IA de pointe pour contourner dynamiquement les obstacles. Cette capacité est essentielle à l'IA moderne dans le domaine de la logistique, car elle optimise le débit de la chaîne d'approvisionnement.
Il est essentiel de distinguer la robotique physique de l' automatisation robotisée des processus (RPA), car ces termes se confondent souvent dans le contexte commercial.
Bien que les deux visent à accroître l'automatisation, la robotique manipule des atomes, tandis que la RPA manipule des bits.
Le déploiement de modèles de vision sur des robots nécessite souvent une optimisation pour une faible latence d'inférence afin de garantir la sécurité. Des intergiciels tels que le Robot Operating System (ROS) sont couramment utilisés pour combler le fossé entre les algorithmes de vision et les actionneurs matériels. Avant le déploiement, les développeurs utilisent souvent Ultralytics pour annoter des ensembles de données spécialisés et gérer le cycle de vie de la formation dans le cloud.
L'exemple suivant montre comment un Python peut utiliser un modèle de vision pour detect dans le flux d'une caméra, une exigence de sécurité courante pour les robots mobiles :
from ultralytics import YOLO
# Load a lightweight YOLO26 model optimized for edge devices
model = YOLO("yolo26n.pt")
# Process a live camera feed (source=0) with a generator for efficiency
results = model.predict(source=0, stream=True)
for result in results:
# Check if a person (class index 0) is detected with high confidence
if result.boxes.conf.numel() > 0 and 0 in result.boxes.cls:
print("Person detected! Triggering stop command.")
# robot.stop() # Hypothetical hardware interface call
Le domaine tend vers des robots polyvalents capables d'effectuer plusieurs tâches à la fois plutôt que vers des machines spécialisées à fonction unique . Les innovations dans les modèles de base permettent aux robots de comprendre les instructions en langage naturel, ce qui les rend accessibles aux utilisateurs non techniciens. En outre, les progrès de l'IA dans le domaine agricole conduisent à la mise en place de flottes agricoles entièrement autonomes, capables de désherber, de semer et de récolter avec précision, réduisant ainsi l'utilisation de produits chimiques et les coûts de main-d'œuvre. Les recherches menées par des institutions telles que le Laboratoire d'informatique et d'intelligence artificielle du MIT continuent de repousser les limites de la robotique souple et de l'interaction homme-robot.