Verificação verde
Link copiado para a área de transferência

Integração da visão computacional na robótica com o Ultalytics YOLO11

Vê mais de perto como os modelos de visão por computador, como o Ultralytics YOLO11 , estão a tornar os robôs mais inteligentes e a moldar o futuro da robótica.

Os robôs percorreram um longo caminho desde o Unimate, o primeiro robô industrial, que foi inventado na década de 1950. O que começou por ser uma máquina pré-programada e baseada em regras, evoluiu para sistemas inteligentes capazes de executar tarefas complexas e interagir perfeitamente com o mundo real. 

Atualmente, os robôs são utilizados em todos os sectores, desde a indústria transformadora e os cuidados de saúde até à agricultura, para a automatização de diversos processos. Um fator-chave na evolução da robótica é a IA e a visão por computador, um ramo da IA que ajuda as máquinas a compreender e interpretar a informação visual.

Por exemplo, modelos de visão por computador como o Ultralytics YOLO11 estão a melhorar a inteligência dos sistemas robóticos. Quando integrada nestes sistemas, a IA de visão permite aos robôs reconhecer objectos, navegar em ambientes e tomar decisões em tempo real.

Neste artigo, vamos ver como YOLO11 pode melhorar os robôs com capacidades avançadas de visão por computador e explorar as suas aplicações em várias indústrias.

Uma visão geral da IA e da visão por computador na robótica

A principal funcionalidade de um robô depende da forma como compreende o que o rodeia. Esta consciência liga o seu hardware físico a uma tomada de decisões inteligente. Sem ela, os robots só podem seguir instruções fixas e têm dificuldade em adaptar-se a ambientes em mudança ou em lidar com tarefas complexas. Tal como os humanos dependem da visão para navegar, os robôs utilizam a visão por computador para interpretar o seu ambiente, compreender a situação e tomar as medidas adequadas.

Fig. 1. Um robô a jogar o jogo do galo utilizando a visão por computador para interpretar o tabuleiro e fazer jogadas estratégicas.

De facto, a visão por computador é fundamental para a maioria das tarefas robóticas. Ajuda os robôs a detetar objectos e a evitar obstáculos enquanto se deslocam. No entanto, para o fazer, ver o mundo não é suficiente; os robôs também têm de ser capazes de reagir rapidamente. Em situações do mundo real, mesmo um ligeiro atraso pode levar a erros dispendiosos. Modelos como o Ultralytics YOLO11 permitem que os robôs obtenham informações em tempo real e reajam instantaneamente, mesmo em situações complexas ou desconhecidas.

Conhece o Ultralytics YOLO11

Antes de nos debruçarmos sobre a forma como YOLO11 pode ser integrado em sistemas robóticos, vamos primeiro explorar as principais caraterísticas do YOLO11.

Os modelosYOLO Ultralytics suportam várias tarefas de visão computacional que ajudam a fornecer informações rápidas e em tempo real. Em particular, o Ultralytics YOLO11 oferece um desempenho mais rápido, custos computacionais mais baixos e maior precisão. Por exemplo, pode ser utilizado para detetar objectos em imagens e vídeos com elevada precisão, tornando-o perfeito para aplicações em áreas como a robótica, cuidados de saúde e fabrico. 

Apresentamos-te algumas caraterísticas impactantes que fazem do YOLO11 uma excelente opção para a robótica:

  • Facilidade de implementação: É fácil de implementar e integra-se perfeitamente numa vasta gama de plataformas de software e hardware.
  • Adaptabilidade: YOLO11 funciona bem em diferentes ambientes e configurações de hardware, oferecendo um desempenho consistente mesmo em condições dinâmicas.

Fácil de utilizar: A documentação e a interface de fácil compreensão doYOLO11ajudam a reduzir a curva de aprendizagem, tornando-o simples de integrar em sistemas robóticos.

Fig. 2. Um exemplo de análise da pose de pessoas numa imagem utilizando YOLO11.

Explora as tarefas de visão por computador possibilitadas pelo YOLO11

Vê mais de perto algumas das tarefas de visão por computador suportadas pelo YOLO11 : 

  • Deteção de objectos: A capacidade de deteção de objectos em tempo real do YOLO11 permite que os robôs identifiquem e localizem objectos no seu campo de visão instantaneamente. Isto ajuda os robôs a evitar obstáculos, a efetuar um planeamento dinâmico do caminho e a conseguir uma navegação automatizada em ambientes interiores e exteriores.
  • Segmentação de instâncias: Ao identificar os limites e as formas exactas de objectos individuais, YOLO11 equipa os robôs para realizarem operações precisas de recolha e colocação e tarefas de montagem complexas.
  • Estimativa de pose: O suporte do YOLO11para estimativa de pose permite que os robots reconheçam e interpretem os movimentos e gestos do corpo humano. É crucial para que os robôs colaborativos (cobots) trabalhem em segurança ao lado dos humanos.
  • Seguimento de objectos: YOLO11 permite seguir objectos em movimento ao longo do tempo, o que o torna ideal para aplicações relacionadas com a robótica autónoma que necessitem de monitorizar o seu ambiente em tempo real.
  • Classificação de imagens: YOLO11 pode classificar objectos em imagens, permitindo que os robôs categorizem itens, detectem anomalias ou tomem decisões com base em tipos de objectos, como a identificação de material médico em ambientes de cuidados de saúde.
Fig. 3. Tarefas de visão por computador suportadas pelo YOLO11.

IA em aplicações de robótica: Desenvolvido por YOLO11

Da aprendizagem inteligente à automação industrial, modelos como o YOLO11 podem ajudar a redefinir o que os robôs podem fazer. A sua integração na robótica demonstra como os modelos de visão por computador estão a impulsionar os avanços na automação. Vamos explorar alguns domínios chave onde YOLO11 pode ter um impacto significativo.

Ensinar robôs utilizando a visão por computador 

A visão por computador é amplamente utilizada em robôs humanóides, permitindo-lhes aprender através da observação do seu ambiente. Modelos como o YOLO11 podem ajudar a melhorar este processo, fornecendo deteção avançada de objectos e estimativa de pose, o que ajuda os robôs a interpretar com precisão as acções e comportamentos humanos.

Ao analisar movimentos e interações subtis em tempo real, os robôs podem ser treinados para reproduzir tarefas humanas complexas. Isto permite-lhes ir além das rotinas pré-programadas e aprender tarefas, como a utilização de um controlo remoto ou de uma chave de fendas, simplesmente observando uma pessoa.

Fig. 4. Um robô que imita a ação de um humano.

Este tipo de aprendizagem pode ser útil em diferentes sectores. Por exemplo, na agricultura, os robots podem observar os trabalhadores humanos a aprender tarefas como a plantação, a colheita e a gestão das culturas. Ao copiar a forma como os humanos executam estas tarefas, os robots podem ajustar-se a diferentes condições agrícolas sem terem de ser programados para cada situação.

Aplicações relacionadas com a robótica dos cuidados de saúde

Do mesmo modo, nos cuidados de saúde, a visão por computador está a tornar-se cada vez mais importante. Por exemplo, YOLO11 pode ser utilizado em dispositivos médicos para ajudar os cirurgiões em procedimentos complexos. Com funcionalidades como a deteção de objectos e a segmentação de instâncias, YOLO11 pode ajudar os robôs a detetar estruturas internas do corpo, gerir ferramentas cirúrgicas e fazer movimentos precisos.

Embora isto possa parecer algo saído da ficção científica, uma investigação recente demonstra a aplicação prática da visão por computador em procedimentos cirúrgicos. Num estudo interessante sobre dissecção robótica autónoma para colecistectomia (remoção da vesícula biliar), os investigadores integraram YOLO11 para segmentação de tecidos (classificação e separação de diferentes tecidos numa imagem) e deteção de pontos-chave de instrumentos cirúrgicos (identificação de pontos de referência específicos nos instrumentos). 

O sistema foi capaz de distinguir com precisão os diferentes tipos de tecido - mesmo quando os tecidos se deformavam (mudavam de forma) durante o procedimento - e ajustou-se dinamicamente a essas mudanças. Isto permitiu que os instrumentos robóticos seguissem trajectórias de dissecção (corte cirúrgico) precisas.

Fabrico inteligente e automação industrial

Os robôs que podem recolher e colocar objectos estão a desempenhar um papel fundamental na automatização das operações de fabrico e na otimização das cadeias de fornecimento. A sua velocidade e precisão permitem-lhes executar tarefas com um mínimo de intervenção humana, como identificar e ordenar itens. 

Com a segmentação precisa de instâncias do YOLO11, os braços robóticos podem ser treinados para detetar e segmentar objectos em movimento numa correia transportadora, recolhê-los com precisão e colocá-los em locais designados com base no seu tipo e tamanho.

Por exemplo, os fabricantes de automóveis populares estão a utilizar robôs baseados na visão para montar diferentes peças de automóveis, melhorando a velocidade e a precisão da linha de montagem. Modelos de visão por computador como o YOLO11 podem permitir que esses robôs trabalhem ao lado de trabalhadores humanos, garantindo a integração perfeita de sistemas automatizados em configurações de produção dinâmicas. Esse avanço pode levar a tempos de produção mais rápidos, menos erros e produtos de maior qualidade.

Fig. 5. Um braço robótico baseado na visão a montar um carro.

Vantagens da integração do Ultralytics YOLO11 na robótica

YOLO11 oferece várias vantagens importantes que o tornam ideal para uma integração perfeita em sistemas de robótica autónoma. Apresentamos de seguida algumas das principais vantagens:

  • Baixa latência de inferência: YOLO11 pode fornecer previsões altamente precisas com baixa latência, mesmo em ambientes dinâmicos.
  • Modelos leves: Concebidos para otimizar o desempenho, os modelos leves do YOLO11permitem que robôs mais pequenos, com menos poder de processamento, tenham capacidades de visão avançadas sem sacrificar a eficiência.
  • Eficiência energética: YOLO11 foi concebido para ser eficiente em termos energéticos, o que o torna ideal para robôs alimentados por bateria que necessitam de conservar energia, mantendo um elevado desempenho.

Limitações da IA de visão na robótica

Embora os modelos de visão por computador forneçam ferramentas poderosas para a visão robótica, há algumas limitações a considerar ao integrá-los em sistemas robóticos do mundo real. Algumas dessas limitações incluem:

  • Recolha de dados dispendiosa: O treino de modelos eficazes para tarefas específicas de robôs requer frequentemente conjuntos de dados grandes, diversificados e bem rotulados, cuja aquisição é dispendiosa.
  • Variações ambientais: Os robôs trabalham em ambientes imprevisíveis, onde factores como as condições de iluminação ou os fundos desordenados podem afetar o desempenho dos modelos de visão.
  • Problemas de calibração e alinhamento: Garantir que os sistemas de visão estão corretamente calibrados e alinhados com os outros sensores do robô é vital para um desempenho preciso, e o desalinhamento pode levar a erros na tomada de decisões.

O futuro dos avanços da robótica e da IA

Os sistemas de visão por computador não são apenas ferramentas para os robôs actuais; são blocos de construção para um futuro em que os robôs podem operar de forma autónoma. Com suas habilidades de deteção em tempo real e suporte a múltiplas tarefas, eles são perfeitos para a robótica da próxima geração.

De facto, as tendências actuais do mercado mostram que a visão por computador está a tornar-se cada vez mais essencial na robótica. Os relatórios da indústria destacam que a visão computacional é a segunda tecnologia mais utilizada no mercado global de robótica com IA. 

Fig. 6. Quota de mercado global dos robôs de IA por tecnologia.

Principais conclusões

Com a sua capacidade de processar dados visuais em tempo real, YOLO11 pode ajudar os robôs a detetar, identificar e interagir com o que os rodeia de forma mais precisa. Isto faz uma enorme diferença em áreas como a produção, onde os robôs podem colaborar com os humanos, e os cuidados de saúde, onde podem ajudar em cirurgias complexas. 

À medida que a robótica continua a avançar, a integração da visão por computador nesses sistemas será crucial para permitir que os robôs lidem com uma vasta gama de tarefas de forma mais eficiente. O futuro da robótica parece promissor, com a IA e a visão por computador a conduzirem a máquinas ainda mais inteligentes e adaptáveis.

Junta-te à nossa comunidade e consulta o nosso repositório GitHub para saberes mais sobre os recentes desenvolvimentos em IA. Explora várias aplicações de IA nos cuidados de saúde e visão por computador na agricultura nas nossas páginas de soluções. Consulta os nossos planos de licenciamento para criares as tuas próprias soluções de visão computacional.

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática