Verificação verde
Link copiado para a área de transferência

A Visão por Computador impulsiona a forma como os agentes de IA de Visão tomam decisões

Aprende como os agentes de IA estão a utilizar a visão por computador para reinventar as indústrias. Explora as suas aplicações em áreas como a segurança, carros autónomos e muito mais.

Todos os sectores, desde a indústria transformadora até ao retalho, enfrentam os seus próprios desafios de processo e encontrar formas inovadoras de resolver estes problemas sempre foi fundamental para gerir empresas de sucesso. Recentemente, os agentes de IA tornaram-se uma solução popular em muitos domínios. Estes sistemas vão para além da análise de dados. Também podem tomar medidas. 

Por exemplo, os agentes de IA na indústria transformadora podem detetar defeitos em tempo real e iniciar automaticamente medidas de controlo de qualidade para manter a produção a funcionar sem problemas. Do mesmo modo, na logística e no retalho, podem monitorizar vários locais utilizando vigilância inteligente e alertar instantaneamente as equipas para actividades invulgares. 

À medida que esta tendência cresce, os agentes de IA estão a transformar ativamente as indústrias em todo o mundo. O mercado global de agentes de IA atingiu 5,1 mil milhões de dólares em 2024 e prevê-se que cresça para 47,1 mil milhões de dólares até 2030.

Figura 1. Analisa a dimensão do mercado global de agentes de IA.

Uma das principais tecnologias que impulsiona estes avanços é a visão por computador. Ao permitir que as máquinas processem e interpretem dados visuais, a Vision AI possibilita que os agentes de IA executem tarefas de visão computacional, como a deteção de objectos em tempo real, a segmentação de instâncias e o seguimento de objectos com uma precisão incrível. Faz a ponte entre o que as máquinas vêem e a forma como tomam decisões, tornando-a uma parte essencial de muitas soluções alimentadas por IA.

Neste artigo, vamos explorar os agentes de IA e a sua relação com a visão por computador. Discutiremos também os diferentes tipos de agentes de IA e a forma como são utilizados em aplicações baseadas na visão. Toca a começar!

O que são agentes de IA?

Antes de nos debruçarmos sobre os agentes de IA baseados na visão, vamos analisar os agentes de IA em geral para percebermos a versatilidade destes sistemas.

Um agente de IA é um sistema inteligente que pode compreender e responder a tarefas ou perguntas sem necessitar da ajuda de um ser humano. Muitos agentes de IA utilizam a aprendizagem automática e o processamento de linguagem natural (PNL) para lidar com uma vasta gama de tarefas, desde a resposta a perguntas básicas até à gestão de processos complexos. 

Alguns agentes de IA têm mesmo a capacidade de aprender e melhorar ao longo do tempo, ao contrário dos sistemas de IA tradicionais que dependem da intervenção humana para cada atualização. É por isso que os agentes de IA estão a tornar-se rapidamente uma parte essencial da IA. Podem automatizar tarefas, tomar decisões e interagir com o seu ambiente sem necessitarem de supervisão constante. São especialmente úteis para gerir tarefas repetitivas e demoradas.

Por exemplo, podes encontrar agentes de IA em sectores como o serviço ao cliente e a hotelaria. Os agentes de IA estão a ser utilizados para processar reembolsos e oferecer recomendações personalizadas de produtos no serviço ao cliente. Entretanto, na indústria hoteleira, podem ajudar o pessoal do hotel a gerir os pedidos dos hóspedes, a otimizar o serviço de quartos e a sugerir atracções próximas aos hóspedes. Estes exemplos mostram como os agentes de IA estão a tornar os processos diários mais rápidos e eficientes.

Compreender como funcionam os agentes de visão da IA

De seguida, vamos ver como funcionam os agentes de IA. Embora cada agente de IA seja único e concebido para tarefas específicas, todos partilham os mesmos três passos principais: perceção, tomada de decisões e ação.

Primeiro, na fase de perceção, os agentes de IA recolhem informações de diferentes fontes para compreender o que está a acontecer. Segue-se a tomada de decisões. Com base na informação que recolhem, utilizam os seus algoritmos para analisar a situação e decidir a melhor forma de agir. Por fim, passa à ação. Depois de tomarem uma decisão, executam-na - quer seja responder a uma pergunta, concluir uma tarefa ou assinalar um problema para ser tratado por um humano.

Pode parecer simples, mas dependendo do tipo de agente de IA, muitas vezes há muita coisa a acontecer nos bastidores para que estes passos funcionem. Desde a análise de dados complexos à utilização de modelos avançados de aprendizagem automática, cada agente de IA é criado para lidar com tarefas específicas à sua maneira. 

Por exemplo, enquanto muitos agentes de IA se concentram no processamento da linguagem através da PNL, outros - conhecidos como agentes de IA de visão - integram a visão por computador para tratar dados visuais. Utilizando modelos avançados de visão por computador, como o Ultralytics YOLO11os agentes de IA de visão podem efetuar uma análise de imagem mais precisa.

Fig. 2. Um exemplo de contagem de maçãs numa imagem utilizando YOLO11.

Agentes de IA de visão em carros autónomos

Vamos utilizar os automóveis autónomos como exemplo para ver como funcionam os agentes de IA de visão através dos três passos principais acima descritos:

  • Perceção: Os agentes de visão da IA nos automóveisautónomos recolhem dados visuais de câmaras e sensores instalados no veículo. Estes dados incluem imagens e vídeos do ambiente circundante, como outros veículos, peões, sinais de trânsito e sinais rodoviários.
  • Toma decisões: O agente de IA processa estes dados visuais utilizando modelos como YOLO11. Identifica objectos como carros e peões, detecta obstáculos ou mudanças súbitas de faixa e reconhece padrões como o fluxo de tráfego e os estados dos sinais. Isto ajuda o automóvel a compreender as condições da estrada em tempo real.
  • Ação: Com base na sua análise, o agente de IA toma medidas, tais como guiar para evitar um obstáculo, ajustar a velocidade ou parar num sinal vermelho. Estas decisões são tomadas rapidamente para garantir uma condução segura e eficiente.

Os carros autónomos da Waymo são um excelente exemplo desta tecnologia. Utilizam agentes de IA de visão para compreender o que os rodeia, tomar decisões em tempo real e navegar nas estradas de forma segura e eficiente sem intervenção humana.

Figura 3. Táxi autónomo da Waymo baseado em agentes de IA.

Tipos de agentes de IA de visão 

Agora que já vimos como funcionam os agentes de IA e como utilizam a visão por computador, vamos analisar os diferentes tipos de agentes de IA. Cada tipo foi concebido para tarefas específicas, desde acções simples a tomadas de decisão e aprendizagem mais complexas.

Agentes de reflexo simples

Os agentes reflexivos simples são o tipo mais básico de agente de IA. Respondem a entradas específicas com acções pré-definidas, baseadas apenas na situação atual, sem considerar qualquer histórico ou resultados futuros. Estes agentes utilizam normalmente regras "se-então" simples para orientar o seu comportamento.

No que diz respeito à análise de imagens, um simples agente reflexivo pode ser programado para detetar uma determinada cor (como o vermelho) e desencadear uma ação imediata (como destacar ou contar objectos vermelhos). Embora isto possa funcionar para tarefas simples, fica aquém em ambientes mais complexos, uma vez que o agente não aprende nem se adapta a partir de experiências anteriores.

Agentes reflexivos baseados em modelos

Os agentes reflexivos baseados em modelos são mais avançados do que os agentes reflexivos simples porque utilizam um modelo interno do seu ambiente para compreender melhor a situação. Este modelo permite-lhes lidar com informações em falta ou incompletas e tomar decisões mais informadas. 

os sistemas de câmaras de segurança com IA, por exemplo. Os agentes de IA de visão integrados nestes sistemas podem utilizar a visão por computador para analisar o que está a acontecer em tempo real. Podem comparar movimentos e acções com um modelo de comportamento normal, ajudando-os a detetar actividades invulgares, como furtos em lojas, e a assinalar potenciais ameaças à segurança com maior precisão.

Fig. 4. Um exemplo de utilização da visão por computador para detetar roubos.

Agentes baseados na utilidade

Pensa num drone utilitário utilizado para a monitorização de colheitas. Ajusta a sua trajetória de voo para cobrir mais terreno, evitando obstáculos e selecionando a melhor rota para o trabalho. Isto significa que o drone avalia várias acções potenciais, como a área a que deve dar prioridade ou a forma de navegar eficientemente, e escolhe a que maximiza a sua eficácia. 

Do mesmo modo, os agentes baseados na utilidade são concebidos para escolher a melhor ação de entre várias opções para obter o maior benefício ou resultado. Os agentes de visão da IA concebidos para este efeito podem processar e analisar diferentes entradas visuais, como imagens ou dados de sensores, e selecionar o resultado mais útil com base em critérios predefinidos. 

Fig. 5. Os drones utilitários podem ser utilizados para monitorizar as culturas.

Agentes baseados em objectivos

Os agentes baseados em objectivos são semelhantes aos agentes baseados na utilidade porque ambos pretendem atingir objectivos específicos. No entanto, os agentes baseados em objectivos concentram-se apenas nas acções que os aproximam do seu objetivo definido. Avaliam cada ação com base na forma como esta ajuda a atingir o seu objetivo, sem ponderar outros factores como o valor global ou os trade-offs.

Por exemplo, um carro autónomo funciona como um agente baseado em objectivos quando o seu objetivo é chegar a um destino. Processa dados de câmaras e sensores de IA para tomar decisões como evitar obstáculos, obedecer a sinais de trânsito e escolher as curvas certas para se manter na rota. Estas decisões são guiadas inteiramente pelo seu alinhamento com o objetivo de alcançar o destino de forma segura e eficiente. Ao contrário dos agentes baseados em utilidades, os agentes baseados em objectivos centram-se apenas no cumprimento do objetivo, sem considerar critérios adicionais como a eficiência ou a otimização.

Fig. 6. Um carro autónomo que utiliza a visão por computador para identificar objectos no seu ambiente.

Agentes de aprendizagem

Se estás familiarizado com a visão por computador, já deves ter ouvido falar de afinação - um processo em que os modelos melhoram ao aprenderem com novos dados. Os agentes de aprendizagem funcionam de forma semelhante, adaptando-se e melhorando ao longo do tempo à medida que ganham experiência. Em aplicações como o controlo de qualidade baseado na visão, estes agentes melhoram a deteção de defeitos em cada inspeção. Esta capacidade de aperfeiçoar o seu desempenho é particularmente vital em áreas como a aviação, onde a segurança e a precisão são vitais.

Agentes hierárquicos

Os agentes hierárquicos simplificam tarefas complexas, dividindo-as em etapas mais pequenas e mais fáceis de gerir. Um agente de nível superior supervisiona o processo global, tomando decisões estratégicas, enquanto os agentes de nível inferior tratam de tarefas específicas. É mais eficiente quando se trata de operações que envolvem várias etapas e execução detalhada.

Por exemplo, num armazém automatizado, um robô de nível superior pode planear o processo de separação, decidindo que itens devem ir para que áreas. Ao mesmo tempo, os robôs de nível inferior concentram-se na identificação dos artigos utilizando a visão por computador, analisando caraterísticas como o tamanho, a forma ou as etiquetas, e organizando-os nos contentores corretos. Uma divisão clara de responsabilidades ajuda o sistema a funcionar sem problemas.

Fig. 7. Um exemplo de um agente robótico de IA a selecionar embalagens.

Como começar a criar um agente de IA de visão

O núcleo de um agente de IA com capacidades de visão é um modelo de visão por computador. Um dos modelos de visão por computador mais recentes e fiáveis atualmente disponíveis é o Ultralytics YOLO11 . O YOLO11 é conhecido pela sua eficiência e precisão em tempo real, o que o torna perfeito para tarefas de visão por computador.

Eis os diferentes processos envolvidos na criação do teu próprio agente de IA com as capacidades do YOLO11:

  • Prepara um conjunto de dados: Recolhe e pré-processa imagens rotuladas relevantes para a tarefa que o teu agente de IA vai executar.
  • Treino personalizado o modelo: Treina o YOLO11 especificamente no teu conjunto de dados para melhorar a sua precisão e desempenho para a tua aplicação única.
  • Integra com um quadro de tomada de decisões: Liga o modelo treinado a um sistema que permite ao agente de IA tomar decisões com base em entradas visuais.
  • Testa e aperfeiçoa: Implementa o agente de IA, testa o seu desempenho, recolhe feedback e ajusta o modelo para melhorar a precisão e a fiabilidade.

Principais conclusões

Os agentes de IA integrados com visão computacional - agentes de IA de visão - estão a mudar as indústrias, automatizando tarefas, tornando os processos mais rápidos e melhorando a tomada de decisões. Desde cidades inteligentes que controlam o tráfego a sistemas de segurança que utilizam o reconhecimento facial, estes agentes estão a trazer novas soluções para problemas comuns. 

Também podem continuar a aprender e a melhorar ao longo do tempo, o que os torna úteis em ambientes em mudança. Com ferramentas como YOLO11, é mais fácil criar e utilizar estes agentes de IA, o que conduz a soluções mais inteligentes e mais eficientes.

Junta-te à nossa comunidade e consulta o nosso repositório GitHub para aprenderes sobre IA. Explora várias aplicações da visão por computador nos cuidados de saúde e da IA na agricultura nas nossas páginas de soluções. Dá uma vista de olhos às opções de licenciamento disponíveis para começares!

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática