Explora como a Edge AI e as inovações da NVIDIA, como o Jetson, Triton e o TensorRT, estão a simplificar a implementação de aplicações de visão computacional.
Graças aos recentes avanços na visão computacional e na inteligência artificial (IA), o que antes era apenas um campo de investigação está agora a conduzir a aplicações impactantes numa série de indústrias. Desde carros autónomos a imagens médicas e segurança, os sistemas de visão por computador estão a resolver problemas reais em escala.
Muitas destas aplicações envolvem a análise de imagens e vídeos em tempo real, e confiar na computação em nuvem nem sempre é prático devido à latência, aos custos e às preocupações com a privacidade. A IA de ponta é uma óptima solução nestas situações. Ao executar modelos de IA de visão diretamente em dispositivos periféricos, as empresas podem processar dados mais rapidamente, de forma mais económica e com maior segurança, tornando a IA em tempo real mais acessível.
Durante o YOLO Vision 2024 (YV24), o evento híbrido anual organizado pela Ultralytics, um dos temas centrais foi a democratização da Vision AI ao tornar a implementação mais fácil de utilizar e eficiente. Guy Dahan, Arquiteto de Soluções Sénior da NVIDIA, discutiu como as soluções de hardware e software da NVIDIA, incluindo dispositivos de computação edge, servidores de inferência, estruturas de otimização e SDKs de implementação de IA, estão a ajudar os programadores a otimizar a IA no edge.
Neste artigo, vamos explorar as principais conclusões da apresentação de Guy Dahan no YV24 e como as inovações mais recentes da NVIDIAestão a tornar a implementação da Vision AI mais rápida e mais escalável.
Guy Dahan começou a sua intervenção expressando o seu entusiasmo por se juntar virtualmente ao YV24 e o seu interesse no pacote Ultralytics Python e nos modelosYOLO do Ultraalytics, dizendo: "Tenho utilizado Ultralytics desde o dia em que foi lançado. Gosto muito do Ultralytics - já utilizava YOLOv5 antes disso, e sou um verdadeiro entusiasta deste pacote".
Em seguida, introduziu o conceito de IA de ponta, explicando que envolve a execução de cálculos de IA diretamente em dispositivos como câmaras, drones ou máquinas industriais, em vez de enviar dados para servidores de nuvem distantes para processamento.
Em vez de esperar que as imagens ou os vídeos sejam carregados, analisados e depois enviados com os resultados, a IA de ponta permite analisar os dados instantaneamente no próprio dispositivo. Isto torna os sistemas Vision AI mais rápidos, mais eficientes e menos dependentes da conetividade com a Internet. A IA de ponta é particularmente útil para aplicações de tomada de decisões em tempo real, como carros autónomos, câmaras de segurança e fábricas inteligentes.
Depois de apresentar a Edge AI, Guy Dahan destacou as suas principais vantagens, centrando-se na eficiência, na poupança de custos e na segurança dos dados. Explicou que uma das maiores vantagens é a baixa latência - uma vez que os modelos de IA processam os dados diretamente no dispositivo, não há necessidade de enviar informações para a nuvem e esperar por uma resposta.
A IA de ponta também ajuda a reduzir os custos e a proteger os dados sensíveis. O envio de grandes quantidades de dados para a nuvem, especialmente fluxos de vídeo, pode ser dispendioso. No entanto, ao processá-los localmente, reduz os custos de largura de banda e de armazenamento.
Outra vantagem importante é a privacidade dos dados, uma vez que as informações permanecem no dispositivo em vez de serem transferidas para um servidor externo. Isto é particularmente importante para as aplicações de cuidados de saúde, finanças e segurança, em que manter os dados locais e seguros é uma prioridade máxima.
Com base nestes benefícios, Guy Dahan comentou a crescente adoção da IA de ponta. Observou que desde que NVIDIA introduziu o Jetson em 2014, a utilização aumentou dez vezes. Atualmente, mais de 1,2 milhões de programadores estão a trabalhar com dispositivos Jetson.
Guy Dahan centrou-se depois nos dispositivosNVIDIA Jetson, uma família de dispositivos de computação de ponta de IA concebidos para proporcionar um elevado desempenho com baixo consumo de energia. Os dispositivos Jetson são ideais para aplicações de visão por computador em sectores como a robótica, a agricultura, os cuidados de saúde e a automação industrial. "Os Jetsons são dispositivos de IA de ponta especificamente concebidos para a IA. Posso mesmo acrescentar que, originalmente, foram concebidos sobretudo para a visão por computador", acrescentou Guy Dahan.
Os dispositivos Jetson estão disponíveis em três níveis, cada um adequado a diferentes necessidades:
Além disso, Guy Dahan falou sobre o próximo Jetson AGX Thor, que será lançado este ano, e disse que oferecerá oito vezes o desempenho GPU (Unidade de Processamento Gráfico), o dobro da capacidade de memória e um desempenho melhorado CPU (Unidade de Processamento Central). Foi especificamente concebido para robótica humanoide e aplicações avançadas de IA Edge.
Guy Dahan passou então a discutir o lado do software da Edge AI e explicou que, mesmo com hardware potente, a implementação de modelos de forma eficiente pode ser um desafio.
Um dos maiores obstáculos é a compatibilidade, uma vez que os programadores de IA trabalham frequentemente com diferentes estruturas de IA, como PyTorch e TensorFlow. A mudança entre estas estruturas pode ser difícil, exigindo que os programadores recriem ambientes para garantir que tudo funciona corretamente.
A escalabilidade é outro desafio fundamental. Os modelos de IA requerem um poder de computação significativo e, como disse Dahan, "nunca houve uma empresa de IA que quisesse menos computação". Expandir as aplicações de IA em vários dispositivos pode tornar-se rapidamente dispendioso, tornando a otimização essencial.
Além disso, os pipelines de IA são complexos, envolvendo frequentemente diferentes tipos de dados, processamento em tempo real e integração de sistemas. Os programadores fazem um grande esforço para garantir que os seus modelos interagem perfeitamente com os ecossistemas de software existentes. Ultrapassar estes desafios é uma parte crucial para tornar as implementações de IA mais eficientes e escaláveis.
Em seguida, Guy Dahan centrou a sua atenção no Servidor de InferênciaTriton da NVIDIA. Salientou que muitas empresas e startups começam o desenvolvimento de IA sem otimizar totalmente os seus modelos. Redesenhar todo um pipeline de IA a partir do zero pode ser disruptivo e demorado, dificultando o dimensionamento eficiente.
Em vez de exigir uma revisão completa do sistema, Triton permite que os programadores refinem e optimizem gradualmente os seus fluxos de trabalho de IA, integrando componentes mais eficientes sem quebrar a configuração existente. Com suporte para várias estruturas de IA, incluindo TensorFlow, PyTorch, ONNX e TensorRT, Triton permite uma implementação perfeita em ambientes de nuvem, centros de dados e dispositivos de ponta com ajustes mínimos.
Aqui estão algumas das principais vantagens do Servidor de Inferência Triton da NVIDIA:
Digamos que estás à procura de ainda mais aceleração; NVIDIA TensorRT é uma opção interessante para otimizar os teus modelos de IA. Guy Dahan explicou que TensorRT é um optimizador de aprendizagem profunda de alto desempenho criado para GPUs NVIDIA . Modelos do TensorFlow, PyTorch, ONNX e MXNet podem ser convertidos em arquivos GPU altamente eficientes usando o TensorRT.
O que torna TensorRT tão fiável são as suas optimizações específicas de hardware. Um modelo otimizado para dispositivos Jetson não terá um desempenho tão eficiente em outras GPUs porque TensorRT ajusta o desempenho com base no hardware de destino. Um modelo de visão computacional com ajuste fino pode resultar em um aumento na velocidade de inferência de até 36 vezes em comparação com modelos não otimizados.
Guy Dahan também chamou a atenção para o suporte da Ultralytics para TensorRT, falando sobre como torna a implementação do modelo de IA mais rápida e eficiente. Os modelosYOLO Ultralytics podem ser exportados diretamente para o formato TensorRT , permitindo aos programadores optimizá-los para GPUs NVIDIA sem necessidade de efetuar quaisquer alterações.
A terminar a palestra com uma nota alta, Guy Dahan apresentou o DeepStream 7.0 - uma estrutura de IA concebida para o processamento em tempo real de dados de vídeo, áudio e sensores utilizando GPUs NVIDIA . Criada para suportar aplicações de visão computacional de alta velocidade, permite a deteção, o seguimento e a análise de objectos em sistemas autónomos, segurança, automação industrial e cidades inteligentes. Ao executar a IA diretamente em dispositivos de borda, o DeepStream elimina a dependência da nuvem, reduzindo a latência e melhorando a eficiência.
Especificamente, o DeepStream pode lidar com o processamento de vídeo alimentado por IA do início ao fim. Ele suporta fluxos de trabalho de ponta a ponta, desde a decodificação e o pré-processamento de vídeo até a inferência e o pós-processamento de IA.
Recentemente, o DeepStream introduziu várias atualizações para aprimorar a implantação de IA, tornando-a mais acessível e escalável. Novas ferramentas simplificam o desenvolvimento, melhoram o rastreamento de várias câmeras e otimizam os pipelines de IA para um melhor desempenho.
Os desenvolvedores agora têm suporte expandido para ambientes Windows, recursos aprimorados de fusão de sensores para integrar dados de várias fontes e acesso a aplicativos de referência pré-criados para acelerar a implantação. Essas melhorias tornam o DeepStream uma solução mais flexível e eficiente para aplicativos de IA em tempo real, ajudando os desenvolvedores a dimensionar a análise de vídeo inteligente com facilidade.
Tal como ilustrado na apresentação de Guy Dahan no YV24, a IA de ponta está a redefinir as aplicações de visão por computador. Com os avanços em hardware e software, o processamento em tempo real está a tornar-se mais rápido, mais eficiente e económico.
À medida que mais indústrias adoptam a IA de ponta, enfrentar desafios como a fragmentação e a complexidade da implementação será fundamental para desbloquear todo o seu potencial. A adoção destas inovações conduzirá a aplicações de IA mais inteligentes e mais reactivas, moldando o futuro da visão computacional.
Torna-te parte da nossa comunidade em crescimento! Explora o nosso repositório GitHub para saberes mais sobre IA e verifica as nossas opções de licenciamento para iniciares os teus projectos de Visão de IA. Tens curiosidade sobre inovações como a IA nos cuidados de saúde e a visão por computador no fabrico? Visita as nossas páginas de soluções para saberes mais!
Começa a tua viagem com o futuro da aprendizagem automática