Descobre como a IA de ponta permite o processamento de IA em tempo real, seguro e eficiente em dispositivos, transformando indústrias como os cuidados de saúde e os veículos autónomos.
A IA de ponta refere-se à prática de executar algoritmos de inteligência artificial (IA) diretamente em dispositivos de hardware locais, conhecidos como dispositivos de ponta, tais como smartphones, câmaras, sensores ou sistemas incorporados. Em vez de enviar dados para servidores remotos de computação em nuvem para processamento, a IA de ponta permite que a análise de dados e a tomada de decisões ocorram mais perto da fonte onde os dados são gerados. Esta abordagem aproveita os avanços no hardware, como chips de IA especializados, e modelos eficientes de aprendizagem automática (ML) para trazer a inteligência para a extremidade da rede. Permite que os dispositivos executem localmente tarefas como o reconhecimento de imagens, o processamento de linguagem natural (PNL) e a deteção de anomalias.
O processo envolve normalmente o treino de um modelo de IA, muitas vezes utilizando poderosos recursos de nuvem ou servidores locais. Uma vez treinado, o modelo é submetido a técnicas de otimização, como a quantização do modelo ou a poda do modelo, para reduzir o seu tamanho e os requisitos computacionais. Esta otimização é crucial para executar modelos de forma eficiente em dispositivos de ponta com recursos limitados, que muitas vezes têm um poder de processamento limitado (CPU/GPU), memória e duração da bateria. O modelo optimizado é então implementado no dispositivo periférico utilizando estruturas como o TensorFlow Lite, PyTorch Mobile, ONNX Runtime, ou SDKs especializados como o OpenVINO daIntel. O dispositivo pode então efetuar inferência em tempo real utilizando os seus sensores locais (por exemplo, câmaras, microfones) para processar dados e gerar conhecimentos ou acções sem necessitar de ligação constante à Internet. A gestão destas implementações pode ser simplificada utilizando plataformas como o Ultralytics HUB.
A principal diferença reside no local onde ocorre o cálculo da IA. A IA na nuvem processa dados em servidores centralizados, oferecendo vastos recursos computacionais adequados para modelos complexos e dados de formação em grande escala. No entanto, introduz latência devido à transmissão de dados e requer uma ligação fiável à Internet. A IA de ponta, pelo contrário, processa os dados localmente no dispositivo. Isto minimiza a latência, aumenta a privacidade dos dados, uma vez que as informações sensíveis não precisam de sair do dispositivo, e permite o funcionamento em ambientes offline ou com pouca largura de banda. A desvantagem é que os dispositivos de ponta têm recursos limitados, restringindo a complexidade dos modelos implementáveis. Lê mais sobre IA de ponta vs IA na nuvem.
A IA de ponta é uma aplicação específica no âmbito do domínio mais vasto da computação de ponta. A computação de ponta refere-se ao paradigma geral de deslocar as tarefas computacionais dos centros de dados centralizados para a "ponta" da rede, mais perto dos utilizadores e das fontes de dados. A IA de ponta aplica especificamente este conceito a cargas de trabalho de IA e ML, permitindo o processamento inteligente diretamente em dispositivos de ponta. Embora a computação periférica possa envolver vários tipos de processamento, a IA periférica centra-se na implementação e execução de modelos de IA localmente. Podes saber mais sobre a computação periférica aqui.
A IA de ponta está a transformar numerosas indústrias, em especial a da visão por computador (CV). O aumento da procura reflecte-se na dimensão crescente do mercado da IA de ponta.
Apesar dos seus benefícios, a IA de ponta enfrenta desafios, incluindo os recursos computacionais limitados(impacto da potência de computação) dos dispositivos de ponta, a necessidade de modelos altamente optimizados(como a eficiência do YOLOv9), a gestão da implementação e das actualizações do modelo em vários dispositivos distribuídos (muitas vezes utilizando ferramentas como o Docker) e a garantia do desempenho do modelo em condições reais variáveis. Hardware especializado como o Google Edge TPU e sensores como o Sony IMX500 ajudam a resolver algumas dessas limitações de hardware. Estruturas como a NVIDIA TensorRT também ajudam na otimização.
A IA de borda representa uma mudança significativa na forma como os recursos de IA são fornecidos, movendo a inteligência de nuvens centralizadas para dispositivos locais. Isto permite uma nova geração de aplicações de IA responsivas, privadas e fiáveis que podem funcionar eficazmente no limite da rede, tendo impacto em tudo, desde a eletrónica de consumo a sistemas industriais críticos.