Revisita a palestra YOLO Vision 2024 de Dmitriy Pastushenkov e Adrian Boguszewski sobre a otimização de modelos YOLO com Intel OpenVino e a execução de inferências em tempo real no AI PC de Intel.
YOLO O Vision 2024 (YV24), o evento híbrido anual do Ultralytics, reuniu entusiastas da IA, programadores e especialistas de todo o mundo para explorar as mais recentes inovações no domínio da visão computacional. O YV24 foi uma excelente oportunidade e uma plataforma para discutir novos avanços. O evento contou com a presença dos principais intervenientes na indústria da IA, que apresentaram as suas últimas inovações. Entre eles estava o Intel, que participou no evento apresentando uma palestra sobre o seu novo e inovador PC de IA e a integração doIntel OpenVino com Ultralytics YOLO modelos como Ultralytics YOLO11.
A palestra foi conduzida por Adrian Boguszewski, um evangelista de software que foi coautor do conjunto de dados LandCover.ai e educa os programadores sobre o kit de ferramentas Intel's OpenVINO , e Dmitriy Pastushenkov, um evangelista de PC de IA com mais de 20 anos de experiência em automação industrial e IA. Durante o evento, Adrian partilhou o seu entusiasmo e disse: "Hoje é um grande evento, não só porque Ultralytics entregou uma nova versão de YOLO , mas também porque podemos apresentar este novo modelo a funcionar no nosso novo hardware, bem como uma nova versão de OpenVINO."
Neste artigo, vamos analisar os principais destaques da palestra deIntelno YV24, aprofundando os detalhes do seu PC de IA, o Intel Core Ultra 200V Series, e como se integram com os modelos Ultralytics YOLO utilizando o kit de ferramentas OpenVINO . Toca a começar!
Dmitriy começou a sua intervenção com uma análise das principais diferenças entre a IA tradicional e a IA generativa. A atenção centrou-se na forma como estas tecnologias e os seus casos de utilização estão a evoluir em 2024. As técnicas tradicionais de IA, como a visão por computador e o processamento de linguagem natural, têm sido essenciais para tarefas como a estimativa de pose, a deteção de objectos e o reconhecimento de voz. A IA generativa, no entanto, representa uma nova vaga de tecnologia de IA que envolve aplicações como chatbots, geração de texto para imagem, escrita de código e até texto para vídeo.
Dmitriy chamou a atenção para a diferença de escala entre os dois. Explicou que, enquanto os modelos tradicionais de IA consistem em milhões de parâmetros, os modelos de IA generativa funcionam a uma escala muito maior. Os modelos de IA generativa envolvem frequentemente milhares ou mesmo milhares de milhões de parâmetros, o que os torna muito mais exigentes do ponto de vista computacional.
Dmitriy apresentou o Intel AI PC como uma nova solução de hardware concebida para enfrentar os desafios crescentes de executar modelos de IA tradicionais e generativos de forma eficiente. O Intel AI PC é uma máquina potente e eficiente em termos energéticos. É capaz de executar uma vasta gama de modelos de IA localmente, sem necessidade de processamento baseado na nuvem.
O processamento local ajuda a manter a privacidade dos dados sensíveis. Quando os modelos de IA podem funcionar independentemente das ligações à Internet, as preocupações éticas das indústrias relativamente à privacidade e à segurança são respondidas.
A força motriz por detrás do Intel AI PC é o processador Intel Core Ultra 200V Series. Este processador incorpora três componentes principais: a Unidade Central de Processamento (CPU), a Unidade de Processamento Gráfico (GPU) e a Unidade de Processamento Neural (NPU). Cada um desempenha um papel específico no tratamento de diferentes tipos de cargas de trabalho de IA. A CPU é ideal para tarefas mais pequenas e de baixa latência que requerem respostas rápidas, enquanto a GPU está optimizada para operações de elevado débito, como a execução de modelos de IA. A NPU, concebida para eficiência energética, é adequada para tarefas de longa duração, como a deteção de objectos em tempo real com modelos como YOLO11.
Foi salientado que o CPU pode fornecer até 5 TOPS (Triliões de Operações por Segundo), o GPU até 67 TOPS e a NPU fornece uma forma eficiente em termos energéticos para executar tarefas de IA continuamente sem esgotar os recursos do sistema.
O processador Intel Core Ultra 200V Series integra os três motores de IA - NPU, CPU e GPU - num único chip pequeno. O seu design é perfeitamente adequado para dispositivos compactos, como computadores portáteis, sem sacrificar o desempenho.
O processador também inclui RAM incorporada, eliminando a necessidade de placas gráficas separadas. Isto ajuda a reduzir o consumo de energia e mantém o dispositivo compacto. Dmitriy também destacou a flexibilidade do processador. Os utilizadores podem decidir se querem executar modelos de IA no CPU, GPU, ou NPU, dependendo da tarefa. Por exemplo, a deteção de objectos com modelos YOLO11 pode ser executada em qualquer um destes motores, enquanto tarefas mais complexas, como a geração de texto para imagem, podem utilizar simultaneamente o GPU e a NPU para um melhor desempenho.
Durante a apresentação, Dmitriy tirou o chip do bolso, dando a todos uma noção clara do quão pequeno ele realmente é - apesar da sua capacidade de lidar com tarefas de IA tão avançadas. Foi uma forma divertida e memorável de mostrar como o Intel está a trazer poderosas capacidades de IA para dispositivos mais portáteis e práticos.
Depois de apresentar os mais recentes avanços de hardware do Intel, Dmitriy mudou para a pilha de software do Intel que suporta IA. Apresentou o , a estrutura de código aberto do concebida para otimizar e implementar modelos de IA de forma eficiente em diferentes dispositivos. Apresentou OpenVINO, a estrutura de código aberto de Intelconcebida para otimizar e implementar modelos de IA de forma eficiente em diferentes dispositivos. OpenVINO vai além das tarefas visuais, alargando o seu suporte a modelos de IA utilizados para processamento de linguagem natural, processamento de áudio, transformadores, etc.
OpenVINO é compatível com plataformas populares como PyTorchTensorFlow, e ONNXe os programadores podem incorporá-lo facilmente nos seus fluxos de trabalho. Um recurso importante que ele destacou foi a quantização. A quantização comprime os pesos dos modelos para reduzir seu tamanho, de modo que modelos grandes possam ser executados sem problemas em dispositivos locais, sem precisar da nuvem. OpenVINO funciona em vários frameworks, rodando em CPU, GPU, NPU, FPGA ou até mesmo em dispositivos ARM, e suporta Windows, Linux e macOS. Dmitriy também mostrou ao público como é fácil começar a usar o OpenVINO.
Na segunda parte da palestra, o microfone foi passado para Adrian, que explicou a integração perfeita entre os modelos Ultralytics YOLO e o kit de ferramentas OpenVINO da Intel, simplificando o processo de implantação do modeloYOLO . Ele deu uma explicação passo a passo de como exportar um modelo YOLO usando o pacoteUltralytics Python para o formato OpenVINO é rápido e direto. Esta integração torna muito mais fácil para os programadores optimizarem os seus modelos para o hardware Intel e tirarem o máximo partido de ambas as plataformas.
Adrian demonstrou que, uma vez treinado um modelo Ultralytics YOLO , os utilizadores podem exportá-lo utilizando alguns sinalizadores simples da linha de comandos. Por exemplo, os utilizadores podem especificar se pretendem exportar o modelo como uma versão de vírgula flutuante para máxima precisão ou como uma versão quantizada para maior velocidade e eficiência. Destacou também a forma como os programadores podem gerir este processo diretamente através do código, utilizando opções como a quantização INT8 para melhorar o desempenho sem sacrificar demasiada precisão.
Pondo em prática toda esta teoria, a equipa do Intel apresentou uma demonstração em tempo real da deteção de objectos YOLO11 no PC Intel AI. Adrian mostrou como o sistema lidou com o modelo em diferentes processadores, alcançando 36 quadros por segundo (FPS) no CPU com um modelo de ponto flutuante, mais de 100 FPS no GPU integrado e 70 FPS com a versão quantizada INT8. Conseguiram mostrar a eficiência com que o Intel AI PC pode gerir tarefas complexas de IA.
Salientou também que o sistema pode executar modelos em paralelo, utilizando o CPU, GPU e NPU em conjunto para tarefas em que todos os dados ou fotogramas de vídeo estão disponíveis antecipadamente. Isto é útil quando processa cargas pesadas como vídeos. O sistema pode dividir a carga de trabalho entre diferentes processadores, tornando-a mais rápida e eficiente.
Para terminar, Adrian referiu que os utilizadores podiam experimentar as demonstrações em casa, incluindo soluções como a contagem de pessoas e a gestão inteligente de filas de espera. Em seguida, apresentou uma demonstração de bónus em que os utilizadores podiam introduzir instruções para gerar imagens de sonho em tempo real no GPU. Demonstrou a versatilidade do Intel AI PC tanto para tarefas de IA tradicionais como para projectos de IA criativos e generativos.
No evento, a Intel teve um stand onde apresentou uma demonstração de deteção de objectos em tempo real utilizando a YOLO11, executada no seu Intel AI PC. Os participantes puderam ver o modelo em ação, optimizado com OpenVINO, e implementado no processador Intel Core Ultra 200V.
No stand Intel , Dmitry partilhou: "Esta é a minha primeira vez na YOLO Vision e estou feliz por estar em Madrid. Estamos a apresentar o modelo YOLO11 de Ultralytics, executado no processador Intel Core Ultra 200V. Apresenta um excelente desempenho e utilizamos o OpenVINO para otimizar e implementar o modelo. Foi muito fácil colaborar com Ultralytics e executar o modelo no hardware Intel mais recente, utilizando o CPU, GPU e NPU." O stand também tinha alguns brindes divertidos, como t-shirts e computadores portáteis para os participantes levarem para casa.
IntelA palestra técnica da YV24, com os processadores Intel Core Ultra 200V Series, mostrou como o kit de ferramentas OpenVINO optimiza modelos de IA como Ultralytics YOLO11 . Esta integração permite aos utilizadores executar modelos YOLO diretamente nos seus dispositivos, proporcionando um excelente desempenho para tarefas de visão por computador, como a deteção de objectos. A principal vantagem é que os utilizadores não precisam de depender de serviços na nuvem.
Os programadores e entusiastas de IA podem executar e afinar sem esforço os modelos YOLO , utilizando totalmente hardware como CPUs, GPUs e NPUs para aplicações em tempo real. O kit de ferramentas Intel OpenVINO , em combinação com os modelos Ultralytics YOLO , abre novas possibilidades para trazer capacidades avançadas de IA diretamente para dispositivos pessoais, tornando-o uma opção ideal para programadores ansiosos por impulsionar inovações de IA em várias indústrias.
Vamos colaborar e inovar! Visita o nosso repositório GitHub para explorar as nossas contribuições e interagir com a nossa comunidade. Vê como estamos a utilizar a IA para causar impacto em sectores como o fabrico e os cuidados de saúde.
Começa a tua viagem com o futuro da aprendizagem automática