Aprende tudo sobre o novo modelo Ultralytics YOLO11 , as suas caraterísticas e aplicações em tempo real em várias indústrias. Iremos guiar-te por tudo o que precisas de saber.
Na segunda-feira, 30 de setembro, Ultralytics lançou oficialmente Ultralytics YOLO11o mais recente avanço em visão computacional, após a sua estreia no YOLO Vision 2024 (YV24), o evento híbrido anual do Ultralytics. A comunidade de IA tem estado a fervilhar de entusiasmo à medida que se apressa a explorar as capacidades do modelo. Com processamento mais rápido, maior precisão e modelos optimizados para dispositivos de ponta e implementação na nuvem, oYOLO11 redefine o que é possível em aplicações de visão computacional em tempo real.
Numa entrevista, o fundador e diretor executivo da Ultralytics , Glenn Jocher, afirmou: "O mundo está a avançar para a energia limpa, mas não com a rapidez suficiente. Queremos que os nossos modelos possam ser treinados em menos épocas, com menos aumentos e menos dados, pelo que estamos a trabalhar arduamente nesse sentido. O modelo de deteção de objectos mais pequeno, o YOLO11n, tem apenas 2,6 milhões de parâmetros - mais ou menos o tamanho de um JPEG, o que é realmente fantástico. O maior modelo de deteção de objectos, o YOLO11x, tem cerca de 56 milhões de parâmetros, e mesmo esse é incrivelmente pequeno em comparação com outros modelos. Podes treiná-los com um GPU barato, como um Nvidia GPU de cinco anos, apenas com alguma excitação e um pouco de café".
Neste artigo, vamos analisar mais detalhadamente o YOLO11, explorando as suas caraterísticas, melhorias, referências de desempenho e aplicações reais para te ajudar a compreender o que este modelo pode fazer. Vamos começar!
YOLO11 é o mais recente avanço da série YOLO (You Only Look Once) de modelos de visão computacional e oferece melhorias significativas em relação às versões anteriores, como YOLOv5 e YOLOv8. A equipa do Ultralytics incorporou o feedback da comunidade e investigação de ponta para tornar o YOLO11 mais rápido, mais preciso e mais eficiente. O YOLO11 também suporta as mesmas tarefas de visão computacional que o YOLOv8, incluindo deteção de objectos, segmentação de instâncias e classificação de imagens. De facto, os utilizadores podem mudar facilmente para YOLO11 sem terem de alterar os fluxos de trabalho existentes.
Um dos principais destaques do YOLO11 é o seu desempenho superior, tanto em termos de precisão como de velocidade, em comparação com os seus antecessores. Com menos 22% de parâmetros do que o YOLOv8m, o YOLO11m atinge uma precisão média superior (mAP) no conjunto de dados COCO, o que significa que consegue detetar objectos de forma mais precisa e eficiente. Em termos de velocidade de processamento, o YOLO11 supera os modelos anteriores, o que o torna ideal para aplicações em tempo real, em que a deteção e a resposta rápidas são fundamentais e cada milissegundo conta.
O gráfico de avaliação comparativa abaixo ilustra como o YOLO11 se destaca dos modelos anteriores. No eixo horizontal, mostra a precisão média (AP) da caixa COCO, que mede a exatidão da deteção de objectos. O eixo vertical apresenta a latência utilizando o TensorRT10 FP16 num NVIDIA T4 GPU, indicando a rapidez com que o modelo processa os dados.
Com o lançamento de Ultralytics YOLO11 , Ultralytics está a expandir a série YOLO , oferecendo modelos de código aberto e empresariais para satisfazer a procura crescente em todos os sectores.
YOLO11 apresenta cinco tamanhos de modelos distintos - Nano, Pequeno, Médio, Grande e X. Os utilizadores podem escolher o melhor modelo, dependendo das necessidades específicas da sua aplicação de visão por computador. Os cinco tamanhos oferecem flexibilidade em tarefas como classificação de imagens, deteção de objectos, segmentação de instâncias, seguimento, estimativa de pose e deteção de objectos com caixas delimitadoras orientadas (OBB). Para cada tamanho, existe um modelo disponível para cada tarefa, resultando num total de 25 modelos de código aberto que constituem o núcleo das ofertas do Ultralytics'. Estes modelos são ideais para uma vasta gama de aplicações, desde tarefas ligeiras em dispositivos de ponta, em que o modelo YOLO11n oferece uma eficiência impressionante, até aplicações de maior escala que requerem os modelos YOLO11l e YOLO11x.
Pela primeira vez, Ultralytics está a introduzir modelos empresariais, assinalando um marco importante na nossa oferta de produtos, e estamos entusiasmados por partilhar estas inovações com os nossos utilizadores. YOLO11 introduz cinco modelos proprietários concebidos especificamente para casos de utilização comercial. Estes modelos empresariais, que estarão disponíveis no próximo mês, são treinados no novo conjunto de dados proprietário da Ultralytics, constituído por mais de 1 milhão de imagens, oferecendo modelos pré-treinados mais robustos. Foram concebidos para aplicações exigentes do mundo real, como a análise de imagens médicas e o processamento de imagens de satélite, em que a deteção precisa de objectos é crucial.
Agora que já falámos sobre o que o YOLO11 oferece, vamos ver o que torna o YOLO11 tão especial.
Um dos principais desafios no desenvolvimento do YOLO11 foi encontrar o equilíbrio certo entre prioridades concorrentes: tornar os modelos mais pequenos, mais rápidos e mais precisos. Como Glenn Jocher, fundador e diretor executivo de Ultralytics, explicou: "Trabalhar na investigação e desenvolvimento de YOLO é um verdadeiro desafio, porque queremos ir em três direcções diferentes: queremos tornar os modelos mais pequenos, queremos que sejam mais precisos, mas também queremos que sejam mais rápidos em diferentes plataformas como CPU e GPU. Todos estes interesses são concorrentes, por isso tens de fazer compromissos e escolher onde fazer as alterações". Apesar destes desafios, o YOLO11 consegue um equilíbrio impressionante, proporcionando melhorias de velocidade e precisão em relação a versões anteriores como o YOLOv8.
YOLO11 traz melhorias substanciais, como a extração de caraterísticas melhorada com uma arquitetura redesenhada da espinha dorsal e do pescoço, levando a uma deteção de objectos mais precisa. O modelo também foi optimizado para velocidade e eficiência, oferecendo tempos de processamento mais rápidos e mantendo uma elevada precisão. Para além destas vantagens, oYOLO11 é altamente adaptável a diferentes ambientes, funcionando sem problemas em dispositivos periféricos, plataformas de nuvem e sistemas que utilizam GPUs NVIDIA . Esta adaptabilidade torna-o a escolha ideal para os utilizadores que necessitam de opções de implementação flexíveis em várias configurações de hardware, desde dispositivos móveis a servidores de grande escala.
YOLO11torna-o uma ferramenta fiável em muitas indústrias, especialmente quando se trata de casos de utilização complexos. Por exemplo, funciona sem problemas em dispositivos periféricos e pode ser utilizado para aplicações que requerem uma análise em tempo real em ambientes com poder de computação limitado. Um excelente exemplo disto é a condução autónoma, em que os veículos precisam de tomar decisões em fracções de segundo para manter todos em segurança. O YOLO11 ajuda a detetar e analisar objectos na estrada, como peões ou outros carros, mesmo em condições difíceis, como pouca luz ou quando os objectos estão parcialmente escondidos. A deteção rápida e precisa ajuda a evitar acidentes e garante que os veículos autónomos possam navegar em segurança.
Outro exemplo interessante do alcance do YOLO11é a sua capacidade de lidar com caixas delimitadoras orientadas (OBB). É essencial para detetar objectos que não estão perfeitamente alinhados. A deteção de objectos OBB é uma funcionalidade especialmente útil em indústrias como a agricultura, o mapeamento e a vigilância, onde as imagens contêm frequentemente objectos rodados, como colheitas ou edifícios em imagens aéreas ou de satélite. Ao contrário dos modelos tradicionais, o YOLO11 pode identificar objectos em qualquer ângulo e fornecer resultados muito mais exactos para tarefas que exigem precisão.
Começar a trabalhar com YOLO11 é simples e acessível, quer prefiras codificar ou não codificar. Para trabalhar com YOLO11 através de código, podes utilizar o pacoteUltralytics Python para treinar e implementar modelos facilmente. Se preferir uma abordagem sem código, o Ultralytics HUB permite-te experimentar o YOLO11 com apenas alguns cliques.
Para usar YOLO11 com Python, primeiro precisas de instalar o pacote Ultralytics . Dependendo das tuas preferências, podes fazer isto usando pip, conda ou Docker. Para obteres instruções detalhadas e melhores práticas relacionadas com o processo de instalação, não te esqueças de consultar o nosso Guia de Instalação deUltralytics . Ao instalar os pacotes necessários para YOLO11, se encontrares alguma dificuldade, consulta o nosso Guia de Problemas Comuns para obteres soluções e dicas.
Assim que tiveres o pacote Ultralytics instalado, a utilização de YOLO11 é simples. O trecho de código a seguir mostra o processo de carregar um modelo, treiná-lo, testar seu desempenho e exportá-lo para o formatoONNX . Para exemplos mais aprofundados e utilização avançada, consulta a documentação oficial Ultralytics , onde encontrarás guias detalhados e melhores práticas para tirar o máximo partido do YOLO11.
Para os utilizadores que preferem uma abordagem sem código, o Ultralytics HUB proporciona uma forma fácil de treinar e implementar modelos YOLO11 com apenas alguns cliques. Para começar a utilizar o HUB, basta criar uma conta na plataforma Ultralytics HUB e podes começar a treinar e a gerir os teus modelos através de uma interface intuitiva.
A comunidade de IA está constantemente a avançar no campo da visão computacional, esforçando-se por desenvolver modelos mais rápidos e mais precisos para aplicações do mundo real. Ultralytics YOLO11 é um marco importante neste esforço, trazendo maior velocidade, precisão e flexibilidade. Foi concebido para aplicações em tempo real e de ponta, tornando-o ideal para indústrias como a saúde e a condução autónoma. Quer estejas a utilizar o pacote Ultralytics Python ou o Hub Ultralytics sem código, o YOLO11 simplifica tarefas complexas de IA de visão. Fornece poderosas capacidades de visão computacional, tornando-o uma excelente escolha para programadores e empresas.
Consulta o nosso repositório GitHub e junta-te à nossa comunidade ativa para saberes mais sobre IA. Explora como a Vision AI está a impulsionar a inovação em sectores como os cuidados de saúde e a agricultura.
Começa a tua viagem com o futuro da aprendizagem automática