Verificação verde
Link copiado para a área de transferência

Treino personalizado Ultralytics YOLO11 com conjuntos de dados de visão por computador

Descobre como a integração Roboflow pode simplificar a formação personalizada Ultralytics YOLO11 , tornando os conjuntos de dados de visão computacional de código aberto facilmente acessíveis.

Treinar um modelo de visão computacional como o Ultralytics YOLO11 envolve normalmente a recolha de imagens para o teu conjunto de dados, a sua anotação, a preparação dos dados e o ajuste fino do modelo para satisfazer os teus requisitos específicos. Embora o pacoteUltralytics Python torne estes passos simples e fáceis de utilizar, o desenvolvimento da IA de visão pode ainda assim ser moroso.

Isto torna-se particularmente verdadeiro quando estás a trabalhar com um prazo apertado ou a desenvolver um protótipo. Nestas situações, dispor de ferramentas ou integrações que simplifiquem partes do processo - como a otimização da preparação do conjunto de dados ou a automatização de tarefas repetitivas - pode fazer uma grande diferença. Ao reduzir o tempo e o esforço necessários, estas soluções ajudam-te a concentrar-te na construção e no aperfeiçoamento do teu modelo. É exatamente isso que a integração do Roboflow oferece.

A integração Roboflow permite-te aceder facilmente a conjuntos de dados do Roboflow Universe, uma grande biblioteca de conjuntos de dados de visão computacional de código aberto. Em vez de passar horas a recolher e organizar dados, pode encontrar e utilizar rapidamente conjuntos de dados existentes para iniciar o seu processo de formação YOLO11 . Essa integração torna muito mais rápida e simples a experimentação e a iteração no desenvolvimento do modelo de visão computacional.

Neste artigo, vamos ver como podes tirar partido da integração Roboflow para um desenvolvimento de modelos mais rápido. Vamos começar!

O que é o Roboflow Universe?

Roboflow O Universe é uma plataforma mantida pela Roboflow, uma empresa centrada na simplificação do desenvolvimento da visão computacional. Consiste em mais de 350 milhões de imagens, 500.000 conjuntos de dados e 100.000 modelos aperfeiçoados para tarefas como deteção de objectos, classificação de imagens e segmentação. Com contribuições de programadores e investigadores de todo o mundo, o Roboflow Universe é um centro de colaboração para quem procura iniciar ou melhorar os seus projectos de visão computacional.

Fig. 1. Exemplos de conjuntos de dados de deteção de objectos em Roboflow Universe.

Roboflow O Universe inclui as seguintes caraterísticas principais:

  • Ferramentas de exploração de conjuntos de dados: Explora, filtra e visualiza conjuntos de dados para encontrar rapidamente os recursos que se alinham com os requisitos do teu projeto.
  • Opções de exportação: Exporta dados em formatos como COCO, YOLO, TFRecord, CSV e outros para se adequar ao teu fluxo de trabalho.
  • Análise de conjuntos de dados: Obtém informações sobre vários conjuntos de dados com ferramentas de análise que fornecem visualizações de distribuições de rótulos, desequilíbrios de classes e qualidade do conjunto de dados. 
  • Controlo de versões: Vê e acede a diferentes versões de conjuntos de dados carregados por colaboradores, permitindo-te acompanhar as actualizações, comparar as alterações e escolher a versão que melhor se adequa às necessidades do teu projeto. 

A integração Roboflow ajuda-te a encontrar os dados certos

Encontrar o conjunto de dados correto é muitas vezes uma das partes mais difíceis da construção de um modelo de visão por computador. A criação de um conjunto de dados envolve normalmente a recolha de grandes quantidades de imagens, certificando-se de que são relevantes para a tua tarefa e rotulando-as com precisão. 

Este processo pode consumir muito tempo e recursos, especialmente se estiveres a experimentar diferentes abordagens num curto espaço de tempo. Até mesmo encontrar conjuntos de dados pré-existentes pode ser complicado, uma vez que muitas vezes estão dispersos por várias plataformas, não estão devidamente documentados ou não têm as anotações específicas de que precisas.

Por exemplo, se estiveres a criar uma aplicação de visão por computador para detetar ervas daninhas em campos agrícolas, podes querer testar diferentes abordagens de IA de visão, como a deteção de objectos versus a segmentação de instâncias. Isto permite-te experimentar e descobrir qual o método que funciona melhor antes de gastares tempo e esforço a recolher e rotular o teu próprio conjunto de dados.

Fig. 2. Detecta peças de automóveis utilizando YOLO11.

Utilizando a integração Roboflow , pode navegar por uma variedade de conjuntos de dados relacionados com a agricultura, incluindo os que se centram na deteção de ervas daninhas, saúde das culturas ou monitorização de campos. Estes conjuntos de dados prontos a utilizar permitem-lhe experimentar diferentes técnicas e aperfeiçoar o seu modelo sem o esforço inicial de criar os seus próprios dados. 

Como funciona a integração do Roboflow

Agora que já discutimos como podes utilizar a integração Roboflow para encontrar os conjuntos de dados certos, vamos ver como se encaixa no teu fluxo de trabalho. Depois de escolheres um conjunto de dados do Roboflow Universe, podes exportá-lo ou transferi-lo no formato YOLO11 . Depois de exportar o conjunto de dados, podes usá-lo para treinar YOLO11 de forma personalizada usando o pacote Ultralytics Python . 

Ao descarregar o teu conjunto de dados, podes reparar que o Roboflow Universe também suporta outros formatos para treinar diferentes modelos. Então, por que razão deves optar por treinar Ultralytics YOLO11 ? 

YOLO11 é a versão mais recente dos modelos Ultralytics YOLO e foi concebido para proporcionar uma deteção de objectos mais rápida e precisa. Utiliza menos 22% de parâmetros (os valores internos que um modelo ajusta durante o treino para fazer previsões) do que o YOLOv8m, mas atinge uma precisão média superior (mAP) no conjunto de dados COCO. Este equilíbrio entre velocidade e precisão faz do YOLO11 uma escolha versátil para uma vasta gama de aplicações de visão por computador, especialmente quando se trata de modelos de treino personalizados para tarefas específicas.

Vê mais detalhadamente como funciona o treino personalizado YOLO11:

  • Alimentação de dados: O modelo YOLO11 processa o seu conjunto de dados, aprendendo a detetar e a classificar objectos a partir das imagens e das suas anotações.
  • Previsão e feedback: O modelo faz previsões sobre objectos nas imagens e compara-as com as respostas corretas fornecidas no conjunto de dados.
  • Controlo do desempenho: As métricas como a precisão (detecções corretas), a recuperação (detecções falhadas) e a perda (erros de previsão) são monitorizadas para avaliar o progresso.
  • Aprendizagem iterativa: O modelo ajusta os seus parâmetros em várias rondas (épocas) para melhorar a precisão da deteção e minimizar os erros.
  • Saída do modelo final: Após o treino, o modelo optimizado é guardado e está pronto para ser implementado.

Outras integrações centradas no desenvolvimento da visão por computador

À medida que explora a integração Roboflow , notará outras integrações mencionadas na documentaçãoUltralytics . Apoiamos uma variedade de integrações relacionadas com várias fases do desenvolvimento da visão computacional. 

O objetivo é fornecer à nossa comunidade uma gama de opções, para que possas escolher o que funciona melhor para o teu fluxo de trabalho específico.

Figura 3. Uma visão geral das integrações suportadas por Ultralytics.

Para além dos conjuntos de dados, outras integrações suportadas peloUltralytics centram-se em várias partes do processo de visão computacional, como a formação, a implementação e a otimização. Aqui estão alguns exemplos de outras integrações que apoiamos:

  • Integrações de formação: Integrações como Amazon SageMaker e Paperspace Gradient simplificam os fluxos de trabalho de formação, oferecendo plataformas baseadas na nuvem para o desenvolvimento e teste eficientes de modelos.
  • Integrações de fluxo de trabalho e controlo de experiências: ClearML, MLFlow e Weights & Biases (W&B) ajudam a automatizar fluxos de trabalho, a acompanhar experiências e a melhorar a colaboração, facilitando a gestão de projectos de aprendizagem automática.
  • Integrações de otimização e implementação: CoreML, ONNX e OpenVINO permitem uma implementação optimizada em vários dispositivos e estruturas, garantindo um desempenho eficiente em plataformas como o hardware da Apple e os CPUs Intel .
  • Integrações de monitorização e visualização: O TensorBoard e o Weights & Biases fornecem ferramentas para visualizar o progresso do treino e monitorizar o desempenho, fornecendo informações detalhadas para aperfeiçoar os modelos.

YOLO11 aplicações e o papel das integrações

As integrações que suportam o desenvolvimento da visão computacional, combinadas com as capacidades fiáveis de YOLO11, facilitam a resolução de desafios do mundo real. Considera inovações como a visão computacional na fabricação, onde a IA de visão é usada para detetar defeitos em uma linha de produção - como arranhões em peças de metal ou componentes ausentes. A recolha dos dados corretos para essas tarefas pode muitas vezes ser lenta e desafiante, exigindo acesso a ambientes especializados. 

Normalmente, envolve a instalação de câmaras ou sensores ao longo das linhas de produção para captar imagens dos produtos. Estas imagens têm de ser captadas em grandes volumes, muitas vezes sob iluminação e ângulos consistentes, para garantir clareza e uniformidade. 

Uma vez captadas, as imagens têm de ser meticulosamente anotadas com etiquetas precisas para cada tipo de defeito, como riscos, amolgadelas ou componentes em falta. Este processo requer tempo e recursos substanciais, bem como conhecimentos especializados, para garantir que o conjunto de dados reflecte com precisão a variabilidade do mundo real. Factores como diferentes tamanhos, formas e materiais dos defeitos devem ser tidos em conta para criar um conjunto de dados robusto e fiável.

As integrações que fornecem conjuntos de dados prontos a utilizar facilitam tarefas como o controlo de qualidade industrial e, com as capacidades de deteção em tempo real do YOLO11, os fabricantes podem monitorizar as linhas de produção, detetar defeitos instantaneamente e melhorar a eficiência.

Fig. 4. Um exemplo de utilização do Ultraytics YOLO11 para detetar e contar as latas que estão a ser fabricadas.

Para além da indústria transformadora, as integrações relacionadas com os conjuntos de dados podem ser utilizadas em muitas outras indústrias. Ao combinar a velocidade e a precisão do YOLO11com conjuntos de dados facilmente acessíveis, as empresas podem desenvolver e implementar rapidamente soluções adaptadas às suas necessidades específicas. Considera, por exemplo, os cuidados de saúde - as integrações de conjuntos de dados podem ajudar a desenvolver soluções para analisar imagens médicas para detetar anomalias como tumores. Do mesmo modo, na condução autónoma, essas integrações podem ajudar a identificar veículos, peões e sinais de trânsito para aumentar a segurança.

Principais conclusões

Encontrar o conjunto de dados certo é muitas vezes uma das partes mais demoradas da construção de um modelo de visão computacional. No entanto, a integração Roboflow facilita a procura do melhor conjunto de dados para treinar os teus modelos Ultralytics YOLO personalizados, mesmo que sejas novo na visão computacional. 

Com acesso a uma vasta coleção de conjuntos de dados para tarefas de visão computacional, como deteção de objectos, classificação de imagens ou segmentação de instâncias, o Roboflow Universe elimina o incómodo do processo de descoberta de dados. Ajuda-o a começar rapidamente e a concentrar-se na construção do seu modelo, em vez de perder tempo a recolher e organizar dados. Esta abordagem simplificada permite aos programadores criar protótipos, iterar e desenvolver soluções de visão computacional de forma mais eficiente.

Para saber mais, visita o nosso repositório GitHub e participa na nossa comunidade. Explora as inovações em áreas como a IA em carros autónomos e a visão computacional na agricultura nas nossas páginas de soluções. 🚀

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática