Tipos de técnicas de aprendizagem da IA utilizadas na visão computacional

Abirami Vina

4 min ler

6 de novembro de 2024

Explorar os diferentes tipos de técnicas de aprendizagem automática e de aprendizagem profunda utilizadas em aplicações de visão computacional, desde a aprendizagem supervisionada à aprendizagem por transferência.

A aprendizagem automática é um tipo de inteligência artificial (IA) que ajuda os computadores a aprenderem com os dados para poderem tomar decisões por si próprios, sem necessitarem de uma programação pormenorizada para cada tarefa. Envolve a criação de modelos algorítmicos que podem identificar padrões nos dados. Ao identificar padrões nos dados e aprender com eles, estes algoritmos podem melhorar gradualmente o seu desempenho ao longo do tempo.

Uma área em que a aprendizagem automática desempenha um papel crucial é a visão por computador, um domínio da IA que se centra nos dados visuais. A visão computacional utiliza a aprendizagem automática para ajudar os computadores a detetar e reconhecer padrões em imagens e vídeos. Impulsionado pelos avanços na aprendizagem automática, estima-se que o valor do mercado global da visão computacional seja de cerca de 175,72 mil milhões de dólares até 2032. 

Neste artigo, vamos analisar os diferentes tipos de aprendizagem automática utilizados na visão computacional, incluindo a aprendizagem supervisionada, não supervisionada, por reforço e por transferência, e como cada um deles desempenha um papel em diferentes aplicações. Vamos começar!

Visão geral da aprendizagem automática na visão computacional

A visão computacional baseia-se na aprendizagem automática, especialmente em técnicas como a aprendizagem profunda e as redes neuronais, para interpretar e analisar informações visuais. Estes métodos permitem que os computadores realizem tarefas de visão por computador, como a deteção de objectos em imagens, a classificação de imagens por categoria e o reconhecimento de rostos. A aprendizagem automática é também essencial para aplicações de visão por computador em tempo real, como o controlo de qualidade no fabrico e a imagiologia médica nos cuidados de saúde. Nestes casos, as redes neuronais ajudam os computadores a interpretar dados visuais complexos, como a análise de exames cerebrais para detetar tumores

De facto, muitos modelos avançados de visão por computador, como o Ultralytics YOLO11, são construídos com base em redes neuronais. 

Fig. 1. Segmentação de exames cerebrais utilizando o Ultralytics YOLO11.

Existem vários tipos de métodos de aprendizagem na aprendizagem automática, como a aprendizagem supervisionada, a aprendizagem não supervisionada, a aprendizagem por transferência e a aprendizagem por reforço, que estão a alargar os limites do que é possível na visão computacional. Nas secções seguintes, exploraremos cada um destes tipos para compreender o seu contributo para a visão computacional.

Explorar a aprendizagem supervisionada

A aprendizagem supervisionada é o tipo de aprendizagem automática mais comummente utilizado. Na aprendizagem supervisionada, os modelos são treinados utilizando dados etiquetados. Cada entrada é identificada com a saída correta, o que ajuda o modelo a aprender. À semelhança de um aluno que aprende com um professor, estes dados marcados actuam como um guia ou supervisor.

Durante o treino, o modelo recebe dados de entrada (a informação que precisa de processar) e dados de saída (as respostas corretas). Esta configuração ajuda o modelo a aprender a ligação entre as entradas e as saídas. O principal objetivo da aprendizagem supervisionada é que o modelo descubra uma regra ou padrão que ligue com precisão cada entrada à saída correta. Com este mapeamento, o modelo pode fazer previsões exactas quando encontra novos dados. Por exemplo, o reconhecimento facial na visão por computador baseia-se na aprendizagem supervisionada para identificar rostos com base nestes padrões aprendidos.

Uma utilização comum é o desbloqueio do smartphone através do reconhecimento facial. O modelo é treinado com imagens marcadas do seu rosto para que, quando for desbloquear o telemóvel, compare a imagem real com o que aprendeu. Se detetar uma correspondência, o telemóvel é desbloqueado.

Fig. 2. O reconhecimento facial pode ser utilizado para desbloquear o smartphone.

Como é que a aprendizagem não supervisionada funciona na IA?

A aprendizagem não supervisionada é um tipo de aprendizagem automática que utiliza dados não rotulados - o modelo não recebe qualquer orientação ou respostas corretas durante a formação. Em vez disso, aprende a descobrir padrões e ideias por si próprio. 

A aprendizagem não supervisionada identifica padrões utilizando três métodos principais: 

  • Agrupamento: Agrupa pontos de dados semelhantes. É útil para tarefas como a segmentação de clientes, em que clientes semelhantes podem ser agrupados com base nos seus comportamentos ou atributos.
  • Associação: É utilizada para identificar relações entre itens, ajudando a descobrir ligações nos dados (por exemplo, encontrar produtos frequentemente comprados em conjunto na análise de cabazes de compras).
  • Redução da dimensionalidade: Simplifica os conjuntos de dados através da remoção de caraterísticas redundantes, o que ajuda na visualização e no processamento. 

Uma aplicação fundamental da aprendizagem não supervisionada é a compressão de imagens, em que técnicas como o agrupamento k-means reduzem o tamanho da imagem sem afetar a qualidade visual. Os pixels são agrupados em clusters e cada cluster é representado por uma cor média, resultando numa imagem com menos cores e um tamanho de ficheiro mais pequeno.

Fig. 3. Um exemplo de compressão de imagem não supervisionada.

No entanto, a aprendizagem não supervisionada tem algumas limitações. Sem respostas predefinidas, pode ter dificuldades com a exatidão e a avaliação do desempenho. Muitas vezes, exige um esforço manual para interpretar os resultados e rotular os grupos, e é sensível a questões como valores em falta e ruído, que podem afetar a qualidade dos resultados.

Aprendizagem por reforço explicada

Ao contrário da aprendizagem supervisionada e não supervisionada, a aprendizagem por reforço não se baseia em dados de treino. Em vez disso, utiliza agentes de redes neuronais para interagir com um ambiente e atingir um objetivo específico. 

O processo envolve três componentes principais:

  • Agente: O aprendiz ou tomador de decisões.
  • Ambiente: Tudo com que o agente interage, que pode ser real ou virtual.
  • Sinal de recompensa: Um valor numérico atribuído após cada ação, que orienta o agente para o objetivo.

À medida que o agente realiza acções, afecta o ambiente, que responde com feedback. O feedback ajuda o agente a avaliar as suas escolhas e a ajustar o seu comportamento. O sinal de recompensa ajuda o agente a compreender quais as acções que o aproximam do seu objetivo.

A aprendizagem por reforço é fundamental para casos de utilização como a condução autónoma e a robótica. Na condução autónoma, tarefas como os controlos do veículo, a deteção e a prevenção de objectos aprendem com base no feedback. Os modelos são treinados utilizando agentes de redes neuronais para detetar peões ou outros objectos e tomar as medidas adequadas para evitar colisões. Do mesmo modo, na robótica, a aprendizagem por reforço permite tarefas como a manipulação de objectos e o controlo de movimentos.

Um excelente exemplo de aprendizagem por reforço em ação é um projeto da OpenAI, em que os investigadores treinaram agentes de IA para jogar o popular jogo de vídeo multijogador Dota 2. Utilizando redes neuronais, estes agentes processaram enormes quantidades de informação do ambiente do jogo para tomar decisões rápidas e estratégicas. Através de feedback contínuo, os agentes aprenderam e melhoraram ao longo do tempo, acabando por atingir um nível de competência suficientemente elevado para derrotar alguns dos melhores jogadores do jogo

Figura 4. Interpretação humana vs. interpretação da IA da matriz Dota.

Compreender os conceitos básicos da aprendizagem por transferência

A aprendizagem por transferência é diferente de outros tipos de aprendizagem. Em vez de treinar um modelo de raiz, utiliza um modelo pré-treinado num grande conjunto de dados e afina-o para uma tarefa nova, mas relacionada. Os conhecimentos adquiridos durante a formação inicial são utilizados para melhorar o desempenho da nova tarefa. A aprendizagem por transferência reduz o tempo necessário para treinar para uma nova tarefa, dependendo da sua complexidade. Funciona mantendo as camadas iniciais do modelo que captam as caraterísticas gerais e substituindo as camadas finais pelas da nova tarefa específica. 

A transferência de estilos artísticos é uma aplicação interessante da aprendizagem por transferência na visão por computador. Esta técnica permite que um modelo transforme uma imagem para corresponder ao estilo de diferentes obras de arte. Para o conseguir, uma rede neural é primeiro treinada num grande conjunto de dados de imagens emparelhadas com os seus estilos artísticos. Através deste processo, o modelo aprende a identificar caraterísticas gerais da imagem e padrões de estilo.

Uma vez treinado, o modelo pode ser ajustado para aplicar o estilo de uma pintura específica a uma nova imagem. A rede adapta-se à nova imagem, preservando as caraterísticas de estilo aprendidas, o que lhe permite criar um resultado único que combina o conteúdo original com o estilo artístico selecionado. Por exemplo, pode tirar uma fotografia de uma cadeia de montanhas e aplicar o estilo de O Grito de Edvard Munch, resultando numa imagem que capta a cena, mas com o estilo arrojado e expressivo da pintura.

Fig. 5. Um exemplo de transferência de estilo artístico utilizando a aprendizagem por transferência.

Um olhar sobre as diferenças entre os tipos de aprendizagem automática

Agora que já abordámos os principais tipos de aprendizagem automática, vamos analisar cada um deles mais detalhadamente para o ajudar a compreender qual é o mais adequado para diferentes aplicações.

  • Aprendizagem supervisionada: Este tipo é altamente preciso quando se trabalha com dados rotulados, mas requer uma grande quantidade de dados e pode ser sensível ao ruído.
  • Aprendizagem não supervisionada: É útil para explorar dados não rotulados para encontrar padrões ocultos, embora os resultados possam ser menos precisos e mais difíceis de interpretar.
  • Aprendizagem por reforço: Treina os agentes para tomarem decisões passo a passo em ambientes complexos, mas requer frequentemente um poder de computação significativo.
  • Aprendizagem por transferência: Esta abordagem utiliza modelos pré-treinados para acelerar a formação e melhorar o desempenho em novas tarefas, especialmente quando os dados são limitados.
Fig. 6. Uma comparação de todos os tipos de aprendizagem automática. Imagem do autor.

A escolha do tipo certo de aprendizagem automática depende de vários factores. A aprendizagem supervisionada funciona bem se tiver dados rotulados em abundância e uma tarefa clara. A aprendizagem não supervisionada é útil para a exploração de dados ou quando os exemplos identificados são escassos. A aprendizagem por reforço é ideal para tarefas complexas que requerem uma tomada de decisão passo a passo, enquanto a aprendizagem por transferência é óptima quando os dados são limitados ou os recursos são restritos. Ao considerar estes factores, pode selecionar a abordagem mais adequada para o seu projeto de visão computacional.

Concluir

As técnicas de aprendizagem automática podem dar resposta a uma variedade de desafios, especialmente em áreas como a visão computacional. Ao compreender os diferentes tipos de aprendizagem, supervisionada, não supervisionada, de reforço e de transferência, pode escolher a melhor abordagem para as suas necessidades.

 A aprendizagem supervisionada é óptima para tarefas que exigem elevada precisão e dados rotulados, enquanto a aprendizagem não supervisionada é ideal para encontrar padrões em dados não rotulados. A aprendizagem por reforço funciona bem em contextos complexos e baseados em decisões, e a aprendizagem por transferência é útil quando se pretende construir modelos pré-treinados com dados limitados. 

Cada método tem pontos fortes e aplicações únicas, desde o reconhecimento facial à robótica e à transferência de estilos artísticos. A escolha do tipo certo pode abrir novas possibilidades em sectores como os cuidados de saúde, a indústria automóvel e o entretenimento.

Para explorar mais, visite o nosso repositório GitHub e participe na nossa comunidade. Explore as aplicações de IA em carros autónomos e na agricultura nas nossas páginas de soluções. 🚀

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência