Glossário

Reconhecimento de imagens

Descobre como o reconhecimento de imagens permite à IA classificar e compreender imagens, impulsionando a inovação nos cuidados de saúde, no retalho, na segurança e muito mais.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

O reconhecimento de imagens é um ramo crucial da inteligência artificial (IA) e da visão por computador (CV) que permite às máquinas identificar e interpretar informações visuais de imagens ou vídeos. Vai além de simplesmente ver pixels; envolve a compreensão do conteúdo, como objectos, pessoas, cenas e acções representadas nos dados visuais. Esta tecnologia constitui a base de inúmeras aplicações, permitindo que os sistemas "vejam" e compreendam o mundo de uma forma semelhante à dos seres humanos.

Como funciona o reconhecimento de imagens

No seu cerne, o reconhecimento de imagens assenta fortemente na aprendizagem automática (ML), em particular nos algoritmos de aprendizagem profunda (DL). As Redes Neuronais Convolucionais (CNN) são um componente fundamental, concebido para aprender automaticamente e de forma adaptativa hierarquias espaciais de caraterísticas das imagens. O processo envolve normalmente o treino de um modelo em vastos conjuntos de dados de imagens etiquetadas, como o famoso conjunto de dados ImageNet, em que cada imagem é etiquetada com informações sobre o seu conteúdo, muitas vezes organizadas utilizando estruturas como a hierarquia WordNet. Durante o treino, o modelo aprende a associar padrões e caraterísticas visuais específicos (como arestas, texturas, formas) a diferentes etiquetas ou categorias. Arquitecturas como a ResNet têm um desempenho significativamente avançado nestas tarefas. Uma vez treinado, o modelo pode analisar imagens novas e inéditas e prever os objectos ou conceitos nelas presentes. A compreensão destes conceitos pode ser aprofundada através de recursos como a Especialização em Aprendizagem Profunda. Embora o ImageNet seja fundamental para a classificação, conjuntos de dados como o COCO também são vitais para tarefas de compreensão visual mais amplas. A formação eficaz de modelos requer um planeamento e execução cuidadosos.

Distinções de termos relacionados

Embora relacionado com outras tarefas de visão por computador, o reconhecimento de imagens é frequentemente utilizado como um termo mais lato que engloba várias capacidades específicas. É importante distingui-lo de tarefas mais restritas:

O reconhecimento de imagens pode, por vezes, referir-se especificamente à classificação de imagens, mas implica frequentemente a capacidade mais ampla de compreender o conteúdo da imagem, o que pode envolver a deteção ou a segmentação, consoante as necessidades da aplicação.

Aplicações no mundo real

O reconhecimento de imagens permite uma vasta gama de aplicações em vários sectores:

O campo está em constante evolução, impulsionado pela investigação partilhada em locais como a Conferência sobre Visão por Computador e Reconhecimento de Padrões (CVPR) e organizações como a Computer Vision Foundation (CVF). Lê informações práticas no Blogue de IAGoogle Cloud.

Ferramentas e formação

O desenvolvimento de aplicações de reconhecimento de imagem envolve frequentemente a utilização de bibliotecas e estruturas especializadas. As principais tecnologias incluem:

Lê tudo