Verificação verde
Link copiado para a área de transferência

Tornar-se um engenheiro de visão computacional

Explora o poder transformador da IA de visão por computador com Ultralytics. Descobre aplicações industriais e aprende com engenheiros especializados como Muhammad Rizwan Munawar.

A visão por computador (CV) é um domínio da inteligência artificial que treina os computadores para interpretarem e compreenderem o mundo visual. A tecnologia funciona de forma muito semelhante à visão humana, mas com algumas diferenças notáveis: os seres humanos têm uma vida inteira de contexto para treinar como distinguir objectos, a que distância estão, se estão em movimento e se há algo de errado com uma imagem.

Graças aos avanços da inteligência artificial e às inovações no domínio da aprendizagem profunda e das redes neuronais, este campo tem dado grandes saltos nos últimos anos e tem conseguido ultrapassar os seres humanos em algumas tarefas relacionadas com a deteção e rotulagem de objectos.

O CV permite soluções do mundo real para indústrias como a indústria médica, por exemplo, onde é extremamente útil para implementações de diagnóstico. No entanto, a utilidade da CV também se estende a inúmeras outras aplicações, como o desporto, o retalho, a agricultura, os transportes, a produção e muito mais. Em Ultralytics, tornamos os modelos de formação e a aprendizagem automática acessíveis a todos. O nosso objetivo é ajudar-te a tirar partido do poder da Inteligência Artificial sem teres de te preocupar com todos os detalhes técnicos. Com os nossos esforços, vimos até alunos do ensino secundário começarem a treinar os seus modelos com Ultralytics HUB e YOLOv5.

"A visão por computador é uma das coisas mais notáveis que surgiram no mundo da aprendizagem profunda e da inteligência artificial. Os avanços que a aprendizagem profunda tem contribuído para o campo da visão computacional têm realmente distinguido este campo."

Wayne Thompson, cientista de dados do SAS

Os engenheiros da CV aplicam a investigação em IA de visão e aprendizagem automática para resolver problemas do mundo real. Os engenheiros de visão por computador têm geralmente uma experiência significativa em vários sistemas, como o reconhecimento de imagens, a aprendizagem automática, a IA de ponta, as redes e a comunicação, a aprendizagem profunda, a inteligência artificial, a computação avançada, a anotação de imagens, a ciência dos dados e a segmentação de imagens/vídeos.

Apresento-te o Muhammad!

Muhammad Rizwan Munawar

Muhammad Rizwan Munawar é um engenheiro de visão computacional. Concluiu o bacharelato em Informática com especialização em Inteligência Artificial na COMSATS University Islamabad, Wah Campus. A sua experiência não se limita à área da visão, porque sabe que outras competências podem ajudá-lo a crescer e a melhorar a sua carreira, pelo que também tem conhecimentos de aplicações de secretária, front-end da Web e desenvolvimento de painéis de controlo atractivos. Atualmente, trabalha como freelancer desenvolvendo soluções para diferentes casos de utilização com base nas necessidades dos seus clientes.

Como é que entraste na aprendizagem automática e na IA de visão?

"Bem, tem sido uma jornada de obstáculos e trabalho árduo e consistente. Quando comecei, nem sequer sabia o que era a deteção de objectos, mas tinha curiosidade e paixão principalmente pela IA de visão. Estava no último ano dos meus estudos quando comecei a trabalhar como freelancer, apenas para aprender as competências. Paralelamente, também comecei a aprender conceitos básicos de aprendizagem automática em vários canais do YouTube. Depois de passar 7-8 meses a trabalhar de forma consistente, desenvolvi uma boa compreensão da IA de visão e da aprendizagem profunda e decidi continuar a minha carreira profissional na área dos currículos."

Conta-nos a tua experiência com YOLOv5!

"Tenho utilizado o YOLOv5 desde que foi lançado, mas para o desenvolvimento e modificação adequados de acordo com diferentes casos de utilização, tenho utilizado o YOLOv5 há 1,5 anos.""Inicialmente, o problema com que estava a lidar relacionava-se com a deteção de objectos, pelo que comecei a explorar diferentes algoritmos relacionados com a deteção de objectos. Depois de algum tempo de pesquisa, comparei o mapa de diferentes detectores de objectos e percebi que a precisão do YOLOv5 no conjunto de dados coco era muito elevada quando comparada com outros detectores de objectos da altura. Por isso, etiquetei os meus dados e afinei o YOLOv5 nos meus dados personalizados, com o objetivo de detetar pessoas." OYOLOv5 é muito fácil de utilizar, modificar e afinar e a sua enorme comunidade está sempre disponível para ajudar se alguém encontrar um problema. As actualizações regulares do YOLOv5 facilitam-me a deteção de objectos de uma forma muito eficiente."    

3 dicas de Muhammad para principiantes

  1. Aprende regularmente novos conceitos e torna a tua rotina consistente. Muhammad atribui a consistência como um dos maiores factores do seu sucesso.
  2. Continua a pensar em novas ideias, não importa se são estúpidas! Elas vão ajudar-te a pensar sobre as coisas em profundidade. Tenta implementar estas ideias a um determinado nível e escreve-as num documento. Segue sempre esta estratégia.
  3. Desenvolve projectos relacionados com a CV. Trabalhar regularmente em projectos vai ajudar-te a aprender e a desenvolver uma paixão na tua mente pela área de CV.

Obrigado por leres sobre a viagem do Muhammad! Se quiseres saber mais sobre o seu trabalho, consulta o seu sítio Web. E, para te manteres atualizado à medida que partilhamos contigo as notícias mais recentes sobre YOLOv5 e IA de visão, segue-nos no Twitter e no Linkedin!  

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática