Compreende como o SharkEye, apresentado na YOLO Vision 2024, utiliza o Ultralytics YOLOv8 para deteção de objectos em tempo real e segurança na praia.
A monitorização de animais nos seus habitats naturais, quer se trate de gado a pastar numa quinta ou de tubarões a moverem-se perto da costa, sempre foi importante para a sua segurança e bem-estar. No entanto, observá-los manualmente não é fácil. Muitas vezes, envolve horas de paciência e concentração cuidadosa, pois os observadores têm de estar atentos a quaisquer alterações de comportamento ou movimento. Mesmo assim, é fácil deixar passar sinais subtis mas importantes.
Graças à intervenção da inteligência artificial (IA), este processo está a tornar-se mais rápido, mais inteligente e muito mais eficiente, reduzindo a pressão sobre os observadores humanos e melhorando a precisão. Em particular, a visão por computador pode ser utilizada para seguir animais, detetar perigos e tomar decisões em tempo real. Tarefas que antes demoravam horas podem agora ser feitas em minutos, abrindo novas formas de compreender o comportamento animal.
No YOLO Vision 2024 (YV24), um evento híbrido anual organizado pela Ultralytics, especialistas e inovadores reuniram-se para explorar a forma como a IA está a enfrentar os desafios do dia a dia. Alguns dos tópicos apresentados incluíram avanços na deteção de objectos em tempo real e na monitorização de animais, demonstrando como a IA está a melhorar a segurança e a eficiência em vários campos.
Um dos destaques do evento foi uma palestra de Jim Griffin, fundador do AI Master Group, em que demonstrou como a Vision AI está a tornar as praias mais seguras ao detetar tubarões antes de estes se aproximarem demasiado da costa. Explicou como utilizaram Ultralytics YOLOv8um modelo de visão computacional de ponta, para identificar com precisão os tubarões em tempo real, mesmo em condições difíceis como ondas agitadas, brilho e obstáculos subaquáticos.
Neste artigo, analisamos mais de perto o projeto SharkEye e partilhamos informações interessantes da palestra de Jim.
Jim começou a sua palestra apresentando Padaro Beach, um conhecido destino de surf na Califórnia, onde surfistas e tubarões partilham frequentemente as mesmas águas. Destacando o verdadeiro desafio da deteção de tubarões, partilhou: "É claro que é fácil detetar um tubarão se ele te morder, por isso o que queríamos fazer era identificar os tubarões de antemão."
O SharkEye foi criado para resolver este problema, com o apoio da Universidade da Califórnia, em Santa Barbara. Jim descreveu a forma como drones com câmaras de IA de alta resolução foram utilizados para voar a cerca de 200 pés acima da água, analisando o oceano em tempo real.
Se for detectado um tubarão, os alertas por SMS chegam a cerca de 80 pessoas, incluindo nadadores-salvadores, proprietários de lojas de surf e qualquer pessoa que se tenha inscrito para receber actualizações. Jim salientou que estas notificações instantâneas permitem respostas rápidas, mantendo os banhistas mais seguros quando um tubarão está perto da costa.
Jim também mencionou que o SharkEye possui um painel de controlo em tempo real onde os utilizadores podem ver as estatísticas de deteção de tubarões. Por exemplo, ao longo de 12 semanas, o sistema identificou dois tubarões grandes e 15 mais pequenos, com uma média de pouco mais de um tubarão por semana.
De seguida, apresentou Neil Nathan, o cientista que liderou os esforços por detrás do SharkEye. Apesar de ter formação em estudos ambientais e não em ciências informáticas, Nathan liderou com sucesso o projeto. Jim sublinhou a forma como as ferramentas modernas de IA, como as utilizadas no SharkEye, foram concebidas para serem acessíveis, permitindo que indivíduos sem formação técnica desenvolvam soluções com impacto.
Ao aprofundar os detalhes, Jim explicou o que está por trás do SharkEye e como a solução de deteção de tubarões não envolveu apenas uma simples tarefa de deteção de objectos. Tinha de lidar com condições dinâmicas e imprevisíveis, como algas flutuantes que podiam ser facilmente confundidas com tubarões. Ao contrário da deteção de um objeto fixo, a identificação de um tubarão requer precisão e adaptabilidade, YOLOv8 que faz do YOLOv8 a escolha ideal.
Outra vantagem do YOLOv8 foi o facto de poder ser implementado num drone sem depender de servidores na nuvem. Jim explicou como esta abordagem tornou possível ao SharkEye enviar alertas imediatos - uma parte essencial para garantir respostas atempadas em condições oceânicas imprevisíveis.
Depois de explicar como funciona o SharkEye e o esforço de colaboração que lhe está subjacente, Jim apresentou uma demonstração ao vivo.
Jim Griffin começou a sua demonstração ao vivo, conduzindo o público através de um exemplo familiar - um trecho de código "hello world" para os modelosUltralytics YOLO . Com apenas seis linhas de código Python , demonstrou como um modelo pré-treinado Ultralytics YOLOv8 podia detetar sem esforço um autocarro numa imagem.
A sua demonstração utilizou o modelo YOLOv8 Nano, uma versão leve para dispositivos de baixo consumo, como drones. O mesmo modelo foi utilizado no SharkEye para a deteção de tubarões em tempo real.
Para fornecer mais contexto, Jim mencionou que o modelo na demonstração estava a ser treinado no COCO128, um subconjunto mais pequeno do conjunto de dados COCO amplamente utilizado . O conjunto de dados COCO contém mais de 20.000 imagens em 80 categorias de objectos diferentes. Embora o COCO128 funcione bem para demonstrações rápidas, ele salientou que o SharkEye precisava de algo mais robusto - um conjunto de dados de deteção de tubarões específico para aplicações que pudesse lidar com as complexidades dos cenários do mundo real.
De acordo com Jim, a parte mais difícil do projeto SharkEye não foi treinar o modelo de IA, mas sim recolher os dados certos. Comenta: "O trabalho principal deste projeto não foi a IA. O trabalho principal deste projeto foi sobrevoar os drones durante cinco anos, selecionar as imagens dos vídeos e marcá-las adequadamente."
Descreveu como a equipa recolheu 15 000 imagens na praia de Padaro. Cada imagem teve de ser etiquetada manualmente para distinguir entre tubarões, algas e outros objectos na água. Embora o processo tenha sido lento e exigente, lançou as bases para tudo o que se seguiu.
Quando o conjunto de dados ficou pronto, Ultralytics YOLOV8 foi treinado à medida. Jim disse: "A formação propriamente dita não foi a parte mais difícil - demorou apenas 20 horas em GPUs T4 [unidades de processamento gráfico]." Acrescentou ainda que o tempo poderia ter sido reduzido para apenas cinco horas com hardware mais potente, como as GPUs A100.
Depois, Jim falou sobre como o desempenho do SharkEye foi avaliado. Ilustrou que a métrica chave era a precisão - a exatidão com que o sistema identificava os tubarões reais. Com o SharkEye a atingir uma impressionante precisão de 92%, o modelo provou ser altamente eficaz na identificação exacta de tubarões no meio do complexo ambiente oceânico.
Aprofundando a importância da precisão, Jim esclareceu por que razão a precisão era mais importante do que a recuperação neste caso. "A maior parte das vezes, as pessoas estão interessadas na recuperação, especialmente em áreas como os cuidados de saúde, em que perder um caso positivo pode ser crítico. Mas, neste caso, não sabíamos quantos tubarões andavam por aí, por isso o que nos interessava era a precisão", explicou. O SharkEye garantiu que os falsos alarmes fossem minimizados, concentrando-se na precisão, facilitando a ação rápida dos nadadores-salvadores e de outras equipas de intervenção.
Concluiu a sua intervenção comparando a IA com o desempenho humano, referindo que a precisão de 92% do SharkEye ultrapassa largamente a precisão de 60% dos peritos humanos. Sublinhou esta diferença, dizendo: "É porque somos humanos. Por muito peritos que tu ou eu sejamos, se tivermos de nos sentar em frente a um ecrã durante todo o dia à procura de tubarões, acabamos por nos distrair". Ao contrário das pessoas, os modelos de IA não se cansam nem se distraem, o que os torna uma solução fiável para tarefas que exigem uma monitorização contínua.
Uma citação intrigante da palestra de Jim Griffin, "Seis linhas de código podem salvar a tua vida um dia", capta perfeitamente o quão avançada e acessível a IA se tornou. Os modelosYOLO Ultralytics foram criados com isto em mente, tornando a tecnologia de visão por computador de ponta acessível a programadores e empresas de todas as dimensões. Ultralytics YOLO11 baseia-se nisto com inferências mais rápidas e maior precisão.
Aqui tens uma visão rápida do que distingue YOLO11 :
Estas caraterísticas fazem do YOLO11 uma excelente opção para o seguimento do comportamento animal em ambientes dinâmicos, seja numa quinta ou na natureza.
Os avanços na IA de visão estão a facilitar a resolução de desafios do mundo real, fornecendo ferramentas práticas para vários campos. Por exemplo, modelos de visão por computador como o YOLO11 podem ser utilizados para monitorizar e seguir animais em tempo real, mesmo em condições difíceis.
A apresentação de Jim Griffin no YV24 ilustrou como YOLOv8 pode ser utilizado para resolver problemas complexos com um mínimo de programação. O projeto SharkEye, que combina drones com IA para a deteção de tubarões em tempo real, mostrou como a tecnologia pode melhorar a segurança nas praias.
Foi um estudo de caso fascinante sobre a forma como a IA acessível permite que pessoas de diferentes origens criem soluções eficazes. À medida que a IA continua a evoluir, está a transformar as indústrias e a permitir que os indivíduos aproveitem o seu potencial para tornar o mundo um lugar mais seguro, mais inteligente e mais eficiente.
Torna-te parte da nossa comunidade e explora o nosso repositório GitHub para mergulhares mais fundo na IA. Desde a visão computacional na agricultura até à IA em carros autónomos, vê como estas tecnologias estão a impulsionar a inovação. Vê as nossas opções de licenciamento para começares os teus projectos de IA hoje mesmo!
Começa a tua viagem com o futuro da aprendizagem automática