了解在YOLO Vision 2024 上展示的 SharkEye 如何利用Ultralytics YOLOv8 进行实时物体检测和海滩安全。
无论是在农场里吃草的牛群,还是在海岸附近活动的鲨鱼,在动物的自然栖息地对它们进行监测,对于它们的安全和福祉一直都很重要。然而,人工观察动物并非易事。这往往需要数小时的耐心和仔细专注,因为观察者必须密切注意行为或动作的任何变化。即便如此,也很容易错过细微但重要的迹象。
由于人工智能(AI)的介入,这一过程变得更快、更智能、更高效,在提高准确性的同时也减轻了人类观察者的负担。特别是,计算机视觉可用于跟踪动物、发现危险并实时做出决策。过去需要数小时才能完成的任务,现在几分钟就能完成,为了解动物行为开辟了新途径。
在由Ultralytics 主办的年度混合活动YOLO Vision 2024(YV24)上,专家和创新者齐聚一堂,探讨人工智能如何应对日常挑战。展示的主题包括实时物体检测和动物监控方面的进步,展示了人工智能如何在各个领域提高安全性和效率。
活动的亮点之一是人工智能大师集团创始人吉姆-格里芬(Jim Griffin)的演讲,他在演讲中演示了Vision AI如何在鲨鱼靠近海岸之前探测到它们,从而使海滩更加安全。他解释了他们如何使用 Ultralytics YOLOv8来实时准确地识别鲨鱼,即使是在波涛汹涌、眩光和水下障碍物等恶劣条件下。
在本文中,我们将对 "鲨鱼眼 "项目进行详细介绍,并分享吉姆演讲中的有趣见解。
吉姆首先介绍了加利福尼亚州著名的冲浪胜地帕达罗海滩(Padaro Beach),冲浪者和鲨鱼经常在这里共处一室。他强调了鲨鱼探测的真正挑战,并分享道:"当然,如果鲨鱼咬了你,很容易就能探测到,所以我们要做的是事先识别鲨鱼。
在加州大学圣巴巴拉分校的支持下,鲨鱼眼公司(SharkEye)应运而生。吉姆介绍了如何使用装有高分辨率人工智能摄像机的无人机在距离水面约 200 英尺的上空飞行,对海洋进行实时扫描。
如果发现鲨鱼,短信警报会发送给大约 80 个人,包括救生员、冲浪店主和任何注册接收更新的人。吉姆指出,当鲨鱼靠近海岸时,这些即时通知可以迅速做出反应,使海滩游客更加安全。
吉姆还提到,SharkEye 有一个实时仪表板,用户可以在上面看到鲨鱼探测的统计数据。例如,在 12 周内,该系统识别出 2 条大鲨鱼和 15 条小鲨鱼,平均每周识别出一条鲨鱼。
随后,他介绍了领导 "鲨鱼眼 "项目的科学家尼尔-内森(Neil Nathan)。尽管内森的背景是环境研究而非计算机科学,但他成功地领导了这个项目。吉姆强调了现代人工智能工具(如 "鲨鱼眼 "中使用的工具)是如何被设计成易于使用的,让非技术背景的个人也能开发出有影响力的解决方案。
Jim 进一步详细介绍了 SharkEye 的功能,以及鲨鱼检测解决方案如何不仅仅涉及简单的物体检测任务。它必须处理动态的、不可预测的条件,如漂浮的海草,这些海草很容易被误认为是鲨鱼。与发现固定物体不同,识别鲨鱼需要精确性和适应性,因此YOLOv8 成为了理想的选择。
YOLOv8 的另一个优势是可以部署在无人机上,而无需依赖云服务器。吉姆解释了这种方法如何使鲨鱼眼能够发送即时警报,这是在不可预测的海洋条件下确保及时响应的重要部分。
在重点介绍了 SharkEye 的工作原理及其背后的协作努力之后,吉姆展示了一个现场演示。
吉姆-格里芬(Jim Griffin)在现场演示中首先向观众介绍了一个熟悉的例子--Ultralytics YOLO 模型的 "hello world "代码片段。仅用六行Python 代码,他就展示了预先训练好的Ultralytics YOLOv8 模型如何毫不费力地检测到图像中的一辆公共汽车。
他的演示使用的是YOLOv8 Nano 型号,这是一种轻型型号,适用于无人机等低功耗设备。鲨鱼眼(SharkEye)中也使用了相同的模型,用于实时检测鲨鱼。
为了提供更多背景信息,吉姆提到演示中的模型是在 COCO128 上训练的,COCO128 是广泛使用的COCO 数据集的一个较小的子集。COCO 数据集包含 80 个不同物体类别的 20,000 多张图像。虽然 COCO128 可以很好地进行快速演示,但他指出,SharkEye 需要更强大的东西--一个特定于应用的鲨鱼检测数据集,能够处理现实世界中复杂的场景。
吉姆认为,SharkEye 项目最难的部分不是训练人工智能模型,而是收集正确的数据。他评论说:"这个项目的主要工作不是人工智能。这个项目的主要工作是让无人机飞行五年,从这些视频中提取图像,并给它们打上适当的标签。
他介绍了团队如何在帕达罗海滩收集 15,000 张图片。每张图片都必须人工标注,以区分鲨鱼、海藻和水中的其他物体。虽然这个过程既缓慢又费力,但它为之后的工作奠定了基础。
数据集准备就绪后,Ultralytics YOLOV8 对其进行了定制训练。吉姆说:"实际训练并不难,在 T4 GPU(图形处理单元)上只花了 20 个小时。他还补充说,如果使用更强大的硬件(如 A100 GPU),时间可以缩短到 5 个小时。
然后,吉姆讨论了如何评估鲨鱼眼的性能。他说明,关键指标是精确度,即系统识别实际鲨鱼的准确度。SharkEye 的精确度达到了令人印象深刻的 92%,证明该模型在复杂的海洋环境中准确识别鲨鱼方面非常有效。
在深入探讨精度的重要性时,吉姆解释了为什么在这种情况下精度比召回率更重要。"大多数时候,人们对召回率很感兴趣,尤其是在医疗保健等领域,错过一个阳性病例可能至关重要。但在这种情况下,我们不知道外面有多少鲨鱼,所以我们关心的是精确度,"他解释说。SharkEye 专注于精确度,确保将误报率降到最低,使救生员和其他救援人员更容易快速采取行动。
在演讲的最后,他将人工智能与人类的表现进行了比较,指出 SharkEye 92% 的精确度远远超过了人类专家 60% 的精确度。他强调说:"这是因为我们是人类。无论你我是多么专业的专家,如果我们不得不整天坐在屏幕前寻找鲨鱼,最终,我们还是会让自己的思绪游离。"与人不同,人工智能模型不会感到疲倦或分心,因此对于需要持续监控的任务来说,它是一种可靠的解决方案。
吉姆-格里芬(Jim Griffin)的演讲中有一句引人入胜的话:"有一天,六行代码就能挽救你的生命",这句话完美地概括了人工智能的先进性和可及性。Ultralytics YOLO 模型正是基于这一理念而创建的,它使各种规模的开发人员和企业都能使用最先进的计算机视觉技术。 Ultralytics YOLO11在此基础上实现了更快的推断和更高的准确性。
以下是YOLO11 与众不同之处的简要介绍:
这些功能使YOLO11 非常适合在动态环境中跟踪动物行为,无论是在农场还是在野外。
视觉人工智能的进步为各个领域提供了实用工具,从而使应对现实世界的挑战变得更加容易。例如,YOLO11 等计算机视觉模型可用于实时监控和跟踪动物,即使在恶劣条件下也是如此。
吉姆-格里芬(Jim Griffin)在 YV24 上发表的主题演讲展示了如何利用YOLOv8 以最少的编码解决复杂的问题。SharkEye 项目将无人机与人工智能相结合,用于实时检测鲨鱼,展示了技术如何改善海滩安全。
这是一个引人入胜的案例研究,展示了无障碍人工智能如何赋予不同背景的人创造有效解决方案的能力。随着人工智能的不断发展,它正在改变各行各业,使个人有可能利用其潜力,让世界变得更安全、更智能、更高效。
成为我们社区的一员,探索我们的GitHub 存储库,深入了解人工智能。从农业中的计算机视觉到自动驾驶汽车中的人工智能,看看这些技术是如何推动创新的。查看我们的许可选项,立即开始您的人工智能项目!