绿色检查
链接复制到剪贴板

如何使用Ultralytics YOLO11 进行图像分类

了解Ultralytics YOLO11 新模型如何改进图像分类,为农业、零售业和野生动物监测任务提供更高的准确性。

假设一个机器人正在观察一黑一白两只猫,它需要找出哪只猫是谁。为此,它可以使用图像分类,这是一种计算机视觉任务,有助于识别和分类图像中的物体或场景。事实上,得益于人工智能(AI)领域的最新进展,图像分类技术可广泛应用于动物监测、制造和农业作物疾病检测等领域。

Ultralytics YOLO11 模型图像分类领域的最新进展之一。该模型在Ultralytics' 年度混合活动 YOLO Vision 2024 (YV24) 上发布、 YOLO11旨在轻松而精确地处理包括图像分类在内的各种视觉人工智能任务。

在本文中,我们将探讨图像分类的基本原理,讨论现实世界中的应用,并向您展示如何使用 YOLO11Ultralytics Python 进行 图像分类 我们还将介绍如何通过几个简单的步骤在Ultralytics HUB 上试用 YOLO11的功能。让我们开始吧!

图 1.使用Ultralytics YOLO11 对波斯猫进行分类的示例。

什么是图像分类?

图像分类的工作原理是根据从以前贴过标签的图像中学到的模式为图像分配标签或标记。通过仔细分析图像的像素,计算机视觉模型可以为图像找到最佳匹配。像 YOLO11等可靠的模型可以无缝地处理这一过程。YOLO11计算机视觉系统的模型架构使其几乎可以即时处理图像或视频帧,非常适合需要快速、准确图像分类的应用。

要真正理解图像分类的范围,最好将其与其他任务(如对象检测)区分开来。图像分类是对整个图像进行标注,而物体检测则是对图像中的每个物体进行识别和定位。 

图 2.图像分类、物体检测和图像分割的比较。

让我们来看一张长颈鹿的图像。在图像分类中,模型可能会根据图像的整体内容将整幅图像简单地标记为长颈鹿。但是,在对象检测中,模型不仅会识别出长颈鹿,还会在长颈鹿周围放置一个包围盒,精确定位长颈鹿在图像中的位置。

现在,想象一下长颈鹿和其他动物一起站在热带草原的一棵树旁。图像分类模型可能会将整个场景标记为热带稀树草原或野生动物。但是,通过对象检测,该模型可以单独识别每个元素,识别出长颈鹿、树和其他动物,每个元素都有自己的边界框。

YOLO11 图像分类应用

Ultralytics YOLO11 模型在图像分类方面的准确性和性能使其在各行各业都大有用武之地。让我们来探讨YOLO11 在图像分类中的一些重要应用。

YOLO11 农业图像分类

图像分类有助于简化农业和养殖业的许多功能。具体来说,利用YOLO11 等图像分类模型,农民可以持续监控农作物的健康状况,检测严重疾病,并高精度地识别任何虫害。 

下面我们来看看它是如何工作的:

  • 图像捕捉:可部署 摄像头和无人机 等物联网(IoT)设备,从不同角度和位置捕捉田间作物的实时图像。
  • 处理:根据可用资源和连接情况,可通过边缘计算在现场处理图像,或上传到云端进行更深入的分析。
  • 利用YOLO11 进行图像分类:YOLO11 模型可以分析这些图像,对各种作物状况进行分类。常见的分类可能包括健康、病害、虫害或营养不良,有助于找出影响田间不同区域的具体问题。
  • 洞察生成:根据分类,YOLO11 可提供有关作物健康指标的见解,帮助农民发现疾病的早期迹象、确定虫害热点或发现养分缺乏症
  • 知情决策:有了这些洞察力,农民就能在灌溉、施肥和病虫害防治方面做出有针对性的决策,只把资源用在最需要的地方。
图 3.从健康叶到受感染叶的不同类别示例。

YOLO11 零售业图像分类

图像分类可以大大改善零售购物体验,使其更加个性化和用户友好。零售商可以使用定制训练的计算机视觉模型来识别库存中的产品,并将这一功能集成到他们的移动应用程序或网站中。这样,顾客只需上传照片即可搜索产品,从而使购物更加快捷方便。

一旦客户将图片上传到可视化搜索系统,在搜索结果显示出来之前,幕后会发生一些事情。 

首先,物体检测可用于找出图像中的主要物品,如识别一件衣服或一件家具,并将其从背景中分离出来。接下来,图像分类可用于对每个物品进行进一步分类,识别出是夹克、衬衫、沙发还是桌子。 

有了这些信息,系统就可以调出可供购买的同类产品,这对于寻找难以用语言描述的独特或时尚商品尤其有帮助。同样的技术还可以通过自动识别和分类商品,帮助简化库存管理等其他零售任务。

图 4.基于图像分类的视觉搜索平台运行图。

利用YOLO11 图像分类进行野生动物监测

传统上,监测野外动物是一项繁琐的工作,需要许多人对成千上万张照片进行人工分类和分析。利用YOLO11 等计算机视觉模式,研究人员可以更快的速度自动监测动物。可以将相机放置在自然栖息地拍摄照片。然后,视觉人工智能模型可用于分析这些照片,并对其中的动物进行分类(如果有的话)。这样的系统可以帮助研究人员研究和跟踪动物种群及其迁徙模式等。

人工智能和计算机视觉模型(如YOLO11 )在这一领域的另一种帮助方式是简化濒危物种的分类过程。通过识别动物可能属于的物种或品种类别,这些模型可以为研究人员提供重要数据。例如,塔斯马尼亚大学(UTAS)开发了一种基于图像分类的系统,用于监测塔斯马尼亚的各种野生动物。这些模型的预测结果可以帮助科学家和研究人员密切关注动物的活动和行为,这可能是偷猎或栖息地丧失等威胁的信号。 

图 5.YOLO11 预测狗可能属于的品种。

尝试使用YOLO11 模型进行图像分类

现在,我们已经讨论了什么是图像分类,并探索了它的一些应用。让我们来看看如何使用新的YOLO11 模型尝试图像分类。有两种简单的入门方法:使用Ultralytics Python 软件包或通过Ultralytics HUB。我们将介绍这两种方法。

使用YOLO11

要开始使用Ultralytics Python 软件包,只需使用 pip、conda 或 Docker安装即可。如果遇到任何问题,请查看我们的《常见问题指南》,了解有用的故障排除技巧

安装软件包后,您可以使用以下代码加载YOLO11 图像分类模型的变体,并在图像上运行推理。运行推理意味着使用训练有素的模型对未见过的新数据进行预测。您可以选择一张图像进行尝试!

图 6.使用YOLO11 模型运行推论。

训练自定义YOLO11 分类模型

您还可以使用同一个Python 软件包来训练自定义的YOLO11 分类模型。自定义训练使您可以根据具体需要 YOLO11 模型进行微调。例如,如果您正在开发一款用于对不同品种的猫进行分类的应用程序,您就可以专门为此定制训练一个YOLO11 模型。

下面的代码展示了如何加载和训练YOLO11 图像分类模型。通过它,您可以传输预训练的权重,利用现有模型的知识来提高自己模型的性能。您可以指定一个数据集,如 "fashion-mnist "数据集,它是一个著名的服装(衬衫、裤子、鞋子等)灰度图像集。在这个数据集上训练模型,可以让它学会识别不同的服装类别。您可以将 "fashion-mnist "换成任何适合您项目的数据集,如猫的品种或植物的类型。

图 7.自定义训练用于图像分类的YOLO11 模型。

在Ultralytics HUB 上试用YOLO11

虽然Ultralytics 软件包的使用非常简单,但它确实需要一定的Python 知识。如果您正在寻找一个对初学者更友好的选项,您可以使用Ultralytics HUB,这是一个旨在使培训和部署不同YOLO 模型变得简单易用的平台。要开始使用,您需要创建一个账户

登录后,进入 "模型 "部分,选择YOLO11 模型进行图像分类。你会看到一系列可用的模型尺寸:纳米、小型、中型、大型和超大型。选择模型后,您可以在 "预览 "部分上传图像,图像处理完成后,预测结果将显示在页面左侧。

图 8.使用Ultralytics HUB 运行推理。

主要收获

YOLO11 提供了强大的图像分类功能,为各行各业带来了新的可能性。从改进农业作物监测、加强零售业产品搜索到支持野生动物保护,YOLO11的速度和准确性使其成为各种应用的理想选择。用户可以选择通过Ultralytics Python 软件包进行定制培训,或在Ultralytics HUB 上进行用户友好的无代码设置,从而可以轻松地将YOLO11 纳入其工作流程。随着越来越多的行业采用人工智能解决方案,YOLO11 提供了一个灵活、高性能的工具,支持创新和实际进步。

要了解更多信息,请访问我们的GitHub 存储库,并与我们的社区互动。请访问我们的解决方案页面,探索人工智能在自动驾驶汽车医疗保健领域的应用。🚀

Facebook 徽标Twitter 徽标LinkedIn 徽标复制链接符号

在此类别中阅读更多内容

让我们共同打造人工智能的未来

开始您的未来机器学习之旅