术语表

图像分类

使用Ultralytics YOLO 探索图像分类:使用尖端工具为医疗保健、农业、零售等行业训练自定义模型。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

图像分类是计算机视觉(CV)中的一项基本任务,涉及根据视觉内容为整幅图像指定一个标签或类别。它是人工智能(AI)的核心能力,使机器能够像人类识别场景或物体一样理解图像并对其进行分类。借助机器学习(ML),尤其是深度学习(DL)技术,图像分类旨在回答以下问题:"这张图像的主要对象是什么?

图像分类的工作原理

这一过程通常涉及在一个大型标注图像数据集上训练一个模型,通常是一种名为卷积神经网络(CNN)的专门神经网络。著名的数据集(如ImageNet)包含数以百万计的图像,被分为数千个类别。在训练过程中,模型学会识别区分不同类别的模式和特征,如纹理、形状和颜色分布。像 PyTorchTensorFlow等框架提供了构建和训练这些模型的工具。您可以探索各种Ultralytics 分类数据集,启动自己的项目。我们的目标是让训练好的模型准确预测未见过的新图像的类别标签。要深入了解技术,斯坦福 CS231n 课程等资源提供了有关 CNN 的全面资料。

与其他任务的主要区别

图像分类的重点是为整个图像分配一个标签。这使其有别于其他常见的 CV 任务:

  • 物体检测:识别图像中的多个物体,并使用边界框定位每个物体。它能回答 "图像中有哪些物体,它们在哪里?
  • 实例分割:在物体检测的基础上更进一步,准确勾勒出每个不同物体实例的像素边界。
  • 语义分割:将图像中的每个像素归入一组预定义的类别(如 "天空"、"道路"、"汽车"),但不区分同一类别中的各个实例。

了解这些差异对于针对特定问题选择合适的技术至关重要。

实际应用

图像分类因其相对简单和有效而被广泛应用于各个领域:

利用Ultralytics进行图像分类

Ultralytics YOLO 模型在物体检测方面享有盛誉,在图像分类任务方面也同样出色。使用Ultralytics Python 软件包或无代码Ultralytics HUB平台,可以轻松地对Ultralytics YOLOv11等现代架构进行分类训练。这些工具提供了全面的资源,包括模型训练技巧和清晰的文档,如如何使用Ultralytics YOLOv11 进行图像分类的指南。在实践中,可以考虑探索PyTorch 分类教程或参加Kaggle 图像分类竞赛。通过Papers With Code 等资源了解最新研究进展。

阅读全部