使用Ultralytics YOLO 探索图像分类:使用尖端工具为医疗保健、农业、零售等行业训练自定义模型。
图像分类是计算机视觉(CV)中的一项基本任务,涉及根据视觉内容为整幅图像指定一个标签或类别。它是人工智能(AI)的核心能力,使机器能够像人类识别场景或物体一样理解图像并对其进行分类。借助机器学习(ML),尤其是深度学习(DL)技术,图像分类旨在回答以下问题:"这张图像的主要对象是什么?
这一过程通常涉及在一个大型标注图像数据集上训练一个模型,通常是一种名为卷积神经网络(CNN)的专门神经网络。著名的数据集(如ImageNet)包含数以百万计的图像,被分为数千个类别。在训练过程中,模型学会识别区分不同类别的模式和特征,如纹理、形状和颜色分布。像 PyTorch和 TensorFlow等框架提供了构建和训练这些模型的工具。您可以探索各种Ultralytics 分类数据集,启动自己的项目。我们的目标是让训练好的模型准确预测未见过的新图像的类别标签。要深入了解技术,斯坦福 CS231n 课程等资源提供了有关 CNN 的全面资料。
图像分类的重点是为整个图像分配一个标签。这使其有别于其他常见的 CV 任务:
了解这些差异对于针对特定问题选择合适的技术至关重要。
图像分类因其相对简单和有效而被广泛应用于各个领域:
Ultralytics YOLO 模型在物体检测方面享有盛誉,在图像分类任务方面也同样出色。使用Ultralytics Python 软件包或无代码Ultralytics HUB平台,可以轻松地对Ultralytics YOLOv11等现代架构进行分类训练。这些工具提供了全面的资源,包括模型训练技巧和清晰的文档,如如何使用Ultralytics YOLOv11 进行图像分类的指南。在实践中,可以考虑探索PyTorch 分类教程或参加Kaggle 图像分类竞赛。通过Papers With Code 等资源了解最新研究进展。