术语表

图像分类

使用 Ultralytics YOLO 探索图像分类:使用尖端工具为医疗保健、农业、零售业等领域训练定制模型。

图像分类是计算机视觉 (CV)的一项基本任务,它涉及从一组预定义的类别中为整幅图像指定一个单一的特定标签。其主要目标是识别图像的主体并进行相应的分类。例如,分类模型会分析图像并输出 "猫"、"狗 "或 "汽车 "等标签。这项任务是许多更复杂的 CV 应用程序的基础,也是机器学习 (ML) 的核心组成部分。这一过程依赖于算法,其中最著名的是卷积神经网络(CNN),来学习大型标签数据集的识别特征。

图像分类的工作原理

图像分类模型采用监督学习法进行训练,即向模型输入大量已被人工标记为正确类别的图像。在训练过程中,神经网络学会识别与每个类别相关的模式、纹理、形状和颜色组合。这种学习是通过一个称为反向传播的过程来实现的,该过程会调整模型的内部参数或权重,以尽量减小预测结果与实际标签之间的差异。

现代分类模型通常使用多层深度学习架构。早期层可能学习识别边缘和角落等简单特征,而更深的层则将这些特征结合起来,以识别眼睛、车轮或人脸等更复杂的结构。网络的最后一层通常使用软最大函数为每个可能的类别生成概率分数。概率最高的类别将被选为最终预测结果。这一过程的关键是特征提取,即模型自动学习分类任务中信息量最大的特征。

图像分类的应用

图像分类被广泛应用于各行各业,以实现视觉识别任务的自动化和规模化。两个突出的例子包括

  1. 医学图像分析在医疗保健领域,分类模型可以分析 X 光、核磁共振成像和 CT 扫描等医学扫描图像,帮助放射科医生检测疾病。例如,可以在数千张乳房 X 光照片上训练一个模型,将图像分类为 "良性 "或 "恶性",从而帮助早期发现乳腺癌。这可以加快诊断速度,减少人为错误。有关这方面的更多信息,请参阅美国癌症协会关于人工智能在癌症检测中的应用的概述
  2. 农业技术:农民利用无人机或卫星拍摄的图像进行图像分类,监测作物健康状况。模型可将植物叶片图像分为 "健康"、"有病 "或 "虫害 "等类别。这样就可以有针对性地施用农药或化肥,提高作物产量,促进可持续农业发展。进一步了解 Ultralytics 如何为农业人工智能提供支持。

图像分类与相关任务

图像分类虽然与其他计算机视觉任务密切相关,但却有其独特的目的。重要的是要将其与以下任务区分开来:

  • 物体检测这项任务比分类更进一步。对象检测不是给整个图像指定一个标签,而是识别图像中的多个对象,并在每个对象周围画一个边框,同时给每个边框指定一个类别标签。例如,它不会只给图像贴上 "街道场景 "的标签,而是会定位并分类单个的 "汽车"、"行人 "和 "交通信号灯"。
  • 图像分割这项任务通过对每个像素进行分类,提供对图像最详细的了解。图像分割有多种类型,包括语义分割实例分割,前者为每个像素指定一个类别(例如,属于汽车的所有像素都是一种颜色),后者区分同一物体的不同实例(例如,每辆汽车都是不同的颜色)。这种详细程度对于自动驾驶汽车等应用至关重要。

总之,分类能告诉你图像中有哪些内容,检测能告诉你内容位置,而分割则能提供场景中所有内容的详细像素级地图。

利用超声技术进行图像分类

Ultralytics YOLO模型在物体检测方面享有盛誉,在图像分类任务方面也同样出色。使用直观的Ultralytics Python 软件包或无代码的Ultralytics HUB平台,可以在自定义数据集上轻松训练或微调YOLO11等先进模型。

我们的文档提供了广泛的资源,包括模型训练技巧如何使用 YOLO11 进行图像分类的详细指南。开发人员可以利用ImageNetCIFAR-100Caltech-101等基准数据集上的预训练模型,或者从头开始训练一个新模型。对于那些对最新进展感兴趣的人,Papers With Code等资源提供了对顶级模型的全面概述。您还可以在标准基准上比较 YOLO 模型的性能PyTorchTensorFlow等框架为构建和训练这些模型奠定了基础。

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、合作和成长

立即加入
链接复制到剪贴板