词汇表

图像分类

探索图像分类基础知识，从卷积神经网络到现实世界的人工智能应用。学习如何Ultralytics 训练并部署最先进的分类器。

图像分类是计算机视觉（CV）领域的基础任务，其中机器学习模型会分析整张图像，并从预定义的类别集合中为其分配单一标签。本质上，它回答的是"这张图片的主要主题是什么？"这个问题。作为人工智能（AI）的核心组件，该过程使自动化系统能够大规模组织、分类和解读视觉数据。尽管对人眼而言看似简单，但要使计算机识别模式，需要复杂的机器学习（ML）算法来弥合原始像素与有意义概念之间的鸿沟。

分类背后的机制

现代图像分类技术高度依赖于称为卷积神经网络（CNN）的深度学习（DL）架构。这些网络旨在模拟生物视觉皮层处理信息的方式。通过称为特征提取的过程，模型在早期层中学习识别边缘和纹理等低级属性，最终在更深层中将它们组合起来以识别复杂的形状和物体。

要构建分类器，开发者会采用监督学习方法，向模型输入海量标注训练数据集。大型公共数据集如 ImageNet 对提升系统准确性起到了关键作用。在推理阶段，模型会为每个类别输出概率分数，通常通过软最大化函数确定最可能的类别。

分类与其他视觉任务

区分图像分类与相关计算机视觉能力至关重要，因为技术选择取决于具体问题：

分类与目标检测： 分类为整张图像分配一个标签。相比之下，目标检测通过为每个目标绘制边界框，识别场景中多个目标的位置。
分类与图像分割： 分类关注整体上下文，而分割提供像素级精度。语义分割对每个独立像素进行分类，从而实现物体与背景之间的精确边界划分。

实际应用

图像分类技术驱动着众多真实世界的AI应用横跨多个行业领域：

医疗诊断

在医学领域，分类模型通过分析诊断扫描图像为放射科医生提供辅助。医学影像分析工具能够快速将X光片或MRI影像归类为"正常"或"异常"，或识别特定病症（如肿瘤检测），从而加快患者分诊与诊断流程。

制造过程中的质量控制

工厂采用自动化视觉检测技术来维持产品标准。装配线上的摄像头捕捉零部件图像，分类模型根据可见缺陷即时标注为"合格"或"不合格"。这种自动化质量控制确保仅无缺陷产品进入包装阶段。

智能农业

农民利用人工智能技术监测作物健康状况。通过对无人机或智能手机拍摄的图像进行分类，系统能够识别病害、营养缺乏或虫害侵袭的迹象，从而实现精准农业干预。

使用YOLO26实现分类

Ultralytics 框架虽以目标检测闻名，但在图像分类任务中同样展现出顶尖性能。其架构经过速度与精度的双重优化，特别适用于实时应用场景。

以下是一个简洁示例，演示如何加载预训练模型并使用该模型classify ： ultralytics Python 软件包：

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Run inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Prediction: {results[0].names[results[0].probs.top1]}")

对于希望简化工作流的团队Ultralytics 可简化整个数据处理流程。它支持用户管理分类数据集、执行基于云的训练，并将模型部署为多种格式，例如 ONNX 或 TensorRT 等多种格式，无需复杂的编码基础设施。

图像分类

培训Ultralytics YOLO 模型，以简化各行业的工作流程

灵活的企业许可解决方案，助力您的创新

使用Ultralytics YOLO在数秒内训练人工智能模型

分类背后的机制

分类与其他视觉任务

实际应用

医疗诊断

制造过程中的质量控制

智能农业

使用YOLO26实现分类

阅读更多此类别的内容

12个基于计算机视觉的航拍影像应用场景

什么是单目深度估计？概述

Ultralytics YOLO 进行人工智能威胁检测

加入Ultralytics 社区