术语表

图像识别

了解图像识别如何赋予人工智能分类和理解视觉效果的能力,从而推动医疗保健、零售、安防等领域的创新。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

图像识别是人工智能的一个重要分支,它使计算机和软件系统能够识别图像中的物体、人物、地点和动作并对其进行分类。它不仅仅是简单地检测物体,还包括像人类一样理解和标记图像中描述的内容。这项技术是各行各业许多先进应用的基石,使机器能够 "看到 "和解释视觉数据。

什么是图像识别?

图像识别是计算机视觉(CV)的一个子集,侧重于识别和分类图像中的物体或特征。它利用机器学习(ML)算法,特别是卷积神经网络(CNN)深度学习(DL)技术来分析图像并提取有意义的信息。图像识别与对象检测不同,对象检测是定位图像中的对象并在其周围画出边界框,而图像识别则主要侧重于对整个图像或图像中的区域进行内容分类。

这一过程通常包括在大量标注图像的数据集上训练模型。在这一训练阶段,模型可以学习与不同类别相关的模式和特征。训练完成后,该模型就可以分析新的、未见过的图像,并预测其中的类别或内容。像 PyTorch等框架和OpenCV等工具通常用于构建和实施图像识别系统。

图像识别的应用

图像识别技术在各个领域都有广泛的应用:

图像识别与物体检测

虽然图像识别和物体检测都是计算机视觉任务,但它们的目的却截然不同。图像识别对图像中的内容进行分类,回答 "这是什么 "的问题。Ultralytics YOLO 模型用途广泛,可同时用于这两种任务,具体取决于具体应用和模型配置。

总之,图像识别是一项强大的技术,它为机器提供了解释和理解视觉信息的能力,推动了众多行业的创新和效率。随着人工智能的不断发展,图像识别无疑将在我们与技术和周围世界的互动中发挥越来越重要的作用。

阅读全部