深圳Yolo 视觉
深圳
立即加入
词汇表

ImageNet

探索ImageNet——深度学习的基石数据集。了解它如何通过迁移学习Ultralytics 提供支持,实现高精度图像分类。

ImageNet 为视觉对象识别软件研究设计的庞大视觉数据库,被广泛视为点燃现代深度学习革命的催化剂。ImageNet 依据WordNet词汇层级体系构建, ImageNet 数千个类别、数百万张标注图像, 为训练复杂神经网络提供了海量数据支撑。 对计算机视觉领域的科研人员与开发者而言, ImageNet 评估算法性能的标准基准, 尤其在图像分类与目标定位等任务中ImageNet 。

ImageNet 与卷积神经网络的崛起

该数据集ImageNet 视觉识别挑战赛(ILSVRC)获得全球瞩目,这项赛事于2010至2017年间每年举办。竞赛要求算法将classify 精准 classify 至1000个类别之一。2012年迎来历史性转折点——卷积神经网络架构AlexNet实现了远低于竞争对手的错误率。这一胜利彰显了深度神经网络相较传统特征提取方法的卓越优势,由此正式开启了当前的深度学习时代。(CNN) 架构AlexNet实现了远低于竞争对手的错误率。这一胜利证明了深度神经网络相较于传统特征提取方法的优越性,有效开启了当前的人工智能时代。如今,Ultralytics 尖端架构仍在延续这些挑战中确立的基础原理。

预训练与迁移学习的作用

ImageNet 最重要的贡献之一ImageNet 其在迁移学习中的作用。从零开始训练深度神经网络需要海量计算资源和大量训练数据。为规避这一问题,开发者常采用"预训练模型"——这些网络已ImageNet学习到如何提取丰富的特征表征。

当模型ImageNet进行预训练时,它学会识别边缘、纹理和形状等基础视觉元素。这些习得的模型权重随后可针对特定任务在更小规模的数据集上进行微调。该过程能显著缩短开发周期并提升性能,尤其Ultralytics 等工具进行定制化模型训练时效果更为显著。

实际应用

ImageNet 远不止于学术研究,ImageNet 至实际应用中的日常人工智能系统:

  • 自动零售结账系统:自助结账终端中自动识别生鲜或商品的系统,依赖于ImageNet海量数据集上训练的分类能力。通过区分视觉上相似的物品(例如不同品种的苹果),这些系统实现了零售领域人工智能的应用优化
  • 内容审核:社交媒体平台利用视觉识别技术自动扫描数百万张上传图片,以检测不当内容。其识别物体和场景的核心能力,通常源自最初ImageNet 上训练的骨干网络

ImageNet .COCO . CIFAR-10

ImageNet 分类任务的金标准,但有必要将其与其他常用数据集区分开来:

  • COCO: COCO 上下文中的常见物体)数据集是 目标检测 与分割领域的主要基准 ImageNet 图像中包含"什么"(分类), COCO 物体"所在位置"及其精确边界。
  • ImageNet CIFAR-10ImageNet : CIFAR-10是规模小得多的数据集, 包含尺寸仅为 32x32 像素的微型图像。它常用于快速原型开发或教学目的, 而ImageNet 则代表专业级高分辨率挑战,适用于生产就绪的模型。

使用ImageNet 预训练模型

现代人工智能框架使用户能够轻松利用ImageNet 。下例演示了如何加载一个基于ImageNet预训练的YOLO26分类模型classify 。

from ultralytics import YOLO

# Load a YOLO26 classification model pre-trained on ImageNet
model = YOLO("yolo26n-cls.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the top prediction class name
print(f"Top Class: {results[0].names[results[0].probs.top1]}")

此代码片段使用了 yolo26n-cls.pt 该模型已学习ImageNet 1,000ImageNet 使其能够在无需额外训练的情况下即时识别输入图像的内容。

加入Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入