术语表

卷积神经网络(CNN)

了解卷积神经网络 (CNN) 如何彻底改变计算机视觉,为医疗保健、自动驾驶汽车等领域的人工智能提供动力。

使用Ultralytics HUB 对YOLO 模型进行简单培训

了解更多

卷积神经网络(CNN)是一种深度学习模型,尤其适用于分析图像和视频等视觉数据。与传统的神经网络不同,卷积神经网络旨在从输入数据中自动、自适应地学习空间层次特征。这是通过各层执行卷积等数学运算来检测边缘、纹理和更复杂形状等模式来实现的。CNN 彻底改变了计算机视觉(CV)领域,使机器在解释和理解视觉信息方面取得了重大进展。

核心组件和功能

CNN 由几种类型的层组成,每种层在处理视觉数据时都有不同的作用:

  • 卷积层:这些层使用滤波器扫描输入图像,并创建突出特定模式的特征图。每个滤镜负责检测一个特定的特征,如垂直边缘或曲线。要深入了解卷积过程,可以浏览卷积
  • 池化层:池化层通常用在卷积层之后,它可以减少特征图的空间维度,降低计算负荷,并有助于防止过度拟合。常见类型包括最大池化和平均池化。
  • 激活函数: 激活函数将非线性引入网络,使其能够学习复杂的模式。流行的选择包括ReLU(整流线性单元)及其变体,如Leaky ReLU
  • 全连接层:这些层将上一层的每个神经元连接到下一层,类似于传统的神经网络。它们通常位于网络的末端,负责根据卷积层提取的特征进行最终分类或预测。
  • 剔除层这些层在训练过程中每次更新时都会随机将一部分输入单元设置为 0,从而有助于防止过度拟合。

与其他神经网络的主要区别

虽然所有神经网络都有节点互连的基本概念,但 CNN 与递归神经网络 (RNN)或基本前馈网络等其他类型的神经网络有很大不同:

  • 空间层次:CNN 擅长捕捉数据中的空间层次,这对图像和视频分析至关重要。另一方面,RNN 专为顺序数据而设计,因此更适合自然语言处理 (NLP)时间序列分析等任务。
  • 参数共享:在 CNN 中,滤波器在整个输入空间中共享,与全连接网络相比,大大减少了参数数量。这不仅提高了 CNN 的效率,还有助于它们更好地泛化视觉任务。
  • 局部感受野CNN 中的神经元只与输入的局部区域(即感受野)相连,因此能有效检测局部模式。这与全连接网络形成鲜明对比,在全连接网络中,每个神经元都与上一层的所有神经元相连。

实际应用

CNN 在各个领域都表现出非凡的能力。以下是其在现实世界中应用的两个具体实例:

  1. 医学图像分析CNN 被广泛应用于医疗保健领域,用于分析 X 射线、CT 扫描和 MRI 扫描等医学图像。它们可以高精度地检测异常、分类疾病和分割器官。例如,CNN 可以识别肿瘤、骨折和其他病症,帮助医生进行诊断和制定治疗计划。CNN 从图像中学习复杂模式的能力使其在改善患者预后方面具有不可估量的价值。了解更多有关人工智能在医疗保健领域的应用
  2. 自动驾驶汽车:自动驾驶汽车主要依靠 CNN 进行物体检测图像分割和场景理解。CNN 处理来自摄像头的视觉数据,以识别行人、其他车辆、交通标志和道路边界。这些信息对于做出实时驾驶决策、确保自动驾驶汽车的安全和效率至关重要。了解有关自动驾驶汽车中的人工智能的更多信息。

工具和框架

各种工具和框架提供了预置层、优化算法和硬件加速,使开发和部署 CNN 变得更加容易:

  • PyTorch: PyTorch 允许动态计算图,因此深受研究人员和开发人员的欢迎。
  • TensorFlow: TensorFlow 由Google 开发,是另一个广泛使用的框架,同时支持研究和生产环境。它提供了一个全面的工具、库和社区资源生态系统。
  • Keras一个用户友好型神经网络库,可在TensorFlow 或 Keras 上运行。 PyTorch.Keras 简化了构建和训练深度学习模型的过程。
  • Ultralytics YOLO:首次使用 "YOLO",Ultralytics YOLO 模型是最先进的物体检测模型,利用 CNN 架构实现了高精度和高速度。这些模型可通过Ultralytics HUB 获取,它提供了用于高效训练、部署和管理模型的工具。

通过了解 CNN 的复杂性,用户可以更好地理解它们在推动人工智能和机器学习方面的重要意义。这些网络不断推动着各行各业的创新,使其成为现代计算机视觉应用的基石。

阅读全部