绿色检查
链接复制到剪贴板

感知器与神经网络计算机视觉基本原理

了解神经网络如何改变现代技术,从供应链的质量控制到使用无人机的自主公用事业检查。

在过去几十年里,神经网络已成为许多关键人工智能(AI)创新的基础。神经网络是一种试图模仿人脑复杂功能的计算模型。它们帮助机器从数据中学习并识别模式,从而做出明智的决策。通过这样做,它们在医疗保健金融自动驾驶汽车等领域实现了计算机视觉深度学习等人工智能子领域。 

了解神经网络的工作原理可以让你更好地理解人工智能这个"黑盒子",有助于揭开尖端技术如何融入我们日常生活的 神秘面纱。在本文中,我们将探讨什么是神经网络、神经网络如何工作以及神经网络多年来是如何发展的。我们还将了解它们在计算机视觉应用中发挥的作用。让我们开始吧!

什么是人工智能中的感知器?

在详细讨论神经网络之前,我们先来了解一下感知器。它们是最基本的神经网络类型,也是构建更复杂模型的基础。 

感知器是一种线性机器学习 算法,用于监督学习(从标注的训练数据中学习)。它也被称为单层神经网络,通常用于区分两类数据的二元分类任务。如果你想将感知器可视化,可以将其视为一个单一的人工神经元。 

图 1.感知器是一个单一的人工神经元。

了解感知器的工作原理

感知器可以接收多个输入,将它们与权重相结合,决定它们属于哪个类别,并充当简单的决策者。它由四个主要参数组成:输入值(也称为节点)、网和、激活函数、 weights and biases网和以及激活函数。 

具体操作如下

  • 输入和权重:比方说,你有几条信息(输入),每条信息都有一个权重,以显示其重要程度。除此之外,偏置还能帮助感知器更灵活地做出决策。
  • 计算加权和感知器将每个输入乘以其权重,然后将所有输入相加,包括偏差,得出加权和。
  • 做出决定然后,感知器使用激活函数来确定最终输出。它利用加权和来决定感知器是否应该激活。在最简单的情况下,激活函数是一个阶跃函数,如果加权和大于某个阈值,输出就为 1,反之则为 0。因此,加权输入被转换为 "是 "或 "否 "的判断。
  • 学习和改进如果感知器犯了错误,它就会调整权重,争取下次有所改进。这一过程有助于模型从错误中学习
图 2.感知器概述

感知器在计算机视觉中的作用

感知器在帮助我们理解计算机视觉基础知识方面发挥着重要作用。它们是高级神经网络的基础。与感知器不同,神经网络并不局限于单层。它们由多层相互连接的感知器组成,这使它们能够学习复杂的非线性模式。神经网络可以处理更高级的任务,并产生二进制和连续输出。例如,神经网络可用于实例分割姿态估计高级计算机视觉任务

从神经网络看计算机视觉技术的发展

神经网络的历史可以追溯到几十年前,其中充满了各种研究和有趣的发现。让我们来详细了解其中的一些重要事件。 

下面是早期里程碑的简要介绍:

  • 1940s:Warren McCulloch 和 Walter Pitts 开发了一种简单的电路来模拟大脑的工作原理。 
  • 1958: 罗森布拉特推出了感知器。
  • 1970s:保罗-韦伯斯(Paul Werbos)提出了 "反向传播"(一种训练方法,通过最小化预测输出与实际输出之间的差异来帮助神经网络学习)的概念。反向传播使多层神经网络的训练成为可能,并为深度学习铺平了道路。 
  • 1980s:杰弗里-辛顿(Geoffrey Hinton)和扬-勒昆(Yann LeCun)等研究人员研究了联结主义,即相互连接的单元网络如何形成认知过程。他们的研究为现代神经网络奠定了基础。
  • 1990s:Jürgen Schmidhuber 和 Sepp Hochreiter 提出了长短时记忆(LSTM)网络,该网络已成为序列预测任务的关键。
图 3.神经网络的演变。

进入 21 世纪后,神经网络研究突飞猛进,取得了更大的进步。在 2000 年代,辛顿在受限玻尔兹曼机(一种能在数据中发现模式的神经网络)方面的研究在推动深度学习方面发挥了关键作用。它使深度网络的训练变得更加容易,帮助克服了复杂模型的挑战,使深度学习更加实用和有效。

随后,在 2010 年代,由于大数据并行计算的兴起,研究迅速加速。这一时期的一大亮点是 AlexNet 在ImageNet竞赛(2012 年)中获胜。AlexNet是一个深度卷积神经网络,它是一项重大突破,因为它展示了深度学习在计算机视觉任务(如准确识别图像)中的强大功能。它推动了人工智能在视觉识别领域的快速发展。 

如今,神经网络正随着新的创新技术而不断发展,比如变压器,它能很好地理解序列;还有图神经网络,它能很好地处理数据中的复杂关系。迁移学习(将在一项任务中训练的模型用于另一项任务)和自我监督学习(模型无需标记数据即可学习)等技术也在不断扩展神经网络的功能。

了解神经网络:基础知识

既然我们已经了解了基础知识,那就让我们来了解一下什么是神经网络。神经网络是一种机器学习模型,它在类似人脑的分层结构中使用相互连接的节点或神经元。这些节点或神经元对数据进行处理和学习,使其能够执行模式识别等任务。此外,神经网络还具有自适应能力,因此可以从错误中学习,并随着时间的推移不断改进。这使它们有能力更准确地处理复杂问题,如面部识别

图 4.神经网络。

神经网络由多个并行工作的处理器组成,并按层组织。它们由一个输入层、一个输出层和中间的几个隐藏层组成。输入层接收原始数据,类似于我们的视觉神经接收视觉信息。然后,每一层将其输出传递给下一层,而不是直接处理原始输入,这就像大脑中的神经元如何将信号从一个传递给另一个。最后一层产生网络输出。利用这一过程,人工神经网络(ANN)可以学习执行图像分类计算机视觉任务

神经网络在计算机视觉中的工业应用

了解了什么是神经网络以及神经网络的工作原理后,让我们来看看一个能展示神经网络在计算机视觉中的潜力的应用程序。

检查能源部门的电力线路

神经网络是计算机视觉模型的基础,例如 Ultralytics YOLO11等计算机视觉模型的基础,并可用于使用无人机对输电线路进行视觉检测。公用事业行业在检查和维护其庞大的电力线网络时面临着后勤方面的挑战。从繁忙的城区到偏远、崎岖的地貌,这些线路往往绵延不绝。传统上,这些检查都是由地面人员进行的。这些人工方法虽然有效,但成本高、耗时长,而且会使工人面临环境和电气危险。 研究表明,公用事业线路工作是美国十大最危险的工作之一,每年每 10 万名工人中有 30 到 50 人死亡

然而,无人机检查技术可以使空中检查成为一种更实用、更具成本效益的选择。尖端技术使无人机可以飞行更远的距离,在检查过程中无需频繁更换电池。现在,许多无人机都集成了人工智能,具有自动避障功能和更好的故障检测能力。这些功能使无人机能够在电力线众多的拥挤地区进行检查,并从更远的距离捕捉高质量的图像。许多国家正在采用无人机和计算机视觉技术来执行电力线路巡检任务。例如,在爱沙尼亚,100% 的电力线路检查都是由这种无人机完成的

图 5.使用无人机和人工智能工具检查电线的技术人员(左图)和他正在操作的无人机(右图)。

主要收获 

神经网络从研究到应用已经走过了漫长的道路,并已成为现代技术进步的重要组成部分。它们允许机器学习、识别模式,并利用所学知识做出明智决策。从医疗保健和金融到自动驾驶汽车和制造业,这些网络正在推动创新并改变着各行各业。随着我们不断探索和完善神经网络模型,它们重新定义我们日常生活和业务运营的更多方面的潜力也变得越来越明显。

要了解更多信息,请访问我们的GitHub 存储库,并与我们的社区互动。在我们的解决方案页面探索人工智能在制造业农业中的应用。🚀

Facebook 徽标Twitter 徽标LinkedIn 徽标复制链接符号

在此类别中阅读更多内容

让我们共同打造人工智能的未来

开始您的未来机器学习之旅