胶囊网络(通常称为 CapsNets)是一种新型的神经网络架构,旨在解决传统卷积神经网络(CNN)的一些局限性,尤其是在处理图像中的空间层次和特征之间的关系方面。CNN 使用集合运算的标量输出,而 CapsNets 则不同,它使用向量来表示特征,从而能够捕捉到有关物体方向和相对空间位置的更详细信息。这种能力使 CapsNets 在图像识别等任务中特别有效,因为在这些任务中,理解物体的姿态和空间关系至关重要。
CapsNets 引入了 "胶囊 "的概念,即一组神经元,其活动向量代表了特定类型实体(如物体或物体部件)的各种属性。活动向量的长度代表实体存在的概率,而其方向则编码实例化参数(如位置、大小、方向)。一个层级的活动胶囊通过转换矩阵对更高层级胶囊的实例化参数进行预测。当多个预测结果一致时,更高层次的胶囊就会激活。这一过程被称为 "协议路由"。
虽然 CapsNets 和卷积神经网络(CNNs)都被用于计算机视觉(CV)任务,但它们在处理空间信息的方法上有很大不同:
与传统的 CNN 相比,CapsNets 具有多项优势:
胶囊网络在各种应用中都大有可为,显示出其推动深度学习(DL)领域发展的潜力:
尽管 CapsNets 有其优势,但也面临着挑战,例如与 CNN 相比,其计算复杂度更高,而且需要进一步研究以优化其架构和训练程序。目前的研究重点是提高动态路由的效率,探索新的胶囊类型,以及将 CapsNets 应用于图像识别以外的更广泛任务。
随着人工智能(AI)领域的不断发展,胶囊网络(Capsule Networks)代表了一个令人兴奋的发展领域,为创建更强大、更多功能的神经网络模型提供了新的可能性。胶囊网络能够捕捉到详细的空间信息,并能处理变换,是推动计算机视觉和其他人工智能应用的重要工具。对于那些有兴趣探索前沿人工智能模型的人来说,Ultralytics YOLO 模型提供了最先进的物体检测架构,其中融合了该领域的一些最新进展。此外,Ultralytics HUB 还提供了一个训练和部署这些模型的平台,进一步促进了先进人工智能解决方案的开发和应用。