Glossar

Faltungsneuronales Netzwerk (CNN)

Entdecke, wie Convolutional Neural Networks (CNNs) die Computer Vision revolutionieren und die KI im Gesundheitswesen, bei selbstfahrenden Autos und vielem mehr unterstützen.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Ein neuronales Faltungsnetzwerk (Convolutional Neural Network, CNN) ist eine spezielle Art von neuronalem Netzwerk (NN), das vor allem für die Verarbeitung gitterförmiger Daten wie Bilder und Videos entwickelt wurde. Anders als herkömmliche neuronale Netze nutzen CNNs das Prinzip der Faltung, um automatisch räumliche Hierarchien von Merkmalen aus den Eingabedaten zu lernen. Dadurch sind sie besonders effektiv für Aufgaben im Bereich des Computer Vision (CV), was zu erheblichen Fortschritten bei der Interpretation visueller Informationen durch Maschinen führt und viele moderne Anwendungen der Künstlichen Intelligenz (KI) ermöglicht.

Kernkomponenten und Funktionsweise

CNNs bestehen in der Regel aus mehreren verschiedenen Schichten, die zusammenarbeiten, um Informationen aus visuellen Eingaben zu extrahieren und zu verarbeiten:

  • Convolutional Layers: Dies sind die zentralen Bausteine. Sie wenden Filter (Kernels) auf das Eingangsbild an, um Merkmalskarten zu erstellen, die bestimmte Muster wie Kanten, Ecken oder Texturen hervorheben. Die Faltungsoperation ermöglicht es dem Netzwerk, die für die Aufgabe relevanten Merkmale zu lernen.
  • Aktivierungsfunktionen: Funktionen wie ReLU (Rectified Linear Unit) oder Leaky ReLU, die nach den Faltungsschichten eingesetzt werden, führen Nichtlinearität ein und ermöglichen es dem Netz, komplexere Beziehungen in den Daten zu lernen. Erfahre mehr über die verschiedenen Aktivierungsfunktionen.
  • Pooling-Schichten: Diese Schichten reduzieren die räumliche Ausdehnung (Breite und Höhe) der Merkmalskarten, verringern den Rechenaufwand und machen die gelernten Merkmale robuster gegenüber Positionsveränderungen. Zu den gängigen Pooling-Techniken gehören Max Pooling und Average Pooling, die in Ressourcen wie diesem Überblick über Pooling-Methoden näher erläutert werden.
  • Vollständig verknüpfte Schichten: Diese Schichten befinden sich in der Regel am Ende des Netzwerks und verwenden die von den Faltungsschichten und Pooling-Schichten extrahierten High-Level-Merkmale für Klassifizierungs- oder Regressionsaufgaben, ähnlich wie die Schichten in einem normalen neuronalen Feedforward-Netzwerk.

Hauptunterschiede zu anderen neuronalen Netzen

CNNs haben zwar die gleichen grundlegenden Konzepte wie andere neuronale Netze, weisen aber dennoch einzigartige Eigenschaften auf:

  • Lernen von räumlichen Hierarchien: CNNs sind dank ihrer Faltungsschichten und lokalen rezeptiven Felder besonders gut darin, räumliche Muster und Hierarchien in Daten wie Bildern zu erkennen. Herkömmliche NNs behandeln die Eingabemerkmale oft unabhängig voneinander und verlieren den räumlichen Kontext.
  • Gemeinsame Nutzung von Parametern: Die Filter werden in den Faltungsschichten über das gesamte Eingangsbild verteilt, wodurch die Anzahl der Parameter im Vergleich zu voll vernetzten Netzen deutlich reduziert und die Effizienz verbessert wird.
  • Anwendungsfall im Fokus: CNNs sind die bevorzugte Architektur für Bild- und Videoanalyseaufgaben. Im Gegensatz dazu eignen sich rekurrente neuronale Netze (RNNs) besser für sequentielle Daten wie Text für die Verarbeitung natürlicher Sprache (NLP) oder Zeitreihenanalysen.

Anwendungen in der realen Welt

CNNs haben in zahlreichen Bereichen bemerkenswerte Erfolge erzielt. Hier sind zwei prominente Beispiele:

  1. Medizinische Bildanalyse: CNNs helfen Medizinern bei der Analyse von Röntgenbildern, CT-Scans und MRTs, um subtile Anomalien wie Tumore oder Knochenbrüche zu erkennen. Dies trägt erheblich zur KI im Gesundheitswesen bei, da es schnellere und möglicherweise genauere Diagnosen ermöglicht. In der Forschung werden die Grenzen immer weiter verschoben, wie die Studien zeigen, die auf Plattformen wie PubMed Central verfügbar sind.
  2. Autonome Fahrzeuge: Selbstfahrende Autos verlassen sich bei der Objekterkennung in Echtzeit (Erkennung von Fußgängern, Autos, Verkehrsschildern) und der Bildsegmentierung (Erkennung von Fahrspuren und Hindernissen) stark auf CNNs. Diese visuelle Wahrnehmung ist entscheidend für die sichere Navigation in komplexen Umgebungen und bildet den Kern der KI in selbstfahrenden Autos.

Tools und Frameworks

Die Entwicklung und der Einsatz von CNNs wird durch verschiedene leistungsstarke Deep-Learning-Tools und -Frameworks erleichtert:

  • Rahmenwerke: Beliebte Wahlmöglichkeiten sind PyTorch, TensorFlowund Keras, die vorgefertigte Schichten, Optimierer und Unterstützung für Hardware-Beschleunigung wie GPUs bieten. Du kannst Glossareinträge finden für PyTorch, TensorFlowund Keras.
  • Ultralytics Ökosystem: Tools wie Ultralytics YOLO bieten hochmoderne CNN-basierte Modelle, die für die Objekterkennung und andere CV-Aufgaben optimiert sind. Die Ultralytics HUB-Plattform vereinfacht das Training, den Einsatz und die Verwaltung dieser Modelle ohne umfangreichen Programmieraufwand. Erfahre Tipps für das Modelltraining, um deine CNNs zu optimieren.
Alles lesen