Glossar

Residuale Netzwerke (ResNet)

Entdecke, wie ResNets das Deep Learning revolutionieren, indem sie verschwindende Gradienten lösen und ultratiefe Netze für Bildanalyse, NLP und mehr ermöglichen.

Trainiere YOLO Modelle einfach
mit Ultralytics HUB

Mehr erfahren

Residual Networks, allgemein bekannt als ResNet, sind eine zentrale Deep Learning (DL)-Architektur, die vor allem in der Computer Vision (CV) eingesetzt wird. ResNet wurde von Kaiming He et al. in ihrem Artikel"Deep Residual Learning for Image Recognition" vorgestellt und stellt sich der Herausforderung, sehr tiefe neuronale Netze zu trainieren. Vor ResNet führte das einfache Stapeln von mehr Schichten in einem konventionellen Convolutional Neural Network (CNN) oft zu einem Problem, das als Degradation bezeichnet wird: Die Genauigkeit sättigte und verschlechterte sich dann schnell, nicht weil die Modelle übermäßig angepasst wurden, sondern weil tiefere Modelle schwieriger zu optimieren waren. Die Innovation von ResNet ermöglicht das erfolgreiche Training von Netzwerken mit Hunderten oder sogar Tausenden von Schichten.

Wie ResNet funktioniert: Residuale Verbindungen

Die Kernidee hinter ResNet ist die Einführung von "Shortcut-Verbindungen" oder "Skip-Verbindungen". Diese Verbindungen umgehen eine oder mehrere Schichten und führen eine Identitätszuordnung durch, indem sie die Ausgabe der vorherigen Schicht zu der davor liegenden Schicht hinzufügen. Diese Struktur hilft dabei, das Problem des verschwindenden Gradienten zu lösen, mit dem tiefe Netze beim Training mittels Backpropagation oft zu kämpfen haben. Anstatt die Schichten zu zwingen, direkt eine optimale Zuordnung zu lernen, erlaubt ResNet ihnen, eine Restzuordnung in Bezug auf die Identitätsfunktion zu lernen, die von der Skip-Verbindung bereitgestellt wird. Dies erleichtert es dem Netz, bei Bedarf Identitätszuordnungen zu erlernen (d. h. ein Block kann effektiv übersprungen werden, wenn er nicht von Vorteil ist), was den Optimierungsprozess für sehr tiefe Architekturen vereinfacht und das Degradationsproblem, das bei einfachen tiefen Netzen auftritt, abschwächt.

Anwendungen von ResNet

ResNets haben sich zu einer grundlegenden Architektur in der Computer Vision entwickelt und werden in zahlreichen Anwendungen eingesetzt:

  • Bild Klassifizierung: ResNets erzielten Spitzenergebnisse bei Benchmarks zur Bildklassifizierung wie ImageNet. Ihre Fähigkeit, effektiv von sehr tiefen Netzen zu lernen, führte zu erheblichen Verbesserungen der Genauigkeit bei der Identifizierung von Objekten und Szenen. Viele moderne Architekturen nutzen ResNet oder seine Varianten als leistungsstarkes Rückgrat für die Merkmalsextraktion.
  • Erkennung und Segmentierungvon Objekten: Architekturen wie Ultralytics YOLO nutzen häufig ResNet-Varianten als Grundlage für die Extraktion umfangreicher Merkmale. Bei der Objekterkennung helfen ResNets dabei, Objekte genau zu lokalisieren und zu klassifizieren, was für Anwendungen wie die Analyse von Einzelhandelsregalen oder die Identifizierung von Fahrzeugen in Verkehrsüberwachungssystemen entscheidend ist. Bei der Segmentierung zum Beispiel tragen sie zu einer präzisen Objektabgrenzung auf Pixelebene bei. Erforsche verschiedene Architekturen zur Objekterkennung und finde heraus, wie ResNet im Vergleich abschneidet.
  • Medizinische Bildanalyse: ResNets werden für Aufgaben wie die Erkennung von Tumoren, die Klassifizierung von Krankheiten anhand von Scans und die Segmentierung von Organen eingesetzt. Bei der Analyse von CT-Scans kann ein ResNet-basiertes Modell zum Beispiel dabei helfen, die Tumorgrenzen für die Planung der Strahlentherapie abzugrenzen. Die Tiefe und die Darstellungsstärke sind wichtig, um subtile Muster zu erfassen und die Diagnostik im Rahmen von KI-Lösungen im Gesundheitswesen zu verbessern.
  • Gesichtserkennung: ResNets werden zur robusten Merkmalsextraktion aus Gesichtsbildern eingesetzt, um eine genaue Identifizierung und Überprüfung in Sicherheits- und Zugangskontrollsystemen zu ermöglichen.

Vorteile von ResNet

Der Hauptvorteil von ResNet ist die Fähigkeit, extrem tiefe Netze effektiv zu trainieren und so die Probleme der Degradation und des verschwindenden Gradienten zu überwinden. Dank dieser Tiefe können ResNets komplexere Muster und hierarchische Merkmale aus den Trainingsdaten lernen, was zu einer besseren Leistung bei verschiedenen Lebenslaufaufgaben führt. ResNet-Architekturen sind außerdem relativ einfach und dienen als Standardkomponente in vielen modernen Deep-Learning-Modellen. Ihre starke Leistung und Anpassungsfähigkeit haben sie zu einem Eckpfeiler in der KI-Forschung und -Anwendung gemacht. Um die Entwicklung zu beschleunigen, können Nutzer/innen mit Hilfe von Plattformen wie Ultralytics HUB vortrainierte ResNet-Modelle für das Transferlernen oder die Feinabstimmung auf eigenen Datensätzen nutzen.

Alles lesen