Глоссарий

Остаточные сети (ResNet)

Открой для себя мощь ResNet, новаторской архитектуры глубокого обучения, решающей проблемы исчезающих градиентов. Идеально подходит для задач ИИ, таких как зрение, обнаружение и многое другое!

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Residual Networks (ResNet) - это революционная архитектура глубокого обучения, разработанная для решения проблемы исчезающего градиента, которая часто мешает обучению очень глубоких нейронных сетей. Представленная Каймингом Хе и его командой в Microsoft Research в 2015 году, ResNet использует "пропускные связи" или "остаточные связи", позволяющие информации обходить один или несколько слоев, что позволяет моделям эффективно обучаться даже с сотнями или тысячами слоев. Эта инновация сделала ResNet основополагающей архитектурой в современном глубоком обучении, особенно в задачах компьютерного зрения.

Ключевые особенности ResNet

  1. Пропускные соединения: Эти соединения позволяют градиенту течь напрямую через сеть, смягчая проблему исчезающего градиента. Они работают за счет введения короткого пути, который пропускает один или несколько слоев и напрямую соединяет вход с выходом блока. Узнай больше о роли обратного распространения в обучении глубоких сетей.

  2. Остаточные блоки: Основной строительный блок ResNet, остаточный блок добавляет вход блока к его выходу, эффективно обучая остаточное отображение, а не полное преобразование. Это упрощает оптимизацию, так как сеть фокусируется на изучении того, что отличается от входных данных.

  3. Масштабируемость: Архитектуры ResNet могут масштабироваться до очень глубоких сетей, таких как ResNet-50, ResNet-101 и ResNet-152, не страдая от снижения производительности.

  4. Улучшенное обобщение: Остаточные связи улучшают способность глубоких сетей к обобщению, делая ResNet устойчивой к различным задачам и наборам данных, таким как ImageNet.

Применение ResNet

Классификация изображений

ResNet занимает лидирующие позиции в задачах классификации изображений. Такие модели, как ResNet-50 и ResNet-101, часто используются в качестве основы для конвейеров классификации. Например, ResNet сыграла важную роль в победе в конкурсе ImageNet Large Scale Visual Recognition Challenge (ILSVRC) в 2015 году. Узнай больше о классификации изображений и ее применении.

Обнаружение объектов

ResNet обычно используется в качестве основы в таких системах обнаружения объектов, как Faster R-CNN и Ultralytics YOLO . Способность извлекать иерархические признаки делает ее идеальной для локализации и классификации объектов на изображениях. Узнай, как обнаружение объектов преобразует такие отрасли, как здравоохранение и автономные транспортные средства.

Медицинская визуализация

В здравоохранении модели ResNet используются для анализа сложных медицинских изображений, таких как рентгеновские снимки, МРТ и КТ. Они помогают с высокой точностью обнаружить такие аномалии, как опухоли или нарушения в работе органов. Узнай, как ИИ в здравоохранении революционизирует диагностику и планирование лечения.

Автономные транспортные средства

ResNet - важнейший компонент систем технического зрения для самоуправляемых автомобилей, обеспечивающий точное распознавание объектов: пешеходов, автомобилей и дорожных знаков. Надежные возможности ResNet по извлечению признаков обеспечивают безопасную навигацию в динамичных условиях. Подробнее о роли искусственного интеллекта в самостоятельном вождении.

Примеры из реальной жизни

  1. Системы распознавания лиц: ResNet используется в моделях распознавания лиц для их идентификации и проверки подлинности. Например, в DeepFace от Facebook используются архитектуры, вдохновленные ResNet, чтобы добиться точности верификации лица на уровне человека.

  2. Контроль качества в производстве: Модели ResNet применяются на производстве для обнаружения дефектов продукции путем анализа изображений предметов на производственных линиях. Такая автоматизация повышает эффективность и снижает количество человеческих ошибок. Узнай, как Vision AI в производстве преобразует промышленные процессы.

Технические познания

Успех ResNet заключается в его способности обучать очень глубокие сети без снижения производительности. Традиционные глубокие сети часто испытывают падение точности по мере увеличения слоев из-за проблемы исчезающего градиента. ResNet обходит эту проблему, используя остаточные связи, которые позволяют градиентам беспрепятственно распространяться по сети.

Для получения более подробной технической информации обратись к странице глоссария "Конволюционные нейронные сети (CNN) ", где объясняется, как CNN лежат в основе таких архитектур, как ResNet.

Отличительные особенности по сравнению с аналогичными моделями

  • U-Net: Хотя и ResNet, и U-Net поддерживают глубокие архитектуры, U-Net специально разработана для задач сегментации изображений, обеспечивая классификацию на уровне пикселей. Узнай больше о U-Net.

  • Трансформаторы зрения (ViT): В отличие от ResNet, который опирается на конволюционные слои, Vision Transformers используют механизмы самовнушения для моделирования глобальных зависимостей в изображениях. Изучи Vision Transformers для сравнения.

Будущие направления

ResNet продолжает вдохновлять новые архитектуры, такие как DenseNet, которая расширяет концепцию пропускных соединений, соединяя каждый слой с каждым другим слоем. По мере развития глубокого обучения ResNet остается краеугольным камнем для разработки эффективных и масштабируемых моделей.

Чтобы получить практический опыт, изучи Ultralytics HUB для обучения и развертывания моделей искусственного интеллекта, используя ResNet в качестве основы для таких задач, как классификация и обнаружение.

Читать полностью