Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Глубокое обучение (DL)

Изучите основы глубокого обучения (DL) — от нейронных сетей до реальных приложений искусственного интеллекта. Узнайте, как Ultralytics упрощает обучение и развертывание.

Глубокое обучение (DL) — это специализированное подразделение машинного обучения (ML), которое имитирует способ обработки информации человеческим мозгом. В то время как традиционное ML часто полагается на ручное извлечение признаков, глубокое обучение автоматизирует этот процесс с помощью многослойных структур, известных как искусственные нейронные сети (ANN). Эти сети состоят из слоев взаимосвязанных узлов, или нейронов, которые обрабатывают данные иерархическим образом. Эта «глубина» позволяет моделям изучать сложные паттерны и представления непосредственно из необработанных входных данных, таких как изображения, аудио и текст, что делает их исключительно мощными для решения проблем с неструктурированными данными.

Как работает глубокое обучение

Основной механизм глубокого обучения заключается в прохождении данных через несколько слоев нелинейных блоков обработки. В стандартной нейронной сети с прямой передачей информация проходит от входного слоя через несколько «скрытых» слоев и, наконец, к выходному слою. Во время фазы обучения сеть корректирует свои внутренние параметры — известные как weights and biases— на основе ошибок своих предсказаний. Эта корректировка обычно достигается с помощью алгоритма оптимизации, такого как стохастический градиентный спуск (SGD) в сочетании с обратной пропагацией для минимизации потерь.

Глубокое обучение особенно эффективно при работе с огромными объемами данных. В отличие от более простых алгоритмов, производительность которых может достигать плато, модели глубокого обучения, как правило, продолжают совершенствоваться по мере увеличения объема обучающих данных. Эта масштабируемость является основной причиной, по которой высокопроизводительные графические процессоры часто используются для ускорения интенсивных вычислений, необходимых для обучения этих массивных архитектур.

Основные архитектуры и различия

Глубокое обучение часто путают с машинным обучением, но разница заключается в степени вмешательства человека и сложности архитектуры. Машинное обучение обычно требует структурированных данных и разработанных человеком функций. Глубокое обучение, напротив, выполняет автоматическое извлечение функций.

В рамках глубокого обучения существует несколько специализированных архитектур для обработки определенных типов данных:

Применение в реальном мире

Глубокое обучение перешло от академической теории к ядру современных технологических стеков. Вот два конкретных примера его влияния:

  1. Автономное вождение: Автомобили с автономным управлением в значительной степени полагаются на глубокое обучение для безопасного перемещения. Такие модели, как YOLO26, обрабатывают видеопоток в режиме реального времени detect пешеходов, других транспортных средств и дорожных знаков. Это включает в себя сложные задачи, такие как отслеживание нескольких объектов и оценка глубины , чтобы принимать решения за доли секунды.
  2. Медицинская диагностика: в здравоохранении алгоритмы глубокого обучения помогают радиологам, анализируя медицинские изображения, такие как рентген и МРТ. Например, ИИ в здравоохранении использует модели сегментации для выявления опухолей или аномалий с точностью, которая соответствует или иногда превосходит точность человеческих экспертов, что позволяет проводить более ранние вмешательства.

Внедрение глубокого обучения

Такие инструменты, как PyTorch и TensorFlow доступ к глубокому обучению более демократичным, но высокоуровневые интерфейсы делают его еще проще. ultralytics Пакет позволяет разработчикам использовать современные архитектуры без необходимости проектирования нейронных сетей с нуля.

Вот краткий пример загрузки предварительно обученной модели глубокого обучения и выполнения инференции по изображению:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model (a Convolutional Neural Network)
model = YOLO("yolo26n.pt")

# Perform object detection on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results to see identified objects and bounding boxes
results[0].show()

Будущие тенденции и инструменты

Эта область быстро развивается в направлении создания более эффективных и мощных моделей. Такие методы, как перенос обучения, позволяют пользователям точно настраивать массивные предварительно обученные модели на меньших, специфических наборах данных, что значительно экономит время и вычислительные ресурсы. Кроме того, появление генеративного ИИ демонстрирует способность DL создавать новый контент, от реалистичных изображений до кода.

Для команд, стремящихся оптимизировать свой рабочий процесс, Ultralytics предлагает комплексную среду для управления жизненным циклом проектов глубокого обучения. От совместной анотации данных до облачного обучения и развертывания — эти инструменты помогают преодолеть разрыв между экспериментальными исследованиями и готовыми к производству приложениями. Чтобы глубже понять математические основы, такие ресурсы, как книга MIT Deep Learning Book, предоставляют обширное теоретическое освещение.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас