Глоссарий

Нейронная сеть (НС)

Открой для себя мощь нейронных сетей - ключ к инновациям в области AI и ML, таким как компьютерное зрение, NLP и прорывы в глубоком обучении.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Нейронные сети (НС), часто называемые искусственными нейронными сетями (ИНС), - это вычислительные модели, вдохновленные сложной структурой и функциями человеческого мозга. Они являются краеугольным камнем современного искусственного интеллекта (ИИ) и машинного обучения (МЛ) и предназначены в первую очередь для распознавания сложных закономерностей в данных. Эти сети лежат в основе многих интеллектуальных систем, с которыми мы ежедневно взаимодействуем, - от сложных инструментов распознавания изображений до продвинутых сервисов языкового перевода.

Понимание нейронных сетей

Нейронная сеть состоит из слоев взаимосвязанных узлов, или нейронов. Эти слои обычно включают входной слой, на который поступают исходные данные, один или несколько скрытых слоев, которые обрабатывают эти данные, и выходной слой, который выдает конечный результат, например классификацию или предсказание. Каждая связь между нейронами имеет вес, означающий важность связи. Нейроны обрабатывают свои входы с помощью функции активации, чтобы определить выходной сигнал, который они передают. Сеть обучается, регулируя эти веса в процессе обучения, обычно используя такие алгоритмы, как градиентный спуск и обратное распространение, чтобы минимизировать ошибку между своими предсказаниями и реальными целевыми значениями. Об эффективном обучении читай в наших советах по обучению моделей.

Модели, использующие глубокое обучение, - это, по сути, нейронные сети с множеством скрытых слоев (отсюда и слово "глубокий"). Такая глубина позволяет им изучать очень сложные паттерны и иерархические признаки из больших наборов данных, что делает их исключительно эффективными для таких задач, как обнаружение объектов и сегментация изображений. В отличие от более простых ML-моделей, которые могут потребовать ручной разработки признаков, NN отлично справляются с автоматическим извлечением релевантных признаков из неструктурированных данных, таких как изображения и текст.

Приложения нейронных сетей

Нейронные сети невероятно универсальны и применяются во многих областях. Вот два ключевых примера:

  1. Компьютерное зрение: В области компьютерного зрения (КВ) NN, особенно специализированные типы, такие как CNN, используются для анализа и интерпретации визуальной информации. Современные модели, такие как Ultralytics YOLO используют глубокие нейронные сети для обнаружения объектов, сегментации изображений и оценки позы в реальном времени, что позволяет использовать их в самых разных областях - от автономного вождения до анализа медицинских изображений. Ты можешь обучать и разворачивать такие модели с помощью платформ вроде Ultralytics HUB.
  2. Обработка естественного языка: NNs являются основой для обработки естественного языка (NLP), позволяя машинам понимать и генерировать человеческий язык. Приложения включают машинный перевод, анализ настроения и разработку чатботов. Такие модели, как BERT и различные модели GPT, основаны на сложных архитектурах нейронных сетей, в частности на трансформаторах.

Нейронные сети в сравнении с аналогичными понятиями

Полезно отличать NN от родственных концепций ИИ:

  • Искусственный интеллект (ИИ): ИИ - это широкая область создания интеллектуальных машин. NNs - это специфическая техника, используемая в рамках ИИ для достижения способности к обучению.
  • Машинное обучение (ML): ML - это подмножество ИИ, сфокусированное на алгоритмах, которые обучаются на данных. NNs - основной класс ML-моделей, особенно доминирующий в глубоком обучении.
  • Глубокое обучение (Deep Learning, DL): DL - это подполе ML, которое специально использует NN с большим количеством слоев (глубокие архитектуры) для моделирования сложных паттернов. Все модели глубокого обучения - это нейронные сети, но не все нейронные сети являются глубокими.
  • Конволюционные нейронные сети (КНС): CNN - это специализированный тип NN, предназначенный в первую очередь для обработки данных, похожих на сетку, например изображений, что делает их очень эффективными для задач компьютерного зрения.
  • Рекуррентные нейронные сети (РНС): Рекуррентные нейросети предназначены для работы с последовательными данными, такими как текст или временные ряды, благодаря наличию связей, которые образуют циклы, позволяя информации сохраняться.
  • Трансформеры: Трансформеры - это более современная архитектура, в значительной степени зависящая от механизмов внимания, которые стали современными для многих задач НЛП и все чаще используются в компьютерном зрении.

Итак, нейронные сети - это мощные, вдохновленные мозгом модели, которые позволяют машинам изучать сложные закономерности на основе данных. Они являются фундаментальными строительными блоками для глубокого обучения и стимулируют прогресс в различных приложениях ИИ, от понимания изображений с помощью компьютерного зрения до обработки языка в NLP.

Читать полностью