Глоссарий

Нейронная сеть (НС)

Открой для себя мощь нейронных сетей - ключ к инновациям в области AI и ML, таким как компьютерное зрение, NLP и прорывы в глубоком обучении.

Обучай модели YOLO просто
с помощью Ultralytics HUB.

Узнай больше

Нейронные сети (НС), часто называемые искусственными нейронными сетями (ИНС), - это вычислительные модели, вдохновленные сложной структурой и функциями человеческого мозга. Они являются краеугольным камнем современного искусственного интеллекта (ИИ) и машинного обучения (МЛ) и предназначены в первую очередь для распознавания сложных закономерностей в данных. Эти сети лежат в основе многих интеллектуальных систем, с которыми мы ежедневно взаимодействуем, - от сложных инструментов распознавания изображений до продвинутых сервисов языкового перевода - и являются фундаментальными для таких областей, как компьютерное зрение (CV) и обработка естественного языка (NLP).

Понимание нейронных сетей

Нейронная сеть состоит из слоев взаимосвязанных узлов, или нейронов. Эти слои обычно включают входной слой, который получает исходные данные (например, значения пикселей в изображении или слова в предложении), один или несколько скрытых слоев, которые обрабатывают данные путем вычислений, и выходной слой, который выдает конечный результат, например классификационную метку или предсказанное значение. Каждая связь между нейронами имеет "вес" - числовое значение, обозначающее важность связи в вычислениях сети.

Нейроны обрабатывают свои объединенные входы с помощью функции активации, например ReLU или Sigmoid, которая определяет выходной сигнал, передаваемый на следующий слой. Сеть "обучается", регулируя эти веса в процессе обучения, обычно на помеченных примерах в условиях контролируемого обучения. Такие алгоритмы, как градиентный спуск и алгоритм обратного распространения, обычно используются для итеративной подстройки весов с целью минимизации функции потерь, которая измеряет разницу между предсказаниями сети и реальными целевыми значениями. Эффективное обучение модели часто требует тщательной настройки гиперпараметров и стратегий, описанных в руководствах вроде наших "Советов по обучению модели".

Модели, использующие глубокое обучение (DL), - это, по сути, NN с несколькими скрытыми слоями (отсюда и слово "глубокий"). Такая глубина позволяет им изучать очень сложные паттерны и иерархические признаки из больших наборов данных, что делает их исключительно эффективными для таких задач, как обнаружение объектов и сегментация экземпляров. В отличие от более простых ML-моделей, таких как линейная регрессия или машины опорных векторов (SVM), которые могут потребовать ручной разработки признаков, NN отлично справляются с автоматическим извлечением признаков из сырых, неструктурированных данных, таких как изображения и текст.

Типы нейронных сетей и их различия

Хотя базовая структура, описанная выше, применима в целом, существует несколько специализированных архитектур NN:

NN существенно отличаются от традиционных алгоритмов вроде Деревьев решений или k-Nearest Neighbors (KNN), которые работают по другим принципам и часто меньше подходят для высокоразмерных, сложных данных вроде изображений без обширной предварительной обработки.

Приложения нейронных сетей

Нейронные сети невероятно универсальны и применяются во многих областях. Вот два ключевых примера:

  1. Компьютерное зрение (КВ): NNs, особенно CNNs, являются движущей силой основных достижений в области CV. Они используются для:

  2. Обработка естественного языка (NLP): NN, включая RNN и трансформеры, произвели революцию в том, как машины понимают и генерируют человеческий язык. Области применения включают:

Инструменты и фреймворки

Разработку и внедрение NN облегчают различные мощные инструменты и фреймворки глубокого обучения:

  • Библиотеки: Такие фреймворки, как PyTorch и TensorFlow предоставляют основные строительные блоки и возможности автоматического дифференцирования, необходимые для обучения NN. Keras предлагает высокоуровневый API, который часто используется с TensorFlow.
  • Платформы: Ultralytics HUB предлагает платформу для обучения моделей YOLO , управления наборами данных и упрощения процесса развертывания моделей.
  • Модели: Предварительно обученные модели, такие как в Ultralytics YOLO обеспечивают сильную отправную точку для решения различных CV-задач, зачастую требуя лишь тонкой настройки на конкретных наборах данных. Сравнение различных моделей YOLO ты можешь найти в нашей документации.

Понимание NNs крайне важно для всех, кто работает в области ИИ или ML, так как они являются основой для многих современных решений в самых разных отраслях, от ИИ в здравоохранении до ИИ в сельском хозяйстве.

Читать полностью